作者:林斐 來源:IT時(shí)報(bào)
圖像是信息的重要載體,也是信息保護(hù)的重點(diǎn)關(guān)注對(duì)象,。圖像編輯軟件的發(fā)展和普及降低了虛假圖像的制作門檻,,大量基于虛假圖片產(chǎn)生的詐騙案件、網(wǎng)絡(luò)暴力事件在全球范圍內(nèi)造成了惡劣的影響,。自AIGC技術(shù)興盛以來,“生成式造假”也讓人們倍感憂慮,。圖像內(nèi)容的安全與可信性也成為了公眾關(guān)注的焦點(diǎn),,但圖像領(lǐng)域的“可信AI”才剛剛起步。
在剛剛結(jié)束的本次世界人工智能大會(huì)可信AI論壇上,長(zhǎng)期聚焦“AI+OCR”在文檔智能領(lǐng)域中的前沿技術(shù)探索的合合信息展示“三大技術(shù),,一項(xiàng)標(biāo)準(zhǔn)”,,探索AI在圖像內(nèi)容安全領(lǐng)域可信化發(fā)展的多重可能。
合合信息AI圖像安全技術(shù)方案主要包括三項(xiàng)重點(diǎn)技術(shù):AI圖像篡改檢測(cè),、生成式圖像鑒別,、OCR對(duì)抗攻擊技術(shù),以應(yīng)對(duì)日益高發(fā)的惡意P圖,、生成式造假和個(gè)人信息非法提取現(xiàn)象,。
AI圖像篡改檢測(cè)技術(shù)
合合信息圖像篡改檢測(cè)技術(shù)應(yīng)用效果展示
P圖是常見的圖像篡改手段之一。去年的世界人工智能大會(huì)上,合合信息PS篡改檢測(cè)技術(shù)首次亮相,,“像素級(jí)”起底修改痕跡,,覆蓋身份證、護(hù)照等多種證照識(shí)別類目,。該技術(shù)基于深度學(xué)習(xí)的圖像篡改檢測(cè)技術(shù)及相關(guān)系統(tǒng),,通過學(xué)習(xí)圖像被篡改后統(tǒng)計(jì)特征的變化,智能捕捉圖像在篡改過程中留下的細(xì)微痕跡,,并以熱力圖的形式展示圖像區(qū)域篡改地點(diǎn),,相關(guān)技術(shù)已在銀行、保險(xiǎn)等領(lǐng)域落地應(yīng)用,。
今年圖像篡改檢測(cè)“黑科技”持續(xù)優(yōu)化升級(jí),,應(yīng)用面也拓展至“截圖篡改檢測(cè)”。此前,,圖像篡改檢測(cè)的技術(shù)研究對(duì)象主要集中于自然場(chǎng)景圖像,然而,真正為人們的生活帶來風(fēng)險(xiǎn)的通常是被篡改的資質(zhì)證書,、文檔,、截圖等。合合信息AI圖像篡改檢測(cè)技術(shù)可檢測(cè)包括轉(zhuǎn)賬記錄,、交易記錄,、聊天記錄等多種截圖,無論是從原圖中“摳下”關(guān)鍵要素后移動(dòng)“粘貼”至另一處的“復(fù)制移動(dòng)”圖片篡改手段,,還是“擦除”“重打印”等方式,,圖像篡改檢測(cè)技術(shù)均可“慧眼”識(shí)假。
圖片輸入到合合信息篡改檢測(cè)模型中,,便能夠判別這張圖像是否被篡改,,并且定位出篡改圖像的篡改區(qū)域
該技術(shù)的主要難點(diǎn)在于,能否從沒有明顯視覺差異的圖片中找出被篡改的截圖,,以及找出的圖片中是誤檢率是否可控,。與證照篡改檢測(cè)相比,截圖檢測(cè)難度更大,。
從成像角度來看,,截圖的背景沒有紋路和底色,整個(gè)截圖沒有光照差異,。證件篡改識(shí)別尚可通過拍照時(shí)產(chǎn)生的成像差異進(jìn)行篡改痕跡判斷,,而截圖則沒有這些“信息”。現(xiàn)有的視覺模型通常難以充分發(fā)掘原始圖像和篡改圖像的細(xì)粒度差異特征,,因此難以實(shí)現(xiàn)令人滿意的準(zhǔn)確率,。為此,合合信息提出了一種基于HRNet的編碼器-解碼器結(jié)構(gòu)的圖像真實(shí)性鑒別模型,,結(jié)合圖像本身的信息包括但不限于噪聲,、頻譜等, 從而捕捉到細(xì)粒度的視覺差異,,達(dá)到高精度鑒別目的,。
生成式圖像鑒別
今年以語言生成類、視覺生成類模式為代表的AIGC產(chǎn)品引發(fā)了社會(huì)對(duì)于圖文內(nèi)容“可信度”問題的討論,。AIGC爆火的背后,,不法分子通過生成的圖片去規(guī)避版權(quán)、身份驗(yàn)證,,非法獲取利益,,給人民群眾造成了財(cái)產(chǎn)損失?;诖吮尘?,合合信息研發(fā)了關(guān)于AI生成圖片鑒別技術(shù),,用于幫助個(gè)人及機(jī)構(gòu)識(shí)別判斷AI圖片是否為生成的,防止“虛擬人”欺詐,,通過解決生成式AI面臨的部分倫理問題,,助力生成式AI的健康發(fā)展。
該項(xiàng)目的難點(diǎn)主要分為兩點(diǎn):生成出來的圖像場(chǎng)景繁多,,不能窮舉,,不能通過細(xì)分來一一訓(xùn)練解決;有些生成圖和真實(shí)圖片的相似度過高,,很貼近于人類的判斷,,對(duì)于機(jī)器而言,真?zhèn)闻卸ㄖ粫?huì)更難,。合合信息基于空域與頻域關(guān)系建模,,能夠在不用窮舉圖片的情況下,利用多維度特征來分辨真實(shí)圖片和生成式圖片的細(xì)微差異,。
模型結(jié)構(gòu)
輸入圖片后,,模型通過多個(gè)空間注意力頭(attention head)來關(guān)注空間特征,并使用紋理增強(qiáng)模塊放大淺層特征中的細(xì)微偽影,,增強(qiáng)模型對(duì)真實(shí)人臉和偽造人臉的感知與判斷準(zhǔn)確度,。
生成式圖像檢測(cè)技術(shù)在反詐騙、版權(quán)保護(hù)等領(lǐng)域的應(yīng)用空間十分廣泛,。例如在金融行業(yè),,不法分子可利用AI合成技術(shù)對(duì)線上資金進(jìn)行盜刷,威脅公民財(cái)產(chǎn)安全,。本項(xiàng)技術(shù)可通過對(duì)支付環(huán)節(jié)的干預(yù),,降低資金盜刷概率;在傳媒行業(yè),,某些圖片供給方使用軟件自動(dòng)生成海報(bào)等圖片,,故意隱瞞其來源并售賣給第三方,第三方在不知情的情況下進(jìn)行商用,,導(dǎo)致了侵權(quán)問題,,相關(guān)檢測(cè)技術(shù)可在一定程度上解決這些問題。
OCR對(duì)抗攻擊技術(shù)
人們會(huì)出于生活,、工作需要,,拍攝自己的相關(guān)證件、文件并發(fā)送給第三方,,這些圖片上承載的個(gè)人信息可能被不法分子使用OCR技術(shù)識(shí)別提取并泄露,。基于個(gè)人,、企業(yè)業(yè)務(wù)的文件資料保密需求,,合合信息進(jìn)行了創(chuàng)新技術(shù)探索,,研發(fā)了OCR對(duì)抗攻擊技術(shù)來進(jìn)行文檔圖片“加密”。
合合信息OCR對(duì)抗攻擊技術(shù)應(yīng)用效果展示,,可對(duì)關(guān)鍵信息進(jìn)行遮蓋,,在不影響肉眼觀看的情況下阻止機(jī)器自動(dòng)爬取。該技術(shù)可在不影響肉眼觀看與判斷的情況下,,對(duì)場(chǎng)景文本或者文檔內(nèi)文本進(jìn)行擾動(dòng),對(duì)包含中文,、英文,、數(shù)字等關(guān)鍵信息的內(nèi)容進(jìn)行“攻擊”,防止第三方通過OCR系統(tǒng)讀取并保存圖像中所有的文字內(nèi)容,,降低數(shù)據(jù)泄露的風(fēng)險(xiǎn),,以此達(dá)到保護(hù)信息的目的。
與中國信息通信研究院等權(quán)威機(jī)構(gòu)一起建立標(biāo)準(zhǔn) 助力科技向善
圖像安全的重要性與日俱增,,標(biāo)準(zhǔn)規(guī)范的出臺(tái)迫在眉睫,。合合信息與中國信息通信研究院(下簡(jiǎn)稱信通院)等權(quán)威機(jī)構(gòu)一道,攜手院校,、研究機(jī)構(gòu)及企業(yè),,共同探索AI技術(shù)在圖像領(lǐng)域的可信化落地這一深遠(yuǎn)命題,助力科技向上的同時(shí)向善發(fā)展,。
為貫徹落實(shí)《中華人民共和國網(wǎng)絡(luò)安全法》《生成式人工智能服務(wù)管理辦法(征求意見稿)》等文件中對(duì)于AI服務(wù)的規(guī)范性要求,,系統(tǒng)性建立圖像內(nèi)容安全行業(yè)發(fā)展秩序,信通院牽頭啟動(dòng)了《文檔圖像篡改檢測(cè)標(biāo)準(zhǔn)》制定工作,,合合信息,、中國圖象圖形學(xué)學(xué)會(huì)、中國科學(xué)技術(shù)大學(xué)等科技創(chuàng)新企業(yè)及知名學(xué)術(shù)機(jī)構(gòu)聯(lián)合編制,。
《文檔圖像篡改檢測(cè)標(biāo)準(zhǔn)》將為文檔圖像內(nèi)容安全提供可靠保障,,助力新時(shí)代AI安全體系建設(shè)。作為牽頭方,,信通院表示,,《文檔圖像篡改檢測(cè)標(biāo)準(zhǔn)》將基于產(chǎn)業(yè)現(xiàn)狀,圍繞“細(xì)粒度”視覺差異偽造圖像鑒別,、生成式圖像判別,、文檔圖像完整性保護(hù)等行業(yè)焦點(diǎn)議題,凝聚行業(yè)共識(shí),,以期為行業(yè)提供有效指引,。
“可信”反映了AI系統(tǒng)、產(chǎn)品和服務(wù)在安全性,、可靠性,、可解釋,、可問責(zé)等一系列內(nèi)在屬性的可信賴程度,相關(guān)概念正隨著技術(shù)發(fā)展的腳步,,從模糊走向清晰,、從起步走向成熟。開年以來,,以語言生成類,、視覺生成類模式為代表的AIGC產(chǎn)品引發(fā)了社會(huì)對(duì)于圖文內(nèi)容“可信度”問題的討論?!段臋n圖像篡改檢測(cè)標(biāo)準(zhǔn)》的制定,,或?qū)橹袊翱尚臕I”在機(jī)器視覺、圖像處理領(lǐng)域的體系建設(shè)提供有力支持,。
用“過硬”的AI為行業(yè)發(fā)展注入安全感
AI向善還是向惡而行,?不法分子和守護(hù)者們每天都在未知的角落里上演無數(shù)次隱形的爭(zhēng)斗。哪一方是技術(shù)實(shí)力更為強(qiáng)勁,,是決定道高一尺還是魔高一丈的關(guān)鍵,。作為一家人工智能公司,過硬的科技實(shí)力是合合信息等科技企業(yè)突破行業(yè)難題,,培育創(chuàng)新技術(shù)的底氣,。AI圖像安全新技術(shù)的實(shí)現(xiàn),得益于公司在文檔圖像領(lǐng)域十余年的深耕攢下的底蘊(yùn),。
近期,,合合信息相關(guān)產(chǎn)品接連獲得信通院在智能文檔處理、OCR智能化領(lǐng)域的高分評(píng)級(jí),。智能文檔處理系統(tǒng)評(píng)估結(jié)果顯示,,AI核心能力方面,合合信息產(chǎn)品在NLP領(lǐng)域的文本分類,、知識(shí)圖譜領(lǐng)域的實(shí)體識(shí)別,、關(guān)系抽取及OCR領(lǐng)域的字符識(shí)別、文本行識(shí)別均獲得5分評(píng)分,。合合信息智能文檔處理產(chǎn)品獲得“5級(jí)”評(píng)定,。據(jù)悉,“5級(jí)”為該模塊最高評(píng)定等級(jí),。
OCR評(píng)估中,,合合信息智能文字識(shí)別產(chǎn)品順利通過全部7項(xiàng)基礎(chǔ)類功能指標(biāo)測(cè)試以及9項(xiàng)增強(qiáng)類功能指標(biāo)測(cè)試,獲得“增強(qiáng)級(jí)”評(píng)級(jí),。評(píng)估報(bào)告認(rèn)為,,公司智能文字識(shí)別產(chǎn)品展現(xiàn)出良好的性能和服務(wù)成熟度。以具有較大難度的證件類和票據(jù)類性能測(cè)試為例,,面對(duì)旋轉(zhuǎn),、陰影,、反光、褶皺,、形變,、模糊、多語言,、低像素,、光照不均等復(fù)雜場(chǎng)景,合合信息智能文字識(shí)別產(chǎn)品均有較高的識(shí)別準(zhǔn)確率,,字符準(zhǔn)確率分別為99.21%和99.59%,,字段準(zhǔn)確率分別為97.87%和98.42%。
測(cè)試結(jié)果還顯示,,合合信息智能文字識(shí)別產(chǎn)品支持超過50種復(fù)雜語言的識(shí)別,為全球化,、多語言背景下的信息智能識(shí)別提供了技術(shù)支撐,。截至目前,合合信息智能文字識(shí)別,、智能文檔處理相關(guān)技術(shù)已發(fā)表于CVPR,、AAAI、ACL,、ACM MM等國際頂會(huì)上,,并在ICPR、ICFHR 等十余項(xiàng)國際競(jìng)賽中獲得冠軍?,F(xiàn)階段,,公司已獲得超百項(xiàng)自主知識(shí)產(chǎn)權(quán)發(fā)明專利,為全球超過200個(gè)國家和地區(qū)的上億用戶提供智能文字識(shí)別產(chǎn)品及AI服務(wù),。未來,,公司將持續(xù)關(guān)注圖像領(lǐng)域新需求、新動(dòng)態(tài),,用“過硬”的AI為行業(yè)發(fā)展注入安全感,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1058033.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。