作者:林斐 來源:IT時報
圖像是信息的重要載體,,也是信息保護的重點關(guān)注對象,。圖像編輯軟件的發(fā)展和普及降低了虛假圖像的制作門檻,大量基于虛假圖片產(chǎn)生的詐騙案件,、網(wǎng)絡(luò)暴力事件在全球范圍內(nèi)造成了惡劣的影響。自AIGC技術(shù)興盛以來,,“生成式造假”也讓人們倍感憂慮,。圖像內(nèi)容的安全與可信性也成為了公眾關(guān)注的焦點,但圖像領(lǐng)域的“可信AI”才剛剛起步。
在剛剛結(jié)束的本次世界人工智能大會可信AI論壇上,,長期聚焦“AI+OCR”在文檔智能領(lǐng)域中的前沿技術(shù)探索的合合信息展示“三大技術(shù),,一項標(biāo)準”,探索AI在圖像內(nèi)容安全領(lǐng)域可信化發(fā)展的多重可能,。
合合信息AI圖像安全技術(shù)方案主要包括三項重點技術(shù):AI圖像篡改檢測,、生成式圖像鑒別、OCR對抗攻擊技術(shù),,以應(yīng)對日益高發(fā)的惡意P圖,、生成式造假和個人信息非法提取現(xiàn)象。
AI圖像篡改檢測技術(shù)
合合信息圖像篡改檢測技術(shù)應(yīng)用效果展示
P圖是常見的圖像篡改手段之一,。去年的世界人工智能大會上,,合合信息PS篡改檢測技術(shù)首次亮相,,“像素級”起底修改痕跡,覆蓋身份證,、護照等多種證照識別類目,。該技術(shù)基于深度學(xué)習(xí)的圖像篡改檢測技術(shù)及相關(guān)系統(tǒng),通過學(xué)習(xí)圖像被篡改后統(tǒng)計特征的變化,,智能捕捉圖像在篡改過程中留下的細微痕跡,,并以熱力圖的形式展示圖像區(qū)域篡改地點,相關(guān)技術(shù)已在銀行,、保險等領(lǐng)域落地應(yīng)用,。
今年圖像篡改檢測“黑科技”持續(xù)優(yōu)化升級,應(yīng)用面也拓展至“截圖篡改檢測”,。此前,圖像篡改檢測的技術(shù)研究對象主要集中于自然場景圖像,然而,,真正為人們的生活帶來風(fēng)險的通常是被篡改的資質(zhì)證書,、文檔、截圖等,。合合信息AI圖像篡改檢測技術(shù)可檢測包括轉(zhuǎn)賬記錄,、交易記錄、聊天記錄等多種截圖,,無論是從原圖中“摳下”關(guān)鍵要素后移動“粘貼”至另一處的“復(fù)制移動”圖片篡改手段,,還是“擦除”“重打印”等方式,圖像篡改檢測技術(shù)均可“慧眼”識假,。
圖片輸入到合合信息篡改檢測模型中,,便能夠判別這張圖像是否被篡改,并且定位出篡改圖像的篡改區(qū)域
該技術(shù)的主要難點在于,,能否從沒有明顯視覺差異的圖片中找出被篡改的截圖,,以及找出的圖片中是誤檢率是否可控。與證照篡改檢測相比,,截圖檢測難度更大,。
從成像角度來看,截圖的背景沒有紋路和底色,,整個截圖沒有光照差異,。證件篡改識別尚可通過拍照時產(chǎn)生的成像差異進行篡改痕跡判斷,而截圖則沒有這些“信息”?,F(xiàn)有的視覺模型通常難以充分發(fā)掘原始圖像和篡改圖像的細粒度差異特征,,因此難以實現(xiàn)令人滿意的準確率,。為此,合合信息提出了一種基于HRNet的編碼器-解碼器結(jié)構(gòu)的圖像真實性鑒別模型,結(jié)合圖像本身的信息包括但不限于噪聲,、頻譜等, 從而捕捉到細粒度的視覺差異,,達到高精度鑒別目的,。
生成式圖像鑒別
今年以語言生成類、視覺生成類模式為代表的AIGC產(chǎn)品引發(fā)了社會對于圖文內(nèi)容“可信度”問題的討論,。AIGC爆火的背后,,不法分子通過生成的圖片去規(guī)避版權(quán)、身份驗證,,非法獲取利益,,給人民群眾造成了財產(chǎn)損失?;诖吮尘?,合合信息研發(fā)了關(guān)于AI生成圖片鑒別技術(shù),,用于幫助個人及機構(gòu)識別判斷AI圖片是否為生成的,防止“虛擬人”欺詐,,通過解決生成式AI面臨的部分倫理問題,,助力生成式AI的健康發(fā)展。
該項目的難點主要分為兩點:生成出來的圖像場景繁多,,不能窮舉,,不能通過細分來一一訓(xùn)練解決;有些生成圖和真實圖片的相似度過高,,很貼近于人類的判斷,,對于機器而言,真?zhèn)闻卸ㄖ粫y,。合合信息基于空域與頻域關(guān)系建模,,能夠在不用窮舉圖片的情況下,利用多維度特征來分辨真實圖片和生成式圖片的細微差異,。
模型結(jié)構(gòu)
輸入圖片后,,模型通過多個空間注意力頭(attention head)來關(guān)注空間特征,并使用紋理增強模塊放大淺層特征中的細微偽影,,增強模型對真實人臉和偽造人臉的感知與判斷準確度,。
生成式圖像檢測技術(shù)在反詐騙、版權(quán)保護等領(lǐng)域的應(yīng)用空間十分廣泛,。例如在金融行業(yè),,不法分子可利用AI合成技術(shù)對線上資金進行盜刷,威脅公民財產(chǎn)安全,。本項技術(shù)可通過對支付環(huán)節(jié)的干預(yù),,降低資金盜刷概率;在傳媒行業(yè),,某些圖片供給方使用軟件自動生成海報等圖片,,故意隱瞞其來源并售賣給第三方,第三方在不知情的情況下進行商用,,導(dǎo)致了侵權(quán)問題,,相關(guān)檢測技術(shù)可在一定程度上解決這些問題。
OCR對抗攻擊技術(shù)
人們會出于生活,、工作需要,,拍攝自己的相關(guān)證件、文件并發(fā)送給第三方,,這些圖片上承載的個人信息可能被不法分子使用OCR技術(shù)識別提取并泄露,。基于個人,、企業(yè)業(yè)務(wù)的文件資料保密需求,,合合信息進行了創(chuàng)新技術(shù)探索,,研發(fā)了OCR對抗攻擊技術(shù)來進行文檔圖片“加密”。
合合信息OCR對抗攻擊技術(shù)應(yīng)用效果展示,,可對關(guān)鍵信息進行遮蓋,,在不影響肉眼觀看的情況下阻止機器自動爬取。該技術(shù)可在不影響肉眼觀看與判斷的情況下,,對場景文本或者文檔內(nèi)文本進行擾動,對包含中文,、英文,、數(shù)字等關(guān)鍵信息的內(nèi)容進行“攻擊”,防止第三方通過OCR系統(tǒng)讀取并保存圖像中所有的文字內(nèi)容,,降低數(shù)據(jù)泄露的風(fēng)險,,以此達到保護信息的目的。
與中國信息通信研究院等權(quán)威機構(gòu)一起建立標(biāo)準 助力科技向善
圖像安全的重要性與日俱增,,標(biāo)準規(guī)范的出臺迫在眉睫,。合合信息與中國信息通信研究院(下簡稱信通院)等權(quán)威機構(gòu)一道,攜手院校,、研究機構(gòu)及企業(yè),,共同探索AI技術(shù)在圖像領(lǐng)域的可信化落地這一深遠命題,助力科技向上的同時向善發(fā)展,。
為貫徹落實《中華人民共和國網(wǎng)絡(luò)安全法》《生成式人工智能服務(wù)管理辦法(征求意見稿)》等文件中對于AI服務(wù)的規(guī)范性要求,,系統(tǒng)性建立圖像內(nèi)容安全行業(yè)發(fā)展秩序,信通院牽頭啟動了《文檔圖像篡改檢測標(biāo)準》制定工作,,合合信息,、中國圖象圖形學(xué)學(xué)會、中國科學(xué)技術(shù)大學(xué)等科技創(chuàng)新企業(yè)及知名學(xué)術(shù)機構(gòu)聯(lián)合編制,。
《文檔圖像篡改檢測標(biāo)準》將為文檔圖像內(nèi)容安全提供可靠保障,,助力新時代AI安全體系建設(shè)。作為牽頭方,,信通院表示,,《文檔圖像篡改檢測標(biāo)準》將基于產(chǎn)業(yè)現(xiàn)狀,圍繞“細粒度”視覺差異偽造圖像鑒別,、生成式圖像判別,、文檔圖像完整性保護等行業(yè)焦點議題,凝聚行業(yè)共識,,以期為行業(yè)提供有效指引,。
“可信”反映了AI系統(tǒng)、產(chǎn)品和服務(wù)在安全性,、可靠性,、可解釋,、可問責(zé)等一系列內(nèi)在屬性的可信賴程度,相關(guān)概念正隨著技術(shù)發(fā)展的腳步,,從模糊走向清晰,、從起步走向成熟。開年以來,,以語言生成類,、視覺生成類模式為代表的AIGC產(chǎn)品引發(fā)了社會對于圖文內(nèi)容“可信度”問題的討論?!段臋n圖像篡改檢測標(biāo)準》的制定,,或?qū)橹袊翱尚臕I”在機器視覺、圖像處理領(lǐng)域的體系建設(shè)提供有力支持,。
用“過硬”的AI為行業(yè)發(fā)展注入安全感
AI向善還是向惡而行,?不法分子和守護者們每天都在未知的角落里上演無數(shù)次隱形的爭斗。哪一方是技術(shù)實力更為強勁,,是決定道高一尺還是魔高一丈的關(guān)鍵,。作為一家人工智能公司,過硬的科技實力是合合信息等科技企業(yè)突破行業(yè)難題,,培育創(chuàng)新技術(shù)的底氣,。AI圖像安全新技術(shù)的實現(xiàn),得益于公司在文檔圖像領(lǐng)域十余年的深耕攢下的底蘊,。
近期,,合合信息相關(guān)產(chǎn)品接連獲得信通院在智能文檔處理、OCR智能化領(lǐng)域的高分評級,。智能文檔處理系統(tǒng)評估結(jié)果顯示,,AI核心能力方面,合合信息產(chǎn)品在NLP領(lǐng)域的文本分類,、知識圖譜領(lǐng)域的實體識別,、關(guān)系抽取及OCR領(lǐng)域的字符識別、文本行識別均獲得5分評分,。合合信息智能文檔處理產(chǎn)品獲得“5級”評定,。據(jù)悉,“5級”為該模塊最高評定等級,。
OCR評估中,,合合信息智能文字識別產(chǎn)品順利通過全部7項基礎(chǔ)類功能指標(biāo)測試以及9項增強類功能指標(biāo)測試,獲得“增強級”評級,。評估報告認為,,公司智能文字識別產(chǎn)品展現(xiàn)出良好的性能和服務(wù)成熟度。以具有較大難度的證件類和票據(jù)類性能測試為例,,面對旋轉(zhuǎn),、陰影,、反光、褶皺,、形變,、模糊、多語言,、低像素,、光照不均等復(fù)雜場景,合合信息智能文字識別產(chǎn)品均有較高的識別準確率,,字符準確率分別為99.21%和99.59%,,字段準確率分別為97.87%和98.42%。
測試結(jié)果還顯示,,合合信息智能文字識別產(chǎn)品支持超過50種復(fù)雜語言的識別,為全球化,、多語言背景下的信息智能識別提供了技術(shù)支撐,。截至目前,合合信息智能文字識別,、智能文檔處理相關(guān)技術(shù)已發(fā)表于CVPR,、AAAI、ACL,、ACM MM等國際頂會上,,并在ICPR、ICFHR 等十余項國際競賽中獲得冠軍?,F(xiàn)階段,,公司已獲得超百項自主知識產(chǎn)權(quán)發(fā)明專利,為全球超過200個國家和地區(qū)的上億用戶提供智能文字識別產(chǎn)品及AI服務(wù),。未來,,公司將持續(xù)關(guān)注圖像領(lǐng)域新需求、新動態(tài),,用“過硬”的AI為行業(yè)發(fā)展注入安全感,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1058033.html
溫馨提示:投資有風(fēng)險,,入市須謹慎,。本資訊不作為投資理財建議。