鑒偽“深度合成”內(nèi)容
快商通與美亞柏科,、華僑大學(xué)聯(lián)合申報的“基于深度學(xué)習(xí)的可信多媒體鑒定關(guān)鍵技術(shù)研究及其產(chǎn)業(yè)化應(yīng)用”課題入選廈門市重大科技項目,這一項目就是對“深度合成”內(nèi)容進行鑒別,,判斷多媒體內(nèi)容是否屬于偽造,。
研究反生成式AI
美亞柏科正對包括反生成式AI在內(nèi)的AI安全及監(jiān)管領(lǐng)域進行研究,并根據(jù)業(yè)務(wù)需要布局相關(guān)產(chǎn)品,。
推出聲音克隆服務(wù) 引入智能檢測算法
復(fù)刻你的聲音 還能加“防偽碼”
最近,,“AI孫燕姿”成了新“頂流”,,其通過AI訓(xùn)練,可以用歌手孫燕姿的聲音演唱任何你想聽到的歌曲,,有網(wǎng)友感慨“真假難辨”,。
事實上,“AI孫燕姿”背后的聲音克隆技術(shù)并非新生事物,,其應(yīng)用已涉及娛樂,、教育等多個領(lǐng)域。在我市,已有人工智能企業(yè)探索聲音克隆的應(yīng)用場景,,還有的研究鑒偽技術(shù),防止技術(shù)濫用,。
聲音克隆已用于多種場景
廈門大學(xué)信息學(xué)院副教授洪青陽說,,聲音克隆可用在電影配音、有聲書,、播客等領(lǐng)域,,“人們可以根據(jù)自己喜好,選擇某個已獲授權(quán)的聲音來演繹,。再比如,,可以克隆已故親人的聲音,讓記憶永存,。
不久前,,廈企云知芯的母公司云知聲就上線了“聲音克隆”服務(wù)。據(jù)云知聲介紹,,其“聲音克隆”可全面學(xué)習(xí)用戶的音色和風(fēng)格,,僅需用戶二十句左右的原始錄音,就可以合成貼近真人的數(shù)字聲音,,且能做到“朗讀的語氣、語調(diào),、情感堪比真人”,。
在具體的應(yīng)用中,云知聲方面描繪了幾個場景:智能語音音箱中傳來兒女的聲音,,提醒年邁的父母注意天氣變化,;兒童點讀機里生硬的機械音被媽媽輕柔的呢喃所取代……
廈企快商通也將聲音克隆技術(shù)應(yīng)用于其研發(fā)的數(shù)字人軟件中?!坝脩糁恍杼峁┮欢?~5分鐘有真人出鏡,、包含人聲的視頻,通過我們的軟件,,就可以根據(jù)需求,,自動生成一段全新的視頻,這個數(shù)字人的聲音跟真人幾乎一模一樣,?!笨焐掏?lián)合創(chuàng)始人李稀敏說。
用AI反制AI 防止濫用
AI虛擬歌手的風(fēng)靡,,引發(fā)人們對聲音安全問題的擔憂:用AI技術(shù)模擬聲音進行詐騙的違法行為屢見不鮮,,我們?nèi)绾巫R別出原版和翻版的聲音?
技術(shù)產(chǎn)生的問題,當然也能通過技術(shù)來解決,。去年底,,快商通與美亞柏科、華僑大學(xué)聯(lián)合申報的“基于深度學(xué)習(xí)的可信多媒體鑒定關(guān)鍵技術(shù)研究及其產(chǎn)業(yè)化應(yīng)用”課題入選廈門市重大科技項目,,這一項目就是對“深度合成”內(nèi)容進行鑒別,,判斷多媒體內(nèi)容是否屬于偽造。
與此同時,,快商通在其自主研發(fā)的數(shù)字人,、聲音復(fù)刻等AIGC(生成式AI)技術(shù)中,也引入獨特的智能檢測算法,,用于AIGC內(nèi)容的追蹤溯源,。李稀敏說:“我們在視頻或者音頻中隱藏了一個信道,這里頭傳輸?shù)男畔⒂歇毺氐臉俗R,,相當于身份名片,。退一步說,哪怕信息丟失了,,我們也能通過算法檢測出聲音真?zhèn)?。?/p>
“任何技術(shù)都具有兩面性,,AIGC在賦能產(chǎn)業(yè)數(shù)字化進程方面大有作為,,但也極其容易被犯罪分子濫用。因此,,發(fā)展AIGC的同時,,也需要持續(xù)深化可信技術(shù)?!崩钕∶粽f,。
【解密】
訓(xùn)練一位AI歌手
僅需三步
任何曲風(fēng)都能駕馭,且沒有違和感,,“AI孫燕姿”是怎么煉成的,?
廈門大學(xué)信息學(xué)院副教授洪青陽告訴記者,以“AI孫燕姿”為代表的AI虛擬歌手,,由語音轉(zhuǎn)換(Voice Conversion)技術(shù)打造,,屬于聲音克隆的一種。所謂語音轉(zhuǎn)換,,簡單理解,,就是把A的音色轉(zhuǎn)換成B的音色,與此同時,,保留A說話或唱歌的內(nèi)容以及語氣,、語調(diào)等細節(jié),。
洪青陽說,訓(xùn)練AI歌手的過程大致分為三步,,以“AI孫燕姿”翻唱周杰倫的《發(fā)如雪》為例:先用專門的音頻軟件,,把《發(fā)如雪》的伴奏和周杰倫的人聲分離;再用處理好的孫燕姿的干聲(去噪的無音樂純?nèi)寺暎?shù)據(jù),,向機器“投喂”,,訓(xùn)練出一個具備孫燕姿音色的聲學(xué)模型;最后用這一模型對《發(fā)如雪》歌曲文件進行音色轉(zhuǎn)換,,最終得到“AI孫燕姿”翻唱的《發(fā)如雪》,。
“完成語音轉(zhuǎn)換的前提是,需具備所模仿對象B的目標音頻,,所以它并不是無中生有的,。”洪青陽說,,除了語音轉(zhuǎn)換以外,,聲音克隆還包括個性化語音合成技術(shù)(TTS),可以實現(xiàn)文本轉(zhuǎn)語音,,其優(yōu)點是不需要被模仿對象B說過同樣的話,,內(nèi)容定制更自由,比如,,“寫一首全新的歌讓AI演唱,,但這種情況下,因為沒有‘依葫蘆畫瓢’的目標音頻,,AI唱得可能像孫燕姿的音色,,但不像周杰倫的唱法?!?/p>
【記者手記】
眼見
不一定為實
耳聽
也可能為虛
今年以來,AI頻頻出圈,,除了技術(shù)更新迭代快以外,,還有一個重要原因是,AIGC(生成式AI)使創(chuàng)作門檻降低了,。正如福建省人工智能協(xié)會會長陸陽所言,當AI從感知智能走向認知智能,,極大提升了個人用戶的生產(chǎn)力,,“人們可以不斷地生產(chǎn)圖像、視頻,、音頻……未來,,人人都可以是AI創(chuàng)作家?!?/p>
不過,,AIGC仍處于發(fā)展的早期階段,其相關(guān)法律法規(guī),、標準體系等尚不健全,。有法律人士提醒,站在被翻唱歌曲權(quán)利人的角度,,AI歌手存在侵權(quán)問題,。當我們利用AI工具生產(chǎn)內(nèi)容的同時,得緊繃知識產(chǎn)權(quán)這根弦,。與此同時,,我們也應(yīng)提高防騙意識,畢竟,,在AI狂飆的時代,,眼見不一定為實,耳聽也可能為虛,。
大模型廣泛應(yīng)用 賦能近百個大數(shù)據(jù)項目
“最強大腦”直面算力難題
昨日,,蘋果發(fā)布首款混合現(xiàn)實(MR)頭戴式設(shè)備Apple Vision Pro(簡稱“蘋果頭顯”),繼ChatGPT之后,,再次引發(fā)大家對人工智能的廣泛關(guān)注,。今年以來,我市多家電子信息企業(yè)緊跟行業(yè)趨勢,,紛紛涉足腦機接口,、大模型等人工智能新領(lǐng)域。
根據(jù)發(fā)布會介紹,,蘋果頭顯將聚焦游戲,、工作,、交流,這款設(shè)備將把世界帶入“空間計算”,。除了硬件之外,,算力也是其發(fā)揮作用的一個重要支撐。
值得一提的是,,隨著AI技術(shù)不斷升級,,其安全也愈發(fā)受到重視,美亞柏科正對包括反生成式AI在內(nèi)的AI安全及監(jiān)管領(lǐng)域進行研究,,并根據(jù)業(yè)務(wù)需要布局相關(guān)產(chǎn)品,。
算力支撐
依托超算平臺
推動大模型應(yīng)用
在ChatGPT之后,基于各自算力,,國內(nèi)行業(yè)“大咖”百度,、騰訊、阿里,、華為等先后發(fā)布大模型,。前不久,云知聲山海大模型也在北京發(fā)布,,展示了其在語言,、邏輯、數(shù)學(xué)等領(lǐng)域的十大核心能力,。這一大模型的背后,正是依托東南區(qū)域最強超算平臺——廈門Atlas智算中心提供的高效穩(wěn)定算力,,近200P算力支撐千億規(guī)模的模型訓(xùn)練,,在兩個月內(nèi)完成,。
云知聲東南總部總經(jīng)理陸陽向記者透露,,為了滿足山海大模型的需求,,他們在廈門Atlas智算平臺和DCML模型工廠基礎(chǔ)上,擴充算力,,攻關(guān)工程優(yōu)化和數(shù)據(jù)優(yōu)選,。這期間,廈門區(qū)域完成了算力擴容,、算法驗證,、并行加速,、數(shù)據(jù)優(yōu)選等,,實現(xiàn)GPT為核心的架構(gòu)升級。
另一家廈企美亞柏科的MYAI大模型目前在順利推進,,日前,,其相關(guān)負責(zé)人透露,大模型已在公共安全,、政務(wù),、稅務(wù),、企業(yè)數(shù)字化轉(zhuǎn)型等多個領(lǐng)域的近百個大數(shù)據(jù)項目建設(shè)中,,得到廣泛應(yīng)用,。美亞柏科建設(shè)的廈門市超級計算中心,截至目前有1000多臺服務(wù)器,,算力達1966萬億次/秒,,主要為大數(shù)據(jù),、人工智能技術(shù)基礎(chǔ)研發(fā)提供算力支撐。
軟硬發(fā)力
關(guān)注并參與
腦機接口領(lǐng)域
作為人工智能的新領(lǐng)域,,腦機接口也正在受到關(guān)注,,其主要是實現(xiàn)腦與設(shè)備的信息交互,。為促進我國腦機接口領(lǐng)域的交流合作,,推動腦機接口技術(shù)產(chǎn)學(xué)研用全鏈條發(fā)展,,由廈企盈趣科技參與承辦的“首屆腦機接口大會”將于下個月召開。
前不久,,盈趣科技“牽手”天津大學(xué)等,,在我市成立北洋腦機接口與智慧健康創(chuàng)新研究院,將圍繞新型神經(jīng)信號感知與檢測,、組織工程與神經(jīng)仿生、新一代高通量腦機交互技術(shù),、人機共融基礎(chǔ)核心器件開發(fā)轉(zhuǎn)化平臺等方向開展科學(xué)研究,,旨在構(gòu)建完整的自主知識產(chǎn)權(quán)集群,,實現(xiàn)腦機交互技術(shù)鏈條全覆蓋,。
盈趣科技為客戶定制化研發(fā)的合作模式,使得其核心能力從早期的精密塑膠件,,逐漸延伸至核心電子組件,、人機交互系統(tǒng)(電助力自行車人機交互系統(tǒng)、車載hud)等,,也是他們與其他電子ODM企業(yè)的核心差異,。
另一家廈企弘信電子則在電子元器件上發(fā)力,日前他們在互動平臺上也透露,,他們關(guān)注并看好腦機接口帶來的發(fā)展機遇,,成功獨家為小米鐵蛋機器人,提供全套電路板解決方案,。同時,,他們的產(chǎn)品正應(yīng)用到多款智能眼鏡及AR、VR硬件產(chǎn)品中,,今年以來,,這個領(lǐng)域的訂單顯著增長。
值得一提的是,,前不久,,弘信電子與燧原科技簽訂合作協(xié)議,雙方正共同開發(fā)高算力,、高能效比的人工智能訓(xùn)練推理能力,,打造適合人工智能應(yīng)用與訓(xùn)練基礎(chǔ)能力的國產(chǎn)化算力平臺。
(廈門日報記者 林露虹 李曉平)
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1042972.html
溫馨提示:投資有風(fēng)險,,入市須謹慎,。本資訊不作為投資理財建議,。