A欧美国产国产综合视频_最近日本中文字幕免费完整_国产乱伦一级片_久久99国产综合精品婷婷_韩国理论片在线中文字幕一区二区_亚洲AV成人影片在线观看_亚洲av无码电影网_优物视频最新网址_天天艹无码天天射_脱下丝袜的极品销魂大胸美女王馨瑶91精品美女嫩模写真套图,男男被?到喷水18禁视频,欧美久久精品一级黑人c片 ,综合在线视频精品专区

人民網(wǎng)

國家科技進步獎|人工智能領(lǐng)域首次“站上巔峰” “十年磨一劍”用AI建設(shè)美好世界

國家科技進步獎|人工智能領(lǐng)域首次“站上巔峰” “十年磨一劍”用AI建設(shè)美好世界24日,,2023年度國家科學(xué)技術(shù)獎在京揭曉,,科大訊飛作為第一完成單位的《多語種智能語音關(guān)鍵技術(shù)及產(chǎn)業(yè)化》項目獲得國家科學(xué)技術(shù)進步獎一等獎。這是深度學(xué)習(xí)引發(fā)全球人工智能浪潮以來,,過去十年人工智能領(lǐng)域首個國家科學(xué)技術(shù)進步獎一等獎,。關(guān)鍵技術(shù)取得四大突破語音是人類最自然便捷的溝通方式,是智能設(shè)備人機交互的關(guān)鍵入口,,也是諸多敏感信息的重要載體,。多語種智能語音技術(shù)對于支撐人機交互、人類語言互通等需求具有重大戰(zhàn)略意義,,具有十分廣闊的產(chǎn)業(yè)前景,,是當(dāng)前國際科技競爭核心焦點之一。持續(xù)攻關(guān)多年,,科大訊飛攻克了多個技術(shù)難題,,提出了四個方面的技術(shù)創(chuàng)新:復(fù)雜語音信號解耦建模關(guān)鍵技術(shù)突破,多語種共享建模關(guān)鍵技術(shù)突破,,語音語義聯(lián)合建模關(guān)鍵技術(shù)突破,,以及國產(chǎn)異構(gòu)硬件平臺訓(xùn)練及推理加速關(guān)鍵技術(shù)突破。語音識別研究中最具挑戰(zhàn)的是遠場,、噪聲,、多人語音混疊等現(xiàn)象導(dǎo)致的“雞尾酒會”效應(yīng)典型難題。為解決這一難題,,科大訊飛提出了多通道語音信號時空分離建模方法和多維度語音屬性解耦表征方法,,實現(xiàn)語音信號中內(nèi)容、噪聲等高度耦合的多維屬性特征解耦,,使得復(fù)雜場景下語音識別準確率得到重大突破,。為了應(yīng)對多語種技術(shù)“卡脖子”問題,必須解決小語種智能語音系統(tǒng)構(gòu)建所面臨的知識匱乏,、訓(xùn)練數(shù)據(jù)稀缺等難題,。科大訊飛設(shè)計了全新的多語種通用音素體系和基本語言單元,,實現(xiàn)多語種統(tǒng)一音素韻律體系的構(gòu)建,,又通過基于元學(xué)習(xí)的多語種預(yù)訓(xùn)練和基于語族分組的多語種共享建模——通俗地說,,就是將不同的小語種進行分類,,找到同類語種的共同規(guī)律,進行分析建模和訓(xùn)練,。復(fù)雜應(yīng)用場景下語音交互,、語音翻譯面臨著深層次語義理解困難,、專業(yè)性不足等問題??拼笥嶏w提出語音語義互增強的魯棒口語理解技術(shù),,有效提升語音交互、語音翻譯等復(fù)雜場景的語義理解準確率,;提出多源知識增強的可信文本生成技術(shù),,提升專有詞匯及領(lǐng)域知識引用的準確率。為解決使用國產(chǎn)芯片開展智能語音算法模型訓(xùn)練和推理面臨的性能低,、適配難等問題,,科大訊飛提出的硬件親和的變長輸入算子融合和聯(lián)合統(tǒng)一量化感知訓(xùn)練技術(shù),通過軟硬件協(xié)同優(yōu)化的動態(tài)張量算子自動融合方法,,實現(xiàn)對語音等變長輸入的訓(xùn)練性能優(yōu)化達到國際主流芯片同等水平,。未來:智能語音+認知大模型據(jù)了解,因2021年度,、2022年度國家科學(xué)技術(shù)獎暫停的緣故,,2023年度國家科學(xué)技術(shù)獎積累了大量的優(yōu)秀成果,無論是提名環(huán)節(jié)拿指標,、初評環(huán)節(jié)過網(wǎng)評,,還是答辯環(huán)節(jié),競爭都異常激烈,。科大訊飛表示,,通用人工智能時代,,多語種智能語音關(guān)鍵技術(shù)中的創(chuàng)新和大模型技術(shù)將相互補充、相互促進,。語音屬性解耦,、語音信號時空分離等技術(shù)突破,可以將語音信號經(jīng)過編碼后輸入到大語言模型,,顯著提升語音大模型的效果,。今年1月30日,科大訊飛就基于相關(guān)技術(shù)融合路線發(fā)布了星火語音大模型,,顯著超過了OpenAI的Whisper v3的語音大模型能力,,Whisper v3的24個主要語種的平均識別率為82%,而星火語音大模型達到了90%,。4月26日,,科大訊飛又首發(fā)多情感超擬人合成和一句話聲音復(fù)刻能力,使機器具備更加豐富的超擬人情緒感知和表達,。大模型技術(shù)可以在復(fù)雜語義理解,、長文本建模能力上進一步提升語音識別,、合成和翻譯的效果,同時基于其強大的語義理解,、知識問答,、多輪對話、多模態(tài)建模能力,,也能進一步大幅提升智能語音技術(shù)的使用場景和應(yīng)用價值,,支撐實現(xiàn)語音同傳、自動客服,、輔學(xué)答疑,、家庭醫(yī)生、虛擬員工,、陪伴機器人,、服務(wù)機器人等等未來智能產(chǎn)品創(chuàng)新,帶來巨大產(chǎn)業(yè)機會,,加速通用人工智能時代的到來,。另據(jù)透露,就在后天(27日),,訊飛星火V4.0也將正式發(fā)布,,底座能力全面對標GPT-4 Turbo,語音大模型也將迎來全新升級,。新民晚報記者 郜陽

免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1109433.html
溫馨提示:投資有風(fēng)險,入市須謹慎,。本資訊不作為投資理財建議,。

(0)
新民晚報的頭像新民晚報
上一篇 2024年6月25日 上午11:58
下一篇 2024年6月25日
198搶自鏈數(shù)字人

相關(guān)推薦