潮新聞客戶端 通訊員 鄭蒙蒙6月24日,,2023年度國(guó)家科學(xué)技術(shù)獎(jiǎng)在北京揭曉,共評(píng)選出250個(gè)項(xiàng)目,。據(jù)了解,由科大訊飛股份有限公司牽頭,,聯(lián)合中國(guó)科學(xué)技術(shù)大學(xué),、清華大學(xué)、華為終端有限公司,、中移(杭州)信息技術(shù)有限公司等高校及行業(yè)領(lǐng)軍企業(yè)聯(lián)合完成的“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項(xiàng)目榮獲2023年度國(guó)家科技進(jìn)步獎(jiǎng)一等獎(jiǎng),。獲獎(jiǎng)證書這是深度學(xué)習(xí)引發(fā)全球人工智能浪潮以來(lái),,過(guò)去十年人工智能領(lǐng)域的首個(gè)國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)。這也是科大訊飛繼2002年和2011年兩次獲得國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)二等獎(jiǎng)之后,,首次獲得國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng),。中國(guó)科技“亮劍”之作此次獲獎(jiǎng)項(xiàng)目是科大訊飛聯(lián)合清華大學(xué)、中國(guó)科大,、華為,、中國(guó)移動(dòng)等“實(shí)力派”國(guó)家隊(duì)共同完成,稱得上是一件中國(guó)科技的“亮劍”之作,。據(jù)了解,,多語(yǔ)種智能語(yǔ)音技術(shù)對(duì)于支撐人機(jī)交互、人類語(yǔ)言互通及國(guó)家安全等需求具有重大戰(zhàn)略意義,,具有十分廣闊的產(chǎn)業(yè)前景,,是當(dāng)前國(guó)際科技競(jìng)爭(zhēng)核心焦點(diǎn)之一。然而,,智能語(yǔ)音也面臨著如何突破復(fù)雜場(chǎng)景語(yǔ)音技術(shù)大規(guī)模實(shí)用門檻,,如何基于自主可控的平臺(tái)、實(shí)現(xiàn)國(guó)產(chǎn)軟硬件的語(yǔ)音產(chǎn)業(yè)鏈自主可控等問(wèn)題,。為解決語(yǔ)音識(shí)別研究中最具挑戰(zhàn)的是遠(yuǎn)場(chǎng),、噪聲、多人語(yǔ)音混疊等現(xiàn)象導(dǎo)致的“雞尾酒會(huì)”效應(yīng)典型難題,,科大訊飛提出了多通道語(yǔ)音信號(hào)時(shí)空分離建模方法和多維度語(yǔ)音屬性解耦表征方法,,實(shí)現(xiàn)語(yǔ)音信號(hào)中內(nèi)容、噪聲等高度耦合的多維屬性特征解耦,,使得復(fù)雜場(chǎng)景下語(yǔ)音識(shí)別準(zhǔn)確率得到重大突破。如何應(yīng)對(duì)小語(yǔ)種智能語(yǔ)音系統(tǒng)構(gòu)建所面臨的知識(shí)匱乏,、訓(xùn)練數(shù)據(jù)稀缺等難題,?科大訊飛設(shè)計(jì)了全新的多語(yǔ)種通用音素體系和基本語(yǔ)言單元,實(shí)現(xiàn)多語(yǔ)種統(tǒng)一音素韻律體系的構(gòu)建,,又通過(guò)基于元學(xué)習(xí)的多語(yǔ)種預(yù)訓(xùn)練和基于語(yǔ)族分組的多語(yǔ)種共享建?!ㄋ椎卣f(shuō),就是將不同的小語(yǔ)種進(jìn)行分類,,找到同類語(yǔ)種的共同規(guī)律,,進(jìn)行分析建模和訓(xùn)練——最終,顯著提升了小語(yǔ)種語(yǔ)音系統(tǒng)性能,。同時(shí),,為解決復(fù)雜應(yīng)用場(chǎng)景下語(yǔ)音交互,、語(yǔ)音翻譯面臨著深層次語(yǔ)義理解困難、專業(yè)性不足等問(wèn)題,,科大訊飛提出語(yǔ)音語(yǔ)義互增強(qiáng)的魯棒口語(yǔ)理解技術(shù),,有效提升語(yǔ)音交互、語(yǔ)音翻譯等復(fù)雜場(chǎng)景的語(yǔ)義理解準(zhǔn)確率,;提出多源知識(shí)增強(qiáng)的可信文本生成技術(shù),,提升專有詞匯及領(lǐng)域知識(shí)引用的準(zhǔn)確率。在解決使用國(guó)產(chǎn)芯片開展智能語(yǔ)音算法模型訓(xùn)練和推理面臨的性能低,、適配難方面,,科大訊飛提出的硬件親和的變長(zhǎng)輸入算子融合和聯(lián)合統(tǒng)一量化感知訓(xùn)練技術(shù),通過(guò)軟硬件協(xié)同優(yōu)化的動(dòng)態(tài)張量算子自動(dòng)融合方法,,實(shí)現(xiàn)對(duì)語(yǔ)音等變長(zhǎng)輸入的訓(xùn)練性能優(yōu)化達(dá)到國(guó)際主流芯片同等水平,;通過(guò)多硬件聯(lián)合的量化計(jì)算模擬,達(dá)到模型單次訓(xùn)練后可在不同硬件平臺(tái)上一鍵部署,,解決了智能語(yǔ)音技術(shù)硬件平臺(tái)的“卡脖子”問(wèn)題,。“頂天立地”構(gòu)建產(chǎn)業(yè)生態(tài)如今,,該技術(shù)成果不僅在全國(guó)兩會(huì),、博鰲論壇等重要政務(wù)和商務(wù)交流場(chǎng)合得到廣泛應(yīng)用,更在中國(guó)品牌“走出去”戰(zhàn)略中發(fā)揮了關(guān)鍵推動(dòng)作用,。以智能手機(jī)為例,,項(xiàng)目支持各主流手機(jī)廠商累計(jì)激活設(shè)備超10億臺(tái);智能汽車方面,,車載智能化產(chǎn)品累計(jì)前裝超 5300萬(wàn)套,,2023年中國(guó)汽車出海十強(qiáng)企業(yè)中,有8家企業(yè)都在和科大訊飛合作,;智能軟硬件方面,,有力支撐訊飛翻譯機(jī),、訊飛智能錄音筆,、訊飛聽見(jiàn)等智能軟硬件產(chǎn)品不斷創(chuàng)新,,其中,,訊飛翻譯機(jī)目前能支持85個(gè)語(yǔ)種的翻譯,,覆蓋全球200多個(gè)國(guó)家和地區(qū),;在會(huì)議,、辦公等場(chǎng)景,,訊飛聽見(jiàn)系列產(chǎn)品服務(wù)遍及全球50多個(gè)國(guó)家和地區(qū),,支持了超過(guò)40萬(wàn)場(chǎng)會(huì)議,,觸及超過(guò)4億觀眾;面向更多用戶,,訊飛輸入法月活躍用戶超1.4億人,,日語(yǔ)音交互次數(shù)超10億次,。項(xiàng)目還構(gòu)建了自主可控的多語(yǔ)種智能語(yǔ)音技術(shù)及全球產(chǎn)業(yè)生態(tài),2017年開始承建的智能語(yǔ)音國(guó)家新一代人工智能開放創(chuàng)新平臺(tái),,已聚集平臺(tái)開發(fā)者數(shù)700.7萬(wàn),,終端設(shè)備數(shù)40.5億;構(gòu)建全球多語(yǔ)種技術(shù)生態(tài),,目前平臺(tái)聚集海外開發(fā)者數(shù)超過(guò)40萬(wàn),。讓科技更有溫度,項(xiàng)目持續(xù)助力公益,,關(guān)愛(ài)弱勢(shì)群體和特殊人群,。“聽見(jiàn)AI的聲音”公益行動(dòng),,為聽力障礙人士提供免費(fèi)的實(shí)時(shí)語(yǔ)音轉(zhuǎn)文字服務(wù),、捐贈(zèng)免費(fèi)時(shí)長(zhǎng),截至2024年6月,,累計(jì)捐贈(zèng)時(shí)長(zhǎng)超一億分鐘,;“三聲有幸”項(xiàng)目,累計(jì)服務(wù)1368萬(wàn)人,,助力公益團(tuán)隊(duì)創(chuàng)建無(wú)障礙應(yīng)用超3萬(wàn)個(gè),。未來(lái):智能語(yǔ)音+認(rèn)知大模型,用人工智能建設(shè)美好世界據(jù)了解,,因2021年,、2022年國(guó)家科學(xué)技術(shù)獎(jiǎng)暫停的緣故,2023年度國(guó)家科學(xué)技術(shù)獎(jiǎng)積累了大量的優(yōu)秀成果,,無(wú)論是提名環(huán)節(jié)拿指標(biāo),、初評(píng)環(huán)節(jié)過(guò)網(wǎng)評(píng),還是答辯環(huán)節(jié),,競(jìng)爭(zhēng)都異常激烈,,堪稱是國(guó)獎(jiǎng)史上“最難”的一年。十年磨一劍,,科大訊飛創(chuàng)業(yè)25年來(lái)第三次獲得國(guó)家科技進(jìn)步獎(jiǎng),,對(duì)于科大訊飛而言,是一個(gè)新開始,。在通用人工智能時(shí)代,科大訊飛多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)中的創(chuàng)新和大模型技術(shù)相互補(bǔ)充,、相互促進(jìn),。今年1月30日,科大訊飛就基于上述技術(shù)融合路線發(fā)布了星火語(yǔ)音大模型,,顯著超過(guò)了OpenAI的Whisper v3的語(yǔ)音大模型能力,,Whisper v3的24個(gè)主要語(yǔ)種的平均識(shí)別率為82%,,而星火語(yǔ)音大模型達(dá)到了90%。4月26日,,科大訊飛又首發(fā)多情感超擬人合成和一句話聲音復(fù)刻能力,,使機(jī)器具備更加豐富的超擬人情緒感知和表達(dá)。
多情感超擬人合成大模型技術(shù)可以在復(fù)雜語(yǔ)義理解,、長(zhǎng)文本建模能力上進(jìn)一步提升語(yǔ)音識(shí)別、合成和翻譯的效果,,同時(shí)基于其強(qiáng)大的語(yǔ)義理解,、知識(shí)問(wèn)答、多輪對(duì)話,、多模態(tài)建模能力,,也能進(jìn)一步大幅提升智能語(yǔ)音技術(shù)的使用場(chǎng)景和應(yīng)用價(jià)值,支撐實(shí)現(xiàn)語(yǔ)音同傳,、自動(dòng)客服,、輔學(xué)答疑、家庭醫(yī)生,、虛擬員工,、陪伴機(jī)器人、服務(wù)機(jī)器人等等未來(lái)智能產(chǎn)品創(chuàng)新,。6月27日,,訊飛星火V4.0也將正式發(fā)布,底座能力全面對(duì)標(biāo)GPT-4 Turbo,,語(yǔ)音大模型也將迎來(lái)全新升級(jí),。“轉(zhuǎn)載請(qǐng)注明出處”
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1109405.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。