新華社北京6月7日電 人類有超過(guò)7000種語(yǔ)言,,其中包括使用人數(shù)不多,、相關(guān)資料稀少的“小眾語(yǔ)言”。美國(guó)“元”公司新研發(fā)的一個(gè)人工智能模型,,能翻譯200種不同語(yǔ)言,,實(shí)現(xiàn)了對(duì)較多“小眾語(yǔ)言”在線翻譯。人工智能翻譯目前多利用基于人工神經(jīng)網(wǎng)絡(luò)的模型翻譯各種語(yǔ)言,。這些模型通常需要大量可在線獲取的訓(xùn)練數(shù)據(jù),。不過(guò),有些特定語(yǔ)言的數(shù)據(jù)尚不能公開(kāi)和低成本獲取或普遍可及,,這類語(yǔ)言又被稱為“低資源語(yǔ)言”,。“元”公司團(tuán)隊(duì)新研發(fā)的一種跨語(yǔ)言技術(shù),,能讓基于人工神經(jīng)網(wǎng)絡(luò)的翻譯模型學(xué)習(xí)如何利用已有的翻譯高資源語(yǔ)言的能力來(lái)翻譯低資源語(yǔ)言,。團(tuán)隊(duì)?wèi)?yīng)用該技術(shù)開(kāi)發(fā)了一個(gè)名為NLLB-200的在線多語(yǔ)言翻譯工具,可容納200種語(yǔ)言,,其能翻譯的低資源語(yǔ)言的數(shù)量是高資源語(yǔ)言數(shù)量的3倍,。這一研究成果近期發(fā)表在英國(guó)《自然》雜志上。由于研究團(tuán)隊(duì)在許多低資源語(yǔ)言上只能獲取1000至2000例樣本,,為擴(kuò)大NLLB-200的訓(xùn)練數(shù)據(jù)量,,他們利用一個(gè)語(yǔ)言識(shí)別系統(tǒng)發(fā)現(xiàn)了這些特定語(yǔ)言的更多實(shí)例。團(tuán)隊(duì)還從互聯(lián)網(wǎng)存檔中挖掘這些語(yǔ)言與英語(yǔ)的雙語(yǔ)文本數(shù)據(jù),,幫助提升模型的翻譯質(zhì)量,。研究者稱,,該翻譯工具可幫助低資源語(yǔ)言使用者使用互聯(lián)網(wǎng)等技術(shù),且這一模型還可用于教育,,幫助這類人群獲取更多圖書和論文資料,。不過(guò)研究者也表示,這一工具的誤譯情況仍有可能出現(xiàn),。(完)
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1106665.html
溫馨提示:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議,。