EchoSpeech眼鏡,。圖片來源:康奈爾大學(xué)
美國康奈爾大學(xué)研究人員開發(fā)了一款聲吶眼鏡,,它通過聲學(xué)感應(yīng)和人工智能跟蹤嘴唇和嘴巴的動作,可連續(xù)識別多達(dá)31條無聲的命令,,該系統(tǒng)可為那些暫時不方便說話或無法發(fā)聲的人提供幫助,。相關(guān)論文將在本月于德國漢堡舉行的計算機(jī)協(xié)會計算系統(tǒng)人為因素會議上發(fā)表,。
這款眼鏡是一種名為EchoSpeech的無聲語音識別接口。該眼鏡配備了一對麥克風(fēng)和比鉛筆橡皮擦還小的揚聲器,,成為一個可穿戴的人工智能驅(qū)動的聲吶系統(tǒng),,在面部發(fā)送和接收聲波,,并感知嘴巴的運動。然后,,深度學(xué)習(xí)算法實時分析這些回聲輪廓,,準(zhǔn)確率約為95%。這款低功耗,、可穿戴的眼鏡只需要幾分鐘的用戶訓(xùn)練數(shù)據(jù),,即可識別命令并可在智能手機(jī)上運行。
EchoSpeech可用于在說話不方便或不合適的地方通過智能手機(jī)與他人交流,,比如在嘈雜的餐廳或安靜的圖書館里,。無聲語音界面還可與觸筆配對,并與CAD等設(shè)計軟件一起使用,,幾乎不需要鍵盤和鼠標(biāo),。
研究人員表示,他們正在將聲吶技術(shù)“搬”到人體上,。它體積小,、功耗低、對隱私敏感,,這些都是在現(xiàn)實世界中部署新的可穿戴技術(shù)的重要功能,。無聲語音識別中的大多數(shù)技術(shù)都局限于一組選定的預(yù)定命令,,需要用戶面部或佩戴攝像頭,,這既不實用也不可行??纱┐魇綌z像頭也存在重大的隱私問題,對用戶和與之互動的人來說都是如此,。而像EchoSpeech這樣的聲學(xué)傳感技術(shù)消除了對可穿戴式攝像機(jī)的需求,。
此外,由于音頻數(shù)據(jù)比圖像或視頻數(shù)據(jù)小得多,,因此EchoSpeech只需更小的帶寬,,通過藍(lán)牙實時傳輸?shù)街悄苁謾C(jī)上,且數(shù)據(jù)在本地,,不在云端,,確保了敏感隱私信息安全。
今年以來,,人工智能再次引發(fā)極大關(guān)注,。幾年前,專家們還在探討如何讓人工智能更加準(zhǔn)確地理解人的意圖,,并與人進(jìn)行多輪對話。曾經(jīng),,讓人工智能讀懂唇語,,還只是科幻電影中的橋段,。如今,這些都在快速變?yōu)楝F(xiàn)實,。面對人工智能帶來的超乎預(yù)期的變化,不能停留在“看熱鬧”階段,,人們需要真正去思考,如何更好地主宰人工智能,,利用它為人類造福,并盡量規(guī)避它可能帶來的麻煩,。
來源:科技日報
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1013774.html
溫馨提示:投資有風(fēng)險,入市須謹(jǐn)慎,。本資訊不作為投資理財建議,。