文章來源:硅星GenAI
又一個只有很少的員工,,創(chuàng)造出 10 億美元獨角獸企業(yè)的故事誕生了。
這兩天,,ElevenLabs 緊隨著自己融資 8000 萬的新聞,,在 X 上接連發(fā)了一則招聘啟事和一條宣傳片,,以將自己的團隊規(guī)模,,從 40 人擴大到 100 人。
產(chǎn)品本身不是什么新出的產(chǎn)品,ElevenLabs成立于 2022 年,,像是文字轉(zhuǎn)語音和語音克隆功能也是 2023 年出的,。這次伴隨融資新聞和宣傳片的傳播,讓這家公司徹底被大眾所熟知,。
產(chǎn)品頁面目前看起來簡潔且清晰,,全都集中在左上角:
開頭的視頻號我們就是直接用視頻多語言翻譯(Dubbing)這個功能做的,。
具體步驟比把大象裝冰箱都要簡單:
1,、粘貼你想翻譯的視頻的鏈接(甚至都不用下載);
2,、選擇源語言和目標語言,,并點擊 Create。
然后……等待大概 3 分鐘左右,,Done,。
這時候生成的視頻,,就已經(jīng)可以使用了,,但也可以進一步編輯。
在編輯頁面可以重新選擇說話人的聲音,,通過多條音軌,,每句話是由誰說的都可以自己設定。
能通過設置三個選項對聲音進行微調(diào):
1,、Stability 代表穩(wěn)定性,,這個參數(shù)的高低,會影響語音語調(diào)的變化,。過高會有些死板,,過低會不夠穩(wěn)定。
2,、Similarity 代表著相似程度,,越高就越像源聲音,但過高也會出現(xiàn)一些莫名其妙,、并不存在的聲音,。
3、Style 代表語音的風格,,與上傳的音頻相比,,數(shù)值越高風格越夸張。設置成 0 會提高生成速度,。
在這個產(chǎn)品里,,只有這三個參數(shù)是通過數(shù)據(jù)調(diào)節(jié)。
目前體驗下來,,這款產(chǎn)品在中文上的表現(xiàn),基本上跟現(xiàn)實里外國人說中文的感覺一模一樣,,這種差異在賽博世界也難以避免,。
而且還會有一些非常詭異的 BUG,比如說驢(lv)會讀成路(lu),。
不過,,剛才我們使用的語音克隆,都是即時語音克隆模式,,當付費到Creator級別(每月 22 美元)以后,,可以解鎖專業(yè)聲音克隆模式(Professional Voice Cloning)。
在這種模式下,,光看這些需求,,一股名為“專業(yè)”的感覺就撲面而來:
1、 提交聲音后需要等待 4 周才能使用克隆的聲音
2,、盡量使用專業(yè)錄音設備進行錄制,;
3、錄音時建議使用防噴罩,;
4,、在經(jīng)過聲學處理的房間里進行錄制;
5,、需要錄制至少 30 分鐘,,最好 3 個小時的聲音素材等。
Google 網(wǎng)頁翻譯
我提交了 30 分鐘的我自己的聲音素材,當然也并沒有他說的哪些專業(yè)設備,,就是想看看 4 周以后看看會有什么更厲害的效果,。到時候再給大家匯報。
目前ElevenLabs支持 29 種語言,,除了中文都還可以,。國內(nèi)目前也已經(jīng)有了一些類似的產(chǎn)品,,但還沒聽說有哪一款特別爆火,。如果有哪些很好用,也希望各位推薦安利一波,。
免責聲明:本文來自網(wǎng)絡收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1088397.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。