2023年,第二次人工智能浪潮,,因?yàn)榇竽P偷?#8221;涌現(xiàn)”能力不期而至,。
事實(shí)上,,早在2022年年中,,Midjourney、Jasper等圖片生成,、文字生成類AIGC應(yīng)用就在海外走紅,。這使得,當(dāng)全球大佬們還圍繞底層大模型進(jìn)行”軍備競(jìng)賽”時(shí),,建立在模型基礎(chǔ)上的AI應(yīng)用,,已在數(shù)量和類型上“百花齊放”。
36氪日前接觸到的一家公司「音律閃動(dòng)」,,就是一家以AI寫(xiě)歌為主營(yíng)業(yè)務(wù)的公司,,當(dāng)前正在打磨一款名為「歌歌AI寫(xiě)歌」的AI歌曲創(chuàng)作類產(chǎn)品。公司高管告訴36氪,,其團(tuán)隊(duì)成員長(zhǎng)期身處音樂(lè)領(lǐng)域,,早在上一次AI風(fēng)靡(即Alphago擊敗人類)時(shí),就開(kāi)始探索用AI生成音樂(lè),。而2022年,,出于對(duì)AI寫(xiě)歌領(lǐng)域的持續(xù)看好,團(tuán)隊(duì)成員聚在一起成立了「音律閃動(dòng)」,,希望做出全球領(lǐng)先的AI寫(xiě)歌類產(chǎn)品,。
在全球范圍內(nèi),AI創(chuàng)作音樂(lè)并非新鮮事物——Google,、OpenAI,,和一些國(guó)內(nèi)外創(chuàng)業(yè)公司均有涉獵。但在「音律閃動(dòng)」團(tuán)隊(duì)眼中,,這些產(chǎn)品的效果均有不足,。
公司COO王樞沛告訴36氪,目前全球范圍內(nèi)的AI創(chuàng)作音樂(lè)產(chǎn)品可分為三種技術(shù)路線,。第一種是符號(hào)音樂(lè)生成路線,。這種方式類似NLP模型的訓(xùn)練——人們需要先標(biāo)注大量樂(lè)譜,再訓(xùn)練,,最后形成的產(chǎn)品也是樂(lè)譜,。但這種方式的弊端在于,生成的結(jié)果是樂(lè)譜而非音樂(lè),,”怎么把樂(lè)譜直接變成音樂(lè),,目前是一個(gè)全球范圍內(nèi)的難題。”王樞沛表示,。
另一種是大模型思路,,即直接用海量音頻訓(xùn)練模型,但這種方式不僅需要高昂資金,生成效果也需要提升,。王樞沛解釋,,音樂(lè)里包含的信息量很大,不僅包括歌詞,、人聲和旋律,,歌詞里還分為各種語(yǔ)義信息,人聲里還包括口音,、感情表現(xiàn)等,,旋律則可能由數(shù)十種樂(lè)器演奏而成,每種樂(lè)器都存在自己的演奏方式,。”一首歌里有著龐大的信息量,,比訓(xùn)練ChatGPT的難度高很多。”王樞沛表示,,當(dāng)前Google和OpenAI的產(chǎn)品采用這類路線,,但在音質(zhì),、音色,、歌詞等方面還遠(yuǎn)不及商用標(biāo)準(zhǔn)。
還有一些初創(chuàng)公司走的是”AI剪輯”路線,,就是積累龐大的歌曲素材庫(kù),,再對(duì)這些素材打標(biāo),接著用AI進(jìn)行剪輯,。”嚴(yán)格來(lái)說(shuō),,這不屬于AI的生成。這些素材被提前準(zhǔn)備好,,再讓AI找出來(lái)進(jìn)行拼接,。”王樞沛告訴36氪,在體感上這類歌曲并不流暢,,再加上維護(hù)龐大的素材庫(kù)需要花費(fèi)不少成本,,整體投入產(chǎn)出比不高。
對(duì)比之下,,「音律閃動(dòng)」團(tuán)隊(duì)認(rèn)為自身產(chǎn)品生成的歌曲已達(dá)到商用標(biāo)準(zhǔn),。而且,「歌歌AI寫(xiě)歌」”是唯一能做到整曲生成的產(chǎn)品”,。對(duì)此王樞沛解釋,,整曲是說(shuō),「歌歌寫(xiě)AI歌」目前已可以生成包括歌詞,、人聲,、旋律在內(nèi)的完整音樂(lè)。最終,「歌歌AI寫(xiě)歌」的目標(biāo)是在數(shù)秒內(nèi)根據(jù)用戶Prompt生成發(fā)行級(jí)的華語(yǔ)流行音樂(lè),,并覆蓋全球所有類型音樂(lè),。
他進(jìn)一步告訴36氪,「歌歌AI寫(xiě)歌」采用的并不是大模型路線,,而是由多個(gè)專業(yè)模型和專家系統(tǒng)組成而成的AI產(chǎn)品,。”拿旋律舉例,我們會(huì)有一個(gè)專有模型去做旋律的生成,。整體我們有多個(gè)專有模型,。”他介紹,這樣做既保證了效果,,算力消耗也不大,。再加上,公司此前也積累了不少歌曲的版權(quán),,所以訓(xùn)練素材較為豐富,。另外,公司還積累了把樂(lè)譜轉(zhuǎn)換成音樂(lè)的音頻算法,。王樞沛總結(jié),,多種模型、歌曲版權(quán)以及對(duì)音樂(lè)的理解是公司的壁壘,。
未來(lái),,「音律閃動(dòng)」的目標(biāo)用戶是全球所有喜歡音樂(lè)、唱歌的普通人,。公司表示,,希望達(dá)成全球超過(guò)二十億用戶在其平臺(tái)上進(jìn)行生成、創(chuàng)作,、分享和版權(quán)變現(xiàn)的目標(biāo),。
當(dāng)前「歌歌AI寫(xiě)歌」正在打磨過(guò)程中,計(jì)劃在接下來(lái)的幾個(gè)月內(nèi)面世,。”我們還會(huì)在生成的歌曲整體效果,、生成風(fēng)格的廣度上持續(xù)打磨。”王樞沛說(shuō),。
團(tuán)隊(duì)方面,,公司目前員工人數(shù)在20左右。據(jù)介紹,,CEO龍勇?lián)碛?0年音樂(lè)制作經(jīng)驗(yàn),,曾是中國(guó)好聲音、中國(guó)有嘻哈,、TME官方合作伙伴,,參與制作運(yùn)營(yíng)音樂(lè)版權(quán)總播放量在百億級(jí)別,,總版稅數(shù)億。COO王樞沛是浙江大學(xué)工學(xué)/ 美國(guó)伯克利音樂(lè)學(xué)院音樂(lè)制作和吉他表演雙專業(yè)學(xué)士,,曾任網(wǎng)易AI音樂(lè)產(chǎn)品負(fù)責(zé)人,。CTO張文鉑曾任阿里巴巴技術(shù)總監(jiān),是「我要寫(xiě)歌」APP創(chuàng)始人,。團(tuán)隊(duì)核心成員均來(lái)自阿里,、網(wǎng)易、字節(jié),、Google等音樂(lè)AI相關(guān)項(xiàng)目,。
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1023693.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。