原文來源:硬AI
圖片來源:由無界 AI生成
谷歌繼續(xù)向音樂領(lǐng)域發(fā)起挑戰(zhàn),,人人都能作曲的時代似乎又近了一步。
12月14日,谷歌推出AI音樂創(chuàng)作工具“MusicFX”,僅需幾句話,用戶即可生成原創(chuàng)的音樂作品。
谷歌在介紹中指出,這一名為“MusicFX”的創(chuàng)作工具結(jié)合了谷歌此前發(fā)布的MusicLM模型和DeepMind的水印技術(shù)SynthID,,以便在事后識別出它們是否由AI制作而成,一定程度上可以解決創(chuàng)作人對于版權(quán)問題的擔(dān)憂,。
分析認(rèn)為,,MusicFX的出現(xiàn)也將成為AI領(lǐng)域的一個重要里程碑,為音樂家,、制作人和音樂愛好者開辟了嘗試和創(chuàng)作多種音樂的新可能性:
MusicFX為音樂創(chuàng)作者提供了豐富的音效和聲音素材,,用戶可以創(chuàng)作各種類型的音樂,同時支持調(diào)整音調(diào),、節(jié)奏和音量,,還可以添加混響、回聲等效果,。無論是想要營造舒緩的氛圍還是冒險緊張的氛圍,MusicFX都可以滿足,。
MusicFX當(dāng)前仍需要通過谷歌一個AI實(shí)驗(yàn)性產(chǎn)品網(wǎng)站(AI Test Kitchen)進(jìn)入,,這一平臺的建立是為了讓用戶在盡早體驗(yàn)其最新的AI技術(shù)的同時,,也能提供早期反饋,這種合作方法能幫助谷歌完善技術(shù),,并遵守道德標(biāo)準(zhǔn),。
媒體分析認(rèn)為,MusicFX的發(fā)布不僅僅將為音樂生成提供全新的工具,,也代表了AI發(fā)展過程中的趨勢,,用戶在幫助企業(yè)完善和塑造人工智能方面的作用變得越來越重要,,通過在早期階段讓用戶參與進(jìn)來,谷歌不僅增強(qiáng)了技術(shù),,還主動解決了潛在的道德問題,。
此外,MusicFX的出現(xiàn)可能會降低音樂創(chuàng)作的門檻,,讓更多沒有經(jīng)過專業(yè)音樂培訓(xùn)的愛好者們參與進(jìn)來,。
但MusicFX的出現(xiàn)并非沒有爭議,有觀點(diǎn)認(rèn)為,,如何解決人工智能生成的內(nèi)容對版權(quán),、所有權(quán)和音樂原創(chuàng)性的影響還沒有答案,谷歌決定在AI生成音樂中使用水印,,表明了他們對這些問題的關(guān)注,,但這一問題并沒有解決,AI生成的內(nèi)容是否屬于原創(chuàng),?
對于接下來的計劃,,谷歌表示,他們會繼續(xù)根據(jù)用戶意見繼續(xù)完善MusicFX,MusicFX有可能重新定義音樂創(chuàng)作及與音樂互動的方式,,AI Test Kitchen可能會成為未來AI發(fā)展的典范,,這種方法可以推動人工智能發(fā)展進(jìn)入負(fù)責(zé)任的新時代,在這個時代,,技術(shù)與社會價值觀和規(guī)范齊頭并進(jìn),。
01 MusicLM有多強(qiáng)大?
在今年年初,,谷歌MusicLM橫空出世,,可以直接將文字、圖像自動生成音樂,,并且曲風(fēng)多樣,,凡是想聽的音樂,基本都能自動生成,。
MusicLM是一個以文本為條件的音頻生成模型,,可以從文本描述中生成高保真的音樂。該模型采用層次化的序列到序列的方法,,這使它能夠生成幾分鐘內(nèi)一致的音樂,。
MusicLM使用三種模型來提取作為條件自回歸音樂生成輸入的音頻表示。SoundStream,,w2v-BERT和MuLan,。
其中,AudioLM模型可視作MusicLM的前身,,MusicLM就是利用了AudioLM的多階段自回歸建模作為生成條件,,可以通過文本描述,以24kHz的頻率生成音樂,,并在幾分鐘內(nèi)保持這個頻率,。
相較而言,MusicLM的訓(xùn)練數(shù)據(jù)更多,。研究團(tuán)隊(duì)引入了首個專門為文本-音樂生成任務(wù)評估數(shù)據(jù)MusicCaps來解決任務(wù)缺乏評估數(shù)據(jù)的問題,。MusicCaps由專業(yè)人士共建,涵蓋5500個音樂-文本對,?;诖耍雀栌?80000小時的音樂數(shù)據(jù)集訓(xùn)練出了MusicLM,。
但媒體此前分析稱,,MusicLM肯定不是完美無缺的,或者說離完美仍有相當(dāng)?shù)木嚯x,。
一些樣本還有質(zhì)量問題,,而且雖然 MusicLM 在技術(shù)上可以生成人聲,,包括完成和聲,但還有很多地方需要改進(jìn),。大多數(shù)“歌詞”也是蹩腳的英語或純粹的胡言亂語,,然后由合成的聲音演唱,聽起來像是奇怪的“混合物”,。
02 AI生成音樂的版權(quán)風(fēng)險:到底算不算原創(chuàng)?
AI跟人一樣,,偶爾會偷懶直接抄襲這些素材,,版權(quán)該如何保護(hù)?
谷歌的研究員在一次實(shí)驗(yàn)中發(fā)現(xiàn),,該系統(tǒng)生成的音樂中約有1%是直接復(fù)制自其訓(xùn)練的歌曲,。這個問題足以讓研究人員不愿意過早發(fā)布MusicLM。另外,,用搜集來的素材供AI學(xué)習(xí),,這本身是否就已經(jīng)涉及到侵犯版權(quán)?
實(shí)際上目前已經(jīng)有了相關(guān)案例,。2020年,,美國說唱歌手Jay-Z的唱片公司對YouTube頻道Vocal Synthesis提出版權(quán)警告,理由是它使用AI創(chuàng)作了Jay-Z翻唱比利·喬爾(Billy Joel)的“We Didn't Start the Fire”等歌曲,。
美國音樂出版商協(xié)會的埃里克·桑雷 (Eric Sunray) 撰寫的一份白皮書認(rèn)為,,像MusicLM這樣的AI音樂生成器通過“從訓(xùn)練數(shù)據(jù)庫中吸收作品中連貫的音頻,侵犯了美國版權(quán)法的復(fù)制權(quán)”,。
進(jìn)一步說,,AI生成的音樂雖然是“原創(chuàng)”,但往往像不同音樂人作品的雜糅,,也就是說有洗稿甚至是山寨的嫌疑,。
因而此次谷歌運(yùn)用DeepMind的水印技術(shù)SynthID生成的ID便是對版權(quán)問題的重視,谷歌表示,,生成的所有歌曲都帶有數(shù)字水印,,人的耳朵聽不見也不會影響音樂的效果。
主要通過音頻波轉(zhuǎn)換為二維可視化來實(shí)現(xiàn),。即便數(shù)字水印遭受了添加噪聲,、音質(zhì)壓縮、音頻調(diào)速等破壞性操作,,仍然可以檢測到歌曲中的水印,。
但有分析師指出,盡管谷歌加了水印證明該音樂作品是AI創(chuàng)作而成卻依舊沒能解決根本問題,,由AI系統(tǒng)生成的音樂到底算不算原創(chuàng)作品,?可以和“人造音樂”同臺競技嗎?
伴隨著關(guān)注與爭議,或許在不遠(yuǎn)的未來,,這些問題都將有清晰的答案,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點(diǎn)僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1083360.html
溫馨提示:投資有風(fēng)險,,入市須謹(jǐn)慎,。本資訊不作為投資理財建議。