原文來源:硬AI
圖片來源:由無界 AI生成
谷歌繼續(xù)向音樂領(lǐng)域發(fā)起挑戰(zhàn),,人人都能作曲的時(shí)代似乎又近了一步,。
12月14日,谷歌推出AI音樂創(chuàng)作工具“MusicFX”,,僅需幾句話,,用戶即可生成原創(chuàng)的音樂作品,。
谷歌在介紹中指出,這一名為“MusicFX”的創(chuàng)作工具結(jié)合了谷歌此前發(fā)布的MusicLM模型和DeepMind的水印技術(shù)SynthID,,以便在事后識(shí)別出它們是否由AI制作而成,,一定程度上可以解決創(chuàng)作人對(duì)于版權(quán)問題的擔(dān)憂。
分析認(rèn)為,,MusicFX的出現(xiàn)也將成為AI領(lǐng)域的一個(gè)重要里程碑,,為音樂家、制作人和音樂愛好者開辟了嘗試和創(chuàng)作多種音樂的新可能性:
MusicFX為音樂創(chuàng)作者提供了豐富的音效和聲音素材,,用戶可以創(chuàng)作各種類型的音樂,,同時(shí)支持調(diào)整音調(diào),、節(jié)奏和音量,還可以添加混響,、回聲等效果,。無論是想要營造舒緩的氛圍還是冒險(xiǎn)緊張的氛圍,MusicFX都可以滿足,。
MusicFX當(dāng)前仍需要通過谷歌一個(gè)AI實(shí)驗(yàn)性產(chǎn)品網(wǎng)站(AI Test Kitchen)進(jìn)入,,這一平臺(tái)的建立是為了讓用戶在盡早體驗(yàn)其最新的AI技術(shù)的同時(shí),也能提供早期反饋,,這種合作方法能幫助谷歌完善技術(shù),,并遵守道德標(biāo)準(zhǔn)。
媒體分析認(rèn)為,,MusicFX的發(fā)布不僅僅將為音樂生成提供全新的工具,,也代表了AI發(fā)展過程中的趨勢,用戶在幫助企業(yè)完善和塑造人工智能方面的作用變得越來越重要,通過在早期階段讓用戶參與進(jìn)來,,谷歌不僅增強(qiáng)了技術(shù),,還主動(dòng)解決了潛在的道德問題。
此外,,MusicFX的出現(xiàn)可能會(huì)降低音樂創(chuàng)作的門檻,,讓更多沒有經(jīng)過專業(yè)音樂培訓(xùn)的愛好者們參與進(jìn)來。
但MusicFX的出現(xiàn)并非沒有爭議,,有觀點(diǎn)認(rèn)為,,如何解決人工智能生成的內(nèi)容對(duì)版權(quán)、所有權(quán)和音樂原創(chuàng)性的影響還沒有答案,,谷歌決定在AI生成音樂中使用水印,,表明了他們對(duì)這些問題的關(guān)注,,但這一問題并沒有解決,AI生成的內(nèi)容是否屬于原創(chuàng),?
對(duì)于接下來的計(jì)劃,,谷歌表示,他們會(huì)繼續(xù)根據(jù)用戶意見繼續(xù)完善MusicFX,,MusicFX有可能重新定義音樂創(chuàng)作及與音樂互動(dòng)的方式,,AI Test Kitchen可能會(huì)成為未來AI發(fā)展的典范,這種方法可以推動(dòng)人工智能發(fā)展進(jìn)入負(fù)責(zé)任的新時(shí)代,,在這個(gè)時(shí)代,,技術(shù)與社會(huì)價(jià)值觀和規(guī)范齊頭并進(jìn),。
01 MusicLM有多強(qiáng)大,?
在今年年初,谷歌MusicLM橫空出世,,可以直接將文字,、圖像自動(dòng)生成音樂,并且曲風(fēng)多樣,,凡是想聽的音樂,,基本都能自動(dòng)生成。
MusicLM是一個(gè)以文本為條件的音頻生成模型,,可以從文本描述中生成高保真的音樂,。該模型采用層次化的序列到序列的方法,這使它能夠生成幾分鐘內(nèi)一致的音樂,。
MusicLM使用三種模型來提取作為條件自回歸音樂生成輸入的音頻表示,。SoundStream,w2v-BERT和MuLan,。
其中,,AudioLM模型可視作MusicLM的前身,MusicLM就是利用了AudioLM的多階段自回歸建模作為生成條件,,可以通過文本描述,,以24kHz的頻率生成音樂,并在幾分鐘內(nèi)保持這個(gè)頻率,。
相較而言,,MusicLM的訓(xùn)練數(shù)據(jù)更多。研究團(tuán)隊(duì)引入了首個(gè)專門為文本-音樂生成任務(wù)評(píng)估數(shù)據(jù)MusicCaps來解決任務(wù)缺乏評(píng)估數(shù)據(jù)的問題,。MusicCaps由專業(yè)人士共建,,涵蓋5500個(gè)音樂-文本對(duì)?;诖?,谷歌用280000小時(shí)的音樂數(shù)據(jù)集訓(xùn)練出了MusicLM,。
但媒體此前分析稱,MusicLM肯定不是完美無缺的,,或者說離完美仍有相當(dāng)?shù)木嚯x,。
一些樣本還有質(zhì)量問題,而且雖然 MusicLM 在技術(shù)上可以生成人聲,,包括完成和聲,,但還有很多地方需要改進(jìn)。大多數(shù)“歌詞”也是蹩腳的英語或純粹的胡言亂語,,然后由合成的聲音演唱,,聽起來像是奇怪的“混合物”。
02 AI生成音樂的版權(quán)風(fēng)險(xiǎn):到底算不算原創(chuàng),?
AI跟人一樣,,偶爾會(huì)偷懶直接抄襲這些素材,版權(quán)該如何保護(hù),?
谷歌的研究員在一次實(shí)驗(yàn)中發(fā)現(xiàn),,該系統(tǒng)生成的音樂中約有1%是直接復(fù)制自其訓(xùn)練的歌曲。這個(gè)問題足以讓研究人員不愿意過早發(fā)布MusicLM,。另外,,用搜集來的素材供AI學(xué)習(xí),這本身是否就已經(jīng)涉及到侵犯版權(quán),?
實(shí)際上目前已經(jīng)有了相關(guān)案例,。2020年,美國說唱歌手Jay-Z的唱片公司對(duì)YouTube頻道Vocal Synthesis提出版權(quán)警告,,理由是它使用AI創(chuàng)作了Jay-Z翻唱比利·喬爾(Billy Joel)的“We Didn't Start the Fire”等歌曲,。
美國音樂出版商協(xié)會(huì)的埃里克·桑雷 (Eric Sunray) 撰寫的一份白皮書認(rèn)為,像MusicLM這樣的AI音樂生成器通過“從訓(xùn)練數(shù)據(jù)庫中吸收作品中連貫的音頻,,侵犯了美國版權(quán)法的復(fù)制權(quán)”,。
進(jìn)一步說,AI生成的音樂雖然是“原創(chuàng)”,,但往往像不同音樂人作品的雜糅,,也就是說有洗稿甚至是山寨的嫌疑。
因而此次谷歌運(yùn)用DeepMind的水印技術(shù)SynthID生成的ID便是對(duì)版權(quán)問題的重視,,谷歌表示,,生成的所有歌曲都帶有數(shù)字水印,人的耳朵聽不見也不會(huì)影響音樂的效果,。
主要通過音頻波轉(zhuǎn)換為二維可視化來實(shí)現(xiàn),。即便數(shù)字水印遭受了添加噪聲、音質(zhì)壓縮、音頻調(diào)速等破壞性操作,,仍然可以檢測到歌曲中的水印,。
但有分析師指出,盡管谷歌加了水印證明該音樂作品是AI創(chuàng)作而成卻依舊沒能解決根本問題,,由AI系統(tǒng)生成的音樂到底算不算原創(chuàng)作品,?可以和“人造音樂”同臺(tái)競技嗎?
伴隨著關(guān)注與爭議,,或許在不遠(yuǎn)的未來,,這些問題都將有清晰的答案。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1083360.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。