作者:吾道南來(資深媒體人)來源:“青年記者雜志”微信公眾號(hào)導(dǎo) 讀:紐約時(shí)報(bào)向生成式AI維權(quán)給我們以深刻的啟示:新聞媒體與大模型企業(yè)既要斗爭(zhēng),,又要合作,,斗爭(zhēng)是為了更好的合作。2023年年底,,美國(guó)紐約時(shí)報(bào)將OpenAI(開放人工智能研究中心)及其伙伴微軟公司告上法庭,,指控這兩家公司未經(jīng)授權(quán)使用該媒體數(shù)以百萬計(jì)的文章訓(xùn)練ChatGPT等生成式AI,要求停止使用其內(nèi)容訓(xùn)練AI模型并銷毀訓(xùn)練數(shù)據(jù),,并要求獲得損害賠償,。這一訴訟已被美國(guó)當(dāng)?shù)胤ㄔ菏芾怼km然這不是國(guó)內(nèi)外大模型企業(yè)被訴訟的第一例,,但國(guó)際知名媒體狀告大模型企業(yè)是首例,。這可能是迄今為止向生成式AI維權(quán)最具代表性和全球影響力的案例,判決結(jié)果可能會(huì)影響整個(gè)AI產(chǎn)業(yè)和新聞出版業(yè)的發(fā)展方向,。作為媒體人,,筆者不禁為此鼓掌叫好,。2023年1月,圖庫網(wǎng)站Getty Images對(duì)AI圖像生成器研發(fā)公司Stability AI提起法律訴訟,,指其非法復(fù)制和處理版權(quán)圖像作為模型訓(xùn)練數(shù)據(jù),;4月,環(huán)球音樂集團(tuán)發(fā)函要求Spotify等音樂流媒體平臺(tái)切斷AI公司的訪問權(quán)限,,以阻止其版權(quán)歌曲被用于訓(xùn)練模型和生成音樂,;6月,國(guó)內(nèi)的筆神作文發(fā)布聲明,,指控學(xué)而思AI大模型侵權(quán),;12月多名創(chuàng)作者起訴小紅書AI模型涉嫌使用這些畫師的作品訓(xùn)練。據(jù)不完全統(tǒng)計(jì),,2023年僅在美國(guó)加州,,就有數(shù)十起針對(duì)大模型開發(fā)商違規(guī)使用數(shù)據(jù)的訴訟。筆者認(rèn)為,,紐約時(shí)報(bào)的起訴并非如OpenAI回應(yīng)的那樣“毫無根據(jù)”,。其一,紐約時(shí)報(bào)的起訴有充分的法理依據(jù),。美國(guó)是全球知識(shí)產(chǎn)權(quán)保護(hù)最嚴(yán)格的國(guó)家之一,。紐約時(shí)報(bào)對(duì)其生產(chǎn)的圖文、視頻等內(nèi)容擁有無可爭(zhēng)辯的版權(quán),,內(nèi)容數(shù)據(jù)是其優(yōu)質(zhì)資產(chǎn),,如果被用來訓(xùn)練生成式AI,無疑是比較稀缺,、優(yōu)質(zhì)的訓(xùn)練語料,。OpenAI在聲明中反復(fù)強(qiáng)調(diào),由于模型是從人類知識(shí)的巨大集合中學(xué)習(xí)的,,因此任何一個(gè)領(lǐng)域——包括新聞——都只是所有訓(xùn)練數(shù)據(jù)中的一小部分,,任何一個(gè)數(shù)據(jù)源——包括紐約時(shí)報(bào)——對(duì)模型的專門學(xué)習(xí)都沒有意義。但是,,OpenAI為何這么看重紐約時(shí)報(bào)等媒體的數(shù)據(jù),,就是因?yàn)檫@些媒體擁有的數(shù)據(jù)是可信的訓(xùn)練數(shù)據(jù)來源,這就不難理解為什么OpenAI此前與紐約時(shí)報(bào)等一直在談判,。據(jù)OpenAI 知識(shí)產(chǎn)權(quán)和內(nèi)容首席 Tom Rubin表示,,公司近期與數(shù)十家出版商展開了有關(guān)許可協(xié)議的談判。據(jù)兩名近期與 OpenAI 進(jìn)行談判的媒體公司高管透露,,為了獲得將新聞文章用于訓(xùn)練其大模型的許可,,OpenAI 愿意向部分媒體公司繳納每年100萬至500萬美元的費(fèi)用??傊?,數(shù)據(jù)是大模型訓(xùn)練的基石,,如果沒有可信、可靠的數(shù)據(jù),,大模型的訓(xùn)練就是無源之水,、無本之木。大模型的迅速發(fā)展已引發(fā)“數(shù)據(jù)饑荒”,。根據(jù)美國(guó)現(xiàn)行版權(quán)法及其加入的《世界版權(quán)公約》《伯爾尼公約》《日內(nèi)瓦公約》等著作權(quán)國(guó)際條約,,除合理使用和強(qiáng)制許可外,未經(jīng)授權(quán)不得復(fù)制和傳播版權(quán)作品,。紐約時(shí)報(bào)訴稱:“如果微軟和OpenAI要將我們的作品用于商業(yè)目的,,法律要求他們首先要獲得我們的許可。但他們沒有這樣做,?!監(jiān)penAI辯稱,使用公開可用的互聯(lián)網(wǎng)資料訓(xùn)練大模型是合理使用,,這一原則對(duì)創(chuàng)造者是公平的,對(duì)創(chuàng)新者是必要的,,對(duì)美國(guó)的競(jìng)爭(zhēng)力也是至關(guān)重要的,。筆者認(rèn)為,按照美國(guó)現(xiàn)行的版權(quán)法,,大模型使用版權(quán)作品訓(xùn)練,,很難歸入合理使用的法定情形。美國(guó)對(duì)著作權(quán)的權(quán)利限制,,有合理使用和強(qiáng)制許可,。合理使用的規(guī)定集中體現(xiàn)在其版權(quán)法第107條之中,該條不僅列舉了批評(píng)與評(píng)論,、新聞報(bào)道,、教學(xué)活動(dòng)及學(xué)術(shù)研究等傳統(tǒng)的合理使用范疇,而且列出了判斷合理使用與否的四條標(biāo)準(zhǔn):(1)使用的目的與性質(zhì),;(2)該版權(quán)作品的性質(zhì),;(3)使用部分占被利用作品質(zhì)與量的比例;(4)該使用對(duì)版權(quán)作品潛在市場(chǎng)或價(jià)值所產(chǎn)生的影響,。這被稱為合理使用認(rèn)定“四要素標(biāo)準(zhǔn)”,。根據(jù)這4條標(biāo)準(zhǔn),大模型使用版權(quán)作品訓(xùn)練很難夠得上“合理使用”,,因?yàn)槠涫褂媚康淖罱K是商用,。如果OpenAI有強(qiáng)硬的法律撐腰,就不會(huì)去和出版商談判了,。其二,,紐約時(shí)報(bào)的起訴有充足的事實(shí)依據(jù),。紐約時(shí)報(bào)認(rèn)為,OpenAI和微軟旗下的生成式AI吸收了其幾百萬篇原創(chuàng)文章,,不僅可以將原報(bào)道逐字逐句地“復(fù)制”給提問的用戶,,還可模仿其寫作風(fēng)格,對(duì)文章進(jìn)行提煉,、總結(jié),,甚至被當(dāng)作可靠信源。其搜集的多達(dá)100個(gè)證據(jù)顯示ChatGPT輸出的內(nèi)容與紐約時(shí)報(bào)的新聞內(nèi)容高度相似,,OpenAI的 GPT-4涉嫌直接抄襲紐約時(shí)報(bào)的原文,。紐約時(shí)報(bào)表示,涉事公司需要承擔(dān)其造成的“價(jià)值數(shù)十億美元的法定及實(shí)際損失”,。最近的一項(xiàng)研究結(jié)果也表明,,生成式 AI 開發(fā)商就是在用版權(quán)素材訓(xùn)練自己的系統(tǒng),生成式 AI 系統(tǒng)可能會(huì)頻繁產(chǎn)生文本和視覺抄襲輸出,。在確鑿的證據(jù)面前,,OpenAI也承認(rèn)了這一點(diǎn)。他們把這種抄襲輸出現(xiàn)象稱為“反流”:“死記硬背是學(xué)習(xí)過程中的一種罕見故障,,我們正在不斷加以解決,,但當(dāng)特定內(nèi)容在訓(xùn)練數(shù)據(jù)中出現(xiàn)不止一次時(shí),這種故障就比較常見了,。例如,,如果這些內(nèi)容的片段出現(xiàn)在許多不同的公共網(wǎng)站上。因此,,我們采取了一些措施來限制無意中的記憶,,防止在模型輸出中出現(xiàn)重復(fù)內(nèi)容?!奔~約時(shí)報(bào)在訴訟中還提到了生成式AI的另一個(gè)通病——會(huì)生成并傳播虛假,、無意義或令人反感的內(nèi)容。比如,,微軟必應(yīng)上的聊天機(jī)器人曾羅列過“15種有利于心臟健康的食物”,,并將信源指向紐約時(shí)報(bào),但這15種食物中有12種未被原報(bào)道提及,。筆者認(rèn)為,,這不僅涉嫌侵犯版權(quán),而且涉嫌侵犯紐約時(shí)報(bào)的名譽(yù)權(quán),。從海內(nèi)外的報(bào)道來看,,針對(duì)大模型企業(yè)的版權(quán)訴訟主要聚焦于模型訓(xùn)練和輸出階段的侵權(quán)行為。大模型企業(yè)與新聞媒體的博弈一直在展開,,雙方都在強(qiáng)調(diào)其發(fā)展的重要性,。2023年5月,,在美國(guó)國(guó)會(huì)召開的“交互中的人工智能與版權(quán)法”聽證會(huì)上,,美國(guó)版權(quán)局前總法律顧問Sy Damle表示:“任何強(qiáng)制模型對(duì)于訓(xùn)練內(nèi)容付費(fèi)許可的嘗試,要么會(huì)使美國(guó)AI行業(yè)破產(chǎn),,消除我們?cè)趪?guó)際舞臺(tái)上的競(jìng)爭(zhēng)力,;要么會(huì)驅(qū)使這些頭部AI公司離開這個(gè)國(guó)家?!奔~約時(shí)報(bào)則表示,若相關(guān)新聞機(jī)構(gòu)無法保護(hù)其獨(dú)立報(bào)道,,原創(chuàng)新聞報(bào)道會(huì)隨之減少,,屆時(shí)“社會(huì)將出現(xiàn)計(jì)算機(jī)和AI無法填補(bǔ)的真空”。筆者認(rèn)為,,雙方都有愿望進(jìn)行合作,,相互成就,創(chuàng)造互惠互利,、共享發(fā)展的機(jī)會(huì),,關(guān)鍵是找到一個(gè)雙方利益的平衡點(diǎn)。比如大模型企業(yè)為新聞媒體的智能化生產(chǎn),、傳播,、運(yùn)營(yíng)提供技術(shù)支持,支持新聞媒體建立健康的新聞生態(tài)系統(tǒng),,授權(quán)大模型使用版權(quán)內(nèi)容但要支付一定的費(fèi)用等,。總之,,紐約時(shí)報(bào)向生成式AI維權(quán)給我們以深刻的啟示:新聞媒體與大模型企業(yè)既要斗爭(zhēng),,又要合作,,斗爭(zhēng)是為了更好的合作
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1088600.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。