亚洲精品国产欧美,就操成人

作者：吾道南來（資深媒體人）來源：“青年記者雜志”微信公眾號(hào)導(dǎo) 讀：紐約時(shí)報(bào)向生成式AI維權(quán)給我們以深刻的啟示：新聞媒體與大模型企業(yè)既要斗爭(zhēng),，又要合作,，斗爭(zhēng)是為了更好的合作。2023年年底,，美國(guó)紐約時(shí)報(bào)將OpenAI（開放人工智能研究中心）及其伙伴微軟公司告上法庭,，指控這兩家公司未經(jīng)授權(quán)使用該媒體數(shù)以百萬計(jì)的文章訓(xùn)練ChatGPT等生成式AI，要求停止使用其內(nèi)容訓(xùn)練AI模型并銷毀訓(xùn)練數(shù)據(jù),，并要求獲得損害賠償,。這一訴訟已被美國(guó)當(dāng)?shù)胤ㄔ菏芾怼ｋm然這不是國(guó)內(nèi)外大模型企業(yè)被訴訟的第一例,，但國(guó)際知名媒體狀告大模型企業(yè)是首例,。這可能是迄今為止向生成式AI維權(quán)最具代表性和全球影響力的案例，判決結(jié)果可能會(huì)影響整個(gè)AI產(chǎn)業(yè)和新聞出版業(yè)的發(fā)展方向,。作為媒體人,，筆者不禁為此鼓掌叫好,。2023年1月，圖庫網(wǎng)站Getty Images對(duì)AI圖像生成器研發(fā)公司Stability AI提起法律訴訟,，指其非法復(fù)制和處理版權(quán)圖像作為模型訓(xùn)練數(shù)據(jù),；4月，環(huán)球音樂集團(tuán)發(fā)函要求Spotify等音樂流媒體平臺(tái)切斷AI公司的訪問權(quán)限,，以阻止其版權(quán)歌曲被用于訓(xùn)練模型和生成音樂,；6月，國(guó)內(nèi)的筆神作文發(fā)布聲明,，指控學(xué)而思AI大模型侵權(quán),；12月多名創(chuàng)作者起訴小紅書AI模型涉嫌使用這些畫師的作品訓(xùn)練。據(jù)不完全統(tǒng)計(jì),，2023年僅在美國(guó)加州,，就有數(shù)十起針對(duì)大模型開發(fā)商違規(guī)使用數(shù)據(jù)的訴訟。筆者認(rèn)為,，紐約時(shí)報(bào)的起訴并非如OpenAI回應(yīng)的那樣“毫無根據(jù)”,。其一，紐約時(shí)報(bào)的起訴有充分的法理依據(jù),。美國(guó)是全球知識(shí)產(chǎn)權(quán)保護(hù)最嚴(yán)格的國(guó)家之一,。紐約時(shí)報(bào)對(duì)其生產(chǎn)的圖文、視頻等內(nèi)容擁有無可爭(zhēng)辯的版權(quán),，內(nèi)容數(shù)據(jù)是其優(yōu)質(zhì)資產(chǎn),，如果被用來訓(xùn)練生成式AI，無疑是比較稀缺,、優(yōu)質(zhì)的訓(xùn)練語料,。OpenAI在聲明中反復(fù)強(qiáng)調(diào)，由于模型是從人類知識(shí)的巨大集合中學(xué)習(xí)的,，因此任何一個(gè)領(lǐng)域——包括新聞——都只是所有訓(xùn)練數(shù)據(jù)中的一小部分,，任何一個(gè)數(shù)據(jù)源——包括紐約時(shí)報(bào)——對(duì)模型的專門學(xué)習(xí)都沒有意義。但是,，OpenAI為何這么看重紐約時(shí)報(bào)等媒體的數(shù)據(jù),，就是因?yàn)檫@些媒體擁有的數(shù)據(jù)是可信的訓(xùn)練數(shù)據(jù)來源，這就不難理解為什么OpenAI此前與紐約時(shí)報(bào)等一直在談判,。據(jù)OpenAI 知識(shí)產(chǎn)權(quán)和內(nèi)容首席 Tom Rubin表示,，公司近期與數(shù)十家出版商展開了有關(guān)許可協(xié)議的談判。據(jù)兩名近期與 OpenAI 進(jìn)行談判的媒體公司高管透露,，為了獲得將新聞文章用于訓(xùn)練其大模型的許可,，OpenAI 愿意向部分媒體公司繳納每年100萬至500萬美元的費(fèi)用?？傊?，數(shù)據(jù)是大模型訓(xùn)練的基石,，如果沒有可信、可靠的數(shù)據(jù),，大模型的訓(xùn)練就是無源之水,、無本之木。大模型的迅速發(fā)展已引發(fā)“數(shù)據(jù)饑荒”,。根據(jù)美國(guó)現(xiàn)行版權(quán)法及其加入的《世界版權(quán)公約》《伯爾尼公約》《日內(nèi)瓦公約》等著作權(quán)國(guó)際條約,，除合理使用和強(qiáng)制許可外，未經(jīng)授權(quán)不得復(fù)制和傳播版權(quán)作品,。紐約時(shí)報(bào)訴稱：“如果微軟和OpenAI要將我們的作品用于商業(yè)目的,，法律要求他們首先要獲得我們的許可。但他們沒有這樣做,?！監(jiān)penAI辯稱，使用公開可用的互聯(lián)網(wǎng)資料訓(xùn)練大模型是合理使用,，這一原則對(duì)創(chuàng)造者是公平的，對(duì)創(chuàng)新者是必要的,，對(duì)美國(guó)的競(jìng)爭(zhēng)力也是至關(guān)重要的,。筆者認(rèn)為，按照美國(guó)現(xiàn)行的版權(quán)法,，大模型使用版權(quán)作品訓(xùn)練,，很難歸入合理使用的法定情形。美國(guó)對(duì)著作權(quán)的權(quán)利限制,，有合理使用和強(qiáng)制許可,。合理使用的規(guī)定集中體現(xiàn)在其版權(quán)法第107條之中，該條不僅列舉了批評(píng)與評(píng)論,、新聞報(bào)道,、教學(xué)活動(dòng)及學(xué)術(shù)研究等傳統(tǒng)的合理使用范疇，而且列出了判斷合理使用與否的四條標(biāo)準(zhǔn)：（1）使用的目的與性質(zhì),；（2）該版權(quán)作品的性質(zhì),；（3）使用部分占被利用作品質(zhì)與量的比例；（4）該使用對(duì)版權(quán)作品潛在市場(chǎng)或價(jià)值所產(chǎn)生的影響,。這被稱為合理使用認(rèn)定“四要素標(biāo)準(zhǔn)”,。根據(jù)這4條標(biāo)準(zhǔn)，大模型使用版權(quán)作品訓(xùn)練很難夠得上“合理使用”,，因?yàn)槠涫褂媚康淖罱K是商用,。如果OpenAI有強(qiáng)硬的法律撐腰，就不會(huì)去和出版商談判了,。其二,，紐約時(shí)報(bào)的起訴有充足的事實(shí)依據(jù),。紐約時(shí)報(bào)認(rèn)為，OpenAI和微軟旗下的生成式AI吸收了其幾百萬篇原創(chuàng)文章,，不僅可以將原報(bào)道逐字逐句地“復(fù)制”給提問的用戶,，還可模仿其寫作風(fēng)格，對(duì)文章進(jìn)行提煉,、總結(jié),，甚至被當(dāng)作可靠信源。其搜集的多達(dá)100個(gè)證據(jù)顯示ChatGPT輸出的內(nèi)容與紐約時(shí)報(bào)的新聞內(nèi)容高度相似,，OpenAI的 GPT-4涉嫌直接抄襲紐約時(shí)報(bào)的原文,。紐約時(shí)報(bào)表示，涉事公司需要承擔(dān)其造成的“價(jià)值數(shù)十億美元的法定及實(shí)際損失”,。最近的一項(xiàng)研究結(jié)果也表明,，生成式 AI 開發(fā)商就是在用版權(quán)素材訓(xùn)練自己的系統(tǒng)，生成式 AI 系統(tǒng)可能會(huì)頻繁產(chǎn)生文本和視覺抄襲輸出,。在確鑿的證據(jù)面前,，OpenAI也承認(rèn)了這一點(diǎn)。他們把這種抄襲輸出現(xiàn)象稱為“反流”：“死記硬背是學(xué)習(xí)過程中的一種罕見故障,，我們正在不斷加以解決,，但當(dāng)特定內(nèi)容在訓(xùn)練數(shù)據(jù)中出現(xiàn)不止一次時(shí)，這種故障就比較常見了,。例如,，如果這些內(nèi)容的片段出現(xiàn)在許多不同的公共網(wǎng)站上。因此,，我們采取了一些措施來限制無意中的記憶,，防止在模型輸出中出現(xiàn)重復(fù)內(nèi)容?！奔~約時(shí)報(bào)在訴訟中還提到了生成式AI的另一個(gè)通病——會(huì)生成并傳播虛假,、無意義或令人反感的內(nèi)容。比如,，微軟必應(yīng)上的聊天機(jī)器人曾羅列過“15種有利于心臟健康的食物”,，并將信源指向紐約時(shí)報(bào)，但這15種食物中有12種未被原報(bào)道提及,。筆者認(rèn)為,，這不僅涉嫌侵犯版權(quán)，而且涉嫌侵犯紐約時(shí)報(bào)的名譽(yù)權(quán),。從海內(nèi)外的報(bào)道來看,，針對(duì)大模型企業(yè)的版權(quán)訴訟主要聚焦于模型訓(xùn)練和輸出階段的侵權(quán)行為。大模型企業(yè)與新聞媒體的博弈一直在展開,，雙方都在強(qiáng)調(diào)其發(fā)展的重要性,。2023年5月,，在美國(guó)國(guó)會(huì)召開的“交互中的人工智能與版權(quán)法”聽證會(huì)上,，美國(guó)版權(quán)局前總法律顧問Sy Damle表示：“任何強(qiáng)制模型對(duì)于訓(xùn)練內(nèi)容付費(fèi)許可的嘗試，要么會(huì)使美國(guó)AI行業(yè)破產(chǎn),，消除我們?cè)趪?guó)際舞臺(tái)上的競(jìng)爭(zhēng)力,；要么會(huì)驅(qū)使這些頭部AI公司離開這個(gè)國(guó)家?！奔~約時(shí)報(bào)則表示，若相關(guān)新聞機(jī)構(gòu)無法保護(hù)其獨(dú)立報(bào)道,，原創(chuàng)新聞報(bào)道會(huì)隨之減少,，屆時(shí)“社會(huì)將出現(xiàn)計(jì)算機(jī)和AI無法填補(bǔ)的真空”。筆者認(rèn)為,，雙方都有愿望進(jìn)行合作,，相互成就，創(chuàng)造互惠互利,、共享發(fā)展的機(jī)會(huì),，關(guān)鍵是找到一個(gè)雙方利益的平衡點(diǎn)。比如大模型企業(yè)為新聞媒體的智能化生產(chǎn),、傳播,、運(yùn)營(yíng)提供技術(shù)支持，支持新聞媒體建立健康的新聞生態(tài)系統(tǒng),，授權(quán)大模型使用版權(quán)內(nèi)容但要支付一定的費(fèi)用等,。總之,，紐約時(shí)報(bào)向生成式AI維權(quán)給我們以深刻的啟示：新聞媒體與大模型企業(yè)既要斗爭(zhēng),，又要合作,，斗爭(zhēng)是為了更好的合作

免責(zé)聲明：本文來自網(wǎng)絡(luò)收錄或投稿，觀點(diǎn)僅代表作者本人,，不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,，版權(quán)歸原作者所有。轉(zhuǎn)載請(qǐng)注明出處：http://lequren.com/1088600.html
溫馨提示：投資有風(fēng)險(xiǎn),，入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。

吾道南來：為紐約時(shí)報(bào)向生成式AI維權(quán)叫好

相關(guān)推薦