原文來源:字母榜
作者:譚宵寒
圖片來源:由無界 AI生成
OpenAI和《紐約時報》的互掐,,越來越有看頭了,。
當(dāng)?shù)貢r間1月9日,,OpenAI終于打破了近兩周的沉默,,公開發(fā)表長文回應(yīng)《紐約時報》的指控。去年12月27日,,《紐約時報》在美國起訴ChatGPT制造商OpenAI及其合作伙伴微軟,,指控后者未經(jīng)許可使用數(shù)百萬篇文章訓(xùn)練AI。
這次OpenAI的回應(yīng)不是白開水般的公關(guān)措辭,,而是犀利地指出,,《紐約時報》沒有講述完整的經(jīng)過,且有故意操縱ChatGPT回答結(jié)果之嫌,,整個訴訟毫無根據(jù),。
一邊是代表著新科技的ChatGPT,一邊是代表著老牌新聞機構(gòu)的《紐約時報》,,二者對簿公堂,,原本就是注定寫進科技史的事件。如今OpenAI頗為“頭鐵”的回應(yīng),,更是為事件火上澆油,。
回頭看,不管是廣播,、電視,、互聯(lián)網(wǎng),新的媒介產(chǎn)生,,都會與內(nèi)容版權(quán)方產(chǎn)生利益拉扯,,其中又尤以新聞業(yè)最為激烈。
整整10年前,,在中國,,正在崛起的今日頭條也被《廣州日報》告上法庭,其后多個新聞機構(gòu),、門戶網(wǎng)站跟進,,大有群起而攻之的氣勢。事件雙方的矛盾與如今AI與新聞媒體之間的如出一轍,。
那場紛爭,,最后以今日頭條大力購買版權(quán)而逐漸平息,“合作”是張一鳴擺出的路徑,。兩年后,,今日頭條覆蓋的媒體已達3700余家,每年在版權(quán)采購商的投入超過15億元,。
無獨有偶,,OpenAI如今高舉的依然是“合作”的旗。在對《紐約時報》毫不客氣地回懟之余,,也強調(diào)了“可退出”原則,,以及與新聞機構(gòu)合作的強烈意愿,。
但這次,《紐約時報》們只會更加謹(jǐn)慎——直到現(xiàn)在,,社交媒體如Facebook、搜索引擎如谷歌與新聞業(yè)仍舊沒有達成一致,,新聞業(yè)想要從平臺獲得更多分成,,而平臺則不愿輕易配合。
OpenAI拋出合作之“餅”,,《紐約時報》們可能不會輕易吃下了,。
OpenAI和《紐約時報》,都握緊了拳頭,。
自ChatGPT在2022年底推出以來,,OpenAI沒少吃版權(quán)官司。去年9月,,就有十余名作家對OpenAI提起訴訟,,幾個月后的12月,又有11名美國作家在紐約曼哈頓聯(lián)邦法院起訴OpenAI和微軟,。
但《紐約時報》的訴狀,,分量畢竟不同。一來《紐約時報》本身是西方最主流,、最大的老牌媒體之一,,二來《紐約時報》的起訴來勢洶洶。
起訴OpenAI,,《紐約時報》一口氣向法院提交了22000頁的附件和狀書,,其中對ChatGPT侵權(quán)的關(guān)鍵證據(jù)多達100個,顯示ChatGPT輸出的內(nèi)容和《紐約時報》高度相似,。
在一個典型的證據(jù)片段中,,左邊是GPT-4的輸出結(jié)果,右邊是《紐約時報》原文,,重合的文字以紅色顯示,,像極了中文互聯(lián)網(wǎng)上每次“錘”抄襲時會用的“調(diào)色盤”技能。
訴狀中表示,光是《紐約時報》的文章構(gòu)成了Common Crawl中用于訓(xùn)練GPT的最大單個專有數(shù)據(jù)集(Common Crawl 是一個基金會,,16年來已經(jīng)幾乎存檔了整個網(wǎng)絡(luò)),。《紐約時報》要求OpenAI和微軟銷毀包含侵權(quán)材料的模型和訓(xùn)練數(shù)據(jù),,沒有提出具體索賠金額,,但表示被告應(yīng)該對非法復(fù)制和使用《紐約時報》獨有價值的作品相關(guān)的“數(shù)十億美元的法定和實際損失”負(fù)責(zé),。
除此之外,《紐約時報》還指出,,由于AI“幻覺”,,ChatGPT有時會將一些假新聞、謠言“張冠李戴”,,說成是出自《紐約時報》的,,對其名譽造成損害。
《紐約時報》有備而來,,重拳出擊,,提起上訴的當(dāng)天還自己出了高調(diào)的報道,打得OpenAI措手不及,。OpenAI后來也說,,本來在12月已經(jīng)和OpenAI就版權(quán)問題在溝通合作方案了,沒想到對方轉(zhuǎn)手就是一記耳光,。
再表態(tài)時,,OpenAI也不客氣,,發(fā)長文,拋出四個關(guān)鍵點:1,、OpenAI愿意和新聞機構(gòu)合作并創(chuàng)造新機會,;2、使用公開的互聯(lián)網(wǎng)材料訓(xùn)練AI模型是合理的,,但OpenAI還是提供了退出機制,;3、反芻事實(regurgitate facts)確實是一種罕見的錯誤,,OpenAI正在努力將其減少到零,;4、《紐約時報》沒有完整講述故事,,其訴訟毫無根據(jù),。
其中提到的“反芻”,就是指AI將訓(xùn)練物料原封不動地“吐出來”,,就像《紐約時報》所列舉的那樣,,AI的回答和《紐約時報》的文章幾乎一字不差。OpenAI的立場是,,“反芻”現(xiàn)象的確存在,,但OpenAI已經(jīng)將其程度降到很低,《紐約時報》一下拿出上百個“反芻”例子,,是很可疑的,。
因此,,OpenAI懷疑:“有趣的是,《紐約時報》提到的反芻似乎來自多個第三方網(wǎng)站上大量傳播的多年前的文章,。他們似乎故意操縱提示,,通常包括冗長的文章摘錄,以便讓我們的模型反芻,。即使使用這樣的提示,,我們的模型通常也不會像《紐約時報》暗示的那樣表現(xiàn),這表明他們要么指示模型反芻,,要么從多次嘗試中精心挑選示例,?!?/p>
總而言之就是:說我家孩子偷東西,?我看是你塞孩子手里、搞栽贓吧,?
除此之外,,OpenAI的回應(yīng)中還有兩點值得玩味。
首先,,OpenAI強調(diào)了“退出”機制,,并指出《紐約時報》早在去年8月就已經(jīng)采用推出流程。實際上,,《紐約時報》,、路透社、CNN等在內(nèi)的多家主流新聞媒體都已在去年起屏蔽OpenAI的GPTBot網(wǎng)絡(luò)爬蟲,,以限制其繼續(xù)獲取這些媒體的內(nèi)容,。
其次,OpenAI“殺人誅心”,,否定了《紐約時報》一家媒體在ChatGPT訓(xùn)練中的重要性:“由于模型是從人類知識的巨大集合中學(xué)習(xí)的,,因此任何一個部門(包括新聞)都只是整體訓(xùn)練數(shù)據(jù)的一小部分,而任何單一數(shù)據(jù)源(包括《紐約時報》)對于模型的預(yù)期學(xué)習(xí)并不重要,?!?/p>
“我不是、我沒有,、你別瞎說啊”的否認(rèn)三連,,放在OpenAI身上正合適。
既然AI已經(jīng)是未來趨勢,,OpenAI也有意愿合作,,《紐約時報》為何還要大動干戈?
“人工智能30%都來源于新聞業(yè),。讓我們不要再犯同樣的錯誤、再一次免費地付出一切,?!薄拔覀兊膬?nèi)容正在被盜竊,我們必須說:這次不行,?!薄睹襟w創(chuàng)新2023年世界報告》中寫道。
“不要犯同樣的錯誤”,,類似的措辭,,當(dāng)OpenAI的CEO山姆·阿爾特曼坐在美國國會聽證席上時也聽到過。彼時國會議員數(shù)次表達后悔,,稱不能重蹈社交媒體時代的覆轍,。社交媒體時代,監(jiān)管被遠遠落在科技發(fā)展之后,,扎克伯格2018年首次因“劍橋丑聞”坐上國會聽證席時,,F(xiàn)acebook已經(jīng)推出14年。
從某種角度來說,,OpenAI的確是站在了巨人的肩膀上——有了前車之鑒,,ChatGPT一朝出名,立刻引來四方警惕,。
《紐約時報》們也不想重蹈覆轍,。在搜索引擎和社交媒體成為流量入口的時代,傳統(tǒng)媒體艱難轉(zhuǎn)型,,也曾和大型科技平臺達成“合作”,,但后來卻覺得這不“值”。
Facebook很早就和傳統(tǒng)媒體展開合作,《紐約時報》也是首批入駐的媒體,,那時的合作模式是利潤分成,,分發(fā)在Facebook的平臺完成。但隨著2018年Facebook和谷歌母公司獲得美國數(shù)字廣告收入的60%,,媒體機構(gòu)開始覺得自己被奪走得太多,、得到的卻太少。
2019年,,《紐約時報》曾發(fā)布報道:美國新聞業(yè)數(shù)字廣告年收入51億美元,,而谷歌提供聚合新聞服務(wù)所獲得的數(shù)字廣告收入47億美元。
新聞出版商在多個國家和地區(qū)爭取更多利益,。2020年,,澳大利亞政府成為第一個要求Facebook和谷歌為新聞內(nèi)容付費的國家。2023年,,加拿大也通過了《在線新聞法》,,隨后谷歌與當(dāng)局達成協(xié)議,同意向加拿大新聞出版商支付7400萬美元,。而Facebook的制造商Meta卻拒絕妥協(xié),,干脆不在加拿大當(dāng)?shù)仄帘涡侣剝?nèi)容,。美國《新聞競爭與保護法案》也曾在國會推進,,但未獲得全體投票機會。
撰寫《媒體創(chuàng)新2023年世界報告》的創(chuàng)新媒體咨詢集團創(chuàng)始人胡安·賽諾在演講中直言:“我們不能在別人的平臺上建立自己的業(yè)務(wù),,無論是Facebook還是谷歌,,大型科技公司并不關(guān)心我們的利益?!薄八麄冇凶约旱睦?,為什么要指望他們照顧我們的利益呢?形式主義盛行,,收入?yún)s太少,。”
要知道,,《紐約時報》本身是在紙媒衰落之時浴火重生的榜樣,,2008年次貸危機后,其一度抵押總部大樓借款,,甚至多方出手想要將其收購,。隨著大舉進行數(shù)字化轉(zhuǎn)型,推出付費訂閱模式,,《紐約時報》最終扭虧為盈,。在2022年,《紐約時報》超過六成收入都來自付費訂閱。
由此,,也就不難理解《紐約時報》要和OpenAI“魚死網(wǎng)破”的架勢從何而來:“合作”說起來簡單,,但怎么合作才能保證《紐約時報》們原有的利益不受侵害、新的商機不被奪走,?問號很多,,答案寥寥。
“利用《紐約時報》在報道中的巨大投入,,在搭新聞行業(yè)的便車,。”《紐約時報》的怨氣,,不僅來自“初出茅廬”的ChatGPT,。
對于OpenAI來說,這注定是一場硬仗,。
除了多點爆發(fā)的版權(quán)之爭,,歐洲已經(jīng)于去年6月表決通過《AI法案》草案。根據(jù)該法案,,OpenAI等廠商需要公開在訓(xùn)練模型過程中使用的受版權(quán)保護的版權(quán)數(shù)據(jù)清單,。
雖然在此次的聲明中強調(diào)《紐約時報》“不重要”,但版權(quán)內(nèi)容對于OpenAI的大模型訓(xùn)練還是很重要的,。
在前不久提交給英國上議院通信和數(shù)字事務(wù)特別委員會關(guān)于大語言模型調(diào)查的文件中,,OpenAI承認(rèn),像ChatGPT這樣的AI工具的開發(fā)離不開受版權(quán)保護的素材,,并稱如果沒有這些素材,,GPT根本無法誕生:“由于當(dāng)前版權(quán)涵蓋了幾乎所有形式的人類表達方式,包括博客文章,、照片,、論壇帖子、軟件代碼片段和政府文件,,如果不使用受版權(quán)保護的內(nèi)容,,就不可能訓(xùn)練當(dāng)今領(lǐng)先的人工智能模型?!?/p>
在和《紐約時報》隔空互懟的同時,,OpenAI也在積極推進與新聞業(yè)的“合作”,已經(jīng)取得部分成果,。
去年12月,,《紐約時報》起訴OpenAI前不久,OpenAI與德國新聞出版巨頭阿克塞爾·施普林格(Axel Springer)達成合作,。施普林格是歐洲最大的數(shù)字出版公司,,旗下包括Business Insider、《世界報》等在內(nèi)的知名新聞品牌。
雙方簽訂為期多年的協(xié)議,,ChatGPT可以在回復(fù)中給用戶提供施普林格新聞媒體的報道摘要,,包含原始出處和鏈接,保證新聞網(wǎng)站獲得流量,。同時,,施普林格的內(nèi)容將被OpenAI用于訓(xùn)練模型。Information援引知情人士稱,,該交易在上千億美元規(guī)模,。
這已經(jīng)是OpenAI與新聞機構(gòu)達成的第二個大型合作,同年7月其曾與美聯(lián)社達成類似協(xié)議,,金額未公開,。
競爭也會進一步推高新聞采集的成本。去年12月,,媒體報道蘋果已經(jīng)和多家主要出版商達成協(xié)議,,采集其新聞內(nèi)容訓(xùn)練AI模型。報道稱,,蘋果已經(jīng)和NBC新聞,、IAC等多家機構(gòu)接洽,擬議交易金額至少5000萬美元,。
僅僅勾一勾“廣告分成”的手指頭,,就引來主流媒體爭相入駐,那種“好時代”屬于社交媒體和搜索引擎,。如今的OpenAI們,,不得不畫更大,、更香的餅,。
參考資料:
1、36氪:《 紐約時報:從危機中崛起重返全球媒體之巔》
2,、iweekly周末畫報:《挽救新聞業(yè),,谷歌同意向加拿大新聞出版商付費》
3、騰訊科技:《Facebook將推新聞標(biāo)簽 擬斥資數(shù)百萬美元從媒體購買版權(quán)》
4,、界面新聞:《OpenAI與出版界巨頭達成合作,,這項交易能否為新聞業(yè)帶來進化嗎?》
北京日報:《手機APP“今日頭條”肆意抓取新聞陷侵權(quán)漩渦》
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1086896.html
溫馨提示:投資有風(fēng)險,,入市須謹(jǐn)慎。本資訊不作為投資理財建議。