【環(huán)球時(shí)報(bào)特約記者 甄翔】《紐約時(shí)報(bào)》6日披露了科技公司訓(xùn)練人工智能的秘密——利用語音識(shí)別工具轉(zhuǎn)錄視頻網(wǎng)站YouTube上的視頻,,形成對(duì)話文本數(shù)據(jù),供其最新的AI學(xué)習(xí),。這是一條違反法律的“捷徑”,。報(bào)道稱,早在2021年年底,OpenAI就面臨培訓(xùn)AI模型的數(shù)據(jù)源幾乎陷入枯竭的境地。該公司鋌而走險(xiǎn),在明知YouTube母公司谷歌禁止用工具提取該平臺(tái)內(nèi)容的情況下,,轉(zhuǎn)錄了100多萬條視頻并生成GPT-4模型的學(xué)習(xí)材料,,OpenAI創(chuàng)始人之一布羅克曼也參與其中。諷刺的是,,谷歌得知OpenAI的行為卻并未制止,,因?yàn)槠湟苍谔崛ouTube平臺(tái)內(nèi)容訓(xùn)練AI模型?!都~約時(shí)報(bào)》援引消息人士的話表示,,這可能侵犯視頻版權(quán),因?yàn)樗鼈儗儆趧?chuàng)作者,。盡管如此,,越來越多的科技公司冒著面臨訴訟的風(fēng)險(xiǎn)也要“走捷徑”。報(bào)道稱,,根據(jù)內(nèi)部會(huì)議記錄,,Meta公司商定從互聯(lián)網(wǎng)上收集受版權(quán)保護(hù)的數(shù)據(jù),因?yàn)榕c出版商,、藝術(shù)家,、音樂家和新聞行業(yè)就版權(quán)內(nèi)容談判太花時(shí)間。報(bào)道稱,,領(lǐng)先的AI模型需要從涵蓋多達(dá)3萬億字的數(shù)字文本池中學(xué)習(xí),。有分析稱,,預(yù)計(jì)互聯(lián)網(wǎng)上現(xiàn)有可供培訓(xùn)AI模型的數(shù)據(jù)最快到2026年就會(huì)耗盡?!都~約時(shí)報(bào)》援引內(nèi)部人士的消息稱,,谷歌法律部門已經(jīng)要求起草新的政策,擴(kuò)大該公司對(duì)消費(fèi)者數(shù)據(jù)的用途,。Meta的情況更嚴(yán)峻,,其旗下臉書平臺(tái)不是人們撰寫文章的地方,,可用數(shù)據(jù)不多,。報(bào)道稱,,在一次討論中,,Meta高管談到在非洲聘請(qǐng)承包商來匯總各種小說和非小說的文本摘要,。Meta全球合作與內(nèi)容副總裁格魯丁表示:“唯一阻礙我們達(dá)到ChatGPT水平的因素就是數(shù)據(jù)量,?!保▉碓矗涵h(huán)球時(shí)報(bào))
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1096052.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。