Sora生成的視頻截屏Sora生成的視頻截屏Sora生成的視頻截屏本報(bào)記者 樊 巍 劉 揚(yáng) 劉彩玉繼去年發(fā)布的聊天機(jī)器人ChatGPT引領(lǐng)新一輪人工智能(AI)浪潮之后,美國(guó)人工智能公司OpenAI于16日又發(fā)布了全新的生成式人工智能模型Sora,,它能夠通過(guò)文本指令創(chuàng)建最長(zhǎng)達(dá)60秒的視頻,其逼真的視覺(jué)效果讓它在一夜之間“刷屏”,,全球諸多媒體都對(duì)其冠以“顛覆性”的美名,,甚至有網(wǎng)友感嘆“視頻行業(yè)全都要被洗牌了”。相關(guān)專(zhuān)家17日接受《環(huán)球時(shí)報(bào)》記者采訪時(shí)表示,,短期來(lái)看,,Sora確實(shí)會(huì)對(duì)影視等行業(yè)帶來(lái)顯著影響,但我們也不應(yīng)神化其作用,,長(zhǎng)期來(lái)看,,需要用心制作的作品,依舊很難僅用“芯”完成,?!叭祟?lèi)愿賭服輸”目前OpenAI還沒(méi)有發(fā)布Sora的公開(kāi)使用版本,但已經(jīng)發(fā)布的40多個(gè)演示視頻中包含有細(xì)節(jié)拉滿的場(chǎng)景,、復(fù)雜的攝像機(jī)運(yùn)鏡以及多個(gè)充滿情感的角色,。OpenAI宣稱(chēng),Sora可以理解物體在物理世界中如何存在,,并準(zhǔn)確地解釋道具并生成引人注目的角色來(lái)表達(dá)充滿活力的情感,。例如它可以根據(jù)文字描述“在東京街頭,一名時(shí)髦女士穿梭在充滿溫暖霓虹燈光和動(dòng)感城市標(biāo)志的街道上”,,生成一段包含有多鏡頭的高清晰視頻,,包括從大街景切入對(duì)女士臉部表情的特寫(xiě),以及潮濕的街道地面反射霓虹燈的光影效果,。這些視頻的真實(shí)度令人為之驚嘆,,就連特斯拉CEO馬斯克也在社交媒體上對(duì)此表示“人類(lèi)愿賭服輸”。美國(guó)有線電視新聞網(wǎng)(CNN)稱(chēng),,盡管“多模態(tài)大模型”屢見(jiàn)不鮮,,但Sora的制作長(zhǎng)度和準(zhǔn)確性使其與眾不同,它可能會(huì)對(duì)數(shù)字娛樂(lè)產(chǎn)業(yè)產(chǎn)生重大影響,。北京郵電大學(xué)人機(jī)交互與認(rèn)知工程實(shí)驗(yàn)室主任劉偉接受《環(huán)球時(shí)報(bào)》記者采訪時(shí)表示,,Sora在短期內(nèi)可能會(huì)對(duì)短視頻制作、影視行業(yè)以及視覺(jué)交互界面應(yīng)用產(chǎn)生較為顯著的影響,;從長(zhǎng)期來(lái)看,,這項(xiàng)技術(shù)會(huì)為自動(dòng)駕駛、數(shù)字仿真,、場(chǎng)景模擬等領(lǐng)域帶來(lái)改變,。他表示,“我們不應(yīng)神化Sora的作用,,這項(xiàng)技術(shù)還很難取代傳統(tǒng)的影視行業(yè)制作流程,,人類(lèi)用‘心’拍出影視的作品,,還很難僅用‘芯’來(lái)完成?!敝袊?guó)影協(xié)科幻電影工作委員會(huì)執(zhí)行秘書(shū)長(zhǎng)馬賀亮接受《環(huán)球時(shí)報(bào)》記者采訪時(shí)表示,,Sora的確讓影視圈“震驚”,但“主要是因?yàn)锳I的發(fā)展速度遠(yuǎn)遠(yuǎn)超過(guò)了原來(lái)的預(yù)期”,。他認(rèn)為,,短期內(nèi)與概念設(shè)計(jì)、視頻預(yù)覽相關(guān)的崗位會(huì)在一定程度上受到Sora的影響,,但它所能呈現(xiàn)的效果其實(shí)還達(dá)不到院線電影的級(jí)別,,而且電影在創(chuàng)作上有主觀立場(chǎng)、視角和表達(dá),,觀看時(shí)有情感交流和情感投射,,遠(yuǎn)不是簡(jiǎn)單生成一段視頻就能代替,因此AI作為技術(shù)輔助手段的確已經(jīng)在改變電影制作方式與流程,,能優(yōu)化提升電影創(chuàng)作,,但要說(shuō)它能“顛覆整個(gè)電影行業(yè)”,還為時(shí)過(guò)早,。OpenAI也坦承,Sora還存在一些短板,,例如模型在準(zhǔn)確模擬復(fù)雜場(chǎng)景的物理特性方面可能會(huì)遇到一些困難,,也可能無(wú)法周到地展現(xiàn)具有因果關(guān)系的事例。例如演示視頻中就出現(xiàn)了“有人咬了一口餅干,,但餅干上并未出現(xiàn)咬痕”的明顯漏洞,。“眼見(jiàn)為實(shí)”或成過(guò)去中國(guó)人工智能專(zhuān)家吳甘沙17日接受《環(huán)球時(shí)報(bào)》記者采訪時(shí)表示,,“Sora的影響往小了說(shuō),,是文生視頻技術(shù)突破了一個(gè)數(shù)量級(jí)(時(shí)長(zhǎng)比此前最好的水平提升了15-20倍),可以直接應(yīng)用于短視頻,、廣告行業(yè)等,,對(duì)自動(dòng)駕駛的場(chǎng)景和數(shù)據(jù)生成等都有正面影響;往大了說(shuō),,它提供了理解,、重建和模擬這個(gè)世界的可能性。如果大語(yǔ)言模型LLM像是一個(gè)小孩關(guān)在圖書(shū)館里讀遍人間萬(wàn)卷,,Sora就是一個(gè)胸有丘壑的青年來(lái)到真實(shí)人間,、行萬(wàn)里路,用現(xiàn)實(shí)和反饋來(lái)印證知識(shí),,并且能夠用視頻(模擬真實(shí))的方式輸出知識(shí)和內(nèi)容,。一圖勝千言,,圖和視頻的信息傳遞損耗遠(yuǎn)低于文字,從這個(gè)意義上來(lái)看,,它未來(lái)沖擊的不僅僅是視頻,、電影行業(yè),也會(huì)影響書(shū)籍,、知識(shí)、教育等一切信息輸出的行業(yè)”,。新智元?jiǎng)?chuàng)始人楊靜17日接受《環(huán)球時(shí)報(bào)》記者采訪時(shí)表示,,Sora是對(duì)OpenAI算法應(yīng)用領(lǐng)域的升維拓展,,ChatGPT一年前已在自然語(yǔ)言交互領(lǐng)域取得重大突破,,Sora則在AI視頻領(lǐng)域一舉登上行業(yè)巔峰,。如果說(shuō)ChatGPT模擬了人類(lèi)的思維能力,,Sora則是對(duì)整個(gè)物理世界的模擬。結(jié)合這些技術(shù),,如果未來(lái)虛擬世界與現(xiàn)實(shí)世界無(wú)縫融合,,那么人類(lèi)的整個(gè)社會(huì)生活都會(huì)顛覆,包括智慧城市,、軍事,、影視游戲、電商社交等多個(gè)領(lǐng)域,。但楊靜也提醒說(shuō),,AI生成的假視頻存在泛濫風(fēng)險(xiǎn),可能被用于詐騙犯罪,。在Sora將AI生成視頻能力提升到近乎逼真的程度時(shí),,大家也要認(rèn)識(shí)到“眼見(jiàn)為實(shí)”可能已成過(guò)去。CNN稱(chēng),,OpenAI已關(guān)注安全性問(wèn)題,。該公司表示,未來(lái)將在Sora輸出的視頻中應(yīng)用內(nèi)容追溯技術(shù),,以鑒別是否為AI深度偽造視頻,。劉偉認(rèn)為,如今AI技術(shù)在應(yīng)用層面出現(xiàn)的一些亂象也凸顯這項(xiàng)技術(shù)是一把“雙刃劍”,。隨著以大語(yǔ)言模型為代表的AI技術(shù)快速發(fā)展,,會(huì)對(duì)傳統(tǒng)的倫理、法律以及生產(chǎn)方式等等方面都產(chǎn)生強(qiáng)大的沖擊,如果我們不加以監(jiān)管,,其一旦“泛濫成災(zāi)”,,必然會(huì)侵犯許多人的權(quán)益。但如果我們過(guò)早或者過(guò)嚴(yán)地加以監(jiān)管,,這必然又會(huì)限制這項(xiàng)技術(shù)的發(fā)展,。“我認(rèn)為監(jiān)管之難主要體現(xiàn)在如何平衡‘管’與‘放’之間的關(guān)系,,特別是在全球各國(guó)人工智能飛速發(fā)展的時(shí)期,。”劉偉表示,,在實(shí)際操作的層面,,我們既要對(duì)明顯會(huì)侵害大部分人權(quán)益的行為堅(jiān)決加以限制,,與此同時(shí)也應(yīng)有“特區(qū)制”,允許有試錯(cuò)的空間,。中美在AI領(lǐng)域差距拉大了,?Sora的出現(xiàn)也引發(fā)了國(guó)內(nèi)許多業(yè)界人士的擔(dān)憂,,“中美AI領(lǐng)域差距進(jìn)一步拉大”成為Sora問(wèn)世后的伴生話題,。360集團(tuán)創(chuàng)始人周鴻祎認(rèn)為,,“OpenAI訓(xùn)練的Sora應(yīng)該會(huì)閱讀大量視頻,。一幅圖勝過(guò)千言萬(wàn)語(yǔ),,而視頻傳遞的信息量又遠(yuǎn)遠(yuǎn)超過(guò)一幅圖”,因此Sora的出現(xiàn)可能意味著通用人工智能“真的就不遠(yuǎn)了”,,“不是10年20年的問(wèn)題,可能一兩年很快就可以實(shí)現(xiàn)”,。他表示,,盡管?chē)?guó)內(nèi)大模型發(fā)展水平表面看已經(jīng)接近GPT3.5,但實(shí)際上跟4.0比還有一年半的差距。從現(xiàn)在來(lái)看,,OpenAI手上除了GPT5之外,,可能還有一些“秘密武器”沒(méi)有亮出來(lái)?!爸袊?guó)和美國(guó)的AI差距可能不但沒(méi)有縮小,,反而在加大?!睏铎o認(rèn)為,,Sora的震撼給我們?nèi)齻€(gè)提醒。第一是在算法方面,,OpenAI在攻破語(yǔ)言和視覺(jué)兩個(gè)堡壘后,,即將向通用人工智能發(fā)起最后挑戰(zhàn);一旦實(shí)現(xiàn)超級(jí)人工智能,,加上生成式的AI世界,,人類(lèi)整體的權(quán)重都將降維;第二是在算力方面,,OpenAI公布籌資7萬(wàn)億美元建立芯片帝國(guó)的計(jì)劃,,這筆巨款相當(dāng)于美國(guó)GDP的1/4,或許將確立壟斷全球算法與算力的AI霸主地位,;第三是在數(shù)據(jù)方面,,微軟此前為OpenAI提供了5000億視頻用于Sora訓(xùn)練,未來(lái)還將有更多海量數(shù)據(jù)涌入,,又有更多視頻生成,。吳甘沙表示,目前AI領(lǐng)域的競(jìng)爭(zhēng)格局是OpenAI公司“一騎絕塵”,。無(wú)論是谷歌的Gemini,、創(chuàng)業(yè)公司Runway和Pika,還是中國(guó)的頂尖公司,,都要奮起急追,,不然差距會(huì)越來(lái)越大。他認(rèn)為,,中國(guó)要在AI領(lǐng)域追趕,,首先是依靠人才,確保與世界頂尖水平的交流,,鼓勵(lì)人才高密度聚集,。“美國(guó)大模型相關(guān)的大公司加創(chuàng)業(yè)公司可能就是一二十家,,而中國(guó)有幾百家,,人才太分散”,。其次是不能太短視,要允許失敗,,給予足夠的發(fā)展時(shí)間,。第三是不要過(guò)度監(jiān)管,寬進(jìn)嚴(yán)出,,讓不完全成熟的技術(shù)通過(guò)不斷反饋得以提升,。同時(shí)算力也是AI發(fā)展的稀缺資源,更不應(yīng)該太分散了,。劉偉曾多次參加中美之間的人工智能技術(shù)官方和學(xué)界層面對(duì)話,,他告訴《環(huán)球時(shí)報(bào)》記者,在這些對(duì)話活動(dòng)中有一個(gè)深刻感觸就是“中美學(xué)者對(duì)于兩國(guó)人工智能技術(shù)發(fā)展的認(rèn)識(shí)趨同”,。大家普遍認(rèn)為,,美國(guó)在AI技術(shù)的軟件和硬件上更具領(lǐng)先優(yōu)勢(shì),而且這個(gè)優(yōu)勢(shì)還有進(jìn)一步擴(kuò)大的趨勢(shì),;但在技術(shù)應(yīng)用和數(shù)據(jù)收集方面,,美國(guó)學(xué)者坦言中國(guó)更具優(yōu)勢(shì),而在AI領(lǐng)域,,“大數(shù)據(jù)正好是輔助決策模型的重要組成部分”,。此外,在人機(jī)協(xié)同和人機(jī)融合領(lǐng)域,,中美技術(shù)能力旗鼓相當(dāng),。“這也是美國(guó)三番五次與中國(guó)開(kāi)展人工智能技術(shù)對(duì)話的原因之一,,雙方實(shí)力相當(dāng),,才有對(duì)話的意愿,美國(guó)方面也很擔(dān)心我們?cè)谌藱C(jī)協(xié)同上實(shí)現(xiàn)重大突破,,從而占據(jù)領(lǐng)先地位,。”▲
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1089145.html
溫馨提示:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議,。