Sora生成的視頻截屏
Sora生成的視頻截屏
Sora生成的視頻截屏本報(bào)記者 樊 巍 劉 揚(yáng) 劉彩玉繼去年發(fā)布的聊天機(jī)器人ChatGPT引領(lǐng)新一輪人工智能(AI)浪潮之后,,美國人工智能公司OpenAI于16日又發(fā)布了全新的生成式人工智能模型Sora,,它能夠通過文本指令創(chuàng)建最長達(dá)60秒的視頻,其逼真的視覺效果讓它在一夜之間“刷屏”,,全球諸多媒體都對其冠以“顛覆性”的美名,,甚至有網(wǎng)友感嘆“視頻行業(yè)全都要被洗牌了”。相關(guān)專家17日接受《環(huán)球時(shí)報(bào)》記者采訪時(shí)表示,短期來看,,Sora確實(shí)會對影視等行業(yè)帶來顯著影響,,但我們也不應(yīng)神化其作用,長期來看,,需要用心制作的作品,,依舊很難僅用“芯”完成?!叭祟愒纲€服輸”目前OpenAI還沒有發(fā)布Sora的公開使用版本,,但已經(jīng)發(fā)布的40多個(gè)演示視頻中包含有細(xì)節(jié)拉滿的場景、復(fù)雜的攝像機(jī)運(yùn)鏡以及多個(gè)充滿情感的角色,。OpenAI宣稱,,Sora可以理解物體在物理世界中如何存在,并準(zhǔn)確地解釋道具并生成引人注目的角色來表達(dá)充滿活力的情感,。例如它可以根據(jù)文字描述“在東京街頭,,一名時(shí)髦女士穿梭在充滿溫暖霓虹燈光和動感城市標(biāo)志的街道上”,生成一段包含有多鏡頭的高清晰視頻,,包括從大街景切入對女士臉部表情的特寫,,以及潮濕的街道地面反射霓虹燈的光影效果。這些視頻的真實(shí)度令人為之驚嘆,,就連特斯拉CEO馬斯克也在社交媒體上對此表示“人類愿賭服輸”,。美國有線電視新聞網(wǎng)(CNN)稱,盡管“多模態(tài)大模型”屢見不鮮,,但Sora的制作長度和準(zhǔn)確性使其與眾不同,,它可能會對數(shù)字娛樂產(chǎn)業(yè)產(chǎn)生重大影響。北京郵電大學(xué)人機(jī)交互與認(rèn)知工程實(shí)驗(yàn)室主任劉偉接受《環(huán)球時(shí)報(bào)》記者采訪時(shí)表示,,Sora在短期內(nèi)可能會對短視頻制作,、影視行業(yè)以及視覺交互界面應(yīng)用產(chǎn)生較為顯著的影響;從長期來看,,這項(xiàng)技術(shù)會為自動駕駛,、數(shù)字仿真、場景模擬等領(lǐng)域帶來改變,。他表示,,“我們不應(yīng)神化Sora的作用,這項(xiàng)技術(shù)還很難取代傳統(tǒng)的影視行業(yè)制作流程,,人類用‘心’拍出影視的作品,,還很難僅用‘芯’來完成?!敝袊皡f(xié)科幻電影工作委員會執(zhí)行秘書長馬賀亮接受《環(huán)球時(shí)報(bào)》記者采訪時(shí)表示,,Sora的確讓影視圈“震驚”,,但“主要是因?yàn)锳I的發(fā)展速度遠(yuǎn)遠(yuǎn)超過了原來的預(yù)期”。他認(rèn)為,,短期內(nèi)與概念設(shè)計(jì),、視頻預(yù)覽相關(guān)的崗位會在一定程度上受到Sora的影響,但它所能呈現(xiàn)的效果其實(shí)還達(dá)不到院線電影的級別,,而且電影在創(chuàng)作上有主觀立場,、視角和表達(dá),觀看時(shí)有情感交流和情感投射,,遠(yuǎn)不是簡單生成一段視頻就能代替,,因此AI作為技術(shù)輔助手段的確已經(jīng)在改變電影制作方式與流程,能優(yōu)化提升電影創(chuàng)作,,但要說它能“顛覆整個(gè)電影行業(yè)”,,還為時(shí)過早。OpenAI也坦承,,Sora還存在一些短板,,例如模型在準(zhǔn)確模擬復(fù)雜場景的物理特性方面可能會遇到一些困難,也可能無法周到地展現(xiàn)具有因果關(guān)系的事例,。例如演示視頻中就出現(xiàn)了“有人咬了一口餅干,,但餅干上并未出現(xiàn)咬痕”的明顯漏洞?!把垡姙閷?shí)”或成過去中國人工智能專家吳甘沙17日接受《環(huán)球時(shí)報(bào)》記者采訪時(shí)表示,,“Sora的影響往小了說,是文生視頻技術(shù)突破了一個(gè)數(shù)量級(時(shí)長比此前最好的水平提升了15-20倍),,可以直接應(yīng)用于短視頻,、廣告行業(yè)等,對自動駕駛的場景和數(shù)據(jù)生成等都有正面影響,;往大了說,,它提供了理解、重建和模擬這個(gè)世界的可能性,。如果大語言模型LLM像是一個(gè)小孩關(guān)在圖書館里讀遍人間萬卷,,Sora就是一個(gè)胸有丘壑的青年來到真實(shí)人間、行萬里路,,用現(xiàn)實(shí)和反饋來印證知識,,并且能夠用視頻(模擬真實(shí))的方式輸出知識和內(nèi)容。一圖勝千言,,圖和視頻的信息傳遞損耗遠(yuǎn)低于文字,,從這個(gè)意義上來看,它未來沖擊的不僅僅是視頻,、電影行業(yè),,也會影響書籍,、知識、教育等一切信息輸出的行業(yè)”,。新智元?jiǎng)?chuàng)始人楊靜17日接受《環(huán)球時(shí)報(bào)》記者采訪時(shí)表示,Sora是對OpenAI算法應(yīng)用領(lǐng)域的升維拓展,,ChatGPT一年前已在自然語言交互領(lǐng)域取得重大突破,,Sora則在AI視頻領(lǐng)域一舉登上行業(yè)巔峰。如果說ChatGPT模擬了人類的思維能力,,Sora則是對整個(gè)物理世界的模擬,。結(jié)合這些技術(shù),如果未來虛擬世界與現(xiàn)實(shí)世界無縫融合,,那么人類的整個(gè)社會生活都會顛覆,,包括智慧城市、軍事,、影視游戲,、電商社交等多個(gè)領(lǐng)域。但楊靜也提醒說,,AI生成的假視頻存在泛濫風(fēng)險(xiǎn),,可能被用于詐騙犯罪。在Sora將AI生成視頻能力提升到近乎逼真的程度時(shí),,大家也要認(rèn)識到“眼見為實(shí)”可能已成過去,。CNN稱,OpenAI已關(guān)注安全性問題,。該公司表示,,未來將在Sora輸出的視頻中應(yīng)用內(nèi)容追溯技術(shù),以鑒別是否為AI深度偽造視頻,。劉偉認(rèn)為,,如今AI技術(shù)在應(yīng)用層面出現(xiàn)的一些亂象也凸顯這項(xiàng)技術(shù)是一把“雙刃劍”。隨著以大語言模型為代表的AI技術(shù)快速發(fā)展,,會對傳統(tǒng)的倫理,、法律以及生產(chǎn)方式等等方面都產(chǎn)生強(qiáng)大的沖擊,如果我們不加以監(jiān)管,,其一旦“泛濫成災(zāi)”,,必然會侵犯許多人的權(quán)益。但如果我們過早或者過嚴(yán)地加以監(jiān)管,,這必然又會限制這項(xiàng)技術(shù)的發(fā)展,。“我認(rèn)為監(jiān)管之難主要體現(xiàn)在如何平衡‘管’與‘放’之間的關(guān)系,,特別是在全球各國人工智能飛速發(fā)展的時(shí)期,?!眲ケ硎荆趯?shí)際操作的層面,,我們既要對明顯會侵害大部分人權(quán)益的行為堅(jiān)決加以限制,,與此同時(shí)也應(yīng)有“特區(qū)制”,允許有試錯(cuò)的空間,。中美在AI領(lǐng)域差距拉大了,?Sora的出現(xiàn)也引發(fā)了國內(nèi)許多業(yè)界人士的擔(dān)憂,“中美AI領(lǐng)域差距進(jìn)一步拉大”成為Sora問世后的伴生話題,。360集團(tuán)創(chuàng)始人周鴻祎認(rèn)為,,“OpenAI訓(xùn)練的Sora應(yīng)該會閱讀大量視頻。一幅圖勝過千言萬語,,而視頻傳遞的信息量又遠(yuǎn)遠(yuǎn)超過一幅圖”,,因此Sora的出現(xiàn)可能意味著通用人工智能“真的就不遠(yuǎn)了”,“不是10年20年的問題,,可能一兩年很快就可以實(shí)現(xiàn)”,。他表示,盡管國內(nèi)大模型發(fā)展水平表面看已經(jīng)接近GPT3.5,,但實(shí)際上跟4.0比還有一年半的差距,。從現(xiàn)在來看,OpenAI手上除了GPT5之外,,可能還有一些“秘密武器”沒有亮出來,。“中國和美國的AI差距可能不但沒有縮小,,反而在加大,。”楊靜認(rèn)為,,Sora的震撼給我們?nèi)齻€(gè)提醒,。第一是在算法方面,OpenAI在攻破語言和視覺兩個(gè)堡壘后,,即將向通用人工智能發(fā)起最后挑戰(zhàn),;一旦實(shí)現(xiàn)超級人工智能,加上生成式的AI世界,,人類整體的權(quán)重都將降維,;第二是在算力方面,OpenAI公布籌資7萬億美元建立芯片帝國的計(jì)劃,,這筆巨款相當(dāng)于美國GDP的1/4,,或許將確立壟斷全球算法與算力的AI霸主地位;第三是在數(shù)據(jù)方面,,微軟此前為OpenAI提供了5000億視頻用于Sora訓(xùn)練,,未來還將有更多海量數(shù)據(jù)涌入,,又有更多視頻生成。吳甘沙表示,,目前AI領(lǐng)域的競爭格局是OpenAI公司“一騎絕塵”,。無論是谷歌的Gemini、創(chuàng)業(yè)公司Runway和Pika,,還是中國的頂尖公司,,都要奮起急追,不然差距會越來越大,。他認(rèn)為,中國要在AI領(lǐng)域追趕,,首先是依靠人才,,確保與世界頂尖水平的交流,鼓勵(lì)人才高密度聚集,?!懊绹竽P拖嚓P(guān)的大公司加創(chuàng)業(yè)公司可能就是一二十家,而中國有幾百家,,人才太分散”,。其次是不能太短視,要允許失敗,,給予足夠的發(fā)展時(shí)間,。第三是不要過度監(jiān)管,寬進(jìn)嚴(yán)出,,讓不完全成熟的技術(shù)通過不斷反饋得以提升,。同時(shí)算力也是AI發(fā)展的稀缺資源,更不應(yīng)該太分散了,。劉偉曾多次參加中美之間的人工智能技術(shù)官方和學(xué)界層面對話,,他告訴《環(huán)球時(shí)報(bào)》記者,在這些對話活動中有一個(gè)深刻感觸就是“中美學(xué)者對于兩國人工智能技術(shù)發(fā)展的認(rèn)識趨同”,。大家普遍認(rèn)為,,美國在AI技術(shù)的軟件和硬件上更具領(lǐng)先優(yōu)勢,而且這個(gè)優(yōu)勢還有進(jìn)一步擴(kuò)大的趨勢,;但在技術(shù)應(yīng)用和數(shù)據(jù)收集方面,,美國學(xué)者坦言中國更具優(yōu)勢,而在AI領(lǐng)域,,“大數(shù)據(jù)正好是輔助決策模型的重要組成部分”,。此外,在人機(jī)協(xié)同和人機(jī)融合領(lǐng)域,,中美技術(shù)能力旗鼓相當(dāng),?!斑@也是美國三番五次與中國開展人工智能技術(shù)對話的原因之一,雙方實(shí)力相當(dāng),,才有對話的意愿,,美國方面也很擔(dān)心我們在人機(jī)協(xié)同上實(shí)現(xiàn)重大突破,從而占據(jù)領(lǐng)先地位,?!薄?/p>
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1089145.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。