OpenAI的最新技術(shù)成果——文生視頻模型Sora,,在春節(jié)假期炸裂登場,,令海內(nèi)外的AI從業(yè)者,、投資人徹夜難眠,。
如果你還沒有關(guān)注到這個新聞,,簡單介紹一下:Sora是OpenAI使用超大規(guī)模視頻數(shù)據(jù),,訓(xùn)練出的一個通用視覺模型,,可以理解和模擬運動中的物理世界,,生成不同時間,、縱橫比和分辨率的視頻,,最大版本的Sora能夠生成長達一分鐘的高保真視頻。
Sora發(fā)布之前,,也有許多采用各種方法的視頻生成模型,,但都使用較少的視覺數(shù)據(jù),只能生成較短(4秒)或固定大小的視頻,。所以,,Sora逼真的視覺效果、碾壓級的性能提升,,在震撼整個科技圈之余,,也導(dǎo)致了“中國AI焦慮癥”的人傳人現(xiàn)象。
廣大網(wǎng)友們再一次痛心疾首,對中國A發(fā)出質(zhì)問:
為什么又一個AI元創(chuàng)新沒能發(fā)生在中國,?我們點錯了科技樹,,好難過;
中國跟美國的AI差距越來越大,,Sora這波國內(nèi)慢了十年吧,?這下真跟不上了;
復(fù)制Sora算力是最大阻礙,,從芯片禁運開始咱們就完敗了,,沒戲了。
當然也不乏陰陽怪氣的,,“等國外的類Sora模型開源,,國內(nèi)AI公司就又能創(chuàng)新啦”。
在中美對弈的時代背景下,,上述焦慮情緒,,每一次在海外科技取得重大突破的時候,都會蔓延開來,。但時間證明,,作為全球唯二的AI大國之一,中國發(fā)展了多年AI技術(shù),,就算美國真有什么新AI成果是其他國家做不了,、趕不上的,那也絕對不是中國,。
拿并不遙遠的ChatGPT來說,,經(jīng)過一年狂奔,“中國有沒有自己的ChatGPT”已經(jīng)不再成為問題,。2023年很多國產(chǎn)“類ChatGPT”大語言模型已經(jīng)向公眾開放使用,,走進行業(yè)場景,有數(shù)億用戶檢測過中國AI的真實水平,,或許與OpenAI還存在差距,,但肯定不是一些人擔(dān)憂的那樣,認為“中國做不到”“技術(shù)有代差”,。
這就像我們經(jīng)常會看到一類“震驚體”新聞,,一種新藥問世,就說人類離永生不遠了,;一個AI突破,,就說AGI要實現(xiàn)了,人類要被毀滅了,。讀者在這些奇談怪論中“死去活來”,,對AI的認知也在“成神”和“騙子”之間反復(fù)橫跳,。而真正懂藥的人,肯定不會相信一種藥能包治百病,,而是搞清楚療效和副作用,,在對應(yīng)的癥狀上使用。
同理,,真正了解AI產(chǎn)業(yè)的人,,也能正視中國AI的長處,承認現(xiàn)實差距,,不卑不亢,,積極應(yīng)對。
尤其是經(jīng)過了ChatGPT的“練兵”之后,,這一次我們應(yīng)該更有底氣,,客觀看待Sora對中國AI帶來的真實變化,準備迎接又一個“AI之春”,。
變化一:拉近差距
在“ChatGPT為什么沒有誕生在中國,?”之后,龍年版本已經(jīng)成了“Sora為什么沒有誕生在中國,?”接連兩次錯失“元創(chuàng)新”,,讓期待中國AI“彎道超車”“后來居上”的急性子讀者,大感失望,。
科技發(fā)展從來不是一步登天,,現(xiàn)實并沒有爽文小說中逆襲打臉的“金手指”,只能是一步一個腳印邁進,。不能否認,大語言模型,、文生視頻模型的顛覆性產(chǎn)品,,沒有首發(fā)在中國,但也必須看到,,中國AI一直都在正確的道路上,,并且腳步在加速。
Sora的發(fā)布,,反而會讓中美AI的距離進一步拉近,,原因有三:
首先,方向一致,。
錯過一場技術(shù)革命,,最可怕的不是來得晚,而是點錯技能樹,,比如歷史上日本大力發(fā)展的“五代機”,,選錯方向就錯過了一個時代,。OpenAI的ChatGPT、Sora都是在大規(guī)模預(yù)訓(xùn)練模型的技術(shù)路徑上,,進行大量的工程實踐創(chuàng)新,。由此可見,一項新突破,,技術(shù)積累,、技術(shù)選型是十分重要的,而這條以Transformer架構(gòu)為主的“大模型之路”,,中國AI一直在持續(xù)跟進,,基礎(chǔ)設(shè)施和算法層面的堅實程度是肉眼可見的。
其次,,目標明確,。
OpenAI的元創(chuàng)新讓人應(yīng)接不暇,處于全球AI領(lǐng)先地位,,中國AI企業(yè)確實與其存在差距,,始終在追趕。但這并不是諷刺中國AI的理由,?!皼]有從頭發(fā)明xx技術(shù)”,并不代表不優(yōu)秀,,OpenAI也不是Transformer發(fā)明者,。而且,OpenAI本身就是一家集合了全球頂尖人才,、力量與資本的特殊AI公司,,就連谷歌都跟在后面屢敗屢戰(zhàn),用OpenAI的標準去要求各方面資源受限的中國AI產(chǎn)學(xué)研機構(gòu),,其實是不公平的,。
Sora明確了,“視頻生成模型是一條構(gòu)建物理世界通用模擬器的有效路徑”,,印證了暴力計算的又一次勝利,,“Scaling Law”大力出奇跡的涌現(xiàn)效果,相當于為中國AI領(lǐng)域完成了“探路”,。有了清晰的追趕目標,,中國AI各界反而能快速整合資源、投入研發(fā),,從而進一步拉近中美在文生視頻上的距離,。和ChatGPT一樣,中國AI做出“類Sora”也是必然的,,絕不可能錯過這一波或者徹底跟不上,。
最后,,能力具備。
或早或晚,,中國一定會做出“類Sora”,,但到底是三年后、五年后,,還是十年后,?我們認為,2024年應(yīng)該就會看到國產(chǎn)Sora問世,。無論是Sora所用到的基礎(chǔ)模型LLM,、文生圖模型DALL·E 3、大規(guī)模視頻數(shù)據(jù)集,、AI算力體系,、大模型開發(fā)工具棧等核心基礎(chǔ)設(shè)施,中國都已經(jīng)具備,。比如原創(chuàng)的基礎(chǔ)大語言模型文心一言,、訊飛星火、BAICHUAN等,,以及文生圖模型文心一格,、騰訊混元等,加上過去一年大模型存算傳基礎(chǔ)設(shè)施的突飛猛進,,有能力和條件支持中國AI修成正果,,在視頻生成賽道再現(xiàn) 類ChatGPT 式的成功。
面對Sora,,中國AI努力追趕是必須的,,但數(shù)一數(shù)行囊中的工具和果實,不必妄自菲薄,,更不用亂了陣腳,。沿著正確且清晰的道路,加速向前跑,,中美AI的差距才能縮小,。
變化二:國產(chǎn)大模型格局再優(yōu)化
和LLM一樣,,不會出現(xiàn)Sora在全球一枝獨秀,,而國內(nèi)卻無視頻生成模型可用的情況。衷心希望,,我們在不久的未來,,不會像LLM百模大戰(zhàn)一樣,從擔(dān)憂“中國沒有Sora”,,轉(zhuǎn)而擔(dān)憂“中國要那么多Sora怎么用”,。
從這個角度看,,OpenAI從ChatGPT到Sora的持續(xù)輸出,會讓國內(nèi)AI大模型市場少一點虛火,,多一分理性,。
少一點虛火,是指底層模型的重要性,,被Sora再一次“劃重點”,,避免國產(chǎn)大模型低水平的重復(fù)建設(shè)。
2023年一個又一個大語言模型被訓(xùn)練出來,,推向市場,,其中原創(chuàng)性的基礎(chǔ)模型占比最小,更多是行業(yè)大模型,,以及很多私有化部署的大模型,,在數(shù)據(jù)規(guī)模、參數(shù)規(guī)模上無法與基座模型相提并論,,生成效果也會差很多,。這種低水平的重復(fù)建設(shè),也會造成AI算力,、投資的浪費,。
而Sora在視頻領(lǐng)域的驚艷表現(xiàn),再次證明了暴力美學(xué)的有效性,,將曾經(jīng)大火的AI視頻創(chuàng)業(yè)公司的模型直接碾壓,。正如OpenAI CEO奧特曼在YC W24 啟動會上的演講中所說:最正確的做法是設(shè)想一個“上帝般的”模型正在運作,然后基于這種設(shè)想來構(gòu)建最好的產(chǎn)品,。
對中國AI來說,,將為數(shù)不多具有底層原創(chuàng)能力的基座模型,如文心,、星火等,,作為大模型基礎(chǔ)設(shè)施與支柱,支持初創(chuàng)企業(yè)和千行百業(yè)做好精調(diào),、優(yōu)化,,避免“重復(fù)造輪子”,是非常重要的,。
多一分理性,,是在被Sora驚艷的同時,也要想到應(yīng)用和商業(yè)化的漸進性,,以更合理的方案來進行國產(chǎn)類Sora的開發(fā),。
類ChatGPT的大語言模型在狂奔一年之后,在與各個行業(yè)結(jié)合的過程中,,已經(jīng)暴露出實際應(yīng)用場景局限,、商業(yè)價值雖有但不多,、大模型投入產(chǎn)出比較低的挑戰(zhàn)。如何用好大模型,,已經(jīng)成為中國AI的關(guān)鍵考驗,。
相比“人人皆可上手”的大語言模型,視頻生成模型的應(yīng)用門檻更高,,受眾群體更小,,目前OpenAI僅開放給創(chuàng)作者使用,而非像ChatGPT那樣開放給大眾,。不難看到,,視頻生成模型從研發(fā)到落地,整個過程會更加緩慢,,應(yīng)用潛力與商業(yè)出口還有待探索,。
這一方面留給中國AI產(chǎn)學(xué)各界了較長的追趕窗口期,同時,,由于Sora能夠激活多大的商業(yè)價值尚不明確,,除了字節(jié)跳動、流媒體平臺等要全力投入,,其他科技企業(yè)和初創(chuàng)公司都要考慮到商業(yè)化的問題,,為創(chuàng)作、商用場景打磨好工具,,做好視頻生成模型的提示詞工程,,以便非專業(yè)背景的廣大行業(yè)用戶們上手使用。
大模型的價值需要商業(yè)化來證明,,Sora也不例外,。視頻生成模型走向行業(yè)的長跑,才剛剛開始,。在更廣袤的產(chǎn)業(yè)空間里,,如何讓類Sora產(chǎn)品帶來真實價值,這個答案OpenAI沒有給,,美國AI不會給,,只能由中國AI自己來書寫,而這也是國內(nèi)更勝一籌的地方,。
變化三:長期動能的查漏補缺
不必焦慮Sora,,并不意味著中國AI就能躺平“坐看云卷云舒”了。必須承認,,國產(chǎn)大模型還有很多瓶頸尚待解決,。
Sora模擬物理世界的通用能力,,不僅可以用于影視制作等內(nèi)容創(chuàng)意行業(yè),,還可以為游戲,、自動駕駛、工業(yè)數(shù)字孿生,、電商,、文旅等各行各業(yè),提供一個構(gòu)建敘事融合世界的技術(shù)支柱,。
那么問題來了,,國產(chǎn)Sora一定會出現(xiàn),但我們做好各行業(yè)規(guī)模應(yīng)用Sora的準備了嗎,?恐怕今天的答案還是,,沒有。
前面提到,,Sora的“暴力美學(xué)”再次證明了Scale的價值,。而要達到涌現(xiàn)效果,基座模型仍然高度依賴于大量高質(zhì)量數(shù)據(jù)集,,超大規(guī)模算力,,大量工程化調(diào)優(yōu)人才,以及由此帶來的巨大開發(fā)及運行成本,。
即使背靠微軟云的OpenAI,,也沒有面向公眾開放使用Sora,也沒有向開發(fā)者開放API接入,,就連正式開放使用的時間表都欠奉,。國產(chǎn)AI本就存在的專項算力緊缺問題,在Sora問世之后變得更加緊迫,。
同時不難預(yù)料,,為了進一步阻截中國AI的發(fā)展,圍繞AI算力的新一輪限制一定會來,。完善和發(fā)展AI基礎(chǔ)設(shè)施,,構(gòu)建自主可控的產(chǎn)業(yè)鏈,讓大語言模型,、視頻生成模型等新AI技術(shù)都不缺席中國式現(xiàn)代化的進程,,讓算力成為中國數(shù)字經(jīng)濟長期發(fā)展的動能,中國計算行業(yè)依舊重任在肩,。
此外,,在中美AI差距中,數(shù)據(jù)的規(guī)模與質(zhì)量成為越不過的門檻,。2023年5月英國《經(jīng)濟學(xué)人》提出,,中國在建立基礎(chǔ)模型方面比美國落后兩到三年,造成這一差距的首要原因就是數(shù)據(jù),AI模型在訓(xùn)練時難以充分利用互聯(lián)網(wǎng)內(nèi)容,。
針對這一現(xiàn)狀,,2023年12月15日,國家數(shù)據(jù)局同中央網(wǎng)信辦,、科技部,、工業(yè)和信息化部等17個部門聯(lián)合印發(fā)《“數(shù)據(jù)要素×”三年行動計劃(2024—2026年)》,目標是到2026年底,,數(shù)據(jù)要素應(yīng)用場景廣度和深度大幅擴展,。2024年,我們一定會見證該行動的推進與落地,,見證數(shù)據(jù)要素成為國產(chǎn)AI的養(yǎng)料,。
由此可見,中國AI的查漏補缺,,不是一朝一夕的事,,也不是某一家AI企業(yè)、某一個模型廠商的事,,面對已經(jīng)在行動的中國產(chǎn)業(yè)各界,,何妨多一些耐心。
智者不惑,,仁者不憂,,勇者不懼。正視Sora給中國AI帶來的變化與挑戰(zhàn),,不為一時的缺席而焦慮,,是相信我們有能力登場,也終將登場,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1089226.html
溫馨提示:投資有風(fēng)險,入市須謹慎,。本資訊不作為投資理財建議,。