智譜AI CEO張鵬,。受訪者供圖“讓機(jī)器像人一樣思考,?!边M(jìn)入位于搜狐網(wǎng)絡(luò)大廈的智譜AI(人工智能)辦公區(qū)域,,公司愿景映入眼簾,。隨著ChatGPT,、Sora相繼問世,智譜公司也在這波人工智能大模型浪潮中更為忙碌,,調(diào)研、合作接踵而至,?!皠?chuàng)業(yè)像用百米的速度跑馬拉松?!眲?chuàng)業(yè)的快節(jié)奏讓張鵬團(tuán)隊(duì)不斷拓展邊界,,跨出舒適圈。這正是眾多風(fēng)口創(chuàng)業(yè)者的常態(tài),。坐落在北京中關(guān)村的搜狐網(wǎng)絡(luò)大廈,,見證著中國互聯(lián)網(wǎng)行業(yè)騰飛,助力一批又一批明星企業(yè)成長,。如今,,再度站在風(fēng)口,吸引眾多人工智能創(chuàng)業(yè)企業(yè)入駐,。張鵬與人工智能的緣分追溯至1998年,,當(dāng)時(shí)互聯(lián)網(wǎng)行業(yè)在中國萌發(fā),計(jì)算機(jī)尚未普及,。彼時(shí),,張鵬填報(bào)了清華大學(xué)計(jì)算機(jī)專業(yè),也逐漸打開人工智能世界的大門,。張鵬在清華園浸潤二十多年后,,開啟創(chuàng)業(yè),“從研究到產(chǎn)業(yè)落地需要一定時(shí)間過渡,,在這樣的歷史浪潮中,,產(chǎn)生了科技成果向社會(huì)轉(zhuǎn)化的契機(jī),,我們應(yīng)該厚積薄發(fā)?!薄坝萌斯ぶ悄芗夹g(shù)譜寫未來的華章?!边@是智譜公司名稱的由來,,張鵬團(tuán)隊(duì)創(chuàng)業(yè)之初便試圖解局——如何將研究到實(shí)踐落地的過程縮短,或者親自下場產(chǎn)生更大價(jià)值,。目前,,智譜AI專注于人工智能大模型研發(fā)與商業(yè)化落地。近日,,針對Sora技術(shù)難點(diǎn),、行業(yè)發(fā)展趨勢以及公司商業(yè)化進(jìn)展等問題,新京報(bào)貝殼財(cái)經(jīng)記者專訪了智譜AI CEO張鵬,。談迭代Sora領(lǐng)跑,,生成視頻連續(xù)性更好、邏輯性更強(qiáng)貝殼財(cái)經(jīng):初次看到Sora生成的視頻時(shí)感受如何,?張鵬:OpenAI近期發(fā)布了視頻生成模型Sora,,能夠生成一分鐘的高精度視頻。更重要的是,,讓大家看到也許這是構(gòu)建物理世界通用模型的可能路徑,。這確實(shí)是非常不錯(cuò)的進(jìn)展,文生視頻研發(fā)有段時(shí)間了,,之前可能只實(shí)現(xiàn)幾秒,,或者分辨率不高,或者是生成的畫面有閃爍,、跳幀,、前后不一致的情況,從去年下半年開始進(jìn)展還比較明顯,。Sora主要的優(yōu)點(diǎn)是生成視頻的連續(xù)性更好,、分辨率更高、邏輯性更強(qiáng),,本質(zhì)上解決了一些關(guān)鍵性的問題,,對文生視頻的理解和了解更深入、廣泛,。貝殼財(cái)經(jīng):文生視頻的技術(shù)難點(diǎn)在哪,,Sora的技術(shù)具有哪些突破性?張鵬:Sora的主要技術(shù)思路是用視覺塊編碼(Visual Patch)的方式,,把不同格式的視頻進(jìn)行統(tǒng)一編碼,,然后用Transformer(變換器)架構(gòu)進(jìn)行訓(xùn)練,并引入類似Diffusion的Unet方式,在降維和升維的過程中做加噪和去噪,。Sora提到的Diffusion Transformer(擴(kuò)散型變換器)架構(gòu),,和之前的“小”視頻模型不同,Sora是一個(gè)很大的視頻模型,,估算起來可能和千億Dense語言模型需要的訓(xùn)練量(算力)相當(dāng),。Sora可以生成長達(dá)60秒語義豐富的視頻,這說明訓(xùn)練的序列也比較長,,訓(xùn)練時(shí)的窗口至少也得有5s+,。貝殼財(cái)經(jīng):Sora如何反映了大模型發(fā)展水平的差異?張鵬:Sora的出現(xiàn)更鮮明地體現(xiàn)了OpenAI在技術(shù)方面的領(lǐng)先,,它把這種領(lǐng)先具象化了,。這里面有很多原因,總體上看,,Open AI對大模型技術(shù)路線的認(rèn)知更早,、更透徹,目光更長遠(yuǎn),,足夠堅(jiān)持探索AGI(人工通用智能)機(jī)理,。在人才方面,其團(tuán)隊(duì)足夠強(qiáng),,都是世界比較頂級的人才聚集,,有共同的理想和愿景。此外,,專利,、資金、數(shù)據(jù)等各資源能夠集中發(fā)揮作用,。貝殼財(cái)經(jīng):追趕或者實(shí)現(xiàn)Sora的技術(shù)有時(shí)間表嗎,?張鵬:不好判斷,文生視頻技術(shù)有許多團(tuán)隊(duì)都在研究,,關(guān)鍵是需要點(diǎn)對點(diǎn)針對性解決問題,。此外,模型規(guī)模變大,,數(shù)據(jù)量增加,,數(shù)據(jù)的標(biāo)注、清洗,、選擇,、合成都有待探索,所以很難有準(zhǔn)確時(shí)間預(yù)估,。談落地需要承認(rèn)差距,,完美的產(chǎn)品靠打磨貝殼財(cái)經(jīng):智譜已經(jīng)在大語言模型上有諸多成果,,比如智譜清言去年上線公測,目前使用效果如何,?張鵬:智譜清言是C端產(chǎn)品,,產(chǎn)品本身根植在模型之上,它的版本迭代和效果提升,,絕大部分來自于模型本身的迭代,,從去年到今年更迭了3個(gè)版本,效果提升了許多,。智譜清言產(chǎn)品本身也做了非常多的優(yōu)化,早期具備簡單聊天功能,,現(xiàn)在已經(jīng)是比較全面的AI效率工具,,無論是工作學(xué)習(xí)和日常生活都可以用AI賦能。貝殼財(cái)經(jīng):1月16日,,智譜AI發(fā)布了基座大模型GLM-4,,從標(biāo)準(zhǔn)大模型評測角度看,其性能整體上已經(jīng)逼近GPT-4,。不過,,如何看待有些評測的效果并不是很驚艷?張鵬:從主流,、標(biāo)準(zhǔn)的大模型測評角度看,,我們在1月的智譜AI技術(shù)開放日上已經(jīng)公布了完整的 benchmark(基準(zhǔn))測評結(jié)果,GLM-4性能整體比肩GPT-4,,在一些測評中還有所反超,,比如在基于AlignBench的測評中,GLM-4的中文對齊能力優(yōu)于GPT-4,。當(dāng)然,,我們留意到了在某些案例中,智譜清言的效果不盡如人意,,我們的產(chǎn)品團(tuán)隊(duì)正在持續(xù)優(yōu)化,,努力為所有用戶提供優(yōu)秀體驗(yàn)。完美的產(chǎn)品是靠打磨出來的,,大模型是個(gè)新生事物,,在發(fā)展過程中肯定會(huì)出現(xiàn)各種問題,在某一方面存在差距非常正常,,我們正視差距,,努力做到超越大家的預(yù)期。貝殼財(cái)經(jīng):你曾表示希望2024年讓大模型真正落地,,大模型如何從實(shí)驗(yàn)室到商業(yè)化,?張鵬:2021年就提出商業(yè)化落地,,目前商業(yè)化效果還可以,現(xiàn)在已經(jīng)有2000多家合作伙伴,,其中有1000多家實(shí)現(xiàn)了規(guī)?;涞兀?00多家深度共創(chuàng)的用戶,。商業(yè)化當(dāng)然還有很大的空間,。另外,我們也在思考大模型商業(yè)化落地的邏輯和范式是什么,?市場上可能有各種各樣的聲音,,是做通用技術(shù)模型還是做行業(yè)垂直模型,是以標(biāo)準(zhǔn)化產(chǎn)品的方式做平臺,,還是定制化開發(fā)應(yīng)用落地,,大家都有很多的討論。貝殼財(cái)經(jīng):大家用智譜大模型,,更看重產(chǎn)品的性價(jià)比,?張鵬:我覺得我們給大家的價(jià)值應(yīng)該是技術(shù)本身的優(yōu)勢,重要的是把技術(shù)做到最好,,技術(shù)決定模型能力的好與壞,。我們努力給客戶提供有競爭力的價(jià)格方案。貝殼財(cái)經(jīng):對標(biāo)OpenAI的過程中,,智譜AI有什么轉(zhuǎn)變嗎,?張鵬:我們起步比OpenAI晚,人家做得比我們好,,需要承認(rèn)差距,,但是我們的目標(biāo)一致,那就是AGI?,F(xiàn)在OpenAI還是處于領(lǐng)先地位,,有非常多值得我們學(xué)習(xí)的地方。談布局讓機(jī)器像人一樣思考,,通用人工智能不是單項(xiàng)能力突破貝殼財(cái)經(jīng):智譜在文生視頻方面有無布局,,下一步有何計(jì)劃?張鵬:團(tuán)隊(duì)從2021年開始布局文生圖和文生視頻,。其中,,根據(jù)CogView(模型名),我們研發(fā)了基于大模型的文本到視頻生成模型CogVideo,,采用了多幀率分層訓(xùn)練策略,,生成高質(zhì)量的視頻片段,提出一種基于遞歸插值的方法,,逐步生成與每個(gè)子描述相對應(yīng)的視頻片段,,并將這些視頻片段逐層插值得到最終的視頻片段,。這個(gè)工作引起了臉書、谷歌,、微軟的廣泛關(guān)注,。實(shí)現(xiàn)全系列產(chǎn)品矩陣對標(biāo)Open AI,是我們大模型系列產(chǎn)品布局的一貫?zāi)繕?biāo),,多模態(tài)模型在其中扮演著重要角色,,也始終是我們的研究重點(diǎn)。未來智譜AI也會(huì)第一時(shí)間向大家公布我們在多模態(tài)方面的最新成果,。貝殼財(cái)經(jīng):除了文生圖,、文生視頻外,智譜是否有其他計(jì)劃,?張鵬:首先創(chuàng)業(yè)團(tuán)隊(duì)做事要聚焦,,我們布局文生圖、文生視頻,,最終還是要收攏,并不是去做一堆的模型,,更要看重技術(shù)之間解決了哪些核心問題,,是否具有一致性。我們的愿景是“讓機(jī)器像人一樣思考”,。最后要解決通用人工智能認(rèn)知問題,。文生圖、文生視頻就是把人的認(rèn)知能力拆解,,一項(xiàng)一項(xiàng)解決,,最終才能把這些事情統(tǒng)合起來解決。真正的通用人工智能不是單項(xiàng)能力的突破,,而是追求本質(zhì)上的認(rèn)知能力突破,。一旦讓機(jī)器具備這種認(rèn)知能力,就有可能突破人腦上限,。新京報(bào)貝殼財(cái)經(jīng)記者 陳維城 編輯 王進(jìn)雨 校對 楊許麗
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1090665.html
溫馨提示:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議,。