作者:小巖
編輯:小迪
來源:新火種
如果把時間回撥5年,我們會發(fā)現(xiàn),全世界范圍內能夠進行AI大模型研發(fā)的團體,,屈指可數(shù),。要知道,,能夠訓練大模型的算力設備基本是近3年發(fā)布的,而現(xiàn)象級產(chǎn)品ChatGPT的誕生,不過是最近一年的事情,。
畢竟,,大模型的發(fā)展需要極高的門檻,,不僅需要強大的算力資源,更需要豐富的數(shù)據(jù)資源給予支持。大模型時代,,離不開大算力,,也離不開大數(shù)據(jù)。
但也就在一年的時間,,各式各樣,,專供大模型的公司和機構如雨后春筍般冒出頭。大家開始角力,,繼而陷入白熱化的競爭狀態(tài),。就連著名AI科學家李開復都表示,未來中美的大模型公司中,,能存活下去的只有5,、6家。
我們不禁感嘆,大模型賽道從“高處不勝寒”到擠兌嚴重,,竟然只需要如此短的時間,。
“除了大廠,中美加起來應該可以支撐5,、 6家左右”,。
12月14日,在一場與AI相關的對話中,,零一萬物的CEO李開復被問到了一個問題:大模型賽道最終能有幾家活下來,?對此,李開復也算是知無不言,,他認為,,除了大廠,中美加起來應該可以支撐五六家左右,。
李開復表示,,如今來看,做巨大預訓練模型的機會正在變少,。這個通道不能說是完全關閉了,,但勢必會越來越難。未來只有在需要新技術的時候,,才會出現(xiàn)更多的機會,。與此同時,李開復還給出了AI未來的發(fā)展方向:AI Infra(人工智能基礎框架技術)和AI應用等方面。
李開復解釋,,“做AI應用的機會就是現(xiàn)在,,正如10多年前移動互聯(lián)網(wǎng)所面臨的時代一樣,。較早抓到機會的微信就成功了。當然,,后續(xù)也有抖音,,拼多多等陸續(xù)崛起。但一定是越早入局,,機會越大,。真正有夢想有野心的開發(fā)者,應該是要做AI-First(AI優(yōu)先) ,,AI-Native(AI原生)的應用,,這些應用才可能成為AI 2.0時代最偉大或是最賺錢的應用”。
事實的確如此,。專業(yè)性大模型AI的開發(fā)競爭激烈,,各大公司在訓練自家大模型時,還不得不面臨巨大的挑戰(zhàn)和限制,。一方面,,大模型的訓練需要龐大的計算資源和時間,如果不是大廠或者擁有雄厚的資本支持獨角獸,,這勢必會成為一個難以逾越的壁壘,。另一方面,大模型的訓練數(shù)據(jù)需要大量的人工標注和清洗,,這個過程專業(yè)性極高,,復雜而耗時。更重要的是,,大模型的應用面臨著數(shù)據(jù)隱私和安全方面的挑戰(zhàn),,“如何保護用戶數(shù)據(jù)和防止濫用”是每個大模型開發(fā)者都需要考慮清楚,亟待解決的問題,。稍有不慎,,就會陷入泥潭。
李開復領銜零一萬物,,發(fā)布首款開源中英雙語大模型“Yi”。
雖然強調AI大模型即將發(fā)展成“紅海賽道”,,但李開復本人卻是賽道里卷的最兇的那個,。
作為創(chuàng)新工場的董事長兼CEO,他成立了自己的AI公司“零一萬物”,。就在上個月,,零一萬物發(fā)布了首款開源中英雙語大模型“Yi”。
此次開源發(fā)布的Yi系列模型,,包含34B和6B兩個版本,,11月2日,零一萬物在Hugging Face上傳了這兩個參數(shù)。據(jù)悉,,Hugging Face是全球最受歡迎的大模型,,數(shù)據(jù)集開源社區(qū),被認為是大模型領域的GitHub,,在大模型英文能力測試中具有相當權威性,。
根據(jù)Hugging Face英文開源社區(qū)平臺和C-Eval中文評測所提供的最新榜單,Yi-34B分別在預訓練大語言模型和中文大模型榜單C-Eval排行榜爬升到第1位,。這也是迄今為止唯一成功登頂 Hugging Face全球開源模型排行榜的國產(chǎn)模型,。
與此同時,,零一萬物新一輪的融資十分順利,,由阿里云領投。目前,,零一萬物估值已超10億美元,,躋身獨角獸行列。李開復在2023年3月創(chuàng)建了零一萬物團隊,,6月開始運營,。也就是說,在短短8個月的時間里,,零一萬物不僅推出了核心產(chǎn)品,,更躋身成為估值超10億美元的“獨角獸”。
行業(yè)內盡是大廠和“獨角獸”,,也難怪李開復要感嘆大模型賽道競爭激烈了,。
大模型Yi全球領跑,旨在打造打造更多的To C Super App,。
據(jù)了解,,Yi-6B和Yi-3B分別代表數(shù)據(jù)參數(shù)量為60億和340億,按照李開復的說法,,“34B是一個黃金尺寸”,。
34B的最大優(yōu)勢在于一方面它不會小到?jīng)]有涌現(xiàn)或者涌現(xiàn)不夠,甚至已經(jīng)完全達到了涌現(xiàn)的門檻,;另一方面,,它又沒有太大,允許高效率的單卡推理,。Yi-34B模型在多項評測基準中全球領跑,,基于超強Infra下模型訓練成本實測下降40%,模擬千億規(guī)模訓練成本則可以下降多達50%,。
所謂AI Infra,,全稱為AI Infrastructure ,,即人工智能基礎架構技術,主要涵蓋大模型訓練和部署提供各種底層技術設施,,包括處理器,,操作系統(tǒng),存儲系統(tǒng),,網(wǎng)絡基礎設施,,云計算平臺等,是模型訓練背后極其關鍵的“保障技術”,。
AI Infra是大模型行業(yè)發(fā)展至今較少被關注到的硬技術領域,但也是十分關鍵的領域,。用李開復的話說,,“做過大模型Infra的人比做算法的人才更稀缺”。
對于零一萬物而言,,因為有了Yi做基礎,,更多To C端的超級應用才有可能出現(xiàn)。Yi的定位是通用底座,,已在 Hugging Face,,ModelScope,GitHub 3大全球開源社區(qū)平臺正式上線,。與此同時,,Yi系列量化版本,對話模型,,數(shù)學模型,,代碼模型,多模態(tài)模型等都將很快亮相,。
按照李開復的邏輯,,AI的技術壁壘終將會被一個個的攻破,對于AI公司來說,,可持續(xù),,可增長的盈利才是要緊事,無法商業(yè)化的公司終將被淘汰,。在AI 2.0時代,,最大的商機一定是來自超級應用,而且是消費者級別的,,諸如抖音,微信一樣的超級應用,。
目前,,零一萬物已經(jīng)啟動100B以上參數(shù)規(guī)模的模型訓練,,而多模態(tài)大模型團隊也已經(jīng)集結了10多個人,說明零一萬物將朝著“消費級應用”的方向努力,。而這些,,恰恰與李開復所說的“AI Infra和AI應用才是未來”的理念,不謀而合,。
免責聲明:本文來自網(wǎng)絡收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權歸原作者所有,。轉載請注明出處:http://lequren.com/1084431.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。