在國內(nèi)大模型競爭愈發(fā)競爭激烈,、難落地的當下,智譜AI的模式有什么特殊之處,?以及被資本追捧的它能給中國大模型帶來哪些不一樣的思考,?
原文來源:產(chǎn)業(yè)家
作者|斗斗
圖片來源:由無界 AI生成
對于智譜AI而言,很長一段時間里,,“眾星捧月”這個詞再合適不過。
前段時間,,智譜AI的最新一筆融資再次引發(fā)了廣泛關(guān)注,成為萬眾矚目的焦點,。公開信息顯示,,新一輪融資金額超過 25 億元人民幣,加上前幾輪融資,,智譜AI市值已經(jīng)突破百億。
更值得注意的是投資方的豪華陣容,,包括社?;鹬嘘P(guān)村自主創(chuàng)新基金(君聯(lián)資本為基金管理人)、美團,、螞蟻、阿里,、騰訊、小米,、金山,、順為,、Boss 直聘、好未來,、紅杉,、高瓴等多家機構(gòu),,以及包括君聯(lián)資本在內(nèi)的部分老股東跟投,。
在這場“百模大戰(zhàn)”中,智譜AI無疑是被寄予眾望的一個,。
然而,,值得注意的是,就目前來看智譜AI能商用的ChatGLM3只有6B版本,,對標GPT 3.5商用高參數(shù)版本仍有距離,。尤其是在阿里正式開源72B參數(shù)模型之后,智譜亦會面臨不小的壓力,。
一些值得思考的問題是,,智譜AI的優(yōu)勢究竟是什么?未來發(fā)展的想象力在哪,?以及其目前面臨的一些問題下,,如何解題,?挖掘其頻繁融資的另一面。
百億估值,,憑什么,?
從3月份開源第一代到現(xiàn)在7個月之后迭代到第三代,智譜AI發(fā)展十分迅猛,。
在最新發(fā)布第三代基礎(chǔ)大語言模型ChatGLM3系列,。官方表示該模型的性能較前一代大幅提升,是10B以下最強基礎(chǔ)大模型,。
具體來看,,按照MMLU排序,在所有規(guī)模的模型對比下,,ChatGLM3-6B得分排序第9,,但是前面8個模型最小的也是140億參數(shù)規(guī)模的Qwen-14B,如果按照GSM8K排序,,ChatGLM3-6B-Base甚至排到第三,,超過了GPT-3.5的57.1分。
可見,,智譜AI趕超OpenAI不是空穴來風。
想要深入挖掘智譜AI的優(yōu)勢,,就不得不從國產(chǎn)大模型發(fā)展,、落地的諸多難題講起。
一項新技術(shù)的價值幾何,,商業(yè)化變現(xiàn)是最直接的檢驗方式,。在國內(nèi)一眾大模型廠商中,可以說大部分都還處于講技術(shù),、講發(fā)展的階段,。對于商業(yè)化落地,基本處于一個探索階段,。
而智譜AI早在創(chuàng)業(yè)前就已經(jīng)服務(wù)B端,,目前客戶已經(jīng)超過1000家??梢娖洚a(chǎn)業(yè)落地,、商業(yè)化變現(xiàn)更有前景。
大模型落地又一個極為重要的前提,,便是數(shù)據(jù)安全,。智譜AI 作為國內(nèi)唯一全內(nèi)資、國產(chǎn)自研的大模型企業(yè),,它推出的 GLM 國產(chǎn)芯片適配計劃,,面對不同類型的用戶不同類型的芯片提供不同等級的認證和測試,,可真正實現(xiàn)安全可控。
這個優(yōu)勢,,從某種意義上可以完全俘獲央國企以及有特殊要求的大型企業(yè)?!皣笱肫?,想做模型能力或者接入,智譜都是無論如何都是繞不開的選項,?!蹦硺I(yè)內(nèi)人士對產(chǎn)業(yè)家說。
此外,,還有人的因素,。在一級市場,早期投資就是投人,,這一點在所有初創(chuàng)公司都適用,。智譜AI的“前身”是清華KEG(知識工程實驗室),CEO張鵬本科畢業(yè)于清華大學計算機系博士,;董事長劉德兵師從高文院士,,曾任清華數(shù)據(jù)科學研究院科技大數(shù)據(jù)研究中心副主任;總裁王紹蘭為清華創(chuàng)新領(lǐng)軍博士,。
總體來看,,智譜AI具備了落地經(jīng)驗、人才完備,、資金充足,、技術(shù)到位等天時地利人和的條件。這種條件也使其在一種大模型廠商的賽跑中,,率先脫穎而出,。然而這只是表象。
路徑選擇上,,不同于比較主流的 GPT,,智譜 AI 采用的是 GLM,智譜AI提出了全新的GLM(通用語言模型)路徑,。訓練效率比GPT更高,,也能理解更復(fù)雜的場景。
在大模型落地層面,,其沒有選擇推出行業(yè)大模型,,而是說服行業(yè)客戶在通用大模型基座上做微調(diào)。在CEO張鵬看來,,只有一定規(guī)模的通用大模型,,才能實現(xiàn)類人的認知能力涌現(xiàn),。
此外,為了提高大語言模型作為AI Agent的表現(xiàn)和能力,,清華大學和智譜AI推出了一種新的方案——AgentTuning,,可以將有效增強開源大語言模型作為AI Agent的能力。
智譜AI獲得資本和互聯(lián)網(wǎng)巨頭青睞的原因,,不僅僅是因為其技術(shù),,更在于其在路徑、模式,、策略上的選擇,,以及對自身大模型底層定位的明確。
用CEO張鵬的話來說,,智譜AI的全線產(chǎn)品與 OpenAI 的產(chǎn)品已經(jīng)做到了對標,。
那么,就當下而言,,除了被驗證的路徑和模型,,智譜AI有沒有其它待完成的拼圖?
商業(yè)化,、AI開源和避不開的資金
通過智譜AI商用授權(quán)的模型版本來看,。目前僅限于6B,即60億參數(shù),。而從OpenAI開源模型來看,,GPT-3 為具有 1750 億參數(shù)的自回歸語言模型,OpenAI 已將其部分開源,;GPT-3.5具有 1375 億參數(shù),,同樣有一部分已經(jīng)被開源。
更值得注意的是,,阿里最近也開源了72B參數(shù)的模型,。要知道目前的大模型應(yīng)用,多處于大力出奇跡階段,,更大的參數(shù),,意味著更好的落地效果。
可以發(fā)現(xiàn),,雖然智譜AI作為國內(nèi)第一開源大模型,,有著較強的技術(shù)架構(gòu),但對標OpenAI以及國內(nèi)大廠商業(yè)授權(quán)的模型規(guī)模上來看仍有一些距離,。且隨著阿里更大參數(shù)的開源模型發(fā)布,,智譜AI在6B模型上的優(yōu)勢或?qū)⒆內(nèi)酢?/strong>
而想要補齊這個短板,則需要大量的資金支持,。
“如果智譜AI背后也能有一個像微軟這樣的金主,,會十分亮眼?!蹦硺I(yè)內(nèi)人士對產(chǎn)業(yè)家直言,。
事實上,隨著智譜AI大模型能力持續(xù)提升,,訓練參數(shù)自然也需要提升,,對算力、存儲等需求也會增加,。這在資金上以及資源調(diào)度上將會是一個巨大的難題。
粗略來看,,私有化部署一個130b規(guī)模的大模型,,一年費用接近4000萬,但這4000萬花出去能帶來多少價值,,卻是一個未知數(shù),。在AI大模型部署方面,目前小企業(yè)付費能力弱,,大企業(yè)要么自研,,要么還處于了解、認知階段,,商業(yè)化落地較難,。
資金從哪來,是一個亟待解決的問題,。
“智譜開源6b模型有一部分原因是為了告訴市場,,我這有更好的,看你愿不愿意花錢,?!?/strong>某業(yè)內(nèi)人士對產(chǎn)業(yè)家說。對于智譜AI而言,,開源6B展示實力,,以及拉投資是較為明顯的解法。
而另一個解法,,則是擴大“朋友圈”,。
眾所周知,互聯(lián)網(wǎng)巨頭在計算,、存儲能力以及數(shù)據(jù)資源方面有著較大地優(yōu)勢,。而對于智譜AI而言,這些都需要其投入大量的資金去搭建,。與巨頭的合作,,可以很大程度上降低研發(fā)成本,、提高研發(fā)效率。此外,,智譜 AI 還可以借助云廠商的市場地位和渠道,,推廣自身的人工智能技術(shù)和服務(wù),。
另一邊,由于大模型需要部署在云上,,按照數(shù)據(jù)運行付費,,越多的用戶使用模型和資源,對云算力的需求量就越大,,云廠家的收入也就隨之增加,。且云廠商則可以借助智譜 AI 的技術(shù)實力,提升自身在人工智能領(lǐng)域的競爭力,。
總體而言,,對于云廠商而言,可以拉動自身云收入,;對于大模型廠商,,可以減少基礎(chǔ)設(shè)施的投入,可謂一石二鳥,。
目前,,智譜AI已經(jīng)與阿里、騰訊,、美團等企業(yè)展開一系列合作,。
從這點來看,智譜AI之所以“眾星捧月”,更在于其開放,、融合的商業(yè)模式,,在國內(nèi)大模型競爭愈發(fā)競爭激烈、難落地的當下,,智譜AI的模式更能推動大模型的落地以及加速大模型生態(tài)的發(fā)展,。
智譜AI的這種模式,也為其自身以及國內(nèi)大模型未來的發(fā)展業(yè)態(tài)帶來了一些新的想象力和思考,。
國產(chǎn)大模型未來在哪里,?
“模型能開除一半人,企業(yè)才會考慮用,。”在與某行業(yè)人士的溝通中,,其表達了對當下大模型商業(yè)化路途之遠的觀點。
客觀來看,,目前國內(nèi)大模型的業(yè)態(tài),,屬于百花齊放,已經(jīng)開始出現(xiàn)同質(zhì)化的特征,。這不僅會造成算力等基礎(chǔ)設(shè)施的非合理化使用,更或造成非良性的競爭,。
目前,,大模型落地進程較慢,加上仍舊如春筍般往外冒的大模型創(chuàng)業(yè)熱潮,,必將產(chǎn)生大量泡沫,。對于國內(nèi)大模型廠商而言,以生態(tài)之力,,各司其職推動大模型商業(yè)化落地,,無疑是一個最佳選項。
事實上,,目前國內(nèi)外主流大模型在算法層面尚不存在代際差,,但是在算力和數(shù)據(jù)方面存有差距。
通過大力支持通用領(lǐng)域國內(nèi)頭部科技企業(yè)研發(fā)自主可控的國產(chǎn)大模型,,同時鼓勵各垂直領(lǐng)域在大模型基礎(chǔ)上,,利用開源工具構(gòu)建規(guī)范可控的自主工具鏈,既探索“大而強”的通用模型,,又研發(fā)“小而美”的垂直行業(yè)模型,,就可以逐漸構(gòu)建基礎(chǔ)大模型和專業(yè)小模型交互共生、迭代進化的良好生態(tài),。
在大模型生態(tài)愈發(fā)完善下,,也將帶來一些新的變化。
首先是模型質(zhì)量的提升。隨著技術(shù)的進步和資源的投入,,未來的大模型將具有更高的精度,、更強的理解能力和更廣泛的適用性。這不僅意味著它們能夠更好地理解自然語言,,還能夠進行更多的復(fù)雜任務(wù),,如翻譯、推理,、創(chuàng)作等,。
其次是更豐富的應(yīng)用領(lǐng)域。除了傳統(tǒng)的文本處理之外,,大模型也將在語音識別,、圖像生成、視頻理解和推薦系統(tǒng)等領(lǐng)域發(fā)揮更大的作用,。這意味著我們可以在更多的場景中享受到AI帶來的便利,。
此外,未來大模型將更加定制化,,能夠更好地滿足用戶的個性化需求,。用戶可以根據(jù)自己的實際需求選擇合適的模型,并進行定制化配置,。這將使用戶能夠更加靈活地利用大模型來解決自己的問題,。
在大模型生態(tài)中,數(shù)據(jù)將變得更加共享和開放,。機構(gòu)和企業(yè)之間可能會加強合作,,共享優(yōu)質(zhì)數(shù)據(jù)資源,從而促進大模型技術(shù)的發(fā)展,。這種合作將為大模型的開發(fā)和應(yīng)用提供更加廣闊的空間,。
新的科技浪潮襲來,就必然需要一些企業(yè)承擔一些使命,。著眼當下,,技術(shù)架構(gòu)是大模型走出來的重要標準;遙看未來,,想要站在AI大模型浪潮之上,,生態(tài)構(gòu)建力愈發(fā)重要。
免責聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1084091.html
溫馨提示:投資有風險,,入市須謹慎,。本資訊不作為投資理財建議。