在國內(nèi)大模型競爭愈發(fā)競爭激烈,、難落地的當(dāng)下,智譜AI的模式有什么特殊之處,?以及被資本追捧的它能給中國大模型帶來哪些不一樣的思考?
原文來源:產(chǎn)業(yè)家
作者|斗斗
圖片來源:由無界 AI生成
對(duì)于智譜AI而言,,很長一段時(shí)間里,“眾星捧月”這個(gè)詞再合適不過,。
前段時(shí)間,,智譜AI的最新一筆融資再次引發(fā)了廣泛關(guān)注,成為萬眾矚目的焦點(diǎn),。公開信息顯示,,新一輪融資金額超過 25 億元人民幣,加上前幾輪融資,,智譜AI市值已經(jīng)突破百億,。
更值得注意的是投資方的豪華陣容,包括社?;鹬嘘P(guān)村自主創(chuàng)新基金(君聯(lián)資本為基金管理人),、美團(tuán)、螞蟻,、阿里,、騰訊、小米,、金山,、順為、Boss 直聘,、好未來,、紅杉、高瓴等多家機(jī)構(gòu),,以及包括君聯(lián)資本在內(nèi)的部分老股東跟投,。
在這場“百模大戰(zhàn)”中,智譜AI無疑是被寄予眾望的一個(gè),。
然而,,值得注意的是,,就目前來看智譜AI能商用的ChatGLM3只有6B版本,對(duì)標(biāo)GPT 3.5商用高參數(shù)版本仍有距離,。尤其是在阿里正式開源72B參數(shù)模型之后,,智譜亦會(huì)面臨不小的壓力。
一些值得思考的問題是,,智譜AI的優(yōu)勢究竟是什么,?未來發(fā)展的想象力在哪?以及其目前面臨的一些問題下,,如何解題,?挖掘其頻繁融資的另一面。
百億估值,,憑什么,?
從3月份開源第一代到現(xiàn)在7個(gè)月之后迭代到第三代,智譜AI發(fā)展十分迅猛,。
在最新發(fā)布第三代基礎(chǔ)大語言模型ChatGLM3系列,。官方表示該模型的性能較前一代大幅提升,是10B以下最強(qiáng)基礎(chǔ)大模型,。
具體來看,,按照MMLU排序,,在所有規(guī)模的模型對(duì)比下,,ChatGLM3-6B得分排序第9,但是前面8個(gè)模型最小的也是140億參數(shù)規(guī)模的Qwen-14B,,如果按照GSM8K排序,,ChatGLM3-6B-Base甚至排到第三,超過了GPT-3.5的57.1分,。
可見,智譜AI趕超OpenAI不是空穴來風(fēng),。
想要深入挖掘智譜AI的優(yōu)勢,,就不得不從國產(chǎn)大模型發(fā)展、落地的諸多難題講起,。
一項(xiàng)新技術(shù)的價(jià)值幾何,,商業(yè)化變現(xiàn)是最直接的檢驗(yàn)方式。在國內(nèi)一眾大模型廠商中,,可以說大部分都還處于講技術(shù),、講發(fā)展的階段。對(duì)于商業(yè)化落地,,基本處于一個(gè)探索階段,。
而智譜AI早在創(chuàng)業(yè)前就已經(jīng)服務(wù)B端,目前客戶已經(jīng)超過1000家??梢娖洚a(chǎn)業(yè)落地,、商業(yè)化變現(xiàn)更有前景。
大模型落地又一個(gè)極為重要的前提,,便是數(shù)據(jù)安全,。智譜AI 作為國內(nèi)唯一全內(nèi)資、國產(chǎn)自研的大模型企業(yè),,它推出的 GLM 國產(chǎn)芯片適配計(jì)劃,,面對(duì)不同類型的用戶不同類型的芯片提供不同等級(jí)的認(rèn)證和測試,可真正實(shí)現(xiàn)安全可控,。
這個(gè)優(yōu)勢,,從某種意義上可以完全俘獲央國企以及有特殊要求的大型企業(yè)?!皣笱肫?,想做模型能力或者接入,智譜都是無論如何都是繞不開的選項(xiàng),?!蹦硺I(yè)內(nèi)人士對(duì)產(chǎn)業(yè)家說。
此外,,還有人的因素,。在一級(jí)市場,早期投資就是投人,,這一點(diǎn)在所有初創(chuàng)公司都適用,。智譜AI的“前身”是清華KEG(知識(shí)工程實(shí)驗(yàn)室),CEO張鵬本科畢業(yè)于清華大學(xué)計(jì)算機(jī)系博士,;董事長劉德兵師從高文院士,,曾任清華數(shù)據(jù)科學(xué)研究院科技大數(shù)據(jù)研究中心副主任;總裁王紹蘭為清華創(chuàng)新領(lǐng)軍博士,。
總體來看,,智譜AI具備了落地經(jīng)驗(yàn)、人才完備,、資金充足,、技術(shù)到位等天時(shí)地利人和的條件。這種條件也使其在一種大模型廠商的賽跑中,,率先脫穎而出,。然而這只是表象。
路徑選擇上,,不同于比較主流的 GPT,,智譜 AI 采用的是 GLM,,智譜AI提出了全新的GLM(通用語言模型)路徑。訓(xùn)練效率比GPT更高,,也能理解更復(fù)雜的場景,。
在大模型落地層面,其沒有選擇推出行業(yè)大模型,,而是說服行業(yè)客戶在通用大模型基座上做微調(diào),。在CEO張鵬看來,只有一定規(guī)模的通用大模型,,才能實(shí)現(xiàn)類人的認(rèn)知能力涌現(xiàn),。
此外,為了提高大語言模型作為AI Agent的表現(xiàn)和能力,,清華大學(xué)和智譜AI推出了一種新的方案——AgentTuning,,可以將有效增強(qiáng)開源大語言模型作為AI Agent的能力。
智譜AI獲得資本和互聯(lián)網(wǎng)巨頭青睞的原因,,不僅僅是因?yàn)槠浼夹g(shù),,更在于其在路徑、模式,、策略上的選擇,,以及對(duì)自身大模型底層定位的明確。
用CEO張鵬的話來說,,智譜AI的全線產(chǎn)品與 OpenAI 的產(chǎn)品已經(jīng)做到了對(duì)標(biāo),。
那么,就當(dāng)下而言,,除了被驗(yàn)證的路徑和模型,,智譜AI有沒有其它待完成的拼圖?
商業(yè)化,、AI開源和避不開的資金
通過智譜AI商用授權(quán)的模型版本來看。目前僅限于6B,,即60億參數(shù),。而從OpenAI開源模型來看,GPT-3 為具有 1750 億參數(shù)的自回歸語言模型,,OpenAI 已將其部分開源,;GPT-3.5具有 1375 億參數(shù),同樣有一部分已經(jīng)被開源,。
更值得注意的是,,阿里最近也開源了72B參數(shù)的模型。要知道目前的大模型應(yīng)用,,多處于大力出奇跡階段,,更大的參數(shù),,意味著更好的落地效果。
可以發(fā)現(xiàn),,雖然智譜AI作為國內(nèi)第一開源大模型,,有著較強(qiáng)的技術(shù)架構(gòu),但對(duì)標(biāo)OpenAI以及國內(nèi)大廠商業(yè)授權(quán)的模型規(guī)模上來看仍有一些距離,。且隨著阿里更大參數(shù)的開源模型發(fā)布,,智譜AI在6B模型上的優(yōu)勢或?qū)⒆內(nèi)酢?/strong>
而想要補(bǔ)齊這個(gè)短板,,則需要大量的資金支持,。
“如果智譜AI背后也能有一個(gè)像微軟這樣的金主,會(huì)十分亮眼,?!蹦硺I(yè)內(nèi)人士對(duì)產(chǎn)業(yè)家直言。
事實(shí)上,,隨著智譜AI大模型能力持續(xù)提升,,訓(xùn)練參數(shù)自然也需要提升,對(duì)算力,、存儲(chǔ)等需求也會(huì)增加,。這在資金上以及資源調(diào)度上將會(huì)是一個(gè)巨大的難題。
粗略來看,,私有化部署一個(gè)130b規(guī)模的大模型,,一年費(fèi)用接近4000萬,但這4000萬花出去能帶來多少價(jià)值,,卻是一個(gè)未知數(shù),。在AI大模型部署方面,目前小企業(yè)付費(fèi)能力弱,,大企業(yè)要么自研,,要么還處于了解、認(rèn)知階段,,商業(yè)化落地較難,。
資金從哪來,是一個(gè)亟待解決的問題,。
“智譜開源6b模型有一部分原因是為了告訴市場,,我這有更好的,看你愿不愿意花錢,?!?/strong>某業(yè)內(nèi)人士對(duì)產(chǎn)業(yè)家說。對(duì)于智譜AI而言,,開源6B展示實(shí)力,,以及拉投資是較為明顯的解法,。
而另一個(gè)解法,則是擴(kuò)大“朋友圈”,。
眾所周知,,互聯(lián)網(wǎng)巨頭在計(jì)算、存儲(chǔ)能力以及數(shù)據(jù)資源方面有著較大地優(yōu)勢,。而對(duì)于智譜AI而言,,這些都需要其投入大量的資金去搭建。與巨頭的合作,,可以很大程度上降低研發(fā)成本,、提高研發(fā)效率。此外,,智譜 AI 還可以借助云廠商的市場地位和渠道,,推廣自身的人工智能技術(shù)和服務(wù),。
另一邊,由于大模型需要部署在云上,,按照數(shù)據(jù)運(yùn)行付費(fèi),,越多的用戶使用模型和資源,對(duì)云算力的需求量就越大,,云廠家的收入也就隨之增加。且云廠商則可以借助智譜 AI 的技術(shù)實(shí)力,,提升自身在人工智能領(lǐng)域的競爭力,。
總體而言,對(duì)于云廠商而言,,可以拉動(dòng)自身云收入,;對(duì)于大模型廠商,,可以減少基礎(chǔ)設(shè)施的投入,可謂一石二鳥,。
目前,,智譜AI已經(jīng)與阿里、騰訊,、美團(tuán)等企業(yè)展開一系列合作,。
從這點(diǎn)來看,智譜AI之所以“眾星捧月”,,更在于其開放,、融合的商業(yè)模式,在國內(nèi)大模型競爭愈發(fā)競爭激烈,、難落地的當(dāng)下,,智譜AI的模式更能推動(dòng)大模型的落地以及加速大模型生態(tài)的發(fā)展。
智譜AI的這種模式,,也為其自身以及國內(nèi)大模型未來的發(fā)展業(yè)態(tài)帶來了一些新的想象力和思考,。
國產(chǎn)大模型未來在哪里?
“模型能開除一半人,,企業(yè)才會(huì)考慮用,。”在與某行業(yè)人士的溝通中,其表達(dá)了對(duì)當(dāng)下大模型商業(yè)化路途之遠(yuǎn)的觀點(diǎn),。
客觀來看,,目前國內(nèi)大模型的業(yè)態(tài),屬于百花齊放,,已經(jīng)開始出現(xiàn)同質(zhì)化的特征,。這不僅會(huì)造成算力等基礎(chǔ)設(shè)施的非合理化使用,更或造成非良性的競爭,。
目前,,大模型落地進(jìn)程較慢,加上仍舊如春筍般往外冒的大模型創(chuàng)業(yè)熱潮,,必將產(chǎn)生大量泡沫,。對(duì)于國內(nèi)大模型廠商而言,以生態(tài)之力,,各司其職推動(dòng)大模型商業(yè)化落地,,無疑是一個(gè)最佳選項(xiàng)。
事實(shí)上,,目前國內(nèi)外主流大模型在算法層面尚不存在代際差,,但是在算力和數(shù)據(jù)方面存有差距。
通過大力支持通用領(lǐng)域國內(nèi)頭部科技企業(yè)研發(fā)自主可控的國產(chǎn)大模型,,同時(shí)鼓勵(lì)各垂直領(lǐng)域在大模型基礎(chǔ)上,,利用開源工具構(gòu)建規(guī)范可控的自主工具鏈,,既探索“大而強(qiáng)”的通用模型,又研發(fā)“小而美”的垂直行業(yè)模型,,就可以逐漸構(gòu)建基礎(chǔ)大模型和專業(yè)小模型交互共生,、迭代進(jìn)化的良好生態(tài)。
在大模型生態(tài)愈發(fā)完善下,,也將帶來一些新的變化,。
首先是模型質(zhì)量的提升。隨著技術(shù)的進(jìn)步和資源的投入,,未來的大模型將具有更高的精度,、更強(qiáng)的理解能力和更廣泛的適用性。這不僅意味著它們能夠更好地理解自然語言,,還能夠進(jìn)行更多的復(fù)雜任務(wù),,如翻譯、推理,、創(chuàng)作等,。
其次是更豐富的應(yīng)用領(lǐng)域。除了傳統(tǒng)的文本處理之外,,大模型也將在語音識(shí)別,、圖像生成、視頻理解和推薦系統(tǒng)等領(lǐng)域發(fā)揮更大的作用,。這意味著我們可以在更多的場景中享受到AI帶來的便利,。
此外,未來大模型將更加定制化,,能夠更好地滿足用戶的個(gè)性化需求,。用戶可以根據(jù)自己的實(shí)際需求選擇合適的模型,并進(jìn)行定制化配置,。這將使用戶能夠更加靈活地利用大模型來解決自己的問題,。
在大模型生態(tài)中,數(shù)據(jù)將變得更加共享和開放,。機(jī)構(gòu)和企業(yè)之間可能會(huì)加強(qiáng)合作,,共享優(yōu)質(zhì)數(shù)據(jù)資源,從而促進(jìn)大模型技術(shù)的發(fā)展,。這種合作將為大模型的開發(fā)和應(yīng)用提供更加廣闊的空間,。
新的科技浪潮襲來,就必然需要一些企業(yè)承擔(dān)一些使命,。著眼當(dāng)下,,技術(shù)架構(gòu)是大模型走出來的重要標(biāo)準(zhǔn);遙看未來,,想要站在AI大模型浪潮之上,,生態(tài)構(gòu)建力愈發(fā)重要。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1084091.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。