文章來源:樹龍談
作者:賀樹龍
圖片來源:由無界AI生成
2021年下半年,英諾天使基金合伙人王晟開始認真研究大模型,,想找一個大模型項目投點錢,。
當時美國硅谷出現(xiàn)了一批大模型相關的項目,,發(fā)展很迅猛。比如年初成立的Jasper,,在市場上非?;鸨恍枰粋€簡單提示,,就能生成各種風格的營銷文案,,當年就賺了3000萬美元。而Jasper的底層系統(tǒng),,來自于OpenAI在一年前推出的大語言模型GPT-3,。
王晟留意到了GPT-3,覺得這個方向或許隱藏著大機會,。雖然當時生成式AI的質量還不太理想,,但他覺得對于投資而言,或許到了一個合適的時點,。
但當時國內做大模型的創(chuàng)業(yè)團隊不多,。2021年底,英諾天使基金在清華大學設立了一個獎學金項目,,支持計算機系的學生做研究,,2017級博士豈凡超申請了這個項目。王晟意外發(fā)現(xiàn),,豈凡超正在做的大模型項目,,正好就是他想投的方向。
2022年4月,,臨近畢業(yè),,豈凡超對王晟透露了想創(chuàng)業(yè)的想法,王晟果斷決定投資,,深言科技成立了,。
天使輪之后,豈凡超開始為下一輪融資做準備,,三個月內談了四五十家VC,,沒有一家愿意投資?!按蠹叶伎床欢?,不知道什么是大模型?!蓖蹶蓪ξ一貞?。
9月下旬的一個周五,王晟拉著豈凡超跟紅杉資本的一個合伙人吃了頓飯,,三天后就收到了詳談的邀約,,豈凡超聊完拿到了紅杉的TS(投資意向),。
英諾天使基金合伙人 王晟
行業(yè)看起來一切如常,,但一些嗅覺敏銳的投資人,,已經(jīng)提前感受到了大模型行業(yè)即將到來的波濤洶涌。
2個月后的11月底,,OpenAI正式推出ChatGPT,,因為效果驚艷,整個科技圈大為震撼,。一時間,,AI大模型爆火,,科技公司紛紛跟進,,整個投資圈一蜂窩沖上去看大模型項目。深言科技在隨后又拿到了騰訊,、好未來,、春華資本、三七互娛等機構的投資,。
2023年的“百模大戰(zhàn)”中,,VC對著十來家大模型公司猛投,項目估值一時被拉到很高,,很多投資機構陷入迷茫,。按照王晟的話說,“大家第一看不懂,,第二不敢投,,第三投不到。對于絕大多數(shù)早期投資機構而言,,已經(jīng)沒法玩了,。”
英諾天使基金通過提前布局,,拿到了這波大模型競賽的船票,。此外,英諾天使基金還投資了一些做基礎設施和應用的項目,。王晟告訴我,,投資一年多時間,深言科技的估值漲了十幾倍,。
如今,,大模型熱潮還在繼續(xù)。前不久,,我跟王晟進行了一次深聊,,他對我講了投資大模型的歷程,、經(jīng)驗和感受,也分享了他對大模型創(chuàng)業(yè)投資的一些觀察和見解,。以下是正文:
01,、大模型估值有泡沫,比的是“市夢率”
問:英諾什么時候將AIGC確定為一個重要的投資方向,?
王晟:我們其實投AI不算晚,,之前就在AI賽道花了很多時間。國內第一波AI浪潮差不多從2013年開始,,誕生了AI四小龍(商湯,、曠視、依圖,、云從),,我們從2016年開始投資,投中了文遠知行,、智行者,、中科原動力等項目,后來投了一些圖像視頻類的AI公司,,再就是這一波大模型,。
問:大模型項目估值很高,動輒幾十億人民幣,,這是不是對關注早期投資的基金不太友好,?
王晟:早期基金就得投的早。2022年11月底OpenAI推出ChatGPT之后,,很多VC才去學習,,提升認知,開始找項目,。實際上你今天看到的項目,,絕大多數(shù)都是在那之后出現(xiàn)的,而我們在那之前就開始布局了,。
問:在ChatGPT出現(xiàn)之后,,還有哪些項目是適合早期投資的?
王晟:幾乎沒有。
問:為什么,?
王晟:我覺得市場跟大家看到的情況不一樣,。2023年整個AI投資是兩端收斂,資金端20多家VC投資很活躍,,資產端就幾十個項目融了很多錢,,兩邊都沒有泛化,這個市場還不夠繁榮。
中基協(xié)統(tǒng)計全市場VC有1.2萬家,,實際出手的可能連200家都不到,,活躍的也就20來家,剩下的都是在看熱鬧,,跟著搖旗吶喊,。因為大家第一看不懂,第二不敢投,,第三投不到,。一堆創(chuàng)業(yè)者各種鼓吹項目多厲害,其實根本沒人投,。
問:為什么會呈現(xiàn)兩端收斂的格局,?
王晟:創(chuàng)新有周期,當多個方面的基礎科學研究達到一個閾值,,就會出現(xiàn)天才企業(yè)家把科研成果轉化成技術創(chuàng)新,,帶動一個新的技術范式。
一個新的技術范式出現(xiàn)之后,,首先要做infra(基礎設施),,就像建一個商場,,先得通水通電有電梯,,但做infra不會泛化,因為需要大筆投資,,能玩得起的玩家不多,。如果infra本身還不完善,去做應用毫無意義,,會被基礎設施的升級碾壓掉,。
另外,今天能做的所有創(chuàng)新都是受限的,,涌現(xiàn)出優(yōu)秀的創(chuàng)業(yè)者和產品經(jīng)理還需要時間,。2007年iPhone出現(xiàn),移動互聯(lián)網(wǎng)浪潮開啟,,但很多重要的應用隔了好幾年才出現(xiàn),,拼多多是2015年,抖音是2016年,,而ChatGPT從推出到現(xiàn)在也就一年時間,,沒人知道它的能力邊界在哪里。
問:所以要在恰當?shù)臅r間段內做恰當?shù)氖隆?/p>
王晟:是的,。過去兩年行業(yè)在大力構建infra,還沒到大量做創(chuàng)新項目的時間點,今年會有一些能夠迅速提升生產力的應用涌現(xiàn)出來,,目前一個共識是,,2023年是大模型元年,2024年是Agent元年,,但還不是AI應用的元年,。所有投資人都是在這種規(guī)律周期里做符合周期的事情。
問:你說的拿到投資的幾十家創(chuàng)業(yè)公司,,是以大模型為主嗎?
王晟:大模型可能不到十個,,其實大部分是infra,比如芯片算力,、無損網(wǎng)絡,、光模塊。我們也投了端側的算力芯片,,但我們不太相信在數(shù)據(jù)中心這種通用的GPU上,,能跑出來一個初創(chuàng)公司,因為硬件特別不適合VC投很多錢,。
問:所以投大模型的主要還是資金實力雄厚的大機構和巨頭公司,?
王晟:目前看來是這樣,除非你投的早,,因為對天使投資來講投的早很重要,。
問:現(xiàn)在市場上號稱有200多個大模型,你認為有水分嗎,?
王晟:我認為能屬于頭部的也就十幾家,。
問:頭部的幾個項目估值飛漲,有的高達百億人民幣,,你覺得是否存在高估,?
王晟:肯定是高估了。商湯現(xiàn)在是300多億港幣,,而曾經(jīng)有3000億?,F(xiàn)在大模型的估值拉到這么高,都是市夢率,,可能未來會拉到更高,,但最終還是要看如何落地,能不能避免上一波AI在落地上無法找到特別有效的商業(yè)場景的情況,。
問:現(xiàn)在行業(yè)里怎么估值,?
王晟:大家會基于未來的收入,給十幾倍二十倍的PS(市銷率),,現(xiàn)在實際給到的都是大幾十倍甚至上百倍的PS,。沒收入的就拍腦袋給個數(shù),。
問:作為早期投資人,面對這種局面會不會焦慮,?
王晟:沒什么可焦慮的,,因為我們投了深言科技。這是目前為止,,所有大模型項目中收益率最高的投資,。這些大模型公司我們想投都能投的進去,只不過有些我們選擇沒出手,。
問:為什么不出手,?
王晟:我們的單筆投資跟項目的估值匹配度不好,這不是說我們投不進去,。其實對于絕大多數(shù)早期投資機構而言,,已經(jīng)沒法玩了,大量的VC首先不知道該往哪個方向投,,其次大家一窩蜂都上的時候,,他也不知道誰厲害,然后他也找不到這些人,,即便找到了人家可能沒興趣讓他投,,他也投不進去。我們沒有這些問題,。
問:王小川的百川智能之前很火,,你們有接觸嗎?
王晟:2022年4月初,,我跟王小川一起吃過一頓飯,,他歡迎我們投資,,但確實太貴了,。當時是親友輪,估值5億美金,,英諾的典型投資一般是1000萬人民幣,,這在5億美金的盤子里確實不太匹配。
所以我覺得早期投資機構需要認知早,,做判斷早,,不能在VC一哄而上的時候才反應過來,那就已經(jīng)不是早期投資人能參與的了,。在市場達成共識之前出手,,價格就會可控,共識達成后價格會上漲很快,。
02,、投資大模型,最核心還是看人
問:你們怎么判斷哪個項目能跑出來?
王晟:核心看團隊做大模型的能力,。中國跟美國有一個很大的差異,,投資人往往會迫切要求項目落地到具體的應用場景,拿到訂單獲得收益,,只講商業(yè)模式是不被認可的,,但另一方面中國的用戶和企業(yè)都不愿意付費,很少能像OpenAI那樣獲得很高的年收入,。但是投資人可以認可一個團隊做好大模型的能力,,我們相信大模型跟某些行業(yè)深度結合之后,可能會創(chuàng)造出巨大價值,。
問:所以投資人看的不是現(xiàn)在的商業(yè)模式,,而是一種能力和可能性。
王晟:對,,你可以理解2022年投的大模型項目都沒有商業(yè)模式,,大家也說不清楚怎么賺錢。
問:哪些方面的能力對一個大模型團隊至關重要,?
王晟:最核心的還是人,,所有公司都是如此。你有了最好的人才,,就能夠吸引投資,,有錢了就能買算力,再去吸引更好的人才,,飛輪就能滾動起來,。
問:什么背景或者類型的人才是最被看好的,?
王晟:我覺得這是動態(tài)的,。一開始學術水平高的團隊更有優(yōu)勢,大家比的是科研能力,,LLaMA開源之后,,大家對大模型的認知迅速被拉齊,這個時候擁有更強工程能力,、融資能力的團隊更容易贏,。
問:中國創(chuàng)業(yè)者從LLaMA開源學到了什么?
王晟:如果自己從零到一練大模型,,過去累積的經(jīng)驗,、科研能力、方法是非常重要的,,或許某些方面在技術上不難,,但它是一個綜合的,、涉及到很多技巧和方法的事情,一旦有個點被卡住了,,靠自己可能需要花一兩年時間才能解決,。Meta過去這些年積累的大模型技術,本來都是不傳之秘,,結果一開源,,迅速把很多認知拉平了,這意味著很多坑不用再踩,,那些在大廠做過巨大系統(tǒng)工程的人,,優(yōu)勢就體現(xiàn)出來了。
問:接下來可能會怎么演變,?
王晟:我認為LLaMA接下來應該也是開源的,,可能是多模態(tài),仍然保持很高的水準,。當再過幾年,,開源大模型能力封頂?shù)臅r候,更大的挑戰(zhàn)就來自于做產品的能力,。那時對一個團隊最大的挑戰(zhàn)不是科研,,也不是工程,而是整個系統(tǒng)的運營能力,,那可能就是王慧文的時代,。
問:這么說的話,王慧文入場太早了,?
王晟:我覺得王慧文有一點做錯了,,他角色錯了。他下場的階段是拼技術,、科研,、工程,他的優(yōu)勢在后期的市場和運營,,未來對他更友好,。
問:有些大模型企業(yè)是在開源模型上做創(chuàng)新,還有一些是套殼,,你認為這兩種有沒有機會?
王晟:有這么三類企業(yè):第一類是真正有能力做大模型的企業(yè),,第二類是基于開源大模型做微調,、部署,第三類是調用外部大模型的API接口,。后兩種屬于大模型應用公司,,要特別專注于應用場景,,側重于發(fā)現(xiàn)需求,做好產品,,因為它的價值在于把模型用好,,把需求滿足好,我覺得機會也不小,。
Infra完善之后,,就會出現(xiàn)很多應用。但受限于我們的想象力,,這些應用都是基于過去的,,現(xiàn)在用新技術來做遷移,把新的技術范式當成做創(chuàng)新轉變的手段,,所以幾百個大模型,,很多都是大公司甚至上市公司在做,他們實際上是試圖用大模型賦能原有業(yè)務,,優(yōu)化業(yè)務鏈,、工具鏈、工作流,。
問:但有些公司似乎只吆喝不行動,。
王晟:有些上市公司口號喊得響,可能是為了拉股價,。實打實做大模型的企業(yè),,在二級市場很少。技術范式遷移的過程中,,其實沒有創(chuàng)業(yè)公司太多機會,,因為大廠占據(jù)了場景、客戶,、數(shù)據(jù),,創(chuàng)業(yè)公司只能等創(chuàng)新,需要時間去涌現(xiàn),。
問:之前大家都說要做中國的OpenAI,,你覺得現(xiàn)在有公司能配得上這個稱號嗎?
王晟:我覺得目前還沒有,。
問:差距有多大,?
王晟:現(xiàn)在國內頭部的大模型差不多都在GPT-3.5的水平,最頂尖的距離GPT-4和Gemini可能還有兩年的差距,。一方面在語言能力,,另外在多模態(tài)方面差距挺遠。差距能否縮小,,就要看這一次大模型技術范式的天花板有多高,,包括多模態(tài)能不能也變成生成式,,我覺得未來會變成生成式多模態(tài)大語言模型。假如LLaMA不開源,,我們今天的水平可能比現(xiàn)在還要差,,會被國外的大模型公司大幅甩下。
問:現(xiàn)在很多大模型會說自己在某個指標上超越了GPT,,在一些排行榜奪冠,,這能代表模型的真實水平嗎?
王晟:現(xiàn)在的榜單多而雜,,基本原理是給AI出題,,但我們發(fā)現(xiàn)有些榜單的題目和答案都是錯的,所以打分越高,,可能意味著模型能力越差,。對于投資機構而言,刷榜的得分不重要,,什么樣的團隊能做什么事,,其實大家都知道,重點還是看人,。
03,、大廠做大模型沒有優(yōu)勢,機會屬于創(chuàng)新者
問:行業(yè)里一種觀點,,認為基礎大模型交給大廠做就好了,,沒必要重復造輪子,,你怎么看,?
王晟:這是屁股決定腦袋。我認為大力度的顛覆式創(chuàng)新,,應該由初創(chuàng)企業(yè)來做,,而不是由某些業(yè)務上的壟斷者來做,因為作為既得利益者,,第一它做不好,,第二不利于整個創(chuàng)新的生態(tài),。
問:表面看起來,,大廠有很多優(yōu)勢,。
王晟:我覺得沒有什么優(yōu)勢,。
問:他們會講,有云計算,、人才,、資源。
王晟:熊彼特講創(chuàng)新,其實不是顛覆式創(chuàng)新,,而是創(chuàng)造性破壞,。創(chuàng)新會對舊勢力造成沉重打擊,,所有不創(chuàng)新的企業(yè)都會被破壞掉,而大廠就代表舊勢力,、舊的生產力,、舊的范式,,創(chuàng)新本身就是要顛覆他們的,。大廠愿意做的都是當一個東西看起來成熟時,,跳出來搶奪勝利果實,。漸進式創(chuàng)新,、無法形成特定壁壘的項目,很容易被大廠打擊,,爆發(fā)式創(chuàng)新,、具有飛輪效應的項目,只要飛輪轉動起來,,大廠就很難將它干掉,。
問:你覺得這一波AI跟上一輪最大的區(qū)別是什么?
王晟:大模型,。過去的小模型不會帶來泛化的智能,,只能在特定場景表現(xiàn)不錯,現(xiàn)在我們已經(jīng)看到了大模型的涌現(xiàn),,而且過去的語言任務是理解式,現(xiàn)在是生成式,,它能做的事情會更多,。
問:差異怎么體現(xiàn)?
王晟:我們經(jīng)常開玩笑,人類能感知,,動物也能,,而且不比我們差,但動物能做的事就很少,。只有是生成式,,才會像人類產生巨大的,、更復雜,、更多元化的經(jīng)濟活動,。
問:垂直模型是偽命題嗎,?有人認為數(shù)據(jù)太少就不會有智能涌現(xiàn),。
王晟:其實大語言模型已經(jīng)有很多數(shù)據(jù)了,再給它很少的數(shù)據(jù)也能涌現(xiàn),,就像一個受過非常多教育的人能觸類旁通,,因為底座太強大。更重要的其實是,,大模型應該深入到工作流中去,,讓AI變成工作的人,而不只是一個聊天機器人,。只有AI進入工作流,,它才在行業(yè)里有價值,這就是Agent要做的事,。
問:大模型的競爭,是不是已經(jīng)不再可能會有新的團隊出現(xiàn)并擠進頭部陣營,?
王晟:目前看不太可能,。
問:現(xiàn)有的玩家你更看好誰?
王晟:現(xiàn)有的幾家各有特色,,而他們其實代表了不同的探索方向,,現(xiàn)在贏就變成了一個更復雜的事兒,長期還是要看誰真正挖到了需求,。
問:黃仁勛和馬斯克都提到,會在2029年之前看到AGI(通用人工智能)。你的預測偏樂觀還是偏保守,?
王晟:我覺得沒戲,。從大的范式上來看,,有人相信基于transformer就能實現(xiàn)AGI,但transformer存在一個悖論,,它做復雜的事情容易,,做簡單的事情有時候很困難。我覺得有一些其他范式也有機會,,比如基于強化學習的具身智能,,以及全腦計算。
問:接下來你覺得哪些領域可能會出現(xiàn)爆款應用,?
王晟:多模態(tài)大模型,、生成式視頻、Agent,。
問:現(xiàn)在這一波AI創(chuàng)業(yè),,創(chuàng)業(yè)者如果不懂技術,是不是就沒什么機會,?
王晟:那就等幾年?,F(xiàn)在這個新舊范式轉移的階段是屬于技術高手的,等底層的創(chuàng)新都做完了,,創(chuàng)新做成平臺化,,會需要產品高手和運營高手,那才是新一波大眾可以參與的時候,。
問:作為投資人你是怎么學習的,?如何獲取信息?
王晟:除了常規(guī)的信息渠道,,我覺得還是得跟厲害的人交流,,這樣能提升認知。另外投資是一個非常復雜的綜合性的系統(tǒng),,不是說我投AI就只學AI,,它還涉及到很多交叉學科的知識,比如我會看腦科學,、行為學的東西,,一個廣泛的知識體系還是挺重要的。
免責聲明:本文來自網(wǎng)絡收錄或投稿,,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,版權歸原作者所有,。轉載請注明出處:http://lequren.com/1088532.html
溫馨提示:投資有風險,,入市須謹慎。本資訊不作為投資理財建議,。