【導(dǎo)讀】中國(guó)工程院院士李國(guó)杰認(rèn)為,,DeepSeek的橫空出世,是世界第三波人工智能浪潮中新的標(biāo)志性事件
中國(guó)基金報(bào)記者 尹振茂
2025年1月27日至2月12日,,Wind DeepSeek指數(shù)(1月26日發(fā)布)7個(gè)交易日暴漲58.29%,,DeepSeek概念股并行科技同期暴漲234.73%。
DeepSeek指數(shù)和相關(guān)個(gè)股股價(jià)狂飆的背后,,是AI(人工智能)大模型公司DeepSeek的橫空出世,,不僅震撼了美國(guó),,引發(fā)美國(guó)AI芯片巨頭英偉達(dá)股價(jià)單日暴跌17%,同時(shí)也震撼了全球,。
2023年4月,,在美國(guó)OpenAI推出ChatGPT3.5大模型引發(fā)人工智能熱之后,中國(guó)基金報(bào)記者曾專(zhuān)訪了中國(guó)工程院院士,、前中國(guó)科學(xué)院計(jì)算技術(shù)研究所所長(zhǎng),、時(shí)任中科曙光董事長(zhǎng)李國(guó)杰(參閱《徹底火了,暴漲60%,!李國(guó)杰最新研判》),。
李國(guó)杰當(dāng)時(shí)指出,因?yàn)閺V泛的滲透性,,人工智能將成為21世紀(jì)起決定性作用的技術(shù),,未來(lái)幾年一定會(huì)出現(xiàn)新的標(biāo)志性事件。
近日,,中國(guó)基金報(bào)記者再次專(zhuān)訪中國(guó)工程院院士李國(guó)杰,,請(qǐng)他詳細(xì)闡釋了DeepSeek為什么會(huì)震撼全球。
在此次專(zhuān)訪中,,李國(guó)杰表示,,DeepSeek的橫空出世,是世界第三波人工智能浪潮中新的標(biāo)志性事件,,可以和2023年初OpenAI發(fā)布ChatGPT3.5相媲美,。DeepSeek推出的V3和R1模型既是技術(shù)上的重大突破,也是發(fā)展模式上的顛覆性創(chuàng)新,。
DeepSeek帶來(lái)的最大“震撼”,,是闖出了一條發(fā)展人工智能的新路,中國(guó)從“追趕者”變?yōu)椤耙?guī)則改寫(xiě)者”,,第一次在核心技術(shù)領(lǐng)域以顛覆性創(chuàng)新而非規(guī)模優(yōu)勢(shì)挑戰(zhàn)西方霸權(quán),。
在李國(guó)杰看來(lái),DeepSeek的崛起動(dòng)搖了硅谷與華爾街的基本信念,,其對(duì)美國(guó)AI巨頭的沖擊不是短期的,,而是中長(zhǎng)期的。這種沖擊堪比1957年蘇聯(lián)衛(wèi)星上天的“斯普特尼克時(shí)刻”,迫使美國(guó)重新審視其技術(shù)霸權(quán)的基礎(chǔ),。
李國(guó)杰指出,,DeepSeek不僅是技術(shù)突破者,更是規(guī)則重構(gòu)者,。DeepSeek的崛起說(shuō)明AI不再是簡(jiǎn)單堆砌算力的暴力游戲,,而是進(jìn)入了以算法和模型架構(gòu)優(yōu)化為主,同時(shí)高度重視數(shù)據(jù)質(zhì)量與規(guī)模,、理性提高算力的新時(shí)期,。DeepSeek的開(kāi)源戰(zhàn)略將向歷史證明:在這場(chǎng)AI競(jìng)賽中,誰(shuí)擁抱開(kāi)源,,誰(shuí)就能贏得未來(lái),。
李國(guó)杰認(rèn)為,中國(guó)人工智能企業(yè)正在重構(gòu)全球AI供應(yīng)鏈版圖,。就整個(gè)人工智能領(lǐng)域而言,在有些研究方向上中國(guó)還在跟跑,,但在推理模型等許多方向上,,中國(guó)和美國(guó)已經(jīng)處于你追我趕的并跑狀態(tài)。在人工智能賽道上,,中國(guó)不止DeepSeek一家,,而是有一批創(chuàng)新型科技企業(yè)進(jìn)入全球第一梯隊(duì)。
不過(guò),,李國(guó)杰也強(qiáng)調(diào),,DeepSeek的成功并沒(méi)有否定算力在人工智能發(fā)展中的關(guān)鍵作用。實(shí)際上,,由于用于推理的設(shè)備比訓(xùn)練設(shè)備多得多,,推理所需要的算力將來(lái)會(huì)成為主要需求。不論是算力,、數(shù)據(jù)還是算法,,中國(guó)與美國(guó)仍然有差距。要打贏這場(chǎng)事關(guān)國(guó)運(yùn)的科技戰(zhàn),,還要做長(zhǎng)期的艱苦努力,。
以下是此次專(zhuān)訪全文:
中國(guó)基金報(bào):DeepSeek的橫空出世,是否可以和2023年初OpenAI的ChatGPT3.5類(lèi)比,?是否是世界人工智能發(fā)展史上新的標(biāo)志性事件,?如果是的話(huà),其標(biāo)志性意義是源于技術(shù)上的突破,,還是發(fā)展模式上的創(chuàng)新,?
李國(guó)杰:DeepSeek的橫空出世是世界人工智能發(fā)展史上新的標(biāo)志性事件,可以和2023年初OpenAI發(fā)布ChatGPT3.5相媲美,。DeepSeek推出的V3和R1模型既是技術(shù)上的重大突破,,也是發(fā)展模式上的顛覆性創(chuàng)新,。
有人說(shuō)ChatGPT是“0到1”的突破,而DeepSeek只是“1到N”的擴(kuò)展,,這種看法不符合人工智能發(fā)展的歷史軌跡,。人工智能不同于物理學(xué)等基礎(chǔ)理論研究,物理學(xué)中的牛頓定律和愛(ài)因斯坦發(fā)現(xiàn)的相對(duì)論是“0到1”的突破,。但人工智能是一個(gè)沒(méi)有嚴(yán)格定義的研究領(lǐng)域,,沒(méi)有智能和不智能的“0”和“1”的界限,只有智能化水平不斷提高的發(fā)展過(guò)程,。
從1943年提出神經(jīng)元計(jì)算模型以來(lái),,人工智能經(jīng)歷了漫長(zhǎng)的探索過(guò)程?;谏窠?jīng)網(wǎng)絡(luò)模型的第三波人工智能浪潮已經(jīng)出現(xiàn)好幾次里程碑式的重大事件,。
2012年在ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽上,Hinton等人研制的AlexNet卷積神經(jīng)網(wǎng)絡(luò)取得了顯著成功,,這可以看作第三波人工智能浪潮的起點(diǎn),。
2016年DeepMind研制的AlphaGo圍棋程序戰(zhàn)勝世界冠軍李世石和柯潔,引起了全世界的關(guān)注,。
2017年Google的7名人員提出Transformer模型,,提出自注意力機(jī)制,成為深度學(xué)習(xí)的主流模型,。
2018年DeepMind發(fā)布了AlphaFold,,在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)中展示出驚人的預(yù)測(cè)能力,開(kāi)辟了AI for science的新方向,。
2023年OpenAI發(fā)布ChatGPT3.5,,引領(lǐng)了以大語(yǔ)言模型(LLM)為標(biāo)志的生成式人工智能新浪潮。
DeepSeek的橫空出世與上述重大事件一樣,,都是第三波人工智能浪潮的里程碑事件,。
為什么說(shuō)DeepSeek發(fā)布V3和R1模型是與OpenAI發(fā)布ChatGPT 3.5一樣的里程碑事件?
從DeepSeek發(fā)布后用戶(hù)和大企業(yè)的狂熱接納情形,,可以看出其巨大影響力,。ChatGPT發(fā)布后兩個(gè)月用戶(hù)就達(dá)到1億,全球?yàn)橹@嘆,。2025年1月20日,,DeepSeek-R1發(fā)布上線,在沒(méi)有任何廣告投放情況下,,7天之內(nèi)用戶(hù)增長(zhǎng)超過(guò)1億,,創(chuàng)造了用戶(hù)增長(zhǎng)速度新的世界紀(jì)錄。DeepSeek在蘋(píng)果應(yīng)用商店的下載量占據(jù)了157個(gè)國(guó)家/地區(qū)的第一名位置(包括美國(guó)),在相同時(shí)間段超過(guò)ChatGPT首次發(fā)布時(shí)的下載量,。
GitHub是全球最大的代碼托管網(wǎng)站,,GitHub的星(Star)數(shù)?(即GitHub平臺(tái)項(xiàng)目頁(yè)面上的Star按鈕被用戶(hù)主動(dòng)點(diǎn)擊的次數(shù)),代表項(xiàng)目受歡迎的程度和社區(qū)的認(rèn)可度,。目前,,DeepSeek的GitHub星數(shù)已超越了OpenAI。
全球人工智能的龍頭企業(yè)紛紛擁抱DeepSeek,,也凸顯了其不可抗拒的影響力,。微軟最早宣布將DeepSeek-R1模型添加到云平臺(tái)Azure AI Foundry,開(kāi)發(fā)者可用于構(gòu)建基于云的應(yīng)用程序和服務(wù),。接著,,AWS(亞馬遜云科技)、英偉達(dá),、AMD等公司相繼宣布在其AI服務(wù)平臺(tái)上部署DeepSeek-R1模型,。
不管相關(guān)勢(shì)力如何抵制,少數(shù)媒體如何惡意中傷,,公司和用戶(hù)都是根據(jù)DeepSeek的實(shí)際效果和親身體驗(yàn)做出選擇,,DeepSeek推出的高效率、低成本的推理模型和開(kāi)源的商業(yè)模式,,必將引領(lǐng)人工智能行業(yè)新潮流。
DeepSeek的V3和R1模型廣受歡迎,,是因?yàn)樵谀P退惴ê拖到y(tǒng)軟件層次都有重大創(chuàng)新,。
首先是算法層次的創(chuàng)新,DeepSeek采用了新的混合專(zhuān)家架構(gòu)(MoE),,每一層有256個(gè)路由專(zhuān)家和1個(gè)共享專(zhuān)家,。在每次前向傳播過(guò)程中,只激活一小部分專(zhuān)家來(lái)進(jìn)行計(jì)算,。雖然DeepSeek-V3是一個(gè)671B參數(shù)的大模型,,但模型的任何函數(shù)調(diào)用和傳遞只使用約37B參數(shù),使其訓(xùn)練成本大為降低,。
在算法層面,,DeepSeek還有一個(gè)降低成本的重大創(chuàng)新,即低秩注意力機(jī)制(也稱(chēng)為多頭潛在注意力機(jī)制),。這一發(fā)明對(duì)巨大的注意力機(jī)制矩陣進(jìn)行了壓縮,,減少參與運(yùn)算的參數(shù)數(shù)量,把顯存占用降到了其他大模型的5%~13%,,極大提升了模型運(yùn)行效率,。
DeepSeek更重要的創(chuàng)新是在推理層面。OpenAI發(fā)布的o1推理模型是閉源的,其他的企業(yè)都搞不清楚OpenAI是如何基于預(yù)訓(xùn)練模型構(gòu)建推理模型的,。通過(guò)開(kāi)源方式,,DeepSeek把實(shí)現(xiàn)低成本推理的奧秘告訴全世界,為發(fā)展推理模型開(kāi)辟了一條新路,。DeepSeek揭示了一個(gè)事實(shí),,即推理模型的開(kāi)發(fā)比想象中更為簡(jiǎn)單,各行各業(yè)都可以做,。
傳統(tǒng)的強(qiáng)化學(xué)習(xí)需要大量標(biāo)注數(shù)據(jù),,成本很高。DeepSeek另辟蹊徑,,采用全自動(dòng)的強(qiáng)化學(xué)習(xí)取代監(jiān)督微調(diào)和基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)(RLHF),,用機(jī)器直接推測(cè)的方式來(lái)預(yù)測(cè)分?jǐn)?shù),顯著提高了強(qiáng)化學(xué)習(xí)的效率,。
與DeepMind和OpenAI一樣,,DeepSeek的貢獻(xiàn)主要還是工程創(chuàng)新和優(yōu)化,在人工智能的基礎(chǔ)理論上并沒(méi)有重大突破,。但這些創(chuàng)新大大降低了推理成本,,打破了對(duì)高算力的迷信,對(duì)人工智能產(chǎn)業(yè)的發(fā)展有重大意義,。
DeepSeek的科技震撼波及全球
中國(guó)基金報(bào):2月3日,,中國(guó)醫(yī)學(xué)科學(xué)院學(xué)部委員、生物學(xué)家饒毅發(fā)表了題為《鴉片戰(zhàn)爭(zhēng)以來(lái),,中國(guó)對(duì)人類(lèi)最大的科技震撼:DeepSeek》的文章,,認(rèn)為“1840年至今的185年來(lái),在科學(xué)和技術(shù)相關(guān)的方面,,中國(guó)出現(xiàn)的對(duì)人類(lèi)最大的震撼是DeepSeek”,。饒毅教授對(duì)DeepSeek的評(píng)價(jià)是否過(guò)于夸張?
李國(guó)杰:饒毅教授稱(chēng)“DeepSeek是鴉片戰(zhàn)爭(zhēng)以來(lái)中國(guó)對(duì)全世界最大的科技震撼”,,我認(rèn)為,,這一評(píng)價(jià)有一定的道理,并非夸張,。中國(guó)在航天,、高鐵等領(lǐng)域都取得過(guò)震驚世界的科技成就,大疆無(wú)人機(jī),、宇樹(shù)機(jī)器人在全球的市場(chǎng)占有率高達(dá)60%以上,,但這些成就并沒(méi)有引起全球性的科技震撼。
DeepSeek掀起這么大的沖擊波,,是美國(guó)政府和一些龍頭企業(yè)妄圖以人工智能獨(dú)霸全球夢(mèng)想破滅造成的,。特朗普上臺(tái)第二天就簽署法案,,啟動(dòng)星際之門(mén)計(jì)劃,要投資5000億美元,,打造人工智能的基礎(chǔ)設(shè)施,。可見(jiàn),,美國(guó)政府把人工智能當(dāng)成美國(guó)稱(chēng)霸世界的頭等大事,。
DeepSeek帶來(lái)的最大“震撼”,是從中國(guó)杭州殺出一匹黑馬,,闖出一條發(fā)展人工智能的新路,,中國(guó)從“追趕者”變?yōu)椤耙?guī)則改寫(xiě)者”,第一次在核心技術(shù)領(lǐng)域以顛覆性創(chuàng)新而非規(guī)模優(yōu)勢(shì)挑戰(zhàn)西方霸權(quán),。
DeepSeek在模型算法和工程優(yōu)化方面所進(jìn)行的系統(tǒng)級(jí)創(chuàng)新,,為在受限資源下探索通用人工智能開(kāi)辟了新的道路。傳統(tǒng)大模型遵循的是一條“由通到專(zhuān)”的人工智能發(fā)展思路,,與之相反,,DeepSeek追求的是“由專(zhuān)到通”的人工智能發(fā)展路徑,通過(guò)引領(lǐng)人工智能技術(shù)生態(tài)的形成,,邁向全社會(huì)分享的通用人工智能之路,。
雖然以O(shè)penAI為代表的生成式人工智能紅紅火火,但多數(shù)企業(yè)不敢將自己的數(shù)據(jù)交給私有AI平臺(tái)生成自己的垂直模型,,因?yàn)楹ε绿峤坏臄?shù)據(jù)會(huì)泄露自己的技術(shù)機(jī)密,。人工智能之所以在各個(gè)行業(yè)難以落地,這可能是一個(gè)根本性的原因,。
DeepSeek的出現(xiàn)化解了這一難題,。歐洲、印度等國(guó)人工智能的發(fā)展一直落后于美國(guó)和中國(guó),,現(xiàn)在可以將DeepSeek提供的小而精的模型下載到本地,即使斷網(wǎng)也可以“蒸餾”出高效率的垂直模型,,這讓他們看到了希望,。也就是說(shuō),DeepSeek的科技震撼,,不僅僅是對(duì)美國(guó),,也是對(duì)全球的震撼。
人工智能不同于資本密集型和經(jīng)驗(yàn)積累型的集成電路產(chǎn)業(yè),,不僅要“燒錢(qián)”,,更要“燒腦”,本質(zhì)上是比拼人的智力的新興產(chǎn)業(yè),。因此,,人工智能產(chǎn)業(yè)具有明顯的不對(duì)稱(chēng)性,,一個(gè)具有100多個(gè)聰明頭腦的小企業(yè)就可以挑戰(zhàn)市值上萬(wàn)億美元的龍頭企業(yè)。
DeepSeek給全球的震撼具有顛覆性,,但DeepSeek只是中國(guó)具有潛力的人工智能企業(yè)之一,。
近日,《麻省理工科技評(píng)論》刊發(fā)了一篇題為《關(guān)注DeepSeek之外的四家中國(guó)人工智能初創(chuàng)公司》的報(bào)道,,指出階躍星辰(Stepfun),、面壁智能(Model Best)、智譜AI,、無(wú)問(wèn)芯穹(Infinigence AI)四家企業(yè)同樣展現(xiàn)出不遜于DeepSeek的技術(shù)實(shí)力與全球競(jìng)爭(zhēng)力,。
中國(guó)人工智能企業(yè)的崛起,正在重構(gòu)全球AI供應(yīng)鏈版圖,;開(kāi)源模型將基礎(chǔ)模型層轉(zhuǎn)化為普惠資源,,正在為應(yīng)用開(kāi)發(fā)者開(kāi)啟創(chuàng)新之門(mén);算法革命正在大幅度降低訓(xùn)練成本,,打破了單一依賴(lài)算力堆砌的迷信,。
中國(guó)基金報(bào):DeepSeek的巨大影響是否預(yù)示規(guī)模法則(Scaling Law)已經(jīng)走到盡頭?“大力出奇跡”的技術(shù)路線是否還能延續(xù),?算力究竟在人工智能的發(fā)展中起什么作用,?
李國(guó)杰:2020年1月,OpenAI發(fā)表論文《神經(jīng)語(yǔ)言模型的規(guī)模法則》(Scaling Laws forNeural Language Models),,提出規(guī)模法則:“通過(guò)增加模型規(guī)模,、數(shù)據(jù)量和計(jì)算資源,可以顯著提升模型性能,?!?/strong>
在AI領(lǐng)域,規(guī)模法則被認(rèn)為是“公理”,,俗稱(chēng)“大力出奇跡”,,OpenAI等龍頭企業(yè)和美國(guó)的AI投資界把它當(dāng)成制勝法寶。
但是,,規(guī)模法則不是像牛頓定律一樣經(jīng)過(guò)無(wú)數(shù)次驗(yàn)證的科學(xué)定律,,而是OpenAI等公司近幾年研制大模型的經(jīng)驗(yàn)歸納。從科學(xué)研究的角度看,,屬于一種對(duì)技術(shù)發(fā)展趨勢(shì)的猜想,;從投資的角度看,屬于對(duì)某種技術(shù)路線的押注,。人工智能是對(duì)未來(lái)技術(shù)的探索,,技術(shù)路線存在多種可能。人工智能本身也存在多元化的目標(biāo),,探索的道路上有很多高山需要去攀登,,攀登一座高山的路徑也不止一條,。把一種信仰或猜想當(dāng)成科學(xué)公理,不是科學(xué)的態(tài)度,。
鼓吹規(guī)模法則的人,,常常以強(qiáng)化學(xué)習(xí)之父理查德·薩頓(Richard S. Sutton)的文章“苦澀的教訓(xùn)”作為追求高算力的依據(jù):“研究人員曾一次又一次試圖通過(guò)精巧的工程設(shè)計(jì)來(lái)提升性能,但最終都敗給了簡(jiǎn)單粗暴的‘加大算力’方案,,歷史證明,,通用方法總是在AI領(lǐng)域勝出?!?/strong>
但是,,薩頓本人這兩年對(duì)規(guī)模法則做了深刻的反思。他指出,,雖然規(guī)模法則在提升模型性能方面確實(shí)有效,,但它并不是解決所有問(wèn)題的萬(wàn)能鑰匙。AI系統(tǒng)不僅需要具備強(qiáng)大的計(jì)算能力,,還需要具備持續(xù)學(xué)習(xí),、適應(yīng)環(huán)境、理解復(fù)雜情境等能力,,這些能力往往難以通過(guò)簡(jiǎn)單地增加算力來(lái)實(shí)現(xiàn),。
但現(xiàn)在就說(shuō)規(guī)模法則已經(jīng)走到盡頭,也沒(méi)有根據(jù),。與人腦的神經(jīng)連接復(fù)雜性相比,,現(xiàn)在的人工神經(jīng)網(wǎng)絡(luò)至少還有上百倍的差距。繼續(xù)擴(kuò)大神經(jīng)網(wǎng)絡(luò)的規(guī)模和增加訓(xùn)練的數(shù)據(jù)量,,是否能取得與投入相稱(chēng)的回報(bào),,還要看今后的實(shí)際效果。
但GPT-5遲遲不能問(wèn)世,,可能說(shuō)明規(guī)模擴(kuò)張的效果已經(jīng)不太明顯,。圖靈獎(jiǎng)得主楊立昆(YannLeCun)和OpenAI前首席科學(xué)家伊利亞·蘇茨克維(IlyaSutskever)等人直言,規(guī)模法則已觸及天花板,。
DeepSeek的出現(xiàn),,逼迫AI界嚴(yán)肅地思考這一技術(shù)發(fā)展路線問(wèn)題:是繼續(xù)燒錢(qián)豪賭,還是另辟蹊徑,,在算法優(yōu)化上下更多功夫?
DeepSeek的成功似乎預(yù)示著“小力也可出奇跡”,,或者說(shuō)“算法和模型架構(gòu)優(yōu)化也可以出奇跡”,。隨著時(shí)間的推移,AI擴(kuò)展方法也在發(fā)生變化:最初是模型規(guī)模,,后來(lái)是數(shù)據(jù)集大小和數(shù)據(jù)質(zhì)量,,現(xiàn)在是推理時(shí)間和合成數(shù)據(jù),。
DeepSeek推出的V3是預(yù)訓(xùn)練模型,R1是推理模型,,對(duì)全球沖擊比較大的主要是R1模型,,某種意義上是把人工智能的關(guān)注重點(diǎn)轉(zhuǎn)移到推理計(jì)算上。所謂規(guī)模法則也可以表現(xiàn)為在探索推理時(shí)間的擴(kuò)展行為,,即模型在推理階段(而非訓(xùn)練階段)通過(guò)增加計(jì)算資源來(lái)提升性能,。
DeepSeek的成功并沒(méi)有否定算力在人工智能發(fā)展中的關(guān)鍵作用。實(shí)際上,,由于用于推理的設(shè)備比訓(xùn)練設(shè)備多得多,,所以推理所需要的算力將來(lái)會(huì)成為主要需求。通過(guò)算法優(yōu)化提高模型的效率十分重要,,走節(jié)省算力的綠色發(fā)展之路是我們的基本選擇,,但算力肯定是解決人工智能問(wèn)題的必要條件,也不可忽視,。
中國(guó)基金報(bào):為什么DeepSeek對(duì)英偉達(dá)的股價(jià)會(huì)產(chǎn)生這么大的沖擊,?這種沖擊是短期還是中長(zhǎng)期的,背后的深層邏輯是什么,?
李國(guó)杰:第三波人工智能浪潮興起以來(lái),,美國(guó)政府和投資界形成的基本信念是:發(fā)展人工智能需要高算力,而目前實(shí)現(xiàn)人工智能計(jì)算性能最高的芯片就是英偉達(dá)的GPU,。因此,,只要控制GPU,美國(guó)就能在人工智能領(lǐng)域獨(dú)霸全球,。
DeepSeek的崛起動(dòng)搖了硅谷與華爾街的基本信念,。由于市場(chǎng)對(duì)高端GPU芯片需求下降的擔(dān)憂(yōu),英偉達(dá)股價(jià)單日暴跌17%,,市值縮水約6000億美元,,創(chuàng)下美國(guó)上市公司單日最大損失紀(jì)錄。
這種沖擊堪比1957年蘇聯(lián)衛(wèi)星上天的“斯普特尼克時(shí)刻”,,迫使美國(guó)重新審視其技術(shù)霸權(quán)的基礎(chǔ),。
但DeepSeek是否會(huì)真正降低對(duì)算力的需求,現(xiàn)在還不能下結(jié)論,。
1865年,,經(jīng)濟(jì)學(xué)家杰文斯提出了一個(gè)關(guān)于技術(shù)進(jìn)步的悖論:“當(dāng)技術(shù)進(jìn)步提高了效率,資源消耗不僅沒(méi)有減少,,反而激增,。”福特的流水線讓汽車(chē)制造更快,、更便宜,,但最終帶來(lái)的卻是全球石油消耗的暴漲,。有時(shí),單個(gè)產(chǎn)品越便宜,,反而會(huì)刺激整體采購(gòu)量增加,。人類(lèi)對(duì)智能產(chǎn)品的需求肯定會(huì)持續(xù)增加,即便單個(gè)產(chǎn)品算力成本下降,,整個(gè)社會(huì)的算力消耗可能還會(huì)增加,。
DeepSeek對(duì)“高投入、高算力”的研發(fā)路徑會(huì)產(chǎn)生一定沖擊,,有些正在部署的智能計(jì)算中心猶豫觀望,,部分AI上游算力市場(chǎng)可能會(huì)受到一定負(fù)面影響,美股科技巨頭的超額估值可能會(huì)下調(diào),。
但另一方面,,DeepSeek模型的低成本優(yōu)勢(shì)有利于AI下游應(yīng)用場(chǎng)景的快速落地,有助于加速相關(guān)產(chǎn)業(yè)的智能化進(jìn)程,,為機(jī)器人,、自動(dòng)駕駛汽車(chē)、智慧城市,、智能辦公,、消費(fèi)電子等下游板塊帶來(lái)利好。
DeepSeek將AI的應(yīng)用引向C端市場(chǎng),,更多企業(yè)和普通用戶(hù)都會(huì)成為AI的消費(fèi)者,,計(jì)算資源的需求也會(huì)隨之水漲船高。
DeepSeek對(duì)美國(guó)AI巨頭的沖擊不是短期的,,隨著博弈的進(jìn)一步發(fā)展,,一定會(huì)對(duì)其產(chǎn)生中長(zhǎng)期的影響。因?yàn)锳I應(yīng)用對(duì)高端GPU需求降低,,讓更多的芯片和整機(jī)企業(yè)參與競(jìng)爭(zhēng),,人工智能新增的市場(chǎng)最后花落誰(shuí)家,現(xiàn)在還很難斷定,。中國(guó)企業(yè)更有希望在AI市場(chǎng)上占有一席之地,。DeepSeek明顯提振了國(guó)內(nèi)企業(yè)自立自強(qiáng)的信心,民族自信心的增強(qiáng)將為A股市場(chǎng)注入新的活力,。
中國(guó)基金報(bào):對(duì)于DeepSeek的橫空出世,,有人認(rèn)為是國(guó)運(yùn)級(jí)別的創(chuàng)新,也有人認(rèn)為不過(guò)是一場(chǎng)新的鬧劇,,將曇花一現(xiàn),。對(duì)此,你怎么看?DeepSeek在何種程度上影響了全球人工智能的發(fā)展,,其代表的AI大模型是否將成為市場(chǎng)主流?如果不是的話(huà),,何種類(lèi)型的AI大模型將成為市場(chǎng)主流,?
李國(guó)杰:DeepSeek崛起的背后是中美兩國(guó)的科技博弈,絕不是一場(chǎng)曇花一現(xiàn)的鬧劇,。但將一家小公司提上政治高度,,推到大國(guó)博弈的前線,背上“國(guó)運(yùn)級(jí)別創(chuàng)新”的沉重十字架,,對(duì)初創(chuàng)公司的發(fā)展沒(méi)有好處,。
DeepSeek對(duì)全球人工智能發(fā)展有里程碑式的意義,其主要的價(jià)值是打破了“高算力和高投入是發(fā)展人工智能唯一途徑”和“集成電路制程優(yōu)勢(shì)=人工智能技術(shù)霸權(quán)”的迷信,,增強(qiáng)了人工智能業(yè)界走開(kāi)源道路的信心,。用開(kāi)源將AI入場(chǎng)券“平民化”,促進(jìn)AI在各個(gè)國(guó)家,、眾多行業(yè)的應(yīng)用和創(chuàng)新,。
DeepSeek不僅是技術(shù)突破者,更是規(guī)則重構(gòu)者,,對(duì)中國(guó)實(shí)現(xiàn)科技突圍具有重要的啟示作用,。DeepSeek的崛起說(shuō)明,AI不再是簡(jiǎn)單堆砌算力的暴力游戲,,而是進(jìn)入了以算法和模型架構(gòu)優(yōu)化為主,,同時(shí)高度重視數(shù)據(jù)質(zhì)量與規(guī)模、理性提高算力的新時(shí)期,。
由于美國(guó)政府的封鎖,,目前我國(guó)無(wú)法獲取最先進(jìn)的芯片制程工藝,可能會(huì)落后國(guó)外兩代以上,。DeepSeek給我們的啟示是,,我們需要在有限算力條件下,通過(guò)算法和軟件的協(xié)同創(chuàng)新,,充分發(fā)揮硬件的極致性能,,挖掘所有可能的優(yōu)化空間。DeepSeek R1發(fā)布以后,,華為,、海光、龍芯等芯片設(shè)計(jì)公司迅速和DeepSeekR1綁定,,推出在各個(gè)行業(yè)實(shí)用的推理平臺(tái),,DeepSeek也接入了國(guó)家超算互聯(lián)網(wǎng)。我國(guó)的算力資源巨大,國(guó)內(nèi)的人工智能模型與美國(guó)的水平十分接近,,幾乎并駕齊驅(qū),,只要做好算力資源與人工智能平臺(tái)的優(yōu)化適配,我國(guó)的人工智能科研和應(yīng)用一定會(huì)走在世界前列,。
DeepSeek是一家成立不到兩年的小公司,,全球人工智能的賽道上有很多公司在你追我趕。一家公司一時(shí)的技術(shù)領(lǐng)先,,并不是“護(hù)城河”,,關(guān)鍵是看發(fā)展的速度快不快。
總體來(lái)看,,人工智能還處在發(fā)展初期,,現(xiàn)在就斷定哪一種人工智能大模型是市場(chǎng)主流,還為時(shí)過(guò)早,。只要我國(guó)有一批創(chuàng)新企業(yè)像DeepSeek那樣,,堅(jiān)持做引領(lǐng)性的科研而不是跟隨,中國(guó)對(duì)形成人工智能的主流模型一定會(huì)做出與國(guó)力相稱(chēng)的貢獻(xiàn),。
中國(guó)基金報(bào):2023年4月,,你在接受我們專(zhuān)訪時(shí)曾表示,中國(guó)要走低成本的人工智能發(fā)展之路,,人工智能界需要“晶體管”式的重大發(fā)明,,才能使大模型走上良性發(fā)展之路。那么,,DeepSeek是否已經(jīng)探索出了一條低成本的人工智能發(fā)展之路,?人工智能界的“晶體管”式的重大發(fā)明是否已經(jīng)可以看到希望的曙光?
李國(guó)杰:低成本是技術(shù)普及的基本要求,,蒸汽機(jī),、電力和計(jì)算機(jī)的普及都是其成本降低到大眾可以接受時(shí)才做到的,人工智能肯定也會(huì)走這條路,。
目前,,人工智能產(chǎn)業(yè)的成本還很高,主要表現(xiàn)在算力資源,、數(shù)據(jù)獲取與處理,、算法研發(fā)的人才門(mén)檻和人工智能系統(tǒng)部署維護(hù)的復(fù)雜性等。為了降低人工智能的成本,,企業(yè)界和科技界已經(jīng)做了大量的努力,,包括優(yōu)化算力體系、高效模型架構(gòu),、建設(shè)開(kāi)源生態(tài)等,。這幾年,人工智能成本已經(jīng)有了數(shù)量級(jí)的下降,但人工智能要做到大規(guī)模普及,,還需要更大幅度降低成本,。
近日,華裔科學(xué)家李飛飛團(tuán)隊(duì)的研究人員,,以阿里通義千問(wèn)(Qwen)模型為基礎(chǔ),,通過(guò)蒸餾谷歌的AI推理模型Gemini 2.0 Flash Thinking Experimental,并結(jié)合監(jiān)督微調(diào)(SFT)技術(shù),,使用16個(gè)英偉達(dá)H100GPU進(jìn)行了26分鐘的訓(xùn)練,以不到50美元的云計(jì)算費(fèi)用成功訓(xùn)練出s1模型,,其性能超過(guò)了Open AI的o1-preview模型,。這種創(chuàng)新的訓(xùn)練方法以令人吃驚的低成本,做到了與高端模型相媲美的性能,,顯示出人工智能的低成本化還有巨大的提升空間,,為人工智能領(lǐng)域帶來(lái)新的發(fā)展思路。
我們?cè)跒橥评砟P偷牡统杀净瘹g欣鼓舞時(shí),,應(yīng)注意到一個(gè)事實(shí),,那就是目前推理模型的低成本是以預(yù)訓(xùn)練模型(基礎(chǔ)模型)的高成本為前提。我們真正追求的不是人工智能某些步驟的低成本,,而是整體的低成本,,但要實(shí)現(xiàn)這個(gè)目標(biāo)還要走很長(zhǎng)的路。
電子計(jì)算機(jī)剛問(wèn)世的時(shí)候采用真空電子管,,難以實(shí)現(xiàn)低成本,。1947年發(fā)明了晶體管,1958年發(fā)明了集成電路,。在摩爾定律的推動(dòng)下,,集成電路的集成度飛速提高。現(xiàn)在最高性能的GPU包含2080億個(gè)晶體管,,相當(dāng)于1美元可以買(mǎi)到500多萬(wàn)個(gè)晶體管,,單個(gè)晶體管的成本已下降了上千萬(wàn)倍。晶體管成本的急速下降為人類(lèi)的信息化做出了不可磨滅的貢獻(xiàn),。
所以,,我曾經(jīng)說(shuō)過(guò),人工智能界需要“晶體管”式的重大發(fā)明,,才能使大模型走上良性發(fā)展之路,。DeepSeek為探索低成本的人工智能發(fā)展之路做出了重要貢獻(xiàn),但人工智能界的“晶體管”式的重大發(fā)明目前還沒(méi)有看到苗頭,。偉大的發(fā)現(xiàn)從來(lái)不出自計(jì)劃,,說(shuō)不定哪一天會(huì)突然冒出來(lái)。我相信,只要堅(jiān)持做原創(chuàng)性的基礎(chǔ)研究,,人工智能界類(lèi)似晶體管的重大發(fā)明一定會(huì)出現(xiàn),。
中國(guó)基金報(bào):有人認(rèn)為,DeepSeek之所以受關(guān)注,,更多是開(kāi)源和閉源路線之爭(zhēng),。對(duì)此,你怎么看,?此外,,怎么看目前全球AI大模型發(fā)展的競(jìng)爭(zhēng)格局?中國(guó)是在繼續(xù)跟跑,,還是已經(jīng)到了“并跑”狀態(tài),?
李國(guó)杰:DeepSeek推出的V3和R1模型,雖然有重大的技術(shù)突破,,但還是基于Transformer結(jié)構(gòu)的改進(jìn),,核心技術(shù)上并沒(méi)有和國(guó)外拉開(kāi)距離。過(guò)去這幾年,,開(kāi)源大模型的性能始終與龍頭企業(yè)的閉源大模型有一代以上的差距,,這一次DeepSeek的性能追上了閉源模型,大大增強(qiáng)了開(kāi)源社區(qū)的信心,,這是了不起的成就,。
圖靈獎(jiǎng)得主楊立昆認(rèn)為“對(duì)DeepSeek崛起的正確解讀,應(yīng)是開(kāi)源模型正在超越閉源模型”,。這一評(píng)價(jià)十分中肯,,因?yàn)楦淖傾I發(fā)展模式比單項(xiàng)技術(shù)的突破更重要。
長(zhǎng)期以來(lái),,美國(guó)的AI龍頭公司夸大開(kāi)源AI的安全風(fēng)險(xiǎn),,力圖通過(guò)監(jiān)管抑制開(kāi)源AI。事實(shí)上,,開(kāi)源模型對(duì)于全球AI供應(yīng)鏈至關(guān)重要,,發(fā)展中國(guó)家尤其需要開(kāi)源AI技術(shù)。若美國(guó)繼續(xù)在這一領(lǐng)域設(shè)置障礙,,中國(guó)就有望在開(kāi)源AI全球供應(yīng)鏈中占據(jù)核心地位,,從而使更多企業(yè)轉(zhuǎn)向中國(guó)企業(yè)而非美國(guó)企業(yè)的技術(shù)方案。
DeepSeek發(fā)布以后,,OpenAI的CEO Altman承認(rèn),,OpenAI過(guò)去在開(kāi)源方面一直站在“歷史錯(cuò)誤的一邊”。他表示:“需要想出一個(gè)不同的開(kāi)源策略,?!?025年1月31日,,OpenAI宣布,免費(fèi)向用戶(hù)開(kāi)放推理模型o3-Mini,,但其核心技術(shù)還是封閉的,,仍然強(qiáng)調(diào)開(kāi)源“不是我們當(dāng)前的最高優(yōu)先事項(xiàng)”。這表明,,OpenAI短期內(nèi)不會(huì)在開(kāi)源方面有實(shí)質(zhì)性的轉(zhuǎn)變,。
真正的AI競(jìng)爭(zhēng),不僅僅是技術(shù)和模型的競(jìng)爭(zhēng),,更是生態(tài)系統(tǒng),、商業(yè)模式,以及價(jià)值觀的競(jìng)爭(zhēng),。開(kāi)源模型讓AI民主化,,每個(gè)開(kāi)發(fā)者都能輕松調(diào)用強(qiáng)大AI工具,不再受大公司的約束,,AI的進(jìn)化速度將會(huì)明顯提升。DeepSeek的開(kāi)源戰(zhàn)略將向歷史證明:在這場(chǎng)AI競(jìng)賽中,,誰(shuí)擁抱開(kāi)源,,誰(shuí)就能贏得未來(lái)。
OpenAI剛發(fā)布ChatGPT的時(shí)候,,雖然中國(guó)馬上掀起“百模大戰(zhàn)”,,但大模型的實(shí)際水平存在代際差距。經(jīng)過(guò)這幾年的市場(chǎng)競(jìng)爭(zhēng)和優(yōu)勝劣汰,,中美的差距明顯縮小,。我國(guó)有好幾家優(yōu)秀的人工智能公司冒了出來(lái),大模型的性能與國(guó)外先進(jìn)水平差不多,,都屬于世界第一梯隊(duì),。
因此,就整個(gè)人工智能領(lǐng)域而言,,在有些研究方向上中國(guó)還在跟跑,,但在推理模型等許多方向上,中國(guó)和美國(guó)已經(jīng)處于你追我趕的并跑狀態(tài),。人工智能是探索未知領(lǐng)域的研究,,并沒(méi)有確定的研究方向。進(jìn)入并跑狀態(tài)以后,,就不要過(guò)于在意與美國(guó)相差幾個(gè)月,,可以你做你的、我做我的,,比誰(shuí)能發(fā)現(xiàn)正確的研究方向,。中國(guó)的人工智能人才總量比美國(guó)多,,現(xiàn)在發(fā)表的論文數(shù)、引用數(shù)和授權(quán)專(zhuān)利數(shù)都遠(yuǎn)遠(yuǎn)超過(guò)美國(guó),。但是頂尖的AI人才還是美國(guó)多,,我們?cè)谌斯ぶ悄艿难芯繉?shí)力上與美國(guó)還有一些差距??偟膩?lái)講,,要打贏這一場(chǎng)事關(guān)國(guó)運(yùn)的科技戰(zhàn),還要做長(zhǎng)期的艱苦努力,,但年輕一代正在成為科研的主力,,我們要有信心在人工智能的研究和應(yīng)用上走在美國(guó)前面。
中國(guó)基金報(bào):DeepSeek的崛起對(duì)業(yè)界有何啟發(fā),?為什么DeepSeek沒(méi)有在上?;驀?guó)內(nèi)人工智能發(fā)展的高地北京誕生?
李國(guó)杰:最近幾年,,不論是國(guó)防戰(zhàn)線還是民用領(lǐng)域,,中國(guó)的科技突破出現(xiàn)類(lèi)似噴泉的態(tài)勢(shì),轟動(dòng)全球的科研成果不斷冒出來(lái),。這些成果的出現(xiàn)不是偶然的,,而是中國(guó)的科技和經(jīng)濟(jì)發(fā)展經(jīng)過(guò)多年積累必然要走上的一個(gè)新臺(tái)階。載人航天工程,、第六代戰(zhàn)斗機(jī),、052D型導(dǎo)彈驅(qū)逐艦等與國(guó)防有關(guān)的重大成果,與DeepSeek,、宇樹(shù)機(jī)器人等創(chuàng)新型人工智能產(chǎn)品的出現(xiàn),,似乎有著不同的發(fā)展途徑,建立科技發(fā)展的新型舉國(guó)體制需要考慮兩者的區(qū)別,。
在市場(chǎng)化程度高,、技術(shù)迭代快的領(lǐng)域(如AI、生物科技等),,通過(guò)市場(chǎng)競(jìng)爭(zhēng)贏者勝出的機(jī)制可能比集中規(guī)劃的建制化研究更有效,。未來(lái)的科技政策既要支持國(guó)家隊(duì)在戰(zhàn)略安全領(lǐng)域沖鋒陷陣,同時(shí)要大力支持民間力量在充分競(jìng)爭(zhēng)中自下而上地突破技術(shù)封鎖,。人工智能領(lǐng)域的探索性很強(qiáng),,目前這一領(lǐng)域在全球起引領(lǐng)作用的不是美國(guó)和西歐的國(guó)家實(shí)驗(yàn)室,而是DeepMind和OpenAI這樣的創(chuàng)新型企業(yè),。在中國(guó),,DeepSeek這一類(lèi)創(chuàng)業(yè)公司也起到了引領(lǐng)作用。
DeepSeek的成功與其創(chuàng)始人梁文峰的人才管理路線有很大關(guān)系,。梁文峰選擇了一條與眾不同的用人策略,。他們拒絕經(jīng)驗(yàn)豐富的人才,,而選擇初出茅廬的年輕人。
DeepSeek有一條不成文的用人規(guī)則:招聘時(shí)工作經(jīng)驗(yàn)超過(guò)8年者,,直接拒聘,;超過(guò)5年,需要特別出色才能入選,。DeepSeek團(tuán)隊(duì)成員幾乎全是國(guó)內(nèi)頂尖高校的應(yīng)屆畢業(yè)生或博士實(shí)習(xí)生,。
DeepSeek相信,真正的創(chuàng)新往往來(lái)自那些沒(méi)有包袱的人,,有極致熱情的人,,而不是習(xí)慣用經(jīng)驗(yàn)找答案的人。這種用人理念為公司帶來(lái)了令人驚喜的創(chuàng)新動(dòng)力,?!?0后”和“00后”的中國(guó)年輕人是在相對(duì)充裕的物質(zhì)條件下成長(zhǎng)起來(lái)的,他們更多是為了興趣和熱愛(ài)而努力,,已經(jīng)開(kāi)始平視美西方國(guó)家,,具有“敢為天下先”的勇氣和自信。他們是中國(guó)科技自立自強(qiáng)的希望,。
作為DeepSeek的誕生地,,杭州市政府出臺(tái)了一系列鼓勵(lì)創(chuàng)新創(chuàng)業(yè)的政策。同時(shí),,杭州擁有完善的產(chǎn)業(yè)鏈配套和豐富的人才資源,為其發(fā)展提供了良好的創(chuàng)業(yè)環(huán)境,。DeepSeek出名以后,,民間流傳起關(guān)于“杭州六小龍”的故事,深度求索,、宇樹(shù)科技,、游戲科學(xué)、云深處,、群核科技,、強(qiáng)腦科技六家初創(chuàng)公司有一些共同的特點(diǎn):都由年輕科技人才創(chuàng)辦,都屬于人工智能領(lǐng)域,,都屬于民營(yíng)小微企業(yè),。這些具有世界影響的公司都出自杭州,肯定不是偶然的,,希望杭州的經(jīng)驗(yàn)?zāi)茉谄渌鞘写罅ν茝V,。
但是,我國(guó)在人工智能領(lǐng)域被全世界關(guān)注的公司不僅僅出自杭州,。上面提到的階躍星辰,、面壁智能,、智譜AI都是在北京注冊(cè)的公司,無(wú)問(wèn)芯穹來(lái)自上海,。當(dāng)這些公司和以后可能冒出來(lái)的AI公司都成為世界級(jí)的大公司時(shí),,中國(guó)無(wú)疑將成為人工智能的世界強(qiáng)國(guó)。
《中國(guó)基金報(bào)》對(duì)本平臺(tái)所刊載的原創(chuàng)內(nèi)容享有著作權(quán),未經(jīng)授權(quán)禁止轉(zhuǎn)載,,否則將追究法律責(zé)任,。
授權(quán)轉(zhuǎn)載合作聯(lián)系人:于先生(電話(huà):0755-82468670)
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1131305.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。