向日葵视频在线观看,日本真人裸交试看120秒无码人妻丰满熟妇区免费 ,欧美中文字幕在线观看

【導(dǎo)讀】中國(guó)工程院院士李國(guó)杰認(rèn)為,，DeepSeek的橫空出世,，是世界第三波人工智能浪潮中新的標(biāo)志性事件

中國(guó)基金報(bào)記者尹振茂

2025年1月27日至2月12日，Wind DeepSeek指數(shù)（1月26日發(fā)布）7個(gè)交易日暴漲58.29%,，DeepSeek概念股并行科技同期暴漲234.73%,。

DeepSeek指數(shù)和相關(guān)個(gè)股股價(jià)狂飆的背后,，是AI（人工智能）大模型公司DeepSeek的橫空出世,，不僅震撼了美國(guó),，引發(fā)美國(guó)AI芯片巨頭英偉達(dá)股價(jià)單日暴跌17%,，同時(shí)也震撼了全球。

2023年4月,，在美國(guó)OpenAI推出ChatGPT3.5大模型引發(fā)人工智能熱之后,，中國(guó)基金報(bào)記者曾專訪了中國(guó)工程院院士、前中國(guó)科學(xué)院計(jì)算技術(shù)研究所所長(zhǎng),、時(shí)任中科曙光董事長(zhǎng)李國(guó)杰（參閱《徹底火了,，暴漲60%！李國(guó)杰最新研判》）,。

李國(guó)杰當(dāng)時(shí)指出，因?yàn)閺V泛的滲透性,，人工智能將成為21世紀(jì)起決定性作用的技術(shù),，未來(lái)幾年一定會(huì)出現(xiàn)新的標(biāo)志性事件。

近日,，中國(guó)基金報(bào)記者再次專訪中國(guó)工程院院士李國(guó)杰,，請(qǐng)他詳細(xì)闡釋了DeepSeek為什么會(huì)震撼全球。

在此次專訪中,，李國(guó)杰表示,，DeepSeek的橫空出世，是世界第三波人工智能浪潮中新的標(biāo)志性事件,，可以和2023年初OpenAI發(fā)布ChatGPT3.5相媲美,。DeepSeek推出的V3和R1模型既是技術(shù)上的重大突破，也是發(fā)展模式上的顛覆性創(chuàng)新,。

DeepSeek帶來(lái)的最大“震撼”,，是闖出了一條發(fā)展人工智能的新路，中國(guó)從“追趕者”變?yōu)椤耙?guī)則改寫者”,，第一次在核心技術(shù)領(lǐng)域以顛覆性創(chuàng)新而非規(guī)模優(yōu)勢(shì)挑戰(zhàn)西方霸權(quán),。

在李國(guó)杰看來(lái)，DeepSeek的崛起動(dòng)搖了硅谷與華爾街的基本信念,，其對(duì)美國(guó)AI巨頭的沖擊不是短期的,，而是中長(zhǎng)期的。這種沖擊堪比1957年蘇聯(lián)衛(wèi)星上天的“斯普特尼克時(shí)刻”,，迫使美國(guó)重新審視其技術(shù)霸權(quán)的基礎(chǔ),。

李國(guó)杰指出，DeepSeek不僅是技術(shù)突破者,，更是規(guī)則重構(gòu)者,。DeepSeek的崛起說(shuō)明AI不再是簡(jiǎn)單堆砌算力的暴力游戲，而是進(jìn)入了以算法和模型架構(gòu)優(yōu)化為主,，同時(shí)高度重視數(shù)據(jù)質(zhì)量與規(guī)模,、理性提高算力的新時(shí)期,。DeepSeek的開源戰(zhàn)略將向歷史證明：在這場(chǎng)AI競(jìng)賽中，誰(shuí)擁抱開源,，誰(shuí)就能贏得未來(lái),。

李國(guó)杰認(rèn)為，中國(guó)人工智能企業(yè)正在重構(gòu)全球AI供應(yīng)鏈版圖,。就整個(gè)人工智能領(lǐng)域而言,，在有些研究方向上中國(guó)還在跟跑，但在推理模型等許多方向上,，中國(guó)和美國(guó)已經(jīng)處于你追我趕的并跑狀態(tài),。在人工智能賽道上，中國(guó)不止DeepSeek一家,，而是有一批創(chuàng)新型科技企業(yè)進(jìn)入全球第一梯隊(duì),。

不過(guò)，李國(guó)杰也強(qiáng)調(diào),，DeepSeek的成功并沒(méi)有否定算力在人工智能發(fā)展中的關(guān)鍵作用,。實(shí)際上，由于用于推理的設(shè)備比訓(xùn)練設(shè)備多得多,，推理所需要的算力將來(lái)會(huì)成為主要需求,。不論是算力、數(shù)據(jù)還是算法,，中國(guó)與美國(guó)仍然有差距,。要打贏這場(chǎng)事關(guān)國(guó)運(yùn)的科技戰(zhàn)，還要做長(zhǎng)期的艱苦努力,。

以下是此次專訪全文：

世界人工智能發(fā)展史上

新的標(biāo)志性事件

中國(guó)基金報(bào)：DeepSeek的橫空出世,，是否可以和2023年初OpenAI的ChatGPT3.5類比？是否是世界人工智能發(fā)展史上新的標(biāo)志性事件,？如果是的話,，其標(biāo)志性意義是源于技術(shù)上的突破，還是發(fā)展模式上的創(chuàng)新,？

李國(guó)杰：DeepSeek的橫空出世是世界人工智能發(fā)展史上新的標(biāo)志性事件,，可以和2023年初OpenAI發(fā)布ChatGPT3.5相媲美。DeepSeek推出的V3和R1模型既是技術(shù)上的重大突破,，也是發(fā)展模式上的顛覆性創(chuàng)新,。

有人說(shuō)ChatGPT是“0到1”的突破，而DeepSeek只是“1到N”的擴(kuò)展,，這種看法不符合人工智能發(fā)展的歷史軌跡,。人工智能不同于物理學(xué)等基礎(chǔ)理論研究，物理學(xué)中的牛頓定律和愛(ài)因斯坦發(fā)現(xiàn)的相對(duì)論是“0到1”的突破,。但人工智能是一個(gè)沒(méi)有嚴(yán)格定義的研究領(lǐng)域,，沒(méi)有智能和不智能的“0”和“1”的界限,，只有智能化水平不斷提高的發(fā)展過(guò)程。

從1943年提出神經(jīng)元計(jì)算模型以來(lái),，人工智能經(jīng)歷了漫長(zhǎng)的探索過(guò)程,。基于神經(jīng)網(wǎng)絡(luò)模型的第三波人工智能浪潮已經(jīng)出現(xiàn)好幾次里程碑式的重大事件,。

2012年在ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽上,，Hinton等人研制的AlexNet卷積神經(jīng)網(wǎng)絡(luò)取得了顯著成功，這可以看作第三波人工智能浪潮的起點(diǎn),。

2016年DeepMind研制的AlphaGo圍棋程序戰(zhàn)勝世界冠軍李世石和柯潔,，引起了全世界的關(guān)注。

2017年Google的7名人員提出Transformer模型,，提出自注意力機(jī)制,，成為深度學(xué)習(xí)的主流模型。

2018年DeepMind發(fā)布了AlphaFold,，在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)中展示出驚人的預(yù)測(cè)能力，開辟了AI for science的新方向,。

2023年OpenAI發(fā)布ChatGPT3.5,，引領(lǐng)了以大語(yǔ)言模型（LLM）為標(biāo)志的生成式人工智能新浪潮。

DeepSeek的橫空出世與上述重大事件一樣,，都是第三波人工智能浪潮的里程碑事件,。

為什么說(shuō)DeepSeek發(fā)布V3和R1模型是與OpenAI發(fā)布ChatGPT 3.5一樣的里程碑事件？

從DeepSeek發(fā)布后用戶和大企業(yè)的狂熱接納情形,，可以看出其巨大影響力,。ChatGPT發(fā)布后兩個(gè)月用戶就達(dá)到1億，全球?yàn)橹@嘆,。2025年1月20日,，DeepSeek-R1發(fā)布上線，在沒(méi)有任何廣告投放情況下,，7天之內(nèi)用戶增長(zhǎng)超過(guò)1億,，創(chuàng)造了用戶增長(zhǎng)速度新的世界紀(jì)錄。DeepSeek在蘋果應(yīng)用商店的下載量占據(jù)了157個(gè)國(guó)家/地區(qū)的第一名位置（包括美國(guó)）,，在相同時(shí)間段超過(guò)ChatGPT首次發(fā)布時(shí)的下載量,。

GitHub是全球最大的代碼托管網(wǎng)站，GitHub的星（Star）數(shù)?（即GitHub平臺(tái)項(xiàng)目頁(yè)面上的Star按鈕被用戶主動(dòng)點(diǎn)擊的次數(shù)）,，代表項(xiàng)目受歡迎的程度和社區(qū)的認(rèn)可度,。目前，DeepSeek的GitHub星數(shù)已超越了OpenAI,。

全球人工智能的龍頭企業(yè)紛紛擁抱DeepSeek,，也凸顯了其不可抗拒的影響力,。微軟最早宣布將DeepSeek-R1模型添加到云平臺(tái)Azure AI Foundry，開發(fā)者可用于構(gòu)建基于云的應(yīng)用程序和服務(wù),。接著,，AWS（亞馬遜云科技）、英偉達(dá),、AMD等公司相繼宣布在其AI服務(wù)平臺(tái)上部署DeepSeek-R1模型,。

不管相關(guān)勢(shì)力如何抵制，少數(shù)媒體如何惡意中傷,，公司和用戶都是根據(jù)DeepSeek的實(shí)際效果和親身體驗(yàn)做出選擇,，DeepSeek推出的高效率、低成本的推理模型和開源的商業(yè)模式,，必將引領(lǐng)人工智能行業(yè)新潮流,。

DeepSeek的V3和R1模型廣受歡迎，是因?yàn)樵谀Ｐ退惴ê拖到y(tǒng)軟件層次都有重大創(chuàng)新,。

首先是算法層次的創(chuàng)新,，DeepSeek采用了新的混合專家架構(gòu)（MoE），每一層有256個(gè)路由專家和1個(gè)共享專家,。在每次前向傳播過(guò)程中,，只激活一小部分專家來(lái)進(jìn)行計(jì)算。雖然DeepSeek-V3是一個(gè)671B參數(shù)的大模型,，但模型的任何函數(shù)調(diào)用和傳遞只使用約37B參數(shù),，使其訓(xùn)練成本大為降低。

在算法層面,，DeepSeek還有一個(gè)降低成本的重大創(chuàng)新,，即低秩注意力機(jī)制（也稱為多頭潛在注意力機(jī)制）。這一發(fā)明對(duì)巨大的注意力機(jī)制矩陣進(jìn)行了壓縮,，減少參與運(yùn)算的參數(shù)數(shù)量,，把顯存占用降到了其他大模型的5%～13%，極大提升了模型運(yùn)行效率,。

DeepSeek更重要的創(chuàng)新是在推理層面,。OpenAI發(fā)布的o1推理模型是閉源的，其他的企業(yè)都搞不清楚OpenAI是如何基于預(yù)訓(xùn)練模型構(gòu)建推理模型的,。通過(guò)開源方式,，DeepSeek把實(shí)現(xiàn)低成本推理的奧秘告訴全世界，為發(fā)展推理模型開辟了一條新路,。DeepSeek揭示了一個(gè)事實(shí),，即推理模型的開發(fā)比想象中更為簡(jiǎn)單，各行各業(yè)都可以做,。

傳統(tǒng)的強(qiáng)化學(xué)習(xí)需要大量標(biāo)注數(shù)據(jù),，成本很高,。DeepSeek另辟蹊徑，采用全自動(dòng)的強(qiáng)化學(xué)習(xí)取代監(jiān)督微調(diào)和基于人類反饋的強(qiáng)化學(xué)習(xí)（RLHF）,，用機(jī)器直接推測(cè)的方式來(lái)預(yù)測(cè)分?jǐn)?shù),，顯著提高了強(qiáng)化學(xué)習(xí)的效率。

與DeepMind和OpenAI一樣,，DeepSeek的貢獻(xiàn)主要還是工程創(chuàng)新和優(yōu)化,，在人工智能的基礎(chǔ)理論上并沒(méi)有重大突破。但這些創(chuàng)新大大降低了推理成本,，打破了對(duì)高算力的迷信,，對(duì)人工智能產(chǎn)業(yè)的發(fā)展有重大意義。

DeepSeek的科技震撼波及全球

中國(guó)基金報(bào)：2月3日,，中國(guó)醫(yī)學(xué)科學(xué)院學(xué)部委員,、生物學(xué)家饒毅發(fā)表了題為《鴉片戰(zhàn)爭(zhēng)以來(lái)，中國(guó)對(duì)人類最大的科技震撼：DeepSeek》的文章,，認(rèn)為“1840年至今的185年來(lái),，在科學(xué)和技術(shù)相關(guān)的方面，中國(guó)出現(xiàn)的對(duì)人類最大的震撼是DeepSeek”,。饒毅教授對(duì)DeepSeek的評(píng)價(jià)是否過(guò)于夸張,？

李國(guó)杰：饒毅教授稱“DeepSeek是鴉片戰(zhàn)爭(zhēng)以來(lái)中國(guó)對(duì)全世界最大的科技震撼”，我認(rèn)為,，這一評(píng)價(jià)有一定的道理,，并非夸張,。中國(guó)在航天,、高鐵等領(lǐng)域都取得過(guò)震驚世界的科技成就，大疆無(wú)人機(jī),、宇樹機(jī)器人在全球的市場(chǎng)占有率高達(dá)60%以上,，但這些成就并沒(méi)有引起全球性的科技震撼。

DeepSeek掀起這么大的沖擊波,，是美國(guó)政府和一些龍頭企業(yè)妄圖以人工智能獨(dú)霸全球夢(mèng)想破滅造成的,。特朗普上臺(tái)第二天就簽署法案，啟動(dòng)星際之門計(jì)劃,，要投資5000億美元,，打造人工智能的基礎(chǔ)設(shè)施?？梢?，美國(guó)政府把人工智能當(dāng)成美國(guó)稱霸世界的頭等大事。

DeepSeek帶來(lái)的最大“震撼”,，是從中國(guó)杭州殺出一匹黑馬,，闖出一條發(fā)展人工智能的新路,，中國(guó)從“追趕者”變?yōu)椤耙?guī)則改寫者”，第一次在核心技術(shù)領(lǐng)域以顛覆性創(chuàng)新而非規(guī)模優(yōu)勢(shì)挑戰(zhàn)西方霸權(quán),。

DeepSeek在模型算法和工程優(yōu)化方面所進(jìn)行的系統(tǒng)級(jí)創(chuàng)新,，為在受限資源下探索通用人工智能開辟了新的道路。傳統(tǒng)大模型遵循的是一條“由通到?！钡娜斯ぶ悄馨l(fā)展思路,，與之相反，DeepSeek追求的是“由專到通”的人工智能發(fā)展路徑,，通過(guò)引領(lǐng)人工智能技術(shù)生態(tài)的形成,，邁向全社會(huì)分享的通用人工智能之路。

雖然以O(shè)penAI為代表的生成式人工智能紅紅火火,，但多數(shù)企業(yè)不敢將自己的數(shù)據(jù)交給私有AI平臺(tái)生成自己的垂直模型,，因?yàn)楹ε绿峤坏臄?shù)據(jù)會(huì)泄露自己的技術(shù)機(jī)密。人工智能之所以在各個(gè)行業(yè)難以落地,，這可能是一個(gè)根本性的原因,。

DeepSeek的出現(xiàn)化解了這一難題。歐洲,、印度等國(guó)人工智能的發(fā)展一直落后于美國(guó)和中國(guó),，現(xiàn)在可以將DeepSeek提供的小而精的模型下載到本地，即使斷網(wǎng)也可以“蒸餾”出高效率的垂直模型,，這讓他們看到了希望,。也就是說(shuō)，DeepSeek的科技震撼,，不僅僅是對(duì)美國(guó),，也是對(duì)全球的震撼。

人工智能不同于資本密集型和經(jīng)驗(yàn)積累型的集成電路產(chǎn)業(yè),，不僅要“燒錢”,，更要“燒腦”，本質(zhì)上是比拼人的智力的新興產(chǎn)業(yè),。因此,，人工智能產(chǎn)業(yè)具有明顯的不對(duì)稱性，一個(gè)具有100多個(gè)聰明頭腦的小企業(yè)就可以挑戰(zhàn)市值上萬(wàn)億美元的龍頭企業(yè),。

DeepSeek給全球的震撼具有顛覆性,，但DeepSeek只是中國(guó)具有潛力的人工智能企業(yè)之一。

近日,，《麻省理工科技評(píng)論》刊發(fā)了一篇題為《關(guān)注DeepSeek之外的四家中國(guó)人工智能初創(chuàng)公司》的報(bào)道,，指出階躍星辰（Stepfun）、面壁智能（Model Best）、智譜AI,、無(wú)問(wèn)芯穹（Infinigence AI）四家企業(yè)同樣展現(xiàn)出不遜于DeepSeek的技術(shù)實(shí)力與全球競(jìng)爭(zhēng)力,。

中國(guó)人工智能企業(yè)的崛起，正在重構(gòu)全球AI供應(yīng)鏈版圖,；開源模型將基礎(chǔ)模型層轉(zhuǎn)化為普惠資源,，正在為應(yīng)用開發(fā)者開啟創(chuàng)新之門；算法革命正在大幅度降低訓(xùn)練成本,，打破了單一依賴算力堆砌的迷信,。

DeepSeek的成功

似乎預(yù)示著“小力也可出奇跡”

中國(guó)基金報(bào)：DeepSeek的巨大影響是否預(yù)示規(guī)模法則（Scaling Law）已經(jīng)走到盡頭？“大力出奇跡”的技術(shù)路線是否還能延續(xù),？算力究竟在人工智能的發(fā)展中起什么作用,？

李國(guó)杰：2020年1月，OpenAI發(fā)表論文《神經(jīng)語(yǔ)言模型的規(guī)模法則》（Scaling Laws forNeural Language Models）,，提出規(guī)模法則：“通過(guò)增加模型規(guī)模,、數(shù)據(jù)量和計(jì)算資源，可以顯著提升模型性能,?！?/strong>

在AI領(lǐng)域，規(guī)模法則被認(rèn)為是“公理”,，俗稱“大力出奇跡”,，OpenAI等龍頭企業(yè)和美國(guó)的AI投資界把它當(dāng)成制勝法寶。

但是,，規(guī)模法則不是像牛頓定律一樣經(jīng)過(guò)無(wú)數(shù)次驗(yàn)證的科學(xué)定律,，而是OpenAI等公司近幾年研制大模型的經(jīng)驗(yàn)歸納。從科學(xué)研究的角度看,，屬于一種對(duì)技術(shù)發(fā)展趨勢(shì)的猜想,；從投資的角度看，屬于對(duì)某種技術(shù)路線的押注,。人工智能是對(duì)未來(lái)技術(shù)的探索,，技術(shù)路線存在多種可能,。人工智能本身也存在多元化的目標(biāo),，探索的道路上有很多高山需要去攀登，攀登一座高山的路徑也不止一條,。把一種信仰或猜想當(dāng)成科學(xué)公理,，不是科學(xué)的態(tài)度。

鼓吹規(guī)模法則的人,，常常以強(qiáng)化學(xué)習(xí)之父理查德·薩頓（Richard S. Sutton）的文章“苦澀的教訓(xùn)”作為追求高算力的依據(jù)：“研究人員曾一次又一次試圖通過(guò)精巧的工程設(shè)計(jì)來(lái)提升性能,，但最終都敗給了簡(jiǎn)單粗暴的‘加大算力’方案，歷史證明,，通用方法總是在AI領(lǐng)域勝出,?！?/strong>

但是，薩頓本人這兩年對(duì)規(guī)模法則做了深刻的反思,。他指出,，雖然規(guī)模法則在提升模型性能方面確實(shí)有效，但它并不是解決所有問(wèn)題的萬(wàn)能鑰匙,。AI系統(tǒng)不僅需要具備強(qiáng)大的計(jì)算能力,，還需要具備持續(xù)學(xué)習(xí)、適應(yīng)環(huán)境,、理解復(fù)雜情境等能力,，這些能力往往難以通過(guò)簡(jiǎn)單地增加算力來(lái)實(shí)現(xiàn)。

但現(xiàn)在就說(shuō)規(guī)模法則已經(jīng)走到盡頭,，也沒(méi)有根據(jù),。與人腦的神經(jīng)連接復(fù)雜性相比，現(xiàn)在的人工神經(jīng)網(wǎng)絡(luò)至少還有上百倍的差距,。繼續(xù)擴(kuò)大神經(jīng)網(wǎng)絡(luò)的規(guī)模和增加訓(xùn)練的數(shù)據(jù)量,，是否能取得與投入相稱的回報(bào)，還要看今后的實(shí)際效果,。

但GPT-5遲遲不能問(wèn)世,，可能說(shuō)明規(guī)模擴(kuò)張的效果已經(jīng)不太明顯。圖靈獎(jiǎng)得主楊立昆（YannLeCun）和OpenAI前首席科學(xué)家伊利亞·蘇茨克維（IlyaSutskever）等人直言,，規(guī)模法則已觸及天花板,。

DeepSeek的出現(xiàn)，逼迫AI界嚴(yán)肅地思考這一技術(shù)發(fā)展路線問(wèn)題：是繼續(xù)燒錢豪賭,，還是另辟蹊徑,，在算法優(yōu)化上下更多功夫？

DeepSeek的成功似乎預(yù)示著“小力也可出奇跡”,，或者說(shuō)“算法和模型架構(gòu)優(yōu)化也可以出奇跡”,。隨著時(shí)間的推移，AI擴(kuò)展方法也在發(fā)生變化：最初是模型規(guī)模,，后來(lái)是數(shù)據(jù)集大小和數(shù)據(jù)質(zhì)量,，現(xiàn)在是推理時(shí)間和合成數(shù)據(jù)。

DeepSeek推出的V3是預(yù)訓(xùn)練模型,，R1是推理模型,，對(duì)全球沖擊比較大的主要是R1模型，某種意義上是把人工智能的關(guān)注重點(diǎn)轉(zhuǎn)移到推理計(jì)算上,。所謂規(guī)模法則也可以表現(xiàn)為在探索推理時(shí)間的擴(kuò)展行為,，即模型在推理階段（而非訓(xùn)練階段）通過(guò)增加計(jì)算資源來(lái)提升性能。

DeepSeek的成功并沒(méi)有否定算力在人工智能發(fā)展中的關(guān)鍵作用。實(shí)際上,，由于用于推理的設(shè)備比訓(xùn)練設(shè)備多得多,，所以推理所需要的算力將來(lái)會(huì)成為主要需求。通過(guò)算法優(yōu)化提高模型的效率十分重要,，走節(jié)省算力的綠色發(fā)展之路是我們的基本選擇,，但算力肯定是解決人工智能問(wèn)題的必要條件，也不可忽視,。

DeepSeek將對(duì)美國(guó)AI巨頭

產(chǎn)生中長(zhǎng)期沖擊

中國(guó)基金報(bào)：為什么DeepSeek對(duì)英偉達(dá)的股價(jià)會(huì)產(chǎn)生這么大的沖擊,？這種沖擊是短期還是中長(zhǎng)期的，背后的深層邏輯是什么,？

李國(guó)杰：第三波人工智能浪潮興起以來(lái),，美國(guó)政府和投資界形成的基本信念是：發(fā)展人工智能需要高算力，而目前實(shí)現(xiàn)人工智能計(jì)算性能最高的芯片就是英偉達(dá)的GPU,。因此,，只要控制GPU，美國(guó)就能在人工智能領(lǐng)域獨(dú)霸全球,。

DeepSeek的崛起動(dòng)搖了硅谷與華爾街的基本信念,。由于市場(chǎng)對(duì)高端GPU芯片需求下降的擔(dān)憂，英偉達(dá)股價(jià)單日暴跌17%,，市值縮水約6000億美元,，創(chuàng)下美國(guó)上市公司單日最大損失紀(jì)錄。

這種沖擊堪比1957年蘇聯(lián)衛(wèi)星上天的“斯普特尼克時(shí)刻”,，迫使美國(guó)重新審視其技術(shù)霸權(quán)的基礎(chǔ),。

但DeepSeek是否會(huì)真正降低對(duì)算力的需求，現(xiàn)在還不能下結(jié)論,。

1865年,，經(jīng)濟(jì)學(xué)家杰文斯提出了一個(gè)關(guān)于技術(shù)進(jìn)步的悖論：“當(dāng)技術(shù)進(jìn)步提高了效率，資源消耗不僅沒(méi)有減少,，反而激增,。”福特的流水線讓汽車制造更快,、更便宜,，但最終帶來(lái)的卻是全球石油消耗的暴漲。有時(shí),，單個(gè)產(chǎn)品越便宜,，反而會(huì)刺激整體采購(gòu)量增加,。人類對(duì)智能產(chǎn)品的需求肯定會(huì)持續(xù)增加,，即便單個(gè)產(chǎn)品算力成本下降，整個(gè)社會(huì)的算力消耗可能還會(huì)增加。

DeepSeek對(duì)“高投入,、高算力”的研發(fā)路徑會(huì)產(chǎn)生一定沖擊,，有些正在部署的智能計(jì)算中心猶豫觀望，部分AI上游算力市場(chǎng)可能會(huì)受到一定負(fù)面影響,，美股科技巨頭的超額估值可能會(huì)下調(diào),。

但另一方面，DeepSeek模型的低成本優(yōu)勢(shì)有利于AI下游應(yīng)用場(chǎng)景的快速落地,，有助于加速相關(guān)產(chǎn)業(yè)的智能化進(jìn)程,，為機(jī)器人、自動(dòng)駕駛汽車,、智慧城市,、智能辦公、消費(fèi)電子等下游板塊帶來(lái)利好,。

DeepSeek將AI的應(yīng)用引向C端市場(chǎng),，更多企業(yè)和普通用戶都會(huì)成為AI的消費(fèi)者，計(jì)算資源的需求也會(huì)隨之水漲船高,。

DeepSeek對(duì)美國(guó)AI巨頭的沖擊不是短期的,，隨著博弈的進(jìn)一步發(fā)展，一定會(huì)對(duì)其產(chǎn)生中長(zhǎng)期的影響,。因?yàn)锳I應(yīng)用對(duì)高端GPU需求降低,，讓更多的芯片和整機(jī)企業(yè)參與競(jìng)爭(zhēng)，人工智能新增的市場(chǎng)最后花落誰(shuí)家,，現(xiàn)在還很難斷定,。中國(guó)企業(yè)更有希望在AI市場(chǎng)上占有一席之地。DeepSeek明顯提振了國(guó)內(nèi)企業(yè)自立自強(qiáng)的信心,，民族自信心的增強(qiáng)將為A股市場(chǎng)注入新的活力,。

DeepSeek的崛起說(shuō)明

AI不再是簡(jiǎn)單堆砌算力的暴力游戲

中國(guó)基金報(bào)：對(duì)于DeepSeek的橫空出世，有人認(rèn)為是國(guó)運(yùn)級(jí)別的創(chuàng)新,，也有人認(rèn)為不過(guò)是一場(chǎng)新的鬧劇,，將曇花一現(xiàn)。對(duì)此,，你怎么看,？DeepSeek在何種程度上影響了全球人工智能的發(fā)展，其代表的AI大模型是否將成為市場(chǎng)主流,？如果不是的話,，何種類型的AI大模型將成為市場(chǎng)主流？

李國(guó)杰：DeepSeek崛起的背后是中美兩國(guó)的科技博弈,，絕不是一場(chǎng)曇花一現(xiàn)的鬧劇,。但將一家小公司提上政治高度,，推到大國(guó)博弈的前線，背上“國(guó)運(yùn)級(jí)別創(chuàng)新”的沉重十字架,，對(duì)初創(chuàng)公司的發(fā)展沒(méi)有好處,。

DeepSeek對(duì)全球人工智能發(fā)展有里程碑式的意義，其主要的價(jià)值是打破了“高算力和高投入是發(fā)展人工智能唯一途徑”和“集成電路制程優(yōu)勢(shì)=人工智能技術(shù)霸權(quán)”的迷信,，增強(qiáng)了人工智能業(yè)界走開源道路的信心,。用開源將AI入場(chǎng)券“平民化”，促進(jìn)AI在各個(gè)國(guó)家,、眾多行業(yè)的應(yīng)用和創(chuàng)新,。

DeepSeek不僅是技術(shù)突破者，更是規(guī)則重構(gòu)者,，對(duì)中國(guó)實(shí)現(xiàn)科技突圍具有重要的啟示作用,。DeepSeek的崛起說(shuō)明，AI不再是簡(jiǎn)單堆砌算力的暴力游戲,，而是進(jìn)入了以算法和模型架構(gòu)優(yōu)化為主,，同時(shí)高度重視數(shù)據(jù)質(zhì)量與規(guī)模、理性提高算力的新時(shí)期,。

由于美國(guó)政府的封鎖,，目前我國(guó)無(wú)法獲取最先進(jìn)的芯片制程工藝，可能會(huì)落后國(guó)外兩代以上,。DeepSeek給我們的啟示是,，我們需要在有限算力條件下，通過(guò)算法和軟件的協(xié)同創(chuàng)新,，充分發(fā)揮硬件的極致性能,，挖掘所有可能的優(yōu)化空間。DeepSeek R1發(fā)布以后,，華為,、海光、龍芯等芯片設(shè)計(jì)公司迅速和DeepSeekR1綁定,，推出在各個(gè)行業(yè)實(shí)用的推理平臺(tái),，DeepSeek也接入了國(guó)家超算互聯(lián)網(wǎng)。我國(guó)的算力資源巨大,，國(guó)內(nèi)的人工智能模型與美國(guó)的水平十分接近,，幾乎并駕齊驅(qū)，只要做好算力資源與人工智能平臺(tái)的優(yōu)化適配,，我國(guó)的人工智能科研和應(yīng)用一定會(huì)走在世界前列,。

DeepSeek是一家成立不到兩年的小公司，全球人工智能的賽道上有很多公司在你追我趕,。一家公司一時(shí)的技術(shù)領(lǐng)先,，并不是“護(hù)城河”,，關(guān)鍵是看發(fā)展的速度快不快。

總體來(lái)看,，人工智能還處在發(fā)展初期,，現(xiàn)在就斷定哪一種人工智能大模型是市場(chǎng)主流,，還為時(shí)過(guò)早,。只要我國(guó)有一批創(chuàng)新企業(yè)像DeepSeek那樣，堅(jiān)持做引領(lǐng)性的科研而不是跟隨,，中國(guó)對(duì)形成人工智能的主流模型一定會(huì)做出與國(guó)力相稱的貢獻(xiàn),。

AI界“晶體管”式的重大發(fā)明

目前還沒(méi)有看到苗頭

中國(guó)基金報(bào)：2023年4月，你在接受我們專訪時(shí)曾表示,，中國(guó)要走低成本的人工智能發(fā)展之路,，人工智能界需要“晶體管”式的重大發(fā)明，才能使大模型走上良性發(fā)展之路,。那么,，DeepSeek是否已經(jīng)探索出了一條低成本的人工智能發(fā)展之路？人工智能界的“晶體管”式的重大發(fā)明是否已經(jīng)可以看到希望的曙光,？

李國(guó)杰：低成本是技術(shù)普及的基本要求,，蒸汽機(jī)、電力和計(jì)算機(jī)的普及都是其成本降低到大眾可以接受時(shí)才做到的,，人工智能肯定也會(huì)走這條路,。

目前，人工智能產(chǎn)業(yè)的成本還很高,，主要表現(xiàn)在算力資源,、數(shù)據(jù)獲取與處理、算法研發(fā)的人才門檻和人工智能系統(tǒng)部署維護(hù)的復(fù)雜性等,。為了降低人工智能的成本,，企業(yè)界和科技界已經(jīng)做了大量的努力，包括優(yōu)化算力體系,、高效模型架構(gòu),、建設(shè)開源生態(tài)等。這幾年,，人工智能成本已經(jīng)有了數(shù)量級(jí)的下降,，但人工智能要做到大規(guī)模普及，還需要更大幅度降低成本,。

近日,，華裔科學(xué)家李飛飛團(tuán)隊(duì)的研究人員，以阿里通義千問(wèn)（Qwen）模型為基礎(chǔ),，通過(guò)蒸餾谷歌的AI推理模型Gemini 2.0 Flash Thinking Experimental,，并結(jié)合監(jiān)督微調(diào)（SFT）技術(shù),，使用16個(gè)英偉達(dá)H100GPU進(jìn)行了26分鐘的訓(xùn)練，以不到50美元的云計(jì)算費(fèi)用成功訓(xùn)練出s1模型,，其性能超過(guò)了Open AI的o1-preview模型,。這種創(chuàng)新的訓(xùn)練方法以令人吃驚的低成本，做到了與高端模型相媲美的性能,，顯示出人工智能的低成本化還有巨大的提升空間,，為人工智能領(lǐng)域帶來(lái)新的發(fā)展思路。

我們?cè)跒橥评砟Ｐ偷牡统杀净瘹g欣鼓舞時(shí),，應(yīng)注意到一個(gè)事實(shí),，那就是目前推理模型的低成本是以預(yù)訓(xùn)練模型（基礎(chǔ)模型）的高成本為前提。我們真正追求的不是人工智能某些步驟的低成本,，而是整體的低成本,，但要實(shí)現(xiàn)這個(gè)目標(biāo)還要走很長(zhǎng)的路。

電子計(jì)算機(jī)剛問(wèn)世的時(shí)候采用真空電子管,，難以實(shí)現(xiàn)低成本,。1947年發(fā)明了晶體管，1958年發(fā)明了集成電路,。在摩爾定律的推動(dòng)下,，集成電路的集成度飛速提高。現(xiàn)在最高性能的GPU包含2080億個(gè)晶體管,，相當(dāng)于1美元可以買到500多萬(wàn)個(gè)晶體管,，單個(gè)晶體管的成本已下降了上千萬(wàn)倍。晶體管成本的急速下降為人類的信息化做出了不可磨滅的貢獻(xiàn),。

所以,，我曾經(jīng)說(shuō)過(guò)，人工智能界需要“晶體管”式的重大發(fā)明,，才能使大模型走上良性發(fā)展之路,。DeepSeek為探索低成本的人工智能發(fā)展之路做出了重要貢獻(xiàn)，但人工智能界的“晶體管”式的重大發(fā)明目前還沒(méi)有看到苗頭,。偉大的發(fā)現(xiàn)從來(lái)不出自計(jì)劃,，說(shuō)不定哪一天會(huì)突然冒出來(lái)。我相信,，只要堅(jiān)持做原創(chuàng)性的基礎(chǔ)研究,，人工智能界類似晶體管的重大發(fā)明一定會(huì)出現(xiàn)。

在推理模型等方向上

中美已處于并跑狀態(tài)

中國(guó)基金報(bào)：有人認(rèn)為,，DeepSeek之所以受關(guān)注,，更多是開源和閉源路線之爭(zhēng)。對(duì)此,，你怎么看,？此外,，怎么看目前全球AI大模型發(fā)展的競(jìng)爭(zhēng)格局？中國(guó)是在繼續(xù)跟跑,，還是已經(jīng)到了“并跑”狀態(tài),？

李國(guó)杰：DeepSeek推出的V3和R1模型，雖然有重大的技術(shù)突破,，但還是基于Transformer結(jié)構(gòu)的改進(jìn),，核心技術(shù)上并沒(méi)有和國(guó)外拉開距離。過(guò)去這幾年,，開源大模型的性能始終與龍頭企業(yè)的閉源大模型有一代以上的差距,，這一次DeepSeek的性能追上了閉源模型,，大大增強(qiáng)了開源社區(qū)的信心,，這是了不起的成就。

圖靈獎(jiǎng)得主楊立昆認(rèn)為“對(duì)DeepSeek崛起的正確解讀,，應(yīng)是開源模型正在超越閉源模型”,。這一評(píng)價(jià)十分中肯，因?yàn)楦淖傾I發(fā)展模式比單項(xiàng)技術(shù)的突破更重要,。

長(zhǎng)期以來(lái),，美國(guó)的AI龍頭公司夸大開源AI的安全風(fēng)險(xiǎn)，力圖通過(guò)監(jiān)管抑制開源AI,。事實(shí)上,，開源模型對(duì)于全球AI供應(yīng)鏈至關(guān)重要，發(fā)展中國(guó)家尤其需要開源AI技術(shù),。若美國(guó)繼續(xù)在這一領(lǐng)域設(shè)置障礙,，中國(guó)就有望在開源AI全球供應(yīng)鏈中占據(jù)核心地位，從而使更多企業(yè)轉(zhuǎn)向中國(guó)企業(yè)而非美國(guó)企業(yè)的技術(shù)方案,。

DeepSeek發(fā)布以后,，OpenAI的CEO Altman承認(rèn)，OpenAI過(guò)去在開源方面一直站在“歷史錯(cuò)誤的一邊”,。他表示：“需要想出一個(gè)不同的開源策略,。”2025年1月31日,，OpenAI宣布,，免費(fèi)向用戶開放推理模型o3-Mini，但其核心技術(shù)還是封閉的,，仍然強(qiáng)調(diào)開源“不是我們當(dāng)前的最高優(yōu)先事項(xiàng)”,。這表明，OpenAI短期內(nèi)不會(huì)在開源方面有實(shí)質(zhì)性的轉(zhuǎn)變,。

真正的AI競(jìng)爭(zhēng),，不僅僅是技術(shù)和模型的競(jìng)爭(zhēng),，更是生態(tài)系統(tǒng)、商業(yè)模式,，以及價(jià)值觀的競(jìng)爭(zhēng),。開源模型讓AI民主化，每個(gè)開發(fā)者都能輕松調(diào)用強(qiáng)大AI工具,，不再受大公司的約束,，AI的進(jìn)化速度將會(huì)明顯提升。DeepSeek的開源戰(zhàn)略將向歷史證明：在這場(chǎng)AI競(jìng)賽中,，誰(shuí)擁抱開源,，誰(shuí)就能贏得未來(lái)。

OpenAI剛發(fā)布ChatGPT的時(shí)候,，雖然中國(guó)馬上掀起“百模大戰(zhàn)”,，但大模型的實(shí)際水平存在代際差距。經(jīng)過(guò)這幾年的市場(chǎng)競(jìng)爭(zhēng)和優(yōu)勝劣汰,，中美的差距明顯縮小。我國(guó)有好幾家優(yōu)秀的人工智能公司冒了出來(lái),，大模型的性能與國(guó)外先進(jìn)水平差不多,，都屬于世界第一梯隊(duì),。

因此，就整個(gè)人工智能領(lǐng)域而言,，在有些研究方向上中國(guó)還在跟跑，但在推理模型等許多方向上,，中國(guó)和美國(guó)已經(jīng)處于你追我趕的并跑狀態(tài),。人工智能是探索未知領(lǐng)域的研究，并沒(méi)有確定的研究方向,。進(jìn)入并跑狀態(tài)以后,，就不要過(guò)于在意與美國(guó)相差幾個(gè)月，可以你做你的,、我做我的,，比誰(shuí)能發(fā)現(xiàn)正確的研究方向。中國(guó)的人工智能人才總量比美國(guó)多,，現(xiàn)在發(fā)表的論文數(shù),、引用數(shù)和授權(quán)專利數(shù)都遠(yuǎn)遠(yuǎn)超過(guò)美國(guó),。但是頂尖的AI人才還是美國(guó)多，我們?cè)谌斯ぶ悄艿难芯繉?shí)力上與美國(guó)還有一些差距?？偟膩?lái)講,，要打贏這一場(chǎng)事關(guān)國(guó)運(yùn)的科技戰(zhàn),，還要做長(zhǎng)期的艱苦努力,，但年輕一代正在成為科研的主力,，我們要有信心在人工智能的研究和應(yīng)用上走在美國(guó)前面。

科技發(fā)展的新型舉國(guó)體制

需要考慮軍民領(lǐng)域的區(qū)別

中國(guó)基金報(bào)：DeepSeek的崛起對(duì)業(yè)界有何啟發(fā)？為什么DeepSeek沒(méi)有在上?；驀?guó)內(nèi)人工智能發(fā)展的高地北京誕生,？

李國(guó)杰：最近幾年，不論是國(guó)防戰(zhàn)線還是民用領(lǐng)域,，中國(guó)的科技突破出現(xiàn)類似噴泉的態(tài)勢(shì)，轟動(dòng)全球的科研成果不斷冒出來(lái),。這些成果的出現(xiàn)不是偶然的,，而是中國(guó)的科技和經(jīng)濟(jì)發(fā)展經(jīng)過(guò)多年積累必然要走上的一個(gè)新臺(tái)階,。載人航天工程、第六代戰(zhàn)斗機(jī),、052D型導(dǎo)彈驅(qū)逐艦等與國(guó)防有關(guān)的重大成果,，與DeepSeek、宇樹機(jī)器人等創(chuàng)新型人工智能產(chǎn)品的出現(xiàn)，似乎有著不同的發(fā)展途徑,，建立科技發(fā)展的新型舉國(guó)體制需要考慮兩者的區(qū)別,。

在市場(chǎng)化程度高、技術(shù)迭代快的領(lǐng)域（如AI,、生物科技等）,，通過(guò)市場(chǎng)競(jìng)爭(zhēng)贏者勝出的機(jī)制可能比集中規(guī)劃的建制化研究更有效,。未來(lái)的科技政策既要支持國(guó)家隊(duì)在戰(zhàn)略安全領(lǐng)域沖鋒陷陣,，同時(shí)要大力支持民間力量在充分競(jìng)爭(zhēng)中自下而上地突破技術(shù)封鎖,。人工智能領(lǐng)域的探索性很強(qiáng),，目前這一領(lǐng)域在全球起引領(lǐng)作用的不是美國(guó)和西歐的國(guó)家實(shí)驗(yàn)室，而是DeepMind和OpenAI這樣的創(chuàng)新型企業(yè),。在中國(guó),，DeepSeek這一類創(chuàng)業(yè)公司也起到了引領(lǐng)作用。

DeepSeek的成功與其創(chuàng)始人梁文峰的人才管理路線有很大關(guān)系,。梁文峰選擇了一條與眾不同的用人策略。他們拒絕經(jīng)驗(yàn)豐富的人才,，而選擇初出茅廬的年輕人。

DeepSeek有一條不成文的用人規(guī)則：招聘時(shí)工作經(jīng)驗(yàn)超過(guò)8年者,，直接拒聘,；超過(guò)5年,，需要特別出色才能入選。DeepSeek團(tuán)隊(duì)成員幾乎全是國(guó)內(nèi)頂尖高校的應(yīng)屆畢業(yè)生或博士實(shí)習(xí)生,。

DeepSeek相信,，真正的創(chuàng)新往往來(lái)自那些沒(méi)有包袱的人,，有極致熱情的人，而不是習(xí)慣用經(jīng)驗(yàn)找答案的人,。這種用人理念為公司帶來(lái)了令人驚喜的創(chuàng)新動(dòng)力,?！?0后”和“00后”的中國(guó)年輕人是在相對(duì)充裕的物質(zhì)條件下成長(zhǎng)起來(lái)的，他們更多是為了興趣和熱愛(ài)而努力,，已經(jīng)開始平視美西方國(guó)家,，具有“敢為天下先”的勇氣和自信。他們是中國(guó)科技自立自強(qiáng)的希望,。

作為DeepSeek的誕生地,，杭州市政府出臺(tái)了一系列鼓勵(lì)創(chuàng)新創(chuàng)業(yè)的政策。同時(shí),，杭州擁有完善的產(chǎn)業(yè)鏈配套和豐富的人才資源,，為其發(fā)展提供了良好的創(chuàng)業(yè)環(huán)境。DeepSeek出名以后,，民間流傳起關(guān)于“杭州六小龍”的故事,，深度求索、宇樹科技,、游戲科學(xué),、云深處、群核科技,、強(qiáng)腦科技六家初創(chuàng)公司有一些共同的特點(diǎn)：都由年輕科技人才創(chuàng)辦,，都屬于人工智能領(lǐng)域，都屬于民營(yíng)小微企業(yè),。這些具有世界影響的公司都出自杭州,，肯定不是偶然的，希望杭州的經(jīng)驗(yàn)?zāi)茉谄渌鞘写罅ν茝V,。

但是,，我國(guó)在人工智能領(lǐng)域被全世界關(guān)注的公司不僅僅出自杭州。上面提到的階躍星辰,、面壁智能,、智譜AI都是在北京注冊(cè)的公司，無(wú)問(wèn)芯穹來(lái)自上海,。當(dāng)這些公司和以后可能冒出來(lái)的AI公司都成為世界級(jí)的大公司時(shí),，中國(guó)無(wú)疑將成為人工智能的世界強(qiáng)國(guó)。

編輯：杜妍

校對(duì)：紀(jì)元

制作：鹿米

審核：陳墨許聞

版權(quán)聲明

《中國(guó)基金報(bào)》對(duì)本平臺(tái)所刊載的原創(chuàng)內(nèi)容享有著作權(quán)，未經(jīng)授權(quán)禁止轉(zhuǎn)載,，否則將追究法律責(zé)任,。

授權(quán)轉(zhuǎn)載合作聯(lián)系人：于先生（電話：0755-82468670）

免責(zé)聲明：本文來(lái)自網(wǎng)絡(luò)收錄或投稿，觀點(diǎn)僅代表作者本人,，不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,，版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處：http://lequren.com/1131305.html
溫馨提示：投資有風(fēng)險(xiǎn)，入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議,。

7天暴漲58%！DeepSeek為何震撼全球？李國(guó)杰再論第三波人工智能浪潮

相關(guān)推薦