這兩天,, 我們?cè)俅位仡櫫它S仁勛在 GTC 2024 上的演講,,在對(duì)產(chǎn)品做更深一層的分析解讀時(shí),發(fā)現(xiàn)了一些當(dāng)時(shí)熬夜忽略掉的亮點(diǎn),。
一是老黃的演講風(fēng)格,,幽默、自然,、很有交流感,,也難怪能把一場(chǎng)科技產(chǎn)品發(fā)布會(huì)開(kāi)成演唱會(huì)的模樣。
圖源:愛(ài)范兒
二是結(jié)合著前幾代產(chǎn)品,再次審視最新發(fā)布的 Blackwell 架構(gòu)以及系列 GPU,,只能說(shuō)它的算力性能,、成本造價(jià)和今后表現(xiàn),遠(yuǎn)超乎我的想像,。
就如英偉達(dá)的名字,,NVIDIA 的前兩個(gè)字母 N 和 V,代表著 Next Version「下一代」,。
圖源:愛(ài)范兒
與往年的 GTC 一樣,英偉達(dá)如期發(fā)布了下一代產(chǎn)品,,性能更高,、表現(xiàn)更好;但又和以前完全不同,,因?yàn)?Blackwell 所代表的不僅是下一代產(chǎn)品,,更是下一個(gè)時(shí)代。
重新認(rèn)識(shí),,地表最強(qiáng) GPU
自我介紹一般都從名字開(kāi)始,,那這顆最新最強(qiáng)的 AI 芯片,也從這里講起吧,。
圖源:愛(ài)范兒
Blackwell 的全名是 David Harold Blackwell,,他是美國(guó)統(tǒng)計(jì)學(xué)家,、拉奧-布萊克韋爾定理的提出者之一。更重要的是,,他還是美國(guó)國(guó)家科學(xué)院的首位黑人院士,,和加州大學(xué)伯克利分校的首位黑人終身教員。
圖源:愛(ài)范兒
GTC 2024 上發(fā)布的這顆「Blackwell」就來(lái)源于此,,倒不是說(shuō) Blackwell 本人對(duì)英偉達(dá)有過(guò)什么突出的貢獻(xiàn),,而是在英偉達(dá)的命名體系中,拿歷史上一些著名科學(xué)家(或數(shù)學(xué)家)的名字來(lái)命名 GPU 微架構(gòu),,已經(jīng)成為了一種慣例,。
自 2006 年起,英偉達(dá)陸續(xù)推出的 Tesla, Fermi, Kepler, Maxwel, Pascal, Volta, Turing, Ampere 架構(gòu),,就對(duì)應(yīng)著特斯拉,、費(fèi)米、開(kāi)普勒,、麥克斯韋,、帕斯卡、伏打,、圖靈,、安培這幾位學(xué)術(shù)大佬。
圖源:愛(ài)范兒
一是有名,,二是有料,至于是否和指定產(chǎn)品一一對(duì)應(yīng),,實(shí)際上就沒(méi)有那么強(qiáng)相關(guān)了,。
這里需要強(qiáng)調(diào)一點(diǎn),上面提到的這些以名字命名的對(duì)象,,不是哪一顆單獨(dú)的芯片,,而是指整個(gè) GPU 的架構(gòu)(黃仁勛將其稱為平臺(tái))。
圖源:愛(ài)范兒
芯片架構(gòu)(Chip Architecture)指芯片的基本設(shè)計(jì)和組織結(jié)構(gòu),不同的架構(gòu)決定著芯片的性能,、能效,、處理能力和兼容性,也影響著應(yīng)用程序的執(zhí)行方式和效率,。
簡(jiǎn)單講,,擁有了一座體育場(chǎng)(制作芯片的原材料)的你,打算將它徹底改造,,這塊地具體是用來(lái)開(kāi)演唱會(huì)還是辦運(yùn)動(dòng)會(huì)(芯片用途),,決定了場(chǎng)地布置、人員雇傭,、裝扮和宣發(fā)的方式(芯片架構(gòu)),。
因此芯片架構(gòu)和芯片設(shè)計(jì)相互關(guān)聯(lián),也共同決定了芯片性能,。
例如經(jīng)常聽(tīng)到的 x86 和 ARM,,就是針對(duì) CPU 而設(shè)計(jì)的兩種主流架構(gòu),前者性能表現(xiàn)強(qiáng)悍,,后者能耗控制優(yōu)秀,,各有長(zhǎng)項(xiàng)。
圖源:愛(ài)范兒
基于多代 NVIDIA 技術(shù)構(gòu)建,在 Blackwell 架構(gòu)下的芯片 B200,、B100 具備出眾的性能,、效率和規(guī)模,也一同開(kāi)啟了 AIGC 的新篇章,。
但為什么會(huì)被稱為「AI 核彈」,?新 GPU 到底有多強(qiáng)?在與上一代產(chǎn)品的對(duì)比下,我們會(huì)有更直觀的感受,。
2022 年的 GTC 上,,黃仁勛發(fā)布了全新架構(gòu) Hopper 以及全新芯片 H100:
圖源:愛(ài)范兒
1. 由臺(tái)積電 4nm 工藝制程,,當(dāng)中集成了 800 億個(gè)晶體管,比上一代 A100 足足多了 260 億個(gè),。 H100 的 FP16,、TF32 以及 FP64 性能都是 A100 的 3 倍,分別為 2000TFLOPS,、1000TFLOPS 和 60TFLOPS,,訓(xùn)練 3950 億參數(shù)大模型僅需 1 天,用老黃的原話解釋「20 張即可承載全球互聯(lián)網(wǎng)流量」,。
2. H100 的發(fā)售,,讓英偉達(dá)市值突破了2 萬(wàn)億美元,成為僅次于微軟和蘋果的第三大科技公司,。
3. 據(jù)市場(chǎng)跟蹤公司 Omdia 的統(tǒng)計(jì)分析,,英偉達(dá)在去年第三季度大約賣出了 50 萬(wàn)臺(tái) H100 和 A100 GPU,這些顯卡的總重,,近千噸,。
圖源:愛(ài)范兒
到目前為止,,Hopper H100 仍是在售的最強(qiáng) GPU,并遙遙領(lǐng)先,。
而 Blackwell B200,,再次刷新了「最強(qiáng)」的記錄,性能的提升遠(yuǎn)超出了常規(guī)的產(chǎn)品迭代,。
圖源:愛(ài)范兒
從制程工藝看,,B200 GPU 采用第二代臺(tái)積電的 4nm 工藝,采用雙倍光刻極限尺寸的裸片,,通過(guò) 10 TB/s 的片間互聯(lián)技術(shù)連接成一塊統(tǒng)一的 GPU ,,共有 2080 億個(gè)晶體管(單顆芯片為 1040 億個(gè)),相較于制作 Hopper H100 的 N4 技術(shù),,性能提升了 6%,。,綜合性能提升約 250%,。
圖源:愛(ài)范兒
從性能看,第二代 Transformer 引擎使 Blackwell 可以通過(guò)新的 4 位浮點(diǎn) AI 支持雙倍的計(jì)算和模型大小推理能力,,單芯片 AI 性能高達(dá) 20 PetaFLOPS(每秒可以執(zhí)行 20×10^15 次浮點(diǎn)運(yùn)算),,比上一代 Hopper H100 提升了 4 倍,同時(shí) AI 推理性能比上一代提升了 30 倍,。
圖源:愛(ài)范兒
從能耗控制看,,過(guò)去訓(xùn)練一個(gè) 1.8 萬(wàn)億參數(shù)模型之前需要 8000 個(gè) Hopper GPU 和 15 兆瓦的功率,,如今 2000 個(gè) Blackwell GPU 就可以做到這一點(diǎn),而功耗僅為 4 兆瓦,,直接降低了 96%,。
圖源:愛(ài)范兒
因此,,黃仁勛的那句「Blackwell 將成為世界上最強(qiáng)大的芯片」并不是信口開(kāi)河,而且已經(jīng)成為事實(shí),。
不便宜的造價(jià),,不簡(jiǎn)單的用途
金融服務(wù)公司 Raymond James 分析師曾預(yù)估過(guò) B200 的成本。
英偉達(dá)每制造一顆 H100 的成本約為 3320 美元,,售價(jià)為 2.5-3 萬(wàn)美元之間,,根據(jù)兩者的性能差異推算 B200 成本將比 H100 高出 50%~60%,大概是 6000 美元,。
圖源:愛(ài)范兒
黃仁勛在發(fā)布會(huì)后接受 CNBC 專訪時(shí)透露,,Blackwell GPU 的售價(jià)約為 3 萬(wàn)~4 萬(wàn)美元,,整個(gè)新架構(gòu)的研發(fā)大約花了 100 億美元。
我們必須發(fā)明一些新技術(shù)才能使其(新架構(gòu))成為可能,。
按照以往的節(jié)奏,,英偉達(dá)大約每?jī)赡昃蜁?huì)發(fā)布新一代 AI 芯片,最新的 Blackwell 相較于前幾代產(chǎn)品在算力性能和能耗控制上有了顯著的提升,,更直觀的是,, 結(jié)合了兩顆 GPU 的 Blackwell 比 Hooper 大了將近一倍。
圖源:愛(ài)范兒
高昂的成本不僅與芯片有關(guān),還與設(shè)計(jì)數(shù)據(jù)中心和集成到其他公司的數(shù)據(jù)中心緊密相連,因?yàn)樵邳S仁勛看來(lái),,英偉達(dá)并不制造芯片,,而是在建數(shù)據(jù)中心。
根據(jù)英偉達(dá)最新的財(cái)報(bào)顯示,,第四財(cái)季營(yíng)收達(dá)到創(chuàng)紀(jì)錄的 221 億美元,,同比增長(zhǎng) 265%。四季度凈利潤(rùn) 123 億美元,,同比暴增 765%,。
這當(dāng)中最大的營(yíng)收來(lái)源數(shù)據(jù)中心部門,達(dá)到創(chuàng)紀(jì)錄的 184 億美元,,較第三季度增長(zhǎng) 27%,,較上年同期增長(zhǎng) 409%。
圖源:愛(ài)范兒
研發(fā)成本很高,但以此搏來(lái)的正向回報(bào)更高,。
英偉達(dá)目前正在構(gòu)建的數(shù)據(jù)中心,,包含全棧系統(tǒng)和所有軟件,是一套完整的體系,,Blackwell 或者說(shuō) GPU,,只是這當(dāng)中的一環(huán)。
數(shù)據(jù)中心被分解成多個(gè)模塊,,用戶能夠根據(jù)自身需求自由選擇相應(yīng)的軟硬件服務(wù),,英偉達(dá)會(huì)根據(jù)不同的要求對(duì)網(wǎng)絡(luò)、存儲(chǔ),、控制平臺(tái),、安全性、管理進(jìn)行調(diào)整,,并有專門團(tuán)隊(duì)來(lái)提供技術(shù)支持,。
圖源:愛(ài)范兒
如此的全局視野和定制化服務(wù)到底好不好,,數(shù)據(jù)可以說(shuō)明一切:截至 3 月 5 日,英偉達(dá)的市值繼超越 Alphabet,、亞馬遜等巨頭后,又超過(guò)沙特阿美,, 成為全球第三大公司,,僅次于微軟和蘋果兩大科技巨頭,總市值達(dá)到 2.4 萬(wàn)億美元。
圖源:愛(ài)范兒
目前,全球數(shù)據(jù)中心大約有 2000 億歐元(約合人民幣 7873 億)的市場(chǎng),,英偉達(dá)正是這當(dāng)中的一部分,,黃仁勛預(yù)測(cè)這個(gè)市場(chǎng)在未來(lái)極有可能增長(zhǎng)到 1-2 萬(wàn)億美元。
英偉達(dá) CFO 克雷斯分析:
第四財(cái)季數(shù)據(jù)中心的收入主要是由生成式 AI 及其相關(guān)訓(xùn)練所推動(dòng)的,。我們估計(jì),,過(guò)去一年中約有 40% 的數(shù)據(jù)中心收入來(lái)源于 AI。
不到一個(gè)月前,,黃仁勛也在財(cái)報(bào)中表示
加速計(jì)算和生成式 AI 已經(jīng)達(dá)到引爆點(diǎn),,全球范圍內(nèi),企業(yè),、產(chǎn)業(yè)和國(guó)家的需求正在激增,。
的確,定制化不是英偉達(dá)的專屬,,但在 AI 時(shí)代的風(fēng)口,,能夠提供「從頭到腳」的服務(wù)的企業(yè)所剩無(wú)幾,英偉達(dá)就是其中之一,。
豬能起飛,,首先得在風(fēng)口
在這個(gè)虛擬現(xiàn)實(shí)、高性能計(jì)算和人工智能的交叉口,,GPU 甚至在取代 CPU 成為 AI 計(jì)算機(jī)的大腦,。
圖源:愛(ài)范兒
生成式 AI 之所以引起各個(gè)行業(yè)的熱烈討論,,最核心的一點(diǎn)是它開(kāi)始像「人」一樣工作學(xué)習(xí),從聊天,、寫文案,、畫圖片、做視頻,,到分析病情,、調(diào)研總結(jié)……所有令人驚嘆的生成結(jié)果,都需要天文數(shù)字般的樣本數(shù)據(jù)作為支撐,。
比如,,你能記住「愛(ài)范兒」這個(gè)名字,可能是因?yàn)槊刻斓墓娞?hào)推送讓信息不斷重復(fù)加強(qiáng)了記憶,;也可能是以前從未見(jiàn)過(guò)「愛(ài)」和「范兒」的組合,,新奇感讓你印象深刻,;又或者是橙色的 logo 在你腦海中留下了獨(dú)特的視覺(jué)符號(hào)。
圖源:愛(ài)范兒
每一個(gè)簡(jiǎn)單的小細(xì)節(jié)鞏固了你腦海中「愛(ài)范兒」的畫像,但當(dāng)全國(guó)的科技媒體信息雜糅在一起的時(shí)候,,就需要更多的符號(hào)來(lái)加深印象,,以免搞混。
AI 的深度學(xué)習(xí),,大概就是這個(gè)邏輯,,而 GPU 就是處理海量信息的最佳選擇。
自 OpenAI 引燃 AIGC 后,,大部分有名有姓的公司都開(kāi)始極速上架自家的大小模型,,智能汽車、翻譯軟件,、電子文檔,、手機(jī)助手,連掃地機(jī)器人,,都擁有了 AI,。
圖源:愛(ài)范兒
GPU 仿佛在一夜之間就成了全球爭(zhēng)奪的對(duì)象,,根據(jù)市場(chǎng)跟蹤公司 Omdia 的統(tǒng)計(jì),這當(dāng)中不乏騰訊,、阿里巴巴,、百度、字節(jié)跳動(dòng),、特斯拉,,Meta 和微軟甚至各自采購(gòu)了15 萬(wàn)顆 H100 GPU(去年最強(qiáng)芯片)。
技術(shù)原理和時(shí)代背景,,共同促進(jìn)了 GPU 的爆火,,也成就了屬于英偉達(dá)的「顯卡帝國(guó)」。根據(jù)富國(guó)銀行的統(tǒng)計(jì),,英偉達(dá)目前在數(shù)據(jù)中心 AI 市場(chǎng)擁有 98% 的市場(chǎng)份額,。
圖源:愛(ài)范兒
站在風(fēng)口上,,豬都可以飛起來(lái)。
但當(dāng)一家公司在一個(gè)行業(yè)里的占有率接近 100% 時(shí),,背后一定有個(gè)和站在風(fēng)口同樣重要的原因,。
1999 年,,英偉達(dá)就率先提出了 GPU 的概念,2006 年就推出了 CUDA,,這是英偉達(dá)發(fā)展史上一次重要的技術(shù)轉(zhuǎn)折點(diǎn),它降低了 GPU 的應(yīng)用門檻,,開(kāi)發(fā)者可以用 C/C++ 等語(yǔ)言在 GPU 上邊寫程序,,GPU 脫離了圖像處理的單一用途,高性能計(jì)算走入了顯卡的世界,。
圖源:愛(ài)范兒
16 年 AlphaGo 的勝利,,17 年比特幣的暴漲以及挖礦熱潮,,在此期間押注自動(dòng)駕駛市場(chǎng),直到 23 年 ChatGPT 等 AI 大模型問(wèn)世,,讓英偉達(dá)在多年前的播種,,迎來(lái)了豐收時(shí)刻。
圖源:愛(ài)范兒
風(fēng)口固然重要,但前瞻市場(chǎng)布局,、多元化應(yīng)用領(lǐng)域,、大手筆的投入與創(chuàng)新,任何一環(huán)的失位,,都不會(huì)造就當(dāng)下接近滿分的市場(chǎng)神話,。
不過(guò),于英偉達(dá)而言,,如何在時(shí)代的十字路口保持領(lǐng)先地位,,才是最重要的議題。
Blackwell,,就是鞏固成果的關(guān)鍵一步,,在許多廠家還沒(méi)收到已經(jīng)下定的 H100 時(shí),B200,、B100 的流水線已經(jīng)開(kāi)啟,。
圖源:愛(ài)范兒
黃仁勛在演講中,,重申了自己在此前財(cái)報(bào)中提出的觀點(diǎn)「通用計(jì)算已經(jīng)到達(dá)瓶頸」。
因此現(xiàn)在需要更大的模型,,也需要更大的 GPU,,更需要將 GPU 堆疊在一起,。
這不是為了降低成本,而是為了擴(kuò)大規(guī)模,。
這當(dāng)中,,有些謙虛,當(dāng)然也有市場(chǎng)的巨大需求,。
圖源:愛(ài)范兒
目前 OpenAI 最大的模型已經(jīng)有 1.8T(萬(wàn)億)參數(shù),,需要吞吐數(shù)十億 token(字符串),,即使是一塊 PetaFLOP(每秒千萬(wàn)億次)級(jí)的 GPU,訓(xùn)練這樣大的模型也需要 1000 年才能完成,。
Hopper 很棒,,但我們需要更強(qiáng)大的 GPU。
圖源:愛(ài)范兒
GTC 2024 帶來(lái)的第一波討論熱潮在這幾天慢慢淡去,可以預(yù)見(jiàn)的是,,發(fā)布會(huì)上的 Blackwell GPU 系列,、第五代 NVLink、RAS 引擎,,在走向市場(chǎng)的時(shí)候會(huì)帶來(lái)更多的震撼,;難以預(yù)測(cè)的是「生成式 AI 已觸及的引爆點(diǎn)」究竟還會(huì)給世界帶來(lái)多少驚喜與改變?
在 AIGC 爆發(fā)的當(dāng)下和 AGI 到來(lái)的前夕,,英偉達(dá)引爆的這串 AI 鞭炮,,目前還只是炸響了第一下。
本文來(lái)自微信公眾號(hào)“愛(ài)范兒”(ID:ifanr),,作者:肖凡博,,36氪經(jīng)授權(quán)發(fā)布。
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1093864.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。