本報記者 李玉洋 上海報道
在這一輪AI浪潮下,,能把一場技術(shù)大會辦得如Taylor Swift演唱會那樣火爆,,還得是英偉達。
近日,,英偉達2024 GTC(GPU Technology Conference)引發(fā)全球AI界的關(guān)注,,萬人會場座無虛席,,英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛在開場演講中直言:“這并不是一場演唱會,而是一個開發(fā)者大會,?!?/p>
《中國經(jīng)營報》記者注意到,英偉達在GTC上對外展示出新一代圖形計算平臺Blackwell,,它代表的是一個平臺,,包含了采用全新架構(gòu)Blackwell的GPU B200和GB200系列芯片,前者被稱為“地表最強算力AI芯片”,,據(jù)介紹B200訓練萬億大模型的性能是H100的4倍,,推理性能最多提升30倍。
除了超大尺寸的AI超級芯片,,英偉達還展示出Blackwell所具備的新特性:第二代Transformer引擎,、第五代NVLink網(wǎng)絡(luò)技術(shù)、RAS引擎,、安全AI和新解壓縮引擎,,這是外界所矚目的地方,。然而,多位產(chǎn)業(yè)分析師表示,,本屆GTC雖然新GPU吸人眼球,,但驚艷之處還在于英偉達的軟件服務(wù),比如推理微服務(wù)(NIM),、基于Omniverse Cloud API的新軟件框架等,。
“這屆GTC講推理的次數(shù)遠遠大過講訓練。訓練是前期投入燒錢的過程,,推理是面向用戶的,,是往回收錢的一個過程,這才說明整個產(chǎn)業(yè)是在走向落地的,?!迸c非網(wǎng)資深行業(yè)分析師張慧娟認為,這是英偉達的一個新階段,,或是AI進入應(yīng)用部署階段,。
盡管國產(chǎn)AI芯片還很難追上英偉達GPU的步伐,但正如黃仁勛所說,,“我們的芯片中有大量的零部件產(chǎn)自中國”,中國是全球產(chǎn)業(yè)鏈中重要的一環(huán),。電子創(chuàng)新網(wǎng)CEO張國斌表示:“在制造工藝上的限制,,我們很難追上英偉達,但是可以利用數(shù)據(jù)優(yōu)勢,、場景需求等繼續(xù)追趕,。”
AI芯片的性能天花板
據(jù)了解,,英偉達將全新的GPU架構(gòu)命名為Blackwell,,這是向第一位入選美國國家科學院的黑人學者、數(shù)學家David Harold Blackwell致敬,,延續(xù)了前幾代(Pacal,、Volta、Ampere,、Hopper)的命名邏輯,。
但相比前幾代,Blackwell又有些不一樣,?!癇lackwell不僅僅是一款芯片,它代表的是一個平臺,?!秉S仁勛如此說,。
毋庸置疑,采用Blackwell架構(gòu)的GPU B200是最先被推出來的硬件新品,,可謂是AI芯片的性能天花板,。據(jù)介紹,B200不是單一的GPU,,而是由兩個緊密耦合的芯片組成,,其擁有2080億個晶體管,而Hopper架構(gòu)只有800億個晶體管,,所以外觀尺寸也比前代大不少,。
黃仁勛表示,B200采用定制的,、雙reticle(光刻模板)的臺積電4NP(4N 工藝的改進版本)工藝,,兩塊小芯片之間的互聯(lián)速度高達10TB/秒,可以支持多達10萬億個參數(shù)的AI大模型,。在全新FP4精度下,,Blackwell GPU的AI性能達到Hopper的5倍。
為什么英偉達推出如此大尺寸的GPU,?黃仁勛表示:“我們已經(jīng)來到了一個臨界點,,因此需要一種新的計算方式來加速整個行業(yè)的發(fā)展效率。那么,,英偉達能夠做什么,?當然,答案就是更大的芯片,?!?/p>
同時,新的GPU架構(gòu)和技術(shù)也大大改善了能耗,。黃仁勛舉例稱,,如果要訓練一個1.8萬億參數(shù)量的GPT模型,需要8000張Hopper GPU,,消耗15兆瓦的電力,,連續(xù)跑上90天。而使用Blackwell GPU,,只需要2000張,,跑90天只消耗四分之一的電力。
因此,,B200被英偉達稱為“新工業(yè)革命的引擎”,。在統(tǒng)一的Blackwell平臺下,英偉達推出該系列的“全家桶”產(chǎn)品:GB200超級芯片(通過第五代NVLink-C2C互連技術(shù)將2個Blackwell架構(gòu)的 GPU連接到1個Arm架構(gòu)的Grace CPU),、基于GB200的GB200 NVL72(將36個CPU和72個GPU集成到1組巨大的液冷機架的大型超級運算產(chǎn)品),、基于GB200 NVL72AI超級計算平臺DGX B200系統(tǒng)和新一代DGX SuperPOD AI超級計算機,。
此外,英偉達還推出全新網(wǎng)絡(luò)交換機X800系列,,以支持新型AI基礎(chǔ)設(shè)施運行萬億參數(shù)級生成式AI業(yè)務(wù),。據(jù)介紹,英偉達Quantum-X800 InfiniBand網(wǎng)絡(luò)和Spectrum-X800以太網(wǎng)絡(luò)是全球首批端到端吞吐量高達800Gb/s的網(wǎng)絡(luò)平臺,,交換帶寬容量較前代產(chǎn)品提高5倍,,網(wǎng)絡(luò)計算能力通過英偉達第四代SHARP技術(shù)提高了9倍,網(wǎng)絡(luò)計算性能達到14.4TFLOPS,。
盡管英偉達還沒明確B200 GPU的上市時間,,但黃仁勛宣布了谷歌、微軟,、亞馬遜等公司與Blackwell平臺進行合作,。
有媒體報道,英偉達最新一代AI芯片的定價在3萬至4萬美元,,就此黃仁勛回應(yīng)稱:“我只是試圖讓大家對我們產(chǎn)品的定價有一定的感受,,而并不打算給出具體的報價。因為根據(jù)每一個客戶的需求,,不同系統(tǒng)的價格差異是很大的,,英偉達并不銷售芯片,我們售賣的是數(shù)據(jù)中心,?!?/p>
據(jù)了解,數(shù)據(jù)中心IT設(shè)備主要包括連接器(光纖,、光模塊)、網(wǎng)絡(luò)設(shè)備(交換機,、路由器),、算力設(shè)備(服務(wù)器)、存儲設(shè)備(存儲器)等,。英偉達最新季度財報顯示,,其數(shù)據(jù)中心業(yè)務(wù)收入達到184 億美元,季度營收221億美元,,占比超80%,。從這個角度看,英偉達把華為列為競爭對手的理由也夠充分,。
記者注意到,,黃仁勛日前回到母校斯坦福大學,在回應(yīng)“AMD是個威脅嗎”這個問題時表示,,芯片只是一部分,,現(xiàn)在的計算機不是普通的電腦,,而是一個數(shù)據(jù)中心,買賣芯片的人考慮的是芯片價格,,而運營數(shù)據(jù)中心的人考慮的是運營成本,,就數(shù)據(jù)中心的總擁有成本而言,英偉達GPU的定價并不重要,,我們有太多優(yōu)勢,,即便競爭對手的芯片免費。
轉(zhuǎn)型:英偉達由硬件轉(zhuǎn)向軟件
除了生成式AI,,英偉達還相當看好具身智能,,并發(fā)布了人形機器人通用基礎(chǔ)模型Project GR00T、基于Thor SoC的新型人形機器人計算機Jetson Thor,;還對其機器人平臺NVIDIA Isaac?進行了升級,,包括生成式AI基礎(chǔ)模型和仿真工具,以及AI工作流基礎(chǔ)設(shè)施等,。
值得注意的是,,多位分析師表示英偉達的軟件服務(wù)在這次GTC大會上的表現(xiàn)更驚艷?!坝布窃陬A期之內(nèi)的,,今年大會比較值得關(guān)注的是NIM?!毖芯繖C構(gòu)Omdia AI行業(yè)首席分析師蘇廉節(jié)表示,。
NIM,即英偉達推理微服務(wù)的縮寫,,可將優(yōu)化的推理引擎,、行業(yè)標準API和對人工智能模型的支持打包到容器中,以便于部署,。
據(jù)悉,,NIM微服務(wù)可用于部署來自英偉達、AI21,、Adept,、Cohere、Getty Images,、Shutterstock的模型,,以及來自谷歌、Hugging Face,、Meta,、微軟、Mistral AI,、Stability AI的開放模型,。
NIM另一強大用例還在于,,除了提供預構(gòu)建模型,它還允許企業(yè)使用自己的專有數(shù)據(jù),,并將支持和幫助加速檢索增強生成(RAG)部署,。英偉達企業(yè)計算部門副總裁馬努維爾·達斯(Manuvir Das)說:“如果你是開發(fā)者,手中有一個備受期待的模型,,希望能讓更多人采用,,只需將其部署在NIM上。我們承諾將兼容所有英偉達GPU,,確保模型能觸及廣泛用戶群,。”
在外界看來,,NIM或?qū)⒊蔀橛ミ_“軟件服務(wù)硬件”戰(zhàn)略的又一關(guān)鍵舉措,。“這個微服務(wù)可以協(xié)助英偉達客戶更容易讓AI上線,,英偉達這么做會讓部署更順滑,。”蘇廉節(jié)表示,,從NIM可以看出,,英偉達其實在逐漸從硬件商轉(zhuǎn)型成解決方案提供商。
此外,,讓人印象深刻的還有英偉達Omniverse與蘋果Vision Pro的“強強聯(lián)合”,。NVIDIA Omniverse是英偉達在2021年發(fā)布的一個開放平臺,專為虛擬協(xié)作和實時逼真模擬而構(gòu)建,。
在過去兩年的GTC上,,黃仁勛也在對外大力展示Omniverse的魅力,這次Omniverse挺進蘋果Vision Pro,,發(fā)布云API,。通過英偉達Omniverse的云API和圖形交付網(wǎng)絡(luò)(GDN),企業(yè)將可以輕松將3D應(yīng)用的OpenUSD(交互式通用場景描述)實時串流到Vision Pro頭顯中,。
根據(jù)英偉達方面的演示,一名設(shè)計師佩戴著Vision Pro,,在Omniverse平臺上開發(fā)的應(yīng)用程序內(nèi)進行汽車工業(yè)設(shè)計,,當他切換油漆、內(nèi)飾時,,Vision Pro的三維環(huán)境實時渲染并跟物理世界融為一體,。
黃仁勛認為,Omniverse是一個可以構(gòu)建并操作物理真實的數(shù)字孿生的操作系統(tǒng),,Omniverse和生成式AI都是將價值高達50萬億美元的重工業(yè)市場進行數(shù)字化所需的基礎(chǔ)技術(shù),。
Omniverse Cloud API將于今年晚些時候在微軟Azure上以英偉達A10 GPU上的自托管API,,或是部署在英偉達OVX上的托管服務(wù)的形式提供服務(wù)。
達斯在接受采訪時表示:“最暢銷的商業(yè)產(chǎn)品仍是GPU,,軟件則是為了幫助用戶以不同的方式使用GPU,。”他補充道:“當然,,我們依然在致力于產(chǎn)品的創(chuàng)新,。但現(xiàn)在,我們真正實現(xiàn)了轉(zhuǎn)變,,已經(jīng)發(fā)展出了自己的商業(yè)軟件業(yè)務(wù),。”
對于英偉達由硬件向軟件的轉(zhuǎn)變,,蘇廉節(jié)表示:“英偉達持續(xù)性的軟件投入,,對AI的普及和公司本身的未來都有很大的幫助?!?/p>
張慧娟則表示,,這是英偉達的新階段?!耙郧爸饕f大算力訓練,,當AI越來越多進入行業(yè)應(yīng)用,就需要讓AI好用,、好上手,,那么就需要軟件的幫助?!?/p>
彼之劣勢 我之優(yōu)勢
根據(jù)《第一財經(jīng)》報道,,關(guān)于英偉達在云服務(wù)市場的戰(zhàn)略,黃仁勛這樣回應(yīng):“雖然英偉達推出了云服務(wù)DGX Cloud,,但我們的策略依然是與云服務(wù)提供商合作,,將我們的云放入他們的云中。英偉達不會成為一家云計算公司,,我們的目標是通過軟件的構(gòu)建,,讓全球的開發(fā)者和云服務(wù)提供商采用英偉達的架構(gòu)來構(gòu)建產(chǎn)品?!?/p>
黃仁勛認為,,盡管目前很多云服務(wù)提供商都在研發(fā)芯片,但是這些企業(yè)研發(fā)芯片的邏輯與英偉達的業(yè)務(wù)邏輯完全不同,?!拔覀冋诒M全力使英偉達的業(yè)務(wù)在中國能夠?qū)崿F(xiàn)最大化,我們面向中國市場推出了L20和H20芯片,這些向中國出售的芯片將符合要求,?!秉S仁勛在采訪中指出中國市場的重要性。
黃仁勛說,,他們的芯片中有大量的零部件產(chǎn)自中國,。這與全球汽車供應(yīng)鏈的復雜性是一個道理,供應(yīng)鏈的全球化是很難被打破的,。國內(nèi)AI芯片公司盡管還很難追上英偉達的步伐,,但尺有所長、寸有所短,,也能借助國內(nèi)的產(chǎn)業(yè)優(yōu)勢,,走出一條不一樣的發(fā)展路徑。
張國斌表示:“對比英偉達,,我們主要有以下一些優(yōu)勢:一是大量的端側(cè)需求,,有細化的場景需求,這都讓我們的廠商可以有的放矢,,實現(xiàn)更多的專用方案,;二是政府大力支持,政府已經(jīng)出臺很多政策,;三是有眾多的IC公司從其他路徑進行嘗試突破,,例如有公司利用RISC-V架構(gòu)實現(xiàn)了新型的算力加速器,性價比超過了英偉達的H100,?!?/p>
張國斌指出,如果單純?nèi)ケ绕碐PU,,由于在制造工藝上的限制,,我們很難追上英偉達,但可利用數(shù)據(jù)優(yōu)勢,、場景需求的優(yōu)勢,。“英偉達的弱勢在端側(cè),,而我們的優(yōu)勢是端側(cè),;利用3D集成也可以實現(xiàn)媲美HBM性能的內(nèi)存,通過優(yōu)化的算法和模型,,一樣可以實現(xiàn)創(chuàng)新的應(yīng)用,。”張國斌說,。
(編輯:吳清 校對:顏京寧)
免責聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1093923.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。