本報記者 李玉洋 上海報道
在這一輪AI浪潮下,,能把一場技術(shù)大會辦得如Taylor Swift演唱會那樣火爆,,還得是英偉達,。
近日,英偉達2024 GTC(GPU Technology Conference)引發(fā)全球AI界的關(guān)注,,萬人會場座無虛席,,英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛在開場演講中直言:“這并不是一場演唱會,,而是一個開發(fā)者大會,。”
《中國經(jīng)營報》記者注意到,,英偉達在GTC上對外展示出新一代圖形計算平臺Blackwell,,它代表的是一個平臺,包含了采用全新架構(gòu)Blackwell的GPU B200和GB200系列芯片,,前者被稱為“地表最強算力AI芯片”,,據(jù)介紹B200訓練萬億大模型的性能是H100的4倍,推理性能最多提升30倍,。
除了超大尺寸的AI超級芯片,,英偉達還展示出Blackwell所具備的新特性:第二代Transformer引擎、第五代NVLink網(wǎng)絡(luò)技術(shù),、RAS引擎,、安全AI和新解壓縮引擎,這是外界所矚目的地方,。然而,,多位產(chǎn)業(yè)分析師表示,本屆GTC雖然新GPU吸人眼球,,但驚艷之處還在于英偉達的軟件服務(wù),,比如推理微服務(wù)(NIM)、基于Omniverse Cloud API的新軟件框架等,。
“這屆GTC講推理的次數(shù)遠遠大過講訓練,。訓練是前期投入燒錢的過程,推理是面向用戶的,,是往回收錢的一個過程,,這才說明整個產(chǎn)業(yè)是在走向落地的?!迸c非網(wǎng)資深行業(yè)分析師張慧娟認為,,這是英偉達的一個新階段,或是AI進入應(yīng)用部署階段。
盡管國產(chǎn)AI芯片還很難追上英偉達GPU的步伐,,但正如黃仁勛所說,,“我們的芯片中有大量的零部件產(chǎn)自中國”,中國是全球產(chǎn)業(yè)鏈中重要的一環(huán),。電子創(chuàng)新網(wǎng)CEO張國斌表示:“在制造工藝上的限制,,我們很難追上英偉達,但是可以利用數(shù)據(jù)優(yōu)勢,、場景需求等繼續(xù)追趕,。”
AI芯片的性能天花板
據(jù)了解,,英偉達將全新的GPU架構(gòu)命名為Blackwell,,這是向第一位入選美國國家科學院的黑人學者,、數(shù)學家David Harold Blackwell致敬,,延續(xù)了前幾代(Pacal、Volta,、Ampere,、Hopper)的命名邏輯。
但相比前幾代,,Blackwell又有些不一樣,。“Blackwell不僅僅是一款芯片,,它代表的是一個平臺,。”黃仁勛如此說,。
毋庸置疑,,采用Blackwell架構(gòu)的GPU B200是最先被推出來的硬件新品,可謂是AI芯片的性能天花板,。據(jù)介紹,,B200不是單一的GPU,而是由兩個緊密耦合的芯片組成,,其擁有2080億個晶體管,,而Hopper架構(gòu)只有800億個晶體管,所以外觀尺寸也比前代大不少,。
黃仁勛表示,,B200采用定制的、雙reticle(光刻模板)的臺積電4NP(4N 工藝的改進版本)工藝,,兩塊小芯片之間的互聯(lián)速度高達10TB/秒,,可以支持多達10萬億個參數(shù)的AI大模型。在全新FP4精度下,Blackwell GPU的AI性能達到Hopper的5倍,。
為什么英偉達推出如此大尺寸的GPU,?黃仁勛表示:“我們已經(jīng)來到了一個臨界點,因此需要一種新的計算方式來加速整個行業(yè)的發(fā)展效率,。那么,,英偉達能夠做什么?當然,,答案就是更大的芯片,。”
同時,,新的GPU架構(gòu)和技術(shù)也大大改善了能耗,。黃仁勛舉例稱,如果要訓練一個1.8萬億參數(shù)量的GPT模型,,需要8000張Hopper GPU,,消耗15兆瓦的電力,連續(xù)跑上90天,。而使用Blackwell GPU,,只需要2000張,跑90天只消耗四分之一的電力,。
因此,,B200被英偉達稱為“新工業(yè)革命的引擎”。在統(tǒng)一的Blackwell平臺下,,英偉達推出該系列的“全家桶”產(chǎn)品:GB200超級芯片(通過第五代NVLink-C2C互連技術(shù)將2個Blackwell架構(gòu)的 GPU連接到1個Arm架構(gòu)的Grace CPU),、基于GB200的GB200 NVL72(將36個CPU和72個GPU集成到1組巨大的液冷機架的大型超級運算產(chǎn)品)、基于GB200 NVL72AI超級計算平臺DGX B200系統(tǒng)和新一代DGX SuperPOD AI超級計算機,。
此外,,英偉達還推出全新網(wǎng)絡(luò)交換機X800系列,以支持新型AI基礎(chǔ)設(shè)施運行萬億參數(shù)級生成式AI業(yè)務(wù),。據(jù)介紹,,英偉達Quantum-X800 InfiniBand網(wǎng)絡(luò)和Spectrum-X800以太網(wǎng)絡(luò)是全球首批端到端吞吐量高達800Gb/s的網(wǎng)絡(luò)平臺,交換帶寬容量較前代產(chǎn)品提高5倍,,網(wǎng)絡(luò)計算能力通過英偉達第四代SHARP技術(shù)提高了9倍,,網(wǎng)絡(luò)計算性能達到14.4TFLOPS。
盡管英偉達還沒明確B200 GPU的上市時間,,但黃仁勛宣布了谷歌,、微軟、亞馬遜等公司與Blackwell平臺進行合作,。
有媒體報道,,英偉達最新一代AI芯片的定價在3萬至4萬美元,就此黃仁勛回應(yīng)稱:“我只是試圖讓大家對我們產(chǎn)品的定價有一定的感受,而并不打算給出具體的報價,。因為根據(jù)每一個客戶的需求,,不同系統(tǒng)的價格差異是很大的,英偉達并不銷售芯片,,我們售賣的是數(shù)據(jù)中心,。”
據(jù)了解,,數(shù)據(jù)中心IT設(shè)備主要包括連接器(光纖,、光模塊)、網(wǎng)絡(luò)設(shè)備(交換機,、路由器),、算力設(shè)備(服務(wù)器)、存儲設(shè)備(存儲器)等,。英偉達最新季度財報顯示,,其數(shù)據(jù)中心業(yè)務(wù)收入達到184 億美元,季度營收221億美元,,占比超80%,。從這個角度看,,英偉達把華為列為競爭對手的理由也夠充分,。
記者注意到,黃仁勛日前回到母校斯坦福大學,,在回應(yīng)“AMD是個威脅嗎”這個問題時表示,,芯片只是一部分,現(xiàn)在的計算機不是普通的電腦,,而是一個數(shù)據(jù)中心,,買賣芯片的人考慮的是芯片價格,而運營數(shù)據(jù)中心的人考慮的是運營成本,,就數(shù)據(jù)中心的總擁有成本而言,,英偉達GPU的定價并不重要,我們有太多優(yōu)勢,,即便競爭對手的芯片免費,。
轉(zhuǎn)型:英偉達由硬件轉(zhuǎn)向軟件
除了生成式AI,英偉達還相當看好具身智能,,并發(fā)布了人形機器人通用基礎(chǔ)模型Project GR00T,、基于Thor SoC的新型人形機器人計算機Jetson Thor;還對其機器人平臺NVIDIA Isaac?進行了升級,,包括生成式AI基礎(chǔ)模型和仿真工具,,以及AI工作流基礎(chǔ)設(shè)施等。
值得注意的是,多位分析師表示英偉達的軟件服務(wù)在這次GTC大會上的表現(xiàn)更驚艷,?!坝布窃陬A(yù)期之內(nèi)的,今年大會比較值得關(guān)注的是NIM,?!毖芯繖C構(gòu)Omdia AI行業(yè)首席分析師蘇廉節(jié)表示。
NIM,,即英偉達推理微服務(wù)的縮寫,,可將優(yōu)化的推理引擎、行業(yè)標準API和對人工智能模型的支持打包到容器中,,以便于部署,。
據(jù)悉,NIM微服務(wù)可用于部署來自英偉達,、AI21,、Adept、Cohere,、Getty Images,、Shutterstock的模型,以及來自谷歌,、Hugging Face,、Meta、微軟,、Mistral AI,、Stability AI的開放模型。
NIM另一強大用例還在于,,除了提供預(yù)構(gòu)建模型,,它還允許企業(yè)使用自己的專有數(shù)據(jù),并將支持和幫助加速檢索增強生成(RAG)部署,。英偉達企業(yè)計算部門副總裁馬努維爾·達斯(Manuvir Das)說:“如果你是開發(fā)者,,手中有一個備受期待的模型,希望能讓更多人采用,,只需將其部署在NIM上,。我們承諾將兼容所有英偉達GPU,確保模型能觸及廣泛用戶群,?!?/p>
在外界看來,NIM或?qū)⒊蔀橛ミ_“軟件服務(wù)硬件”戰(zhàn)略的又一關(guān)鍵舉措,?!斑@個微服務(wù)可以協(xié)助英偉達客戶更容易讓AI上線,,英偉達這么做會讓部署更順滑?!碧K廉節(jié)表示,,從NIM可以看出,英偉達其實在逐漸從硬件商轉(zhuǎn)型成解決方案提供商,。
此外,,讓人印象深刻的還有英偉達Omniverse與蘋果Vision Pro的“強強聯(lián)合”。NVIDIA Omniverse是英偉達在2021年發(fā)布的一個開放平臺,,專為虛擬協(xié)作和實時逼真模擬而構(gòu)建,。
在過去兩年的GTC上,黃仁勛也在對外大力展示Omniverse的魅力,,這次Omniverse挺進蘋果Vision Pro,,發(fā)布云API。通過英偉達Omniverse的云API和圖形交付網(wǎng)絡(luò)(GDN),,企業(yè)將可以輕松將3D應(yīng)用的OpenUSD(交互式通用場景描述)實時串流到Vision Pro頭顯中,。
根據(jù)英偉達方面的演示,一名設(shè)計師佩戴著Vision Pro,,在Omniverse平臺上開發(fā)的應(yīng)用程序內(nèi)進行汽車工業(yè)設(shè)計,,當他切換油漆、內(nèi)飾時,,Vision Pro的三維環(huán)境實時渲染并跟物理世界融為一體,。
黃仁勛認為,Omniverse是一個可以構(gòu)建并操作物理真實的數(shù)字孿生的操作系統(tǒng),,Omniverse和生成式AI都是將價值高達50萬億美元的重工業(yè)市場進行數(shù)字化所需的基礎(chǔ)技術(shù),。
Omniverse Cloud API將于今年晚些時候在微軟Azure上以英偉達A10 GPU上的自托管API,或是部署在英偉達OVX上的托管服務(wù)的形式提供服務(wù),。
達斯在接受采訪時表示:“最暢銷的商業(yè)產(chǎn)品仍是GPU,軟件則是為了幫助用戶以不同的方式使用GPU,?!彼a充道:“當然,我們依然在致力于產(chǎn)品的創(chuàng)新,。但現(xiàn)在,,我們真正實現(xiàn)了轉(zhuǎn)變,已經(jīng)發(fā)展出了自己的商業(yè)軟件業(yè)務(wù),?!?/p>
對于英偉達由硬件向軟件的轉(zhuǎn)變,蘇廉節(jié)表示:“英偉達持續(xù)性的軟件投入,,對AI的普及和公司本身的未來都有很大的幫助,?!?/p>
張慧娟則表示,這是英偉達的新階段,?!耙郧爸饕f大算力訓練,當AI越來越多進入行業(yè)應(yīng)用,,就需要讓AI好用,、好上手,那么就需要軟件的幫助,?!?/p>
彼之劣勢 我之優(yōu)勢
根據(jù)《第一財經(jīng)》報道,關(guān)于英偉達在云服務(wù)市場的戰(zhàn)略,,黃仁勛這樣回應(yīng):“雖然英偉達推出了云服務(wù)DGX Cloud,,但我們的策略依然是與云服務(wù)提供商合作,將我們的云放入他們的云中,。英偉達不會成為一家云計算公司,,我們的目標是通過軟件的構(gòu)建,讓全球的開發(fā)者和云服務(wù)提供商采用英偉達的架構(gòu)來構(gòu)建產(chǎn)品,?!?/p>
黃仁勛認為,盡管目前很多云服務(wù)提供商都在研發(fā)芯片,,但是這些企業(yè)研發(fā)芯片的邏輯與英偉達的業(yè)務(wù)邏輯完全不同,。“我們正在盡全力使英偉達的業(yè)務(wù)在中國能夠?qū)崿F(xiàn)最大化,,我們面向中國市場推出了L20和H20芯片,,這些向中國出售的芯片將符合要求?!秉S仁勛在采訪中指出中國市場的重要性,。
黃仁勛說,他們的芯片中有大量的零部件產(chǎn)自中國,。這與全球汽車供應(yīng)鏈的復(fù)雜性是一個道理,,供應(yīng)鏈的全球化是很難被打破的。國內(nèi)AI芯片公司盡管還很難追上英偉達的步伐,,但尺有所長,、寸有所短,也能借助國內(nèi)的產(chǎn)業(yè)優(yōu)勢,,走出一條不一樣的發(fā)展路徑,。
張國斌表示:“對比英偉達,我們主要有以下一些優(yōu)勢:一是大量的端側(cè)需求,,有細化的場景需求,,這都讓我們的廠商可以有的放矢,,實現(xiàn)更多的專用方案;二是政府大力支持,,政府已經(jīng)出臺很多政策,;三是有眾多的IC公司從其他路徑進行嘗試突破,例如有公司利用RISC-V架構(gòu)實現(xiàn)了新型的算力加速器,,性價比超過了英偉達的H100,。”
張國斌指出,,如果單純?nèi)ケ绕碐PU,,由于在制造工藝上的限制,我們很難追上英偉達,,但可利用數(shù)據(jù)優(yōu)勢,、場景需求的優(yōu)勢?!坝ミ_的弱勢在端側(cè),,而我們的優(yōu)勢是端側(cè);利用3D集成也可以實現(xiàn)媲美HBM性能的內(nèi)存,,通過優(yōu)化的算法和模型,,一樣可以實現(xiàn)創(chuàng)新的應(yīng)用?!睆垏笳f,。
(編輯:吳清 校對:顏京寧)
免責聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1093923.html
溫馨提示:投資有風險,,入市須謹慎,。本資訊不作為投資理財建議。