文章來源:鈦媒體
作者:章橙,、林志佳
圖片來源:由無界AI生成
新一輪人工智能(AI)熱潮引發(fā)大模型算力需求大增,,使得英偉達AI芯片供不應(yīng)求,,加之算力成本不斷攀升,讓AI巨頭們或?qū)⑦x擇“圍剿”英偉達,。
北京時間2月2日,,科技巨頭Meta Platforms對外證實,該公司計劃今年在其數(shù)據(jù)中心部署最新的自研定制芯片,,并將與其他GPU芯片協(xié)調(diào)工作,,旨在支持其AI大模型發(fā)展。
研究機構(gòu)SemiAnalysis創(chuàng)始人Dylan Patel表示,,考慮到Meta的運營規(guī)模,,一旦大規(guī)模成功部署自研芯片,有望將每年節(jié)省數(shù)億美元能源成本,,以及數(shù)十億美元芯片采購成本,。
更早之前,OpenAI持續(xù)推進“造芯”計劃,。公司CEO薩姆·奧爾特曼(Sam Altman)日前到訪韓國,,與芯片巨頭三星,、SK海力士探討合作。據(jù)報道,,雙方會議討論的主要話題之一是高帶寬存儲(HBM)芯片,有消息稱,,若合作達成三星和SK海力士可能會為OpenAI定制開發(fā)以及生產(chǎn)存儲芯片,。
不止是Meta和OpenAI,據(jù)The Information統(tǒng)計,,截至目前,,全球有超過18家用于AI大模型訓(xùn)練和推理的芯片設(shè)計初創(chuàng)公司,包括Cerebras,、Graphcore,、壁仞科技、摩爾線程,、d-Matrix等,,融資總額已超過60億美元,企業(yè)整體估值共計超過250億美元(約合1792.95億元人民幣),。
這些公司背后的投資方包括紅杉資本,、OpenAI、五源資本,、字節(jié)跳動等,。如果加上微軟、英特爾,、AMD等科技巨頭和芯片龍頭的“造芯”行動,,對標(biāo)英偉達的AI芯片企業(yè)數(shù)量最終就將超過20家。
如今,,即使“殺不死”市值達1.63萬億美元的GPU(圖形處理器)芯片龍頭英偉達,,全球也要有數(shù)十家AI公司全力“圍剿”它。
不僅加速造AGI,,奧爾特曼還要投資百億下場“造芯”
目前在大模型領(lǐng)域,,AI算力主要受限于兩個方面:AI模型訓(xùn)練需求暴增,以及算力成本越來越高,。
首先是需求增長,。
據(jù)OpenAI開發(fā)平臺服務(wù)狀態(tài)顯示,1月29日,,ChatGPT平臺的應(yīng)用編程接口(API)出現(xiàn)斷鏈,,時長近20分鐘,并且導(dǎo)致ChatGPT回答的錯誤率飆升,。OpenAI表示,,這主要是由于應(yīng)用訪問量激增,,進而導(dǎo)致服務(wù)器“宕機”。
有消息稱,,目前ChatGPT平臺主要使用英偉達A100和H100 GPU卡,,訓(xùn)練一次大約需要2.5萬塊A100芯片。如果訓(xùn)練GPT-5,,則還需要5萬張H100,。市場分析認為,隨著GPT模型的不斷迭代升級,,未來GPT-5或?qū)⒊霈F(xiàn)無“芯”可用的情況,。
除了需求之外,算力成本也是AI芯片采購的核心要素之一,。
公開數(shù)據(jù)顯示,,英偉達H100的價格已經(jīng)飆升至2.5萬-3萬美元,這意味著ChatGPT單次查詢的成本將提高至約0.04美元,。如果要把ChatGPT能力與谷歌搜索對抗的話,,不僅約481億美元的AI芯片投入,而且每年還需要約160億美元的芯片才能維持運作,。
如今,,英偉達已經(jīng)成為了AI大模型訓(xùn)練當(dāng)中必不可少的關(guān)鍵合作方。
據(jù)富國銀行統(tǒng)計顯示,,目前,,英偉達在數(shù)據(jù)中心AI市場擁有98%的市場份額,而AMD公司的市場份額僅有1.2%,,英特爾則只有不到1%,。
英偉達CEO黃仁勛(Photo: SCMP)
據(jù)Counterpoint Research,2023年,,英偉達的營收將飆升至303億美元,,比2022年的163億美元增長86%,躍升為2023年全球第三大半導(dǎo)體廠商,。富國銀行則預(yù)計,,英偉達2024年將會在數(shù)據(jù)中心市場獲得高達457億美元的營收,或創(chuàng)下歷史新高,。
富國銀行在報告中提到,,盡管AMD在2023年的AI芯片營收僅為4.61億美元,但是2024年將有望增長到21億美元,,屆時市場份額將攀升至4.2%,,英特爾也可能拿到將近2%的市場份額,而這將導(dǎo)致英偉達份額下降至94%。
對于OpenAI而言,,作為大模型廠商,,成本和滿足需求是兩個核心要素,而這兩點卻被“卡脖子”,,受制于英偉達,,因此,我們就不難理解奧爾特曼非得“自己造芯片”的原因——更安全和更長期可控的成本,,減少對英偉達的依賴,。
奧爾特曼曾多次“抱怨”AI芯片短缺問題,稱目前英偉達的芯片產(chǎn)能已不足以滿足未來的需求,。
去年10月的WSJ Live活動上,奧爾特曼首次回應(yīng)傳聞稱:不排除自研芯片這一選項,。
“對于是否采用定制硬件(芯片),,我們還在評估中。我們正努力確定如何擴大規(guī)模以滿足世界的需求,。雖然有可能不會研發(fā)芯片,,但我們正在與做出卓越成果的伙伴保持良好合作?!眾W爾特曼表示,。
(詳見鈦媒體App前文:《OpenAI CEO首次回應(yīng):不排除自研芯片|鈦媒體獨家》)
那么,OpenAI如何“造芯”,?就目前來看,,奧爾特曼手里的牌主要有三個:找投資人建廠、與頭部芯片制造商合作,、投資給其他初創(chuàng)公司聯(lián)合“造芯”,。
今年1月20日,彭博報道稱,,奧爾特曼正在與中東阿布扎比G42基金,、日本軟銀集團等全球投資者籌集超過80億美元資金,成立一家全新AI 芯片公司,,目標(biāo)是利用資金建立一個工廠網(wǎng)絡(luò)來制造芯片,,直接對標(biāo)英偉達。但目前談判仍處于早期階段,,完整名單尚不確定,。
不僅推進融資事宜,奧特曼也在加緊聯(lián)系頭部芯片制造商合作,。1月25日,,奧爾特曼與韓國存儲芯片龍頭SK海力士的CEO,以及SK 集團董事長會面,重點提及構(gòu)建“AI芯片聯(lián)盟”,,雙方或?qū)⒃贏I芯片設(shè)計,、制造等方面與三星和SK集團合作。
早前《金融時報》報道稱,,在接觸SK和三星之前,,奧爾特曼就已接觸英特爾,而且和臺積電討論過合作成立一家新的芯片工廠,。
英特爾CEO基辛格(Pat Gelsinger)日前宣布,,奧爾特曼將出席2月21日舉辦的首屆英特爾代工業(yè)務(wù)IFS Direct Connect 活動,奧爾特曼將作為嘉賓發(fā)表演講,,雙方或?qū)⒐己献魇马棥?/p>
事實上,,除了建廠以外,奧爾特曼還至少投資了3家芯片公司,。其中一家是美國知名的算力芯片公司Cerebras,。
據(jù)悉,Cerebras曾推出過打破世界紀(jì)錄的超大芯片產(chǎn)品,,其第二代AI 芯片WSE-2已達到2.6萬億個晶體管,,AI核心數(shù)量也達到85萬個。
第二家奧爾特曼投資的公司,,是基于RISC-V開源架構(gòu),、模仿大腦工作方式的芯片初創(chuàng)企業(yè)Rain Neuromorphics。據(jù)報道,,該公司既能訓(xùn)練算法,,又能在部署時運行。盡管第一批硬件尚未向客戶交付,,但OpenAI早已向該公司下單了價值5100萬美元的芯片,。
最后一家是Atomic Semi,由芯片大神Jim Keller和Sam Zeloof共同創(chuàng)立,,前者曾是AMD K8的首席架構(gòu)師,,還參與了蘋果A4/A5芯片的開發(fā)。Atomic Semi目標(biāo)是簡化芯片制造流程,,實現(xiàn)在快速生產(chǎn),,以期降低芯片成本。去年1月,,Atomic Semi宣布完成OpenAI的1億美元估值下的一輪融資,。
隨著大模型持續(xù)爆火,AI算力需求將不斷攀升,。奧爾特曼曾透露,,OpenAI希望保證到2030年有足夠的芯片供應(yīng)。
“圍剿”英偉達,新老守衛(wèi)者能否脫穎而出,?
除了OpenAI之外,,此次“圍剿”英偉達的隊伍主要包括三類:
- 一是英特爾、AMD這類芯片巨頭,,與英偉達“亦敵亦友”很久的時間,,對于GPU技術(shù)也有非常多的了解,如今希望“挑戰(zhàn)”英偉達,;
- 二是Meta,、亞馬遜、微軟這類互聯(lián)網(wǎng)和云服務(wù)廠商,,他們對于云端大模型技術(shù)很了解,,希望能借此降低成本且減少對英偉達的依賴;
- 三是近五年內(nèi)成立的芯片設(shè)計初創(chuàng)企業(yè),,如Tenstorrent,、Cerebras、Graphcore,、Etched、Extropic和MatX等公司,,因此其借助新一輪AI浪潮,,或?qū)⑼苿悠洚a(chǎn)品銷售迅速增長。
不過,,The information并不看好這么多AI芯片公司未來都持續(xù)存在,。
該報道指出,上一輪2015年崛起的多個與AI,、自動駕駛芯片初創(chuàng)公司,,最終卻隨著大公司入局和大規(guī)模并且而倒閉消失?!斑@凸顯了科技行業(yè)的一個模式:人才和資本流向火熱的地方,。”
那么,,企業(yè)如何構(gòu)建AI芯片技術(shù),、產(chǎn)品和商業(yè)化壁壘,是這場“圍剿”英偉達之戰(zhàn)的重要因素,。
黃仁勛近期公開表示,,華為、英特爾以及美國政府的出口管制,,已經(jīng)對英偉達在AI芯片市場的主導(dǎo)地位構(gòu)成了嚴峻挑戰(zhàn),。
2月1日,有消息傳出,英偉達針對美國最新出口管制新規(guī)而研發(fā)的三款中國“特供版”芯片HGX H20,,將于2024年第一季度開始小批量預(yù)定和交付,,預(yù)計二季度開始大批量交付。據(jù)悉,,H20芯片性能還不到H100的20%,,而整體價格H20定價為每張卡1.2萬美元至1.5萬美元,最終銷售價格約為11萬元人民幣(約合15320美元),,與華為Ascend 910B定價基本持平,。
另據(jù)經(jīng)銷商公開信息,配置8顆AI芯片的英偉達H20服務(wù)器售價為140萬元,。相比之下,,采用8顆H800芯片服務(wù)器去年售價高達200萬元左右。
對于英偉達將要發(fā)布的特定AI芯片新品,,阿里巴巴,、騰訊、新華三等公司早在2023年11月就開啟測試,。但多個消息顯示,,這些企業(yè)對于今年向英偉達訂購的芯片數(shù)量或?qū)⑦h遠少于此前的計劃。
英偉達在中國銷售高端顯卡變得越來越難,,而后面還有更多廠商進行“追趕”,,比如OpenAI“造芯”。因此,,隨著AI芯片市場競爭加劇,,新老守衛(wèi)者當(dāng)中,誰會從這場AI炒作浪潮中脫穎而出成為贏家,,未來這一重要市場如何變化,,這都將值得期待。
“很多人認為算力會迅速下降,,商業(yè)模式會隨著算力下降而成立,,但我們判斷,未來算力成本不會下降,,很長時間算力成本仍將持續(xù)位于高位,。”小冰公司CEO李笛近日對鈦媒體App表示,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1088941.html
溫馨提示:投資有風(fēng)險,,入市須謹慎。本資訊不作為投資理財建議,。