來源:閆躍龍
過去一年,最熱的是什么,?毫無疑問是AI(人工智能),。《柯林斯英語詞典》直接把“AI”選為2023“年度單詞”,,在《咬文嚼字》發(fā)布的2023十大流行語中,,“人工智能大模型”也位列其中,。
但是,,在AI炙手可熱的時候,也出現(xiàn)了一些新趨勢,、新問題,,尤其是作為AI基座的算力基礎設施如何才能最大程度釋放動能,值得業(yè)界關注,。
突破算力瓶頸成為當務之急
AI的火爆,,與技術的發(fā)展、行業(yè)的需求以及政策的重視都密不可分,,而這一切都讓算力需求呈現(xiàn)出爆炸性增長,。
在技術發(fā)展上,以大模型為代表的生成式人工智能在過去一年迎來大爆發(fā),。正如中國科學院計算技術研究所研究員張云泉所說,,“大模型+大算力+大數(shù)據(jù)”成為新一代人工智能發(fā)展的基本范式。相關數(shù)據(jù)預測,,大模型的出現(xiàn),,使得2018年以來基于Transformer架構的大模型訓練算力平均每年增長十倍,新的摩爾定律已經(jīng)出現(xiàn),,即訓練算力每20個月翻一番,。
在行業(yè)需求上,大模型正在走向千行百業(yè),,催生各個行業(yè)走向深入的智能化轉型,。在2024聯(lián)想創(chuàng)新科技大會上,聯(lián)想集團董事長兼CEO楊元慶表示,,混合式人工智能是人工智能觸達并賦能行業(yè)的必然路徑,,企業(yè)大模型將對本企業(yè)的數(shù)據(jù)進行學習推理,助力企業(yè)提高生產(chǎn)力,。Gartner的報告指出,,80%的企業(yè)將在2026年使用生成式AI,2027年企業(yè)在生成式AI上的支出將是2024年的近4倍,。顯然,,AI在行業(yè)滲透率的增強將進一步加速對算力的需求,。
值得注意的是,,AI以及由此產(chǎn)生的算力基礎設施建設,,也得到政策的高度重視。在今年的兩會政府工作報告中,,首次提出“人工智能+”,。尤其是當前中國正在加快發(fā)展的新質(zhì)生產(chǎn)力,讓AI及算力更是可以大展身手,。工業(yè)和信息化部發(fā)布的《算力基礎設施高質(zhì)量發(fā)展行動計劃》明確指出,,算力是集信息計算力、網(wǎng)絡運載力,、數(shù)據(jù)存儲力于一體的新型生產(chǎn)力,,主要通過算力基礎設施向社會提供服務??梢?,算力作為支撐人工智能發(fā)展的底座,就是典型的新質(zhì)生產(chǎn)力,。
一方面,是對算力的爆炸性需求,,但另一方面,,算力的利用率卻不高,起碼有三座大山困擾著算力的使用效能,。
首先,,是高復雜的大山,一邊是千行百業(yè)的眾多應用場景,,另一邊是豐富的算法框架和算子庫,,如何選擇最適合自己的算力,是一大問題,。
其次是低效率的大山,,千卡乃至萬卡集群的大背景下,頻發(fā)的AI訓練故障導致故障恢復時間長,,以及GPU虛擬化能力弱,、網(wǎng)絡通信瓶頸大等問題,都導致AI算力的利用率低,、可用性差,。如Meta就曾在訓練OPT-175B模型的日志中提到,幾乎整個訓練過程都要面對不停地重啟和中斷,,尤其在兩個星期的時間段內(nèi)因為硬件,、基礎設施或實驗穩(wěn)定性問題而重新啟動了40多次,。
再次,是高能耗的大山,。特斯拉CEO馬斯克認為,,未來幾年內(nèi)AI行業(yè)將由“缺硅”變?yōu)椤叭彪姟薄Sミ_的創(chuàng)始人兼CEO黃仁勛近期更是表示,,AI的盡頭是光伏和儲能,,說的都是伴隨AI發(fā)展所帶來的高能耗挑戰(zhàn)。
總結起來,,現(xiàn)在算力領域的主要矛盾,,已經(jīng)變成了各行各業(yè)對算力的爆炸性需求與算力緊缺、利用率不高的矛盾,。
提升算力效能的“萬全之策”
如何才能翻越壓在算力效能上的這三座大山,?聯(lián)想集團副總裁、聯(lián)想中國基礎設施業(yè)務群總經(jīng)理陳振寬給出了聯(lián)想AI基礎設施聚焦的三大能力:為用戶匹配經(jīng)過驗證優(yōu)化的最佳算力,;賦能用戶充分利用算力,、提升計算效率;以先進的液冷技術幫助用戶節(jié)能增效且突破芯片散熱的瓶頸,。
聯(lián)想集團副總裁、聯(lián)想中國基礎設施業(yè)務群總經(jīng)理陳振寬
可以說,,這三大能力,,以及聯(lián)想最新發(fā)布的五大創(chuàng)新,都是直擊用戶痛點,,用技術創(chuàng)新來應對算力領域的矛盾,。
尤其值得關注的是最新發(fā)布的聯(lián)想萬全異構智算平臺,是用差異化的技術讓用戶獲得更高效,、更穩(wěn)定的算力,。聯(lián)想萬全異構智算平臺,是一個能高度自動化完成AI全流程開發(fā)的平臺,,其下納豐富的算力生態(tài),、上接各類場景優(yōu)化的模型和AI工具集,既像是一個超級資源調(diào)度器和放大器,,也承擔著類似算力提效超級大腦的角色,。
陳振寬這樣描述聯(lián)想萬全異構智算平臺的定位:“聯(lián)想萬全異構智算平臺是AI 2.0時代聯(lián)想中國基礎設施戰(zhàn)略框架的核心,它融合了聯(lián)想的五大技術創(chuàng)新,,是AI 2.0時代大模型訓練和推理的基礎設施底座,。”
聯(lián)想萬全異構智算平臺的最大突破,在算法的技術創(chuàng)新上,。以GPU內(nèi)核態(tài)虛擬化技術為例,,就解決了大多數(shù)操作系統(tǒng)層面的GPU虛擬化算法在多租戶、多容器場景下存在的問題,,如無序資源搶占,、等待性能開銷、顆粒度過粗,?!?strong>聯(lián)想研究院開發(fā)了在GPU驅動層的內(nèi)核態(tài)虛擬化算法,新算法可以將虛擬化造成的GPU算力損耗降到5%以下,,極致情況可以降到1%以下,,大幅提升GPU利用率。”陳振寬說,。
分鐘級AI斷點續(xù)訓,,解決的是AI訓練故障中斷造成的算力可用性差的問題。常規(guī)的斷點續(xù)訓,,是訓練前備份,,訓練中設檢查點并更新備份,故障發(fā)生后,,通過診斷,、隔離或解決故障,恢復時間通常需要數(shù)小時,,算力浪費嚴重,。聯(lián)想的分鐘級AI斷點續(xù)訓技術,通過多級備份策略,、全面實時監(jiān)控,尤其是以AI預測AI故障,,可以實現(xiàn)故障的分鐘級恢復,,大幅提升了算力可用性,以千卡集群為例每月可以節(jié)省上百萬元的算力費用支出,。
此外,突破集群計算瓶頸的聯(lián)想集合通訊庫技術,,可以將訓練效率提升10-15%,;破局算力孤島的異構集群超級調(diào)度技術可以打開AI和HPC算力的共享之門,都能助力客戶獲得持續(xù)穩(wěn)定的算力輸出,。
綜合來看,,聯(lián)想在推動AI基礎設施釋放最大動能,關鍵在于三種“力”。
其一,,是技術力,。聯(lián)想萬全異構智算平臺所蘊含的四大算法創(chuàng)新,彰顯出其強大的技術力,。聯(lián)想中國基礎設施業(yè)務群戰(zhàn)略總監(jiān)黃山在講解聯(lián)想集合通信庫技術時提到的一個例子特別有趣,,在該技術研究過程中,參考了蟻群算法,。在螞蟻群落搬運食物時,,一只螞蟻成功拿到食物后會釋放行動成功的信息素,一條路徑的信息素濃度越高,,代表成功率越大,,螞蟻就是這樣找到成功的捷徑。蟻群算法就是這樣產(chǎn)生的,,并成功解決了城市旅商問題,,即一名商人從一個城市出發(fā)遍歷十個城市回到起點的最優(yōu)路徑,也對聯(lián)想的集合通信庫技術提供了重要參考,。聯(lián)想,,就是這樣不斷對算法探索、創(chuàng)新,。
其二,,是進化力。破解算力高效利用,、降低算力能耗的步伐永無止境,,陳振寬透露,未來聯(lián)想將挑戰(zhàn)分鐘內(nèi)的斷點續(xù)訓,,持續(xù)優(yōu)化超大規(guī)模集群的通訊算法,,深入研究相變式液冷技術,并布局模塊化液冷數(shù)據(jù)中心,??梢钥吹剑?lián)想的AI基礎設施是持續(xù)進化的,,這也意味著其將能不斷刷新算力釋放的高度,。
其三,是生態(tài)力,。2024聯(lián)想創(chuàng)新科技大會上另一個值得關注的,,是異構智算產(chǎn)業(yè)生態(tài)聯(lián)盟的起航。這個覆蓋AI芯片層,、AI設備與系統(tǒng)層和AI平臺與應用層,,涵蓋IaaS平臺、AI訓練與推理、行業(yè)場景解決方案的生態(tài)聯(lián)盟,,無疑將能匯聚基礎設施上下游企業(yè),、學術界和研究機構的力量,整合資源,,提高產(chǎn)業(yè)競爭力,,促進行業(yè)規(guī)范化發(fā)展。
這一切,,都是聯(lián)想讓算力高效利用、釋放最大動能的關鍵所在,。
“一橫五縱”的戰(zhàn)略布局造就堅實底座
值得注意的是,,伴隨聯(lián)想萬全異構智算平臺的發(fā)布,聯(lián)想在基礎設施上“一橫五縱”的戰(zhàn)略布局非常清晰,。
在今年2月舉行的MWC2024上,,聯(lián)想執(zhí)行副總裁、中國區(qū)總裁劉軍首次公布聯(lián)想“一橫五縱”的AI導向的基礎設施布局,。具體來說,,“一橫”即聯(lián)想萬全異構智算平臺,“五縱”就是服務器,、存儲,、數(shù)據(jù)網(wǎng)絡、軟件及超融合以及邊緣基礎設施產(chǎn)品和方案,。
陳振寬說,,作為聯(lián)想“全棧AI”戰(zhàn)略布局的中堅力量,聯(lián)想中國基礎設施業(yè)務正以“一橫五縱”戰(zhàn)略框架,,通過構建布局完整,、穩(wěn)定高效的AI導向的基礎設施,為企業(yè)智能化轉型打造堅實可靠的智算底座,。
可以看到,聯(lián)想的“一橫五縱”戰(zhàn)略布局共同組成了聯(lián)想AI基礎設施的核心競爭力,。陳振寬在接受采訪時表示:“聯(lián)想AI基礎設施的五大產(chǎn)品,將基于AI進行升級和重構,,同時,,聯(lián)想將五大產(chǎn)品融為一體,通過聯(lián)想萬全異構計算平臺實現(xiàn)全面融合,。”
因此,,正是這“一橫五縱”的戰(zhàn)略布局,讓聯(lián)想給出了AI時代基礎設施成就堅實底座的“萬全之策”。
后記:激發(fā)新質(zhì)生產(chǎn)力的引擎
中國科學院院士陳潤生,,在評價AI發(fā)展時,,用到了一個詞:“范式”:“人工智能的發(fā)展,尤其是大模型,,為我們提供了一種新的范式,。”
“范式”一詞,,是托馬斯·庫恩在《科學革命的結構》中第一次提出的概念,,指的是某一領域重大思維方式的變革。人類歷史上的每一次重大變革,,都是“范式革命”的產(chǎn)物,。
AI要想真正引發(fā)范式革命,作為基座的算力基礎設施能否釋放出最大價值是關鍵,。站在這個角度審視聯(lián)想推出的萬全異構智算平臺以及異構智算產(chǎn)業(yè)生態(tài)聯(lián)盟,,就知其重要意義。
可以說,,站在40歲的特殊時點,,聯(lián)想這個公司又一次迎來了AI這個范式革命所提供的歷史性機遇,無論是在智能終端領域的AI PC,,還是基礎設施領域的AI基礎設施,,都是如此。
之所以這樣,,是因為機會總是留給有準備的人或者企業(yè),。拿基礎設施來說,聯(lián)想之所以站在了AI領域的最前沿,,至少是因為三點:
首先,,是經(jīng)驗足。就像劉軍所說,,早在本地計算和存儲為主的時期,,聯(lián)想就推出了第一臺IA架構的PC服務器,開創(chuàng)國產(chǎn)PC服務器新紀元,,而在互聯(lián)網(wǎng)催生通用算力和科學計算算力需求迸發(fā)的時代,,聯(lián)想成為中國算力領軍企業(yè)。豐富的經(jīng)驗,,讓聯(lián)想可以承前啟后,,有機會在大模型為代表的AI時代持續(xù)引領。
其次,,是布局全,。在基礎設施領域,聯(lián)想構建起“一橫五縱”的完整業(yè)務布局,,尤其是此次發(fā)布的萬全異構智算平臺這“一縱”,,更是AI基礎設施的點睛之筆,軟硬兼施,,讓AI基礎設施蛻變,。
然后,就是洞察深,。聯(lián)想此次發(fā)布的AI基礎設施領域的五大創(chuàng)新,,無一不是洞察客戶痛點,用技術創(chuàng)新的結果,。這些創(chuàng)新,,最終實現(xiàn)的結果,就是把復雜留給技術,、把簡單留給客戶,,一切都只為客戶可以將AI基礎設施的價值發(fā)揮到最大化,更好地支撐起AI,、大模型等的發(fā)展,。
“人工智能技術給我們帶來的新時代是百花齊放,百舸爭流的時代,,也將是英雄輩出的時代,。聯(lián)想將持續(xù)投入,堅持創(chuàng)新,,持續(xù)升級萬全之力,,為英雄助力,成就英雄,。加速中國智能化轉型,,釋放社會進步新動能。” 陳振寬這樣說,。
人工智能已成為我國加快發(fā)展新質(zhì)生產(chǎn)力的核心驅動力,。可以預計,,當AI基礎設施堅如磐石,,人工智能將能更快地走入千行百業(yè)以及千家萬戶,更好地迸發(fā)新質(zhì)生產(chǎn)力,。
免責聲明:本文來自網(wǎng)絡收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權歸原作者所有,。轉載請注明出處:http://lequren.com/1098477.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。