來源:閆躍龍
過去一年,,最熱的是什么?毫無疑問是AI(人工智能),?!犊铝炙褂⒄Z詞典》直接把“AI”選為2023“年度單詞”,在《咬文嚼字》發(fā)布的2023十大流行語中,,“人工智能大模型”也位列其中,。
但是,,在AI炙手可熱的時候,也出現(xiàn)了一些新趨勢、新問題,,尤其是作為AI基座的算力基礎(chǔ)設(shè)施如何才能最大程度釋放動能,,值得業(yè)界關(guān)注。
突破算力瓶頸成為當(dāng)務(wù)之急
AI的火爆,,與技術(shù)的發(fā)展,、行業(yè)的需求以及政策的重視都密不可分,而這一切都讓算力需求呈現(xiàn)出爆炸性增長,。
在技術(shù)發(fā)展上,,以大模型為代表的生成式人工智能在過去一年迎來大爆發(fā)。正如中國科學(xué)院計算技術(shù)研究所研究員張云泉所說,,“大模型+大算力+大數(shù)據(jù)”成為新一代人工智能發(fā)展的基本范式,。相關(guān)數(shù)據(jù)預(yù)測,大模型的出現(xiàn),,使得2018年以來基于Transformer架構(gòu)的大模型訓(xùn)練算力平均每年增長十倍,,新的摩爾定律已經(jīng)出現(xiàn),即訓(xùn)練算力每20個月翻一番,。
在行業(yè)需求上,,大模型正在走向千行百業(yè),催生各個行業(yè)走向深入的智能化轉(zhuǎn)型,。在2024聯(lián)想創(chuàng)新科技大會上,,聯(lián)想集團董事長兼CEO楊元慶表示,混合式人工智能是人工智能觸達(dá)并賦能行業(yè)的必然路徑,,企業(yè)大模型將對本企業(yè)的數(shù)據(jù)進(jìn)行學(xué)習(xí)推理,,助力企業(yè)提高生產(chǎn)力。Gartner的報告指出,,80%的企業(yè)將在2026年使用生成式AI,,2027年企業(yè)在生成式AI上的支出將是2024年的近4倍。顯然,,AI在行業(yè)滲透率的增強將進(jìn)一步加速對算力的需求,。
值得注意的是,,AI以及由此產(chǎn)生的算力基礎(chǔ)設(shè)施建設(shè),,也得到政策的高度重視。在今年的兩會政府工作報告中,,首次提出“人工智能+”,。尤其是當(dāng)前中國正在加快發(fā)展的新質(zhì)生產(chǎn)力,讓AI及算力更是可以大展身手,。工業(yè)和信息化部發(fā)布的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》明確指出,,算力是集信息計算力、網(wǎng)絡(luò)運載力,、數(shù)據(jù)存儲力于一體的新型生產(chǎn)力,,主要通過算力基礎(chǔ)設(shè)施向社會提供服務(wù)??梢?,算力作為支撐人工智能發(fā)展的底座,就是典型的新質(zhì)生產(chǎn)力,。
一方面,,是對算力的爆炸性需求,但另一方面,,算力的利用率卻不高,,起碼有三座大山困擾著算力的使用效能。
首先,,是高復(fù)雜的大山,,一邊是千行百業(yè)的眾多應(yīng)用場景,另一邊是豐富的算法框架和算子庫,,如何選擇最適合自己的算力,,是一大問題。
其次是低效率的大山,,千卡乃至萬卡集群的大背景下,,頻發(fā)的AI訓(xùn)練故障導(dǎo)致故障恢復(fù)時間長,以及GPU虛擬化能力弱,、網(wǎng)絡(luò)通信瓶頸大等問題,,都導(dǎo)致AI算力的利用率低、可用性差,。如Meta就曾在訓(xùn)練OPT-175B模型的日志中提到,,幾乎整個訓(xùn)練過程都要面對不停地重啟和中斷,尤其在兩個星期的時間段內(nèi)因為硬件,、基礎(chǔ)設(shè)施或?qū)嶒灧€(wěn)定性問題而重新啟動了40多次,。
再次,是高能耗的大山,。特斯拉CEO馬斯克認(rèn)為,,未來幾年內(nèi)AI行業(yè)將由“缺硅”變?yōu)椤叭彪姟薄Sミ_(dá)的創(chuàng)始人兼CEO黃仁勛近期更是表示,,AI的盡頭是光伏和儲能,,說的都是伴隨AI發(fā)展所帶來的高能耗挑戰(zhàn)。
總結(jié)起來,,現(xiàn)在算力領(lǐng)域的主要矛盾,,已經(jīng)變成了各行各業(yè)對算力的爆炸性需求與算力緊缺,、利用率不高的矛盾。
提升算力效能的“萬全之策”
如何才能翻越壓在算力效能上的這三座大山,?聯(lián)想集團副總裁,、聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群總經(jīng)理陳振寬給出了聯(lián)想AI基礎(chǔ)設(shè)施聚焦的三大能力:為用戶匹配經(jīng)過驗證優(yōu)化的最佳算力;賦能用戶充分利用算力,、提升計算效率,;以先進(jìn)的液冷技術(shù)幫助用戶節(jié)能增效且突破芯片散熱的瓶頸。
聯(lián)想集團副總裁,、聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群總經(jīng)理陳振寬
可以說,這三大能力,,以及聯(lián)想最新發(fā)布的五大創(chuàng)新,,都是直擊用戶痛點,用技術(shù)創(chuàng)新來應(yīng)對算力領(lǐng)域的矛盾,。
尤其值得關(guān)注的是最新發(fā)布的聯(lián)想萬全異構(gòu)智算平臺,,是用差異化的技術(shù)讓用戶獲得更高效、更穩(wěn)定的算力,。聯(lián)想萬全異構(gòu)智算平臺,,是一個能高度自動化完成AI全流程開發(fā)的平臺,其下納豐富的算力生態(tài),、上接各類場景優(yōu)化的模型和AI工具集,,既像是一個超級資源調(diào)度器和放大器,也承擔(dān)著類似算力提效超級大腦的角色,。
陳振寬這樣描述聯(lián)想萬全異構(gòu)智算平臺的定位:“聯(lián)想萬全異構(gòu)智算平臺是AI 2.0時代聯(lián)想中國基礎(chǔ)設(shè)施戰(zhàn)略框架的核心,,它融合了聯(lián)想的五大技術(shù)創(chuàng)新,是AI 2.0時代大模型訓(xùn)練和推理的基礎(chǔ)設(shè)施底座,。”
聯(lián)想萬全異構(gòu)智算平臺的最大突破,在算法的技術(shù)創(chuàng)新上,。以GPU內(nèi)核態(tài)虛擬化技術(shù)為例,,就解決了大多數(shù)操作系統(tǒng)層面的GPU虛擬化算法在多租戶、多容器場景下存在的問題,,如無序資源搶占,、等待性能開銷、顆粒度過粗,?!?strong>聯(lián)想研究院開發(fā)了在GPU驅(qū)動層的內(nèi)核態(tài)虛擬化算法,新算法可以將虛擬化造成的GPU算力損耗降到5%以下,,極致情況可以降到1%以下,,大幅提升GPU利用率,。”陳振寬說。
分鐘級AI斷點續(xù)訓(xùn),,解決的是AI訓(xùn)練故障中斷造成的算力可用性差的問題,。常規(guī)的斷點續(xù)訓(xùn),是訓(xùn)練前備份,,訓(xùn)練中設(shè)檢查點并更新備份,故障發(fā)生后,,通過診斷,、隔離或解決故障,恢復(fù)時間通常需要數(shù)小時,,算力浪費嚴(yán)重,。聯(lián)想的分鐘級AI斷點續(xù)訓(xùn)技術(shù),通過多級備份策略,、全面實時監(jiān)控,,尤其是以AI預(yù)測AI故障,可以實現(xiàn)故障的分鐘級恢復(fù),,大幅提升了算力可用性,,以千卡集群為例每月可以節(jié)省上百萬元的算力費用支出。
此外,,突破集群計算瓶頸的聯(lián)想集合通訊庫技術(shù),可以將訓(xùn)練效率提升10-15%,;破局算力孤島的異構(gòu)集群超級調(diào)度技術(shù)可以打開AI和HPC算力的共享之門,,都能助力客戶獲得持續(xù)穩(wěn)定的算力輸出。
綜合來看,,聯(lián)想在推動AI基礎(chǔ)設(shè)施釋放最大動能,,關(guān)鍵在于三種“力”。
其一,,是技術(shù)力,。聯(lián)想萬全異構(gòu)智算平臺所蘊含的四大算法創(chuàng)新,彰顯出其強大的技術(shù)力,。聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群戰(zhàn)略總監(jiān)黃山在講解聯(lián)想集合通信庫技術(shù)時提到的一個例子特別有趣,,在該技術(shù)研究過程中,參考了蟻群算法,。在螞蟻群落搬運食物時,,一只螞蟻成功拿到食物后會釋放行動成功的信息素,一條路徑的信息素濃度越高,,代表成功率越大,,螞蟻就是這樣找到成功的捷徑,。蟻群算法就是這樣產(chǎn)生的,并成功解決了城市旅商問題,,即一名商人從一個城市出發(fā)遍歷十個城市回到起點的最優(yōu)路徑,,也對聯(lián)想的集合通信庫技術(shù)提供了重要參考。聯(lián)想,,就是這樣不斷對算法探索,、創(chuàng)新。
其二,,是進(jìn)化力,。破解算力高效利用、降低算力能耗的步伐永無止境,,陳振寬透露,,未來聯(lián)想將挑戰(zhàn)分鐘內(nèi)的斷點續(xù)訓(xùn),持續(xù)優(yōu)化超大規(guī)模集群的通訊算法,,深入研究相變式液冷技術(shù),,并布局模塊化液冷數(shù)據(jù)中心??梢钥吹?,聯(lián)想的AI基礎(chǔ)設(shè)施是持續(xù)進(jìn)化的,這也意味著其將能不斷刷新算力釋放的高度,。
其三,,是生態(tài)力。2024聯(lián)想創(chuàng)新科技大會上另一個值得關(guān)注的,,是異構(gòu)智算產(chǎn)業(yè)生態(tài)聯(lián)盟的起航,。這個覆蓋AI芯片層、AI設(shè)備與系統(tǒng)層和AI平臺與應(yīng)用層,,涵蓋IaaS平臺,、AI訓(xùn)練與推理、行業(yè)場景解決方案的生態(tài)聯(lián)盟,,無疑將能匯聚基礎(chǔ)設(shè)施上下游企業(yè),、學(xué)術(shù)界和研究機構(gòu)的力量,整合資源,,提高產(chǎn)業(yè)競爭力,,促進(jìn)行業(yè)規(guī)范化發(fā)展。
這一切,,都是聯(lián)想讓算力高效利用、釋放最大動能的關(guān)鍵所在。
“一橫五縱”的戰(zhàn)略布局造就堅實底座
值得注意的是,,伴隨聯(lián)想萬全異構(gòu)智算平臺的發(fā)布,,聯(lián)想在基礎(chǔ)設(shè)施上“一橫五縱”的戰(zhàn)略布局非常清晰。
在今年2月舉行的MWC2024上,,聯(lián)想執(zhí)行副總裁,、中國區(qū)總裁劉軍首次公布聯(lián)想“一橫五縱”的AI導(dǎo)向的基礎(chǔ)設(shè)施布局。具體來說,,“一橫”即聯(lián)想萬全異構(gòu)智算平臺,,“五縱”就是服務(wù)器、存儲,、數(shù)據(jù)網(wǎng)絡(luò),、軟件及超融合以及邊緣基礎(chǔ)設(shè)施產(chǎn)品和方案。
陳振寬說,,作為聯(lián)想“全棧AI”戰(zhàn)略布局的中堅力量,聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)正以“一橫五縱”戰(zhàn)略框架,,通過構(gòu)建布局完整,、穩(wěn)定高效的AI導(dǎo)向的基礎(chǔ)設(shè)施,為企業(yè)智能化轉(zhuǎn)型打造堅實可靠的智算底座,。
可以看到,聯(lián)想的“一橫五縱”戰(zhàn)略布局共同組成了聯(lián)想AI基礎(chǔ)設(shè)施的核心競爭力,。陳振寬在接受采訪時表示:“聯(lián)想AI基礎(chǔ)設(shè)施的五大產(chǎn)品,,將基于AI進(jìn)行升級和重構(gòu),同時,,聯(lián)想將五大產(chǎn)品融為一體,,通過聯(lián)想萬全異構(gòu)計算平臺實現(xiàn)全面融合。”
因此,,正是這“一橫五縱”的戰(zhàn)略布局,,讓聯(lián)想給出了AI時代基礎(chǔ)設(shè)施成就堅實底座的“萬全之策”。
后記:激發(fā)新質(zhì)生產(chǎn)力的引擎
中國科學(xué)院院士陳潤生,,在評價AI發(fā)展時,,用到了一個詞:“范式”:“人工智能的發(fā)展,尤其是大模型,,為我們提供了一種新的范式,。”
“范式”一詞,,是托馬斯·庫恩在《科學(xué)革命的結(jié)構(gòu)》中第一次提出的概念,,指的是某一領(lǐng)域重大思維方式的變革。人類歷史上的每一次重大變革,,都是“范式革命”的產(chǎn)物,。
AI要想真正引發(fā)范式革命,,作為基座的算力基礎(chǔ)設(shè)施能否釋放出最大價值是關(guān)鍵。站在這個角度審視聯(lián)想推出的萬全異構(gòu)智算平臺以及異構(gòu)智算產(chǎn)業(yè)生態(tài)聯(lián)盟,,就知其重要意義,。
可以說,站在40歲的特殊時點,,聯(lián)想這個公司又一次迎來了AI這個范式革命所提供的歷史性機遇,,無論是在智能終端領(lǐng)域的AI PC,,還是基礎(chǔ)設(shè)施領(lǐng)域的AI基礎(chǔ)設(shè)施,都是如此,。
之所以這樣,,是因為機會總是留給有準(zhǔn)備的人或者企業(yè),。拿基礎(chǔ)設(shè)施來說,,聯(lián)想之所以站在了AI領(lǐng)域的最前沿,,至少是因為三點:
首先,,是經(jīng)驗足。就像劉軍所說,,早在本地計算和存儲為主的時期,,聯(lián)想就推出了第一臺IA架構(gòu)的PC服務(wù)器,,開創(chuàng)國產(chǎn)PC服務(wù)器新紀(jì)元,而在互聯(lián)網(wǎng)催生通用算力和科學(xué)計算算力需求迸發(fā)的時代,,聯(lián)想成為中國算力領(lǐng)軍企業(yè),。豐富的經(jīng)驗,讓聯(lián)想可以承前啟后,有機會在大模型為代表的AI時代持續(xù)引領(lǐng),。
其次,,是布局全,。在基礎(chǔ)設(shè)施領(lǐng)域,,聯(lián)想構(gòu)建起“一橫五縱”的完整業(yè)務(wù)布局,,尤其是此次發(fā)布的萬全異構(gòu)智算平臺這“一縱”,,更是AI基礎(chǔ)設(shè)施的點睛之筆,,軟硬兼施,,讓AI基礎(chǔ)設(shè)施蛻變,。
然后,就是洞察深,。聯(lián)想此次發(fā)布的AI基礎(chǔ)設(shè)施領(lǐng)域的五大創(chuàng)新,,無一不是洞察客戶痛點,用技術(shù)創(chuàng)新的結(jié)果,。這些創(chuàng)新,,最終實現(xiàn)的結(jié)果,就是把復(fù)雜留給技術(shù),、把簡單留給客戶,,一切都只為客戶可以將AI基礎(chǔ)設(shè)施的價值發(fā)揮到最大化,,更好地支撐起AI,、大模型等的發(fā)展。
“人工智能技術(shù)給我們帶來的新時代是百花齊放,,百舸爭流的時代,,也將是英雄輩出的時代。聯(lián)想將持續(xù)投入,,堅持創(chuàng)新,,持續(xù)升級萬全之力,為英雄助力,,成就英雄,。加速中國智能化轉(zhuǎn)型,,釋放社會進(jìn)步新動能。” 陳振寬這樣說,。
人工智能已成為我國加快發(fā)展新質(zhì)生產(chǎn)力的核心驅(qū)動力,。可以預(yù)計,,當(dāng)AI基礎(chǔ)設(shè)施堅如磐石,,人工智能將能更快地走入千行百業(yè)以及千家萬戶,更好地迸發(fā)新質(zhì)生產(chǎn)力,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1098477.html
溫馨提示:投資有風(fēng)險,入市須謹(jǐn)慎,。本資訊不作為投資理財建議,。