◇AI+時代,公共云將成為破解算力資源緊張,、降低算力成本的關鍵抓手◇公共云可以多路復用,,通過多租戶使用同一套計算資源大池,削峰填谷,,顯著提升硬件資源利用率,,降低使用成本◇公共云和AI相結合還將推動云計算走向云智算文?|《瞭望》新聞周刊記者?扈永順觀眾在杭州舉行的 2023 云棲大會上了解云計算產(chǎn)品及應用(2023 年10月31日攝) 黃宗治攝 / 本刊新一代人工智能技術正步入跨越式發(fā)展新階段,成為引領現(xiàn)代產(chǎn)業(yè)變革的核心力量,?!?span id="a6otyhj" class="wpcom_keyword_link">人工智能+”今年首次被寫入政府工作報告,,多地積極探索推動AI深度賦能實體經(jīng)濟,開啟了AI在各行各業(yè)廣泛應用的新篇章,。隨著AI技術和應用創(chuàng)新不斷加速,,模型復雜度和數(shù)據(jù)量急劇增加,對包括算力在內(nèi)的新型基礎設施建設提出了新需求和新要求,,建立適應AI+時代的高質(zhì)量算力服務體系迫在眉睫,。日前國家信息中心信息化和產(chǎn)業(yè)發(fā)展部發(fā)布了《“人工智能+”時代公共云發(fā)展模式與路徑研究》報告,提出公共云是破解我國AI+時代算力“供不上、用不起”瓶頸問題的重要抓手,。公共云是指面向公眾提供的云計算資源,,通過聚合各類算力并通過在線的模式為各類用戶提供簡單易用,且近乎無限擴展的計算服務,,其本質(zhì)是將云計算資源規(guī)?;⒋蠓秶M行共享,?!肮苍颇芤再Y源利用效率最大化的方式,幫助提升我國算力供給能力,,并通過規(guī)模經(jīng)濟效應推動算力門檻降低,,讓更多的用戶享受普適普惠的算力服務?!眹倚畔⒅行男畔⒒彤a(chǎn)業(yè)發(fā)展部主任單志廣介紹,。智能算力緊缺制約大模型規(guī)模化應用智能算力資源緊缺已成為制約大模型規(guī)?;瘧玫闹饕款i,。按照應用和功能特性,,算力可分為基礎算力,、智能算力、超算算力三類,,基礎算力主要基于CPU芯片,,用于滿足基礎通用計算需求,如網(wǎng)購,、打游戲等,;智能算力基于GPU、FPGA(現(xiàn)場可編程門陣列),、ASIC(專用集成電路芯片)等AI芯片的加速計算平臺,,主要用于人工智能的訓練和推理計算,如語音,、圖像和視頻的處理,;超算算力由超級計算機等高性能計算集群提供,主要用于尖端科學領域的計算,。智能算力方面,,以AIGC(生成式人工智能)為代表的AI應用、大模型訓練等所使用的數(shù)據(jù)量和參數(shù)規(guī)模呈指數(shù)級增長,,帶來了智能算力需求爆炸式增加,。例如GPT-3模型參數(shù)約為1746億個,訓練一次需要以每秒一千萬億次計算,運行3640天,。GPT-4參數(shù)數(shù)量擴大到1.8萬億個,,是GPT-3的10倍,訓練算力需求上升到GPT-3的68倍,,在2.5萬個A100芯片上需要訓練90~100天,。在中文大語言模型方面,2023年3月百度發(fā)布文心一言,,4月華為發(fā)布盤古大模型,,阿里發(fā)布通義千問大模型,商湯科技公布日日新大模型體系,,5月科大訊飛發(fā)布星火大模型等,,到目前我國大語言模型已有上百個。根據(jù)中國信息通信研究院測算,,從設備供給側看,,2022年我國計算設備總算力規(guī)模中,基礎算力占比40%,,智能算力占比則高達59%,,成為算力快速增長的驅(qū)動力。根據(jù)預測,,到2026年智能算力規(guī)模將進入每秒十萬億億次浮點計算(ZFlops)級別,。“大語言模型發(fā)展帶來了AI算力需求的快速上升,,所消耗的計算資源每幾個月翻一倍,,算力需求的增長速度已經(jīng)遠超芯片性能提升和產(chǎn)能擴張速度上限?!眴沃緩V介紹,。公共云具備緩解算力緊缺潛力公共云是以需求為導向以應用為目的的一種公共服務模式。AI+時代,,公共云將成為破解算力資源緊張,、降低算力成本的關鍵抓手。首先,,公共云具備訓練大模型所需的強算力,。訓練全球領先的基礎大模型需要調(diào)度至少萬張GPU芯片高效協(xié)同工作,只有極少數(shù)公共云具備相應能力,。從亞馬遜,、微軟和谷歌等科技巨頭運營公共云的經(jīng)驗來看,其優(yōu)勢是規(guī)模大,、效率高,,天然能向全球市場擴張,。其次,公共云的規(guī)模效應能夠帶來算力普惠,。隨著AI大模型規(guī)?;瘧茫魏A坑脩纛l繁使用所需要的推理算力成本也將急劇上升,,尤其是多模態(tài)大模型對于算力的消耗將遠高于文本類大語言模型,。算力成本是限制大模型發(fā)展的關鍵因素之一,中小型AI企業(yè)往往難以通過自建算力設施解決訓練和推理算力需求,,因此算力租賃需求旺盛,。公共云可以多路復用,通過多租戶使用同一套計算資源大池,,削峰填谷,,顯著提升硬件資源利用率,降低使用成本,。例如亞馬遜,、阿里云等公共云廠商隨著用戶規(guī)模增加、技術優(yōu)化和運營效率提升,,持續(xù)降低云計算服務價格,,亞馬遜AWS曾連續(xù)三年每年降價12次;過去十年阿里云將計算成本降低了80%,,存儲成本降低了近90%,。再者,公共云能夠?qū)崿F(xiàn)我國算力供給能力的邊界突破,。公共云通過集群的計算,、網(wǎng)絡,、存儲平衡設計和軟硬一體化加速技術,,調(diào)度“盤活”已有芯片,可以形成超大規(guī)模算力資源池,,實現(xiàn)芯片復用,、彈性可擴展;發(fā)揮公共云大規(guī)模機器調(diào)度,、異構芯片兼容能力,,不僅能將已有先進芯片集約化利用,還能充分利用已有的通用CPU資源,,為AI大模型訓練和推理應用提供必要的算力支持,;隨著公共云技術體系加速升級,AI訓練,、AI推理以及HPC超算等計算資源將并池管理,,實現(xiàn)算力普惠和模型普及。推動云計算走向云智算公共云和AI相結合將推動云計算走向云智算。未來云計算將不再局限于IT計算本身,,而是提供包括算力,、模型、數(shù)據(jù),、生態(tài)等與智能化發(fā)展相關的全方位創(chuàng)新服務,,從而促進AI+切實落地,引領新質(zhì)生產(chǎn)力發(fā)展,。推動云計算走向云智算,,亟待解決技術層面的短板。國家信息中心信息化和產(chǎn)業(yè)發(fā)展部提出了公共云技術服務架構解決方案,。第一,,以融合算力設施為支點搭建云計算基石。利用虛擬化技術把各種硬件資源,,如計算,、存儲、網(wǎng)絡等整合起來,,并輸出融合異構算力服務,。無論是X86、GPU還是ARM(微處理器芯片),,都能在這個平臺上運行,,不僅解決AI算力不足的問題,還能使大規(guī)模商業(yè)化成為可能,。第二,,以AI工程化工具為重點搭建平臺,為開發(fā)者提供統(tǒng)一的研發(fā),、測試,、運維工具,包括了智算服務和機器學習框架,,讓AI開發(fā)變得更加高效,。開發(fā)者無需在本地維護復雜的平臺就能享受到工程化的便利,降低開發(fā)成本,。第三,,為開發(fā)者提供一站式模型服務。大模型是AI競爭的關鍵,,通過模型聚合,、開發(fā)和服務的整合,打破傳統(tǒng)AI應用的壁壘,,讓AI技術更易于應用到各行各業(yè),。第四,,以智能化應用場景為特色,提供適用于各種智能化場景的軟件服務,?!按送猓苍菩枰M一步提升大規(guī)模集群管理能力,,以優(yōu)化資源利用效率,,從而更好地滿足AI對算力的需求?!眴沃緩V介紹,。(《瞭望》2024年第17期 )
免責聲明:本文來自網(wǎng)絡收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權歸原作者所有。轉載請注明出處:http://lequren.com/1098287.html
溫馨提示:投資有風險,,入市須謹慎,。本資訊不作為投資理財建議。