近日,北電數(shù)智成功實(shí)現(xiàn)了DeepSeek-V3/R1全尺寸模型與海光DCU,、華為,、壁仞科技,、沐曦等國(guó)產(chǎn)芯片的混元算力適配,,為AI應(yīng)用提供了更多算力選擇,。
這一成果的背后,,離不開北電數(shù)智“寶塔·模型適配平臺(tái)”的有力支持,?!皩毸つP瓦m配平臺(tái)”是北電數(shù)智開發(fā)的高質(zhì)量AI工具鏈,,該平臺(tái)能夠抹平不同國(guó)產(chǎn)芯片在底層架構(gòu)、軟件生態(tài)上的差異,,快速實(shí)現(xiàn)對(duì)模型的優(yōu)化支持和硬件適配,。在“寶塔·模型適配平臺(tái)”上,用戶可以忽略底層硬件的差異從而輕松高效使用各種算力,。平臺(tái)會(huì)自動(dòng)基于大模型的調(diào)用需求,,為其匹配合適的算力資源以確保如DeepSeek等模型的高效運(yùn)行。
DeepSeek模型采用了創(chuàng)新的混合專家系統(tǒng)(DeepSeekMoE),、多頭潛在注意力機(jī)制(MLA)以及自研訓(xùn)練框架等多項(xiàng)工程化創(chuàng)新,,這些獨(dú)特創(chuàng)新機(jī)制使得DeepSeek模型只需消耗較少的算力資源即可實(shí)現(xiàn)與OpenAI模型相當(dāng)?shù)男阅堋6c此同時(shí),,DeepSeek模型在算法層面的創(chuàng)新也對(duì)AI芯片的通用性提出了更高要求,。國(guó)產(chǎn)芯片在底層架構(gòu)、軟件生態(tài)等方面存在差異,,這對(duì)如DeepSeek模型的適配工作帶來挑戰(zhàn),。正是基于這樣的背景,“寶塔·模型適配平臺(tái)”的重要性更加凸顯,。
在處理推理任務(wù)方面,,針對(duì)DeepSeek類超大模型,數(shù)據(jù)中心的集群化推理尤為重要,。北電數(shù)智推出的混元推理技術(shù)路線與DeepSeek技術(shù)路線具有天然的匹配性,。
北電數(shù)智實(shí)現(xiàn)DeepSeek模型與國(guó)產(chǎn)算力的深度適配融合也為整個(gè)AI行業(yè)帶來了深刻的啟示,即只有促進(jìn)和滿足國(guó)產(chǎn)原生模型的算力需求,,才能同時(shí)真正推動(dòng)國(guó)產(chǎn)算力的發(fā)展,。北電數(shù)智所推出的“星火·國(guó)產(chǎn)算力AI原生適配認(rèn)證”,也旨在從芯片層面加強(qiáng)國(guó)產(chǎn)模型與國(guó)產(chǎn)算力的適配工程,推動(dòng)國(guó)產(chǎn)芯片的場(chǎng)景化商業(yè)成功以及AI原生應(yīng)用的加速落地,。
目前,,北電數(shù)智“寶塔·模型適配平臺(tái)”已完成24款基座大模型的適配工作,并正式開通企業(yè)版內(nèi)測(cè)服務(wù),,用戶可以在該平臺(tái)上輕松構(gòu)建和部署基于DeepSeek模型的AI應(yīng)用支撐實(shí)際業(yè)務(wù)使用場(chǎng)景需求,。
關(guān)注“北電數(shù)智AI江湖”小程序,查看更多資訊,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1133619.html
溫馨提示:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議,。