ChatGPT掀起的新一輪人工智能狂歡下,隱藏在背后的“大模型”正進(jìn)入越來(lái)越多開(kāi)發(fā)者的視野,。
誠(chéng)如幾年前開(kāi)始流行的一種說(shuō)法:數(shù)據(jù)是燃料,、模型是引擎、算力是加速器,。ChatGPT的出現(xiàn),,恰如其分地詮釋了數(shù)據(jù)、模型和算力的“化學(xué)反應(yīng)”,。而在其中扮演“橋梁”角色的,,恰恰是上承應(yīng)用、下接芯片的AI框架,。
正是在這樣的背景下,,市場(chǎng)調(diào)研機(jī)構(gòu)Omdia通過(guò)對(duì)AI開(kāi)發(fā)者進(jìn)行調(diào)研,在日前發(fā)布了《中國(guó)人工智能框架市場(chǎng)調(diào)研報(bào)告》,,向外界揭示了國(guó)內(nèi)開(kāi)發(fā)者對(duì)于AI框架的認(rèn)知,以及不斷變化的行業(yè)格局,。
01 開(kāi)發(fā)者眼中的AI框架市場(chǎng)
隨著ChatGPT的熱度越來(lái)越高,,不少人坦言:“人工智能領(lǐng)域正在引發(fā)新一輪科技競(jìng)賽”,其實(shí)AI的學(xué)術(shù)競(jìng)賽在2020年前后就已經(jīng)開(kāi)始,。
OpenAI在這一年推出了著名的GPT-3,,擁有1750億參數(shù)量;DeepMind的AlphaFold2在第14屆國(guó)際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽中奪冠,;同時(shí)全球AI論文發(fā)表量逐年增長(zhǎng),,來(lái)自中國(guó)的論文比例越來(lái)越高…… 頂會(huì)論文、大模型,、科學(xué)智能代表的技術(shù)生態(tài),,達(dá)到了前所未有的熱度。
同樣是在2020年,,以昇思MindSpore等為代表的中國(guó)AI框架紛紛開(kāi)源,,開(kāi)始了追趕TensorFlow、PyTorch等前輩們的追逐賽,,中國(guó)AI框架的崛起和技術(shù)生態(tài)的繁榮,,不可避免地出現(xiàn)了交叉。
就像Omdia在《中國(guó)人工智能框架市場(chǎng)調(diào)研報(bào)告》中給出的觀點(diǎn):在大模型應(yīng)用的趨勢(shì)下,,國(guó)內(nèi)開(kāi)發(fā)者對(duì)于AI框架的認(rèn)知發(fā)生了一些微妙的變化,。
比如“對(duì)于超大規(guī)模模型訓(xùn)練能力,您覺(jué)得哪個(gè)人工智能框架最好,?”的問(wèn)題中,,36%的開(kāi)發(fā)者投票給了TensorFlow/JAX,,15%的開(kāi)發(fā)者選擇的是PyTorch,昇思MindSpore以10%的占比排名第三,。
需要說(shuō)明的是,,開(kāi)發(fā)者的答案在某種程度上受到了認(rèn)知習(xí)慣的影響,自然而然地給“老牌框架”打了高分,。譬如谷歌的TensorFlow并非原生支持大模型,,通過(guò)新推出的另一個(gè)新生框架JAX作為T(mén)ensorFlow的簡(jiǎn)化庫(kù)融入;PyTorch則是靠第三方并行算法庫(kù)補(bǔ)充了大模型支持能力,。昇思MindSpore正依托原生支持大模型的能力快速崛起。
再比如“您認(rèn)為最適合做AI for Science項(xiàng)目的人工智能框架是,?”的問(wèn)答下,,TensorFlow和新生框架JAX收到了45%的開(kāi)發(fā)者支持,昇思MindSpore在這個(gè)問(wèn)題下超過(guò)了PyTorch,,以37%的支持率排名第二,。
而在人工智能框架使用率的排名中,TensorFlow和PyTorch的先發(fā)優(yōu)勢(shì)依然存在,,但昇思MindSpore以11%的份額進(jìn)入第一梯隊(duì),。TensorFlow早在2015年就已經(jīng)開(kāi)源,PyTorch的歷史也可以追溯到2017年,,昇思MindSpore比“前輩”們晚了三到五年,,但表現(xiàn)出了快速趕超老牌AI框架的態(tài)勢(shì),扮演了“挑戰(zhàn)者”的角色,。
如果說(shuō)Omdia的報(bào)告主要是基于開(kāi)發(fā)者的認(rèn)知,,可能與實(shí)際情況存在一定出入,那硬核的技術(shù)生態(tài)與行業(yè)生態(tài)的合作,,則以板上釘釘?shù)臄?shù)字佐證著昇思MindSpore等中國(guó)AI框架崛起態(tài)勢(shì):
在技術(shù)生態(tài)方面,,昇思MindSpore已經(jīng)與200多所高校、科研機(jī)構(gòu)展開(kāi)創(chuàng)新合作,;在行業(yè)生態(tài)方面,,僅在2022年獲得昇思技術(shù)認(rèn)證的企業(yè)就超過(guò)800多家,涵蓋制造,、金融,、電信運(yùn)營(yíng)商等國(guó)計(jì)民生行業(yè);在開(kāi)源生態(tài)方面,,昇思MindSpore在Gitee AI開(kāi)源項(xiàng)目綜合排名TOP1,,軟件下載增速第一,總量已超過(guò)370萬(wàn)……
02 昇思MindSpore越級(jí)的時(shí)與勢(shì)
一個(gè)殘酷但有現(xiàn)實(shí)意義的現(xiàn)象是,,2020年AI框架市場(chǎng)還是一幅百家爭(zhēng)鳴的景象,,目前卻出現(xiàn)了典型的虹吸效應(yīng),。
按照Omdia的調(diào)研數(shù)據(jù),在中國(guó)人工智能框架的使用率方面,,TensorFlow,、PyTorch、昇思MindSpore和飛槳合計(jì)占了86%的市場(chǎng)份額,,大多數(shù)AI框架的使用率不足1%,,曾經(jīng)聲名鵲起的Caffe、CNTK等已逐漸掉出主流隊(duì)伍,,只有昇思MindSpore一家逆勢(shì)進(jìn)入了AI框架的第一梯隊(duì),。
想要弄清問(wèn)題的答案,昇思MindSpore可以說(shuō)是最好的研究對(duì)象,。過(guò)去近三年時(shí)間里,,昇思MindSpore到底做對(duì)了什么?
第一個(gè)參考答案是大模型的“時(shí)”,。
2021年9月的華為全聯(lián)接大會(huì)上,,昇思MindSpore迭代至1.5版本,最直接的變化就是原生支持AI大模型訓(xùn)練,,通過(guò)全自動(dòng)并行,、可視化智能調(diào)優(yōu)等大幅提升了大模型的開(kāi)發(fā)效率。
其中在大模型并行訓(xùn)練上,,昇思MindSpore支持?jǐn)?shù)據(jù)并行,、MoE并行、優(yōu)化器并行,、多副本并行等7大并行計(jì)算能力,,將訓(xùn)練千億模型的代碼量降低了80%、調(diào)優(yōu)時(shí)間下降60%,;和TensorFlow,、PyTorch等框架相比,昇思MindSpore是支持模型結(jié)構(gòu)最全的AI框架,,包含稠密,、稀疏MoE、卷積結(jié)構(gòu),、高維稀疏等,。
第二個(gè)參考答案是應(yīng)用創(chuàng)新的“勢(shì)”。
2022年11月發(fā)布的2.0版本中完成了AI與HPC的融合,,通過(guò)神經(jīng)網(wǎng)絡(luò)模擬的非線性擬合,,讓科學(xué)家無(wú)需再解高維方程,進(jìn)一步提升了科技創(chuàng)新效率,。特別是在產(chǎn)業(yè)應(yīng)用創(chuàng)新方面,,昇思MindSpore構(gòu)建了流體仿真,、電磁仿真、分子模擬在內(nèi)的科學(xué)計(jì)算套件,,持續(xù)使能應(yīng)用創(chuàng)新,。
和PyTorch的興起不謀而合,昇思MindSpore也將技術(shù)生態(tài)作為“先手棋”,。印證昇思MindSpore “路線正確”的案例,,絕不止Omdia的報(bào)告和開(kāi)發(fā)者的認(rèn)同,還有一份沉甸甸的成績(jī)單,。
衡量創(chuàng)新能力的一個(gè)重要標(biāo)準(zhǔn)正是論文數(shù)量,。按照Papers with Code網(wǎng)站的統(tǒng)計(jì)數(shù)據(jù),2022年使用昇思MindSpore的頂級(jí)會(huì)議論文已經(jīng)超過(guò)600篇,,在國(guó)內(nèi)AI框架中排名第一,,在全球范圍內(nèi)僅次于PyTorch。
而在大模型的創(chuàng)新中,,目前國(guó)內(nèi)科研院所和高校已經(jīng)發(fā)布了10多個(gè)基于昇思MindSpore的大模型。其中紫東.太初是全球首個(gè)三模態(tài)大模型,,能夠?qū)崿F(xiàn)視覺(jué),、文本、語(yǔ)音三個(gè)模態(tài)間的高效協(xié)同,,曾在2022世界人工智能大會(huì)上斬獲“卓越人工智能引領(lǐng)者”獎(jiǎng),;東方.御風(fēng)是業(yè)界首個(gè)工業(yè)級(jí)流體仿真大模型,在進(jìn)行飛機(jī)流場(chǎng)模擬仿真時(shí),,對(duì)比傳統(tǒng)的科學(xué)計(jì)算,,在精度一樣的情況下,東方.御風(fēng)的仿真時(shí)間只需要原來(lái)的1/25,。
如果把人工智能產(chǎn)業(yè)生態(tài)比喻成森林的話,,人工智能框架就像是森林中的土壤,尋求創(chuàng)新的開(kāi)發(fā)者自然會(huì)“擇水土而居”,。
03 不應(yīng)被忽視的可信AI問(wèn)題
在全民“調(diào)戲”ChatGPT的風(fēng)潮中,,ChatGPT有時(shí)會(huì)“一本正經(jīng)地胡說(shuō)八道”,這其實(shí)暴露了存在事實(shí)性錯(cuò)誤,、知識(shí)盲區(qū)和常識(shí)偏差等諸多問(wèn)題,。
Omdia在《中國(guó)人工智能框架市場(chǎng)調(diào)研報(bào)告》中向開(kāi)發(fā)者詢(xún)問(wèn)了類(lèi)似的問(wèn)題,最終的答案似乎超出了一些人的料想:在所有主流人工智能框架中,,國(guó)內(nèi)的開(kāi)發(fā)者普遍認(rèn)為T(mén)ensorFlow 與 昇思MindSpore 對(duì)“負(fù)責(zé)任的人工智能”提供的支持最好,。
個(gè)中原因其實(shí)不難解釋。為了打消開(kāi)發(fā)者擔(dān)心的安全隱私等問(wèn)題,,谷歌通過(guò)Model Cards等工具讓框架更加透明,、更具備可解釋性,,同時(shí)TensorFlow也提供了一系列支持?jǐn)?shù)據(jù)安全和隱私的功能、庫(kù)和培訓(xùn)工具,。
昇思MindSpore之所以能夠在可信方面超越PyTorch,,離不開(kāi)對(duì)AI安全技術(shù)體系的布局,提供了涵蓋AI訓(xùn)練,、AI測(cè)評(píng),、AI部署的一整套端到端的安全可信體系,包括聯(lián)邦學(xué)習(xí),、模型水印,、模型加密等外界所熟知的可信機(jī)制。
比如聯(lián)邦學(xué)習(xí)是一種常見(jiàn)的隱私保護(hù)方式,,可以在不收集數(shù)據(jù)的情況下協(xié)同進(jìn)行模型的訓(xùn)練,,實(shí)現(xiàn)數(shù)據(jù)的“可用不可見(jiàn)”,繼而保護(hù)隱私信息,。然而聯(lián)邦學(xué)習(xí)和大模型的結(jié)合也產(chǎn)生了諸多挑戰(zhàn),,涉及到計(jì)算代價(jià)、通信開(kāi)銷(xiāo),、隱私泄露,、模型安全等等,需要解決隱私保護(hù)與效率的兩難課題,。
昇思MindSpore的回答是跨域可信訓(xùn)練,。
以鵬城.盤(pán)古大模型為例,昇思的聯(lián)邦學(xué)習(xí)能力助力盤(pán)古超大模型協(xié)同訓(xùn)練,,根據(jù)各地算力情況將大模型拆分,,以AI計(jì)算中心超大算力實(shí)現(xiàn)盤(pán)古主干網(wǎng)絡(luò)的正反向訓(xùn)練,同步在銀行等計(jì)算機(jī)房做數(shù)據(jù)處理,,模型Embedding,、TOP層算Loss正反向訓(xùn)練,實(shí)現(xiàn)了敏感數(shù)據(jù)不出本地,,并讓聯(lián)邦學(xué)習(xí)的訓(xùn)練時(shí)延降低了30%,、通信和計(jì)算開(kāi)銷(xiāo)降低了40%。
就像Omdia在報(bào)告中的評(píng)論:“負(fù)責(zé)任的人工智能”即是一套道德準(zhǔn)則,,又是一套技術(shù)體系,, 是以安全、可靠和合乎道德的方式開(kāi)發(fā),、評(píng)估,、部署和規(guī)模化人工智能系統(tǒng)的方法,,對(duì)人工智能的可持續(xù)發(fā)展非常重要,。
大模型,、科學(xué)智能等技術(shù)生態(tài)在過(guò)去三年時(shí)間里深入影響了開(kāi)發(fā)者對(duì)AI框架的選擇,把時(shí)間再拉長(zhǎng)一些的話,,能否在可信AI方面有所作為,,能否打消開(kāi)發(fā)者的疑慮,無(wú)疑將左右AI框架下一個(gè)三到五年的市場(chǎng)排位,。
04 寫(xiě)在最后
人工智能的星星之火能否燎原,,AI框架有著不可或缺的作用。
一座城市的繁榮,,不在于有多高的摩天大樓,,而是無(wú)處不在的建筑群。沿循這樣的邏輯,,AI框架的價(jià)值在于賦予不同的開(kāi)發(fā)者“建造高樓”的能力,,讓人工智能的前沿能力進(jìn)入每一個(gè)行業(yè)、每一家企業(yè),。
至少,,以昇騰AI為首的中國(guó)人工智能產(chǎn)業(yè)建設(shè)者早已開(kāi)始發(fā)力。
不只是昇思MindSpore在技術(shù)生態(tài)上的異軍突起,,Atlas系列硬件,、異構(gòu)計(jì)算架構(gòu)CANN、昇騰應(yīng)用使能MindX等軟硬件也在持續(xù)創(chuàng)新,,為開(kāi)發(fā)者打造了“端、邊,、云”的全場(chǎng)景AI基礎(chǔ)設(shè)施,,讓人工智能在千行百業(yè)不斷擴(kuò)散。
本文作者張賀飛,,Alter聊科技主理人,,關(guān)注云計(jì)算、AI,、元宇宙等前沿科技領(lǐng)域,,目前已60余家科技專(zhuān)欄。系福布斯中國(guó)撰稿人,,發(fā)表觀點(diǎn)僅代表個(gè)人,。
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/990690.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。