“沒有大數(shù)據(jù),,數(shù)字經(jīng)濟(jì)便是‘無米之炊’,;沒有智能算法,,數(shù)字經(jīng)濟(jì)就不能‘創(chuàng)造價(jià)值’,。”
在日前的2023世界人工智能大會(以下簡稱WAIC)“大模型生產(chǎn)與產(chǎn)業(yè)落地合作論壇”上,,國務(wù)院參事,、中國科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心主任、中國科學(xué)院大數(shù)據(jù)挖掘與知識管理重點(diǎn)實(shí)驗(yàn)室主任石勇說,。
近一年來,,隨著通用人工智能(AGI)與生成式人工智能(AIGC)的興起,,人工智能產(chǎn)業(yè)掀開了新的篇章——AI對部分產(chǎn)業(yè)的顛覆開始加速,,我們正在迎來一個(gè)屬于AI的新時(shí)代。
縱觀整個(gè)計(jì)算機(jī)科學(xué)歷史,,進(jìn)入AI時(shí)代后,,中國AI產(chǎn)業(yè)與國際先進(jìn)水平之間的差距正在不斷縮小。但業(yè)界也清醒地認(rèn)識到,,中國AI產(chǎn)業(yè)的基礎(chǔ)設(shè)施仍然有很大的提升空間,。
正如石勇所言,在AGI時(shí)代,,數(shù)據(jù),、算力以及算法、算法開發(fā)平臺,,都是中國AI產(chǎn)業(yè)發(fā)展壯大不可或缺的基礎(chǔ)設(shè)施,。
在今年的WAIC大會上,越來越多的專家,、學(xué)者以及AI,、芯片等領(lǐng)域的從業(yè)者們都開始關(guān)注到這一問題,并希望能從底層入手,,夯實(shí)中國AI產(chǎn)業(yè)的“地基”。
01. AI產(chǎn)業(yè)需要什么樣的基礎(chǔ)設(shè)施,?
隨著AI技術(shù)進(jìn)入大模型時(shí)代,,AI產(chǎn)業(yè)對于數(shù)據(jù)、算力的需求急劇膨脹,。
以ChatGPT為例,,根據(jù)媒體報(bào)道及投資、咨詢機(jī)構(gòu)的分析,,GPT-3時(shí)期的ChatGPT數(shù)據(jù)量達(dá)到了45TB,,對于純文本數(shù)據(jù)而言,這一數(shù)字堪稱驚人,。
與此同時(shí),,ChatGPT的算力消耗巨大,參與訓(xùn)練的算力在萬張英偉達(dá)A100級別,,單次訓(xùn)練成本就高達(dá)140萬美元,。此外,,ChatGPT在運(yùn)營過程中,用戶的每次互動(dòng)都會產(chǎn)生一定的算力成本,。
而在數(shù)據(jù),、算力之外,AI從業(yè)者,,特別是最核心的算法工程師,,還需要大量的開發(fā)工具。
“算法工程師很多時(shí)候并沒有真正研究算法,,而是把時(shí)間浪費(fèi)在了環(huán)境搭建的工作上,。”在WAIC大會上,,閃馬智能創(chuàng)始人兼CEO彭垚說:“我們希望人能更好地利用工具,,而不是被工具利用?!?/p>
有AI從業(yè)者將AI訓(xùn)練調(diào)侃為“煉丹”,,可靠的算法訓(xùn)練平臺,可以有效減輕算法工程師的“煉丹”籌備時(shí)間,。在這一背景下,,越來越多的AI企業(yè)開始關(guān)注到AI開發(fā)平臺,閃馬智能便是其中之一,。在WAIC上,,閃馬智能發(fā)布了新一代的ATOM AI生產(chǎn)力平臺,希望通過更友好的開發(fā)平臺,,幫助算法工程師提升效率,。
據(jù)悉,閃馬智能的ATOM AI生產(chǎn)力平臺構(gòu)建了從標(biāo)注,、訓(xùn)練,、測試到落地的全鏈路自動(dòng)生產(chǎn)體系,可以實(shí)現(xiàn)模型快速生產(chǎn),、迭代與驗(yàn)證的一站式管理,,保障技術(shù)成果積累和數(shù)據(jù)資產(chǎn)沉淀。
具體而言,,ATOM AI平臺支持跨云,、跨集群靈活調(diào)度,基于DataExpress數(shù)據(jù)多級緩存與數(shù)據(jù)pipeline,,可支撐千卡級大模型訓(xùn)練及各類場景微調(diào)模型的穩(wěn)定運(yùn)行,。
ATOM AI生產(chǎn)力平臺的前身,是閃馬智能團(tuán)隊(duì)推出的ATOM深度學(xué)習(xí)平臺。官方資料顯示,,該平臺經(jīng)多年迭代后,,已成為1000余位算法科學(xué)家和數(shù)十所高校師生使用的AI模型開發(fā)工具。
02 視頻大模型方興未艾
與目前AI產(chǎn)業(yè)時(shí)下火熱的ChatGPT,、Midjourney不同,,ATOM AI平臺關(guān)注的是另一賽道。前兩者通過大模型實(shí)現(xiàn)了文本,、圖片的AIGC,,而后者則關(guān)注視頻領(lǐng)域,希望打造出更多視頻專屬的AI模型,。
在AI視覺領(lǐng)域,,業(yè)界現(xiàn)有的模型大多基于靜態(tài)圖片。目前,,針對人臉,、車牌、敏感內(nèi)容審查領(lǐng)域的AI模型已高度成熟,。但在視頻領(lǐng)域,,特別是較長視頻中的物體跟蹤與行為檢測,現(xiàn)有AI模型的表現(xiàn)仍然不夠理想,。
這背后的原因是,,大部分視覺模型針對靜態(tài)圖片表現(xiàn)良好,但針對動(dòng)態(tài)視頻,,模型需要根據(jù)時(shí)序模型,,對單幀靜態(tài)圖片進(jìn)行空間-時(shí)間建模,再提取視覺特征,。這一過程的效率極低,,且需要大量的算力支持。
此外,,相較于圖片數(shù)據(jù),,視頻數(shù)據(jù)更稀缺、體積更大,、標(biāo)注也更加困難。因此,,在整個(gè)AI產(chǎn)業(yè),,視頻大模型仍處于方興未艾階段,增長潛力巨大,。
針對視頻模型開發(fā)的特殊需求,,閃馬智能的ATOM AI生產(chǎn)力平臺提供了集成數(shù)據(jù)管理、標(biāo)注、訓(xùn)練,、優(yōu)化和推理功能的一體化服務(wù),,并通過打通算力、數(shù)據(jù)資源的形式,,幫助算法工程師專注于模型訓(xùn)練本身,。
事實(shí)上,閃馬智能自身也在持續(xù)投入模型開發(fā),。目前,,閃馬智能解決方案已經(jīng)在智慧交管、智慧高速,、智慧軌交,、智慧建造、智慧電站和揚(yáng)塵治理等業(yè)務(wù)場景中落地應(yīng)用,。
“大模型存在的意義一定是需要應(yīng)用到實(shí)際場景中,,為人們解決問題,賦能社會發(fā)展,?!迸韴惙Q,“對于大模型本身,,我們是理智的——不盲目投入極大參數(shù)LLM(大型語言模型),,而是結(jié)合自身優(yōu)勢,基于視覺拓展做了感知大模型,?!?/p>
例如,閃馬智能日前發(fā)布的SupreMeta感知大模型,,就融合了視覺,、激光、雷達(dá)等多模態(tài),,對于目標(biāo)及場景擁有更強(qiáng)的泛化能力,,針對同一物體的不同視角、光照,、遮擋,,都能實(shí)現(xiàn)準(zhǔn)確識別。
03 聯(lián)合算力,、算法,,打造AI生產(chǎn)生態(tài)
作為一家AI企業(yè),閃馬智能以智慧交通解決方案為主營業(yè)務(wù),。對于ATOM AI開發(fā)平臺,,閃馬智能更希望借此打造一個(gè)AI生態(tài),。
在WAIC大會上,閃馬智能宣布與北京國科智算科技有限公司,、北京國科未來科技有限公司聯(lián)合成立“中科閃馬”,,意在借助更多資源,共同推廣ATOM新一代異構(gòu)人工智能計(jì)算平臺和DataOcean新一代存儲系統(tǒng),,打造主可控,、軟硬一體的人工智能計(jì)算與存貯設(shè)備,并為大模型的訓(xùn)練與實(shí)戰(zhàn)提供可靠的計(jì)算平臺,。
中科閃馬智能有限公司揭牌儀式
中國科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心特聘研究員張影飛表示:“中科閃馬智能有限公司具有三大優(yōu)勢:第一,,強(qiáng)強(qiáng)聯(lián)合,、資源整合;第二,,技術(shù)融合,、拓展應(yīng)用;第三,,聚力發(fā)力,、突破難點(diǎn)。期待與閃馬智能共同推動(dòng)自主可控的國產(chǎn)技術(shù)發(fā)展與創(chuàng)新,?!?/p>
毫無疑問的是,在大模型時(shí)代,,算力的意義變得無比重大,。在日前的WAIC大會上,閃馬智能便邀請了國產(chǎn)GPU及解決方案廠商沐曦加入ATOM產(chǎn)業(yè)生態(tài),。
在沐曦創(chuàng)始人陳維良看來,,以GPU為代表的芯片產(chǎn)業(yè)已經(jīng)成為了AI產(chǎn)業(yè)的發(fā)展瓶頸。AI產(chǎn)業(yè)旺盛的需求催生出了GPU的廣闊市場,,GPU未來的發(fā)展架構(gòu)也將針對AI產(chǎn)業(yè)需求進(jìn)行定義,。
閃馬智能的生態(tài)圈也在嘗試將更多伙伴拉入自身的生態(tài)圈。例如,,在WAIC上,,閃馬智能宣布將與3D互動(dòng)內(nèi)容創(chuàng)作和運(yùn)營平臺Unity中國合作,基于3D孿生技術(shù)和“AI+交通”的算法能力,,打造實(shí)時(shí)全息的智慧交通系統(tǒng)與靈活彈性的渲染云平臺,。
閃馬智能 x Unity中國產(chǎn)業(yè)元宇宙戰(zhàn)略合作簽約儀式
以往,,Unity大多被用于游戲開發(fā),客戶以游戲廠商為主,。但近年來,,隨著科技業(yè)對于3D引擎需求的增長,越來越多的開發(fā)者開始將Unity用于非游戲領(lǐng)域的開發(fā),,如汽車智能座艙,、數(shù)字孿生、元宇宙等等,。特別是在汽車領(lǐng)域,,包括閃馬智能在內(nèi)的眾多廠商,都在使用Unity作為3D渲染工具,。
而Unity也在積極擁抱AIGC,。日前,Unity中國公布了其在AIGC相關(guān)領(lǐng)域的規(guī)劃——打造U3D Copilot——開發(fā)者只需要使用自然語言下達(dá)需求,,AI就可以通過大語言模型和用戶更自然的交互界面,,串起3D的AIGC模型,以及引擎內(nèi)部能提供的包括資產(chǎn)庫和程序化生成等這種工具,。
U3D Copilot同時(shí)面向游戲和非游戲行業(yè)的開發(fā)者,。在2023世界人工智能大會上,Unity中國CEO張俊波在接受36氪采訪時(shí)表示,,以U3D Copilot為代表的3D渲染AIGC工具,,對于非游戲行業(yè)意義更大。與游戲開發(fā)者相比,,這些開發(fā)者在3D渲染方面的經(jīng)驗(yàn)有限,,而AI則可以為他們提供更多助力。
不難看出從上游的算力,、數(shù)據(jù)資源,,到下游的行業(yè)應(yīng)用,閃馬智能結(jié)合自身業(yè)務(wù),,搭建起了一整套面向大模型開發(fā)的生態(tài)系統(tǒng),。從某種程度而言,閃馬智能自身也成為了AI大模型產(chǎn)業(yè)基礎(chǔ)設(shè)施的一部分,。
如今,,中國AI大模型正在蓬勃發(fā)展。根據(jù)科技部新一代人工智能發(fā)展研究中心發(fā)布的《中國人工智能大模型地圖研究報(bào)告》,,據(jù)不完全統(tǒng)計(jì),,國內(nèi)參數(shù)在10億規(guī)模以上的大模型全國已發(fā)布了79個(gè)。
對于大模型的未來前景,,彭垚給出的答案是,,這條賽道如今從業(yè)者甚多,,但并不擁擠,因?yàn)榇竽P唾惖罉O其廣闊:“今天,,仍有很多領(lǐng)域的大模型甚至還沒有完成定義,。”
“所以,,我們一定要擁有自己的GPU,、自己的算力,有更多做模型,、做算法,、做平臺的公司,這樣,,中國的大模型產(chǎn)業(yè)才能發(fā)展起來,。”他進(jìn)一步解釋到,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1056868.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。