AI智能體開(kāi)卷,、人形機(jī)器人進(jìn)入商用前期、國(guó)產(chǎn)算力春意浮動(dòng)
作者/ IT時(shí)報(bào)記者 郝俊慧
編輯/ 孫妍
短短10天內(nèi),,上海連續(xù)舉辦兩個(gè)全球性重要展會(huì)——世界移動(dòng)通信大會(huì)(MWCS2024)和世界人工智能大會(huì)(WAIC2024),,無(wú)論瓢潑大雨還是烈日當(dāng)空,AI都在魔都掀起一陣科技“颶風(fēng)”。
馮·諾伊曼說(shuō):“技術(shù)的不斷加速進(jìn)步,,將會(huì)引發(fā)人類(lèi)歷史上某個(gè)關(guān)鍵的奇點(diǎn),。”從2018年首屆世界人工智能大會(huì)拂曉初現(xiàn)的“人工智能新紀(jì)元”曙光,到如今第七屆WAIC的召開(kāi),,我們已然佇立在奇點(diǎn)的門(mén)檻之上,,比以往任何時(shí)候都更貼近那個(gè)改寫(xiě)歷史的瞬間。
透過(guò)WAIC2024的透鏡,,我們清晰看到AI的三大趨勢(shì),。
趨勢(shì)一
“百模大戰(zhàn)”第二幕
大模型應(yīng)用元年開(kāi)卷AI Agent
與一年前的WAIC相比,,今年的“百模大戰(zhàn)”名副其實(shí),中國(guó)電信的“星辰”,、阿里的“通義”,、百度的“文心”、騰訊的“混元”,、商湯科技的“日日新”,、云知聲的“山海”,、人工智能實(shí)驗(yàn)室的“書(shū)生”……幾乎每個(gè)展臺(tái)都有自己的“大模型”。
在“卷”了一年參數(shù)量級(jí),、可支持上下文token數(shù),、推理價(jià)格等等之后,,AI Agent(AI助理/AI智能體)拉開(kāi)了“百模大戰(zhàn)”的第二幕。
今年入選WAIC鎮(zhèn)館之寶的支付寶智能助理,,便是一款基于螞蟻集團(tuán)百靈大模型研發(fā)的AI Agent,,用戶(hù)在支付寶首頁(yè)下拉就能喚起“小助理”,問(wèn)一問(wèn)就能獲得出行,、健康,、政務(wù),、金融等領(lǐng)域超8000項(xiàng)數(shù)字生活服務(wù),。
“同門(mén)師兄”阿里云的“通義for everyone”則集成通義大模型全棧能力,,以通義千問(wèn)最新基礎(chǔ)模型為基座,,整合通義實(shí)驗(yàn)室前沿的文生圖、智能編碼,、文檔解析,、音視頻理解、視覺(jué)生成等能力,,最終形成一個(gè)All in one的全能AI助手,。
在“騰訊元器”展區(qū),參會(huì)嘉賓可以通過(guò)添加提示詞,、插件,、知識(shí)庫(kù)等自由創(chuàng)建智能體(AI Agent),也可以在智能體商店選擇,、使用智能體,以滿(mǎn)足不同場(chǎng)景下的需求,。
除了這些針對(duì)個(gè)人用戶(hù)的“AI 助手”,,作為大模型從通用走向垂直應(yīng)用的重要“抓手”,AI Agent也出現(xiàn)在各類(lèi)行業(yè)大模型中,。
“為B端客戶(hù)打造一個(gè)AI Agent的過(guò)程,,更像是一個(gè)打通企業(yè)流程、全面治理數(shù)據(jù),、重塑業(yè)務(wù)架構(gòu)的契機(jī),。”中國(guó)電信大模型首席專(zhuān)家劉敬謙告訴《IT時(shí)報(bào)》記者,,只有深入理解行業(yè)特性和場(chǎng)景需求,,才能打造出真正實(shí)用的AI Agent,實(shí)現(xiàn)技術(shù)的有效落地,。
與微軟在Windows 11中創(chuàng)建的Copilot(助手)不同,,AI Agent更強(qiáng)調(diào)服務(wù)的協(xié)同性以及對(duì)自然語(yǔ)言的認(rèn)知程度。
OpenAI對(duì)AI Agent的定義是以大語(yǔ)言模型(LLM)為大腦驅(qū)動(dòng),,具有自主理解,、感知、規(guī)劃,、記憶和使用工具的能力,,能自動(dòng)化執(zhí)行復(fù)雜任務(wù)的智能體。它具有獨(dú)立思考和行動(dòng)能力,,不僅能夠處理信息,,還能根據(jù)環(huán)境變化自主學(xué)習(xí)和適應(yīng),以實(shí)現(xiàn)特定的目標(biāo)或解決特定的問(wèn)題,。
不久前蘋(píng)果剛剛發(fā)布的“Apple Intelligence”,,便是一個(gè)整合操作系統(tǒng)、軟件,、模型和數(shù)據(jù),,強(qiáng)化對(duì)應(yīng)用場(chǎng)景的理解,深刻洞察用戶(hù)需求的AI Agent,。
第一個(gè)為AI Agent歡呼的大佬是比爾·蓋茨,。早在1995年出版的《未來(lái)之路》一書(shū)中,他便描述過(guò)這種可以理解用戶(hù)自然語(yǔ)言并根據(jù)對(duì)用戶(hù)的了解完成多種任務(wù)的Agent,,但直到ChatGPT橫空出世,,才讓他看到了真正可實(shí)用AI Agent出現(xiàn)的可能。
在比爾·蓋茨看來(lái),,AI Agent將徹底顛覆人與機(jī)器的交互方式,。可預(yù)見(jiàn)的未來(lái)是:智能手機(jī)上都會(huì)有一個(gè)AI Agent,,它將集合手機(jī)中所有數(shù)據(jù),,滿(mǎn)足用戶(hù)隨時(shí)隨地的需求;它將是企業(yè)的“AI程序員”,,協(xié)助開(kāi)發(fā)人員完成從編碼,、測(cè)試、升級(jí)應(yīng)用到故障排查,、安全掃描和修復(fù),、優(yōu)化云資源等繁瑣重復(fù)的工作,;或者是公司的“數(shù)據(jù)分析員”,自動(dòng)匯集分析企業(yè)所有數(shù)據(jù),,挖掘數(shù)據(jù)金礦價(jià)值,,員工則只要用自然語(yǔ)言與AI Agent對(duì)話(huà),便可以獲得相關(guān)業(yè)務(wù)數(shù)據(jù)和答案,,例如公司政策,、產(chǎn)品信息、業(yè)務(wù)結(jié)果,、代碼庫(kù),、人員等。
螞蟻集團(tuán)董事長(zhǎng)兼CEO井賢棟也在本屆人工智能大會(huì)上表示,,如同移動(dòng)互聯(lián)網(wǎng)時(shí)代App是典型應(yīng)用一樣,,在人工智能時(shí)代,智能體將成為新的應(yīng)用范式,,為用戶(hù)帶來(lái)服務(wù)代際的升級(jí),,而專(zhuān)業(yè)智能體是大模型落地產(chǎn)業(yè)的有效路徑。醫(yī)療,、教育,、金融、制造,、交通,、農(nóng)業(yè)等各行業(yè)領(lǐng)域,未來(lái)都有可能依據(jù)自己的場(chǎng)景和特有經(jīng)驗(yàn),、規(guī)則,、數(shù)據(jù)等等,生成數(shù)以百萬(wàn)量級(jí)的智能體,,形成龐大生態(tài),。
然而,并不是所有的AI Agent都天然擁有強(qiáng)大的能力,。AIGC時(shí)代,,每個(gè)企業(yè)都不想錯(cuò)過(guò)紅利,但每個(gè)企業(yè)也都在問(wèn):AIGC究竟能給自己帶來(lái)什么,?讓生成式人工智能應(yīng)用和助手真正發(fā)揮作用,,它們必須了解組織的數(shù)據(jù)、客戶(hù),、運(yùn)營(yíng)和業(yè)務(wù),,但如今的許多助手都無(wú)法輕松個(gè)性化,而且它們的設(shè)計(jì)也無(wú)法滿(mǎn)足公司所需的數(shù)據(jù)隱私和安全要求,。
事實(shí)上,,AI Agent高度依賴(lài)基座大模型的能力,、貫通整個(gè)企業(yè)體系架構(gòu)的工程能力、研發(fā)者對(duì)行業(yè)的理解以及高質(zhì)量的數(shù)據(jù)支撐,,以上任何一個(gè)條件缺失,,都有可能使AI Agent只是看起來(lái)很美好,實(shí)際使用中卻因?yàn)椴粔颉皩?zhuān)業(yè)”,,導(dǎo)致應(yīng)用無(wú)法落地。
“應(yīng)用是未來(lái)大模型決戰(zhàn)的主要戰(zhàn)場(chǎng),,”在騰訊云副總裁,、騰訊優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲看來(lái),目前幾乎所有大模型廠(chǎng)商都在智能體領(lǐng)域做進(jìn)一步技術(shù)嘗試,,模型以落地,、實(shí)用為先,大模型的研發(fā)應(yīng)用必須關(guān)注和解決具體業(yè)務(wù)場(chǎng)景,,關(guān)注可用性和性?xún)r(jià)比,。
趨勢(shì)二
具身智能扎堆繁榮
人形機(jī)器人進(jìn)入商用前期
今年WAIC的鎮(zhèn)館之寶做了一道“大菜”——“十八金剛 人形機(jī)器人先鋒陣列”,,網(wǎng)羅了中電科,、復(fù)旦大學(xué)、達(dá)闥,、傅利葉,、鈦虎、星動(dòng)紀(jì)元,、卓益得,、開(kāi)普勒、宇樹(shù)等18個(gè)國(guó)內(nèi)領(lǐng)先的機(jī)器人產(chǎn)品,,著實(shí)讓觀(guān)眾體驗(yàn)了一回什么叫“具身智能元年”,。來(lái)自主辦方的數(shù)據(jù)顯示,本屆大會(huì)合計(jì)展出的人形機(jī)器人超過(guò)25款,。
1950年,,“計(jì)算機(jī)之父”圖靈(Alan Turing)在他的論文中首次提出“具身智能”概念,。嚴(yán)格意義上,機(jī)器人,、工業(yè)機(jī)器人,、擬態(tài)機(jī)器狗,、智能網(wǎng)聯(lián)車(chē),都是“身”,,但人形依然是人類(lèi)接受度最高的機(jī)器人形態(tài),。
從硬件條件上看,不少人形機(jī)器人已經(jīng)具備相當(dāng)高的肢體靈敏度,。比如,,人形機(jī)器人(上海)有限公司自主研發(fā)人形機(jī)器人“青龍”,身高185cm,、體重80kg,、全身多達(dá)43個(gè)主動(dòng)自由度,手指可以輕拿輕放杯子,,即便是柔軟的面包,,也能在抓起時(shí)保證面包外形的完整性。
上海開(kāi)普勒探索機(jī)器人有限公司的通用人形機(jī)器人,,身高175cm,,體重70kg,全身具備40個(gè)關(guān)節(jié)自由度,、80多個(gè)傳感器,,具備復(fù)雜地形行走、智能規(guī)避障礙等多種功能,。
國(guó)家地方共建人形機(jī)器人創(chuàng)新中心總經(jīng)理許彬一直有一種略帶激進(jìn)的看法:具身智能是通往通用人工智能的必由之路,,而且只有人形機(jī)器人才能實(shí)現(xiàn)通用人工智能,核心邏輯是人類(lèi)社會(huì)存在的所有數(shù)據(jù),,都是為了讓人類(lèi)更好地生存和發(fā)展,,所有對(duì)世界的理解、認(rèn)知和情感的數(shù)據(jù),,都是基于人體產(chǎn)生,,而貓或魚(yú)等其它生物本體,不可能感知到人類(lèi)世界的各個(gè)方面,。
至少在現(xiàn)階段,,具身智能尚不完全具備對(duì)物理世界的認(rèn)知和交互能力,尤其是目前類(lèi)GPT模式的大模型,,在用于具身智能時(shí),,效果并不理想。
一家國(guó)產(chǎn)人形機(jī)器人創(chuàng)始人透露,,之前曾將GPT-4V的圖像接口接入機(jī)器人,,但大模型對(duì)物體的空間認(rèn)知能力非常差,而且“記憶力”只有一秒。全球人工智能頂級(jí)科學(xué)家李飛飛也認(rèn)為,,大模型不具備知覺(jué),,參數(shù)再多也不行。
“我們需要構(gòu)建一種‘知識(shí)+數(shù)據(jù)’驅(qū)動(dòng)的智能模型,,”中國(guó)工程院院士,、同濟(jì)大學(xué)校長(zhǎng)鄭慶華創(chuàng)新性地提出“知識(shí)森林”理論,將大模型中的碎片化知識(shí)與人類(lèi)已有的知識(shí)鏈融合,,從而生成具有可解釋推理的問(wèn)題求解機(jī)制,。
上海人工智能實(shí)驗(yàn)室主任、首席科學(xué)家周伯文也認(rèn)為,,具身智能絕不僅僅是大模型加機(jī)器人的應(yīng)用,,而是大模型接收物理世界的反饋從而進(jìn)化,“光靠看書(shū)或看視頻,,永遠(yuǎn)學(xué)不會(huì)游泳,你得親身扎到水里才能學(xué)會(huì),。大模型得通過(guò)機(jī)器人,,扎進(jìn)現(xiàn)實(shí)世界,才能真正理解物理世界,?!?/p>
世界模型是當(dāng)前具身智能領(lǐng)域最熱門(mén)的詞語(yǔ)。人工智能實(shí)驗(yàn)室構(gòu)建了“軟硬虛實(shí)”一體的機(jī)器人訓(xùn)練場(chǎng)——浦源·桃源,,同時(shí)攻關(guān)具身智能的“大腦”與“小腦”,。“浦源·桃源”是首個(gè)城市級(jí)具身智能數(shù)字訓(xùn)練場(chǎng),,構(gòu)建了集場(chǎng)景數(shù)據(jù),、工具鏈、具身模型評(píng)測(cè)三位一體的開(kāi)源具身智能研究平臺(tái),。作為大模型與機(jī)器人的連接層,,涵蓋89種功能性場(chǎng)景、超10萬(wàn)高質(zhì)量可交互數(shù)據(jù),,有望解決領(lǐng)域內(nèi)數(shù)據(jù)匱乏,、評(píng)測(cè)困難的問(wèn)題。
在大腦方面,,人工智能實(shí)驗(yàn)室通過(guò)具身智能體自身狀態(tài)認(rèn)知,、復(fù)雜任務(wù)分解分配、底層技能協(xié)同控制三方面創(chuàng)新,,實(shí)現(xiàn)了大模型驅(qū)動(dòng)的無(wú)人機(jī),、機(jī)械臂、機(jī)器狗三種異構(gòu)智能體協(xié)同。在小腦方面,,通過(guò)GPU高性能并行仿真和強(qiáng)化學(xué)習(xí),,可以高效實(shí)現(xiàn)機(jī)器人在真實(shí)世界里快速學(xué)習(xí),并完成高難度動(dòng)作,,現(xiàn)在單卡1小時(shí)的訓(xùn)練就能實(shí)現(xiàn)真實(shí)世界380天的訓(xùn)練效果,。
盡管完美匹配智能本體的世界模型還未出現(xiàn),但具身智能近兩年的發(fā)展已經(jīng)遠(yuǎn)超從業(yè)者預(yù)期,。
不久前,,特斯拉CEO馬斯克在年度股東大會(huì)上表示,特斯拉將于2025年開(kāi)始“限量生產(chǎn)”O(jiān)ptimus(擎天柱)人形機(jī)器人,,明年特斯拉將有上千臺(tái)在運(yùn)行的Optimus機(jī)器人,。達(dá)闥更是在現(xiàn)場(chǎng)預(yù)售起具身智能人形機(jī)器人XR4,價(jià)格39.9萬(wàn)元起,。
宇樹(shù)科技CEO王興興認(rèn)為,,最遲明年年底之前,全球范圍內(nèi)一定會(huì)出現(xiàn)比人跑得快的人形機(jī)器人,,“比如說(shuō)100米跑進(jìn)10秒,,在體育項(xiàng)目和文藝演出上,人形機(jī)器人比做家務(wù)應(yīng)該更得心應(yīng)手,?!?/p>
許彬?qū)夹g(shù)的迭代速度樂(lè)觀(guān)地判斷道,未來(lái)3~5年,,人形機(jī)器人可以在一些工廠(chǎng)智能制造產(chǎn)線(xiàn)運(yùn)行,,未來(lái)5~10年可以在家庭服務(wù)等場(chǎng)景運(yùn)用。
趨勢(shì)三
多路徑破局“鐵幕”
國(guó)產(chǎn)算力“春意浮動(dòng)”
由AI帶來(lái)的算力風(fēng)暴,還有被美方拉下的“科技鐵幕”,,使算力芯片成為近幾年WAIC上備受關(guān)注的焦點(diǎn),。
2022年WAIC期間,更是正面遭遇美國(guó)宣布對(duì)華斷供英偉達(dá)高端芯片,。如今,,兩年過(guò)去,當(dāng)美國(guó)不斷收緊芯片政策時(shí),,國(guó)產(chǎn)算力開(kāi)始顯露出一絲春天的綠意,。
“從今年開(kāi)始,萬(wàn)卡將是AI模型訓(xùn)練主戰(zhàn)場(chǎng)的標(biāo)配,?!?月3日,,國(guó)產(chǎn)芯片廠(chǎng)商摩爾線(xiàn)程創(chuàng)始人兼CEO張建中宣布,夸娥(KUAE)智算集群解決方案向萬(wàn)卡萬(wàn)P萬(wàn)億參數(shù)通用算力集群升級(jí),,以全功能GPU為底座,,打造能承載萬(wàn)卡規(guī)模、具備萬(wàn)P級(jí)浮點(diǎn)運(yùn)算能力的國(guó)產(chǎn)通用加速計(jì)算平臺(tái),,為萬(wàn)億參數(shù)級(jí)別的大模型訓(xùn)練提供平臺(tái),。
截至目前,,至少已有兩家國(guó)產(chǎn)芯片廠(chǎng)商實(shí)現(xiàn)了單池萬(wàn)卡集群的能力,為我國(guó)自主可控的AI大模型攻堅(jiān)建立了關(guān)鍵基礎(chǔ)設(shè)施,。
新型異構(gòu)算力架構(gòu)也在嘗試解決算力規(guī)?;y題。無(wú)問(wèn)芯穹推出的千卡規(guī)模異構(gòu)芯片混訓(xùn)平臺(tái),,采用“MxN”方案,,M層是大模型,N層是各種國(guó)內(nèi)外芯片,,可以通過(guò)算子優(yōu)化,、自動(dòng)編譯、不同芯片耦合等技術(shù)一鍵部署模型,,支持Baichuan2、ChatGLM3,、Llama2,、Qwen系列等20多個(gè)模型,,在A(yíng)MD,、華為昇騰,、天數(shù)智芯,、沐曦,、摩爾線(xiàn)程,、NVIDIA等六種異構(gòu)芯片上混合訓(xùn)練,,算力利用率最高達(dá)97.6%,。
無(wú)問(wèn)芯穹希望解決國(guó)內(nèi)AI領(lǐng)域存在的“生態(tài)豎井”難題,,雖然不同芯片組成的算力構(gòu)成了集群,,但在生態(tài)邏輯上,,整個(gè)軟件棧并不能夠很好地協(xié)調(diào)和打通。無(wú)問(wèn)芯穹構(gòu)建的是一個(gè)AI Native基礎(chǔ)設(shè)施,,可以適配中國(guó)獨(dú)特的多模型,、多芯片生態(tài)格局,將多種異構(gòu)算力構(gòu)建成大系統(tǒng),,快速完成大模型的訓(xùn)練和推理。
受限于芯片禁令,,國(guó)內(nèi)在單池超大規(guī)模集群建設(shè)上面臨困境,,只有幾個(gè)互聯(lián)網(wǎng)大廠(chǎng)和電信運(yùn)營(yíng)商有芯片儲(chǔ)備和技術(shù)能力,,而根據(jù)大模型的Scaling Law(尺度定律),,至少在現(xiàn)有路徑上,,更多的算力才能造就更多的智能涌現(xiàn)。
電信運(yùn)營(yíng)商也開(kāi)始尋找另外的方向,,以網(wǎng)強(qiáng)算,。“我們已經(jīng)在實(shí)驗(yàn)室實(shí)現(xiàn)了百公里內(nèi)的并池計(jì)算,。”劉敬謙告訴記者,,為了突破單池算力限制,,中國(guó)電信正在嘗試?yán)?00G/800G的超高寬帶將兩個(gè)位于不同區(qū)域的實(shí)驗(yàn)室,,無(wú)損高速連接起來(lái),,同一個(gè)預(yù)訓(xùn)練任務(wù)可以同步部署在兩個(gè)相隔百公里的實(shí)驗(yàn)室里,而且連續(xù)訓(xùn)練時(shí)長(zhǎng)與在同一個(gè)物理數(shù)據(jù)中心內(nèi)訓(xùn)練相當(dāng),,“下一步,,我們還將在京滬兩個(gè)單池萬(wàn)卡群間進(jìn)行超高速直連測(cè)試”。
一旦實(shí)驗(yàn)成功,,將大大緩解國(guó)產(chǎn)大模型的“算力焦慮”,。GPT-4模型有2萬(wàn)億參數(shù)和8萬(wàn)億token,,10000顆英偉達(dá)H100,需要訓(xùn)練三個(gè)月,,換成最新的超級(jí)芯片BX200,,10000顆芯片只需要10天,。而受限于產(chǎn)能,,目前能夠穩(wěn)定供貨萬(wàn)卡以上的國(guó)產(chǎn)芯片并不多。如果數(shù)據(jù)中心間網(wǎng)速能夠幾乎等同于數(shù)據(jù)中心內(nèi)部高速互聯(lián),,此前全國(guó)各地零散建設(shè)的地方智算中心,,將可被有效利用。
多路徑破局“鐵幕”的嘗試,,讓國(guó)產(chǎn)算力和國(guó)產(chǎn)大模型的春天悄然而至,。
排版/ 季嘉穎
圖片/ IT時(shí)報(bào) WAIC
來(lái)源/《IT時(shí)報(bào)》公眾號(hào)vittimes
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,觀(guān)點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀(guān)點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1111768.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。