【文/觀察者網(wǎng) 周毅 編輯 呂棟】相比于ChatGPT問世時(shí)的火爆,,大模型“聊天”的魅力似乎正在悄然消退,。在本月最新文章中,,網(wǎng)絡(luò)分析公司Similarweb表示,,隨著新鮮感的消失,,ChatGPT的流量正在下降,。據(jù)初步估計(jì),,今年6月ChatGPT網(wǎng)站的全球訪問量下降了9.7%,這是該網(wǎng)站訪問量首次錄得環(huán)比下降,。在美國(guó)市場(chǎng)上,,該網(wǎng)站訪問量環(huán)比降幅錄得10.3%。很明顯,,“Chat”并不是大模型的全部,,只靠寫詩(shī)、作畫也無(wú)法重構(gòu)人類社會(huì),。
Similarweb文章截圖不過,,自問世以來(lái),大模型“聊天”一直在向垂直領(lǐng)域下沉,,不斷重塑著人們的生活,。國(guó)際權(quán)威期刊《JAMA InternalMedicine》一項(xiàng)研究表明,當(dāng)需要仔細(xì)回答患者提問時(shí),,醫(yī)生平均回復(fù)長(zhǎng)度是52個(gè)單詞,,聊天機(jī)器人是211個(gè)單詞。它的回復(fù)不僅內(nèi)容更多,,而且質(zhì)量更好,,更加富有同理心。在評(píng)估中,,78.6%的人更喜歡聊天機(jī)器人的回答,,而不是醫(yī)生的回答。將大模型投入產(chǎn)業(yè)應(yīng)用,,也正在成為國(guó)內(nèi)外眾多企業(yè)的選擇,。不久前在上海閉幕的第六屆世界人工智能大會(huì)(WAIC)上,京東等不少企業(yè)介紹了自己的解決方案和相關(guān)思考,。圍繞“貼合行業(yè)場(chǎng)景”,,有人選擇讓通用大模型下沉向行業(yè),也有人選擇直接打造垂直大模型,。頭腦風(fēng)暴一下:除了更好地理解“場(chǎng)景”,,人工智能今后還會(huì)往哪些方面發(fā)展,?京東探索研究院院長(zhǎng)、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬表示,,通向真正的人工智能,,多模態(tài)是必經(jīng)之路?!叭耸冀K是一個(gè)核心存在,,所有技術(shù)最后都要服務(wù)人,。未來(lái)的AI需要通過語(yǔ)言、視覺和語(yǔ)音和人類進(jìn)行交流,,所以未來(lái)的AI也必須理解語(yǔ)言,、語(yǔ)音。做好多模態(tài),,才能更好的服務(wù)好人類,。”在當(dāng)下的競(jìng)爭(zhēng)環(huán)境中,,“場(chǎng)景落地”,,才是大模型的終極目標(biāo)。大模型應(yīng)用落地,,理解場(chǎng)景是關(guān)鍵,?今年WAIC最熱門的話題之一,就是如何讓大模型應(yīng)用落地,。這本身不難理解:國(guó)內(nèi)外大模型不能局限于“聊天”,。基于智能交互,,它本身就是一種提升生產(chǎn)效率的工具,。任何大模型,未來(lái)最終都要落地于具體的行業(yè)應(yīng)用,,提高生產(chǎn)力,;在大模型競(jìng)爭(zhēng)中,中國(guó)和其他國(guó)家相比各有千秋,,雖然存在差距,,但中國(guó)行業(yè)多、發(fā)展成熟,,這或許是一個(gè)可以“超車”的機(jī)會(huì),。從數(shù)據(jù)來(lái)看,在算力等方面,,中國(guó)未必就處于劣勢(shì),。中國(guó)工程院院士鄔賀銓曾指出,按2022年年底的數(shù)據(jù),,美國(guó)占全球算力36%,,中國(guó)占31%,單看算力總規(guī)模,,中國(guó)與美國(guó)確實(shí)有差距,,但差距并不大;若以GPU和NPU為主的智能算力規(guī)模來(lái)看,2021年美國(guó)智算規(guī)模占全球智算總規(guī)模15%,,中國(guó)占26%,。但差距依然值得重視,例如深度學(xué)習(xí)框架還需要經(jīng)受考驗(yàn),、繼續(xù)打磨,;例如生成式AI拓展到產(chǎn)業(yè)應(yīng)用,需要將多個(gè)大模型高效融合,,由此帶來(lái)很多問題;例如大模型需要海量數(shù)據(jù)訓(xùn)練,,但目前中文可供訓(xùn)練的語(yǔ)料挖掘還不足,;例如大模型訓(xùn)練所依賴的英偉達(dá)A100芯片,被限制向中國(guó)出口……中國(guó)依然面臨眾多挑戰(zhàn),。
圖源英偉達(dá)網(wǎng)站在新一輪全球人工智能競(jìng)賽中,,大模型本身確實(shí)是必啃的“硬仗”。但中國(guó)其實(shí)有一個(gè)出“奇兵”的機(jī)會(huì),。數(shù)據(jù),、算力和“鈔能力”對(duì)大模型而言缺一不可,但大模型的發(fā)展同樣離不開“場(chǎng)景”,。本質(zhì)上,,大模型改變的是人類獲取信息和服務(wù)的方式。它不僅需要滿足信息匹配的需求,,更要讓AI精準(zhǔn)地理解人類的用途,,精準(zhǔn)地完成人類交付的任務(wù)?!熬珳?zhǔn)”,,就基于對(duì)場(chǎng)景的理解。在WAIC大會(huì)上,,京東探索研究院院長(zhǎng),、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬表示,伴隨著大模型的出現(xiàn),,世界未來(lái)必然會(huì)走向智能交互時(shí)代,,讓機(jī)器更好地幫助我們完成專業(yè)域、更廣泛的任務(wù),。何曉冬表示,,訓(xùn)練好大模型就需要場(chǎng)景,“場(chǎng)景和數(shù)據(jù)是這個(gè)時(shí)代訓(xùn)練大模型的抓手,?!被蛟S這會(huì)是中國(guó)的機(jī)遇所在。拿工業(yè)來(lái)說(shuō),中國(guó)擁有41個(gè)工業(yè)大類,、207個(gè)工業(yè)中類,、666個(gè)工業(yè)小類,是全世界唯一擁有聯(lián)合國(guó)產(chǎn)業(yè)分類中所列全部工業(yè)門類的國(guó)家,;在互聯(lián)網(wǎng)方面,,中國(guó)有大量電商、社交,、搜索領(lǐng)域的企業(yè),,擁有成熟經(jīng)驗(yàn)和龐大數(shù)據(jù),大模型和這些行業(yè),、場(chǎng)景的結(jié)合,,或許會(huì)帶來(lái)大量機(jī)遇。
生產(chǎn)車間一景 圖源新華社例如電商,。網(wǎng)經(jīng)社此前發(fā)布的《2022年度中國(guó)電子商務(wù)市場(chǎng)數(shù)據(jù)報(bào)告》顯示,,2022年國(guó)內(nèi)網(wǎng)絡(luò)零售市場(chǎng)交易規(guī)模達(dá)137853億元;中國(guó)網(wǎng)絡(luò)零售用戶規(guī)模達(dá)8.45億人,,占網(wǎng)民整體的79.2%,。這個(gè)“大場(chǎng)景”下涌現(xiàn)了直播、社交,、美妝,、母嬰等“子場(chǎng)景”,電商,、物流,、客服……它們都可能成為大模型應(yīng)用落地的入口。理解場(chǎng)景之后,,AI的下一站是多模態(tài)能力,?圍繞行業(yè)場(chǎng)景,一些“解決方案”已經(jīng)出爐,。據(jù)何曉冬介紹,,通過5分鐘的形象和數(shù)據(jù)采集,基于大模型能力,,京東可以重構(gòu)整個(gè)數(shù)字人形象,,并推向應(yīng)用場(chǎng)景。比如在電商這個(gè)場(chǎng)景中,。言犀虛擬主播已經(jīng)在京東上線了4000+品牌直播間,,累計(jì)帶動(dòng)8億GMV(商品交易總額)。不過重視場(chǎng)景應(yīng)用,,或許只是大模型全球競(jìng)賽的現(xiàn)在,,而非將來(lái),。何曉冬表示,人們不要只關(guān)注到ChatGPT帶來(lái)的語(yǔ)言大模型,。實(shí)際上,,大模型技術(shù)在很多其他模態(tài)上也在迅速應(yīng)用起來(lái),比如語(yǔ)音識(shí)別和語(yǔ)音合成,,比如視覺領(lǐng)域的圖像識(shí)別和視頻合成——當(dāng)然也包括數(shù)字人,。“數(shù)字人既有形象,,又有語(yǔ)音,,還有手勢(shì),還有語(yǔ)義,,還有各種情緒在里面,。”何曉冬表示,,多模態(tài)是必經(jīng)之路,,無(wú)論是發(fā)明神經(jīng)網(wǎng)絡(luò)或者是注意力機(jī)制,,其實(shí)都是基于對(duì)人本身學(xué)習(xí)機(jī)制的理解和靈感的激發(fā),,從而去引領(lǐng)我們發(fā)明一系列模型。有趣的是,,今年不少參會(huì)企業(yè),,似乎都對(duì)“數(shù)字人”情有獨(dú)鐘,由此可見各界對(duì)多模態(tài)能力的重視,。今年WAIC大會(huì)上,,騰訊云MaaS(Model-as-a-Service)一站式服務(wù)迎來(lái)升級(jí)。騰訊云行業(yè)大模型能力將被應(yīng)用到金融風(fēng)控,、交互翻譯,、數(shù)智人客服等場(chǎng)景中。通過平臺(tái)提供的AI生成算法,、生成式動(dòng)作驅(qū)動(dòng),,再結(jié)合行業(yè)大模型能力,企業(yè)可以獲得個(gè)性化,、專業(yè),、逼真的數(shù)字員工。數(shù)字人,,其實(shí)就涉及到多模態(tài)能力,。《人機(jī)共生——大模型時(shí)代的十大AI趨勢(shì)觀察》報(bào)告指出,多模態(tài)技術(shù)的發(fā)展正在助力AI解決更為復(fù)雜的問題,。擁有圖像和語(yǔ)音的感知,、輸入,大模型未來(lái)可以基于動(dòng)作,、表情,、情感等信息進(jìn)行分析,提升自己的交互能力和表現(xiàn)能力,。目前基于文本的交互,,也將走向基于語(yǔ)義的交互,強(qiáng)化對(duì)人類情緒的感知和表達(dá),。
現(xiàn)場(chǎng)圖需要承認(rèn)的是,,在多模態(tài)等通往未來(lái)的賽道上,挑戰(zhàn)依然存在,。ChatGPT-4早已開始接受圖像作為輸入介質(zhì),,它已經(jīng)能簡(jiǎn)練地指出圖片的違和之處。如下圖所示,,當(dāng)用戶提問,,“這張圖片有什么不尋常之處”時(shí),GPT-4簡(jiǎn)練地回答出“一名男子正在行駛中的出租車車頂上,,使用熨衣板熨燙衣服,。”
在今年的WAIC大會(huì)上,,談及國(guó)內(nèi)外在大模型方面的差距,,曠視科技聯(lián)合創(chuàng)始人、CTO唐文斌對(duì)《科創(chuàng)板日?qǐng)?bào)》表示,,不管是基礎(chǔ)語(yǔ)言模型還是多模態(tài)模型,,國(guó)內(nèi)外都存在一定的距離?!安贿^,,這是可以迎頭趕上的。在應(yīng)用的探索上,,也處于相對(duì)初期的狀態(tài),。但未來(lái)會(huì)是繁榮的生態(tài)?!狈脚d未艾,,眼下正是國(guó)內(nèi)企業(yè)積極作為之時(shí)。在接受觀察者網(wǎng)采訪時(shí),,何曉冬表示,,未來(lái)通用人工智能有兩個(gè)方向要走,,一個(gè)方向是多模態(tài),大模型必須具有視覺能力,,未來(lái)甚至可以更進(jìn)一步延伸向嗅覺,、觸覺;另外一個(gè)方向是走向具身智能,,包括機(jī)器人,、機(jī)械臂、無(wú)人車等,,讓通用人工智能走向物理世界,。本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),,不得轉(zhuǎn)載,。
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1104476.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。