在上海世博中心和上海世博展覽館的路上,,一個貼了數(shù)個微信群二維碼的立牌旁,,不少路人掃描入群,一個女士說:“很多群都滿了,,需要有人拉才行,。”
而在另一個微信群里,,不時有群主提示,,展覽館開放注冊了,可以注冊進入了,。
連日的梅雨之后,,上海進入炎熱的夏季,正在舉行的2024世界人工智能大會,,就像當下37,、38度的天氣一樣,無論是場內(nèi)還是場外,,熱度都非常高,,國內(nèi)外專家學(xué)者和企業(yè)家們,都加入到這場AI的最大盛會,。
百度創(chuàng)始人李彥宏分享中提到說,,上一次參加世界人工智能大會是2022年,,當時主題是元宇宙,,當時主辦方希望他講元宇宙,李彥宏堅持說講AI,,并把主題定在了AIGC,,“我認為AI的技術(shù)發(fā)展路線,發(fā)生了方向性的改變,,就是從過去的辨別式人工智能,,轉(zhuǎn)向了未來的生成式人工智能?!崩顝┖暾f,,講這話后的5個月,ChatGPT發(fā)布,,后來的事情大家就更清楚,,兩年的時間恍若隔世,整個世界都變了,,人工智能顛覆了絕大多數(shù)人的認知,。
阿里云CTO周靖人也是早在2022年就提出了MaaS,也就是模型即服務(wù)的概念,,“兩年前,,我們在世界人工智能大會上發(fā)布通義大模型系列,當時我們公布,,通義核心模型將開源開放,。到今天,通義千問已經(jīng)實現(xiàn)真正意義上的全尺寸,、全模態(tài)開源,,拉平了開源,、閉源模型之間的差距?!敝芫溉嗽?024世界人工智能大會期間這樣說,。
確實,在這個AI盛會期間,,各路大佬們分享的高密度信息,,以及思維和觀點的碰撞,,夾雜著對未來發(fā)展趨勢的洞悉和預(yù)判,,一定程度上,讓我們看到未來的一部分,。
接下來,,我們看看大佬們都說了什么吧!
上海人工智能實驗室主任,、首席科學(xué)家,,清華大學(xué)惠妍講席教授,銜遠科技創(chuàng)始人周伯文:通向AGI的必經(jīng)之路是ABI,,并會有通專融合的“價值引爆點”
“通向AGI的必經(jīng)之路是ABI,,即廣義人工智能。從學(xué)術(shù)上我給出了嚴格的定義:自監(jiān)督,、端對端,、從判別式走向生成式?!?/p>
周伯文認為,,人工智能AGI落地會有一個高價值區(qū)域,同時要求模型兼?zhèn)浜軓姷姆夯芰妥銐虻膶I(yè)性,。這個區(qū)域離原點最近的位置,,我們把它叫做通專融合的“價值引爆點”。
根據(jù)對歷史生產(chǎn)力提升的分析,我們認為處在這個點的大模型,,在專業(yè)能力上應(yīng)超過90%的專業(yè)人類,,同時具備強泛化能力,即ABI的能力,。誰先進入高價值區(qū)域,,即意味著誰的能力更強,擁有更多的場景和數(shù)據(jù)飛輪,,并因此更早擁有自我進化迭代的能力,。
周伯文認為,,強泛化之上的專業(yè)能力是AI皇冠上的明珠,,通專融合的發(fā)展新范式。
如何瞄準構(gòu)建一個既具有泛化性又具備專業(yè)能力的AI系統(tǒng),,以更高效,、更好地適應(yīng)和解決現(xiàn)實世界中的復(fù)雜問題?這包括三層重點工作:
-
基礎(chǔ)模型層:專注于更高效地構(gòu)建通用泛化能力,,尤其是其高階能力,,如數(shù)理、因果推理等,。通過高質(zhì)量數(shù)據(jù)的清洗和合成,,研發(fā)高性能訓(xùn)練框架、高效的模型架構(gòu),。
-
融合協(xié)同層:采用多路線協(xié)同的算法和技術(shù),,構(gòu)建比肩人類優(yōu)秀水平的專業(yè)能力。我們的原創(chuàng)工作包括高密度監(jiān)督信號的生成,、復(fù)雜任務(wù)規(guī)劃,,以及新的架構(gòu)來實現(xiàn)系統(tǒng)1(即快速、直覺反應(yīng)的系統(tǒng))和系統(tǒng)2(慢速,、邏輯分析的系統(tǒng))之間的交互,。通過這些技術(shù),AI能夠在復(fù)雜環(huán)境中做出決策,,將復(fù)雜任務(wù)分解為更易管理的子任務(wù),,制定行動計劃,并有效地協(xié)調(diào)多個智能體,,以實現(xiàn)群體智能的涌現(xiàn),。
-
自主進化與交互層:強調(diào)AI的自主探索和反饋閉環(huán)的重要性。AI系統(tǒng)需要能夠在真實或仿真世界中自主地收集數(shù)據(jù),、學(xué)習(xí)并適應(yīng)環(huán)境,。通過與環(huán)境的交互,AI能夠獲得反饋,,這些反饋對于其自我進化至關(guān)重要,。自主進化與交互層使AI能夠進行具身自主學(xué)習(xí),最終對世界模型有更深刻的理解并與之交互,,完成開放世界任務(wù),。
早在1900年,德國數(shù)學(xué)家大衛(wèi)·希爾伯特(David Hilbert)提出了著名的“23個問題”,,引領(lǐng)了數(shù)學(xué)很多子領(lǐng)域數(shù)百年的發(fā)展,。
在科學(xué)上,,提出一個好問題往往比解決問題更重要。希爾伯特還有一句名言,,這也是他的墓志銘:“We must know. We will know.”我們必須知道,。我們終將知道。
“今天我們踏上通專融合的路線,,探索通用人工智能AGI的未來,,展望下一代的AI for Science,更可以從這句話中汲取靈感和激勵,?!敝懿倪@樣說。
中國工程院院士,、清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)院長張亞勤:大模型和生成式AI有五個大的趨勢
在 2024 世界人工智能大會 “長三角協(xié)同創(chuàng)新AI新質(zhì)生產(chǎn)力發(fā)展”論壇上,,中國工程院院士、清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)院長張亞勤就大模型和生成式AI的發(fā)展趨勢等進行了分享,。
張亞勤認為大模型和生成式AI有五個大的趨勢:
-
第一個趨勢是多模態(tài),、跨模態(tài)、多尺度,,這里面有文字,、聲音、圖像,、視頻,,但是也包括像激光雷達、結(jié)構(gòu)傳感器,、生物里面DNA,、蛋白質(zhì)、細胞,,其實是一種多模態(tài),、跨模態(tài)的方式。
-
第二個趨勢是走向邊緣,,現(xiàn)在講的大模型更多的是基礎(chǔ)大模型在云端的,,現(xiàn)在更多的智能走向PC、電視,、手機,、車,走向各種邊緣,。
-
第三是智能體的發(fā)展,,特別是自主規(guī)劃去完成一個任務(wù),,自我升級,包括自我編程,、自動試錯,。
-
第四是物理智能,現(xiàn)在大模型和物理世界結(jié)合起來,,包括無人車,、無人機、無人系統(tǒng),,包括物理設(shè)施,、基礎(chǔ)設(shè)施,走向通用人工智能不僅僅要理解這個世界,,要讀書,,而且要走路。其實物理智能就是我們機器和物理世界交互學(xué)到我們這個世界模型,。
-
第五是比較長遠,也是最重要的智能,是生物智能,,我們把大模型和我們的大腦、器官,、生物體連在一塊的時候,,這時候智能是AI加上HI新的智能。
張亞勤認為,,現(xiàn)在行業(yè)簡單的堆算力,、堆數(shù)據(jù),一定會有達到一個瓶頸,,一定會遇到一個瓶頸,,效率十分低,比起人的大腦目前效率可能低3個數(shù)量級,,現(xiàn)在有860億個神經(jīng)元,。“每個神經(jīng)元有一千到一萬個連結(jié),,但是我們只用20瓦,,所以我們的效率是高了很多?!?/p>
張亞勤預(yù)計,,未來五年會出現(xiàn)一個全新的架構(gòu),這個框架需要首先要有一個記憶系統(tǒng),,像人類是三層有DNA記憶,、短期記憶、海馬體記憶,,皮層記憶,、長期記憶?,F(xiàn)在目前的AI大模型是沒有真正的支持記憶系統(tǒng)的,沒有真正的物理模型,系統(tǒng)推理能力比較差,透明性也比較差,。
什么時候可以達到AGI,?張亞勤給出一個時間段:15-20年,。他把這個時間分成三個階段:
-
第一是現(xiàn)在信息智能,多模態(tài)智能,。
目前的ChatGPT或者GPT4已經(jīng)通過圖靈測試了,,視頻像Sora等在5年之內(nèi)預(yù)計也能通過圖靈測試,,是一個新的圖靈測試,。
-
第二個是物理智能或者具身智能,,這可能需要5年甚至更長的時間,。
具身智能第一個就是無人駕駛,,無人駕駛可能是最快通過圖靈測試的具身智能,。然后是機器人,產(chǎn)業(yè)的機器人、家庭的機器人等,這個需要可能5-10年的時間。
-
最后是生物智能,包括腦機接口,、植入芯片或者是傳感器也好,,可能還需要5年、10年,。如果5年前問我這個問題我說可能需要50年,,過去這幾年大模型的發(fā)展,我認為是加速了,,20年之內(nèi)可以達到AGI,。
中國工程院院士,、之江實驗室主任,、阿里云創(chuàng)始人王堅:一定會有新的大公司出現(xiàn),,也一定會有大公司烈火重生
“人工智能有一個非常長的過去,,但是有一個非常短的歷史。長到什么時候呢,?長到其實你可以追溯到一百多年以前,。但是短到什么時候呢?短到就是GPT的出來,。GPT的潛力,,今天事實上還是沒有被完整的探索的,?!?/p>
王堅認為,,未來十年將是一個非常激動人心的十年,,一定會有新的大公司出現(xiàn),,也一定會有大公司烈火重生。
人工智能,,是一個非常革命性的東西,。它對產(chǎn)業(yè)的影響一定是反映在兩方面:
-
第一, 只要是個新的技術(shù),,一定會有新的大公司出現(xiàn),。如果一個新的技術(shù)出來,沒有新的大公司出現(xiàn),,那它是不是顛覆性的技術(shù)是要打個問號的,。但是我自己相信,在這個時代一定會有新的大公司出來,。就像當年的GE一樣,,這是第一個邏輯來看這件事情。
-
第二,, 一定會有大公司是烈火重生的,。就像前幾天大家看到蘋果這個事情。我覺得蘋果這個發(fā)布很有意思,,不是他拿AI去服務(wù)了C端的客戶,,事實上人工智能技術(shù)重新重構(gòu)了蘋果這家公司,這個重構(gòu)是從重構(gòu)它的操作系統(tǒng)開始的,。所以我自己覺得,,因為有了人工智能技術(shù),蘋果這家公司不一樣,,那是不是真的能不一樣,?但我們要再往下看,但是我想只有不一樣,,以后他可能才可以市場上活得更好,。所以我想對于大公司而言,,就是大的企業(yè)而言,只有兩種可能性,。
王堅說,因為數(shù)據(jù)等,,人工智能對大公司會友好一點,。但友好并不是說它會對你寬容,你沒有創(chuàng)造力,,它也不會對你寬容,,因為該面臨的挑戰(zhàn)還是會面臨的。
“最后你發(fā)現(xiàn)有一個因素容易被忽略,,就是人,。AI我們這么講是革命性力量的時候,你發(fā)現(xiàn)AI對每個部門都會產(chǎn)生影響,,要所有部門的所有人都去擁抱AI這在很多大企業(yè)是很難的,。我想小企業(yè)跟大企業(yè)的差別就是,根本上,,小企業(yè)一定會覺得大企業(yè)一定會覺得AI是工具的革命,。小企業(yè)一定會覺得這是革命的工具,那就是點差別,。我想大企業(yè)也要意識到這是革命的工具,,那這個變化就來了?!?/p>
另外,,關(guān)于能源問題,王堅認為,,要放在時間和空間維度動態(tài)來看,。
“1980年全世界都擔(dān)心石油馬上沒有了,沒想到越到現(xiàn)在石油反而更便宜了,?!蓖鯃哉J為,所有的問題都是要在動態(tài)過程中解決,,你根本不會想到可能十年以后說的算力,,跟今天說的算力不是同一個算力。十年以后說的電,,可能跟今天說的電也不是同一個概念,。“所以我是覺得這個還是要在動態(tài)過程解決,,一定不能在現(xiàn)在這個時刻的狀態(tài)來解決十年以后的問題,。要拿十年以后的狀態(tài)來解決十年以后的問題,。”
商湯科技董事長兼CEO徐立:有應(yīng)用支撐,,才能迎來AI的超級時刻
“超級時刻和應(yīng)用是互相成就的,,只有超級時刻帶來的認知的變化,,最后才能推動這樣一個應(yīng)用。所以倒推回來,,如果我們后面用應(yīng)用來支撐,,那么我們現(xiàn)在這個時刻就是超級時刻?!?024世界人工智能大會期間,,徐立說,就像IPhone一樣,,因為是有了這個平臺,,后面才有iOS上面的App Store生態(tài),應(yīng)用是決定這個時代是不是人工智能超級時刻的一個關(guān)鍵,。
要走向應(yīng)用,,人們在認知上有幾個核心的重要的突破點:
-
一是對高階的邏輯數(shù)據(jù)的依賴性來解決人工智能的推理問題,就是它的智慧,。
現(xiàn)在的人工智能大模型某種程度上只是記憶器,,他只是背下了所有的知識點,它僅有的一點點的智能其實是來自于互聯(lián)網(wǎng)上的數(shù)據(jù)背后帶有的一個高階的邏輯思維鏈,。那在在垂直領(lǐng)域里要做一個突破,,依賴于人類去構(gòu)造更加高級的思維鏈背后的邏輯,甚至是再往上一步,,不依賴于人類,,也就是通過跟真實世界的交互形成執(zhí)行的數(shù)據(jù),形成知識層,、推理層以及執(zhí)行層,。
-
第二個是實時的交互性能夠帶來一個流暢的體驗,也是帶來推動超級時刻以及應(yīng)用變化的一個核心,。
-
最后很重要的一點是可控性,,不管是文本、圖像,、視頻,,如果對它沒有具備可控性,它作為一個工具,它本身能夠帶來的效能的提升就非常的有限,。
徐立說,,如果要推動人工智能超級時刻的到來,需要大模型可以展現(xiàn)出卓越的深度思考的能力,。首先合成的人工數(shù)據(jù),,特別是高級思維的數(shù)據(jù)往往是非常重要的,所以越是有應(yīng)用的場景,,才能形成更好的高質(zhì)量的數(shù)據(jù)的一些核心,。
第二自然的沒有延遲的交互。所以端側(cè)其實也是一個非常重要的突破點,,今年商湯科技著重推動模型的端側(cè)優(yōu)化,實時的交互變化更加的流暢,。用好端和云兩部分的計算機資源,,才能夠成為一種全自然的交互模式。
第三就是所有的生成都要可控,,你不需要做得很好,,但你需要知道你哪里做得不好,并且說做哪里進行一些修改,,有了這樣的一個邊界,,那么實際上才能做到真正的可控技術(shù)以及可持續(xù)的技術(shù)發(fā)展。
百度創(chuàng)始人,、董事長兼首席執(zhí)行官李彥宏:閉源模型最能打,、避免掉入”超級應(yīng)用陷阱”,最看好智能體
2024世界人工智能大會期間,李彥宏的分享不僅回應(yīng)了關(guān)于開源還是閉源的問題,,也提到了是否發(fā)展超級應(yīng)用等問題,。
李彥宏認為,在大多數(shù)的應(yīng)用場景,,開源模型并不合適,,當你處在一個激烈競爭的市場環(huán)境當中的時候,你需要是讓自己業(yè)務(wù)的效率比你的同行更高,,成本比你的同行更低,,這個時候商業(yè)化的閉源模型是最能打的。
李彥宏說,,有些外行甚至混淆了模型開源和代碼開源這兩個概念,,模型開源你拿到的是一大堆的參數(shù),你還是要去做SFT(監(jiān)督微調(diào)),,還是要去做安全對齊,,你不知道這些參數(shù)是怎么來的,。你是無法做到眾人拾柴火焰高的,即使你拿到對應(yīng)的源代碼,,你也不知道他用了多少數(shù)據(jù),,用了什么比例的數(shù)據(jù)去訓(xùn)練這些參數(shù)。所以拿到這些東西,,并不能夠讓你站在巨人的肩膀上去迭代和開發(fā),。
所以同樣參數(shù)規(guī)模之下,閉源模型的能力就比開源模型要更好,,而如果開源想要能力追平閉源,,那么它就需要有更大的參數(shù),這就意味著推理成本會更高,,反應(yīng)速度會更慢,。
李彥宏也強調(diào)了從卷模型到卷應(yīng)用的觀點,“沒有應(yīng)用,,光有基礎(chǔ)模型,,不管是開源還是閉源都一文不值?!?/p>
李彥宏說,,基于基礎(chǔ)模型的應(yīng)用在各行各業(yè)、各個領(lǐng)域都已經(jīng)開始了逐步的滲透,,兩個多月前我們宣布文心大模型的日調(diào)用量超過了2億,,最近文心的日均調(diào)用量超過了5億!僅僅兩個多月的時間,,調(diào)用量發(fā)生了這么大的變化,,足見它背后代表了真實的需求,是有人在用,,是有人真的從大模型當中獲益了,,得到了價值。
比如在快遞領(lǐng)域,,讓大模型幫助處理訂單,,做到了”一張圖、一句話寄快遞”,,不再需要其他繁瑣的流程,,時間從3分多鐘縮短到19秒。而且90%以上的售后問題,,也都由大模型來解決,,效率提升非常的明顯。
再比如在小說創(chuàng)作領(lǐng)域,一開始也用開源模型做出過一些效果,,后來改用文心輕量級模型,,經(jīng)過10輪上萬組數(shù)據(jù)的SFT和post pretrain,結(jié)果有了明顯的提升,,最近又轉(zhuǎn)到文心4.0版本,,僅用了數(shù)百條數(shù)據(jù),4.0就在情節(jié)和邏輯方面展現(xiàn)出了非凡的優(yōu)勢,,生成的內(nèi)容無論是可用率還是優(yōu)質(zhì)率都大大超過了輕量級模型,,網(wǎng)文作者們?nèi)缁⑻硪恚?/p>
其實更通用的領(lǐng)域,比如說代碼生成,,文心快碼這樣的軟件,,在各個領(lǐng)域,也在逐步的滲透,,百度內(nèi)部的話,,我們有30%左右的代碼,已經(jīng)用AI生成的,,代碼的采用率超過了44%。
李彥宏認為,,要避免掉入”超級應(yīng)用陷阱”,,覺得一定要出現(xiàn)一個DAU10億的APP才叫成功,這是移動時代的思維邏輯,。其實不一定,,AI時代,”超級能干”的應(yīng)用比只看DAU的”超級應(yīng)用”恐怕要更重要,,只要對產(chǎn)業(yè),、對應(yīng)用場景能產(chǎn)生大的增益,整體的價值就比移動互聯(lián)網(wǎng)要大多了,。
”隨著基礎(chǔ)模型的日益強大,,開發(fā)應(yīng)用也越來越簡單了,最簡單的就是智能體,,這也是我們最看好的AI應(yīng)用的發(fā)展方向,。“李彥宏認為,,制作一個好的智能體通常并不需要編碼,,只要用人話把智能體的工作流說清楚,再配上專有的知識庫,,一般就是一個很有價值的智能體了,。這比互聯(lián)網(wǎng)時代制作一個網(wǎng)頁還要簡單。
未來在醫(yī)療、金融,、教育,、制造、交通,、農(nóng)業(yè)等等領(lǐng)域,,都會依據(jù)自己的場景,自己特有的經(jīng)驗,、規(guī)則,、數(shù)據(jù)等等,做出各種各樣的智能體,,將來會有數(shù)以百萬量級的智能體出現(xiàn),,形成龐大的智能體生態(tài)。
上??茖W(xué)智能研究院院長,、復(fù)旦大學(xué)浩清特聘教授、無限光年創(chuàng)始人漆遠:實現(xiàn)通用人工智能的最好標志之一就是實現(xiàn) “AI愛因斯坦”
“在AI 1.0時代,從風(fēng)控到搜索,、推薦,,每個具體任務(wù)都訓(xùn)練出一個模型,聚焦同一個任務(wù)或領(lǐng)域的具體任務(wù),?!逼徇h認為,“在今天的AI 2.0時代,,大模型有更好的泛化能力,,可以在很多領(lǐng)域或某一類垂直領(lǐng)域的多項任務(wù)中發(fā)揮接近或超越人類的能力。我們看到了通用人工智能的火花,?!?/p>
與AI對話,欣賞與傳播AI生成的文本,、圖片與視頻……AI已經(jīng)為人們的生活帶來便利與樂趣,。但是“所有的大模型都是‘做夢的機器’,都有幻覺的特點”,,漆遠坦言,,“幻覺和幻想類似,在情感對話和藝術(shù)創(chuàng)作里可以發(fā)揮作用,。但是如果想把大模型作為生產(chǎn)力工具,,在科研,、醫(yī)學(xué)、金融等領(lǐng)域的核心業(yè)務(wù)里發(fā)揮重要作用,,大模型的幻覺就是個大問題,,可能會違背基礎(chǔ)規(guī)律,導(dǎo)致差之毫厘,,謬以千里,。”“從微觀的分子,,到宏觀的人體表型,、到更宏觀的氣象氣候和復(fù)雜的經(jīng)濟金融系統(tǒng),我們需要AI大模型做出精準預(yù)測,,給出靠譜的答案,,甚至發(fā)現(xiàn)未知的規(guī)律?!?/p>
漆遠認為,,scaling law還有紅利,但是基于transformer(注:變壓器)自回歸架構(gòu)的大模型不足夠走到通用人工智能,,無論是從AI技術(shù)本身角度還是從能耗的角度而言,。未來要把人工智能的邏輯推理為代表的符號主義和深度學(xué)習(xí)為代表的聯(lián)結(jié)主義結(jié)合在一起,融合知識規(guī)則,、數(shù)字世界與物理世界里的數(shù)據(jù),,去探索與發(fā)現(xiàn)世界里的未知規(guī)律。
今天的深度學(xué)習(xí)是對數(shù)據(jù)的模擬和壓縮,,擅長對觀測數(shù)據(jù)的概率內(nèi)插預(yù)測,并不擅長對數(shù)據(jù)之外的外插推演,,更不擅長多步的邏輯推演,。而愛因斯坦的大腦,作為人類智能一個巔峰體現(xiàn),,結(jié)合有限的物理觀測數(shù)據(jù),、自己的“合成數(shù)據(jù)”和黎曼幾何等數(shù)學(xué)工具,提出狹義和廣義相對論,,適用于廣闊的宇宙,。漆遠認為實現(xiàn)通用人工智能的最好標志之一就是實現(xiàn) “AI愛因斯坦”,發(fā)現(xiàn)復(fù)雜世界的未知規(guī)律,。
施耐德電氣副總裁古月:沒有生態(tài)的力量,,AI很難真正發(fā)展起來
沒有生態(tài)的力量,AI很難真正發(fā)展起來,,更不用說在產(chǎn)業(yè)推廣應(yīng)用,。
因為AI要蓬勃發(fā)展,,需要算法、算力,、數(shù)據(jù)等因素的支撐,,單獨一家企業(yè)很難具備這些所有的能力。AI的規(guī)?;瘧?yīng)用,、技術(shù)創(chuàng)新迭代、產(chǎn)業(yè)可持續(xù)發(fā)展,,這些都離不開高度開放合作的生態(tài)體系,。AI產(chǎn)業(yè)鏈上的不同企業(yè)、機構(gòu)和個人需要共同協(xié)作,、相互賦能,,才能釋放AI技術(shù)紅利和產(chǎn)業(yè)價值,實現(xiàn)經(jīng)濟效益和社會效益的共贏,。
施耐德電氣商業(yè)價值研究院認為,,企業(yè)對于AI價值的期待正在從單一向立體轉(zhuǎn)變,形成三大顯著趨勢:首先,,從僅重視AI的商業(yè)收益,,拓展到越來越注重社會環(huán)境價值;其次,,價值取向從宏觀決策到微觀個體,,更加關(guān)注AI如何影響并優(yōu)化每一位用戶的體驗;第三,,從追求AI帶來短期的快速增長,,到更重視長期的價值跨越。
騰訊集團副總裁蔣杰:場景應(yīng)用會成為未來大模型的決勝要素
“未來通用模型會成為水,、電,、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施一樣存在,供業(yè)務(wù)和應(yīng)用按需接入,?!彬v訊集團副總裁蔣杰認為,從行業(yè)和應(yīng)用的角度來看,,未來會出現(xiàn)更多不同尺寸,、不同模態(tài)的模型,業(yè)務(wù)可以通過大小模型的協(xié)同,,在提升性能的同時滿足定制化需求,。
騰訊混元大模型自2023年9月首次亮相以來,,經(jīng)過多次迭代升級,,在國內(nèi)率先采用MoE架構(gòu),實現(xiàn)性能大幅提升,,模型整體參數(shù)量已達到萬億,,tokens數(shù)量超過7萬億,居國內(nèi)大模型第一梯隊,。
目前,,騰訊混元大模型已通過騰訊云向企業(yè)及個人開發(fā)者開放,包含萬億,、千億,、百億等不同參數(shù)尺寸,接下來,,多種尺寸的騰訊混元MoE模型也將對外開源,,可分別支持手機端、PC端,、云以及數(shù)據(jù)中心等多樣化的部署場景,。
蔣杰表示,大模型行業(yè)正經(jīng)歷從單模態(tài)到多模態(tài),,再到全模態(tài)的演進,。比如在文生圖領(lǐng)域,最近效果比較好的是采用 DiT 架構(gòu)的模型,,它融合了早前主要用于文本生成的Transformer架構(gòu),,并在圖像和視頻生成任務(wù)中展現(xiàn)出了顯著的優(yōu)勢;在文生視頻領(lǐng)域,,視頻生成正朝著更高分辨率,、更長時長、更精細的方向發(fā)展,,一些較好的模型已經(jīng)能夠生成長達數(shù)分鐘高清的視頻,,帶來了廣闊的應(yīng)用想象空間。
騰訊混元大模型正在積極部署多模態(tài)甚至全模態(tài)技術(shù),,在文生圖方面,混元文生圖打造了業(yè)界首個中文原生DiT架構(gòu)生圖模型效果超開源 Stable Diffusion 模型,,發(fā)布一個多月Github 點贊數(shù)超過兩千,,是社區(qū)內(nèi)最受歡迎的國產(chǎn)開源文生圖模型;在3D生成方面,,單圖輸入僅需30秒即可生成動漫,、汽車、建筑等類型的3D模型,;在視頻生成方面,,騰訊混元擁有文生視頻,、圖生視頻、圖文生視頻,、視頻生視頻4大核心能力,,支持視頻風(fēng)格化、視頻重繪等多樣化的產(chǎn)品玩法,。
蔣杰認為,,場景應(yīng)用會成為未來大模型的決勝要素。當前大模型的落地主要集中在生產(chǎn)工具和提效方面,,距離真正的業(yè)務(wù)創(chuàng)新還有一定距離,,缺少殺手級的應(yīng)用,不過行業(yè)的探索一直沒有停下,。
T3出行CEO崔大勇 :2027年將是自動駕駛商業(yè)化運營拐點
除了大模型以外,,自動駕駛是人工智能技術(shù)落地應(yīng)用的另一重要領(lǐng)域。
自動駕駛何時會迎來大規(guī)模商業(yè)化運營?T3出行CEO崔大勇在2024 世界人工智能大會 “長三角協(xié)同創(chuàng)新AI新質(zhì)生產(chǎn)力發(fā)展”論壇上預(yù)測說,,2027年是自動駕駛進入商業(yè)化運營的拐點,。
一方面,隨著人工智能大模型時代到來,,自動駕駛技術(shù)日益成熟,。另一方面,自動駕駛車輛成本降低,?!癛obotaxi車輛成本在100萬元以上時,就沒有商業(yè)化應(yīng)用場景,。眼下,,我們已經(jīng)看到有企業(yè)推出30萬元以內(nèi)的量產(chǎn)車型。這樣的車輛批量上市,,便能夠大規(guī)模應(yīng)用,。”崔大勇說,。
值得一提的是,,相關(guān)部門積極推進完善智能網(wǎng)聯(lián)汽車和自動駕駛相關(guān)法律法規(guī)制度建設(shè),讓自動駕駛商業(yè)化應(yīng)用再提速,。其中,,五部門已確定20個城市(聯(lián)合體)為智能網(wǎng)聯(lián)汽車“車路云一體化”應(yīng)用試點城市。
從更長遠來看,,人工智能將大大改變?nèi)藗兂鲂畜w驗,。崔大勇舉例稱,,隨著自動駕駛,尤其是全無人駕駛時代的到來,,乘客將享有獨屬于自己的車上空間,。比如,乘客可以在車上開電視電話會,、玩游戲,,或者看視頻,這是一個私密的,、完全放松的個人空間,。
綜上,從各方的發(fā)言中,,不難看出,,在大模型的發(fā)展范疇下,更加務(wù)實的走向場景,、應(yīng)用,,找到商業(yè)化的路徑,已經(jīng)成為業(yè)內(nèi)的共識,,而且會在未來幾年時間成為發(fā)展的重要路徑和方向,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1111723.html
溫馨提示:投資有風(fēng)險,,入市須謹慎,。本資訊不作為投資理財建議。