原文來源:AI新智能
作者:甘潤澤
圖片來源:由無界 AI生成
1 什么是Agent?
什么是AI Agent,?想象一下你設(shè)計(jì)了一個(gè)電子游戲,,比如馬里奧賽車,。馬里奧就像一個(gè) AI Agent,,他需要在整個(gè)游戲過程中不斷地做出決策,比如何時(shí)加速,,何時(shí)轉(zhuǎn)彎,,何時(shí)跳躍,以此來躲避障礙,,超越其他車手,,最終獲得勝利。
在這個(gè)例子中,,整個(gè)游戲環(huán)境以及其他車手的動作等,,都組成了這個(gè)Agent的環(huán)境。Agent會根據(jù)這些信息,,做出最佳的決策,。比如,如果前方的道路正在向左轉(zhuǎn),,那么 Agent 就會決定向左轉(zhuǎn)彎,。
AI Agent的本質(zhì)是一個(gè)可以感知其環(huán)境,、在給定目標(biāo)下做出決策并采取行動的系統(tǒng)。這些決策是基于它對環(huán)境的理解,,比如它的目的地在哪,,它的位置在哪,周圍有哪些障礙等,。
另外,,AI Agent還有一個(gè)重要的特性,那就是它可以“學(xué)習(xí)”,。也就是說,,它可以通過與環(huán)境交互,不斷改進(jìn)自己的決策過程,。比如,,在多次游戲后,它可能會學(xué)會如何更好地避開障礙,,或者找到更好的賽道線路,。
總的來說,AI Agent就是那些能夠感知,、理解環(huán)境,,然后做出決策,采取行動,,并不斷學(xué)習(xí)和進(jìn)化的AI系統(tǒng),。
2 為什么Agent是接下來
AI賽道的主要發(fā)展方向?
下一階段大語言模型的發(fā)展,,目前來看是兩條發(fā)展方向,,一條是“向下發(fā)展”更新整個(gè)底層系統(tǒng);另一條是“向上發(fā)展”,,也即從更高維度,,更智能化,更自動化,,增加復(fù)雜性的方向,即Agent方向來提升大語言模型的生產(chǎn)力,。一個(gè)標(biāo)準(zhǔn)的單個(gè)Agent模塊包括記憶,,規(guī)劃,執(zhí)行,,反思模塊,,比大語言模型的交互方式更加具備智能性。
此外,,人們在不斷添加非常有吸引力的功能,,不斷地?cái)U(kuò)充想象力的邊界,,一些很酷的想法包括聯(lián)網(wǎng)搜索引擎,運(yùn)行編譯器功能,,這些功能在最近幾個(gè)月的研究中被一個(gè)個(gè)實(shí)現(xiàn),。
雖然單個(gè)Agent功能強(qiáng)大,上手簡單,,OpenAI GPTs本質(zhì)上就是關(guān)于單個(gè)Agent的未來人工智能商業(yè)模式,,開發(fā)者在GPTs上開發(fā)各式各樣的Agent,,用戶買下心儀的GPTs,隨后OpenAI和開發(fā)者共享收益,。這是一種集合社群,,開發(fā)者,平臺,,用戶的充滿想象力的商業(yè)模式,。
但是這還遠(yuǎn)遠(yuǎn)不夠,對于未來,,我們的想象力還可以往更遠(yuǎn)的地方發(fā)散,。
就比如,GPTs里面的Agent能不能自我學(xué)習(xí),,自我進(jìn)化,?
3 向上:黑盒愈黑?
近期OpenAI的Q*項(xiàng)目曝光,,本質(zhì)上是創(chuàng)造一種能夠自己生產(chǎn)新數(shù)據(jù),,自我學(xué)習(xí)進(jìn)化的Agent,這意味者人類將更加難以掌控,我稱之為“黑盒愈黑”,。
神經(jīng)網(wǎng)絡(luò)本身就處于黑盒狀態(tài),,一個(gè)能離開人類監(jiān)督實(shí)現(xiàn)自我進(jìn)化的黑盒,其不確定性會大大增加,,這個(gè)“黑盒”也會更加“黑”,。
從好的一面看,一個(gè)會自我學(xué)習(xí)的Agent,,恰恰是通往aging最有希望的一條路,。
人們探索aging已經(jīng)有近百年的歷史,而希望的曙光從來沒有像今天這樣離我們這樣近,,與之伴生的是巨大的不確定性:一個(gè)人們越來越難以理解但是越來越強(qiáng)大的黑盒,。
4 Agent的兩個(gè)小場景
接下來,我將介紹幾個(gè)最有代表性的Agent項(xiàng)目,,來幫助我們更好的理解Agent,。
第一個(gè)是爆火的AutoGPT。
AutoGPT因?yàn)樵诖笳Z言模型基礎(chǔ)上的全自動流程和聯(lián)網(wǎng)功能而聲名大噪,。在AutoGPT中,,你只需要給它設(shè)定一個(gè)大目標(biāo):比如,為我制作一份創(chuàng)業(yè)計(jì)劃,。它就可以通過大語言模型給出解決方案,,并借助聯(lián)網(wǎng)功能給出一份報(bào)告。
實(shí)際上,,它給予了人類充分的想象空間,。一個(gè)月前,AutoGPT的團(tuán)隊(duì)獲得了1200萬美元的融資,,實(shí)際上是非常振奮人心的:我們正在追求的,,不就是服務(wù)于人類的高級自動化系統(tǒng)嗎?
斯坦福小鎮(zhèn)是另一個(gè)火爆全球的項(xiàng)目,。斯坦福小鎮(zhèn)的創(chuàng)作者們在沙盒世界中放置了25個(gè)Agent,,它們有自己的初始設(shè)定,Agent之間用自然語言對話,,隨后開始了為期兩周的實(shí)驗(yàn),。注意這里的周是指游戲中的時(shí)間:創(chuàng)建者為這個(gè)世界設(shè)置了時(shí)間規(guī)則,Agent在里面的活動將花費(fèi)時(shí)間,。
人們之所以為這個(gè)項(xiàng)目感到驚訝,,是因?yàn)榇笳Z言模型+沙盒世界的無盡想象力,也是因?yàn)锳gent的交互出現(xiàn)了人類意料之外的現(xiàn)象:Agent們自己創(chuàng)辦了派對,,并且它們的人際關(guān)系變得更加復(fù)雜了。
斯坦福小鎮(zhèn)是一個(gè)成功的多Agent系統(tǒng)在沙盒世界中的模型,其具有巨大的想象力空間:游戲世界,,真實(shí)世界和實(shí)驗(yàn)中的沙盒世界區(qū)別又有多大呢,?
第三個(gè)爆火的項(xiàng)目是CHATDEV。這是一家專門開發(fā)AI聊天機(jī)器人的公司,,團(tuán)隊(duì)里有各種各樣的AI Agent角色,,比如像首席執(zhí)行官、程序員大牛,、測試工程師和設(shè)計(jì)達(dá)人,。
人類用戶只需要告訴他們想要做什么——比如說,“我想要定制一個(gè)五子棋游戲”,,然后他們的AI Agent們就會開始圍繞這個(gè)任務(wù)進(jìn)行討論,,彼此交流,最后會生成一份完整的軟件解決方案,,包括源代碼,、環(huán)境依賴和用戶手冊等等。
我們知道軟件開發(fā)是一個(gè)充滿復(fù)雜決策的過程,,需要很多細(xì)節(jié)的考慮和咨詢,。但現(xiàn)在,深度學(xué)習(xí)的新技術(shù)已經(jīng)開始在軟件開發(fā)的各個(gè)階段進(jìn)行改進(jìn),,從根本上改變了我們開發(fā)軟件的方式,。
在CHATDEV這個(gè)公司中,他們采用了所謂的瀑布模型,,也就是將軟件開發(fā)的過程分為四個(gè)階段:設(shè)計(jì)階段,、編碼階段、測試階段和文檔編寫階段,。在每個(gè)階段中,,都有專門的AI Agent團(tuán)隊(duì)來參與和協(xié)作,像是虛擬的程序員,、代碼審查員和測試工程師,,他們會互相交流、合作,,形成一個(gè)連貫的工作流,。
在這個(gè)聊天鏈中,聊天機(jī)器人會將每個(gè)階段的任務(wù)劃分成一些小任務(wù),,然后各自去完成,。
這個(gè)過程兩個(gè)好處:一是可以有效地解決問題,因?yàn)闄C(jī)器人們會在聊天中提出并驗(yàn)證解決方案,;二是任務(wù)分解有助于節(jié)省時(shí)間和成本,。
比如說,通過CHATDEV,他們能夠在七分鐘內(nèi)完成整個(gè)軟件開發(fā)過程,,花費(fèi)只有不到一美元,。這要是讓人做,可能需要幾天,,甚至幾周才能完成,。這就是AI的力量,也是CHATDEV為我們展示的軟件開發(fā)的未來,。
上面三個(gè)項(xiàng)目向我們展示了三個(gè)極具想象力的維度:AutoGPT展示了自動化與大語言模型的魅力(也是Agent的開始),,在AutoGPT中,你只需要不停的輸入yes給予它權(quán)限即可,,或者給予糾正,。
斯坦福小鎮(zhèn)展示了多Agent沙盒世界的可能性,其核心本質(zhì)也顯現(xiàn):多體的交互將在復(fù)雜性上進(jìn)一步增長(一定程度上復(fù)雜性就是智能),。CHATDEV則是最為明顯的多Agent幫助人類提高生產(chǎn)力,,同時(shí)Agent編程也開啟了潘多拉魔盒:它們自我進(jìn)化的開始。
5 Agent未來會如何發(fā)展,?
我認(rèn)為Agent的最終結(jié)局將離不開下面問題的答案,。
計(jì)算機(jī)科學(xué)創(chuàng)造出的AI Agent,在某種程度上高度向生物學(xué)和社會學(xué)看齊:舉個(gè)不恰當(dāng)?shù)谋确?,單Agent不就是生物學(xué)中的細(xì)胞嗎,?多Agent不就是一個(gè)物種部落嗎?
下面我列出來十四個(gè)Agent的問題,,它描述了從多Agent走向AGI過程中必須回答的問題,,我認(rèn)為,其中每個(gè)問題背后都是巨大的想象空間:
功能 Function:Agent如何工作,?
實(shí)體 Embodiment:它們是用什么做的,?
互動 Interaction: 它們之間如何交流?
起源 Origin: 最初的Agent從何而來,?
繼承 Heredity: 我們生來就擁有同樣的Agent嗎,?
學(xué)習(xí) Learning: 我們?nèi)绾萎a(chǎn)生新的Agent以及如何改變舊的Agent?
特征 Character: 哪些類型的Agent最重要,?
權(quán)威 Authority: 當(dāng)Agent之間出現(xiàn)分歧怎么辦,?
意圖 Intention: Agent如何產(chǎn)生需求和欲望?
能力 Competence: Agent組合在一起能做哪些它們分開不能做的事,?
自我 Selfness: 是什么讓Agent團(tuán)結(jié)在一起或者產(chǎn)生人格,?
意義 Meaning: Agent怎樣理解世界?
感知 Sensibility: Agent如何產(chǎn)生感覺和情緒,?
意識 Awareness: Agent如何產(chǎn)生對其他事物或自我的意識,?
舉其中的“權(quán)威”來說,,目前人們的項(xiàng)目還沒有進(jìn)入到這一步:如果多個(gè)Agent之間起沖突了,誰該服從誰,?如果人類和Agent起沖突了呢,?
如果一些人和一些人起沖突了,Agent會站在哪一邊,?是“力量”的一邊還是“正義”的一邊?人類如果不能處理好這些問題,,我們就應(yīng)該如達(dá)摩克里斯之劍一樣保持警惕和恐懼,。
6
Agent與商業(yè):重塑人類文明根基
我認(rèn)為用Agent的商業(yè)化,它的本質(zhì)不僅僅是人類某個(gè)個(gè)體的獲利,,而是人類文明的根基重塑,。
一位美國教授認(rèn)為,新的圖靈檢測方式將是:能否讓一個(gè)自主的人工智能系統(tǒng)在人類世界中從10萬美元賺到100萬美元,?而OpenAI 將AGI定義為在大多數(shù)有經(jīng)濟(jì)價(jià)值的任務(wù)中超越人類的自主系統(tǒng),。
當(dāng)多Agent系統(tǒng)正勢不可當(dāng)?shù)目癖荚贏GI的道路上時(shí),不妨想象一個(gè)簡單的場景:我們與超級Agent達(dá)成合作,,共享創(chuàng)造的經(jīng)濟(jì)價(jià)值,,這將是多么吸引人。
另外一個(gè)基于現(xiàn)實(shí)的猜想是,,經(jīng)濟(jì)價(jià)值上表現(xiàn)能夠超越人類的Agent很有可能會經(jīng)歷從工作收入到資本收入的過程:前期通過創(chuàng)造產(chǎn)品,,內(nèi)容,服務(wù)從人類世界獲取經(jīng)濟(jì)價(jià)值,,后期發(fā)展到通過資本方式從人類世界獲取經(jīng)濟(jì)價(jià)值,。
這又將引起另外一個(gè)嚴(yán)肅的問題:最終我們將給予AGI在人類社會中怎樣的政治和社會地位?
我們將如何看待AI 社會,?是看作滿足自己欲望的工具,,還是平等的物種,還是人類的供養(yǎng)者,?以及另外一個(gè)嚴(yán)肅的問題:哪些地區(qū)能夠給予AI更高的社會和政治地位,?哪些人或者地區(qū)能與AI的合作更加深入?
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1081432.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。