才剛剛1月,,OpenAI就正式宣布進軍AI智能體領(lǐng)域,中國公司智譜也推出新一版的GLM-PC 1.1,。從回答問題到執(zhí)行任務(wù),,AI智能體元年真的來了?當?shù)貢r間1月23日,,美國人工智能公司OpenAI正式推出首款A(yù)I智能體Operator(意為操作員),,這是OpenAI的首個AI智能體。Operator號稱能夠模擬人類操作瀏覽器完成購物,、訂餐、論文整理等操作,通過融合視覺識別與高級推理的CUA模型實現(xiàn)復雜步驟規(guī)劃,。
具體的工作流程上,Operator會根據(jù)需求捕獲屏幕畫面,,再將其添加到模型上下文,,并通過GPT-4o的視覺能力準確理解界面內(nèi)容,再依靠強化學習的推理能力制定下一步計劃,,最后使用虛擬鼠標和鍵盤,,精確執(zhí)行點擊、滾動或輸入的界面操作,,直到任務(wù)完成或需要用戶輸入,。OpenAI創(chuàng)始人奧特曼介紹稱,目前Operator將以每月200美元的訂閱費,,率先面向美國ChatGPT Pro用戶開放測試,。而就在同一天,中國公司智譜AI也對外發(fā)布了去年12月公布的AI智能體GLM-PC 1.0的升級版 —— GLM-PC 1.1,,本次更新優(yōu)化多種任務(wù)流程,,甚至被業(yè)內(nèi)人士稱為“2.0也不為過”。智譜的 GLM-PC 不僅能自動處理文件,、發(fā)送定制化微信內(nèi)容,,還通過借鑒人類的左右腦分工,以“左腦邏輯+右腦感知”的雙引擎架構(gòu)實現(xiàn)多模態(tài)交互,,甚至生成代碼與視頻內(nèi)容,,展現(xiàn)超越文本生成的操作層突破。其中,,智譜公眾號文章還實機演示了在淘寶中一鍵加購辣條等產(chǎn)品,、截取小紅書春節(jié)檔圖片轉(zhuǎn)發(fā)微信群聊并詢問觀看意愿、以及給這個群聊的成員每人單獨小窗發(fā)送一段2025年新春祝福語和AI自動生成的蛇年主題圖片,。
新春祝福甚至可以按照每人名字定制發(fā)送。智譜AI智譜介紹,,新版 GLM-PC背后是智譜自主研發(fā)的多模態(tài)模型 CogAgent 與代碼模型 CodeGeex 的深度融合,。以代碼形式指揮工作流程和工具調(diào)用,并強化了深度思考模式下的規(guī)劃,、推理,、反思能力,從而能夠穩(wěn)定高效地應(yīng)對復雜場景與任務(wù),。實際執(zhí)行時,,GLM-PC 能感知多層環(huán)境反饋,,協(xié)助反思,以有效自我糾正與優(yōu)化,。當前,,通用人工智能技術(shù)已進入OpenAI所分類的L3級(智能體)階段,,核心競爭圍繞各家企業(yè)模型的自主操作能力展開。除了OpenAI和智譜,,谷歌,、微軟、Anthropic以及國內(nèi)等眾多AI公司也都相繼推出類似產(chǎn)品,。上海人工智能產(chǎn)業(yè)研究院院長朱兆穎此前就曾預(yù)測,,AI智能體將是生成式AI的下一個前沿,預(yù)計2025年市場規(guī)模將達100億美元以上,,2025年將成為AI智能體大放異彩的應(yīng)用元年,。本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),,不得轉(zhuǎn)載,。
免責聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1129372.html
溫馨提示:投資有風險,,入市須謹慎,。本資訊不作為投資理財建議。