一家成立不到兩個月但擁有十名天才工程師的初創(chuàng)公司Cognition,搞了一個引爆科技圈的大動作,。
他們推出了一款名為Devin的人工智能(AI)助手,,可以協(xié)助人類軟件工程師完成諸多開發(fā)任務。Devin不同于現(xiàn)有其他AI編碼者,,它可以從零構建網(wǎng)站,、自行部署應用、修復漏洞,、學習新技術等,,人類只需扮演一個下指令和監(jiān)督的角色。
這是第一個真正意義上完全自主的AI軟件工程師,,一亮相即掀起軒然大波,,因為人們擔心:人類程序員是不是真要失業(yè)了?
測試表現(xiàn)超越“同輩”
據(jù)Cognition官網(wǎng)報道,,Devin只需一句指令,,即可端到端地處理整個開發(fā)項目,。
按照用戶需求,Devin可以同時執(zhí)行多步驟工作流程,,人類工程師則可以實時觀察其進度,,發(fā)現(xiàn)錯誤時,跳出指令進行修正,。這便于工程師們將大部分工作“外包”給AI,,自己則可以潛心于創(chuàng)意性工作。
在SWE-bench基準測試中,,Devin的表現(xiàn)遠超Claude 2,、Llama、GPT-4等選手,,能夠完整正確地處理13.86%的問題,。相較之下,GPT-4只能處理1.74%的問題,。更重要的是,,Devin在測試中沒有得到任何幫助,而其他所有模型都需要幫助,,即人們要準確告知模型需要編輯哪些文件,。
這一進展,標志著AI在自主理解和解決軟件開發(fā)問題方面取得了顯著進步,。目前,,Devin已經(jīng)成功通過一家AI公司面試,并且在Upwork上完成了實際工作,。
運作幾乎完全自主
Devin的厲害之處,,還在于可以規(guī)劃和執(zhí)行異常復雜的工程任務,這類任務通常需要數(shù)千個決策才能完成,。在這之中,,無論進行到任何一步,它都可以回調所有相關的上下文信息,,保證任務的邏輯性,,也便于隨時校正。
更讓人震撼的是,,Devin不僅能幫人們解決代碼,,還囊括了與之相關的整個工作流。
譬如,,當工程師需要設計一個網(wǎng)頁游戲時,,Devin首先能生成網(wǎng)頁,接著還能完成服務端的部署,最后直接發(fā)布上線,,省去了中間大量人工操作,。甚至在發(fā)現(xiàn)漏洞之后,Devin還會回溯報錯出現(xiàn)的位置及對應的數(shù)據(jù),,然后分析原因并給出解決方案,。
此外,作為一個AI全能助手,,Devin還可以幫助人類訓練和微調其他AI,。對于一些常見的模型,你只需要提及模型的名稱,,Devin自己就知道要怎樣去訓練,。
那人們需要做什么呢?按設想,,最終的Devin會讓人類只需要發(fā)號施令,,其他什么也不用做。
對軟件開發(fā)業(yè)影響深遠
初創(chuàng)公司Cognition雖然只有十名員工,,但他們手中卻握著十塊IOI(國際信息學奧林匹克競賽)金牌,,核心創(chuàng)始團隊為3名華人。
Devin現(xiàn)處于內測階段,,有意用戶可申請?zhí)崆霸囉谩D壳?,團隊尚未透露更多核心技術細節(jié),,但他們表示,Devin源于其長期推理及規(guī)劃研究的進展,。編碼只是第一步,,這一AI助手其實可推廣到更寬領域。
Devin的出現(xiàn),,可能對軟件開發(fā)行業(yè)產生深遠影響,,甚至可能減少對人類開發(fā)者的需求。但須注意到,,該技術仍處于早期階段,,其成熟度和效果需要業(yè)界作進一步評估。
就目前而言,,Devin的成功可以說為當今軟件開發(fā)人員帶來更新更好的AI協(xié)作體驗,。人們從繁瑣工作中“解放”,只需監(jiān)督AI系統(tǒng)去處理,,而自己將精力投入到創(chuàng)新性任務上,,實現(xiàn)生產力的真正提高。
來源:科技日報
免責聲明:本文來自網(wǎng)絡收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權歸原作者所有。轉載請注明出處:http://lequren.com/1092587.html
溫馨提示:投資有風險,,入市須謹慎,。本資訊不作為投資理財建議。