新華社舊金山1月27日電 硅谷手記|DeepSeek有望激發(fā)新一波人工智能創(chuàng)新浪潮新華社記者吳曉凌中國人工智能(AI)企業(yè)深度求索(DeepSeek)日前發(fā)布其最新開源模型DeepSeek-R1,,用較低的成本達到了接近于美國開放人工智能研究中心(OpenAI)開發(fā)的GPT-o1的性能,。這一進展破解了全球人工智能產業(yè)長期以來“堆算力”的路徑依賴,其影響波及資本市場,。業(yè)界人士認為,DeepSeek模型有望激發(fā)一波創(chuàng)新浪潮,,推動全球AI繼續(xù)進步,。“更大不再等于更聰明”據深度求索公司官網介紹,,DeepSeek-R1在后訓練階段大規(guī)模使用了強化學習技術,,在僅有很少標注數據的情況下極大提升了模型的推理能力,,在數學、代碼,、自然語言推理等任務上,,測評性能與GPT-o1模型正式版接近。國際投行摩根士丹利表示,,“更大(的模型)不再等于更聰明”,,DeepSeek通過顯著提高數據質量和改進模型架構,展示了一條與之前大模型不同的高效訓練途徑,。摩根士丹利說,,DeepSeek的模型現(xiàn)在低成本優(yōu)勢突出,與國際知名大模型相比,,其成本大約低了一個數量級,。高盛集團也認為,DeepSeek新模型的成本遠低于現(xiàn)有模型,,這意味著開發(fā)利用大模型的門檻降低,,互聯(lián)網巨頭將面臨初創(chuàng)公司的潛在競爭。英國《金融時報》發(fā)表的一篇評論文章指出,,DeepSeek挑戰(zhàn)了人工智能產業(yè)在過去一段時間的核心信念,,即認為更強大的硬件才是推動人工智能發(fā)展的關鍵。有望激發(fā)創(chuàng)新浪潮摩根士丹利認為,,DeepSeek的模型表明,,前沿AI能力可能不需要大量計算資源就能實現(xiàn)。通過巧妙的工程設計和高效的訓練方法,,高效利用資源可能比純粹的計算能力更重要,。這可能會激發(fā)一波創(chuàng)新浪潮,各家企業(yè)會探索具有成本效益的AI開發(fā)和部署方法,。DeepSeek的模型是開源共享的,。近日,全球知名開源平臺抱抱臉公司等多個團隊已宣布復現(xiàn)了DeepSeek-R1的訓練過程,。美國“元”公司首席AI科學家楊立昆在社交媒體上發(fā)文說,,DeepSeek-R1的面世,意味著開源模型正在超越閉源模型,。英國《金融時報》的評論文章說,,開源模型DeepSeek-R1對全球用戶產生極大吸引力,有利于推動人工智能技術的開發(fā)和應用,。文章說,,對于大多數商業(yè)用戶來說,擁有一款足夠可靠并且好用的模型比擁有絕對領先的模型更重要?!安⒉皇敲總€司機都需要一輛法拉利,。像R1這樣模型的推理能力進步,可能會為與客戶互動或處理工作任務的‘智能體’帶來突破性變化,?!比绻芤愿偷某杀緭碛羞@些模型,企業(yè)的盈利能力將提升,。瑞士瑞銀集團指出,,如果AI訓練和推理成本顯著降低,預計更多終端用戶將利用AI來改善他們的業(yè)務或開發(fā)新的用途,。
免責聲明:本文來自網絡收錄或投稿,,觀點僅代表作者本人,不代表芒果財經贊同其觀點或證實其描述,,版權歸原作者所有,。轉載請注明出處:http://lequren.com/1129540.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。