目前,國內外大模型無論研究還是投資都呈現(xiàn)高熱現(xiàn)象,,但在其背后,,一些問題值得重視。
《瞭望東方周刊》特約撰稿韓健,、鐘新龍,、王聰聰?編輯陳融雪
3月24日,湖北宜昌,,網(wǎng)民展示手機上由百度“文心一言”生成的圖片
當前,,全球各國人工智能大模型(以下簡稱“大模型”)已呈現(xiàn)白熱化競賽態(tài)勢。
大模型扎堆出爐的背后潛藏著問題,,包括技術仍存軟肋,、治理體系尚待優(yōu)化、盲目跟風,、資源消耗巨大,、發(fā)展路徑有待明晰等。
為此,,宜推動大模型底層技術研究和應用創(chuàng)新,、建立健全大模型監(jiān)管機制、引導資本市場理性投資,、加強國際合作與交流,。
競爭白熱化
人工智能大模型,,是一種能夠利用大數(shù)據(jù)和神經網(wǎng)絡來模擬人類思維和創(chuàng)造力的人工智能算法,。它利用海量的數(shù)據(jù)和深度學習技術來理解、生成和預測新內容,,通常情況下有數(shù)百億乃至數(shù)萬億個參數(shù),,可以在不同的領域和任務中表現(xiàn)出智能。比如,,可在各種場景中生成高質量的文本,、圖像和音視頻等內容。
相比傳統(tǒng)人工智能,,大模型能處理多模態(tài)任務,,而不局限于特定的任務或應用。
以自然語言處理為例,,大模型可以根據(jù)上下文和情感調整語言風格,,用符合人類自然語言對話的邏輯和使用習慣來提高對話的自然度和流暢度;同時,,基于大模型預訓練具有的龐大知識儲備庫,,可生成符合用戶實際需求和有價值的回答。
此外,,大模型在音頻,、視頻,、圖片方面的多模態(tài)處理和生成能力都令傳統(tǒng)人工智能難以企及,。
目前,,在大模型領域,國內外巨頭的競爭已經白熱化,。OpenAI已成為引領大模型發(fā)展的標桿企業(yè),。繼多模態(tài)大模型GPT-4發(fā)布后,預計今年四季度OpenAI將發(fā)布更為高級的ChatGPT-5版本,。微軟借助對OpenAI的投資與合作,,將旗下Office辦公產品全線整合,已在3月下旬推出Copilot Office,。5月24日,,微軟宣布Win11接入GPT-4,。
5月10日,,微軟的直接競爭對手谷歌推出新一代大模型PaLM 2,已有超過25個AI產品和功能全線接入PaLM 2,,包括原有對話機器人Bard,,AI+辦公助手Duet AI、AI+搜索引擎等,,Meta則發(fā)布大模型LLaMA,,加入競賽,。亞馬遜與人工智能初創(chuàng)公司Hugging Face合作開發(fā)ChatGPT競品——BLOOM。
此外,,Character. Al,、Stability Al、A121 Labs等大模型技術關聯(lián)的初創(chuàng)和獨角獸公司也掀起了新一輪投資熱潮加入大模型競賽,。
國內,,產投研各方均已加快布局步伐。
一是國內科技龍頭企業(yè)密集發(fā)布自研大模型,。百度發(fā)布大模型文心一言,,阿里發(fā)布首個超大規(guī)模語言模型通義千問,騰訊混元AI大模型團隊推出了萬億級別中文NLP預訓練模型HunYuan-NLP-1T,。華為發(fā)布的鵬城盤古大模型是業(yè)界首個千億級生成和理解中文NLP大模型,。
二是投創(chuàng)界積極入局大模型競賽。美團聯(lián)合創(chuàng)始人王慧文自帶5000萬美元入局AI大模型,,搜狗前CEO王小川與搜狗前COO茹麗云共同創(chuàng)立百川智能,,瀾舟科技發(fā)布其語言生成模型——孟子MChat可控大模型,,西湖心辰也推出了心辰Chat大模型,。
三是高校與科研院所積極布局大模型。復旦大學推出國內首個類ChatGPT大模型MOSS,,清華大學知識工程實驗室與其技術成果轉化公司智譜AI發(fā)布ChatGLM,中科院自動化所推出多模態(tài)大模型紫東太初,,IDEA 研究院 CCNL推出開源通用大模型“姜子牙”,。
技術與治理存短板
目前,,國內外大模型無論研究還是投資都呈現(xiàn)高熱現(xiàn)象,但在其背后,,一些問題值得重視。
首先,,技術層面仍存軟肋。
從輸出質量上來看,,自然語言和圖像生成大模型在生成內容上存在輸出質量不佳,、出現(xiàn)有害內容等問題,。自然語言大模型生成結果雖然看起來通順,,但是在可解釋性和邏輯上還存在風險,,且模型對簡單概念存在過分解讀和冗余回答,。
尤其值得注意的是,,大模型可能有輸出危害答復內容的風險。比如,,對用戶提出的犯罪行為給出具體行動方案。除此之外,,從未來發(fā)展的不確定性角度來看,持續(xù)無限制擴充訓練參數(shù)規(guī)模的大模型可能面臨被創(chuàng)新算法換道超車的風險,。
目前,業(yè)界主流大模型都是在2017年提出的自注意力機制模型Transformer架構上設計而來,,未來新機制框架若使用小規(guī)模參數(shù)樣本也能訓練出同樣效果,,那么目前上千億乃至上萬億訓練參數(shù)規(guī)模的做法將不再有優(yōu)勢,。
其次,治理體系尚待優(yōu)化完善,。
當前,大模型訓練過程缺乏監(jiān)管且監(jiān)管范圍更多針對服務提供者,,一定程度上忽略了對服務使用者和商業(yè)運營主體的規(guī)范,對服務使用者仍通過用戶協(xié)議,、平臺規(guī)則予以約束,,而運營方欠缺安全責任意識,,則容易埋下輸出含有毒害內容的隱患,。
各服務提供者、服務平臺對人工智能生成內容存在審核盲區(qū),。比如,各大平臺公司在惡意應用產生危害時,,對內容發(fā)布者與發(fā)布平臺責任、主要責任和次要責任等方面的界定尚不明確,,容易造成監(jiān)管盲區(qū),。
現(xiàn)有的對人工智能生成內容權責分配也有待完善。比如,,人工智能生成內容可能存在知識產權侵權風險,,其來源和生成內容也存在產權權屬不清、取證和損害認定困難等問題,。
從受眾層面看,,公眾對人工智能生成內容技術的認知不強,對其非法濫用的風險防范意識不高,,亦容易造成個人名譽和心理受損等后果,。
盲目跟風成本大
大模型熱潮涌來,需警惕盲目跟風,。
上海世界人工智能大會,,華為云盤古大模型
以ChatGPT為代表的大模型爆火催生的資本投機心理會凌駕于投資心理之上,這對產業(yè)后續(xù)長期良性發(fā)展會造成不良影響,。超高的訓練成本門檻決定了中小型企業(yè)不宜投資此類項目,。
以ChatGPT大語言模型訓練為例,初步估算ChatGPT一次訓練成本就超過200萬美元,,OpenAI公司僅硬件投入成本就超過8億美元,。除了訓練成本,開發(fā)技術也是一道門檻,高質量訓練語料和大規(guī)模人工標注決定了只有大型機構或領軍企業(yè)才具備相應實力,成長型企業(yè)盲目跟風將導致投資失敗,。
此外,,訓練集同質化導致大模型質量不高。大模型的訓練數(shù)據(jù)集一般來自百科類平臺,、新聞語料,、社交媒體文本、書籍,、論壇等可公開獲得資源,,加入競爭的大模型如都使用同質化訓練數(shù)據(jù)集,將會導致絕大多數(shù)大模型成為效果不佳且浪費巨大資源的淘汰產物,。
即便是對于行業(yè)巨頭,,大量成本的消耗也是一個風險。
算力成本是成本消耗的大頭,。以ChatGPT為例,,其在日常運營和模型迭代中會消耗大量算力。Similarweb數(shù)據(jù)顯示,,目前共需602臺DGX A100服務器滿足日常訪問量,。同時,ChatGPT也會占用原本用來支撐云計算,、視頻流媒體和5G網(wǎng)絡的數(shù)據(jù)中心的算力,。而多家公司搶先布局訓練類似模型,則會導致算力浪費,。
電力成本是不得不提的隱性考慮要素,。ChatGPT訓練過程中,其能耗相當于數(shù)百臺電腦一年的用電量,。碳排放更是被忽視的隱藏點,。使用煤炭、天然氣等碳密集型能源訓練ChatGPT會產生550噸碳排放量,相當于一個人在紐約和舊金山之間往返550次,。
人力資源消耗也應重點關注,。據(jù)《時代周刊》報道,OpenAI不僅雇用了大量時薪不到2美元的肯尼亞外包勞工進行數(shù)據(jù)標注,,還額外與Sama公司簽署了三份總價值約20萬美元的合同,為數(shù)據(jù)庫中有害的內容進行標記,。但從現(xiàn)有的表現(xiàn)來看,,仍需更多的標注人力來提升模型性能。
目前,,國內企業(yè)在大模型發(fā)展方向研判上呈現(xiàn)出跟隨式發(fā)展態(tài)勢,。例如,GPT4開啟多模態(tài)大模型發(fā)展方向后,,國內先發(fā)大模型也紛紛發(fā)展多模態(tài),,如何擺脫跟隨式發(fā)展路徑依賴,構建自主可控創(chuàng)新型大模型是當前重點任務,。
考慮到國內用戶規(guī)模龐大,,國內大模型能否承載遠比海外用戶更高的并發(fā)處理需求,尚需時日驗證,??紤]到大模型訓練推理的高算力成本,想要靠免費換取大規(guī)模普及進而變現(xiàn)的路徑很難走通,,應用賦能成本如何實現(xiàn)回本和增量營收的商業(yè)路徑仍需探索,。
建議舉措
面對上述問題,可以四方面加以應對,。
一是推動大模型底層技術研究和應用創(chuàng)新,。
包括提高基礎研究投入力度,針對大模型面臨的技術挑戰(zhàn),,如模型泛化能力,、計算資源消耗、可解釋性等問題,,加強原始理論研究和技術攻關,,不斷提升大模型性能;培育創(chuàng)新生態(tài),,搭建大模型開放研發(fā)平臺,,鼓勵政產學研金介用各方積極參與,促進大模型應用成果轉化和產業(yè)鏈協(xié)同發(fā)展,;推動有條件的企業(yè)盡快將大模型應用于實際場景,,如人形機器人、智能網(wǎng)聯(lián)汽車、生物醫(yī)藥,、新材料等領域,,以應用為導向,為重點領域提升智能化水平,。
二是建立健全大模型監(jiān)管機制,。
大模型訓練審核機制宜盡量減少同質化大模型無序競爭,減少資源浪費,;探索建立大模型安全性和可靠性評估標準,,提出具體技術標準和評估準則,確保各類大模型在各個應用場景中能夠穩(wěn)定可靠運行,;加強對大模型的數(shù)據(jù)來源和訓練過程的監(jiān)管,,審核數(shù)據(jù)處理邏輯、明確數(shù)據(jù)收集,、整理和使用的合規(guī)要求,,防止數(shù)據(jù)濫用和隱私泄露;對大模型的應用場景進行分類管理,,確立不同類型模型的使用范圍和限制,,避免不當應用帶來的負面影響;建立大模型的責任追溯機制,,明確制定者,、開發(fā)者、部署者和用戶在模型使用過程中的權利和義務,,為潛在的糾紛提供法律依據(jù),;積極推動跨部門、跨領域的監(jiān)管協(xié)同,,形成全方位,、多層次的監(jiān)管格局,提高監(jiān)管效能,。
三是引導資本市場理性投資,。
包括引導投資風向,鼓勵各類投資主體積極參與大模型應用環(huán)節(jié),,形成多元化的投資格局,,防止扎堆投資訓練環(huán)節(jié);加強風險防范意識,,引導投資者樹立長期投資理念,,關注大模型項目的技術創(chuàng)新和市場前景,避免盲目投資和短期行為,;建立大模型產業(yè)鏈協(xié)同機制,,促進上下游企業(yè)共同發(fā)展,,形成集群效應。
四是加強國際合作與交流,。
積極參與國際人工智能監(jiān)管組織和論壇,,與各國政府、監(jiān)管機構,、企業(yè)和研究機構探討和分享監(jiān)管經驗和技術成果,,共同探討跨國監(jiān)管的有效途徑;探索與部分國家先行建立多邊合作框架,,推動制定全球性的大模型監(jiān)管規(guī)范和技術標準,;開展多邊交流與合作,與其他國家在大模型監(jiān)管領域開展項目合作,、技術交流和人才培養(yǎng),,以提高監(jiān)管方面的實踐能力和理論水平,;關注全球監(jiān)管動態(tài),,及時了解各國在大模型監(jiān)管方面的新政策、新技術和新案例,,為國內監(jiān)管提供借鑒和參考,;積極推動國際監(jiān)管能力建設,支持有關國際組織和機構開展監(jiān)管能力建設項目,,提高我國在大模型監(jiān)管方面的國際話語權,;搭建國際監(jiān)管信息共享平臺,實現(xiàn)各國監(jiān)管機構之間的信息互通和資源共享,,以便于跨境監(jiān)管合作和問題解決,。
免責聲明:本文來自網(wǎng)絡收錄或投稿,觀點僅代表作者本人,,不代表芒果財經贊同其觀點或證實其描述,,版權歸原作者所有。轉載請注明出處:http://lequren.com/1044126.html
溫馨提示:投資有風險,,入市須謹慎,。本資訊不作為投資理財建議。