來源:IT水哥
以GPT為代表的生成式預(yù)訓(xùn)練大語言模型這兩年在人工智能領(lǐng)域各項(xiàng)任務(wù)中表現(xiàn)出色,,這是一種現(xiàn)今看來具有十億以上權(quán)重或參數(shù)的由人工神經(jīng)網(wǎng)絡(luò)組成,使用自監(jiān)督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)對(duì)大量未標(biāo)記文本進(jìn)行訓(xùn)練的深度學(xué)習(xí)模型,。關(guān)于大模型的訓(xùn)練所需總算力,業(yè)內(nèi)有一個(gè)公式:6 * 模型的參數(shù)量 * 訓(xùn)練數(shù)據(jù)的 token 數(shù) = 總算力(Flops),,這里的模型參數(shù)量指的是構(gòu)建和訓(xùn)練大規(guī)模機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型時(shí)所使用的各種可調(diào)整的設(shè)置和數(shù)值,參數(shù)的數(shù)量級(jí)越大,模型的潛在體量與規(guī)模越大,。而大模型參數(shù)數(shù)量級(jí)從一開始的過億級(jí),、十億級(jí),,發(fā)展到GPT-3的1750億、文心一言的2600億等,,如今朝著萬億級(jí)的趨向演進(jìn)。
2024年初,Sora的橫空出世讓原本僵持在千億參數(shù)級(jí)別的業(yè)內(nèi)各方大模型瞬間有了危機(jī)感,一時(shí)間競(jìng)逐加速,。首先是初創(chuàng)公司Anthropic宣布Claude 3超越OpenAI的GPT-4稱王,,旋即谷歌升級(jí)了Gemini系列模型并開放測(cè)試,國內(nèi)月之暗面的Kimi助手也以不俗的表現(xiàn)贏得業(yè)界聚焦,。值得注意的是,,盡管面臨Sora(文生視頻)的壓力,,業(yè)內(nèi)各方仍決定從NLP(自然語言處理)產(chǎn)品的升級(jí)著手展開備戰(zhàn),,原因也許是Sora本身也只發(fā)布了預(yù)覽效果,,且并未公開和組織規(guī)模性的測(cè)試,在AI視頻方面仍有較長的時(shí)間窗口,。
●內(nèi)卷升級(jí),,賽道競(jìng)逐日趨白熱化
由于過去一年生成式人工智能突飛猛進(jìn)了一整年,,在產(chǎn)業(yè)層面,,國內(nèi)外科技巨頭圍繞AI大模型打響了“百模大戰(zhàn)”;在資本市場(chǎng),,AI概念成為市場(chǎng)主線之一,。因此2024年,業(yè)界觀點(diǎn)認(rèn)為大模型領(lǐng)域的競(jìng)爭(zhēng)將進(jìn)一步白熱化,,行業(yè)與資本的輪番交互將有望推動(dòng)本輪AI行情進(jìn)一步擴(kuò)散,。
當(dāng)前國際市場(chǎng)自然語言生成式人工智能以O(shè)penAI的ChatGPT(GPT-4)為代表,其主要競(jìng)爭(zhēng)對(duì)手為谷歌DeepMind的Gemini(前身是Bard),、Meta的LLaMA模型,、Anthropic的Claude 3以及正在進(jìn)場(chǎng)的xAI等。大模型的主流框架則由TensorFlow和PyTorch二分天下,。文生圖方面,,DALL-E、Midjourney和Stable Diffusion依然是主流三家,,擴(kuò)散模型在該領(lǐng)域運(yùn)用得到了迅速發(fā)展,。
國內(nèi)方面,過去的AI四小龍商湯,、曠視,、依圖、云從由于生長在資本膨脹時(shí)期,,趕上了AI風(fēng)口,,前期成長較好,,在視覺CV領(lǐng)域各領(lǐng)風(fēng)騷。然而進(jìn)入到第二輪賽道競(jìng)逐時(shí),,意識(shí)到訓(xùn)練成本高昂,,只有巨頭加碼燒錢,回報(bào)周期又長,,故事就不好講了,。資本退潮之后,無一不面臨著從模型應(yīng)用到商業(yè)化落地的困境,。
但隨著GPT-4的壓力和Sora的鯰魚效應(yīng),,國內(nèi)巨頭開始逐步發(fā)力。百度文心,、阿里通義,、騰訊混元模型升級(jí)并朝著多模態(tài)進(jìn)軍;訊飛星火,、百川智能,、360智腦、日日新等逐漸殺出一條血路,,還有初創(chuàng)新秀月之暗面Kimi逆風(fēng)崛起,。
經(jīng)歷了大半年的僵持,資本從觀望開始向進(jìn)場(chǎng)轉(zhuǎn)變,,對(duì)大模型的加注也在持續(xù)升溫,,初創(chuàng)的融資金額從千萬到數(shù)億不等;從融資輪次來看,,70%的初創(chuàng)處于A輪及A輪前融資階段,,B輪以上融資階段的企業(yè)總數(shù)接近30%,整個(gè)賽道朝著白熱化的趨勢(shì)變化,。
●AGI是終點(diǎn),,多模態(tài)是方向
目前大模型市場(chǎng)仍以自然語言處理NLP為主,這主要是因?yàn)镹LP領(lǐng)域的應(yīng)用需求巨大,,且近年來在技術(shù)上取得了顯著的進(jìn)展,。NLP大模型如GPT系列、BERT,、XLNet等在語義理解,、文字生成和翻譯等任務(wù)上展現(xiàn)出卓越的性能,推動(dòng)了智能助手,、聊天機(jī)器人,、內(nèi)容推薦、搜索引擎優(yōu)化等多個(gè)行業(yè)的革新,。NLP大模型的框架成熟度,、參數(shù)和token量級(jí)也是其他類模型目前所無法比擬的,。
但是業(yè)界不會(huì)止步于此,首先框架來說,,Transformer架構(gòu)已經(jīng)在NLP領(lǐng)域取得了巨大成功,,類似的結(jié)構(gòu)可能會(huì)被擴(kuò)展到多模態(tài)學(xué)習(xí)中,以更有效地處理和融合多種類型的數(shù)據(jù),。其次是跨模態(tài)學(xué)習(xí)深度,,多模態(tài)大模型的核心挑戰(zhàn)之一是如何實(shí)現(xiàn)不同模態(tài)之間的有效交互和信息融合,未來的研究可能會(huì)探索新的跨模態(tài)學(xué)習(xí)技術(shù),,如注意力機(jī)制,、聯(lián)合嵌入空間的構(gòu)建等,以提高模型對(duì)多模態(tài)數(shù)據(jù)的理解和生成能力,。還有就是數(shù)據(jù)集和基準(zhǔn)的豐富,,應(yīng)用場(chǎng)景的拓寬(自動(dòng)駕駛、健康醫(yī)療等等)對(duì)多模態(tài)理解復(fù)雜環(huán)境和用戶需求有著較高的要求,。因此,,大模型由單模態(tài)向多模態(tài)升級(jí)已然成為行業(yè)共識(shí),。
而通用人工智能AGI作為AI的終極目標(biāo),,現(xiàn)在去討論顯然是不合適的。目前AGI的發(fā)展還處于初級(jí)階段,,雖然已有AI在某些特定領(lǐng)域表現(xiàn)出了超越人類的智能水平,,但仍有很多局限性,如只能處理特定類型的任務(wù),,缺乏泛化能力,,且不具備真正的自主學(xué)習(xí)和自動(dòng)推理的能力。之前Sora引發(fā)的AGI論也只是資本市場(chǎng)的短暫的泡沫和高調(diào)而已,。
●落地與盈利,,觸手可及的希望
雖然研發(fā)和資本游戲仍在內(nèi)卷,大模型的落地和盈利不論從商用還是消費(fèi)來看,,絕對(duì)不僅僅是“最后一公里”的事,。除了少數(shù)AI開發(fā)者開放API賣升級(jí)服務(wù)之外,在更多資本可以想象的場(chǎng)景和市場(chǎng)仍然是一片空白,。盡管如此,,業(yè)界依然寄予厚望,多年來在經(jīng)歷了區(qū)塊鏈,、元宇宙等概念的泡沫和熱潮褪去之后,,人工智能深度學(xué)習(xí)的崛起和大模型的表現(xiàn)讓人們看到了扎實(shí)的技術(shù)革新和觸手可及的希望。
正因?yàn)槿绱?,隨著大模型落地拐點(diǎn)將近,,科技巨頭開始為之奔走尋求行業(yè)支持,初創(chuàng)公司亦如雨后春筍而且精準(zhǔn)啟動(dòng),。蘋果CEO庫克今年3月現(xiàn)身上海首談生成式AI,,諸如Apple Watch的摔倒檢測(cè)以及iPhone的預(yù)測(cè)性文本輸入等功能,蘋果公司正在尋求為自家產(chǎn)品線引入大模型的支持,。促使蘋果加速AI落地的往往來自同行的壓力,,谷歌宣布用于取代Google Assistant的Gemini也即將登陸各類安卓應(yīng)用,而微軟作為OpenAI的金主,,早已布局了自家生產(chǎn)力工具和產(chǎn)品的方方面面,。國內(nèi)大模型也緊跟趨勢(shì),在多個(gè)行業(yè)如教育,、醫(yī)療,、金融、汽車等方面表現(xiàn)活躍,,如星火認(rèn)知大模型在智能座艙應(yīng)用場(chǎng)景展現(xiàn)出強(qiáng)大的溝通和理解能力,;日日新SenseNova在專業(yè)文本理解、代碼生成和輔助初步醫(yī)療問診方面表現(xiàn)亮眼,。
大模型的落地和盈利要面對(duì)的挑戰(zhàn)是一個(gè)多維度的問題,。首先算法和數(shù)據(jù)處理方面雖取得了顯著進(jìn)展,但算法參數(shù)量激增,,訓(xùn)練成本高昂,,對(duì)模型優(yōu)化和微調(diào)提出了更高的要求。其次AI性能很大程度上取決于高質(zhì)量的數(shù)據(jù),,數(shù)據(jù)的獲取,、清洗、標(biāo)注和處理是一大挑戰(zhàn),,尤其是在保護(hù)數(shù)據(jù)隱私和符合法規(guī)要求的前提下,。還有場(chǎng)景和應(yīng)用經(jīng)驗(yàn)、多模態(tài)任務(wù)的挑戰(zhàn)等等,,所以大模型的落地不能僅僅認(rèn)為是“最后一公里”的事,,而是從工程整體上檢驗(yàn)案例項(xiàng)目的突破和進(jìn)展,。隨著技術(shù)的迭代革新和市場(chǎng)逐步成熟,這些挑戰(zhàn)最后都能得到有效解決,。
文/陳徐毅 高級(jí)工程師,,科技專欄作者,中國計(jì)算機(jī)學(xué)會(huì)會(huì)員,。本文刊發(fā)于《中關(guān)村》第251期
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1102976.html
溫馨提示:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議,。