隨著美國初創(chuàng)公司OpenAI于2022年11月30日推出劃時代人工智能產(chǎn)品ChatGPT后,,生成式人工智能產(chǎn)品迅速成為數(shù)字經(jīng)濟發(fā)展的最新趨勢。去年和今年,,ChatGPT的版本和功能也一日千里,。筆者認為,目不暇接新的技術(shù)和新產(chǎn)品,,充分顯示出生成式人工智能技術(shù)成為了通用性人工智能技術(shù)的代表,,并迅速融入生產(chǎn)力提升環(huán)節(jié),昭示出數(shù)字經(jīng)濟四大發(fā)展趨勢:趨勢一:存量數(shù)據(jù)要素的價值將得到充分釋放搜素引擎時代,,一個網(wǎng)頁,,如無法被任何搜索引擎找到,基本意味著該網(wǎng)頁在數(shù)字空間內(nèi)并不存在,。在人工智能時代,,存量數(shù)據(jù)亦如是。人工智能的時代下的數(shù)據(jù),,有著兩方面的價值:一是生成信息和知識的價值,、二是對人工智能的訓(xùn)練價值。存量數(shù)據(jù)如未被人工智能技術(shù)予以使用的話,,既無法用來生成新的信息與知識,,也無法用來訓(xùn)練人工智能模型,也就意味著數(shù)據(jù)失去了意義與價值,。近日ChatGPT,、文心一言等生成式人工智能技術(shù)的問世與迭代。令人們愿意更多地與此類生成式人工智能交互,,從而令沉淀下來的數(shù)據(jù)要素存量得以進一步發(fā)揮其生成信息和知識的價值,。在交互的過程中,存量數(shù)據(jù)也將發(fā)揮訓(xùn)練人工智能的價值,,讓人工智能日新月異,。未來隨著生成式人工智能技術(shù)的發(fā)展,數(shù)據(jù)將在尊重個體隱私信息的情況下,,在交互中被生成信息或知識,,提高人們的工作效率和決策水平,從而推動經(jīng)濟高質(zhì)量發(fā)展,。另一個釋放存量數(shù)據(jù)要素價值的突破性技術(shù)是生成式人工智能訓(xùn)練時所用到的數(shù)據(jù)token化,。token指語言模型所處理的數(shù)據(jù)單位,而數(shù)據(jù)token化是指將句子,、段落,、文章這些類型的長文本分解為若干部分,,形成單元,即以token為單位的數(shù)據(jù)結(jié)構(gòu),,而后把文本分詞后每個詞表示成向量進行模型計算的過程,。如單詞pretrained,可被分成pre,,##train,,##ed三個tokens,進而單獨訓(xùn)練每個token的含義,,然后將pre,train,,ed這三個token的含義結(jié)合起來來推測pretrained這個詞的含義,。這樣的做法能夠極大減少詞表的大小,例如(BERT-base模型)英文其實是用30722個token來表示的,,這其中甚至有很多token并沒有被用到,。這就意味著,我們可以用小于3W個token來表示英文中的幾乎所有單詞,。人類社會中80%以上的數(shù)據(jù)都是圖片,、音頻、視頻等等非結(jié)構(gòu)化的數(shù)據(jù),,這些數(shù)據(jù)不像文字,、字符一樣能被計算機處理,如何挖掘這些數(shù)據(jù)背后的價值成為大數(shù)據(jù)變革的一大方向,。而在AI大模型的加持下,,文字、圖片,、聲音等數(shù)據(jù),,均可通過token化而轉(zhuǎn)變成可供人工智能訓(xùn)練的單元,使得人工智能的訓(xùn)練不再需要面對千百種的排列組合,,而是著眼于最基本的單元,。這將極大利用各類數(shù)據(jù)要素存量,帶來所有數(shù)據(jù)統(tǒng)一處理的新變革,。趨勢二:推動高性能芯片產(chǎn)業(yè)快速發(fā)展OpenAI的ChatGPT產(chǎn)品所依賴的GPT模型參數(shù)高達1750億,,谷歌LaMDA 模型參數(shù)高達1370億,其視覺語言模型PaLM-E的參數(shù)則高達5620億,。根據(jù)李彥宏介紹,,百度公司的文心一言大模型的訓(xùn)練數(shù)據(jù)包括萬億級網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù),、百億級的語音日均調(diào)用數(shù)據(jù),,以及5500億事實的知識圖譜等,。這使得生成式人工智能產(chǎn)品在訓(xùn)練和與用戶交互的過程中,需要大量算力來支撐,。在生成式人工智能突飛猛進的當(dāng)下,,人工智能開發(fā)者們也在秣馬厲兵,擴大高性能計算集群儲備,。數(shù)據(jù)顯示,,日前Meta公司的NVIDIA A100計算卡的庫存已經(jīng)達到了21000余張。谷歌母公司甲骨文的A100計算卡存量也突破了10000張,。在可見的未來,,隨著人們對生成式人工智能的需求更深更廣,人們對算力的需求也將呈指數(shù)型增長,。而這種趨勢也將把春風(fēng)吹向高性能芯片產(chǎn)業(yè),,極大地促進處理器、計算卡,、服務(wù)器等相關(guān)運算組件的研發(fā)與銷售,。趨勢三:催生云計算新型服務(wù)模式云計算作為利用分布式計算形成巨大算力的計算服務(wù)系統(tǒng),可以對生成式人工智能提供強有力的算力保障,。OpenAI的大東家微軟,,不僅在ChatGPT的研發(fā)過程中出資支持,更為ChatGPT模型提供了微軟的云計算服務(wù),。目前,,云計算的主要服務(wù)方式涵蓋了基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺及服務(wù)(PaaS),、軟件即服務(wù)(SaaS),。生成式人工智能的發(fā)展,或?qū)⒋龠M云計算服務(wù)從IaaS逐步轉(zhuǎn)向模型即服務(wù)MaaS(Model as a Service),即從提供算力,、存儲等基礎(chǔ)云服務(wù)到提供模型,、框架、應(yīng)用等多樣化服務(wù),。例如百度CEO李彥宏近期表示,,百度已經(jīng)在AI層面進行了全棧布局,整個公司的AI技術(shù)架構(gòu)分為四層:芯片層,、框架層,、模型層和應(yīng)用層。這個技術(shù)架構(gòu),,越往下越通用,,越往上越專用。通用性的提升將會降低開發(fā)與應(yīng)用的門檻,,而專用性的提升則將提高開發(fā)與應(yīng)用的效率,。在未來,,云計算廠商通過模型及服務(wù),將能標(biāo)準(zhǔn)化地輸出智能化的底層能力,,為AI的發(fā)展提供堅實地基,。趨勢四:推動生產(chǎn)力智能服務(wù)平臺等平臺經(jīng)濟新業(yè)態(tài)在上述趨勢作用下,生成式人工智能技術(shù)將使得數(shù)字經(jīng)濟步入智能經(jīng)濟階段,,推動數(shù)字經(jīng)濟和實體經(jīng)濟深入融合,,對生產(chǎn)力提升將產(chǎn)生重大影響。生產(chǎn)力智能服務(wù)平臺,,指的是通過基于生成式人工智能的服務(wù),,促進生產(chǎn)力提高或決策智能化的服務(wù)型平臺。最簡單的例子就是微軟近期在自家Microsoft Office各類工作軟件上發(fā)布的Microsoft Copilot人工智能助手,。這類結(jié)合辦公軟件的多模態(tài)模型,,讓本來極為繁瑣的操作步驟與程序語言,可以被用自然語言表述的指令替代,。我們只需要用人類的語言給人工智能傳達我們的目標(biāo),它便會理解,、想出實現(xiàn)我們目標(biāo)所需要的計算機指令,,并幫助我們直接操作完成。這將極大地降低人們利用辦公軟件實現(xiàn)復(fù)雜功能的門檻,,也將極大提升人們在辦公場景下的生產(chǎn)力水平,。在未來,,對強大的生成式人工智能來說,辦公場景只是千萬種應(yīng)用場景的冰山一角,。ChatGPT通過API插件與其他應(yīng)用場景結(jié)合,,可以催生出更多2C或2B的生產(chǎn)力智能服務(wù)平臺,,在無人駕駛,、智能辦公,、程序編寫,、車間控制等場景也會帶來革命性生產(chǎn)力提升,。我國應(yīng)鼓勵互聯(lián)網(wǎng)企業(yè)積極投身該領(lǐng)域的創(chuàng)新和競爭,,助力我國數(shù)字經(jīng)濟邁入新的發(fā)展階段,。作者/清華大學(xué)社科學(xué)院數(shù)字經(jīng)濟研究中心主任 王勇教授編輯/岳彩周校對/薛京寧
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1091356.html
溫馨提示:投資有風(fēng)險,,入市須謹慎,。本資訊不作為投資理財建議。