2022年12月1日,美國的人工智能研究公司OpenAI發(fā)布自然語言識別新模型Chat GPT,,并免費開放測試,。人工智能內(nèi)容生成技術(shù)(AIGC)早已出現(xiàn),,而Chat GPT成為社交分享平臺的現(xiàn)象級產(chǎn)品,引發(fā)對AIGC技術(shù)及其行業(yè)發(fā)展的新思考,。
人工智能領(lǐng)域的新嘗試
21世紀(jì)初,,人工智能文字生成技術(shù)已逐漸從實驗性向?qū)嵱眯赞D(zhuǎn)變。2007年,,紐約大學(xué)人工智能研究員羅斯?古德溫裝配的人工智能系統(tǒng),,通過對公路旅行中的所見所聞進行記錄和感知,撰寫出世界第一部完全由人工智能創(chuàng)作的小說《1 The Road》,。但其可讀性不強,,拼寫錯誤、辭藻空洞,、缺乏邏輯等缺點明顯,。
GPT(Generative Pre-trained Transformer,生成型預(yù)訓(xùn)練變換器)是一種基于互聯(lián)網(wǎng)可用數(shù)據(jù)訓(xùn)練的文本生成深度學(xué)習(xí)模型,用于問答,、文本摘要生成,、機器翻譯、分類,、代碼生成和對話AI,。在性能方面,2018年誕生的GPT-1有一定的泛化能力,,能夠用于和監(jiān)督任務(wù)無關(guān)的任務(wù)中,。有觀點認(rèn)為,這一年也是NLP(自然語言處理)的預(yù)訓(xùn)練模型元年,。在此之前,,傳統(tǒng)的NLP模型往往使用大量的數(shù)據(jù)對有監(jiān)督的模型進行任務(wù)相關(guān)的模型訓(xùn)練,但這種有監(jiān)督學(xué)習(xí)的任務(wù)存在兩個缺點,,即需要大量的標(biāo)注數(shù)據(jù)和模型難以泛化,。
隨后,AIGC技術(shù)發(fā)展迅速,。僅2022年就相繼出現(xiàn)Dall-E,、Imagen、Stable Fusion,、Midjourney,、Lambda、Imagen Video等突破性的AI技術(shù),。新晉網(wǎng)紅Chat GPT模型,,則是OpenAI在2020年推出的NLP預(yù)訓(xùn)練模型GPT-3的衍生產(chǎn)品。有觀點認(rèn)為,,本次放出的Chat GPT應(yīng)被稱為GPT-3.5,,業(yè)內(nèi)人士認(rèn)為,這將是對NLP以及人工智能領(lǐng)域有重要意義的一款模型,。有了GPT-3.5的加持,,Chat GPT經(jīng)訓(xùn)練后提升了對答如流的能力。在實際效果上,,GPT-3只預(yù)測任何給定的單詞串之后的文本,而Chat GPT則試圖以一種更像人類的方式與用戶發(fā)生互動,。在使用體驗上,,多數(shù)網(wǎng)民反饋Chat GPT的互動非常流暢,,適配于各種主題,,與幾年前的聊天機器人相比,,Chat GPT帶來許多驚喜,。
有觀點認(rèn)為,Chat GPT令人眼前一亮的表現(xiàn),,與其人力參與的訓(xùn)練方式密不可分,。OpenAI官方稱,Chat GPT是在人類的幫助下創(chuàng)建并訓(xùn)練的,,人類訓(xùn)練師對該AI早期版本回答查詢的方式進行排名和評級。然后,,這些信息被反饋到系統(tǒng)中,系統(tǒng)會根據(jù)訓(xùn)練師的偏好來調(diào)整答案,。具體來說,,Chat GPT使用監(jiān)督微調(diào)訓(xùn)練了一個初始模型:人類AI訓(xùn)練員提供對話,并在對話中扮演雙方——用戶和AI助手,,AI訓(xùn)練員可以訪問模型編寫的對話回復(fù),,以幫助AI調(diào)整回復(fù)內(nèi)容,。這也是一種訓(xùn)練人工智能的標(biāo)準(zhǔn)方法,,被稱為RLHF(從人類反饋中強化學(xué)習(xí))。
準(zhǔn)確性仍是難題
Chat GPT一經(jīng)發(fā)出,,便引爆社交網(wǎng)絡(luò),。12月5日,,OpenAI首席執(zhí)行官Sam Altman在社交媒體上發(fā)文表示,OpenAI訓(xùn)練的大型語言模型Chat GPT推出后,,當(dāng)日突破100萬用戶。推特首席執(zhí)行官馬斯克發(fā)推特稱,,許多人陷入瘋狂的Chat GPT循環(huán)中。
一時間,,針對Chat GPT的探討,、詢問,、閑聊帖刷屏了各大社交媒體平臺,。有網(wǎng)民嘗試讓Chat GPT參加美國高考、書寫學(xué)術(shù)文章,、檢查代碼,、回答熱力學(xué)問題;有程序員“誘騙”Chat GPT規(guī)劃如何毀滅世界,,并引誘讓其提供底層代碼,;更有甚者讓Chat GPT扮演OpenAI,在系統(tǒng)內(nèi)構(gòu)建Chat GPT套娃,。在實際表現(xiàn)中,,Chat GPT敢于質(zhì)疑不正確的前提和假設(shè),、主動承認(rèn)錯誤,回答一些無法回答的問題,、主動拒絕不合理的問題,,提升了對用戶意圖的理解以及結(jié)果的準(zhǔn)確性,。
Chat GPT或?qū)⒀苌鲆慌鷱姶蟮淖匀徽Z言處理商業(yè)應(yīng)用,。有人工智能行業(yè)專家認(rèn)為,通用大模型的普及預(yù)計會在3—5年內(nèi)實現(xiàn),,人工智能將很快替代簡單重復(fù)勞動,,甚至是一些流程性的技術(shù)崗位,比如翻譯,、新聞簡訊編輯等,。通用大模型很可能會在短時間內(nèi)改變很多生產(chǎn)和生活方式,大量基礎(chǔ)性的工作流程會被基于大模型的智能應(yīng)用滲透甚至取代,。
當(dāng)然,,Chat GPT離實際落地還有一段距離,。其中最為核心的問題,在于模型的準(zhǔn)確性和部署成本,。其中,,各大AI公司已積極對部署成本做出改進。
準(zhǔn)確性仍為人工智能技術(shù)商業(yè)落地待解的普遍性難題,,而Chat GPT的準(zhǔn)確性仍存在缺口,。OpenAI承認(rèn),Chat GPT傾向于用“聽起來合理但不正確或無意義的答案”來回應(yīng),,該公司認(rèn)為這個問題很難解決,。一是在訓(xùn)練過程中缺少引用來源;二是為避免誤報,,模型可能會拒絕回答,;三是訓(xùn)練的模型具有傾向性,例如,,如果訓(xùn)練者喜歡更長的答案,,將會導(dǎo)致模型傾向于冗長的回答,以及過度使用某些短語,。以上原因都會導(dǎo)致Chat GPT輸出的結(jié)果不夠準(zhǔn)確,。
在使用上,如果初始提示或問題含糊不清,,則Chat GPT模型不會適當(dāng)?shù)匾蟪吻?,會?dǎo)致用戶的使用壁壘。雖然Chat GPT的輸入輸出均為自然語言,,但模型的底層邏輯與自然語言邏輯不同,故而程序員在調(diào)整輸入關(guān)鍵詞上具有專業(yè)優(yōu)勢,,而普通使用者則難以理解模型底層邏輯并進行調(diào)節(jié),。
技術(shù)突破是主要推動力量
在商業(yè)發(fā)展上,Chat GPT所在的AIGC賽道競爭激烈,。中國的互聯(lián)網(wǎng)巨頭,、大學(xué),在短短的一兩年之內(nèi),,設(shè)計了二十多個千億參數(shù)以上的大模型,。同時,類似功能定位的產(chǎn)品也已出現(xiàn),。
資本市場上的新技術(shù)定位與應(yīng)用不斷更新,,Chat GPT四面楚歌。2022年5月,,獲得2.25億美元股權(quán)融資的機器學(xué)習(xí)初創(chuàng)公司Inflection AI,,旨在5年內(nèi)實現(xiàn)將人類意圖轉(zhuǎn)化為計算機可理解的語言,。
2022年4月,以6500萬美元的融資悄然出現(xiàn)的Adept實驗室,,正在構(gòu)建通用智能,,旨在使人類和計算機能夠創(chuàng)造性地合作解決問題,將技術(shù)應(yīng)用推向新的臺階,。該公司項目可以簡單概括為完善計算機中的覆蓋層,,即聽從人的指令,讓計算機使用人類的工具為人類干活,,諸如生成月度合規(guī)報告或者幫助設(shè)計建筑裝修圖,,并使用現(xiàn)有軟件來完成。Adept的首席執(zhí)行官David Luan表示,,真正的通用智能不僅可以讀寫,,而且可以在人們要求它做某事時采取行動。
在2022年2月的一篇論文中,,人工智能企業(yè)Deep Mind的科學(xué)家提出數(shù)據(jù)驅(qū)動方法,,用于教會AI控制計算機,對AI技術(shù)未來應(yīng)用提供前瞻,。通過讓人工智能觀察人們使用鍵盤和鼠標(biāo)完成“指令遵循”的計算機任務(wù),,科學(xué)家訓(xùn)練系統(tǒng)執(zhí)行一百多項任務(wù),以達到人類水平的準(zhǔn)確性,。
在創(chuàng)新應(yīng)用上,,Chat GPT轉(zhuǎn)型搜索引擎仍存瓶頸。有觀點認(rèn)為,,Chat GPT在回答基本的,、甚至有些無聊的問題上具有獨特優(yōu)勢。有網(wǎng)民在對比了谷歌的搜索結(jié)果和與Chat GPT的聊天結(jié)果之后,,宣稱谷歌已經(jīng)“完蛋”了,。因此,如果能準(zhǔn)確地呈現(xiàn)這些信息,,并以更流暢和對話的語調(diào)來進行反饋,,將實現(xiàn)傳統(tǒng)搜索的巨大進步。
但在實際操作上,,Chat GPT作為搜索引擎仍存在技術(shù)瓶頸,。一方面,受限于訓(xùn)練數(shù)據(jù)集和模型邏輯,,Chat GPT的輸出結(jié)果仍存在優(yōu)化空間,。據(jù)Open AI,由于Chat GPT的知識只來自訓(xùn)練數(shù)據(jù)中的統(tǒng)計規(guī)律,而不是任何類似人類對世界復(fù)雜和抽象系統(tǒng)的理解,,因此“該系統(tǒng)偶爾會產(chǎn)生不正確或誤導(dǎo)性的信息,,并產(chǎn)生攻擊性或有偏見的內(nèi)容”。此外,,該機器人對2021年之后的世界知識了解有限,,對于某些特定人群的問題也知之甚少。
另一方面,,Chat GPT的輸出也具有道德風(fēng)險,。當(dāng)用戶向Chat GPT詢問一些危險的問題時,受過安全訓(xùn)練的系統(tǒng)會解釋為什么它不能告訴你答案,。但用戶可以通過某些技巧來繞過這種安全訓(xùn)練,,比如哄騙Chat GPT,讓它以為自己是電影中的一個角色,,或是它正在撰寫一個有關(guān)人工智能模型為何不應(yīng)該回答此類問題的劇本,。
Chat GPT未來的發(fā)展重點在于技術(shù)營銷,應(yīng)注重保持高流量,、高熱度,。微信公眾號“券商中國”認(rèn)為,技術(shù)的突破和推廣是主要推動力量,。信達證券研究所相關(guān)研究表示,,2022年下半年以來,深度學(xué)習(xí)模型不斷完善,、開源模式的推動,、商業(yè)化案例的落地,推動AIGC發(fā)展明顯加速,。
人民數(shù)據(jù)研究院認(rèn)為,,在注意力時代,技術(shù)與普通產(chǎn)品一樣流量為王,。雖然,,Chat GPT模型的準(zhǔn)確性仍為其短板,但其不可預(yù)測的輸出也帶來極高的話題性,,無形中普及了AIGC技術(shù),奠定了公共流量基礎(chǔ),,與其他同領(lǐng)域模型或公司相比,,具有先發(fā)優(yōu)勢。未來新版本的Chat GPT也可以通過繼續(xù)降低應(yīng)用門檻,,增加模型輸出話題性,,吸引更多人力、金錢、資源的投入,,占據(jù)市場優(yōu)勢地位,,逐步迭代完善技術(shù)效能?! ?/p>
作者:人民數(shù)據(jù)研究院 研究員劉雪倫
來源:《網(wǎng)絡(luò)輿情》雜志
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/978912.html
溫馨提示:投資有風(fēng)險,,入市須謹(jǐn)慎,。本資訊不作為投資理財建議。