2022年12月1日,,美國的人工智能研究公司OpenAI發(fā)布自然語言識(shí)別新模型Chat GPT,并免費(fèi)開放測(cè)試,。人工智能內(nèi)容生成技術(shù)(AIGC)早已出現(xiàn),,而Chat GPT成為社交分享平臺(tái)的現(xiàn)象級(jí)產(chǎn)品,,引發(fā)對(duì)AIGC技術(shù)及其行業(yè)發(fā)展的新思考。
人工智能領(lǐng)域的新嘗試
21世紀(jì)初,,人工智能文字生成技術(shù)已逐漸從實(shí)驗(yàn)性向?qū)嵱眯赞D(zhuǎn)變,。2007年,,紐約大學(xué)人工智能研究員羅斯?古德溫裝配的人工智能系統(tǒng),通過對(duì)公路旅行中的所見所聞進(jìn)行記錄和感知,,撰寫出世界第一部完全由人工智能創(chuàng)作的小說《1 The Road》,。但其可讀性不強(qiáng),拼寫錯(cuò)誤,、辭藻空洞,、缺乏邏輯等缺點(diǎn)明顯。
GPT(Generative Pre-trained Transformer,,生成型預(yù)訓(xùn)練變換器)是一種基于互聯(lián)網(wǎng)可用數(shù)據(jù)訓(xùn)練的文本生成深度學(xué)習(xí)模型,用于問答,、文本摘要生成,、機(jī)器翻譯、分類,、代碼生成和對(duì)話AI,。在性能方面,2018年誕生的GPT-1有一定的泛化能力,,能夠用于和監(jiān)督任務(wù)無關(guān)的任務(wù)中,。有觀點(diǎn)認(rèn)為,這一年也是NLP(自然語言處理)的預(yù)訓(xùn)練模型元年,。在此之前,,傳統(tǒng)的NLP模型往往使用大量的數(shù)據(jù)對(duì)有監(jiān)督的模型進(jìn)行任務(wù)相關(guān)的模型訓(xùn)練,但這種有監(jiān)督學(xué)習(xí)的任務(wù)存在兩個(gè)缺點(diǎn),,即需要大量的標(biāo)注數(shù)據(jù)和模型難以泛化,。
隨后,AIGC技術(shù)發(fā)展迅速,。僅2022年就相繼出現(xiàn)Dall-E,、Imagen、Stable Fusion,、Midjourney,、Lambda、Imagen Video等突破性的AI技術(shù),。新晉網(wǎng)紅Chat GPT模型,,則是OpenAI在2020年推出的NLP預(yù)訓(xùn)練模型GPT-3的衍生產(chǎn)品。有觀點(diǎn)認(rèn)為,,本次放出的Chat GPT應(yīng)被稱為GPT-3.5,,業(yè)內(nèi)人士認(rèn)為,這將是對(duì)NLP以及人工智能領(lǐng)域有重要意義的一款模型,。有了GPT-3.5的加持,,Chat GPT經(jīng)訓(xùn)練后提升了對(duì)答如流的能力,。在實(shí)際效果上,GPT-3只預(yù)測(cè)任何給定的單詞串之后的文本,,而Chat GPT則試圖以一種更像人類的方式與用戶發(fā)生互動(dòng),。在使用體驗(yàn)上,多數(shù)網(wǎng)民反饋Chat GPT的互動(dòng)非常流暢,,適配于各種主題,,與幾年前的聊天機(jī)器人相比,Chat GPT帶來許多驚喜,。
有觀點(diǎn)認(rèn)為,,Chat GPT令人眼前一亮的表現(xiàn),與其人力參與的訓(xùn)練方式密不可分,。OpenAI官方稱,,Chat GPT是在人類的幫助下創(chuàng)建并訓(xùn)練的,人類訓(xùn)練師對(duì)該AI早期版本回答查詢的方式進(jìn)行排名和評(píng)級(jí),。然后,,這些信息被反饋到系統(tǒng)中,系統(tǒng)會(huì)根據(jù)訓(xùn)練師的偏好來調(diào)整答案,。具體來說,,Chat GPT使用監(jiān)督微調(diào)訓(xùn)練了一個(gè)初始模型:人類AI訓(xùn)練員提供對(duì)話,并在對(duì)話中扮演雙方——用戶和AI助手,,AI訓(xùn)練員可以訪問模型編寫的對(duì)話回復(fù),,以幫助AI調(diào)整回復(fù)內(nèi)容。這也是一種訓(xùn)練人工智能的標(biāo)準(zhǔn)方法,,被稱為RLHF(從人類反饋中強(qiáng)化學(xué)習(xí)),。
準(zhǔn)確性仍是難題
Chat GPT一經(jīng)發(fā)出,便引爆社交網(wǎng)絡(luò),。12月5日,,OpenAI首席執(zhí)行官Sam Altman在社交媒體上發(fā)文表示,OpenAI訓(xùn)練的大型語言模型Chat GPT推出后,,當(dāng)日突破100萬用戶,。推特首席執(zhí)行官馬斯克發(fā)推特稱,許多人陷入瘋狂的Chat GPT循環(huán)中,。
一時(shí)間,,針對(duì)Chat GPT的探討、詢問,、閑聊帖刷屏了各大社交媒體平臺(tái),。有網(wǎng)民嘗試讓Chat GPT參加美國高考、書寫學(xué)術(shù)文章,、檢查代碼,、回答熱力學(xué)問題,;有程序員“誘騙”Chat GPT規(guī)劃如何毀滅世界,并引誘讓其提供底層代碼,;更有甚者讓Chat GPT扮演OpenAI,,在系統(tǒng)內(nèi)構(gòu)建Chat GPT套娃。在實(shí)際表現(xiàn)中,,Chat GPT敢于質(zhì)疑不正確的前提和假設(shè),、主動(dòng)承認(rèn)錯(cuò)誤,回答一些無法回答的問題,、主動(dòng)拒絕不合理的問題,,提升了對(duì)用戶意圖的理解以及結(jié)果的準(zhǔn)確性。
Chat GPT或?qū)⒀苌鲆慌鷱?qiáng)大的自然語言處理商業(yè)應(yīng)用,。有人工智能行業(yè)專家認(rèn)為,,通用大模型的普及預(yù)計(jì)會(huì)在3—5年內(nèi)實(shí)現(xiàn),人工智能將很快替代簡(jiǎn)單重復(fù)勞動(dòng),,甚至是一些流程性的技術(shù)崗位,比如翻譯,、新聞簡(jiǎn)訊編輯等,。通用大模型很可能會(huì)在短時(shí)間內(nèi)改變很多生產(chǎn)和生活方式,大量基礎(chǔ)性的工作流程會(huì)被基于大模型的智能應(yīng)用滲透甚至取代,。
當(dāng)然,,Chat GPT離實(shí)際落地還有一段距離。其中最為核心的問題,,在于模型的準(zhǔn)確性和部署成本,。其中,各大AI公司已積極對(duì)部署成本做出改進(jìn),。
準(zhǔn)確性仍為人工智能技術(shù)商業(yè)落地待解的普遍性難題,,而Chat GPT的準(zhǔn)確性仍存在缺口。OpenAI承認(rèn),,Chat GPT傾向于用“聽起來合理但不正確或無意義的答案”來回應(yīng),,該公司認(rèn)為這個(gè)問題很難解決。一是在訓(xùn)練過程中缺少引用來源,;二是為避免誤報(bào),,模型可能會(huì)拒絕回答;三是訓(xùn)練的模型具有傾向性,,例如,,如果訓(xùn)練者喜歡更長(zhǎng)的答案,將會(huì)導(dǎo)致模型傾向于冗長(zhǎng)的回答,,以及過度使用某些短語,。以上原因都會(huì)導(dǎo)致Chat GPT輸出的結(jié)果不夠準(zhǔn)確,。
在使用上,如果初始提示或問題含糊不清,,則Chat GPT模型不會(huì)適當(dāng)?shù)匾蟪吻?,?huì)導(dǎo)致用戶的使用壁壘。雖然Chat GPT的輸入輸出均為自然語言,,但模型的底層邏輯與自然語言邏輯不同,,故而程序員在調(diào)整輸入關(guān)鍵詞上具有專業(yè)優(yōu)勢(shì),而普通使用者則難以理解模型底層邏輯并進(jìn)行調(diào)節(jié),。
技術(shù)突破是主要推動(dòng)力量
在商業(yè)發(fā)展上,,Chat GPT所在的AIGC賽道競(jìng)爭(zhēng)激烈。中國的互聯(lián)網(wǎng)巨頭,、大學(xué),,在短短的一兩年之內(nèi),設(shè)計(jì)了二十多個(gè)千億參數(shù)以上的大模型,。同時(shí),,類似功能定位的產(chǎn)品也已出現(xiàn)。
資本市場(chǎng)上的新技術(shù)定位與應(yīng)用不斷更新,,Chat GPT四面楚歌,。2022年5月,獲得2.25億美元股權(quán)融資的機(jī)器學(xué)習(xí)初創(chuàng)公司Inflection AI,,旨在5年內(nèi)實(shí)現(xiàn)將人類意圖轉(zhuǎn)化為計(jì)算機(jī)可理解的語言,。
2022年4月,以6500萬美元的融資悄然出現(xiàn)的Adept實(shí)驗(yàn)室,,正在構(gòu)建通用智能,,旨在使人類和計(jì)算機(jī)能夠創(chuàng)造性地合作解決問題,將技術(shù)應(yīng)用推向新的臺(tái)階,。該公司項(xiàng)目可以簡(jiǎn)單概括為完善計(jì)算機(jī)中的覆蓋層,,即聽從人的指令,讓計(jì)算機(jī)使用人類的工具為人類干活,,諸如生成月度合規(guī)報(bào)告或者幫助設(shè)計(jì)建筑裝修圖,,并使用現(xiàn)有軟件來完成。Adept的首席執(zhí)行官David Luan表示,,真正的通用智能不僅可以讀寫,,而且可以在人們要求它做某事時(shí)采取行動(dòng)。
在2022年2月的一篇論文中,,人工智能企業(yè)Deep Mind的科學(xué)家提出數(shù)據(jù)驅(qū)動(dòng)方法,,用于教會(huì)AI控制計(jì)算機(jī),對(duì)AI技術(shù)未來應(yīng)用提供前瞻,。通過讓人工智能觀察人們使用鍵盤和鼠標(biāo)完成“指令遵循”的計(jì)算機(jī)任務(wù),,科學(xué)家訓(xùn)練系統(tǒng)執(zhí)行一百多項(xiàng)任務(wù),,以達(dá)到人類水平的準(zhǔn)確性。
在創(chuàng)新應(yīng)用上,,Chat GPT轉(zhuǎn)型搜索引擎仍存瓶頸,。有觀點(diǎn)認(rèn)為,Chat GPT在回答基本的,、甚至有些無聊的問題上具有獨(dú)特優(yōu)勢(shì),。有網(wǎng)民在對(duì)比了谷歌的搜索結(jié)果和與Chat GPT的聊天結(jié)果之后,宣稱谷歌已經(jīng)“完蛋”了,。因此,,如果能準(zhǔn)確地呈現(xiàn)這些信息,并以更流暢和對(duì)話的語調(diào)來進(jìn)行反饋,,將實(shí)現(xiàn)傳統(tǒng)搜索的巨大進(jìn)步,。
但在實(shí)際操作上,Chat GPT作為搜索引擎仍存在技術(shù)瓶頸,。一方面,,受限于訓(xùn)練數(shù)據(jù)集和模型邏輯,Chat GPT的輸出結(jié)果仍存在優(yōu)化空間,。據(jù)Open AI,,由于Chat GPT的知識(shí)只來自訓(xùn)練數(shù)據(jù)中的統(tǒng)計(jì)規(guī)律,而不是任何類似人類對(duì)世界復(fù)雜和抽象系統(tǒng)的理解,,因此“該系統(tǒng)偶爾會(huì)產(chǎn)生不正確或誤導(dǎo)性的信息,并產(chǎn)生攻擊性或有偏見的內(nèi)容”,。此外,,該機(jī)器人對(duì)2021年之后的世界知識(shí)了解有限,對(duì)于某些特定人群的問題也知之甚少,。
另一方面,,Chat GPT的輸出也具有道德風(fēng)險(xiǎn)。當(dāng)用戶向Chat GPT詢問一些危險(xiǎn)的問題時(shí),,受過安全訓(xùn)練的系統(tǒng)會(huì)解釋為什么它不能告訴你答案,。但用戶可以通過某些技巧來繞過這種安全訓(xùn)練,比如哄騙Chat GPT,,讓它以為自己是電影中的一個(gè)角色,,或是它正在撰寫一個(gè)有關(guān)人工智能模型為何不應(yīng)該回答此類問題的劇本。
Chat GPT未來的發(fā)展重點(diǎn)在于技術(shù)營(yíng)銷,,應(yīng)注重保持高流量,、高熱度。微信公眾號(hào)“券商中國”認(rèn)為,,技術(shù)的突破和推廣是主要推動(dòng)力量,。信達(dá)證券研究所相關(guān)研究表示,,2022年下半年以來,深度學(xué)習(xí)模型不斷完善,、開源模式的推動(dòng),、商業(yè)化案例的落地,推動(dòng)AIGC發(fā)展明顯加速,。
人民數(shù)據(jù)研究院認(rèn)為,,在注意力時(shí)代,技術(shù)與普通產(chǎn)品一樣流量為王,。雖然,,Chat GPT模型的準(zhǔn)確性仍為其短板,但其不可預(yù)測(cè)的輸出也帶來極高的話題性,,無形中普及了AIGC技術(shù),,奠定了公共流量基礎(chǔ),與其他同領(lǐng)域模型或公司相比,,具有先發(fā)優(yōu)勢(shì),。未來新版本的Chat GPT也可以通過繼續(xù)降低應(yīng)用門檻,增加模型輸出話題性,,吸引更多人力,、金錢、資源的投入,,占據(jù)市場(chǎng)優(yōu)勢(shì)地位,,逐步迭代完善技術(shù)效能?! ?/p>
作者:人民數(shù)據(jù)研究院 研究員劉雪倫
來源:《網(wǎng)絡(luò)輿情》雜志
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/978912.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。