《安安訪談錄》是界面財(cái)聯(lián)社執(zhí)行總裁徐安安出品的一檔深度訪談類欄目。從投資角度對話1000位行業(yè)領(lǐng)軍人物,,覆蓋傳媒創(chuàng)新,、VC/PE、信息服務(wù),、金融科技,、交易體系、戰(zhàn)略新興等方向,。
科創(chuàng)板日報(bào)《連線創(chuàng)始人/CEO》是由《安安訪談錄》出品的針對創(chuàng)新創(chuàng)業(yè)型未上市企業(yè)創(chuàng)始人的訪談欄目,,以企業(yè)創(chuàng)始人/CEO的訪談為一手信源,讓成長中的創(chuàng)業(yè)公司走入公眾和市場視野,,并發(fā)掘最新技術(shù)和產(chǎn)業(yè)趨勢,。
本期訪談人物:
天壤創(chuàng)始人兼首席執(zhí)行官 薛貴榮
“在一些基礎(chǔ)工作被AI替代的同時(shí),也會衍生諸如人工智能培訓(xùn)師等新興行業(yè),。當(dāng)前中國版ChatGPT要實(shí)現(xiàn)追趕,,最大的挑戰(zhàn)在于追趕時(shí)間差?!?/p>
▍個人介紹
天壤創(chuàng)始人兼首席執(zhí)行官,,人工智能與大數(shù)據(jù)領(lǐng)域科學(xué)家,國家科技部云計(jì)算專家組成員,,原阿里媽媽首席數(shù)據(jù)科學(xué)家,。首批全國優(yōu)秀博士論文獎獲得者,國內(nèi)第一位在全球搜索領(lǐng)域頂級會議ACM SIGIR上發(fā)表論文的科學(xué)家,,全球遷移學(xué)習(xí)領(lǐng)域開創(chuàng)者和深度強(qiáng)化學(xué)習(xí)頂尖專家,。薛貴榮博士曾在世界頂級會議NIPS、ICML,、SIGKDD,、SIGIR、WWW與世界頂級刊物ACM TOIS,、ACM TIST等發(fā)表論文70余篇,,擁有專利十余項(xiàng),論文引用達(dá)9000+,。
▍第一標(biāo)簽
國內(nèi)深度強(qiáng)化學(xué)習(xí)領(lǐng)域開拓者
▍公司簡介
天壤成立于2016年,,是專注于通用智能研究(AGI)的創(chuàng)新企業(yè),致力于解決人工智能的可用性和易用性問題,,實(shí)現(xiàn)以最小成本,、最快速度賦能業(yè)務(wù)場景,,讓智能像水電煤一樣便捷。
目前,,已經(jīng)廣泛地服務(wù)于城市運(yùn)行,、交通治理、金融保險(xiǎn),、商業(yè)零售,、生物科技等場景。希望為人類社會的可持續(xù)發(fā)展帶來突破性進(jìn)展,,讓社會更便捷,、更聰明、更智慧,。
大模型近幾年持續(xù)火熱,薛貴榮認(rèn)為,,ChatGPT能夠脫穎而出的根本原因是強(qiáng)化學(xué)習(xí)技術(shù)的創(chuàng)新和高質(zhì)量數(shù)據(jù)積累的疊加效應(yīng),。
“先預(yù)訓(xùn)練一個大模型,然后用強(qiáng)化學(xué)習(xí)去‘教導(dǎo)’模型,,讓模型生產(chǎn)出足夠多的新數(shù)據(jù),,進(jìn)行‘自學(xué)習(xí)’。就像一個小孩對應(yīng)一個教導(dǎo)老師,,不僅學(xué)習(xí)知識,,還學(xué)習(xí)方法,解決問題的能力就可以持續(xù)提升,。這才能代表真正的人工智能,。”
薛貴榮指出,,現(xiàn)如今的所有界面可能都會被重構(gòu),,最終將變成人類通過AI和數(shù)字世界進(jìn)行自然語言交流,可以直接向機(jī)器發(fā)送指令,,解決問題,。
在2016年創(chuàng)立天壤之前,薛貴榮曾就職于阿里巴巴,,先后任職阿里媽媽大數(shù)據(jù)中心負(fù)責(zé)人,、阿里媽媽首席數(shù)據(jù)科學(xué)家等職務(wù),負(fù)責(zé)研發(fā)了阿里搜索引擎等平臺,。
作為上海交通大學(xué)計(jì)算機(jī)系副教授,,薛貴榮的研究方向主要為機(jī)器學(xué)習(xí)、信息檢索,、互聯(lián)網(wǎng)營銷,、大規(guī)模數(shù)據(jù)分析和分布式計(jì)算,,在世界頂級會議NIPS等發(fā)表論文70余篇,擁有專利十余項(xiàng),。
談及當(dāng)下ChatGPT所引領(lǐng)的人工智能熱潮,,薛貴榮認(rèn)為未來兩年,會看到AI應(yīng)用的極度爆發(fā),,人工智能技術(shù)將廣泛,、深刻地改變各行各業(yè),并將帶來人機(jī)交互方式的巨大變革,,所有的應(yīng)用和平臺要基于ChatGPT框架重新開發(fā),。
“在一些基礎(chǔ)工作被AI替代的同時(shí),也會衍生諸如人工智能培訓(xùn)師等新興行業(yè),。當(dāng)前中國版ChatGPT要實(shí)現(xiàn)追趕,,最大的挑戰(zhàn)在于追趕時(shí)間差。”薛貴榮說,。
01
——————————
做中國版ChatGPT 算法創(chuàng)新和高質(zhì)量的數(shù)據(jù)缺一不可
對于ChatGPT熱潮背后的推動力,,薛貴榮認(rèn)為,首先是算力的提升,,其次是算法的躍遷,。Transformer把自然語言模型的上下文之間關(guān)系的學(xué)習(xí)能力,提升了新的臺階,。
“過去基于卷積的神經(jīng)網(wǎng)絡(luò)依賴大量數(shù)據(jù),,通過一層一層網(wǎng)絡(luò)的學(xué)習(xí),掌握如何把一個概念與另一個概念相關(guān)聯(lián),。但這種方式傳遞過程中往往容易產(chǎn)生信息的丟失,。Transformer模型出現(xiàn)后,針對某兩個概念,,機(jī)器可以更迅速、準(zhǔn)確地建立關(guān)系的連接,。這種方式更接近于我們?nèi)祟惤鉀Q問題的方式,,可以考慮更復(fù)雜的事情。
同時(shí),,ChatGPT引入了強(qiáng)化學(xué)習(xí)機(jī)制,,加速推動了通用人工智能的發(fā)展。
“在過去,,標(biāo)數(shù)據(jù)是一個很困難的事兒,,特別是標(biāo)這么大的規(guī)模。如今的ChatGPT基于大模型學(xué)到的知識,,并通過人類的反饋進(jìn)行訓(xùn)練優(yōu)化,。通過人的指導(dǎo),,不斷告訴AI,這么回答是錯的,、這么回答是很有條理的,。讓AI盡可能地掌握與人類進(jìn)行溝通的‘技能’,以保證AI能夠像人類一樣思考和回答問題,,并和人類保持相似的價(jià)值觀,。”
隨著ChatGPT帶動人工智能產(chǎn)業(yè)成長,,引起新一輪全球科技競賽,。中國的ChatGPT究竟該如何追趕?薛貴榮表示,,國內(nèi)廠商要不惜代價(jià)地迎頭追趕,,現(xiàn)在最重要的是追趕時(shí)間差。ChatGPT的智能化程度指數(shù)級增長且與日俱增,。其最終的迭代信息差和發(fā)展高度決定了我國與國外的平均智商差,。
“大模型近幾年持續(xù)火熱,ChatGPT能夠脫穎而出的根本原因是強(qiáng)化學(xué)習(xí)技術(shù)的創(chuàng)新和高質(zhì)量數(shù)據(jù)積累的疊加效應(yīng),。第一,,只有基于深度強(qiáng)化學(xué)習(xí)體系,模型才會有更好的反饋機(jī)制和價(jià)值判斷標(biāo)準(zhǔn),,才能掌握更多優(yōu)質(zhì)數(shù)據(jù)和答案,,才更逼近人類智能。第二,,只有對語料數(shù)據(jù)的抓取足夠充分,,實(shí)現(xiàn)規(guī)模、深度,、廣度的全覆蓋,,才能提升高質(zhì)量數(shù)據(jù)密度,訓(xùn)練出好的大模型,。要實(shí)現(xiàn)中國的ChatGPT大模型,,這兩點(diǎn)缺一不可,而國內(nèi)廠商目前在這兩方面的探索還有較大提升空間,?!?/p>
在模型方面,自然語言處理的兩大路線分別為谷歌BERT和OpenAI的GPT系列,,兩者一直處于競爭狀態(tài),。此前,BERT模型的表現(xiàn)更好,,也導(dǎo)致國內(nèi)企業(yè)大多追隨的是谷歌BERT路線,,國內(nèi)的模型面臨技術(shù)路線的調(diào)整,。
02
——————————
每個人都將擁有AI大腦
作為國家科技部云計(jì)算專家組成員,薛貴榮是國內(nèi)第一位在全球搜索領(lǐng)域頂級會議ACM SIGIR上發(fā)表論文的科學(xué)家,。之后,,也曾加入阿里巴巴,負(fù)責(zé)研發(fā)阿里全網(wǎng)搜索引擎,。
2016年離開阿里創(chuàng)立天壤后,,薛貴榮堅(jiān)定了通用人工智能的探索道路?!白屆總€人都有一個AI大腦,,是我們一直以來所堅(jiān)持的方向,也是我們最大的目標(biāo),?!?/p>
迄今,薛貴榮帶領(lǐng)團(tuán)隊(duì)先后在AI圍棋,、交通,、生物科技等領(lǐng)域開展探索,研發(fā)了AI圍棋TRGo,、蛋白質(zhì)結(jié)構(gòu)預(yù)測系統(tǒng)TRFold,,以及國內(nèi)首個城市級交通調(diào)度系統(tǒng)TRTraffic、蛋白質(zhì)設(shè)計(jì)TRDesign等多個大模型,。
薛貴榮向《科創(chuàng)板日報(bào)》記者坦言,,在創(chuàng)業(yè)過程中曾面臨中文版ChatGPT一樣的難題,即有標(biāo)注的數(shù)據(jù)量不夠,。如果沒有高質(zhì)量的數(shù)據(jù),,很難把技術(shù)做深。為此,,天壤很早地就在實(shí)踐中引入了基于強(qiáng)化學(xué)習(xí)的數(shù)據(jù)增強(qiáng)機(jī)制,。
“我們做強(qiáng)化學(xué)習(xí)在國內(nèi)是非常早的。2016年我們做AI圍棋的時(shí)候,,用兩個機(jī)器人對抗的方法來生成大量的棋譜數(shù)據(jù),,并通過優(yōu)勝劣汰的方式迭代優(yōu)化模型。那時(shí)候我們就發(fā)現(xiàn)用強(qiáng)化學(xué)習(xí)對模型的效果提升作用非常巨大,,這個發(fā)現(xiàn)對當(dāng)時(shí)的我們來說非常震撼,也證明我們找對了路子,?!?/p>
薛貴榮認(rèn)為,生成高質(zhì)量數(shù)據(jù)的能力是天壤的優(yōu)勢,。
“后來這套方法論我們在智能交通領(lǐng)域進(jìn)行應(yīng)用,。路上的信號燈基本上都是靠人力調(diào)控,,調(diào)地好壞沒有很客觀的評價(jià)標(biāo)準(zhǔn)。同時(shí)信號燈又涉及上下游路口聯(lián)調(diào),,流量24小時(shí)都在動態(tài)變化,,要獲取訓(xùn)練數(shù)據(jù)非常復(fù)雜。我們搭建交通模擬器來生成數(shù)據(jù),,通過強(qiáng)化學(xué)習(xí)不斷的進(jìn)行模型的學(xué)習(xí)和數(shù)據(jù)生成,,從而獲得高質(zhì)量的交通信號燈調(diào)控模型。
薛貴榮透露,,在做蛋白質(zhì)研究時(shí),,同樣采用了強(qiáng)化學(xué)習(xí)來進(jìn)行數(shù)據(jù)增強(qiáng)?!跋扔媚P皖A(yù)測結(jié)果,,然后再把預(yù)測好的數(shù)據(jù)投喂給模型訓(xùn)練,用數(shù)據(jù)增強(qiáng)的方式讓模型質(zhì)量有了大幅度的提升,。經(jīng)過幾個大的復(fù)雜場景的實(shí)踐,,我們研究大模型訓(xùn)練的路線越來越通用,也形成了統(tǒng)一的思路,?!?/p>
“先預(yù)訓(xùn)練一個大模型,然后用強(qiáng)化學(xué)習(xí)去‘教導(dǎo)’模型,,讓模型生產(chǎn)出足夠多的新數(shù)據(jù),,進(jìn)行‘自學(xué)習(xí)’。就像一個小孩對應(yīng)一個教導(dǎo)老師,,不僅學(xué)習(xí)知識,,還學(xué)習(xí)方法,解決問題的能力就可以持續(xù)提升,。這才能代表真正的人工智能,。”薛貴榮總結(jié),。
從科學(xué)家變成創(chuàng)業(yè)者,,薛貴榮直言這條路上確實(shí)荊棘重重。
“創(chuàng)業(yè)的關(guān)鍵,,還是要有核心技術(shù),,并且靠核心技術(shù)能夠帶動商業(yè)。我覺得在國內(nèi),,創(chuàng)業(yè)的門檻要足夠高,,才能有機(jī)會。”
03
——————————
“這兩年AI應(yīng)用會極度爆發(fā),,沖擊所有行業(yè)”
對未來人工智能的發(fā)展,,薛貴榮表達(dá)了樂觀的態(tài)度。
“這兩年AI應(yīng)用會爆發(fā),,而且會極度爆發(fā),。我覺得對所有的行業(yè)都會有沖擊。首當(dāng)其沖是客服會被顛覆,,普通的律師,、財(cái)務(wù)、人力等工作可能也會被替代,。以后,,人類要學(xué)會和機(jī)器一起工作,這是競爭力所在,。機(jī)器將承擔(dān)絕大部分基礎(chǔ)性的工作,,人類主要做好‘指導(dǎo)’的角色,并把精力投入到更有創(chuàng)造性的事情上,?!?/p>
在替代一些基礎(chǔ)工作的同時(shí),AI也將催生新的行業(yè),,比如人工智能培訓(xùn)師,。
“AI生產(chǎn)內(nèi)容的組織方式很重要。比如,,讓AI提取財(cái)報(bào)的核心數(shù)據(jù),,需要依賴人類給他指令,告訴它重點(diǎn)是什么,。將來會’提問題’是一項(xiàng)很重要的能力,。你問的問題越有挑戰(zhàn),越能持續(xù)幫助AI訓(xùn)練,,升級AI應(yīng)用,,AI回答問題也將更加準(zhǔn)確、全面,。這在未來幾年會是一個很大的行業(yè),。”
ChatGPT所引領(lǐng)的這波人工智能熱潮,,也會帶來人機(jī)交互方式的巨大變革,,所有的應(yīng)用和平臺要基于ChatGPT框架重新開發(fā)。
“ChatGPT的成功不僅僅是新一代聊天機(jī)器人的突破,,更是人工智能對整個信息產(chǎn)業(yè)帶來的革命,,將帶來全要素生產(chǎn)率的極速提升。基于ChatGPT的全新的交互接口,,所有的應(yīng)用、平臺,、軟件將全部重新開發(fā),,代替以往Windows視窗作業(yè)系統(tǒng)?!?/p>
薛貴榮進(jìn)一步解釋,,“現(xiàn)如今的所有界面可能都會被重構(gòu),最終將變成人類通過AI和數(shù)字世界進(jìn)行自然語言交流,??梢灾苯酉驒C(jī)器發(fā)送指令,解決問題,。人和數(shù)字世界的通道徹底被打通,,AI將變得更加實(shí)用。你可以直接跟AI交流,,來完成一個客戶email的回復(fù),,完成一個廣告策劃的文案,也可以完成會議的關(guān)鍵內(nèi)容整理,,獲取財(cái)報(bào)的關(guān)鍵數(shù)據(jù),。他會變成你個人的一個AI助手。越多的交流,,他就會越能明白你的意圖,,幫你解決各類問題?!?/p>
除了工作場景,,行業(yè)和企業(yè)級的應(yīng)用,也將被完全顛覆,?!安辉偈莻鹘y(tǒng)的交互方式,而是直接給AI下指令:把招聘需求,、大量文稿翻譯,,面試和財(cái)務(wù)報(bào)告的整理等等?!?/p>
當(dāng)然,,這背后都需要大模型的支撐。薛貴榮認(rèn)為,,未來模型會進(jìn)一步細(xì)分,,除了通用模型外,還會衍生針對不同細(xì)分領(lǐng)域的行業(yè)模型,以及企業(yè)內(nèi)部模型,、個人模型等等,。
“總之ChatGPT讓我們看到大模型有希望實(shí)現(xiàn)通用人工智能。未來針對某個場景有Best Model(最佳模型),,每個行業(yè),、每個企業(yè)都需要有一個ChatGPT,再結(jié)合個人模型,。其中,,個人模型里會包括你的基礎(chǔ)信息、喜好偏向等,,便于AI更準(zhǔn)確地為你提供個性化服務(wù),。”
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1010379.html
溫馨提示:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議,。