2024年2月16日,,OpenAI宣布推出全新的生成式人工智能模型Sora,。Sora可以根據(jù)文本指令直接生成長達60秒的視頻,包括精細的背景,、復雜的多角度鏡頭和富有情感的多個角色,。OpenAI表示,Sora是能夠理解和模擬現(xiàn)實世界的模型的基礎(chǔ),,這一能力將是實現(xiàn)AGI(通用人工智能)的重要里程碑,?!渡墒饺斯ぶ悄堋芬粫到y(tǒng)介紹了生成式AI所帶來的震撼,以及生成式人工智能的內(nèi)在邏輯與應(yīng)用,,并將其與產(chǎn)業(yè)發(fā)展,、與實際相結(jié)合?!蹲x+》周刊記者專訪該書作者,、人工智能商業(yè)化專家、PayPal全球數(shù)據(jù)科學平臺創(chuàng)始負責人丁磊,。2015年回國,、一直在互聯(lián)網(wǎng)領(lǐng)域工作的丁磊表示,就AI人才來說,,中國的人才不比美國少,中國要想在AI競爭中快速占據(jù)有利位置,不妨加快布局,,尊重模型訓練本身的規(guī)律,,用客觀、全面的AI思維,,去迎接這一領(lǐng)域的挑戰(zhàn),。丁磊臨危受命,實現(xiàn)AI的商業(yè)落地當丁磊還是一個高中生時,,他就非常清楚自己未來的發(fā)展方向了,。丁磊說,這是源自自己對機器人的喜愛,。當時國內(nèi)高校并沒有開設(shè)人工智能的相關(guān)專業(yè),,于是他選擇一個離AI最近的專業(yè),“那就是計算機”,。高中畢業(yè)后,,丁磊被保送進入浙江大學計算機學院。一入學,,他就主動尋找研究AI方向的導師,,他的目的非常明確,就是要學習AI,。丁磊在這方面做出了十足的努力,。他跟隨導師研究自然語言處理中的文本分類問題,在本科階段就發(fā)表了一篇國內(nèi)核心期刊的論文,。本科畢業(yè)后,,丁磊在國外繼續(xù)深造博士學位,研究方向為機器學習和計算機視覺,。他心中一直有著堅定的方向——認定了研究AI,,沒有任何猶豫。丁磊是PayPal 2012年成立數(shù)據(jù)科學部門時的創(chuàng)始數(shù)據(jù)科學家之一,。然而,,丁磊他們起初的實驗并不順利,折騰了一年,,PayPal最開始的數(shù)據(jù)科學團隊,,并沒有找到自己在商業(yè)世界中的位置。一年后,,領(lǐng)隊黯然離職,。“當時團隊遇到的最大問題,,是數(shù)據(jù)科學在公司的落地,?!彼貞洠m然第一年出現(xiàn)了一些波折,,但PayPal公司在數(shù)據(jù)科學上的戰(zhàn)略方向并沒有改變,。丁磊這時“臨危受命”,重新組建了新的團隊——PayPal消費者數(shù)據(jù)科學部,。在他看來,,數(shù)據(jù)科學之前落地失敗的原因主要有兩個:一方面是商業(yè)與數(shù)據(jù)科學本身的割裂,“也就是說數(shù)據(jù)科學帶來的收益不能立刻就在商業(yè)中體現(xiàn)出來”,;另一方面是數(shù)據(jù)科學的研究沒有產(chǎn)品化,,單個項目的成本過高。在設(shè)計這個平臺的時候,,丁磊的最終目的是希望它能實現(xiàn)對商業(yè)項目的部分自動化決策,,所以也稱其為“AI(人工智能)平臺”。努力的背后終有體現(xiàn),,丁磊的想法成功了,。PayPal用了兩年的時間成功建立了自己的AI平臺。這個平臺能夠跟海量的底層數(shù)據(jù)銜接,,面對需求能夠自動地提出解決方案,。憑借這個項目,丁磊成功實現(xiàn)了AI的工程化商業(yè)落地,。一直到現(xiàn)在,,這都是一項非常領(lǐng)先的AI業(yè)務(wù)創(chuàng)新案例。這個平臺為PayPal帶來了成倍數(shù)的客戶增長,,并且至今仍在使用,。AI將會成為行業(yè)的決策引擎這些年,丁磊始終沉浸在鉆研AI的世界里,。他認為,,數(shù)據(jù)科學分為三個階段:1.0的時候是簡單的事后數(shù)據(jù)分析,例如報表等,;2.0則是利用更為完備的查詢工具和統(tǒng)計方法,,輔助業(yè)務(wù)決策;到3.0的時候,,就是通過AI,、大數(shù)據(jù)等方法進行預測分析,進而做出決策,。2015年,,丁磊回到中國發(fā)展。國內(nèi)日新月異的數(shù)據(jù)科學環(huán)境,,讓他看到了更廣闊的市場前景,?!耙膊皇撬蓄I(lǐng)域都適合使用AI”,在丁磊看來,,滿足大規(guī)模落地商業(yè)化AI,,需要具備兩個先決條件。首先是數(shù)據(jù)的積累,,數(shù)據(jù)的數(shù)量和質(zhì)量直接決定了AI發(fā)展基礎(chǔ)是否牢固。AI平臺的底層是數(shù)據(jù),,數(shù)據(jù)的流通和更新直接影響著上層機器學習,、圖像語音處理等技術(shù)的使用效果。其次,,就是所在領(lǐng)域的商業(yè)問題是否清晰,,如果問題不夠明確,也很難用AI來處理,。丁磊為AI繪制了一份商業(yè)版圖,,“如果橫軸是行業(yè),縱軸是職能,,AI現(xiàn)在只是填充了其中非常小的一部分”,。在這個版圖中,零售,、金融,、制造、醫(yī)療,、教育等是橫軸,,代表不同的行業(yè)領(lǐng)域;營銷,、風控,、安全等是縱軸,代表不同的職能方向,。二者共同構(gòu)成了一個二維商業(yè)矩陣,,對于行業(yè)中的相關(guān)職能,AI都可以探索相關(guān)應(yīng)用場景,?!耙院蟮男袠I(yè)將要變成AI驅(qū)動。AI會成為行業(yè)的決策引擎,,取代的是在戰(zhàn)術(shù)層面上需要人工干預的場景,,AI能夠持續(xù)有效地讓企業(yè)在最佳狀態(tài)下運行?!倍±诒硎?,“而且AI帶來的效果不僅是‘優(yōu)化’,而是革命性的,、成倍數(shù)的增長,,這才是AI的能力,真正為行業(yè)賦能,。”
《生成式人工智能》丁磊 著 中信出版集團【訪談】AI的世界理解力還很低讀+:近日掀起科技熱潮的Sora被稱作“世界模擬器”。相比去年的ChatGPT,,Sora帶來的震撼和沖擊似乎更為劇烈,這是為什么,?丁磊:有研究聲稱隨著越來越多人使用,,大模型似乎變笨了,甚至還出現(xiàn)了“幻覺”,。出現(xiàn)這種問題的主要原因是目前主流的生成式模型仍然缺少對于物理世界的理解,,以至于對于一個正常人來說非常容易解答的問題,在大模型這里卻無法給出正確的輸出,。人腦認識事物的過程類似一個模型,。從認識論的角度來看,人腦認識的過程中會逐漸形成“關(guān)于世界的模型”,。人的主觀知識并不一定從一開始就符合現(xiàn)實規(guī)律,,但通過不斷的實踐和不斷的比較后,人們調(diào)整修正主觀認識,,以減少以往思維模型預測與實踐之間的差異,。這種調(diào)整機制可以使得人腦關(guān)于世界的模型更接近真理。打個比方,,體育運動是人類對物理世界認知和學習過程的體現(xiàn),。以乒乓球運動為例,運動員一開始能掌握最簡單的推,、攻技巧,,對于常規(guī)的來球,他們一般都能正常應(yīng)對,,回球路線也符合自己的預期,。隨著來球的速度、旋轉(zhuǎn)的變化,,運動員發(fā)現(xiàn)以往的接球技巧很難完全應(yīng)對了,,他們回球時而下網(wǎng)、時而出臺,。運動員逐漸認知到,,通過調(diào)整球拍接球的力度和角度可以應(yīng)對不同的來球情況。隨著接觸到的來球情況變得多樣,,大腦里就會構(gòu)建越來越復雜的“世界模型”,,之后在賽場上無論遇到什么情況,,越來越應(yīng)對自如。這就是人類的“世界模型”認知和學習的過程,。Sora的出現(xiàn)讓我們更加清晰地認識到了這個問題,,也為生成式AI的未來發(fā)展提供了方向,就是讓大模型認識和學習物理世界,,建立起大模型與物理世界的聯(lián)通,。這必將帶來AI新的應(yīng)用和突破。所以,,看到Sora的出現(xiàn)以后,,有人認為我們實現(xiàn)通用人工智能的時間也被縮短了——當然,我們現(xiàn)在沒法預判多長時間以后會實現(xiàn)通用的人工智能,,但是大家感覺時間線上似乎是縮短了。讀+:有人將Sora視為走向通用人工智能的重要里程碑,,您怎么看,?對于創(chuàng)業(yè)者和行業(yè)來講,會引發(fā)“地震”嗎,?丁磊:Sora帶給人們的震撼是,,它似乎通過學習,不斷締造物理場景下的“知識體系”,,通過融匯這些知識,,生成高質(zhì)量的視頻內(nèi)容,給人類帶來以假亂真的視覺感受,。當然,,如果我們以“世界模型”的標準來重新審視目前的生成結(jié)果,Sora距離真正意義上的“世界模型”還有一段不小的距離,。一方面,,Sora在處理復雜場景和物理效果時仍然存在一些不足。例如,,當場景中涉及多個物體的交互或復雜的物理運動時,,Sora可能會出現(xiàn)失誤或偏差。另一方面,,Sora主要依賴于大量的訓練數(shù)據(jù)來學習視頻的生成規(guī)律,,這種方式雖然有效但在一定程度限制了其在新場景下的泛化能力。Sora讓我們看到了AI形成“世界模型”的影子,,一旦AI與物理世界建立了聯(lián)通,,學習到了“世界模型”,AI的推理和預測能力將實現(xiàn)突破,,這將在很多應(yīng)用場景和專業(yè)領(lǐng)域里大有可為,。這樣的AI能夠執(zhí)行復雜任務(wù)和操作,,甚至能夠模仿人類智能的行為,最終實現(xiàn)通用人工智能,。Sora帶給我們的不僅是視頻生成領(lǐng)域這么一個應(yīng)用,,更多的是我們的大模型是需要具有對世界的理解能力的,我想這才是它帶給我們更新的思考,?!爸袊鍻penAI”值得期待讀+:人工智能技術(shù)正在加速度發(fā)展。未來,,類似Sora這樣顛覆傳統(tǒng)認知的技術(shù)創(chuàng)新是否會越來越多,?所謂的人工智能奇點真的會來嗎?丁磊:首先,,對于人工智能奇點會不會來,,我是持有謹慎樂觀態(tài)度的。AI短期內(nèi)出現(xiàn)很多奇跡,,但要真正被大家廣泛使用到實際中去,,并不會那么快。我們可以運用一些智能工具,,但并不能在短時間內(nèi)實現(xiàn)全方位的產(chǎn)業(yè)變革,。從長遠來看,我非??春萌斯ぶ悄艿陌l(fā)展,。在我看來,AI的發(fā)展是需要與行業(yè)相結(jié)合的——大的應(yīng)用無非兩類,,一類是消費類的應(yīng)用,,像我們用來購物、打車等消費類的應(yīng)用,;還有一類就是行業(yè)類的應(yīng)用,,比如跟零售業(yè)結(jié)合、跟傳播業(yè)結(jié)合,、跟制造業(yè)結(jié)合……前者需要一個大的網(wǎng)絡(luò)平臺,,這并不需要AI直接去解決問題;跟行業(yè)結(jié)合類的應(yīng)用,,包括媒體影視類的應(yīng)用中,,人工智能所發(fā)揮的影響會更大。當然,,這些行業(yè)本身還是需要更多的創(chuàng)意,,制作只是它中間的一個環(huán)節(jié)——AI跟其他行業(yè)的結(jié)合,更需要尊重行業(yè)發(fā)展的規(guī)律。所以,,回到那個問題,,你問我人工智能奇點會不會很快到來,我覺得不會,,但它一定會到來,。我們要尊重行業(yè)的發(fā)展規(guī)律,要尊重人工智能技術(shù)的發(fā)展規(guī)律,,這樣才會有一個更加合理的預判,。讀+:下一個AI元創(chuàng)新會發(fā)生在中國嗎?丁磊:我曾在AI領(lǐng)域有20多年的研究和工作經(jīng)驗,。在硅谷工作多年,,我非常了解為什么硅谷會出現(xiàn)OpenAI及奧特曼這樣的人物——是硅谷的“工程師文化基因”造就了他們。對于AI領(lǐng)域來說,,不能沿用互聯(lián)網(wǎng)公司的“養(yǎng)雞模式”,,而是得用“養(yǎng)娃模式”來研發(fā)產(chǎn)品。實際上,,美國真正專注通用人工智能研發(fā)的知名公司也就兩家——OpenAI以及谷歌母公司Alphabet下設(shè)的人工智能實驗室DeepMind,。就目前披露的信息看,奧特曼個人能力非常強,,不僅懂技術(shù),也懂商業(yè)運作,,OpenAI在運營過程中也鮮少受股東制約,。OpenAI是長在美國硅谷重視工程師地位的文化土壤里,有著強大的“工程師文化基因”,,簡單說就是工程師可以主導研發(fā),,擁有更大自主性,發(fā)揮創(chuàng)造性的空間更大,。但是OpenAI也是一個很稀有的物種,,在美國可能找不到第二家。為什么谷歌等大公司目前在人工智能領(lǐng)域的研發(fā),,都很難超越OpenAI,?一個關(guān)鍵因素就是GPT是一個新領(lǐng)域,訓練這么大一個模型,,難度不亞于造火箭或無人車,。打個比方,包括谷歌在內(nèi)的現(xiàn)代公司研發(fā)產(chǎn)品,,采用的是“養(yǎng)雞模式”,,公司會將“養(yǎng)雞”拆成不同的細分任務(wù),多部門人員各自負責具體業(yè)務(wù),。而訓練GPT模型是“養(yǎng)娃模式”,,它反而不需要那么多老師,,核心人物只要少數(shù)。也就是說,,它很難拆分成完全獨立的任務(wù),,必須有父母站在全局角度,親自教授培養(yǎng)孩子,。訓練 GPT模型本質(zhì)是一個很難拆解的事,,需要公司領(lǐng)導層在技術(shù)、業(yè)務(wù),,甚至資本方面都是專家,。另一個簡單的例子,是美國AI繪畫工具Midjourney,,它是由一家獨立研究實驗室開發(fā)出來的,。包括創(chuàng)始人大衛(wèi)·霍爾茲在內(nèi)僅有11個人,除了他和財務(wù),、法務(wù),,核心人員只有8位研發(fā)人員。我曾在IBM沃森研究中心有過一段工作經(jīng)歷,,IBM的沃森人工智能也曾陷入這種困境——有太多的人參與人工智能訓練,,資源太多、研發(fā)不聚焦,,造成該項目并沒有持續(xù)取得成績?,F(xiàn)在大家普遍對人工智能有一種焦慮,在我的新書《生成式人工智能》中,,比較詳細地介紹了哪些職業(yè)可能被取代,。在我看來,隨著中國經(jīng)濟發(fā)展,、產(chǎn)業(yè)升級,,“中國版OpenAI”的出現(xiàn)可以期待。就AI人才來說,,中國的人才不比美國少,,中國要想在AI競爭中快速占據(jù)有利位置,不妨加快布局,,尊重模型訓練本身的規(guī)律,,用客觀、全面的AI思維,,去迎接這一領(lǐng)域的挑戰(zhàn),。真正能被AI取代的工作很少讀+:AI帶來的改變深入各行各業(yè),它也帶來職業(yè)結(jié)構(gòu)的改變。您在《生成式人工智能》中提到,,我們身處在AI技術(shù)日益革新的世界中,,每一個人與其踟躕不定,不如就此前行,。作為普通人,,我們應(yīng)該如何前行?丁磊:人工智能模擬的是人腦,,但又不同于人腦,。人工智能與人腦的相似點在于通過對過往的分析習得規(guī)律、得出結(jié)論,,只是分析過往數(shù)據(jù)過程與人腦是不同的,。AI與人腦的競爭也在于“有跡可循”的規(guī)律,面對規(guī)律性強的工作,,AI會表現(xiàn)出優(yōu)勢,。因此不難得出結(jié)論:面對事情本身的、重復性高的,、有章可循的,、需要具體執(zhí)行的工作最易被人工智能取代;而需要面對人的,、對創(chuàng)新性要求高的,、情感交互多的、對專業(yè)經(jīng)驗要求多的,、需要展現(xiàn)情感交流價值和領(lǐng)導力的工作最難被人工智能取代,。其實,真正能夠被人工智能取代的工作很少,,但是絕大部分職業(yè)都會受到影響,。目前,,人工智能仍然只能完成部分工作,,在很多環(huán)節(jié)還只是起到輔助性作用。但是它會提升效率,,讓我們從重復性的工作中解脫出來,,對于部分技術(shù)要求低且重復勞動類的職業(yè),如數(shù)據(jù)錄入員,、電話客服等,,人工智能的工作表現(xiàn)已經(jīng)十分突出了。對于人工智能是否能真正取代我們的工作,,還應(yīng)該理性對待,,人工智能在很多領(lǐng)域帶來的是崗位數(shù)量的調(diào)整。人工智能也會在產(chǎn)業(yè)升級中創(chuàng)造新的產(chǎn)品和市場,從而創(chuàng)造出新的崗位和就業(yè)機會,,例如算法工程師,、人工智能產(chǎn)品經(jīng)理、提示詞工程師,、人工智能創(chuàng)意師,、人工智能調(diào)校師等職業(yè),這些職業(yè)的需求和數(shù)量也將逐步上升,。據(jù)普華永道2018年12月發(fā)布的《人工智能和相關(guān)技術(shù)對中國就業(yè)的凈影響》估算,,未來20年,中國現(xiàn)有約26%的工作崗位將被人工智能及相關(guān)技術(shù)取代,,但是人工智能及相關(guān)技術(shù)通過提高生產(chǎn)率和實際收入水平,,能夠產(chǎn)生約38%的新工作崗位,最終將凈增約12%的工作崗位,。因此,,人工智能帶來的是對職業(yè)結(jié)構(gòu)的影響。讀+:您在書中提到“君子生非異也,,善假于物也”,。您為何引用中國這句經(jīng)典名言來面對第四次科技革命的浪潮?丁磊:對我們每個個體而言,,應(yīng)該去提升自己的認知,,從而去和人工智能一起工作,我們要與AI共存,,去掌握它,、擁抱它。具體怎么做,?我有兩個建議,。首先,擁有AI思維,。所謂AI思維,,本質(zhì)是一種“數(shù)據(jù)驅(qū)動”的思維,對未知情況做出最佳預測,。不管是決策式AI模型還是生成式AI模型,,其基礎(chǔ)邏輯都是一致的,只靠邏輯和經(jīng)驗難以推導,,需要海量的數(shù)據(jù)進行訓練,,我們需要理解AI思維的底層邏輯,其基礎(chǔ)在于數(shù)據(jù),,核心在于模型,,實現(xiàn)在于算力,,具體應(yīng)用在于業(yè)務(wù)場景。擁有AI思維能夠避免經(jīng)驗主義帶來的主觀,、片面和限制,,具有積極的意義。其次,,擁有AI工具思維,。就是善于利用工具,通過工具賦能,,從而解決問題,、提高效率、解放勞動力,。而AI工具思維,,就是掌握數(shù)據(jù)化思維,掌握使用AI,、訓練AI的方法,。AIGC技術(shù)的發(fā)展已經(jīng)不可逆轉(zhuǎn),與其消極對待,,不如使之為我所用,。我們要理解AI的底層邏輯,在工作和生活中使用AI,,挖掘AI技術(shù)的工具價值,,并訓練AI具有更強的適配性,為我們的工作和生活帶來更大的便利,,將我們從繁雜的事務(wù)中解放出來,。未來,我們?nèi)巳硕伎梢允茿I的使用者和訓練師,。(長江日報記者馬夢婭)【編輯:張靖】更多精彩資訊請在應(yīng)用市場下載“大武漢”客戶端,,未經(jīng)授權(quán)請勿轉(zhuǎn)載,歡迎提供新聞線索,,一經(jīng)采納即付報酬,。24小時報料熱線:027-59222222。此文版權(quán)歸原作者所有,,若有來源錯誤或者侵犯您的合法權(quán)益,,您可通過郵箱與我們?nèi)〉寐?lián)系,,我們將及時進行處理,。郵箱地址:[email protected]
免責聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1092903.html
溫馨提示:投資有風險,入市須謹慎,。本資訊不作為投資理財建議,。