編者按:人工智能的炒作還是很熱,仿佛全自動(dòng)駕駛和比人聰明的人工智能就是幾年內(nèi)的事情了。但訓(xùn)練數(shù)據(jù)集擴(kuò)大帶來的回報(bào)正在遞減,,而用所述數(shù)據(jù)集所需的算力(能源,、成本)又呈指數(shù)級(jí)增長(zhǎng),再加上更高效的解決方案還沒有出現(xiàn)或進(jìn)入實(shí)用階段,,未來幾年人工智能的發(fā)展將面臨天花板,,別總想著指數(shù)發(fā)展。文章來自編譯,。
過去幾個(gè)月,,對(duì)人工智能的炒作已經(jīng)到了瘋狂的地步。什么特斯拉在一兩年內(nèi)就要實(shí)現(xiàn)全自動(dòng)駕駛了,,人工智能明年將會(huì)變得比人類更聰明了,,到 2040 年會(huì)有十億臺(tái)人工智能機(jī)器人取代人類工人了,這些還只是埃隆·馬斯克今年迄今為止對(duì)人工智能許下的??谥?。整個(gè)人工智能圈都充斥著這樣的預(yù)測(cè)和承諾,給人感覺人工智能的發(fā)展已走上不可阻擋的指數(shù)軌跡曲線上,,已經(jīng)到了我們?nèi)祟惛緹o法阻止的地步,。但是事實(shí)并非如此。要我說,,人工智能正開始觸碰到收益遞減的發(fā)展天花板,,從而令這些夸張的承諾變成一張廢紙。下面我會(huì)解釋的,。
要想理解這個(gè)問題,,我們得先了解一點(diǎn)人工智能的基本工作原理。現(xiàn)代人工智能運(yùn)用的是深度學(xué)習(xí)算法與人工神經(jīng)網(wǎng)絡(luò),,借此來發(fā)現(xiàn)數(shù)據(jù)當(dāng)中的趨勢(shì),。然后,人工智能就可以根據(jù)這些數(shù)據(jù)推斷或沿著同一趨勢(shì)線生成新的數(shù)據(jù),。這首先需要“訓(xùn)練”人工智能,,將大量數(shù)據(jù)喂給它進(jìn)行分析,讓它去發(fā)現(xiàn)這些趨勢(shì),。之后,,你就可以拋問題給人工智能來獲得輸出。這個(gè)基本概念為計(jì)算機(jī)視覺,、自動(dòng)駕駛汽車,、聊天機(jī)器人以及生成式人工智能提供了動(dòng)力。這個(gè)解釋有點(diǎn)簡(jiǎn)化了,,但現(xiàn)在我們只需要了解這些就夠了,。
過去幾年,,人工智能的能力有了顯著增強(qiáng)。這部分要?dú)w功于有了更好的編程和算法,。但 90% 要?dú)w功于用了更大的數(shù)據(jù)集對(duì)人工智能進(jìn)行訓(xùn)練,。從而使得人工智能可以更準(zhǔn)確地了解數(shù)據(jù)趨勢(shì),從而更準(zhǔn)確地生成結(jié)果,。但有個(gè)問題:我們正目睹相對(duì)于所需的數(shù)據(jù)和算力,,訓(xùn)練人工智能帶來的回報(bào)正在急劇遞減。
我們先從數(shù)據(jù)講起,。假設(shè)我們開發(fā)了一個(gè)簡(jiǎn)單的計(jì)算機(jī)視覺人工智能,,它可以識(shí)別出狗和貓,我們已經(jīng)用 100 只狗和貓的圖像和視頻對(duì)其進(jìn)行了訓(xùn)練,,它可以在 60% 的時(shí)間內(nèi)正確識(shí)別這些動(dòng)物,。如果我們將訓(xùn)練的圖像和視頻數(shù)量增加一倍,達(dá)到 200 個(gè),,其識(shí)別率就會(huì)提高,,但只能略微提高到 65% 左右。如果我們?cè)俅螌⒂?xùn)練圖像和視頻增加一倍,,達(dá)到 400 個(gè),,那么其改進(jìn)將更加微乎其微,只能達(dá)到 67.5% 左右,。
這其中的部分原因在于,,如果你手頭的數(shù)據(jù)集比較小時(shí),相對(duì)于較大的數(shù)據(jù)集,,往里面添加一張新的訓(xùn)練圖像,,所提供的新數(shù)據(jù)會(huì)更多。不過,,這也是因?yàn)槿斯ぶ悄芴幚硇〉臄?shù)據(jù)集可以迅速建立新的連接與趨勢(shì),,因?yàn)樗恍枵业竭m用于幾個(gè)示例的趨勢(shì)即可。但隨著數(shù)據(jù)集的增長(zhǎng),,找到對(duì)整個(gè)數(shù)據(jù)集都適用的新趨勢(shì)和連接變得越來越難,。這些來自較更大數(shù)據(jù)集的新趨勢(shì)和連接讓人工智能變得更好、能力更強(qiáng),。因此,,隨著訓(xùn)練人工智能的收益遞減,我們看到將人工智能改進(jìn)到一定程度所需要的訓(xùn)練數(shù)據(jù)量急劇增加,。
但這里面還有一個(gè)問題。訓(xùn)練人工智能對(duì)算力的需求非常大,。人工智能必須將每個(gè)單獨(dú)的數(shù)據(jù)點(diǎn)與數(shù)據(jù)集所有其他數(shù)據(jù)點(diǎn)進(jìn)行比較,,這樣才能找到它們的關(guān)聯(lián)和趨勢(shì),。這意味著,每往人工智能訓(xùn)練數(shù)據(jù)庫添加一位數(shù)據(jù),,用這個(gè)數(shù)據(jù)庫訓(xùn)練人工智能所需的計(jì)算工作量都會(huì)呈指數(shù)級(jí)增長(zhǎng),。因此,就算你有能力獲取到訓(xùn)練這些不斷改進(jìn)的人工智能所需的大量數(shù)據(jù),,它所需的物理計(jì)算能力和能源最終也會(huì)增長(zhǎng)到難以為繼的地步,。
可悲的是,有證據(jù)表明,,我們現(xiàn)在正處在這樣一個(gè)階段:一方面訓(xùn)練數(shù)據(jù)集擴(kuò)大帶來的回報(bào)在遞減,,一方面用所述數(shù)據(jù)集所需的算力又呈指數(shù)級(jí)增長(zhǎng),這些都會(huì)給人工智能的發(fā)展制造剛性的上限,。
就拿 OpenAI 的旗艦人工智能產(chǎn)品 ChatGPT4 來說吧,,但它相對(duì)于 ChatGPT3 的改進(jìn)要小于 ChatGPT3 相對(duì)于 ChatGPT2 的改進(jìn),盡管它的準(zhǔn)確率提高了,,但仍然存在跟 ChatGPT3 一樣的幻覺與缺乏理解的問題,。雖說OpenAI 對(duì)自己的人工智能開發(fā)方式守口如瓶,但專家調(diào)查發(fā)現(xiàn),,ChatGPT3 使用的訓(xùn)練數(shù)據(jù)集比 ChatGPT2 大了 78 倍,,而ChatGPT4 所用的數(shù)據(jù)集比 ChatGPT3 要大 571 倍!可是,,盡管訓(xùn)練數(shù)據(jù)集的大小有了顯著提升,, 但ChatGPT4 仍然存在重大缺陷,大大限制了它的使用場(chǎng)景,。比方說,,還是不能信任它能寫出任何以事實(shí)為基礎(chǔ)的東西,因?yàn)樗匀辉诰幵焓聦?shí),。
有人估計(jì) ChatGPT4 的原始訓(xùn)練數(shù)據(jù)集有 45 TB 的純文本,。這意味著,下一次迭代要想取得 ChatGPT4 相對(duì)于 ChatGPT3 那樣的巨大進(jìn)步,,訓(xùn)練數(shù)據(jù)集需要達(dá)數(shù)萬 TB 之巨 ,。即便采用OpenAI 存疑的方法,獲取和準(zhǔn)備如此大量的純文本數(shù)據(jù)也很不切實(shí)際,。然而,,就算真用這個(gè)數(shù)據(jù)集來訓(xùn)練人工智能也可能要消耗大量能源,大到這種成本令人工智能變得完全不可行的地步,,那怕你是一家非營(yíng)利組織也不可行,。
這么說并不夸張。 OpenAI 首席執(zhí)行官山姆·阿爾特曼 (Sam Altman) 九層公開表示,,先進(jìn)的人工智能要想變得可行,,需要能源技術(shù)取得突破,,比如核聚變??杀氖?,就算我們確實(shí)實(shí)現(xiàn)了核聚變,在本世紀(jì)乃至下世紀(jì)這種技術(shù)也不太可能比我們目前的能源便宜,。事實(shí)上,,任何形式的能源都不會(huì)比我們目前所擁有的能源便宜得多。因此,,針對(duì)人工智能能源問題提出的解決方案具有很大的誤導(dǎo)性,。
這個(gè)觀點(diǎn)得到了一些非常嚴(yán)肅的研究的支持。馬薩諸塞大學(xué)阿默斯特分校曾做過一項(xiàng)研究,,他們分析了將圖像識(shí)別人工智能性能提高到準(zhǔn)確率達(dá) 95% 以上所需的計(jì)算和能源成本,。研究發(fā)現(xiàn),訓(xùn)練這樣一個(gè)模型將需要花費(fèi) 1000 億美元,,其所產(chǎn)生的碳排放量相當(dāng)于紐約市一個(gè)月的碳排放量,。請(qǐng)記住,這是針對(duì)仍有 5% 的時(shí)間會(huì)出現(xiàn)災(zāi)難性錯(cuò)誤的人工智能而言的,。該研究還強(qiáng)調(diào),,將準(zhǔn)確率提高到 99% 需要的成本和碳排放還會(huì)成倍增加。
這就是為什么特斯拉永遠(yuǎn)不會(huì)用當(dāng)前的方式開發(fā)全自動(dòng)駕駛汽車的原因所在,。他們的Autopilot和FSD只能通過這種人工智能計(jì)算機(jī)視覺來感知周圍的世界,,而FSD要想實(shí)現(xiàn)全自動(dòng)駕駛,其圖像識(shí)別精度需要接近100%的準(zhǔn)確度,。正如那項(xiàng)研究所表明那樣,,要想讓特斯拉的人工智能變得那么好,其所需要的資金也許遠(yuǎn)非特斯拉能負(fù)擔(dān)得起,。
換句話說,,除非人工智能行業(yè)能夠找到一種更高效的方法來提高訓(xùn)練人工智能以及計(jì)算負(fù)載的效率,否則就無法突破這個(gè)限制,,然后人工智能的發(fā)展就將完全停滯,。目前可能的解決方案即將出現(xiàn),比方說結(jié)合了模擬與量子技術(shù)的更高效的人工智能硬件,,以及需要訓(xùn)練數(shù)據(jù)集個(gè)更小的新的人工智能架構(gòu),。不過,這些概念仍處在起步階段,,距離應(yīng)用到現(xiàn)實(shí)世界可能還需要幾十年的時(shí)間,。
簡(jiǎn)而言之,大家得有個(gè)心理準(zhǔn)備,未來幾年人工智能的發(fā)展肯能會(huì)大幅低于預(yù)期,。
譯者:boxi,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1106394.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。