過(guò)去幾個(gè)月,,對(duì)人工智能的炒作已經(jīng)到了瘋狂的地步。什么特斯拉在一兩年內(nèi)就要實(shí)現(xiàn)全自動(dòng)駕駛了,,人工智能明年將會(huì)變得比人類(lèi)更聰明了,,到 2040 年會(huì)有十億臺(tái)人工智能機(jī)器人取代人類(lèi)工人了,這些還只是埃隆·馬斯克今年迄今為止對(duì)人工智能許下的??谥?。整個(gè)人工智能圈都充斥著這樣的預(yù)測(cè)和承諾,給人感覺(jué)人工智能的發(fā)展已走上不可阻擋的指數(shù)軌跡曲線上,,已經(jīng)到了我們?nèi)祟?lèi)根本無(wú)法阻止的地步,。但是事實(shí)并非如此,。要我說(shuō),人工智能正開(kāi)始觸碰到收益遞減的發(fā)展天花板,,從而令這些夸張的承諾變成一張廢紙,。下面我會(huì)解釋的。
要想理解這個(gè)問(wèn)題,,我們得先了解一點(diǎn)人工智能的基本工作原理?,F(xiàn)代人工智能運(yùn)用的是深度學(xué)習(xí)算法與人工神經(jīng)網(wǎng)絡(luò),借此來(lái)發(fā)現(xiàn)數(shù)據(jù)當(dāng)中的趨勢(shì),。然后,,人工智能就可以根據(jù)這些數(shù)據(jù)推斷或沿著同一趨勢(shì)線生成新的數(shù)據(jù)。這首先需要“訓(xùn)練”人工智能,,將大量數(shù)據(jù)喂給它進(jìn)行分析,,讓它去發(fā)現(xiàn)這些趨勢(shì)。之后,,你就可以拋問(wèn)題給人工智能來(lái)獲得輸出,。這個(gè)基本概念為計(jì)算機(jī)視覺(jué)、自動(dòng)駕駛汽車(chē),、聊天機(jī)器人以及生成式人工智能提供了動(dòng)力,。這個(gè)解釋有點(diǎn)簡(jiǎn)化了,但現(xiàn)在我們只需要了解這些就夠了,。
過(guò)去幾年,,人工智能的能力有了顯著增強(qiáng)。這部分要?dú)w功于有了更好的編程和算法,。但 90% 要?dú)w功于用了更大的數(shù)據(jù)集對(duì)人工智能進(jìn)行訓(xùn)練,。從而使得人工智能可以更準(zhǔn)確地了解數(shù)據(jù)趨勢(shì),從而更準(zhǔn)確地生成結(jié)果,。但有個(gè)問(wèn)題:我們正目睹相對(duì)于所需的數(shù)據(jù)和算力,,訓(xùn)練人工智能帶來(lái)的回報(bào)正在急劇遞減。
我們先從數(shù)據(jù)講起,。假設(shè)我們開(kāi)發(fā)了一個(gè)簡(jiǎn)單的計(jì)算機(jī)視覺(jué)人工智能,,它可以識(shí)別出狗和貓,我們已經(jīng)用 100 只狗和貓的圖像和視頻對(duì)其進(jìn)行了訓(xùn)練,,它可以在 60% 的時(shí)間內(nèi)正確識(shí)別這些動(dòng)物,。如果我們將訓(xùn)練的圖像和視頻數(shù)量增加一倍,達(dá)到 200 個(gè),,其識(shí)別率就會(huì)提高,,但只能略微提高到 65% 左右。如果我們?cè)俅螌⒂?xùn)練圖像和視頻增加一倍,達(dá)到 400 個(gè),,那么其改進(jìn)將更加微乎其微,,只能達(dá)到 67.5% 左右。
這其中的部分原因在于,,如果你手頭的數(shù)據(jù)集比較小時(shí),,相對(duì)于較大的數(shù)據(jù)集,往里面添加一張新的訓(xùn)練圖像,,所提供的新數(shù)據(jù)會(huì)更多,。不過(guò),這也是因?yàn)槿斯ぶ悄芴幚硇〉臄?shù)據(jù)集可以迅速建立新的連接與趨勢(shì),,因?yàn)樗恍枵业竭m用于幾個(gè)示例的趨勢(shì)即可,。但隨著數(shù)據(jù)集的增長(zhǎng),找到對(duì)整個(gè)數(shù)據(jù)集都適用的新趨勢(shì)和連接變得越來(lái)越難,。這些來(lái)自較更大數(shù)據(jù)集的新趨勢(shì)和連接讓人工智能變得更好,、能力更強(qiáng)。因此,,隨著訓(xùn)練人工智能的收益遞減,,我們看到將人工智能改進(jìn)到一定程度所需要的訓(xùn)練數(shù)據(jù)量急劇增加。
但這里面還有一個(gè)問(wèn)題,。訓(xùn)練人工智能對(duì)算力的需求非常大,。人工智能必須將每個(gè)單獨(dú)的數(shù)據(jù)點(diǎn)與數(shù)據(jù)集所有其他數(shù)據(jù)點(diǎn)進(jìn)行比較,這樣才能找到它們的關(guān)聯(lián)和趨勢(shì),。這意味著,,每往人工智能訓(xùn)練數(shù)據(jù)庫(kù)添加一位數(shù)據(jù),用這個(gè)數(shù)據(jù)庫(kù)訓(xùn)練人工智能所需的計(jì)算工作量都會(huì)呈指數(shù)級(jí)增長(zhǎng),。因此,,就算你有能力獲取到訓(xùn)練這些不斷改進(jìn)的人工智能所需的大量數(shù)據(jù),它所需的物理計(jì)算能力和能源最終也會(huì)增長(zhǎng)到難以為繼的地步,。
可悲的是,,有證據(jù)表明,我們現(xiàn)在正處在這樣一個(gè)階段:一方面訓(xùn)練數(shù)據(jù)集擴(kuò)大帶來(lái)的回報(bào)在遞減,,一方面用所述數(shù)據(jù)集所需的算力又呈指數(shù)級(jí)增長(zhǎng),,這些都會(huì)給人工智能的發(fā)展制造剛性的上限。
就拿 OpenAI 的旗艦人工智能產(chǎn)品 ChatGPT4 來(lái)說(shuō)吧,,但它相對(duì)于 ChatGPT3 的改進(jìn)要小于 ChatGPT3 相對(duì)于 ChatGPT2 的改進(jìn),盡管它的準(zhǔn)確率提高了,,但仍然存在跟 ChatGPT3 一樣的幻覺(jué)與缺乏理解的問(wèn)題,。雖說(shuō)OpenAI 對(duì)自己的人工智能開(kāi)發(fā)方式守口如瓶,但專家調(diào)查發(fā)現(xiàn),ChatGPT3 使用的訓(xùn)練數(shù)據(jù)集比 ChatGPT2 大了 78 倍,,而ChatGPT4 所用的數(shù)據(jù)集比 ChatGPT3 要大 571 倍,!可是,盡管訓(xùn)練數(shù)據(jù)集的大小有了顯著提升,, 但ChatGPT4 仍然存在重大缺陷,,大大限制了它的使用場(chǎng)景。比方說(shuō),,還是不能信任它能寫(xiě)出任何以事實(shí)為基礎(chǔ)的東西,,因?yàn)樗匀辉诰幵焓聦?shí)。
有人估計(jì) ChatGPT4 的原始訓(xùn)練數(shù)據(jù)集有 45 TB 的純文本,。這意味著,,下一次迭代要想取得 ChatGPT4 相對(duì)于 ChatGPT3 那樣的巨大進(jìn)步,訓(xùn)練數(shù)據(jù)集需要達(dá)數(shù)萬(wàn) TB 之巨 ,。即便采用OpenAI 存疑的方法,,獲取和準(zhǔn)備如此大量的純文本數(shù)據(jù)也很不切實(shí)際。然而,,就算真用這個(gè)數(shù)據(jù)集來(lái)訓(xùn)練人工智能也可能要消耗大量能源,,大到這種成本令人工智能變得完全不可行的地步,那怕你是一家非營(yíng)利組織也不可行,。
這么說(shuō)并不夸張,。 OpenAI 首席執(zhí)行官山姆·阿爾特曼 (Sam Altman) 九層公開(kāi)表示,先進(jìn)的人工智能要想變得可行,,需要能源技術(shù)取得突破,,比如核聚變??杀氖?,就算我們確實(shí)實(shí)現(xiàn)了核聚變,在本世紀(jì)乃至下世紀(jì)這種技術(shù)也不太可能比我們目前的能源便宜,。事實(shí)上,,任何形式的能源都不會(huì)比我們目前所擁有的能源便宜得多。因此,,針對(duì)人工智能能源問(wèn)題提出的解決方案具有很大的誤導(dǎo)性,。
這個(gè)觀點(diǎn)得到了一些非常嚴(yán)肅的研究的支持。馬薩諸塞大學(xué)阿默斯特分校曾做過(guò)一項(xiàng)研究,,他們分析了將圖像識(shí)別人工智能性能提高到準(zhǔn)確率達(dá) 95% 以上所需的計(jì)算和能源成本,。研究發(fā)現(xiàn),訓(xùn)練這樣一個(gè)模型將需要花費(fèi) 1000 億美元,,其所產(chǎn)生的碳排放量相當(dāng)于紐約市一個(gè)月的碳排放量,。請(qǐng)記住,,這是針對(duì)仍有 5% 的時(shí)間會(huì)出現(xiàn)災(zāi)難性錯(cuò)誤的人工智能而言的。該研究還強(qiáng)調(diào),,將準(zhǔn)確率提高到 99% 需要的成本和碳排放還會(huì)成倍增加,。
這就是為什么特斯拉永遠(yuǎn)不會(huì)用當(dāng)前的方式開(kāi)發(fā)全自動(dòng)駕駛汽車(chē)的原因所在。他們的Autopilot和FSD只能通過(guò)這種人工智能計(jì)算機(jī)視覺(jué)來(lái)感知周?chē)氖澜?,而FSD要想實(shí)現(xiàn)全自動(dòng)駕駛,,其圖像識(shí)別精度需要接近100%的準(zhǔn)確度。正如那項(xiàng)研究所表明那樣,,要想讓特斯拉的人工智能變得那么好,,其所需要的資金也許遠(yuǎn)非特斯拉能負(fù)擔(dān)得起。
換句話說(shuō),,除非人工智能行業(yè)能夠找到一種更高效的方法來(lái)提高訓(xùn)練人工智能以及計(jì)算負(fù)載的效率,,否則就無(wú)法突破這個(gè)限制,然后人工智能的發(fā)展就將完全停滯,。目前可能的解決方案即將出現(xiàn),,比方說(shuō)結(jié)合了模擬與量子技術(shù)的更高效的人工智能硬件,以及需要訓(xùn)練數(shù)據(jù)集個(gè)更小的新的人工智能架構(gòu),。不過(guò),,這些概念仍處在起步階段,距離應(yīng)用到現(xiàn)實(shí)世界可能還需要幾十年的時(shí)間,。
簡(jiǎn)而言之,,大家得有個(gè)心理準(zhǔn)備,未來(lái)幾年人工智能的發(fā)展肯能會(huì)大幅低于預(yù)期,。
譯者:boxi,。
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1101195.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。