編者按:人工智能的炒作還是很熱,仿佛全自動駕駛和比人聰明的人工智能就是幾年內(nèi)的事情了。但訓(xùn)練數(shù)據(jù)集擴(kuò)大帶來的回報正在遞減,,而用所述數(shù)據(jù)集所需的算力(能源,、成本)又呈指數(shù)級增長,再加上更高效的解決方案還沒有出現(xiàn)或進(jìn)入實(shí)用階段,,未來幾年人工智能的發(fā)展將面臨天花板,,別總想著指數(shù)發(fā)展。文章來自編譯,。
過去幾個月,,對人工智能的炒作已經(jīng)到了瘋狂的地步。什么特斯拉在一兩年內(nèi)就要實(shí)現(xiàn)全自動駕駛了,,人工智能明年將會變得比人類更聰明了,,到 2040 年會有十億臺人工智能機(jī)器人取代人類工人了,這些還只是埃隆·馬斯克今年迄今為止對人工智能許下的??谥?。整個人工智能圈都充斥著這樣的預(yù)測和承諾,給人感覺人工智能的發(fā)展已走上不可阻擋的指數(shù)軌跡曲線上,,已經(jīng)到了我們?nèi)祟惛緹o法阻止的地步,。但是事實(shí)并非如此。要我說,,人工智能正開始觸碰到收益遞減的發(fā)展天花板,,從而令這些夸張的承諾變成一張廢紙。下面我會解釋的。
要想理解這個問題,,我們得先了解一點(diǎn)人工智能的基本工作原理?,F(xiàn)代人工智能運(yùn)用的是深度學(xué)習(xí)算法與人工神經(jīng)網(wǎng)絡(luò),借此來發(fā)現(xiàn)數(shù)據(jù)當(dāng)中的趨勢,。然后,,人工智能就可以根據(jù)這些數(shù)據(jù)推斷或沿著同一趨勢線生成新的數(shù)據(jù)。這首先需要“訓(xùn)練”人工智能,,將大量數(shù)據(jù)喂給它進(jìn)行分析,,讓它去發(fā)現(xiàn)這些趨勢。之后,,你就可以拋問題給人工智能來獲得輸出,。這個基本概念為計(jì)算機(jī)視覺、自動駕駛汽車,、聊天機(jī)器人以及生成式人工智能提供了動力。這個解釋有點(diǎn)簡化了,,但現(xiàn)在我們只需要了解這些就夠了,。
過去幾年,人工智能的能力有了顯著增強(qiáng),。這部分要?dú)w功于有了更好的編程和算法,。但 90% 要?dú)w功于用了更大的數(shù)據(jù)集對人工智能進(jìn)行訓(xùn)練。從而使得人工智能可以更準(zhǔn)確地了解數(shù)據(jù)趨勢,,從而更準(zhǔn)確地生成結(jié)果,。但有個問題:我們正目睹相對于所需的數(shù)據(jù)和算力,訓(xùn)練人工智能帶來的回報正在急劇遞減,。
我們先從數(shù)據(jù)講起,。假設(shè)我們開發(fā)了一個簡單的計(jì)算機(jī)視覺人工智能,它可以識別出狗和貓,,我們已經(jīng)用 100 只狗和貓的圖像和視頻對其進(jìn)行了訓(xùn)練,,它可以在 60% 的時間內(nèi)正確識別這些動物。如果我們將訓(xùn)練的圖像和視頻數(shù)量增加一倍,,達(dá)到 200 個,,其識別率就會提高,但只能略微提高到 65% 左右,。如果我們再次將訓(xùn)練圖像和視頻增加一倍,,達(dá)到 400 個,那么其改進(jìn)將更加微乎其微,,只能達(dá)到 67.5% 左右,。
這其中的部分原因在于,如果你手頭的數(shù)據(jù)集比較小時,相對于較大的數(shù)據(jù)集,,往里面添加一張新的訓(xùn)練圖像,,所提供的新數(shù)據(jù)會更多。不過,,這也是因?yàn)槿斯ぶ悄芴幚硇〉臄?shù)據(jù)集可以迅速建立新的連接與趨勢,,因?yàn)樗恍枵业竭m用于幾個示例的趨勢即可。但隨著數(shù)據(jù)集的增長,,找到對整個數(shù)據(jù)集都適用的新趨勢和連接變得越來越難,。這些來自較更大數(shù)據(jù)集的新趨勢和連接讓人工智能變得更好、能力更強(qiáng),。因此,,隨著訓(xùn)練人工智能的收益遞減,我們看到將人工智能改進(jìn)到一定程度所需要的訓(xùn)練數(shù)據(jù)量急劇增加,。
但這里面還有一個問題,。訓(xùn)練人工智能對算力的需求非常大。人工智能必須將每個單獨(dú)的數(shù)據(jù)點(diǎn)與數(shù)據(jù)集所有其他數(shù)據(jù)點(diǎn)進(jìn)行比較,,這樣才能找到它們的關(guān)聯(lián)和趨勢,。這意味著,每往人工智能訓(xùn)練數(shù)據(jù)庫添加一位數(shù)據(jù),,用這個數(shù)據(jù)庫訓(xùn)練人工智能所需的計(jì)算工作量都會呈指數(shù)級增長,。因此,就算你有能力獲取到訓(xùn)練這些不斷改進(jìn)的人工智能所需的大量數(shù)據(jù),,它所需的物理計(jì)算能力和能源最終也會增長到難以為繼的地步,。
可悲的是,有證據(jù)表明,,我們現(xiàn)在正處在這樣一個階段:一方面訓(xùn)練數(shù)據(jù)集擴(kuò)大帶來的回報在遞減,,一方面用所述數(shù)據(jù)集所需的算力又呈指數(shù)級增長,這些都會給人工智能的發(fā)展制造剛性的上限,。
就拿 OpenAI 的旗艦人工智能產(chǎn)品 ChatGPT4 來說吧,,但它相對于 ChatGPT3 的改進(jìn)要小于 ChatGPT3 相對于 ChatGPT2 的改進(jìn),盡管它的準(zhǔn)確率提高了,,但仍然存在跟 ChatGPT3 一樣的幻覺與缺乏理解的問題,。雖說OpenAI 對自己的人工智能開發(fā)方式守口如瓶,但專家調(diào)查發(fā)現(xiàn),,ChatGPT3 使用的訓(xùn)練數(shù)據(jù)集比 ChatGPT2 大了 78 倍,,而ChatGPT4 所用的數(shù)據(jù)集比 ChatGPT3 要大 571 倍!可是,,盡管訓(xùn)練數(shù)據(jù)集的大小有了顯著提升,, 但ChatGPT4 仍然存在重大缺陷,,大大限制了它的使用場景。比方說,,還是不能信任它能寫出任何以事實(shí)為基礎(chǔ)的東西,,因?yàn)樗匀辉诰幵焓聦?shí)。
有人估計(jì) ChatGPT4 的原始訓(xùn)練數(shù)據(jù)集有 45 TB 的純文本,。這意味著,,下一次迭代要想取得 ChatGPT4 相對于 ChatGPT3 那樣的巨大進(jìn)步,訓(xùn)練數(shù)據(jù)集需要達(dá)數(shù)萬 TB 之巨 ,。即便采用OpenAI 存疑的方法,,獲取和準(zhǔn)備如此大量的純文本數(shù)據(jù)也很不切實(shí)際。然而,,就算真用這個數(shù)據(jù)集來訓(xùn)練人工智能也可能要消耗大量能源,,大到這種成本令人工智能變得完全不可行的地步,那怕你是一家非營利組織也不可行,。
這么說并不夸張,。 OpenAI 首席執(zhí)行官山姆·阿爾特曼 (Sam Altman) 九層公開表示,先進(jìn)的人工智能要想變得可行,,需要能源技術(shù)取得突破,,比如核聚變??杀氖牵退阄覀兇_實(shí)實(shí)現(xiàn)了核聚變,,在本世紀(jì)乃至下世紀(jì)這種技術(shù)也不太可能比我們目前的能源便宜,。事實(shí)上,任何形式的能源都不會比我們目前所擁有的能源便宜得多,。因此,,針對人工智能能源問題提出的解決方案具有很大的誤導(dǎo)性。
這個觀點(diǎn)得到了一些非常嚴(yán)肅的研究的支持,。馬薩諸塞大學(xué)阿默斯特分校曾做過一項(xiàng)研究,,他們分析了將圖像識別人工智能性能提高到準(zhǔn)確率達(dá) 95% 以上所需的計(jì)算和能源成本。研究發(fā)現(xiàn),,訓(xùn)練這樣一個模型將需要花費(fèi) 1000 億美元,,其所產(chǎn)生的碳排放量相當(dāng)于紐約市一個月的碳排放量。請記住,,這是針對仍有 5% 的時間會出現(xiàn)災(zāi)難性錯誤的人工智能而言的,。該研究還強(qiáng)調(diào),將準(zhǔn)確率提高到 99% 需要的成本和碳排放還會成倍增加,。
這就是為什么特斯拉永遠(yuǎn)不會用當(dāng)前的方式開發(fā)全自動駕駛汽車的原因所在,。他們的Autopilot和FSD只能通過這種人工智能計(jì)算機(jī)視覺來感知周圍的世界,,而FSD要想實(shí)現(xiàn)全自動駕駛,其圖像識別精度需要接近100%的準(zhǔn)確度,。正如那項(xiàng)研究所表明那樣,,要想讓特斯拉的人工智能變得那么好,其所需要的資金也許遠(yuǎn)非特斯拉能負(fù)擔(dān)得起,。
換句話說,,除非人工智能行業(yè)能夠找到一種更高效的方法來提高訓(xùn)練人工智能以及計(jì)算負(fù)載的效率,否則就無法突破這個限制,,然后人工智能的發(fā)展就將完全停滯,。目前可能的解決方案即將出現(xiàn),比方說結(jié)合了模擬與量子技術(shù)的更高效的人工智能硬件,,以及需要訓(xùn)練數(shù)據(jù)集個更小的新的人工智能架構(gòu),。不過,這些概念仍處在起步階段,,距離應(yīng)用到現(xiàn)實(shí)世界可能還需要幾十年的時間,。
簡而言之,大家得有個心理準(zhǔn)備,,未來幾年人工智能的發(fā)展肯能會大幅低于預(yù)期,。
譯者:boxi。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1106394.html
溫馨提示:投資有風(fēng)險,,入市須謹(jǐn)慎。本資訊不作為投資理財建議,。