過去幾個(gè)月,,對(duì)人工智能的炒作已經(jīng)到了瘋狂的地步。什么特斯拉在一兩年內(nèi)就要實(shí)現(xiàn)全自動(dòng)駕駛了,,人工智能明年將會(huì)變得比人類更聰明了,到 2040 年會(huì)有十億臺(tái)人工智能機(jī)器人取代人類工人了,,這些還只是埃隆·馬斯克今年迄今為止對(duì)人工智能許下的??谥弧U麄€(gè)人工智能圈都充斥著這樣的預(yù)測(cè)和承諾,,給人感覺人工智能的發(fā)展已走上不可阻擋的指數(shù)軌跡曲線上,,已經(jīng)到了我們?nèi)祟惛緹o法阻止的地步。但是事實(shí)并非如此,。要我說,,人工智能正開始觸碰到收益遞減的發(fā)展天花板,從而令這些夸張的承諾變成一張廢紙,。下面我會(huì)解釋的,。
要想理解這個(gè)問題,我們得先了解一點(diǎn)人工智能的基本工作原理?,F(xiàn)代人工智能運(yùn)用的是深度學(xué)習(xí)算法與人工神經(jīng)網(wǎng)絡(luò),,借此來發(fā)現(xiàn)數(shù)據(jù)當(dāng)中的趨勢(shì)。然后,,人工智能就可以根據(jù)這些數(shù)據(jù)推斷或沿著同一趨勢(shì)線生成新的數(shù)據(jù),。這首先需要“訓(xùn)練”人工智能,將大量數(shù)據(jù)喂給它進(jìn)行分析,,讓它去發(fā)現(xiàn)這些趨勢(shì),。之后,你就可以拋問題給人工智能來獲得輸出,。這個(gè)基本概念為計(jì)算機(jī)視覺,、自動(dòng)駕駛汽車、聊天機(jī)器人以及生成式人工智能提供了動(dòng)力。這個(gè)解釋有點(diǎn)簡(jiǎn)化了,,但現(xiàn)在我們只需要了解這些就夠了,。
過去幾年,人工智能的能力有了顯著增強(qiáng),。這部分要?dú)w功于有了更好的編程和算法,。但 90% 要?dú)w功于用了更大的數(shù)據(jù)集對(duì)人工智能進(jìn)行訓(xùn)練。從而使得人工智能可以更準(zhǔn)確地了解數(shù)據(jù)趨勢(shì),,從而更準(zhǔn)確地生成結(jié)果,。但有個(gè)問題:我們正目睹相對(duì)于所需的數(shù)據(jù)和算力,訓(xùn)練人工智能帶來的回報(bào)正在急劇遞減,。
我們先從數(shù)據(jù)講起,。假設(shè)我們開發(fā)了一個(gè)簡(jiǎn)單的計(jì)算機(jī)視覺人工智能,它可以識(shí)別出狗和貓,,我們已經(jīng)用 100 只狗和貓的圖像和視頻對(duì)其進(jìn)行了訓(xùn)練,,它可以在 60% 的時(shí)間內(nèi)正確識(shí)別這些動(dòng)物。如果我們將訓(xùn)練的圖像和視頻數(shù)量增加一倍,,達(dá)到 200 個(gè),,其識(shí)別率就會(huì)提高,但只能略微提高到 65% 左右,。如果我們?cè)俅螌⒂?xùn)練圖像和視頻增加一倍,,達(dá)到 400 個(gè),那么其改進(jìn)將更加微乎其微,,只能達(dá)到 67.5% 左右,。
這其中的部分原因在于,如果你手頭的數(shù)據(jù)集比較小時(shí),,相對(duì)于較大的數(shù)據(jù)集,,往里面添加一張新的訓(xùn)練圖像,,所提供的新數(shù)據(jù)會(huì)更多,。不過,這也是因?yàn)槿斯ぶ悄芴幚硇〉臄?shù)據(jù)集可以迅速建立新的連接與趨勢(shì),,因?yàn)樗恍枵业竭m用于幾個(gè)示例的趨勢(shì)即可,。但隨著數(shù)據(jù)集的增長(zhǎng),找到對(duì)整個(gè)數(shù)據(jù)集都適用的新趨勢(shì)和連接變得越來越難,。這些來自較更大數(shù)據(jù)集的新趨勢(shì)和連接讓人工智能變得更好,、能力更強(qiáng)。因此,,隨著訓(xùn)練人工智能的收益遞減,,我們看到將人工智能改進(jìn)到一定程度所需要的訓(xùn)練數(shù)據(jù)量急劇增加。
但這里面還有一個(gè)問題,。訓(xùn)練人工智能對(duì)算力的需求非常大,。人工智能必須將每個(gè)單獨(dú)的數(shù)據(jù)點(diǎn)與數(shù)據(jù)集所有其他數(shù)據(jù)點(diǎn)進(jìn)行比較,,這樣才能找到它們的關(guān)聯(lián)和趨勢(shì)。這意味著,,每往人工智能訓(xùn)練數(shù)據(jù)庫(kù)添加一位數(shù)據(jù),,用這個(gè)數(shù)據(jù)庫(kù)訓(xùn)練人工智能所需的計(jì)算工作量都會(huì)呈指數(shù)級(jí)增長(zhǎng)。因此,,就算你有能力獲取到訓(xùn)練這些不斷改進(jìn)的人工智能所需的大量數(shù)據(jù),,它所需的物理計(jì)算能力和能源最終也會(huì)增長(zhǎng)到難以為繼的地步。
可悲的是,,有證據(jù)表明,,我們現(xiàn)在正處在這樣一個(gè)階段:一方面訓(xùn)練數(shù)據(jù)集擴(kuò)大帶來的回報(bào)在遞減,一方面用所述數(shù)據(jù)集所需的算力又呈指數(shù)級(jí)增長(zhǎng),,這些都會(huì)給人工智能的發(fā)展制造剛性的上限,。
就拿 OpenAI 的旗艦人工智能產(chǎn)品 ChatGPT4 來說吧,但它相對(duì)于 ChatGPT3 的改進(jìn)要小于 ChatGPT3 相對(duì)于 ChatGPT2 的改進(jìn),,盡管它的準(zhǔn)確率提高了,,但仍然存在跟 ChatGPT3 一樣的幻覺與缺乏理解的問題。雖說OpenAI 對(duì)自己的人工智能開發(fā)方式守口如瓶,,但專家調(diào)查發(fā)現(xiàn),,ChatGPT3 使用的訓(xùn)練數(shù)據(jù)集比 ChatGPT2 大了 78 倍,而ChatGPT4 所用的數(shù)據(jù)集比 ChatGPT3 要大 571 倍,!可是,,盡管訓(xùn)練數(shù)據(jù)集的大小有了顯著提升, 但ChatGPT4 仍然存在重大缺陷,,大大限制了它的使用場(chǎng)景,。比方說,還是不能信任它能寫出任何以事實(shí)為基礎(chǔ)的東西,,因?yàn)樗匀辉诰幵焓聦?shí),。
有人估計(jì) ChatGPT4 的原始訓(xùn)練數(shù)據(jù)集有 45 TB 的純文本。這意味著,,下一次迭代要想取得 ChatGPT4 相對(duì)于 ChatGPT3 那樣的巨大進(jìn)步,,訓(xùn)練數(shù)據(jù)集需要達(dá)數(shù)萬 TB 之巨 。即便采用OpenAI 存疑的方法,,獲取和準(zhǔn)備如此大量的純文本數(shù)據(jù)也很不切實(shí)際,。然而,就算真用這個(gè)數(shù)據(jù)集來訓(xùn)練人工智能也可能要消耗大量能源,,大到這種成本令人工智能變得完全不可行的地步,,那怕你是一家非營(yíng)利組織也不可行。
這么說并不夸張。 OpenAI 首席執(zhí)行官山姆·阿爾特曼 (Sam Altman) 九層公開表示,,先進(jìn)的人工智能要想變得可行,,需要能源技術(shù)取得突破,比如核聚變,??杀氖牵退阄覀兇_實(shí)實(shí)現(xiàn)了核聚變,,在本世紀(jì)乃至下世紀(jì)這種技術(shù)也不太可能比我們目前的能源便宜,。事實(shí)上,任何形式的能源都不會(huì)比我們目前所擁有的能源便宜得多,。因此,,針對(duì)人工智能能源問題提出的解決方案具有很大的誤導(dǎo)性。
這個(gè)觀點(diǎn)得到了一些非常嚴(yán)肅的研究的支持,。馬薩諸塞大學(xué)阿默斯特分校曾做過一項(xiàng)研究,,他們分析了將圖像識(shí)別人工智能性能提高到準(zhǔn)確率達(dá) 95% 以上所需的計(jì)算和能源成本。研究發(fā)現(xiàn),,訓(xùn)練這樣一個(gè)模型將需要花費(fèi) 1000 億美元,,其所產(chǎn)生的碳排放量相當(dāng)于紐約市一個(gè)月的碳排放量。請(qǐng)記住,,這是針對(duì)仍有 5% 的時(shí)間會(huì)出現(xiàn)災(zāi)難性錯(cuò)誤的人工智能而言的,。該研究還強(qiáng)調(diào),將準(zhǔn)確率提高到 99% 需要的成本和碳排放還會(huì)成倍增加,。
這就是為什么特斯拉永遠(yuǎn)不會(huì)用當(dāng)前的方式開發(fā)全自動(dòng)駕駛汽車的原因所在,。他們的Autopilot和FSD只能通過這種人工智能計(jì)算機(jī)視覺來感知周圍的世界,而FSD要想實(shí)現(xiàn)全自動(dòng)駕駛,,其圖像識(shí)別精度需要接近100%的準(zhǔn)確度,。正如那項(xiàng)研究所表明那樣,要想讓特斯拉的人工智能變得那么好,,其所需要的資金也許遠(yuǎn)非特斯拉能負(fù)擔(dān)得起,。
換句話說,除非人工智能行業(yè)能夠找到一種更高效的方法來提高訓(xùn)練人工智能以及計(jì)算負(fù)載的效率,,否則就無法突破這個(gè)限制,,然后人工智能的發(fā)展就將完全停滯。目前可能的解決方案即將出現(xiàn),,比方說結(jié)合了模擬與量子技術(shù)的更高效的人工智能硬件,以及需要訓(xùn)練數(shù)據(jù)集個(gè)更小的新的人工智能架構(gòu),。不過,,這些概念仍處在起步階段,距離應(yīng)用到現(xiàn)實(shí)世界可能還需要幾十年的時(shí)間。
簡(jiǎn)而言之,,大家得有個(gè)心理準(zhǔn)備,,未來幾年人工智能的發(fā)展肯能會(huì)大幅低于預(yù)期。
譯者:boxi,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1101195.html
溫馨提示:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議,。