財(cái)聯(lián)社12月22日訊(編輯 周子意)蘋果GPT就在你口袋里?這或許會(huì)更快成為現(xiàn)實(shí)。
蘋果人工智能(AI)研究人員近日在預(yù)印本網(wǎng)站arXiv上發(fā)表了一篇論文,,其中提到了一種創(chuàng)新的“閃存利用”技術(shù),,可以在iPhone和其他內(nèi)存有限的蘋果設(shè)備上部署大型語(yǔ)言模型(LLM),,這幾乎是一項(xiàng)重大突破,。
內(nèi)存的約束
基于LLM的聊天機(jī)器人(如ChatGPT,、Claude等)都非常依賴于數(shù)據(jù)和內(nèi)存,,其需要同時(shí)處理的數(shù)據(jù)量非常龐大,,往往需要大量?jī)?nèi)存才能運(yùn)行。
因此運(yùn)行LLM對(duì)于DRAM(一般指內(nèi)存)容量有限的iPhone等設(shè)備來說是一個(gè)挑戰(zhàn),。
通常,,運(yùn)算數(shù)據(jù)標(biāo)準(zhǔn)的方法是將閃存中的數(shù)據(jù)加載到DRAM中,再在DRAM中進(jìn)行數(shù)據(jù)推理,。
性能水平高的DRAM可以讓數(shù)據(jù)處理的速度提升數(shù)百萬(wàn)倍,然而,,弊端在于容量上,。在DRAM上運(yùn)行嚴(yán)重限制了可以運(yùn)行的最大模型大小。
為了解決這個(gè)問題,,蘋果公司的研究人員開發(fā)了一種新技術(shù),,使用容量較大的閃存(flash memory)來存儲(chǔ)人工智能模型的數(shù)據(jù),,再在需要時(shí)在將數(shù)據(jù)調(diào)入DRAM內(nèi)存中來處理。
在閃存上存儲(chǔ)AI
在一篇題為《flash中的LLM:有限內(nèi)存下的高效大型語(yǔ)言模型推理》的新研究論文中,,作者指出,,移動(dòng)設(shè)備中的閃存比傳統(tǒng)上用于運(yùn)行LLM的內(nèi)存更加豐富,。
這種方法巧妙地繞過了容量限制。改論文提出了兩項(xiàng)關(guān)鍵技術(shù),,最大限度地減少數(shù)據(jù)傳輸,、并最大限度地提高閃存處理能力:
其一叫做“窗口化(windowing)”技術(shù),相當(dāng)于一種回收方法,。AI模型不需要每次都加載新數(shù)據(jù),,而是重新使用一些已經(jīng)處理過的數(shù)據(jù)。這減少了對(duì)不斷獲取內(nèi)存的需求,,使過程更快更平滑,。
其二叫做“行-列捆綁(Row-Column Bundling)”技術(shù)。該技術(shù)是通過更有效地分組數(shù)據(jù),,即針對(duì)閃存的數(shù)據(jù)特征制定訪問數(shù)據(jù)塊的順序,,可以更快地從閃存中讀取數(shù)據(jù),加快人工智能理解和生成語(yǔ)言的能力,。
根據(jù)這篇論文,,這些方法的結(jié)合使人工智能模型的運(yùn)行容量達(dá)到iPhone可用內(nèi)存的兩倍。這意味著該方法下,,CPU中的推理速度較傳統(tǒng)加載方式提高了4-5倍,,GPU中的推理速度提高了驚人的20-25倍。
該論文作者寫道,,“這一突破對(duì)于在資源有限的環(huán)境中部署先進(jìn)的LLM尤其重要,從而擴(kuò)大了它們的適用性和可及性,?!?/p>
蘋果的AI戰(zhàn)略
人工智能效率的突破為未來的iPhone打開了新的可能性,比如更先進(jìn)的Siri功能,、實(shí)時(shí)語(yǔ)言翻譯,、復(fù)雜的人工智能驅(qū)動(dòng)的攝影和增強(qiáng)現(xiàn)實(shí)功能。
論文中的新技術(shù)還為iPhone在設(shè)備上運(yùn)行復(fù)雜的人工智能助手和聊天機(jī)器人奠定了基礎(chǔ),,據(jù)說蘋果已經(jīng)在開發(fā)這方面的技術(shù),。
蘋果在生成式人工智能方面的工作最終可能會(huì)被整合到其語(yǔ)音助手Siri中。蘋果在今年2月的人工智能峰會(huì)上,,向員工介紹了其大型語(yǔ)言模型的工作,。據(jù)媒體此前報(bào)道,蘋果的目標(biāo)是推出與人工智能深度集成的智能版Siri,。
還有傳言稱蘋果計(jì)劃在盡可能多的蘋果應(yīng)用程序中添加人工智能,。
除此之外據(jù)報(bào)道,蘋果還正在開發(fā)自己的生成式人工智能模型“Ajax”,,其在2000億個(gè)參數(shù)上運(yùn)行,為了與OpenAI的GPT-4模型相抗衡。
內(nèi)部稱為“Apple GPT”的Ajax旨在統(tǒng)一整個(gè)蘋果的機(jī)器學(xué)習(xí)開發(fā),,這突顯了蘋果將人工智能更深入地融入蘋果生態(tài)系統(tǒng)的更廣泛戰(zhàn)略,。
根據(jù)最新的報(bào)告,Ajax被認(rèn)為比早期的ChatGPT 3.5更強(qiáng)大,。然而,,2023年9月OpenAI推出的新模型GPT-4可能已經(jīng)超越了Ajax的能力。
果鏈分析師Jeff Pu曾指出,,蘋果將在2024年底左右在iPhone和iPad上推出某種生成式人工智能功能,,屆時(shí)iOS 18將會(huì)包含這項(xiàng)功能。Pu還表示,,蘋果將在2023年建造幾百臺(tái)人工智能服務(wù)器,,2024年還會(huì)有更多。
(財(cái)聯(lián)社 周子意)
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1084518.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。