財聯(lián)社12月22日訊(編輯 周子意)蘋果GPT就在你口袋里?這或許會更快成為現(xiàn)實,。
蘋果人工智能(AI)研究人員近日在預(yù)印本網(wǎng)站arXiv上發(fā)表了一篇論文,,其中提到了一種創(chuàng)新的“閃存利用”技術(shù),可以在iPhone和其他內(nèi)存有限的蘋果設(shè)備上部署大型語言模型(LLM),,這幾乎是一項重大突破,。
內(nèi)存的約束
基于LLM的聊天機器人(如ChatGPT、Claude等)都非常依賴于數(shù)據(jù)和內(nèi)存,,其需要同時處理的數(shù)據(jù)量非常龐大,,往往需要大量內(nèi)存才能運行。
因此運行LLM對于DRAM(一般指內(nèi)存)容量有限的iPhone等設(shè)備來說是一個挑戰(zhàn),。
通常,,運算數(shù)據(jù)標(biāo)準(zhǔn)的方法是將閃存中的數(shù)據(jù)加載到DRAM中,再在DRAM中進行數(shù)據(jù)推理,。
性能水平高的DRAM可以讓數(shù)據(jù)處理的速度提升數(shù)百萬倍,然而,,弊端在于容量上,。在DRAM上運行嚴重限制了可以運行的最大模型大小。
為了解決這個問題,,蘋果公司的研究人員開發(fā)了一種新技術(shù),,使用容量較大的閃存(flash memory)來存儲人工智能模型的數(shù)據(jù),,再在需要時在將數(shù)據(jù)調(diào)入DRAM內(nèi)存中來處理。
在閃存上存儲AI
在一篇題為《flash中的LLM:有限內(nèi)存下的高效大型語言模型推理》的新研究論文中,,作者指出,,移動設(shè)備中的閃存比傳統(tǒng)上用于運行LLM的內(nèi)存更加豐富。
這種方法巧妙地繞過了容量限制,。改論文提出了兩項關(guān)鍵技術(shù),,最大限度地減少數(shù)據(jù)傳輸、并最大限度地提高閃存處理能力:
其一叫做“窗口化(windowing)”技術(shù),,相當(dāng)于一種回收方法,。AI模型不需要每次都加載新數(shù)據(jù),而是重新使用一些已經(jīng)處理過的數(shù)據(jù),。這減少了對不斷獲取內(nèi)存的需求,,使過程更快更平滑。
其二叫做“行-列捆綁(Row-Column Bundling)”技術(shù),。該技術(shù)是通過更有效地分組數(shù)據(jù),,即針對閃存的數(shù)據(jù)特征制定訪問數(shù)據(jù)塊的順序,可以更快地從閃存中讀取數(shù)據(jù),,加快人工智能理解和生成語言的能力,。
根據(jù)這篇論文,這些方法的結(jié)合使人工智能模型的運行容量達到iPhone可用內(nèi)存的兩倍,。這意味著該方法下,,CPU中的推理速度較傳統(tǒng)加載方式提高了4-5倍,GPU中的推理速度提高了驚人的20-25倍,。
該論文作者寫道,,“這一突破對于在資源有限的環(huán)境中部署先進的LLM尤其重要,從而擴大了它們的適用性和可及性,?!?/p>
蘋果的AI戰(zhàn)略
人工智能效率的突破為未來的iPhone打開了新的可能性,比如更先進的Siri功能,、實時語言翻譯,、復(fù)雜的人工智能驅(qū)動的攝影和增強現(xiàn)實功能。
論文中的新技術(shù)還為iPhone在設(shè)備上運行復(fù)雜的人工智能助手和聊天機器人奠定了基礎(chǔ),,據(jù)說蘋果已經(jīng)在開發(fā)這方面的技術(shù),。
蘋果在生成式人工智能方面的工作最終可能會被整合到其語音助手Siri中,。蘋果在今年2月的人工智能峰會上,,向員工介紹了其大型語言模型的工作,。據(jù)媒體此前報道,蘋果的目標(biāo)是推出與人工智能深度集成的智能版Siri,。
還有傳言稱蘋果計劃在盡可能多的蘋果應(yīng)用程序中添加人工智能。
除此之外據(jù)報道,,蘋果還正在開發(fā)自己的生成式人工智能模型“Ajax”,,其在2000億個參數(shù)上運行,為了與OpenAI的GPT-4模型相抗衡,。
內(nèi)部稱為“Apple GPT”的Ajax旨在統(tǒng)一整個蘋果的機器學(xué)習(xí)開發(fā),,這突顯了蘋果將人工智能更深入地融入蘋果生態(tài)系統(tǒng)的更廣泛戰(zhàn)略。
根據(jù)最新的報告,,Ajax被認為比早期的ChatGPT 3.5更強大。然而,2023年9月OpenAI推出的新模型GPT-4可能已經(jīng)超越了Ajax的能力。
果鏈分析師Jeff Pu曾指出,,蘋果將在2024年底左右在iPhone和iPad上推出某種生成式人工智能功能,,屆時iOS 18將會包含這項功能,。Pu還表示,,蘋果將在2023年建造幾百臺人工智能服務(wù)器,2024年還會有更多,。
(財聯(lián)社 周子意)
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1084518.html
溫馨提示:投資有風(fēng)險,,入市須謹慎,。本資訊不作為投資理財建議。