財(cái)聯(lián)社12月22日訊(編輯 周子意)蘋(píng)果GPT就在你口袋里,?這或許會(huì)更快成為現(xiàn)實(shí)。
蘋(píng)果人工智能(AI)研究人員近日在預(yù)印本網(wǎng)站arXiv上發(fā)表了一篇論文,,其中提到了一種創(chuàng)新的“閃存利用”技術(shù),,可以在iPhone和其他內(nèi)存有限的蘋(píng)果設(shè)備上部署大型語(yǔ)言模型(LLM),這幾乎是一項(xiàng)重大突破,。
內(nèi)存的約束
基于LLM的聊天機(jī)器人(如ChatGPT,、Claude等)都非常依賴(lài)于數(shù)據(jù)和內(nèi)存,其需要同時(shí)處理的數(shù)據(jù)量非常龐大,,往往需要大量?jī)?nèi)存才能運(yùn)行,。
因此運(yùn)行LLM對(duì)于DRAM(一般指內(nèi)存)容量有限的iPhone等設(shè)備來(lái)說(shuō)是一個(gè)挑戰(zhàn)。
通常,,運(yùn)算數(shù)據(jù)標(biāo)準(zhǔn)的方法是將閃存中的數(shù)據(jù)加載到DRAM中,,再在DRAM中進(jìn)行數(shù)據(jù)推理。
性能水平高的DRAM可以讓數(shù)據(jù)處理的速度提升數(shù)百萬(wàn)倍,,然而,弊端在于容量上,。在DRAM上運(yùn)行嚴(yán)重限制了可以運(yùn)行的最大模型大小,。
為了解決這個(gè)問(wèn)題,蘋(píng)果公司的研究人員開(kāi)發(fā)了一種新技術(shù),,使用容量較大的閃存(flash memory)來(lái)存儲(chǔ)人工智能模型的數(shù)據(jù),再在需要時(shí)在將數(shù)據(jù)調(diào)入DRAM內(nèi)存中來(lái)處理,。
在閃存上存儲(chǔ)AI
在一篇題為《flash中的LLM:有限內(nèi)存下的高效大型語(yǔ)言模型推理》的新研究論文中,,作者指出,移動(dòng)設(shè)備中的閃存比傳統(tǒng)上用于運(yùn)行LLM的內(nèi)存更加豐富,。
這種方法巧妙地繞過(guò)了容量限制,。改論文提出了兩項(xiàng)關(guān)鍵技術(shù),最大限度地減少數(shù)據(jù)傳輸,、并最大限度地提高閃存處理能力:
其一叫做“窗口化(windowing)”技術(shù),,相當(dāng)于一種回收方法。AI模型不需要每次都加載新數(shù)據(jù),,而是重新使用一些已經(jīng)處理過(guò)的數(shù)據(jù),。這減少了對(duì)不斷獲取內(nèi)存的需求,使過(guò)程更快更平滑,。
其二叫做“行-列捆綁(Row-Column Bundling)”技術(shù),。該技術(shù)是通過(guò)更有效地分組數(shù)據(jù),即針對(duì)閃存的數(shù)據(jù)特征制定訪(fǎng)問(wèn)數(shù)據(jù)塊的順序,,可以更快地從閃存中讀取數(shù)據(jù),,加快人工智能理解和生成語(yǔ)言的能力。
根據(jù)這篇論文,,這些方法的結(jié)合使人工智能模型的運(yùn)行容量達(dá)到iPhone可用內(nèi)存的兩倍,。這意味著該方法下,CPU中的推理速度較傳統(tǒng)加載方式提高了4-5倍,,GPU中的推理速度提高了驚人的20-25倍,。
該論文作者寫(xiě)道,,“這一突破對(duì)于在資源有限的環(huán)境中部署先進(jìn)的LLM尤其重要,從而擴(kuò)大了它們的適用性和可及性,?!?/p>
蘋(píng)果的AI戰(zhàn)略
人工智能效率的突破為未來(lái)的iPhone打開(kāi)了新的可能性,,比如更先進(jìn)的Siri功能、實(shí)時(shí)語(yǔ)言翻譯,、復(fù)雜的人工智能驅(qū)動(dòng)的攝影和增強(qiáng)現(xiàn)實(shí)功能,。
論文中的新技術(shù)還為iPhone在設(shè)備上運(yùn)行復(fù)雜的人工智能助手和聊天機(jī)器人奠定了基礎(chǔ),據(jù)說(shuō)蘋(píng)果已經(jīng)在開(kāi)發(fā)這方面的技術(shù),。
蘋(píng)果在生成式人工智能方面的工作最終可能會(huì)被整合到其語(yǔ)音助手Siri中,。蘋(píng)果在今年2月的人工智能峰會(huì)上,向員工介紹了其大型語(yǔ)言模型的工作,。據(jù)媒體此前報(bào)道,,蘋(píng)果的目標(biāo)是推出與人工智能深度集成的智能版Siri。
還有傳言稱(chēng)蘋(píng)果計(jì)劃在盡可能多的蘋(píng)果應(yīng)用程序中添加人工智能,。
除此之外據(jù)報(bào)道,,蘋(píng)果還正在開(kāi)發(fā)自己的生成式人工智能模型“Ajax”,其在2000億個(gè)參數(shù)上運(yùn)行,,為了與OpenAI的GPT-4模型相抗衡,。
內(nèi)部稱(chēng)為“Apple GPT”的Ajax旨在統(tǒng)一整個(gè)蘋(píng)果的機(jī)器學(xué)習(xí)開(kāi)發(fā),這突顯了蘋(píng)果將人工智能更深入地融入蘋(píng)果生態(tài)系統(tǒng)的更廣泛戰(zhàn)略,。
根據(jù)最新的報(bào)告,,Ajax被認(rèn)為比早期的ChatGPT 3.5更強(qiáng)大。然而,,2023年9月OpenAI推出的新模型GPT-4可能已經(jīng)超越了Ajax的能力,。
果鏈分析師Jeff Pu曾指出,蘋(píng)果將在2024年底左右在iPhone和iPad上推出某種生成式人工智能功能,,屆時(shí)iOS 18將會(huì)包含這項(xiàng)功能,。Pu還表示,蘋(píng)果將在2023年建造幾百臺(tái)人工智能服務(wù)器,,2024年還會(huì)有更多,。
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,觀(guān)點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀(guān)點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1084551.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議。