原文來源:極客公園
圖片來源:由無界 AI生成
經(jīng)過十幾年的發(fā)展,,大部分智能手機系統(tǒng)都已走向完善,功能愈發(fā)趨同,。
但這只是表象,。實際上,各家廠商都在積蓄力量,,醞釀革新,。今年,隨著大模型的迅速應(yīng)用落地,,進化的號角也終于開始吹響,。
這場革命必定與大模型息息相關(guān),但又不只關(guān)乎大模型,。目前大模型領(lǐng)域的主流,,都是圍繞服務(wù)端部署展開。想讓智能手機與大模型結(jié)合,,到底意味著什么,?有什么局限和優(yōu)勢?
想理解這個問題,,需要回到更早的時候,。
去年,OPPO 在 ODC2022 上發(fā)布了自研智慧跨端系統(tǒng)「潘塔納爾」,。起初它給人的感覺還略顯抽象,,但過去一年,潘塔納爾已經(jīng)實現(xiàn)了初步落地,。通過智慧跨端和泛在服務(wù)兩大體驗,,對下實現(xiàn)跨設(shè)備的協(xié)同,,對上支撐了不同應(yīng)用間服務(wù)的智能流轉(zhuǎn)。
剛剛結(jié)束的 ODC2023 上,,OPPO 正式推出 AndesGPT,,將AIGC 能力與潘塔納爾結(jié)合,融入了 ColorOS 14,。表面上,,OPPO 早已布局的大模型和智慧跨端系統(tǒng)是兩套不同的技術(shù)底座,但在今天,,它們卻產(chǎn)生了重要的化學(xué)反應(yīng),。
這幅手機應(yīng)用、交互革命的未來藍圖,,正在一點點變得完整,。
01 系統(tǒng)「解耦」,讓服務(wù)與數(shù)據(jù)融合
去年夏天,,OPPO 首次推出了自研智慧跨端系統(tǒng)「潘塔納爾」,。
當(dāng)時大部分人的注意力都放在「跨端」這個概念上,認為 OPPO 準(zhǔn)備做的事,,主要是不同硬件之間的數(shù)據(jù)流轉(zhuǎn),、功能接力。比如「手機上復(fù)制,,電腦上粘貼」,、「手機上接到電話,在平板上接聽」等功能……
但實際上,,過去一年,,OPPO 通過潘塔納爾做到的最重要的一件事,是像一座橋梁,,通過泛在服務(wù)和智慧跨端,,把系統(tǒng)、應(yīng)用到服務(wù)做了深層次的打通,。
從智能手機誕生之日起,,用來組織功能的單位就是 App。早期的智能手機系統(tǒng),,以 iOS 為代表,,只有兩個核心層級:一層是桌面,排列著一個個 App 的圖標(biāo),;一層是 App,,就是點開 App 后所有的功能。
當(dāng)年蘋果最早喊出了「每個需求都有一個 App 來解決」(There's an app for everything)的口號,。
隨著移動互聯(lián)網(wǎng)生態(tài)的發(fā)展,,App 的生態(tài)也終于走向飽和,,很多 App 都開始變得臃腫,出現(xiàn)了大量的功能重疊,。
對用戶來說,,臃腫的 App、重復(fù)的功能越來越成為一種負擔(dān),。為了一個小功能,,就要在 App 間反復(fù)跳轉(zhuǎn),也變得非常麻煩,。典型場景包括一邊回復(fù)消息,,一邊關(guān)注外賣的配送進度;在檢查郵件,、瀏覽網(wǎng)頁的時候,,同時看地圖導(dǎo)航……
App 是智能手機最關(guān)鍵的功能組織形態(tài),但不應(yīng)該是唯一的形態(tài),,更不應(yīng)該是一個完全封裝的系統(tǒng),。想要優(yōu)化 App 的體驗,就必須進行「系統(tǒng)解耦」,。
這個問題一直存在,,所以 Android 很早就推出了「小組件」,嘗試在用戶界面層面解決,。但早期的小組件,完全出于 App 開發(fā)者自愿開發(fā),,并沒有得到充分推動,。
而 OPPO 在推出「潘塔納爾」后,,以一個更開放的姿態(tài)參與進來,,將整個系統(tǒng)解耦,變成了一個個原子化服務(wù),,以人為中心,,憑借情境感知與計算能力為人提供合適的服務(wù),智能顯示在手機桌面上,,手表上,,甚至通過耳機播報。
過去一年,,潘塔納爾已經(jīng)針對出行,、外賣、導(dǎo)航,、快遞等應(yīng)用場景,,推動了「泛在服務(wù)」落地,。首批支持的 App 包括支付寶、美團,,這次 ColorOS 14 又支持了小紅書,、攜程、去哪兒,。
利用泛在服務(wù),,用戶可以更靈活、便捷地調(diào)取服務(wù),,減少不必要的操作步驟,。
這件事并不只有 OPPO 一家在做,,蘋果 iOS 的「即時動態(tài)」,、「小組件」,也是在做類似的事情,。從系統(tǒng)中解耦出 App 的一項項「服務(wù)」,,增加配置的靈活性,更高效地利用手機信息的內(nèi)容和優(yōu)先級,,降低用戶的認知,、操作負擔(dān),已經(jīng)是行業(yè)趨勢,。
與此同時,,只是做到讓服務(wù)跳出「App」以外其實并不足夠,存在于 App 內(nèi)的文件數(shù)據(jù)也會由于不同系統(tǒng)生態(tài)導(dǎo)致體驗割裂,,例如 iPhone 可以打開在微信上收到的 keynote,但 Android 卻沒辦法,。這種安卓生態(tài)與蘋果系統(tǒng)之間類似的割裂每天都在上演,。
這樣的情況也通過「智慧跨端」正在逐步得到解決。潘塔納爾通過一個 OPPO 賬號打破數(shù)據(jù)壁壘,,實現(xiàn)數(shù)據(jù)采集,,跨端調(diào)用,,讓服務(wù)和數(shù)據(jù)不局限于手機,而是可以實現(xiàn)多設(shè)備多系統(tǒng)之間的流轉(zhuǎn),。這使得服務(wù)能夠流轉(zhuǎn)出現(xiàn)在用戶的不同設(shè)備及系統(tǒng)上:手表,、平板,、電腦、耳機,、電視,、汽車……隨時觸手可及。
舉個例子,,上個月的 OPPO Find N3 手機發(fā)布會上,,蘋果系統(tǒng)辦公軟件格式的文件,可以快速在安卓手機上打開了,,而且這個功能無需安裝第三方應(yīng)用,。在 ColorOS 14 上通過 PhoneLink,用戶可以直接在 Windows 系統(tǒng)上操作使用手機 App,,訪問手機上的相冊,,互傳文件。
將手機功能的基本組織單位從系統(tǒng)內(nèi)「App」解耦為「服務(wù)」,,允許它在多設(shè)備間靈活流轉(zhuǎn),,會帶來非常深遠的變化。
因為隨著泛在服務(wù)場景的豐富,,智慧跨端可流轉(zhuǎn)設(shè)備的增加,,另一個問題會迅速產(chǎn)生:如何實現(xiàn)準(zhǔn)確智能地推薦,讓用戶可以便捷調(diào)用,?
這就需要對手機的界面,、交互,以及智能推薦的機器學(xué)習(xí)模型,,進行革新升級,。
大模型的切入點,出現(xiàn)了,。
02 大模型,不只要「大」
過去一年,,大模型發(fā)展的核心關(guān)鍵詞,,就是「大」。
參量是大模型展現(xiàn)出驚人智慧的核心原因,,所謂「大力出奇跡」,。參數(shù)的規(guī)模越大、層級越多,,大模型就能對數(shù)據(jù)進行更細膩的理解,,最終擬合出更真實的結(jié)果。
如果把智慧比作聲音,,人類智慧是連貫的模擬信號,,AI 則像是數(shù)字錄音回放設(shè)備,,采樣率決定了音質(zhì)。采樣率越高,,就與自然的聲音越接近,,到一定程度,人耳就不再能分辨出區(qū)別,。同樣的,,參量夠大,AI 就能「騙」過人類,。
所以,,目前宣布將大模型部署到手機上的廠商,都不同程度地遭到了輿論質(zhì)疑,。很多人認為手機上可以部署的模型,,參量不夠大。進行多端,、多模型部署,,反而會帶來混亂。
如果大模型應(yīng)用的目標(biāo)僅僅是打造出一個「能通過圖靈測試,,上知天文,,下知地理的人工智能」,,那確實是,參量決定一切,。
但實際上,,一個模型是否實用,并不是靠參量來判斷的。一切模型,,最終都是為了模擬一部分現(xiàn)實,,推演、擬合出合理,、正確的結(jié)果,,滿足需要即可,并不能武斷地說「越大越好」,。
對這個問題,,手機廠商有更深的認識,一個典型例子是語音助手,。
語音助手的核心模型,,就是要把用戶發(fā)出的聲音波形,,擬合成自然語言,。這個模型的復(fù)雜度和運算量,對于早期的智能手機來說已經(jīng)很大了,,大部分手機芯片跑不動,。所以早期的語音助手,都會將用戶語音指令的聲音波形,,發(fā)送到云端,,由服務(wù)器上的模型識別成指令后,再發(fā)回手機執(zhí)行,。
但隨著手機上 NPU(神經(jīng)引擎)的算力發(fā)展,,以及對聲音識別模型的簡化,手機廠商發(fā)現(xiàn),,也可以把這個模型部署到本地,,直接讓 NPU 來跑,。它帶來的好處也很實際:響應(yīng)速度變快了,,無網(wǎng)絡(luò)環(huán)境也可以用,,且增強了隱私安全性,。
谷歌率先將 Google Assistant 的識別模型縮小到 500M 大小,,部署在了手機本地
目前大模型應(yīng)用主要以生成式 AI 為主,,并未進入那些更接地氣的復(fù)雜場景,。當(dāng)大模型應(yīng)用真正觸及到用戶需求的細枝末節(jié)時,,會有更多問題出現(xiàn),其中最關(guān)鍵的兩個就是「數(shù)據(jù)安全」和「響應(yīng)速度」,。
從這個角度,,就不難理解 OPPO 為什么在推出 AndesGPT 的時候,如此篤定地采用了「端云協(xié)同」的技術(shù)架構(gòu),。
從十億參量到千億參量,,OPPO 計劃部署一系列不同參數(shù)規(guī)模的大模型,兼顧響應(yīng)速度,、安全性,同時追求提升大模型的能力上限,。
通過端云分工,,AndesGPT 會根據(jù)對指令、任務(wù)需求的梯度理解,,來智能調(diào)用不同模型,。比如用戶的指令只是查詢手機內(nèi)一個聯(lián)系人,那就通過端側(cè)模型迅速響應(yīng),,如果用戶問的是更復(fù)雜的知識,,就通過云端大模型,生成更復(fù)雜,,準(zhǔn)確的回答,。
AndesGPT 的能力覆蓋非常廣闊,,從「智能摘要」,、「智能消除」,到基于語義的多模態(tài)信息搜索,,加深對用戶個性化習(xí)慣的理解,、記憶……
據(jù) OPPO 內(nèi)部透露,這些能力也將會支持端側(cè)化,,目前他們已經(jīng)在端側(cè)跑通 13B(130 億)參量模型,,突破了端側(cè)大模型的能力上限。這些模型能力,,加上智能手機十億級的用戶規(guī)模,,將展開大模型應(yīng)用的廣闊未來。
03 智能手機的二次革命
從潘塔納爾,,到 AndesGPT,,OPPO 展示了自己推動變革的決心。
ODC2023 上,OPPO 還宣布,,計劃將「對話式交互」引入到各個系統(tǒng)應(yīng)用,,簡化用戶的用機體驗。
「對話式交互」,,會很容易讓人聯(lián)想到 2017 年前后的 voice-first(語音優(yōu)先)風(fēng)潮,。當(dāng)時很多人都認為智能音箱、語音助手會成為下一代人機交互的關(guān)鍵,。但風(fēng)潮迅速席卷之后,,又迅速衰退下去。
其中一大原因就在于,,過去的智能語音助手,,無論是部署在音箱還是手機上,對語義的理解能力都有限,,能調(diào)用的數(shù)據(jù)和服務(wù)更有限,。到最后,它能實現(xiàn)的功能與智能手機相比,,依然只能算滄海一粟,。
但這一次,變革圍繞系統(tǒng),、應(yīng)用到服務(wù)展開,,依靠大模型深入。
從 ColorOS 的發(fā)展藍圖里就能看到,,它一方面通過潘塔納爾對系統(tǒng)解耦,,帶來泛在服務(wù)和智慧跨端,便于用戶在 App 之外調(diào)用功能,;同時又通過 AndesGPT,,基于自然語義理解用戶需要,推動「對話式交互」發(fā)展,。
OPPO 軟件工程事業(yè)部副總裁李杰在接受采訪時表示,,OPPO 希望通過 AndesGPT 為用戶提供一個類似「超級助理」的產(chǎn)品。
這正是手機利用大模型的優(yōu)勢所在,。
一方面,手機可以利用本地的數(shù)據(jù)去理解用戶,,其中很多是最貼近用戶私人生活的數(shù)據(jù),,獲得授權(quán)后,這些數(shù)據(jù)可以直接成為 prompt 的「語境」,;另一方面,,手機可以利用各種本地接口,、模塊,調(diào)用更多 App 的功能,。
舉一個簡單的想象。當(dāng)用戶問聊天機器人「我晚上應(yīng)該吃點什么,?」時,,如果不詳細寫在 prompt 里,那些部署在云端的聊天機器人就不會知道用戶的籍貫民族,,口味營養(yǎng)的偏好,,更難以調(diào)用相關(guān)的服務(wù)。最后大概率只能給出一些較泛化的圖文食物推薦,。這個情況,,無論把模型的參量提升到什么程度,都很難改進,。
但如果利用部署在手機上的大模型,,可能并不需要參量多大,就可以基于用戶的位置,、時間,、歷史訂單記錄,甚至是運動健康數(shù)據(jù),,來給出推薦,。給出的推薦可以是食譜,可以是一個通向點評 App 的鏈接,,以至于直接調(diào)用外賣軟件的服務(wù)模塊,,生成一個訂單,用戶一鍵確認發(fā)送,,也完全可能,。
這是一個最基本的想象,類似的場景還有很多,??梢哉f,越是貼近用戶生活的,,簡單而具體的需求,,手機在結(jié)合大模型之后,輔助用戶的效果就會更好更便捷,。
借助大模型,,使用手機將不再是一個需要「學(xué)習(xí)」的過程,用戶只需用自然語言表達自己的需求即可,。OPPO 目前基于潘塔納爾融合大模型后,,在 ColorOS 14 上推出的「用機助手」就已經(jīng)邁出了第一步,,通過「對話」理解用戶需求,幫助用戶解決日常高頻使用的復(fù)雜設(shè)置,,將傳統(tǒng)交互方式升級為更智能更便捷的對話方式,。
它的應(yīng)用邏輯是,潘塔納爾先將各種復(fù)雜的用機設(shè)置,,組合構(gòu)建成面向用戶需求的「原子化能力」,,再通過 AndesGPT 理解用戶需求之后,去匹配對應(yīng)的能力并完成設(shè)置,,僅手機的設(shè)置功能就覆蓋了近 400 項,。
所以這場變革,,既是從「界面交互」到「對話交互」的轉(zhuǎn)變,,更是從「用戶學(xué)習(xí)使用計算機」到「計算機主動理解用戶需要」的轉(zhuǎn)變。
這件事,,OPPO 已經(jīng)邁出了第一步,。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1080210.html
溫馨提示:投資有風(fēng)險,,入市須謹(jǐn)慎,。本資訊不作為投資理財建議。