原文來源:硬 AI
作者?| 卜淑清
圖片來源:由無界 AI生成
全球AI競爭必將在明年進(jìn)入新一輪高潮,各大科技巨頭圍繞智能眼鏡展開的爭奪戰(zhàn)也將成為焦點(diǎn),。
隨著多模態(tài)AI強(qiáng)勢崛起,,Meta、谷歌,、微軟,、OpenAI 等公司正競相將更強(qiáng)大的AI技術(shù)應(yīng)用于智能眼鏡和其他可穿戴設(shè)備。
據(jù)The Information最新報道,,谷歌雖然已經(jīng)終止了增強(qiáng)現(xiàn)實(shí)(AR)眼鏡項(xiàng)目,,但仍在為智能眼鏡開發(fā)軟件。上周,,谷歌史上最強(qiáng)AI模型Gemini展示了其多模態(tài)功能,,向打造一個“始終在線”的AI助手的目標(biāo)邁出第一步,但這距離真正實(shí)現(xiàn)可能仍需要數(shù)年時間,。
該媒體援引一位知情人士報道,,OpenAI最近考慮將其物體識別軟件GPT-4與Vision嵌入到Snapchat母公司Snap公司的Spectacles智能眼鏡產(chǎn)品中,這可能會為其帶來新的功能,。
Meta將一款多模態(tài)AI語音助手嵌入了他們正在與奢侈品墨鏡公司Ray-Ban合作開發(fā)的智能眼鏡,,該助手可以描述佩戴者看到的東西,為襯衫搭配褲子提出建議,,并可以將西班牙語文本翻譯成英語,。
另外,近幾個月亞馬遜也在討論一種新型AI設(shè)備,,據(jù)悉該設(shè)備也具備類似的視覺能力,。
01 谷歌:仍在開發(fā)智能眼鏡軟件
據(jù)報道,谷歌雖然早在年中就取消了智能眼鏡的開發(fā),,但仍在為其開發(fā)軟件,,谷歌計劃將軟件授權(quán)給硬件制造商,類似于為三星等手機(jī)制造商開發(fā)安卓移動操作系統(tǒng)的方式,。
谷歌上周發(fā)布視頻展示了Gemini 的部分功能,,比如自動識別用戶表演的電影,對面前物品提出建議,以及學(xué)習(xí)新游戲的能力,。
Gemini家族目前有Gemini Ultra,,Gemini Pro和Gemini Nano三個成員,將向不同的客戶群開放,,但谷歌并未在視頻中公開其所謂的高級版Gemini,,視頻中的用戶交互也做了渲染。
盡管如此,,該視頻展示了谷歌打造一個“始終在線”的AI助手的愿景,,它可以實(shí)時響應(yīng)和理解用戶正在做的事情和看到的東西。
知情人士向The Information透露,,要實(shí)現(xiàn)這種“環(huán)境計算”仍需數(shù)年時間,。作為第一步,谷歌正在重新設(shè)計Pixel手機(jī)的操作系統(tǒng),,嵌入小型的Gemini模型驅(qū)動Pixie AI助手,,處理更加復(fù)雜和多模態(tài)的任務(wù)。據(jù)此前報道,,Pixie能夠根據(jù)用戶拍的照片,,推薦附近的商店買到相關(guān)商品。
谷歌的核心搜索技術(shù)就是預(yù)測和提供用戶需要的信息,,因此開發(fā)這樣的AI設(shè)備非常符合谷歌的定位,。谷歌十年前試水的眼鏡就是一個失敗案例,由于外形尷尬,、實(shí)用性有限,,用戶并不買單。
后來,,谷歌對攝像頭設(shè)計進(jìn)行了調(diào)整,,并推動安卓手機(jī)廠商將手機(jī)攝像頭打造成“第三只眼”,可以掃描環(huán)境并將圖像發(fā)送到谷歌云端分析,,為用戶提供上下文信息,,但這個想法最終縮水成圖像搜索應(yīng)用Google Lens。
02 OpenAI:與Snap強(qiáng)強(qiáng)聯(lián)手
The Information援引一位知情人士報道,,OpenAI最近考慮將其物體識別軟件GPT-4與Vision嵌入到Snapchat母公司Snap公司的Spectacles智能眼鏡產(chǎn)品中,,這可能會為其帶來新的功能。
早在今年3月份,,OpenAI就展示了其AI軟件根據(jù)手繪草圖來構(gòu)建網(wǎng)站的能力,。或許是為了充分發(fā)揮大模型的強(qiáng)大功能,,從那時起,OpenAI首席執(zhí)行官Sam Altman就多次表示,對構(gòu)建一種新的基于AI的消費(fèi)類設(shè)備感興趣,。
值得注意的是,,OpenAI本身沒有設(shè)備團(tuán)隊(duì),但可以與其他公司合作,,比如Snap這樣的設(shè)備制造商,,或者AI芯片設(shè)計商。
另外,,Altman還正在投資一家名叫“Humane”的AI設(shè)備制造商,,這家公司制造帶攝像頭的可穿戴設(shè)備“AI brooch”,計劃制造可以取代智能手機(jī)的AI設(shè)備,。
03 微軟:積極推進(jìn)智能眼鏡相關(guān)AI技術(shù)開發(fā)
微軟正在積極推進(jìn)可應(yīng)用于智能眼鏡和其他小型設(shè)備的AI技術(shù)的研發(fā),,這些技術(shù)或基于語音或圖像識別,目的是賦能更多樣化的智能硬件,。
The Information認(rèn)為,,這些工作可能基于微軟現(xiàn)有的 HoloLens AR頭顯來展開。
報道稱,,微軟正在為 HoloLens嵌入一種AI軟件,,用戶可以通過語音與 OpenAI技術(shù)驅(qū)動的聊天機(jī)器人討論相機(jī)拍攝的物體。
04 蘋果:已在硬件上做好準(zhǔn)備
蘋果在多模態(tài)AI技術(shù)上較競爭對手相對落后,,但也在這一領(lǐng)域開展了一定工作,。具體來說,
蘋果已通過即將發(fā)售的Vision Pro頭顯,,在硬件上做好應(yīng)用多模態(tài)AI技術(shù)的準(zhǔn)備,。
蘋果在AI算法方面落后于同行,直到今年才開始重點(diǎn)研究大型語言模型(LLM),,此前相關(guān)研究僅停留在初步階段,。
The Information報道稱,目前沒有跡象表明Vision Pro會在近期具備復(fù)雜的物體識別等多模態(tài)功能,。
但是,,蘋果這些年致力于增強(qiáng)Vision Pro 的計算機(jī)視覺能力,使其可以快速識別周遭環(huán)境,,例如識別家具,、判斷環(huán)境是客廳、臥室還是廚房,,蘋果目前正在開發(fā)可以識別圖像和視頻的多模態(tài)模型,。
Vision Pro的一個主要障礙是體積較大、笨重,,也不太適合戶外佩戴,。今年早些時候,,蘋果據(jù)傳暫停了AR眼鏡的研發(fā)以專注推出頭顯產(chǎn)品。目前不清楚眼鏡項(xiàng)目何時重新啟動,,但未來可能實(shí)現(xiàn)多模態(tài)功能,。
05 Meta:與Ray-Bans優(yōu)勢互補(bǔ)
12月12日,Meta和奢侈品墨鏡公司Ray-Bans合作的新產(chǎn)品——Meta Ray-Bans智能眼鏡,,開始推出多項(xiàng)AI功能:拍照,、計算食物卡路里、識別植物,、翻譯等,。從媒體和扎克伯格的試用來看,Meta Ray-Bans智能眼鏡AI功能的表現(xiàn)似乎還不錯,。
早在今年9月接受媒體采訪時,,扎克伯格就透露過,Meta會在智能眼鏡上推出多模態(tài)AI功能,。所謂的多模態(tài),,即支持文本、圖像,、語音等多種形式的媒介輸入的AI,。
據(jù)報道,Meta未來還計劃讓眼鏡能夠檢測人體的感官數(shù)據(jù),,進(jìn)一步強(qiáng)化多模態(tài)能力,。眼鏡上搭載的高通AI芯片目前似乎表現(xiàn)良好,Meta未來還計劃進(jìn)一步對使用流程進(jìn)行優(yōu)化,。
目前,,Meta眼鏡已經(jīng)上架銷售,售價為300美元,,AI功能處于早期測試階段,,僅向部分用戶開放。但值得指出的是,,Meta也表示,,會使用匿名數(shù)據(jù)來幫助改進(jìn)眼鏡的AI服務(wù),可能會讓許多關(guān)心隱私的用戶感到不適,。
06 亞馬遜:計劃退出多模態(tài)AI新設(shè)備
據(jù)直接了解該項(xiàng)目的人士向The Information透露,,今年夏天,亞馬遜Alexa團(tuán)隊(duì)計劃推出一款能夠運(yùn)行多模態(tài)AI的新設(shè)備,。
這位人士表示,,該團(tuán)隊(duì)特別感興趣的是,如何減少在設(shè)備上處理圖像,、視頻和語音的AI計算和內(nèi)存需求,。
報道稱,,目前尚不清楚該項(xiàng)目是否獲得資金支持,也不清楚該設(shè)備打算為客戶解決什么問題,,但它與亞馬遜老產(chǎn)品 Echo 語音助理設(shè)備系列是分開的,。
Alexa 團(tuán)隊(duì)多年來一直致力于新型設(shè)備的開發(fā),其中包括一款名為 Echo Frames 的智能音頻眼鏡,。然而,目前尚不清楚,,亞馬遜是否會在該眼鏡的基礎(chǔ)上開發(fā)具有視覺識別功能的設(shè)備,,因?yàn)樗淮钶d屏幕顯示器或攝像頭。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1083558.html
溫馨提示:投資有風(fēng)險,,入市須謹(jǐn)慎。本資訊不作為投資理財建議,。