原文來(lái)源:硬 AI
作者?| 卜淑清
圖片來(lái)源:由無(wú)界 AI生成
全球AI競(jìng)爭(zhēng)必將在明年進(jìn)入新一輪高潮,,各大科技巨頭圍繞智能眼鏡展開的爭(zhēng)奪戰(zhàn)也將成為焦點(diǎn),。
隨著多模態(tài)AI強(qiáng)勢(shì)崛起,Meta,、谷歌,、微軟、OpenAI 等公司正競(jìng)相將更強(qiáng)大的AI技術(shù)應(yīng)用于智能眼鏡和其他可穿戴設(shè)備,。
據(jù)The Information最新報(bào)道,,谷歌雖然已經(jīng)終止了增強(qiáng)現(xiàn)實(shí)(AR)眼鏡項(xiàng)目,但仍在為智能眼鏡開發(fā)軟件,。上周,,谷歌史上最強(qiáng)AI模型Gemini展示了其多模態(tài)功能,向打造一個(gè)“始終在線”的AI助手的目標(biāo)邁出第一步,,但這距離真正實(shí)現(xiàn)可能仍需要數(shù)年時(shí)間,。
該媒體援引一位知情人士報(bào)道,OpenAI最近考慮將其物體識(shí)別軟件GPT-4與Vision嵌入到Snapchat母公司Snap公司的Spectacles智能眼鏡產(chǎn)品中,這可能會(huì)為其帶來(lái)新的功能,。
Meta將一款多模態(tài)AI語(yǔ)音助手嵌入了他們正在與奢侈品墨鏡公司Ray-Ban合作開發(fā)的智能眼鏡,,該助手可以描述佩戴者看到的東西,為襯衫搭配褲子提出建議,,并可以將西班牙語(yǔ)文本翻譯成英語(yǔ),。
另外,近幾個(gè)月亞馬遜也在討論一種新型AI設(shè)備,,據(jù)悉該設(shè)備也具備類似的視覺能力,。
01 谷歌:仍在開發(fā)智能眼鏡軟件
據(jù)報(bào)道,,谷歌雖然早在年中就取消了智能眼鏡的開發(fā),,但仍在為其開發(fā)軟件,谷歌計(jì)劃將軟件授權(quán)給硬件制造商,,類似于為三星等手機(jī)制造商開發(fā)安卓移動(dòng)操作系統(tǒng)的方式,。
谷歌上周發(fā)布視頻展示了Gemini 的部分功能,比如自動(dòng)識(shí)別用戶表演的電影,,對(duì)面前物品提出建議,,以及學(xué)習(xí)新游戲的能力。
Gemini家族目前有Gemini Ultra,,Gemini Pro和Gemini Nano三個(gè)成員,,將向不同的客戶群開放,但谷歌并未在視頻中公開其所謂的高級(jí)版Gemini,,視頻中的用戶交互也做了渲染,。
盡管如此,該視頻展示了谷歌打造一個(gè)“始終在線”的AI助手的愿景,,它可以實(shí)時(shí)響應(yīng)和理解用戶正在做的事情和看到的東西,。
知情人士向The Information透露,要實(shí)現(xiàn)這種“環(huán)境計(jì)算”仍需數(shù)年時(shí)間,。作為第一步,,谷歌正在重新設(shè)計(jì)Pixel手機(jī)的操作系統(tǒng),嵌入小型的Gemini模型驅(qū)動(dòng)Pixie AI助手,,處理更加復(fù)雜和多模態(tài)的任務(wù),。據(jù)此前報(bào)道,Pixie能夠根據(jù)用戶拍的照片,,推薦附近的商店買到相關(guān)商品,。
谷歌的核心搜索技術(shù)就是預(yù)測(cè)和提供用戶需要的信息,因此開發(fā)這樣的AI設(shè)備非常符合谷歌的定位,。谷歌十年前試水的眼鏡就是一個(gè)失敗案例,,由于外形尷尬、實(shí)用性有限,用戶并不買單,。
后來(lái),,谷歌對(duì)攝像頭設(shè)計(jì)進(jìn)行了調(diào)整,并推動(dòng)安卓手機(jī)廠商將手機(jī)攝像頭打造成“第三只眼”,,可以掃描環(huán)境并將圖像發(fā)送到谷歌云端分析,,為用戶提供上下文信息,但這個(gè)想法最終縮水成圖像搜索應(yīng)用Google Lens,。
02 OpenAI:與Snap強(qiáng)強(qiáng)聯(lián)手
The Information援引一位知情人士報(bào)道,,OpenAI最近考慮將其物體識(shí)別軟件GPT-4與Vision嵌入到Snapchat母公司Snap公司的Spectacles智能眼鏡產(chǎn)品中,這可能會(huì)為其帶來(lái)新的功能,。
早在今年3月份,,OpenAI就展示了其AI軟件根據(jù)手繪草圖來(lái)構(gòu)建網(wǎng)站的能力?;蛟S是為了充分發(fā)揮大模型的強(qiáng)大功能,,從那時(shí)起,OpenAI首席執(zhí)行官Sam Altman就多次表示,,對(duì)構(gòu)建一種新的基于AI的消費(fèi)類設(shè)備感興趣,。
值得注意的是,OpenAI本身沒有設(shè)備團(tuán)隊(duì),,但可以與其他公司合作,,比如Snap這樣的設(shè)備制造商,或者AI芯片設(shè)計(jì)商,。
另外,,Altman還正在投資一家名叫“Humane”的AI設(shè)備制造商,這家公司制造帶攝像頭的可穿戴設(shè)備“AI brooch”,,計(jì)劃制造可以取代智能手機(jī)的AI設(shè)備,。
03 微軟:積極推進(jìn)智能眼鏡相關(guān)AI技術(shù)開發(fā)
微軟正在積極推進(jìn)可應(yīng)用于智能眼鏡和其他小型設(shè)備的AI技術(shù)的研發(fā),這些技術(shù)或基于語(yǔ)音或圖像識(shí)別,,目的是賦能更多樣化的智能硬件,。
The Information認(rèn)為,這些工作可能基于微軟現(xiàn)有的 HoloLens AR頭顯來(lái)展開,。
報(bào)道稱,,微軟正在為 HoloLens嵌入一種AI軟件,用戶可以通過語(yǔ)音與 OpenAI技術(shù)驅(qū)動(dòng)的聊天機(jī)器人討論相機(jī)拍攝的物體,。
04 蘋果:已在硬件上做好準(zhǔn)備
蘋果在多模態(tài)AI技術(shù)上較競(jìng)爭(zhēng)對(duì)手相對(duì)落后,,但也在這一領(lǐng)域開展了一定工作。具體來(lái)說(shuō),,
蘋果已通過即將發(fā)售的Vision Pro頭顯,,在硬件上做好應(yīng)用多模態(tài)AI技術(shù)的準(zhǔn)備。
蘋果在AI算法方面落后于同行,直到今年才開始重點(diǎn)研究大型語(yǔ)言模型(LLM),,此前相關(guān)研究?jī)H停留在初步階段,。
The Information報(bào)道稱,目前沒有跡象表明Vision Pro會(huì)在近期具備復(fù)雜的物體識(shí)別等多模態(tài)功能,。
但是,,蘋果這些年致力于增強(qiáng)Vision Pro 的計(jì)算機(jī)視覺能力,使其可以快速識(shí)別周遭環(huán)境,,例如識(shí)別家具,、判斷環(huán)境是客廳、臥室還是廚房,,蘋果目前正在開發(fā)可以識(shí)別圖像和視頻的多模態(tài)模型,。
Vision Pro的一個(gè)主要障礙是體積較大、笨重,,也不太適合戶外佩戴,。今年早些時(shí)候,,蘋果據(jù)傳暫停了AR眼鏡的研發(fā)以專注推出頭顯產(chǎn)品,。目前不清楚眼鏡項(xiàng)目何時(shí)重新啟動(dòng),但未來(lái)可能實(shí)現(xiàn)多模態(tài)功能,。
05 Meta:與Ray-Bans優(yōu)勢(shì)互補(bǔ)
12月12日,,Meta和奢侈品墨鏡公司Ray-Bans合作的新產(chǎn)品——Meta Ray-Bans智能眼鏡,開始推出多項(xiàng)AI功能:拍照,、計(jì)算食物卡路里,、識(shí)別植物、翻譯等,。從媒體和扎克伯格的試用來(lái)看,,Meta Ray-Bans智能眼鏡AI功能的表現(xiàn)似乎還不錯(cuò)。
早在今年9月接受媒體采訪時(shí),,扎克伯格就透露過,,Meta會(huì)在智能眼鏡上推出多模態(tài)AI功能。所謂的多模態(tài),,即支持文本,、圖像、語(yǔ)音等多種形式的媒介輸入的AI,。
據(jù)報(bào)道,,Meta未來(lái)還計(jì)劃讓眼鏡能夠檢測(cè)人體的感官數(shù)據(jù),進(jìn)一步強(qiáng)化多模態(tài)能力,。眼鏡上搭載的高通AI芯片目前似乎表現(xiàn)良好,,Meta未來(lái)還計(jì)劃進(jìn)一步對(duì)使用流程進(jìn)行優(yōu)化。
目前,Meta眼鏡已經(jīng)上架銷售,,售價(jià)為300美元,,AI功能處于早期測(cè)試階段,僅向部分用戶開放,。但值得指出的是,,Meta也表示,會(huì)使用匿名數(shù)據(jù)來(lái)幫助改進(jìn)眼鏡的AI服務(wù),,可能會(huì)讓許多關(guān)心隱私的用戶感到不適,。
06 亞馬遜:計(jì)劃退出多模態(tài)AI新設(shè)備
據(jù)直接了解該項(xiàng)目的人士向The Information透露,今年夏天,,亞馬遜Alexa團(tuán)隊(duì)計(jì)劃推出一款能夠運(yùn)行多模態(tài)AI的新設(shè)備,。
這位人士表示,該團(tuán)隊(duì)特別感興趣的是,,如何減少在設(shè)備上處理圖像,、視頻和語(yǔ)音的AI計(jì)算和內(nèi)存需求。
報(bào)道稱,,目前尚不清楚該項(xiàng)目是否獲得資金支持,,也不清楚該設(shè)備打算為客戶解決什么問題,但它與亞馬遜老產(chǎn)品 Echo 語(yǔ)音助理設(shè)備系列是分開的,。
Alexa 團(tuán)隊(duì)多年來(lái)一直致力于新型設(shè)備的開發(fā),,其中包括一款名為 Echo Frames 的智能音頻眼鏡。然而,,目前尚不清楚,,亞馬遜是否會(huì)在該眼鏡的基礎(chǔ)上開發(fā)具有視覺識(shí)別功能的設(shè)備,因?yàn)樗淮钶d屏幕顯示器或攝像頭,。
免責(zé)聲明:本文來(lái)自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,,版權(quán)歸原作者所有,。轉(zhuǎn)載請(qǐng)注明出處:http://lequren.com/1083558.html
溫馨提示:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,。本資訊不作為投資理財(cái)建議,。