【年度專題】AI+AR,將促成下一代計算平臺的飛躍
文/VR陀螺 萬里
近期百度公布了2023年百度沸點年度關鍵詞,不出意外,生成式AI赫然在列。
去年一年當中,各大科技巨頭相繼發(fā)布了其AI大模型,GPT-4、LLaMA、PaLM2、Runway Gen 2、文心一言、Meta AI、Gemini......AI大模型產品無疑是目前科技圈最重要的“興奮劑“,而其更新迭代速度也讓很多人眼花繚亂。
目前AI已然成為電子消費市場的核心訴求之一,這點在我們今天要聊的AR眼鏡市場也同樣如此。
在早些時候,AR眼鏡的重要議題仍停留在“AR眼鏡能否成為下一代計算平臺?”而到了現(xiàn)在,社會更關注的議題已經變成“未來眼鏡形態(tài)的智能終端能否成為AI的絕佳載體?”
無論是新的計算平臺,又或是新的AI計算終端,AR眼鏡都成為了其中不容忽視的關鍵一環(huán)。
本文將回顧2023年以來一眾AR廠商關于AI應用場景的探索,并展望“AI+AR”兩者的發(fā)展趨勢。
圖源:VR陀螺
AI+AR是眾望所歸,當前AR眼鏡的 AI能力仍集中于語音交互
從2023這一年的發(fā)展來看,AI對于AR眼鏡的重要性已無需多言。關于這點我們可以先從AR行業(yè)大咖發(fā)聲中略窺一二:
Meta CEO 扎克伯格:我認為智能眼鏡將成為未來的一個重要平臺......之前團隊不少人認為智能眼鏡只有當真正實現(xiàn)3D全息圖、內置顯示器等才會真正普及,但是這需要很長的時間。如今得益于AI的進步,內置的AI助手將能看到你所看到的,聽到你所聽到的,AI將與其他AR功能同樣重要。
Snap CEO Evan Spiegel:我相信我們都在腦海中對自己想要創(chuàng)造的東西有一個愿景。然而,通常情況下,這些工具不夠復雜,無法讓我們將想象的圖像、視頻或AR體驗變?yōu)楝F(xiàn)實。我認為AI將有助于彌合我們的想象力和我們可以在手機或AR眼鏡上實際創(chuàng)造的東西之間的差距。
圖源:Snap
雷鳥創(chuàng)新 CEO 李宏偉:我們相信,AI 會是 AR 眼鏡上第一個 Killer APP......AI 和 AR 的結合可以給未來的鏡像世界打造非常好的內容基礎。未來元宇宙的內容很大程度上會是 3D 內容,3D 內容的產生比較復雜,而 AI 大模型可以在這一方面發(fā)揮特別重要的作用。
李未可科技 創(chuàng)始人兼CEO 茹憶:AR眼鏡有望成為“下一代計算終端”,而AI的交互能力,也將成為AR眼鏡的核心能力。二者的深度結合,將使AR眼鏡成為一個真正意義上無縫融入人們生活的智能設備,而不僅僅是一個離頭最近的玩具。同時,在AI 和AR的深度融合方面,李未可正在打造的是 AI Agent,它也并非是一個更智能的助理或是更方便的交互模式如此簡單,AI Agent 將是融合手機上所有Apps 的能力,成為 AR眼鏡的一個系統(tǒng)。
圖源:李未可科技
如果回顧2023年所發(fā)布的AR眼鏡產品,可以發(fā)現(xiàn)其中大多數(shù)產品都與AI進行了靠攏,并且嘗試基于AI為用戶帶來更優(yōu)秀的使用體驗。如果展開來看,其中不乏隱性的AI能力構建,比如基于AI算法提升語音識別準確率、在交互場景中通過AI提升手勢識別以及SLAM的魯棒性等。而對于用戶而言,最容易感知的莫過于AR廠商基于AI為我們帶來的新功能以及場景探索。
2023 AR眼鏡及其AI玩法盤點(圖源:VR陀螺)
以下是常見的AI功能玩法:
語音助手:這是目前AR眼鏡設備最為常見的AI體驗,當設備接入ChatGPT或者類似的大型自然語言模型后,眼鏡支持上下文語意理解,并且能夠以更趨近于真人的方式回復用戶。舉例而言,李未可Meta Lens S3搭載了大型語言模型AI系統(tǒng),你可以通過語音的方式與設備閑聊、獲得一些健身、旅游行程方面的建議等。你可以面向設備詢問各種五花八門的問題,有時候還會獲得一些意想不到的回復。
Meta Lens S3的“吐槽垃圾桶”功能(圖源:VR陀螺)
物體識別:這也是AR眼鏡常見功能之一,較為典型的產品是Ray-Ban Meta,它將在今年引入建筑識別、菜單/路牌翻譯等功能。國內雷鳥X2、ARKnovv A1等產品也內置了識物功能,不過基于當前體驗來看,設備的物體識別準確率還有待提升。
海外的Envision Glasses則另辟蹊徑為眼鏡開發(fā)了一項人臉識別功能,它可以識別生活中親朋好友的面孔,用以解決一些患有視障或者臉盲癥的用戶群體的社交問題。
雷鳥X2識圖功能(圖源:VR陀螺)
生活/辦公助理:目前已經有部分AI智能終端顯露出了“AI Agent"的苗頭,在這一方面Ai Pin走在了前列。Ai Pin與用戶的社交生活進行了深度綁定,如用戶可通過語音指令驅動設備向親友發(fā)送符合心意的聊天回復;AI可以幫助用戶快速整理郵件并提取有價值的信息;AI可以提供生日禮物購買建議并快速下單等。
除Ai Pin外,我們也可以從Rokid設備中看到類似的用例。Rokid在去年Rokid Jungle活動期間亮相了空間搜索功能,當用戶搜索網(wǎng)頁、視頻等內容時,系統(tǒng)會根據(jù)信息的權重呈現(xiàn)出不同的排列方式,該功能不但兼顧了AR的使用直覺,同時也通過AI功能進一步提升了用戶對于信息的獲取效率。
圖源:Rokid
圖生圖:目前AR眼鏡設備關于“AI生成內容”的玩法仍以文生文體驗為主,文生圖、文生視頻等體驗則相對稀缺。ARKnovv A1是目前為數(shù)不多的支持AI圖生圖的眼鏡產品,眼鏡可以對其拍攝畫面進行“二創(chuàng)”以生成風格多樣化的圖片,并支持導出到社交平臺。該功能背后依賴于開源大模型Stable Diffution。
ARKnovv A1的AR創(chuàng)作功能(圖源:VR陀螺)
多模態(tài)AI是眾望所歸 全天候AI是北極星指標
如果說2023年是“AI+AR”的小試牛刀,那么2024年便是其進一步爆發(fā)的節(jié)點。有消息指出,在新的一年中,華為、科大訊飛等更多廠商會進一步入局AR眼鏡市場,以實現(xiàn)市場占位。從功能來看,預計“AI+AR”將會迎來以下新變化:
多模態(tài)AI
目前AR眼鏡所采用的多為單模態(tài)AI大模型,這使得產品的玩法相對單一,難以實現(xiàn)更復雜的多元信息處理能力。未來我們有望看到多模態(tài)AI在眼鏡終端的進一步應用落地。
所謂多模態(tài)AI,指的是能同時處理文本、圖像、音視頻、代碼等多種信息的人工智能,它的信息處理方式更接近于人類的“所看、所聽、所想”。近期谷歌所發(fā)布的Gemini正是多模態(tài)AI的代表之一,從演示視頻中我們可以發(fā)現(xiàn)Gemini可以“理解”用戶在紙上所畫的內容,并能結合用戶的對話交流給予相應的反饋。
Gemini演示視頻(圖源:谷歌)
無獨有偶,Meta也正在為Ray-Ban Meta引入多模態(tài)AI能力,去年年底扎克伯格展示了基于智能眼鏡的一個服裝搭配使用場景:當眼鏡鏡頭對準衣服,AI不僅可以識別襯衫的樣式,并且還能進一步給出相應的穿搭建議。在這么一個簡單的場景中,其實需要調用自然語言處理、圖片識別、推理等多種能力,這些都是單模態(tài)AI所難以實現(xiàn)的。
可以預見,未來多模態(tài)AI將有望成為AR眼鏡的標配,甚至我們可以進一步推測:AR眼鏡產品的攝像頭將會成為至關重要的模組之一,攝像頭或許會在AR眼鏡上率先落地,其優(yōu)先級甚至會高于光學屏幕。
圖源:Meta
更強的生產力屬性:
除智能手表、智能手機以外,AR眼鏡同樣是一個絕佳的隨身攜帶可穿戴式設備。當前智能手機主要作為用戶信息中樞、智能手表從中探索出來的核心應用場景是信息輔助以及健康檢測。AR眼鏡的殺手級應用無疑是“AI Agent”,因為它具備了與用戶一樣以第一視角感知、記錄世界的能力(這些是其他設備所欠缺的)。隨著AI能力的提升,AR眼鏡無疑會化身為更強大的私人助理。
未來AI+AR將會更為深度的參與到我們的工作以及學習流程,比如谷歌去年上線的Google Lens搜題答題功能,借助AI可以快速分析一些K12課程題目并且給予解答;此外,在會議場景中,在AI技術的幫助下,我們有望使用AR眼鏡快速生成會議紀要等。
圖源:谷歌
LBS玩法的進一步落地:
走出戶外一直都是AR眼鏡所倡導的核心價值之一,當前的AR眼鏡已不乏相應的探索,比如ARKnovv A1的探店、 Ray-Ban Meta的建筑識物等。
而李未可科技Meta Lens系列產品更是直接選擇從騎行、徒步、城市旅游等大戶外場景切入,通過AR+LBS以為這類用戶群體構建更好的運動體驗。
如Meta Lens S3內置的 AI 助手可在騎行時起到領航員的作用;在CityWalk場景下,眼鏡除導航外還可以識別街景信息,并為用戶介紹沿途景點和推薦美食。除此之外,Meta Lens 3配備了一枚拍攝按鈕,方便用戶能在旅途過程中通過第一視角記錄生活。
圖源:李未可科技
隨著光學以及AI等技術的升級,未來AR眼鏡有望進一步拓寬其LBS娛樂玩法。如扎克伯格曾在Meta Connect 2023期間提到了一個“網(wǎng)球裁判”的眼鏡用例,在網(wǎng)球運動中,如果雙方對于球是否出界等意見有分歧,則可以進一步參考AI的意見。
目前Snap、谷歌、蘋果等廠商都在積極完善其地圖服務,如Snap的基于地圖的社交、蘋果近期對地圖AR導航功能加大了投入,未來這些LBS體驗也會進一步遷移到AR眼鏡終端。
圖源:蘋果
全天候AI:
基于續(xù)航方面考慮,目前AR眼鏡的AI功能都需要基于喚醒詞或者按鍵的方式激活,這種體驗方式距離真正的“AI Agent”顯然還有很遠距離。在理想情況下,AI應該能夠全天候陪伴我們,隨時響應我們的需求,并且它還能像計步器一樣通過不斷記錄用戶所觸達的外在信息最終讓產品更了解我們。
Meta CTO Andrew Bosworth也曾表達了類似的愿景:“未來眼鏡將會擁有功耗足夠低的傳感器,它能夠檢測到觸發(fā)意識的事件,從而觸發(fā)人工智能,這才是我們真正的夢想。”目前距離全天候AI顯然還有很長的路要走,這是值得未來持續(xù)努力的重要方向。
如今的AR眼鏡類產品續(xù)航普遍在4小時以內,而Meta Lens 3表現(xiàn)會稍好,達到了6-8小時。為了解決全天候使用的問題,Ray-Ban Meta等產品采用的是結合充電盒補電的方式,而Ai Pin則設計了電池外置磁吸方案,可進行快速換電。
圖源:Meta
潛在的問題: 算力、隱私與產品形態(tài)之爭
無可否認,AR眼鏡仍處于非常早期的階段,反映在出貨量上,AR產品國內只有數(shù)十萬臺區(qū)間,遠不及智能眼鏡的零頭;反映在產品形態(tài)方面,其仍處于探索期,產品百花齊放,如包含了分體式、一體式方案,其中又涉及了觀影、信息輔助、拍攝等場景的探索。
AR眼鏡仍未成熟,發(fā)展路上仍需要解決諸多問題:
算力問題:
以一體式AR眼鏡為例,其搭載的主處理器芯片種類頗多:如INMO Go搭載的是炬芯科技ATS3085芯片、雷鳥X2搭載的是驍龍XR2、MYVU探索版搭載的是驍龍SW5100等。
高通于去年發(fā)布了專門面向于AR眼鏡的最新芯片平臺驍龍AR1,這是一款低功耗芯片,并且采用第三代Hexagon NPU,支持終端側部署視覺搜索、實時翻譯等AI能力。目前Ray-Ban Meta以及雷鳥X2 Lite已經搭載該處理器,不排除今年會有更多眼鏡產品采用該方案。
不過另一邊,伴隨著高通XR2 Gen 2以及AR1的發(fā)布,我們也可以預見未來較長一段時間頭顯以及眼鏡設備功能的分野:頭顯具備更強的性能,用以支撐更復雜的游戲應用體驗,而AR眼鏡(特別是一體式AR眼鏡)則會更聚焦于AI信息輔助、拍照等輕量化玩法。在算力薄弱的情況下如何進一步引入具有龐大參數(shù)的AI模型會是一大考驗。
圖源:高通
隱私問題:
早在十多年前Google Glass推出時,社會各界便開始對“掛在眼前的攝像頭”這一類產品感到警惕。伴隨著AR眼鏡出貨量的提升,由此導致的隱私問題將會持續(xù)存在并且日益嚴重。
關于如何減輕由AR眼鏡攝像頭所引發(fā)的隱私困擾,當前AR眼鏡廠商的思路主要有兩種,一類是Ray-Ban Meta和Ai Pin等產品,它們傾向于加入一個無法關閉的相機指示燈,這樣可以在設備相機工作時起到提醒路人的作用。而還有一種設計思路則會傾向于將攝像頭盡量設計得小巧,以更好隱藏于機身當中。
Ray-Ban Meta左側的相機指示燈(圖源:Meta)
產品形態(tài)問題:
IDC 2024年中國智能終端十大洞察報告指出,預計2024年中國市場上搭載AI功能的終端設備將超70%,AI終端占比將達55%。除了AR眼鏡外,AI能力也還在PC、智能手機以及智能手表等品類中不斷得到強化。
有關AI硬件的終極形態(tài)的爭論不絕于耳,眼鏡會是其中一種理想形態(tài),但也有可能不是唯一解。
2023年最值得關注的AI產品自然離不開Ai Pin,它在智能手表以及智能眼鏡等可穿戴式設備的基礎之上開辟了一個全新的賽道,它主打集成AI的私人助理,并且有意通過投影方案來弱化海量信息對于用戶的視覺侵擾。目前用戶對于這款產品褒貶不一,后續(xù)市場表現(xiàn)有待進一步觀察。
目前一眾智能手機廠商也已經選擇擁抱AI,如近期OPPO發(fā)布了安第斯大模型(AndesGPT),模型最高包含上千億個參數(shù),可以靈活端側部署于未來的智能手機、智能手表、平板電腦等產品中。
當前AR眼鏡的一大困境在于內容生態(tài)的薄弱,這點反映在AI體驗上也同樣如此,導航、翻譯、識物....這些功能在手機側也已經具有完善的解決方案,未來AR眼鏡如何走出差異化路線則是值得持續(xù)關注的問題。
圖源:OPPO
結語
當前AR眼鏡市場似乎已經來到了指數(shù)級爆發(fā)增長的前沿,IDC預測2024年中國AR市場出貨量將增長101%;有人則認為AR眼鏡會在2030年徹底取代我們的手機電腦。
目前AR核心光學技術不斷迎來捷報,而市場的”AI軍備競賽“又在加速著AGI的到來。在AI的加持之下,今年的AR市場,無疑是肉眼可見的令人期待。
原文標題 : 【年度專題】AI+AR,將促成下一代計算平臺的飛躍
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-12.26立即報名>>> 【在線會議】村田用于AR/VR設計開發(fā)解決方案
-
1月8日火熱報名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會
-
即日-1.14火熱報名中>> OFweek2025中國智造CIO在線峰會
-
即日-1.24立即參與>>> 【限時免費】安森美:Treo 平臺帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產業(yè)大會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市