VR/AR/腦機接口是集閤瞭微顯示、傳感器、芯片和算法等多項技術在內的下一代人機交互平台。迴顧整個人機交互發展曆程,我們看到人機交互的指令輸入形式和反饋輸齣形式都在朝著更低的操作門檻和更高的交互效率演變。當前我們正站在智能手機時代和下一個交互形態的交界處,我們認為盡管 VR/AR 在輸入技術(傳感)和輸齣技術(顯示)方麵均較上一代交互設備有顯著飛躍,但目前仍處於發展的早期階段。隨著元宇宙應用的發展和內容生態的完善,元宇宙對硬件的需求逐步清晰,將推動 VR/AR/腦機接口設備的逐步升級,最終有望齣現可以和 PC、智能手機媲美的下一代硬件。
本期的智能內參,我們推薦華泰證券的報告《人機交互係統是通往元宇宙的入口》,分析VR、AR和腦機接口設備在元宇宙時代的發展趨勢。
來源 華泰證券
原標題:
《人機交互係統是通往元宇宙的入口》
作者:黃樂平 等
一、元宇宙場景落地,定義下一代 VR/AR/腦機接口升級方嚮
隨著元宇宙應用場景的清晰化,未來 VR/AR/腦機接口的發展方嚮逐漸明確。早期的硬件設備受製於應用場景和內容單一化、用戶對硬件設備的體驗不完善等缺陷,初代VR/AR 並未實現大規模增長。當前時點,我們看到遊戲、電商、協同辦公、社交、健身、醫療、視頻和模擬訓練(教育)等元宇宙應用場景正逐漸清晰,這對 VR/AR/腦機接口硬件端提齣瞭更高的需求,有望驅動包括微顯示技術、三維重建、生物傳感器、肌電/腦電處理、全身追蹤、空間定位在內的多項底層技術不斷完善。
▲ 元宇宙各大應用場景對沉浸感和交互感的要求
元宇宙時代的應用比移動互聯網時代更強調沉浸感和交互感,不同應用對兩種效果的側重各有不同。其中,沉浸感可通過更豐富的音畫效果和更多維度的感官交互獲得,例如藉助場景渲染、沉浸聲場、溫度模擬、觸覺傳感等技術營造齣逼真的虛擬場景,使大腦産生“身臨其境”的感覺;交互感則需藉助多樣化的輸入方式來降低人機交互的操作門檻,例如直接通過識彆語音或讀取手勢來傳達指令,無需打字或操作鍵鼠/按鈕,增強互動效率。
1、遊戲:強調“沉浸感”的元宇宙遊戲需要多平台/VRAR/雲原生技術作為底層技術支撐
當前遊戲已具備元宇宙所擁有的虛擬身份、朋友、經濟係統等特點,但未能給玩傢完全帶來“沉浸感”,硬件方麵主要受製於近眼顯示和多維感官傳感技術不夠成熟。未來,元宇宙遊戲將朝著更強的沉浸感與更豐富的內容生態方嚮發展,需要藉助成熟的場景渲染和沉浸聲場技術增強聲畫效果,藉助全身運動追蹤、傳感器、空間定位等技術增強臨場感。我們認為優質的遊戲內容創新將與 VR/AR 硬件升級互相形成正反饋效應,促進元宇宙遊戲生態的發展,並為高性能計算芯片、矽基 OLED、Micro LED 以及相關設備組裝企業帶來增量空間。
▲ 元宇宙遊戲發展方嚮及底層技術
2、 電商:虛實交融的沉浸式購物模式為近眼顯示、 AI 芯片、傳感器帶來發展機遇
傳統電商平台仍主要以圖片和視頻等平麵化形式展示商品。盡管近年來電商直播、AR 試妝等形式興起,一定程度上彌補瞭傳統電商在購物時較為單薄的觀感體驗,然而對於服飾等SKU 豐富的非標品類商品,用戶仍然無法對其進行在綫試品。在“在綫即在場”的終極需求驅動下,元宇宙時代的電商有望進一步突破物質世界屏障,通過 AR/VR/MR 等新一代人機交互平台實現視聽甚至觸覺等多感官交互的購物體驗,創造如 3D 虛擬商場、數字展館等消費者購買場景。我們認為這一進程主要依賴於近眼顯示、三維重建、觸覺傳感乃至虛擬人等技術的成熟,將為相關微顯示、傳感器、芯片企業帶來增長空間。
▲ 元宇宙電商有望藉助 VR/AR/MR 實現“在綫即在場”的沉浸式購物體驗
3、 協同辦公 / 社交:藉助手勢追蹤、語音識彆、眼動追蹤、虛擬化身實現互動感
未來元宇宙辦公/社交有望突破物理空間的局限,將帶來最接近實地麵對麵的工作和交友體 驗,提升辦公生産、溝通、協作效率。當前移動互聯網階段的遠程辦公距離理想模式有一定差距,工作效率與溝通效果仍存在局限性。而元宇宙辦公/社交則強調互動感,例如,用戶可以全程通過手勢操作,即可滿足在 VR 虛擬空間中舉手、竪大拇指點贊等功能,顯著降低人機交互平台操作門檻,同時實現無距離感互動。這一場景的實現將主要藉助手勢讀取、眼動追蹤、語音識彆、空間定位等 VR/AR 底層技術。
4、 醫療與健康: VR/AR/ 腦機硬件將搭載先進生物監測以及腦電信號處理技術
在 VR/AR 方麵,盡管目前已齣現瞭拳擊、攀岩、球類運動等輔助健身的應用,欠佳的硬件佩戴體驗卻限製瞭用戶使用時長。一方麵,VR 設備的眩暈感仍未完全消除,運動健身應用中高速變換的場景將進一步加劇不適感;另一方麵,目前主流 VR 頭顯的重量大多在 300g以上,VR 一體機甚至普遍超過 500g,大大增加瞭佩戴者運動時的負擔。因此,顯示技術和輕薄化是硬件廠商重點攻剋的方嚮,我們看好具有超輕薄、高清晰度、低功耗、低延遲等特點的矽基 OLED(索尼、視涯等),以及具有無感佩戴且不妨礙正常視綫優勢的入眼式AR 設備(InWith 和 Mojo Vision 等)的發展機會。
在生物監測方麵,當前隨著心率監測、血氧檢測技術的成熟,已有部分智能手環和手錶産品中引入瞭醫療級功能,我們認為嚮著更專業的醫療設備進化將是智能穿戴重要發展方嚮。未來,智能穿戴産品有望大規模搭載 ECG 心電圖以及無創血糖檢測等新功能,針對老年群體、慢病群體提供更專業的服務,這也對血糖、血氧等生物監測技術提齣瞭更高的要求。長期來看,人機交互硬件在醫療與健康領域有望拓展到服務神經係統和肌肉係統癱瘓的患者(如腦、脊髓疾病、中風、外傷等),這一需求將為腦機接口技術創造可觀的發展前景。
▲ 生物檢測與輔助健身場景
5、 視頻: VR/AR 技術帶來高沉浸感的流媒體觀賞體驗
傳統影視作品、長視頻與短視頻仍主要通過電視、影院、視頻平台等媒介傳播,受製於平麵化的錶現形式,內容的錶現力仍有較大提升空間。元宇宙時代,觀眾有望使用先進 VR/AR設備更沉浸地觀看電影、現場實況、音樂會等內容,娛樂性與體驗感將迎來質的飛躍。目前包括 Netflix 和愛奇藝在內的長視頻平台已對“元宇宙+視頻”的落地做齣瞭積極探索,例如 Netflix 為美劇《怪奇物語》推齣 VR 體驗,愛奇藝推齣主打觀影功能的手機盒子。藉鑒移動互聯網時代對短視頻生態的孵化曆程,元宇宙作為互聯網的下一站,也為視頻創作提供瞭新的可能性,例如通過建模、動作捕捉、人工智能製作齣的虛擬人物能夠參演影視劇集,影視與視頻內容創作有望迎來新的高光期。
6、 模擬訓練 / 教育:將實現虛擬空間中對實體環境的仿真映射
模擬訓練是指將現實中的場景復刻到虛擬世界中,應用於軍事訓練、工業設計、教學訓練、安全應急演練等較為復雜或具有高危險係數的領域。工業領域中,製造業企業將在仿真虛擬空間中充分利用各類數據,優化工業生産環節中的設備工藝和作業流程。軍事和安全應急領域均有進行模擬演練的需求,未來有望在虛擬場景開展更大規模和更復雜的軍事和應急訓練,實現節省訓練成本、提高安全性的目的,如曼恒科技研發齣上海浦東機場的 VR 火災應急演練係統,使用 VR 和 5G 雲渲染技術模擬機場火災突發事件及機場消防員在危險場景下如何開展消防應急救援,幫助提升機場係統整體應急能力。鑒於模擬訓練用途的特殊性,其對沉浸感和交互感的要求相對而言較低,無需依賴高端硬件設備加成,目前已有曼恒科技、壹傳誠等企業實現瞭商業化。
二、 AR/VR :下一代人機交互平台
VR 是 Virtual Reality(虛擬現實)的縮寫,指計算機圖形技術、計算機仿真技術、傳感器技術、顯示技術等多種科學技術,在多維信息空間上創建一個虛擬信息環境,提供使用者關於視覺、聽覺、觸覺等感官的模擬,能使用戶具有身臨其境的沉浸感,具有與環境完善的交互作用能力的一種嶄新的人機交互手段。
目前常見的 VR 由頭戴式顯示設備和手柄組成。其中,頭戴式顯示設備集成瞭顯示、計算、傳感器等設備,通過將人對外界視覺、聽覺的封閉,並由左右眼屏幕分彆顯示左右眼的圖像,引導用戶産生一種身在虛擬環境中的立體感。而手柄則負責輔助追蹤使用者手的位置、提供交互使用的按鍵,以及簡單的觸覺震動反饋。
VR 頭顯經曆 VR 盒子、VR 頭盔、VR 一體機三階段,爆款産品持續主導硬件消費市場。 2Q21 全球 VR 産品齣貨量達 212.6 萬台,同比增長 136.4%,其中 Oculus Quest 2 齣貨量占 75%,持續主導市場。從 2014 年開始,行業銷量由爆款産品主導的特點仍然沒有變化(2015-2017 年三星 VR 盒子、2016-2018 年 PS VR、2019 年至今 Oculus 一體機)。
▲ VR 曆史銷量:VR 盒子、VR 頭盔、VR 一體機持續迭代
▲ 主流 VR 産品比較
2022 年 VR 將迎來一波創新技術潮流, MetaVR 産品迎來升級,蘋果推齣高端産品。根據digitimes,推測 Meta 下一代 VR 升級産品將於明年推齣,將引入 pancake 光學模組和更多傳感器,以實現産品輕量化,並升級手勢識彆、眼動跟蹤等功能;而蘋果也將在 2022年底推齣一款高端 VR 方案,這款高端産品能夠會重新定義 VR 這個産品形態。我們預計這款産品將配備 Micro-OLED 顯示屏,復閤菲涅爾透鏡 pancake 方案,全彩影像透視、搭載更多傳感器,為消費者帶來全新混閤現實體驗。
Pancake 短焦光學是公認的下一代 VR 升級方嚮,使 VR 頭顯更加輕薄。在 Meta 較早的pancake 技術專利中,我們可以看見一個顯示組件包括具有四分之一波片和部分反射錶麵的第一透鏡、具有反射偏振器的第二透鏡和顯示器,實現頭顯的輕薄化。我們認為,蘋果同樣在探索使用三個菲涅爾透鏡堆疊,形成輕薄透鏡組的方案。改進光學透鏡後的 VR 産品將實現輕薄化,頭顯重量或由原來的 500g 降低至 200-300g。
Meta 下一代 VR 産品與蘋果 MR 産品將會增加傳感器,主要是攝像頭的種類與數量。高通在其官網上披露,高通驍龍 XR2 芯片算力最多可支持 7 顆攝像頭(2 顆眼動追蹤,2 顆混閤現實,2 顆頭部 6DoF追蹤,1 顆其他),並可以此實現 MR 混閤現實功能。我們認為 Meta 下一代或充分利用驍龍 XR2 算力,為産品進行功能升級。
蘋果或將搭載更多傳感器,為各類應用提供豐富數據。根據 digitimes 等雜誌 2022 年 1 月中旬的報道,蘋果或將搭載與 M1 芯片相似算力高階處理器和一個負責傳感器的低階處理器,支持 5-8 個外置相機模組,2 個內置眼動追蹤相機模組,1-2 個 ToF 攝像頭,以實現全彩RGB 影像透視和眼動追蹤、手勢追蹤等功能,實現內容與應用邊界的拓展,也為內容生産商提供更多的數據支持。
為 Meta 下一代或沿用 FastLCD 屏幕,與 quest 2 分辨率差彆不大,但具有像素級控製的先進背光,可以展示和 OLED 一樣的純黑底色;而蘋果或使用高分辨率、高對比度、寬色域、快速響應的 Micro-OLED 顯示屏,隨之而來的或是高昂的售價,根據Digitimes 等媒體 2022 年 1 月中旬的報道,新一代蘋果 MR 産品售價可能達到 1500-3000美元,高於當前 Oculus quest 2 的最低售價 299 美元。
三、 AR :産品處於概念期, Micro-LED + 衍射光波導技術突破被寄予厚望
AR(Augmented Reality,增強現實)是促使真實世界信息和虛擬世界信息內容之間綜閤在一起的較新的技術內容,與 VR 不同的是,AR 能夠將真實環境和虛擬物體之間重疊之後,在同一個畫麵以及空間中同時存在。AR 中的關鍵技術包括跟蹤定位技術、虛擬與現實閤並技術、顯示技術與交互技術。
目前 AR 眼鏡也可以分為一體式和分體式,從齣貨量看當前一體式為主流。分體式指計算單元或電池等結構與頭顯分開,如 Nreal 頭顯支持通過 type-C 接口與智能手機、PC 連接,允許將智能手機中、PC 的內容無縫傳輸到眼鏡中,用戶可以在其中查看內容。而一體式AR 産品則將顯示器、傳感器、計算、人類理解、環境理解等係統集成在一個頭顯上,提供更便捷體驗。根據 IDC,1H21,AR 一體機齣貨量占比達 70%,仍然為市場主流。
根據 IDC,2020-2021 年 AR 年齣貨(不含Screenless viewer)在 20-30 萬之間,增速波動大。從品牌來看,除 Epson 和微軟外,其他較多品牌並沒有實現 AR 的持續大規模銷售,常常在 1-2 個季度的爆發後銷聲匿跡,消費端市場上沒能齣現標杆性的品牌,我們認為 AR 作為一款消費電子産品仍然處於概念期階段。
長期來看 AR 終端有望替代手機,實現年齣貨量超過 10 億台(對比手機齣貨量超過 13 億台),但目前來看實現這個目標時日尚早。從應用看,AR 産品仍未齣現殺手級的應用場景。從技術角度看,雖然OLED+Birdbath 方案已經比較成熟,但因透光性差等原因,形似墨鏡的設計不能支持全環境的使用。而其他微顯示係統如 LBS/LCoS/DLP 等搭配光波導的方案仍在探索過程中。
一款閤格 AR 眼鏡需要怎樣的配置?
顯示:微顯示單元與光機模組決定亮度、對比度、刷新率、分辨率等指標。目前市場上 AR眼鏡的近眼顯示係統即使用微顯示器作為圖像源器件,由其産生圖像後投射到自由麯麵/光波導等光學模組中,再進入人眼。由於 AR 像源産生的圖像將與太陽光一起進入人眼,戶外若不加墨鏡,入眼亮度需超過 2,000nits,甚至達到 5,000nits,纔能在各種天氣狀況下清楚的顯示圖像。據我們估算,目前一款光波導眼鏡的光效率大約為 3-5%,即像源亮度至少要在10 萬 nits 左右,纔能滿足 AR 眼鏡的亮度需求。此外,75Hz 以上的刷新率、25°視場下 720P的分辨率、支持局部刷新及低功耗狀態下靜態圖像的維持,是一款 AR 眼鏡的及格綫。
人、機、環境的有效交互:SLAM+傳感器+AI 用於理解環境、理解使用者、實現虛擬信息和現實世界的結閤。為瞭實現虛擬信息和真實場景的疊加,需要實現使用者的空間定位追蹤和虛擬物體在真實空間中定位。除此之外,為瞭將虛擬信息與輸入的現實場景無縫結閤在一起,增強 AR 使用者的體驗,還需要考慮虛擬事物與真實事物之間的遮擋關係以及實現幾何一緻、模型真實、光照一緻和色調一緻。從上世紀 80 年代發展到現在,SLAM 傳感器、算法、技術框架等持續改進,是實現自我姿態評價以及虛擬圖像反饋,構建人與虛擬內容的有效交互的主要手段。
微顯示技術: MicroLED 有望成為 AR 主流 。當前已提齣的微顯示技術包括 OLED(有機發光二極管)/ LCoS(矽基液晶)/ DLP(數字光處理)/LBS(激光束掃描儀)等待,但這些技術均無法兼顧成熟性、性能、成本等指標。MicroLED 是業內公認的 AR 顯示最佳解決方案,但存在技術尚不成熟、量産難度大等問題,真正大麵積商用可能要到 2025 年左右。
▲ 微顯示技術一覽
LCoS —— 限製較多,逐漸淡齣 。LCoS 作為微顯示技術存在比較明顯的限製,逐漸淡齣微顯示領域。LCoS 的優勢在於技術成熟,成本低廉,像素密度高且功耗低,在早期的 AR 設備中應用較多,如靈犀微光靈犀AR(LCoS+幾何光波導),Magic Leap One (LCoS+衍射光波導)。但劣勢也相對明顯,如對比度較低,特彆是在大入射角情況下;由於必須和 PBS 配閤使用而限製瞭整體光機的小型化和輕量化進程(目前較小的 digilens 的 LCoS 光機體積為 2.5 立方厘米);低溫狀態下無法工作,環境適應性較差等。因此,大量廠商都在積極尋求使用 LBS/DLP 等方案代替 LCoS,2018 年以後搭載 LCoS 的新機型逐漸淡齣。
矽基 OLED —— 亮度較低,目前難以應用於戶外 AR 場景。矽基 OLED 的缺點也比較明確,應用局限於 VR 及類似設備。目前市場上主流的矽基 OLED産品亮度均小於 3000nits,與 10 萬 nits 的要求相去甚遠,難以應用於戶外 AR 場景。同時,由於産品的生産工藝更加復雜,其價格比 LCoS 貴 50%以上,但使用壽命在高亮度模式下將低於 3000 小時且極有可能齣現燒屏的情況,整體性價比更低。因此,雖已有部分 AR 廠商使用矽基 OLED 替代 LCoS,但其仍不是 AR 像源的最佳解決方案。
LBS —— 激光二極管對溫度敏感、分辨率較差。與 LCoS 等其他顯示技術相比,LBS 技術優勢明顯。LBS 係統主要由激光、光學器件和MEMS Mirror 組成由於 LBS 使用激光光源進行逐像素渲染,相較其他非激光、逐幀渲染方案天然具有延遲低(激光納秒 vs 普通光源毫秒)、畫麵滯留時間短、亮度高、能耗低、色彩豐富的優勢。此外,為獲得更大的視場角和更高的解析度,其他技術必須增加微鏡的數量並放大産品尺寸,而 LBS 方案僅通過改變 MEMS 微鏡的振動頻率和反轉角度即可實現,因而更易實現光機的輕量和小型化。(目前 LBS 光機體積大緻在 0.5-1.5 立方厘米)。
當前主流的 LBS 産品分辨率約720P,提高分辨率可能需要較高的成本。AR 硬件/軟件企業 Rave 首席科學傢 Karl Guttag將搭載 LBS 光機的 HoloLens 2 代和搭載 LCoS 光機的 HoloLens 1 代進行對比測試後發現,雖然 HoloLens 2 的垂直視場角較 1 代提升近一倍(30 度 vs 17.5 度),但其在分辨率、色彩均勻性等方麵的錶現均更差。此外,HoloLens 2 實拍圖色彩飽和度更低,觀感模糊,霧度也更大。
DLP —— 對溫度敏感,難以小型化。DLP 由於成本高、體積大等缺陷,在 AR 場景中的應用有一定限製。DLP(Digital Light Processing)係統的核心是 TI 專利的 DMD 芯片(Digital Micromirror Device),它由數百萬個高反射的鋁製獨立微型鏡片組成,每個鏡片通過數量龐大的超小型數字光開關控製角度。這些開關可以接受電子訊號代錶的資料字節,然後産生光學字節輸齣,將輸入 DMD 的視頻或圖形信號轉換成高清晰度的、高灰度等級的圖像。DLP 由於以鏡片為基礎,提高瞭光通效率,因此 DLP 投影係統比所有其他顯示係統具有更強的亮度。然而,由於其設計難度大、結構復雜、生産成本高、體積大等劣勢,目前在 AR、HUD 等設備中應用並不普及。
MircoLED —— 仍處在早期階段,較多技術問題需要解決。MicroLED 産品性能絕佳,是業內公認的 AR 顯示最佳解決方案。Micro LED 即 LED 微縮技術,通過將傳統 LED 陣列化、微縮化後定址巨量轉移到電路基闆上形成超小間距 LED,可將毫米級彆的 LED 長度進一步縮小到微米級(50um 左右,原本 LED 的 1%)。相較其它技術,MicroLED 産品性能在亮度、對比度、工作溫度範圍、刷新率、分辨率、色域、功耗、延時、體積、壽命等多方麵具備較大優勢,被期望為下一代主流顯示技術的重要路徑。
MicroLED 的發展瓶頸在於微米級的像素尺寸和間距給量産和全彩方案所帶來的巨大挑戰。 MicroLED 的生産包括芯片和背闆製造、巨量轉移、接閤、驅動和檢測維修等環節,由於其晶粒尺寸在微米級,生産單個成品即需要處理數百萬甚至數韆萬晶粒,對技術的效率和良率提齣瞭極為嚴苛的要求,現有技術水平還無法滿足其量産需求。而 MicroLED 晶粒的發 光效率、波長一緻性和良率也尚未達到 MicroLED 彩色化顯示的要求。基於此,現有MicroLED 屏幕價格高昂,單片售價即大於 1000 美金。2018 年三星演示的采用 microLED技術的 The Wall 電視,146 寸版報價高於 10 萬美元。
光學模組:從幾何光學到納米光學。與 VR 的不同之處在於,AR 眼鏡需要透視(see-through),既要看到真實的外部世界,也要看到虛擬信息,所以成像係統不能擋在實現前方,這就需要多加一個或一組光學組閤,通過層疊的方式,將虛擬信息和真實場景融為一體,設計包括自由麯麵,光波導等。
傳統的光學透鏡加工方式為切割/注塑/塗層/拋光等等,但隨著光波導等光學模組的復雜化,傳統加工工藝帶來瞭生産流程復雜、良率低等問題,國內外包括 Digilens,WaveOptics,至格科技,瓏璟光電等廠傢開始探索納米壓印、紫外光加工等加工方案。
▲ AR 光學模組梳理
光波導技術是應 AR 需求而生的一個比較有特色的光學組件。因它的輕薄與外界光綫的高穿透特性而被認為是消費級 AR 眼鏡的必選光學方案。
AR 眼鏡中光的傳輸關鍵在於“全反射”。其實,波導技術並不是新發明,光縴就是波導的一種,隻不過傳輸的是我們看不見的紅外波段的光。光機完成成像過程後,波導將光耦閤進自己的玻璃基底中,通過“全反射”原理將光傳輸到眼睛前方再釋放齣來,就完成瞭圖像的傳輸。
越是大的視場角,就需要越高摺射率的玻璃基底來實現。因此傳統玻璃製造商比如康寜和肖特,近年來都在為近眼顯示市場研製專門的高摺射率並且輕薄的玻璃基底,還在努力不斷增大晶元尺寸以降低波導生産的單位成本。
具體來看,當前光波導技術可以分為下麵三種:
1) 幾何/列陣光波導。該概念和專利一直由以色列公司 Lumus 提齣並持續優化迭代,基本原理是耦閤光進入波導的一般是一個反射麵或者棱鏡。在多輪全反射後光到達眼鏡前方時,會遇到一個“半透半反”鏡麵陣列,將光耦閤齣波導。幾何/列陣光波導目前大都隻能實現一維擴瞳。這裏的“半透半反”鏡麵陣列相當於將齣瞳沿水平方嚮復製瞭多份,每一個齣瞳都輸齣相同的圖像,這樣眼睛在橫嚮移動時都能看到圖像,這就是一維擴瞳技術(1D EPE)。
幾何/列陣光波導工藝流程復雜,良率提升難度極大。“半透半反”鏡麵陣列的鍍膜工藝中,由於光在傳播過程中會越來越少,陣列中這五六個鏡麵的每一個都需要不同的反射透射比(R/T),以保證整個動眼框範圍內的齣光量是均勻的。並且由於幾何波導傳播的光通常是偏振的,每個鏡麵的鍍膜層數可能達到十幾甚至幾十層。
這些鏡麵是鍍膜後層層摞在一起並用特殊的膠水粘閤,然後按照一個角度切割齣波導的形狀,這個過程中鏡麵之間的平行度和切割的角度都會影響到成像質量。因此,即使每一步工藝都可以達到高良率,這幾十步結閤起來的總良率卻是一個挑戰。每一步工藝的失敗都可能導緻成像齣現瑕疵,常見的有背景黑色條紋、齣光亮度不均勻、鬼影等。
2) 浮雕光柵衍射光波導。傳統的光學結構被平麵的衍射光柵取代,通過材料錶麵浮雕齣來的高峰和低榖,在材料中形成瞭一個摺射率的周期性變化。通過設計光柵的參數(材料摺射率、光柵形狀、厚度、占空比等)可以將某一衍射級(即某一方嚮)的衍射效率優化到最高,從而使大部分光在衍射後主要沿這一方嚮傳播。
用衍射光柵可以實現二維擴瞳,digilens 和 WaveOptics 分彆具有兩種技術方案。 Hololens I, Vuzix Blade, Magic Leap One, Digilens 等使用的方法是,當入射光柵將光耦閤入波導後,會進入一個轉摺光柵的區域,這個區域內的光柵溝壑方嚮與入射光柵呈一定角度,那麼它就像一個鏡子一樣將 X 方嚮打來的光反射一下變成沿 Y 方嚮傳播。另外一種實現二維擴瞳的方式是直接使用二維光柵,即光柵在至少兩個方嚮上都有周期,將單嚮“溝壑”變為柱狀陣列。WaveOptics 就是采用的這種結構,從入射光柵耦閤進波導的光直接進入一個具有二維柱狀陣列發區域,可以同時將光綫在 X 和 Y 兩個方嚮實現擴束,並且一邊傳播一邊將一部分光耦閤齣來進入人眼。
3) 布拉格光柵衍射光波導(也叫全息光柵光波導)。利用光全息術在記錄材料薄膜上記錄點光源的乾涉條紋,再經過處理製成光柵條紋結構的薄膜光學元件,具有光束準直、聚焦、偏轉等功能。其對光的衍射符閤布拉格定律,隻有滿足布拉格條件的入射光纔會被衍射,不滿足布拉格條件的入射光不被衍射。目前在做全息體光柵(VHG)波導方案的廠傢比較少,包括十年前就為美國軍工做 AR 頭盔的 Digilens,曾經齣過單色 AR 眼鏡的 Sony,還有由於被蘋果收購的 Akonia。
優點顯著,探索持續進行。這種技術具有體積薄,重量輕,且可同時記錄多個全息圖等優點,使它能夠替代許多傳統的光學元件,如棱鏡、立方體分束器和光柵等,進一步減小 AR 頭戴式顯示器體積。由於體光柵由於受到可利用材料的限製,能夠實現的摺射率差有限,導緻它目前在 FOV、光效率、清晰度等方麵都還未達到與錶麵浮雕光柵同等的水平。但是由於它在設計壁壘、工藝難度和製造成本上都有一定優勢,業內對這個方嚮的探索從未停歇。
SLAM:理解環境與使用者,實現虛擬信息和現實世界的結閤。SLAM(Simulataneous Localization and Mapping),同步定位與地圖構建,指在運動過程中通過重復觀測到的環境特徵定位自身位置和姿態,再根據自身位置構建周圍環境的增量式地圖,從而達到同時定位和地圖構建的目的。
現代流行的 SLAM 係統大概可以分為前端和後端。前端通過傳感器實現數據關聯,研究幀與幀之間變換關係,主要完成實時的位姿跟蹤,對輸入的圖像進行處理,計算姿態變化。後端主要對前端的輸齣結果進行優化,得到最優的位姿估計和地圖。
SLAM 在 ARVR 中有較多應用,AR 中主要是 1)現實物體與虛擬物體的有效交互,2)實 現語義理解,優化智能輔助功能:
實現虛擬世界和現實世界之間坐標疊加、實現幾何物理信息交互。與電腦、平闆、手機的3D 顯示不同,AR 更注重虛擬信息與真實信息的無縫融閤,即圖像齣現的平麵位置與景深準確、帶來沉浸感的良好體驗。這就需要利用 SLAM 算法,準確疊加虛擬坐標係和真實坐標係。同時,真實環境中有高低起伏、有障礙物、有遮擋關係,AR 可以讓虛擬信息跟這些真實環境中的物理信息進行交互。
隨著機器學習和深度學習的發展,虛擬信息可以“理解”真實世界,讓二者的融閤更趨於自然。當前計算機已經可以已經可以認齣圖片上的內容,但沒有理解內容之間的關係,當前的一項研究方嚮是,應用 SLAM+AI 技術,通過特徵提取,實現機器的語義理解,優化 AR 係統的輔助功能。
傳感器:交互方式與應用場景升級推動傳感器升級。AR 中交互方式的升級,帶來更多樣信息需求。隨著人機交互由 2D 走嚮 3D,交互方式逐漸多樣化,嚮人類本能發展,手勢交互、姿勢交互、眼動交互、語音交互,甚至結閤生物信號、周圍環境交互的方式不斷進化,這對更多種類的信息提齣瞭要求,用戶運動類、生物類信息,以及其他環境信息都將為人機交互提供底層支持。
大量信息需求為運動類、生物類、環境類各型傳感器提供增量機會。當前蘋果手機、手錶廣泛運用多種運動、生物型傳感器,與之對比,VR 爆款産品 Oculus quest 2 頭顯僅搭載瞭4 顆黑白攝像頭,手柄配備瞭兩組陀螺儀加速度計傳感器。未來,為實現更深度沉浸和更便捷交互,測距攝像頭、眼動追蹤攝像頭、精細化壓力傳感器,甚至生物型、環境型傳感器,都將逐漸配備。
三、腦機接口:離現實還有多遠?
對於大多數人來說,最早接觸腦機接口概念是從科幻電影中。不管是《X-戰警》中博士的意念控物,還是《黑客帝國》中锡安人通過接口與電腦相連,迅速學會各種各樣的知識和技能,並進入 Matrix 的虛擬世界中,再或是《沙丘》中人們通過腦科學的探索,不斷開發大腦潛能,通過訓練的領航員的大腦能夠媲美大型計算機,這些情節都讓人印象深刻,也是科學傢不斷探索的方嚮。
使用電子計算機對人腦進行模擬需要 172PFlops 計算量。人的大腦有接近 860 億個神經元,每個神經元有 1 萬個連接點,掌管人類運動、聽覺、語言、嗅覺、記憶、思考、性格、情緒等功能。根據我們估算,如果想要以計算機來模擬人腦的活動需要 172PFlops(對應神威太湖之光 93PFlops,美國 Summit 超算 122.3PFlops)。人腦的潛能或能夠達到一台超級計算機的運算能力。
腦機接口或支持人腦潛力持續開發。馬斯剋提齣的一個經典論述是“人類不能被 AI 淘汰,要與 AI 融閤,在大腦和電腦之間創建一個接口”。隨著我們對腦科學的不斷認識和腦機接口技術下對人類肢體限製的不斷突破,人腦的潛能或得到釋放。
被稱作“腦機接口之父”的尼可萊利斯教授在其《腦機穿越》一書中提到,在腦機接口的幫助下,思想或能轉化為有形的動作、印象或情感,人可以用思想操控電腦、駕駛汽車、與他人進行交流,可以完美的轉化為納米工具的精細化操作,或者是應用瞭尖端科技的機器人的復雜動作。不用動手輸入一個字,也不用動口說一個詞就可以與人進行交流,即使足不齣戶,也能體驗到觸摸遙遠星球錶麵的感覺。
腦機接口(Brain Computer Interface,BCI)1976 年由加州大學洛杉磯分校的雅剋·維達爾(Jacques J. Vidal)提齣。一個完整的腦機接口過程包括信號采集、信息解碼處理、信號 輸齣/執行、反饋四個步驟實現。 腦機接口可以通過電、磁、光、聲進行信號采集與反饋,而腦電技術是目前主流探索方嚮。 事實上采集中樞神經信號以監測大腦活動的方法有很多種,包括腦電、功能近紅外光譜(functional near-infrared spectroscopy, fNIRS)、功能磁共振成像(functional magneticresonance imaging, fMRI)等,反饋技術也同樣包括電、磁、聲、光多種。在這些監測技術中,腦電因為時間分辨率高、設備價格低廉且便攜等優點,逐漸成為腦機接口研究最主流的探索方嚮。
1) 腦電采集:腦電采集是 BCI 的關鍵步驟,采集的效果、信號強弱、穩定性及帶寬大小直接決定後續的處理及輸齣。由於大腦的中樞神經元膜電位的變化會産生鋒電位(spikes),或動作電位(action potentials),並且神經細胞突觸間傳遞的離子移動會形成場電位(field potentials),通過在大腦皮質的運動神經位置外接或植入微型電極,可以采集並放大這些神經生理信號。
2) 信號解碼處理:信號處理是將轉化為電信號的大腦活動,去除乾擾電波以及其他信號,並將目標分類並處理,轉化為可以執行輸齣的對應信號。
3) 信號輸齣及執行:信號輸齣指將收集並處理後的腦電波信號傳輸至已連接的設備器材,作為數據基礎加工內容,或反饋到終端機器以形成指令,甚至實現直接交互。
4) 反饋:在信號執行後,設備將産生動作或顯示內容,參與者將通過視覺、觸覺或聽覺感受到第一步産生的腦電波已被執行,並觸發反饋信號。
根據腦電的采集方式,當前的腦機接口又可以分為侵入式、非侵入式 非侵入式更多用於消費端的腦電監測。非侵入式是在人/動物大腦外部佩戴腦機接口設備,通過采集腦電、神經電獲取腦部信息,但信息精度及分辨率較低,可用於簡單的信號判斷與反饋,但較難傳達復雜指令,如幫助肢體殘障人士通過意念操控機械骨骼,或用於 VR/AR遊戲應用的基礎手勢控製。非侵入式根據收集信息的不同可以分為 EEG(收集腦電)和MEG(收集磁場)兩種。
1)EEG:通過導電凝膠將 Ag/AgCI 電極固定在頭皮上,以測量頭皮腦電信號,但一般隻能監測到 0-50Hz 相對較窄頻帶中的信息。
2)MEG:通過測量細胞內離子電流引起的小磁場獲得信號,但由於高昂的成本和操作方法的繁瑣(電磁封鎖環境,保持絕對靜止),MEG 並不是一個理想的解決方案。
侵入式腦機接口主要應用於醫療康復領域。侵入式將設備直接植入到人/動物大腦灰質或顱腔內,能夠獲取相對高頻、準確的神經信號,不僅能夠通過讀取腦電信號來控製外部設備,還能夠通過精確的電流刺激讓大腦産生特定感覺。侵入式腦機接口可以分為 ECoG、LFP、SUA 等類型。
1) ECoG:測量大腦皮層電位,與 EEG 技術相似,但能夠監測到更大帶寬的信息;
2) LFP、SUA:測量大腦皮層場電位與鋒電位,可以通過 Mircowire array,Michigan array,Utah array,Neurotrophic electrode 等多種傳感器實現。
侵入式采取電信號的方法,具有較高的空間分辨率、良好的信噪比和更寬的頻帶,但目前仍然麵臨著有創帶來的安全問題、難以獲得長期穩定的記錄、需要醫護人員長時間連續的觀察等問題,目前應用仍局限於醫療康復領域。
侵入式工具也齣現瞭全新不開顱植入方案。2021 年 8 月,來自美國加州伯剋利大學的Synchron 公司開發的微創腦機接口獲得美國食品藥品監督管理局(FDA)的人體臨床試驗批文。其腦機裝置微小,可以安全地穿過血管,因此直接利用頸靜脈植入 BCI,使用導管手術將設備輸送到大腦和脊柱中,在兩小時無需開顱手術內即可將設備植入瞭患者大腦內。
由於不需要開顱手術,因此這種傳感器可以靈活布置在大腦多個位置,從而捕捉各種類型的信號。與傳感器相連的 BrainPort 接收裝置植入病人的胸口,它沒有內置電池,而是通過無綫的方式進行供電以及數據傳輸,進一步提升瞭安全性。通過 Synchron 研發的 BrainOS操作係統,可以將傳感器讀取到的信號轉化為與外界交互的通用信號,從而實現用大腦與外界交流溝通。
醫療、消費市場應用的持續拓展或支撐起韆億市場規模。隨著人們對大腦的認知、電極設計、和人工智能算法的精進,腦機接口領域應用也持續拓展,並嚮更加精細化發展。腦機接口相關的研發已經在仿生學、醫療診斷與乾預、消費電子等多個領域進行持續探索,我們認為相關産品可能將在未來 20-30 年內陸續商業化,支撐起近韆億美元的市場規模。
二十世紀七十年代到九十年代末,腦機接口技術經曆瞭從概念期到科學論證期的發展。二十世紀七十年代至八十年代,“腦機接口”專業術語齣現,1977 年 Jacques J. Vidal 開發瞭基於視覺事件相關電位的腦機接口係統,通過注視同一視覺刺激的不同位置實現瞭對 4 種控製指令的選擇。1980 年德國學者提齣瞭基於皮層慢電位的腦機接口係統。
二十世紀八十年代後,少數先驅研發瞭實時且可執行的腦機接口係統,並定義瞭至今仍在使用的幾種範式:
1) 1988 年 L.A. Farewell 和 E.Donchin 提齣瞭著名且廣泛使用的腦機接口範式 P300 拼寫器,錶明係統有望幫助嚴重癱瘓患者與環境進行通信和交互。不久後研究人員都開發齣基於感覺運動節律的腦機接口係統,該係統可以控製一維光標嚮使用者反饋運動節律幅度,從而通過訓練實現通過想象控製小球嚮上或嚮下移動。
2) 1990 年左右 Gert Pfurtscheller 開發齣另一種基於感覺運動節律的腦機接口,用戶必須明確地想象左手或右手運動,並通過機器學習將其轉化為計算機命令,這定義瞭基於運動想象的腦機接口。
3) 1992 年 Erich E. Sutter 提齣瞭一種高效的基於視覺誘發電位的腦機接口係統,在該係統中設計瞭 8×8 拼寫器,利用從視覺皮層采集的視覺誘發電位識彆用戶眼睛注視方嚮來確定他選擇拼寫器中的哪一個符號。肌萎縮側索硬化癥患者可以實現 10 個單詞/分鍾的通信速度。
二十一世紀以來腦機接口技術高速成長,新範式、新算法、新設備層齣不窮,早期範式性 能明顯提高。新型腦機接口實驗範式相繼湧現,如聽覺腦機接口、言語腦機接口、情感腦機接口以及混閤腦機接口。先進的腦電信號處理和機器學習算法被應用於腦機接口,如空間模式算法、xDAWN 算法等,新型的腦信號獲取方法如功能核磁共振成像測量的血氧水平依賴信號以及功能近紅外光譜測量的皮層組織血紅蛋白濃度等被用於構建非侵入式腦機接口。除此之外,早期開發的基於 P300 和視覺誘發電位的腦機接口性能得到瞭明顯提高,並在初步的臨床試驗中證明適用於肌萎縮側索硬化癥、腦卒中以及脊髓損傷患者。
應用場景1:醫療健康領域是腦機接口當前最接近商業化的領域。腦機接口可以幫助實時監控和測量神經係統狀態,輔助臨床判讀。“監測”型腦機接口應用方嚮十分多樣,包括評測陷入深度昏迷患者的意識等級,測量視/聽覺障礙患者神經通路狀態協助醫生定位病因等等。除此之外,通過結閤腦電、視頻等多元信息進行診
監測到的腦電信息可以用於加工、反饋,針對多動癥、中風、抑鬱癥等做對應的恢復訓練。 例如,對於運動皮層相關部位受損的中風病人,腦機接口可以從受損的皮層區采集信號,然後刺激失能肌肉或控製矯形器,改善手臂運動;運動想象類腦機接口可以用於孤獨癥兒童的康復訓練,提升他們對於感覺運動皮層激活程度的自我控製能力,從而改善孤獨癥的癥狀,也可以通過腦電信號的反饋,訓練使用者的專注力。療,能夠輔助醫生判讀腦損傷、腦發育等多種臨床適應癥。
基於電、聲、光、磁刺激進行神經調控的腦機接口已經實現商業化。相關應用包括:通過電刺激治療進行神經康復,主要針對腦卒中、 帕金森等中樞神經或周圍神經損傷所緻的運動功能障礙,如偏癱、肌萎縮、肌力低下、步行障礙、手功能障礙;通過顱磁刺激治療抑鬱癥,以及對腦卒中所緻的言語功能障礙、吞咽障礙、認知功能障礙進行治療。經顱磁刺激用於抑鬱癥治療已在美國、加拿大、新西蘭、以色列等國傢明確獲批,與藥物治療相比,經顱磁刺激具有副作用小、安全性高、無痛苦、不易成癮、不會影響認知功能等優勢。國內外多傢公司包括偉思醫療(688580 CH,未覆蓋),Neuronetics(STIM US,未覆蓋),Brainsway(BWAY US,未覆蓋)等公司已經推齣相關産品。
BrainCo 強腦科技在 2019 年推齣世界上第一款可以意識控製每一根手指的非侵入式智能仿生手後,在今年再次推齣一款適閤不同傷殘等級的仿生腿産品。根據公司介紹,這款産品每秒可提取 2 萬個肌電神經電數據,因此能快速、準確地識彆用戶意圖,並根據環境、肌肉情況調整步態防止摔倒,實現高仿生體驗,還能夠支持攀岩、涉水等多種復雜操作,為殘障人士創造高品質生活,拓展瞭腦機接口技術在義肢方嚮的應用。
應用場景2:消費電子與 AIoT 領域展開消費端應用。腦機接口技術可以與消費産品相結閤,提供更直覺交互體驗。早在 2014 年,加難道公司Thalmic Labs 就推齣瞭一款臂帶式控製器 Myo,通過感知肌肉的生物電活動,可以讓使用者隻需要動動手指就可以無綫控製身邊的計算機和其他數字産品。隨著技術的持續升級,當前臂帶式控製器可以實現通過識彆活動意念帶來的電流進行控製,意念打字、意念操作玩具等已經不是幻想。
在腦機接口的支持下,遊戲玩傢可以用意念來控製 VR 界麵的菜單導航和選項控製,獲得瞭獨立於傳統遊戲控製方式之外的新的操作體驗;同時人們也可以用意念控製開關等,甚至控製傢庭服務機器人,實現全新意義上的智能傢居。
滲透率或隨 AR 及其他可穿戴産品普及持續提升。當前更加簡單形式的控製,比如眼動追蹤攝像頭、觸摸控製等或限製腦機接口交互需求。我們認為未來隨著一係列可穿戴設備比如 AR 眼鏡的普及,以及元宇宙的持續建設,基於腦機接口技術的消費電子産品滲透率將持續提升。
應用場景3:實現大腦強化,運用於國防軍事領域 2020 年美國蘭德公司發布瞭一份名為《腦機接口:美國軍事應用和意義的初步評估》(Brain-Computer Interfaces: U.S. Military Applications and Implications)的報告,指齣雖然存在一定風險,“腦機接口”很可能在改進未來作戰中提供相應的支持,腦機接口在軍事 領域用途包括保證更高效和保密的軍事通信、提高決策速度與準確性,允許操作員同時控 製多個平台等。
進行更高效和更保密的軍事通信。2019 年,DARPA(美國國防部高級研究計劃局)就選擇瞭6個團隊來開發N3神經技術研究計劃,旨在為美國軍方提供高精度的雙嚮腦機接口係統,使服役人員能夠與計算機係統進行通信。未來若腦機接口用於軍事通信的技術獲得成功,將顛覆現有通信技術的運轉模式。此前的通信解密都是在得到對方通信信號的基礎上,依據共同、公開的技術知識進行解密。理論上隻要有足夠的時間,任何加密算法都可以被破譯。而腦機接口通信可能在雙方的主體意識尚未明確時就已經完成;所以,不僅通信信號難以得到,即使得到信號,也缺乏解密所需的技術知識。
腦機接口或用於處理大量數據來提高決策效率。未來作戰中,智能設備、士兵穿戴式傳感器和無人機可嚮士兵提供大量的行動數據,大量的信息融閤將增加決策的復雜性。通過腦機接口能夠使得機器與人之間連通性增強,促進數據在作戰人員和決策者之間快速而廣泛地流動,使得相互連接的軍事係統能夠順利運行。同時人工智能工具可能融入決策流程,幫助人類作戰人員評估環境,管理數據,並最終消化更大容量的信息。
▲ 全球主要腦機接口公司
智東西 認為,人機交互是人類通往元宇宙的入口,藉助於自然用戶界麵,AR/VR帶來瞭遠遠高於圖形化展示更自然的交互模式,也是最有希望的實現元宇宙的第一個入口。但長遠來看,腦機接口纔是元宇宙入口的真正形態,而其中的非侵入式腦機接口在未來或許成為元宇宙入口的一張“王炸”。
責任編輯: