史曉剛,薛正輝,李會會,王丙杰,李雙龍
(1. 北京理工大學 信息與電子學院,北京100081;2.北京梟龍科技有限公司,北京100144)
增強現(xiàn)實(Augmented Reality,AR)通過將計算機生成的虛擬信息疊加到真實環(huán)境中,來豐富人們與現(xiàn)實世界和數(shù)字世界的互動,以達到超越現(xiàn)實的感官體驗。1968年,Ivan Sutherland使用光學透視頭戴式顯示器開發(fā)出了世界上第一套增強現(xiàn)實系統(tǒng),命名為達摩克利斯之劍(The Sword of Damocles)[1]。1992年,波音公司的Tom Caudell和David Mizell在幫助工人組裝飛機電纜時,創(chuàng)造了增強現(xiàn)實一詞。同年,兩個早期的增強現(xiàn)實原型系統(tǒng)由美國空軍的L.B Rosenberg和哥倫比亞大學的Steven Feiner等人提出,它們分別是Virtual Fixtures虛擬幫助系統(tǒng)和KARMA機械師修理幫助系統(tǒng)。1997年,Ronald Azuma撰寫了第一份關于增強現(xiàn)實的報告,提出了后來被廣泛接受的AR定義。該定義包含三個特征:虛實結合;實時交互;三維注冊。2000年,Bruce Thomas開發(fā)了第一款室外AR游戲,ARQuake,將AR帶到了室外的真實場景。此后,隨著智能手機等移動設備的不斷更新,越來越多的AR應用程序被開發(fā)出來。2012年,谷歌眼鏡的亮相掀起了新一輪的AR熱潮[2]。隨后,越來越多的企業(yè)和科研機構積極投身于AR技術的研發(fā)。隨著AR技術的快速發(fā)展,AR產(chǎn)品已被廣泛應用于游戲、軍事、教育、醫(yī)療和零售等領域。
AR采用手勢識別、眼球追蹤等人機交互方式,能夠給用戶帶來顛覆式的場景體驗,被認為是繼個人電腦和智能手機后的下一代計算平臺[3]。然而,AR同時顯示真實世界和虛擬世界的特點,以及傳遞高保真圖像的需求,給其光學設計在視場角(Field Of View,F(xiàn)OV)、眼動范圍(eye-box)大小和圖像對比度等方面帶來了巨大挑戰(zhàn)。目前,要設計出性能好、體積小和功耗低的AR頭戴式顯示設備還非常困難。本文以人眼視覺系統(tǒng)的視覺感知為基礎,總結了AR頭戴式顯示器中微顯示器和光學組合器的研究現(xiàn)狀,對比分析了它們的性能參數(shù)和發(fā)展前景。
人眼是自然進化而來的光學成像系統(tǒng)。光線通過虹膜進入眼睛,被角膜和晶狀體折射后,在視網(wǎng)膜上成像,同時感光細胞將光信號轉化為電信號[4]。電信號在視網(wǎng)膜上經(jīng)過一定的信號處理后進入大腦。大腦接收到電信號后,根據(jù)多個線索對圖像進行解析,并在三維空間中感知物體。
人眼的視場角分布如圖1(a)所示,單目視場角約是水平160°和垂直130°,雙目視場角約是水平200°和垂直130°,且水平方向有120°左右的重疊[5-6]。雙目重疊區(qū)域對立體視覺至關重要,可用于完成閱讀和社交等高敏銳度任務,周邊的非重疊區(qū)域則在平衡和搜索等任務中發(fā)揮作用。人眼的分辨率極限由視網(wǎng)膜中央凹上圓錐細胞的平均間隔決定,可觀察到的最小視角約為0.5弧分,或120像素/度,相當于20/10的視敏度[7]。顯示技術中,若總顯示像素數(shù)固定,分辨率密度越高,則視場角越小。而近眼顯示系統(tǒng)普遍要求更大的視野,以增強用戶沉浸感。一般認為,AR顯示所需的最小視場為水平100°和垂直20°,而目前AR頭戴式顯示器可實現(xiàn)的視場角一般不超過水平60°。
圖1 (a)人眼視場角分布[5];(b)人眼觀察真實景象時,會聚距離與調焦距離一致;(c)人眼觀察顯示屏上的虛擬物體時,會聚距離與調焦距離不一致Fig.1(a)The profile of human FOV[5];(b)accommodation cue coincides with vergence cue when viewing a real object;(c)accommodation cue mismatches with vergence cue when viewing a virtual object displayed at a fixed plane
人眼作為高動態(tài)范圍的成像系統(tǒng),可適應從白天(104lx)到夜晚(10?3lx)的光照變化。AR顯示對顯示亮度有嚴格要求,當周圍環(huán)境照度比較高時,顯示亮度的需求也會非常高。這種情況下,環(huán)境對比度(Ambient Contrast Ratio,ACR)可作為一個定量表征參數(shù),定義為[8-10]:
其中,T是透光率,Lon和Loあ分別是開/關狀態(tài)下的顯示亮度,Lambient是環(huán)境亮度。環(huán)境照明一般以照度(lx)表示,為便于對比,可通過除以 π因子來將照度轉化為亮度(nits)。起居室內(nèi)的照度約為100 lx,轉化為亮度為30 nits;普通辦公室內(nèi)的亮度約為150 nits;陰天和晴天時的室外亮度分別約為300 nits和3 000 nits。即使是對于高對比度(Lon/Loあ≥100)的顯示系統(tǒng),環(huán)境亮度依然可能會使圖像被湮沒,無法辨認。因此,一般認為,ACR=3:1時 ,顯示圖像可被識別; ACR=5:1時,顯示圖像易辨認; ACR>10:1時,顯示圖像成像質量好。若顯示系統(tǒng)透光率為80%,周圍環(huán)境照度為104lx,則ACR=2:1,若使顯示圖像不被湮沒,則需2 500 nits的顯示亮度;A CR=5:1正常顯示圖像時,需10 000 nits的顯示亮度。目前,AR顯示的亮度一般小于500 nits,較適合在室內(nèi)使用。
評估AR顯示產(chǎn)生的3D圖像時,人眼的另一個需要考慮的因素是立體感。人眼觀察3D物體時,視覺輻輳(眼睛旋轉以將兩只眼睛的視圖重疊成一個對齊圖像)和視覺調節(jié)(彎曲眼睛晶狀體以聚焦不同距離的對象)一致,如圖1(b)所示。然而,AR顯示中,固定的顯示平面對左右眼呈現(xiàn)不同的內(nèi)容,使得眼睛雖然聚焦在平面上,而眼睛旋轉形成的會聚點卻往往在平面外,造成輻輳-調節(jié)沖 突(Vergence-Accommodation Conflict,VAC)[11-14],如圖1(c)所示。長期佩戴此類產(chǎn)品,可能會導致視覺疲勞和不適。單目顯示是解決VAC的一種簡單方法,但僅適用于AR應用的一些特殊場合。由于通過渲染立體顯示中的會聚距離,可使其與人眼觀察真實物體時一致,因此大多數(shù)方法都是通過改善調焦距離來減輕輻輳-調節(jié)沖突,如全息顯示技術[2,15-16]、光場顯示技術[17]、麥克斯韋觀察法[18]、多焦面顯示技術[19-21]和變焦面顯示技術[14,22-24]等。
對于光學透視式AR顯示系統(tǒng),ACR是評估其顯示性能的一個重要參數(shù)。為達到AR顯示所需的高亮度,微顯示器和光學組合器的選擇都非常重要。目前,關于AR顯示的微顯示器的研究還處于初步發(fā)展階段。盡管文獻中報道的微顯示器種類較多,但現(xiàn)階段能夠用于AR顯示的微顯示器主要有硅基液晶(Liquid-Crystal-on-Silicon,LCoS)顯示器、數(shù)字光處理(Digital Light Processer,DLP)顯示器、有機發(fā)光二極管(Organic Light Emitting Diode,OLED)顯示器、微型發(fā)光二極管(Micro Light Emitting Diode,μLED)顯示器和視網(wǎng)膜掃描顯示器5種。本節(jié)通過對近年來這5種微顯示器的相關報道進行回顧總結,對AR顯示的微顯示器的發(fā)展歷程和研究現(xiàn)狀作簡要探討。
LCoS顯示技術起源于20世紀70年代,是一種將液晶(Liquid Crystal,LC)和半導體基板相結合的新型顯示技術。隨著液晶電光響應特性的應用和硅互補金屬氧化物半導體(Complementary Metal Oxide Semiconductor,CMOS)背板技術的發(fā)展,LCoS在自適應光學、計量學、量子物理學、通信和顯示等領域得到了廣泛應用[25]。典型的反射式LCoS結構如圖2所示。LC層位于銦錫氧化物(Indium Tin Oxide,ITO)鍍膜玻璃和CMOS背板之間,上下兩個聚酰亞胺取向層決定LC的取向,鋁電極則提供電壓控制。反射式結構中,入射光兩次經(jīng)過LC層。外加電壓變化時,LC分子重新定向以朝向相應的電場方向,使得出射光的相位和偏振得到調制。根據(jù)聚酰亞胺表面取向和LC材料的性質,LC模式主要被分為3種:垂直取向模式、扭曲向列相模式和平行取向模式,前兩者主要用于強度調制,后者用于相位調制。
圖2 LCoS結構示意圖[25]Fig.2 Schematic diagram of LCoS structure[25]
近年來,LCoS以其高亮度、結構緊湊和高分辨率密度等特點成為AR頭戴式顯示器的主要解決方案,被最先應用于谷歌眼鏡、HoloLens V1和Magic Leap One等頭戴式顯示器中。圖3(彩圖見期刊電子版)以谷歌眼鏡為例,展示了LCoS在AR頭戴式顯示器中的工作原理。LCoS顯示器使用發(fā)光二極管(Light Emitting Diodes,LEDs)作為光源,偏振分光鏡(Polarization Beam Splitter,PBS)反射光。LEDs發(fā)出的光進入PBS后,s偏振光被反射,p偏振光透射進入LCoS。經(jīng)過LCoS調制后,p偏振光返回LED光源,s偏振光則被PBS反射,經(jīng)部分反射鏡(Partially-Reflective Mirror,PRM)和聚焦鏡(Focusing Mirror,F(xiàn)M)后進入人眼。由于只有p偏振光經(jīng)過PBS進入LCoS,因此只有入射光的一半可被調制,導致光效較低。為提高顯示亮度,可在LED光源和PBS之間放置適宜的偏振轉換元件。傳統(tǒng)的大型LCoS顯示器中,包含復眼透鏡的偏振轉換系統(tǒng)、PBS陣列和半波片被組合在一起[6]。然而,當顯示器像素尺寸縮小至微米級別時,偏振轉換系統(tǒng)體積龐大的局限性突顯出來。PBS的使用也使得進一步降低LCoS顯示器的體積變得十分困難。然而,一些研究者提出使用基于薄膜偏振光柵的偏振轉換系統(tǒng)[26-27]或能實現(xiàn)小體積和高效率的需求。
圖3 基于LCoS結構的一種AR頭戴式顯示器的光學系統(tǒng)示意圖[25]Fig.3 Schematic diagram of an LCoS based AR headmounted display optical system[25]
LED技術的發(fā)展大幅提高了LCoS的亮度,使其亮度達到了104~105nits。但LCoS作為一種被動發(fā)光顯示技術,其動態(tài)范圍有限,相對較差的暗狀態(tài)會使其對比度較低,影響AR透視體驗。另一個影響AR體驗的因素是LCoS的響應時間,一般地,AR顯示需要60 Hz以上的刷新率。傳統(tǒng)LC材料的響應時間相對較長,難以滿足60 Hz以上的刷新率需求。為解決此問題,響應速度快和可重復性高的數(shù)字驅動方案被提出和采用[28]。通過在單幀內(nèi)施加不同脈沖寬度的二元電壓,LC分子對均方根電壓做出響應,使人眼感知到平均反射率。雖然數(shù)字驅動方案對LC響應時間要求較低,且可以提供較好的灰度精度,但在灰度變化比較小的情況下,可能會出現(xiàn)較強的邊緣場效應。數(shù)字驅動方案中的LC響應時間要慎重選擇,要使其小于幀時間,但大于脈沖寬度,以避免光強波動。一般來說,響應速度快的LC材料有助于提高模擬驅動和數(shù)字驅動LC器件的性能,因此人們一直致力于獲得亞毫秒響應時間的LC材料。
理想情況下,若人眼視敏度覆蓋100°的視場,則每只眼睛需要6K6K的分辨率,而目前大多數(shù)商用產(chǎn)品的分辨率為≤ 4K2K。要提高分辨率,LCoS顯示器主要面臨以下問題:(1)面板尺寸保持不變時,增大分辨率意味著像素尺寸變小,這將會導致更強的邊緣場效應,同時像素間間隙的限制也可能導致填充因子降低;(2)有源矩陣驅動方案中,柵極線被依次開啟。掃描更新方法使得面板分辨率和柵極線的信號時間(柵極打開+數(shù)據(jù)尋址時間)的乘積為一常數(shù),即幀時間。保持幀率不變,分辨率提高可能會導致充電不足問題的出現(xiàn);(3)計算量隨分辨率的增加而增加,這可能會降低源輸入幀頻。改善硬件性能可用來解決上述一些問題。2004年,Kanazawa等人提出使用像素錯位法集成4個LC顯示屏來實現(xiàn)8K4K的分辨率[29]。此外,采用疊層方法時,在保持體積不會增加太多的情況下,適應反射式LCoS結構的光學系統(tǒng)需被精密設計以滿足器件性能。2008年,JVC實現(xiàn)了8K4K分辨率的LCoS顯示器,但如何獲得更小的像素間距依然是一個難題[30]。
為緩解硬件壓力,人們試圖從時間方面來解決問題。場順序式彩色顯示方法被用于LCoS顯示器中來實現(xiàn)4K2K的分辨率。場順序式彩色顯示按時間順序顯示RGB光,即每個圖像幀被分成3個單色子幀[31]。這樣,分辨率密度可增加至原來的3倍,但系統(tǒng)的刷新率也相應地變?yōu)樵瓉淼?倍。例如,采用場順序式彩色顯示的系統(tǒng)若具有60 Hz的顯示幀率,則將需要180 Hz的色彩變化速率。近年來,像移法和圖像復合法也被用于AR顯示中,通過在每幀圖像中產(chǎn)生兩個光場來增加分辨率[32]。與場順序式彩色顯示一樣,系統(tǒng)所需的場速率也變?yōu)樵瓉淼膬杀丁?/p>
為獲得更大的視場和更高的分辨率,AR顯示需要更高分辨率密度的LCoS面板。理想情況下,AR顯示的像素間距需小于1μm,而目前可實現(xiàn)的最小像素間距為2.5~3μm。制備如此小的像素間距主要有電學和光學兩方面的挑戰(zhàn)。一方面,像素區(qū)域的有限空間將會容納更少的晶體管和存儲電容,導致LC層的低適用電壓。另一方面,邊緣場效應和低填充因子會影響光功率的輸出。目前,商用LCoS面板一般具有較大的像素間距和有限的分辨率,難以提供令人滿意的3D圖像。對硬件進行升級或采用新的光學系統(tǒng)設計是非常必要的。
DLP是一種反射式顯示器[33]。DLP最早由德州儀器開發(fā),利用數(shù)字微鏡元件(Digital Micromirror Device,DMD)來產(chǎn)生圖像。DMD是DLP的基礎,DMD由聚集在硅基片上的微鏡片(精密、微型的反射鏡)組成。每個微鏡片相當于投影畫面的一個像素,微鏡片的數(shù)量即為投影畫面的分辨率。在數(shù)字驅動信號的控制下,微鏡片可沿兩個方向轉動,其中一個方向傾斜+12°,入射光被反射到投影透鏡,進而投射到屏幕上,屏幕變亮;另一個方向傾斜?12°,入射光被反射到吸收平面,由光吸收器吸收,屏幕變暗。微鏡片處于投影狀態(tài)和非投影狀態(tài)時,分別對應“開”和“關”兩種狀態(tài)。通過改變兩種狀態(tài)間的切換頻率,反射光呈現(xiàn)出白和黑之間的各種灰度。
DLP投影系統(tǒng)中,彩色圖像主要通過兩種方法來實現(xiàn)。單片DLP系統(tǒng)采用色輪來產(chǎn)生彩色圖像。色輪由紅、綠、藍濾波系統(tǒng)組成,且以60 Hz的頻率旋轉,每秒產(chǎn)生180個彩色場。色輪旋轉時,紅、綠、藍光按順序投射到DMD上。色輪與視頻信號同步,當紅光投射到DMD上時,微鏡片根據(jù)要顯示的紅光信息(何處顯示、顯示多強的紅光)來相應改變傾斜方向和轉動頻率,綠光和藍光也一樣。人眼視覺系統(tǒng)將紅、綠、藍3種信息綜合,進而形成完整的彩色圖像。3片DLP系統(tǒng)采用3個DMD來產(chǎn)生彩色圖像,每個DMD對應紅、綠、藍光的一種。棱鏡系統(tǒng)首先將白光分為紅、綠、藍光,然后每種光連續(xù)地投射到對應的DMD上產(chǎn)生彩色圖像。3片DLP系統(tǒng)亮度較高,主要用于超大屏幕和高亮度應用場合。
DLP采用數(shù)字光開關來反射光線,具有較高的光效率和亮度,而且每個微鏡片的尺寸一般為14μm×14μm,體積較小,因而可被用于AR頭戴式顯示器中,如已被Vuzix和DigiLens等公司AR眼鏡產(chǎn)品采用。使用LEDs和激光等作為光源,DLP顯示器的動態(tài)范圍比LCoS顯示器更高,且其振幅調制具有偏振無關性。這些特點使得DLP在車載AR顯示系統(tǒng)中也具有廣泛的應用范圍[34]。然而,雖然不使用PBS,DLP的反射光路依然很長,如圖4所示,不利于體積的減小。
圖4 DLP結構示意圖Fig.4 Schematic diagram of DLP structure
為了進一步減小顯示器體積,同時獲得更高的亮度和分辨率,OLED顯示技術被用于AR顯示中。不同于LCoS顯示需要使用LED或激光外置光源通過液晶矩陣產(chǎn)生圖像,OLED是一種自發(fā)光顯示技術。OLED器件在施加電壓時,金屬陰極和ITO陽極產(chǎn)生的電子和空穴在電場力的作用下,分別穿過電子傳輸層和空穴傳輸層,在有機發(fā)光層相遇,形成能量激子,從而激發(fā)發(fā)光分子產(chǎn)生可見光。OLED具有無需背光、高分辨率、高對比度、寬視角、低響應時間和低功耗等優(yōu)點,且其每個像素都可以獨立控制,并能產(chǎn)生3種不同顏色的光,實現(xiàn)彩色顯示。OLED的組成成分為固態(tài)結構,沒有液態(tài)物質,因而抗機械振動性能更好。
隨著AR顯示設備的輕便化,適用于AR眼鏡和頭盔的微型OLED顯示器逐步發(fā)展起來,其典型結構是在白光OLEDs上排列彩色濾光片[35-36],如圖5(彩圖見期刊電子版)所示。彩色濾光片選擇需要通過的波段光波,反射掉其他不需要通過的波段,使人眼接收到飽和的顏色光線。目前,全彩色微型OLED已可實現(xiàn)3 000~5 000 nits的顯示亮度和3 000像素/英寸的分辨率。然而,對于大眼動范圍的AR顯示系統(tǒng),這樣的亮度還遠不夠。而且,由于OLED的壽命與其亮度成反比,OLED顯示屏壽命相對較短,加上成本略高和色彩純度不夠等因素,OLED在AR顯示方面的應用還遠不如LCoS。因此,未來需進一步提高微型OLED顯示器的顯示亮度,器件壽命和電流效率。
圖5 微型OLED結構示意圖Fig.5 Schematic diagram of micro-OLED structure
相比于LCoS和OLED,μLED顯示技術近年來吸引了越來越多的關注,并被視為下一代顯示技術[37-39]。μLED有很多優(yōu)勢,如高效率、長壽命、高分辨率、高色彩飽和度、高動態(tài)范圍等,且可以較高密度集成在芯片上。μLED將LED薄膜化、微小化和陣列化后,可通過巨量轉移技術轉移到驅動電路背板上,再利用物理沉積技術生成外接電極和保護層,以形成微小間距的LED。電路基板可以為硬性或柔性,透明或不透明。
μLED的輕薄、省電和全天候使用等特點,使其在顯示方面的應用非常突出。2014年,蘋果公司收購了擁有多項μLED顯示技術專利的LuxVue公司,將μLED技術用于AR/VR方面。最近報道的可用于AR頭戴式顯示器的全彩色μLED實現(xiàn)了105~106nits的顯示亮度[40]。但目前μLED尚未產(chǎn)業(yè)化,且面臨許多技術挑戰(zhàn),如巨量轉移技術和全彩化顯示等。一方面,由于難以將驅動電路直接制備在μLED襯底上,因此需要將μLED從其襯底上轉移到CMOS驅動電路襯底上。然而,轉移的μLED尺寸小、數(shù)量多,且需要精確對位和非常高的良率,因此巨量轉移技術是目前難以實現(xiàn)的一項關鍵性技術。另一方面,μLED主要采用兩種方法來實現(xiàn)彩色顯示。一是三色RGB法,即分別在不同的襯底上外延并制作紅色、綠色、藍色的μLED芯片,然后將其切割,轉移到目標基板上。由于需要將3種不同的μLED轉移到目標基板上,因此三色RGB法對巨量轉移技術要求很高,實現(xiàn)起來非常困難。另一種方法是短波長μLED+發(fā)光介質法,即利用沉積在短波長μLED上的發(fā)光介質(如熒光粉或量子點)作為顏色轉換層來實現(xiàn)全彩顯示,如圖6(彩圖見期刊電子版)所示。此種方法需要將顏色轉換層放置在尺寸很小的像素上,且目前常用的熒光粉材料顆粒尺寸大,容易造成沉積不均勻[41-42],而量子點材料尺寸小,但材料穩(wěn)定性較差且壽命短[43]。
圖6 μLED結構示意圖Fig.6 Schematic diagram of μLED structure
通常顯示器都含有一個由微小像素結構組成的顯示屏幕,觀察者直接觀察該屏幕或將屏幕上的圖像通過光學系統(tǒng)成像后用眼睛觀察以獲得顯示圖像。隨著AR頭戴式顯示器的發(fā)展,特別是微顯示技術和人眼視覺系統(tǒng)研究的成熟,逐漸出現(xiàn)了一種新型的顯示技術,稱為視網(wǎng)膜掃描顯示(Retinal Scanning Display,RSD)技術。RSD利用掃描器對光束進行二維掃描,掃描圖像經(jīng)成像后在觀察者的視網(wǎng)膜上形成二維圖像,如圖7所示。RSD光源發(fā)出的一個脈沖即為一個像素,掃描器以非常高的頻率振動,人眼因視覺延遲而感知到靜態(tài)的二維圖像。相比于AR顯示常用的LCoS和OLED等傳統(tǒng)平板顯示器,RSD可根據(jù)設備所處環(huán)境的亮暗對顯示亮度和色彩等進行調節(jié),使用戶在清晰觀察周圍環(huán)境的情況下獲得設備傳輸?shù)奶摂M顯示信息。
圖7 視網(wǎng)膜掃描顯示系統(tǒng)示意圖Fig.7 Schematic diagram of retinal scanning display
RSD采用半導體激光器等作為光源,顯示亮度可大幅提高。一般地,RSD的掃描器由相互垂直放置的水平掃描鏡和垂直掃描鏡組成,水平掃描鏡高速掃描形成掃描線,垂直掃描鏡低速掃描使掃描線沿垂直方向平移以形成圖像。North Focals AR 眼鏡采用了一個二維MEMS激光束掃描系統(tǒng)[44],由激光器發(fā)出的光線被反射鏡反射后,再經(jīng)全息膜調制,最后在人眼視網(wǎng)膜上成像。而HoloLens V2采用了兩個一維MEMS激光束掃描系統(tǒng),激光器發(fā)出的紅綠藍三色脈沖分別投射到兩面反射鏡上以形成圖像。Magic Leap提出了另一種基于光纖的激光束掃描系統(tǒng),將紅綠藍三色激光耦合入光纖后,光纖隨驅動器共振產(chǎn)生快速二維運動以形成圖像?;诠饫w的激光束掃描系統(tǒng)體積小、重量輕、分辨率無上限且成本低。隨著技術的發(fā)展和成熟,有望在AR頭戴式顯示器等領域得到應用。RSD的出瞳主要由激光束的參數(shù)和掃描鏡決定,為使出瞳直徑在10~15 mm范圍及以上,通常需要出瞳擴展,這也使得其光學設計更加復雜。
目前,用于AR顯示的各種微顯示器正處于快速發(fā)展階段[45]。為方便人們的選擇,表1給出了5種微顯示器的定性比較??梢钥闯觯琇CoS和DLP顯示器可提供較高的顯示亮度,但光學效率和緊湊性很差,使得它們不適用于未來便攜化的可穿戴頭戴顯示產(chǎn)品。OLED顯示器展現(xiàn)出出色的光學效率和緊湊性,是一種理想的顯示器,其主要限制是有限的顯示亮度。然而,正如我們看到的,OLED顯示器的亮度在過去幾年中已經(jīng)得到了很大的改善。μLED相比OLED、LCoS等顯示技術具有顯著的優(yōu)勢,被認為是最有前途的顯示技術。通過將LED器件小型化,μLED可實現(xiàn)超高分辨率顯示,但也面臨許多新的技術挑戰(zhàn),如巨量轉移技術、全彩化顯示等,目前產(chǎn)學兩界正對此進行廣泛研究。MEMS RSD技術隨著在HoloLens V2上的應用而引起了人們的廣泛關注。RSD技術也能實現(xiàn)非常高的亮度和光效,及非常小的體積,且每次擴大視場時,只需調大掃描鏡轉動角度,不需要重新設計整個光引擎,節(jié)省未來開發(fā)成本。未來很長一段時間內(nèi),OLED,μLED和RSD等技術將共同發(fā)展,哪種技術更適合未來的AR頭戴式顯示產(chǎn)品取決于產(chǎn)品的系統(tǒng)設計參數(shù),光學組合器的選擇和微顯示器自身的性能。換句話說,目前還沒有一種通用的顯示技術能夠適用于所有的AR顯示系統(tǒng)。AR顯示系統(tǒng)是微顯示器和光學組合器的集成,它們需要相互配合以更好地滿足不同的AR系統(tǒng)設計規(guī)格。
表 1幾種AR微顯示器之間的性能對比Tab.1 Performance comparison of different types of AR micro-displays
光學組合器將來自微顯示器的虛擬信息和現(xiàn)實世界的物理景象組合在一起,決定了AR頭戴式顯示器的體積大小、亮度、視場、效率和眼動范圍大小等。原則上,只要能將虛擬顯示信息和現(xiàn)實物理景象組合起來的結構都可用作AR頭戴式顯示器的光學組合器,因此光學組合器的種類多種多樣。但考慮到體積大小、可實現(xiàn)的圖像質量和可批量生產(chǎn)等因素,目前AR顯示常用的光學組合器主要有Birdbath結構、自由曲面反射鏡結構、自由曲面棱鏡結構、陣列波導結構、表面浮雕光柵結構和全息光學元件結構等6種。本節(jié)將介紹以上光學組合器結構的工作原理,主要性能指標及在AR眼鏡中的應用。
Birdbath結構將來自于微顯示器的光線投射到位于眼睛前方的分光鏡上[46-47],如圖8(彩圖見期刊電子版)中紅色光線所示。分光鏡同時反射和透射光線,使用戶在看清現(xiàn)實世界的物理景象時,也可看到微顯示器生成的數(shù)字影像。位于分光鏡一側的凹面鏡用來反射光線,將光重新導向眼睛。
圖8 Birdbath結構示意圖Fig.8 Structure diagram of Birdbath optical combiner
Birdbath結構為AR眼鏡提供了一種較簡單的解決方案,被用于谷歌眼鏡、ODG R8和R9、聯(lián)想Mirage等AR頭戴式顯示器中。采用Birdbath結構的AR眼鏡通常體積較大,視場角中等,一般為50°左右。由于分光鏡為半透半反鏡,光線經(jīng)過分光鏡時被多次反射,每次反射都會產(chǎn)生50%的光損,因此Birdbath結構的能量損失嚴重。
自由曲面反射鏡結構僅使用一個曲面反射鏡收集來自于微顯示器和現(xiàn)實世界的光線[48],如圖9所示。微顯示器的理想位置是與鏡面平行,因此大多數(shù)基于此種結構的AR 頭戴式顯示器都將微顯示器放置在額頭上方,如Mira Prism、Meta 2和DreamGlass等AR眼鏡。采用自由曲面反射鏡結構的AR眼鏡也具有較大體積,可實現(xiàn)的視場角為50°~100°。由于光線僅被反射一次,自由曲面反射鏡結構的光損明顯降低,遠低于Birdbath結構的光損。
圖9 自由曲面反射鏡結構示意圖Fig.9 Structure diagram of freeform mirror optical combiner
自由曲面棱鏡結構巧妙地將兩個折射面,一個全內(nèi)反射面和一個部分反射面合并到一個元件中[49],如圖10所示,增加了結構的自由度。此種結構可以增大視場角,同時提高成像質量,但光學元件的厚度較大,且通常需要一個校正棱鏡來消除環(huán)境光從自由曲面棱鏡的折射。愛普生BT-300、耐德佳X2等AR眼鏡采用了此種結構。將自由曲面棱鏡結構與幾何波導或衍射波導相結合,可以在保證圖像質量的情況下減小體積,是解決光學厚度問題的一個有效途徑,成為近年來的研究熱點。
圖10 自由曲面棱鏡結構示意圖Fig.10 Structure diagram of freeform prism optical combiner
為進一步減小AR頭戴式顯示器的體積,由多個部分反射面組成的陣列波導結構被提出[50-52],如圖11所示。來自于微顯示器的光線耦合進入波導,在波導內(nèi)以全反射形式傳輸,遇到一個部分反射面時將部分光線反射入人眼,部分透射的光則繼續(xù)前進,遇到下一個部分反射面時重復上述過程,直到最后一個面將入射的光線全部反射入人眼。棱鏡是最早用于將光線耦合進入波導的結構,可以將其固定在波導耦入的一端,或將波導切割成一個角度,以允許入射光進入波導管。
圖11 陣列波導結構示意圖Fig.11 Structure diagram of cascaded mirrors optical combiner
進一步減小陣列波導結構的厚度,可以提高透視率,且通過降低部分反射面的反射率,可使光線分布在較大的眼動范圍內(nèi),這種方法被應用于Lumus AR眼鏡等。但級聯(lián)的反射面結構容易產(chǎn)生百葉窗效應。隨著切割/拋光和涂層技術的發(fā)展,以及采用更好的光學設計方法,早期版本中出現(xiàn)的百葉窗效應已被有效降低。由于每一個部分的反射面均會形成一個出瞳,因此可以在波導板厚度很薄的情況下,進行出瞳擴展,實現(xiàn)大視場顯示。然而,波導的全內(nèi)反射角限制了結構的視場角,且多次反射容易產(chǎn)生雜光,使得出射光線強度分布不均勻,圖像質量下降。
表面浮雕光柵(Surface Relief Gratings,SRGs)主要包括矩形光柵、傾斜光柵、閃耀光柵和模擬光柵等結構[53],如圖12所示。SRGs用于將光耦合入或耦合出光波導,且可以工作在反射和透射模式,其中反射模式下可通過在光柵結構表面涂覆金屬層來提高反射效率。SRGs在可見光波段的光柵周期一般小于500 nm,因此需要采用電子束曝光等方法制備模板。模板制備好后,再通過納米壓印復刻到聚合物材料上以實現(xiàn)批量生產(chǎn)。由于空氣和聚合物材料的折射率差,SRGs可實現(xiàn)較大的折射率調制,折射率比δn≥0.5。要降低δn,可使用聚合物材料代替空氣。大δn的SRGs展現(xiàn)出超寬的光譜帶寬和角帶寬,有利于提升整體效率。
圖12 各種表面浮雕光柵結構示意圖[53]。(a)矩形光柵;(b)傾斜光柵;(c)閃耀光柵和(d)模擬光柵Fig.12 Structure diagram of various SRGs[53].(a)Rectangular grating;(b)slanted grating;(c) blazed grating and (d)analog grating
如圖13所示,位于顯示端一側的輸入耦合光柵將來自微顯示器的光線衍射到波導中,衍射角大于波導全內(nèi)反射臨界角。衍射光線以全反射形式在波導內(nèi)向人眼觀察區(qū)域傳輸。位于眼睛前方的輸出耦合光柵衍射傳輸來的光,使其向人眼方向傳輸。為了使光線分布在較大的眼動范圍內(nèi),輸出耦合光柵的衍射效率一般較低,且衍射效率通常呈梯度分布,以使向人眼方向傳輸?shù)难苌涔獾膹姸确植几鶆騕54]。
圖13 光柵波導結構示意圖Fig.13 Structure diagram of grating waveguide optical combiner
波導的全內(nèi)反射臨界角取決于波導材料的折射率大小,其限制了光在波導中傳輸?shù)淖钚〗嵌?。波導材料的折射率越大,對應的全?nèi)反射臨界角越小。此外,全內(nèi)反射的最大角度一般設定為小于80°。因此,高折射率的波導材料是獲得更大角度范圍的關鍵。目前,市面上的玻璃的折射率已可達2.0,而塑料的折射率約為1.75。高折射率的波導材料雖可使視場角增加,但由于光柵的衍射特性,過大的視場角往往難以同時滿足亮度分布和色彩分布的均勻性。光柵衍射方程為
其中,θin和θout分 別是入射角和衍射角,nin和nout分別是入射區(qū)域和衍射區(qū)域的折射率,m是衍射級次,Λ是光柵周期。該方程表明了波長與衍射角的關系。對于固定參數(shù)的光柵結構,不同波長的入射光會被衍射到不同的角度范圍,而波導所允許的全內(nèi)反射角范圍對于所有的波長卻是相同的。因此,如果光柵結構使綠光具有最大的視場角,那么紅光和藍光的視場角通常會被截止而變窄。為了使RGB光具有相同的視場角,通常需要3個不同的光柵結構分別將RGB光衍射到相同的角度范圍。三光柵結構的單波導設計方案,可使RGB光被對應的光柵結構衍射。然而,不同光線之間的串擾,如紅光被綠光對應的光柵結構衍射,成為一個主要問題。低串擾的波導設計方案通常是通過降低光柵波導組合器的光譜帶寬,犧牲整體效率來實現(xiàn)的。為了實現(xiàn)高效率,雙波導和三波導設計方案被采用,這也使得器件厚度相應增加[55]。
圖14 給出了微軟HoloLens V1頭戴式顯示器中使用的光學組合器結構。HoloLens V1采用了三層波導,每層波導的SRG都有不同的光柵周期,以傳輸特定波段的光,使其具有最大視場角[56]。為簡便起見,這里只畫出了兩層波導及其中心區(qū)域。微顯示器和人眼觀察區(qū)域分別位于波導兩側。輸入耦合光柵選用傾斜光柵,這是因為傾斜光柵能夠作用于特定的光譜范圍,同時使剩余光譜不受影響,以被位于下層波導的輸入耦合光柵衍射。輸出耦合光柵也選用傾斜光柵,通過優(yōu)化使其在特定的入射角度范圍(波導全內(nèi)反射允許的角度范圍)更有效地工作,同時保證透視效果不受影響。調制輸出耦合光柵的深度以產(chǎn)生均勻的出射強度分布。輸入和輸出耦合光柵的傾斜角度均接近于45°,轉折光柵(未畫出)的傾斜角度為該角度的一半。
圖14 HoloLens V1光學組合器示意圖[53]Fig.14 Structure diagram of HoloLens V1 optical combiner[53]
圖15 給出了Magic Leap One頭戴式顯示器中使用的光學組合器結構。Magic Leap One采用了六層波導,能在1 m和3 m處實現(xiàn)聚焦以產(chǎn)生3D圖像[57]。同樣地,為簡便起見,這里也只畫出了兩層波導及其中心區(qū)域。微顯示器和人眼觀察區(qū)域位于波導同側。這種結構中,輸入耦合光柵為涂覆金屬層的閃耀光柵。每層波導的輸入耦合光柵在空間位置上相互錯開,以傳輸來自LCoS顯示器的不同波段的光。由于輸入耦合光柵在空間位置上不重疊,因此閃耀光柵不必工作在特定的光波段。輸出耦合光柵為矩形光柵,其深度也被調制以產(chǎn)生均勻的出射強度分布。轉折光柵(未畫出)也為矩形光柵,其周期在每層波導中都不相同。
圖15 Magic Leap One光學組合器示意圖[53]Fig.15 Structure diagram of Magic Leap One optical combiner[53]
全息光學元件(Holographic Optical Element,HOE)是利用光全息術在記錄材料薄膜上記錄點光源的干涉條紋,再經(jīng)過處理制成光柵條紋結構(如圖16所示)的薄膜光學元件,具有光束準直、聚焦、偏轉等功能。記錄材料包括鹵化銀乳膠、重鉻酸明膠、光致聚合物、液晶、光折變晶體、光致抗蝕劑和光導熱塑料等[58-59]。HOE種類包括全息透鏡、全息光柵、全息濾光片和全息掃描器等,其對光的衍射符合布拉格定律,只有滿足布拉格條件的入射光才會被衍射,不滿足布拉格條件的入射光不被衍射。HOE體積薄,重量輕,且可同時記錄多個全息圖,使它能夠替代許多傳統(tǒng)的光學元件,如棱鏡、立方體分束器和光柵等,進一步減小AR頭戴式顯示器體積。近眼顯示系統(tǒng)中,如圖17所示,HOE可同時用作輸入和輸出耦合光柵[60-61],將來自微顯示器或空間光調制器(Spatial Light Modulator,SLM)的光導向人眼,同時在不增加額外光功率的情況下傳輸來自真實場景的光。
圖16 光柵條紋結構示意圖Fig.16 Schematic diagram of grating stripe structure
圖17 全息光學元件波導組合器示意圖[4]Fig.17 Schematic diagram of holographic optical element waveguide combiner[4]
離軸全息透鏡和空間光調制器或MEMS激光掃描器件等可組成全息激光視網(wǎng)膜投影系統(tǒng),如圖18所示,將入射到全息透鏡上的光線重新定向入射到人眼以實現(xiàn)虛擬圖像的顯示[44,62]。離軸全息透鏡方案將一個全息準直透鏡和一個簡單的線性光柵記錄在同一個全息干板上,全息準直透鏡將來自光源的光束準直為平面波,并衍射進基底以進行全內(nèi)反射傳輸,線光柵則將光束衍射出基底進入人眼。此種方案采用HOE作為組合元件,結構緊湊,視場角大,體積小,眼動范圍也比較小。然而,由于全息透鏡具有復雜的像差和嚴重的色散,因此成像效果不理想。采用離軸全息透鏡方案的典型AR頭戴式顯示器是North Focals AR眼鏡。
圖18 離軸全息光學元件組合器示意圖[4]Fig.18 Schematic diagram of off-axis holographic optical element combiner[4]
當記錄介質厚度遠大于條紋間距時,全息光柵為體全息光柵。折射率比δn較小時,體全息光柵展現(xiàn)出良好的光譜選擇性,且通常工作在反射模式。反射體全息能避免色串擾的出現(xiàn),是一種良好的白光再現(xiàn)全息圖。全色反射體全息圖可通過相位復用3個單色反射體全息圖來實現(xiàn),但效率較低。為提高效率和使體全息光柵能夠工作在透射模式,需增大折射率比。Digilens提出了一種基于全息聚合物分散液晶(Holographic Polymer-Dispersed Liquid Crystals,HPDLCs)的體全息光柵結構,在干涉曝光下利用LCs和單體的相分離來產(chǎn)生折射率調制[63]。干涉曝光后,光柵結構中形成的LC納米液滴由外加電壓驅動,實現(xiàn)電控切換的體全息光柵。HPDLCs具有較大的折射率比,在厚度小于4μm時也可產(chǎn)生較強的耦合效率。雖然增大折射率比可提高效率及增大光譜帶寬和角帶寬,但使用現(xiàn)有材料一般難以實現(xiàn),且大折射率比的全息光柵材料通常對環(huán)境條件(如溫度和濕度等)更敏感。
增大全息光柵的厚度可使光譜帶寬或角帶寬變窄,不利于用于AR顯示中。但全息光柵厚度增加時,可相位復用的全息圖個數(shù)也將增加,可使多個布拉格衍射條件協(xié)同工作以獲得較寬的光譜帶寬和角帶寬[53]。厚度達500μm的體全息光柵在反射和透射模式下工作良好,但需被放置在兩層波導板之間。圖19展示了位于波導板之間的透射體全息光柵的光線傳輸情況。對于輸出耦合光柵,光線向下傳輸時,遠離布拉格狀態(tài),不發(fā)生衍射;向上傳輸時,處于或接近布拉格狀態(tài),產(chǎn)生衍射光。
圖19 體全息光柵波導組合器示意圖Fig.19 Schematic diagram of volume holographic grating waveguide combiner
偏振體光柵(Polarization Volume Grating,PVG)是另一種基于液晶的體全息光柵[64-69],如圖20所示。PVG主要由兩種方法制備獲得。一種方法是利用LC材料的光定向和自組裝。光定向層首先涂覆在襯底上,然后通過干涉曝光來定義面內(nèi)晶軸,最后將液晶聚合物前體涂覆在曝光后的光定向層上。前體中的手性分子促使LCs在光定向層上按照記錄的光柵周期自組裝成螺旋結構,形成PVG。另一種方法是利用肉桂酸的光環(huán)合反應將體極化場記錄到材料中。首先將含肉桂酸酯基的LC前體薄膜涂覆在襯底上,然后使用左旋和右旋圓偏光干涉曝光涂覆樣品,記錄三維極化場。高溫退火后,雙折射增加,PVG形成。上述任一種制備方法,除了折射率有所變化外,PVG的布拉格衍射都是由LC光軸的螺旋旋轉形成的,這說明PVG的折射率調制δn其實是LC材料的雙折射Δn。液晶顯示產(chǎn)業(yè)的發(fā)展使得Δn可在0.05~0.4范圍內(nèi)變化,因此PVG的折射率比也可在較大范圍內(nèi)調節(jié)。PVG具有較強的偏振選擇性,可用于提高效率、增大視場角和擴展出瞳等[70]。
圖20 偏振體光柵結構示意圖[67]Fig.20 Structure diagram of polarization volume grating[67]
表2 總結了以上光學組合器的一些性能參數(shù)及批量加工方法。Birdbath、自由曲面反射鏡和自由曲面棱鏡結構成像質量雖好,但體積較大,且結構視場角越大,光學鏡片越厚,體積越大,限制了它們在AR頭戴式顯示器方面的應用。陣列波導結構具有輕薄、眼動范圍大和色彩均勻的優(yōu)勢,設計方案成熟,具備大規(guī)模的量產(chǎn)能力,但目前尚未成為AR頭戴式顯示器的主流方案。如何充分考慮雜散光和人眼兼容性,如何控制各個膜層的反射率和透過率,如何控制鍍膜工藝,以保證整個眼動范圍內(nèi)亮度和色彩的均勻性,是陣列波導結構的研究重點。SRG結構具有大視場和大眼動范圍的優(yōu)勢,同時由于納米壓印的便利性,受到了越來越多的關注。但SRG目前的主要問題有:(1)效率低;(2)色彩不均勻和彩虹效應;(3)波導板兩側均有圖像信息耦出;(4)納米壓印的良率問題。微軟HoloLens和Magic Leap One AR頭戴式顯示器采用的都是SRG方案,且HoloLens是目前AR市場上的主導產(chǎn)品??梢哉f,SRG是目前AR頭戴式顯示器的主流方案,但還需進一步完善設計方案和提升量產(chǎn)良率。離軸全息透鏡結構視場角大,體積輕巧,未來有可能成為消費市場的主導產(chǎn)品,但目前受限于眼動范圍比較小,只在個別領域有所應用。體全息光柵波導結構利用全息光柵作為波導組合器的輸入和輸出耦合光柵,相比于陣列波導結構采用幾何光學元件來耦入和耦出光線,可有效降低顯示系統(tǒng)的厚度和重量。體全息光柵結構還具有色彩均勻性好和易于實現(xiàn)單片彩色波導的優(yōu)勢,但其采用全息干涉曝光的方法進行波導片的加工,無法進行大規(guī)模的量產(chǎn)。同時,做大視場角需要疊加多層全息光柵,且做彩色波導片需要高密度的曝光材料,這進一步增加了工藝難度。因此,體全息光柵波導結構在短期內(nèi)也難成為AR頭戴式顯示器的主流方案。
表2 AR光學組合器的性能對比Tab.2 Performance comparison of AR optical combiners
AR顯示技術面臨的挑戰(zhàn)是影響AR普及的主要因素。人眼視覺系統(tǒng)的需求為AR顯示提供了定量標準,也指出了當前AR頭戴式顯示器中需要解決的主要問題,如分辨率、視場角、顯示亮度、輻輳-調節(jié)沖突和體積大小等。分辨率的高低和視場角的大小取決于微顯示芯片的尺寸,高的分辨率和大的視場角需要更大尺寸的微顯示芯片。視場角越大,顯示亮度需求越高,顯示器也會變得更笨重。輻輳-調節(jié)沖突一般通過改變顯示平面距離和提供不同顯示平面等方法來解決。光學組合器將虛擬物體和真實景象相結合,決定了AR頭戴式顯示器的顯示亮度。傳統(tǒng)的反射式組合器成像質量較好,效率高,體積也較大。光柵波導組合器體積雖小,但顯示亮度不足,且光柵衍射容易使亮度分布和色彩分布不均勻。在目前技術水平下,如何在視場角和顯示亮度等指標上找到相應的平衡對AR設備至關重要。隨著顯示技術、光學技術和數(shù)字處理芯片的發(fā)展,未來的AR頭戴式顯示器必然會更加小巧和舒適,也更能滿足大眾消費者的需求。