劉經(jīng)南,高柯夫
(1.武漢大學(xué) 衛(wèi)星導(dǎo)航研究中心,湖北 武漢 430079)
增強(qiáng)現(xiàn)實(shí)技術(shù)的目的是將真實(shí)世界中蘊(yùn)含的信息數(shù)據(jù),與人們目視的場(chǎng)景實(shí)時(shí)融合,以增強(qiáng)對(duì)真實(shí)世界的認(rèn)識(shí)。根據(jù)定義,增強(qiáng)現(xiàn)實(shí)通常包括3個(gè)方面內(nèi)容[1]:虛擬和現(xiàn)實(shí)結(jié)合;實(shí)時(shí)與環(huán)境互動(dòng);定位配準(zhǔn),真實(shí)與虛擬全方位匹配。增強(qiáng)現(xiàn)實(shí)可視作現(xiàn)實(shí)與虛擬的連續(xù)統(tǒng)一[2],無(wú)縫對(duì)接和信息深度服務(wù),其基本流程如圖1所示。
圖1 增強(qiáng)現(xiàn)實(shí)系統(tǒng)基本流程
圖2 基于增強(qiáng)現(xiàn)實(shí)的報(bào)紙[3]
美國(guó)麻省理工學(xué)院(MIT)已將氣象數(shù)據(jù)通過(guò)圖像識(shí)別和定位配準(zhǔn)方式動(dòng)態(tài)投影到報(bào)紙地圖中對(duì)應(yīng)的位置,如圖2所示。目前,位置服務(wù)(LBS)僅做到表層街景的應(yīng)用,與街景的感知內(nèi)容設(shè)備,如攝像頭、多媒體、麥克風(fēng)等無(wú)關(guān)。增強(qiáng)現(xiàn)實(shí)的LBS服務(wù)可直接利用多視角攝像頭等感知設(shè)備做到道路建筑辨識(shí)、肢體動(dòng)作控制、社會(huì)信息推送,并實(shí)時(shí)疊加各類多媒體信息內(nèi)容,效果直觀,內(nèi)容豐富,更能滿足人們的生活需求。目前在Android、iPhone以及Windows Phone等手機(jī)平臺(tái)上,已經(jīng)出現(xiàn)了不少采用增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用程序,并開(kāi)始在泛在測(cè)繪的場(chǎng)景分析中展開(kāi)應(yīng)用。
增強(qiáng)現(xiàn)實(shí)的研究最早可以追溯到1968年,美國(guó)MIT的Ivan Sutherland 教授研制出世界上第一臺(tái)光學(xué)透明頭戴式顯示器[6],用于實(shí)時(shí)顯示計(jì)算機(jī)圖形。20世紀(jì)70、80年代,增強(qiáng)現(xiàn)實(shí)技術(shù)研究在美國(guó)空軍、NASA、MIT、北卡羅來(lái)納大學(xué)等研究機(jī)構(gòu)展開(kāi)。到了20世紀(jì)90年代初期,波音公司的Tom Caudell和他的同事在設(shè)計(jì)的輔助布線系統(tǒng)中首次提出了“增強(qiáng)現(xiàn)實(shí)”這一名詞[7]。在他們?cè)O(shè)計(jì)的系統(tǒng)中,把由簡(jiǎn)單線條繪制的布線路徑和文字提示信息實(shí)時(shí)疊加在機(jī)械師的視野中,以助其完成拆卸過(guò)程,減少日常工作中出錯(cuò)的概率。
1993年,美國(guó)加州大學(xué)的J. Loomis開(kāi)發(fā)了聽(tīng)覺(jué)增強(qiáng)的戶外導(dǎo)航系統(tǒng)[8],輔助盲人進(jìn)行語(yǔ)音導(dǎo)航。1997年,美國(guó)哥倫比亞大學(xué)Steven Feiner等人開(kāi)發(fā)了首個(gè)移動(dòng)增強(qiáng)現(xiàn)實(shí)系統(tǒng)Touring Machine[9],用于校園導(dǎo)航,如圖3所示。用戶通過(guò)穿透式頭戴顯示屏,在真實(shí)的圖書(shū)館上同步顯示相關(guān)的介紹信息,其移動(dòng)計(jì)算交由背負(fù)的電腦,并連入校園無(wú)線網(wǎng)絡(luò)。2001年,希臘INTRACO電信的Vlahakis等人開(kāi)發(fā)了基于移動(dòng)增強(qiáng)現(xiàn)實(shí)的文化遺產(chǎn)導(dǎo)航系統(tǒng)[10],用戶通過(guò)GPS定位及無(wú)線通信,在真實(shí)的歷史遺址上感受虛實(shí)融合的建筑復(fù)原模型。2002年,奧地利格拉茲工業(yè)大學(xué)Michael Kalkusch等人開(kāi)發(fā)了基于移動(dòng)增強(qiáng)現(xiàn)實(shí)的室內(nèi)標(biāo)記定位系統(tǒng)[11]。2006年,諾基亞研究院的MARA(Mobile Augmented Reality Applications)項(xiàng)目[12],首次在配備傳感器和攝像機(jī)的手機(jī)上實(shí)現(xiàn)了移動(dòng)增強(qiáng)現(xiàn)實(shí)應(yīng)用。
圖3 Touring Machine工作示意圖[13]
2007年以來(lái),隨著iPhone對(duì)手機(jī)的重定義,手機(jī)應(yīng)用的可能性得到極大釋放,出現(xiàn)了大量基于移動(dòng)增強(qiáng)現(xiàn)實(shí)的位置服務(wù)應(yīng)用。例如,Wikitude能讓用戶使用手機(jī)辨識(shí)附近的飯店、商場(chǎng)、地標(biāo)等信息,用戶也可以實(shí)時(shí)發(fā)表關(guān)于景點(diǎn)的評(píng)價(jià);Layar的功能更強(qiáng)大,能夠引導(dǎo)用戶找到附近的ATM機(jī)或在當(dāng)前位置上疊加有關(guān)建筑的歷史信息和照片。2個(gè)應(yīng)用都是通過(guò)手持設(shè)備的GNSS模塊和電子羅盤,定位計(jì)算當(dāng)前位置及手機(jī)攝像頭朝向,通過(guò)無(wú)線通信網(wǎng)絡(luò)獲取興趣點(diǎn)的相關(guān)信息,再將信息疊加、配準(zhǔn)到手機(jī)屏幕中,以達(dá)到虛實(shí)融合的效果。
2010年11月,微軟推出3D攝影機(jī)Kinect,利用光編碼技術(shù),獲得空間中不同距離的衍射斑點(diǎn),以對(duì)空間進(jìn)行標(biāo)記,從而確定其中物體的位置。歐美出現(xiàn)了很多基于Kinect的應(yīng)用,如在線試衣導(dǎo)購(gòu)系統(tǒng)[14],如圖4所示,將衣服圖片與攝影機(jī)中的人像配準(zhǔn),用戶可以實(shí)時(shí)查看衣服上身效果。
圖4 基于Kinect的增強(qiáng)現(xiàn)實(shí)導(dǎo)購(gòu)系統(tǒng)[15]
2011年3月,臺(tái)灣工研院將基于圖像的建模方法和增強(qiáng)現(xiàn)實(shí)技術(shù)應(yīng)用到3D電視中[16],采用相機(jī)陣列捕獲物體信息,重建物體三維模型,在具有預(yù)定義標(biāo)注點(diǎn)的實(shí)拍場(chǎng)景中實(shí)現(xiàn)虛擬三維模型與真實(shí)場(chǎng)景的融合,開(kāi)辟了電視技術(shù)發(fā)展的一個(gè)新方向。
2012年9月,諾基亞增強(qiáng)現(xiàn)實(shí)應(yīng)用City Lens正式登陸Windows Phone應(yīng)用市場(chǎng),如圖5所示,City Lens 會(huì)通過(guò)增強(qiáng)現(xiàn)實(shí)接口為用戶實(shí)時(shí)顯示鏡頭中的餐館、商場(chǎng)、機(jī)構(gòu)及景點(diǎn)的基本信息,并分別給予評(píng)價(jià)和推薦。
圖5 City Lens手機(jī)界面[17]
目前國(guó)內(nèi)增強(qiáng)現(xiàn)實(shí)技術(shù)的相關(guān)研究主要集中在高校和科研院所。北京理工大學(xué)光學(xué)系對(duì)增強(qiáng)現(xiàn)實(shí)的頭戴式顯示器進(jìn)行了研究[18],完成了對(duì)圓明園景觀的數(shù)字重建。浙江大學(xué)和Intel合作實(shí)現(xiàn)了增強(qiáng)現(xiàn)實(shí)環(huán)境下的自然人手3D交互[19]。國(guó)內(nèi)許多船舶、航空航天等軍工單位以及汽車企業(yè)都建立了大型虛擬現(xiàn)實(shí)環(huán)境和增強(qiáng)現(xiàn)實(shí)系統(tǒng),但其設(shè)備成本相對(duì)較高??傮w來(lái)說(shuō),增強(qiáng)現(xiàn)實(shí)技術(shù)在國(guó)內(nèi)具有很大的發(fā)展空間。
增強(qiáng)現(xiàn)實(shí)技術(shù)的研究范圍十分廣泛,涉及諸如信號(hào)處理、計(jì)算機(jī)圖形和圖像處理、模式識(shí)別、人機(jī)交互和心理學(xué)、移動(dòng)計(jì)算、計(jì)算機(jī)網(wǎng)絡(luò)、云計(jì)算、大數(shù)據(jù)、信息獲取和信息可視化,以及新型顯示器和傳感器的設(shè)計(jì)等各個(gè)領(lǐng)域。
增強(qiáng)現(xiàn)實(shí)的顯示技術(shù)是信息可視化的基礎(chǔ),目前對(duì)個(gè)人使用多采用頭戴式顯示器。頭戴式顯示器主要分2類,一種是頭戴式視頻顯示器,在眼鏡上提供2個(gè)屏幕分別給左右眼觀賞,只要分別給兩邊不同的信號(hào)即可成像,其缺點(diǎn)在于僅供單一觀眾觀賞,且造價(jià)高,頭盔重;另一種是穿戴式光學(xué)顯示器,2012年發(fā)布的Google Glass就屬于這一類。如圖6所示,其眼鏡的右半部,包括攝像頭、觸控板、麥克風(fēng)、陀螺儀、加速度計(jì)、GPS、Wi-Fi、藍(lán)牙及處理器模塊。根據(jù)不同需要,在目鏡上可以顯示距離、方向、地圖和導(dǎo)航信息。
圖6 Google Glass功能架構(gòu)及顯示界面[20]
2013年初的開(kāi)發(fā)版Google Glass很可能還將采用類似全息投影的技術(shù)[21],將圖像投射到Google Glass透明的目鏡上。更為輕便的還有基于增強(qiáng)現(xiàn)實(shí)的隱形眼鏡。華盛頓大學(xué)的研究團(tuán)隊(duì)將天線、無(wú)線接收器、控制電路和LED集成到一枚隱形眼鏡中[22],這種隱形眼鏡顯示屏由一個(gè)遠(yuǎn)程射頻發(fā)射器供電,鏡片上有一個(gè)5 mm長(zhǎng)的天線,用于接收10 cm外由發(fā)射器發(fā)射的千兆赫范圍內(nèi)的無(wú)線電射頻能量,不過(guò)目前顯示屏的分辨率還僅為單像素水平。
還有空間顯示技術(shù),即用數(shù)字投影儀將虛擬信息直接投射在真實(shí)場(chǎng)景上,如圖7所示,電話撥號(hào)盤被直接投影到人手上,以實(shí)現(xiàn)撥號(hào)功能。數(shù)字投影儀的投影內(nèi)容一般由強(qiáng)大的處理單元計(jì)算和控制,不僅要考慮現(xiàn)實(shí)場(chǎng)景的凹凸表面,還要保證不同角度下的投影真實(shí)性。
圖7 基于空間顯示技術(shù)的電話撥號(hào)鍵盤[3]
全息顯示技術(shù)是一種可供多人同時(shí)使用的真三維顯示技術(shù),是顯示技術(shù)未來(lái)發(fā)展的重要方向。其原理是利用光束的衍射與干涉效應(yīng),記錄并再現(xiàn)物體的光強(qiáng)與相位的三維顯示,目前主要應(yīng)用于小范圍場(chǎng)景的三維顯示。2012年北京車展,豐田發(fā)布采用全息投影技術(shù)的概念車Fun-Vii[23],用全息投影生成一位行車助手,如同真人一樣通過(guò)語(yǔ)音與駕駛者交流并提供導(dǎo)航信息。
圖像識(shí)別和特征提取在增強(qiáng)現(xiàn)實(shí)應(yīng)用中是一項(xiàng)將圖像或視頻配準(zhǔn)到實(shí)體上以實(shí)現(xiàn)虛實(shí)融合的重要技術(shù)。識(shí)別圖像主要使用模式識(shí)別技術(shù)(模板匹配、邊緣檢測(cè)等),識(shí)別出預(yù)先定義好的標(biāo)記、物體或基準(zhǔn)點(diǎn),然后根據(jù)其偏移和轉(zhuǎn)動(dòng)角度計(jì)算相應(yīng)標(biāo)記的坐標(biāo)轉(zhuǎn)換矩陣,將標(biāo)記的特征信息預(yù)存,在采集的視頻流中查找標(biāo)記并確定其方位,然后將虛擬圖像與標(biāo)記配準(zhǔn),實(shí)現(xiàn)虛實(shí)融合。
實(shí)景中的自然圖像識(shí)別,則通過(guò)對(duì)所攝圖像進(jìn)行解析,識(shí)別出場(chǎng)景的目標(biāo)物體,再在其上疊加相關(guān)信息。該類識(shí)別不需要特定標(biāo)記,通過(guò)解析圖像建立虛擬坐標(biāo),能夠很自然地進(jìn)行虛實(shí)融合,但對(duì)圖像實(shí)時(shí)處理能力要求高,且受環(huán)境及目標(biāo)實(shí)時(shí)狀態(tài)的影響,錯(cuò)誤率較高,目前僅適用于簡(jiǎn)單場(chǎng)景。
在目標(biāo)識(shí)別過(guò)程中,對(duì)自然場(chǎng)景及目標(biāo)物體的外觀圖像抽象是一項(xiàng)很重要的任務(wù)。所謂的抽象即尋找出一些具有代表性特征的關(guān)鍵點(diǎn)。圖像特征提取就是以一定的算法加以排列描述,使得同一特征點(diǎn)出現(xiàn)在不同幀時(shí),能夠迅速檢測(cè)并識(shí)別。其一般步驟,如圖8所示,通過(guò)對(duì)處理后的原始圖像進(jìn)行特征檢測(cè)及形式化描述,按類別對(duì)其分類,綜合得出識(shí)別結(jié)果。
圖8 物體識(shí)別的基本步驟
定位配準(zhǔn)實(shí)際上就是將計(jì)算機(jī)生成的虛擬物體和真實(shí)環(huán)境中影像“對(duì)齊”的過(guò)程。定位必須先確定虛擬物體與觀察者之間的關(guān)系,然后對(duì)目標(biāo)物體進(jìn)行識(shí)別,計(jì)算攝像機(jī)相對(duì)于目標(biāo)物體的位置和姿態(tài),確定虛擬物體在圖像平面的渲染位置,再通過(guò)正確的幾何投影將虛擬物體配準(zhǔn)到觀察者的視野中。
對(duì)目標(biāo)物體進(jìn)行配準(zhǔn),涉及到圖像坐標(biāo)系、相機(jī)坐標(biāo)系和世界坐標(biāo)系等之間的坐標(biāo)變換。我們建立一個(gè)坐標(biāo)系,如圖9所示,其坐標(biāo)原點(diǎn)設(shè)為相機(jī)的光心C=(0,0,0),X-Y平面和相機(jī)的像平面平行,且像平面在相機(jī)坐標(biāo)系中的表達(dá)式為Z=f,此坐標(biāo)系稱為相機(jī)坐標(biāo)系{O, Xc , Yc , Zc}。
圖9 相機(jī)的針孔模型
計(jì)算機(jī)中處理的數(shù)字圖像都是以像素為單位的。而在相機(jī)坐標(biāo)系中,三維物體是以物理單位定義的,經(jīng)透視變換后形成的圖像中的點(diǎn)也是物理單位的。因此,存在以物理單位表示的圖像坐標(biāo)系和數(shù)字圖像系的坐標(biāo)轉(zhuǎn)換。
以物理單位表示的圖像坐標(biāo)系與相機(jī)坐標(biāo)系之間的變換又稱為透視投影,它是從三維到兩維的變換,也是相機(jī)成像過(guò)程中的核心變換。
日常生活中,人們依靠多種感官(如視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)及重力感應(yīng)等)信息,維持自身的方向感。定位配準(zhǔn)過(guò)程同樣需要進(jìn)行大量的標(biāo)定,測(cè)量值包括攝像機(jī)參數(shù)、視域范圍、傳感器的偏移、對(duì)象定位以及變形等。
目前的配準(zhǔn)手段主要有3類:①基于傳感器硬件,采用紅外線、RFID、超寬帶、電磁、超聲波、慣導(dǎo)等感知設(shè)備,確定傳感器和信號(hào)源之間的相對(duì)距離,其優(yōu)點(diǎn)在于實(shí)時(shí)性高;②基于機(jī)器視覺(jué),對(duì)攝入的圖像數(shù)據(jù)進(jìn)行識(shí)別,檢測(cè)出目標(biāo)物體,獲取攝像機(jī)相對(duì)于目標(biāo)物體的姿態(tài),并根據(jù)攝像機(jī)內(nèi)部參數(shù),計(jì)算投影模型,最后渲染虛擬物體,其中涉及到圖像識(shí)別技術(shù)和攝像機(jī)姿態(tài)定位技術(shù),其優(yōu)勢(shì)在于成本低;③基于無(wú)線網(wǎng)絡(luò),即利用通信網(wǎng)絡(luò)、Wi-Fi、廣播網(wǎng)絡(luò)等進(jìn)行檢測(cè)和定位。
GNSS系統(tǒng)為增強(qiáng)現(xiàn)實(shí)提供絕對(duì)定位。GNSS與Sensor結(jié)合,即通過(guò)GNSS取得經(jīng)緯度和高程,通過(guò)地磁電子指南針取得方向和傾斜角度,最后根據(jù)這些位置信息提供信息服務(wù)并疊加顯示在終端上。此種輔助定位方式適合于移動(dòng)終端上的應(yīng)用,目前的Android手機(jī)和iPhone等都已具備硬件裝置。在泛在測(cè)繪應(yīng)用中的增強(qiáng)現(xiàn)實(shí),則采用高精度的實(shí)時(shí)GNSS定位和高精度定向技術(shù),如網(wǎng)絡(luò)RTK和GNSS慣導(dǎo)器件的緊組合或超緊組合設(shè)備以完成輔助定位。
電影行業(yè)是最早采用增強(qiáng)現(xiàn)實(shí)技術(shù)的領(lǐng)域之一,利用增強(qiáng)現(xiàn)實(shí)技術(shù),使得導(dǎo)演能夠形象化地預(yù)覽虛擬場(chǎng)景,并直接看到影視最終的拍攝效果。在電視制作領(lǐng)域,通過(guò)增強(qiáng)現(xiàn)實(shí)技術(shù)可以在播放電視節(jié)目時(shí),將相關(guān)信息實(shí)時(shí)疊加到畫(huà)面指定位置,如游泳比賽時(shí)(見(jiàn)圖10),將世界紀(jì)錄、比賽成績(jī)、選手信息實(shí)時(shí)疊加到對(duì)應(yīng)泳道上,使得數(shù)據(jù)更實(shí)時(shí),信息更直觀,目前已在賽事直播、文藝演出中廣泛采用。
圖10 基于增強(qiáng)現(xiàn)實(shí)技術(shù)的賽事直播[24]
增強(qiáng)現(xiàn)實(shí)技術(shù)應(yīng)用在教育領(lǐng)域,使得符合學(xué)生自身特點(diǎn)的個(gè)性化教學(xué)過(guò)程得以展開(kāi)。學(xué)生可以根據(jù)自身的需求和薄弱環(huán)節(jié)自主學(xué)習(xí),從而實(shí)現(xiàn)教育質(zhì)量的提升。例如,索尼將要發(fā)布的增強(qiáng)現(xiàn)實(shí)外設(shè)Wonder Book[25]被設(shè)計(jì)得像一本真正的書(shū),用戶通過(guò)動(dòng)作控制器創(chuàng)建與操縱數(shù)字畫(huà)面,如揮揮手,就會(huì)將其轉(zhuǎn)換成一個(gè)圍繞圖書(shū)的動(dòng)畫(huà)效果,以此達(dá)到與圖書(shū)互動(dòng)的效果。所有的動(dòng)作都由攝像頭記錄并識(shí)別,互動(dòng)的效果將同步顯示在電視屏幕上。
在工業(yè)輔助設(shè)計(jì)領(lǐng)域,借助增強(qiáng)現(xiàn)實(shí)技術(shù)可以更加直觀、高效,低成本地對(duì)工業(yè)設(shè)計(jì)的效果進(jìn)行評(píng)估分析;在工業(yè)維修領(lǐng)域,將多種輔助信息以增強(qiáng)現(xiàn)實(shí)的方式呈現(xiàn)給用戶,包括虛擬儀表面板、設(shè)備內(nèi)部結(jié)構(gòu)、設(shè)備零件圖及維修工序等,有望改變制造業(yè)職工的培訓(xùn)模式。在軍事領(lǐng)域早已廣泛使用增強(qiáng)現(xiàn)實(shí)技術(shù),進(jìn)行輔助駕駛、單兵作戰(zhàn)訓(xùn)練、戰(zhàn)場(chǎng)環(huán)境分析等訓(xùn)練活動(dòng)。在醫(yī)療領(lǐng)域,醫(yī)生借助增強(qiáng)現(xiàn)實(shí)技術(shù),可以輕松地進(jìn)行手術(shù)部位的精準(zhǔn)定位,圖11所示為德國(guó)癌癥研究中心采用增強(qiáng)現(xiàn)實(shí)的App應(yīng)用輔助外科手術(shù)。在古跡復(fù)原和數(shù)字化文化遺產(chǎn)保護(hù)領(lǐng)域,文化古跡的信息以增強(qiáng)現(xiàn)實(shí)的方式提供給參觀者,用戶不僅可以看到古跡的文字解說(shuō),還能看到遺址上殘缺部分的虛擬重構(gòu),圖12所示為由倫敦博物館推出的增強(qiáng)現(xiàn)實(shí)手機(jī)應(yīng)用。用戶可以使用GNSS定位,把手機(jī)對(duì)準(zhǔn)目標(biāo)建筑,系統(tǒng)會(huì)匹配出該建筑幾十年前的樣子。
圖11 增強(qiáng)現(xiàn)實(shí)輔助的外科手術(shù)[26]
圖12 倫敦博物館的“Street Museum”應(yīng)用[27]
導(dǎo)航及位置服務(wù)泛指一切以移動(dòng)設(shè)備地理位置和移動(dòng)網(wǎng)絡(luò)為基礎(chǔ)構(gòu)成的信息綜合服務(wù),是當(dāng)前信息服務(wù)業(yè)的重要組成部分。增強(qiáng)現(xiàn)實(shí)技術(shù)在導(dǎo)航中的應(yīng)用,最早出現(xiàn)于車載導(dǎo)航中。類似于戰(zhàn)斗機(jī)中抬頭式顯示器的原理,很多車廠都在其高端車型中將簡(jiǎn)單的地圖和導(dǎo)航信息顯示在駕駛員一側(cè)的擋風(fēng)玻璃前的半透明屏幕上,但其缺點(diǎn)是信息單一,無(wú)法與所處環(huán)境交互。
隨著智能手機(jī)的迅速普及,位置服務(wù)已經(jīng)成為移動(dòng)互聯(lián)網(wǎng)的標(biāo)準(zhǔn)配置[29]。人們對(duì)手機(jī)依賴性的提高,也使得增強(qiáng)現(xiàn)實(shí)技術(shù)向移動(dòng)終端發(fā)展,為位置服務(wù)帶來(lái)個(gè)性化的深度服務(wù)。其使用攝像頭、GNSS定位模塊,結(jié)合電子地圖向移動(dòng)終端實(shí)時(shí)更新位置數(shù)據(jù),通過(guò)基于增強(qiáng)現(xiàn)實(shí)的視覺(jué)、聽(tīng)覺(jué)提示向用戶傳達(dá)方位,通過(guò)挖掘人們的使用行為和偏好,向移動(dòng)終端推送興趣信息。其深度服務(wù)在于通過(guò)與SoLoMo[29]結(jié)合,實(shí)現(xiàn)移動(dòng)互聯(lián)網(wǎng)、社交網(wǎng)絡(luò)與位置服務(wù)的深度融合,增強(qiáng)人與人的社交場(chǎng)景感知。
增強(qiáng)現(xiàn)實(shí)技術(shù)在移動(dòng)終端上的應(yīng)用,除了要具備傳統(tǒng)增強(qiáng)現(xiàn)實(shí)的虛實(shí)結(jié)合、實(shí)時(shí)交互和定位配準(zhǔn)外,還需要具備較高的自由移動(dòng)性,不會(huì)因?yàn)榄h(huán)境因素而只能固定在一個(gè)較小范圍內(nèi)活動(dòng),這對(duì)終端的計(jì)算性能提出了較高要求。而目前高性能智能手機(jī)的普及,使得嵌入式實(shí)時(shí)視覺(jué)追蹤和識(shí)別成為可能。同時(shí)電子地圖平臺(tái)逐步從簡(jiǎn)單2D模式向關(guān)聯(lián)信息和圖像的3D模式轉(zhuǎn)變,使得基于地圖平臺(tái)的非結(jié)構(gòu)化大數(shù)據(jù)信息的獲取成為可能。
目前,位置服務(wù)應(yīng)用都在界面上顯示電子地圖,對(duì)于使用者而言,看見(jiàn)了電子地圖,接著再看眼前的實(shí)景,需要在心里進(jìn)行整合,才能明白地圖上所繪出的某條路線是所看到的哪一條,還無(wú)法做到“知行合一”。而基于增強(qiáng)現(xiàn)實(shí)的位置服務(wù)應(yīng)用,則彌補(bǔ)了這種不便,使用者只需將攝像頭對(duì)準(zhǔn)興趣地點(diǎn)、建筑或街道,即可在界面上實(shí)時(shí)看到興趣信息。
為真正做到“知行合一”,建立關(guān)聯(lián)信息的3D實(shí)景模型是必不可少的。通過(guò)移動(dòng)測(cè)繪系統(tǒng)對(duì)路面數(shù)據(jù)進(jìn)行采集,可以建立3D實(shí)景數(shù)據(jù)模型,實(shí)現(xiàn)真正的全三維實(shí)景導(dǎo)航。該系統(tǒng)通常由定位定姿系統(tǒng)(POS)、激光掃描儀與全景相機(jī)(panoramic camera)、工業(yè)相機(jī)(CCD)、工業(yè)化計(jì)算機(jī)系統(tǒng)組成,不僅可以采集街景數(shù)據(jù),還可以采集道路、標(biāo)線、標(biāo)牌、街邊建筑物,甚至井蓋等所有能看到的地理信息數(shù)據(jù),進(jìn)一步擴(kuò)展了泛在測(cè)繪[30]的范疇。Google于2007年推出的街景功能,如圖13所示。
圖13 Google街景數(shù)據(jù)的泛在式采集[31]
首先將采集到的街景數(shù)據(jù)(如圖14所示)保存到服務(wù)器端的街景圖像庫(kù),并建立索引;然后在現(xiàn)有2D電子地圖的基礎(chǔ)上(如圖15所示),利用攝影、LiDAR及SAR等方式獲取景物圖像、位置、紋理、高程、景深等多維數(shù)據(jù),再通過(guò)數(shù)據(jù)分割、影像匹配、特征提取和幾何建模等方法,對(duì)城市建筑進(jìn)行3D建模,如圖16所示。
圖14 街景全景圖像數(shù)據(jù)[32]
圖15 2D電子地圖[32]
圖16 3D城市建筑模型[33]
用戶使用時(shí),攝像頭捕捉到的圖像信息經(jīng)過(guò)圖像識(shí)別和特征提取,連同位置數(shù)據(jù),借助通信網(wǎng)絡(luò)傳到街景圖像數(shù)據(jù)庫(kù)中進(jìn)行檢索,再和3D城市建筑模型進(jìn)行配準(zhǔn),就可以把路網(wǎng)信息、興趣點(diǎn)數(shù)據(jù)、交通信息、街道導(dǎo)航信息等數(shù)據(jù)逐層精確顯示在對(duì)應(yīng)的街道、建筑物上了。
目前,不少移動(dòng)增強(qiáng)現(xiàn)實(shí)已應(yīng)用于旅游,以提供實(shí)時(shí)的自主導(dǎo)游。如App應(yīng)用Triposo[34],根據(jù)用戶的情況將最相關(guān)的景點(diǎn)信息介紹給用戶,當(dāng)用戶在新城市游走時(shí),會(huì)在用戶的前面高亮顯示首個(gè)目的地,用戶就可以準(zhǔn)確無(wú)誤地到達(dá)了;App 應(yīng)用Museum[35],為大型場(chǎng)館提供室內(nèi)移動(dòng)增強(qiáng)現(xiàn)實(shí)服務(wù),向游客推送實(shí)時(shí)的展示信息;應(yīng)用ARNav[36],最大的特色是采用了增強(qiáng)現(xiàn)實(shí)技術(shù)的三維立體導(dǎo)航,用戶可以在屏幕上看到三維導(dǎo)引標(biāo)記,只需穿過(guò)一個(gè)個(gè)標(biāo)記方框,就可以到達(dá)目的地。
泛在測(cè)繪是指用戶在任何地點(diǎn)、任何時(shí)間為認(rèn)知環(huán)境與人的關(guān)系而創(chuàng)建和使用地圖的活動(dòng)。強(qiáng)調(diào)以人為本,以用戶為中心,以使用者的需求為地圖的主要信息來(lái)創(chuàng)建實(shí)時(shí)、動(dòng)態(tài)的測(cè)繪產(chǎn)品。由此衍生出泛在定位的概念,即用戶在泛在測(cè)繪的過(guò)程中,利用多種感知技術(shù)來(lái)感知目標(biāo)位置、環(huán)境及其變化的活動(dòng)。在泛在測(cè)繪概念的基礎(chǔ)之上,利用泛在定位和多種資源創(chuàng)建用戶感興趣的目標(biāo)和有關(guān)用戶自身的實(shí)時(shí)動(dòng)態(tài)場(chǎng)景地圖,則稱為泛在地圖。泛在地圖的產(chǎn)生是由技術(shù)牽引和學(xué)科牽引共同構(gòu)建的。
增強(qiáng)現(xiàn)實(shí)技術(shù)將在泛在測(cè)繪中得到廣泛的應(yīng)用。例如,上文提到的三維實(shí)景導(dǎo)航服務(wù);在市政建設(shè)規(guī)劃領(lǐng)域,采用增強(qiáng)現(xiàn)實(shí)技術(shù)將規(guī)劃效果實(shí)地放樣到真實(shí)場(chǎng)景中,就可以獲得規(guī)劃的直觀效果。未來(lái)還將出現(xiàn)全站儀與增強(qiáng)現(xiàn)實(shí)技術(shù)的結(jié)合,用于建筑放樣及人工物體形變監(jiān)測(cè),如圖17所示。
圖17 基于增強(qiáng)現(xiàn)實(shí)的實(shí)景放樣圖[37]
隨著增強(qiáng)現(xiàn)實(shí)的發(fā)展和未來(lái)新需求的出現(xiàn),道路或建筑物上的每一個(gè)字符都可能成為泛在測(cè)繪的內(nèi)容,從而成為現(xiàn)實(shí)世界地理索引的一部分。每個(gè)人都可以有一張自己的興趣點(diǎn)地圖。泛在測(cè)繪可以將每個(gè)人不同時(shí)間獲取的興趣點(diǎn)地圖通過(guò)多次交互后融合,借助增強(qiáng)現(xiàn)實(shí)技術(shù)處理成興趣點(diǎn)豐富、具有時(shí)間標(biāo)記、且能不斷更新的泛在地圖,從而為每個(gè)人提供個(gè)性化的深度服務(wù)。
增強(qiáng)現(xiàn)實(shí)作為實(shí)現(xiàn)LBS個(gè)性化深度服務(wù)的重要手段,未來(lái)將重點(diǎn)在多媒體增強(qiáng)、時(shí)空定位增強(qiáng)及個(gè)性化服務(wù)增強(qiáng)等方面進(jìn)一步發(fā)展。
1)多媒體增強(qiáng):隨著生物-納米技術(shù)、自組裝、納米制造和微機(jī)電系統(tǒng)的發(fā)展,從視覺(jué)、聽(tīng)覺(jué)到姿態(tài),感官增強(qiáng)技術(shù)將不斷創(chuàng)新,如眼動(dòng)軌跡分析技術(shù)、體感技術(shù)、智能語(yǔ)音輸入、空間顯示及全息顯示技術(shù)等,將以整體的形式把增強(qiáng)信息融入到現(xiàn)實(shí)世界中,為用戶呈現(xiàn)一個(gè)立體、全方位、浸入式的增強(qiáng)現(xiàn)實(shí)場(chǎng)景,讓用戶可以跟著“感覺(jué)” 走。
2)時(shí)空定位增強(qiáng):隨著計(jì)算性能的提升,定位精度和方法的改進(jìn),通信能力的增強(qiáng)及摩爾定律的效用,使得長(zhǎng)時(shí)間、高性能、高可靠的全時(shí)空定位增強(qiáng)成為可能,有條件提供更實(shí)時(shí)、更精準(zhǔn)、更無(wú)縫的深度服務(wù),大大提高服務(wù)的粘度,改變用戶認(rèn)知世界的模式,讓用戶跟著“認(rèn)知” 走。
3)個(gè)性化服務(wù)增強(qiáng):隨著基于位置的社會(huì)感知、大數(shù)據(jù)時(shí)代的個(gè)人信息挖掘等技術(shù)的發(fā)展,使得基于用戶行為模式的個(gè)性化移動(dòng)增強(qiáng)現(xiàn)實(shí)服務(wù)應(yīng)用成為可能,相同位置的增強(qiáng)服務(wù)內(nèi)容將會(huì)因人的興趣不同而變化,讓用戶跟著“興趣”走。
同時(shí),位置數(shù)據(jù)與物理實(shí)體的融合/混合表達(dá)客觀世界,將促成新測(cè)繪標(biāo)準(zhǔn)的研究和誕生。越來(lái)越逼真的3D顯示技術(shù)將是研究的前沿,并帶動(dòng)光學(xué)、材料科學(xué)、信息科學(xué)及認(rèn)知科學(xué)的發(fā)展。
增強(qiáng)現(xiàn)實(shí)將成為智能手機(jī)的標(biāo)準(zhǔn)配置、公眾投資熱點(diǎn)和新的經(jīng)濟(jì)增長(zhǎng)點(diǎn)。增強(qiáng)現(xiàn)實(shí)面對(duì)政府、行業(yè)、企業(yè)及公眾不同的需求,將有不同的表達(dá)方式及虛實(shí)融合方式,形成從硬件、軟件、數(shù)據(jù)采集到3D測(cè)繪的大跨度產(chǎn)業(yè)鏈,從而提供豐富的創(chuàng)新空間,帶來(lái)大量的就業(yè)機(jī)會(huì)。增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用將是測(cè)繪和導(dǎo)航位置服務(wù)提升自己服務(wù)能力,實(shí)現(xiàn)智能化的又一次機(jī)遇。
[1]Azuma R. A Survey of Augmented Reality Presence[J]Teleoperators and Virtual Environments, 1997:355–385
[2]Milgram P, Kishino A F. Taxonomy of Mixed Reality Visual Displays [J].IEEE Transactions on Information and Systems,1994, (12):1 321-1 329
[3]http://www.ted.com/talks/pranav_mistry_the_thrilling_potential_of_sixthsense_technology.html
[4]http://www.36kr.com/p/148106.html
[5]http://telecom.chinabyte.com/156/11840156.shtml
[6]Sutherland I E.A Head-mounted Three Dimensional Display[C].Fall Joint Computer conference, 1968
[7]Tom Caudell. AR at Boeing [EB/OL]. http://www.ipo.tue.nl/homepages/mrauterb/presentations/HCI-history/tsld096.htm,1990
[8]Loomis J, Golledge R, Klatzky R. Personal Guidance System for the Visually Impaired Using GPS, GIS, and VR Technologies[C].Proceedings of Conference on Virtual Reality and Persons with Disabilities, 1993 :17-18
[9]Feiner S, MacIntyre B, H?llerer T, et al. A Touring Machine:Prototyping 3D Mobile Augmented Reality Systems for Exploring the Urban Environment[C].Proceedings of First IEEE International Symposium on Wearable Computers (ISWC '97),Cambridge MA, 1997
[10]Vlahakis V, Karigiannis J. Archeoguide: First Results of an Augmented Reality, Mobile Computing System in Cultural Heritage Sites[C].Proceedings of Virtual Reality, Archaeology,and Cultural Heritage International Symposium (VAST01), 2001
[11]Kalkusch M, Lidy T, Knapp M, et al. Schmalstieg, Structured Visual Markers for Indoor Path-finding[C].Proceedings of the First IEEE International Workshop on ARToolKit (ART02),2002
[12]Markus Kahari, David J,Murphy. MARA-sensor Based Augmented Reality System for Mobile ImagingIn[C]. Proc.ISMAR 2006,New York, USA,2006:67-73
[13]http://graphics.cs.columbia.edu/projects/mars
[14]http://www.36kr.com/p/24864.html
[15]http://techblog.orl.ucla.edu/?p=291
[16]Jeng T R, Huang D R, Liu K C, et al. New 3D Image Technologies Developed in Taiwan [J]. IEEE Transactions on Magnetics, 2011, 47(3): 663-668
[17]http://www.thinkdigit.com/Apps/Nokia-introduces-City-Lens-augmented-reality-app_10878.html
[18]陳靖,王涌天,林精敦,等.基于增強(qiáng)現(xiàn)實(shí)技術(shù)的圓明園景觀數(shù)字重現(xiàn)[J].系統(tǒng)仿真學(xué)報(bào),2010(2):424-428
[19]孫超,張明敏,李揚(yáng),等.增強(qiáng)現(xiàn)實(shí)環(huán)境下的人手自然交互[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2011(4):697-704
[20]http://www.travopia.com/2012/04/how-googles-projectglass-is-going-to.html
[21]http://www.36kr.com/p/123619.html
[22]http://www.leiphone.com/ar-contact-lense.html
[23]http://www.chexun.com/2012-04-16/100715332_2.html
[24]http://2012.sohu.com/20120805/n349865160.shtml
[25]http://www.36kr.com/p/115797.html
[26]http://medicalaugmentedreality.com/2012/03/mobile-medicalaugmented-reality-app-for-the-apple-ipad-interview-withprof-hans-peter-meinzer/
[27]http://www.museumoflondon.org.uk/Resources/app/you-arehere-app/home.html
[28]劉經(jīng)南,郭遲,彭瑞卿.移動(dòng)互聯(lián)網(wǎng)時(shí)代的位置服務(wù)[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2011(12):40-49
[29]http://zh.wikipedia.org/wiki/SoLoMo
[30]劉經(jīng)南.泛在測(cè)繪與泛在定位的概念與發(fā)展[J].數(shù)字通信世界,2011(S1):28-30
[31]http://network.pconline.com.cn/news/1210/3046185_all.html
[32]http://cens.ucla.edu/~mhr/cs219/presentations/cs219_Outdoors_Augmented_Reality_on_Mobile_Phone.ppt
[33]http://vision.cs.uiuc.edu/~vhedau2/Publications/3dimpvt2012_3dcity_modeling.pdf
[34]http://www.36kr.com/p/107490.html
[35]http://mashable.com/2010/07/29/american-museum-ofnatural-history-app
[36]http://www.36kr.com/p/107490.html
[37]http://www.metaio.com/uploads/tx_templavoila/IMG-eng_layout_plan-010.jpg