劉源 陳杰 龔國成 楊朝智
摘要 虛擬現(xiàn)實技術把現(xiàn)實世界物體高精度建模,為用戶帶來交互式的三維動態(tài)實景,使用戶足不出戶就可細覽物體各角度細節(jié)。結合虛擬現(xiàn)實技術,物聯(lián)網(wǎng)設備采集的信息和用戶控制手段將會得到革新,帶給用戶前所未有的所見即所得的非常體驗。高精度3D模型建立技術是虛擬現(xiàn)實的關鍵技術,其模型包括空間結構模型和外觀紋理模型,然而高精度空間結構模型建立于物體的點云模型上,因此獲取高精度點云模型就是虛擬現(xiàn)實關鍵技術中的關鍵技術。本文就建立點云模型所用到的三種常見關鍵技術(包括激光掃描法、雙目立體視覺法以及序列圖片重建法),并就各自方法的優(yōu)缺點進行說明,探討技術發(fā)展方向。
[關鍵詞]虛擬現(xiàn)實 物聯(lián)網(wǎng)展示與控制 點云模型3D掃描
1 引言
虛擬現(xiàn)實是一種新型的交互顯示技術,是一門以計算機技術為基礎,結合其它相關技術,為用戶帶來交互式的三維動態(tài)實景展示。虛擬現(xiàn)實技術通過對現(xiàn)實物體高精度三維建模,從而構造近似現(xiàn)實的虛擬數(shù)字世界,帶來沉浸式的交互體驗,用戶通過與虛擬世界的交互,體驗現(xiàn)實世界中的感覺,進而獲得真實的經(jīng)驗。虛擬現(xiàn)實技術具有廣泛的應用,比如各類危險環(huán)境下的模擬訓練、城市規(guī)劃、物聯(lián)網(wǎng)系統(tǒng)展示與控制等。物體的高精度三維模型由空間結構模型和表面紋理模型組成,空間結構模型負責展示目標結構,紋理模型負責渲染目標顏色等信息??臻g模型可以通過實際測量或軟件建模等方法生成,不過由于物體形狀結構千差萬別,使用建模軟件需要熟悉的工程師用較長的時間進行設計加工,對于使用率較低的物體模型就會有較大的成本投入;實際測量則通過掃描儀等專業(yè)傳感器獲取物體的測量數(shù)據(jù),對于物體,特別是精細物體的建模較人工設計有速度快,精度高的優(yōu)勢。隨著技術發(fā)展,測量儀器也從專業(yè)設備逐步演變?yōu)槠胀ㄔO備結合專用軟件的方式。本文就如何利用普通設備進行高精度建模的三種主流方法進行研究并探討各自優(yōu)點。
2 點云模型建立方法研究
目前生成點云模型的方法主要有三種,分別是激光掃描法、雙目立體視覺法和序列重建法。
2.1 激光掃描法
激光掃描法是最常見的一種測量方式,這類方法一般都是利用激光測距原理獲取掃描點距離激光發(fā)射點的距離,從而獲取掃描點在世界坐標系下的坐標。激光測距有激光飛行時間法(TOF)和三角測距法。利用激光飛行時間技術獲取物體距離需專用的激光傳感器,其原理是通過計算發(fā)出激光到接收反射激光的時間差計算距離。這種方法需專用高精度傳感器,價格較貴,一般主要用于空間測量領域,比如建筑測繪等。此處主要介紹基于三角測距原理進行物體點云模型重建的方法,三角測距的原理如圖1所示。
激光發(fā)射器和相機光心處于同一直線上,激光發(fā)射器發(fā)射激光點投影到目標點上,對應的,針孔相機獲取當前激光點在像平面中的成像,可得到圖1所示的系統(tǒng)工作光路原理模型。根據(jù)針孔相機原理,可以得到如下的相似三角形關系:
那么目標點距離激光器的距離即可通過公式(2)中得到:
d=sf/x sin(β)
(2)
公式(2)中B為激光發(fā)射器與坐標系夾角,s為激光發(fā)射器距離相機光心距離,f為相機焦距。此種光路情況對于激光點剛好位于圖像中心,對于激光點像素不位于圖像中心時,圖1中的f可以通過圖2所示關系換算,圖2中P1點表示圖像中心點,P2點表示目標點在圖像中的位置,且有,那么此時:
將公式(3)代入公式(2)中,激光線上非中心點對應的目標點距離激光發(fā)射器的距離。把激光線繞物體旋轉360°,即可完成對物體的掃描建模。
基于此原理的掃描儀主要是在精度要求高,掃描物體較精細的場景下使用。目前有一款桌面級的3D掃描開源系統(tǒng)Ciclop也是基于此原理實現(xiàn)。Ciclop系統(tǒng)包括自動轉臺,線激光發(fā)射器,攝像頭和必須的支架,這款系統(tǒng)依據(jù)上述介紹的激光測距原理,獲取掃描物體的3D點云模型。團隊對基于激光掃描法的測試也主要依賴Ciclop系統(tǒng)實現(xiàn),經(jīng)過參數(shù)調試,使用激光法得到的物體點云模型如圖3所示。
2.2 雙目立體視覺法
雙目立體視覺法是利用兩幅圖片之間的對極幾何約束條件,獲取視差圖像,從而得到物體的深度信息。這種方法是模擬人眼處理景物的方式,只需要兩個攝像頭即可,排除了激光法中激光對于敏感物體的潛在破壞風險,具有很好的推廣價值。
雙目立體視覺法實現(xiàn)空間坐標重建主要有圖像獲取、特征匹配和重建三個步驟。圖像獲取是由不同位置的兩臺攝像機獲取同一物體的過程;特征匹配是在兩幅圖片中通過特征關系,尋找對應點的過程;重建就是根據(jù)匹配點對應關系計算目標點點空間坐標的過程。
2.2.1 圖像匹配
圖像匹配通過提取圖片特征,尋找同一點在兩幅圖像中的像素坐標的過程。常用的特征有圖像紋理特征(比如SIFT特征、SURF特征)和圖像編碼等。圖像紋理特征主要依賴圖像中具有的數(shù)學極值的特征點,比如Hams角點等進行定位,這種方法的優(yōu)勢就是只需要同時采集兩幅圖像即可,缺點就是對于物體表面無明顯紋理的物體無法使用,且有的點無法尋找到穩(wěn)定的對應點,造成重建效果不好。結構光法通過投影編碼圖案到被測物體,并利用攝像頭采集編碼圖案后解碼獲取對應點關系,是獲取對應點最可靠的方式之一。此處實驗使用時間多路二進制編碼測試,系統(tǒng)對物體投射圖4所示橫縱交替編碼圖片,這些編碼圖片把攝像頭采集部分每個像素進行編碼,簡單二進制解碼后可以獲取兩幅圖片中每個像素的精確對應關系。
2.2.2 空間點坐標計算
物體空間點坐標利用兩幅采集圖像的對應關系求解。通過相機立體標定,建立以攝像機1相機坐標為世界坐標的參考系,則對于攝像機2有X2=RXi+T。通過該式把世界坐標系下坐標轉到攝像機2坐標系下;通過攝像機單機標定,攝像機各自的內參矩陣K己知,由相機模型原理可得:
zx=Kx
那么對于兩攝像機有如下公式:
式中X表示點的空間坐標,x,表示該點在攝像機1中的圖像齊次坐標(Ul v1 l),X2表示該點在攝像機2中的圖像坐標(U2 V2 1)。
求解上述方程組即可得到物體的空間坐標。如圖5、圖6所示。
2.3 序列重建法
序列重建法利用序列圖像進行三維重建,該方法只需要對物體拍攝不同角度的序列圖片即可,不需要依賴其余設備。這種方法主要利用的是雙目立體視覺的原理,由于圖像特征點匹配是稀疏的過程,為了達到一個較好的效果,這種方法還要進行點云模型的稠密重建。
2.3.1 圖像稀疏重建
圖像的稀疏重建一般使用基于SIFT特征的方式,對兩幅圖片提取SIFT特征,然后進行點與點的匹配得到兩幅圖像上的點對應關系,然后根據(jù)2.2.2節(jié)的分析進行對應點的空間坐標計算。不過這種情況下由于兩幅圖片的旋轉矩陣R和平移矩陣T是未知的,那么圖像稀疏重建的過程首先要進行坐標系自標定。
坐標系自標定
序列圖像是同一攝像頭轉動不同角度拍攝物體得到的序列圖片,且每次拍攝的移動距離和角度都未知,那么通過圖像對應關系獲取坐標系的變換參數(shù)就是最主要的任務。
由2 2 2節(jié)可得:
s1x1=K1X
s2x2=K2(RX+T)
那么有:
s2x2=K2(Rs1K1-1x1+T)
對等式同時乘以X2T,也就是x2與T的外積,則有:
O=(x2xT)K2(RK1-1x1)
對于兩幅不同視角圖像,當有多對特征對應點時,通過SVD求解上述方程組的解即可求得兩幅圖像對應的相機坐標系的變換矩陣,從而使用2.2.2節(jié)所述方法求取特征匹配點的空間坐標。
2.3.2 稠密點云重建
2.3.1 節(jié)介紹了如何通過圖像匹配點求取物體特征點空間坐標,不過上述步驟得到的匹配點較少,需要PMVS算法進行稠密重建獲取物體點云模型。實驗使用VisualSFM系統(tǒng)進行測試,得到的恢復點云重建模型如圖7所示,原始序列圖像數(shù)據(jù)來自。觀察重建模型不難發(fā)現(xiàn),頂部區(qū)域的重建效果很不理想,這就是因為頂部區(qū)域的紋理特征點不穩(wěn)定,發(fā)生錯誤匹配,導致計算的空間坐標不正確。
2.4 對比
上述介紹的三種方法是主流的點云模型重建算法,已經(jīng)在很多領域得到了應用。激光掃描法模型精度高,不過系統(tǒng)比較復雜,并且激光對于文物等物品有潛在破壞作用,不能便攜應用;雙目立體視覺法依賴雙目攝像頭,較激光法的設備而言比較輕便,目前在手持掃描終端等移動端上應用較多,部分手機也集成了雙目攝像頭;序列圖像的方法完全脫離了專用硬件設備的限制,只用一個普通攝像頭即可,該方法利用同一物體的不同角度照片即可實現(xiàn)物體建模,在互聯(lián)網(wǎng)圖片建模等方面較多,比如虛擬圖像瀏覽等。不過序列圖像法的精度較低,對于物體的精細化建模還有提高的空間,對于某些沒有明顯紋理的物體(比如純白瓷瓶等)無法處理。
需要注意的是,上述三種方法都是采用普通攝像頭采集激光線、編碼圖案或者物體圖像,環(huán)境因素(比如光照條件)對重建效果具有較大的影響,實驗時需要盡可能調節(jié)環(huán)境因素減少處理難度。此外對于攝像頭無法拍攝到的區(qū)域(比如遮擋部分),還應調整物體角度,多次重建后進行點云模型融合等操作才會得到一個比較精確的模型。
3 小結
虛擬現(xiàn)實技術為用戶帶來全新的瀏覽體驗,本文從技術原理上分析了主流三種3D模型重建方法,分析對比各自方法的優(yōu)勢。隨著技術的發(fā)展,物聯(lián)網(wǎng)技術的成熟,沉浸式的交互需求會越來越旺,基于虛擬現(xiàn)實技術的應用一定會越來越多,該技術有巨大的應用前景。本文所述的建模方法不需要復雜的專用設備即可達到不錯的效果,可以有效應用于日常生活中,降低虛擬現(xiàn)實技術的門檻。