李潔瓊 薛玉芳 李亞軍
(1,2.安徽理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,安徽 淮南 232001;3.寧夏青銅峽68242部隊(duì) 751601)
淺談三維建模的幾種方法
李潔瓊1薛玉芳2李亞軍3
(1,2.安徽理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,安徽 淮南 232001;3.寧夏青銅峽68242部隊(duì) 751601)
介紹了從二維坐標(biāo)空間轉(zhuǎn)化到三維坐標(biāo)空間所要遵從的對(duì)極幾何限制,并通過數(shù)學(xué)推導(dǎo)得出坐標(biāo)轉(zhuǎn)化表達(dá)式。在此基礎(chǔ)上重點(diǎn)討論了三維物體主動(dòng)還原重建方式,特別是結(jié)構(gòu)光還原的方法,通過結(jié)構(gòu)光的引入,能夠較好地解決像素匹配問題,可以提高還原確定性、減少拍照的次數(shù)、有利于動(dòng)態(tài)物體的重建。
計(jì)算機(jī)視覺;三維建模;主動(dòng)還原;結(jié)構(gòu)光
三維物體的建模是指通過一定的方法,建立物體幾何表面的點(diǎn)云,這些點(diǎn)可以通過插補(bǔ)的方法形成物體的表面形狀,點(diǎn)云越密集所建立的模型就越精確。物體的建模方式可以根據(jù)所用儀器的類型分為接觸式與非接觸式兩類。接觸式建模方式需要實(shí)際觸碰物體的表面,如使用測(cè)徑器、尺子和坐標(biāo)測(cè)量機(jī)等。雖然坐標(biāo)測(cè)量機(jī)可以精確地獲得重建物體的數(shù)據(jù),但由于必須接觸物體,有可能對(duì)待測(cè)物造成污染、變形或損壞,用于一些價(jià)值較高的物體如遺跡古文物和古文物等的重建則不太合適。非接觸式建模方式可以分為主動(dòng)式和被動(dòng)式兩種。主動(dòng)視覺系統(tǒng)一般采用結(jié)構(gòu)光的方法,該方法通常包括一臺(tái)攝像機(jī)和一個(gè)投影儀,投影儀向物體投射一些人工設(shè)計(jì)的圖案,攝像機(jī)拍攝被照物體得到這些結(jié)構(gòu)光圖案在物體表面形成的變形圖像,利用結(jié)構(gòu)光的編碼技術(shù)和三角測(cè)量方法,來恢復(fù)物體的三維結(jié)構(gòu)。這種方法借助結(jié)構(gòu)光的信息,從而簡(jiǎn)化了圖像匹配問題。被動(dòng)視覺方法即立體視覺方法,用多臺(tái)攝像機(jī)或一臺(tái)攝像機(jī)在不同位置拍攝多幅物體圖像來恢復(fù)場(chǎng)景深度信息,但這類方法有在不同圖像間尋找匹配關(guān)系的問題,圖像匹配是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)經(jīng)典難題,從而限制了這類方法的廣泛應(yīng)用。兩種方法的本質(zhì)都是根據(jù)立體視覺法重建圖像。被動(dòng)式重建方式,其本身不發(fā)射輻射線,而是通過測(cè)量由待測(cè)物表面反射周邊輻射線的方法獲取圖像,再通過輔助方法實(shí)現(xiàn)還原。其還原方法可分為:明暗法,是把圖像像素的亮度值代入預(yù)先設(shè)計(jì)的色度模型中,再通過表面可微分性、曲率限制及光滑度的限制求解方程;立體光學(xué)法,為了彌補(bǔ)明暗法中單張照片提供的信息不足,立體光學(xué)法是在同一個(gè)相機(jī)、同一場(chǎng)景下,采用不同的照明條件拍攝多張待測(cè)物的照片,通過處理得到物體表面的梯度向量,然后再經(jīng)過向量場(chǎng)的積分得到三維模型;界提取法,重建的對(duì)象一般是一些簡(jiǎn)單形狀的物體,通過拉普拉斯和高斯濾波等提取物體的邊界信息以還原圖像,在該法中利用到了物體的仿射不變性和尺度不變性算法;還有紋理識(shí)別和法輪廓法等。主動(dòng)還原重建方式是指將額外的輻射能量投射至物體上,借助反射能量所得到額外信息計(jì)算出待測(cè)物體的深度信息。常使用的輻射能量有可見光、高能光束與激光。被動(dòng)還原的各種方法相似,是以立體視覺法為基礎(chǔ)的。但立體視覺法的缺點(diǎn)是,在還原過程中不能確定兩幅照片中的對(duì)應(yīng)點(diǎn)是否來自空間中的同一點(diǎn),這就是像素匹配問題,給還原增加了難度。采用主動(dòng)視覺系統(tǒng)建模將解決這一問題,首先必須對(duì)系統(tǒng)進(jìn)行標(biāo)定?,F(xiàn)有的標(biāo)定方法大致可以分為2類,即結(jié)構(gòu)光標(biāo)定法和轉(zhuǎn)換矩陣法。其中,結(jié)構(gòu)光標(biāo)定法是最常用的一種方法,它對(duì)攝像機(jī)和投影儀分別標(biāo)定,求出投射的光條所在光平面的模型。轉(zhuǎn)換矩陣法對(duì)每一個(gè)投影光條求解一個(gè)4x3的變換矩陣,通過變換矩陣求解圖像上的光條所對(duì)應(yīng)的空間三維信。這兩類方法都假定被照亮的物體表面上的點(diǎn)恰好在光平面上,當(dāng)投影儀鏡頭存在畸變時(shí),光平面的模型無法精確描述投影關(guān)系。當(dāng)主動(dòng)視覺系統(tǒng)的某個(gè)部件發(fā)生位置變化,或內(nèi)部參數(shù)調(diào)整時(shí),必須對(duì)系統(tǒng)重新進(jìn)行標(biāo)定。以上這些標(biāo)定方法,其標(biāo)定過程都比較繁瑣,而且需要一個(gè)可以精確控制其運(yùn)動(dòng)的移動(dòng)機(jī)構(gòu)來完成。為了提高建模的速度和效率,大多數(shù)系統(tǒng)都采用同時(shí)向物體投射各種結(jié)構(gòu)光圖案的方法,需要利用結(jié)構(gòu)光編碼技術(shù)來解決結(jié)構(gòu)光的匹配問題。對(duì)此,文獻(xiàn)[3]給出了一個(gè)較好的綜述。第一類方法是采用顏色編碼策略,假設(shè)物體表面顏色為中性,不改變投影儀投射的彩色信息;第二類方法是基于時(shí)間連續(xù)性假設(shè),即物體相鄰像素在不同時(shí)刻是相同的,投影儀按照編碼策略,在不同時(shí)刻,控制像素的亮滅,由攝像機(jī)檢測(cè)這些特別的灰度圖案,從而實(shí)現(xiàn)匹配。第一類方法投影儀投射條紋的順序與其在圖像上的順序是一致的每一種編碼策略均有其局限性,第二類方法不適合對(duì)運(yùn)動(dòng)物體的模。
2.1 點(diǎn)和線的投影。先考慮兩種比較簡(jiǎn)單的情況。如果僅有一個(gè)點(diǎn)投影到物體上,則它在投影儀和照片上的相對(duì)位置是確定的,通過上面計(jì)算三維物體坐標(biāo)公式的方法就可以求解該點(diǎn)的坐標(biāo)。如果是一條線,比如,一條平行于x軸方向的線,則該線在y軸方向的投影仍是一個(gè)點(diǎn),仍然可用上面的坐標(biāo)公式進(jìn)行計(jì)算。點(diǎn)和線的投影可以很好地匹配。但是,由于單獨(dú)的點(diǎn)和線的投影可能會(huì)超出照相機(jī)的拍攝范圍,投影到物體的背面,有時(shí)需要對(duì)整個(gè)物體進(jìn)行掃描拍照,需要不斷地移動(dòng)照相機(jī),這是很耗時(shí)的,并且在移動(dòng)過程中會(huì)引入機(jī)械誤差,大大降低了效率和還原的可靠性。
2.2 網(wǎng)格。有人提出了網(wǎng)格的方法,它兼有點(diǎn)和線的優(yōu)勢(shì),線的突變意味著邊界的變化,交叉的點(diǎn)可以對(duì)物體進(jìn)行定位。網(wǎng)格的覆蓋增大了物體的探測(cè)范圍,消除了機(jī)械誤差。網(wǎng)格線的粗細(xì)變化可以產(chǎn)生平滑效果。J·L·Mogen等人在此基礎(chǔ)上進(jìn)行了改進(jìn),如圖2所示。在網(wǎng)格中增加方塊點(diǎn),用來初始化標(biāo)記圖像和作為識(shí)別圖像的依據(jù)。經(jīng)過優(yōu)化,使得方塊點(diǎn)在網(wǎng)格中的數(shù)量最少,且所有的垂直線都能與方塊點(diǎn)中的一個(gè)或者多個(gè)相連。投影儀和相機(jī)的特殊放置使它們的橫軸(x)相互平行,縱軸(y)在一條線上。因此,對(duì)于網(wǎng)格線來說,垂直線的投影基本不會(huì)變形,變化不會(huì)很大,在后期可以使用垂直線來輔助水平線的提取,而水平線投影到物體上會(huì)出現(xiàn)扭曲或斷裂。扭曲包含了物體的深度(z)信息,斷裂則是由于線比較細(xì)。相反,粗線會(huì)對(duì)圖像進(jìn)行平滑,改變圖像的分辨率。重建中,根據(jù)需要,可以適當(dāng)調(diào)節(jié)線的粗細(xì)來得到不同的精細(xì)程度(分辨率)。對(duì)于得到的圖像,先進(jìn)行高斯濾波,然后用拉普拉斯算法提取垂直線。掃描垂直線的左右兩邊得到垂直線與水平線的交點(diǎn)和方塊點(diǎn),通過這些交點(diǎn)把水平線恢復(fù)出來,如果恢復(fù)不出來,說明水平線細(xì)了,需要重新選擇水平線的寬度。得到網(wǎng)格后,對(duì)方塊點(diǎn)的左右兩邊進(jìn)行掃描,標(biāo)記各交點(diǎn)并與原圖進(jìn)行匹配。因?yàn)橛行┚€在投影中被截?cái)嗔?,使得有些點(diǎn)不能與交點(diǎn)相連,因此從不同的方塊點(diǎn)開始會(huì)得到不同的結(jié)果,通過把這些不同結(jié)果合并,可以得到一個(gè)較好的網(wǎng)格圖,這也是選用了幾個(gè)方塊點(diǎn)的意義所在。
圖1
本文討論了這幾年來三維物體建模的幾種方法,其關(guān)鍵之處在于找到物體的深度信息。幾種方法從本質(zhì)上來說還是基于人眼的雙目視差,雙眼視物時(shí),主觀上可產(chǎn)生被視物體的厚度以及空間的深度或距離等感覺,即同個(gè)物體從兩個(gè)或多個(gè)不同的角度觀察,通過視差信息得到深度信息。基于此原理,首先發(fā)展起來的是被動(dòng)還原的方法,它能夠重建三維物體,但存在匹配問題,不能夠確定兩張照片上的對(duì)應(yīng)點(diǎn)是否來自同一個(gè)三維空間點(diǎn)的投影。在此基礎(chǔ)上提出了主動(dòng)還原重建方法,能夠較好地解決像素匹配的問題。
[1]三維掃描儀[EB/OL].(2010-04-08)[2010-05-20].http://zh·Wikipedia·org/zh-cn/三維掃描儀.
[2]MIKOLAJCZYK K,ZISSERMAN A,SCHMID C.Shape Recognition with edge-based features[C].//Proceedings of The British Machine Vision Conference.Norwich,UK,2003:1-8.[3]REMONDINO F,EL-HAKIM S.Imagebased3D modeling:a Review[J].The Photogrammetric Record,2006,21(115):269-291.
Z
B