王曉剛
(東營職業(yè)學院,山東 東營 257091)
人類正在進入信息時代,隨著科學技術(shù)的快速發(fā)展,計算機視覺(Computer Vision)的應用越來越受到廣泛的重視。計算機視覺的目標是要使機器人和計算機通過對二維圖像的處理達到對三維景物和環(huán)境的認知,從而具有和人類相當?shù)囊曈X處理能力,最終像人一樣通過視覺觀察和理解世界,具有自主適應環(huán)境的能力。計算機視覺是對靜止圖像或者視頻中的數(shù)據(jù)進行一定的處理,轉(zhuǎn)化成另一種表達方式,以達到某種特定的需求,而且基于計算機視覺實現(xiàn)的三維技術(shù)應用范圍也越來越廣泛,為此,有必要開展基于計算機視覺的三維技術(shù)應用研究。
本論文主要結(jié)合計算機視覺的三維成像特點,對基于計算機視覺的三維重建技術(shù)進行應用研究,以期從中能夠找到三維重建技術(shù)的應用模式與構(gòu)建方法,并以此和廣大同行分享。
雖然基于計算機視覺的三維建模已經(jīng)廣泛的應用于很多領(lǐng)域,但是,這種技術(shù)仍然有一些難點和問題。當前,國內(nèi)外學者主要集中于三個問題進行研究:效率、精確性和魯棒性。
(1)建模效率。速度的改進可以體現(xiàn)在兩個方面:一是硬件方面,大量的圖形處理功能被集成到硬件中,加快了處理速度,同時,計算機硬件又以摩爾速度更新,也為建模效率提高提供了良好的條件,但是,對建模效率提高的需求不能僅僅局限于對硬件廠商的熱切期望。第二個方面就是要提高建模算法的速度,這才是最根本的解決方式。
(2)模型的拓撲精度、紋理映射以及光照處理。物體都具有材質(zhì)信息,不同的環(huán)境下,使其呈現(xiàn)不同的狀態(tài)。目前,人們還是能夠分辨出電腦所展示的物體是真實拍攝的還是電腦制作的。由此可見,計算機生成的模型還沒有達到以假亂真的程度。如何構(gòu)建環(huán)境光模型,如何給不同材質(zhì)的物體應用光照模型,如何在物體的材質(zhì)信息、紋理信息和拓撲結(jié)構(gòu)信息之間建立對應關(guān)系也是要解決的問題。
(3)普適性。生成三維模型的方法很多,但是,每種方法都有其適用范圍,沒有哪種方法可以很好的重構(gòu)各類物體,這給實際的模型生成工作帶來了很大的麻煩。出現(xiàn)這樣的問題,是因為每種方法利用的重構(gòu)信息不同。如何結(jié)合不同方法的優(yōu)點,提出一個具有普遍適用性的方法同,也是三維建模的一個難點。
匹配技術(shù)通??梢苑譃榛谔卣鞯钠ヅ?、基于區(qū)域的匹配和基于相位的匹配三大類,其中,基于特征的匹配由于其提取的圖像特征針對性強,能夠大大減少隨機噪聲、形變、灰度變化以及遮擋等因素對圖像的影響,比其他兩種方法更具有實用性。另外,基于特征的匹配方法不需要處理全部的圖像點,只需計算代表圖像信息的強特征部分,從而大大節(jié)省了計算時間,具有更好的實時性?;谝陨峡紤],本文采用的方法即為基于特征的匹配。
(1)特征點的提取
對于基于機器視覺的特征提取方法,最傳統(tǒng)的和最常用的方法莫過于Harris提取法。Harris檢測器的核心思想是用圖像的一階導數(shù)組成的自相關(guān)矩陣來檢測某點周圍的亮度強度變化。最早采用小型濾波器作為圖像的導數(shù),之后發(fā)現(xiàn)高斯濾波器的效果更好。為了降低噪聲的干擾,Harris用高斯函數(shù)進行了平滑處理。自相關(guān)矩陣M的特征值用來判斷所檢測的點窗口的特征類型。Harris定義的角點位于圖像自相關(guān)矩陣中存在的兩個最大特征值的地方,這在本質(zhì)上表示以此點為中心周圍至少存在兩個不同方向的紋理(或者邊緣),正如實際的角點是由至少兩個邊緣相交于一點而產(chǎn)生。角點的這個定義還有另一個優(yōu)點,被跟蹤的物體在移動過程中可能會旋轉(zhuǎn),找到同時對移動和旋轉(zhuǎn)不變的量是很重要的。利用自相關(guān)矩陣的特征值可以達到這個目的。
(2)特征點的匹配
在提取出特征點之后,就該對特征點進行匹配,匹配的關(guān)鍵之處在于給每一個特征點附加一個獨特的標記,以方便于識別特征點。這些用來描述特征的標記統(tǒng)稱為特征描述符。描述符廣泛應用于紋理分類,圖像檢索,匹配等領(lǐng)域。為某一點建立描述符需要計算該點周圍鄰域的像素特征,這些特征可以是局部區(qū)域的灰度值,顏色值或者紋理輪廓。描述符的任務就是將這些特征描述出來,同時要能與其他點區(qū)分開來,以完成正確的匹配。
經(jīng)過匹配之后,我們得到了空間的離散點,但是由于點與點之間的情形是未知的,更不能構(gòu)成平面或曲面,為了使物體真實地顯示出來,需要對這些點進行剖分,并賦予其深度信息,從而得到場景的三維重構(gòu)模型。
基于立體視覺的三維重建是由兩幅或多幅圖像恢復物體二維幾何形狀的方法,用于重建的圖像序列是由移動的單臺攝像機或處于不同視點的多臺攝像機所拍攝的。攝像機通過透視變換獲取了三維空間物體的二維圖像,該圖像中的點實際物體上的點存在著一定的對應關(guān)系。就像我們的雙眼一樣,兩臺CCD攝機從不同方向?qū)臻g中一個點進行拍攝后得到的兩幅圖像,然后依據(jù)對應關(guān)系向推出實際空間中點的位置坐標,這就是雙目立體視覺三維重建的過程。如前面章節(jié)的敘述可知,通過完成攝像機標定、三維物體立體圖像對預處和匹配并得到空間點三維坐標后,我們就可以利用這些數(shù)據(jù)對物體進行三維重建了。
經(jīng)過攝像機標定獲得攝像機的內(nèi)參數(shù),結(jié)合估計出的基礎(chǔ)矩陣F以及由立體匹配獲得的匹配點集,接下來利用SFM(Structure from Motion)算法恢復攝像機的外參數(shù),進一步計算就可以得出空間離散點的三維坐標。
依據(jù)國內(nèi)外經(jīng)典的三維重建系統(tǒng),我們在已有工具箱的基礎(chǔ)上,對相關(guān)算法進行改進,完成了一個簡單的三維離散點重建系統(tǒng)。經(jīng)過立體匹配、攝像機標定、三維重建等步驟,重建出所提取特征點的空間三維坐標值。三維重建是通過由不同角度拍攝的兩幅或多幅圖像恢復物體空間坐標的方法。在找到匹配點對并已知攝像機內(nèi)參數(shù)的情況下,采用SFM算法進行離散點的重建,主要算法步驟如下:
(1)由基礎(chǔ)矩陣F進一步求解本質(zhì)矩陣;
(2)計算攝像機運動參數(shù)(外參數(shù))(R|t)的候選值;
(3)判斷(R|t)的符號,并從多組候選值中確定唯一的正確值;
(4)得到投影矩陣,計算匹配點的空間三維坐標。
物體的三維重建技術(shù)一直是計算機視覺研究的熱點和重點之一,它的目標是將二維的投影圖像轉(zhuǎn)化為三維的立體結(jié)構(gòu)。高仿真的三維重建技術(shù)正逐漸使用于各種模擬場景和智能系統(tǒng)中,例如飛機的模擬駕駛,游戲和場景中的虛擬物體演示,建筑物的虛擬建模,工廠的零件檢測,交通事故保存等領(lǐng)域。隨著科學技術(shù)的發(fā)展和日益增長的需求,三維重建技術(shù)必將更加完善。
[1]彭健,姜露露.基于極線幾何約束的非標定圖像的立體匹配[J].計算機應用,2007,27(11):2800-2805.
[2]吳福朝.計算機視覺中的數(shù)學方法[M].北京:科學出版社,2008.
[3]林志泉,胡永健,楊暉,汪偉.一種基于特征的約束匹配方法[J].中國圖象圖形學報,2007,12(11):2104-2108.