徐煒文
(英國利物浦大學(xué) 英國利物浦市 L693BX)
三維圖形庫下的計算機視覺算法分析
徐煒文
(英國利物浦大學(xué) 英國利物浦市 L693BX)
隨著我國社會主義現(xiàn)代化建設(shè)的不斷發(fā)展,我國的計算機信息技術(shù)得到了前所未有的發(fā)展,這也在一定程度上促進了人工智能技術(shù)以及圖像工程等技術(shù)的革新。作為當(dāng)前計算機領(lǐng)域中一個熱點問題,三維圖形庫下的計算機視覺算法研究對計算機智能技術(shù)的發(fā)展有著重要的意義與價值。本文主要通過對四種計算機視覺算法進行分析,進一步探討了三維圖像的虛擬算法研究。
三維圖形;計算機;視覺算法
在當(dāng)前三維圖形技術(shù)的高科技應(yīng)用背景下,計算機圖形學(xué)的快速發(fā)展進一步縮小了真實世界與虛擬世界的差距。計算機視覺是通過相機系統(tǒng)完成目標識別,并對現(xiàn)實環(huán)境目標進行跟蹤和三維重建,三維圖像庫是建立在虛擬現(xiàn)實環(huán)境中的一種圖形庫函數(shù),目前,計算機視覺算法正處在相對發(fā)展成熟階段,能夠從虛擬環(huán)境中獲得相應(yīng)的算法信息,并逐步完成圖像的渲染和完善[1]。由于在真實環(huán)境下獲取光照、環(huán)境顏色、玻璃反光等數(shù)據(jù)信息較為困難,而借助于三維圖像庫的計算機實驗,可以通過連接輸入端和輸出端,依據(jù)所獲得的虛擬環(huán)境信息實現(xiàn)圖像處理。
相機標定是建立在相機的數(shù)學(xué)模型參數(shù)基礎(chǔ)之上的,通常可以采用一個3×4的相機矩陣P表示,P=A【RT】,其中A表示3×3的相機內(nèi)參矩陣,R表示3×3的3D旋轉(zhuǎn)矩陣,T表示3×1平移向量,,其中ax,ay表示相機焦距,u0、v0表示圖像中坐標,r表示像素的歪斜系數(shù),通過相機標定算法聯(lián)合系數(shù)匹配,計算出相機的矩陣值。
仿真研究中往往需要搭建實驗環(huán)境,創(chuàng)造合適的虛擬場景,將運動中的人物、動態(tài)物體、靜態(tài)物體、光源等作為虛擬場景的部分,并將屏幕得到的圖像渲染進行處理。在計算機視覺算法中,可以假設(shè)所有的相機矩陣均為未知,根據(jù)算法的不同,其虛擬環(huán)境的搭建也存在一定差異。計算機算法主要根據(jù)同步相機組的圖像,在多視幾何原理的基礎(chǔ)上完成多相機標定。作為相機組點光源的同步視頻輸入[2]。
Visual Hull是建立在二值圖像中的3D重建算法,通過將空間切分為M×N×K(其中M、N、K均為正整數(shù))的長方體,根據(jù)長方體在相機矩陣P中的投影,獲得相應(yīng)的二值圖像。該計算機視覺算法的輸入信息包括所有相機矩陣計算值及相應(yīng)的二值圖像數(shù)據(jù)。在三維圖形庫OpenGL中,在除去圖像紋理后,可以較為置管的獲得相機的二值圖像。
所謂連續(xù)幀差法主要是指在對視頻圖像運動目標進行提取與計算的過程中,計算出當(dāng)前幀圖像與前一幀圖像的差值,并以此確定運動區(qū)域,其能夠使運動區(qū)域背景保持不變的狀態(tài),而對于非運動區(qū)域的背景則可以采用當(dāng)前幀實現(xiàn)動態(tài)更新,在迭代作用下,對背景進行提取。首先,原始圖像B0可以采用第一幀圖像I0進行表示,將迭代參數(shù)設(shè)置為i= 1,所求為前幀與前一幀的差分二值圖像,即BW1,其具體計算方法為:其中當(dāng)前幀與前一幀圖像分別采用Ii與Ii-1表示,幀間差分則為ads(Ik-Ii-1)表示,幀間差分圖像的灰度直方圖用T表示,即最大峰值右側(cè)1/10對應(yīng)的灰度值。然后通過二值圖像對背景進行更新,其具體計算方法為:,其中Bi(x,y),BWi(x,y)表示兩圖像在坐標中的位置,將更新速度系數(shù)確定為0.1。設(shè)置條件i=i+1,然后將其代入BWi進行迭代計算,達到一定數(shù)量后,結(jié)束迭代,將B1設(shè)置為提取背景。
人體動作的捕獲在單一圖像中的呈現(xiàn)較為苦難,但是采用以骨架模型運動為主的動作重建模式能夠構(gòu)建多路同步圖像[3]。通過對搜集不同時間圖像組資料,骨架模型的運動隨著時間的變化逐漸運動。多相機系統(tǒng)的運動主要依賴于兩種不同的實現(xiàn)方式:①通過在人體貼上反光的標志,采用紅外相機系統(tǒng)記錄反光標志的運動形式和運動時間,采用計算機算法進一步分析各個相機在不同時間捕獲的運動標志,并通過算法重建進一步構(gòu)建骨架運動模型。②骨架運動的重建模型算法也可以依據(jù)于不帶反光標志的運動。對于該計算機視覺算法,應(yīng)從各個相機的數(shù)據(jù)資料記錄中,經(jīng)圖像預(yù)處理而收集需要用到的圖像特征,通過通過圖像的特征變化,進一步完成圖像測量,從而實現(xiàn)運動骨架模型的重建。
該三維圖像庫下的計算機視覺仿真研究中,采用多空間校對拍攝,將相機組能夠拍到的空間都設(shè)置為工作空間,如圖1,該圖表示實驗環(huán)境的仿真系統(tǒng),上下兩列表示相機第3真的圖像。在游戲引擎Ogre的仿真過程中,設(shè)置六臺虛擬相機的環(huán)境搭建,并將其焦點設(shè)置為相機目標的中心,常采用引擎中的骨痂動畫模型進一步實現(xiàn)虛擬場景和虛擬人物的運動軌跡的記錄。
圖1 虛擬同步多相機系統(tǒng)
綜上所述,基于開放式的三維圖像庫,計算機視覺算法的虛擬場景和相機參數(shù)都是一致的,能夠為算法輸入提供較為可靠的數(shù)據(jù)支持,三維圖形庫下的計算機算法成為計算機領(lǐng)域研究的一個重點,其不僅是對計算機視覺仿真研究的理論分析,更是對視頻與圖像處理技術(shù)的實踐探究,有著廣闊的應(yīng)用前景。
[1]陳坤.基于立體視覺的三維重建理論與算法研究[D].南昌航空大學(xué),2011.
[2]姜大志,郁倩.計算機視覺中的設(shè)備標定和三維圖形重構(gòu)綜述[J].計算機工程與應(yīng)用,2001,37(13):53~55.
[3]Domingo,Mery,李亞寧.X射線檢測的計算機視覺成像,系統(tǒng),圖像數(shù)據(jù)庫和算法[J].國外科技新書評介,2016,13(2):9~10.
TP391.4
A
1004-7344(2016)29-0257-01
2016-9-25