周 瓊
(湖南永州職業(yè)技術學院,永州 425000)
上個世紀60年代初期,計算機視覺正式興起,其中以立體視覺為重要分支。在雙目立體視覺中,立體匹配是從不同視角對同一場景拍攝并獲得圖像對,再找出兩幅圖像中特征相同的點,然后再算出視差,最后得到圖像的三維信息。下面,筆者主要探討計算機雙目視覺的立體匹配算法。
據(jù)研究,雙目立體視覺是先從不同視角利用兩臺攝像機拍攝同一場景,并獲得兩幅圖像,然后按三角測量與視差原理,測得物體至成像系統(tǒng)的距離或深度信息。其中,可按攝像機安裝的位置將雙目立體視覺分為兩種模型?;趨R聚光軸的視覺模型按一定的角度安裝左、右攝像頭;基于平行光軸的視覺模型完全平行安裝左、右攝像頭。對于基于匯聚光軸、平行光軸的兩種視覺模型,前者具有攝像頭安裝難度較低、兩臺攝像機的間距與方向可自由調(diào)節(jié)、圖像的遮擋減少、攝像機視場范圍可自由調(diào)節(jié)等優(yōu)點;后者的效果最好,但在實際安裝攝像頭時,卻很難實現(xiàn)兩個攝像頭完全平行。
下面,筆者選擇基于平行光軸的視覺模型,以解析雙目立體視覺所用的視差原理。假設攝像機的焦距為f,兩個攝像頭的基線距離為B及其成像中心分別為OR、OT,現(xiàn)實中物體點到B的距離為Z,兩臺攝像機投影平面上P點的成像點分別為p、p’,那么可按三角測量原理進行如下描述:
據(jù)此,在基于光軸平行的視覺模型中,兩臺攝像機的基線與其成像平面相互平行,則得視差場景的深度與攝像機的焦距、基線的長度呈正相關,同時與視差呈負相關,而物體深度與其呈負相關,表明物體距離攝像機較近時的值具有更高的精確度。
BM算法是一種局部立體匹配算法,其以支撐窗為理論基礎,并假設支撐窗中像素的視差相同,即:先設定小窗口,再在待匹配的圖像上按窗口中的特征向量遍歷搜索,然后再計算遍歷中不同窗口與該窗口的相似度,并取最相似的窗口為最后結(jié)果。關于BM算法,其既可以像素(塊)為匹配特征,又可按圖像特征對窗口進行自適應調(diào)節(jié)。關于最佳窗口的搜索,贏者通吃法是最常見的優(yōu)化算法,其原理為:先算出不同匹配窗口中對應于每一像素點的匹配代價,再以匹配代價最小的窗口為最后的匹配窗口。BM算法的首要任務是算出匹配代價,即:視差分別從左、右視圖中選定矩形窗口及其中心分別為p1(x,y)、p2(x+d,y);運用匹配代價函數(shù)算出兩個矩形窗口的相似性。其中,匹配代價函數(shù)以SAD(絕對差之和)、SSD(平方差之和)和ZSSD(歸一化互相關)等為主,本文運用SAD找尋左、右圖的最優(yōu)匹配點。綜上,BM算法的實現(xiàn)步驟為:首先,通過預過濾,以對圖像對亮度進行歸一化處理及強化圖像紋理;其次,運用SAD窗口沿極線開展匹配搜索;最后,通過再過濾,以篩除誤匹配點。
GC算法是一種全局匹配算法,其處理效果最好。關于GC算法,Boykov等人提出了基于Graph Cut(圖割)的立體匹配技術,即通過實現(xiàn)圖像最小割來解決能量最小化的問題。在Graph Cut模型中,構(gòu)造數(shù)據(jù)與平滑約束項是最為核心的問題,目的是使圖像分割結(jié)果的精準度更高,其中運用的能量函數(shù)為:
其中,P為全部像素;p為某一像素的位置;N為鄰接關系;D為數(shù)據(jù)約束;f為標記;Dp(fp)為像素p在視差為fp時對應的匹配代價;V為光滑約束。圖像最小割問題的解決方法為最大流,所以Graph Cut在解決能量最小化問題時常用網(wǎng)絡流算法。綜上,GC算法先以能量函數(shù)中每個因子的取值建構(gòu)賦權(quán)圖,再以賦權(quán)圖的最小割對目標能量函數(shù)進行極小化處理,通過解決賦權(quán)圖最小割問題來解決全局能量最小化問題,然后再運用最大流算法進行解答。
GC算法的實現(xiàn)步驟為:首先,運用某種分割法按一定程度分割圖像;其次,運用BM算法快速求解每一點的初始視差;第三、根據(jù)視差信息,對每一區(qū)域開展平面化建模,并獲得平面集合;第四、修正平面集合;第五、以區(qū)域為單位全面匹配,從而獲得每一區(qū)域的視差。
SGM算法是半全局匹配算法,其相似性測度為互信息。其中,匹配點僅可對附近路徑上的一些像素進行搜索,所以弱紋理區(qū)會出現(xiàn)誤匹配。SGM算法的實現(xiàn)步驟為:首先,逐一計算左、右掃描線上的像素;其次,選擇八條規(guī)劃路徑聚合匹配代價;第三、運用迭代法計算視差;第四、按照左、右圖像同名像素點具有一致性來篩除無效匹配點。
綜上,本文簡要探究了計算機雙目視覺立體匹配算法,并著重介紹了BM算法、GC算法和SGM算法。經(jīng)過數(shù)十年的深入發(fā)展,雙目視覺立體匹配得到了不斷改進,且在醫(yī)學診斷、機器視覺等領域發(fā)揮了重要作用。但目前,仍缺少一種通用性強、精確度高且快速的匹配算法,且立體匹配仍是計算機雙目立體視覺的瓶頸,有待深入研究。