張政武
(陜西理工學院機械工程學院,陜西 漢中 723003)
共面多邊形不變量計算方法研究
張政武
(陜西理工學院機械工程學院,陜西 漢中 723003)
不變量的場景理解和目標識別是計算機視覺研究的一個重要領域,以往有關不變量研究主要集中在點、直線、二次曲線等幾何元素之間。在二維平面點的射影變換的基礎上,利用平面三角形面積不變量構造了三角形、四邊形、五邊形、六邊形等共面多邊形的不變量,并提出了具體的計算方法。在此基礎上通過舉例分析和實驗驗證,證明文中所給公式的正確性。
計算機視覺;共面多邊形;3D不變量;計算方法
20世紀80年代末,人們把在數(shù)學和物理學中成功應用的不變量理論引入機器視覺研究,初步形成了視覺不變量理論及其應用框架。從數(shù)學意義上講,視覺不變量是目標幾何結構在某些變換群條件下保持不變的函數(shù)形式,是反映不同模式之間本質差別的重要參數(shù)。近年來,基于不變量的場景理解和目標識別已成為計算機視覺研究的一個重要領域[1-3]。
有關不變量早期的研究,主要集中在利用點、直線等幾何元素來實現(xiàn)對三維場景理解和空間物體識別[4-7]。文獻[4]提出了一種從 3幅圖像中計算空間6個點射影不變量方法;文獻[5]通過對非線性方程組的求解提出了一種計算空間6點不變量的計算方法,并推導出了空間N點不變量的數(shù)目和圖像平面中匹配點數(shù)目之間的相互關系;文獻[6]提出了一種利用消失點列的射影不變量提取平面直線夾角方法,該方法可用于描述平面上直線間的平行、垂直、相交等相互關系;文獻[7]提出了一種共線4點交比不變量的計算方法,并且利用該方法實現(xiàn)了對空間建筑物的三維重建。近年來,隨著二次曲線造型技術的不斷發(fā)展,基于目標不變量二次曲線三維場景的理解和識別也成為計算機視覺研究的一個重要方面[8-10]。文獻[8]利用兩幅圖像中的7對匹配二次曲線,線性求解出剛體繞x, y, z軸的正負兩組旋轉運動參數(shù);文獻[9]利用單軸旋轉運動中空間點的軌跡在圖像平面的投影為二次曲線,建立了單軸旋轉運動不變量,提出了單軸旋轉運動的三維重建;文獻[10]從二次型的不變量構造了兩平面二次曲線的射影不變量,并利用平面二次曲線的共自極三角形對兩平面二次曲線的不變量進行了幾何解釋。
在實際應用中,有時會將目標圖像抽象為一系列共面多邊形,這就需要提取出共面多邊形的不變量。本文從二維平面點的射影變換出發(fā),利用平面三角形面積不變量構造了三角形、四邊形、五邊形、六邊形等共面多邊形的不變量,并提出了具體地計算方法。在此基礎上通過舉例分析和實驗驗證,證明文中所給公式的正確性。
設攝像機的成像模型為:在空間建立一個坐標系XYZ,讓攝像機的光心與坐標系的原點O重合、光軸位于Z軸上,稱平面Z=f是視平面;在視平面上建立一個像坐標系xoy,x、y軸分別與X、Y軸平行,稱原點O為視點,常數(shù)f為焦距。攝像機在該模型下完成三維空間到圖像二維空間的射影變換,其關系式可表示為:
或表示為:
其中,N為三維空間點(X, Y, Z)T的齊次坐標形式,m為二維平面圖像點(x, y)T的齊次坐標形式,P為攝像機的投影矩陣。
當所研究的點均位于一個二維平面上或組成一個平面多邊形時,空間點的坐標可以簡化為平面上的二維坐標,則從一個二維空間到另一個二維空間的射影變換可以表示為:
式(3)可以展開為非齊次坐標形式:
2.1 平面三角形面積及其不變量
假設三角形M在二維平面直角坐標系下,其3個頂點坐標分別為 (x1,y1)、 (x2,y2)、 (x3,y3)。根據(jù)有關幾何理論可知,從三角形某個頂點出發(fā),相鄰兩邊的向量交叉坐標乘積之差的絕對值一半等于該三角形的面積。即:
同時,設 J( x,y)是射影變換式(4)在點( x,y)處的雅可比矩陣,則有:
假設三角形M經(jīng)過射影變換式(3)后為M′,由式(5)、(6)可得三角形M′的面積為:
由式(7)可知,三角形在射影變換前、后的面積SM、SM′比值為雅可比矩陣乘積的次方,因此,三角形面積為該變換的相對不變量。
2.2 共面多變形不變量
由于平面n邊形包含n(n=3,…,n)個頂點,每個頂點作為起點按順時針(或逆時針)依次與其余相鄰2點連接均可構成一個三角形單元體。因此,平面多變形的不變量可由三角形單元體的面積來構造。以三角形、四邊形、五邊形、六邊形為例,將多邊形頂點按順時針依次標記為1、2、3、4、5、6,則多邊形分割的三角形單元體見表1所示。
表1 各多邊形分割成的三角形單元體
由于每個三角形的面積為射影變換的相對不變量,按照不變量理論,其乘積也是該射影變換的相對不變量。由表1可知,三角形、四邊形各有1個相對不變量,五邊形有2個相對不變量,六邊形有4個相對不變量。各多邊形對應的相對不變量見表2所示。
表2 各多邊形的相對不變量
多邊形的絕對不變量由相對不變量的商構造。由表2所示的各多邊形的相對不變量可得其對應的絕對不變量見表3所示。
表3 各多邊形的絕對不變量
設變換前三角形、四邊形、五邊形、六邊形分別為M,N,P,Q,經(jīng)過變換矩陣T二維射影變換后分別為M',N',P',Q',其中射影變換矩陣T為:則變換前、后各頂點對應坐標如表4所示。
各共面多邊形變換前后三角形單元體的 S及S′見表5所示。
表4 各圖形變換前后的坐標
表5 各共面多邊形變換前后三角形單元體的S及S′
由表2可知,各共面多邊形的相對不變量見表6所示。
表6 共面多邊形的相對不變量
由表3可知,絕對不變量如表7所示。
由表6可知,變換前后五邊形、六邊形4個絕對不變量完全相同。
各多邊形變換前后相對位置如圖1所示,共面多邊形變換前后相對位置如圖2所示。
表7 共面多邊形的絕對不變量
圖1 各多邊形變換前后相對位置
本文基于視覺不變性理論,從二維平面點的射影變換出發(fā),利用平面三角形面積不變量構造了三角形、四邊形、五邊形、六邊形等共面多邊形的不變量,并提出了具體地計算方法。在此基礎上通過舉例分析和實驗驗證,證明文中所給公式的正確性。希望該方法能夠為空間場景的三維重建和物體識別等方面的研究提供一個較好的理論基礎。
[1] Bayro-Corrochano E, Banarer V. A geometric approach for the theory and applications of 3D projective invariants [J]. Journal of Mathematical Imaging and Vision, 2002, 16: 131-154.
[2] Unel M, Soldea O, Ozgur E, et al. 3D object recognition using invariants of 2D projection curves [J]. Pattern Anal Applic, 2010, 13: 451-468.
[3] Raviv D M, Bronstein A M, Bronstein M, et al. Equi-affine invariant geometry for shape analysis [J]. Journal of Mathematical Imaging and Vision, 2014, 50: 144-163.
[4] Long Quan. Invariants of six points and projective reconstruction from three uncalibrated images [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1995, 17(1): 34-46.
[5] 袁立行, 鄭南寧, 王愛群. 一種新的空間透視不變量計算方法[J]. 西安交通大學學報, 1997, 31(1): 82-87.
[6] 劉 方, 王潤生. 利用消失點列的射影不變量描述平面直線關系[J]. 電子學報, 2001, 29(9): 1188-1191.
[7] Rajashekhar S C, Namboodiri V P. Image retrieval based on projective invariance [C]//2004 International Conference on Image Processing (ICIP). Singapore, 2004, 10: 405-408.
[8] 程志遠, 馬彩文, 高滿屯, 等. 基于序列圖像中二次曲線對應的純旋轉運動參數(shù)估計算法[J]. 工程圖學學報, 2006, 27(1): 98-104.
[9] Jiang Guang, Tsui H, Long Quan, et al. Geometry of single axis motions using conic fitting [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003, 25(10): 1343-1348.
[10] 張政武. 兩平面二次曲線不變量的定義、幾何解釋及計算方法[J]. 機械科學與技術, 2012, 31(8): 1354-1358.
Computational Methods of Invariants of Coplanar Polygons
Zhang Zhengwu
(Department of Mechanical Engineering, Shaanxi University of Technology, Hanzhong Shaanxi 723003, China)
The comprehensive and recognition of 3D scene based on invariants are the most important research areas in computer vision fields. The conventional studies of invariants are that these invariants are derived for planar objects using points, lines, and conics from images. The invariants of triangular, quadrilateral, pentagonal and hexagon are structured by use of triangular area from 2D points perspective projection in this paper. And the computational methods of the invariants are derived. The result of example shows that this formula is correct on the basis of studies.
computer vision; coplanar polygon; 3D invariant; computational methods
TP 391
A
2095-302X(2015)05-0691-06
2015-02-07;定稿日期:2015-04-13
陜西省教育廳專項科研計劃資助項目(15JK1163)
張政武(1969-),男,陜西藍田人,副教授,碩士。主要研究方向為圖學理論、計算機視覺。E-mail:zhzhw256@163.com