,,
(浙江清華長三角研究院 先進制造技術研究所,嘉興 314000)
圖像匹配算法是目標識別和人工智能的關鍵技術之一。近年來,隨著此技術在各領域的應用需求不斷增加,其已成為眾多學者的重點研究對象。
根據(jù)匹配基本原理[1],圖像匹配可分為三類[2]:基于灰度相關的圖像匹配[3]、基于特征的圖像匹配[4-6]和基于解釋的圖像匹配?;诨叶认嚓P的匹配方法需要選取一定大小的窗口灰度陣列,一旦進入信息貧乏區(qū)域,匹配失敗在所難免?;诮忉尩膱D像匹配需要建立圖片自動判讀的專家系統(tǒng),不僅要有非常大的數(shù)據(jù)庫支持,而且計算量龐大,相關的研究至今也尚未取得突破性的進展。而基于特征的匹配通過提取圖片的一些特征后,再采用算法進行匹配。這樣既避免了采用死板的固定灰度陣列,也降低了計算量,具有靈活性強、準確性高等優(yōu)點。
本文以TI公司的TMS320C6000系列DSP(Digital Signal Processor)為核心,組建紅外圖像匹配系統(tǒng)。利用DSP計算速度快的特點,系統(tǒng)在匹配算法運行前加入圖像預處理過程,減少了干擾影響,優(yōu)化了匹配效果。
紅外圖像匹配系統(tǒng)前端配備的是國內公司自主研發(fā)的波長范圍為8~14 μm的中紅外波段熱源檢測器,輸出14位有效數(shù)據(jù)。核心處理器采用TMS320DM648型號DSP,該款DSP許多特性可為在處理圖像信號時提供很大的便捷性。最后,紅外灰度圖片經偽彩色算法著色后在液晶屏顯示,并輸出匹配結果。
紅外圖像匹配系統(tǒng)的硬件主要由三部分組成,分別是電源模塊、DSP模塊和FPGA模塊。電源模塊負責電路板所有設備的供電,除了電路板上的芯片,還包括外部設備接口處的供電。DSP模塊負責數(shù)據(jù)處理,包括圖像處理算法、通信數(shù)據(jù)處理等,是系統(tǒng)的核心。FPGA模塊主要負責多種接口的轉換、接口協(xié)議的實現(xiàn)等功能。系統(tǒng)中紅外圖片數(shù)據(jù)的輸入輸出都需要經過FPGA解碼和編碼。系統(tǒng)硬件結構如圖1所示。
圖1 系統(tǒng)硬件結構圖
1.3.1 圖像預處理
紅外傳感器輸出圖像的尺寸為640×480,為了提高運算效率,縮短匹配時間,需要將原始圖片尺寸縮小。但如果一味追求運算速度而把圖片尺寸縮得過小,則會導致圖片特征信息丟失,反而不利于正確匹配。因此權衡之后,選擇圖片的長寬分別縮小為原來的四分之一比較合適。其中,縮放算法采用近鄰取樣插值算法。
紅外檢測設備在運用于大型電廠或者變電場所時,由于室內室外有些檢測位置的背景較為復雜,存在一些不可忽略的干擾因素,因此本文采用最大類間方差算法[7-8]去除背景干擾。
1.3.2 圖像特征提取
圖像特征提取分兩步進行:第一步提取邊緣信息,第二步提取圖像共生矩陣。
紅外圖像輸入DSP時即為灰度數(shù)據(jù),故可直接采用Sobel算法[9]進行邊緣提取。利用水平和垂直Sobel算子分別與圖像作卷積運算:
(1)
其中D為圖像數(shù)據(jù)矩陣,Gx為提取水平方向邊緣的圖片數(shù)據(jù),Gy為提取垂直方向邊緣的圖片數(shù)據(jù)。圖像的邊緣強度為:
(2)
由于不同的圖像邊緣信息差異較大,G的取值范圍變化也會很大,不利于后續(xù)圖像特征提取,故將其歸一化后,再映射到8位圖像灰度值區(qū)間:
(3)
其中Gmin和Gmax分別是G的最小值和最大值。
灰度共生矩陣[10]是一種常用的紋理特征分析方法,它對圖像每兩個像素灰度級聯(lián)合分布進行統(tǒng)計,能很好地體現(xiàn)紋理灰度級相關性的規(guī)律?;叶裙采仃嚤欢x為從灰度級i的點離開某個固定位置關系D=(Dx,Dy)達到灰度為j的概率?;叶裙采仃囉肞D(i,j)(i,j=0,1,2,…,L-1)表示。其中L表示圖像灰度級,i、j分別表示兩個像素的灰度。共生矩陣生成的方向一般為0°、45°、90°、135°四個方向。由于紅外圖像信息偏少,為了增加匹配算法的魯棒性,本文采用上述的全部4個方向的共生矩陣作為圖像的特征向量。
P=[P0(i,j),P45(i,j),P90(i,j),P135(i,j)]
(i,j=0,1,2,…,L-1)
(4)
考慮DSP在處理中讀寫數(shù)據(jù)的速度問題,將式(4)轉換為一維數(shù)組,則特征向量可表述為:
P(i)(i=0,1,2,…,4×L2-1)
(5)
1.3.3 圖像匹配算法
圖像的匹配過程實則是圖像特征向量的匹配。本文采用曼哈頓距離算法[11]衡量未知圖的特征向量PX(i)(i=0,1,2,…,4×L2-1)和圖庫的特征向量PR(i)(i=0,1,2,…,4×L2-1)的匹配程度,如式(6)所示:
(6)
由于不同圖片提取的特征向量數(shù)值差異較大,在多個樣本參與匹配時不利于獲得正確的匹配結果。因此對傳統(tǒng)曼哈頓距離算法作了改進,加入權重系數(shù)W,使不同的特征向量處于同一數(shù)量級。
(7)
在實際處理中,以圖庫圖片的特征向量來計算權重系數(shù),然后通過改進的曼哈頓距離計算公式得到圖庫圖片與未知圖片之間的一個匹配值,數(shù)值最小對應的圖庫圖片則被判定為匹配結果。其中,改進后的距離稱為加權距離,如式(8)所示:
(8)
由于采用全部4個方向(0°,45°,90°,135°)的共生矩陣作為圖像的特征向量,故理論上灰度共生矩陣的總和Ptotal與圖像像素尺寸大小(m×n)的關系如式(9)所示:
Ptotal=(m-1)·n+m·(n-1)
+(m-1)·(n-1)+(m-1)·(n-1)
(9)
本文圖像通過尺寸調整后像素均為160×120,所以Ptotal=75 962。
由于預處理時去除了背景,所以實際參與灰度共生矩陣計算的有效像素有所減少,導致實際灰度共生矩陣總和也相應減小,則圖像去除背景后的灰度共生矩陣有效占比率(L)為:
(10)
調整后的距離方程如式(11)所示,稱其為有效距離。
DL=L·dW(PX,PR)
(11)
為了對所建系統(tǒng)的實時性、準確性和穩(wěn)定性有效地評估,本文設計了4組匹配實驗,每一組匹配實驗的次數(shù)為30次,分別統(tǒng)計每組的消耗時間和匹配成功率,其中時間是通過高精度示波器檢測硬件I/O高低狀態(tài)變換測得,如表1所列。
表1 匹配不同圖庫的時間和成功率
實驗中,雖然隨著圖庫圖片數(shù)量增加,匹配消耗的時間也增加,但增加的幅度比較小,而且匹配所耗時間整體都是遠遠小于紅外圖片更新時間40 ms(每秒25幀)。匹配的準確率與圖庫圖片有一定關系,如果圖庫中存在特征比較接近的圖片,則系統(tǒng)可能會匹配錯誤。整體上,系統(tǒng)的匹配效率、準確率等方面符合要求。
趙飛(碩士研究生),主要研究方向為圖像識別。