秦雪,王歡,2,嚴(yán)曄 ,吳玉寧,蘇偉 ,2
(1.長(zhǎng)春理工大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,長(zhǎng)春 130022;2.長(zhǎng)春理工大學(xué) 信息化中心,長(zhǎng)春 130022)
圖像識(shí)別技術(shù)在現(xiàn)代計(jì)算機(jī)科學(xué)中已經(jīng)得到了廣泛的研究和發(fā)展,并且運(yùn)用到了生產(chǎn)生活的各個(gè)方面,例如人臉識(shí)別,指紋識(shí)別,機(jī)動(dòng)車監(jiān)控等。傳統(tǒng)灰度圖像識(shí)別系統(tǒng)[1]如圖1所示。傳統(tǒng)灰度圖檢測(cè)方法,由于具有良好的匹配效果,確切的定量分析,大量的實(shí)驗(yàn)結(jié)果,目前得到了廣泛的應(yīng)用。但是,此類方法仍然存在對(duì)圖像識(shí)別精度不高、復(fù)雜度高等缺點(diǎn)。本文基于邊緣檢測(cè)圖像識(shí)別算法,通過優(yōu)化灰度圖像識(shí)別系統(tǒng)流程圖,提出了一種新的邊緣檢測(cè)圖像識(shí)別算法,提高了圖像識(shí)別的精度,分析了算法的優(yōu)缺點(diǎn)和實(shí)際使用的可行性。
圖1 灰度圖像識(shí)別系統(tǒng)
算法主要思想是改進(jìn)識(shí)別流程圖的決策判斷部分。將其流程優(yōu)化為提取圖像邊緣、計(jì)算邊緣梯度矩陣、建立梯度直方圖、計(jì)算偏離方差、確定判定條件五個(gè)部分,基本流程如圖2所示。
圖2 基于邊緣檢測(cè)圖像識(shí)別流程圖
首先,提取待測(cè)對(duì)象邊緣。通過分析此邊緣圖像的矩陣,保留圖像中為待測(cè)對(duì)象邊緣的對(duì)應(yīng)像素點(diǎn),本文中稱作有效像素。然后,對(duì)原圖中有效像素計(jì)算偏導(dǎo)數(shù),得到原圖中有效像素的梯度矩陣,最后分析此梯度矩陣得到邊緣梯度的匹配標(biāo)準(zhǔn)。通過判定條件過濾掉待測(cè)對(duì)象中邊緣梯度并不契合的對(duì)象。
在這種方法中,使用了有效像素,雖然匹配效率變高,但是時(shí)間復(fù)雜度增加。
基于灰度特征的級(jí)聯(lián)分類器訓(xùn)練[2]是邊緣檢測(cè)圖像識(shí)別算法的基礎(chǔ),它提供了一個(gè)有效的圖像識(shí)別研究平臺(tái)。Haar-like特征[3],如圖3所示。
圖3 Haar-like特征庫
可以使用五個(gè)要素來描述這些矩形:在圖像中的坐標(biāo)x,y,矩形橫向距離w和矩形縱向距離h,以及矩形與水平方向的夾角α。根據(jù)灰度圖像特征描述公式:
其中每一個(gè)矩形的特征值計(jì)算公式:
為實(shí)現(xiàn)對(duì)圖像邊緣像素提取,首先通過canny算子[4]計(jì)算統(tǒng)計(jì)平均,使圖像像素的高斯分布趨于平衡。假如設(shè)定如下二維高斯函數(shù)公式:
可以得到的此高斯函數(shù)的導(dǎo)數(shù)公式:
導(dǎo)數(shù)公式表示圖像灰度變化率相對(duì)水平的傾斜方向,通過卷積得到圖像像素沿這兩個(gè)方向的偏導(dǎo)數(shù)公式:
公式中k為自然數(shù),e表示高斯參數(shù),它表示圖像的像素平衡程度。然后,通過一階偏微分卷積方法求出的變化率的大小公式:
和傾斜角度公式:
本文采用Canny算子大小為3×3,閾值范圍(56~168)。
在文中,由于矩陣行列數(shù)過多,因此只截取邊緣矩陣第151~154行,第356~350列作為分析矩陣,可見通過Canny算法求取邊緣后,灰度變化率方向上的像素灰度值達(dá)到峰值,最后通過雙閾值算法將邊緣圖像連接起來,實(shí)際效果如圖4所示。
圖4 邊緣提取效果對(duì)比圖
圖像中可以看出機(jī)器人的大致輪廓能夠被識(shí)別出來,機(jī)器人輪廓線和閾值參數(shù)有關(guān)。過于高的閾值設(shè)定會(huì)使輪廓線會(huì)減少。這也是基于邊緣檢測(cè)圖像識(shí)別算法的一個(gè)局限所在,只能夠根據(jù)具體的圖像做出最優(yōu)的選擇。
Sobel算子是用來求取圖像矩陣的偏導(dǎo)數(shù)的算子[5]。假設(shè)為圖像矩陣函數(shù),其中(x ,y)圖像矩陣中的行和列的位置,別分對(duì)應(yīng)此行和列的像素灰度值,則由一階導(dǎo)數(shù)得到像素的梯度公式:
同樣得到矢量模的大小公式:
Sobel算子能夠?qū)?度和90度兩個(gè)方向上的梯度進(jìn)行檢測(cè)分析,將接近于這兩個(gè)方向的梯度劃分成兩組。其中梯度函數(shù)公式:
根據(jù)三角函數(shù)性質(zhì)得到像素傾角公式:
算子包括兩組3×3矩陣,拓展內(nèi)核為1。
在本文中,由此公式得到的梯度矩陣截取第151~154行,第356~350列矩陣為
進(jìn)而求出整個(gè)圖像的像素點(diǎn)的傾角矩陣
由于通過矩陣計(jì)算出邊緣傾角矩陣,此方法增加了算法復(fù)雜度。
灰度直方圖[6]是灰度值的統(tǒng)計(jì)圖形,以圖形的方式反映圖像灰度分布情況,灰度直方圖分為兩個(gè)類型。一是標(biāo)準(zhǔn)灰度直方圖,表示像素個(gè)數(shù)和灰度值大小的關(guān)系;二是歸一化的直方圖,表示同一灰度值大小的像素所占百分比和灰度值的關(guān)系。灰度圖一維表示公式和歸一化公式如下:
根據(jù)歸一化公式計(jì)結(jié)果,得到某一灰度值的在整個(gè)圖像像素中所占概率,是圖像像素總數(shù)。
灰度直方圖直觀的統(tǒng)計(jì)特性,為圖像識(shí)別判定原則提供了方便的工具。
通常使用的彩色圖像一般都是RGB格式。圖像中紅、綠、藍(lán)三個(gè)分量所占比例是不同的[7]。按照加權(quán)的方式可以將三種顏色色值轉(zhuǎn)化為灰度圖像灰度值。
例如某像素點(diǎn)RGB分量分別為(R,G,B),像素灰度公式如下:
R,G,B,V的大小范圍從0~255。根據(jù)如上公式的比例因子,將彩色的三色色值加權(quán)求和,保存成灰度圖像,再把0~255分成n個(gè)灰度級(jí)別對(duì)這些灰度級(jí)別進(jìn)行直方統(tǒng)計(jì)。
根據(jù)需要本文將讀取的標(biāo)準(zhǔn)圖像和待識(shí)別的視頻提取圖像全部轉(zhuǎn)換為灰度圖像進(jìn)行操作。
將標(biāo)準(zhǔn)差應(yīng)用于圖像質(zhì)量標(biāo)準(zhǔn)[8],可以使圖像統(tǒng)計(jì)數(shù)據(jù)更健全利于分析,標(biāo)準(zhǔn)差定義公式如下:
邊緣像素變化率和水平方向的夾角(邊緣傾角、梯度方向)可以取180個(gè)方向的角度,因此建立直方圖有180個(gè)灰度級(jí),其中橫坐標(biāo)對(duì)應(yīng)180個(gè)角度,縱坐標(biāo)對(duì)應(yīng)同一角度的像素出現(xiàn)頻率,根據(jù)傾角數(shù)據(jù)繪制灰度圖。建立灰度圖[9],如圖5所示。為過濾匹配項(xiàng),增加識(shí)別判定準(zhǔn)則也就是匹配識(shí)別距離d,其公式為:
其中θi為待匹配圖像的某一傾角頻率值,αi為原圖同一傾角頻率值。
通過比較基于兩幅圖的邊緣傾角建立的灰度圖像的相似程度,便可以得到分析數(shù)據(jù)來判定此兩幅圖是否具有相似的灰度分布,從而識(shí)別出待識(shí)別的物體。
對(duì)比兩幅圖像邊緣梯度方向也就是邊緣傾角分布情況。通過計(jì)算的方差統(tǒng)計(jì),求出最優(yōu)在匹配識(shí)別距離d,以達(dá)到最優(yōu)的匹配效果。
圖5 傾角矩陣直方圖
本實(shí)驗(yàn)所用設(shè)備為處理器core i7,顯卡GTX660M,內(nèi)存8G,在VS2010,C++語言環(huán)境下采用cascade方法訓(xùn)練的級(jí)聯(lián)分類器,訓(xùn)練樣本400張。匹配過程中圖像經(jīng)過灰度轉(zhuǎn)化,比例縮小,縮小因子1.1,識(shí)別框矩形大小為30~50。
對(duì)比結(jié)果如圖6所示,基于邊緣檢測(cè)匹配,識(shí)別效果優(yōu)于傳統(tǒng)灰度圖像識(shí)別系統(tǒng)。圖中可以觀察到,傳統(tǒng)灰度圖像匹配下有6個(gè)待選識(shí)別框,而邊緣檢測(cè)匹配算法只有1個(gè)匹配識(shí)別框。改進(jìn)后的在此單幀下優(yōu)化了83.3%。
圖6 圖像識(shí)別對(duì)比結(jié)果
如表1所示,對(duì)于匹配識(shí)別距離d的不同取值得到了不同的匹配效果,隨著d的減小,圖像識(shí)別精度不斷提高。但隨著匹配識(shí)別距離d減小到臨界值時(shí),識(shí)別效果達(dá)到頂峰。
表1 匹配效率數(shù)據(jù)
如圖7所示,如果采用圖像的某一幀分析,就會(huì)發(fā)現(xiàn)得到的效率曲線并不是一直隨著匹配識(shí)別距離的減小而提高。當(dāng)d取值為0.05時(shí),達(dá)到峰值,但隨后匹配效率急劇下降,甚至匹配框消失。過低的匹配識(shí)別距離意味著待測(cè)圖像和原圖之間的差異非常小,而待測(cè)圖像和原圖并不是完全一致的,一些滿足條件的匹配框也被過濾掉了。此方法并不能夠適應(yīng)一些多變的環(huán)境,局限性非常明顯。
圖7 單幀識(shí)別率隨匹配距離d變化值
實(shí)驗(yàn)結(jié)果表明,基于邊緣檢測(cè)的圖像識(shí)別使普通識(shí)別效率最高提高了80%。但是匹配識(shí)別距離的局限性使得此效率不能夠再提升。而且匹配識(shí)別距離只能依靠具體的條件才能得到最優(yōu)效果,并不能夠自適應(yīng)各種圖像識(shí)別。
基于邊緣檢測(cè)的圖像識(shí)別算法,保持了傳統(tǒng)圖像識(shí)別的優(yōu)點(diǎn),提高了圖像識(shí)別效率。傳統(tǒng)圖像識(shí)別的基礎(chǔ)上增加了新的判定準(zhǔn)則,為實(shí)現(xiàn)圖像匹配識(shí)別進(jìn)行了有益的探索。但是仍然存在識(shí)別速度慢,匹配識(shí)別距離自適應(yīng)性差,Canny算法的自適應(yīng)性差等問題,有待于進(jìn)一步研究解決。
[1]王明瀟.圖像識(shí)別算法研究及其智能終端上的實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2010.
[2]Prem Kuchi,Prasad Gabbur,P Subbanna Bhat,et al.Human face detection and tracking using skin color modeling and connected component operators[J].IETE Journal of Research,2002,48(3-4):289-293.
[3]王明瀟.圖像識(shí)別算法研究及其智能終端上的實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2010.
[4]王植,賀賽先.一種基于Canny理論的自適應(yīng)邊緣檢測(cè)方法[J].中國圖象圖形學(xué)報(bào),2004,9(08):65-70.
[5]袁春蘭,熊宗龍,周雪花,等.基于Sobel算子的圖像邊緣檢測(cè)研究[J].激光與紅外,2009,39(1):85-87.
[6]李小利,阮秋琦,阮成雄.基于灰度直方圖的加權(quán)模板匹配法在攝像機(jī)標(biāo)定中的應(yīng)用[J].北京交通大學(xué)學(xué)報(bào),2013,37(2):22-26.
[7]張學(xué)榮,雷國偉.基于灰度直方圖的背景差目標(biāo)檢測(cè)算法[J].計(jì)算機(jī)安全,2010(2):45-47.
[8]張小利,李雄飛,李軍.融合圖像質(zhì)量評(píng)價(jià)指標(biāo)的相關(guān)性分析及性能評(píng)估[J].自動(dòng)化學(xué)報(bào),2014,40(2):306-315.
[9]王潤(rùn)鴻.基于視覺加權(quán)的最大連通面積直方圖檢索[J].長(zhǎng)春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2013,36(1-2):110-114.