摘 要:以偽二維隱馬爾科夫模型(Pseudo two-dimensional hidden Markov model P2DHMM)為基礎(chǔ),通過(guò)構(gòu)建參考圖像與測(cè)試圖像匹配模型,采用計(jì)算距離和方格表達(dá)變化過(guò)程,解決了兩個(gè)技術(shù)問(wèn)題:圖像特征參量的構(gòu)建;圖像符號(hào)識(shí)別的二維非線性變形P2DHMM模型構(gòu)建。介紹了圖像符號(hào)識(shí)別的P2DHMM構(gòu)建與初步應(yīng)用。
關(guān)鍵詞:偽二維隱馬爾科夫模型;符號(hào)識(shí)別;圖像匹配
中圖分類(lèi)號(hào):TP312
目標(biāo)的檢測(cè)與識(shí)別主要應(yīng)用于智能交通領(lǐng)域,如飛機(jī)、艦船、車(chē)輛等目標(biāo)的檢測(cè)與識(shí)別跟蹤[1]。要實(shí)現(xiàn)圖像目標(biāo)的檢測(cè)與識(shí)別,一方面可以通過(guò)一些圖像處理的手段消除影響因素使其得到比較規(guī)范的數(shù)據(jù);另一方面就可以尋找目標(biāo)圖像上能夠保持恒定不變的某些特征參數(shù)來(lái)建立該類(lèi)目標(biāo)的表述模型。建立了這樣的目標(biāo)影像的表述模型后就能實(shí)現(xiàn)影像目標(biāo)有效識(shí)別。第一種方法雖然是一個(gè)行之有效的方法,但是它需要一系列繁瑣的預(yù)處理,效率很低;本研究主要是考慮提取標(biāo)更一般化的不變量特征。
基于偽二維隱馬爾科夫模型(Pseudo Two-Dimensional Hidden Markov Model-P2DHMM)的識(shí)別方法[2],是基于P2DHMM模型的拓?fù)浣Y(jié)構(gòu)進(jìn)行圖像的匹配,計(jì)算得出P2DHMM距離,利用最近鄰原則判別,沒(méi)有固定的模板參量限制,因此P2DHMM在手跡識(shí)別、人臉識(shí)別和醫(yī)學(xué)圖像方面得到成功的應(yīng)用[3-4]。本研究將P2DHMM引入到圖像符號(hào)的識(shí)別中,工作重點(diǎn)放在三個(gè)方面:(1)研究圖像中基于P2DHMM目標(biāo)識(shí)別的二維非線性變形模型的適用性和潛在應(yīng)用價(jià)值;(2)實(shí)驗(yàn)?zāi)P偷耐負(fù)浣Y(jié)構(gòu)、主要參數(shù)和算法選擇;(3)建立典型參考圖像符號(hào)庫(kù),進(jìn)行了圖像符號(hào)識(shí)別實(shí)驗(yàn)并分析結(jié)果,提出模型改進(jìn)的建議。
1 偽二維隱馬爾科夫結(jié)構(gòu)與特征參量構(gòu)建
1.1 隱馬爾科夫模型與偽二維隱馬爾科夫模型
隱馬爾科夫模型(HMM)是在馬爾科夫鏈的基礎(chǔ)上發(fā)展起來(lái)的,由于實(shí)際問(wèn)題比馬爾科夫模型所描述的更為復(fù)雜,觀察到的事件并不是與狀態(tài)一一對(duì)應(yīng),而是通過(guò)一組概率分布相聯(lián)系,這樣的模型就稱(chēng)為HMM。它是一個(gè)雙重隨機(jī)過(guò)程,其中之一是馬爾科夫鏈,這是基本隨機(jī)過(guò)程,它描述狀態(tài)的轉(zhuǎn)移;另一個(gè)隨機(jī)過(guò)程描述狀態(tài)和觀察值之間的統(tǒng)計(jì)對(duì)應(yīng)關(guān)系[5]。
二維隱馬爾科夫模型(2DHMM)是由HMM模型演變而來(lái),它由水平方向HMM和垂直方向HMM構(gòu)成,水平HMM中的某一狀態(tài)不僅可以轉(zhuǎn)移到水平方向的其它狀態(tài),同時(shí)還可以躍遷到垂直方向HMM中的某一狀態(tài),同樣的垂直方向HMM中的狀態(tài)也可轉(zhuǎn)移到水平方向。由于二維HMM的結(jié)構(gòu)的復(fù)雜性,算法復(fù)雜,限制了2DHMM的應(yīng)用[6]。
偽二維隱馬爾科夫模型(P2DHMM)利用了一維HMM的基本拓?fù)浣Y(jié)構(gòu),將一個(gè)完整的一維HMM作為一個(gè)狀態(tài),形成P2DHMM的超狀態(tài),超狀態(tài)里面的一維HMM的狀態(tài)是子狀態(tài)。子狀態(tài)只能在相應(yīng)的狀態(tài)約束下進(jìn)行躍遷,超狀態(tài)與子狀態(tài)之間也不允許躍遷,但是在超狀態(tài)之間有狀態(tài)轉(zhuǎn)移。由于這一模型中不同超狀態(tài)下的子狀態(tài)之間不能夠躍遷,因而不是真正意義的二維模型,故也被稱(chēng)為偽二維隱馬爾科夫模型,見(jiàn)圖1。每個(gè)超狀態(tài)為一個(gè)隱Markov模型單向左右型的拓?fù)浣Y(jié)構(gòu),超狀態(tài)間轉(zhuǎn)移的拓?fù)浣Y(jié)構(gòu)也為單向左右型。P2DHMM模型已被成功地應(yīng)用于字符識(shí)別、人臉識(shí)別等領(lǐng)域。
圖1 P2DHMM的拓?fù)浣Y(jié)構(gòu)圖
1.2 基于P2DHMM拓?fù)浣Y(jié)構(gòu)的圖像匹配
基于P2DHMM拓?fù)浣Y(jié)構(gòu)的圖像匹配,沒(méi)有進(jìn)行目標(biāo)的特征的提取直接用圖像的灰度值進(jìn)行匹配。
具體匹配算法如下所述:
假設(shè),測(cè)試目標(biāo)圖像用A=(aij)表示,其中每個(gè)像素的位置為(i,j),i=1,……,I,j=1,……J。
參考目標(biāo)圖像用B=(bxy)表示,其中每個(gè)像素的位置為:
X=1,……,X,y=1,……,Y。
基于P2DHMM拓?fù)浣Y(jié)構(gòu)的測(cè)試圖像和目標(biāo)圖像之間進(jìn)行匹配滿足的約束為:
x(1,j)=y(i,l)=1
x(N,j)=y(i,N)=N
0≤(xij-xi-1j)≤2
|xij-xij-1|=0
0≤(yij-yij-1)≤2 (1)
此約束忽略了相鄰的列的像素之間的依賴(lài)關(guān)系,相鄰列之間的垂直方向的相對(duì)置移被忽略,圖像間的映射為列到列的映射,映射關(guān)系滿足P2DHMM超狀態(tài)的轉(zhuǎn)移。每列內(nèi)的像素之間的映射也是滿足超狀態(tài)內(nèi)的子狀態(tài)之間的轉(zhuǎn)移。
超狀態(tài)之間的轉(zhuǎn)移是從左到右,子狀態(tài)之間的轉(zhuǎn)移是從下到上,躍遷都不超過(guò)2個(gè)像素寬。像素和其相鄰的像素之間的關(guān)系保持下來(lái),參考圖像的二維變形圖像保持了原始圖像的結(jié)構(gòu)特征。
通過(guò)基于P2DHMM的拓?fù)浣Y(jié)構(gòu)對(duì)兩圖像進(jìn)行匹配,我們得到樣本B的變形的圖像B(xIJ11,yIJ11)。A,B圖像之間的距離,就轉(zhuǎn)化成A和B(xIJ11,yIJ11)之間的距離。
(2)
1.3 圖像水平方向約束的補(bǔ)償與構(gòu)建特征參量
P2DHMM不是真正的二維,放松了水平方向的約束,目前通常采用兩種方法對(duì)這種假設(shè)進(jìn)行補(bǔ)償[6-7]。第一種方法是對(duì)圖像進(jìn)行Sobel濾波(包括水平和垂直方向),得到圖像的梯度圖,在梯度圖的基礎(chǔ)上進(jìn)行識(shí)別。第二種方法是加入像素的上下文信息,比如采用3×3的區(qū)域的上下文信息。
若用U表示3×3的區(qū)域,A和 之間的距離用歐幾里的距離公式:
(3)
現(xiàn)在將這兩種方法結(jié)合,對(duì)梯度圖像進(jìn)行上下文信息的提取和重構(gòu)。
特征參量提取的步驟:
對(duì)圖像分別進(jìn)行垂直、水平方向的Sobel濾波,得到圖像的兩個(gè)梯度圖。
將兩個(gè)梯度圖上同坐標(biāo)的像素3×3的區(qū)域的9個(gè)像素的灰度值取出,得到每個(gè)像素的18維的矢量表示。
得到像素垂直方向提取結(jié)果3×3(V),水平方向提取結(jié)果3×3(H),將水平方向提取結(jié)果與垂直方向提取結(jié)果排列構(gòu)成18維的矢量表示。
2 技術(shù)路線與典型實(shí)驗(yàn)
2.1 技術(shù)路線
從一系列圖像中,選擇200種典型的圖像符號(hào)作為試驗(yàn)的參考樣本。對(duì)樣本進(jìn)行縮放、旋形成測(cè)試樣本。然后進(jìn)行P2DHMM匹配處理,處理技術(shù)路線見(jiàn)圖2:
圖2 P2DHMM匹配處理的流程圖
2.2 典型圖像符號(hào)P2DHMM匹配實(shí)驗(yàn)
圖3和圖4是同種圖像符號(hào)的識(shí)別效果圖。從左到右分別是測(cè)試圖像-1,變形圖像-2,變形網(wǎng)格-3,參考圖像-4。上層是垂直方向Sobel濾波的效果圖,下層是水平方向Sobel濾波的效果圖,每一次匹配結(jié)果可以得到一個(gè)P2DHMM距離值。其中,變形網(wǎng)格是參考圖像二維變形過(guò)程中,像素的坐標(biāo)位置的置移,變形圖像-2是參考圖像-4根據(jù)測(cè)試圖像得到的二維變形圖像。
如果背景相同、目標(biāo)相同,測(cè)試圖像-1和參考圖像-4相同,變形圖像-2就沒(méi)有變化,變形網(wǎng)格-3是直角網(wǎng)格,P2DHMM距離值為零。見(jiàn)圖5。
如果測(cè)試圖像和參考圖像是同種圖像符號(hào),發(fā)生了一定的縮放,計(jì)算得到兩圖像的P2DHMM距離值不為0,變形網(wǎng)格-3發(fā)生變化,P2DHMM距離值較小為6.79455。
如果測(cè)試圖像和參考圖像是不同種類(lèi)型的圖像符號(hào),計(jì)算得到兩圖像的P2DHMM距離值不為0,變形網(wǎng)格-3發(fā)生變化,P2DHMM距離值較大為31.76735。
圖3 同一圖像符號(hào)的匹配效果圖
圖4 縮小圖像符號(hào)的匹配效果圖
圖5 不同圖像符號(hào)的匹配效果圖
我們利用圖2的技術(shù)路線開(kāi)發(fā)了圖像符號(hào)識(shí)別原型系統(tǒng),取得了好的識(shí)別效果。為兩種圖像符號(hào)的識(shí)別效果圖。
圖像符號(hào)識(shí)別效果圖中。左上角為待識(shí)別圖像符號(hào),識(shí)別結(jié)果中列出了識(shí)別出的圖像符號(hào)。識(shí)別出的圖像符號(hào)按照P2DHMM距離值的大小從左到右排序,越靠左P2DHMM距離值越小,表示與待識(shí)別圖像符號(hào)越相似。
圖6 圖像符號(hào)識(shí)別效果圖
3 結(jié)束語(yǔ)
論文介紹了將人工智能領(lǐng)域的P2DHMM模型介紹引入到圖像目標(biāo)識(shí)別的模型構(gòu)建、算法選擇和典型實(shí)驗(yàn)的技術(shù)過(guò)程。利用基于P2DHMM的拓?fù)浣Y(jié)構(gòu)的約束進(jìn)行測(cè)試圖像和參考圖像的匹配,保持了參考圖像的結(jié)構(gòu)特征,得到更一般化的度量距離,采用了提取圖像的水平和垂直兩方向的兩幅梯度圖中像素周?chē)?×3 區(qū)域的像素信息表示像素值,得到像素的18維矢量表示,提高了的符號(hào)的識(shí)別率。
實(shí)驗(yàn)結(jié)果展示了P2DHMM模型在圖像符號(hào)識(shí)別方面的應(yīng)用潛在價(jià)值。另外,當(dāng)目標(biāo)背景發(fā)生變化的情況下,可以先做中值濾波處理,可以提高P2DHMM處理效果。
參考文獻(xiàn):
[1]馬建文,田國(guó)良,王長(zhǎng)耀.遙感變化檢測(cè)技術(shù)綜述[J].地球科學(xué)進(jìn)展,2004(19):192-195.
[2]史忠植.高級(jí)人工智能[M].北京:科學(xué)出版社,1998.
[3]薛斌黨,歐宗瑛.加權(quán)合成的嵌入式隱Markov模型人臉識(shí)別[J].大連理工大學(xué)學(xué)報(bào),2002(05):32-33.
[4]張引,潘云鶴.工程圖紙自動(dòng)輸入字符識(shí)別的二維隱形馬爾可夫模型方法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),1999(09).
[5]D.Keysers,C.Gollan,and H.Ney.Local Context in Non-linear Deformation Models for Handwritten Character Recognition[J].In ICPR 2004.International Conference on Pattern Recognition,2004.
[6]D.Keysers,C.Gollan,and H.Ney.Classification of Medical Images using Non-linear Distortion Models[J].In BVM 2004.Bildverarbeitung für die Medizin 2004,2004(03):366-370.
作者簡(jiǎn)介:席曉燕(1981-),女,河北石家莊人,碩士,工程師,研究方向:圖像處理,目標(biāo)識(shí)別和變化檢測(cè);李小娟(1980-),女,河南正陽(yáng)人,碩士,工程師,研究方向:圖形圖像處理;梁佳(1978)女,博士,高級(jí)工程師,研究方向:圖形圖像處理;董昱麟(1984-),男,碩士,研究方向:大型軍工項(xiàng)目管理、圖像處理和識(shí)別。
作者單位:華北計(jì)算技術(shù)研究所,北京 100083;中國(guó)電子科技集團(tuán)公司電子科學(xué)研究院,北京 100041