摘 要:半調(diào)圖像分類(lèi)在逆半調(diào)過(guò)程中是非常關(guān)鍵的步驟。文獻(xiàn)[1]提出的神經(jīng)網(wǎng)絡(luò)分類(lèi)算法利用增強(qiáng)的一維相關(guān)性,可以對(duì)半調(diào)圖像進(jìn)行適當(dāng)?shù)姆诸?lèi),但分類(lèi)精度不夠高。在神經(jīng)網(wǎng)絡(luò)分類(lèi)算法的基礎(chǔ)上,通過(guò)計(jì)算圖像的灰度共生矩陣,進(jìn)而提取圖像的紋理特征來(lái)對(duì)圖像進(jìn)行分類(lèi)。實(shí)驗(yàn)表明,改進(jìn)后的算法可提高分類(lèi)的精度。
關(guān)鍵詞:半調(diào)圖像;圖像分類(lèi);紋理特征;灰度共生矩陣
中圖分類(lèi)號(hào):TP391.41文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1004-373X(2008)22-112-03
Improved Algorithm for Halftone Image Classification
FAN Junjie,Kong Yueping
(Xi′an University of Architecture and Technology,Xi′an,710055,China)
Abstract:The classification of halftone image is a key step in the process of inverse halftone.The neural net classification Algorithm can classify the halftone images using the enhanced one-dimensional correlation of halftone images,but the precision is not very high.This paper based on the neural net classification algorithm abstract the textural features by calculate the gray level co-occurrence matrix of halftone images.Experimental results show that the improved algorithm can enhance the classification precision.
Keywords:halftone image;image classification;texture feature;gray level co-occurrence matrix
1 引 言
數(shù)字半調(diào)技術(shù)是將連續(xù)色調(diào)圖像轉(zhuǎn)換成等觀感的半色調(diào)圖像;而逆半調(diào)技術(shù)是將半色調(diào)圖像轉(zhuǎn)換成連續(xù)色調(diào)的圖像,它去除在半調(diào)過(guò)程中所產(chǎn)生的半調(diào)噪聲和人工紋理,將離散的二值圖像恢復(fù)為連續(xù)色調(diào)圖像。對(duì)于不同的半調(diào)圖像只有采用相應(yīng)的逆半調(diào)技術(shù)才能得到比較滿(mǎn)意的結(jié)果,因此半調(diào)圖像分類(lèi)在逆半調(diào)、半調(diào)圖像壓縮過(guò)程中扮演著非常重要的角色。
由于連續(xù)色調(diào)圖像在半調(diào)過(guò)程中引入了許多噪聲,同時(shí)會(huì)呈現(xiàn)出許多有周期有規(guī)律的人工紋理,因此可以選取半調(diào)圖像的紋理特征作為圖像分類(lèi)的依據(jù)。本文先對(duì)文獻(xiàn)[1]中提出的半調(diào)圖像分類(lèi)算法進(jìn)行簡(jiǎn)單介紹,并分析這種方法的優(yōu)缺點(diǎn),并針對(duì)缺點(diǎn)提出基于灰度共生矩陣的紋理特征提取方法,最后對(duì)改進(jìn)后的算法進(jìn)行仿真,并給出實(shí)驗(yàn)結(jié)果。
2 基于BP神經(jīng)網(wǎng)絡(luò)的半調(diào)圖像分類(lèi)算法
文獻(xiàn)[1]中通過(guò)觀察發(fā)現(xiàn)各種半調(diào)圖的頻譜之間存在明顯的差異,因此將其作為半調(diào)圖像分類(lèi)的依據(jù),但是由于圖像的頻譜計(jì)算量比較大,復(fù)雜度比較高,所以提取圖像的一維相關(guān)性,然后用神經(jīng)網(wǎng)絡(luò)進(jìn)行分類(lèi)。
一個(gè)M×M大小圖像塊(IM×M(a,b),a,b=0,1,…,M-1)的一維相關(guān)性的定義為:
(l)=1M×M∑M-1i=0 ∑M-1j=0I(a+i,b+j)·I(a+i,b+j+l)
其中l(wèi)=1,2,…L,L是一維相關(guān)性的最大偏移長(zhǎng)度。
文獻(xiàn)[1]中通過(guò)只有單個(gè)隱層的BP神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行半調(diào)圖像分類(lèi),并將一維增強(qiáng)相關(guān)性數(shù)據(jù)向量作為神經(jīng)網(wǎng)絡(luò)的輸入。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,它由16個(gè)輸入節(jié)點(diǎn)(對(duì)應(yīng)16個(gè)相關(guān)性數(shù)據(jù))、4個(gè)輸出節(jié)點(diǎn)(對(duì)應(yīng)4個(gè)分類(lèi)結(jié)果)和10個(gè)隱層節(jié)點(diǎn)(根據(jù)輸入節(jié)點(diǎn)和輸出結(jié)點(diǎn)數(shù)目的平均值得到)構(gòu)成。
圖1 半調(diào)圖像分類(lèi)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)確定之后需要進(jìn)行訓(xùn)練,以便獲得神經(jīng)網(wǎng)絡(luò)的最佳權(quán)值和偏移。
利用該算法對(duì)半調(diào)圖像分類(lèi)可以得到如圖2所示的分類(lèi)結(jié)構(gòu)圖。
圖2 神經(jīng)網(wǎng)絡(luò)分類(lèi)結(jié)構(gòu)圖
由于自相關(guān)性函數(shù)描述的是一幅圖像中塊與塊之間的空間相關(guān)性,自相關(guān)函數(shù)值的大小與圖像中紋理粗細(xì)的變化有著對(duì)應(yīng)關(guān)系。當(dāng)圖像的紋理較粗時(shí),函數(shù)的變化速度較慢,當(dāng)紋理較細(xì)時(shí),函數(shù)的變化速度較快。對(duì)于同一大類(lèi)中的不同半調(diào)方法,雖然它們生成的半調(diào)圖在局部存在一定的差異,但在整體上,圖中塊與塊之間的空間相關(guān)性變化規(guī)律非常相似,因此只能暫時(shí)被劃分為同一大類(lèi)。對(duì)于局部存在差異的半調(diào)圖像需要一種能提取局部特征的方法來(lái)進(jìn)行分類(lèi),而基于灰度共生矩陣的特征提取方法正好解決這一問(wèn)題。
灰度共生矩陣是對(duì)圖像上保持某距離的兩像素分別具有某灰度的狀況進(jìn)行統(tǒng)計(jì)的到的,因此可以看成是兩個(gè)灰度組合的聯(lián)合直方圖。因此,對(duì)于同一大類(lèi)中無(wú)法利用自相關(guān)函數(shù)分開(kāi)的半調(diào)圖像,本文將利用基于灰度共生矩陣的紋理特征進(jìn)行區(qū)分。
3 改進(jìn)算法描述和試驗(yàn)
對(duì)于第三大類(lèi)的有序抖動(dòng)模板矩陣Cluster 4×4和DispersedCL 8×8,它們?cè)诰仃嚧笮『驮嘏帕猩洗嬖诿黠@的差異;而對(duì)于第4大類(lèi)中誤差分散方法Burkers和其他3種誤差分散算法,它們的誤差分散核在形狀大小和分散權(quán)值上也存在著比較大的差異。這些差異導(dǎo)致它們生成的半調(diào)圖在局部也存在著一定的區(qū)別。下面利用改進(jìn)的算法對(duì)半調(diào)圖像進(jìn)行分類(lèi):
改進(jìn)后的半調(diào)圖像分類(lèi)算法首先計(jì)算出圖像的一維增強(qiáng)相關(guān)性,并用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類(lèi),對(duì)第3大類(lèi)和第4大類(lèi)中的半調(diào)圖像利用紋理特征中的逆差矩特性進(jìn)行二次分類(lèi),對(duì)于其他大類(lèi)則直接輸出結(jié)果??驁D如圖3所示:
圖3 改進(jìn)后的算法框圖
其中,基于灰度共生矩陣的分類(lèi)算法框圖如圖4所示:
圖4 基于灰度共生矩陣的半調(diào)圖像分類(lèi)算法框圖
下面主要介紹利用灰度共生矩陣對(duì)第三大類(lèi)和第四大類(lèi)進(jìn)行區(qū)分:
(1) 圖像預(yù)處理
由于灰度半調(diào)圖像只有0和1兩個(gè)灰度級(jí),在此基礎(chǔ)上計(jì)算得到灰度共生矩陣并沒(méi)有實(shí)際意義。在此,需要先將灰度半調(diào)圖像轉(zhuǎn)換成一個(gè)灰度級(jí)比較豐富的圖像,然后再計(jì)算灰度共生矩陣。在實(shí)驗(yàn)中采用的辦法如下所示:
g=a×8+b×4+c×2+d×1
先將圖像分為2×2的塊,然后按照上述公式將4個(gè)像素映射為一個(gè)像素。通過(guò)轉(zhuǎn)化,灰度半調(diào)圖像就轉(zhuǎn)換成一個(gè)具有16個(gè)灰度級(jí)的圖像,在此基礎(chǔ)上計(jì)算的灰度共生矩陣就可以提取有用的特征值。
(2) 計(jì)算圖像的灰度共生矩陣
一幅灰度級(jí)為G的灰度圖像I,其大小為Ny×Nx,那么它的空間灰度共生矩陣定義為為:
其中(i,j)∈G×G,d是間隔距離,可以取為1,2,3,4,8等值。θ為方向(θ=0°,45°,90°,135°)。矩陣第i行第j列元素P(i,j,d,θ)表示所有θ方向,相鄰間隔為d的像素中有一個(gè)取i值、另一個(gè)取j值的相鄰對(duì)點(diǎn)數(shù),可以簡(jiǎn)記為P(i,j)。對(duì)于不同的θ,矩陣元素定義如下[3]:
P(i,j,d,0°)=#{((k,l),(m,n))∈(Ny×Nx)×(Ny×Nx)|(k-m=0,|l-n|=d);
I(k,l)=i,I(m,n)=j}
P(i,j,d,45°)=#{((k,l),(m,n))∈(Ny×Nx)×(Ny×Nx)|(k-m=d,l-n=-d)or(k-m=-d,l-n=d);I(k,l)=i,I(m,n)=j}
P(i,j,d,90°)=#{((k,l),(m,n))∈(Ny×Nx)×(Ny×Nx)|(|k-m|=d,l-n=0);
I(k,l)=i,I(m,n)=j}
P(i,j,d,135°)=#{((k,l),(m,n))∈(Ny×Nx)×(Ny×Nx)|(k-m=d,l-n=d)or(k-m=-d,l-n=-d);I(k,l)=i,I(m,n)=j}
上述式中記號(hào)#{X}表示集合X的元素?cái)?shù)。
為了分析方便,矩陣元素常用概率值表示,即將各元素P(i,j)除以各元素之和S,得到的各元素都是小于1的歸一化值(i,j),即:
(i,j)=P(i,j)/S
由此得到的共生矩陣稱(chēng)為歸一化共生矩陣[3],特征的提取就是在此矩陣上進(jìn)行的。
利用步驟一中預(yù)處理后的圖像,將d設(shè)為1,可以計(jì)算得到在四個(gè)方向的歸一化的灰度共生矩陣l(i,j),(l=1,2,3,4)。
(3) 特征提取
基于灰度共生矩陣提取的紋理特征量有很多種,常用的主要有能量、對(duì)比度、熵、逆差矩和相關(guān)等。本方法用到的特征量主要是逆差矩(Inverse Different Moment)[4],因?yàn)樗从沉藞D像紋理局部變化的多少。其值大則說(shuō)明圖像紋理的不同區(qū)域間缺少變化,局部非常均勻。定義為:
Idm=∑L-1i=0∑L-1j=011+(i-j)2P(i,j)
根據(jù)步驟二中得到的l(i,j),(l=1,2,3,4)計(jì)算4個(gè)方向上的逆差矩,并把它們作為一個(gè)結(jié)果向量。
(4) 最小歐氏距離分類(lèi)
在進(jìn)行分類(lèi)之前首先需要確定各類(lèi)的標(biāo)準(zhǔn)向量,然后計(jì)算結(jié)果向量和標(biāo)準(zhǔn)向量之間的歐氏距離,距離最小的就是半調(diào)圖像所采用的半調(diào)技術(shù)。標(biāo)準(zhǔn)向量通過(guò)計(jì)算80幅圖像的逆差矩特征值,然后計(jì)算每種半調(diào)方法特征向量的平均值得到的。通過(guò)實(shí)驗(yàn),可以算得標(biāo)準(zhǔn)向量如表1所示,在得到標(biāo)準(zhǔn)向量之后就可以對(duì)未知半調(diào)圖像進(jìn)行分類(lèi)。
表1 標(biāo)準(zhǔn)向量
半調(diào)技術(shù)標(biāo)準(zhǔn)向量類(lèi)別代碼
Burkers00.830 80.974 50.624 141
Others0.047 50.992 60.136 10.747 942
Cluster 4×4100.012 1 031
DispersedCL8×8100.011 9032
4 實(shí)驗(yàn)結(jié)果
在實(shí)驗(yàn)中,利用Matlab 7.0.1[5]對(duì)算法進(jìn)行仿真,對(duì)89幅圖像的15種半調(diào)方法進(jìn)行了測(cè)試,其中256大小的圖像40幅,512×512大小的圖像49幅,測(cè)試結(jié)果如表2所示,正確率可以達(dá)到98.35%。
表2 灰度半調(diào)圖像分類(lèi)測(cè)試結(jié)果
半調(diào)技術(shù)Bayer4×4Bayer8×8Cluster4×4Cluster8×8DispersedCL4×4DispersedCL8×8DispersedW8×8DispersedW8×8
所屬類(lèi)別1131213211
測(cè)試數(shù)目8989898989898989
錯(cuò)誤數(shù)目00400200
半調(diào)技術(shù)BurkersFloydJarvisSierraStenvensonStuckiBayerOpt8×8
所屬類(lèi)別41542426421
測(cè)試數(shù)目89898989898989
錯(cuò)誤數(shù)目1630240
參考文獻(xiàn)
[1]Chi Chang Pao,Yu CheSheng.Neural Net Classification and LMS Reconstruction to Halftone Images[J].SPIE,1998:592-602.
[2]Haralick R M.Statistical and Structural Approaches to Texture[J].Proceedings of the IEEE,1979,67(5):786-804.
[3]王耀南,李樹(shù)濤,毛建旭.計(jì)算機(jī)圖像處理與模式識(shí)別技術(shù)[M].北京:高等教育出版社,2000.
[4] Haralick R M,Shanmugam K,Dinstein I,Textural Features for Image Classification[J].IEEE Transactions on Systems,Man and Cybernetics,1973,3:610-621.
[5]徐飛,施曉紅.Matlab應(yīng)用圖像處理.西安:西安電子科技大學(xué)出版社,2002.
[6]章毓晉.圖像工程(上冊(cè))圖像處理和分析[M].北京:清華大學(xué)出版社,2003.
[7]飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡(luò)理論與Matlab 7實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2005.
作者簡(jiǎn)介 范俊杰 男,1983年出生,山西運(yùn)城人,碩士研究生。研究方向?yàn)閳D像處理。
孔月萍 副教授。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文