吳一全,吳加明,占必超
(1.南京航空航天大學(xué)電子信息工程學(xué)院,江蘇南京210016;2.南京大學(xué) 計(jì)算機(jī)軟件新技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,江蘇 南京210093)
閾值分割是使用普遍、處理有效且實(shí)現(xiàn)簡(jiǎn)單的圖像分割技術(shù)。其關(guān)鍵是快速選取合適的閾值以實(shí)現(xiàn)準(zhǔn)確分割。國(guó)內(nèi)外學(xué)者對(duì)此進(jìn)行了大量研究[1-2],提出了基于最大類間方差(Otsu 法)[3]、最大熵[4]、Fisher 準(zhǔn)則[5]等多種類型閾值選取方法。最初都通過(guò)圖像的一維灰度直方圖選取閾值,雖然處理速度快,但圖像受到噪聲干擾時(shí)難以獲得滿意的分割效果。因此,最大熵法、Otsu 法和Fisher 準(zhǔn)則法分別被Abutaleb[6]和Brink[7]、劉健莊[8]、龔堅(jiān)[9]等相繼推廣到灰度級(jí)—鄰域平均灰度級(jí)二維直方圖,效果明顯改善,但同時(shí)運(yùn)算量按指數(shù)增加。故人們又提出了基于二維直方圖的閾值選取快速算法[10-12],不同程度地提高了運(yùn)行速度。但上述二維方法都將二維直方圖分成4 個(gè)矩形區(qū)域(稱之為區(qū)域直分),而這樣會(huì)在計(jì)算中引入近似,導(dǎo)致分割結(jié)果不夠準(zhǔn)確。因此,文獻(xiàn)[13 -15]提出了基于二維直方圖區(qū)域斜分的閾值分割方法,進(jìn)一步減小了誤差,大大縮短了運(yùn)行時(shí)間,且抗噪性更穩(wěn)健。
圖像閾值分割是紅外目標(biāo)檢測(cè)中的關(guān)鍵步驟之一。在紅外目標(biāo)探測(cè)成像平面內(nèi),目標(biāo)與背景的大小之比通常很小,如低于1%.這就要解決目標(biāo)與背景大小之比很小的小目標(biāo)圖像閾值分割問(wèn)題。對(duì)于這一問(wèn)題,現(xiàn)有的閾值選取方法幾乎都失效,得不到理想結(jié)果。當(dāng)目標(biāo)與背景比例相差較大時(shí),將背景的一部分劃分為目標(biāo)反而可能具有更小的類內(nèi)方差或更大的類間方差。因此,Otsu 法和Fisher 準(zhǔn)則法不能準(zhǔn)確地分割小目標(biāo)圖像; 最大熵方法對(duì)小目標(biāo)圖像也不能有效分割。
鑒于以上原因,本文提出了一種基于背景與目標(biāo)面積差和類內(nèi)方差的小目標(biāo)圖像分割閾值選取方法??紤]到準(zhǔn)確分割時(shí),目標(biāo)內(nèi)部和背景內(nèi)部的灰度均勻,類內(nèi)方差很小,再利用小目標(biāo)圖像中目標(biāo)與背景的面積相差很大的特點(diǎn),構(gòu)造準(zhǔn)則函數(shù);在此基礎(chǔ)上,分別給出了基于一維直方圖和二維直方圖區(qū)域直分的閾值選取公式; 然后導(dǎo)出了二維直方圖區(qū)域斜分閾值選取公式及其快速遞推算法; 最后在實(shí)驗(yàn)結(jié)果中,給出了本文方法的閾值分割結(jié)果和運(yùn)行時(shí)間,并與基于二維斜分的Otsu、最大熵及Fisher 閾值選取快速方法進(jìn)行了比較。
Otsu 法根據(jù)最大類間方差或最小類內(nèi)方差選取閾值,實(shí)質(zhì)上是基于誤差平方和最小準(zhǔn)則導(dǎo)出的。該準(zhǔn)則有一個(gè)潛在的問(wèn)題,即當(dāng)不同聚類所包含的樣本個(gè)數(shù)相差較大時(shí),將一個(gè)大的類別分割開反而可能具有更小的誤差平方和。對(duì)于小目標(biāo)圖像,目標(biāo)與背景所占比例相差較大,將背景的一部分劃分為目標(biāo)反而可能具有更小的類內(nèi)方差或更大的類間方差,因此Otsu 法將不能準(zhǔn)確分割。
考慮到準(zhǔn)確分割時(shí),目標(biāo)內(nèi)部和背景內(nèi)部的灰度均勻,數(shù)據(jù)點(diǎn)緊密,類內(nèi)方差很小; 如果再利用小目標(biāo)圖像的目標(biāo)與背景的面積比例很小也即目標(biāo)與背景的面積相差很大的特點(diǎn),將其考慮為閾值選取準(zhǔn)則函數(shù)的一部分,可望提高閾值分割的準(zhǔn)確性。綜合上述2 個(gè)特點(diǎn),本文構(gòu)造了基于背景與目標(biāo)的面積差和類內(nèi)方差的閾值選取準(zhǔn)則函數(shù),從而可有效地分割小目標(biāo)圖像。
設(shè)圖像的尺寸為M×N,灰度級(jí)取0,1,…,L -1,p(i)為灰度級(jí)i 出現(xiàn)的概率?,F(xiàn)用閾值t 劃分為背景類和目標(biāo)類,假設(shè)圖像的亮(暗)像素屬于目標(biāo)(背景)。背景和目標(biāo)的概率分別為ω0(t)、ω1(t),灰度級(jí)均值分別為μ0(t)/ω0(t)、μ1(t)/ω1(t),方差分別為σ20(t)、σ21(t).該準(zhǔn)則函數(shù)的一維形式為
使準(zhǔn)則函數(shù)Φ(t)達(dá)到最大求得最佳閾值:
設(shè)M×N 圖像的灰度級(jí)取0,1,…,L -1,定義像素點(diǎn)(m,n)的鄰域平均灰度級(jí)g(m,n)=,其中D 一般取像素點(diǎn)(m,n)的3 ×3鄰域,W 為D 中的像素點(diǎn)數(shù)。若用r(i,j)表示(灰度級(jí)f,鄰域平均灰度級(jí)g)對(duì)出現(xiàn)的頻數(shù)(0 ≤r(i,j)≤M×N),定義:
則p(i,j)即為圖像的二維直方圖。圖1(a)為原始圖像,圖1(b)為其二維直方圖,閾值向量(t,s)將二維直方圖直分為圖1(c)所示的4 個(gè)區(qū)域。
圖1 圖像二維直方圖及其區(qū)域直分Fig.1 2-D histogram and vertical segmentation
設(shè)背景和目標(biāo)的概率分別為ω0(t,s)、ω1(t,s),灰度級(jí)均值分別為μ0i(t,s)/ω0(t,s)、μ0j(t,s)/ω0(t,s)、μ1i(t,s)/ω1(t,s)、μ1j(t,s)/ω1(t,s),方差分別為σ20i(t,s)、σ20j(t,s)、σ21i(t,s)、σ21j(t,s),則由一維形式推廣,得到基于背景與目標(biāo)面積差和類內(nèi)方差的二維直分閾值選取準(zhǔn)則函數(shù)
使準(zhǔn)則函數(shù)Φ(t,s)達(dá)到最大求得最佳閾值:
此時(shí),分割后的圖像類內(nèi)均勻,目標(biāo)與背景分離度最佳。
分析圖1(b)所示的二維直方圖可見,像素點(diǎn)基本都分布在主對(duì)角線附近,故在圖2中,通過(guò)位于主對(duì)角線兩側(cè)且與其平行的4 條平行斜線L1、L2、L3、L4,將直方圖區(qū)域分成1 個(gè)內(nèi)點(diǎn)區(qū)、2 個(gè)邊界點(diǎn)區(qū)和2 個(gè)噪聲點(diǎn)區(qū):L1 和L2 之間的區(qū)域由于像素灰度級(jí)和鄰域平均灰度級(jí)相近,認(rèn)為是目標(biāo)和背景內(nèi)點(diǎn)區(qū);L1 和L3 之間及L2 和L4 之間的2 個(gè)區(qū)域因像素灰度級(jí)和鄰域平均灰度級(jí)有一定差別,視為目標(biāo)和背景之間過(guò)渡的邊界點(diǎn)區(qū); L3 以外和L4 以外的2 個(gè)區(qū)域由于像素灰度級(jí)和鄰域平均灰度級(jí)相差很大,定為噪聲點(diǎn)區(qū)[14-15]。
圖2 二維直方圖區(qū)域斜分Fig.2 2-D histogram oblique segmentation
斜分是采用與主對(duì)角線垂直(即與灰度級(jí)軸成135°角)的一條斜線段g=-f +2T(T 為閾值,0≤T≤L-1),按灰度級(jí)與鄰域平均灰度級(jí)的平均值進(jìn)行閾值分割,即分割后的二值圖像b(m,n)為
其中,0<T≤L-1.
若背景與目標(biāo)的概率分別為ω0(T)、ω1(T),灰度均值分別為μ0i(t,s)/ω0(t,s)、μ0j(t,s)/ω0(t,s)、μ1i(t,s)/ω1(t,s)、μ1j(t,s)/ω1(t,s),方差分別為σ2oi(T)、σ2oj(T)、σ21i(T)、σ21j(T),則基于背景與目標(biāo)面積差和類內(nèi)方差的二維斜分閾值選取準(zhǔn)則函數(shù)為
若設(shè)總體灰度級(jí)均值為μti和μtj,總體方差σ2為σ2ti和σ2tj,由于斜分情況下總體方差為類內(nèi)方差與類間方差之和,所以(5)式的準(zhǔn)則函數(shù)可改寫為
使準(zhǔn)則函數(shù)Φ(T)達(dá)到最大求得最佳閾值:
從上述算法公式可以看出,計(jì)算Φ(T)需要計(jì)算ω0(T)和ω1(T)、μ0i(T)和μ0j(T)、μti和μtj、σ2ti和對(duì)于同一幅圖像,μti和μtj、σ2ti和σ2tj是固定的。對(duì)于每一個(gè)閾值T,如果每次計(jì)算Φ(T)都重新從i=0,j=0 開始累加計(jì)算ω0(T)、μ0i(T)、μ0j(T),勢(shì)必造成大量的重復(fù)計(jì)算,而且計(jì)算復(fù)雜性都為o(L2),而共有L-1 個(gè)閾值T,從而使總的計(jì)算復(fù)雜性達(dá)到o(L3).
0<T≤L/2 -1 時(shí),遞推公式推導(dǎo)如下:
同理可以得到L/2≤T≤L-1 時(shí)的遞推公式。
根據(jù)上述遞推公式,每計(jì)算一次Φ(T)都勿需重新計(jì)算ω0(2T)、μ0i(2T)、μ0j(2T),只要分別利用前面得到的ω0(2T -1)、μ0i(2T -1)、μ0j(2T -1),再加上直線段g=-f +2T 上各點(diǎn)相應(yīng)的值即可。這樣就只要分別在T =0,1,…,L -1 范圍內(nèi)搜索。計(jì)算μ0i、μ0j需要次乘法,而對(duì)于每一個(gè)T,計(jì)算準(zhǔn)則函數(shù)需要8 次乘法,所以總的計(jì)算復(fù)雜性為2L2+16L~o(L2).而發(fā)現(xiàn)對(duì)于ω0(2T)、μ0i(2T)、μ0j(2T)及ω0(2T-1)、μ0i(2T-1)、μ0j(2T -1)可以只用3 個(gè)存儲(chǔ)單元來(lái)存儲(chǔ),而不用把對(duì)應(yīng)每個(gè)T 的值都存起來(lái),只要在累加時(shí)往上加即可,大大減少了存儲(chǔ)空間。
上述算法流程圖如圖3所示。
圖3 算法流程圖Fig.3 Flowchart of the algorithm
本文進(jìn)行了大量實(shí)驗(yàn),現(xiàn)舉一例說(shuō)明。圖4分別給出了基于一維直方圖、二維直方圖區(qū)域直分以及斜分的本文方法對(duì)同一幅艦船圖像進(jìn)行閾值分割的結(jié)果。其中圖4(a)為原始艦船圖像,大小為155 像素×154 像素,圖4(b)為基于一維直方圖的分割結(jié)果,圖4(c)為基于二維直方圖區(qū)域直分的分割結(jié)果,圖4(d)為基于二維直方圖區(qū)域斜分的分割結(jié)果。可以看出,本文方法不僅能夠準(zhǔn)確地提取目標(biāo),而且二維方法的抗噪性較好,特別是基于二維直方圖斜分方法的抗噪性更為穩(wěn)健。
圖4 本文方法的分割結(jié)果Fig.4 Segmentation results of different methods
表1 4 種方法的分割結(jié)果Tab.1 Segmentation results of four methods
針對(duì)200 多幅各類較小目標(biāo)圖像進(jìn)行了實(shí)驗(yàn)?,F(xiàn)選取其中5 幅圖像加以說(shuō)明。其中目標(biāo)都是飛行器,但其與紅外成像平面的遠(yuǎn)近距離不同。下面分別給出本文方法與基于二維直方圖區(qū)域斜分的Otsu法、最大熵方法、Fisher 準(zhǔn)則法的分割結(jié)果。如表1所示,從上到下分別為圖像1~圖像5,每一行從左到右依次為原始圖像、一維直方圖及Otsu 方法、最大熵方法、Fisher 方法、本文方法的分割結(jié)果。圖像1的大小為322 像素×221 像素,目標(biāo)與背景大小比例為6.8%,雖然4 種方法都能將目標(biāo)分割出來(lái),但本文方法去噪性更好;圖像2、圖像3 的大小分別為323 像素×217 像素和256 像素×256 像素,目標(biāo)與背景大小比例分別為4.2% 和3.9%,Otsu 法和Fisher 方法此時(shí)已不能有效分割,最大熵方法雖然能分割出來(lái),但仍存在噪聲;圖像4 的大小為104 像素×90 像素,目標(biāo)與背景大小比例為0.43%,此時(shí)Otsu 法和Fisher 方法已基本失效,最大熵方法分割結(jié)果的噪聲變大,失去準(zhǔn)確性,而唯有本文方法能較準(zhǔn)確地將小目標(biāo)分割出來(lái),相對(duì)其它分割方法,其噪聲已達(dá)最小,且分割結(jié)果滿足要求; 圖像5 的大小為106 像素×94 像素,目標(biāo)與背景大小比例為0.18%,分割效果與圖像4 類似,進(jìn)一步體現(xiàn)了本文方法分割小目標(biāo)圖像的優(yōu)越性。
實(shí)驗(yàn)是在Intel Pentium 4 CPU 2.80 GHz/512 MB 內(nèi)存/Matlab 7.1 的計(jì)算機(jī)環(huán)境中進(jìn)行的。表1中4 種方法的分割閾值及運(yùn)行時(shí)間如表2所示,表2中的百分比表示目標(biāo)與背景大小比例。
表2 4 種方法的閾值及運(yùn)行時(shí)間Tab.2 Threshold and running time of four methods
從表2中可以看出,對(duì)于每幅圖像,Otsu 方法的運(yùn)行時(shí)間最短,但其在小目標(biāo)圖像分割中,效果最差;最大熵方法分割效果優(yōu)于Otsu 方法,但因涉及對(duì)數(shù)運(yùn)算其運(yùn)行時(shí)間最長(zhǎng); Fisher 方法分割效果略好于Otsu 方法,但仍然較差,而且運(yùn)行時(shí)間也比Otsu方法長(zhǎng);本文方法分割效果最佳,能準(zhǔn)確地分割出小目標(biāo),運(yùn)行時(shí)間僅比Otsu 方法稍長(zhǎng),少于Fisher方法和最大熵方法。
本文提出的基于背景與目標(biāo)面積差和類內(nèi)方差的圖像分割閾值選取方法,可有效地分割目標(biāo)與背景大小之比很小的小目標(biāo)圖像。大量實(shí)驗(yàn)結(jié)果表明:該方法能使分割后圖像中的目標(biāo)和背景區(qū)域內(nèi)部均勻,邊界形狀準(zhǔn)確;基于二維斜分方法的抗噪性優(yōu)于一維和二維直分方法; 所用的二維直方圖區(qū)域斜分快速遞推算法,降低了二維空間搜索的代價(jià),大大提高了運(yùn)行速度; 與目前性能較優(yōu)越的基于二維斜分的Otsu、最大熵及Fisher 準(zhǔn)則圖像分割閾值選取快速方法相比,本文方法在小目標(biāo)圖像分割效果上具有極為明顯的優(yōu)勢(shì)。
References)
[1]吳一全,朱兆達(dá).圖像處理中閾值選取方法30年(1962—1992)的進(jìn)展(一)[J].數(shù)據(jù)采集與處理,1993,8(3): 193 -201.WU Yi-quan,ZHU Zhao-da.30 years (1962—1992)of the developments in the threshold selection methods in image processing(Ⅰ)[J].Journal of Data Acquisition & Processing,1993,8(3):193 -201.(in Chinese)
[2]吳一全,朱兆達(dá).圖像處理中閾值選取方法30年(1962—1992)的進(jìn)展(二)[J].數(shù)據(jù)采集與處理,1993,8(4): 268 -282.WU Yi-Quan,ZHU Zhao-da.30 years(1962—1992)of the developments in the threshold selection methods in image processing(Ⅱ)[J].Journal of Data Acquisition & Processing,1993,8(4):268 -282.(in Chinese)
[3]Otsu N.A threshold selection method from gray-level histogram[J].IEEE Transactions System Man and Cybernetics,1979,9(1):62 -66.
[4]Kapur J N,Sahoo P K,Wong A K C.A new method for grey-level picture thresholding using the entropy of the histogram[J].Computer Vision,Graphics and Image Processing,1985,29(1): 273-285.
[5]陳果.圖像閾值分割的Fisher 準(zhǔn)則函數(shù)法[J].儀器儀表學(xué)報(bào),2003,24(6):564 -567.CHEN Guo.The Fisher criterion function method of image thresholding[J].Chinese Journal of Scientific Instrument,2003,24(6):564 -567.(in Chinese)
[6]Abutaleb A S.Automatic thresholding of gray-level picture using two-dimensional entropies[J].Pattern Recognition,1989,47(1):22 -32.
[7]Brink A D.Thresholding of digital image using two-dimensional entropies[J].Pattern Recognition,1992,25(8):803 -808.
[8]劉健莊,栗文青.灰度圖像的二維Otsu 自動(dòng)閾值分割法[J].自動(dòng)化學(xué)報(bào),1993,19(1):101 -105.LIU Jian-zhuang,LI Wen-qing.Automatic thresholding using the Otsu algorithm based on the two-dimensional gray image[J].Acta Automatica Sinica,1993,19(1):101 - 105.(in Chinese)
[9]龔堅(jiān),李立源,陳維南.基于二維灰度直方圖Fisher 線性分割的圖像分割方法[J].模式識(shí)別與人工智能,1997,10(1):1 -8.GONG Jian,LI Li-yuan,CHEN Wei-nan.The gray-level thresholding method based on Fisher linear discriminant of two-dimensional histogram[J].Pattern Recognition and Artificial Intelligence,1997,10(1):1 -8.(in Chinese)
[10]Gong J,Li L Y,Chen W N.Fast recursive algorithms for two-dimensional thresholding[J].Pattern Recognition,1998,31(3):295 -300.
[11]景曉軍,蔡安妮,孫景鰲.一種基于二維最大類間方差的圖像分割算法[J].通信學(xué)報(bào),2001,22(4):71 -76.JING Xiao-jun,CAI An-ni,SUN Jing-ao.Image segmentation based on 2D maximum between-cluster variance[J].Journal of China Institute of Communications,2001,22(4):71 -76.(in Chinese)
[12]汪海洋,潘德爐,夏德深.二維Otsu 自適應(yīng)閾值選取算法的快速實(shí)現(xiàn)[J].自動(dòng)化學(xué)報(bào),2007,33(9):968 -971.WANG Hai-yang,PAN De-lu,XIA De-shen.A fast algorithm for two-dimensional Otsu adaptive threshold algorithm[J].Acta Automatica Sinica,2007,33(9):968 -971.(in Chinese)
[13]范九倫,趙鳳.灰度圖像的二維Otsu 曲線閾值分割法[J].電子學(xué)報(bào),2007,35(4):751 -755.FAN Jiu-lun,ZHAO Feng.Two-dimensional Otsu curve thresholding segmentation method for gray-level images[J].Acta Automatica Sinica,2007,35(4):751 -755.(in Chinese)
[14]吳一全,潘喆,吳文怡.二維直方圖區(qū)域斜分閾值分割及快速遞推算法[J].通信學(xué)報(bào),2008,29(4):77 -83.WU Yi-quan,PAN Zhe,WU Wen-yi.Image thresholding based on two-dimensional histogram oblique segmentation and its fast recurring algorithm[J].Journal of China Institute of Communications,2008,29(4):77 -83.(in Chinese)
[15]吳一全,潘喆,吳文怡.二維直方圖區(qū)域斜分的最大熵閾值分割算法[J].模式識(shí)別與人工智能,2009,22(1): 162 -168.WU Yi-quan,PAN Zhe,WU Wen-yi.Maximum entropy thresholding algorithm based on two-dimensional histogram oblique segmentation[J].Pattern Recognition and Artificial Intelligence,2009,22(1):162 -168.(in Chinese)