聶方彥,屠添翼,潘梅森,周慧燦
湖南文理學院 圖形圖像處理技術研究所,湖南 常德415000
圖像分割作為圖像處理后期階段任務的基礎,是計算機視覺研究的重要內(nèi)容之一,在圖像分析、理解和目標檢測、識別與跟蹤中具有重要的意義[1]。把人體目標作為研究對象已成為計算機視覺領域中的一個熱點問題。人體目標分割是智能監(jiān)控、高級人機接口、人體運動分析、人體行為理解等領域的一個先決條件,當前研究主要集中于可見光視覺領域,經(jīng)過十幾年已取得了很大的發(fā)展[2]。
與可見光相比,紅外波長遠超可見光譜,因此具有獨待的成像能力。最近十幾年隨著熱傳感技術的發(fā)展,設備成本急劇降低,紅外(熱)傳感器已廣泛用于各領域,如軍事、交通、安保、醫(yī)學等。由于紅外傳感器本身固有的特點,紅外圖像與可見光圖像相比,普遍存在目標與背景對比度低,目標的邊緣模糊與噪聲較大,分辨細節(jié)能力較差等特點,而且圖像的先驗知識較少,因此紅外圖像的精確分割是比較困難的任務[3]。
目前,專門針對紅外人體圖像分割的文獻還比較少見,把已有的圖像分割算法用于紅外人體圖像分割,由于紅外成像的獨特特點,并不能取得很好的結(jié)果?;诖?,本文提出了一種新的有效的紅外人體圖像分割方法。在廣義熵——Renyi 熵[4]的基礎上定義一種新的模糊熵,也即模糊Renyi 熵,使用窮舉搜索法把這種新的模糊熵用于紅外人體圖像分割,實驗取得了較好的結(jié)果。為了加快最優(yōu)分割閾值的獲取,設計了一種基于混沌理論[5]的模擬退火算法[6],即混沌模擬退火(Chaos Simulated Annealing,CSA)算法用于最優(yōu)分割閾值的選取。實驗表明,本文方法不僅取得了令人滿意的分割結(jié)果,而且也大大降低了紅外人體圖像分割的時間。
一幅大小為m×n,具有L 級灰度的數(shù)字圖像可以表示為I={f(x,y)},這里x=1,2,…,m;y=1,2,…,n;f(x,y)∈{0,1,…,L-1} 。它的歸一化灰度直方圖H={h(l)|l=0,1,…,L-1}可通過下式計算:
其中,nl表示圖像中具有l(wèi) 級灰度的像素數(shù)。應用模糊集理論進行圖像閾值分割時,把數(shù)字圖像看做一個模糊集,這就意味著圖像中目標O 與背景B 的灰度級各具有一個受限于下式的模糊隸屬度函數(shù):
其中,μO、μB分別表示目標、背景的隸屬度函數(shù)。在閾值化時哪類隸屬度函數(shù)值大,就把該灰度級歸類到相應類中。
把一幅圖像映射到一個模糊域,根據(jù)模糊集理論有多種函數(shù)可供選擇,如三角函數(shù)、S-函數(shù)、Z-函數(shù)以及π -函數(shù)等。在本文研究中,選擇S-函數(shù)、Z-函數(shù)作為模糊隸屬度函數(shù),即
這里l 是圖像灰度級,變量a、b、c 是決定模糊區(qū)間形狀的參數(shù),滿足條件0 ≤a ≤b ≤c ≤L-1。當找到一個最佳的模糊區(qū)間(a,b,c)時,最佳分割閾值可用下式計算得到:
應用模糊隸屬度函數(shù)把一幅圖像映射到一個模糊域,即P=(μ(0)h(0),μ(1)h(1),…,μ(L-1)h(L-1)) ,從中分別可得到圖像目標O 與背景B 的分布:
根據(jù)Renyi 熵定義[4],把圖像目標O 與背景B 關于熵指數(shù)α 的模糊Renyi熵定義為:
應用定義的模糊熵進行圖像閾值分割時,根據(jù)Renyi熵的可加性原則,使用最大熵原理[7]求取最佳閾值,即
從第2 章可以看出,用模糊隸屬度函數(shù)把一幅圖像映射到一個模糊域,需要用到三個參數(shù),如果用窮盡方法搜索這三個最佳參數(shù),算法時間復雜度是O(L3),將耗費很長時間。模擬退火算法作為一種優(yōu)秀的數(shù)值優(yōu)化算法,自1983 年提出以來[6],在很多工程領域取得了成功的應用[8-9],為了加快圖像分割算法的收斂速度,研究中采用了模擬退火算法進行最優(yōu)分割閾值的選取。原始模擬退火算法在某些數(shù)值優(yōu)化問題中表現(xiàn)出收斂較慢,且不穩(wěn)定等問題,為了克服這些問題,設計了一種基于混沌理論[5]的模擬退火算法。
混沌(Chaos)是自然界中一種常見的非線性現(xiàn)象?;煦缱兞靠此齐s亂的變化過程其實含有內(nèi)在的規(guī)律性,利用混沌變量的隨機性、遍歷性及規(guī)律性可以進行優(yōu)化搜索。引入混沌序列的搜索算法可在原始模擬退火算法迭代中產(chǎn)生局部最優(yōu)解的許多鄰域點,以此幫助惰性解逃離局部極值點,并快速搜尋到最優(yōu)解?;煦缋碚摚–haos Theory)[5]自1963 年被Edward Lorenz 提出以來,混沌學說在工程科學等領域得到了廣泛的研究[10],近年來有學者把混沌學說引入數(shù)值優(yōu)化問題并取得了很好的結(jié)果[11]。
為了構造混沌模擬退火算法,首先引入著名的一維logistic映射[12]混沌系統(tǒng):
其中,xt表示混沌變量x 在第t 次迭代的值,λ 是分歧參數(shù),一般取λ=4。logistic 映射具有依賴于混沌初始條件的遍歷性、隨機性及敏感性等特性。
混沌模擬退火算法如下所示:
步驟1混沌初始化。初始化混沌變量及最優(yōu)解初值x0。
步驟2初始化模擬退火初始退火溫度Tmax、最小退火溫度Tmin、退火速率β、最大迭代次數(shù)Imax;設置當前退火溫度T=Tmax,迭代計數(shù)器IC=0;設置當前最優(yōu)解x*=x0,當前最優(yōu)評價函數(shù)值f*=f(x*)。
步驟3
while(T >Tmin)do
i.While(IC ≤Imax)do
(1)用混沌擾動方法產(chǎn)生一個滿足條件的新解xnew;
(2)計算各解的評價函數(shù)之間的差值:ΔF*=f(xnew)-f(x*),ΔF=f(xnew)-f(xIC);
(3)如果ΔF*≤0, 更新當前最優(yōu)解及函數(shù)最優(yōu)值:x*=xnew,f*=f(xnew);
(4)如果ΔF ≤0, 更新當前解及函數(shù)值:xIC=xnew,fIC=f(xnew);
(5)如果ΔF >0,以概率exp(-ΔF/T)更新當前解及當前函數(shù)值;
(6)IC=IC+1;
ii.降低退火溫度:T=β×T
步驟4輸出最優(yōu)解。
運用所提出的模糊Renyi 熵結(jié)合設計的混沌模擬退火算法對紅外人體圖像進行分割,首先設置一個混沌變量初值v0,再從v0出發(fā)根據(jù)logistic 映射初始化三個用于對問題解進行擾動的混沌變量(v01,v02,v03)。在此設計中v0i=λ×v0×(1-v0)×rand(),i=1,2,3,rand()是一個介于(0,1)之間的隨機數(shù);求出需處理圖像的最大灰度級gmax及最小灰度級gmin, 生成一個初始解(a0,b0,c0),a0=gmin+(gmax-gmin)×v01,b0和c0也用類似方法產(chǎn)生。用以上方法產(chǎn)生的實驗解并不能保證條件a ≤b ≤c 成立,所以需對產(chǎn)生的混沌解進一步處理,在本文研究中直接對產(chǎn)生的混沌解進行升序排序,然后用排序后的解作為滿足條件的實驗解;評價函數(shù)設置為。具體算法描述如下:
步驟1輸入待處理紅外人體圖像。
步驟2初始模擬退火算法參數(shù),初始混沌變量,生成一個混沌初始解。
步驟3運行混沌模擬退火算法。
步驟4輸出最優(yōu)解。
步驟5根據(jù)式(5)計算最優(yōu)閾值T*。
步驟6用T*對輸入圖像進行閾值分割。
步驟3 中的混沌擾動變量v(t+1)i=λ×vti×(1-vti),i=1,2,3,t 為迭代次數(shù),產(chǎn)生的新解為xnew=(anew,bnew,cnew),
其中anew=gmin+(gmax-gmin)×v(t+1)1,bnew和cnew用類似方法產(chǎn)生,新解生成后再進行升序排序,作為符合條件的解參與迭代運算。
實驗所用計算機配置為Intel?CoreTM2 Duo CPU T8100 2.10 GHz,2 GB 內(nèi)存,編程語言為Matlab(R2007b)。實驗中的紅外圖像取自IEEE OTCBVS WS Series Bench標準紅外人體圖像庫[13]與自拍的紅外人體圖像集。這些圖像集包含有不同季節(jié)、不同環(huán)境條件下拍攝的圖像,如雨、陰、晴、白天及夜視等不同條件。為了比較算法的魯棒性,將提出的方法其他方法與進行了比較。這些方法包括:Kapur 等人提出的最大熵方法[7];Otsu 提出的著名的最大類間方差方法[14];Cheng 等人提出的模糊劃分熵方法[15];Luo等人提出的最大模糊熵方法[16];Sahoo 等人提出的Renyi 熵方法[17]。實驗中混沌模擬退火方法的相關參數(shù)設置如下:Tmax=10,Tmin=0.000 01,β=0.9,v0=0.1;模糊Renyi 熵指數(shù)α經(jīng)過大量實驗驗證,當紅外人體圖像有效灰度級數(shù)小于100時α?。?.1,0.3)之間的值,在其他情況下α取(0.7,0.9)范圍內(nèi)的值能取得較好的分割結(jié)果,在實驗中根據(jù)圖像灰度分布情況分別取α=0.2 或α=0.8;Sahoo 等人提出的Renyi 熵方法中的熵指數(shù)參照文獻[18]取α=0.7。圖1 列出了兩幅典型的實驗圖像,其中圖像(a)的有效灰度級數(shù)是52,圖像(b)的有效灰度級數(shù)是225。
圖1 原始紅外人體圖像
如圖2 為各方法對圖1 中圖像進行閾值分割時獲得的最佳閾值及閾值結(jié)果圖像。
從圖2 可以看出:Otsu 方法對兩幅圖像都不能取得比較好的分割結(jié)果;Kapur及Sahoo 兩種熵方法對圖1(a)的分割結(jié)果比較好,但對圖1(b)較差;Cheng 提出的模糊劃分熵方法對兩幅圖像的分割結(jié)果都不好;Luo 提出的方法對圖1(b)較好,對圖1(a)卻較差;本文的方法對這兩幅圖像的分割都能得到較滿意的結(jié)果。在大量的圖像上進行實驗,結(jié)果表明本文方法得到的分割圖像邊緣較光滑,人體目標能比較好地與背景分離。
圖2 各方法對實驗紅外人體圖像進行分割時獲得的最佳閾值及分割圖像
為了說明所設計的混沌模擬退火算法的搜索性能,用窮盡搜索方法與CSA 方法結(jié)合提出的模糊熵對圖1 中圖像的分割效果進行了比較,如表1 所示。
表1 窮盡法與CSA 方法的性能比較
從表1 可以看出,用混沌模擬退火算法結(jié)合提出的模糊熵對圖像進行分割,得到最佳模糊區(qū)域參數(shù)值與閾值和用窮盡搜索方法得到的最佳模糊區(qū)域參數(shù)值與閾值非常接近,這說明本文提出的混沌模擬退火算法是效的。從圖像分割所需的時間上來說,對圖1(a)而言,窮盡法耗時是CSA 方法的70 倍,對圖1(b)而言,窮盡法耗時是CSA 方法的644 倍。兩圖像的有效灰度級分別為52 與225,因而窮盡法的耗時不同。但對于CSA 方法來說,在256 級圖像灰度級范圍內(nèi)不管圖像的有效灰度級是多少,它的搜索耗時間保持在0.8 s 左右,從這點來說,提出的方法是適合實時處理要求的。
根據(jù)紅外人體圖像特點,提出用模糊Renyi 熵結(jié)合基于混沌理論的模擬退火算法對紅外人體圖像進行閾值分割。將本文方法與幾種著名的圖像閾值分割方法在紅外人體圖像集上進行實驗。實驗結(jié)果證明:提出的方法在對紅外人體圖像進行分割時能得到較理想的結(jié)果,魯棒性優(yōu)于其他幾種方法;此外針對256 級紅外人體灰度圖像,本文方法在CPU 處理時間上僅需0.8 s 左右,從而也滿足了通常情況下的紅外圖像處理實時性要求。
[1] Sezgin M,Sankur B.Survey over image thresholding techniques and quantitative performance evaluation[J].J Electron Imaging,2004,13(1):146-165.
[2] Zhao T,Nevatia R.Bayesian human segmentation in crowded situations[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,Madison,WI,2003,2:459-466.
[3] Fang Y,Yamada K,Ninomiya Y,et al.A shape-independent method for pedestrian detection with far-infrared images[J].IEEE Transactions on Vehicular Technology,2004,53(6):1679-1697.
[4] Renyi A.On measures of entropy and information[C]//Proceedings of the 4th Berkeley Symp on Mathematical Statistics and Probability.California:University of California Press,1961:547-561.
[5] Lorenz E N.Deterministic nonperiodic flow[J].Journal of the Atmospheric Sciences,1963,20:130-141.
[6] Kirkpatrick S,Gelatt C D.Optimization by simulated annealing[J].Sciences,1983,220:671-680.
[7] Kapur J N,Sahoo P K,Wong A K C.A new method for gray-level picture thresholding using the entropy of the histogram[J].Comput Vision Graphics Image Process,1985,29:273-285.
[8] 金杉,麥豐,任波.基于模擬退火算法的資源負載均衡方案[J].計算機工程與應用,2011,47(22):160-163.
[9] 楊衛(wèi)波,王萬良.求解24 數(shù)碼問題的改進遺傳退火算法[J].計算機工程與應用,2011,47(15):9-11.
[10] 張玉金,蔣品群,王文延.基于混沌的雙重變換域數(shù)字圖像擴頻水印算法[J].計算機工程與應用,2011,47(6):188-191.
[11] Ji M,Tang H.Application of chaos in simulated annealing[J].Chaos,Solitons and Fractals,2004,21:933-941.
[12] May R M.Simple mathematical models with very complicated dynamics[J].Nature,1976,261:459-474.
[13] IEEE OTCBVS WS Series Bench[DB/OL].[2011-08-01].http://www.cse.ohio-state.edu/otcbvs-bench/bench.html.
[14] Otsu N.A threshold selection method from gray-level histograms[J].IEEE Trans on Systems Man Cybernet,1979,9(1):62-66.
[15] Cheng H D,Chen J R,Li J.Threshold selection based on fuzzyC-partition entropy approach[J].Pattern Recognition,1998,31(7):857-870.
[16] Luo X,Tian J.ICM method for multi-level thresholding using maximum entropy criterion[C]//Proceedings of Internat Conf on Image Analysis and Processing,1999:108-113.
[17] Sahoo P,Wilkins C,Yeager J.Threshold selection using Renyi’s entropy[J].Pattern Recognition,1997,30(1):71-84.
[18] Sahoo P K,Arora G.A thresholding method based on two-dimensional Renyi’s entropy[J].Pattern Recognition,2004,37:1149-1161.