李斐朱曉磊
(1. 山東建筑大學(xué)信息與電氣工程學(xué)院,山東 濟(jì)南 250101;2. 山東建筑大學(xué)山東省智能建筑技術(shù)重點(diǎn)實(shí)驗(yàn)室,山東 濟(jì)南 250101;3. 積成電子股份有限公司,山東 濟(jì)南 250100)
圖像分割是指根據(jù)目標(biāo)與背景的先驗(yàn)知識(shí),將圖像劃分為某些特性上相近的連通區(qū)域的集合,通常為模式識(shí)別、圖像理解、圖像壓縮等應(yīng)用的基礎(chǔ)準(zhǔn)備,是從圖像處理到圖像分析的關(guān)鍵步驟[1]。 目前,自動(dòng)化的圖像分割主要基于邊緣和區(qū)域的方法。由于每種方法具有不同特點(diǎn),故適用于不同類型的圖像。 其中,基于圖像灰度的閾值分割方法屬于后者,是一種最為簡(jiǎn)單有效的分割方法,根據(jù)圖像灰度的相似性,直接得到劃分好的區(qū)域。 閾值分割的前提是圖像中要提取的目標(biāo)物與其背景在灰度特性存在差異,具有了不同的灰度值區(qū)域。 圖像的閾值個(gè)數(shù)由具體的劃分程度要求決定,單域值可以簡(jiǎn)單地將圖像劃分為兩個(gè)區(qū)域,當(dāng)實(shí)際應(yīng)用中需要將圖像劃分為多個(gè)目標(biāo)區(qū)域時(shí),需要多個(gè)分割閾值。 傳統(tǒng)的閾值分割算法,通過(guò)窮舉法遍歷所有灰度值尋找最優(yōu)閾值,其耗時(shí)較長(zhǎng),特別是當(dāng)利用閾值分割算法進(jìn)行多閾值分割時(shí),計(jì)算法復(fù)雜度隨閾值個(gè)數(shù)呈指數(shù)級(jí)增長(zhǎng),因此需要更加高效和智能的閾值尋找方法。
元啟發(fā)式算法于20 世紀(jì)60 年代提出,利用仿生學(xué)原理,模擬生物或自然現(xiàn)象中群體移動(dòng)和定位的行為機(jī)制進(jìn)行目標(biāo)函數(shù)優(yōu)化,具有計(jì)算量低、優(yōu)化效率高和自我調(diào)節(jié)等優(yōu)點(diǎn),已在解決非確定性多項(xiàng)式困難(Nondeterministic Polynomial-h(huán)ard,NPH)、組合優(yōu)化等問(wèn)題上取得廣泛的應(yīng)用。 元啟發(fā)式算法也已用于圖像的多閾值選擇問(wèn)題上。 閾值處理可視為一種統(tǒng)計(jì)決策問(wèn)題,常用的統(tǒng)計(jì)鑒別分析中的測(cè)度有最大類間方差和信息熵,呂鑫等[2]結(jié)合鳥(niǎo)群算法中飛行行為的思想優(yōu)化麻雀搜索算法,提出改進(jìn)麻雀搜索算法(Improved Sparrow Search Algorithm,ISSA),提高算法的搜索能力和開(kāi)拓能力,獲得更好的全局最優(yōu)值,同時(shí)將最大類間方差和Kapur 熵作為ISSA 的目標(biāo)函數(shù)進(jìn)行圖像的多閾值尋優(yōu),得到更加穩(wěn)定高效的分割性能;常君杰等[3]在烏鴉算法中引入Levy 飛行機(jī)制,提高全局搜索能力,并采用自適應(yīng)尺度調(diào)整系數(shù)限制Levy 飛行的搜索范圍,加快尋優(yōu)速度,改善了二維Tsallis 熵多閾值圖像分割計(jì)算量大的問(wèn)題;賈鶴鳴等[4]采用Kent 混沌映射初始化螢火蟲(chóng)算法,并利用改進(jìn)后的優(yōu)化算法優(yōu)化了二維Renyi 熵函數(shù)中的變量,分割了復(fù)雜環(huán)境中的污油圖像,提高了圖像分割的準(zhǔn)確度;霍星等[5]提出一種新的天牛須算法(Antennae Search Algorithm,BAS)進(jìn)行二維K 熵下圖像的多閾值分割,將原始BAS 算法拓展為二進(jìn)制離散形式并將其作為輔助算法與BAS 結(jié)合,解決了BAS 易陷入局部最優(yōu)的不足。 基于二維灰度直方圖的方法比基于一維灰度直方圖的方法計(jì)算更加復(fù)雜。 灰狼算法(Grey Wolf Optimizer,GWO)是MIRJALILI 等[6]提出的一種新型元啟發(fā)式算法,其算法簡(jiǎn)單、參數(shù)少、易實(shí)現(xiàn),具有良好的搜索和開(kāi)發(fā)能力,已廣泛應(yīng)用在工程調(diào)度[7]、頻譜分配[8]、圖像分割等領(lǐng)域。 劉磊等[9]提出一種改進(jìn)的灰狼算法(Improved Grey Wolf Optimizer,IGWO),在搜索過(guò)程引入萊維飛行機(jī)制,避免陷入局部極值;動(dòng)態(tài)調(diào)整收斂因子和隨機(jī)權(quán)重以提高搜索精度,在Otsu 測(cè)度下取得了優(yōu)秀的圖像多閾值分割結(jié)果,在這一算法中,灰狼的社會(huì)等級(jí)劃分是固定不變的,一定程度上限制了算法的收斂性能。
綜上所述,層出不窮的元啟發(fā)式算法在處理圖像多閾值分割問(wèn)題上各有優(yōu)勢(shì),并且在有效改進(jìn)策略下優(yōu)化性能顯著提升。 為充分利用灰狼算法良好的搜索能力并進(jìn)一步提升算法的收斂速度和計(jì)算精度,文章提出融合多種策略的灰狼算法(Grey Wolf Optimizer Fused With Multiple Strategies,MSGWO),對(duì)復(fù)雜圖像和多目標(biāo)圖像開(kāi)展了Renyi 熵多閾值分割;提出動(dòng)態(tài)搜索策略,動(dòng)態(tài)調(diào)整迭代初期和后期的頭狼等級(jí)劃分方式,對(duì)個(gè)體位置更新范圍進(jìn)行前期擴(kuò)展和后期壓縮,加快尋優(yōu)速度,克服迭代后期易陷于局部極值的缺陷。 采用所提算法與其他幾種元啟發(fā)式算法進(jìn)行標(biāo)準(zhǔn)圖像的多閾值分割實(shí)驗(yàn),通過(guò)對(duì)比迭代曲線、峰值信噪比和特征相似度,證明所提算法的優(yōu)勢(shì)。
Renyi 熵是香農(nóng)熵的推廣,在香農(nóng)熵基礎(chǔ)上引入階參數(shù)α,對(duì)信息的度量更加靈活和具有一般性[10]。 假設(shè)N個(gè)離散隨機(jī)變量X具有概率分布{pk},k為隨機(jī)變量編號(hào),k=1,2,…,N,其α階Renyi 熵形式由式(1)表示為
基于Renyi 熵的多閾值圖像分割原理為:假設(shè)大小為m×n的灰度圖像記為f(x,y)(1≤x≤m,1≤y≤n),其灰度級(jí)數(shù)為L(zhǎng),希望將圖像分割為K個(gè)目標(biāo)區(qū)域,則需要選取D=K-1 個(gè)閾值t1,t2,…,tK-1。此時(shí)圖像的Renyi 熵由式(2)表示為
熵衡量了系統(tǒng)的不確定性或平均信息量,閾值分割希望每個(gè)分割后的區(qū)域內(nèi)部的灰度是相近的,目標(biāo)和背景的信息量最大,因此閾值分割的目標(biāo)函數(shù)為最大化各個(gè)區(qū)域的Renyi 熵,由式(3)表示為
灰狼算法(GWO)是一種新型的元啟發(fā)式智能優(yōu)化算法,通過(guò)模擬灰狼的社會(huì)階層結(jié)構(gòu)和狩獵行為從而尋找適應(yīng)函數(shù)的最優(yōu)解。 根據(jù)分配任務(wù)的不同,將個(gè)體分成頭狼、探狼、猛狼,個(gè)體間互相協(xié)助、共享信息、協(xié)同完成覓食任務(wù)。 狼群算法通過(guò)對(duì)當(dāng)前群體施加游走、奔襲、圍攻3 種智能行為捕獲獵物,從而使群體進(jìn)化到接近最優(yōu)解的狀態(tài)。 GWO 算法具有良好的廣度開(kāi)拓和深度開(kāi)采能力且算法設(shè)計(jì)簡(jiǎn)單,其初始參數(shù)較少、收斂速度較快。
狼群的社會(huì)等級(jí)分為4 級(jí)。 狩獵過(guò)程中,離獵物最近的3 只狼記為α、β和δ狼,其社會(huì)地位最高,其他狼群則記為ω狼,在α、β和δ狼的引領(lǐng)下更新自己的位置。 狼的社會(huì)地位并非一成不變,每次位置更新后,狼群將進(jìn)行一次優(yōu)勝劣汰,α、β和δ狼隨之更新為當(dāng)前3 個(gè)最優(yōu)的解,其他候選解ω狼不斷向群體中的3 個(gè)最優(yōu)解移動(dòng)。 算法的數(shù)學(xué)模型描述如下:
追蹤獵物過(guò)程,首先計(jì)算當(dāng)前灰狼與α、β和δ狼之間的距離和,由式(8)表示為
ω狼的位置更新由式(9)表示為
最終ω狼個(gè)體移動(dòng)后的新位置由式(10)表示為
如式(6)所示的a是收斂因子,按照迭代次數(shù)線性遞減,該因子決定了個(gè)體更新的幅度。 而線性變化的振幅并不能很好地適應(yīng)尋優(yōu)過(guò)程,可能導(dǎo)致收斂速度較慢。 分析迭代過(guò)程,在初期的隨機(jī)分布位置下,大部分個(gè)體距離最優(yōu)點(diǎn)可能較遠(yuǎn),需要更大的步長(zhǎng)以便快速靠攏最優(yōu)位置,在迭代后期,距離最優(yōu)位置已經(jīng)比較接近,更小的更新幅度適合局部精細(xì)查找,避免出現(xiàn)最優(yōu)位置附近的震蕩,從而加速收斂、提高算法精度。 為此,文章提出一種變化幅度由大到小的非線性振幅調(diào)節(jié)因子,由式(11)表示為
式中t為當(dāng)前迭代次數(shù);M為最大迭代上限。
灰狼算法將狼群分為α、β、δ和ω等4 個(gè)等級(jí),每次迭代中α、β、δ狼對(duì)應(yīng)前3 個(gè)最優(yōu)解,引領(lǐng)種群中其他個(gè)體ω進(jìn)化。 文獻(xiàn)[11]提出了3 個(gè)等級(jí)的改進(jìn)灰狼算法,將狼群的最低2 個(gè)等級(jí)合并為一組,以降低計(jì)算復(fù)雜度,加快收斂。 在新型元啟發(fā)算法黑猩猩算法[12]中,個(gè)體的更新步驟與灰狼算法類似,不同的是個(gè)體的位置更新是同時(shí)向驅(qū)趕者、攔截者、追逐者和狩獵者4 類黑猩猩的當(dāng)前位置靠攏。在此啟發(fā)下,文章提出一種自適應(yīng)探索策略,改進(jìn)灰狼算法。
縱觀整個(gè)迭代過(guò)程,雖然在求解過(guò)程中事先并不知道最優(yōu)解的位置,但隨著狼群開(kāi)發(fā)和探索,種群的位置是逐步向最優(yōu)解的位置靠攏的,種群的更新也是逐步細(xì)化的。 始終選取α、β、δ3 個(gè)最優(yōu)解位置作為更新方向,并不適應(yīng)從粗到細(xì)的更新變化,因此文章考慮采用動(dòng)態(tài)探索策略,在迭代的初期和末期,采用不同的等級(jí)劃分方法。 初期階段,狼群距離最優(yōu)解位置可能較遠(yuǎn),即便跟隨3 個(gè)最優(yōu)解進(jìn)行位置更新,個(gè)體也是從大方向上向獵物靠攏,此階段所有個(gè)體均距離獵物較遠(yuǎn),可以將4 個(gè)最優(yōu)解記為γ狼,與α、β、δ狼共同帶領(lǐng)其他個(gè)體進(jìn)行位置更新,個(gè)體位置更新的落點(diǎn)由3 個(gè)最優(yōu)解包圍的范圍擴(kuò)展到4個(gè)最優(yōu)解包圍的范圍,加大了前期搜索的范圍。 經(jīng)過(guò)多輪迭代后,狼群已經(jīng)發(fā)現(xiàn)獵物并聚集在其附近,此時(shí)狼群與獵物之間的距離比較近,適當(dāng)收縮更新位置落點(diǎn)范圍,以便個(gè)體進(jìn)行精細(xì)位置更新,減少計(jì)算復(fù)雜度,在迭代后期,將帶領(lǐng)等級(jí)減小到兩個(gè),即只保留α、β狼2 個(gè)高級(jí)等級(jí),其他狼均劃為ω狼等級(jí)。
自適應(yīng)探索過(guò)程的狼群位置更新過(guò)程如下,首先引入距離獵物最近的排名第4 的個(gè)體記為γ狼,社會(huì)等級(jí)位于ω狼之上,計(jì)算個(gè)體與其之間的距離,并以γ狼為引導(dǎo),個(gè)體向其靠攏,由式(12)和(13)表示為
式中t為當(dāng)前迭代次數(shù);為第i個(gè)個(gè)體的更新位置;d(t) 為當(dāng)前最優(yōu)解位置與上次迭代的最優(yōu)解的歐氏距離;和分別為解空間的上、下限。用最優(yōu)解距離變化為標(biāo)準(zhǔn),當(dāng)變化大于空間最大距離的0.01 時(shí),說(shuō)明該個(gè)體距離獵物還較遠(yuǎn),取距離獵物最近的前4 個(gè)最優(yōu)解為引領(lǐng),擴(kuò)大了其他個(gè)體的位置落點(diǎn)范圍;反之,說(shuō)明該個(gè)體距離獵物較近,取距離獵物最近的前兩個(gè)最優(yōu)解為引領(lǐng),其他個(gè)體均作為ω狼,在收縮的較小落點(diǎn)范圍內(nèi)進(jìn)行精細(xì)更新。
為了避免在尋優(yōu)的過(guò)程中個(gè)體陷入局部極值的問(wèn)題,在迭代過(guò)程中引入個(gè)體的柯西變異機(jī)制,增大狼群對(duì)全局的探索能力。 標(biāo)準(zhǔn)柯西分布比標(biāo)準(zhǔn)高斯分布更加矮寬,具有更大的拖尾,因此容易產(chǎn)生更大的擾動(dòng)能力,個(gè)體按照柯西分布隨機(jī)產(chǎn)生較大擾動(dòng),變異公式由式(15)表示為
利用Renyi 熵最大化作為圖像分割的目標(biāo)函數(shù),優(yōu)化算法通常以尋找最小值為優(yōu)化目標(biāo),因此取Renyi 熵的負(fù)值為優(yōu)化的適應(yīng)度函數(shù)。 多策略融合灰狼算法下的多閾值圖像分割流程圖如圖1所示。
圖1 多策略融合灰狼算法下的多閾值圖像分割流程圖
為驗(yàn)證文章提出的多閾值分割算法的有效性,選取灰度級(jí)為256 的標(biāo)準(zhǔn)測(cè)試圖像Lena、cameraman和peppers 作為多目標(biāo)分割對(duì)象,進(jìn)行不同閾值數(shù)量下的分割。 同時(shí),為了說(shuō)明融合策略灰狼優(yōu)化算法的尋優(yōu)效果,選取原始灰狼算法、正弦余弦算法(Sine Cosine Algorithm,SCA)[13]、 蜻蜓算法(Dragonfly Algorithm,DA)[14]、以及新型元啟發(fā)式算法的改進(jìn)——麻雀搜索算法(ISSA)[2]和改進(jìn)灰狼優(yōu)化算法(IGWO)[9]作為對(duì)比。
設(shè)置所有的優(yōu)化算法種群數(shù)為20,最大迭代次數(shù)為200,個(gè)體每個(gè)維度的取值范圍為[0,255]。 所有算法的初始化時(shí)隨機(jī)生成,實(shí)驗(yàn)結(jié)果取重復(fù)20 次實(shí)驗(yàn)的均值。 衡量分割的指標(biāo)采用峰值信噪比(Peak Signal-to-Noise Ratio,PSNR),記作P。 通常,P值越大,圖像的分割效果越好。 計(jì)算公式由式(16)表示為
式中f(i,j) 為原始圖像;g(i,j) 為分割圖像;m和n分別為圖像的長(zhǎng)和寬。
此外,特征相似性(Feature Similarity,F(xiàn)SIM),記作F,也是衡量圖像分割效果的有效指標(biāo),通過(guò)相位一致(Phase Congruency,PC) 特征和梯度幅度(Gradient Magnitude,GM)的耦合評(píng)估原始圖像與分割圖像的相似度,計(jì)算公式由式(17)表示為
式中Ω 為整個(gè)圖像空間;x為二維圖像中的像素坐標(biāo);SL(x) 為相位一致特征與梯度幅度在x處的融合相似度;PCm(x) 為原始圖像與分割圖像的在x處的相位一致特征的最大值,關(guān)于該指標(biāo)的具體描述可見(jiàn)參考文獻(xiàn)[15];F取值在[0,1],越接近1,圖像越相似。
為說(shuō)明多策略融合灰狼算法改進(jìn)的有效性,考查每種改進(jìn)單獨(dú)作用與原始灰狼算法以及MSGWO的迭代過(guò)程對(duì)比。 以Lena 圖像的3 閾值分割為例,其迭代曲線如圖2 所示。
圖2 GWO 改進(jìn)方法效果對(duì)比圖
由圖2 可見(jiàn),每一種改進(jìn)方式單獨(dú)作用在GWO時(shí),幾乎都會(huì)產(chǎn)生更加低的適應(yīng)度函數(shù)值,除了自適應(yīng)搜索方法在迭代次數(shù)30 附近有個(gè)別位置遜于原始GWO,但是后續(xù)該曲線迅速收斂到GWO 對(duì)應(yīng)的黑色實(shí)線之下。 整體上看,3 種改進(jìn)策略的MSGWO表現(xiàn)最佳,收斂速度最快且精度也最高,說(shuō)明改進(jìn)策略的有效性。
選取不同閾值個(gè)數(shù),采用MSGWO 對(duì)3 幅標(biāo)準(zhǔn)圖像的分割結(jié)果如圖3 所示。
圖3 文章算法對(duì)Lena、cameraman 和peppers 的不同閾值下的分割結(jié)果圖
第一列圖像為原始圖像,第2 到5 列是閾值個(gè)數(shù)分別為2、3、5 和6 等4 種情況的分割圖像。 其分割結(jié)果直觀地反映了隨著閾值的增加,圖像細(xì)節(jié)越豐富,則信息越完整,由此也看出多閾值分割的必要性。
為觀察算法的精度和收斂性,對(duì)比文章算法與其他元啟發(fā)式算法的迭代過(guò)程。 選取3 幅標(biāo)準(zhǔn)圖像進(jìn)行6 閾值的分割,以最小化負(fù)的Renyi 熵為優(yōu)化目標(biāo),迭代過(guò)程曲線如圖4 所示。
圖4 迭代過(guò)程曲線圖
觀察3 幅曲線圖,從迭代過(guò)程上看,改進(jìn)后的優(yōu)化算法普遍比原始優(yōu)化算法的收斂性好。 從迭代結(jié)果可知,改進(jìn)算法的精度也普遍優(yōu)于原始算法,其中DA 算法的精度有時(shí)優(yōu)于部分改進(jìn)算法,但整體收斂較慢; MSGWO 和ISSA 為精度最好的兩個(gè)算法,而MSGWO 相比于ISSA 的優(yōu)勢(shì)在于其快速的收斂性,這一點(diǎn)在迭代初期表現(xiàn)很明顯,MSGWO 的曲線明顯地處于最低位置。 以Lena 圖像為例,ISSA 的迭代曲線收斂也很迅速,在迭代60 次后達(dá)到-22.72 bit的最小適應(yīng)度值,而收斂到相同適應(yīng)度值,MSGWO 僅需迭代15 次,迭代次數(shù)節(jié)省75%;cameraman 圖像中,ISSA 迭代49 次收斂到最小適應(yīng)度值-24.65 bit,MSGWO 僅用10 次,迭代次數(shù)節(jié)省82.1%;peppers 圖片中,ISSA56 次收斂到最小適應(yīng)度值-20.56 bit,MSGWO 僅用36 次,迭代次數(shù)節(jié)省35.7%;迭代次數(shù)平均可減少64.3%。 因此,MSGWO是收斂速度快且精度高的多閾值求解方法。
為更加客觀地對(duì)比幾種元啟發(fā)式算法在多閾值圖像分割上的性能,將4.3 節(jié)中精度較高的3 種算法——ISSA、IGWO、GWO 和所提算法MSGWO 進(jìn)行峰值信噪比和特征相似性指標(biāo)的對(duì)比,分別用3 和6 閾值對(duì)3 幅標(biāo)準(zhǔn)圖像多閾值分割,兩項(xiàng)指標(biāo)的統(tǒng)計(jì)見(jiàn)表1。
表1 峰值信噪比和特征相似性指標(biāo)統(tǒng)計(jì)表
觀察表中數(shù)據(jù),峰值信噪比和特征相似性指標(biāo)并非完全分布一致,因?yàn)榉逯敌旁氡葐渭冇?jì)算圖像灰度值差異,而特征相似性結(jié)合相位一致性和梯度的特征,可以描述圖像中的感興趣區(qū)域,往往認(rèn)為其是比峰值信噪比更好的圖像相似性評(píng)價(jià)指標(biāo),MSGWO 可以取得至少一個(gè)指標(biāo)下的最高分,不失為一種穩(wěn)定優(yōu)質(zhì)的多閾值分割方法。
通過(guò)上述研究可知:
(1) 通過(guò)消融實(shí)驗(yàn),在灰狼算法上單獨(dú)實(shí)施了3 種改進(jìn)措施,即非線性收斂因子、自適應(yīng)搜索機(jī)制和柯西變異。 其均提高了灰狼算法的收斂性和精度,3 種改進(jìn)策略融合可以實(shí)現(xiàn)優(yōu)勢(shì)疊加,得到更高的收斂性和精度。 表明文章提出對(duì)灰狼算法的3 種融合改進(jìn)策略可以有效提高收斂性和精度。
(2) 多閾值分割對(duì)比了MSGWO 與其他新型元啟發(fā)式算法。 從分割結(jié)果上看,MSGWO 可取得峰值信噪比和特征相似性中至少一項(xiàng)指標(biāo)的最高分,分割精度高。 從分割過(guò)程看,MSGWO 具有更加快速的收斂性,達(dá)到與次優(yōu)算法相同的最小收斂值,MSGWO 的迭代次數(shù)平均可節(jié)省64.3%。