楊晟院,劉祥波,曾笑云,2,龐 達(dá)
(1. 湘潭大學(xué) 計(jì)算機(jī)學(xué)院 網(wǎng)絡(luò)空間安全學(xué)院, 湖南 湘潭 411105;2. 中國(guó)電信股份有限公司湖南分公司, 湖南 長(zhǎng)沙 410000)
圖像分割是計(jì)算機(jī)視覺研究中的一個(gè)經(jīng)典難題,已經(jīng)成為圖像領(lǐng)域關(guān)注的一個(gè)熱點(diǎn).由于圖像分割問(wèn)題本身的重要性,從20世紀(jì)70年代起就吸引了很多研究人員進(jìn)行了深入的研究,提出了一系列行之有效的圖像分割技術(shù),并產(chǎn)生了相當(dāng)多的研究成果和分割方法[1-3].
常見的圖像分割方法有:(1)基于閾值的分割方法[4],該類型的方法計(jì)算簡(jiǎn)單, 效率較高,但對(duì)噪聲比較敏感,魯棒性不高,閾值的選擇有局限性;(2)基于區(qū)域的圖像分割方法,該類型的方法是以尋找區(qū)域?yàn)榛A(chǔ)的分割技術(shù),常見的方法有區(qū)域生長(zhǎng)法[5]、區(qū)域分裂合并法[6]、區(qū)域擬合法[7]、分水嶺算法[8].該類型的方法對(duì)復(fù)雜圖像分割效果較好,但算法復(fù)雜、計(jì)算量較大;(3)基于邊緣檢測(cè)的分割方法[9],該方法試圖通過(guò)檢測(cè)包含不同區(qū)域的邊緣來(lái)解決分割問(wèn)題,常見的算法有Roberts算法、Sobel算法、Priewitt算法、Laplacian算法、Canny算法等.該類算法速度快,邊緣定位準(zhǔn)確,但不能保證邊緣的連續(xù)性和封閉性,在高細(xì)節(jié)區(qū)域容易產(chǎn)生大量的碎邊緣以及小碎片;(4)基于偏微分方程(PDE)模型的分割方法[10-12],如基于擴(kuò)散方程的分割模型[13]、基于主動(dòng)輪廓模型的分割方法[14]、距離正則化水平集演化(DRLSE)模型[15]、CV模型[16]等.(5)基于深度學(xué)習(xí)模型的圖像分割方法,目前大多數(shù)這方面的框架都以U-Net[17]或者特征金字塔網(wǎng)絡(luò)(FPN)[18]作為它的基本結(jié)構(gòu),并且借助VGG[19]、resnext[20]、EfficientNet[21]等框架作為它的主干網(wǎng)絡(luò),用于從原始輸入圖片中提取特征,再借助自身的結(jié)構(gòu)對(duì)圖像進(jìn)行分割預(yù)測(cè).深度學(xué)習(xí)的方法能獲得高精度的圖像分割,但是卻需要消耗大量的計(jì)算資源,且需要大量的訓(xùn)練數(shù)據(jù),在整個(gè)過(guò)程需要花費(fèi)大量時(shí)間.
基于PDE模型的水平集分割方法具有保證圖像分割的封閉性以及邊緣的連續(xù)性,并且有成熟的PDE理論保證和高效的迭代算法等優(yōu)勢(shì),許多學(xué)者在基于PDE模型的圖像分割方面做了大量的工作. 如:CV模型將區(qū)域內(nèi)外的平均擬合灰度看作常數(shù),用各點(diǎn)與平均擬合強(qiáng)度差的平方構(gòu)造能量方程.圖像強(qiáng)度均勻分布時(shí),CV模型能獲得較好的分割效果,但當(dāng)強(qiáng)度不均勻時(shí),容易產(chǎn)生錯(cuò)誤的分割.RSF模型[22]將平均擬合強(qiáng)度擴(kuò)展為局部擬合函數(shù),LIC 模型[23]對(duì)強(qiáng)度不均勻場(chǎng)進(jìn)行評(píng)估并修正.RSF模型和LIC模型均有效提高了處理強(qiáng)度不均勻的能力. Zhang等[24]基于統(tǒng)計(jì)學(xué)原理提出LSACM模型.LSACM模型處理強(qiáng)度不均勻的能力進(jìn)一步增強(qiáng),但在圖像強(qiáng)度嚴(yán)重不均勻時(shí),仍然可能存在偏差.LATE模型[25]通過(guò)泰勒展開式對(duì)RSF模型的擬合函數(shù)進(jìn)行進(jìn)一步擴(kuò)展,在圖像強(qiáng)度嚴(yán)重不均勻情況下,LATE模型仍能保持很好的分割效果,但LATE模型計(jì)算代價(jià)較高.
擴(kuò)散方程作為偏微分方程的重要內(nèi)容,在圖像分割領(lǐng)域也被廣泛應(yīng)用.Du Zhongjie 等[13]提出了一種帶選擇源的非線性擴(kuò)散方程用于對(duì)退化文檔圖像的恢復(fù),再根據(jù)一個(gè)灰度閾值便可將其進(jìn)行分割,該模型對(duì)部分文檔圖像能取得較好的性能, 但是對(duì)于部分背景被嚴(yán)重污染或者文字不太明顯的文檔圖像,該模型效果表現(xiàn)不太好. Moroanu Costi c?等[26]提出了一種非局部非線性二階各向異性反應(yīng)擴(kuò)散模型,該模型在強(qiáng)度較均勻的圖像有較好的分割結(jié)果,對(duì)于具有模糊邊界的多目標(biāo)圖像可以較為準(zhǔn)確地分割,但當(dāng)強(qiáng)度較不均勻時(shí),分割結(jié)果與真實(shí)結(jié)果有較大的偏差.
針對(duì)圖像強(qiáng)度不均勻的情況,以上方法進(jìn)行了較深入的研究,但仍然存在一些問(wèn)題,例如圖像分割精度或者算法的效率有待進(jìn)一步提升.針對(duì)這些問(wèn)題,文章提出了一種基于擴(kuò)散方程的強(qiáng)度不均勻圖像分割方法,該方法無(wú)須設(shè)置初始輪廓,直接利用圖像本身所攜帶的信息構(gòu)造初始的冷、熱源,根據(jù)熱傳導(dǎo)的思想對(duì)強(qiáng)度嚴(yán)重不均勻的圖像進(jìn)行有效的分割.
二維擴(kuò)散方程被廣泛地用于描述濃度擴(kuò)散、流體運(yùn)動(dòng)和傳熱過(guò)程.對(duì)于均勻的二維區(qū)域,假設(shè)傳熱系數(shù)為常數(shù),其傳熱方程為[27].
(1)
式中:函數(shù)φ表示二維區(qū)域上的溫度;(x,y)是區(qū)域內(nèi)點(diǎn)的空間坐標(biāo);f(x,y,t) 是熱源項(xiàng);μ2φ是區(qū)域內(nèi)自發(fā)熱擴(kuò)散的擴(kuò)散項(xiàng);μ是傳熱系數(shù).
為了防止二維區(qū)域上溫度絕對(duì)值過(guò)大,假定區(qū)域內(nèi)的點(diǎn)只有在溫度接近于零時(shí)才有一個(gè)對(duì)該點(diǎn)有較大作用的外部熱源.當(dāng)溫度絕對(duì)值較大時(shí),外部熱源的作用較小(或者說(shuō)接近于0).為了模擬這種情況下的傳熱過(guò)程,設(shè)
f(x,y,t)=D(I(x,y))·δ(φ(x,y,t)),
(2)
式中,D(I(x,y))表示為:
(3)
式中:h(I)是由原圖經(jīng)過(guò)類Laplace算子預(yù)處理得到的溫度初始值,|h(I)| 為熱量分布,當(dāng)圖像某處的初始溫度絕對(duì)值越高時(shí),代表該處所蘊(yùn)含的能量值越高;h((x,y)) / |h((x,y))| 表示符號(hào)控制,符號(hào)為正則表示該點(diǎn)是熱源作用、符號(hào)為負(fù)則表示該點(diǎn)為冷源作用;*表示卷積操作;|h(I)|Kσ2表示為以熱量分布圖中某點(diǎn)為中心的一個(gè)區(qū)域的加權(quán)能量值,其能有效地增加目標(biāo)輪廓邊緣區(qū)域和其他區(qū)域的溫度差,以及抑制強(qiáng)噪音的熱量絕對(duì)值劇增.λ為一個(gè)正常數(shù),其值越大則在分割結(jié)果中會(huì)保留越多的細(xì)節(jié).D(I)在整個(gè)演化過(guò)程只需計(jì)算一次.一般來(lái)說(shuō),當(dāng)區(qū)域上各點(diǎn)溫度一致時(shí),某點(diǎn)h的響應(yīng)幅度越強(qiáng),該點(diǎn)處f的響應(yīng)幅度也越強(qiáng).
δ(φ(x,y,t))稱為熱敏因子,δ(·) 表示為
(4)
式中,u表示某個(gè)坐標(biāo)點(diǎn)處的溫度.當(dāng)|u|= 0,δ(u)有最大值δ(0) = 1/π,f= D/π;當(dāng)|u|較大時(shí),δ(u)≈0,f≈0.由式 (1)、式(2)和式(3)得到
(5)
文中h的表達(dá)式為
h(I)=(I-Kσ1*I)
(6)
其中,Kσ是一個(gè)帶有σ標(biāo)準(zhǔn)差的高斯核函數(shù),Kσ的表達(dá)式為
(7)
在遠(yuǎn)離圖像邊緣的平坦區(qū)域,有I≈Kσ*I,所以h≈0.在圖像的邊緣附近,邊緣兩側(cè)的強(qiáng)度差異很大.因此,類似于采用Laplace算子作用后在邊緣圖像的兩側(cè),產(chǎn)生一對(duì)絕對(duì)值相等且符號(hào)相反值.這樣處理比直接采用Laplace算子更抗干擾.
為了保持活動(dòng)輪廓曲線的光滑性,文中也引入弧長(zhǎng)項(xiàng)vδ(φ)·div(?φ/ |?φ|) 來(lái)保證輪廓曲線的光滑度,最終的圖像分割模型為:
(8)
根據(jù)擴(kuò)散原理可知,當(dāng)整個(gè)演化達(dá)到穩(wěn)定狀態(tài)時(shí),圖像目標(biāo)的輪廓對(duì)應(yīng)于溫度為 0 的分割線.因此,在實(shí)際演化過(guò)程中,只需判定溫度為 0 的分割線在相鄰兩次迭代過(guò)程中不變或者在可控的誤差范圍內(nèi)即可停止迭代.文中根據(jù)每張圖所對(duì)應(yīng)的溫度圖上各點(diǎn)的符號(hào)變化數(shù)來(lái)設(shè)定截止條件.假設(shè)一張圖分辨率為M*N,每次迭代后記錄符號(hào)變化的點(diǎn)的個(gè)數(shù)記為x,當(dāng)x/(M*N) <=ε時(shí),則認(rèn)為該模型已經(jīng)演化到了一個(gè)穩(wěn)定狀態(tài),可停止演化.
根據(jù)以上的分析,給出基于二維擴(kuò)散方程的圖像分割算法如下:
算法1 基于擴(kuò)散方程的圖像分割算法
1:輸入源圖像I,設(shè)置參數(shù) μ、ν、σ1、σ2、λ、ε;
2:記錄整幅圖的像素點(diǎn)個(gè)數(shù)n;
3:根據(jù)式(6)計(jì)算h(I);
4:根據(jù)h(I) 設(shè)置初始值(φ0) ;
5:根據(jù)式(3)計(jì)算D(I);
6:根據(jù)式(2)計(jì)算f;
7:根據(jù)式(8)計(jì)算出下一次迭代后的結(jié)果 φi+1,i表示為當(dāng)前的迭代次數(shù);
8:令φi=φi+1,統(tǒng)計(jì)溫度符號(hào)發(fā)生變化的點(diǎn)的個(gè)數(shù)x,如果x/n>ε,返回第 6 步,否則輸出最終結(jié)果φ.
本文采用MATLAB R2017a編程實(shí)現(xiàn)、操作系統(tǒng)為Windows 10.5種水平集模型和文中的模型的演化如圖1所示.圖1(a)~(f)中,每行圖分別為RSF模型、DRLSE模型、LIC模型、LSACM模型、LATE模型和本文模型的圖像分割演化示意圖.從圖1的第一列圖可知,本文模型無(wú)須設(shè)定初始輪廓,根據(jù)圖像的靜態(tài)項(xiàng)h可以得到圖像的初始狀態(tài)(圖 1(f)的第一張圖);其他模型都需要設(shè)定初始輪廓曲線.從演化圖中可看出,LIC模型和本文模型能夠快速定位圖像的邊緣.另外,本文方法最顯著的特點(diǎn)是,在演化的早期階段,活動(dòng)輪廓能快速定位圖像的強(qiáng)輪廓,虛假輪廓?jiǎng)t由熱擴(kuò)散的作用會(huì)慢慢消失,最終實(shí)現(xiàn)對(duì)目標(biāo)弱輪廓分割.
不同的初始輪廓對(duì)RSF模型、DRLSE模型、LIC模型、LSACM 模型、LATE模型都有較大的影響.在不同初始輪廓下,5種水平集模型的分割結(jié)果如圖4所示.其中圖2(a)(第一行的圖片)為兩幅圖分別給定了5種不同的初始輪廓曲線的情形.圖2(b)~(f)每行分別對(duì)應(yīng)這5種分割模型的分割結(jié)果.可以看出,由于初始輪廓線設(shè)置的不同可能會(huì)產(chǎn)生較為嚴(yán)重的不合理分割.
本文模型則不需要設(shè)置初始輪廓,且能獲得理想的分割結(jié)果,說(shuō)明本文的圖像分割模型具有較強(qiáng)的魯棒性.
圖像分割的精度可以用 JSC 相似系數(shù)[22-23]標(biāo)準(zhǔn)來(lái)衡量.
(9)
式中:Om為算法推導(dǎo)出的目標(biāo)區(qū)域;Ot為圖像中真正的目標(biāo)區(qū)域;A(·)表示區(qū)域面積.JSC的取值范圍為[0,1],其值越大,表示分割越準(zhǔn)確.
一般來(lái)說(shuō),圖像強(qiáng)度不均勻性越嚴(yán)重,越難以得到準(zhǔn)確的分割結(jié)果.因此,針對(duì)強(qiáng)度嚴(yán)重不均勻的圖像進(jìn)行分割,則能很好地檢驗(yàn)圖像分割方法分割圖像的能力.
圖3 中的第(1)列圖像為待分割處理的原始圖像,第(1)列的第一幅圖像為二值圖像,之后的4幅圖像則為強(qiáng)度不均勻性依次增大的圖像.將第(1)列的第一幅圖像的黑色區(qū)域作為標(biāo)準(zhǔn)的Ot.分別采用不同的圖像分割方法對(duì)第(1)列的5幅圖像進(jìn)行分割處理.分割結(jié)果為:第(2)列圖為采用GAC模型的分割結(jié)果;第(3)列圖為采用CV模型的分割結(jié)果;第(4)列圖為采用RSF模型的分割結(jié)果;第(5)列圖為采用DRLSE模型的分割結(jié)果;第(6)列圖為采用LIC模型的分割結(jié)果;第(7)列圖為采用LSACM模型的分割結(jié)果;第(8)列圖為采用LATE模型的分割結(jié)果;第(9)列圖為采用本文模型的分割結(jié)果.
從圖3的分割結(jié)果圖可以看出,隨著強(qiáng)度不均勻性的增加,GAC模型、CV模型、RSF模型、DRLSE模型、LIC模型和LSACM模型的分割結(jié)果明顯變差.LATE模型還能獲得較滿意的分割結(jié)果,本文模型的分割結(jié)果最理想.
表1為8種模型針對(duì)圖3進(jìn)行分割處理的JSC值表.從表1中的數(shù)值結(jié)果看,隨著強(qiáng)度不均勻性的增加,GAC模型和CV模型的JSC值迅速下降;RSF模型、DRLSE模型和LIC模型對(duì)強(qiáng)度不均勻性有一定的處理能力,但當(dāng)強(qiáng)度不均勻性較嚴(yán)重時(shí),JSC值顯著下降;LSACM對(duì)強(qiáng)度不均勻性的有較強(qiáng)的處理能力,但當(dāng)強(qiáng)度不均勻性較嚴(yán)重時(shí),JSC值會(huì)下降到0.8左右.在表1中,從縱向比較的結(jié)果來(lái)看,本文模型針對(duì)圖3中的(b)(d)(e)圖分割精確度最高,對(duì)(a)(c)圖的分割精度也非常接近其他方法的最高精確度值.在強(qiáng)度不均勻圖像的分割精度上,本文模型基本上優(yōu)于 LATE 模型;從橫向比較的結(jié)果來(lái)看,本文模型和LATE模型一樣,在嚴(yán)重的強(qiáng)度不均勻情況下,JSC值也穩(wěn)定在0.9左右.說(shuō)明本文模型針對(duì)強(qiáng)度嚴(yán)重不均勻圖像的分割具有高精度、高魯棒性的優(yōu)點(diǎn).
本文針對(duì)自然圖像的分割也進(jìn)行了測(cè)試,各模型的分割結(jié)果如圖4所示.其中,第1行圖像為待分割處理的原圖.第2行圖像為RSF模型的分割結(jié)果;第3行圖像為DRLSE模型的分割結(jié)果;第4行圖像為L(zhǎng)IC模型的分割結(jié)果;第5行圖像為L(zhǎng)SACM模型的分割結(jié)果;第6行圖像為L(zhǎng)ATE模型的分割結(jié)果;第7行圖像為本文模型的分割結(jié)果.從分割結(jié)果上看,本文模型的分割結(jié)果最理想.
表2為這6種模型針對(duì)圖4中9幅圖像進(jìn)行分割處理的時(shí)間.數(shù)據(jù)結(jié)果顯示,本文的方法在其中的6幅圖像的分割處理用時(shí)最少,在另外3幅圖像的分割處理中用時(shí)僅次于LIC模型,但用時(shí)也相差不大.相較于具有高分割精度的LATE模型,本文模型不僅在強(qiáng)度不均勻圖像的分割精度上基本優(yōu)于 LATE 模型,從運(yùn)行時(shí)間上看,本文模型比 LATE 模型所需時(shí)間更是低一個(gè)數(shù)量級(jí).總體上看,本文模型效率最高.
表2 圖4中9幅圖的分割時(shí)間Tab.2 Segmentation time of the 9 images in Figure 4 單位:s
本文基于擴(kuò)散理論提出了一種針對(duì)強(qiáng)度不均勻圖像的快速分割方法.與傳統(tǒng)的基于邊緣的水平集和基于區(qū)域的水平集相比,本文模型無(wú)須設(shè)定初始輪廓線,對(duì)于強(qiáng)度不均勻圖像的分割具有高效率、高精度、高魯棒性的優(yōu)點(diǎn).
注:本文是將楊晟院老師所指導(dǎo)學(xué)生曾笑云的碩士畢業(yè)論文[28]中部分內(nèi)容進(jìn)一步完善的工作.
湘潭大學(xué)自然科學(xué)學(xué)報(bào)2022年3期