郭雨瑩,許建樓,尚婉清,尤少培,王海軍
(河南科技大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,河南 洛陽 471023)
圖像分割是計算機視覺和圖像處理中一個基本但仍然具有挑戰(zhàn)性的問題。一般來說,圖像分割是基于相似的屬性(如強度、顏色和紋理)將圖像分成一定數(shù)量的互不相交有不同特點的區(qū)域的過程,它在生物醫(yī)學(xué)[1]和深度學(xué)習(xí)[2]等領(lǐng)域有著廣泛的應(yīng)用。通常,自然圖像中的顏色和紋理特征非常復(fù)雜,因此從背景中完全分割對象非常困難。到目前為止,人們已經(jīng)提出了很多圖像分割模型。大體上,求解分割模型的方法分為基于模型[3-9]和基于學(xué)習(xí)[10-12]2大類。然而,由于圖像的多樣性和復(fù)雜性,使得統(tǒng)一的網(wǎng)絡(luò)架構(gòu)不能令大量圖像產(chǎn)生一致最優(yōu)分割效果。在訓(xùn)練網(wǎng)絡(luò)過程中表現(xiàn)就是雖然所有訓(xùn)練樣本的總的損失函數(shù)很好地達到極小值,但對于單個圖像,損耗可能會隨著訓(xùn)練的繼續(xù)而增加。由于這種不穩(wěn)定性以及深度學(xué)習(xí)的方法涉及大量數(shù)據(jù),本文選擇用基于模型的方式進行圖像分割。
在已經(jīng)提出的各種基于模型的圖像分割方法中,最有效的方法是基于變分的分割方法。它利用原始圖像定義一個體現(xiàn)分割區(qū)域的內(nèi)部特點及邊界的能量泛函,然后最小化該能量泛函實現(xiàn)圖像分割。Mumford-Shah[3]模型是在每個區(qū)域內(nèi)使用平滑函數(shù)進行近似,相當(dāng)于將圖像分割成不同的同質(zhì)區(qū)域,但其非凸的能量泛函使得極小化問題難以用數(shù)值方法分析和求解。文獻[4]提出了用每個區(qū)域內(nèi)的常值函數(shù)來近似圖像的活動輪廓模型。文獻[5]將圖像分割和圖像去噪任務(wù)統(tǒng)一到一個全局最小化框架中,避免了水平集方法中初始化距離函數(shù)中的活動輪廓以及在進化過程中周期性地重新初始化距離函數(shù)中的活動輪廓。文獻[6]為了能夠處理分割中的灰度不均勻性,提出了一種新的圖像分割的水平集方法。文獻[7]在隸屬函數(shù)上引入了一個非凸正則化,提出了一種新的用于軟多相圖像分割的變分模型。文獻[8]采用一個多層水平集函數(shù)的N層水平集隱式曲面,將圖像劃分為N個區(qū)域,通過對一個水平集函數(shù)求極值,實現(xiàn)三維多相分段常值圖像的快速分割與重建。與圖像分割不同,圖像分解技術(shù)是通過設(shè)計模型和算法,提取圖像中的主要特征或者有用的信息,其主要目標(biāo)是把一個給定的原始圖像分解為卡通部分和紋理部分?,F(xiàn)有的部分圖像分解變分模型中使用了OSV模型中的H-1泛函[13-15]。由于在測量振蕩分量時使用了H-1(Ω)中的弱范數(shù),這些模型可以有效地從輸入圖像中提取紋理(詳細介紹參見文獻[16]第3節(jié))。雖然這些方法在視覺上都取得了很好的分解效果,但是這些模型在求解過程時都忽略了Hodge分解得到的向量函數(shù)q。從數(shù)學(xué)的意義上來說,若忽略向量函數(shù)q包含的向量信息,則模型的能量泛函出現(xiàn)偏差,影響結(jié)構(gòu)紋理分解。因此,文獻[17]保留了向量函數(shù)q,同時讓紋理對應(yīng)的向量場屬于L1空間,提出了加權(quán)曲率驅(qū)動的卡通紋理圖像分解。
由于自然圖像不符合分片常數(shù)的假設(shè),文獻[18]將圖像分解技術(shù)引入圖像分割模型中,使用結(jié)構(gòu)部分代替分割模型中的原始圖像。文獻[15]遵循織物圖像可以分解為卡通和紋理成分的假設(shè),在圖像分割階段結(jié)合了圖像分解過程。文獻[19]將圖像分割和卡通紋理分解相結(jié)合提出了一種新的模糊分割模型??紤]到OSV分解變分模型中零散度向量函數(shù)被忽略的問題,本文保留了OSV模型中的零散度向量函數(shù),將改進后的圖像分解項加入分割模型,給出了一種更合理、更有效的圖像分割模型和分割算法。由于新模型保留了圖像分解變分模型中的零散度向量函數(shù),使得本文方法能夠正確分割較復(fù)雜的自然圖像。
給定原始圖像f(x):Ω→R+∪{0},假定圖像分割區(qū)域數(shù)為N已知,文獻[20]提出以下的基于模糊區(qū)域的多相圖像分割模型:
(1)
文獻[21]提出了一個在圖像分解中廣泛應(yīng)用的變分模型,簡稱OSV模型:
(2)
由于自然圖像通常有結(jié)構(gòu)和紋理2種成分,文獻[18]將分解模型(2)加入分割模型,提出了基于圖像分解的稀疏正則化多區(qū)域圖像分割方法:
(3)
式中:第1項是正則項;第2項是保真項;第3、4項為圖像分解項;(Ii)γ表示隸屬度函數(shù)Ii(x)的多尺度小波分解系數(shù);λ、α、β是正的平衡參數(shù)。該模型將分解模型與分割模型相結(jié)合,在圖像分解的同時進行圖像分割,從而得到較好的分割結(jié)果。
在式(2)第2項的推導(dǎo)過程中,作者在文獻[21]中假設(shè)圖像的紋理v=f-u=divg,然后利用g的Hodge分解g=?p+q,忽略q并令g屬于L2空間而得到,其中div是散度算子,p是標(biāo)量函數(shù),q是零散度向量函數(shù)。然而忽略q,則g的向量信息被改變,進而改變了紋理的特性[17]。
自然圖像一般有結(jié)構(gòu)和紋理2種成分,使用分塊常值函數(shù)并不能很好地逼近原始圖像。考慮到現(xiàn)有的使用H-1泛函的模型在求解過程中都忽略了Hodge分解得到的零散度向量函數(shù),本文提出了保留零散度向量場約束的多區(qū)域圖像分割模型:
(4)
注意到,與模型(3)不同,新模型(4)中圖像分解項保留了無散度向量場q,這是本文的主要貢獻。首先,新模型(4)中第四項是g屬于L2空間,不同于文獻[17]讓g屬于L1空間。其次,新模型(4)和模型(3)雖然從表達式v=divg的形式上看是一樣的,但是在式(3)中g(shù)是與結(jié)構(gòu)部分u直接相關(guān)的。事實上,由于忽略無散度向量函數(shù)q使得g=?(Δ-1(f-u))不準(zhǔn)確,則由模型(3)所得的結(jié)構(gòu)部分u不準(zhǔn)確,而本文提出的模型(4)保留了零散度向量場q,保證了向量場g的準(zhǔn)確性,從而得到更準(zhǔn)確的結(jié)構(gòu)部分u,因此得到的分割結(jié)果更好。
對模型(4),采用增廣拉格朗日乘子法和交替方向法。首先引入2個輔助變量hi、z,令hi(x)=Ii(x),z=Δ-1(f-u),則模型(4)變成以下最小化問題:
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)
對u子問題,用直接變分法得到它的Euler-Lagrange方程,再利用梯度擴散流得:
(17)
對mi子問題,這是一個關(guān)于mi的可微優(yōu)化問題,可得到解的顯示表達式:
(18)
對Ii-子問題,這是一個關(guān)于Ii的可微優(yōu)化問題,可得到解的顯示表達式:
(19)
對q子問題,利用直接變分法的下面方程并用快速傅里葉變換求解:
(20)
對z子問題,用直接變分法的如下方程并用快速傅里葉變換求解:
(2βΔ-μ3Δ2)z=-2βdivqk+1-
(21)
(22)
(a) 自然圖像 (b) Fish圖像 (c) 織物圖像 (d) Plaid圖像
為了說明本文模型的可行性和有效性,對以上測試圖像進行仿真實驗。參與實驗的其他模型主要有文獻[6]、[22],基于圖像分解使用了H-1泛函的分割模型文獻[15]以及[18]。每個模型均通過人工調(diào)整參數(shù)達到最好的分割效果。在數(shù)值實驗中,直觀地給出紋理所對應(yīng)的向量場g以及向量場q,同時進行定量分析來說明本文模型的創(chuàng)新。
圖2為自然圖像在文獻[15]、[18]以及本文模型上的分割實驗結(jié)果。其中,Ii,i=1,2指示圖像的分割子區(qū)域。
(a) 文獻[15] (b)文獻 [18] (c) 本文模型
從圖2可以看出,其他對比模型的分割子區(qū)域I2包含一些不需要的紋理信息。這是因為盡管文獻[15]和[18]引入OSV分解項得到了相對較好的圖像分割結(jié)果,但OSV分解項忽略了零散度向量場,使得分解不準(zhǔn)確,進而導(dǎo)致分割結(jié)果I2中仍包含部分紋理信息。而本文模型保留了被忽略的零散度向量函數(shù)q,使得紋理對應(yīng)的向量場更準(zhǔn)確,從而通過求解模型得到了更加準(zhǔn)確的結(jié)構(gòu)和紋理圖像,因此分割結(jié)果I2較為理想。另外,由于零散度向量場還包含很多向量信息(如圖4),與其他忽略q的模型相比,本文模型的向量場g更加清晰準(zhǔn)確,包含更完整的紋理信息,故本文模型的分解結(jié)果較為理想。
同樣地,為了進一步驗證本文模型的有效性,文獻[6]、[22]、[18]以及本文模型在Fish圖像上進行對比分割實驗,得到的結(jié)果見OSID“開放科學(xué)數(shù)據(jù)與內(nèi)容”中“補充材料.docx”的圖1。
圖3選擇織物圖像作為測試圖像對文獻[15]、[18]的模型和本文模型進行實驗,展示了相應(yīng)的分割結(jié)果、分解結(jié)果及其對應(yīng)的向量場g。其中,Ii,i=1,2,3指示圖像的分割子區(qū)域。由于文獻[6]、[22]直接對織物圖像進行分割,且實驗結(jié)果相對較差,具體分割結(jié)果見OSID“開放科學(xué)數(shù)據(jù)與內(nèi)容”中“補充材料.docx”的圖2。
(a)文獻 [15] (b) 文獻[18] (c) 本文模型
從圖3可以看出,相較于其他對比模型,本文模型的分割結(jié)果更準(zhǔn)確。由于織物圖像含有大量紋理成分不利于分割,文獻[15]和[18]在分解的同時也進行了分割從而得到了較為準(zhǔn)確的分割結(jié)果,但其分解過程忽略了零散度向量函數(shù)q,導(dǎo)致紋理所對應(yīng)的g向量場不正確,使得通過求解模型得到的結(jié)構(gòu)成分和紋理成分不準(zhǔn)確,因此得到的分割子區(qū)域L1包含一些屬于子區(qū)域L3的線條。而本文模型的向量場g保留了零散度向量場q(如圖4),?z向量方向與q向量方向相互抵消合并,使得紋理部分提取得比較徹底,卡通部分更加符合分段常數(shù)的假設(shè),進而得到了更好的分割結(jié)果。
類似地,文獻[15]、[18]、[6]以及本文模型在Plaid圖像上進行分割實驗,得到的結(jié)果見OSID碼“開放科學(xué)數(shù)據(jù)與內(nèi)容”中“補充材料.docx”的圖3。
(a) 自然圖像 (b) Fish圖像 (c) 織物圖 (d) Plaid圖
從圖4可以看出,q向量場包含了很多向量信息。如果q被忽略,那么得到的g向量場就不正確,從而影響通過模型求解得到的結(jié)構(gòu)部分和紋理部分的準(zhǔn)確性,進而影響圖像分割的結(jié)果,因此保留q是有必要的。
為了進一步說明新模型的優(yōu)勢,采用精確率[23]、召回率[24]以及Jaccard相似系數(shù)[25]來評估分割結(jié)果,如表1所示。
表 1 客觀評價結(jié)果
表1中的指標(biāo)越接近1,說明分割越準(zhǔn)確。從表1可以看出,文獻[6]、[22]的3種評價指標(biāo)數(shù)值上表現(xiàn)較差,由于OSV分解項的加入,文獻[15]、[18]的3種評價指標(biāo)數(shù)值上表現(xiàn)較好,而本文模型保留了OSV分解項忽略的q,在數(shù)值上表現(xiàn)更好。與其他模型相比,本文模型在測試圖像上精確率、召回率以及Jaccard相似系數(shù)的平均值至少分別提高了3.42%、0.77%、4.89%。這與本文模型的理論分析和直觀視覺結(jié)果一致。
為了得到更好的分割結(jié)果,本文通過分析無散度向量場理論,提出了一個新的帶有零散度向量場約束的基于圖像分解的多區(qū)域分割模型并采用交替方向法求解新模型。實驗結(jié)果表明,對于紋理圖像,由于耦合圖像分割與圖像分解使得分割不易受紋理影響,從而新模型的分割結(jié)果在精確率、召回率、Jaccard相似系數(shù)上有明顯提升,由于保留了使用H-1泛函度量振蕩成分時忽略的無散度向量場q,無論從理論還是數(shù)值實驗,向量信息都更加完整。