張海艷,高尚兵
(1.淮陰工學(xué)院 計(jì)算機(jī)與軟件工程學(xué)院,江蘇 淮安 223003; 2.江蘇省物聯(lián)網(wǎng)移動互聯(lián)技術(shù)工程實(shí)驗(yàn)室(淮陰工學(xué)院),江蘇 淮安 223003; 3.南京曉莊學(xué)院 可信云計(jì)算與大數(shù)據(jù)分析重點(diǎn)實(shí)驗(yàn)室,南京 211171) (*通信作者電子郵箱24472074@qq.com)
圖像分割中改進(jìn)空間約束貝葉斯網(wǎng)絡(luò)模型的應(yīng)用
張海艷1,2*,高尚兵1,3
(1.淮陰工學(xué)院 計(jì)算機(jī)與軟件工程學(xué)院,江蘇 淮安 223003; 2.江蘇省物聯(lián)網(wǎng)移動互聯(lián)技術(shù)工程實(shí)驗(yàn)室(淮陰工學(xué)院),江蘇 淮安 223003; 3.南京曉莊學(xué)院 可信云計(jì)算與大數(shù)據(jù)分析重點(diǎn)實(shí)驗(yàn)室,南京 211171) (*通信作者電子郵箱24472074@qq.com)
針對馬爾可夫鏈蒙特卡羅方法普遍存在的迭代收斂性問題,在具有空間平滑約束的高斯混合模型條件上提出改進(jìn)空間約束貝葉斯網(wǎng)絡(luò)模型并在圖像分割領(lǐng)域進(jìn)行具體應(yīng)用。所提模型應(yīng)用隱狄利克雷分布(LDA)概率密度模型和高斯-馬爾可夫定理的隨機(jī)域參數(shù)混合過程來實(shí)現(xiàn)參數(shù)平滑。所提方法根據(jù)空間信息先驗(yàn)平滑變換操作,在待處理像素點(diǎn)的上下文混合結(jié)構(gòu)中引入LDA符合多項(xiàng)式分布,用來替換傳統(tǒng)期望最大化算法中映射操作。LDA參數(shù)采用閉合形式將有利于準(zhǔn)確估計(jì)最大后驗(yàn)概率(MAP)框架與上下文混合結(jié)構(gòu)的相關(guān)比例。實(shí)驗(yàn)結(jié)果表明,應(yīng)用PRI、VoI、GCE和BDE指標(biāo)進(jìn)行效果比較,該方法比聯(lián)合系統(tǒng)工程組(JSEG)、當(dāng)前變換矩陣(CTM)和最大后驗(yàn)概率-最大似然法(MM)方法的圖像分割應(yīng)用效果較好,高斯噪聲對于該算法的魯棒性影響較小。
隱狄利克雷分布;期望最大化方法;貝葉斯模型;高斯混合模型;圖像分割
目前,很多科學(xué)研究文獻(xiàn)已經(jīng)提出了多種圖像分割方法。其中,圖像聚類方法主要受到數(shù)據(jù)分組初始安排規(guī)則影響。近些年來的主要科學(xué)研究成果均集中在圖形理論方法研究、基于均值漂移(Mean Shift,MS)的相關(guān)圖像分割算法和Rate-distortion理論方法[1]。
針對有限混合模型(Finite Mixture Model, FMM)的概率密度函數(shù)(Probability Density Function, PDF)的像素點(diǎn)相關(guān)屬性(如:強(qiáng)度、紋理等屬性)建模到群體數(shù)據(jù)上是自然形式,因?yàn)樗鼤鶕?jù)組件自動提供產(chǎn)生分組混合結(jié)構(gòu)。此外,針對聚類性能來說,F(xiàn)MM概率密度函數(shù)是米制單位[2]?;贔MM的概率密度函數(shù)建模方法已經(jīng)成功應(yīng)用在生物信息學(xué)[3]、圖像檢索[4]等相關(guān)領(lǐng)域。FMM模型參數(shù)能夠通過極大似然估計(jì)融合期望最大化算法求得[5]。
圖像先驗(yàn)屬性針對強(qiáng)化空間平滑程度操作有著重要意義,而強(qiáng)化空間平滑度是圖像處理應(yīng)用的關(guān)鍵問題[6]。圖像處理應(yīng)用包括圖像恢復(fù)、圖像去噪、圖像分割、圖像優(yōu)化等各種問題。在常見概率密度函數(shù)框架中,圖像平滑操作是針對圖像先驗(yàn)特征的具體方法。
本文提出的模型與現(xiàn)有方法有區(qū)別。首先,文本、場景和目標(biāo)分類均為有監(jiān)督學(xué)習(xí)問題且相關(guān)分割方法也是無監(jiān)督性質(zhì);同時,在現(xiàn)有科研成果來看,針對隱狄利克雷分布(Latent Dirichlet Allocation, LDA)參數(shù)估計(jì)通常是由變分推理或者簡化Logistic模型來完成。本文提出的改進(jìn)模型優(yōu)點(diǎn)是在E-step步驟中可表示在密閉形式上,也明確說明本文模型假設(shè)改進(jìn)空間約束貝葉斯網(wǎng)絡(luò)模型的概率向量具體比例。通過期望最大化(Expectation Maximization, EM)算法的推理將執(zhí)行LDA參數(shù)的多項(xiàng)式方程,因此,密閉形式M-step步驟所得參數(shù)能夠滿足概率約束所需條件。
(1)
假定像素點(diǎn)位置xi的標(biāo)準(zhǔn)有限混合模型概率密度函數(shù)可以表示為式(2)形式:
(2)
φ(xi|θj)的高斯分布參數(shù)是θj= {μj,Σj},其中μj=(μj,1,μj,2,…,μj,L)是平均矢量,Σj是L維高斯分布的協(xié)方差矩陣,Π可定義為隨機(jī)變量和Θ參數(shù)。
空間變化有限混合模型使用先驗(yàn)密度分布p(Π)的隨機(jī)變量Π,因此,X表示該組像素點(diǎn)的特征向量{xi},當(dāng)i=1,2,…,N時,本文假設(shè)像素點(diǎn)是獨(dú)立統(tǒng)計(jì),應(yīng)用貝葉斯模型條件,將所得后驗(yàn)概率密度函數(shù)由式(3)計(jì)算:
(3)
根據(jù)密度對數(shù)函數(shù),可推導(dǎo)出式(4):
(4)
p(Π)是Gauss-Markov隨機(jī)域[8]表達(dá)的典型實(shí)例,具體形式如式(5)所示:
(5)
因?yàn)閰?shù)βj可獲取集群數(shù)據(jù)的空間平滑性和執(zhí)行不同平滑度,所以在每個集群數(shù)據(jù)上都找到j(luò)以便適應(yīng)數(shù)據(jù)模型。
SVFMM空間變化模型具體如圖1所示。在標(biāo)準(zhǔn)FMM模型中,對于給定的像素點(diǎn)特征向量x取決于離散隱變量z來表示混合部分,最終生成特征向量x。如果zj=1,像素點(diǎn)x則屬于j類。在這種情況下,對于給定類混合比例屬于該類別像素點(diǎn)百分比。在SVFMM情況下,每個像素點(diǎn)i都有自身固定混合比例πi,稱為像素點(diǎn)標(biāo)簽概率。這些上下文混合比例均由平滑先驗(yàn)知識來執(zhí)行空間約束。
圖1 空間變化有限混合模型
最大后驗(yàn)概率(Maximum A Posteriori, MAP)估計(jì)模型參數(shù)估計(jì)的EM算法[9]需要在E-step迭代步長t計(jì)算隱變量的條件期望值,具體如式(6)所示:
(6)
在M-step步驟中,考慮到完整數(shù)據(jù)是隱變量的線性似然對數(shù),那么完整數(shù)據(jù)的最大化對數(shù)似然估計(jì)模型參數(shù)如式(7)所示:
(7)
式(7)中的函數(shù)Q(·)能夠針對每個參數(shù)執(zhí)行獨(dú)立最大化操作,并提供以下在t+1步驟的混合模型參數(shù)。
(8)
(9)
為了克服SVFMM算法局限性,本章提出改進(jìn)空間約束貝葉斯網(wǎng)絡(luò)模型。本改進(jìn)空間約束貝葉斯網(wǎng)絡(luò)模型依據(jù)LDA,基于上層分布混合結(jié)構(gòu)來提出圖像分割上下文混合模型Π。LDA是多項(xiàng)式形式,概率向量πi的相關(guān)參數(shù)是由LDA分布產(chǎn)生[5]。相似先驗(yàn)知識已經(jīng)在改進(jìn)空間的上下文約束條件中提出,其中LDA參數(shù)估計(jì)通過迭代梯度下降來進(jìn)行方法優(yōu)化[7]。此外,空間平滑通過隱Dirichlet分布參數(shù)的方程形式以密閉形式計(jì)算實(shí)施具有真正非負(fù)解。
假設(shè)生成圖像模型為了產(chǎn)生第i個像素點(diǎn)以求達(dá)到第j個組件目的,實(shí)現(xiàn)LDA過程,因此,式(6)的隱變量zi具有第j個分量。在這種情況下,后驗(yàn)概率混合模型結(jié)構(gòu)可表述為式(10)形式:
(10)
考慮LDA實(shí)現(xiàn)過程(M=1)與Γ(x+1)=xΓ(x),式(10)中標(biāo)簽的第i個像素點(diǎn)概率可改寫成為式(11):
(11)
新型模型有可能通過引入LDA分布參數(shù)A達(dá)到空間變化目標(biāo)。假設(shè)高斯-馬爾可夫隨機(jī)域來估計(jì)閉合形式具體參數(shù)[8]。
(12)
已有先驗(yàn)知識主要特征是為了提供更好的先期適應(yīng)數(shù)據(jù),強(qiáng)制每個數(shù)據(jù)簇中擁有不同程度的平滑程度。
圖2代表這種分層辦法提出的圖形模型。本文參考LDA分布的空間變化有限混合模型(LDA-SVFMM)模型,LDA-SVFMM產(chǎn)生圖像模型工作原理如下:首先產(chǎn)生樣本ξ(概率向量)使用LDA分布相關(guān)參數(shù),從而獲得多項(xiàng)式分布參數(shù)ξ。隱變量z表示觀察點(diǎn)類的x變量,它是用ξ參數(shù)進(jìn)行多項(xiàng)式計(jì)算所得結(jié)果。LDA分布空間參數(shù)的約束平滑條件α需要根據(jù)標(biāo)準(zhǔn)化SVFMM算法執(zhí)行。
圖2 LDA上下文混合模型
本文模型主要思想是在最大后驗(yàn)概率(Maximum A Prior, MAP)算法上應(yīng)用EM方法。應(yīng)用式(12)中的Gauss-Markov參數(shù)A產(chǎn)生下面所提MAP函數(shù),以最大化EM算法的M-step目標(biāo)。關(guān)于參數(shù)A,本文給出定義如下:
(13)
(14)
(15)
本文MAP-EMM算法的具體過程如下所述:
步驟1 初始化算法參數(shù)和LDA分布向量參數(shù)αi。
步驟2 應(yīng)用式(13)計(jì)算MAP函數(shù):
步驟2.2 (M-Step):
步驟2.2.1 應(yīng)用式(8)計(jì)算改進(jìn)空間約束貝葉斯網(wǎng)絡(luò)模型參數(shù);
步驟2.2.2 應(yīng)用式(14)所得非負(fù)解針對LDA分布參數(shù)進(jìn)行替換;
步驟2.2.3 通過像素點(diǎn)標(biāo)簽替換像素點(diǎn)已有概率參數(shù);
步驟2.2.4 應(yīng)用式(15)計(jì)算像素點(diǎn)標(biāo)簽參數(shù)。
步驟3 直至MAP函數(shù)收縮至無窮小范圍,算法自動達(dá)到結(jié)束條件。
本文實(shí)驗(yàn)環(huán)境為Matlab2014b,圖像大小是256×256。本文針對MAP-EMM改進(jìn)算法的迭代次數(shù)和初始化隨機(jī)生成條件,確保提供對數(shù)似然函數(shù)的最大值。這里考慮EM算法結(jié)束條件準(zhǔn)則是收斂定義成在式(4)的對數(shù)似然變化的百分比在兩個連續(xù)迭代次數(shù)之間小于0.001%。
HAIMER位于德國Igenhausen市,是一家中型家族企業(yè),研發(fā)和生產(chǎn)革命性的超高精度工具。其產(chǎn)品主要有高精度動平衡刀柄、刀具專用動平衡機(jī)、刀柄熱縮機(jī)、3D尋邊器及對中儀等。2009年,HAIMER于上海成立中國總部,全面負(fù)責(zé)中國大陸的市場推廣、產(chǎn)品應(yīng)用以及售后服務(wù)。
為了驗(yàn)證MAP-EMM改進(jìn)算法提出的先驗(yàn)LDA的必要性,針對SVFMM[7]提出在不同復(fù)雜程度下的相同分段圖像分割的具體實(shí)例。經(jīng)過實(shí)驗(yàn)證明,在人工圖像和自然圖像中,高斯噪聲對于MAP-EMM改進(jìn)算法的魯棒性影響很小。
本文針對MAP-EMM改進(jìn)算法在Berkeley圖像數(shù)據(jù)庫的300張圖像中進(jìn)行圖像分割[6]。本文MAP-EMM改進(jìn)算法與JSEG[10]、MAP-ML(MM)[3]、CTM[5]進(jìn)行效果比較。
應(yīng)用標(biāo)準(zhǔn)濾波器進(jìn)行特征描述,在最近文獻(xiàn)中的紋理描述主要方法包括Blobworld特征[11]和MRF特征[12]。Blobworld特征通過生成六維顏色矢量和紋理信息數(shù)據(jù)的過程關(guān)鍵特點(diǎn)是正確估計(jì)紋理規(guī)模。MRF特征只應(yīng)用于PCA進(jìn)行降維操作,其次是像素點(diǎn)終止窗口的向量化操作。
圖3(a)~(d)和圖4(a)~(d)展示本文方法和其他三種方法分割300幅Berkeley圖像數(shù)據(jù)庫部分圖像的結(jié)果比較。從中可得,本文方法分割結(jié)果中,噪聲區(qū)域比較少,邊界保持較好;其次,從本文方法和MM分割結(jié)果的比較可見,兩種方法都采用了圖像優(yōu)化方法,分割結(jié)果的邊界保持較好(如圖3中MM的分割結(jié)果第1~3及第5行),但圖像的標(biāo)簽數(shù)量對分割結(jié)果影響較大,盡管MM在分割過程中能夠根據(jù)能力的變換自動調(diào)整標(biāo)簽數(shù),但容易造成過分割或欠分割。
對比其他方法,JSTG能夠得到較為同質(zhì)的區(qū)域,但已得到過分割結(jié)果,并且不能很好地區(qū)分視覺差異不明顯區(qū)域。CTM采用基于超像素的區(qū)域合并策略對圖像進(jìn)行分割,從圖3和圖4可見,其分割結(jié)果邊界不光滑、錯位,采用的最小描述長度準(zhǔn)則并不能較好地適應(yīng)Berkeley數(shù)據(jù)庫300幅圖像,造成過分割或欠分割現(xiàn)象。
圖3 四種方法分割簡單紋理圖像的比較結(jié)果
圖4 四種方法分割復(fù)雜紋理圖像的比較結(jié)果
為了更好評價各比較方法的分割性能,采用四個常用評價指標(biāo)函數(shù):PRI(ProbabilisticRandIndex)、VoI(VariationofInformation)、GCE(GlobalConsistencyError)和BDE(BoundaryDisplacementError)對分割結(jié)果進(jìn)行評價。其中:PRI是統(tǒng)計(jì)機(jī)器分割和多個人工分割之間標(biāo)簽一致的像素對的個數(shù)占整個像素對個數(shù)的比率;VoI則把機(jī)器分割和人工分割之間的距離定義為在給定人工分割的條件下機(jī)器分割的平均條件熵,它能夠測量機(jī)器分割中不能被人工分割所解釋的隨機(jī)性的量;GCE測量一個分割可被看作為另外一個分割的程度;BDE則是測量兩個分割結(jié)果中邊界像素的平均位移誤差。量化結(jié)果中PRI值越大,VoI、GCE和BED值越小,則機(jī)器分割結(jié)果與人工分割結(jié)果越接近。
表1給出了4種方法分割300幅圖像的結(jié)果在評價指標(biāo)上的量化分析??梢?,本文方法在PRI、VoI、GCE指標(biāo)上優(yōu)于其他3種方法,在BDE指標(biāo)上僅次于CTM,相對于JSEG、MM和CTM,本文方法的分割結(jié)果更加接近于人工分割結(jié)果。
表1 4種方法分割性能比較
本文根據(jù)貝葉斯理論和空間分層建模約束混合模型提出MAP-EMM改進(jìn)算法。本文模型應(yīng)用LDA概率密度模型和高斯—馬爾可夫定理的隨機(jī)域參數(shù)混合過程來實(shí)現(xiàn)參數(shù)平滑。本文方法根據(jù)空間信息先驗(yàn)平滑變換操作,在待處理像素點(diǎn)的上下文混合結(jié)構(gòu)中引入LDA符合多項(xiàng)式分布,從而用來替換傳統(tǒng)期望最大化算法中映射操作。本文仿真結(jié)果對比圖顯示空間變化的混合模型性能方面比采用投影步驟的混合結(jié)構(gòu)約束方法有很大改進(jìn)。
)
[1]MAY,DERKSENH,HONGW,etal.Segmentationofmultivariatemixeddatavialossydatacodingandcompression[J].IEEETransactionsonPatternAnalysisandMachineIntelligence, 2007, 29(9): 1546-1562.
[2]TAYLORCJ.Towardfastandaccuratesegmentation[C]//Proceedingsofthe2013IEEEConferenceonComputerVisionandPatternRecognition.Washington,DC:IEEEComputerSociety, 2013: 1916-1922.
[3]GREENSPANH,DVIRG,RUBNERY.Context-dependentsegmentationandmatchinginimagedatabases[J].ComputerVisionandImageUnderstand, 2004, 93(1): 86-109.
[4]BOYKOVY,VEKSLERO,ZABIHR.Fastapproximateenergyminimizationviagraphcuts[J].IEEETransactionsonPatternAnalysisandMachineIntelligence, 2001, 23(11): 1222-1239.
[5]BLEIDM,NGAY,JORDANMI.LatentDirichletallocation[J].JournalofMachineLearningResearch, 2013, 3: 993-1022.
[6]MARTIND,FOWLKESC,TALD,etal.Adatabaseofhumansegmentednaturalimagesanditsapplicationtoevaluatingsegmentationalgorithmsandmeasuringecologicalstatistics[EB/OL]. [2016- 01- 08].http://vision.ics.uci.edu/papers/MartinFTM_ICCV_2001/MartinFTM_ICCV_2001.pdf.
[7]MADSENR,KAUCHAKD,ELKANC.ModelingwordburstinessusingtheDirichletdistribution[C]//Proceedingsofthe22ndInternationalConferenceonMachineLearning.NewYork:ACM, 2005: 545-552.
[8] NIKOU C, GALATSANOS N P, LIKAS A C. A class-adaptive spatially variant mixture model for image segmentation [J]. IEEE Transactions on Image Processing, 2007, 16(4): 1121-1130.
[9] BLEKAS K, LIKAS A, GALATSANOS N P, et al. A spatially constrained mixture model for image segmentation [J]. IEEE Transactions on Neural Networks, 2005, 16(2): 494-498.
[10] ARBELAEZ P, MAIRE M, FOWLKES C, et al. Contour detection and hierarchical image segmentation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(5): 898-916.
[11] CARSON C, BELONGIE S, GREENSPAN H, et al. Blobworld: image segmentation using expectation maximization and its application to image querying [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(8): 1026-1038.
[12] 周良芬,何建農(nóng).基于GrabCut改進(jìn)的圖像分割算法[J].計(jì)算機(jī)應(yīng)用,2013,33(1):49-52.(ZHOU L F, HE J N. Improved image segmentation algorithm based on GrabCut [J]. Journal of Computer Applications, 2013, 33(1): 49-52.)
[13] 楊明川,呂學(xué)斌,周群彪.不完全K-means聚類與分類優(yōu)化結(jié)合的圖像分割算法[J].計(jì)算機(jī)應(yīng)用,2012,32(1):248-251.(YANG M C, LYU X B, ZHOU Q B. Image segmentation algorithm based on incomplete K-means clustering and category optimization [J]. Journal of Computer Applications , 2012, 32(1): 248-251.)
This work is partially supported by the National Natural Science Foundation of China (61402192), the Key Laboratory of Trusted Cloud Computing and Big Data Analysis.
ZHANG Haiyan, born in 1980, lecturer. Her research interests include image processing.
GAO Shangbing, born in 1981, Ph. D., associate professor. His research interests include pattern recognition, image processing.
Application of improved spatially constrained Bayesian network model to image segmentation
ZHANG Haiyan1,2*, GAO Shangbing1,3
(1.FacultyofComputerandSoftwareEngineering,HuaiyinInstituteofTechnology,Huai’anJiangsu223003,China; 2.JiangsuProvincialInternetofThingsTechnologyEngineeringLaboratory(HuaiyinInstituteofTechnology),Huai’anJiangsu223003,China; 3.KeyLaboratoryofTrustedCloudComputingandBigDataAnalysis,NanjingXiaozhuangUniversity,NanjingJiangsu211171,China;)
Aiming at the problem of iterative convergence of Markov chain Monte Carlo method, an improved spatially constrained Bayesian network model was proposed and applied in the image segmentation domain based on the Gaussian mixture model with spatial smoothing constraint. Latent Dirichlet Allocation (LDA) probability density model and the parameter mix process of Gauss-Markov theorem were used to achieve parameter smoothing. According to the spatial information transcendental transformation operation, the LDA conformance polynomial distribution was introduced into the context hybrid structure of the pixel to be used to replace the mapping operation in the traditional expectation maximization algorithm. LDA parameters were represented by a closed form, which facilitated to accurately estimate the relative proportion of MAP (Maximum A Posteriori) framework to context mixture structure. The experimental results in terms of PRI (Probabilistic Rand Index), VoI (Variation of Information), GCE (Global Consistency Error) and BDE (Boundary Displacement Error) show that the proposed method has better effect in image segmentation, its robustness is less influenced by Gauss noise compared with JSEG (Joint Systems Engineering Group), CTM (Current Transformation Matrix) and MM (Maximum A Posteriori Probability-Maximum Likelihood).
Latent Dirichlet Allocation (LDA); Expectation Maximization (EM) method; Bayesian model; Gaussian Mixture Model (GMM); image segmentation
2016- 09- 05;
2016- 10- 24。
國家自然科學(xué)基金資助項(xiàng)目(61402192);可信云計(jì)算與大數(shù)據(jù)分析重點(diǎn)實(shí)驗(yàn)室資助項(xiàng)目。
張海艷(1980—),女,江蘇淮安人,講師,主要研究方向:圖像處理; 高尚兵(1981—),男,江蘇淮安人,副教授,博士,主要研究方向:模式識別、圖像處理。
1001- 9081(2017)03- 0823- 04
10.11772/j.issn.1001- 9081.2017.03.823
TP391.413
A