王學軍,李智勇,王亮亮
(1.中國人民解放軍91635部隊,北京102249;2.國防科技大學電子科學與工程學院,湖南長沙410073)
海域分割是遙感圖像海上艦船目標檢測中的關(guān)鍵步驟。光學遙感圖像的海域分割通常采用2種方式:① 基于地理信息,如德國的 Definiens利用eCognition軟件和GIS數(shù)據(jù)進行海陸分離[1];②基于圖像灰度分割,如利用直方圖谷底法[2]、最大類間方差(OSTU)法[3]、分裂合并[4]和動態(tài)輪廓[5]算法等圖像分割方法實現(xiàn)海陸分離。后一類方法應用更為廣泛,但不適合處理有海域、陸地、云霧以及其他干擾的復雜背景圖像,需要引入基于期望最大化(Expectation Maximization,EM)算法的直方圖擬合方法來實現(xiàn)多類分割閾值的確定。
EM算法是一種求參數(shù)極大似然估計的迭代算法,其中一個重要參數(shù)——高斯模型個數(shù)M是通過經(jīng)驗預先獲取,其大小對圖像分割效果的影響較大。通常,M值選擇較大時會產(chǎn)生“過擬合”現(xiàn)象,而選擇較小時則會導致分割閾值不準確。對EM算法進行了改進,使其具有自動確定圖像直方圖高斯模型個數(shù)的能力,并利用最大后驗概率法確定分割閾值,實現(xiàn)了海域背景的提取。
在圖像處理領(lǐng)域,可將復雜背景遙感圖像的直方圖視為多個高斯分布的疊加,即利用高斯混合模型(Gauss Mixed Model,GMM)來擬合直方圖,而各個高斯模型的統(tǒng)計參數(shù)可以通過EM算法來估計。假設有M個高斯分布疊加,那么由圖像的灰度值計算出來的概率密度函數(shù)P(x)就是含有M個組成成分的混合高斯分布,即
式中,p(wi)為第i類的先驗概率,滿足
P(x/wi)為x灰度級屬于第i類的概率密度函數(shù),為高斯分布,滿足
EM算法是一種數(shù)據(jù)不完全或者存在缺失變量的情況下參數(shù)估計的迭代算法。在此,只給出針對直方圖擬合應用的迭代公式和終止條件,其具體的推導過程請參見文獻[6,7]。
EM算法每個過程可分成以下2個步驟:第1步是E步,即根據(jù)上一步的結(jié)果來估算完全數(shù)據(jù)集似然函數(shù)的期望值;第2步是M步,即求出讓完全數(shù)據(jù)集的似然函數(shù)期望最大化的參數(shù);然后反復這個2個步驟直到參數(shù)迭代穩(wěn)定為止。針對直方圖數(shù)據(jù),將灰度級xi(i=0,…,255)和直方圖中存在M個類視為完全數(shù)據(jù)集。
①E步,求完全數(shù)據(jù)集數(shù)學期望值。令 θ=(u1,…,uM,σ1,…,σM)T,則由(xi,jj)所構(gòu)成的完全數(shù)據(jù)集的對數(shù)似然函數(shù)為:
式中,h(x)為圖像直方圖;L=(0,…,255)。令 Θ=(θT,p1,…,pM)T包含所有要估算參數(shù)的參數(shù)向量,Θ(t)為第t次迭代步驟所估計的參數(shù)向量,則數(shù)學期望可表示為:
式中,p(t)為以第t次迭代結(jié)果Θ(t)作為參數(shù)的概率密度分布函數(shù);
②M 步,求出讓Q(Θ,Θ(t))最大化的參數(shù) Θ。其中均值、方差與先驗概率的迭代公式為:
最后即可得到逼近的直方圖:
對于給出任何一個M值,EM算法都能收斂到一個M組分的混合高斯分布模型。
如前所述,M值對確定圖像灰度分割閾值的影響很大。事實上,若用相關(guān)系數(shù)測度來衡量擬合直方圖與實際直方圖之間的差異,即
則可發(fā)現(xiàn),隨著M值的增加,其誤差值不斷縮小,即M值越大,擬合直方圖的效果就越理想。
但是,隨著M值的增加,一方面會出現(xiàn)“過擬合”現(xiàn)象,即出現(xiàn)先驗概率非常低的分布模型,這表征的是直方圖中的細節(jié)部分。而該模型分布會與其他模型分布發(fā)生嚴重的混疊,從而使分割閾值確定出現(xiàn)錯誤;另一方面,M值的增加會在增加EM的迭代次數(shù),從而降低數(shù)據(jù)處理的效率。
由此提出了自適應的EM算法。為了選擇最佳圖像閾值分割的M值,通過控制M值由小變大,設定合適的終止條件,從而可自動確定圖像的M值。其中終止條件的設定是關(guān)鍵的步驟。設定終止條件的目的是在保證擬合一定精度下,不出現(xiàn)“過擬合”現(xiàn)象。因此終止條件包括2個部分:
①擬合精度滿足要求,即 1-εh≤η1,其中 η1為預先設定的閾值。
②出現(xiàn)先驗概率較低的類,min(p(ωj);j=1…M)/max(p(ωj);j=1…M)<η2,其中 ,η2為預先設定的閾值;
條件1代表擬合精度要求,條件2代表過擬合情況,二者相互制約即可確定M值。此時,擬合直方圖的各類均值、方差以及先驗概率均已得到,下一步可根據(jù)最小錯誤概率準則,利用先驗概率和條件概率來確定分割閾值。如
需要說明的是,在此只確定相鄰2類之間的閾值,即將多類(超過兩類)分類轉(zhuǎn)化為多個2類分類問題。經(jīng)過閾值求解后,可生成M-1個分割閾值,將直方圖劃分為M類。
遙感圖像海域提取就可視為從M段直方圖中,選擇出代表海域的灰度。雖然這只是一個多選一的過程,但是由于多源遙感圖像在成像質(zhì)量及環(huán)境上的不同,例如大面積陰影、薄云的干擾,自動的判別出海域所處的灰度段存在難度。一般的,可通過人機交互或利用一些先驗知識(海域面積較大、灰度較低等)來確定。整個算法的流程如圖1所示。
圖1 基于自適應EM算法的遙感圖像海域提取算法流程
圖像數(shù)據(jù)為spot4的多光譜遙感圖像,20 m分辨率,圖幅大小為3 000*3 000像素,如圖 2、圖 3、圖4和圖5所示。其中圖2為彩色轉(zhuǎn)為灰度的原始圖,圖3、圖4和圖5分別是M為2、3、4時的直方圖擬合結(jié)果。
圖2 原始圖像
圖3 M=2時EM擬合結(jié)果
圖4 M=3時EM擬合結(jié)果
圖5 M=4時EM擬合結(jié)果
不同的M值所對應的迭代次數(shù)和與直方圖的相應的誤差平方和,以及最小先驗概率與最大先驗概率的比值如表1所示。從表1中可以看出,隨著M值的增加,誤差平方和逐漸減少,但迭代次數(shù)也不斷增加;同時,當M值取5的時候,出現(xiàn)了非常小概率的高斯分布,顯示過擬合現(xiàn)象。而利用自適應算法,恰好能確定出合適的M值為4。
表1 參數(shù)與迭代次數(shù)、誤差以及先驗概率比值之間的關(guān)系
實際中,從灰度值分布的角度,圖像中包含的地物類型主要有海域、陸地、厚云和薄云等4類,恰好與自適應算法計算出的M對應。其中,由于薄云對海域分割的影響最大,因此用該方法計算的閾值可以有效地降低薄云的干擾。此外,利用自適用EM算法還可進行雙閾值的分割,即確定包含海域的高、低閾值,其分割結(jié)果會更理想。
針對復雜光學遙感圖像海域的提取問題,基于EM算法,提出了一種基于自適應EM的分割算法。通過控制EM算法的擬合誤差和最小先驗概率的數(shù)值大小,確定EM算法輸入的類別數(shù),從而使EM算法可完全自適應,且降低了由于過擬合而導致的分類閾值計算錯誤的風險。將其應用于光學圖像的海域分割中,取得了較好的效果。
[1]張風麗,張 磊,吳炳方.歐盟船舶遙感探測技術(shù)與系統(tǒng)研究的進展[J].遙感學報,2007,11(4):552-562.
[2]儲昭亮,王慶華,陳海林,等.基于極小誤差閾值分割的艦船自動檢測方法[J].計算機工程,2007,33(11):239-241.
[3]OTSU N.A Threshold Selection Method from Gray Level Histogram[J].IEEE Trans.Syst.Man.Cybern,1979(8):62-66.
[4]肖利平,曹 炬,高曉穎.復雜海地背景下的艦船目標檢測[J].光電工程,2007,34(6):6-10.
[5]羅紅根,朱利民,丁 漢.基于主動輪廓模型和水平集方法的圖像分割技術(shù)[J].中國圖像圖形學報,2006(3):301-309.
[6]鄒丹平,馮 濤,李咸偉,等.基于EM 的直方圖逼近及其應用[J].中國圖像圖形學報,2005(11):1458-1461.
[7]李亞平,楊 華,陳 霞.基于EM和BIC的直方圖擬合方法應用于遙感變化檢測閾值確定[J].遙感學報,2008(1):85-90.