蘭志剛, 靳衛(wèi)衛(wèi), 朱明亮, 于新生, 國建鳳, 周振濤, 李凱寶
(1. 中海油能源發(fā)展股份有限公司北京分公司, 北京 100027; 2. 中國海洋大學 海洋地球科學學院, 山東 青島266100; 3. 中國海洋石油總公司, 北京100010; 4. 中海石油有限公司天津分公司, 天津300452)
基于高斯混合模型的海冰圖像非監(jiān)督聚類分割研究
蘭志剛1, 靳衛(wèi)衛(wèi)2, 朱明亮2, 于新生2, 國建鳳3, 周振濤4, 李凱寶4
(1. 中海油能源發(fā)展股份有限公司北京分公司, 北京 100027; 2. 中國海洋大學 海洋地球科學學院, 山東 青島266100; 3. 中國海洋石油總公司, 北京100010; 4. 中海石油有限公司天津分公司, 天津300452)
為了利用海冰圖像識別技術(shù)獲取海冰冰況信息, 探索了利用高斯混合模型進行海冰圖像分割的技術(shù)途徑, 描述了具體算法, 并利用高斯混合模型的最大期望值(EM)算法以及最小描述長度(MDL)準則對渤海海冰圖像進行目標提取。研究結(jié)果表明, 該方法可以很好地實現(xiàn)海冰信息的有效提取和海冰圖像的有效分割, 從而證明了建立在圖像分割技術(shù)之上的海冰圖像識別技術(shù)是處理海冰圖像進而獲得冰型、冰量等冰況信息的有效技術(shù)手段。
海冰; 高斯混和模型; 圖像分割; 非監(jiān)督聚類
由于受西伯利亞冷空氣的影響, 我國渤海、特別是遼東灣海區(qū), 每年冬季都會覆蓋大量的海冰, 嚴重時會形成冰災, 嚴重威脅海洋工程構(gòu)筑物的安全,甚至會封鎖港口、阻塞航道、致使渤海海上交通運輸處于癱瘓狀態(tài), 因此掌握準確的海上冰情信息,對于防冰減災至為重要。利用視頻圖像獲取海上冰情信息已日益成為海冰監(jiān)測和研究的重要途徑, 而建立在圖像分割技術(shù)之上的海冰圖像識別技術(shù)則是處理海冰圖像進而獲得冰型、冰量等冰況信息的有效技術(shù)手段。
圖像分割是一種依據(jù)圖像區(qū)域特征, 對圖像進行分解并提取出感興趣目標的技術(shù)過程。傳統(tǒng)的閾值法在圖像區(qū)域分割中得到了很好的應用, 但尚存在著諸多缺陷, 尤其是對于存在噪聲干擾或要進行多區(qū)域分割的圖像, 閥值法很難得到理想的分割結(jié)果。而聚類算法是一類非監(jiān)督的學習方法, 它能夠在缺少先驗知識的情況下, 把沒有類別標記的樣本集按某種準則劃分成若干類, 使類內(nèi)樣本的相似性盡可能大, 而類間樣本的相似性盡量小, 從而實現(xiàn)數(shù)據(jù)集的有效聚合, 這與人類視覺系統(tǒng)對圖像分割的方法是一致的, 因此近年來聚類算法在圖像分割中得到了愈來愈多的應用。
以流冰形態(tài)出現(xiàn)的渤海海冰具有類型分布復雜和變化的特點, 并且相同類型的海冰其冰面的平滑性會有所不同, 同時由于常常出現(xiàn)冰水混合以及平臺觀測區(qū)域的背景天空和平臺結(jié)構(gòu)設施的干擾, 造成圖像分割呈現(xiàn)復雜和多區(qū)域的特點。本文描述了利用高斯混合模型(Gaussian mixture model, GMM)進行圖像分割的具體算法, 并利用高斯混合模型的最大期望值(expectation-maximization, EM)算法以及最小描述長度(minimum description length, MDL)準則對渤海海冰圖像進行目標提取, 實現(xiàn)了海冰圖像的聚類分割。
圖像的分割算法是基于Chaudhuri和Liu提出的彩色圖像模型可以分成三種高斯分布[5,2]。在處理海冰圖像的過程中, 由于天空、輪船等不相關(guān)因素的存在, 需要對這些干擾目標進行濾除, 由分析可知這些目標對象存在著相當強的區(qū)域相似性, 而與海冰或海水之間的相似性較弱, 根據(jù)這一特點, 本文采用基于高斯混合模型的聚類方法進行目標提取。
基于 GMM 的聚類方法采用的是多個單高斯分布的線性組合, 如公式(1)表示的是由三個高斯密度函數(shù)組合表示的高斯混合密度函數(shù)。其中a1,a2,a3表示各個高斯密度函數(shù)的加權(quán)系數(shù), 即高斯分量的比例系數(shù)。公式(2)是單個高斯密度函數(shù)的表達公式,式中d為特征向量x的維度,μ為均值,δ為特征向量的協(xié)方差矩陣。和傳統(tǒng)的k-means和k-medoids聚類方法相比, GMM不僅把每個數(shù)據(jù)點分配到其中某一個聚類中, 并且還給出了這些數(shù)據(jù)點被分配到每個聚類的概率。表1給出了高斯密度函數(shù)的參數(shù)值
表1 高斯密度函數(shù)系數(shù)值Tab. 1 Coefficents of the Gaussian mixture model probability density function
在基于高斯混合模型的聚類方法中, 每個目標對象都是由多個高斯密度函數(shù)線性組合表示的, 這里每個高斯密度函數(shù)都代表該對象的一個子類, 為了更好地進行聚類, 有必要進行每個對象子類個數(shù)的判定。本文采用EM算法[5]和MDL準則[6]相結(jié)合的方法進行最適合分類數(shù)據(jù)集的聚類個數(shù)的估計。以上面高斯混合模型產(chǎn)生的數(shù)據(jù)為基礎, 進行聚類個數(shù)的估計, 其部分處理過程如圖1所示。可以從圖1中數(shù)據(jù)看出, 當Subclass=3時, Rissannen取得最小值, 說明該數(shù)據(jù)集的最佳聚類個數(shù)是 3, 其結(jié)果與實際數(shù)據(jù)產(chǎn)生模型的類別數(shù)相同。
本文采用EM算法進行相關(guān)系數(shù)的確定。EM算法是一種以迭代的方式來解決一類特殊最大似然(Maximum likelihood) 問題的方法, 這類問題通常是無法直接求得最優(yōu)解, 但是如果引入隱含變量,在已知隱含變量的值的情況下, 就可以轉(zhuǎn)化為簡單的情況, 直接求得最大似然解。
圖1 基于MDL準則的聚類個數(shù)估計部分過程Fig. 1 Cluster number estimation based on MDL Criterion
式(3)給出了最大似然函數(shù)表達式, 可以看出對數(shù)計算中包含加法, 不易求得結(jié)果。所以引進隱含變量Z, 其定義如下:
為了將n個高斯分布用一個隨機變量表示, 可以采用如下表示法, 例如n=3時:
最大似然函數(shù)變換為公式(4)。公式(4)中只包含加法運算, 其中的Znk可以由數(shù)學期望E(Znk)代替, 于是可以得到EM算法公式, 如公式(5)所示。
應用上述EM算法對 GMM模型產(chǎn)生的數(shù)據(jù)集進行最大似然系數(shù)求解, 其結(jié)果如表2所示, 其最大似然估計結(jié)果和真實值相當?shù)亟咏?/p>
圖像中不同目標對象對應于不同的高斯混合模型。將圖片信息轉(zhuǎn)化為ASCII格式數(shù)據(jù)信息, 對每個像素點對應數(shù)據(jù)進行最大后驗(Maximum a posteriori,MAP)估計分析, 計算像素歸屬各個 GMM 的概率,根據(jù)其歸屬概率值進行分割處理, 實現(xiàn)圖片目標的有效分割。為方便后續(xù)處理, 分割后的像素值(色彩)選擇與其聚類序列號相同, 并以色彩形式表現(xiàn)分割圖像。按上述方法對兩幀海冰圖像進行處理后得到的分割圖片如圖2所示。
表2 EM算法求解的GMM系數(shù)結(jié)果Tab. 2 Coefficents of GMM with EM algorithm
圖2 海冰原始圖像及其對應分割圖像Fig. 2 The original images of sea ice and their corresponding segmented images
本文利用高斯混合模型的EM算法以及MDL準則對渤海海冰圖像進行目標提取, 從圖像分割結(jié)果可以看出, 建立在嚴密數(shù)學理論基礎之上的基于高斯混合模型的圖像非監(jiān)督聚類分割技術(shù), 能夠在把握圖像的全局和局部信息的基礎上對目標進行分割,在分割性能提高和抗噪能力上, 具有較強優(yōu)勢, 分割過程不需要人機交互, 能夠?qū)崿F(xiàn)渤海海冰的有效分割, 從而為海冰圖像的后續(xù)處理奠定基礎。
[1]Coleman G B, Andrews H C. Image segmentation by clustering[J]. Proc IEEE, 1979, 5(67): 773-785.
[2]劉健莊. 基于二維直方圖的圖像模糊聚類分割方法[J]. 電子學報, 1992, 20(9): 40-46.
[3]Trivedi M M, Bezdek J C. Low-level segmentation of aerial image with fuzzy clustering[J]. IEEE SMC, 1986,16(4): 589-598.
[4]Porter R, Canagarajah N. A robust automatic clustering scheme for image segmentation using wavelets[J].IEEE Image Processing, 1996, 5(4): 662-665.
[5]Chaudhuri B B, Sarkar N. Texture segmentation using fractal dimension[J]. IEEE PAMI, 1995, 17(1): 72-77.
[6]Chen S W, Chen C F, Chen M S, et al. Neural-fuzzy classification for segmentation of remotely sensed images[J]. IEEE Signal Processing, 1997, 45(11):2639-2654.
[7]Shih F Y, Moh J, Chang Fuchun. A new art-based neural architecture for pattern classification and image enhancement without prior knowledge[J]. Pattern Recog-nition, 1992, 25(5): 533-542.
[8]Lai Weichi. A VLSI neural processor for image data compression using self-organization networks[J]. IEEE Neural Networks, 1993, 3(3): 506-517.
[9]向日華, 王潤生. 一種基于高斯混合模型的距離圖像分割算法[J]. 軟件學報, 2003, 14(7): 1250-1257.
Sea ice image segmentation with unsupervised clustering based on the Gaussian mixture model
LAN Zhi-gang1, JIN Wei-wei2, ZHU Ming-liang2, YU Xin-sheng2, GUO Jian-feng3,ZHOU Zhen-tao4, LI Kai-bao4
(1. Beijing Branch, CNOOC Energy Technology & Service Limited, Beijing 100027, China; 2. College of Marine Geosciences, Ocean University of China, Qingdao 266100, China; 3. CNOOC Limited, Beijing 100010, China; 4.Tianjin Branch, CNOOC Limited, Tianjin 300452, China)
Jan., 26, 2011
sea ice, Gaussian mixture model, image segmentation, unsupervised clustering
In order to obtain sea ice data fromin situvideo images, sea ice images were processed with image segmentation technology based on the Gaussian mixture model (GMM). Image segmentation of the Bohai sea ice with unsupervised clustering was realized by the expectation-maximization (EM) algorithm of GMM and minimum description length (MDL) criterion on the sea ice images for object extraction. The calculation procedures of sea ice image segmentation was described. The results indicate that GMM is effective in sea ice image segmentation and sea ice data extraction. It is concluded that sea ice image recognition, based on image segmentation, is an effective technology to process sea ice image for extraction of data on sea ice type and abundance.
P71 文獻標識碼: A 文章編號: 1000-3096(2011)11-0097-04
2011-01-26;
2011-08-05
中國海洋石油總公司科技發(fā)展項目(C/KJFJDSY 003-2008)
蘭志剛(1963-), 男, 山東青島人, 高級工程師, 中國科學院海洋研究所在讀博士, 從事海洋工程環(huán)境監(jiān)測和海洋工程防腐工作, E-mail: lanzhg@cnooc.com.cn
劉珊珊)