喻鈞,劉飛鴻,王占峰,楊俊娜
1.西安工業(yè)大學計算機科學與工程學院,西安710021 2.總后勤部建筑工程研究所,西安710032
基于色度直方圖的顏色聚類算法
喻鈞1,劉飛鴻1,王占峰2,楊俊娜1
1.西安工業(yè)大學計算機科學與工程學院,西安710021 2.總后勤部建筑工程研究所,西安710032
提取目標背景的主色是迷彩設(shè)計中的重要步驟,通常采用的顏色聚類算法具有監(jiān)督性的缺陷.為此,提出一種基于色度直方圖的、無監(jiān)督的顏色聚類算法.該算法采用CIE 1931色度系統(tǒng)建立色度直方圖,根據(jù)像素點在該坐標系的分布規(guī)律自動生成聚類中心.逐一計算像素點與各聚類中心的色度的歐氏距離,將像素點與最近的聚類中心歸于一類.實驗結(jié)果表明,采用該聚類算法能夠準確提取主色,自動分割彩色圖像,且比普通聚類算法的時間效率更優(yōu).
迷彩設(shè)計;顏色聚類;CIE 1931;色度直方圖
在軍事工程的迷彩偽裝中,偽裝效果的好壞主要取決于迷彩是否與目標周圍的自然背景相融合,也就是說,迷彩能否反映目標背景的顏色、紋理等基本特征.迷彩設(shè)計的首要環(huán)節(jié)就是提取目標背景的主色.對于自然背景圖像,主色提取通常采用基于顏色空間的聚類算法[1-2],但需要預先確定聚類數(shù)目(即算法的有監(jiān)督性),這往往帶有一定的主觀性[3-5].為了彌補這類算法有監(jiān)督性的缺陷,曾有人嘗試利用顏色空間各通道的統(tǒng)計規(guī)律實現(xiàn)算法的無監(jiān)督性,但常用的RGB、LAB、XYZ等顏色空間的三維分量之間具有相關(guān)性,因此這種方法的聚類結(jié)果不穩(wěn)定[6].若通過降維方法將三維的空間信息投影到二維平面或一維直線,雖然易于確定閾值,且能保留三維通道之間的相關(guān)性,但聚類結(jié)果依賴于降維時所采用的數(shù)學方法[7-8].
由于色度系統(tǒng)是一種定量描述顏色空間的平面坐標系統(tǒng),除了用色度信息描述顏色之外,還能根據(jù)色度平面內(nèi)的距離描述人眼的視覺差異[9].因此,本文提出一種無監(jiān)督的顏色聚類算法,首先采用CIE 1931色度系統(tǒng)描述圖像的顏色,并在色度坐標平面上進行直方圖統(tǒng)計,以生成圖像的色度直方圖;然后利用圖像像素點在色度平面的分布規(guī)律進行無監(jiān)督的顏色聚類,從而自動提取出目標圖像的主色.
研究表明,電磁波在380~780 nm的波長范圍內(nèi)能夠刺激人眼視細胞,使其產(chǎn)生電脈沖信號;然后大腦處理相應(yīng)的信息,形成視知覺[10-11].色度系統(tǒng)是在單色光譜的顏色匹配實驗基礎(chǔ)上建立起來的,它是聯(lián)系可見光譜和視知覺的紐帶.本文采用色度系統(tǒng)對顏色進行定性和定量的分析,但由于色度空間種類繁多,選用合適的色度空間是圖像處理的首要問題.
1.1彩色像素點的色度表示
根據(jù)顏色匹配實驗,國際照明委員會(Commission Internationale de L'Eclairage,CIE)建立了一系列的色度系統(tǒng).CIE 1931是一個與顏色采集、表示設(shè)備無關(guān)的色度系統(tǒng).它貼近顏色匹配實驗事實,不僅可以表示人眼感知到的所有顏色,還能表示顏色視覺規(guī)律,預測同一種顏色的色度坐標值范圍[12].由于它最貼近人眼視覺,本文采用CIE 1931系統(tǒng)描述圖像的顏色.
為了定量描述圖像顏色,首先錄入CIE 1931標準色度觀測者的光譜色品坐標值(2?視場,5 nm間隔),生成CIE 1931色度坐標系[12];然后輸入彩色圖像,將像素點顏色信息從RGB轉(zhuǎn)化到CIE 1931.轉(zhuǎn)化函數(shù)[x,y]=F(r,g,b)的相關(guān)細節(jié)參見文獻[13].轉(zhuǎn)化過程如圖1所示,其中圖1(a)是根據(jù)色品坐標值生成的馬蹄形曲線,圖1(b)為標準Lena圖像.將Lena圖像的顏色信息轉(zhuǎn)化到CIE 1931上,獲得的色度分布如圖1(c)所示.可以看到像素點在馬蹄形區(qū)域內(nèi)的分布疏密有致,其中色度密集分布在馬蹄形光譜曲線的長波區(qū)域附近,這與Lena圖像為暖色調(diào)的事實相符.
圖1 彩色圖像的色度分布Figure 1 Chromaticity distribution of a color image
1.2人眼色差與顏色聚類
人們在使用顏色空間時,馬蹄形區(qū)域內(nèi)每一個坐標點對應(yīng)于人眼可識別的一種顏色,但人眼通常難以區(qū)分色度值特別相近的顏色.實際上,色度值相近的點對應(yīng)于同一種顏色知覺. 1942年,麥克亞當(Macadam)設(shè)計了一個視覺實驗來記錄觀察者對色彩變化的感知,實驗結(jié)果如圖2所示.
圖2中的每個小橢圓區(qū)域都包含多種色度值信息,但只對應(yīng)于人眼可識別的一種顏色.本文綜合直方圖統(tǒng)計方法,結(jié)合像素點的聚集規(guī)律,實現(xiàn)了無監(jiān)督的顏色聚類,達到了自動識別圖像主色的目的.
圖2 麥克亞當橢圓Figure 2 Ellipse of Macadam
人眼觀察物體時首先捕獲的是顏色.人腦對顏色信息進行分析、處理之后,形成拓撲幾何特征的視覺感知,這些顏色信息就是人眼自動識別對象的基礎(chǔ).本文參考人眼形成視知覺的感知規(guī)律,提出了一種無監(jiān)督的顏色聚類算法.
2.1主色與聚類中心
主色通常是指圖像中出現(xiàn)概率最大的顏色,它往往對應(yīng)著圖像中分布面積最大或者出現(xiàn)最多的物體目標.為了分割出圖像的主要目標,通常采用的聚類算法是有監(jiān)督性的,即聚類中心的生成是隨機的,這就可能導致算法在多次執(zhí)行后獲得的結(jié)果不同.為避免聚類結(jié)果的局部性,本文利用色度系統(tǒng)的全局性,統(tǒng)計圖像中出現(xiàn)的所有顏色.
如圖3所示,輸入辣椒圖(a),可獲得圖(b)所示的色度分布;然后根據(jù)文獻[14]的分類標準,按照色純度和主色調(diào)將色度坐標劃分為若干個小區(qū)域,統(tǒng)計其中像素點密度最大的4個區(qū)域,提取這些區(qū)域?qū)?yīng)的顏色,獲得圖(c)所示的4種主色.按照分布密度的大小從上到下依次排列,即主色1出現(xiàn)的密度最大,主色2次之,依次類推.主色3和4的色調(diào)難以區(qū)分,但原始的辣椒圖中至少出現(xiàn)了7種顏色.通過人工判讀可知,按照密度由大到小排列的4種主色依次為紫、紅、綠、橙黃.多次執(zhí)行聚類后的結(jié)果不變,說明文獻[14]的方法能夠解決局部性問題.然而,該算法是有監(jiān)督性的,初始聚類數(shù)需要手動輸入,可能出現(xiàn)顏色誤分類的結(jié)果;同時,有監(jiān)督的聚類容易使圖像的中、小目標被忽略.因此,僅僅根據(jù)色度密度的分布還不能有效地聚類顏色.
圖3 基于色度分布密度的主色提取Figure 3 Extracting dominant colors from the image based on the chromaticity distribution
為了達到理想的聚類效果,并有效地識別出圖像中的小目標,需要找出像素點在色度系統(tǒng)中的分布規(guī)律.為此,本文建立色度直方圖系統(tǒng),然后利用色度直方圖獲得像素點的聚集規(guī)律,實現(xiàn)無監(jiān)督的顏色聚類.
2.2色度直方圖的生成
基于CIE 1931色度坐標,對輸入圖像進行直方圖統(tǒng)計,生成色度直方圖系統(tǒng).CIE 1931色度坐標值通常精確到小數(shù)點后6位,如440 nm的單色光譜的色度值為(0.164410,0.010860).實際上,采用高精度的數(shù)據(jù)并不能更準確地描述顏色,卻增加了大量的系統(tǒng)開銷.為此,本文降低精度為小數(shù)點后3位,并用其色度坐標值描述圖像的色度信息.
生成色度直方圖的詳細步驟如下:
步驟1在CIE 1931坐標系上截取x軸和y軸[0,1]的區(qū)間,以0.001為間隔分別采樣1 000個點,劃分相應(yīng)平面坐標區(qū)域為1 000×1000個小方格區(qū)域,默認一個小方格對應(yīng)一種顏色.
步驟2讀取圖像數(shù)據(jù)并將其轉(zhuǎn)化為CIE 1931色度坐標值,按照小方格區(qū)域的色度值進行聚類(色度坐標值精度為小數(shù)點后3位).(cx,cy)對應(yīng)步驟1中的一個小方格,轉(zhuǎn)換公式如下:
步驟3統(tǒng)計步驟2中小方格區(qū)域內(nèi)分布像素點的數(shù)目,生成色度直方圖H(cx,cy)=n,其中n為相應(yīng)小方格區(qū)域中的像素點數(shù)目.
辣椒圖的色度直方圖如圖4所示,底面x軸、y軸分別對應(yīng)CIE 1931的x軸、y軸,z軸表示n的大小.
圖4 Peppers的色度直方圖Figure 4 Chromaticity histogram of the Peppers image
觀察并分析圖4可以發(fā)現(xiàn),多個峰值周圍的像素值存在明顯減小的趨勢,這說明波峰附近聚集著大量像素點.不同的波峰對應(yīng)的顏色差異較大,也就是說,波峰區(qū)域代表的顏色就是輸入圖像的主色.因此,需要提取出色度直方圖的峰值點,以生成初始聚類中心.
2.3無監(jiān)督的聚類算法設(shè)計
圖4所示的色度直方圖的峰值起伏規(guī)律明顯,具有明顯的梯度特征.根據(jù)像素點的密度、梯度信息,提出顏色聚類算法的步驟如下:
步驟1生成色度直方圖系統(tǒng),如2.2節(jié)所述.
步驟2讀入圖像I,采用色度直方圖表示其顏色信息,記為G(x,y,z),G(x,y,n)= H(cx,cy).
步驟3對色度直方圖進行高通濾波,確定需要識別的最小目標,并設(shè)定其像素點數(shù)量的閾值為Nmin,濾波公式為
步驟4設(shè)置整合區(qū)域的閾值S(表示同一區(qū)域內(nèi)像素點間的最小距離),遍歷直方圖(x,y,n).如果兩個數(shù)據(jù)點(x1,y1)和(x2,y2)滿足
就將這兩個數(shù)據(jù)點歸到同一個區(qū)域.經(jīng)過區(qū)域合并,形成m個區(qū)域Uk,其中k=1,2,···,m.
步驟5在連通域Uk中尋找極值點,其極值點坐標(xk,yk)即聚類中心,記為Ck,k= 1,2,···,m.
步驟6遍歷整個圖像I,在CIE 1931系統(tǒng)中計算像素點(xij,yij)和m個聚類中心Ck的歐氏距離dijk,歐氏距離的計算公式為
將每個像素點與其最近的聚類中心聚為一類.遍歷完成后,圖像I的所有像素點被聚為m類.
本文采用MATLAB編程實現(xiàn)2.3節(jié)提出的無監(jiān)督的顏色聚類算法.
3.1基于色度直方圖的主色提取
初始化參數(shù)Nmin=50,S=17,對圖4所示的色度直方圖進行高通濾波、區(qū)域整合,得到7個子區(qū)域.求解出這7個子區(qū)域的極大值,如圖5所示.多次執(zhí)行該聚類算法,獲得的初始聚類中心始終不變.通過提取圖4中相應(yīng)的峰值,獲得極大值對應(yīng)的顏色信息,如圖6所示.
圖5 Peppers聚類中心Figure 5 Clustering centers of the Peppers image
圖6 聚類中心對應(yīng)的顏色Figure 6 Colors for each clustering centers
圖6所示的主色分別對應(yīng)于圖3(a)場景的辣椒及其背景,可以看出利用色度直方圖峰值點提取主色的方法是有效的.
3.2基于色度直方圖的顏色聚類
對圖3(a)執(zhí)行2.3節(jié)提出的聚類算法.辣椒圖中的像素點被自動劃分為7類,每類對應(yīng)圖6中的一種主色,聚類結(jié)果如圖7所示,由此可以辨別出辣椒圖中各種對象(青椒、紅椒、黃椒、大蒜等)的顏色.
圖7 本文算法的聚類結(jié)果Figure 7 Clustering result using this algorithm
由于光照等條件的影響,圖7中的單個辣椒表現(xiàn)出不止一種顏色.采用本文算法進行聚類后,能夠明顯地識別辣椒表面不同的顏色.例如,一個青椒可以表現(xiàn)出橙色的邊緣、白色的斑點,紅椒表面的顏色可以有層次感,由底向上的顏色亮度越來越高.
4.1算法有效性的驗證實驗
為了驗證本文算法的有效性,用模糊C均值聚類(fuzzy C-means,F(xiàn)CM)算法進行對照實驗.
將3.1節(jié)所獲得的初始聚類中心數(shù)“7”代入FCM算法公式中;設(shè)置迭代停止閾值ε=0.000001,模糊加權(quán)指數(shù)m=2.聚類結(jié)果如圖8所示,可以看出同一辣椒表面的不同顏色以及圖像背景的紋理都能夠被有效地識別.然而,與圖7相比,圖8中的黃椒沒有被識別出來,且黃椒和紅椒分為一類.這是因為FCM算法根據(jù)隸屬度進行顏色聚類,而其隸屬度仍基于RGB空間的歐氏距離,仍然存在如1.2節(jié)所述的局限性.因此,F(xiàn)CM算法的聚類結(jié)果不能準確反映圖像的主色.
圖8 FCM算法的聚類結(jié)果Figure 8 Clustering result using FCM algorithm
另外,本文還驗證了算法的執(zhí)行效率.分別采用FCM算法和本文算法對經(jīng)典的Lena圖像進行聚類,比較運行算法占用的CPU時間.通過MATLAB的Profile Viewer獲得算法運行的時間開銷(見表1),它表示FCM算法執(zhí)行了大約6 min,表2表示本文算法執(zhí)行不超過10 s.因此,本文算法的時間開銷更小,耗費的資源更少.
表1 FCM算法執(zhí)行時間Table 1 Execution time of FCM algorithm
表2 本文算法執(zhí)行時間Table 2 Execution time of this algorithm
4.2算法適用性的驗證實驗
為驗證本文算法的適用性,本文選擇兩幅差異較大的典型圖像(Lena人物圖像和Berkeley風景圖)進行驗證性實驗,實驗結(jié)果如圖9和10所示.其中,圖9和10中的(a)為原始圖像;圖(b)為原始圖像對應(yīng)的色度直方圖;圖(c)為是提取色度直方圖的波峰,即聚類中心;圖(d)為聚類中心對應(yīng)的顏色,即圖像主色;圖(e)為使用本文算法聚類后的結(jié)果.
圖9 Lena驗證實驗組圖Figure 9 Group of Lena images for the verifcation experiment
圖10 Berkeley驗證實驗組圖Figure 10 Group of Berkeley images for the verifcation experiment
本文的聚類算法主要依據(jù)像素點分布在CIE 1931色度空間的直方圖統(tǒng)計規(guī)律,具體地說就是其色度坐標系的坐標信息以及梯度信息.觀察圖9的Lena組圖,根據(jù)圖(b)的波峰波谷分布規(guī)律提取色度直方圖的波峰點,并將其作為聚類中心,從而自動提取出圖9(a)的主色信息.對比圖9(d)的主色和圖9(c)的波峰點可知,在色度圖上相鄰的像素點,其顏色也相近.聚類結(jié)果9(e)顯示了本文算法的聚類結(jié)果.類似地,Berkeley組圖也展示了同樣的效果.上述實驗表明,本文算法能夠無監(jiān)督地聚類出圖像的主色.
本文提出一種基于色度直方圖的、無監(jiān)督的顏色聚類算法.通過建立圖像的色度直方圖,提取了圖像像素點的色度值,及其在色度平面坐標上的梯度信息,自動生成初始聚類中心,從而提取了圖像主色.驗證實驗表明,本文算法取得了較好的圖像分割效果,且時間效率更優(yōu).
在迷彩設(shè)計中,本文只關(guān)心目標背景的主色和紋理特征,而并不關(guān)心目標背景中各種對象的類別.因此,在進行主色提取時,使用本文算法不僅彌補了FCM等算法有監(jiān)督性的缺陷,而且使獲得的主色更加準確,從而提高了迷彩設(shè)計的自動化程度,使設(shè)計出的迷彩更具科學性.
[1]喻鈞,初苗,田少輝,胡志毅.迷彩設(shè)計中背景圖像聚類方法的比較[J].應(yīng)用科學學報,2009,27(5):475-479. Yu J,Chu M,Tian S H,Hu Z Y.Comparison and analysis for image clustering methods of camouflage design[J].Journal of Applied Sciences,2009,27(5):475-479.(in Chinese)
[2]Yang Y,Guo L,Wang T,Jao W,Shao G,F(xiàn)eng Q.Unsupervised multiphase color-texture image segmentation based on variational formulation and multilayer graph[J].Image and Vision Computing,2014,32(2):87-106.
[3]呂明磊,劉冬梅,曾志勇.一種改進的K-means聚類算法的圖像檢索方法[J].計算機科學,2013,40(8):285-288. Lü M L,Liu D M,Zeng Z Y.Novel image retrieval method of improved K-means clustering algorithm[J].Computer Science,2013,40(8):285-288.(in Chinese)
[4]張春凱,王麗君.基于遺傳算法的一種改進的K-均值聚類算法[J].計算機工程與應(yīng)用,2012,48(26):144-147. Zhang C K,Wang L J.Improved K-means clustering algorithm based on genetic algorithm[J].Computer Engineering and Application,2012,48(26):144-147.(in Chinese)
[5]何月,申鉉京,龍建武,張博.基于塔形信息的空間約束FCM圖像分割算法[J].計算機工程,2011,37(22):209-210,214. He Y,Shen X J,Long J W,Zhang B.Image segmentation algorithm for spatial constraints FCM based on pyramid information[J].Computer Engineering,2011,37(22):209-210,214.(in Chinese)
[6]Jung C R.Unsupervised multiscale segmentation of color images[J].Pattern Recognition Letters,2007,28(4):523-533.
[7]Celik T,Tjahjadi T.Unsupervised colour image segmentation using dual-tree complex wavelet transform[J].Computer Vision and Image Understanding,2010,114(7):813-826.
[8]陳坤,馬燕,劉俊.一種自適應(yīng)無監(jiān)督彩色圖像分割方法[J].小型微型計算機系統(tǒng),2013,34(4):887-891. Chen K,Ma Y,Liu J.An adaptive unsupervised method toward color image segmentation[J]. Journal of Chinese Computer System,2013,34(4):887-891.(in Chinese)
[9]袁興生,王正志,項鳳濤.基于視錐細胞色適應(yīng)生理機制的顏色恒常性計算[J].中國圖象圖形學報,2013,18(5):537-544. Yuan X S,Wang Z Z,Xiang F T.Color constancy algorithm based on biological mechanism:color adaptation of cone cells[J].Journal of Image and Graphics,2013,18(5):537-544.(in Chinese)
[10]Tanaka S,Moon C H,F(xiàn)ukuda M,Kim S G.Three-dimensional visual feature representation in the primary visual cortex[J].Neural Networks,2011,24(10):1022-1035.
[11]Nixon M,Aguado A S.Feature extraction and image processing[M].[S.l.]:Access Online via Elsevier,2008.
[12]Schanda J.Colorimetry:understanding the CIE system[M].[S/l.]:Wiley-Interscience,2007.
[13]徐洋,郭冬霄,程安宇,鄭太雄.基于CIE1931的顏色識別方法研究[J].電視技術(shù),2012,36(5):126-130. Xu Y,Guo D X,Cheng A Y,Zheng T X.Research on color distinguish technology based on CIE1931[J].Video Application and Project,2012,36(5):126-130.(in Chinese)
[14]喻鈞,劉飛鴻,王占鋒,初苗.基于光譜色的迷彩主色提取方法[J].兵工自動化,2014,33(1):72-75. Yu J,Liu F H,Wang Z F,Chu M.Extraction method of dominant colors of pattern painting based on spectrum colors[J].Ordnance Industry Automation,2014,33(1):72-75.(in Chinese)
(編輯:管玉娟)
Color Clustering Based on Chromaticity Histogram
YU Jun1,LIU Fei-hong1,WANG Zhan-feng2,YANG Jun-na1
1.School of Computer Science and Engineering,Xi'an Technological University,Xi'an 710021,China 2.Architectural Engineering Institute,General Logistics Department,Xi'an 710032,China
In camouflage design,extracting the dominant color from target background is an important step.A drawback of common color clustering methods is the requirement of supervision.This paper proposes an unsupervised color clustering algorithm based on the chromaticity histogram.The chromaticity histogram is established according to the CIE 1931 system.The cluster center is automatically generated based on the distribution of pixels in the coordinate system.Euclidean distances in the chroma space are calculated one by one between pixels and each cluster center.These pixels are clustered around the nearest clustering center.Experimental results show that the proposed clustering algorithm can accurately extract the dominant color,and automatically segment the color image.In addition,the algorithm uses less time in image segmentation than common algorithms.
camouflage design,color clustering,CIE 1931,chromaticity histogram
TP751
0255-8297(2015)01-0095-10
10.3969/j.issn.0255-8297.2015.01.011
2014-06-29;
2014-11-04
中國博士后科學基金(No.2013M532180)資助
喻鈞,教授,研究方向:圖像處理,E-mail:jyu0117@163.com