張曼麗
摘要:“智者觀物,固非以一物視之,別之以類,格而致知,推而及其他者也”這是人類及千年來(lái)認(rèn)識(shí)世界和社會(huì)的基本能力,也是當(dāng)今大數(shù)據(jù)中發(fā)現(xiàn)價(jià)值必須面對(duì)的一個(gè)基本問題即聚類問題。無(wú)論是在政治、文化還是在數(shù)理、化工方面無(wú)不借助于聚類分析的結(jié)果,聚類分析還有一個(gè)非常具有實(shí)用價(jià)值的方向即在圖像色彩聚類中的應(yīng)用。本論文就以K-means聚類分析方法為例來(lái)具體說(shuō)明聚類方法在圖像色彩聚類中的應(yīng)用。
關(guān)鍵詞:K-means聚類方法 圖像色彩聚類
當(dāng)今時(shí)代是大數(shù)據(jù)當(dāng)?shù)赖臅r(shí)代,可以說(shuō)大數(shù)據(jù)是作為網(wǎng)絡(luò)時(shí)代的支撐和客觀存在,也是我們當(dāng)今網(wǎng)絡(luò)時(shí)代人類社會(huì)的重要資產(chǎn),很多東西的背后都是數(shù)字,包括我們今天說(shuō)的圖像色彩聚類,背后也是矩陣的操作。圖像作為人類生活中不可缺少的一部分,它是人類獲取和交換信息的主要來(lái)源,圖像處理的應(yīng)用在人類活動(dòng)范圍內(nèi)不斷地?cái)U(kuò)大。近年來(lái)基于聚類方法應(yīng)用下的圖像處理在醫(yī)學(xué)圖像上也非常廣泛。K-means聚類算法作為無(wú)監(jiān)督聚類方法的經(jīng)典,它具有強(qiáng)大的搜索力,該算法的主要思想是,它用一個(gè)聚類的中心來(lái)代表一個(gè)簇,試圖尋找k個(gè)族群的劃分方法,使得劃分后族群內(nèi)方差最小的一種聚類方法。
1 K-Means均值聚類算法
麥克奎因于1967年提出了K-均值法,這種聚類的思想是把每個(gè)樣品聚集到其最近的形心(均值)類中。即試圖尋找k個(gè)族群的劃分方法,使得劃分后族群內(nèi)方差最小,其中組內(nèi)方差的定義為:
其中p代表聚類空間中的一個(gè)點(diǎn),mi為類Ci的均值,在它的最簡(jiǎn)單說(shuō)明中,這個(gè)過(guò)程可以概括為下列步驟:
(1)選定k個(gè)“種子”作為初始族群的代表。
(2)每個(gè)個(gè)體歸入距離其最近的種子所在的族群。
(3)歸類完成后,將新產(chǎn)生的族群的質(zhì)心定為新的種子。
(4)重復(fù)步驟(2)和(3),直到不需要移動(dòng)。
2圖像聚類思想
這種技術(shù)是一種通用技術(shù),你可以對(duì)任意一張彩色圖片進(jìn)形處理,在過(guò)程中可以將編寫代碼進(jìn)行簡(jiǎn)易的修改,就會(huì)利用聚類將一張彩色的圖片轉(zhuǎn)換成有K個(gè)顏色的圖片,并可以將聚出來(lái)的K個(gè)顏色改成其他的顏色以得到意想不到的效果,總而言之對(duì)顏色進(jìn)行K均值聚類就是把一些相似的顏色調(diào)和起來(lái),形成K種顏色,然后用這K種顏色來(lái)形成圖像,如果只有兩種顏色的話,則就有復(fù)古的一種效果。也可以通過(guò)編程實(shí)現(xiàn)將圖像賦予新的所需要的顏色。
3圖像處理試驗(yàn)
圖像處理的流程是:首先我們選擇任意一張彩色圖片,本篇以一張美秋圖為例如圖1所示:
利用R語(yǔ)言進(jìn)行編程處理,對(duì)顏色進(jìn)行K均值聚類,聚類過(guò)程中K分別等于2,4.16,32我們來(lái)進(jìn)行查看圖像的結(jié)果:如圖2所以:
圖2中左上、右上、左下、右下分別是K為2、4、16、32的情況,我們發(fā)現(xiàn)當(dāng)k等于2時(shí)是一種復(fù)古的效果,隨著K的增加其和原來(lái)的圖片越來(lái)越像。
我們不僅可以對(duì)色彩進(jìn)行聚類還可以將圖畫變成不同的顏色,在這里我們以聚類的K=2為例,進(jìn)行黑白顏色的反轉(zhuǎn)改變,如圖3所示:
4總結(jié)
聚類分析是一種非常實(shí)用的方法,本文針對(duì)K-means聚類方法對(duì)圖像顏色進(jìn)行聚類,試驗(yàn)驗(yàn)證了在處理圖像上有很好的實(shí)際效果與應(yīng)用。后續(xù)還會(huì)對(duì)經(jīng)典的K-means方法進(jìn)行改進(jìn),爭(zhēng)取在圖像色彩處理與各割中有新的應(yīng)用。