亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于密度峰值聚類的圖像分割算法

        2020-02-19 15:18:40楊雯璟許彥輝
        計算機(jī)工程 2020年2期
        關(guān)鍵詞:信息熵集上聚類

        趙 軍,朱 荽,楊雯璟,許彥輝,龐 宇

        (重慶郵電大學(xué) 計算智能重慶市重點實驗室,重慶 400065)

        0 概述

        圖像分割是計算機(jī)視覺和圖像處理中的基礎(chǔ)部分,其目的在于按照顏色、灰度、紋理等將圖像劃分成多個不相交的區(qū)塊,從中提取研究者感興趣的區(qū)域[1]。在計算機(jī)視覺領(lǐng)域,對于灰度圖像的研究比對彩色圖像的研究更為成熟。但隨著人工智能的發(fā)展,對彩色圖像研究方法的需求量在不斷增加,針對彩色圖像的研究得到了研究者高度重視。

        研究者提出許多彩色圖像的分割方法,這些方法可分為基于閾值的分割[2-4]、基于聚類的分割[5]、基于邊緣或輪廓檢測的分割[6-7]和基于區(qū)域提取的分割[8]四大類。相較于其他方法,由于聚類是一種無監(jiān)督的分類算法,不必事先知道分類準(zhǔn)則,因此研究者將各類聚類方法應(yīng)用于圖像分割領(lǐng)域,形成諸多基于聚類的圖像分割方法,如模糊C均值(Fuzzy C-Means,FCM)聚類[9-11]、K-means聚類[12-13]、譜聚類[14]、Mean-Shift聚類[15-16]、簡單線性迭代聚類(Simple Linear Iterative Clustering,SLIC)[17-18]等。其中,有些方法如K-means和FCM在給定聚類數(shù)的前提下,能夠生成一種分割算法,但算法分割的性能對聚類中心和聚類數(shù)敏感,并且多數(shù)算法需要人工確定參數(shù)。而密度峰值聚類(Density Peak Clustering,DPC)適用于處理任何形狀的數(shù)據(jù)集,無需提前設(shè)置簇的數(shù)量,所需參數(shù)少,算法原理簡單容易理解,其復(fù)雜度也比一般的聚類算法如FCM和K-means低,但是DPC的可靠性依賴于截斷距離的取值和人工確定的聚類中心。

        本文提出一種基于DPC的圖像分割算法。針對傳統(tǒng)DPC中的參數(shù)截斷距離靠經(jīng)驗取值的情況,引入信息論中信息熵的概念,求得其自適應(yīng)的截斷距離,得到改進(jìn)后的密度峰值聚類(EDPC),并在EDPC的基礎(chǔ)上對彩色圖像進(jìn)行分割。該算法將彩色圖像的每個像素點的顏色特征空間作為聚類算法的輸入數(shù)據(jù),最后基于決策圖確定聚類數(shù)和聚類中心,實現(xiàn)對圖像的準(zhǔn)確分割。

        1 相關(guān)理論

        1.1 密度峰值聚類算法

        文獻(xiàn)[19]提出的DPC算法是一種新型的選取聚類中心的方法,其選取的聚類中心有本身的局部密度大和與其他局部密度大的樣本點相對距離較遠(yuǎn)2個主要特征?;谏鲜鼍垲愔行牡奶卣?DPC算法計算樣本點的局部密度和相對距離,建立決策圖,根據(jù)決策圖選取聚類中心,再對非聚類中心的樣本點進(jìn)行歸類合并,從而實現(xiàn)聚類[19]。

        DPC算法中的局部密度和相對距離這2個特征分別用參數(shù)ρi和δi來刻畫,一般選擇ρi和δi值較大的點作為聚類中心,實現(xiàn)聚類。

        樣本點xi的局部密度ρi數(shù)學(xué)公式定義如下:

        (1)

        樣本點xi的相對距離δi的數(shù)學(xué)公式定義如下:

        (2)

        DPC算法原理簡單,效率較高,所需參數(shù)較少,僅需要局部密度和相對距離2個參數(shù),從式(1)和式(2)可以看出,算法的一個關(guān)鍵參數(shù)為截斷距離,而參數(shù)截斷距離dc的選取是基于若干數(shù)據(jù)集的經(jīng)驗值[20]。截斷距離dc一般默認(rèn)為dij升序排列后前2%處的取值,dc的選取在一定程度上影響著聚類的效果,其值過大過小都會使得聚類效果變差。極端情況下,當(dāng)dc小于dmin時,每個樣本點都是一類;當(dāng)dc大于dmax時,整個數(shù)據(jù)集是一類。因此,DPC選取的dc在真實的數(shù)據(jù)集中分類效果可能不理想。

        1.2 信息熵理論

        信息論中的信息熵是一種系統(tǒng)有序化程度的度量方法。在一個系統(tǒng)中,某個屬性取值提供的信息量越多,系統(tǒng)越穩(wěn)定,信息熵越小;反之,該屬性提供的信息量越少,系統(tǒng)越混亂,信息熵越大[21]。因此,信息熵在聚類分析領(lǐng)域得到了廣泛的應(yīng)用。

        對于隨機(jī)變量X,香農(nóng)定義的信息熵公式如下:

        H(X)=-∑p(xi)lb(p(xi)),i=1,2,…,n

        (3)

        其中,p(xi)表示為事件xi發(fā)生的概率,且∑p(xi)=1。一般信息熵的單位為bit。

        2 基于改進(jìn)DPC的圖像分割算法

        2.1 改進(jìn)的密度峰值聚類

        針對DPC算法中截斷距離dc靠經(jīng)驗取值這一情況,本文提出了一種基于信息熵的截斷距離自適應(yīng)的密度峰值聚類算法EDPC。在EDPC中首先通過信息熵得到自適應(yīng)的截斷距離,然后計算各個參數(shù),畫出決策圖,根據(jù)決策圖來選擇聚類中心,進(jìn)行聚類分析。

        在DPC算法中,局部密度ρi定義采用離散的密度函數(shù),導(dǎo)致樣本點具有相同局部密度的可能性較大,不利于后續(xù)研究,因此,本文采用連續(xù)高斯核密度函數(shù)來刻畫局部密度,其相應(yīng)的定義如下:

        (4)

        其中,dc∈(0,+∞)為自適應(yīng)截斷距離。

        (5)

        信息熵作為一種不確定性的度量,被廣泛應(yīng)用于聚類分析中用以判斷聚類效果的好壞程度。EDPC將信息熵理論應(yīng)用到傳統(tǒng)的DPC中,用信息熵來判斷數(shù)據(jù)集聚類效果,如果數(shù)據(jù)集的信息熵較大,則數(shù)據(jù)集的聚類效果較差,數(shù)據(jù)較混亂;反之,數(shù)據(jù)集的聚類效果較好,數(shù)據(jù)相對較穩(wěn)定。因此,數(shù)據(jù)集的信息熵可表示為:

        (6)

        在EDPC中,假設(shè)每個樣本點的局部密度概率相等,則數(shù)據(jù)分布的不確度最大,此時有最大的熵。由式(6)可知,對于具有n個樣本點的數(shù)據(jù)集有0≤H≤lb(n)。對于該算法的高斯核函數(shù),由分析可知,當(dāng)dc趨近0時,H趨近最大值lb(n);隨dc的增大,H首先減小,在某處達(dá)到最小值,然后逐漸增大,當(dāng)dc趨近+∞時,H再一次趨近lb(n)。獲得效果最好的聚類效果等價于尋找使得H最小的dc值。因此,本文結(jié)合H在(0,+∞)上的變化情況對式(6)中的類信息熵函數(shù)H進(jìn)行求導(dǎo)得到H′,令H′=0來求取極值點處的所有dc值并代入H中,選取使其最小的dc作為自適應(yīng)的截斷距離進(jìn)行聚類分析。

        在真實數(shù)據(jù)集上驗證EDPC算法的有效性,實驗結(jié)果如圖1所示。進(jìn)一步地,在不同數(shù)據(jù)集中對比EDPC與DPC的聚類效果,結(jié)果如圖2所示。在圖2(a)中,采用DPC的聚類結(jié)果明顯地把一類數(shù)據(jù)劃分為了兩類,產(chǎn)生了數(shù)據(jù)誤分,而EDPC聚類效果較之更合理,分類更準(zhǔn)確;在圖2(b)中,DPC聚類邊界交叉度高,而且產(chǎn)生了部分?jǐn)?shù)據(jù)的誤分,而EDPC結(jié)果較好;在圖2(c)中,DPC聚類結(jié)果產(chǎn)生了數(shù)據(jù)遺失,EDPC保留了完整的數(shù)據(jù)數(shù)目;在圖2(d)中,DPC產(chǎn)生的聚類邊界相互交叉,聚類邊界不明顯,而EDPC產(chǎn)生的聚類邊界較之更清晰。從DPC與EDPC的對比實驗可以看出,EDPC較DPC聚類效果更好,EDPC可以很好的彌補(bǔ)DPC截斷距離靠經(jīng)驗取值而導(dǎo)致的在部分?jǐn)?shù)據(jù)集上聚類不準(zhǔn)確以及聚類邊界交叉的不足。實驗證明了將信息熵引入到DPC中較好地提升了算法的性能。

        圖1 真實數(shù)據(jù)集算法聚類結(jié)果

        圖2 EDPC與DPC在不同數(shù)據(jù)集上的聚類效果對比

        Fig.2 Comparison of clustering effect between EDPC and DPC on different datasets

        圖3和圖4給出EDPC、DPC、FCM 和DBSACN 4種算法在不同據(jù)集上的精度值和F值,精度值和F值的取值范圍均為[0,1],其值越大表示聚類效果越好。從圖3和圖4可以看出,在所有數(shù)據(jù)集上,EDPC算法的性能均優(yōu)于對比算法。在常見數(shù)據(jù)集上EDPC算法的聚類結(jié)果以及相應(yīng)的dc如表1所示。

        圖3 不同算法精度對比

        圖4 不同算法F值對比

        表1 EDPC在不同數(shù)據(jù)集上的聚類結(jié)果

        2.2 算法流程

        基于DPC算法選取聚類中心的特點,本文提出一種基于EDPC的圖像分割算法。該算法首先將輸入圖像的每一個像素點視為一個樣本點,將其顏色空間的CIE Lab值作為樣本的特征數(shù)據(jù),然后通過計算信息熵求得自適應(yīng)截斷距離dc,從而計算樣本點的局部密度ρi以及相對距離δi,建立相應(yīng)的決策圖,最后在決策圖中,將ρi和δi都很大的樣本點選取聚類中心,確定聚類中心總數(shù),歸類非聚類中心點,剔除噪聲點從而完成圖像分割。

        對于圖像的像素點,本文修改了DPC算法中的公式。設(shè)分割圖像中有2個像素點i、j,Lab值分別用(Li,ai,bi)、(Lj,aj,bj)表示,本算法采用歐氏距離作為度量距離,則像素點i、j的歐式距離dij如下所示:

        (7)

        將得到的距離矩陣應(yīng)用到EDPC中進(jìn)行圖像分割,算法實施過程如圖5所示。

        圖5 基于EDPC的圖像分割流程

        基于EDPC的圖像分割算法的具體步驟如下:

        1)輸入待分割的彩色圖像,讀取原始圖像數(shù)據(jù)。

        2)將RGB圖像轉(zhuǎn)換為Lab圖像。

        3)計算每個點與其他點的距離dij。

        4)計算信息熵H的極小值,確定自適應(yīng)截斷距離dc。

        6)建立決策圖,選取聚類中心。

        7)將剩余的像素樣本點根據(jù)EDPC算法進(jìn)行聚類處理。

        8)完成最終的圖像分割,輸出圖像。

        3 實驗與結(jié)果分析

        將本文算法與FCM、K-means、IGSO[22]以及IS-FDC[23]算法進(jìn)行對比實驗,驗證其正確性以及有效性。實驗的圖片來源于Berkeley圖像分割數(shù)據(jù)集[24],開發(fā)工具為MATLAB R2016b,不同算法的聚類分割結(jié)果如圖6所示。從圖6可以看出,FCM和K-means的圖像分割效果較差,分割結(jié)果容易受噪聲影響,單一的目標(biāo)和背景容易產(chǎn)生誤分,而且生成的像素塊模糊程度較高,而本文算法EDPC和IS-FDC以及IGSO受噪聲影響小,分割效果更好,目標(biāo)區(qū)域和背景區(qū)域比較清晰。從實驗結(jié)果還可以看出,本文算法針對單一目標(biāo)和背景差距較大的圖片分割效果更好。

        圖6 不同算法的分割結(jié)果

        不同算法具體的聚類細(xì)節(jié)如圖7所示??梢钥闯?在FCM和K-means分割時細(xì)節(jié)保留不夠完整,窗戶邊緣的窗戶框信息遺失,圖像分割不完整,聚類邊界交叉較多;而采用算法EDPC、IGSO和IS-FDC時,建筑物上的窗戶幾乎完整地保留了窗戶框,細(xì)節(jié)保留更多,聚類邊界清晰,圖像分割效果更好。圖8在圖7基礎(chǔ)上展示了不同算法分割后真實圖片對比??梢钥闯?本文算法和IS-FDC較其他算法分割出來的目標(biāo)建筑更完整,遺失的細(xì)節(jié)較少。

        圖7 不同算法的聚類細(xì)節(jié)比較

        圖8 不同算法對真實圖片的分割細(xì)節(jié)結(jié)果比較

        Fig.8 Comparison of real image segmentation details of different algorithms

        為了進(jìn)一步證明EDPC算法在分割圖像方面的有效性和準(zhǔn)確性,本文在Berkeley數(shù)據(jù)集中隨機(jī)抽取50張圖片,計算每種算法的平均分割時間和平均PRI(Probabilistic Rand Index)指標(biāo),結(jié)果如表2所示。其中,PRI為算法分割結(jié)果的準(zhǔn)確程度,其取值范圍為[0,1],其值越大算法分割效果越好。

        表2 不同算法的平均分割時間和PRI指標(biāo)

        Table 2 Average segmentation time and PRI index of different algorithms

        指標(biāo)FCMK-meansIGSOIS-FDCEDPCPRI0.6750.6940.6830.7230.721分割時間/s6.1925.5317.39012.76414.658

        從表2可以看出,本文算法在Berkeley數(shù)據(jù)集上相對于FCM、K-means和IGSO分割效果更好。將EDPC應(yīng)用到圖像分割上,對于像素為n的圖像,樣本點之間距離的計算時間復(fù)雜度為O(n2),雖然算法時間消耗和內(nèi)存消耗較大,但仍然在可承受范圍內(nèi)。

        4 結(jié)束語

        針對傳統(tǒng)DPC算法依靠經(jīng)驗選取截斷距離的情況,本文提出基于信息熵的密度峰值聚類算法。通過計算信息熵的極小值獲得自適應(yīng)的截斷距離,在此基礎(chǔ)上對輸入圖像進(jìn)行聚類并分割。在Berkeley數(shù)據(jù)集中進(jìn)行對比實驗,結(jié)果表明,與FCM、K-means和IGSO等算法相比,本文算法受噪聲影響小,分割效果較好,其PRI指標(biāo)為0.721,達(dá)到了預(yù)期效果。但本文算法未對圖像進(jìn)行預(yù)處理,導(dǎo)致分割時間較長,后續(xù)將對此進(jìn)行改進(jìn),減少計算數(shù)據(jù)量,從而提高算法分割速度。

        猜你喜歡
        信息熵集上聚類
        基于信息熵可信度的測試點選擇方法研究
        Cookie-Cutter集上的Gibbs測度
        鏈完備偏序集上廣義向量均衡問題解映射的保序性
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        基于信息熵的實驗教學(xué)量化研究
        電子測試(2017年12期)2017-12-18 06:35:48
        復(fù)扇形指標(biāo)集上的分布混沌
        一種基于信息熵的雷達(dá)動態(tài)自適應(yīng)選擇跟蹤方法
        基于信息熵的IITFN多屬性決策方法
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
        亚洲一区二区三区99| 成人久久久久久久久久久| 国产精品久久久久久久久鸭| 亚洲Va中文字幕无码毛片下载| 男女动态视频99精品| 国产在线播放一区二区不卡| 欧美丰满老熟妇aaaa片| 欧美午夜精品一区二区三区电影| 亚洲熟妇av乱码在线观看| 国产va精品免费观看| 一区二区三区午夜视频在线观看| 久久精品一区二区熟女| 日本少妇高潮喷水xxxxxxx| 亚洲av有码在线天堂| 国产精品18久久久久久不卡中国 | 国内精品九九久久久精品| 亚洲精品国产精品av| 麻神在线观看免费观看| 97人妻精品一区二区三区| 亚洲性综合网| 亚洲一区视频中文字幕| 欧美性猛交aaaa片黑人 | 97精品人人妻人人| ā片在线观看| 国产无码十八禁| 亚洲免费人成网站在线观看| 白白发在线视频免费观看2| 美女无遮挡免费视频网站| 国产极品美女高潮无套在线观看| av一区二区三区亚洲| 青草草视频在线观看华人免费| 私人vps一夜爽毛片免费| 乌克兰少妇xxxx做受6| 二区三区亚洲精品国产| 日本一区二区视频免费在线看| 亚洲熟妇少妇任你躁在线观看无码| 久久免费国产精品| 丝袜美腿av免费在线观看| 最美女人体内射精一区二区 | 亚洲综合偷拍一区二区| 欧美噜噜久久久xxx|