亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于拉普拉斯矩陣的K-mean聚類

        2017-09-22 04:54:28潘正高路紅梅李雪竹
        綏化學(xué)院學(xué)報 2017年9期
        關(guān)鍵詞:鄰接矩陣拉普拉斯宿州

        王 超 潘正高 路紅梅 李雪竹

        (宿州學(xué)院信息工程學(xué)院 安徽宿州 234000)

        基于拉普拉斯矩陣的K-mean聚類

        王 超 潘正高 路紅梅 李雪竹

        (宿州學(xué)院信息工程學(xué)院 安徽宿州 234000)

        譜聚類的方法被廣泛用在模式識別各個領(lǐng)域。文章運用K-mean聚類方法,主要闡述了如何由樣本的相似度矩陣構(gòu)造的拉普拉斯矩陣來求解樣本的低維映射譜,根據(jù)低維映射譜進行譜聚類。

        拉普拉斯矩陣;譜聚類;K-means

        樣本聚類是無監(jiān)督學(xué)習(xí)的一種重要分類方法。對于無標簽的樣本,要實現(xiàn)分類只能根據(jù)樣本本身的相似度進行分類,度量樣本相似度就是相似度聚類[1]。傳統(tǒng)聚類方法要知道樣本在N維空間的矢量[2]。但是拉普拉斯譜聚類的方法只需要知道樣本的相似度矩陣就能進行聚類。

        一、圖譜理論到拉普拉斯矩陣

        拉普拉斯矩陣式表示圖的一種矩陣,給定一個n個頂點的圖,則拉普拉斯矩陣被定義為:L=D-W

        其中D為圖的度矩陣,W為圖的鄰接矩陣。

        舉個例子,給定一個簡單圖,如下:

        圖1 一個鄰接圖

        把該圖轉(zhuǎn)化成鄰接矩陣的形式記為W則:

        把W的每一列元素加起來得到n個數(shù),然后把這個數(shù)放在對角線上其余位置都是零,組成一個n×n的對角矩陣,記為度矩陣D,如下所示:

        根據(jù)拉普拉斯定義L=D-W可得拉普拉斯矩陣如下所示:

        通過上面這個簡單例子,我們明白了拉普拉斯矩陣在連接圖上的定義。下面我們對于更一般的情況的數(shù)學(xué)描述如下:對于一個圖中定義A子圖和B子圖[3],它們之間的所有邊的權(quán)值之和可以由鄰接矩陣W的一般形式求解如下:

        其中,Wij定義為節(jié)點i到節(jié)點j的權(quán)值,如果兩個節(jié)點不相連,則權(quán)值為零。與某個節(jié)點i鄰接的所有邊的權(quán)值之和定義為該頂點i的度di,多個di形成一個度矩陣D。

        由以上定義可知拉普拉斯矩陣的性質(zhì)如下:

        (1)L是對稱半正定矩陣;

        (2)L·1=0·1,即L的最小特征值是0,相應(yīng)的特征向量是1;

        (3)L有n個非負特征值0=λ1≤λ2≤…λn;

        (4)對于任何一個實向量υ?Rn,有以下表達式成立:

        對性質(zhì)(4)的證明如下:

        二、聚類的圖譜解釋

        聚類是把一堆樣本合理地分成兩份或份。從圖論的角度看,聚類問題就是圖的分割問題[4]。給定一個圖G=(V,M),頂點集表示各樣本,帶權(quán)的邊表示各樣本之間的相似度,譜聚類的目的是要找到一種合理的分割圖的方法,把圖分割為若干個子圖,使得連接不同子圖的邊的權(quán)重或者相似度盡可能的低,同一子圖內(nèi)邊的權(quán)重或者相似度盡可能高。相似的聚集在一起,不相似的彼此遠離。為了達到這樣一個目的,就需要被切割的這些邊的權(quán)值之和最小[5]。

        假設(shè)圖不相交的子圖分別為A1,A2,…,AK,求其代價最小的分割的目標函數(shù)如下:

        其中k表示分成了k個組,Ai表示第i組,Ai表示Ai的補集表示Ai,與Ai相連的所有邊之和。綜合上式就表示所有要切割的邊的權(quán)重之和。就是分割成個組要使得上式取最小值。這個目標函數(shù)在實際的操作中,常常把圖分割為一個點和其余n-1各點。為了讓每個圖都有合適的大小,上述的目標函數(shù)改寫成如下式子:

        下面對這個目標函數(shù)進行推導(dǎo):

        則上式可以化為:

        我們從RatioCut推導(dǎo)出了vTLv,這也就是說拉普拉斯矩陣L和我們要優(yōu)化的目標函數(shù)RatioCut有密切的聯(lián)系。因為是一個常量。最小化RatioCut,也就是最小化vTLv。

        又因為:

        顯然上式n是一個定值,要最小化vTLv也就是最小化λ。因此我們下面只有找到拉普拉斯矩陣L最小特征值是零,對應(yīng)的特征向量就行了。這里有一個問題,就是我們討論過的拉普拉斯矩陣最小特征值是零,對應(yīng)的特征向量是1。不滿足v⊥1的條件了,這里根據(jù)文獻[2]所說理論。我們?nèi)〉?小特征值對應(yīng)特征向量。進一步,由于實際中的特征向量里的元素是連續(xù)的任意實數(shù),所以可以根據(jù)v是大于0還是小于0對應(yīng)到離散情況下的,決定vi是取還是取。而如果能求取v的前K個特征向量,進行K-means聚類,得到K個簇,便從二聚類擴展到了K聚類問題。而這里要求的K個特征向量就是拉普拉斯矩陣的特征向量。所以問題就轉(zhuǎn)換成了:求取拉普拉斯矩陣的前K特征值對應(yīng)的特征向量,然后用這前K個特征值對應(yīng)的特征向量進行K-means聚類。

        三、K-means聚類

        (一)隨機在圖中取K個點作為中心點。

        (二)然后計算圖中所有點到K個中心點距離,假如P點離中心點S點最近,那么P點屬于S點群。

        (三)分完群計算點群中心,用新的中心點作為點群中心點。

        (四)重復(fù)步驟(2)和(3),直到中心點不再移動,聚類完畢。

        四、結(jié)語

        基于拉普拉斯矩陣的K-means聚類,一般步驟如下:

        (一)根據(jù)數(shù)據(jù)構(gòu)造一個圖,圖中每一個節(jié)點對應(yīng)一個數(shù)據(jù)點,將各個數(shù)據(jù)點連接起來,并且邊的權(quán)重表示數(shù)據(jù)的相似度。把這個圖用鄰接矩陣W表示出來。

        (二)把鄰接矩陣每一列元素加起來得到n個數(shù),把它們放在對角線上,其他地方補零構(gòu)成一個的對角陣,記為度矩陣D,并構(gòu)造拉普拉斯矩陣L且L=D-W。

        (三)求出拉普拉斯矩陣的前K個特征值對應(yīng)的特征向量,特征值由小到大順序排列的。

        (四)把這些特征向量(列向量)排列在一起組成一個nx·k的矩陣,將其中每一行看做k維空間的一個向量,并使用K-means算法進行聚類。聚類結(jié)果每一行所屬類別就是圖中節(jié)點也就是n個數(shù)據(jù)點分別所屬類別。

        譜聚類算法和傳統(tǒng)聚類方法相比,譜聚類只需要數(shù)據(jù)之間的相似度矩陣就可以了,而不必想單純K-means聚類需要數(shù)據(jù)在N維歐式空間中的向量。

        [1]H.Zha,C.Ding,M.Gu,X.He,and H.D.Simon.Spectral relaxationfor K-meansclustering[C].AdvancesinNeuralInformation ProcessingSystems14,Vancouver,Canada.Dec.2001:1057-1064.

        [2]Fouss,F.,Pirotte,A.,Renders,J.-M.,and Saerens,M.. Random-walk computation of similar-ities between nodes of a graph with application to collaborative recommendation[J].IEEE Trans.Knowl.DataEng.[J].2007,19(3):355-369.

        [3]Kannan,R.,Vempala,S.,andVetta,A..Onclusterings:Good, badandspectral.JournaloftheACM[J].2004,51(3):497-515.

        [4]Hagen,L.andKahng,A.Newspectralmethodsforratiocut partitioning and clustering.IEEE Trans.Computer-Aided Design [J].1992,11(9):1074-1085.

        [5]Gutman,I.andXiao,W.Generalizedinverse of the Laplacian matrixandsomeap plications[J].Bulletindel’Academie Serbedes Sciencesatdes Arts(Cl.Math.Natur.),2004,129:15-23.

        [責(zé)任編輯 鄭麗娟]

        TP391

        A

        2095-0438(2017)09-0153-03

        2017-05-09

        王超(1981-),男,安徽宿州人,宿州學(xué)院信息工程學(xué)院助教,碩士,研究方向:模式識別、人工智能、物聯(lián)網(wǎng)、圖像處理。

        安徽省青年人才支持項目(gxfxzd2016256);安徽省科技廳科技攻關(guān)項目(1502052053)。

        猜你喜歡
        鄰接矩陣拉普拉斯宿州
        輪圖的平衡性
        安徽宿州靈璧縣:多措并舉發(fā)展特色產(chǎn)業(yè)
        宿州學(xué)院
        宿州綠地城基坑防洪安全設(shè)計
        基于鄰接矩陣變型的K分網(wǎng)絡(luò)社團算法
        “鉆”研40年 宿州地下終于挖出鉆石
        基于超拉普拉斯分布的磁化率重建算法
        一種判定的無向圖連通性的快速Warshall算法
        Inverse of Adjacency Matrix of a Graph with Matrix Weights
        位移性在拉普拉斯變換中的應(yīng)用
        久久精品国产亚洲av四虎| 日韩av无卡无码午夜观看| 中文字幕亚洲人妻系列| 日本高清在线一区二区三区| 国产少妇高潮在线视频| 国产国语按摩对白av在线观看| 久久精品国产亚洲av天| 国产亚洲综合一区二区三区| 正在播放国产多p交换视频| 国产精品18久久久久久麻辣| 国产爆乳乱码女大生Av| 精品久久久久88久久久| 日本高清视频一区二区| 在线观看免费无码专区| 成人国内精品久久久久一区| 国产精品久久婷婷六月丁香| 99热这里只有精品4| 亚洲中文字幕高清视频| av免费观看网站大全| av免费播放网站在线| 国产专区一线二线三线码| 少妇无码吹潮| 亚洲女同精品一区二区久久| 网友自拍人妻一区二区三区三州| 国产高清自产拍av在线| 日本成年一区久久综合| 色天使综合婷婷国产日韩av| 毛茸茸的中国女bbw| 久久久久成人精品免费播放网站| 日本不卡不二三区在线看| 国产精品无码一区二区三区电影| 亚洲成色在线综合网站| 亚洲V无码一区二区三区四区观看| 国产福利一区二区三区在线观看| 成品人视频ww入口| 久久人人97超碰超国产| 中字亚洲国产精品一区二区| 激情五月开心五月av| 影视av久久久噜噜噜噜噜三级 | 精品国产亚洲人成在线观看| 国产亚洲成人av一区|