亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于多層次方法的快速仿射譜聚類算法

        2016-06-02 03:09:54蘇州高等職業(yè)技術學校李志偉
        電子世界 2016年9期

        蘇州高等職業(yè)技術學校 李志偉

        ?

        一種基于多層次方法的快速仿射譜聚類算法

        蘇州高等職業(yè)技術學校 李志偉

        【摘要】快速放射譜聚類具有運行速度快,效率高的優(yōu)點,目前受到各領域研究人員的普遍關注。本文聯(lián)合使用局部距離定義、FAP算法、表征樣本相似度的密度-權值矩陣構造方法,構建一種多級快速彷射譜聚類算法。最后對算法進行有效性分析,并突出本文算法的優(yōu)勢,為提高彷射譜聚類算法提的研究供參考。

        【關鍵詞】快速彷射譜聚類;相似度矩陣;譜聚類

        1 快速仿射傳播譜聚類

        仿射傳播聚類(AP)[1]是由 Frey 等人提出的一種新的聚類算法,其優(yōu)勢體現(xiàn)在處理類數(shù)很多的聚集時運算速度快、聚類結果有效。在人臉圖像的聚類、“基因外顯子”發(fā)現(xiàn)、搜索最優(yōu)航線等方面得到了應用。該算法首先將數(shù)據(jù)集的所有樣本點都視為候選的聚類中心,并為每個樣本點建立與其他樣本點的吸引程度的信息,即任意樣本間的相似度或吸引度。然后在循環(huán)迭代過程中,各樣本點競爭出最終的聚類中心。在每一輪更新的迭代過程中,若一個樣本點處于其相鄰樣本點的中心位置,則該點與其它樣本點的吸引度之和較大,在競爭中勝出的可能性也較大;反之,處在邊緣位置的樣本點,其吸引度之和較小而勝出的可能性也較小。這樣,在競爭中勝出的聚類中心具有較大的吸引度,則屬于聚類的樣本點到其聚類中心的誤差和比較小。因此,算法的迭代過程使得聚類的適應度函數(shù)最大化。當?shù)^程收斂時,聚類中心也隨之確定(即類數(shù)自動確定),再將每個樣本點分配給最近的聚類中心所屬的聚類,算法結束[3,4]。

        從上述可知,AP算法選取了全連接圖的相似矩陣用于樣本的信息傳播,且迭代次數(shù)較多。鑒于此,文獻[2]提出了一種快速的仿射傳播聚類方法(簡稱FAP),F(xiàn)AP同時考慮數(shù)據(jù)集中包含的局部和全局結構信息,是一種高特性多層圖分割方法,可以應實現(xiàn)基于矢量和基于圖的數(shù)據(jù)分割。首先,在FAP中提出了一種快速取樣算法(簡稱FS),F(xiàn)S用于粗化輸入的稀疏圖并選擇少量的具有代表性的樣本作為樣標,且每個樣標標識一個類簇,然后基于一種定義的密度-權值的矩陣得出一種新的譜聚類方法,該方法采用全局距離對每個類簇劃分成最終具有代表類簇的聚類結果,也即對類簇的合并。最后,通過樣本各自對應的類標(最終的樣標又稱為類標)來完成所有樣本點的類別劃分。

        由于在任何一種譜聚類算法中,相似矩陣的構造是個很重要的問題,且該矩陣構造好之后才能進行下一步的譜分解和聚類。而如文獻[2]中所述,密度-權值矩陣也能夠反映出樣本的這種相似程度,且該矩陣的構造步驟如下:

        步驟1. 定義樣本點間局部長和全局距離

        步驟2. 計算類簇間的距離

        步驟3. 構造密度-權值矩陣

        該矩陣被定義為:

        我們將由上述步驟得到的能夠度量樣本相似程度的密度-權值矩陣視為相似矩陣A,則基于密度-權值相似度度量的譜聚類算法實現(xiàn)步驟如下:

        Step3.找出L的最大的K個特征向量構造V矩陣。

        Step4.將V矩陣的每一行單位化,構造成Y矩陣,單元元素yij為:

        2 結束語

        首先,定義出的全局距離能夠相應地放大不同類樣本間的距離,縮小同類樣本間的距離。該距離對于噪聲點和極值點具有較好的魯棒性。能夠克服文獻[5]中最短路徑算法中的短路問題。其次,F(xiàn)AP 算法不僅能夠實現(xiàn)對稀疏圖的粗化,而且能夠對具有代表性標識的樣本點進行提取,且在計算速度上要比AP算法快的多。這是因為AP算法選取了樣本的全連接圖得到的相似矩陣用于信息傳播,且迭代次數(shù)較多。而FAP算法選取了有邊-權值信息存在的樣本構造稀疏圖。這樣,F(xiàn)AP算法不需要每次都計算所有樣本的信息傳播,只需要計算部分有邊--權值存在的樣本間的信息進行傳播。另外,F(xiàn)AP算法在樣本點間信息傳播過程中能夠同時考慮數(shù)據(jù)集中樣本點間的局部和全局結構信息,對多層次圖分割性能較高,且能夠處理大規(guī)模聚類問題。

        最后,將能夠表征樣本相似度的密度-權值矩陣視作樣本的相似矩陣,得出一種基于密度-權值的譜聚類算法,該算法對標準UCI數(shù)據(jù)集、MNIST手寫字和人工數(shù)據(jù)集均具有較好的聚類性能,且加速了運算速度。

        參考文獻

        [1]Frey B, Dueck D. Clustering by passing messages between data points [J]. Science, 2007,305(5841)﹕972-976.

        [2]Shang F H,Jiao L C,Shi J R,etal.Fast affinity propagation clustering﹕A multilevel approach[J].Pattern Recognition, 2012,45(1)﹕474-486.

        [3]Kaijun Wang,Junying Zhang,Dan Li,Xinna Zhang,Tao Guo. Adaptive Affinity Propagation Clustering[J].Acta Automatica Sinica,2007,33(12)﹕1242-1246.

        [4]王開軍,李健,張軍英,涂重陽.半監(jiān)督的仿射傳播聚類[J].計算機工程,2007,33(23)﹕197-198.

        [5]Tenenbaum J, Silva V, Langford J. A global geometric framework for nonlinear dimensionality reduction[J].Science,2000,290(5500)﹕ 2319-2323.

        少妇人妻陈艳和黑人教练| 国产成人亚洲系列毛片| 中文字幕人成人乱码亚洲av| 丰满岳乱妇一区二区三区| 国内露脸中年夫妇交换| 99日本亚洲黄色三级高清网站| 久久99人妖视频国产| 日本动漫瀑乳h动漫啪啪免费 | 男男受被攻做哭娇喘声视频 | 久久久亚洲精品免费视频| 日韩av一区二区不卡| 狠狠色噜噜狠狠狠777米奇小说| 先锋影音av资源我色资源| 久久婷婷免费综合色啪| 一区二区三区国产内射| 免费a级毛片无码av| 欧美第五页| 亚洲天堂av大片暖暖| 不卡日韩av在线播放| 亚洲av综合久久九九| 亚洲国产日韩精品一区二区三区| 99久热re在线精品99 6热视频| 中文人妻av大区中文不卡 | 精品无码国产自产在线观看水浒传| 免费人成网站在线观看欧美| 奇米影视久久777中文字幕| 日韩成人精品一区二区三区| 国产麻豆久久av入口| 伊人久久久精品区aaa片| 无码国产精品第100页| 人妻少妇被猛烈进入中文| 亚洲av综合av国产av中文| 人人狠狠综合久久亚洲婷婷| 中国少妇和黑人做爰视频| 激情五月婷婷一区二区| 国产精品无码a∨精品影院| 亚洲公开免费在线视频| 国产免费操美女逼视频| 精品少妇无码av无码专区| 亚洲最大成av人网站| 国产女主播福利一区二区 |