亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        關(guān)于結(jié)合層次聚類和K—means算法進行聚類的研究

        2015-05-30 15:14:38孔令凱向毅梁松
        科技創(chuàng)新與應(yīng)用 2015年25期
        關(guān)鍵詞:剪枝中心點聚類

        孔令凱 向毅 梁松

        摘 要:為了解決進行K-means聚類時類數(shù)的自動選擇和Hierarchical聚類在處理大量高維數(shù)據(jù)時時間效率低的問題,在K-means聚類算法的基礎(chǔ)上結(jié)合Hierarchical聚類算法,提出了一種基于集體智慧編程方法的用于處理大量數(shù)據(jù)時動態(tài)選取K值的聚類模型。實驗結(jié)果表明該算法比K-means聚類具有更好的聚類效果,同時解決了Hierarchical聚類方法時間效率低的問題。本模型通過K-means聚類生成適量的類簇,再利用Hierarchical聚類對這些類再進行聚類,最后經(jīng)過剪枝得到合適的聚類結(jié)果,以此實現(xiàn)動態(tài)選取K值。

        關(guān)鍵詞:K-means聚類;Hierarchical聚類;降維;剪枝

        引言

        K-means聚類算法是最為經(jīng)典的基于劃分的聚類算法,該算法的最大優(yōu)勢在與簡潔和快速,但是該算法聚類效果的好壞取決于初始中心的選擇和距離公式。同時,Hierarchical聚類在處理大量數(shù)據(jù)時,會生成一個高維的矩陣,導(dǎo)致時間效率低。

        本算法模型正是針對K-means聚類對大量數(shù)據(jù)進行降維,以此降低Hierarchical聚類的時間效率,同時利用Hierarchical提高了K-means的聚類效果并實現(xiàn)k值的選取。

        1 結(jié)合Hierarchical聚類和K-means聚類算法的算法模型

        本模型主要分為一下幾步:首先對數(shù)據(jù)進行預(yù)估,預(yù)設(shè)一個合適的k值(大于目標(biāo)類數(shù),遠小于總樣本數(shù)),使用K-means聚類進行聚類操作;然后對k個類的平均中心點進行Hierarchical聚類操作,生成一棵樹;最后通過判斷k個類的中心點的拐點,對這個樹進行剪枝,從而生成newk個子樹,即newk個類。

        該模型的算法流程如下:

        輸入:k,data[m,n];

        (1)K-means聚類:

        1.選擇k個初始中心點,c[k,n];

        2.對于data[m,n]中的每一行m,尋找距離其最近的中心點I (i∈k),標(biāo)記data[m,:]為I;

        3.對于所有標(biāo)記為i的點,重新計算中心點(使用所有標(biāo)記為i的點的平均數(shù))

        4.重復(fù)2,3,直至循環(huán)10次;

        (2)Hierarchical聚類:

        5.對4中生成的k個中心點計算兩兩間的距離,生成距離矩陣

        6.選擇最近的兩個中心點,合并生成新的中心點,使用兩個類中的所有點的平均值代表新的中心點

        7.重新生成距離矩陣

        8.重復(fù)6和7,直到合并成一個類為止

        (3)剪枝操作:

        9.根據(jù)8生成的樹中每一步合并操作時,兩個子節(jié)點之間的距離,計算拐點

        10.根據(jù)計算的拐點進行剪枝,得到newk個子樹

        2 實驗評價

        本模型中的K-means聚類和Hierarchical聚類使用Python編程實現(xiàn),利用了sklearn工具中實現(xiàn)的聚類算法KMeans和hierarchy數(shù)據(jù)結(jié)構(gòu)。實驗機器配置為:Intel Core i7-3537U 2.00GHz CPU,8.00 GB 內(nèi)存;Python 2.7.5(32 bit)。

        數(shù)據(jù)樣本為900條時:

        3 結(jié)束語

        本模型通過結(jié)合Hierarchical聚類和K-means聚類算法,實現(xiàn)了一種新的聚類方式。從實驗結(jié)果可以看出本方法在處理大量高維數(shù)據(jù)時效果明顯,時間效率低且聚類效果更好。本算法仍存在不足:需要預(yù)設(shè)一個合適的較大的k值,此k值不宜過大,太大會導(dǎo)致算法效率的降低;另一方面,此值也不能小于聚類效果最好時的類數(shù),否則聚類效果不理想?;诖它c,需要在使用前根據(jù)數(shù)據(jù)樣本進行預(yù)估,然后給出一個較為合適的k值,或者進行幾次實驗進行探索。本算法已經(jīng)實現(xiàn)了k值的自動選擇,也大大減小了在探索過程中所需的時間和精力。

        參考文獻

        [1]王千,王成,馮振元.葉金鳳K-means聚類算法研究綜述[J].電子設(shè)計工程,2012(7).

        [2]胡偉.改進的層次K均值聚類算法[J].計算機工程與應(yīng)用,2013,49(2).

        [3]楊燕,靳蕃.KAMEL Mohamed聚類有效性評價綜述[J].計算機應(yīng)用研究,2008(1).

        猜你喜歡
        剪枝中心點聚類
        人到晚年宜“剪枝”
        基于YOLOv4-Tiny模型剪枝算法
        Scratch 3.9更新了什么?
        電腦報(2020年12期)2020-06-30 19:56:42
        如何設(shè)置造型中心點?
        電腦報(2019年4期)2019-09-10 07:22:44
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        剪枝
        天津詩人(2017年2期)2017-03-16 03:09:39
        漢字藝術(shù)結(jié)構(gòu)解析(二)中心點處筆畫應(yīng)緊奏
        基于改進的遺傳算法的模糊聚類算法
        尋找視覺中心點
        大眾攝影(2015年9期)2015-09-06 17:05:41
        一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
        日本高清一道本一区二区| 亚洲av高清在线一区二区三区| 国产美女露脸口爆吞精| 国内久久婷婷精品人双人| av资源吧首页在线观看| 亚洲精品中文字幕91| 一边捏奶头一边高潮视频| 欧美亚洲国产片在线播放| 妺妺窝人体色www在线直播| 亚洲av日韩av天堂久久不卡| 亚洲精品乱码久久久久久 | 久久99热狠狠色精品一区| 亚洲免费观看在线视频| 日韩中文字幕无码av| 中文字幕乱码亚洲三区| 无码av专区丝袜专区| 久久国产精品-国产精品| 国内精品久久久久久久久久影院 | 天天干成人网| 亚洲欧美v国产蜜芽tv| 亚洲一区二区三区日韩在线观看| 无码人妻一区二区三区免费视频| 欧美喷潮久久久xxxxx| 中文字幕偷拍亚洲九色| 亚洲av一区二区三区色多多| 曰本人做爰又黄又粗视频| 亚洲国产欧美日韩一区二区| 亚洲男人在线无码视频| 人妻精品久久一区二区三区 | 色天使综合婷婷国产日韩av| 高清无码一区二区在线观看吞精 | 麻豆激情视频在线观看| 伊人久久大香线蕉av不变影院| 亚洲精品97久久中文字幕无码| 99综合精品久久| 中文字幕 在线一区二区| 一二三四五区av蜜桃| 免费看泡妞视频app| 国产欧美精品一区二区三区–老狼| 亚洲国产精品午夜一区| 午夜久久久久久禁播电影 |