亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Bootstrap的加權(quán)FCM改進(jìn)算法*

        2015-10-10 08:02:46洪年松郭華峰
        關(guān)鍵詞:均值權(quán)重聚類

        洪年松,范 淵,郭華峰

        (浙江工貿(mào)職業(yè)技術(shù)學(xué)院信息傳媒學(xué)院,浙江溫州325003)

        基于Bootstrap的加權(quán)FCM改進(jìn)算法*

        洪年松,范淵,郭華峰

        (浙江工貿(mào)職業(yè)技術(shù)學(xué)院信息傳媒學(xué)院,浙江溫州325003)

        為了提高模糊C-均值聚類算法的收斂速度,Yang等引入截斷因子,提出了截斷閾值模糊C-均值(FCMα)聚類算法,加快了算法的收斂。然而該算法也存在著聚類效果不佳的問題。針對該問題,使用Bootstrap統(tǒng)計(jì)方法進(jìn)行特征加權(quán),提出了基于Bootstrap的加權(quán)模糊C-均值聚類改進(jìn)算法。實(shí)驗(yàn)表明,該算法具有更高的聚類準(zhǔn)確率,也更有效。

        FCM;截斷閾值;Bootstrap;特征加權(quán)

        0 引言

        為了改善模糊C-均值(FCM)聚類算法的聚類效果,學(xué)者做了多方面的研究,包括特征加權(quán)和樣本加權(quán)等幾個方面。特征加權(quán)方面,袁正午等通過ReliefF算法實(shí)現(xiàn)特征權(quán)值的自動確定,提出了一種特征加權(quán)自適應(yīng)FCM算法[1],提高了算法的聚類精度。蔡靜穎等則引入自適應(yīng)馬氏距離對特征加權(quán)進(jìn)行處理,提出了一種基于馬氏距離特征加權(quán)的模糊聚類算法[2],提升了分類的有效性。樣本加權(quán)方面,劉兵等提出了一種基于樣本加權(quán)的可能性模糊聚類算法[3],該算法具有更快的收斂速度和更強(qiáng)的魯棒性。段林珊等則受熱力學(xué)中熵定義的啟發(fā),提出了一種基于模擬退火的樣本加權(quán)FCM算法[4],提高了分類的準(zhǔn)確數(shù)和準(zhǔn)確率。與FCM算法類似,F(xiàn)CM的改進(jìn)算法——FCMα算法[5]也存在著聚類效果不佳的問題。為了解決這個問題,本文將引入Bootstrap統(tǒng)計(jì)方法,對數(shù)據(jù)進(jìn)行特征加權(quán),改善FCMα算法的收斂效果。

        1 截斷閾值模糊C-均值聚類算法

        為了改善FCM算法收斂速度慢的問題,YANG等引入截斷因子,提出了截斷閾值模糊C-均值(FCMα)聚類算法[5],加快了算法的收斂。FCMα算法步驟如下:

        ①設(shè)定模糊指數(shù)1<m<∞,分類數(shù)2≤c≤n,迭代次數(shù)l=0,迭代終止閾值ε>0,截斷閾值0.5≤α≤1,初始化中心點(diǎn)起始值Z(0)。

        ②根據(jù)公式(1)計(jì)算隸屬值μij。

        ③使用以下方法更新μij,i=1,...,n,j=1,...,c:如果μis=max1≤j≤cμij>α,那么μis=1,μis'=0,s'≠s。

        ④根據(jù)公式(2)計(jì)算中心點(diǎn)Z(l+1)。

        否則l=l+1,并回到步驟②。

        FCMα算法雖然收斂速度得到了提升,但其聚類效果仍有改善的空間,下面將在該算法中引入Bootstrap特征加權(quán)方法。

        2 截斷閾值FCM算法的特征加權(quán)

        2.1基于Bootstrap的特征加權(quán)方法

        Bootstrap統(tǒng)計(jì)方法是現(xiàn)代統(tǒng)計(jì)學(xué)較為流行的一種統(tǒng)計(jì)方法,在小樣本統(tǒng)計(jì)時效果很好。Bootstrap方法由B.Efron提出[6],其主要思想是從原始數(shù)據(jù)中重復(fù)抽樣以幫助我們認(rèn)識樣本特征,從而進(jìn)一步認(rèn)識母體特征。其基本步驟為:①采用重復(fù)抽樣技術(shù)從原始樣本中抽取給定數(shù)量的樣本。②根據(jù)抽出的樣本計(jì)算給定的統(tǒng)計(jì)量T。③重復(fù)上述B次,得到B個統(tǒng)計(jì)量T。④計(jì)算上述B個統(tǒng)計(jì)量T的樣本方差。

        根據(jù)Bootstrap方法的以上特點(diǎn),F(xiàn)CMα算法所處理的數(shù)據(jù)樣本可以使用該方法來計(jì)算特征權(quán)重,其計(jì)算步驟設(shè)計(jì)如下:

        ①給定重復(fù)抽樣次數(shù)B,使用重復(fù)抽樣技術(shù)從樣本X=(x1,x2,…,xn)?RP中進(jìn)行B次有放回的重復(fù)抽樣,得到樣本,,i=1,2,…,n,b=1,2,…,B,其中P為樣本維數(shù)。

        ②使用公式(3)計(jì)算各次重復(fù)抽樣的特征權(quán)重:

        ③使用公式(4)計(jì)算樣本最終的特征權(quán)重:

        2.2基于Bootstrap的特征加權(quán)FCM改進(jìn)算法

        其中wk表示樣本在第k個特征的加權(quán),k=1,2,…,P。使用新距離對FCMα算法進(jìn)行推算,就可以得到新的特征加權(quán)FCMα(簡稱WFCMα)算法,其迭代方程更新如下:

        則新提出的WFCMα算法步驟如下:

        ①使用基于Bootstrap的特征加權(quán)方法計(jì)算樣本特征權(quán)重。

        ②設(shè)定模糊指數(shù)1<m<∞,分類數(shù)2≤c≤n,迭代次數(shù)l=0,迭代終止閾值ε>0,截斷閾值0.5≤α≤1,初始化中心點(diǎn)起始值Z(0)。

        ③根據(jù)公式(7)計(jì)算隸屬值μij。

        ④使用以下方法更新μij,i=1,...,n,j=1,...,c:如果μis=max1≤j≤cμij>α,那么μis=1,μis'=0,s'≠s。

        ⑤根據(jù)公式(6)計(jì)算中心點(diǎn)Z(l+1)。

        否則l=l+1,并回到步驟③。

        觀察算法可以發(fā)現(xiàn),與FCMα算法相比,WFCMα算法多了第一步,即特征權(quán)重的計(jì)算,以及特征權(quán)重到算法的代入。為了驗(yàn)證WFCMα算法的效果,進(jìn)行如下實(shí)驗(yàn)。

        3 仿真實(shí)驗(yàn)

        3.1數(shù)據(jù)集

        采用正態(tài)分布的二維人工數(shù)據(jù)集和真實(shí)的高維數(shù)據(jù)集來驗(yàn)證算法的有效性。其中二維人工數(shù)據(jù)集有兩個。第一個數(shù)據(jù)集分別以(3,4)、(7,4)為期望,單位矩陣I2為協(xié)方差矩陣。隨機(jī)生成2堆正態(tài)分布的數(shù)據(jù)點(diǎn),每堆100個數(shù)據(jù),共200個數(shù)據(jù)點(diǎn),如圖1所示。第二個數(shù)據(jù)集分別以(3,4)為期望,單位矩陣I2為協(xié)方差矩陣,(7,4)為期望,矩陣為協(xié)方差矩陣。隨機(jī)生成2堆正態(tài)分布的數(shù)據(jù)點(diǎn),每堆100個數(shù)據(jù),共200個數(shù)據(jù)點(diǎn),如圖2所示。真實(shí)的高維數(shù)據(jù)集則采用經(jīng)典的Iris數(shù)據(jù)集[7]。

        圖1 隨機(jī)生成的正態(tài)分布數(shù)據(jù)集1

        圖2 隨機(jī)生成的正態(tài)分布數(shù)據(jù)集2

        3.2實(shí)驗(yàn)

        在圖1和圖2所示的數(shù)據(jù)集中使用新提出的WFCMα算法和FCMα算法,取模糊度m=2,分類數(shù)c=2,截斷閾值α=0.6,其他的初始條件也設(shè)置相同,執(zhí)行上述兩種算法,得到如表1所示的結(jié)果:

        表1 WFCMα算法和FCMα算法對圖1和圖2數(shù)據(jù)集的聚類結(jié)果

        從表1的結(jié)果可知,相對于FCMα算法的平均權(quán)重,WFCMα算法給出了更自然的權(quán)重因子,其聚類準(zhǔn)確率也得到了一定的提升。以上是算法在人工數(shù)據(jù)集中的表現(xiàn),下面進(jìn)行真實(shí)高維數(shù)據(jù)集的實(shí)驗(yàn)。

        實(shí)驗(yàn)二,在Iris數(shù)據(jù)集中分別使用WFCMα算法和FCMα算法,設(shè)定分類數(shù)c=2,截斷閾值α=0.6,其他的初始條件也設(shè)置相同,在模糊指數(shù)m等于1.2,2.0,5.0,10.0的情況下,執(zhí)行上述兩種算法,得到如表2所示的結(jié)果:

        表2 WFCMα算法和FCMα算法對Iris數(shù)據(jù)集的聚類結(jié)果

        表2的數(shù)據(jù)表明,在真實(shí)的數(shù)據(jù)集中,WFCMα算法的表現(xiàn)非常優(yōu)異,在不同的模糊指數(shù)下都取得了更好的準(zhǔn)確率,聚類精度更高。這說明,相比較FCMα算法的平均特征權(quán)重取值,使用Bootstrap方法得到的特征權(quán)重更符合實(shí)際,基于Bootstrap的WFCMα算法也更有效。

        4 結(jié)論

        為了提高FCMα算法的聚類效果,在算法中引入Bootstrap統(tǒng)計(jì)方法,提出了基于Bootstrap的特征加權(quán)FCM改進(jìn)(WFCMα)算法。仿真實(shí)驗(yàn)表明,相對于FCMα算法的平均權(quán)重,WFCMα算法得到的樣本特征權(quán)重更自然,更適用于實(shí)際情況,改進(jìn)后的算法也具有更好的聚類效果,更有效。

        [1]袁正午,魏榮,葉明星.一種適用于基因表達(dá)數(shù)據(jù)的特征加權(quán)FCM算法[J].計(jì)算機(jī)應(yīng)用研究,2010,27(7):2483-2485.

        [2]蔡靜穎,謝福鼎,張永.基于馬氏距離特征加權(quán)的模糊聚類新算法[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(5):198-200.

        [3]劉兵,夏士雄,周勇,韓旭東.基于樣本加權(quán)的可能性模糊聚類算法[J].電子學(xué)報,2012,40(2):371-375.

        [4]段林珊,劉培玉,謝方方.基于模擬退火的樣本加權(quán)FCM算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2013,34(6):2004-2008.

        [5]M.S.Yang,K.L.Wu,J.N.Hsieh,etal.Alpha-cut implemented fuzzy clusteringalgorithmsand switching regressions[J].IEEE Transactionson Systems,Man,and Cybernetics,2008,38(3):588-603.

        [6]B.Efron.Bootstrap Methods--Another Look at the Jackknife[J].The AnnalsofStatistics,1979,7(1):1-26.

        [7]C.L.Blake,C.J.Merz.UCI repository ofmachine learning databases.[http://archive.ics.uci.edu/m l/].Irvine,CA:University of California,Departmentof Information and Computer Science,1998.

        (責(zé)任編輯:潘修強(qiáng))

        Weighted Im proved Fuzzy C-MeansClustering Algorithm based on Bootstrap

        HONGNian-song,F(xiàn)AN Yuan,GUOHua-feng
        (Collegeof Information and Communications,Zhejiang Industry&Trade VocationalCollege,Wenzhou,325003,China)

        To improve the convergence speed of the fuzzy C-means clustering algorithm,alpha-cut factor is introduced by Yang etal.and thealpha-cut threshold fuzzy C-means(FCMα)clustering algorithm is proposed,which accelerates the convergence.However,the FCMαalgorithm also has the problem of poor clustering effect.To solve the problem,the Bootstrap statisticalmethod isused to carry on the featureweighting,and theweighted im proved fuzzy C-mean clustering algorithm based on Bootstrap is proposed.The experimentsshow that the proposed algorithm hashigher clustering accuracy and beenmoreeffective.

        FCM;alpha-cut threshold;Bootstrap;featureweighting

        TP301.6

        A

        1672-0105(2015)03-0057-03

        10.3969/j.issn.1672-0105.2015.03.013

        2015-07-25

        溫州市公益性科技計(jì)劃項(xiàng)目(G20140049),浙江工貿(mào)職業(yè)技術(shù)學(xué)院教師科技創(chuàng)新活動計(jì)劃項(xiàng)目(X140203)

        洪年松,碩士,浙江工貿(mào)職業(yè)技術(shù)學(xué)院講師,主要研究方向:模式識別、圖像處理;范淵,碩士,浙江工貿(mào)職業(yè)技術(shù)學(xué)院講師,主要研究方向:圖像處理;郭華峰,碩士,浙江工貿(mào)職業(yè)技術(shù)學(xué)院講師,主要研究方向:圖像處理、模式識別。

        猜你喜歡
        均值權(quán)重聚類
        權(quán)重常思“浮名輕”
        為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        基于公約式權(quán)重的截短線性分組碼盲識別方法
        均值不等式失效時的解決方法
        均值與方差在生活中的應(yīng)用
        基于改進(jìn)的遺傳算法的模糊聚類算法
        關(guān)于均值有界變差函數(shù)的重要不等式
        一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
        對偶均值積分的Marcus-Lopes不等式
        亚洲欧美日韩精品久久亚洲区色播| 亚洲精品成人av在线| 无码粉嫩虎白一线天在线观看| 久久久久欧洲AV成人无码国产| 亚洲av有码在线天堂| 亚洲伦理一区二区三区| 强迫人妻hd中文字幕| 精品国偷自产在线视频九色| 无尽动漫性视频╳╳╳3d| 国产精品反差婊在线观看| 亚洲专区路线一路线二网| 国产美女爽到喷出水来视频| 欧美丰满熟妇乱xxxxx图片| 欧美日一本| 中文av字幕一区二区三区| 亚洲av无码乱码在线观看裸奔| 岛国AV一区二区三区在线观看| 国产麻豆精品久久一二三 | 亚洲天堂成人av影院| 亚洲国产另类精品| 亚洲欧美日韩高清中文在线| 久久精品伊人久久精品| 免费成人电影在线观看| 内射中出无码护士在线| 超清无码AV丝袜片在线观看| 亚洲av老熟女一区二区三区| 久久成人影院精品777| 欧美在线播放一区二区| 日本精品啪啪一区二区| 久久影院午夜理论片无码| 一个人在线观看免费视频www| 久久国产精品岛国搬运工| 日本黄色3级一区二区| 曰韩人妻无码一区二区三区综合部| 国产麻豆一精品一AV一免费软件| 水蜜桃在线观看一区二区国产| 偷看农村妇女牲交| 欧美一片二片午夜福利在线快| 中文字幕一区二区三在线| 成人影院在线视频免费观看| 精品亚洲欧美无人区乱码|