亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種快速全局中心模糊聚類方法

        2019-10-30 02:14:39孫冬璞譚潔瓊
        關(guān)鍵詞:模糊聚類

        孫冬璞 譚潔瓊

        摘 要:針對模糊C均值算法對初始中心敏感、容易陷入局部最優(yōu)解,且算法迭代速度慢等問題,依據(jù)模糊聚類的全局中心理論,建立了一種快速全局中心模糊聚類系統(tǒng)模型,并給出了相關(guān)理論分析和算法流程。該模型通過DKC值方案對各數(shù)據(jù)成員進(jìn)行密集度分析來確定初始質(zhì)心,并結(jié)合AM度量提出自定義尋優(yōu)函數(shù),依據(jù)該函數(shù)在算法運(yùn)行的每一個階段來逐一動態(tài)增加聚類中心,直至算法收斂。通過實(shí)驗(yàn)對比和驗(yàn)證,該過程降低了隨機(jī)選取聚類中心對聚類結(jié)果的影響,跳出局部最優(yōu)解,減少計(jì)算量,具有更高的聚類精度和更快的收斂速度。

        關(guān)鍵詞:模糊聚類;全局中心;DKC;AM度量;噪聲點(diǎn)

        DOI:10.15938/j.jhust.2019.04.019

        中圖分類號: TP311

        文獻(xiàn)標(biāo)志碼: A

        文章編號: 1007-2683(2019)04-0110-08

        Abstract:In terms of the problems that the fuzzy C-means algorithm is sensitive to the initial center, easy to fall into the local optimal solution, and the algorithm iteration speed is slow, a rapid global center fuzzy clustering system model is established according to the global center theory of fuzzy clustering, and the relevant theoretical analysis and algorithm process is given. In the model, the initial centroid is determined by the DKC value scheme, and the self-defined optimization function is proposed based on the AM metric. According to this function, the cluster centers are dynamically added one by one to every stage of algorithm operation until the algorithm converges. Through experimental comparison and verification, the process reduces the influence of random selection of cluster centers on clustering results, and jumps out of local optimal solution, reduces computation, and has higher clustering accuracy and faster convergence speed.

        Keywords:fuzzy clustering; global center; DKC; AM metric; noise point

        0 引 言

        模糊C均值聚類[1-2](fuzzy C means clustering,F(xiàn)CM)是眾多模糊聚類的代表,在傳統(tǒng)的硬聚類算法中,每一個數(shù)據(jù)成員只隸屬于一個類別[3],但在真實(shí)世界的數(shù)據(jù)集中,各成員對各自屬于哪一類往往沒有明顯的界限。而FCM算法在執(zhí)行過程中,根據(jù)不同的隸屬度值,每個數(shù)據(jù)成員可以按照一定概率屬于多個類別,F(xiàn)CM通過迭代式爬山算法來尋找問題的最優(yōu)解。然而,該算法具有一定的局限性,比如,對初始條件較為敏感[4],容易陷入局部最優(yōu),易受噪聲點(diǎn)影響,且聚類數(shù)目難以確定,算法執(zhí)行速度慢等缺陷[5-6]。為此,國內(nèi)外學(xué)者做了大量研究。有通過模擬自然進(jìn)化過程的搜索最優(yōu)解的方法,將遺傳算法引入模糊聚類[7-8],避免算法陷入局部最優(yōu)解,但仍存在局部搜索能力較弱、容易陷入“早熟”等缺點(diǎn)。也有將模擬退火算法與FCM相結(jié)合,使算法具有較強(qiáng)的局部搜索能力[9],但模擬退火算法本身對全局搜索空間了解不多,運(yùn)算效率不高。文獻(xiàn)[10]提出了一種非噪聲敏感性FCM算法(INFCM),取消了對隸屬度的限制條件,構(gòu)建出一種增加了懲罰因子的目標(biāo)方程,具有較好的魯棒性,但算法依然不能保證跳出局部極小值、取得全局最優(yōu)解。文[11]提出了快速全局FCM聚類算法,雖然該方法在很多方面彌補(bǔ)了FCM算法的不足,改善了算法性能,但仍容易受噪聲點(diǎn)或孤立點(diǎn)的影響,且聚類精度低、速度慢等問題依然存在。

        針對以上分析,本文提出將動態(tài)規(guī)劃的全局思想和改進(jìn)聚類中心點(diǎn)選取方法結(jié)合,在動態(tài)增加聚類劃分并選取最佳聚類中心的過程中,通過計(jì)算所有數(shù)據(jù)對象的DKC值[12]確定樣本分布密集區(qū)域且排除稀疏區(qū)域,降低外圍孤立點(diǎn)的影響。同時,本文采用AM度量[13]來提高算法穩(wěn)定性,并通過DKC值和AM度量所確定的自定義尋優(yōu)函數(shù)尋找一個周圍數(shù)據(jù)對象點(diǎn)分布比較密集且距離當(dāng)前已有聚類中心都比較遠(yuǎn)的數(shù)據(jù)對象點(diǎn)作為下一個簇的最佳聚類初始中心,該函數(shù)綜合AM度量和DKC值兩者優(yōu)勢,更能快速且準(zhǔn)確的確定出最佳聚類中心,加快算法收斂速度。

        1 相關(guān)工作

        FCM聚類算法是一種基于目標(biāo)函數(shù)優(yōu)化的無監(jiān)督數(shù)據(jù)聚類方法,即一個反復(fù)更新聚類中心及隸屬度從而使目標(biāo)函數(shù)J最小化的過程,其工作原理是:隨機(jī)初始化c個數(shù)據(jù)對象作為初始聚類中心,分別計(jì)算剩余對象與該c個成員的歐氏距離,再根據(jù)距離值將所有對象按照一定概率依次分配給最近的聚類中心,得到隸屬度矩陣,分別計(jì)算新的類內(nèi)成員平均值,再次更新聚類中心。將以上過程不斷重復(fù)至算法收斂,則聚類過程結(jié)束[14]。

        FCM算法雖然應(yīng)用廣泛、靈敏,卻存在對初始值敏感、易陷入局部最優(yōu)的問題,為此,模糊聚類的全局思想應(yīng)運(yùn)而生。

        全局模糊聚類算法不再隨機(jī)地為所有簇分別選取初始聚類中心,而是從一個簇的聚類問題開始,在算法每一次迭代過程中,試圖動態(tài)地添加一個新的聚類中心,具體做法是:從次數(shù)q=1開始,實(shí)現(xiàn)一個簇的聚類劃分,得到一個簇的最佳聚類中心;在尋找q=2簇劃分結(jié)果時,默認(rèn)第一個聚類中心為上一次迭代過程得到的聚類中心,并通過數(shù)據(jù)集中剩余的每一個樣本作為第二個聚類中心的候選集合,然后用FCM算法對候選集合中的所有成員進(jìn)行聚類,得到各自的聚類誤差平方和,最后選擇誤差平方和最小的數(shù)據(jù)點(diǎn)作為第二個最佳聚類中心。在q=2聚類結(jié)果的基礎(chǔ)上解決q=3的聚類劃分,以此類推,得到q=c個簇的聚類問題。應(yīng)用全局思想的模糊聚類算法不再受初始點(diǎn)影響,有效地避免了陷入局部最優(yōu)解的風(fēng)險(xiǎn),提高了聚類精確度。

        2 快速全局中心模糊聚類算法

        2.1 算法的基本思想

        單純的全局模糊聚類算法依然沒有解決c值不確定的問題,且在聚類的每次劃分過程中都需要進(jìn)行N(N為數(shù)據(jù)集合中對象總個數(shù))次算法迭代,整個過程共需進(jìn)行c×N次,導(dǎo)致算法的運(yùn)行速度較慢,其直接原因是在確定下一聚類中心點(diǎn)的過程中,要將數(shù)據(jù)集合中的每一個數(shù)據(jù)對象都作為聚類中心候選點(diǎn)進(jìn)行算法迭代測試。實(shí)際上,數(shù)據(jù)集的各個聚類中心一定會分布在樣本相對密集的區(qū)域,數(shù)據(jù)集合中的外圍孤立點(diǎn)、稀疏區(qū)域?qū)ο蠹筒豢赡艹蔀樽罴丫垲愔行膫溥x點(diǎn),故算法在選取下一聚類中心的過程中,無需將集合中所有數(shù)據(jù)對象都作為初始聚類候選中心進(jìn)行測試運(yùn)算,只要在樣本分布相對密集的區(qū)域?qū)ふ易罴丫垲愔行募纯桑时疚奶岢隽艘环N確定樣本分布密集度的全局中心的模糊聚類算法,基本思想為:

        1)計(jì)算密集度,確定初始中心點(diǎn)

        通過計(jì)算數(shù)據(jù)集中所有對象的密集程度,選擇密集度最大的數(shù)據(jù)成員作為第一個聚類中心,并從質(zhì)心備選集中刪除稀疏區(qū)域樣本點(diǎn)。

        2)重新劃分?jǐn)?shù)據(jù)對象,更新聚類中心

        對于當(dāng)前確定的聚類中心,將數(shù)據(jù)集中的所有數(shù)據(jù)對象分配到距離當(dāng)前已有聚類中心最近的簇,并更新聚類中心。

        3)判斷終止條件

        前后兩次目標(biāo)函數(shù)差值的絕對值ΔJ小于等于給定的某個閾值ε時,算法停止,返回結(jié)果。

        4)選取下一個聚類中心

        在質(zhì)心備選集中按照某種自定義優(yōu)化規(guī)則選擇下一個聚類中心,而不是把備選集中所有對象依次進(jìn)行測試。

        2.3 聚類中心的動態(tài)選擇

        在傳統(tǒng)算法中,采用歐氏距離度量樣本之間的相似性,但歐氏距離的度量方式只對同尺寸、同密度、同形狀等相同信息且分布均勻的理想化數(shù)據(jù)具有穩(wěn)定性。然而,現(xiàn)實(shí)數(shù)據(jù)往往都具有不同的特征,故歐氏距離度量方式使算法很容易受到外圍孤立點(diǎn)、噪聲點(diǎn)的影響,造成聚類結(jié)果的不穩(wěn)定。本文在更新聚類中心和隸屬度的過程中,利用基于非歐氏距離度量方式—AM度量[13][16]的單調(diào)有界性降低外圍點(diǎn)或噪聲點(diǎn)對確定聚類中心過程的影響,來增強(qiáng)聚類算法的穩(wěn)定性和魯棒性,并減少算法的迭代次數(shù)。

        4 結(jié) 語

        針對FCM聚類算法對初始聚類中心選取敏感,易受噪聲點(diǎn)影響,以及聚類最終結(jié)果容易陷入局部最優(yōu)的問題,本文提出了ADGFCM算法,該算法采用全局中心聚類思想,結(jié)合DKC值與AM度量,并提出自定義尋優(yōu)函數(shù)fi,全面考慮了所有數(shù)據(jù)對象點(diǎn)的分布情況,緩解對噪聲點(diǎn)敏感的問題。選取一個周圍數(shù)據(jù)對象分布比較密集,且距離現(xiàn)有聚類中心都比較遠(yuǎn)的數(shù)據(jù)對象點(diǎn)作為下一個最佳聚類中心,不但使聚類結(jié)果趨于穩(wěn)定,提高聚類精確度,而且減少了算法累加過程中的計(jì)算負(fù)擔(dān),加快聚類速度,在一定程度上跳出局部最優(yōu)。實(shí)驗(yàn)結(jié)果表明,ADGFCM算法相比FCM算法和其他改進(jìn)后的FCM算法精確度均有所提高,運(yùn)行時間較短,聚類效果較為穩(wěn)定,在實(shí)際數(shù)據(jù)集上有較好的應(yīng)用價(jià)值。

        參 考 文 獻(xiàn):

        [1] SANAKAL R, JAYAKUMARI T. Prognosis of Diabetes Using Data Mining Approach-fuzzy C Means Clustering and Support Vector Machine[J]. Int. J. Comput. Trends Technol.(IJCTT), 2014, 11(2): 94.

        [2] LIU L, SUN S Z, YU H, et al. A Modified Fuzzy C-Means (FCM) Clustering Algorithm and Its Application on Carbonate Fluid Identification[J]. Journal of Applied Geophysics, 2016, 129:28.

        [3] 吳明陽, 張芮, 岳彩旭,等. 應(yīng)用K-means聚類算法劃分曲面及實(shí)驗(yàn)驗(yàn)證[J]. 哈爾濱理工大學(xué)學(xué)報(bào), 2017(1):54.

        [4] 武俊峰, 艾嶺. 一種基于改進(jìn)聚類算法的模糊模型辨識[J]. 哈爾濱理工大學(xué)學(xué)報(bào), 2010, 15(3):1.

        [5] NAYAK J, NAIK B, KANUNGO D P, et al. A Hybrid Elicit Teaching Learning Based Optimization with Fuzzy C-means (ETLBO-FCM) Algorithm for Data Clustering[J]. Ain Shams Engineering Journal, 2016(5):148.

        [6] FILHO T M S, PIMENTEL B A, SOUZA R M C R, et al. Hybrid Methods for Fuzzy Clustering Based on Fuzzy C-means and Improved Particle Swarm Optimization[J]. Expert Systems with Applications, 2015, 42(17):6315.

        [7] PAN X, LIU P, REN M, et al. Optimization of fuzzy C-means based on OBL-genetic algorithm[C]//Natural Computation, Fuzzy Systems and Knowledge Discovery (ICNC-FSKD), 2016 12th International Conference on. IEEE, 2016: 109.

        [8] YE A X, JIN Y X. A Fuzzy C-Means Clustering AlgorithmBasedon Improved Quantum Genetic Algorithm[J]. International Journal of Database Theory and Application, 2016, 9(1): 227.

        [9] LIU P,DUAN L, CHI X, et al. An Improved Fuzzy C-means Clustering Algorithm Based on Simulated Annealing[C]//Fuzzy Systems and Knowledge Discovery (FSKD), 2013 10th International Conference on. IEEE, 2013: 39.

        [10]陳加順, 皮德常. 一種非噪聲敏感性的模糊C均值聚類算法[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2014, 35(6):1427.

        [11]WANG W, ZHANG Y, LI Y, et al. The Global Fuzzy C-means Clustering Algorithm[C]//2006 6th World Congress on Intelligent Control and Automation. IEEE, 2006, 1:3604.

        [12]任培花, 王麗珍. 不確定域環(huán)境下基于DKC值改進(jìn)的K-means聚類算法[J]. 計(jì)算機(jī)科學(xué), 2013, 40(4):181.

        [13]WU K L, YANG M S. Alternative C-means Clustering Algorithms[J]. Pattern Recognition, 2002, 35(10):2267.

        [14]李遠(yuǎn)成, 陰培培, 趙銀亮. 基于模糊聚類的推測多線程劃分算法[J]. 計(jì)算機(jī)學(xué)報(bào), 2014, 37(3):580.

        [15]謝娟英, 蔣帥, 王春霞,等. 一種改進(jìn)的全局K-均值聚類算法[J]. 陜西師范大學(xué)學(xué)報(bào):自然科學(xué)版, 2010,38(2):18.

        [16]ZHANG Dao-qiang, Chen. A Comment on “Alternative C-means Clustering Algorithms”[J]. Pattern Recognition, 2004, 37(2):173.

        [17]RASTGARPOUR M, ALIPOUR S, SHANBEHZADEH J. Improved Fast Two Cycle by using KFCM Clustering for Image Segmentation[J]. Lecture Notes in Engineering & Computer Science, 2012, 2195(1).

        [18]AHMAD A,DEY L. A K-mean Clustering Algorithm for Mixed Numeric and Categorical Data[J]. Data & Knowledge Engineering, 2007, 63(2):503.

        [19]BEZDEK J C. A Physical Interpretation of Fuzzy ISODATA[J]. IEEE Transactions on Systems Man & Cybernetics, 1976, 6(5):615.

        [20]VANI H Y,ANUSUYA M A. Isolated Speech Recognition Using Fuzzy C Means Technique[C]// International Conference on Emerging Research in Electronics, Computer Science and Technology. IEEE, 2016:352-357.

        (編輯:關(guān) 毅)

        猜你喜歡
        模糊聚類
        模塊化產(chǎn)品族的共享模塊篩選方法
        隴中地區(qū)農(nóng)業(yè)氣候模糊聚類區(qū)劃
        基于MATLAB回采巷道圍巖分類可視化系統(tǒng)開發(fā)及應(yīng)用
        模糊聚類在區(qū)域環(huán)境質(zhì)量評價(jià)中的運(yùn)用
        公路貨運(yùn)樞紐布局方法研究
        科技視界(2016年13期)2016-06-13 10:14:21
        模糊聚類算法下的手寫體數(shù)字識別
        基于模糊聚類的寧波大紅鷹學(xué)院教學(xué)質(zhì)量評價(jià)研究
        配電網(wǎng)故障尋址技術(shù)的研究
        科技視界(2015年28期)2015-10-14 11:48:59
        最大生成樹聚類算法研究
        廣東省人口老齡化的時空演化及成因分析
        一二三区无线乱码中文在线| 欧美成人三级网站在线观看 | 成人精品视频一区二区三区尤物| 好男人视频在线视频| 国产91在线|亚洲| 亚洲第一大av在线综合| 欧美奶涨边摸边做爰视频 | 人妻无码第一区二区三区| 亚洲av无码之国产精品网址蜜芽| 综合精品欧美日韩国产在线| 久久精品人妻嫩草av蜜桃| 免费一区二区高清不卡av| 亚洲av无码久久精品狠狠爱浪潮| 国产一区二区三区在线观看精品| 538在线视频| 国产av一区二区毛片| 三年中文在线观看免费大全| 在线国产小视频| 熟女人妻中文字幕一区| 亚洲综合在线观看一区二区三区| 久久久久亚洲av成人无码| 一级免费毛片| 亚洲乱码中文字幕综合| 国产精品专区第一页天堂2019| 久久超碰97人人做人人爱| 岛国成人在线| 日本女优中文字幕有码| 极品人妻被黑人中出种子| 亚洲国产成人久久综合电影 | 亚洲一区二区三区日本久久九| 色噜噜av亚洲色一区二区| 中文毛片无遮挡高潮| 国产色婷亚洲99精品av网站| 日本真人添下面视频免费| 久久久久久人妻一区二区三区| 高清高速无码一区二区| 女优av一区二区在线观看| 国产成人亚洲精品无码av大片| 五月天综合网站| 人妻中出中文字幕在线| 18禁在线永久免费观看|