聚類
- 一種改進K-means聚類的近鄰傳播最大最小距離算法
)0 引 言初始聚類中心對K-means聚類結(jié)果影響極大。經(jīng)典的K-means聚類算法采用隨機選取初始聚類中心的方式,有以下不足:① 易導(dǎo)致聚類結(jié)果的不穩(wěn)定;② 有取得離群點作為初始聚類中心的可能;③ 某些初始聚類中心可能離群體太遠,有的初始聚類中心可能相互之間隔得太近。為克服這些缺點,文獻[1-3]分別采用構(gòu)造最小生成樹、最短路徑加權(quán)屬性圖、最大最小距離MMD(Max-Min Distance)算法計算K-means的初始聚類中心,獲得了一定的效果。但實
計算機應(yīng)用與軟件 2021年7期2021-07-16
- 局部迭代的快速K-means聚類算法
學(xué)習(xí)情況下的數(shù)據(jù)聚類分析研究不僅在理論上取得了長足的發(fā)展,如文獻中提到的ET-SSE[1]、OLDStream[2]、k-MS[3]、SDPC[4]及最小誤差平方和K-means初始聚類中心優(yōu)化[5]等算法,并且還廣泛應(yīng)用于圖形圖像處理[6]、文本分析[7]、視頻處理[8]、網(wǎng)絡(luò)輿情分析[9]、交通導(dǎo)航和各類推薦系統(tǒng)等各個領(lǐng)域。K-means 模型是最基本和最重要的聚類算法之一。該模型在歐幾里得空間定義了包含n個向量元素的數(shù)據(jù)集D={d1,d2,…,dn}
計算機工程與應(yīng)用 2020年13期2020-07-06
- 基于云計算的數(shù)據(jù)挖掘聚類算法研究
云計算的數(shù)據(jù)挖掘聚類算法。數(shù)據(jù)挖掘聚類指的就是盡可能復(fù)用前人已經(jīng)完成的人工識別工作,從而提高工作效率。解決形式上的數(shù)據(jù)挖掘聚類問題并不困難,最簡單直接的辦法就是為各種基本數(shù)據(jù)格式兩兩之間開發(fā)一個轉(zhuǎn)換器,因為流行的數(shù)據(jù)格式數(shù)量不多,并且轉(zhuǎn)換規(guī)則明確,這是一個只要投入一定人力就能解決的問題[2]。但語義上的數(shù)據(jù)挖掘聚類比較復(fù)雜,因此,本文進行基于云計算的數(shù)據(jù)挖掘聚類算法研究。1 基于云計算的數(shù)據(jù)挖掘聚類算法研究考慮到傳統(tǒng)的數(shù)據(jù)挖掘聚類算法已經(jīng)不能滿足對海量數(shù)據(jù)
數(shù)字通信世界 2020年5期2020-06-15
- 一種改進的自適應(yīng)聚類集成選擇方法
朋 李先鋒 徐靜聚類分析的目標是依據(jù)對象之間的相似度對其自動分組/簇,使得簇內(nèi)對象彼此相似度盡量高,而簇間對象彼此相似度盡量低[1?2].雖然已有上千種聚類算法,但沒有一種能有效識別不同大小,不同形狀,不同密度甚至可能包含噪聲的簇[1].已有聚類方法主要分為:1)基于劃分的方法,將聚類問題轉(zhuǎn)化為優(yōu)化問題,并采用不同的優(yōu)化策略,例如,K均值算法(K-means,KM)[3]、非負矩陣分解(Nonnegative matrix factorization,NM
自動化學(xué)報 2018年11期2018-12-05
- 數(shù)種基于SPSS統(tǒng)計工具的聚類算法效率對比
其重要組成部分的聚類分析技術(shù)已廣泛用于數(shù)據(jù)分析、圖像處理、市場研究等多種領(lǐng)域[1-3]。聚類分析根據(jù)數(shù)據(jù)特征將其進行分類,盡可能突顯類與類之間的差距,使類的數(shù)據(jù)差距盡可能相近,即擁有相似特征的數(shù)據(jù)被聚為一類。聚類分析同時也是一種無監(jiān)督的學(xué)習(xí)過程,很難選擇最佳聚類分析方法并達到有效聚類個數(shù)。目前對聚類算法的研究及應(yīng)用集中在兩個方面:(1)聚類算法改進。眾多專家和學(xué)者對數(shù)據(jù)聚類方法算法進行了改進和創(chuàng)新,包括K-means聚類、系統(tǒng)聚類、兩步聚類,以提高算法精確
軟件導(dǎo)刊 2018年11期2018-11-19
- 面向WSN的聚類頭選舉與維護協(xié)議的研究綜述
WSN提出了很多聚類方法,其中,節(jié)約能耗是這類協(xié)議的主要目標。聚類協(xié)議的操作通常分為三個階段:聚類頭選舉、聚類形成以及數(shù)據(jù)傳輸。每一個協(xié)議的主要部分都是聚類頭選舉算法,因為它能定義一個網(wǎng)絡(luò)的能效。除了能效,聚類協(xié)議還有其他的聚類目標,例如覆蓋率和容錯性等。本文旨在綜述WSN中近十年的聚類協(xié)議。首先,本文討論了WSN中的聚類目標和聚類特征分類,然后詳細概述了各個聚類協(xié)議的聚類頭選舉與維護過程,最后統(tǒng)計并分析了這些聚類選舉的聚類特征和選舉聚類頭節(jié)點的考慮因素。
現(xiàn)代計算機 2018年27期2018-10-25
- 改進K均值聚類算法
71)改進K均值聚類算法楊 娟,屈傳慧(西安電子科技大學(xué),陜西 西安 710071)K均值聚類算法因需給定聚類中心數(shù),使得聚類結(jié)果受初始化中心數(shù)的影響很大。介紹了K均值聚類法的概念,并引入層次聚類的概念,采用先分解后合并的思想對K均值法進行了改進,對改進后算法進行了仿真驗證。K均值;聚類算法;分解合并0 引 言聚類,就是將樣本分配到不同類的過程[1]。聚類的基礎(chǔ)為樣本之間的相異性,聚類即尋找樣本之間的相似度對樣本進行劃分。目前,常用的聚類方法包括:劃分聚類
艦船電子對抗 2017年6期2018-01-11
- Background modeling methods in video analysis:A review and comparative evaluation
”[15].目前聚類方式有三類:一是系統(tǒng)聚類,用于對小樣本的對象間聚類以及對變量聚類。二是有序樣品聚類,對有排序次序的樣本的對象間聚類,要求是次序相鄰的對象才能聚為一類。三是動態(tài)聚類,適用于樣本量大時對象間的聚類,一般用k-means法處理。由于內(nèi)部審計一般依靠歷史數(shù)據(jù),提出有價值的工作建議,所以由于涉及內(nèi)部審計的業(yè)務(wù)數(shù)據(jù)量較大,所以本文采用第三種聚類分析方式。The traditional GMM has several advantages.It do
CAAI Transactions on Intelligence Technology 2016年1期2016-04-11
- 高斯加權(quán)的重構(gòu)性K-NN算法研究
高斯加權(quán)距離以及聚類重構(gòu)機制的K-NN文本聚類算法。文章提出K-NN近鄰域的概念,通過高斯加權(quán)的近鄰域算法實施K-NN聚類。利用高斯函數(shù)根據(jù)樣本與聚類中心的距離為樣本賦權(quán),計算聚類距離。基于近鄰域權(quán)重和聚類密度對形成的聚類實施重構(gòu),實現(xiàn)聚類數(shù)目的自適應(yīng)調(diào)整。使用拆分算子拆分稀疏聚類并調(diào)整異常樣本;使用合并算子合并相似聚類。實驗顯示聚類重構(gòu)機制能夠有效地提高聚類的準確率及召回率,增加聚類密度,使得形成的聚類結(jié)果更加合理。文本聚類;K-NN算法;高斯加權(quán);近鄰
中文信息學(xué)報 2015年5期2015-04-21
- 雷達點元聚類算法性能的比較與分析
到的所有點元進行聚類。點元聚類是指將所有檢測到的屬于一個真實目標的雷達點元進行歸類的操作。雷達點元聚類不僅有助于降低檢測虛警概率,同時有助于真實目標的識別以及目標跟蹤點的選取。點元聚類應(yīng)同時具有完備性和排他性,即在將所有屬于同一目標的點元歸為一類的同時,將不屬于該目標的點元排除。本文主要介紹了三種點元聚類常用的算法:圓心半徑聚類算法、邊緣聚類算法和逐點聚類算法,并對這三種算法的聚類效果以及聚類時間進行了比較。1 圓心半徑聚類算法圓心半徑聚類算法是一種較簡單
制導(dǎo)與引信 2015年1期2015-04-20
- 一種新的層次譜聚類算法
475004)聚類算法在數(shù)據(jù)分析和模式識別領(lǐng)域都扮演著重要的角色,其目的是將相似對象聚為一類.在目前計算機視覺的研究中存在的困難是如何有效地提高聚類算法的性能.作為一種有效的數(shù)據(jù)分析方法,聚類算法在計算機視覺、信息檢索及數(shù)據(jù)挖掘等領(lǐng)域都有廣泛的應(yīng)用.聚類搜索策略是當(dāng)前研究的一個熱點.1998年,Iyengar等[1]利用聚類算法已達到對大型數(shù)據(jù)庫進行有效的訪問.2002年,Saux等[2]提出利用圖像聚類可以從更好的角度幫助用戶快速的從大型數(shù)據(jù)庫中找到所
上海理工大學(xué)學(xué)報 2014年1期2014-11-22