胡淼淼 劉宏志 張 鐸
1(北京工商大學(xué)計算機(jī)與信息工程學(xué)院 北京 100048)2(北京工商大學(xué)食品安全大數(shù)據(jù)技術(shù)北京市重點實驗室 北京 100048)3(北京博時遠(yuǎn)信技術(shù)有限公司 北京 100070)
在數(shù)據(jù)挖掘中,聚類算法可以根據(jù)數(shù)據(jù)的屬性(對象之間的距離)將數(shù)據(jù)劃分為不同的類。目前,主要的聚類算法可以劃分為以下幾類:基于劃分的方法、基于密度的方法、基于網(wǎng)格的方法以及基于層次的方法[1-4]。其中,基于密度的聚類算法主要的目標(biāo)是尋找被低密度區(qū)域分離的高密度區(qū)域,與其他聚類算法不同的是基于密度的聚類算法可以在具有噪聲數(shù)據(jù)的空間數(shù)據(jù)庫中發(fā)現(xiàn)任意形狀的聚類。本文對基于密度的聚類算法DBSCAN的原理進(jìn)行了分析并對算法進(jìn)行了優(yōu)化,使得算法能自適應(yīng)確定參數(shù)滿足GSM-R鐵塔監(jiān)測系統(tǒng)中傾角傳感器的校正需要。
1.1 GSM-R鐵塔監(jiān)測
GSM-R系統(tǒng)是我國針對鐵路運(yùn)輸?shù)膶嶋H需要而專門設(shè)計的綜合專用數(shù)字通信系統(tǒng)[5-6]。近年來,隨著鐵路無線通信技術(shù)的飛速發(fā)展,越來越多的GSM-R通信鐵塔被部署應(yīng)用。GSM-R通信鐵塔監(jiān)測系統(tǒng)結(jié)合了物聯(lián)網(wǎng)技術(shù),使用傾角傳感器、氣象傳感器、電磁傳感器和沉降傳感器等多種傳感器監(jiān)測鐵塔狀態(tài),保證了GSM-R鐵塔的正常使用[7]。其中,傾角傳感器是直接監(jiān)測鐵塔的傾斜狀態(tài)的傳感器,在環(huán)境惡劣的情況下,傾角傳感器能及時發(fā)現(xiàn)鐵塔傾斜,方便維護(hù)人員及時加固鐵塔,避免傾倒影響鐵塔的正常使用。但是,傾角傳感器在人工安裝過程中會出現(xiàn)一定的角度偏移,因此在使用前需對傾角傳感器進(jìn)行校正。
目前,GSM-R鐵塔監(jiān)測系統(tǒng)多采用在穩(wěn)定條件下傾角傳感器采集數(shù)據(jù)的平均值作為鐵塔中心角度偏移值進(jìn)行傳感器校正。由于實際應(yīng)用中的傾角傳感器在穩(wěn)定條件下仍會受鐵塔塑性形變的影響,采集到部分噪聲數(shù)據(jù),并且噪聲數(shù)據(jù)會影響鐵塔中心角度偏移值的計算結(jié)果,進(jìn)而影響告警數(shù)據(jù)的產(chǎn)生,造成嚴(yán)重的后果。因此,本文提出使用DBSCAN算法代替平均值計算法進(jìn)行傾角傳感器的校正,通過對算法進(jìn)一步優(yōu)化使其可以自適應(yīng)確定所需參數(shù)適用于GSM-R鐵塔監(jiān)測系統(tǒng)的傾角傳感器校正需要。優(yōu)化后的DBSCAN算法可以通過密度聚類避免噪聲數(shù)據(jù)的影響,對聚類結(jié)果計算聚類中心可獲得鐵塔中心角度偏移值對傾角傳感器進(jìn)行校正。
1.2 DBSCAN算法基本原理
基于密度的聚類算法DBSCAN算法是由MARTIN等[8-10]提出的一種基于密度的聚類算法,用來尋找被低密度區(qū)域分離的高密度區(qū)域。該算法將具有指定要求密度的相應(yīng)區(qū)域劃分為簇,并在具有噪聲數(shù)據(jù)的數(shù)據(jù)庫樣本中發(fā)現(xiàn)任意形狀的簇,其對簇的定義即為密度相連點的最大集合。
DBSCAN算法使用之初需要用戶輸入?yún)?shù)Eps值和MinPts值。其中,Eps為鄰域半徑參數(shù),MinPts為鄰域密度閾值。DBSCAN算法基本定義如下。
定義1以輸入數(shù)據(jù)集內(nèi)任意一個數(shù)據(jù)對象為圓心,Eps為半徑的球形區(qū)域內(nèi)所有數(shù)據(jù)對象的集合即為Eps鄰域。
定義2在Eps鄰域內(nèi)的數(shù)據(jù)對象個數(shù)大于或等于MinPts的數(shù)據(jù)對象為核心點。在Eps鄰域內(nèi)的對象數(shù)小于MinPts,但是在核心點Eps鄰域內(nèi)的數(shù)據(jù)對象為邊界點。
定義3數(shù)據(jù)對象Pi在核心點Pj的Eps鄰域內(nèi),則Pi到Pj直接密度可達(dá)。
定義4若存在一個對象鏈P1,P2,…,Pn,且有Pi+1到Pi直接密度可達(dá),則P1到Pn密度可達(dá)。
定義5基于密度可達(dá)性的最大的密度相連對象的集合稱為簇。數(shù)據(jù)集中不屬于任何簇的數(shù)據(jù)對象即為噪聲點。
DBSCAN通過檢查數(shù)據(jù)集中每個對象的Eps鄰域來尋找聚類。如果一個點P的Eps鄰域包含多于MinPts個數(shù)據(jù)對象,則創(chuàng)建一個P作為核心對象的新簇。然后,DBSCAN反復(fù)地尋找從這些核心對象直接密度可達(dá)的對象,這個過程涉及密度可達(dá)簇的合并。當(dāng)沒有新的點可以被添加到任何簇時,聚類過程結(jié)束。
1.3 算法應(yīng)用分析
在傳統(tǒng)GSM-R鐵塔監(jiān)測系統(tǒng)中,傾角傳感器的校正是由傳感器在穩(wěn)定狀態(tài)下采集的數(shù)據(jù)取平均值來確定的。根據(jù)中國鐵路總公司印發(fā)的《鐵路通信鐵塔監(jiān)測系統(tǒng)技術(shù)條件》可知,穩(wěn)定狀態(tài)即風(fēng)速為零級(風(fēng)速小于等于0.2 m/s)時的狀態(tài),此時風(fēng)速不能對鐵塔傾斜造成明顯影響。研究表明鐵塔在風(fēng)載荷影響下的隨機(jī)振動不會立刻停止[11],當(dāng)傳感器采集校正所需零級風(fēng)數(shù)據(jù)時,由于隨機(jī)振動的影響傳感器仍會采集到部分噪聲數(shù)據(jù)。因此,使用平均值計算鐵塔中心偏移值對傾角傳感器進(jìn)行校正并不準(zhǔn)確。
穩(wěn)定狀態(tài)下傾角傳感器采集數(shù)據(jù)較為集中,從中心向外側(cè)數(shù)據(jù)密度逐漸降低,噪聲數(shù)據(jù)周圍數(shù)據(jù)密度最低。DBSCAN算法是一種基于密度的空間聚類算法,該算法可以忽略噪聲數(shù)據(jù)的影響對鐵塔中心區(qū)域數(shù)據(jù)進(jìn)行聚類,聚類中心即為鐵塔中心偏移值。此外,受風(fēng)向影響鐵塔中心偏移方向不確定,運(yùn)動軌跡沒有規(guī)律,因此采集數(shù)據(jù)的高密度區(qū)域形狀并不固定。與傳統(tǒng)的基于劃分方法的聚類算法和基于層次方法的聚類的凸形聚類簇算法不同,DBSCAN算法的聚類簇可以是任意形狀的。因此DBSCAN算法適用于GSM-R鐵塔監(jiān)測系統(tǒng)的傾角傳感器校正。
但是,DBSCAN算法在使用過程中聚類對象的密度由事先指定的兩個參數(shù)Eps(鄰域半徑)和MinPts(鄰域密度閾值)來確定。用戶需要在沒有先驗知識的情況下設(shè)定這兩個參數(shù),DBSCAN算法對參數(shù)十分敏感,這兩個參數(shù)的選擇將直接影響算法最終的聚類結(jié)果質(zhì)量。而GSM-R鐵塔監(jiān)測系統(tǒng)通常能監(jiān)測2 000個左右的鐵塔,這些鐵塔地理位置不同,環(huán)境不同甚至鐵塔種類也不同,因此在GSM-R鐵塔監(jiān)測數(shù)據(jù)集中不同鐵塔的數(shù)據(jù)密度不同,使用全局參數(shù)難以準(zhǔn)確計算出不同鐵塔的中心角度偏移值。本文對DBSCAN算法進(jìn)行了優(yōu)化,使其可以針對不同鐵塔數(shù)據(jù)集自適應(yīng)確定Eps和MinPts參數(shù),從而可以準(zhǔn)確計算各個鐵塔的中心角度偏移值,對傾角傳感器進(jìn)行校正。
針對DBSCAN算法的參數(shù)敏感問題,已有不少學(xué)者提出了解決辦法。OPTICS算法通過對數(shù)據(jù)集中的數(shù)據(jù)對象進(jìn)行排序得到一個有序的對象列表(cluster-ordering),根據(jù)對象列表的信息對數(shù)據(jù)對象進(jìn)行分類進(jìn)而提取聚類[12]。文獻(xiàn)[13]根據(jù)數(shù)據(jù)對象在不同維度的密度分布動態(tài)設(shè)置Eps參數(shù)。文獻(xiàn)[14]提出了動態(tài)近鄰概念,即參數(shù)隨數(shù)據(jù)對象的密度動態(tài)變化。文獻(xiàn)[15]基于密度最大區(qū)域中心點對DBSCAN算法進(jìn)行了改進(jìn)。文獻(xiàn)[16]通過分析數(shù)據(jù)的統(tǒng)計特性自適應(yīng)確定參數(shù)。本文在DBSCAN算法及其各類改進(jìn)算法的研究基礎(chǔ)上,根據(jù)GSM-R鐵塔監(jiān)測系統(tǒng)的使用需要對DBSCAN算法進(jìn)行了優(yōu)化。通過Canopy粗聚類確定算法所需參數(shù)Eps值,然后根據(jù)統(tǒng)計學(xué)方法確定參數(shù)MinPts,使得算法可以根據(jù)不同數(shù)據(jù)集自適應(yīng)確定參數(shù),解決了DBSCAN算法的參數(shù)敏感問題,提高了聚類效果。
2.1 鄰域半徑確定方法
根據(jù)DBSCAN算法的原理可知,算法根據(jù)數(shù)據(jù)對象之間的距離確定數(shù)據(jù)對象之間的親疏關(guān)系,Eps參數(shù)的選擇將直接影響最后的聚類效果。在參數(shù)MinPts一定的情況下,參數(shù)Eps選擇越小,則聚類結(jié)果中簇的密度越高,但會導(dǎo)致本該完整的簇被拆分為多個簇,大量的數(shù)據(jù)對象被錯誤的標(biāo)記為噪聲數(shù)據(jù)。參數(shù)Eps選擇越大,則聚類結(jié)果中簇的密度會降低,同時會導(dǎo)致噪聲數(shù)據(jù)被歸入簇中,無法成功分離噪聲數(shù)據(jù)。
在數(shù)據(jù)對象分布不均勻的情況下,對任意一個數(shù)據(jù)對象,將距離該數(shù)據(jù)對象最近的多個數(shù)據(jù)對象的距離平均值作為該對象處的密度衡量標(biāo)準(zhǔn)。符合聚類需要的距離平均值將是需要獲取的Eps參數(shù)值。設(shè)輸入數(shù)據(jù)集D={P1,P2,…,Pn}。Pi為D中任意一個數(shù)據(jù)對象,計算數(shù)據(jù)對象Pi到D的子集S={P1,P2,…,Pi-1,Pi+1,…,Pn}中所有數(shù)據(jù)對象之間的距離。將距離按遞增排序后存入集合R={r1,r2,…,rk-1,rk,rk+1,…,rn-1}。其中,rk被稱為K-距離即數(shù)據(jù)對象Pi到除自身外所有數(shù)據(jù)對象之間距離第k近的距離。數(shù)據(jù)對象Pi到其他數(shù)據(jù)對象之間距離的平均值為:
(1)
Canopy算法是一種快速簡單但是并不準(zhǔn)確的聚類算法,多用于數(shù)據(jù)集的粗劃分[17-18]。本文使用該算法進(jìn)行數(shù)據(jù)集的粗聚類,根據(jù)粗聚類結(jié)果獲取合適的Eps值。Canopy算法使用之初要定義兩個距離值T1和T2,為了確定這兩個距離值,首先要在輸入數(shù)據(jù)集D中任選一個數(shù)據(jù)對象記為P,并將其移出數(shù)據(jù)集D。計算數(shù)據(jù)對象P的K-距離集合并求平均值。根據(jù)計算結(jié)果做如下設(shè)定:
(2)
然后按照K-距離集合將數(shù)據(jù)集D中所有距離小于T1的數(shù)據(jù)對象加入以P為中心的canopy類,將距離小于T2的所有數(shù)據(jù)對象移除數(shù)據(jù)集D。執(zhí)行完一次后重新選擇一個數(shù)據(jù)對象,T1和T2不變,重復(fù)上述步驟,直至數(shù)據(jù)集D為空。
上述步驟執(zhí)行完成后會獲得多個canopy類,這些類中會出現(xiàn)部分?jǐn)?shù)據(jù)重疊的現(xiàn)象。因此Canopy算法的劃分是不準(zhǔn)確的,但是分布雜亂的數(shù)據(jù)對象經(jīng)過大致劃分可以確定數(shù)據(jù)密度分布情況。對多個canopy類按數(shù)據(jù)對象數(shù)目進(jìn)行排序,數(shù)目最多的canopy類的數(shù)據(jù)密度相比較其他類更接近數(shù)據(jù)集的最大密度。在該類中任選一個數(shù)據(jù)對象,計算其K-距離平均值,該值即為所求Eps參數(shù)值。
2.2 鄰域密度閾值確定方法
在參數(shù)Eps已經(jīng)確定的情況下,參數(shù)MinPts選擇越大,聚類結(jié)果中簇的密度越高,但是會減少核心點的數(shù)量,將完整的自然簇分割。參數(shù)MinPts選擇較小會使大量數(shù)據(jù)對象被錯誤的標(biāo)記為核心點,導(dǎo)致噪聲數(shù)據(jù)無法正確標(biāo)識。本文通過統(tǒng)計數(shù)據(jù)集D中所有數(shù)據(jù)對象在其Eps鄰域內(nèi)的數(shù)據(jù)對象的個數(shù),并通過求數(shù)學(xué)期望得到MinPts參數(shù)值表示為:
(3)
式中:Qi表示數(shù)據(jù)對象Pi其Eps鄰域內(nèi)的數(shù)據(jù)對象的個數(shù)。
綜上,本文在對DBSCAN算法及其各類改進(jìn)算法的研究基礎(chǔ)上,結(jié)合對鐵塔數(shù)據(jù)集統(tǒng)計分析,使用Canopy算法粗聚類確定算法所需參數(shù)Eps值,根據(jù)統(tǒng)計學(xué)方法確定參數(shù)MinPts值,使得算法可根據(jù)不同數(shù)據(jù)集自適應(yīng)確定參數(shù),解決了DBSCAN算法的參數(shù)敏感問題。將計算所得參數(shù)Eps和MinPts值代入DBSCAN算法進(jìn)行聚類計算,所得聚類結(jié)果按照密度大小進(jìn)行排序,選擇密度最高的聚類簇計算簇中心即為穩(wěn)定狀態(tài)下鐵塔中心偏移值。其余聚類簇為鐵塔在火車共振等外力影響下的偏移中心,等同于噪聲數(shù)據(jù)。
本文中采用的實驗設(shè)備如圖1所示,左側(cè)儀器是串口輸出型雙軸傾角傳感器,內(nèi)置高精度16 bit A/D 差分轉(zhuǎn)換器,通過5 階濾波算法,最終輸出雙方向的傾角值,分別是水平方向X軸的傾角值和Y軸的傾角值。圖1右側(cè)儀器為推動裝置用于檢測傳感器是否準(zhǔn)確。
圖1 實驗設(shè)備圖
傾角傳感器輸出的水平方向X軸的傾角值和Y軸的傾角值是角度偏移值,并不能直接為DBSCAN算法所用,需要將傾角轉(zhuǎn)換為偏離X軸方向的實際距離值和偏移Y軸方向的實際距離值,方便DBSCAN算法按照密度聚類,具體計算模型如圖2所示。
圖2 角度轉(zhuǎn)換距離計算模型
在計算過程中設(shè)塔高為h,指塔頂?shù)借F塔底座中心的距離。在圖2中,鐵塔底座中心為點O,塔頂為A,OA之間距離為塔高h(yuǎn)。α為X軸方向傾斜角度即∠AOB,β為Y軸方向傾斜角度即∠AOC,θ為垂直方向?qū)嶋H傾斜角度即∠AOD,則有:
(4)
X軸方向偏移距離為:
x=h·cosθ·tanα
(5)
Y軸方向偏移距離為:
y=h·cosθ·tanβ
(6)
經(jīng)過上述計算將得出塔頂?shù)木唧w偏移位置即為塔頂?shù)膶嶋H距離坐標(biāo)(x,y),垂直狀態(tài)下坐標(biāo)為(0,0)。將傾角傳感器采集角度值全部轉(zhuǎn)換為距離值后使用優(yōu)化后的DBSCAN算法對傾角傳感器在穩(wěn)定狀態(tài)下采集的數(shù)據(jù)進(jìn)行聚類計算,求得具體的鐵塔中心距離偏移值,最后將鐵塔中心的距離偏移值轉(zhuǎn)換成角度偏移值對傾角傳感器進(jìn)行校準(zhǔn)。
本文所使用所有數(shù)據(jù)均是使用圖1所示傾角傳感器在四個采集點采集到的實際數(shù)據(jù)。四個采集點分別為4097號鐵塔(濟(jì)南西)、4099號鐵塔(曲阜東)、4100號鐵塔(滕州東)和4101號鐵塔(棗莊)。數(shù)據(jù)采集信息如表1所示,傳感器每250 ms采集一次數(shù)據(jù)。數(shù)據(jù)集包含時間、風(fēng)速、風(fēng)向、X軸傾角和Y軸傾角等信息。
表1 總數(shù)據(jù)集基本信息
本文首先使用優(yōu)化后的DBSCAN算法分別對以上四個數(shù)據(jù)集中全部零級風(fēng)數(shù)據(jù)計算鐵塔中心角度偏移值,計算結(jié)果如表2所示。通過比較計算結(jié)果發(fā)現(xiàn)4 099號數(shù)據(jù)集的DBSCAN算法計算所得鐵塔中心角度偏移值與平均值計算結(jié)果差距較大,其他數(shù)據(jù)集計算結(jié)果差距相對較小,其中4101號數(shù)據(jù)集計算結(jié)果差距最小。通過對數(shù)據(jù)集分析發(fā)現(xiàn)4099號數(shù)據(jù)集在2016年6月21日風(fēng)速變化較大,下午5時最大風(fēng)級達(dá)8級(最大風(fēng)速17.3 m/s),根據(jù)規(guī)定已達(dá)到大風(fēng)預(yù)警條件,數(shù)據(jù)集中零級風(fēng)總數(shù)最少且受大風(fēng)影響噪聲數(shù)據(jù)較多。而4101號數(shù)據(jù)集全天風(fēng)速相對穩(wěn)定,且最大風(fēng)級不超過3級(最大風(fēng)速5.4 m/s),數(shù)據(jù)集中零級風(fēng)數(shù)據(jù)較多且噪聲數(shù)據(jù)最少。上述結(jié)論表明,噪聲數(shù)據(jù)會對中心角度偏移值的計算產(chǎn)生較大影響,需要進(jìn)一步驗證DBSCAN算法分離噪聲數(shù)據(jù)的能力。
表2 總數(shù)據(jù)集計算結(jié)果
為了確定改進(jìn)DBSCAN算法能有效分離噪聲數(shù)據(jù)求得準(zhǔn)確鐵塔中心角度偏移值,本文人工從數(shù)據(jù)集中分離出最大風(fēng)級不超過2級(最大風(fēng)速3.3 m/s)的5個小時的連續(xù)數(shù)據(jù),人工排除了受大風(fēng)影響偏移較大的噪聲數(shù)據(jù),節(jié)選數(shù)據(jù)集信息如表3所示。分別使用改進(jìn)DBSCAN算法和平均值計算法對節(jié)選數(shù)據(jù)進(jìn)行計算,計算結(jié)果如表4所示。通過比較計算結(jié)果發(fā)現(xiàn)改進(jìn)DBSCAN算法計算所得鐵塔中心角度偏移值與表2計算結(jié)果差距較小,最大偏差為0.029°。而平均值計算所得結(jié)果與表2相比仍有比較大的差距,最大偏差已超過0.567°,根據(jù)《鐵路通信鐵塔監(jiān)測系統(tǒng)技術(shù)條件》規(guī)定鐵塔中心偏移超過0.567°將會產(chǎn)生提示告警,因此可以證明平均值計算法易受噪聲數(shù)據(jù)影響,不能準(zhǔn)確計算出鐵塔中心角度偏移值容易產(chǎn)生誤差告警。此外,表4平均值計算結(jié)果更接近于改進(jìn)DBSCAN算法計算所得結(jié)果。綜上所述,改進(jìn)DBSCAN算法受噪聲數(shù)據(jù)影響較小,能夠根據(jù)不同數(shù)據(jù)集自適應(yīng)確定合適的參數(shù)Eps值和MinPts值,分離出絕大部分噪聲數(shù)據(jù),求得相對準(zhǔn)確的鐵塔中心角度偏移值對傾角傳感器進(jìn)行校正。
表3 節(jié)選數(shù)據(jù)集基本信息
表4 節(jié)選數(shù)據(jù)集計算結(jié)果
GSM-R鐵塔監(jiān)測系統(tǒng)保證了鐵路通信鐵塔的正常使用,其中傾角傳感器的監(jiān)測結(jié)果直接反映了鐵塔的傾斜狀態(tài)。為了避免傾角傳感器受到人工安裝誤差的影響,本文提出使用DBSCAN算法代替平均值計算法進(jìn)行傾角傳感器的校正。通過研究DBSCAN算法的基本原理,結(jié)合其他學(xué)者的研究工作解決了該算法的參數(shù)敏感問題,使其適用于GSM-R鐵塔監(jiān)測系統(tǒng)的使用需要。實際數(shù)據(jù)測試結(jié)果表明,優(yōu)化后的DBSCAN算法能根據(jù)不同數(shù)據(jù)集自適應(yīng)確定所需參數(shù),不受噪聲數(shù)據(jù)的影響,同時并未增加算法的處理時間,計算結(jié)果與全站儀所測實際數(shù)據(jù)對比準(zhǔn)確率可達(dá)98.57%,適用于傾角傳感器校正需要。
參考文獻(xiàn)
[1] Dharni C, Bnasal M. An improvement of DBSCAN Algorithm to analyze cluster for large datasets[C]// Innovation and Technology in Education. IEEE, 2013:42-46.
[2] Rodriguez A, Laio A. Machine learning. Clustering by fast search and find of density peaks[J]. Science, 2014, 344(6191):1492.
[3] 孫吉貴, 劉杰, 趙連宇. 聚類算法研究[J]. 軟件學(xué)報, 2008, 19(1):48-61.
[4] Smiti A, Eloudi Z. Soft DBSCAN: Improving DBSCAN clustering method using fuzzy set theory[C]// The, International Conference on Human System Interaction. IEEE, 2013:380-385.
[5] 車顏澤. 高速鐵路GSM-R無線通信系統(tǒng)簡介[J]. 華東科技:學(xué)術(shù)版, 2016(7):307-307.
[6] Tokody D, Maros D, Schuster G, et al. Communication-based intelligent railway- Implementation of GSM-R system in Hungary[C]// IEEE, International Symposium on Applied Machine Intelligence and Informatics. IEEE, 2016:99-104.
[7] 江文丹, 李春, 吳宏松. GSM-R綜合監(jiān)測系統(tǒng)在高鐵中的應(yīng)用研究[J]. 鐵道通信信號, 2015, 51(S1):70-72.
[8] Ester M, Kriegel H P, Sander J, et al. A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise[C]// International Conference on Knowledge Discovery and Data Mining. AAAI Press, 1996:226-231.
[9] Borah B, Bhattacharyya D K. An improved sampling-based DBSCAN for large spatial databases[C]// International Conference on Intelligent Sensing and Information Processing. IEEE, 2004:92-96.
[10] 馮少榮, 肖文俊. 基于密度的DBSCAN聚類算法的研究及應(yīng)用[J]. 計算機(jī)工程與應(yīng)用, 2007, 43(20):216-221.
[11] 潘峰, 李顯鑫, 侯中偉,等. 1000kV特高壓山區(qū)單回路輸電塔風(fēng)振特性研究[J]. 電力建設(shè), 2013, 34(8):64-68.
[12] Ankerst M, Breunig M M, Kriegel H P, et al. OPTICS: ordering points to identify the clustering structure[J]. Acm Sigmod Record, 1999, 28(2):49-60.
[13] Jahirabadkar S, Kulkarni P. Algorithm to determine ε -distance parameter in density based clustering[J]. Expert Systems with Applications, 2014, 41(6):2939-2946.
[14] 李陽, 馬驪, 樊鎖海. 基于動態(tài)近鄰的DBSCAN算法[J]. 計算機(jī)工程與應(yīng)用, 2016, 52(20):80-85.
[15] 范敏, 李澤明, 石欣. 一種基于區(qū)域中心點的聚類算法[J]. 計算機(jī)工程與科學(xué), 2014, 36(9):1817-1822.
[16] 夏魯寧, 荊繼武. SA-DBSCAN:一種自適應(yīng)基于密度聚類算法[J]. 中國科學(xué)院大學(xué)學(xué)報, 2009, 26(4):530-538.
[17] 趙慶. 基于Hadoop平臺下的Canopy-Kmeans高效算法[J]. 電子科技, 2014, 27(2):29-31.
[18] 余長俊, 張燃. 云環(huán)境下基于Canopy聚類的FCM算法研究[J]. 計算機(jī)科學(xué), 2014, 41(S2):316-319.