張 強(qiáng),李 成,吳騰飛
(天津大學(xué)精密測試技術(shù)及儀器國家重點(diǎn)實(shí)驗(yàn)室,天津 300072)
聚類分析是一種重要的無指導(dǎo)學(xué)習(xí)方法,有著廣泛的應(yīng)用領(lǐng)域.在圖像處理方面,聚類被用來實(shí)現(xiàn)圖像的自動分割、人臉的自動識別.在地球物理方面,聚類被用來處理衛(wèi)星遙感信息.在生物醫(yī)學(xué)方面,聚類被用來分析基因表達(dá)的關(guān)系.在文本處理方面,聚類被用來實(shí)現(xiàn)因特網(wǎng)中文本的自動分類.
當(dāng)前的聚類算法主要有 4類:①劃分方法,如文獻(xiàn)[1-2]等,其缺點(diǎn)是確定參數(shù) K困難,算法對噪聲敏感;②層次方法,如文獻(xiàn)[3-5]等,其缺陷是聚類質(zhì)量較低;③密度方法,如文獻(xiàn)[6-7]等,其缺點(diǎn)是計(jì)算量過大,不適合處理大量數(shù)據(jù),對參數(shù)過分敏感;④網(wǎng)格的方法,如 CLUGD[8-9]等,其缺點(diǎn)是對網(wǎng)格大小過于敏感,生成的簇的形狀不是水平的就是垂直的,結(jié)果精度低.
針對以上問題,筆者提出了基于濾波器的聚類算法 (filter-based clustering algorithm,F(xiàn)BCLUS).其主要貢獻(xiàn)是:①利用卷積定理和傅里葉變換,提出了頻率濾波法來消除噪聲的干擾;②提出了單閾值、多閾值幅度濾波法消除噪聲和提取不同密度的感興趣區(qū)域(可能包含聚類簇的區(qū)域);③提出了一個(gè)新的數(shù)學(xué)形態(tài)學(xué)算子,從感興趣區(qū)域中提取聚類簇.
FBCLUS算法的特點(diǎn)有:①能夠發(fā)現(xiàn)任意形狀的聚類;②計(jì)算復(fù)雜度與數(shù)據(jù)量呈線性關(guān)系;③能夠區(qū)分不同密度性質(zhì)的聚類簇;④抗噪聲能力強(qiáng);⑤對網(wǎng)格大小有一定的適應(yīng)性;⑥聚類結(jié)果與數(shù)據(jù)輸入順序無關(guān).
FBCLUS算法在思想上借鑒了數(shù)字信號處理的原理:提出聚類濾波方法降低噪聲水平,通過數(shù)學(xué)形態(tài)學(xué)方法提取聚類簇.FBCLUS分為 3步:①將數(shù)據(jù)空間網(wǎng)格化;②進(jìn)行頻率濾波和幅度濾波;③以數(shù)學(xué)形態(tài)學(xué)方法發(fā)現(xiàn)聚類簇.
FBCLUS的第 1步是將數(shù)據(jù)空間劃分為等間距的網(wǎng)格,每個(gè)網(wǎng)格保存著其包含數(shù)據(jù)對象的個(gè)數(shù).如果將數(shù)據(jù)集看作多維度信號,那么網(wǎng)格中數(shù)據(jù)對象的個(gè)數(shù)就標(biāo)志著該網(wǎng)格處信號的強(qiáng)弱,通過信號的濾波和數(shù)學(xué)形態(tài)學(xué)處理,最終得到聚類簇.?dāng)?shù)據(jù)空間網(wǎng)格化的目的是濃縮信息,提高后續(xù)處理的速度.確定合理的網(wǎng)格大小(或者疏密)對后續(xù)處理有重要影響,目前提出的網(wǎng)格聚類算法對網(wǎng)格大小十分敏感,網(wǎng)格大小的變化對聚類結(jié)果有嚴(yán)重的影響.筆者提出的FBCLUS算法由于采用了模板濾波和數(shù)學(xué)形態(tài)學(xué)聚類,所以對網(wǎng)格的大小有一定的適應(yīng)性.
實(shí)際應(yīng)用中獲得的數(shù)據(jù)通常含有大量的噪聲對象,它們不但影響聚類的精度,同時(shí)也加大了計(jì)算量,所以有必要將它們?yōu)V除.如果將數(shù)據(jù)集視為多維度信號,那么聚類簇和噪聲所在區(qū)域表現(xiàn)為不同的特征[10]:聚類簇所在的區(qū)域信號以低頻為主,信號的幅度大,信號的能量高;噪聲所在的區(qū)域信號以高頻為主,信號的幅度小,能量低.
文中提出了使用頻率和幅度兩種濾波器過濾數(shù)據(jù)集的方法,以提高聚類處理的精度.首先,使用頻率低通濾波器去除噪聲所對應(yīng)的高頻信號;然后,使用幅度濾波器濾除殘存的小幅度噪聲信號.經(jīng)過兩次濾波處理后,噪聲水平明顯降低,為提高聚類簇的質(zhì)量提供了保證.為了降低頻率濾波的計(jì)算復(fù)雜度,提出了時(shí)域和頻域的綜合濾波法,避免了對整個(gè)空間的變換和反變換.實(shí)驗(yàn)表明,該方法有很好的精度和效率.
頻率濾波可以直接施加于信號,也可以先對信號做變換(如傅里葉變換、小波變換等),然后對變換后的結(jié)果進(jìn)行濾波.前者稱為時(shí)域?yàn)V波,因?yàn)樾盘査幍目臻g是時(shí)域空間;后者稱為頻域?yàn)V波,因?yàn)樽儞Q后的空間是頻域空間.在時(shí)域中進(jìn)行頻率濾波的優(yōu)點(diǎn)是計(jì)算量低,因?yàn)樗恍枰M(jìn)行空間變換.但是在時(shí)域中信號的頻率特性沒有被明顯展示,所以頻率濾波器設(shè)計(jì)困難.在頻域中進(jìn)行頻率濾波的優(yōu)點(diǎn)是濾波器設(shè)計(jì)簡單直觀,因?yàn)樾盘栔苯颖憩F(xiàn)為頻率的函數(shù).但是頻域?yàn)V波需要對數(shù)據(jù)集進(jìn)行變換,計(jì)算量大.
文獻(xiàn)[11]在聚類中采用了頻域?yàn)V波,使用小波變換實(shí)現(xiàn)時(shí)域到頻域的變換,在頻域中使用低通濾波器實(shí)現(xiàn)過濾.文獻(xiàn)[11]只考慮了不同區(qū)域的頻率特性而沒有考慮幅度特性.其算法優(yōu)點(diǎn)是抗噪聲強(qiáng)、精度高;缺點(diǎn)是需要對整個(gè)數(shù)據(jù)空間做小波變換和反變換,計(jì)算量大.
筆者提出的頻率濾波方法綜合了時(shí)域和頻域?yàn)V波的優(yōu)點(diǎn),避免了各自的缺點(diǎn),不但精度高而且減小了計(jì)算量.其核心思想是:在頻域中設(shè)計(jì)低通濾波器;根據(jù)卷積定理,使用傅里葉反變換得到時(shí)域空間中對應(yīng)的低通濾波器;在時(shí)域中完成濾波.其優(yōu)點(diǎn)是:①在頻域中能夠方便地設(shè)計(jì)出高質(zhì)量的濾波器,通過傅里葉反變換在時(shí)域中得到的對應(yīng)濾波器具有頻域中相同的性能,這是由卷積定理保證的;②使用時(shí)域?yàn)V波器直接濾波避免了空間的傅里葉變換和傅里葉反變換,減少了計(jì)算量.
下面詳細(xì)討論頻域中低通濾波器的設(shè)計(jì)和時(shí)域中對應(yīng)濾波器的獲得以及時(shí)域中濾波的處理.
頻域中頻率濾波的數(shù)學(xué)模型為
式中: (,)F u v為數(shù)據(jù)集 (,)f x y在頻域的傅里葉變換,也就是要被濾波的對象; (,)H u v是頻域中濾波器函數(shù),完成對信號的濾波; (,)G u v是對 (,)F u v濾波后的結(jié)果.問題的關(guān)鍵是如何確定頻率濾波器 (,)H u v.以原型法設(shè)計(jì)頻率濾波器,確定濾波器的類型,再確定濾波器的參數(shù).采用原型法的最大好處是現(xiàn)有的濾波器理論成熟,可以很容易地設(shè)計(jì)出符合要求的濾波器.主要考慮理想低通濾波器、巴特沃思低通濾波器和高斯低通濾波器[12].以這 3種濾波器為設(shè)計(jì)原型是因?yàn)樗鼈兊念l率特性曲線涵蓋了從尖銳陡峭(理想低通濾波器)到圓滑平緩(高斯低通濾波器)的整個(gè)范圍.理想低通和高斯低通濾波器是兩個(gè)極端,巴特沃思低通濾波器則介于二者之間,為過渡類型.
在頻域中完成濾波器的設(shè)計(jì)之后需要將它變換到時(shí)域中,進(jìn)而完成濾波.卷積定理提供了理論依據(jù),即頻域的乘積對應(yīng)于時(shí)域的卷積
由卷積定理和傅里葉反變換就可以獲得需要的時(shí)域?yàn)V波器 (,)h x y,從而可以直接對時(shí)域中的數(shù)據(jù)濾波.現(xiàn)在時(shí)域空間是大小為R T×的網(wǎng)格,應(yīng)采用離散形式的卷積運(yùn)算,即式中:(,)h x y的大小(作用范圍)是R T×個(gè)網(wǎng)格.為了提高處理速度需要將 (,)h x y做得小一些,文獻(xiàn)[12] 指出以小尺寸的 (,)h x y在時(shí)域?yàn)V波的效率高于頻域?yàn)V波,同時(shí)有很好的濾波效果.下面采用大小為rt×的濾波器,并用模板實(shí)現(xiàn)與網(wǎng)格的卷積,即
式中:iw為掩模的系數(shù);if是與該系數(shù)對應(yīng)的網(wǎng)格信號強(qiáng)度(即網(wǎng)格中含有數(shù)據(jù)對象的個(gè)數(shù)).
以模板計(jì)算卷積的過程是在網(wǎng)格中逐個(gè)網(wǎng)格地移動模板,在每一個(gè)網(wǎng)格(x,y)處濾波器的響應(yīng)由模板的掩模系數(shù)與相應(yīng)網(wǎng)格乘積之和給出.對于一個(gè)3 3×的模板(見圖1),在網(wǎng)格(x,y)處卷積結(jié)果為
計(jì)算中要求網(wǎng)格(x,y)與模板中心0,0w 對應(yīng).對于rt×的模板,r和t都要求是奇數(shù).
圖1 3×3的模板Fig.1 3×3 mask
經(jīng)過頻率濾波之后高頻噪聲被大幅度衰減,但還會有些殘存,筆者采用幅度濾波法以進(jìn)一步降低噪聲水平.
表1 DBSCAN和FBCLUS的運(yùn)行時(shí)間Tab.1 Run time of DBSCAN and FBCLUS
表1為DBSCAN和FBCLUS的運(yùn)行時(shí)間.從表1可知,噪聲區(qū)域的信號強(qiáng)度明顯小于聚類簇區(qū)域,所以文中提出通過信號幅度的差異來進(jìn)一步濾除噪聲.幅度濾波的思想是確定一個(gè)幅度閾值ξ,所有幅度小于ξ的區(qū)域都視為噪聲加以濾除,其數(shù)學(xué)表達(dá)為
式中cell(x, y)為中心坐標(biāo)為(x,y)的網(wǎng)格,Ifrefiltered(x, y )為網(wǎng)格cell(x, y)經(jīng)過頻率濾波后的信號強(qiáng)度;ROI(regions of interest)表示后續(xù)聚類處理的感興趣區(qū)域.如果網(wǎng)格(x,y)的信號強(qiáng)度高于幅度閾值ξ,則表明該網(wǎng)格可能屬于某個(gè)聚類簇,需要算法進(jìn)一步分析處理;反之,表明該網(wǎng)格信號強(qiáng)度太小,則屬于噪聲,要加以濾除.
幅度濾波的關(guān)鍵是如何確定合理的幅度閾值ξ,筆者以直方圖方式選擇幅度閾值.通常情況下,經(jīng)過頻率濾波后的信號幅度是非負(fù)的實(shí)數(shù),呈現(xiàn)為連續(xù)分布.為了構(gòu)建直方圖,需要對其離散化,采用均勻量化,將信號幅度轉(zhuǎn)化為非負(fù)整數(shù).然后分別計(jì)算各個(gè)幅度值對應(yīng)網(wǎng)格數(shù)量的百分?jǐn)?shù),其數(shù)學(xué)處理方法是:設(shè)非空網(wǎng)格的總數(shù)為 M,幅度值為 i的網(wǎng)格數(shù)量是則幅度值為 i的網(wǎng)格數(shù)量百分比為以幅度值 I為橫軸,以iP為縱軸生成幅度直方圖.幅度直方圖一般呈多峰、谷分布,因?yàn)樵肼曅盘柕膹?qiáng)度很低,所以選取第一個(gè)明顯的谷底對應(yīng)的幅度值作為閾值ξ即可.通過以上的幅度濾波,整個(gè)空間被分為 ROI區(qū)域(可能屬于某個(gè)聚類簇)和噪聲區(qū)域,所以這種幅度濾波也可以看作是一種二值劃分問題.
為了進(jìn)一步提高聚類分析的精確性,又提出了多閾值的幅度濾波方法,它對應(yīng)于多值劃分問題,其核心思想是:呈多峰、谷分布的幅度直方圖中每一個(gè)峰及其附近隆起部分都反映某一種特定的信號強(qiáng)度分布,同時(shí)也對應(yīng)于特定的數(shù)據(jù)點(diǎn)密度分布.而兩個(gè)峰之間的谷底則是兩種不同密度分布的分割點(diǎn),選取這些谷底對應(yīng)的幅度值作為幅度閾值,就可以將數(shù)據(jù)空間劃分為不同密度的區(qū)域,每一種密度區(qū)域都可能對應(yīng)不同的物理性質(zhì).多幅度閾值的數(shù)學(xué)表達(dá)為
經(jīng)過頻率和幅度濾波之后,得到 ROI區(qū)域,對于二值幅度濾波,ROI區(qū)域只有一個(gè),而對于多值幅度濾波,ROI區(qū)域有多個(gè),每一個(gè) ROI對應(yīng)的區(qū)域密度不同,需要分別處理.下面任務(wù)是從每個(gè)ROI區(qū)域中提取由相連網(wǎng)格構(gòu)成的聚類簇.
筆者提出了一個(gè)數(shù)學(xué)形態(tài)學(xué)算子完成聚類簇的搜索,其偽代碼見算法,其中⊕代表膨脹運(yùn)算,Δ為膨脹運(yùn)算的結(jié)構(gòu)元素.算子處理過程:第 1步,以 ROI區(qū)域作為種子集合 seeds,并從中任意取出一個(gè)沒有被處理的網(wǎng)格p作為起始點(diǎn) Xi進(jìn)行第i輪迭代.第2
0步,以起始點(diǎn)為中心進(jìn)行膨脹,并將膨脹后新得到的網(wǎng)格作為中心繼續(xù)膨脹,直到?jīng)]有發(fā)現(xiàn)新的網(wǎng)格為止.為了保證膨脹不會超出 ROI區(qū)域,需要將新得到的網(wǎng)格與seeds取交.第3步,將上面膨脹得到的結(jié)果歸屬于一個(gè)新的聚類簇 Ci,并從種子集合中去除已經(jīng)處理過的部分,如果種子集合不為空,則返回第1步繼續(xù)第 i+1輪迭代.此外,這一步還濾除了體積過小的聚類簇.第4步,當(dāng)?shù)Y(jié)束后輸出得到的聚類簇.
筆者提出的數(shù)學(xué)形態(tài)學(xué)算子本身具有一定的降噪能力,它主要消除那些體積過小相互集聚的網(wǎng)格,如圖 2所示.圖 2(a)中小黑點(diǎn)是一些高密度網(wǎng)格的聚集體,數(shù)學(xué)形態(tài)學(xué)算子能夠?qū)⑺鼈優(yōu)V除(見圖2(b).圖 2(a)中小黑點(diǎn)出現(xiàn)的原因是:為了提高效率,對頻率和幅度濾波均采用小尺寸的模板,從而導(dǎo)致抗局部高密度噪聲能力的下降.但是,數(shù)學(xué)形態(tài)學(xué)算子只能區(qū)分體積大小的不同,而不能區(qū)分密度的疏密,所以必須與頻率和幅度濾波相結(jié)合才能取得較好的效果.
圖2 新的數(shù)學(xué)形態(tài)學(xué)算子的降噪效果Fig.2 Filtering effect of new mathematical morphological operator
濾波器模板的大小對算法的計(jì)算復(fù)雜度有很大的影響,模板越大,計(jì)算量越大,文獻(xiàn)[12]指出在使用小模板的情況下,卷積的計(jì)算量會明顯小于傅里葉變換.通常模板大小需要由實(shí)驗(yàn)決定,經(jīng)驗(yàn)表明:在數(shù)據(jù)點(diǎn)密集區(qū)域模板中能夠包含10個(gè)以上的數(shù)據(jù)點(diǎn)就能基本滿足要求.在某些情況下,小尺寸模板會導(dǎo)致局部高密度噪聲的濾除不凈(見圖 2),這可以由提出的數(shù)學(xué)形態(tài)學(xué)算子解決.
膨脹運(yùn)算結(jié)構(gòu)元素的大小決定了算法對提取聚類簇時(shí)的黏合性的強(qiáng)弱.當(dāng)網(wǎng)格劃分過密時(shí),聚類區(qū)域相對分散,要采用較大的結(jié)構(gòu)元素;反之,當(dāng)網(wǎng)格劃分稀疏時(shí),聚類簇區(qū)域相對集中,要采用較小的結(jié)構(gòu)元素.可以通過試探法決定結(jié)構(gòu)元素的大?。菏紫冉Y(jié)構(gòu)元素的大小取一個(gè)較小的值,然后逐步增大結(jié)構(gòu)元素的大小,此時(shí)得到的聚類簇個(gè)數(shù)會逐步減小,當(dāng)增加結(jié)構(gòu)元素的大小而聚類簇個(gè)數(shù)變化不大的時(shí)候,就找到了合適的大?。?/p>
對于多閾值幅度濾波得到的多個(gè) ROI區(qū)域,由于不同類聚類簇的密度差異較大,需要分別確定結(jié)構(gòu)元素的大小,然后再提取聚類簇,這樣就能夠保證類內(nèi)樣本較為稀疏的時(shí)候,算法判別正確.
濾波器模板和膨脹運(yùn)算結(jié)構(gòu)元素的形狀在低維度下選擇矩形,以保證高的聚類質(zhì)量;在高維度下選擇十字形,以減少計(jì)算量.因?yàn)榫匦蔚哪0寤蛘哌\(yùn)算結(jié)構(gòu)中包含網(wǎng)格的數(shù)目與維度呈指數(shù)增長,而十字形中包含網(wǎng)格的數(shù)目與維度呈線性增長,所以十字結(jié)構(gòu)可以降低高維度處理的計(jì)算量.
為了討論方便,規(guī)定數(shù)據(jù)集中對象的個(gè)數(shù)為 N,非空網(wǎng)格的數(shù)目為 M,濾波模板中網(wǎng)格的數(shù)量為 W,濾波得到的ROI網(wǎng)格的總數(shù)目為R,膨脹結(jié)構(gòu)元素中網(wǎng)格的數(shù)量為D,F(xiàn)BCLUS算法第1步空間網(wǎng)格化的計(jì)算復(fù)雜度為 O(N),第 2步空間過濾的計(jì)算復(fù)雜度為 O(MW),第 3步數(shù)學(xué)形態(tài)學(xué)的計(jì)算復(fù)雜度為O(RD),整體復(fù)雜度為 O(N+MW+RD).通常 MW<N,RD<N,整體復(fù)雜度近似為 O(N),與數(shù)據(jù)量呈線性關(guān)系.
測試算法發(fā)現(xiàn)任意形狀聚類簇的能力和抗噪聲性能.測試數(shù)據(jù)集和聚類結(jié)果如圖 3所示,其中數(shù)據(jù)集含有噪聲對象.
圖3 精度測試的數(shù)據(jù)集和聚類結(jié)果Fig.3 Data set and clustering result of accuracy test
測試算法對網(wǎng)格尺寸的適應(yīng)性.測試數(shù)據(jù)集如圖4(a)所示,使用兩種網(wǎng)格進(jìn)行聚類.第1種網(wǎng)格是50×50,第 2種網(wǎng)格是 1,000×1,000,網(wǎng)格邊長相差20倍.目前提出的網(wǎng)格聚類算法一般只能在50×50的網(wǎng)格中正常工作,例如 CLUGD[8]算法在提取聚類簇時(shí)只考慮相鄰網(wǎng)格的聯(lián)通性,當(dāng)網(wǎng)格劃分過于密集時(shí),高密度網(wǎng)格之間被空網(wǎng)格分割開來,其連通性遭到破壞,從而導(dǎo)致算法不能正常工作.而 FBCLUS算法在兩種網(wǎng)格下均能得到圖4(b)的聚類結(jié)果.
圖4 網(wǎng)格適應(yīng)性測試的數(shù)據(jù)集和聚類結(jié)果Fig.4 Data set and clustering result of grid size test
以含障礙物聚類為例測試算法功能的可擴(kuò)展性,測試數(shù)據(jù)集和聚類結(jié)果如圖5所示,它包含兩個(gè)障礙物,聚類算法需要區(qū)分出被障礙物分割開的聚類簇.本測試將含有障礙物的網(wǎng)格標(biāo)記為膨脹禁止區(qū),為了防止禁止區(qū)的泄漏采用3 3×的十字形膨脹結(jié)構(gòu)元素.聚類結(jié)果表明,算法區(qū)分出左側(cè)被障礙物完全分割開的聚類簇.
圖5 含障礙物的測試數(shù)據(jù)集和聚類結(jié)果Fig.5 Data set and clustering result of obstacle test
測試算法的效率,數(shù)據(jù)集由隨機(jī)數(shù)產(chǎn)生器生成:每個(gè)數(shù)據(jù)集含有 5個(gè)聚類簇和 10%的噪聲.測試計(jì)算機(jī)為神舟承運(yùn) M715D,算法 FBCLUS和DBSCAN[13]使用 JAVA 語言編寫,處理時(shí)間見表1.測試結(jié)果表明 FBCLUS的速度明顯高于DBSCAN.
筆者設(shè)計(jì)的基于濾波器的聚類算法 FBCLUS提出以頻率濾波器和幅度濾波器來消除噪聲并獲得感興趣區(qū)域ROI,設(shè)計(jì)一個(gè)新的數(shù)學(xué)形態(tài)學(xué)算子從ROI中提取聚類簇.理論分析和測試結(jié)果表明,F(xiàn)BCLUS算法能夠發(fā)現(xiàn)任意形狀的聚類;計(jì)算復(fù)雜度與數(shù)據(jù)量呈線性關(guān)系;能夠區(qū)分不同密度性質(zhì)的聚類簇;抗噪聲能力強(qiáng);對網(wǎng)格大小有一定的適應(yīng)性.
[1] Har-Peled S,Kushal A. Smaller corsets for k-median and k-means clustering[J]. Discrete and Computational Geometry,2007,37(1):3-19.
[2] Rosa La,Nehorai P S,Eswaran A,et al. Detection of uterine MMG contractions using a multiple change point estimator and the k-means cluster algorithm[J]. IEEE Transactions on Biomedical Engineering,2008,55(2):453-467.
[3] Loewenstein Y,Portugaly E,F(xiàn)romer M,et al. Efficient algorithms for accurate hierarchical clustering of huge datasets:Tackling the entire protein space[J]. Bioinformatics,2008,24(13):i41-i49.
[4] Lee H. E,Park K H,Bien Z Z. Iterative fuzzy clustering algorithm with supervision to construct probabilistic fuzzy rule base from numerical data[J]. IEEE Transactions on Fuzzy Systems,2008,16(1):263-277.
[5] Santos J M,Sa de J M,Alexandre L A,et al. LEGClust:A clustering algorithm based on layered entropic subgraphs[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,30(1):62-75.
[6] Duan Lian, Xu Lida,Guo Feng,et al. A local-density based spatial clustering algorithm with noise[J]. Information Systems,2007,32:978-986.
[7] Li Jianhua,Behjat L,Kennings A. Net cluster:A netreduction-based clustering preprocessing algorithm for partitioning and placement[J]. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems,2007,26(4):669-679.
[8] Sun Zhiwei,Zhao Zheng. A fast clustering algorithm based on grid and density[C]//2005 Canadian Conference on Electrical and Computer Engineering. Saskatoon Sask,Canada:IEEE Press,2005:2276-2279.
[9] Rasheed,Tinku Javaid,Usman Meddour,et al. An efficient stable clustering algorithm for scalable mobile multi-hop networks[C]// 4th IEEE Consumer Communications and Networking Conference. Las Vegas,USA,2007:89-94
[10] Han Jiawei,Kamber M. Data Mining Concepts and Techniques[M]. 2nd ed. San Francisco,CA:Morgan Kaufmann Publishers,2006.
[11] 戰(zhàn)立強(qiáng),劉大昕,張健沛. 基于小波濾波的時(shí)間序列子序列聚類[J]. 計(jì)算機(jī)工程與應(yīng)用,2007,43(10):4-7.Zhan Liqiang,Liu Daxin,Zhang Jianpei. Time series subsequence clustering based on wavelet filters[J]. Computer Engineering and Applications,2007,43(10):4-7(in Chinese).
[12] Gonzalez R C,Woods R E. Digital Image Processing[M]. 3th ed. New Jersey,USA:Pearson Prentice Hall,2008.
[13] Ester M,Kriegel H P,Sander J,et a1. A density-based algorithm for discovering clusters in large spatial databases [C]//Proceedings of 2nd International Conference on Knowledge Discovery and Data Mining. Poland:ACM Press,1996:226-231.