亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向混合屬性數(shù)據(jù)集的改進(jìn)半監(jiān)督FCM聚類方法

        2018-04-23 04:00:24李曉慶唐昊司加勝苗剛中
        自動(dòng)化學(xué)報(bào) 2018年12期
        關(guān)鍵詞:故障

        李曉慶 唐昊 司加勝 苗剛中

        聚類過程主要包括數(shù)據(jù)準(zhǔn)備、特征選取與提取、相似度計(jì)算、聚類與評(píng)估等步驟,經(jīng)典的聚類算法包含K-means、K-modes、模糊均值聚類(Fuzzy C-means,FCM)算法、DBSCAN等.目前仍有關(guān)于經(jīng)典聚類算法的衍生算法的研究,文獻(xiàn)[1]以近鄰反射傳播聚類算法為基礎(chǔ),提出一種基于同類約束的半監(jiān)督近鄰反射傳播聚類方法.文獻(xiàn)[2]提出K-近鄰估計(jì)協(xié)同系數(shù)的協(xié)同模糊C均值算法.然而,這些聚類算法的距離度量函數(shù)是僅針對(duì)單屬性的數(shù)據(jù)集的距離運(yùn)算.

        隨著互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的快速發(fā)展和廣泛應(yīng)用,各種數(shù)據(jù)的數(shù)量呈現(xiàn)指數(shù)式增長,可獲取的數(shù)據(jù)屬性也呈現(xiàn)出多樣化.許多學(xué)者開始致力于混合屬性數(shù)據(jù)集聚類的相關(guān)研究.Huang[3]提出一種適用于混合屬性數(shù)據(jù)聚類的K-prototypes算法,對(duì)于分類屬性部分,該算法采用匹配差異度來描述數(shù)據(jù)點(diǎn)之間相異度.近年來,陳晉音等[4]提出一種面向混合屬性數(shù)據(jù)的增量式聚類算法.根據(jù)混合屬性數(shù)據(jù)特征,將特征向量集分為數(shù)值占優(yōu)、分類占優(yōu)和均衡型三類.文獻(xiàn)[5]對(duì)不同情況的特征選取相應(yīng)的距離度量方式進(jìn)行分析,通過預(yù)設(shè)參數(shù),發(fā)現(xiàn)數(shù)據(jù)密集區(qū)域,確定核心點(diǎn),進(jìn)而利用核心點(diǎn)確定密度相連的對(duì)象實(shí)現(xiàn)聚類.文獻(xiàn)[6]提出一種基于密度的聚類中心自動(dòng)確定的混合屬性數(shù)據(jù)聚類算法.以上文獻(xiàn)在處理混合屬性數(shù)據(jù)的聚類時(shí),并未考慮無序?qū)傩詳?shù)據(jù)的聚類問題.

        文獻(xiàn)[7]將混合屬性數(shù)據(jù)分為有序?qū)傩院蜔o序?qū)傩詢蓚€(gè)部分,并構(gòu)造出雙重近鄰無向圖,但未對(duì)混合屬性數(shù)據(jù)聚類時(shí)距離度量做深入研究.文獻(xiàn)[8]針對(duì)不同維度的向量間的無序?qū)傩韵蛄考木嚯x度量展開研究.文獻(xiàn)[9]針對(duì)機(jī)械系統(tǒng)故障診斷中對(duì)先驗(yàn)知識(shí)利用不足和在高維特征空間中診斷難的問題,提出一種基于成對(duì)約束和通過約束準(zhǔn)則構(gòu)造核函數(shù)的半監(jiān)督譜核聚類方法.本文基于文獻(xiàn)[7?9]提出一種改進(jìn)的半監(jiān)督FCM 算法,首先對(duì)混合數(shù)據(jù)集的構(gòu)成進(jìn)行占優(yōu)分析,確定占優(yōu)因子α,對(duì)Jaccard距離做閾值改進(jìn),并將所獲改進(jìn)Jaccard距離作為無序?qū)傩跃嚯x度量函數(shù),進(jìn)而將所得混合屬性距離度量函數(shù)應(yīng)用于半監(jiān)督FCM 聚類算法,得到改進(jìn)的半監(jiān)督FCM聚類算法.最后,在滾動(dòng)軸承的不同類型單故障及復(fù)合故障數(shù)據(jù)的特征集中進(jìn)行算法對(duì)比驗(yàn)證.

        1 混合屬性數(shù)據(jù)集及其距離度量

        數(shù)據(jù)集由多個(gè)數(shù)據(jù)組成,每個(gè)數(shù)據(jù)對(duì)象由其屬性進(jìn)行描述.數(shù)據(jù)庫中的每個(gè)對(duì)象以一元組的形式呈現(xiàn),每一列代表一個(gè)屬性.數(shù)據(jù)挖掘中常用的屬性類型包括:1)數(shù)值屬性,通常用實(shí)數(shù)值來描述,包括離散型數(shù)值和連續(xù)型數(shù)值之分;2)分類(標(biāo)稱)屬性,每個(gè)不同的值代表某種類別、代碼或狀態(tài),這些值無列別順序;3)二值屬性,取值只有1或0兩種情況.通常1表示屬性值非空,0表示屬性值為空值;4)序數(shù)屬性,屬性取值的值域是一個(gè)有意義的序列.

        以上為常規(guī)屬性類型,當(dāng)數(shù)據(jù)對(duì)象包含多種屬性類型時(shí),稱為混合屬性數(shù)據(jù).本文將混合屬性分為有序?qū)傩院蜔o序?qū)傩詢深?劃分依據(jù)是此屬性有無列別順序.常規(guī)屬性中,數(shù)值屬性和序數(shù)屬性屬于有序?qū)傩?分類屬性屬于無序?qū)傩?若二值屬性維數(shù)較多,則只能看成有序?qū)傩?若維數(shù)為1,則既能看成有序?qū)傩?亦能看成無序?qū)傩?

        對(duì)于數(shù)據(jù)集的距離度量是進(jìn)行有意義的聚類分析的前提,若存在某混合屬性數(shù)據(jù)集表達(dá)式為Φ=,記混合屬性特征向量Xi=(xi1,xi2,···,xil),前m維屬性為有序?qū)傩?后l?m維為無序?qū)傩?對(duì)于上述混合屬性距離度量而言,一般將混合屬性數(shù)據(jù)按照屬性類型進(jìn)行劃分,分別求解距離,再進(jìn)行整體距離的加權(quán)求和.本節(jié)對(duì)有序?qū)傩院蜔o序?qū)傩缘木嚯x度量進(jìn)行簡要闡述,并對(duì)無序?qū)傩缘木嚯x度量方法加以改進(jìn),最后給出本文提出的混合屬性距離度量的完備性證明.

        1.1 歐氏距離

        本文在處理前m維有序?qū)傩缘木嚯x計(jì)算時(shí),采用歐氏距離作為距離度量函數(shù).在距離度量中,閔可夫斯基距離(Minkowski distance)是衡量數(shù)值點(diǎn)之間距離的一種非常常見的方法,計(jì)算公式為

        其中,如果p→∞時(shí),就是切比雪夫距離;p=1時(shí),表示曼哈頓距離;p=2時(shí),表示歐氏距離,即

        可以看出,歐氏距離是兩個(gè)向量相對(duì)應(yīng)維度的運(yùn)算,即歐氏距離適用于有序?qū)傩缘挠?jì)算.

        1.2 Jaccard距離及其改進(jìn)

        對(duì)于后l?m維的無序?qū)傩?本文采用改進(jìn)的Jaccard距離度量方法.

        傳統(tǒng)的Jaccard相似度常用于二值型數(shù)據(jù)的相似度計(jì)算.在數(shù)據(jù)挖掘中,經(jīng)常將屬性值二值化,通過計(jì)算Jaccard相似度,可以簡單快速地得到兩個(gè)對(duì)象的相似程度.記集合, 集合,則A和B的Jaccard相似系數(shù)定義為

        相應(yīng)的Jaccard距離定義為

        其中,Jaccard相似系數(shù)反映了A和B集合的相交程度,值在[0,1]范圍之內(nèi),若A和B不相交,則值為0.

        廣義Jaccard相似系數(shù)定義[10]為

        可見,廣義Jaccard相似系數(shù)雖然考慮向量中各維數(shù)值的大小,但是向量屬性的排序?qū)τ?jì)算結(jié)果有一定的影響.因此,廣義Jaccard相似系數(shù)處理無序?qū)傩约男Ч焕硐?

        實(shí)際生活或生產(chǎn)環(huán)境下,傳感設(shè)備所得數(shù)值存在一定的誤差,本文對(duì)相似系數(shù)計(jì)算做了相應(yīng)改進(jìn),引入相異度閾值系數(shù)ε修正屬性數(shù)值的相似性判斷,則相似性判斷公式為

        其中,p=m+1,m+2,···,l;q=m+1,m+2,···,l.即若向量A和B中存在兩個(gè)屬性值Xip和Xjq滿足以上條件,則令

        1.3 混合屬性距離度量的完備性證明

        有序?qū)傩圆糠志嚯x度量采用歐氏距離,無序?qū)傩圆糠志嚯x度量采用改進(jìn)的Jaccard距離,則混合屬性的距離表達(dá)式為

        其中,x與y均為前m個(gè)有序?qū)傩砸约發(fā)?m個(gè)無序?qū)傩越M成的混合屬性向量,1分別為 x 與y的前m個(gè)有序?qū)傩越M成的向量,x2和y2分別為x與y的l?m個(gè)無序?qū)傩越M成的集合,為了均衡非占優(yōu)屬性對(duì)數(shù)據(jù)對(duì)象整體相似性的影響,引入占優(yōu)因子α[3],并針對(duì)本文算例取值0.6,若m/l>α,則特征向量集是數(shù)值占優(yōu)數(shù)據(jù)集,則令β=0.4,若(l?m)/l>α,則特征向量集是分類占優(yōu)數(shù)據(jù)集,則令β=0.6,若以上兩個(gè)條件均不滿足,則特征向量集是均衡型混合屬性數(shù)據(jù)集,令β=0.5.

        距離定義需滿足同一性、非負(fù)性、對(duì)稱性和三角不等性,為了使證明過程更加清晰,記有x和y和z三個(gè)向量,為有序向量部分,維數(shù)為m,A和B和C為無序?qū)傩圆糠謽?gòu)成的集合,維數(shù)為l.

        定理1.若,且有,則(M為集合A和B考慮相異度閾值情況下,求交集所得的集合).

        證明.若,則.向量A中已有p個(gè)元素屬于C,k?p個(gè)元素不屬于C,及l(fā)?k個(gè)元素可能屬于C.同理,B的情況亦然.易證,A和B中相異元素屬于C的個(gè)數(shù)最大值為l?p,即

        推論1.本文所提混合屬性距離滿足三角不等性.

        證明.需證,即

        將歐氏距離統(tǒng)一放置等式左側(cè),即

        推論2.混合屬性距離度量滿足距離度量準(zhǔn)則.

        證明.

        1)

        滿足到自己距離為零;

        滿足非負(fù)性;

        3)d(x,y)=d(y,x),滿足對(duì)稱性;

        4)由推論1可知,滿足三角不等性.故混合屬性距離度量滿足距離度量準(zhǔn)則.□

        2 改進(jìn)半監(jiān)督FCM算法

        2.1 FCM算法

        FCM算法是根據(jù)不同樣本點(diǎn)對(duì)聚類中心的隸屬度不同來劃分聚類的算法,它的隸屬度取值由K-means聚類算法的{0,1},拓展至[0,1],即每個(gè)樣本的類別隸屬度為一個(gè)實(shí)數(shù)區(qū)間,相較而言,更具靈活性.

        記Xi(i=1,2,···,n)中每一個(gè)向量Xi均有l(wèi)維屬性.根據(jù)選定的相似性度量函數(shù),劃分為c個(gè)聚類中心稱為簇Vk,其中k=1,2,···,c.那么n個(gè)樣本分別屬于c個(gè)類別的隸屬度矩陣記為U=[uik]c×n(模糊劃分矩陣),其中uik(1≤i≤n,1≤k≤c)表示第i個(gè)樣本Xi屬于第k個(gè)類別的隸屬度,應(yīng)滿足以下約束條件:

        FCM算法的目標(biāo)函數(shù)定義為

        聚類中心的迭代公式為

        以下為傳統(tǒng)FCM的算法描述.

        算法1.FCM算法

        輸入.待聚類樣本.

        輸出.聚類中心及隸屬度矩陣.

        步驟1.給定需要?jiǎng)澐值木垲愔行臄?shù)目c及相關(guān)參數(shù);

        步驟2.初始化隸屬度矩陣U;

        步驟3.根據(jù)公式計(jì)算c個(gè)聚類中心;

        步驟4.計(jì)算出各個(gè)樣本點(diǎn)到聚類中心的距離矩陣,并得到新的隸屬度矩陣(若分母為0,則令uik=1);

        步驟5.計(jì)算出目標(biāo)函數(shù)值J.如果小于給定的閾值δ或與上次循環(huán)產(chǎn)生的目標(biāo)函數(shù)值之差小于閾值δ則算法停止.否則,返回步驟2.

        2.2 半監(jiān)督FCM算法的改進(jìn)

        多數(shù)情況下的聚類集成算法建立在非監(jiān)督方式之上,由于缺乏對(duì)先驗(yàn)知識(shí)的利用,致使聚類集成的準(zhǔn)確性、魯棒性和穩(wěn)定性有所降低.

        半監(jiān)督模糊聚類突破了有監(jiān)督和無監(jiān)督模糊聚類中只考慮一種樣本類型的局限,整體考慮數(shù)據(jù)集中的所有樣本,提高了未知樣本的使用率,從而改善了聚類效果.它的核心思想是利用監(jiān)督數(shù)據(jù),得到初始的聚類劃分,然后利用得到的初始的聚類劃分對(duì)未標(biāo)記的數(shù)據(jù)進(jìn)行約束指導(dǎo)[11].

        本文將改進(jìn)距離度量公式與半監(jiān)督模糊聚類算法結(jié)合,得到改進(jìn)的半監(jiān)督FCM算法目標(biāo)函數(shù).

        當(dāng)s為奇數(shù)時(shí),令

        當(dāng)s為偶數(shù)時(shí),令

        定義R(·)為將集合轉(zhuǎn)換成一維行向量的運(yùn)算,則,由于無序?qū)傩圆糠猪樞驘o關(guān),故的形式并不唯一,取其中一種形式,與有序?qū)傩圆糠志垲愔行穆?lián)合,最終求得.即改進(jìn)的FCM算法中的聚類中心每次更新是由有序部分更新結(jié)果與無序部分更新結(jié)果共同構(gòu)成.

        以下為改進(jìn)半監(jiān)督FCM的算法描述.

        算法2.改進(jìn)的半監(jiān)督FCM算法

        輸入.標(biāo)記樣本和未標(biāo)記樣本.

        輸出.聚類中心及未標(biāo)記樣本的隸屬度矩陣.

        步驟1.將標(biāo)記樣本和未標(biāo)記樣本進(jìn)行篩選及降維預(yù)處理;

        步驟2.利用FCM算法對(duì)標(biāo)記樣本進(jìn)行預(yù)聚類;

        步驟3.利用步驟2所得聚類中心對(duì)未標(biāo)記樣本做如下操作:采用改進(jìn)距離度量函數(shù)計(jì)算未標(biāo)記樣本與聚類中心的距離,選擇最靠近第i個(gè)聚類中心的未標(biāo)記樣本并貼上標(biāo)簽i,加入到標(biāo)記樣本中,并從未標(biāo)記樣本中刪除;

        步驟4.計(jì)算各個(gè)樣本點(diǎn)到聚類中心的距離矩陣,并得到新的隸屬度矩陣(若分母為0,則令uik=1);

        步驟5.對(duì)最新獲得的標(biāo)記樣本進(jìn)行重聚類處理,計(jì)算目標(biāo)函數(shù)值J.迭代至J小于給定的閾值δ或與上次循環(huán)產(chǎn)生的目標(biāo)函數(shù)值之差小于閾值δ則算法停止.

        3 仿真與分析

        3.1 訓(xùn)練數(shù)據(jù)及驗(yàn)證數(shù)據(jù)的獲取

        本文所提算法主要針對(duì)包含有序和無序?qū)傩缘幕旌蠈傩詳?shù)據(jù)集的聚類方法,為驗(yàn)證聚類算法的聚類精度,選用滾動(dòng)軸承多種工況下的振動(dòng)信號(hào)進(jìn)行預(yù)處理和時(shí)頻分析[12],并提取相應(yīng)特征值構(gòu)成訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù).

        在軸承運(yùn)行過程中,當(dāng)內(nèi)滾道發(fā)生剝落、裂紋、點(diǎn)蝕等損傷時(shí),會(huì)產(chǎn)生一定頻率的沖擊振動(dòng),軸承外圈亦是同理,當(dāng)滾動(dòng)體產(chǎn)生損傷時(shí),缺陷部位通過內(nèi)圈或外圈滾道表面時(shí),也會(huì)產(chǎn)生一定頻率的沖擊振動(dòng),現(xiàn)實(shí)中的滾動(dòng)軸承的振動(dòng)信號(hào),主要通過安放在軸承座上的傳感器測(cè)取設(shè)備獲得,測(cè)得的信號(hào)是包含若干成分的混合.損傷故障大致可以分為兩類:1)可以從轉(zhuǎn)速和軸承的幾何尺寸求得的通過頻率,又稱為故障特征頻率.2)由于損傷沖擊作用誘發(fā)的軸承系統(tǒng)的高頻固有振動(dòng)成分.若不考慮機(jī)械系統(tǒng)的非線性因素,近似構(gòu)造出包含軸系和軸承的復(fù)合振動(dòng)信號(hào)數(shù)學(xué)模型如下[13]:

        其中,x(t)為加速度傳感器采集的軸承座綜合振動(dòng)信號(hào);x1(t)為與軸轉(zhuǎn)頻和軸承各元件通過頻率相關(guān)的低頻振動(dòng)信號(hào);ai為與軸轉(zhuǎn)頻相關(guān)的第i個(gè)低頻振動(dòng)信號(hào)分量的幅值;fi為頻率;bj為滾動(dòng)軸承故障隱患所引起的第j個(gè)低頻振動(dòng)信號(hào)分量的幅值;fj為滾動(dòng)軸承元件的故障通過頻率;x2(t)為以固有頻率為載波頻率,以滾動(dòng)軸承通過頻率為調(diào)制頻率的調(diào)制信號(hào);bk,j(t)為滾動(dòng)軸承第k個(gè)調(diào)制信號(hào),其調(diào)制頻率為滾動(dòng)軸承的各元件的通過頻率;fk,gz為載波頻率,是各零部件的固有頻率;n(t)為x(t)中的噪聲分量.

        由某故障軸承的結(jié)構(gòu)參數(shù)計(jì)算得到轉(zhuǎn)速為1800r/min下的故障特征頻率,可知,

        相應(yīng)地,各故障特征頻率如表1所示.

        表1 軸承各部件故障特征頻率(Hz)Table 1 Characteristic frequency of rolling bearings(Hz)

        將以上四種故障頻率分別作為單故障振動(dòng)信號(hào)的頻率,忽略機(jī)械系統(tǒng)的非線性因素,近似構(gòu)造出包含軸系和軸承的復(fù)合振動(dòng)信號(hào).

        對(duì)復(fù)合振動(dòng)信號(hào)進(jìn)行特征提取,并構(gòu)造混合屬性向量,特征向量中有序?qū)傩圆糠职畲笾?、最小值、峭度值、均值?biāo)準(zhǔn)差5個(gè)指標(biāo),無序?qū)傩圆糠值臉?gòu)建主要是通過對(duì)復(fù)合振動(dòng)信號(hào)進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical mode decomposition,EMD)[14],得到若干本征模函數(shù)(Intrinsic mode function,IMF)分量,再進(jìn)行希爾伯特變換,進(jìn)而求得特征頻率值而獲得.對(duì)于構(gòu)造的外圈故障和滾動(dòng)體故障復(fù)合振動(dòng)信號(hào)進(jìn)行EMD分解,最終得到8組本征模函數(shù)分量及對(duì)應(yīng)頻譜圖,如圖1所示.

        3.2 測(cè)試實(shí)驗(yàn)1

        實(shí)驗(yàn)部分選取五種故障(各取50組),進(jìn)行聚類處理及分析.五種故障包括內(nèi)圈故障、外圈故障、滾動(dòng)體故障三個(gè)單故障及內(nèi)外圈、滾動(dòng)體外圈兩種復(fù)合故障.聚類結(jié)果采用聚類精度均值來衡量,即每個(gè)簇中占比最高的對(duì)象所占的比例的平均值.

        軸承的混合屬性特征向量中有序?qū)傩耘c無序?qū)傩詳?shù)值差異性較大,圖2(a)和圖2(b)分別為未標(biāo)準(zhǔn)化數(shù)據(jù)及標(biāo)準(zhǔn)化數(shù)據(jù)的預(yù)聚類結(jié)果.

        從圖2可以看出,未標(biāo)準(zhǔn)化數(shù)據(jù)對(duì)預(yù)聚類的正確率影響較明顯,標(biāo)準(zhǔn)化數(shù)據(jù)預(yù)聚類正確率更高.預(yù)聚類所得聚類中心對(duì)最終聚類結(jié)果正確率有直接影響,故本文預(yù)聚類前對(duì)于原始數(shù)據(jù)做標(biāo)準(zhǔn)化的預(yù)處理.

        圖3(a)為FCM重聚類結(jié)果,相同分組用實(shí)線相連,縱坐標(biāo)為數(shù)據(jù)點(diǎn)實(shí)際組別,聚類實(shí)驗(yàn)結(jié)果用實(shí)線相連.可以看出傳統(tǒng)半監(jiān)督FCM聚類算法單故障聚類結(jié)果較理想,聚類不純度較低,但耦合故障聚類的實(shí)驗(yàn)結(jié)果與實(shí)際組別交叉嚴(yán)重,聚類結(jié)果不理想.圖3(b)為改進(jìn)FCM 重聚類結(jié)果圖,與傳統(tǒng)半監(jiān)督FCM 聚類結(jié)果相比,耦合故障的聚類精度明顯提高,詳細(xì)結(jié)果如表2所示.圖4(a)和圖4(b)為兩種聚類算法聚類結(jié)果的柱狀統(tǒng)計(jì)圖(柱狀圖坐標(biāo)分別為:x:實(shí)驗(yàn)結(jié)果組別號(hào),y:實(shí)際組別號(hào),z:統(tǒng)計(jì)數(shù)).

        表2 聚類精度對(duì)比表Table 2 Comparison table of clustering accuracy

        圖1 復(fù)合振動(dòng)信號(hào)EMD分解Fig.1 The EMD decomposition of complex vibration signals

        圖2 有標(biāo)簽數(shù)據(jù)預(yù)聚類Fig.2 Pre-clustering of the label data

        圖3 重聚類結(jié)果Fig.3 Re-clustering result

        圖4 重聚類結(jié)果柱狀統(tǒng)計(jì)圖Fig.4 Bar chart of re-clustering result

        經(jīng)計(jì)算可得,歐氏距離作為距離度量函數(shù)所得試驗(yàn)結(jié)果的聚類精度為0.848,改進(jìn)的混合屬性距離度量函數(shù)所得試驗(yàn)結(jié)果的聚類精度為0.94.

        表2為FCM聚類算法改進(jìn)前及改進(jìn)后在單故障及復(fù)合故障聚類中的精度對(duì)比.從表2可以看出,在本實(shí)驗(yàn)部分,復(fù)合故障之間的干擾對(duì)傳統(tǒng)FCM聚類精度有較大影響,改進(jìn)的混合屬性距離作為距離度量函數(shù)在耦合故障診斷方面具有顯著優(yōu)勢(shì).

        3.3 測(cè)試實(shí)驗(yàn)2

        實(shí)驗(yàn)選取4組單故障及6組耦合故障的特征數(shù)據(jù)集(每組50個(gè)向量)進(jìn)行聚類處理,此時(shí)故障類型較多,復(fù)合故障之間干擾較強(qiáng),傳統(tǒng)FCM的聚類精度急劇下降,實(shí)驗(yàn)結(jié)果部分添加了混合屬性聚類的K-prototypes方法作為對(duì)比.

        重聚類結(jié)果散點(diǎn)圖如圖5所示,圖5(a)為傳統(tǒng)半監(jiān)督FCM聚類的結(jié)果,圖5(b)為K-prototypes聚類的結(jié)果,圖5(c)為改進(jìn)半監(jiān)督FCM聚類的結(jié)果,縱坐標(biāo)代表類別,試驗(yàn)數(shù)據(jù)共有10種故障,每種故障50組數(shù)據(jù),并分別加上類別屬性編號(hào)1~10,故圖中橫坐標(biāo)1~50,51~100,···,451~500的實(shí)際類別應(yīng)該依次對(duì)應(yīng)1~10類,圖中的散點(diǎn)分布為聚類方法所得的結(jié)果,圖5(a)圖中橫坐標(biāo)1~50的區(qū)間,有若干點(diǎn)縱坐標(biāo)為7,橫坐標(biāo)300~350的區(qū)間,有若干點(diǎn)縱坐標(biāo)為9,這些都是實(shí)際結(jié)果與實(shí)驗(yàn)結(jié)果不相符的情況.三種聚類算法的柱狀統(tǒng)計(jì)圖如圖6所示.

        圖5 重聚類結(jié)果散點(diǎn)圖Fig.5 Scatter diagram of re-clustering result

        由正確率柱狀圖對(duì)比可知,當(dāng)故障類型較多時(shí),改進(jìn)FCM 重聚類的聚類效果最好,K-prototypes次之,傳統(tǒng)FCM重聚類的聚類效果較差,三種算法的聚類精度如表3所示.

        表3 三種算法聚類精度對(duì)比表Table 3 Comparison table of clustering accuracy by three algorithms

        表4為在改進(jìn)FCM中不同相異度閾值ε下的聚類精度對(duì)比表.

        表4 不同ε值下聚類精度對(duì)比表Table 4 Comparison table of clustering accuracy by differentε

        圖6 重聚類結(jié)果柱狀統(tǒng)計(jì)圖Fig.6 Bar chart of re-clustering result

        考慮到噪音對(duì)低頻信號(hào)有較大干擾,對(duì)4,7,8,9故障聚類結(jié)果進(jìn)行分析,并對(duì)無序?qū)傩圆糠志嚯x度量計(jì)算時(shí)的相異度閾值ε采用自適應(yīng)閾值調(diào)整,自適應(yīng)閾值調(diào)整公式如下:

        由表4可知,ε=0.12時(shí),聚類效果最好,因此基準(zhǔn)值ε0取0.12,在特定區(qū)間內(nèi),相異度閾值越高則低頻信號(hào)聚類精度越高,超過一定區(qū)間則會(huì)導(dǎo)致高頻信號(hào)的錯(cuò)歸類,進(jìn)而影響聚類精度.根據(jù)式(6),結(jié)合本文實(shí)驗(yàn)算例,可知最易錯(cuò)歸類的相異度閾值為0.125,故乘數(shù)因子γ取值0.005.式中fmax取值163.2,f為計(jì)算Jaccard距離的兩個(gè)數(shù)的平均值.根據(jù)以上參數(shù)設(shè)置,得到最終結(jié)果如圖7和圖8所示.

        圖7 改進(jìn)FCM自適應(yīng)閾值調(diào)整后重聚類結(jié)果Fig.7 Re-clustering result by improved FCM algorithm after adaptive threshold

        圖8 改進(jìn)FCM自適應(yīng)閾值調(diào)整后重聚類結(jié)果柱狀統(tǒng)計(jì)圖Fig.8 Bar chart of re-clustering result by improved FCM algorithm after adaptive threshold

        將圖8與圖6(c)對(duì)比,可知混合屬性距離度量公式進(jìn)行自適應(yīng)閾值調(diào)整后,聚類精度進(jìn)一步提升,由聚類精度計(jì)算公式求得,聚類精度提升至0.912.

        4 結(jié)束語

        本文提出一種基于改進(jìn)Jaccard距離的混合屬性距離度量方法,并運(yùn)用于半監(jiān)督FCM 聚類算法中,得到改進(jìn)的半監(jiān)督FCM算法,將在數(shù)值屬性數(shù)據(jù)集的聚類方法擴(kuò)展到了混合屬性數(shù)據(jù)集的聚類問題中.通過對(duì)聚類算法的聚類精度這一指標(biāo)值進(jìn)行比較,證明了改進(jìn)的半監(jiān)督FCM 算法在聚類效果方面有了顯著提升,并得到如下結(jié)論.

        1)傳統(tǒng)半監(jiān)督FCM算法將樣本不同特征量賦予相同的權(quán)重,忽略了不同屬性特征量本身的相異性,K-prototypes算法作為混合屬性聚類算法,對(duì)分類屬性采用匹配差異度的距離度量方法,但是和廣義的Jaccard距離有相同的弊端,即向量維度對(duì)計(jì)算結(jié)果有很大影響,處理含無序?qū)傩缘幕旌蠈傩詳?shù)據(jù)集時(shí),精度較低.改進(jìn)半監(jiān)督FCM 聚類在處理含無序?qū)傩缘幕旌蠈傩詳?shù)據(jù)集的聚類問題時(shí),采用歐氏距離與改進(jìn)的Jaccard相結(jié)合的距離度量方式,聚類精度明顯優(yōu)于傳統(tǒng)的半監(jiān)督FCM 聚類和K-prototypes聚類.

        2)當(dāng)聚類中心較多時(shí)(對(duì)應(yīng)試驗(yàn)中故障類型較多),對(duì)于改進(jìn)半監(jiān)督FCM,相異度閾值ε可采用自適應(yīng)閾值調(diào)整,即對(duì)于無序?qū)傩圆糠肿赃m應(yīng)改變?chǔ)诺闹?聚類精度得到提高.

        半監(jiān)督聚類的標(biāo)記樣本數(shù)據(jù)必須滿足每個(gè)簇都至少有一個(gè)樣本被標(biāo)記出,且初始樣本數(shù)據(jù)對(duì)聚類結(jié)果影響較大.換而言之,半監(jiān)督聚類算法是建立在對(duì)標(biāo)記樣本完全信任的基礎(chǔ)上的.因此,如何提高算法對(duì)于不均衡數(shù)據(jù)集的聚類精度問題需要進(jìn)一步研究.另外,將軌跡坐標(biāo)值作為無序?qū)傩苑至?并將本文提出算法與時(shí)間翹曲距離結(jié)合,對(duì)軸心軌跡進(jìn)行相似性判斷并聚類,也是下一步工作的重點(diǎn).

        猜你喜歡
        故障
        故障一點(diǎn)通
        奔馳R320車ABS、ESP故障燈異常點(diǎn)亮
        WKT型可控停車器及其故障處理
        基于OpenMP的電力系統(tǒng)并行故障計(jì)算實(shí)現(xiàn)
        故障一點(diǎn)通
        故障一點(diǎn)通
        故障一點(diǎn)通
        故障一點(diǎn)通
        故障一點(diǎn)通
        江淮車故障3例
        亚洲中文字幕视频第一二区| 97无码人妻Va一区二区三区| 窄裙美女教师在线观看视频| 最新中文字幕乱码在线| 精品综合一区二区三区| 风韵多水的老熟妇| 亚洲综合中文字幕乱码在线| av蜜桃视频在线观看| 国产精品三区四区亚洲av| 专干老肥熟女视频网站300部| 日本乱偷人妻中文字幕在线| 日韩毛片在线看| 丰满少妇一区二区三区专区 | 亚洲日韩AV秘 无码一区二区 | 亚洲精品无码久久久久| 亚洲日产无码中文字幕| 正在播放一区| 亚洲嫩模一区二区三区视频| 中文字幕一区二区综合| 国产熟女内射oooo| 男女真实有遮挡xx00动态图| 亚洲一区二区国产精品视频| 中文字幕乱码熟女人妻在线| 一区二区三区国产| 国产午夜精品一区二区三区视频| 无遮挡很爽视频在线观看 | 欧美日韩亚洲一区二区精品 | 国产亚洲欧美在线| 一本色道久久88综合| 国精产品一区一区三区有限在线 | 国产91传媒一区二区三区| 午夜福利试看120秒体验区| 美女裸体无遮挡免费视频的网站| 色琪琪一区二区三区亚洲区 | a级毛片无码免费真人| 全部免费国产潢色一级| 一区二区激情偷拍老牛视频av| 国产乱人伦av在线麻豆a| 摸进她的内裤里疯狂揉她动视频 | 97人妻碰免费视频| 热综合一本伊人久久精品|