陳鵬飛, 趙榮珍, 彭 斌, 李坤杰
(蘭州理工大學(xué) 機(jī)電工程學(xué)院 機(jī)電信息智能技術(shù)研究所, 蘭州 730050)
等距映射和局部線性嵌入算法集成的轉(zhuǎn)子故障數(shù)據(jù)集降維方法
陳鵬飛, 趙榮珍, 彭 斌, 李坤杰
(蘭州理工大學(xué) 機(jī)電工程學(xué)院 機(jī)電信息智能技術(shù)研究所, 蘭州 730050)
經(jīng)數(shù)據(jù)分析途徑實(shí)現(xiàn)機(jī)器智能的故障決策引發(fā)出了關(guān)于故障數(shù)據(jù)集的降維問(wèn)題。通過(guò)將等距映射算法(Isometric Mapping,ISOMAP)、局部線性嵌入(Locally Linear Embedding, LLE)算法的優(yōu)缺點(diǎn)進(jìn)行互補(bǔ),提出一種適用于非線性數(shù)據(jù)集降維的核框架下等距映射與局部線性嵌入相結(jié)合的KISOMAPLLE算法。該算法能夠同時(shí)滿足全局距離保持性和局部結(jié)構(gòu)保持能力的數(shù)據(jù)降維基本要求。用典型的人工數(shù)據(jù)集和轉(zhuǎn)子故障數(shù)據(jù)集進(jìn)行的降維驗(yàn)證結(jié)果表明,該算法能夠繼承ISOMAP、LLE兩種算法的各自優(yōu)良性能,具有能夠顯著提高典型非線性數(shù)據(jù)集分類(lèi)精度的性能。
故障診斷;流形學(xué)習(xí);核方法;特征提取
在機(jī)械信息技術(shù)中,用于描述機(jī)械系統(tǒng)運(yùn)行狀態(tài)的特征數(shù)據(jù)集一般都具有高維、非線性的特點(diǎn)。由此引發(fā)的是在利用此類(lèi)數(shù)據(jù)資源去實(shí)現(xiàn)人工智能決策技術(shù)中,面臨的首要問(wèn)題是如何消除干擾故障分類(lèi)準(zhǔn)確率的數(shù)據(jù)集中冗余特征問(wèn)題。數(shù)據(jù)科學(xué)領(lǐng)域定義該問(wèn)題為非線性高維數(shù)據(jù)集的降維問(wèn)題。傳統(tǒng)的線性降維技術(shù)如PCA[1]、LDA[2]等,并不適用于非線性數(shù)據(jù)集的降維。因此探討新型的如能夠解決好適用于轉(zhuǎn)子系統(tǒng)非線性故障數(shù)據(jù)集的非線性降維方法,則對(duì)科學(xué)發(fā)展機(jī)械信息智能決策技術(shù),具有推動(dòng)和引領(lǐng)作用。
對(duì)于如何解決好關(guān)于非線性數(shù)據(jù)集的降維問(wèn)題,數(shù)據(jù)科學(xué)研究領(lǐng)域提出的流形學(xué)習(xí)理論非常具有指導(dǎo)作用。如自TENENBAUM等[3]提出了等距離映射的ISOMAP算法之后,GENG等[4]提出了一種局部線性嵌入的LLE算法,隨后還相繼出現(xiàn)了局部切空間排列(LTSA)[5]、嗨森矩陣的局部線性嵌入(HLLE)[6]、拉普拉斯變換(LEIGS)[7]等一系列新的適用于非線性數(shù)據(jù)集降維算法。分析這些算法可發(fā)現(xiàn)一個(gè)顯著的特點(diǎn),是它們都可以被統(tǒng)一在同一個(gè)核框架下[8]去構(gòu)造適應(yīng)于特定降維問(wèn)題的新算法。由于ISOMAP算法是基于全局思想建立起的一種鄰域圖關(guān)系,LLE算法是基于局部思想建立起的一種從高維到低維嵌入之間的映射關(guān)系,因此在這兩種算法間存在著可進(jìn)行優(yōu)勢(shì)互補(bǔ)相結(jié)合的潛在可行性。為此參考文獻(xiàn)[9]將它們?cè)诤丝蚣芟逻M(jìn)行了融合,嘗試著提出了一種關(guān)于圖像識(shí)別的方法。該項(xiàng)研究成果對(duì)如何解決好如機(jī)械系統(tǒng)特征數(shù)據(jù)集的非線性數(shù)據(jù)集降維問(wèn)題,非常具有參考借鑒作用。
依據(jù)上述分析,本研究欲對(duì)ISOMAP算法、LLE算法在核框架下進(jìn)行融合,用于消除高維、非線性轉(zhuǎn)子故障數(shù)據(jù)集冗余特征的方法進(jìn)行探討。欲為機(jī)械信息智能決策技術(shù)向科學(xué)方向發(fā)展,提供參考依據(jù)。
基于全局思想建立起一種鄰域圖關(guān)系的ISOMAP算法,與基于局部思想建立起一種從高維到低維嵌入之間映射關(guān)系的LLE算法,它們的原理可分別參見(jiàn)參考文獻(xiàn)[3-4]。因本研究關(guān)注的是在核函數(shù)已被融合在兩個(gè)算法中之后,如何將它們統(tǒng)一在核框架下去嘗試建立一種高維、非線性數(shù)據(jù)集的降維實(shí)現(xiàn)方法,而這需依據(jù)已考慮了核函數(shù)影響的KISOMAP算法、KLLE算法去進(jìn)行,故在此首先對(duì)這兩種衍生算法的原理簡(jiǎn)介如下。
1.1 KISOMAP算法
該算法是在ISOMAP算法中嵌入核函數(shù)的結(jié)果。它的詳細(xì)步驟見(jiàn)參考文獻(xiàn)[10]。核函數(shù)嵌入前后的兩算法間的區(qū)別,是嵌入核函數(shù)后得到的算法需要根據(jù)式(6)計(jì)算出矩陣K(D2)并構(gòu)建出矩陣表達(dá)式(1)。之后需對(duì)式(1)進(jìn)行下述方式的運(yùn)算處理。
需設(shè)法求出式(1)中所需的最大特征值c*。還需根據(jù)c*,構(gòu)建出式(2)所示的Mercer核矩陣KISOMAP,即
(1)
(2)
式中,當(dāng)c>=c*時(shí),才能夠確保KISOMAP是一個(gè)實(shí)對(duì)稱(chēng)的半正定矩陣。求解出KISOMAP的n個(gè)特征向量,并將它們組成為特征向量矩陣V∈RN×n和特征值矩陣Λ∈Rnxn。根據(jù)多維尺度(MDS)進(jìn)行計(jì)算,即可得到一種低維的嵌入坐標(biāo)向量Y,即
Y=Λ1/2·V
(3)
KISOMAP算法中的其它步驟與ISOMAP算法相同。不同之處僅在于需運(yùn)用MDS中常用的添加常數(shù)技巧,求解出實(shí)對(duì)稱(chēng)、半正定的Mercer核矩陣。
1.2 KLLE算法
M=(I-W)T(I-W)
(4)
KLLE=λmaxI-M
(5)
式中,M是一個(gè)實(shí)對(duì)稱(chēng)半正定矩陣;λmax是W的最大特征值,I為單位距陣,其它過(guò)程與LLE算法相同。
1.3 核框架的概念
核框架是多種核映射方法的統(tǒng)稱(chēng)。這一概念的具體定義是:對(duì)于不同的非線性降維算法,核方法中關(guān)于要求解出低維空間與高維空間之間映射函數(shù)的問(wèn)題,最終都可歸結(jié)于求解某一核矩陣的特征值與特征向量問(wèn)題。
根據(jù)核函數(shù)的性質(zhì),不同的核矩陣之間可以進(jìn)行線性變換,最終形成的新矩陣仍然應(yīng)該是一個(gè)核矩陣[11]。由此可推斷出:將不同的核矩陣進(jìn)行融合得到的應(yīng)該是一個(gè)新的核矩陣。根據(jù)參考文獻(xiàn)[8],流形學(xué)習(xí)算法最終都可以轉(zhuǎn)化為求一個(gè)核矩陣的特征值和特征向量問(wèn)題。因此在它們之間可以通過(guò)融合處理,可以設(shè)計(jì)出能滿足特定目標(biāo)所需要的、最大限度的保持各個(gè)算法特點(diǎn)和數(shù)據(jù)結(jié)構(gòu)的新型核矩陣。這一結(jié)論為流形學(xué)習(xí)算法的融合提供了新的理論支撐和探索方向。
基于此原理,故本研究欲將ISOMAP和LLE這兩種經(jīng)典算法在核框架下進(jìn)行融合,對(duì)設(shè)計(jì)出能繼承這兩種算法各自優(yōu)良特點(diǎn)的新的核矩陣構(gòu)造方法進(jìn)行探討。為此,在本研究中提出的這種新算法我們命名它為KISOMAPLLE算法。它在用于高維非線性數(shù)據(jù)集降維時(shí),數(shù)據(jù)處理的算法實(shí)施步驟被設(shè)置如下:
步驟1 用K鄰域法或ε半徑法求鄰域值K。
(6)
步驟3 按照式(1)和式(2),提取ISOMAP的核矩陣KISOMAP。本研究中取c=c*,然后按照式(4)、式(5)提取LLE的核矩陣KLLE。
步驟4 由于KISOMAP、KLLE為實(shí)對(duì)稱(chēng)半正定矩陣,根據(jù)參考文獻(xiàn)[11],它們的和也為核矩陣,并引入調(diào)節(jié)因子α,以調(diào)節(jié)兩種算法的權(quán)重。最后根據(jù)核函數(shù)的性質(zhì)構(gòu)建出新的核矩陣KISOLLE,即
KISOLLE=KISOLLE+(1-α)KLLE
(7)
步驟5 計(jì)算KISOLLE的特征值矩陣P與特征向量矩陣Q,按MDS計(jì)算出低維的嵌入坐標(biāo),即
Y=Λ1/2Q
(8)
其中,Λ為P的對(duì)角矩陣。
本文算法是在文獻(xiàn)[9]的基礎(chǔ)上,對(duì)ISOMAP與LLE進(jìn)行融合,其與文獻(xiàn)[9]的主要不同在于對(duì)ISOMAP的核矩陣的提取過(guò)程不同,其他過(guò)程則類(lèi)似。文獻(xiàn)[9]根據(jù)在連續(xù)流形結(jié)構(gòu)中,數(shù)據(jù)點(diǎn)間的測(cè)地距離與歐氏距離的成正比關(guān)系將式(6)直接作為ISOMAP的一個(gè)核矩陣,融合后將其應(yīng)用到人臉識(shí)別中;本文算法則是將式(6)組成一個(gè)Mercer核矩陣并求其最大特征值,然后根據(jù)核函數(shù)的性質(zhì)構(gòu)造出一個(gè)新的核矩陣,將其融合后應(yīng)用到人工數(shù)據(jù)集與轉(zhuǎn)子故障診斷中。
3.1 在人工數(shù)據(jù)集的應(yīng)用及分析
為了驗(yàn)證第2節(jié)提出的KISOMAPLLE算法在高維非線性數(shù)據(jù)集降維時(shí)的有效性,在研究中我們采取的對(duì)策如下:采用將在數(shù)據(jù)科學(xué)研究領(lǐng)域已得到認(rèn)可的若干降維算法與本研究所提出的算法性能進(jìn)行對(duì)照,將選定的若干算法使用在標(biāo)準(zhǔn)的典型人工數(shù)據(jù)集上。驗(yàn)證過(guò)程中選擇的算法和典型人工數(shù)據(jù)集的具體情況如下。其中,用于佐證本算法有效性的系列算法包括7種:{①I(mǎi)SOMAP; ②KISOMAP; ③KISOMAPLLE; ④LLE; ⑤KLLE; ⑥HLLE; ⑦LEIGS};這7種算法分別被應(yīng)用在6種典型的人工數(shù)據(jù)集上:{swissroll、square、puncted_sphere、scurve、gaussian、spiral}。受篇幅所限,圖1中僅列出了算法“②”、算法“③”、算法“⑤”,在選定的三種數(shù)據(jù)集:{scurve、square、puncted_sphere}上的降維效果情況。這三種算法的特點(diǎn)是它們均已嵌入了核函數(shù)。在此,鄰域值K和權(quán)重因子根據(jù)多次上機(jī)實(shí)驗(yàn)結(jié)果確定的,被統(tǒng)一設(shè)置為K=13、α=0.7。
圖1中,子圖(a)、(b)和(c)分別是算法“②”、算法“③”和算法“⑤”在選定的三個(gè)數(shù)據(jù)集上的降維結(jié)果情況。圖1特點(diǎn)是算法“②”、“③”、“⑤”都能夠成功實(shí)現(xiàn)降維,但算法“③”效果較差,它的最大問(wèn)題是數(shù)據(jù)內(nèi)部出現(xiàn)了“孔洞”現(xiàn)象。雖然算法“①”也會(huì)因鄰域值取得過(guò)小使得數(shù)據(jù)之間因不連通而出現(xiàn)類(lèi)似情況[12],但在實(shí)驗(yàn)中我們發(fā)現(xiàn):鄰域值的大小對(duì)本算法的影響不大,怎么解決“孔洞”問(wèn)題在本研究中不予考慮,它是本項(xiàng)研究中下一步試圖進(jìn)行深入探討的內(nèi)容,然而本研究對(duì)其魯棒性做了下面研究。
(a)KISOMAP算法的降維結(jié)果
(b) KLLE算法的降維結(jié)果
(c) KISOMAPLLE算法的降維結(jié)果
為對(duì)比圖1所涉及到三個(gè)算法的魯棒性,在實(shí)驗(yàn)時(shí)我們分別將幅值為0.1、0.2、0.3、0.4、0.5的隨機(jī)噪聲加入在選定的六個(gè)數(shù)據(jù)集中之后再去進(jìn)行降維。因算法“④”在puncted_sphere數(shù)據(jù)集上的降維效果較好,故選擇這一降維結(jié)果作為對(duì)比的參照物,并進(jìn)行了數(shù)據(jù)降維。實(shí)驗(yàn)時(shí)對(duì)puncted_sphere加入了幅值φ=0.3的隨機(jī)噪聲進(jìn)行干擾。此時(shí)用算法“③”、算法“④”對(duì)puncted_sphere數(shù)據(jù)集進(jìn)行降維的結(jié)果見(jiàn)圖2。 圖2(a)是puncted_sphere原始數(shù)據(jù)集的分布狀態(tài);圖2(b)是對(duì)puncted_sphere加入幅值為0.3的隨機(jī)噪聲圖;圖2(c)為KISOMAPLLE和LLE對(duì)puncted_sphere加入0.3的隨機(jī)噪聲降維結(jié)果圖。通過(guò)對(duì)比可知,用算法③降維之后還可以保持一定的數(shù)據(jù)結(jié)構(gòu),而算法“④”已完全喪失了數(shù)據(jù)結(jié)構(gòu)。上述實(shí)驗(yàn)說(shuō)明,本研究提出的算法“③”,即KISOMAPLLE算法對(duì)于受噪聲污染的數(shù)據(jù)集有一定的魯棒性。
圖2 KISOMAPLLE和LLE在隨機(jī)噪聲為0.3的puncted_sphere數(shù)據(jù)集上的降維效果Fig.2 Dimension reduction of KISOMAPLLE and LLE on a puncted_sphere set with 0.3 random noise
3.2 在轉(zhuǎn)子故障診斷中的應(yīng)用情況
本研究選定的研究對(duì)象是一套雙跨轉(zhuǎn)子系統(tǒng)試驗(yàn)臺(tái)[13]。實(shí)驗(yàn)?zāi)M了五種典型的故障狀態(tài)類(lèi)型,即:{正常、不平衡、不對(duì)中、碰摩、松動(dòng)}。特征提取是在對(duì)采集到的故障信號(hào)進(jìn)行消噪之后進(jìn)行的。關(guān)于描述該套轉(zhuǎn)子系統(tǒng)故障狀態(tài)的原始故障數(shù)據(jù)集的具體構(gòu)造情況如下。
3.2.1 特征提取與數(shù)據(jù)降維
本研究對(duì)模擬的轉(zhuǎn)子的5種常見(jiàn)故障狀態(tài),每種狀態(tài)80個(gè)樣本。為了使提取到的數(shù)據(jù)集能全面客觀地反映出不同機(jī)械運(yùn)行故障狀態(tài)間的差別,為此,對(duì)每個(gè)通道的信號(hào)都提取了表1所示的包括時(shí)域、頻域、時(shí)頻域的總共36個(gè)特征,用12個(gè)通道的表1特征按順序去構(gòu)造樣本。最終組成的原始故障數(shù)據(jù)集是規(guī)模為400×432維的矩陣。
表1 單個(gè)通道信號(hào)的統(tǒng)計(jì)特征情況Tab.1 Statistic feature
為了剔除原始數(shù)據(jù)集中的冗余和干擾分類(lèi)精度的不相關(guān)特征,對(duì)數(shù)據(jù)集依據(jù)可分性指標(biāo)大于0.6的原則進(jìn)行了特征初步選擇[14],共篩選出第{16,28,31,47,11,4,7,16,28,4}共11個(gè)特征。即從原始的432維空間中,提取第{16,28,31,40,43,47,76,79,88,100,112}列作為本研究所提出算法輸入的原始數(shù)據(jù)集,圖3為其中兩個(gè)通道的特征選擇情況。
圖3 通道1和通道2特征選擇Fig.3 Channel 1 and channel 2 feature selection
將上述所提取得到的數(shù)據(jù)分別用3.1節(jié)中使用的7種算法,再加上⑧KPCA進(jìn)行數(shù)據(jù)降維。其中,權(quán)重因子統(tǒng)一取α=0.7,算法“④”、算法“⑤”、算法“⑥”的鄰域值均取K=8,其它算法均取K=13,結(jié)果如圖4所示。其中,“o”、“+”、“*”、“·”、“▽”分別表示不對(duì)中、不平衡、碰摩、松動(dòng)和正常五種狀態(tài)。
圖4 八種降維方法在轉(zhuǎn)子故障數(shù)據(jù)集中的降維Fig.4 Eight kinds of dimensionality reduction methods in dimensionality reduction of rotor fault data set
3.2.2 實(shí)驗(yàn)分析
根據(jù)類(lèi)間可分性判據(jù)[14],同類(lèi)樣本的類(lèi)內(nèi)距離越小,異類(lèi)樣本子集合間的距離越大,則說(shuō)明數(shù)據(jù)的可分性越好。依據(jù)此標(biāo)準(zhǔn),分析圖4可得出以下結(jié)論:(1)除算法“⑥”、算法“⑦”外,其他算法都能成功實(shí)現(xiàn)降維及分類(lèi);(2)算法“③”、“④”、“⑤”的分類(lèi)效果最好。其中,算法“④”和“⑤”對(duì)不平衡、碰摩和正常這三種狀態(tài)降維效果較好,但后面的實(shí)驗(yàn)表明它們會(huì)隨鄰域K的變化出現(xiàn)波動(dòng),魯棒性較差;(3)算法“①”~“③”中,算法“③”的效果最好。其中,在算法“①”降維結(jié)果中不平衡、碰摩和正常三種狀態(tài)類(lèi)間距較小,不易于分類(lèi);算法“②”中的類(lèi)間距大于算法“①”的,但類(lèi)內(nèi)距較大,說(shuō)明核函數(shù)有利于異類(lèi)樣本的分類(lèi),但在一定程度上會(huì)增大同類(lèi)樣本間的距離;而對(duì)于算法“③”,其內(nèi)類(lèi)距較算法“①”和“②”更小,類(lèi)間距更大,即可分性指標(biāo)更好,說(shuō)明算法的“③”即繼承了算法“①”的全局距離保持特性,又繼承了算法“④”的局部結(jié)構(gòu)保持能力,使其類(lèi)內(nèi)距不因算法“①”的全局保持能力而變得過(guò)于分散,更便于分類(lèi);(4)算法“⑧”可以將五種狀態(tài)分離,從圖4可知其類(lèi)間距要小于算法“③”降維結(jié)果的類(lèi)間距,可分性較要次于本研究所提出的算法。
因上述實(shí)驗(yàn)均是在各算法取單一領(lǐng)域值時(shí)的實(shí)驗(yàn)結(jié)果,實(shí)驗(yàn)結(jié)果有一定的局限性,為了更進(jìn)一步研究本算法的可行性,本實(shí)驗(yàn)也對(duì)多個(gè)鄰域值和不同分類(lèi)器進(jìn)行了研究,分別取降維后每種狀態(tài)的前40個(gè)樣本作為訓(xùn)練集,后40個(gè)樣本為測(cè)試集,分別輸入到SVM和粒子群優(yōu)化的SVM(PSO-SVM)兩種分類(lèi)器中,最后分別對(duì)這7種算法隨鄰域值從5到20變化時(shí)的準(zhǔn)確率進(jìn)行記錄并求其平均值,結(jié)果統(tǒng)計(jì)到表2中,然后對(duì)每種算法的降維準(zhǔn)確率隨鄰域值和分類(lèi)器的變化結(jié)果繪制出圖5。其中SVM用LIBSVM提供的工具箱,其中核函數(shù)用徑向基核函數(shù),核參c取0.07;PSO-SVM的參數(shù)設(shè)置為種群規(guī)模M=30,慣性權(quán)重ω=0.9,c1=2.8,c2=1.3,最大迭代次數(shù)itermax=300。
表2 SVM和PSO-SVM的平均分類(lèi)正確率Tab.2 The average classification accuracy of SVM and PSO-SVM %
圖5中用“□”和“○”分別代表SVM和PSO-SVM兩種分類(lèi)器。為了更加顯性表示本文算法的分類(lèi)準(zhǔn)確率隨鄰域的變化時(shí)分類(lèi)器對(duì)結(jié)果的影響,則繪出圖6加以補(bǔ)充說(shuō)明。綜上,從表2、圖5的對(duì)比結(jié)果中可以得出如下結(jié)論:
(1)分類(lèi)器的選擇對(duì)故障辨識(shí)結(jié)果有一定的影響。縱向比較顯示:用PSO優(yōu)化的SVM的分類(lèi)準(zhǔn)確率普遍高于SVM,這是由于SVM的參數(shù)為一定值,而PSO優(yōu)化的SVM的參數(shù)通過(guò)尋優(yōu)為最優(yōu)值,從而有較高的故障識(shí)別率,這說(shuō)明分類(lèi)器的參數(shù)選擇不同將直接影響分類(lèi)精度。
(2)算法“③”的辨識(shí)準(zhǔn)確率最高。橫向比較顯示:當(dāng)算法“③”隨鄰域值從5~20變化時(shí),PSO-SVM對(duì)五種狀態(tài)的平均分類(lèi)準(zhǔn)確率均達(dá)到100%,而SVM平均分類(lèi)正確率也能達(dá)到97.062 5%,說(shuō)明該算法具有較強(qiáng)的故障辨識(shí)能力,且對(duì)鄰域值的依耐性較弱,魯棒性較強(qiáng)。
(3)算法“④”和算法“⑤”降維結(jié)果出現(xiàn)波動(dòng)現(xiàn)象。當(dāng)鄰域值較小時(shí)算法“④”、“⑤”的診斷正確率為100%,但當(dāng)鄰域值在8~15變化時(shí),準(zhǔn)確率隨之出現(xiàn)大幅度的變動(dòng),說(shuō)明算法“④”和算法“⑤”對(duì)鄰域的敏感性比較強(qiáng),魯棒性較差。
圖 5 SVM和PSO-SVM的分類(lèi)準(zhǔn)確率(%)Fig.5 Classification accuracy of SVM and PSO-SVM
圖6 KISOMAPLLE的SVM和PSO-SVM的分類(lèi)準(zhǔn)確率(%)Fig.6 Classification accuracy of SVM and PSO-SVM ofKISOMAPLLE
作為兩種經(jīng)典的流形學(xué)習(xí)算法ISOMAP、LLE,它們已被成功地應(yīng)用到了很多領(lǐng)域。本研究以核方法為基礎(chǔ),對(duì)這兩種算法進(jìn)行結(jié)合,然后去解決非線性高維數(shù)據(jù)集降維、解決好故障數(shù)據(jù)分類(lèi)的實(shí)現(xiàn)方法進(jìn)行了探討。提出了一種可以被統(tǒng)一在同一核框架下的KISOMAPLLE算法。該算法能夠繼承這兩種原始算法的優(yōu)良特性,在典型的人工數(shù)據(jù)集、轉(zhuǎn)子故障數(shù)據(jù)集的降維應(yīng)用中的使用情況表明,本算法不僅對(duì)噪聲和鄰域的選擇具有較強(qiáng)的魯棒性,而且能夠顯著增大不同類(lèi)別數(shù)據(jù)子集間的距離,可以提高數(shù)據(jù)子集間的可分性,由此可提高故障分類(lèi)的準(zhǔn)確率。
[ 1 ] BALASUBRAMANIAN M, SCHWARTZ E L. The isomap algorithm and topological stability[J]. Science, 2002, 295(4):7a.
[ 2 ] ZHANG Yun, LI Benwei, WANG Zibin. Fault diagnosis of rotating machine by isometric feature mapping [J]. Journal of Mechanical Science and Technology, 2013, 27 (11) : 3215-3221.
[ 3 ] TENENBAUM J B, DE SILVA V, LANGFORD J C. A global geometric framework for nonlinear dimensionality reduction [J]. Science, 2000, 290(5500):2319-2323.
[ 4 ] GENG Xin, ZHAN Dechuan, ZHOU Zhihua, et al.Supervised nonlinear dimensionality reduction for visualization and classification[J]. IEEE Transaction on Systems, Man, And Cybernetics-PartB: Cybernetics , 2005,35(6):1098-1107.
[ 5 ] CHAHOOKI M A Z, CHARKARI N M. Unsupervised manifold learning based on multiple feature spaces [J]. Machine Vision and Applications, 2014, 25:1053-1065.
[ 6 ] ROSMAN G. BRONSTEIN M M, BRONSTEIN A M, et al. Nonlinear dimensionality reduction by topologically constrained isometric embedding[J]. International Journal Computer Vision , 2010, 89: 56-68.
[ 7 ] VAN DER MAATEN L, POSTMA E, VAN DEN HERIK J.Dimensionality reduction: a comparative review [J]. Journal of Machine Learning Research,2007,10(1):1-22.
[ 8 ] HAM J L, MIKE D S. A kernel view of the dimeninality reducation of manifolds [C]∥ Proc of the 21st International Conference On Machine Learning, 2004.
[ 9 ] 張少龍,鞏知樂(lè),廖海斌. 融合LLE 和ISOMAP的非線性降維方法[J]. 計(jì)算機(jī)應(yīng)用研究, 2014, 31(1):277-280. ZHANG Shaolong, GONG Zhile, LIAO Haibin. Fusion of LLE and ISOMAP nonlinear descending dimension method [J]. Application Research of computers, 2014, 31 (1): 277-280.
[10] CHOI H, CHOI S. Kernel isomap [J]. Electronics Letters, 2004,40(25):1612-1613 .
[11] 杜京義,侯媛彬. 基于核方法的故障診斷理論及其方法的研究[M]. 北京:北京大學(xué)出版社, 2010, p1-7.
[12] 雷迎科. 流形學(xué)習(xí)算法及其應(yīng)用研究[D]. 合肥:中國(guó)科學(xué)技術(shù)大學(xué),2011.
[13] 霍天龍,趙榮珍,胡寶權(quán). 基于熵帶法與 PSO 優(yōu)化的SVM轉(zhuǎn)子故障診斷[J]. 振動(dòng)、測(cè)試與診斷, 2011, 31( 3): 279-284.HUO Tianlong, ZHAO Rongzhen, HU Baoquan. Based on entropy method and PSO SVM rotor fault diagnosis[J]. Journal of Vibration, Test and Diagnosis, 2011, 31 (3): 279-284.
[14] 張恒,趙榮珍. 故障特征選擇與特征信息融合的加權(quán)KPCA方法研究[J]. 振動(dòng)與沖擊, 2014, 33(9):89-93. ZHANG Heng, ZHAO Rongzhen. Fault feature selection and feature information fusion weighted KPCA method to study [J]. Journal of Vibration and Shock, 2014, 33 (9): 89-93.
Method for the dimension reduction of rotor fault data sets by using ISOMAP and LLE
CHEN Pengfei, ZHAO Rongzhen, PENG Bin, LI Kunjie
(Institute of Mechanical and Electrical Information Technology, College of Mechano-Electronic Engineering,Lanzhou University of Technology, Lanzhou 730050,China)
The data set for fault diagnosis and decision based on machinary intelligence gives rise to the requirement of dimension reduction in data processing. The algorithms of Isometric Mapping (ISOMAP) and Locally Linear Embedding (LLE) were introduced simultaneously to mutually complement their strong points and weak points, and a new KISOMAPLLE algorithm was proposed. The algorithm can satisfy the requirement of both global distance preserving and local structure preserving ability, and has been used to reduce the dimension of typical artificial data sets and rotor fault data sets. The proposed algorithm inherits the excellent performances of ISOMAP and LLE, and can improve the classification accuracy of typical nonlinear data sets.
fault diagnosis; manifold learning; kernel method; feature extraction
國(guó)家自然科學(xué)基金資助項(xiàng)目(51675253);教育部高校博士學(xué)科點(diǎn)專(zhuān)項(xiàng)科研基金資助 (20136201110004)
2015-10-12 修改稿收到日期:2016-01-31
陳鵬飛 男,碩士,1989年生
趙榮珍 女,博士,教授,博士生導(dǎo)師,1960年生 E-mail:zhaorongzhen@lut.cn
0TH165.3; TP181
A
10.13465/j.cnki.jvs.2017.06.007