亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        故障特征選擇與特征信息融合的加權(quán)KPCA方法研究

        2014-09-05 07:32:40趙榮珍
        振動與沖擊 2014年9期
        關(guān)鍵詞:特征選擇分類樣本

        張 恒,趙榮珍

        (1.蘭州理工大學(xué) 數(shù)字制造技術(shù)與應(yīng)用省部共建教育部重點(diǎn)實(shí)驗(yàn)室,蘭州 730050;2.蘭州理工大學(xué) 機(jī)電工程學(xué)院,蘭州 730050)

        在機(jī)械裝備信息化技術(shù)發(fā)展中,機(jī)械運(yùn)行狀態(tài)的量化特征描述,已成為關(guān)乎該項(xiàng)技術(shù)是否能夠科學(xué)發(fā)展的關(guān)鍵性問題。為此,建立起一種能夠科學(xué)描述機(jī)械裝備運(yùn)行狀態(tài)的量化特征模式,用這種模式去解決好設(shè)備運(yùn)行維護(hù)知識的原始數(shù)據(jù)資源搜集問題等,對推動此項(xiàng)技術(shù)向科學(xué)方向發(fā)展具有重要作用[1]。數(shù)據(jù)挖掘和知識發(fā)現(xiàn)研究情況表明,對原始信息通過特征提取與有效的特征融合處理,可達(dá)到降低數(shù)據(jù)分類難度、從而提高故障模式分類質(zhì)量的目的,但這需要對特征屬性篩選問題開展深入研究。對于屬性篩選,比較肯定的方法包括纏繞法[2]、過濾法[3]等。其中前者特點(diǎn)是篩選出的特征雖然可提高數(shù)據(jù)分類的準(zhǔn)確度,但存在著實(shí)現(xiàn)過程復(fù)雜、計(jì)算量偏大的缺陷;后者借助評價(jià)準(zhǔn)則對待分析數(shù)據(jù)及其客觀狀況進(jìn)行分析,具有判斷各特征屬性對分類性能影響的優(yōu)良作用。其中用到的評價(jià)準(zhǔn)則包括特征相關(guān)性[2]、類間可分性[2]、ReliefF算法[2]、不一致測度[2]、信息增益等指標(biāo)[2],以及這些準(zhǔn)則間的“串行”與“并行”優(yōu)化組合[3]等。由于生產(chǎn)實(shí)踐中旋轉(zhuǎn)機(jī)械均是以機(jī)組在運(yùn)行,因此對獲得機(jī)組運(yùn)行維護(hù)管理知識的數(shù)據(jù)型知識資源問題,對借助數(shù)據(jù)驅(qū)動去發(fā)展關(guān)于機(jī)組的機(jī)器智能技術(shù)等,具有非常積極的作用。

        基于上述分析,本研究欲以一個(gè)雙跨轉(zhuǎn)子系統(tǒng)12個(gè)通道的測試信息集合為研究對象,對描述轉(zhuǎn)子系統(tǒng)運(yùn)行狀態(tài)的敏感特征數(shù)據(jù)集構(gòu)造以及解決故障分類問題的方法進(jìn)行探討。欲為雙跨轉(zhuǎn)子系統(tǒng)運(yùn)行知識資源的在線積累,提供參考依據(jù)。

        1 特征選擇方法簡介

        轉(zhuǎn)子系統(tǒng)運(yùn)行狀態(tài)描述的敏感特征集構(gòu)造,涉及到數(shù)據(jù)挖掘研究中的特征選擇問題。該概念意指從原始特征集中,篩選出滿足某種評估標(biāo)準(zhǔn)的最優(yōu)特征子集。這一數(shù)據(jù)預(yù)處理過程是要從一個(gè)待分析的數(shù)據(jù)集中剔除那些影響數(shù)據(jù)分類質(zhì)量的不相關(guān)和冗余特征,以達(dá)到降低數(shù)據(jù)分類難度為目的。但研究已表明,單一評價(jià)準(zhǔn)則往往無法準(zhǔn)確評價(jià)各特征對分類結(jié)果的綜合影響。為此本研究將針對一個(gè)轉(zhuǎn)子系統(tǒng)振動信號集合的一種數(shù)據(jù)集的有效特征篩選問題,構(gòu)造出一種串行方式的多準(zhǔn)則特征選擇方法,即解決故障狀態(tài)特征空間的維度約簡問題。該串行方式涉及的方法包括類間可分性、ReliefF算法等。

        1.1 類間可分性判據(jù)

        為剔除原始數(shù)據(jù)集中的冗余和不相關(guān)特征,本研究欲引用一種基于離差測度的可分離性判據(jù)。該判據(jù)的出發(fā)點(diǎn)是:如果異類樣本子集的類間離差越大、類內(nèi)的離差越小,則類別間的可分性就越好。這一概念的數(shù)學(xué)定義如下。

        (1)

        總的類間離差矩陣:

        (2)

        其中:Ni為Xi中的樣本數(shù);Pi為xi∈Xi的頻率;mi(j)為Xi中第j維特征的樣本均值;m(j)為整個(gè)數(shù)據(jù)集第j維特征的均值。Sw表征了各類樣本子集合圍繞其均值的分布狀況;Sb則顯示出各類間的一種距離測度。將式(1)與式(2)概念集成,一種類間可分性測度可被定義為式(3)形式,即:

        (3)

        式(3)表明,J值越大的特征,類別可分性越好。故可根據(jù)J值的大小,從原始數(shù)據(jù)集中篩選出敏感特征系列,構(gòu)成一種敏感特征集合。這種敏感特征集合一般具備能夠降低原始數(shù)據(jù)集分類難度的能力。

        1.2 ReliefF算法

        原始的Relief算法僅適用于解決二分類問題[4]。目前,一種能夠解決多分類問題的改進(jìn)ReliefF算法已出現(xiàn)。這種改進(jìn)算法的特點(diǎn),是它的分類能力更加健全、能夠處理不完全和有噪聲數(shù)據(jù)集的多分類問題[5]。該算法的數(shù)據(jù)處理思想如下。

        在總體樣本中,xi={xi1,xi2,…,xin}表示第i個(gè)樣本的n個(gè)特征值。對于任意的一個(gè)樣本xi,首先搜索k個(gè)與xi同一類的最近鄰的樣本實(shí)例yj(j=1,2,...,k),然后在每一個(gè)與xi不同類的子集中搜索k個(gè)最近鄰的樣本實(shí)例hj(C)(j=1,2,...,k,C≠class(xi))。

        設(shè)diff_hit表示表示yj和xi在特征上的差異:

        (4)

        設(shè)diff_miss表示hj(C)和xi在特征上的差異:

        (5)

        特征權(quán)重W(xi)的更新依賴于隨機(jī)選擇的樣本實(shí)例xi、和xi在同類中k個(gè)近鄰diff_hit,以及和xi不在同一類中的k個(gè)近鄰diff_miss。權(quán)值W(xi)的遞推公式如下:

        (6)

        循環(huán)m次ReliefF算法,可得每維特征所對應(yīng)的W(xi)。該值越大,表明該特征與該類間的相關(guān)度越高;越小,表示該特征與該類間的相關(guān)度越低。據(jù)此可確定出特征屬性對分類的影響程度。

        2 基于特征選擇與特征信息融合的加權(quán)KPCA方法

        2.1 加權(quán)KPCA算法

        KPCA方法的主要思想是借助一種非線性映射函數(shù)Φ:RN→F,將低維空間的數(shù)據(jù)集映射至高維空間中,使低維空間中線性不可分的非線性數(shù)據(jù)集在高維空間中達(dá)到線性可分目的。但此法存在著假設(shè)所有樣本的貢獻(xiàn)率相同、不考慮樣本權(quán)重的影響問題。加權(quán)KPCA(WKPCA)方法是對一般KPCA方法的擴(kuò)展。其基本思想是通過對各個(gè)數(shù)據(jù)特征進(jìn)行加權(quán),突出不同特征對分類的影響程度作用。

        對輸入空間的N個(gè)樣本xi(i=1,2,…,N),xi∈RN,WKPCA分析方法的協(xié)方差矩陣如式(7)[6],即:

        (7)

        (8)

        (9)

        2.2 特征選擇與多通道特征信息融合的加權(quán)KPCA方法設(shè)計(jì)

        單純依靠特征選擇方法無法滿足對故障精確分類的要求,因?yàn)椴煌卣鲗Ψ诸惖挠绊懗潭炔煌诜诸愡^程中分類算法可能會被弱相關(guān)或不相關(guān)的特征所支配,從而影響分類質(zhì)量。特征加權(quán)處理方法,具有強(qiáng)化重要特征、弱化不相關(guān)特征的作用,從而對提高分類效果非常有借鑒參考作用。因此,在本研究中提出了一種特征選擇與特征信息融合的加權(quán)KPCA方法。該方法的數(shù)據(jù)處理流程如圖1所示。其特點(diǎn)是首先采用小節(jié)1介紹的特征選擇方法剔除不相關(guān)與冗余特征,達(dá)到數(shù)據(jù)降維目的;然后采用特征信息融合方法獲得多傳感器的融合特征向量;最后利用加權(quán)KPCA分析方法,提取出融合特征的核主成分。將依據(jù)此方法提取出的核主成分解決轉(zhuǎn)子系統(tǒng)故障數(shù)據(jù)集的準(zhǔn)確分類問題。該算法的流程描述如下:

        Step1:對每個(gè)通道消噪后的故障信號進(jìn)行時(shí)域、頻域和時(shí)頻域的多域特征提取,經(jīng)歸一化處理后構(gòu)成原始特征集F;

        Step2:采用二次特征選擇方法對原始特征集進(jìn)行篩選,選擇出利于故障分類的敏感特征集;

        Step3: 將從多個(gè)通道篩選出敏感特征集進(jìn)行特征信息融合,并將融合特征分為訓(xùn)練集Ftr和測試集Fte;

        上述算法中,為妥善解決好“二次特征選擇”問題,構(gòu)造出一種串行方式的多準(zhǔn)則特征選擇組合方法,其算法流程見圖2。本研究欲借助類間可分性指標(biāo)和ReliefF算法兩者之間的互補(bǔ)性,綜合提高篩選特征的分類敏感能力,為一類故障信息的自動獲取提供參考。

        圖1 特征選擇與特征信息融合的加權(quán)KPCA算法流程

        圖2 二次特征選擇的組合方法

        關(guān)于“二次特征選擇”的數(shù)據(jù)處理算法如下:

        Step1:按照類間可分性判據(jù),分別計(jì)算多類情況下樣本總的類內(nèi)離差Sw和類間離差Sb;根據(jù)評價(jià)準(zhǔn)則J值的大小進(jìn)行一次選擇,篩選出敏感特征集D;

        Step2:從D中隨機(jī)選取一個(gè)樣本xi,在D中找出與xi同類的k個(gè)近鄰yj(j=1,2,…,k),在其余各類中找出xi的k個(gè)近鄰hj(C)(j=1,2,...,k,C≠class(xi)),然后按式(6)更新屬性的權(quán)值,并根據(jù)權(quán)值大小進(jìn)行二次特征選擇。

        3 實(shí)驗(yàn)結(jié)果與分析

        本項(xiàng)研究工作的實(shí)驗(yàn)對象見文獻(xiàn)[8]圖3所示的一套仿真機(jī)組結(jié)構(gòu)的雙跨度轉(zhuǎn)子系統(tǒng)。在該實(shí)驗(yàn)裝置上,本研究分別模擬了質(zhì)量不平衡、轉(zhuǎn)子不對中、碰磨和支座松動四種常見故障類型。采用了在6個(gè)關(guān)鍵截面上相互垂直方位上分別布置的共12個(gè)渦流傳感器方式,拾取轉(zhuǎn)子系統(tǒng)的振動信號,并進(jìn)行消噪處理。按照2.2節(jié)所述的算法流程對故障信號進(jìn)行原始數(shù)據(jù)集構(gòu)造及算法應(yīng)用,應(yīng)用結(jié)果情況分別如下。

        3.1 初始特征提取情況

        為能夠全面客觀地反映出文獻(xiàn)[8]圖3轉(zhuǎn)子系統(tǒng)的運(yùn)行狀況,研究中采用了將時(shí)域、頻域、時(shí)頻域特征集成在一起構(gòu)造出單個(gè)通道信號的原始特征子集合方法。出于對雙跨度轉(zhuǎn)子系統(tǒng)振動狀態(tài)的盡可能全面描述之目的,設(shè)計(jì)出的單一通道信號的特征集合如表1。它由共29個(gè)特征作為單個(gè)通道信號的初始特征集。按照通道編號將其拓展至12個(gè)通道,據(jù)此規(guī)則構(gòu)造出了一種多域特征集合的雙跨轉(zhuǎn)子系統(tǒng)原始特征集合,作為具體的研究對象。

        表1 特征參數(shù)

        3.2 特征選擇與特征信息融合的分析應(yīng)用

        以ch2單通道信號為例,按照圖2流程進(jìn)行特征選擇,一次選擇結(jié)果如圖3所示。圖中,每條線的高低代表著可分性指標(biāo)J值的大小,線頂圈起來的特征表示選擇出的敏感特征。從圖3中可知,按照可分性指標(biāo)大于0.6的原則從29個(gè)原始特征中選擇出6個(gè)特征作為敏感特征,他們分別是P6、P11、P12、P13、P25、P28標(biāo)號對應(yīng)的特征。

        圖3 單一通道信號的原始特征集構(gòu)造

        采用ReliefF算法對敏感特征集進(jìn)行二次特征選擇,并計(jì)算特征權(quán)值。其中,循環(huán)次數(shù)m=30,計(jì)算得到加權(quán)矩陣W=[0.773 8,1.724 4,4.136 9,3.315 5,2.500 6,0.303 9]。權(quán)值矩陣中的第三個(gè)特征的貢獻(xiàn)程度最大,第六個(gè)特征的貢獻(xiàn)程度最小,基本符合一次特征選擇結(jié)果中特征指標(biāo)大小的分布情況。然后剔除權(quán)值小于1的特征。經(jīng)二次選擇得到P11、P12、P13、P25標(biāo)號對應(yīng)的特征,以及歸一化后的加權(quán)矩陣w=[0.147 7,0.354 4,0.283 7,0.214 2]。

        按照上述方法,分別對12個(gè)通道原始特征集進(jìn)行選擇并融合,處理結(jié)果如表2。表2中分別列舉了不平衡、不對中、碰磨和松動四類常見故障各80組樣本,各通道的29種特征經(jīng)過二次特征選擇后得到4種敏感特征,對上述敏感特征進(jìn)行融合,得到故障特征數(shù)據(jù)表可作為WKPCA方法的依據(jù)。

        3.3 WKPCA的分析應(yīng)用情況分析

        將從多通道數(shù)據(jù)集選出的融合特征向量引入核函數(shù)空間,采用高斯徑向基核函數(shù),對于核函數(shù)參數(shù)的選取問題,采用夾角余弦測度構(gòu)造適應(yīng)度函數(shù)[7],運(yùn)用粒子群優(yōu)化算法對核函數(shù)參數(shù)尋優(yōu)。其中設(shè)置進(jìn)化代數(shù)N=100,種群規(guī)模大小pop=30,通過計(jì)算得出加權(quán)特征的核參數(shù)σ結(jié)果見表3。

        為了使實(shí)驗(yàn)更有說服力,實(shí)驗(yàn)中分別選用一般KPCA方法、特征選擇后的KPCA方法和特征選擇融合后的加權(quán)KPCA方法提取核主元特征,提取的結(jié)果如表3所示。其中,分別提取了故障樣本的前4個(gè)主元特征,并計(jì)算其貢獻(xiàn)率和累計(jì)貢獻(xiàn)率??梢钥闯鎏卣鬟x擇KPCA方法的累積貢獻(xiàn)率要小于一般KPCA方法,表明前一方法的提取結(jié)果所包含的故障信息有所減弱,這是因?yàn)椴捎锰卣鬟x擇方法直接去除部分特征信息,但是去除的特征對于提取結(jié)果的影響并不大。而特征選擇融合的WKPCA方法較于二者,其所包含的故障信息有所提高。

        然后給出四種類別故障情況下的核主元特征點(diǎn)在前兩組特征向量下的二維分布情況見圖4。其中,“o”、“+”、“*”、“Δ”分別表示不平衡、不對中、碰磨和松動四種故障的核主元特征。圖(a)中采用一般KPCA方法提取的結(jié)果分布較散,并且類別2與類別3的樣本點(diǎn)混疊情況嚴(yán)重。圖(b)采用特征選擇KPCA方法的效果有所改善,但是樣本點(diǎn)沿著某一方向的分布集中,而沿著其他方向的分布較散,并且故障類別2的樣本點(diǎn)過于分散。圖(c)中采用特征選擇融合的WKPCA方法使得各故障樣本點(diǎn)的分布更加集中,類別間距明顯,識別效果好。

        表2 多傳感器融合的故障特征數(shù)據(jù)表

        表3 三種特征提取方法的主元貢獻(xiàn)率

        為進(jìn)一步驗(yàn)證本研究的有效性,采用SVM分類器對原始故障數(shù)據(jù)特征及采用了三類KPCA特征提取方法的結(jié)果進(jìn)行分類,結(jié)果見表4。其中,分別計(jì)算每一故障類別對比其余故障類別的分類準(zhǔn)確率[8]??梢钥闯?,由于原始特征中存在諸多的冗余特征與不相關(guān)特征,分類結(jié)果受到極大的影響,分類準(zhǔn)確率低;第一種方法對各類別的分類辨識度都不高,第二種方法的辨識效果有所改善,第三種方法的識別效果最優(yōu),其每一種故障類別的分類準(zhǔn)確率均可達(dá)到100%。

        表4 SVM分類辨識方法的準(zhǔn)確率(%)

        圖4 測試樣本的分離效果

        4 結(jié) 論

        為解決旋轉(zhuǎn)機(jī)械動力機(jī)組故障數(shù)據(jù)集的分類問題,提出了一種特征選擇與特征信息融合的加權(quán)KPCA方法。該方法采用二次特征選擇的組合設(shè)計(jì),這種設(shè)計(jì)不僅能去除冗余特征的缺陷,并且具有強(qiáng)化重要特征、弱化不相關(guān)特征的作用;采用特征信息融合方法提高了分類精度;運(yùn)用WKPCA分析方法,具有對非線性數(shù)據(jù)較好的處理能力。雙跨轉(zhuǎn)子系統(tǒng)典型故障數(shù)據(jù)集的應(yīng)用情況表明,將該方法用于典型故障信號的量化特征提取中,可有效地顯現(xiàn)出不同故障類別間的較顯著差異,為解決好故障數(shù)據(jù)集的類別劃分問題,提供了一種新途徑。

        [1]胡金海,謝壽生,侯勝利,等.核函數(shù)主元分析及其在故障特征提取中的應(yīng)用[J].振動、測試與診斷,2007,27(1):48-52.

        HU Jin-hai,XIE Shou-sheng,HOU Sheng-li,et al.Kernel principal component analysis and its application to fault feature extraction[J].Journal of Vibration,Meaturement & Diagnosis,2007,27(1):48-52.

        [2]楊藝,韓德強(qiáng),韓崇昭.基于排序融合的特征選擇[J].控制與決策,2011,26(3):397-401.

        YANG Yi,HAN De-qiang,HAN Chong-zhao.Study on feature selection based on rank-level fusion[J].Control and Decision,2011,26(3):397-401.

        [3]李勇明,張素娟,曾孝平,等.輪詢式多準(zhǔn)則特征選擇算法的研究[J].系統(tǒng)仿真學(xué)報(bào),2009,21(6):2010-2013.

        LI Yong-ming,ZHANG Su-juan,ZENG Xiao-ping,et al.Research of poll mode and multi-criteria feature selection algorithm based on chain-like agent genetic algorithm[J].J of System Simulation,2009,21(6):2010-2013.

        [4]Kira K,Rendell L A.The feature selection problem: Traditional methods and a new algorithm [C].Proceedings of the 9th National Conference on Artificial Intelligence.[S.l.]: AAAI Press,1992:129-134.

        [5]Kononenko I.Estimation attributes: Analysis and extensions of RELIEF[C]//Proceedings of the 1994 European Conference on Machine Learning.[S.l.]: ACM Press,1997:273-324.

        [6]Wang F,Wang J D,Zhang C S,et al.Face recognition using spectral features[J].Pattern Recognition,40(10):2786-2797(2007).

        [7]李曉宇,張新峰,沈蘭蓀.一種確定徑向基核函數(shù)參數(shù)的方法[J].電子學(xué)報(bào),2005,33(12):2459-2463.

        LI Xiao-yu,ZHANG Xin-feng,SHEN Lan-sun.A selection means on the parameter of radius basis function[J].Acta Electronica Sinica,2005,33(12):2459-2463.

        [8]霍天龍,趙榮珍,胡寶權(quán).基于熵帶法與PSO優(yōu)化的SVM轉(zhuǎn)子故障診斷[J].振動、測試與診斷,2011,31(3):279 -284.

        HUO Tian-long,ZHAO Rong-zhen,HU Bao-quan.Fault diagnosis for rotor systems based on entropy band method and support vector machine optimized by PSO [J].Journal of Vibration,Measurement & Diagnosis,2011,31(3):279-284.

        猜你喜歡
        特征選擇分類樣本
        分類算一算
        用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
        分類討論求坐標(biāo)
        推動醫(yī)改的“直銷樣本”
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
        Kmeans 應(yīng)用與特征選擇
        電子制作(2017年23期)2017-02-02 07:17:06
        村企共贏的樣本
        聯(lián)合互信息水下目標(biāo)特征選擇算法
        国产激情在线观看免费视频| 亞洲綜合一區二區三區無碼| 久久99精品这里精品动漫6| 亚洲精品大全中文字幕| 无码乱肉视频免费大全合集| 老色鬼永久精品网站| 一个人免费观看在线视频播放| 免费黄网站一区二区三区| 久久婷婷五月综合色奶水99啪| 久久夜色精品国产噜噜麻豆| 无码国产精品第100页| av免费在线播放一区二区| 精品露脸国产偷人在视频| 大地资源在线播放观看mv| 国产成社区在线视频观看| 成人水蜜桃视频在线观看| 国产七十六+老熟妇| 无遮无挡三级动态图| 国产免费的视频一区二区| 亚洲天堂精品一区入口| 女人被狂躁高潮啊的视频在线看| 国产精品亚洲欧美天海翼| 91中文字幕精品一区二区| 亚洲日韩成人无码| 欧美日韩一卡2卡三卡4卡 乱码欧美孕交 | 人人爽亚洲aⅴ人人爽av人人片| 亚洲最大av在线精品国产| 亚洲av无码乱码在线观看裸奔| 日韩www视频| 视频福利一区二区三区| 少妇激情av一区二区三区| 1区2区3区高清视频| 在线偷窥制服另类| 精品国产黄一区二区三区| 一本无码av中文出轨人妻| 午夜a福利| 一本色道精品亚洲国产一区| 亚洲愉拍99热成人精品热久久| 在线成人福利| 久久久免费精品国产色夜| 亚洲av永久无码精品漫画|