關曉穎, 陳果,林桐
南京航空航天大學 民航學院, 南京 210016
特征選擇的多準則融合差分遺傳算法及其應用
關曉穎, 陳果*,林桐
南京航空航天大學 民航學院, 南京 210016
為了全面評價特征子集的好壞,提高特征子集作為最佳子集的可靠性,以及更快找到最佳子集,提出了一種用于特征選擇的多準則融合差分遺傳算法。引入多個評價準則對特征子集進行評價,并對遺傳算法的選擇算子進行改進,有利于選出適應度高且具有重要特征的個體;同時,引入差分策略改進變異算子,提高種群多樣性和算法搜索能力;最后通過仿真實驗和滾動軸承實例驗證了該方法的有效性。
特征選擇; 多準則; 差分進化; 遺傳算法; 滾動軸承; 故障診斷
特征選擇的任務就是求出一組對分類最有效的特征,即在特征維數減少到同等水平時,其分類性能最佳。Filter法和Wrapper法是常用的方法。Filter法利用單獨的可分性準則來選擇特征;Wrapper法利用分類器進行特征選擇[1]。由于Wrapper法是直接利用分類器的錯誤率作為特征選擇的依據,具有特征選擇精度高的優(yōu)點,但由于每次選擇子集后都需要進行學習訓練,耗時大。而Filter法的單個評價準則不能全面評價特征子集的好壞?;诖?,特征選擇既要定義有效的可分性準則進行特征評價,還需要設計有效的算法提高最優(yōu)特征組合的可靠性和搜索效率。
特征選擇的過程可以看作是一個求解組合優(yōu)化問題的過程,因此可以用解決組合優(yōu)化問題的方法來解決特征選擇問題。遺傳算法(Genetic Algorithm,GA)在這方面具有很大的潛力,尤其當選擇的空間很大(特征維數很高)且對特征間的關系缺乏認識時。遺傳算法通過模擬自然界中生物進化的遺傳規(guī)律尋找最優(yōu)的進化結果,屬于帶導向性的隨機優(yōu)化算法,具有良好的全局搜索能力和隱含的并行性。目前,遺傳算法被廣泛應用于特征選取,國內外學者對基于遺傳算法的特征選擇方法進行了研究并取得良好的效果[2-8]。
然而,現(xiàn)有應用于特征選擇的遺傳算法中,對于Filter方法,更多是采用單個評價準則;其次,在GA的改進上,未充分考慮特征權重對GA搜索的引導性,以及傳統(tǒng)的變異算子不容易變異得到更多的優(yōu)秀個體。有鑒于此,本文提出一種用于特征選擇的多準則融合的差分遺傳(Differential Evolution and Genetic Algorithm with Multi-criteria Evaluation, MEDEGA)算法,算法的第1階段采用ReliefF算法[9]獲得特征權值,為第2階段的GA搜索提供先驗知識和導向;第2階段提出差分遺傳算法,以簡單遺傳算法(Simple Genetic Algorithm, SGA)為基礎,利用特征權值,并結合適應值對選擇算子進行改進,以及采用差分策略改進變異算子,另外,還以特征子集作為整體進行評價;第3階段注重最優(yōu)特征子集的可靠性評價,在每次GA終止時得到的結果進一步評價,選擇頻繁出現(xiàn)的特征或特征組合,避免偶爾出現(xiàn)的特征所產生的干擾。算法實現(xiàn)了加快種群收斂速度,提高算法性能,有效改善特征選擇的效果。最后,用仿真實例驗證了方法的有效性,并將方法應用于滾動軸承故障特征的選擇研究,得到了滾動軸承故障診斷的最優(yōu)特征子集。
遺傳算法是模擬遺傳繼承和達爾文的適者生存原理,它以適應度函數(或目標函數)為依據,通過對群體施加遺傳算子操作來實現(xiàn)群體內個體基因重組的迭代處理過程,逐代演化產生出越來越好的近似解。遺傳算法的實現(xiàn)涉及5個主要因素:個體的編碼、初始群體的設定、適應度函數(評價函數)的設計、遺傳算子(選擇、交叉、變異、精英策略)和算法控制參數。特征選擇的過程就是一個求解組合優(yōu)化問題的過程,為了求得最優(yōu)特征子集及提高算法的性能,遺傳算法要重點解決的問題有:① 構造適應度函數;② 遺傳算子(選擇、雜交和變異)的設計。
針對Filter方法的單個評價準則不能全面評價特征子集的好壞,為了提高選擇精度,以及提高特征子集作為最佳子集的可靠性,本文提出了多準則融合差分遺傳算法用于特征選擇,分別從3個方面去選擇和評價特征子集:第一,單個特征對分類的貢獻,為GA搜索提供先驗知識和導向。采用ReliefF算法計算單個特征權值,權值越大,則該特征對分類的影響就越大;第二,特征子集作為一個整體進行評價,選取類間距離大、類內距離小的特征子集;第三,提高最優(yōu)特征子集的可靠性,避免偶爾出現(xiàn)的特征所產生的干擾,結合多次測試的結果,選擇頻繁出現(xiàn)的特征或特征組合。圖1為基于多準則融合的特征選擇示意圖,圖2為MEDEGA算法的流程圖。
圖1 基于多準則融合的特征選擇示意圖Fig.1 Illustration of feature selection based on multi-criteria
圖2 提出的多準則融合差分遺傳(MEDEGA)算法流程圖Fig.2 Flowchart of proposed differential evolution and genetic algorithm with multicriteria evaluation (MEDEGA) algorithm
1.2.1 ReliefF算法
ReliefF算法[9]是Kononenko在1994年提出的,它是一種改進的Relief算法,也是目前Filter特征選擇的方法之一,它主要用于處理多類問題以及回歸問題。通過不斷調整權值,使得和類別相關性高的特征賦予較高的權值。
算法的主要思想是:每次從訓練樣本集D中隨機取出一個樣本Ri,找出與樣本Ri同類的k個最近鄰Hj,對每個類C≠class(Ri),找出與Ri不同類的k個最近鄰Mj(C),然后根據式(1)更新每個特征的權值:
(1)
式中:diff(A,R1,R2)表示樣本R1和樣本R2在特征A上的差;m為重復次數。diff(A,R1,R2)的計算公式為
(2)
然而,雖然ReliefF算法適合處理具有大量實例的高維數據集,評估效率高,在噪聲過濾方面表現(xiàn)優(yōu)異,但它不能去除冗余特征[10]。
1.2.2 適應度函數
由于特征之間可能存在不同程度的相關性,不應只關注單個特征對分類的貢獻,應將特征子集作為一個整體進行評價,選取類間距離大、類內距離小的特征子集。因此,本文定義特征子集的類間距離與類內距離之比作為適應度函數,其計算公式為
(3)
式(3)中的分子衡量了類間的疏散程度,值越大,則說明類間越疏散;分母衡量了類內的聚集程度,值越小,則說明類內越聚集。
1.2.3 特征權值與適應值相結合的選擇算子
采用ReliefF計算得到特征權值,得到了單個特征對分類的貢獻;適應度函數從類間與類內距離計算特征子集整體對分類的貢獻。特征權值作為先驗知識,為算法搜索提供導向性,將適應度高且具有重要特征的個體選出,本文設計了特征權值與適應值相結合的選擇算子,具體如下:
1) 計算特征子集權值的均值;假設特征子集的特征個數為n,W(Ai)為特征Ai的權值,則計算特征子集權值的均值為
(4)
2) 計算個體k的適應值在種群中的比重
(5)
式中:m為種群規(guī)模;fk為個體k的適應值。
3) 計算個體被選擇的概率
pk=t·aver+(1-t)Sk
(6)
式中:t為[0,1]的隨機數,表示適應值與特征權值的比重。本文取t=0.5。
4) 計算累積概率以構造一個輪盤。
5) 輪盤賭選擇:在[0,1]區(qū)間內產生一個隨機數,若該隨機數小于或等于個體k的累積概率且大于個體k-1的累積概率,則選中個體k。
1.2.4 差分變異
差分進化(Differential Evolution,DE)是一種基于群體差異的啟發(fā)式隨機搜索算法,變異操作方面使用差分策略,即利用種群中個體間的差分向量對個體進行擾動,實現(xiàn)個體變異。DE的變異方式有效利用群體分布特性,提高算法搜索能力,避免遺傳算法中變異方式的不足[11]。
本文采用了改進的差分變異[12],在每一個新個體的生成過程中用到了父代多個個體的線性組合, 而不是遺傳算法傳統(tǒng)單一的父代染色體交叉技術;并且根據兩個父體的度量距離來決定變異基因位數,然后根據式(10)計算基因值。有利于提高種群的多樣性和提高算法的搜索能力。具體如下:
1) 隨機選擇3個不同父代個體r1、r2、r3。
2) 計算兩個父代個體的距離
(7)
3) 確定個體變異基因數,p為(0,1)隨機數。
(8)
4) 每個基因位的變異:隨機選擇一個基因位i,設該基因位的值表示為hi;根據選出的3個父代個體,使用式(9)計算它們在基因位i的線性組合并賦給hi,即
(9)
式中:F為縮放因子,一般是取值范圍為 [0,2]的常量,用于控制差分向量的擾動程度。經驗表明F取值太小容易使種群過早收斂,而F取值過大時算法收斂速度會明顯下降[13]。本文取F=1.0。
由于r1,r2,r3的取值是0或1(文中所有GA的編碼方式均采用二進制編碼),這3個變量取值就有8種組合,而根據式(9)計算得到,其中6種組合的結果是0或1,而另外2種組合(001和110)的結果分別是-1和2,因此,hi的最終值可根據式(10)計算得到:
(10)
為了測試算法的尋優(yōu)能力,作了如下仿真試驗。樣本數共281個,3類樣本組成,這3類的樣本數分別為93、108和80,特征維數為20,其中特征1和特征2是有效的分類特征,特征3至特征20的取值為0到1之間的隨機數,對分類基本不起任何作用。各樣本在特征1和2張成的空間的分布如圖3(a)所示,特征3和特征4的分布如圖3(b),圖3中每種顏色代表一種類別。顯然,遺傳優(yōu)化的目標是得到最優(yōu)特征組合11000000000000000000。
圖3 仿真數據Fig.3 Simulation data
為了驗證MEDEGA算法的性能,與其他3種算法進行比較,這3種算法分別是:差分遺傳算法(Different Evolution and Genetic Algorithm,DEGA)、基于ReliefF的遺傳算法(Genetic Algorithm based on ReliefF,RGA)、SGA。遺傳算子設置如表1所示。
其他參數取值及說明如下:
1) 交叉率。取值過大會破壞群體中的優(yōu)良模式,不利于進化,取值過小,產生新個體的速度較慢,一般建議取值范圍是0.4~0.99[14],本文交叉率取值為0.7。
表1 4種算法的遺傳算子Table 1 Genetic operators in four algorithms
2) 變異率。取值較大可能會破壞很多較好的模式,取值太小則產生新個體的能力和抑制早熟現(xiàn)象能力較差,一般建議取值范圍是0.000 1~0.1[14],本文變異率取值為0.05。
算法共測試50次,每次運行100代。
2.2.1 研究算法的收斂速度
圖4所示是在50次測試中選取各種算法最快找到最優(yōu)特征組合的一次測試,并分別從4種種群規(guī)模為80、100、150和200對4種算法的收斂情況進行分析。從圖中可得到,在不同的種群,MEDEGA都能最快找到最優(yōu)解,基本都在10代以內就收斂到最優(yōu)解;當在種群規(guī)模為80和100時,MEDEGA和DEGA找到最優(yōu)解的速度相差不大,但和RGA或SGA差別就大;但當在種群規(guī)模為150和200時,4種算法的差別就沒那么明顯,但種群規(guī)模大,搜索時間就需要更多。因此,總體來看,MEDEGA在不同種群規(guī)模中收斂速度均是最快的。
圖4 4種算法在不同種群規(guī)模的收斂曲線圖Fig.4 Convergence graphs of different population sizes with four algorithms
2.2.2 種群均值情況
圖5所示是在50次測試中選取各種算法最快找到最優(yōu)特征組合的一次測試,分析種群均值情況。從圖中可得到,MEDEGA和DEGA這兩種算法種群均值比RGA和SGA的種群均值高很多,特別是MEDEGA,在進化初期比其他3種算法的種群均值都高,這說明在進化初期就能快速搜索到優(yōu)秀的個體,并且將父代優(yōu)秀的基因或基因模式學習并遺傳給后代。
2.2.3 最優(yōu)特征子集可靠性
從50次測試的角度對各種算法找到的最優(yōu)特征子集可靠性進行分析。其中,表2中的“Frequency of the best feature subset”是指在50次測試中,成功找到最優(yōu)特征組合“1100000000 0000000000”的次數;“Frequency of the optimum pattern”是指50次測試中成功找到特征最佳模式“11******************”的次數(“*”代表一個“0”或“1”); “Solution speed”表示50次測試中成功找到最優(yōu)特征組合的平均求解次數。
在表2中,從成功找到最優(yōu)特征組合次數和求解速度這兩個方面來看,MEDEGA和DEGA相差不太大,MEDEGA略優(yōu)于DEGA,但MEDEGA和DEGA明顯優(yōu)于RGA和SGA;從找到最佳模式的次數來看,MEDEGA較其他3種算法具有明顯的優(yōu)勢。由于在實際應用中,遺傳算法的適應度函數設計要結合實際問題,綜合考慮各方面的因素,并且往往有些方面是互相制約的。因此,為了避免偶然性或干擾性,增加找到解的可靠性及適用性,本文根據最優(yōu)適應值所對應的特征組合,綜合考慮50次測試中特征或特征組合出現(xiàn)次數。當某個特征或特征組合出現(xiàn)的次數越多,說明選中它們是更可靠的。因此,從結果來看,本文所采取的方法對提高解的可靠性和適用性是有效的。
圖5 4種算法在不同種群規(guī)模的種群均值Fig.5 Average values of different population sizes with four algorithms
表2 可靠性和求解速度的比較數據Table 2 Comparison of reliability and solution speed
AlgorithmPopulationsizeFrequencyofthebestfeaturesubsetFrequencyoftheoptimumpatternSolutionspeedMEDEGA80174319100284415150224616200234312DEGA80223226100262821150202022200131317RGA80232901006285215014295920082746SGA8053671100532571505256720073246
綜合以上圖4、圖5和表2的分析:圖4和圖5 是對50次測試中的一次測試進行比較分析,從種群收斂速度和種群均值這兩個方面對算法的性能進行分析;表2則從50次測試進行總體分析。可以看出MEDEGA比其他3種算法表現(xiàn)得更優(yōu),這是因為MEDEGA算法以特征權值作為先驗知識,對算法的搜索起到引導作用;另外,變異操作采用差分變異,將3個不同父代個體進行線性組合生成一個新的個體,這更利于將父代優(yōu)秀的基因或基因模式學習并遺傳給后代。同時,還綜合考慮最優(yōu)適應值及其對應特征或特征組合選中的次數,增加最終選出的特征組合的可靠性和適用性。另外,MEDEGA和DEGA在各方面的性能相差不大,但MEDEGA與RGA的性能相差比較大,說明差分變異與權值相比,差分變異對算法的性能改善作用更大。
采用沈陽發(fā)動機設計研究所研制的帶機匣的航空發(fā)動機轉子試驗器進行故障模擬實驗[15],分別在試驗器垂直上方和水平方向布置加速度傳感器,獲取機匣的振動加速度信號,振動信號通過NI USB9234 數據采集器進行采集,加速度傳感器信號為B&K 4805,采樣頻率為10.24 kHz,實驗的對象為6206型滾動軸承,軸承參數如表3 所示,試驗器如圖6所示。分別在轉速為1 500、1 800、2 000、2 400 r/min下進行了3組故障模擬試驗,每組試驗數據包括正常、外圈故障、內圈故障、以及滾動體故障4種狀態(tài)(如圖7所示),每個轉速下均有兩個測點,其中CV為渦輪機匣垂直上方測點,CH為渦輪機匣水平方向測點。
利用時域、頻域和時頻分析法得到13個無量綱特征量[16],13個無量綱特征量的符號定義為:歪度S1、波型因數S2、沖擊指標S3、峰值指標S4、峭度S5、裕度指標S6、重心頻率S7、均方頻率S8、頻率方差S9、內圈頻率包絡譜特征量S10、外圈頻率包絡譜特征量S11、滾動體頻率包絡譜特征量S12、以及保持架頻率包絡譜特征量S13。故障樣本數據如表4所示,其中:“All CV”表示在轉速1 500、1 800、2 000、2 400 r/min下,渦輪機匣垂直上方測點獲得的樣本數據;“1 500 CH”表示在轉速1 500 r/min下,渦輪機匣水平方向測點獲得的樣本數據;其他數據集命名類似。
圖6 航空發(fā)動機轉子試驗器Fig.6 Aero-engine rotor test rig
圖7 故障加工后的6206型軸承Fig.7 Bearing 6206 after fault processing
表3 6206型軸承基本參數Table 3 Basic parameters of bearing 6206
mm
遺傳算法的參數取值:群體規(guī)模為50,交叉率為0.7,變異率為0.05,式(6)中的t=0.5,縮放因子F=0.5。算法共測試50次,每次運行50代。
對表4的滾動軸承故障樣本數據,利用ReliefF算法得到了13個特征的權值,如圖8所示。通過圖8(a)可以看出,在CV測點,特征9(即S9)的權值最大,即它對分類的重要性最大。而對于圖8(b)即在CH測點,對所有的數據集來說,沒有具體某個特征對分類的貢獻是比較明顯的,但相對來說,S9和S11對分類的貢獻相對比較大。
表4 滾動軸承故障樣本數據Table 4 Sample data sets of rolling bearing fault diagnosis
圖8 特征權值Fig.8 Feature weight values
針對表4的滾動軸承故障樣本數據,對所提取出的13個特征,分別利用4種算法進行特征選擇,結果如表5所示。利用Weka軟件對特征選擇后的滾動軸承故障進行分類識別,其結果如圖9 所示。在Weka軟件里采用J48算法驗證分類的準確率,10折交叉驗證。
表54種算法找到的特征子集
Table5Selectedfeaturesubsetsobtainedbyfouralgorithms
DatasetAlgorithmMEDEGADEGARGASGAAllCV2,8,9,10,112,8,9,112,8,9,112,9,111500CV7,8,97,8,97,8,97,8,91800CV7,9,10,117,9,117,9,117,9,112000CV1,7,9,10,112,7,9,10,117,9,119,112400CV7,9,108,9,108,9,108,9,10AllCH2,7,9,11,122,8,9,10,112,8,9,118,9,111500CH2,8,9,112,8,9,112,8,9,118,9,111800CH7,8,9,117,8,9,117,8,97,8,9,112000CH7,8,9,11,132,8,9,117,9,119,112400CH8,9,11,127,9,117,9,118,9,11
圖9 4種算法的分類準確率Fig.9 Classification accuracy by four algorithms
從表5和圖9可以看出,MEDEGA找到的特征子集所對應的分類準確率要優(yōu)于另外3種算法,除了1個數據集(All CH)比最高分類準確率低1.21%,其他的數據集,MEDEGA的分類準確率都優(yōu)于或等于其他的算法(6個優(yōu)于,3個等于)。并且,個別數據集是以相同的特征組合得到更高的分類準確率;有些數據集是特征子集稍多1~2個特征,得到更高的分類準確率,這說明MEDEGA具有更強的搜索能力,較好地改善了遺傳算法的早熟現(xiàn)象。同時,從表5中可以看出,MEDEGA選出的特征也符合實際的應用。
為了驗證算法在滾動軸承故障特征選擇中的收斂速度,選取表5中的1 500 CV數據集作為研究對象,這是因為從表5可知4種算法只在這個數據集上找到的特征子集是相同的,因此,收斂速度的比較是基于各種算法達到的目標相同的情況下進行的。從圖10中可以看出MEDEGA以更快的速度找到最優(yōu)解。
圖10 4種算法在數據集1 500 CV的收斂曲線圖Fig.10 Convergence graph with four algorithms in dataset 1 500 CV
比較本文算法MEDEGA(采用多準則融合)與采用單準則(ReliefF、基于類間類內距離)的特征選擇方法的性能。它們找到的最優(yōu)特征子集與分類準確率分別如表6和圖11所示。其中,表6中“類間類內”得到的特征子集是將基于類間類內距離的準則與GA結合,類間類內距離作為GA的適應度函數。另外,考慮到比較的有效性,對于ReliefF,每個數據集按特征權重大小依次取靠前的特征,且特征個數與MEDEGA的特征個數相同。
表6單準則與多準則融合得到的特征子集
Table6Selectedfeaturesubsetsobtainedbysinglecriterionandmulti-criteria
DatasetAlgorithmMEDEGAReliefFInter-classandintra-classAllCV2,8,9,10,117,8,9,11,132,9,111500CV7,8,97,8,98,91800CV7,9,10,117,8,9,118,9,112000CV1,7,9,10,117,8,9,10,1110,112400CV7,9,108,9,108,9,10AllCH2,7,9,11,127,8,9,11,132,8,9,111500CH2,8,9,114,7,111,7,8,111800CH7,8,9,117,8,9,138,112000CH7,8,9,11,133,4,9,11,137,9,112400CH8,9,11,127,8,9,137,11
圖11 單準則與多準則融合的分類準確率Fig.11 Classification accuracy by single criterion and multi-criteria
從圖11可以看出,10組數據中,僅有2組數據的結果比ReliefF稍差,而比類間類內準則的結果均要好。由此可見,MEDEGA的分類準確率總體上要優(yōu)于其他兩種單準則的分類準確率,說明本文提出的多準則融合方法對提高特征子集的分類準確率是有效的。
1) 提出了一種用于特征選擇的多準則融合的差分遺傳算法,通過對選擇算子和變異算子進行改進,既保證群體多樣性,又提高了搜索速度,同時,采用多準則融合的評價準則,增強了解的可靠性。利用仿真實驗對算法進行了驗證,結果表明了方法的正確有效性。
2) 針對航空發(fā)動機轉子試驗器的滾動軸承故障實驗數據,利用本文方法進行了故障特征選擇研究,結果也表明了本文方法的有效性。
[1] 張學工. 模式識別[M]. 3版. 北京: 清華大學出版社, 2010: 157.
ZHANG X G. Pattern recognition[M]. 3rd ed. Beijing: Tsinghua University Press, 2010: 157 (in Chinese).
[2] AKRAM A, RAMI N, AHMED A A. Enhancing the diversity of genetic algorithm for improved feature selection[C]//2010 IEEE International Conference on Systems Man and Cybernetics (SMC). Piscataway, NJ: IEEE Press, 2011: 1325-1331.
[3] MAJID M, NICOLAS H Y. On the use of the genetic algorithm filter-based feature selection technique for satellite precipitation estimation[J]. IEEE Geoscience and Remote Sensing Letters, 2012, 9(5): 963-967.
[4] CANUTO A M P, NASCIMENTO D S C. A genetic-based approach to features selection for ensembles using a hybrid and adaptive fitness function[C]//The 2012 International Joint Conference on IEEE Neural Networks (IJCNN). Piscataway, NJ: IEEE Press, 2012: 1-8.
[5] 高鵬毅, 陳傳波, 張葵, 等. 一種使用多Filter初始化GA種群的混合特征選擇模型[J]. 小型微型計算機系統(tǒng), 2012, 33(11): 2379-2384.
GAO P Y, CHEN C B, ZHANG K, et al. Hybrid model initializing the genetic population with multiple filters for feature selection[J]. Journal of Chinese Computer Systems, 2012, 33(11): 2379-2384 (in Chinese).
[6] 任江濤, 孫婧昊, 黃煥宇, 等. 一種基于信息增益及遺傳算法的特征選擇算法[J]. 計算機科學, 2006, 33(10): 193-195.
REN J T, SUN J H, HUANG H Y, et al. Feature selection based on information gain and GA[J]. Computer Science, 2006, 33(10): 193-195 (in Chinese).
[7] 陳果, 鄧堰. 遺傳算法特征選取中的幾種適應度函數構造新方法及其應用[J]. 機械科學與技術, 2011, 30(1): 124-128.
CHEN G, DENG Y. Several new methods for features extraction based on genetic algorithm and their application[J]. Mechanical Science and Technology for Aerospace Engineering, 2011, 30(1): 124-128 (in Chinese).
[8] 劉元寧, 王剛, 朱曉冬, 等. 基于自適應多種群遺傳算法的特征選擇[J]. 吉林大學學報(工學版), 2011, 41(6): 1690-1693.
LIU Y N, WANG G, ZHU X D, et al. Feature selection based on adaptive multi-population genetic algorithm[J]. Journal of Jilin University (Engineering and Technology Edition), 2011, 41(6): 1690-1693 (in Chinese).
[9] KONONENKO I. Estimation attributes: Analysis and extensions of ReliefF[C]//Proceedings of the 1994 European Conference on Machine Learning, 1994: 171-182.
[10] 張麗新, 王家廞, 趙雁南, 等. 基于Relief的組合式特征選擇[J]. 復旦學報(自然科學版), 2004, 43(5): 893-898.
ZHANG L X, WANG J X, ZHAO Y N, et al. Combination feature selection based on Relief[J]. Journal of Fudan University (Natural Science), 2004, 43(5): 893-898 (in Chinese).
[11] 楊啟文, 蔣靜坪, 曲朝霞, 等. 應用邏輯操作改善遺傳算法性能[J]. 控制與決策, 2000, 15(4): 510-512.
YANG Q W, JIANG J P, QU Z X, et al. Improving genetic algorithms by using logic operation[J]. Control and Decision, 2000, 15(4): 510-512 (in Chinese).
[12] DENG C, ZHAO B, YANG Y, et al. Binary encoding differential evolution for combinatorial optimization problems[C]//Proceedings of the 2011 Third International Workshop on Education Technology and Computer Science, 2011: 11-14.
[13] 劉琛, 林盈, 胡曉敏. 差分演化算法各種更新策略的對比分析[J]. 計算機科學與探索, 2013, 7(11): 983-993.
LIU C, LIN Y, HU X M. Analyses and comparisons of different update strategies for differential evolution[J]. Journal of Frontiers of Computer Science and Technology, 2013, 7(11): 983-993 (in Chinese).
[14] 周明. 遺傳算法原理及應用[M]. 北京: 國防工業(yè)出版社, 1999: 59.
ZHOU M. Genetic algorithms: Theory and applications[M]. Beijing: National Defense Industry Press, 1999: 59 (in Chinese).
[15] 陳果, 郝騰飛, 程小勇, 等. 基于機匣測點信號的航空發(fā)動機滾動軸承故障診斷靈敏性分析[J]. 航空動力學報, 2014, 29(12): 2874-2884.
CHEN G, HAO T F, CHENG X Y, et al. Sensitivity analysis of fault diagnosis of aero-engine rolling bearing based on vibration signal measured on casing[J]. Journal of Aerospace Power, 2014, 29(12): 2874-2884 (in Chinese).
[16] 梅宏斌. 滾動軸承振動監(jiān)測與診斷[M]. 北京: 機械工業(yè)出版社, 1995.
MEI H B. Rolling bearing vibration monitoring and diagnosis[M]. Beijing: China Machine Press, 1995 (in Chinese).
關曉穎女, 博士研究生。主要研究方向: 智能計算、 遺傳算法、 模式識別及故障診斷。
Tel.: 025-84891850
E-mail: xiaoying_close@sina.com
陳果男, 博士, 教授, 博士生導師。主要研究方向: 航空發(fā)動機智能診斷及專家系統(tǒng), 航空發(fā)動機整機振動與轉子動力學、 故障診斷。
Tel.: 025-84891850
E-mail: cgzyx@263.net
林桐男, 碩士研究生。主要研究方向: 航空發(fā)動機狀態(tài)檢測與故障診斷技術。
Tel.: 025-84891850
E-mail: nuaa_lintong@163.com
*Correspondingauthor.Tel.:025-84891850E-mail:cgzyx@263.net
Featureselectionmethodbasedondifferentialevolutionandgeneticalgorithmwithmulti-criteriaevaluationanditsapplications
GUANXiaoying,CHENGuo*,LINTong
CollegeofCivilAviation,NanjingUniversityofAeronauticsandAstronautics,Nanjing210016,China
Inordertomakeawholeevaluationtotheselectedfeaturesubset,whichimprovesthereliabilityofthebestsubsetandthespeedofitssearching,thepaperpresentsanovelfeaturemethodbasedondifferentialevolutionandgeneticalgorithmwithmulti-criteriaevaluation.Thisalgorithmisusedtoevaluatethefeaturesubsetbythemulti-criteriaevaluation.Meanwhile,theimprovedgeneticoperatorswereproposed,whichimprovestheselectionoperatorandthemutationoperator.Designingtheselectionoperatorwithacombinationoffeatureweightvaluesandfitnessisbeneficialtoselectingtheindividualswhichcontainthehighfitnessandimportantfeaturesfromthepopulation.Inaddition,itintroducesdifferentialstrategytoimprovemutationoperator,whichimprovesthediversityofevolutionpopulationandsearchingefficiency.Finally,simulationexampleteststhevalidityoftheproposedalgorithm.Thevalidityoftheproposedmethodisalsoverifiedwithrollingbearingfaultdiagnosis.
featureselection;multi-criteria;differentialevolution;geneticalgorithm;rollingbearing;faultdiagnosis
2015-11-19;Revised2016-01-14;Accepted2016-01-29;Publishedonline2016-02-021627
URL:www.cnki.net/kcms/detail/11.1929.V.20160202.1627.004.html
NationalNaturalScienceFoundationofChina(61179057)
2015-11-19;退修日期2016-01-14;錄用日期2016-01-29; < class="emphasis_bold">網絡出版時間
時間:2016-02-021627
www.cnki.net/kcms/detail/11.1929.V.20160202.1627.004.html
國家自然科學基金 (61179057)
*
.Tel.:025-84891850E-mailcgzyx@263.net
關曉穎, 陳果, 林桐. 特征選擇的多準則融合差分遺傳算法及其應用J. 航空學報,2016,37(11):3455-3465.GUANXY,CHENG,LINT.Featureselectionmethodbasedondifferentialevolutionandgeneticalgorithmwithmulti-criteriaevaluationanditsapplicationsJ.ActaAeronauticaetAstronauticaSinica,2016,37(11):3455-3465.
http://hkxb.buaa.edu.cnhkxb@buaa.edu.cn
10.7527/S1000-6893.2016.0036
V263.6
A
1000-6893(2016)11-3455-11