肖翼洋 申傳俊 鐘多就
(1、海軍航空大學(xué)青島校區(qū),山東 青島264001 2、海軍湛江航保修理廠,廣東 湛江524002)
軍用飛機(jī)所使用的接觸器是電磁類開關(guān)器件, 用于頻繁接通和斷開主電路, 具有可遠(yuǎn)程操作和以小控大的優(yōu)點(diǎn), 由于接觸器長期連續(xù)工作在頻繁分?jǐn)嗟墓ぷ鳡顟B(tài), 一旦發(fā)生故障將造成巨大損失, 因而國內(nèi)外都非常注重接觸器的維護(hù)。對接觸器進(jìn)行針對性的特征分析, 將特征參數(shù)用于壽命預(yù)測, 可指導(dǎo)維修人員對繼電器進(jìn)行及時(shí)的維護(hù)更換, 避免重大事故的發(fā)生。
目前對交流接觸器進(jìn)行特征分析的方法主要有: 主成分分析、經(jīng)驗(yàn)?zāi)B(tài)分解和小波分析,并取得較好效果。主成分分析來源于統(tǒng)計(jì)學(xué), 優(yōu)勢在于可以降低原始數(shù)據(jù)冗余度和預(yù)測模型的復(fù)雜度。例如:田琨利用主成分分析法對交流接觸器的試驗(yàn)數(shù)據(jù)進(jìn)行分析,提取了交流接觸器兩個(gè)新特征,對新特征進(jìn)行神經(jīng)網(wǎng)絡(luò)預(yù)測的誤差比原特征小[1]。高筱婷對主成分分析進(jìn)行了改進(jìn),用于交流接觸器狀態(tài)檢測特征的主要信息提取, 同時(shí)建立了一種評價(jià)機(jī)制, 利用分析的結(jié)果對改進(jìn)的方法進(jìn)行了仿真驗(yàn)證[2],結(jié)果表明改進(jìn)的方法能較好的剔除噪聲信息。王圓圓利用經(jīng)驗(yàn)?zāi)B(tài)分解同樣實(shí)現(xiàn)了對交流接觸器數(shù)據(jù)的去噪, 為交流接觸器性能的評估提供了保證[3]。
為了研究飛機(jī)直流接觸器的電氣參數(shù)退化特征, 本文對直流接觸器試驗(yàn)數(shù)據(jù)進(jìn)行主成分特征分析,獲取特征參數(shù),利用隨機(jī)森林算法對接觸器試驗(yàn)數(shù)據(jù)進(jìn)行分析與處理, 得到該特征的評價(jià)值,以確定接觸器有關(guān)參數(shù)為接觸器的退化特征,并根據(jù)該退化特性,指導(dǎo)直流接觸器壽命預(yù)測。
表1 試驗(yàn)樣本集
本文研究對象為接觸器的電氣參數(shù),主要包括:線圈電阻,反峰電壓,啟動(dòng)電流,保持電流,吸合電壓,釋放電壓,吸合時(shí)間,釋放時(shí)間,回跳時(shí)間,絕緣性能,接觸電阻。上述參數(shù)可以利用標(biāo)準(zhǔn)儀器測量。MZJ-200 型直流接觸器第二期試驗(yàn)中的接觸器數(shù)據(jù)試驗(yàn)所獲得的樣本集如表1。
基變換實(shí)現(xiàn)了數(shù)據(jù)從一個(gè)空間到另一個(gè)空間的映射, 這組基(一組方向)選擇的要求為:(1)在變換過程中保留原始數(shù)據(jù)的更多信息;(2)基變換后的數(shù)據(jù)特征之間的數(shù)據(jù)冗余盡可能小[4-7];(3)實(shí)現(xiàn)降低特征目標(biāo), 把原始數(shù)據(jù)中主要的成分都保留在新的空間下。
將接觸器試驗(yàn)數(shù)據(jù)在基上投影,作主成分分析,判斷提取的特征是否有隨吸合次數(shù)增加的退化趨勢。步驟如下:
(1)數(shù)據(jù)標(biāo)準(zhǔn)化。
(2) 算樣本集D 進(jìn)行標(biāo)準(zhǔn)化處理后的數(shù)據(jù)X 的協(xié)方差矩陣,獲取協(xié)方差,
(3)求取協(xié)方差矩陣C 的特征值λi和特征向量ei。
(4)將重要的特征向量按照與其對應(yīng)的特征值的大小降序排列,并且合并這些特征向量組成代表樣本主要信息的特征矩陣,利用原始數(shù)據(jù)與特征矩陣基變換獲得提取的特征矩陣[8]
(5) 將特征值降序排列,求出每個(gè)特征值的比重并計(jì)算累加比重,并繪制圖表如圖1,表2- 表4。
如提取原始數(shù)據(jù)70%的主要信息, 選取第1、2、3 主成分已經(jīng)足夠,實(shí)際結(jié)果中包含了80%的信息。第1、2、3 主成分對應(yīng)的特征向量E1、E2和E3組成的特征矩陣如表5。
表2 樣本集D 的11 個(gè)特征值降序排列
表3 11 個(gè)特征值的特征比重
表4 11 個(gè)特征值的特征累加比重
圖1 11 個(gè)特征值的特征比重和累加比重
(6)計(jì)算樣本集D 的特征矩陣。繪制提取的特征隨吸合次數(shù)增加的變化曲線,分析提取的特征是否有退化趨勢。
圖2-4 中,橫坐標(biāo)表示吸合次數(shù),縱坐標(biāo)表示提取特征的值。
結(jié)論:從圖2、圖3 中可以得出:①隨吸合次數(shù)的增加,提取的特征1 的值在不斷下降,下降過程中有非常小的波動(dòng),且規(guī)律明顯;②隨吸合次數(shù)的增加,提取的特征2 的值在600 次吸合以前大致在[-1.2,1]之間波動(dòng),僅有少許值游離在范圍外。特征2 在600-1400 次,1600~2000 次、2000~3000 次吸合時(shí)不斷下降。且在這三段下降之間的位置的某個(gè)特定值附近都有突然的上升;③隨吸合次數(shù)的增加,提取特征3 的值在不斷上升,上升過程僅有少量波動(dòng)。
表5 樣本集D 的特征矩陣
圖2 特征1 隨吸合次數(shù)增加的變化曲線
圖3 特征2 隨吸合次數(shù)增加的變化曲線
圖4 特征3 隨吸合次數(shù)增加的變化曲線
集成學(xué)習(xí)思想是為了解決單個(gè)模型或者某一組特征的模型所固有的缺陷,從而整合了更多的模型,取長補(bǔ)短,避免局限性。隨機(jī)森林就是集成學(xué)習(xí)思想下的產(chǎn)物, 將許多棵決策樹整合成森林, 并合起來用來預(yù)測最終結(jié)果或者投票決定測試樣本的最終類別。
圖5 隨機(jī)森林原理圖
隨機(jī)森林主要包括4 個(gè)部分:隨機(jī)選擇樣本;隨機(jī)選擇特征;構(gòu)建決策樹;隨機(jī)森林投票分類。
假設(shè)一個(gè)分類系統(tǒng)的樣本空間(D,Y),D 表示樣本集,Y 表示基于特征X 的最優(yōu)分割點(diǎn)確定的k 個(gè)類別,可能的取值是C1,C2,……,Cn。每一個(gè)類別出現(xiàn)的概率是P(C1),P(C2),……,P(Cn)。該分類系統(tǒng)的熵為:
熵值越高,則數(shù)據(jù)混合的種類越多,其蘊(yùn)含意義是一個(gè)變量可能的變化越多(跟變量具體的取值沒有任何關(guān)系,只和值的種類多少以及發(fā)生概率有關(guān)),它攜帶的信息量就越大。
根據(jù)信息增益的公式,分類系統(tǒng)中特征X 的信息增益為:
信息增益是針對特征而言的,對一個(gè)特征X,系統(tǒng)有無特征X 時(shí)信息量的差值就是這個(gè)特征給系統(tǒng)帶來的信息增益。每次選取特征的過程都是通過計(jì)算每個(gè)特征值劃分?jǐn)?shù)據(jù)集后的信息增益,然后選取信息增益最高的特征。
經(jīng)過一輪信息增益計(jì)算后會(huì)得到一個(gè)特征作為決策樹的節(jié)點(diǎn),該特征有幾個(gè)取值,節(jié)點(diǎn)就會(huì)有幾個(gè)分支,每一個(gè)分支都會(huì)產(chǎn)生一個(gè)新的數(shù)據(jù)子集, 余下的遞歸過程就是對每個(gè)新的數(shù)據(jù)子集再重復(fù),直至子數(shù)據(jù)集都屬于同一類。
使用scikit-learn 庫中的隨機(jī)森林模塊構(gòu)建隨機(jī)森林, 需要確定三個(gè)參數(shù):決策樹的個(gè)數(shù)、葉子節(jié)點(diǎn)上包含的樣本最小值、分割內(nèi)部節(jié)點(diǎn)所需的最少樣本數(shù)量。確定這三個(gè)參數(shù)的依據(jù)7折交叉驗(yàn)證準(zhǔn)確率。
由于隨機(jī)森林中各個(gè)決策樹并聯(lián)訓(xùn)練,互不影響,且最終分類結(jié)果為所有決策樹投票表決。故決策樹數(shù)量這個(gè)參數(shù),對另外兩個(gè)參數(shù)對7 折交叉驗(yàn)證準(zhǔn)確率的影響沒有干擾。故在確定另外兩個(gè)參數(shù)的最佳值時(shí), 決策樹數(shù)量可以任意取值, 這里取74個(gè)。
特征評價(jià):依據(jù)特征評價(jià)思想,依次完全破壞各個(gè)特征,求出對應(yīng)的特征重要性。
圖6 隨機(jī)森林特征重要性評價(jià)
由圖6 可知,釋放電壓、接觸壓降、釋放時(shí)間和吸合回跳這四個(gè)特征的特征評價(jià)最高, 且其他的各特征的特征評價(jià)相對而言較低。
結(jié)論:選取釋放電壓、接觸壓降、釋放時(shí)間和吸合回跳為接觸器的退化特征。由接觸器的這四個(gè)特征隨吸合次數(shù)增加的變化趨勢可知,這四個(gè)特征的確具有退化趨勢(圖7)。
對飛機(jī)直流接觸器的電氣特征參數(shù)作主成分分析,提取特征量,對兩個(gè)新特征隨動(dòng)作次數(shù)增加的變化趨勢進(jìn)行分析,發(fā)現(xiàn)兩個(gè)新特征均具有良好的退化趨勢。利用隨機(jī)森林算法對接觸器特征參數(shù)進(jìn)行特征分析與處理,結(jié)果表明釋放電壓、接觸壓降、釋放時(shí)間和吸合回跳為接觸器退化特征。退化特征可用于壽命預(yù)測,預(yù)測結(jié)果可直接指導(dǎo)該型接觸器的維修工作,具有重要的軍事與經(jīng)濟(jì)效益。