原慧軍,王雨川
(1.山西機電職業(yè)技術學院電氣工程系,山西長治 046011;2.山西大同大學煤炭工程學院,山西大同 037009)
液壓泵是一種可以實現高效響應、大幅調速以及高功率輸出的動力設備,在工程機械設備液壓驅動領域發(fā)揮了重要作用[1]。液壓泵屬于液壓系統(tǒng)的一個最關鍵組件,它可以為系統(tǒng)提供所需的動力來源,該泵的實際運行狀況對液壓系統(tǒng)控制性能與動力傳輸效率都發(fā)揮著重要作用,并且設備的整體動力輸出穩(wěn)定性也受到液壓系統(tǒng)的直接影響[2-3]。
現階段針對液壓泵開展的健康狀況診斷基本是以單獨振動或壓力信號作為判斷條件,對于實際工況來說,由于存在多種復雜振動源[4],只根據單一壓力或振動信號進行處理容易引起診斷結果的波動變化。綜合運用不同類型的傳感器進行信號分析時,可以實現液壓泵運行狀態(tài)的準確判斷,顯著提升系統(tǒng)的分辨精度與運行穩(wěn)定性,使系統(tǒng)成本得到有效控制[5-6]。與單傳感器相比,設置多傳感器后可以獲得更多的有用信息。信息融合是對各類信息的多級處理過程,可以將它看作對上級信息的重新加工和抽象計算[7]。目前,已有很多學者在健康診斷過程加入信息融合的方法進行研究[8]。任鳳娟[9]通過BP網絡診斷多路信號,以D-S理論對結果實施融合,促進了液壓系統(tǒng)診斷精度的顯著提升。劉思遠等[10]分別對各種磨損程度的液壓滑靴測試了振動、出口流量與壓力烈度因子,再根據上述參數構建得到多信息決策融合算法,由此完成對磨損程度的準確判斷。LU等[11]則分別以泵級、液壓動力級與執(zhí)行級信號建立相應的概率分配函數,之后通過相似距離D-S理論進行決策融合,從而達到泵故障診斷的效果。
深度森林模型屬于一種根據決策樹建立得到的深度模型,具備快速訓練、模型參數少以及準確率高的多項優(yōu)勢[12]。本文作者綜合運用傳感器數據融合與級聯森林模型來實現液壓泵的健康評價,同時運用特征級與決策級融合技術實現對柱塞泵各傳感器信息的快速融合,以隨機森林模型評價初步特征的重要性,并從中選擇具備高重要度的初始特征參數,通過級聯森林模型對液壓泵健康檢測結果實施分類。
增加液壓泵使用時間后,其磨損程度明顯增大,從而造成液壓泵健康狀態(tài)持續(xù)惡化,產生更大程度的泄漏,并引起壓力損失顯著上升,因此溫度、流量也受到相應的影響。文中根據實際試驗環(huán)境對液壓泵流量、出口壓力、溫度參數進行采集,完成參數樣本的篩選后再以時域特征建立初期特征。根據分類器與特征篩選的方式處理初步特征,再通過拼接得到預測特征,由此達到特征融合的效果,最后構建級聯森林模型評價系統(tǒng)健康狀態(tài)。圖1給出了診斷的具體流程。
圖1 液壓泵健康診斷流程Fig.1 Health diagnosis process of hydraulic pump
將信息融合理解成是對各類信息進行多級處理的過程,各級處理都屬于上級信息的抽象和再加工。同時確保信號來自同一個物理量,包含了大量融合信息,但該方法需要消耗大量時間并且缺乏良好的干擾性能。特征級融合是一種第二層次融合的方式,需從傳感器初始信號中提取特征參數,接著融合上述特征參數,有效避免數據級融合單一物理量因素所產生的制約,完成壓縮信號的過程,大幅簡化了傳輸過程[12]。決策級融合屬于層次最高的融合模式,需對各獨立信號開展特征提取、辨別與決策,之后融合以上決策數據并獲得最終結果,實現優(yōu)異的抗干擾性能以及高精度的分類效果。
以上信息融合方法依次針對初始信號、數據特征以及決策結果實施融合。為了能夠充分發(fā)揮信息融合過程的數據特征與決策性能,對各分類器類別概率向量和高重要度特征實施融合,把融合特征輸入級聯森林模型完成分類。圖2給出了采用文中信息融合方法進行處理的具體原理。
圖2 特征融合方法Fig.2 Feature fusion method
以隨機森林模型原始輸入特征實現特征數據的篩選,獲得經過篩選與降維的特征Fimp;再對類別概率向量與經過處理的關鍵特征Fimp拼接獲得融合特征。融合特征長度Fl受到類別數c、分類器數量j、特征數量Fc的共同影響。
因此上述融合特征中既包含多分類器決策數據,同時也含有原特征的關鍵信息。能夠防止出現分類器不適用或引起特征提取結果不足的問題,更加針對性地增強特征可靠度并達到更高的準確率。
采用寬度為k維的滑動窗口作為分析對象進行特征掃描轉化。依次通過常規(guī)隨機森林以及完全隨機森林分類器訓練各特征子樣本,對各分類器進行訓練后獲得了一個c維概率向量,對各特征子樣本處理獲得類別概率向量。完成類別概率向量拼接后可獲得2×m×c維轉換特征向量。
級聯森林模型選擇與DNNs相近的層級結構,可以將之前的森林分類器輸入到后一層森林分類器中進行計算,結果見圖3。把上述特征向量輸入級聯森林結構內,再和各層算法計算得到的森林分類器結果進行概率向量拼接后組成后一層的輸入,由此實現結果的準確預測。級聯森林各層中都存在多個常規(guī)與完全隨機森林分類器,因此模型集成表現出更豐富的多樣性,森林分類器再根據特征差異確定特征指標。為防止過擬合,通過k折交叉方法對級聯森林分類器進行訓練驗證。
圖3 級聯森林結構Fig.3 Cascade forest structure
圖4給出了文中設計的液壓泵測試系統(tǒng),該裝置包含了液壓泵、電機、油箱、壓力檢測器、溢流閥等部件,此次選擇川崎K3V系列斜盤軸向柱塞泵作為測試泵。根據表1的條件,以3種健康狀態(tài)的柱塞泵開展測試:健康的1號泵、運行2 000 h后達到中度磨損的2號泵、運行時間超過3 000 h即將報廢的3號泵。
表1 液壓泵故障代號Tab.1 Fault code of hydraulic pump
圖4 液壓泵測試系統(tǒng)Fig.4 Hydraulic pump test system
測試期間,以PCI-E8025數據采集卡對信號采集,頻率為12.5 kHz,共采樣800 s。此實驗使用的噪聲計包含了2個通道輸出,其中,通道AI10產生交流電信號,1 Vrms為噪聲計范圍檔,通道AI11輸出直流電信號,10 mV對應1 dB的噪聲。
對P1泵進行傳感器信號測試,結果見圖5。將噪聲信號表示成電壓信號的狀態(tài),以傳感器測試形成的400萬數據作為對象;再以隨機方式從各健康狀態(tài)中采集560個訓練樣本與240個測試樣本。根據以上處理方式,完成各個模擬信號的數據分析。
圖5 傳感器信號Fig.5 Signals of sensor:(a)flow;(b)speed;(c) temperature
建立180維初步特征集后,容易產生數據冗余而無法獲得理想的模型效果,文中綜合運用決策級與特征級融合的方法實現信息融合過程并獲得新的預測特征,從而大幅降低特征冗余,獲得更高的模型預測精度。由圖2可知,新特征包括了以下兩部分內容:第一部分是通過多個分類器根據初步特征建立的類別概率向量;第二部分則是根據隨機森林模型特征重要性確定的結果。
對于第一部分,可以通過初步時域特征訓練各分類器得到P1、P2、P3分類概率,設置與后續(xù)深度森林模型同樣比例的訓練樣本。對于第二部分,則利用隨機森林模型評價初步特征的重要性,選擇高重要度的前8個初步特征構成新特征。表2給出了前8個關鍵特征與含義。
表2 重要度分類Tab.2 Importance classification
分析表2時域特征可以發(fā)現:最關鍵的3個特征參數是泵泄油口溫度、泵2與泵1出口溫度,整流均值與均方根值都屬于重要統(tǒng)計特征。由此表明可以根據柱塞泵泄油口與出口部位溫度判斷柱塞泵的運行情況,可以在泵健康狀態(tài)診斷方面發(fā)揮重要作用。
多粒度掃描超參數包括森林分類器數量與種類、決策樹個數、滑動窗口與節(jié)點分裂最小樣本數量等;級聯森林超參數包括森林分類器個數與種類、決策樹個數與節(jié)點分裂最小樣本數量。
文中在確定多粒度掃描與級聯森林分類器種類時按照完全隨機森林與常規(guī)隨機森林相結合的形式,再根據經驗設定滑動窗口依次為2、4、8,設定節(jié)點數量為5。表3所示為設定參數。
表3 級聯森林模型的參數Tab.3 Parameters of the cascade forest model
文中對其中20%樣本開展測試,再對其余樣本進行訓練。此次分類過程存在普遍性,以分類過程的2個主要參數作為評價指標,再根據以上測試集測定級聯森林模型,通過計算獲得了100%的分類精確率與召回率。
設定測試集比例介于30%~95%,對應訓練集比例介于70%~5%,根據訓練集模型獲得的精確率對模型小訓練樣本健康狀態(tài)進行評價,經分類得到表4所示參數??芍簩τ谛∮柧殬颖?,以多傳感器信息融合方法構建的級聯森林模型進行預測時,可以實現對液壓泵健康狀態(tài)的準確診斷,只設置5%訓練集時,液壓泵健康診斷達到99.5%精確率。
表4 不同訓練比例下診斷結果 單位:%Tab.4 Diagnosis results under different training ratios Unit:%
只對第一與第二部分預測向量中的參數開展分析,再以級聯森林方法完成分類,當訓練集比例達到10%時,診斷結果如表5所示。分析表4-5可知:對級聯森林結構部分預測向量,采用多傳感器信息融合后分類效果顯著降低。
表5 部分預測向量診斷結果Tab.5 Part of prediction vector diagnosis results
為深入探討各類信息融合方法結果的差異性,根據采集端口條件設定壓力、溫度、流量參數,再利用以上流程對初始數據進行處理,實現時域特征參數的提取、建立特征參數并完成模型的訓練過程。為了能夠更加準確呈現各類預測結果,依次計算測試集占比為90%條件下P1、P2、P3精確率與召回率。表6給出了具體的組合形式與分類情況。
表6 組合方式下診斷結果Tab.6 Diagnosis results in combination mode
由表6可知:當采用單一溫度特征無法同時滿足精確率與召回率條件時,隨著流量信息的增加,所有數據預測精確率上升了8%;隨著壓力信息的增加,各類數據預測精確率上升了7%,獲得了更優(yōu)的分類性能。并且,“溫度+流量”組合模式的各類預測精確率與召回率相對其他模式更高,由此表明溫度融合流量組合形式具備更大優(yōu)勢。
(1)以多傳感器信息融合方法構建的級聯森林模型進行預測時,可以實現對液壓泵健康狀態(tài)的準確診斷,只設置5%訓練集時,液壓泵健康診斷結果達到99.5%精確率。
(2)當采用單一溫度特征無法同時滿足精確率與召回率條件時,組合模式相對其他模式達到了更高的預測精度與召回率,表明溫度融合流量組合形式具備更大優(yōu)勢。