李良鈺,蘇鐵熊,馬富康
(1. 中北大學 機電工程學院,山西 太原 030051;2. 中北大學 能源動力工程學院,山西 太原 030051)
高壓共軌系統作為一個由高壓油泵、共軌管、電控噴油器與高壓油管等組成的復雜的系統,在運行中易受沖擊振動、磨損、腐蝕與老化等因素的影響,發(fā)生各種故障.因高壓共軌供油系統工作時的振聲與振動較小,易被其他信號干擾與覆蓋,故傳統的通過振動或振聲信號診斷故障的方法較難實現.通過對發(fā)動機油液的檢測則很難精確診斷故障且存在檢測周期長、成本高及無法實時監(jiān)測等問題.近年來,小波分析、經驗模態(tài)分解(EMD)、集合經驗模態(tài)分解(EEMD)等[1-5]時域分析方法被廣泛應用于柴油機故障的分析與診斷中.在特征值的識別領域,能量熵、排列熵、奇異值以及時域特征等被應用于特征參數的提取[6-11].在分類組合問題上,支持向量機、神經網絡等分類算法被應用于故障診斷中.通過時域、頻域分析提取構建振動、振聲信號的特征向量,并利用分類算法進行故障診斷的方法日趨成熟.但是以上故障診斷方法的使用前提是擁有大量的不同運行數據進行分類的訓練,并非所有運行狀態(tài)都可以獲得足夠的數據,特別是對高壓共軌柴油機這種結構復雜的動力機械而言,某些運行狀態(tài)的數據不具有大規(guī)模獲得的基礎與條件,妨礙其大規(guī)模獲取數據的原因主要有:(1)某些故障僅發(fā)生在特定環(huán)境或工況下,臺架試驗難以模擬此種故障的發(fā)生環(huán)境與工況;(2)某些故障的發(fā)生原因與機理尚不明確,臺架試驗無法模擬此種故障的發(fā)生;(3)模擬某些故障的臺架試驗成本過高,無法大規(guī)模獲得運行數據;(4)某些故障是破壞性的,模擬此故障可能對臺架試驗甚至是試驗人員造成傷害.
當因為某些原因無法獲得大量此故障的運行數據時,如何利用少量的運行數據進行故障診斷便成了亟待解決的問題,即筆者所指的小樣本故障診斷問題.傳統方法主要通過建立仿真模型的方法獲取大量數據,但仿真數據與真實數據始終存在誤差,且仿真數據的多樣性較弱,無法充分表現此狀態(tài)的特征參數.在深入研究高壓共軌系統故障診斷后,筆者借鑒深度學習中單樣本學習的相關方法,解決高壓共軌系統小樣本學習問題.單樣本學習是已經學習的舊類別可以幫助只有一個或幾個標簽的新類別學習[12],可分為在少量樣本中學習的小樣本學習和沒有樣本情況下通過其他信息學習的零樣本學習[13].小樣本學習已經廣泛應用于計算機視覺領域,并出現許多成熟的算法模型,主要有基于模型微調、基于數據增強和基于遷移學習等3類.基于模型微調的小樣本學習方法需要通過大量數據訓練一個模型,然后通過少量數據對模型進行微調,但少量數據并不能很好地反映大量數據的真實分布情況,故這種做法可能導致模型出現過擬合.基于遷移學習的小樣本學習方法屬于前沿研究,存在諸如算法不成熟、復雜度高、樣本過小時準確度較低及樣本維度變大時計算復雜度過高等問題.而基于數據增強的小樣本學習方法雖然在計算過程中存在引入噪聲等負面影響,但可以通過提高診斷模型性能解決此類問題.另一方面,由于大部分運行狀態(tài)都可以獲得足夠的訓練數據,使用基于數據增強,特別是基于數據合成的小樣本學習方法可以獲得大量的合成數據,與其他運行狀態(tài)共用一個診斷模型,有利于降低診斷系統的復雜程度.
筆者選擇基于數據合成的小樣本學習方法合成訓練數據供故障診斷模型訓練使用,為加快計算速度,使用經自適應隨機測試(ART)初始化參數的反向傳播(BP)神經網絡對經EEMD的軌壓信號進行故障診斷,證明了該方法的正確性;通過在多個運行狀態(tài)上與仿真模型和傳統對抗神經網絡(GAN)的對比發(fā)現,筆者所用方法有著較高的診斷正確率與良好的普適性,并證明了該方法的優(yōu)秀.
對高壓共軌系統的故障診斷一般以振動與振聲信號為基礎,輔助其他運行參數進行特征值向量的提取與構建,由于高壓共軌供油系統運行狀態(tài)中產生的振動與振聲較小,通過傳統方法極難準確提取與構建高壓共軌供油系統的特征向量.在高壓共軌供油系統中,共軌管作為連接高壓油泵、噴油器與其他零件的重要部件,其共軌管壓力包含許多信息,可通過軌壓提取與構建高壓共軌供油系統的特征向量.以10缸柴油機高壓共軌系統作為研究對象,為簡化計算,搭建一5缸單軌柴油機高壓共軌供油系統臺架進行研究.該試驗系統由德爾福(DELPHI)高壓共軌式燃油噴射系統、漢斯曼22kW噴油泵試驗臺、EMI-II型瞬態(tài)參數測試分析系統、EFS8233型共軌噴油器電磁閥控制儀、EFS8244型軌道壓力控制儀、軌道壓力傳感器、高精度角度傳感器及高強度聯軸器等組成.其原理示意如圖1所示.
圖1 共軌測試裝置系統原理示意Fig.1 Schematic diagram of the system principle of the common rail test device
提取軌壓信號后,因軌壓傳感器易受包括系統、環(huán)境及其他高頻噪聲的影響.為提高軌壓信號質量,采用一階低通模擬濾波器進行軌壓信號的前期處理,其時間常數為450μs,傳遞函數H(S)如式(1)所示,此濾波器可有效消除頻率在350Hz以上高頻噪聲.
式中:T為信號總時長;s為信號.
為解決軌壓信號采集時出現的信號損壞、缺失等問題,統一軌壓信號步長,提高軌壓信號的質量,通過線性插值處理采集的軌壓信號.這是一種基于疊函數系統(IFS),能夠反映插值點之間局部波動特征的插值方法,在描述非線性變化的曲線時,擁有比傳統插值方法更高的精度[14].
設存在一組插值數據D為
式中:ix為第i個x的值;yi為第i個y的值;I為數據長度.插值函數f(x)對于每一個 ix,都有f(xi)=yi,且插值數據(xi,yi)不共線.吸引子為插值數據的連續(xù)圖像.設映射函數Wj為
且滿足條件如式(4)所示.
依據IFS的條件推導映射函數,可得到式(3)中aj~fj的表達式分別為
式中:dj為自由變量,稱為垂直比例因子,將差值函數迭代到吸引子G附近,即可完成分形插值擬合.圖2為處理前、后的軌壓信號.
圖2 軌壓信號Fig.2 Rail pressure signal
作為一種強大的生成網絡,生成式GAN被廣泛應用于圖片生成、數據增強與樣本生成等領域.GAN由生成模型G和判別模型D這兩個深度神經網絡構成,傳統GAN的損失函數可表示為
式中:pdata為真實數據的概率分布;pz為根據噪聲生成的數據的概率分布;z為噪聲;x為真實數據;Ex~pdata為真實數據的期望;Ez~pz為噪聲的期望.生成式對抗網絡中的生成模型和判別模型是相互對抗的,生成模型的目標是盡量生成與真實數據相似的合成數據,判別模型用來判斷目標是否為真實數據.傳統GAN結構示意如圖3所示.其通過輸入一個根據高斯分布或正態(tài)分布產生的隨機噪聲,生成模型G 將輸入噪聲轉化為一個數據,判別模型D將輸入數據轉化為一個標量,用來表示輸入是真實數據的概率,GAN通過損失函數訓練生成模型G 與判別模型D,并學習真實數據的分布.
圖3 傳統GAN結構示意Fig.3 Structure of traditional GAN
圖4 為GAN基于概率的訓練過程.其中,點線、虛線和實線分別表示真實數據的分布、合成數據的分布以及判別模型,箭頭表示生成器G如何將輸入噪聲轉換為合成數據.
圖4 GAN訓練過程示意Fig.4 Schematic diagram of GAN training
基于數據合成的小樣本學習方法通過合成新的帶標簽數據來擴充訓練數據,Royle等[15]首先提出將GAN應用于小樣本學習中,通過訓練兩個相互對抗的神經網絡合成數據,但是合成數據的質量不甚理想,存在多樣性差等問題.為了提高GAN性能,近年來學者們對GAN的架構進行多種改進.Silver等[16]將卷積神經網絡應用到GAN架構中,提出了卷積生成對抗網絡.Mirza等[17]通過將條件變量作為附加信息約束生成過程,提出了條件生成對抗網絡.此外,還有其他優(yōu)秀的GAN架構被廣泛運用于各個領域.但上述一些網絡架構在訓練過程中穩(wěn)定性較差,特別是在小批次樣本訓練中根本無法使用.故障診斷中的小樣本學習是為了給診斷模型提供足夠的、高質量的以及能夠充分描述運行狀態(tài)的訓練數據,故除了要求GAN的生成質量外,還要合成的數據具有較強的多樣性.在各種構架中,Goodfellow等[18]通過將交叉熵損失函數換作最小二乘損失函數提出了LSGANs,使用不同距離而非分布概率作為量度構建一個多樣性更高的生成式對抗網絡,得到了質量高、多樣性強的合成數據.以LSGANs構架為基礎,使用EMD評價合成數據與真實數據的相似程度,為防止合成數據與真實數據過于相似、降低數據的多樣性,設置迭代停止條件使網絡在適當時候停止迭代,以此合成訓練樣本集.LSGANs的損失函數為
式中:a、b和c為常數,使用二元標簽0和1,則常數b=c=1,a=0.
為防止合成數據與真實數據過于相似、降低數據的多樣性,設置迭代停止條件如式(13)所示.
式中:k為輸入真實數據數量;P為輸出合成數據數量;K為經驗系數;EMD(q,)w為第q個輸入數據和第w個輸入數據的EMD,這是一種通過一次線性規(guī)劃計算兩個幾何或向量距離的算法,其在評估兩個多維分布的差異性上有著廣泛的應用;EMD(d,s)為第d個輸入數據和第s個輸出數據的EMD;V為最小迭代次數;v為當前迭代次數.對于任意兩條空間曲線,其EMD值越小,說明其相似性越高,差異性越小;反之,則表示相似性越低,差異性越高.當滿足上述不等式時,代表著合成數據與真實數據的平均EMD已經小于或等于真實數據之間的平均EMD,此時停止迭代能夠得到具有良好多樣性的合成數據.
設存在兩組特征向量為
式中:ix、yj分別為兩個軌壓信號的特征值;Wix、Wyj分別為對應特征值的權重;m、n分別為向量X、Y的長度;H為樣本.通過求解式(15)中的最優(yōu)解得到fij.
式中:dij為 ix與yj之間的距離.
根據上述表達式得到兩個軌壓信號的EMD為
針對軌壓信號的特性,對式(14)做修改可以得到式(17).
式中:pix為軌壓信號X的第i個軌壓極小值;ixT為其對應的時間;pyj為軌壓信號Y的第j個軌壓極小值;Tyj為其對應的時間.式(15)中dij為
為驗證合成數據的準確性,利用EEMD將軌壓信號分解為不同的固有模態(tài)(IMF),使用能量熵構建特征向量,建立一BP神經網絡作為共軌系統故障診斷模型,進行故障診斷.
集合經驗模態(tài)分解(EEMD)是一種在經驗模態(tài)分解(EMD)基礎上提出的將信號分解為固有模態(tài)函數的方法.通過向原始信號中加入白噪聲信號,使不同時間尺度的信號分布到合適的參考尺度上,經過多次平均抵消噪聲,集成均值得到最終結果.EEMD利用白噪聲信號頻譜均勻分布的特性解決了EMD存在的模態(tài)混疊問題,進一步提高了分解的精度,較為準確地保留了原始數據中的特征[12].
每一個IMF分量的能量都代表著此頻率內信號的能量,故信號與能量之間存在某種映射關系,可以作為故障診斷的依據.在此對IMF1~IMF3提取相應的能量構建特征向量[19].各IMF分量的能量Ei為
式中:Ei為第i個IMF的能量;ic為第i個IMF曲線的值;T為信號長度.
作為一種反向傳播誤差進行學習的多層前饋網絡[17-18],BP神經網絡可以實現復雜的非線性映射函數,它通過梯度下降閥法向代價函數的負梯度方向調整權重與閾值[15-16],依次求得代價函數的最小值,完成神經網絡的訓練.為加快BP神經網絡的學習效率和收斂速度,避免陷入局部最優(yōu)解,FSCS-ART算法對BP神經網絡的參數進行初始化.自適應隨機測試(ART)是一種自適應的隨機測試算法,而D-ART是最好的ART測試算法之一,其核心思想是首先生成一候選測試集,由候選測試集中每個個體與測試集中每個個體間的最短距離組成最短距離集,再將最短距離集中的最大距離更新至測試集[20].
根據高壓共軌柴油機供油系統常見故障及其分類,選取4種運行狀態(tài)進行分析,其中1種為正常運行狀態(tài),3種為故障狀態(tài).4種運行狀態(tài)分別是正常狀態(tài)、2號噴油器延遲噴油狀態(tài)、2號噴油器電磁閥磨損狀態(tài)和高壓油泵柱塞磨損狀態(tài).將上述4種運行狀態(tài)分別命名為狀態(tài)1、狀態(tài)2、狀態(tài)3與狀態(tài)4.對上述4種運行狀態(tài)分別采集50組軌壓,每組軌壓信號為一個噴油循環(huán).圖5為經處理后4種狀態(tài)的軌壓信號.
圖5 不同運行狀態(tài)的軌壓信號Fig.5 Rail pressure signals in different operating states
建立的LSGANs中,生成器G含有473個輸出層節(jié)點,輸出層使用tanh函數作為激活函數;判別器D為一含有一個隱藏層的BP神經網絡,它有473個輸入層節(jié)點、1個輸出層節(jié)點,所有層均使用LeakyReLU作為激活函數,最小迭代次數為1000代,最大迭代次數為100000代;若達到最大迭代次數則計算停止,并認為此次計算未收斂.每1代檢查是否符合停止迭代條件,為方便計算,所有EMD的計算均使用歸一化后的信號.
綜合考慮,選擇22作為判別器隱藏層節(jié)點數,10作為生成器輸入層節(jié)點數.隨機選取一次使用未噴油時的軌壓信號作為生成器輸入信號的計算結果,其合成信號與輸入的真實信號之間的平均EMD與輸入真實信號之間的平均EMD隨迭代次數變化的曲線,如圖6所示.其在11313代結束迭代循環(huán),輸入真實信號之間的平均EMD為1.689.最終生成的軌壓信號質量良好,與真實信號差異較?。?/p>
圖6 信號之間偏差隨迭代次數的變化Fig.6 Deviation between signals varies with iteration algebra
圖7為采用上述數據合成方法對狀態(tài)2~狀態(tài)4進行軌壓信號合成處理后的真實軌壓信號與合成軌壓信號(歸一化后)對比.
圖7 歸一化后不同狀態(tài)真實軌壓信號與合成軌壓信號對比Fig.7 Comparison of real rail pressure signals and synthetic rail pressure signals in different states after normalization
為驗證所建立的高壓共軌系統小樣本故障診斷模型的正確性,并與其他方法進行比較,現運用不同的小樣本學習方法對所提及的4種運行狀態(tài)進行故障診斷,不同方法的簡介如表1所示.其中,方法1、方法2由不同的小樣本學習方法生成某一故障狀態(tài)的軌壓信號;方法3為使用真實的故障狀態(tài)的軌壓信號進行故障診斷,以對比不同小樣本學習方法與理想狀態(tài)的性能差距.
表1 故障診斷方法簡介Tab.1 Introduction o fault diagnosis methods
為驗證使用仿真模型數據進行小樣本學習的故障診斷正確率,噴油器自進油端至出油端依次命名為噴油器A~噴油器E,噴油次序為A—E—B—C—D.圖8為正常狀態(tài)下噴油壓力試驗值與仿真值的對比,選取試驗曲線與仿真曲線吻合程度較差的點(如a、b、c、d和e處標記的數據點),將這些點的仿真值、試驗值與相對誤差對比見表2.
圖8 噴油壓力試驗值與仿真值對比Fig.8 Comparison of experimental value and simulation value of fuel injection pressure
數據標記點 時間/ms 試驗值/MPa 仿真值/MPa 誤差/%a 3.50 82.233 79.77 2.99 b 3.75 151.51 147.01 2.97 c 4.00 178.28 171.89 3.58 d 4.25 166.71 162.91 2.27 e 4.50 102.66 101.15 -1.47
從圖8與表2中可以看出,噴油壓力試驗值與仿真值的最大誤差在5%以內,符合仿真要求,故本仿真模型能夠較為準確地模擬此共軌系統在正常狀態(tài)下的運行,依照上述方法分別對其他3種狀態(tài)下仿真模型的正確性與準確性進行驗證.經過上述驗證,認為本仿真模型能夠較為準確地模擬此5缸柴油機在上述4種狀態(tài)下的運行.
每種運行狀態(tài)選取35組作為訓練樣本,15組作為測試樣本,測試樣本根據運行狀態(tài)不同依次編號,將訓練樣本的特征向量輸入故障診斷模型中.對測試樣本的三維能量特征向量輸入故障分類器中進行故障診斷.表3~表5為使用不同小樣本學習方法生成狀態(tài)2~4的軌壓信號故障診斷正確率,表中方法EMD1指數據與原始數據的平均EMD,EMD2指原數據自身的平均EMD,診斷狀態(tài)1~4分別代表測試樣本的狀態(tài),正確診斷代表對此狀態(tài)下的測試樣本進行故障診斷時診斷為本狀態(tài)的樣本個數.
表3 合成狀態(tài)2軌壓信號的故障診斷正確率Tab.3 Fault diagnosis accuracy rate of the composite state two-rail pressure signal
表4 合成狀態(tài)3軌壓信號的故障診斷正確率Tab.4 Fault diagnosis accuracy rate of the composite state three-rail pressure signal
表5 合成狀態(tài)4軌壓信號的故障診斷正確率Tab.5 Correct rate of fault diagnosis of the composite state four-rail pressure signal
針對高壓共軌系統故障診斷中的小樣本學習問題,所使用LSGANs在各個故障狀態(tài)下均有著最高級的正確率,在小樣本集上的診斷正確率在86.6%以上,說明其合成的軌壓信號有著優(yōu)秀的質量和較高的多樣性.在面對狀態(tài)2與狀態(tài)3等這種真實數據間平均EMD較小的故障狀態(tài)時,其在小樣本集上的診斷正確率均可達100.0%;在面對狀態(tài)4這種真實數據間平均EMD較大故障狀態(tài)時,其在小樣本集上的診斷正確率仍可達到83.3%,此時真實數據間平均EMD為3.11,而使用LSGANs合成的軌壓數據與小樣本數據間的EMD為2.87,合成的軌壓數據自身的平均EMD為2.56,說明合成數據在既保證了與原始數據的相似度,又保證了合成數據有著與原始數據相似的多樣性,能夠體現此狀態(tài)下的軌壓信號特征;這表明此方法在各個故障狀態(tài)下均可合成質量與多樣性較好的軌壓數據,在面對不同狀態(tài)的小樣本問題時均有著較高的正確率.
相比之下,原始GAN合成的軌壓信號質量很高,在各個狀態(tài)下其與真實數據集的平均EMD均為最?。诿鎸顟B(tài)2與狀態(tài)3這種真實數據間平均EMD較小的故障狀態(tài)時,其在小樣本集上的診斷正確率分別為93.3%與100.0%,與使用的LSGANs性能相差不大,但在面對狀態(tài)4這種真實數據間平均EMD較大故障狀態(tài)時,其在小樣本集上的診斷正確率僅為66.6%,此時真實數據間平均EMD為3.11,但使用原始GAN合成的軌壓數據與小樣本數據間的EMD仍為1.76,其合成的軌壓數據自身的平均EMD僅為1.69,在此狀態(tài)下的數據多樣性較差,無法充分體現此狀態(tài)下的軌壓信號特征;普適性較差,無法在多種狀態(tài)下均取得較好的診斷正確率.而使用仿真模型進行小樣本訓練的方法在多個狀態(tài)下均取得了最低的正確率,合成質量和多樣性較差,無法體現此狀態(tài)下的軌壓信號特征.
綜上可以得出,采用的高壓共軌小樣本故障診斷方法在解決小樣本故障診斷問題時,生成合成數據質量更高、多樣性更強,故障診斷模型正確率更高,在面對不同狀態(tài)的高壓共軌小樣本故障診斷問題時均有著較高的正確率.
(1) 為解決高壓共軌系統小樣本故障診斷問題,通過臺架試驗,獲得了高壓共軌系統不同運行狀態(tài)下的軌壓信號;通過對軌壓信號進行前期處理,獲得了質量良好、可以進行時頻分析的軌壓信號;針對當前因獲取難度大、獲取質量差或獲取成本高等原因造成的故障信號樣本量小這一問題,使用LSGANs進行軌壓信號的合成,得到了質量高、多樣性強及在面對不同狀態(tài)的小樣本問題時均有著較高的正確率的訓練樣本集.
(2) 為驗證所使用小樣本學習方法的正確性與優(yōu)秀性,采用臺架試驗設備收集經前期處理的訓練與測試數據,通過與使用GAN的小樣本學習方法對比,證明了基于LSGANs的小樣本學習方法具有質量高、多樣性強及在面對不同狀態(tài)的小樣本問題時均有著較高的正確率等優(yōu)點;在為提高訓練集數量而進行的小樣本學習中較高的信號多樣性與質量可以在有限的訓練集上盡可能地描述此狀態(tài)下的軌壓信號特征,提高診斷正確率;使用的LSGANs合成質量較高、多樣性最強,在合成多個狀態(tài)的軌壓信號時均取得了最高的故障診斷正確率,特別是在面對諸如狀態(tài)4等多樣性較強的故障狀態(tài)時,其在小樣本集上仍然有著86.6%的診斷正確率;與之相比,使用GAN解決訓練集樣本不足問題時僅有66.6%的診斷正確率,而使用仿真模型解決訓練集樣本不足問題時僅有46.6%的診斷正確率.
(3) 提出的基于生成式對抗神經網絡的高壓共軌小樣本學習方法能夠解決高壓共軌系統故障診斷中的訓練樣本不足的問題,在面對多種故障狀態(tài)時均有著較高的診斷正確率,是最適合高壓共軌小樣本故障診斷領域的小樣本學習方法.