李英順,孟享廣,姚兆,劉海洋,陶學新
(1.北京石油化工學院信息工程學院,北京 102617;2.陸軍裝甲兵學院士官學校,吉林 長春 130117;3.沈陽順義科技有限公司,遼寧 沈陽 110000)
裝甲車輛作為陸戰(zhàn)部隊最為重要的武器裝備之一,其發(fā)展備受關注。而底盤發(fā)動機是裝甲車輛動力輸出的核心部件,其性能表現(xiàn)很大程度上決定了裝甲車輛整體作戰(zhàn)能力。部隊作戰(zhàn)需求對發(fā)動機系統(tǒng)的設計、使用和維修等方面提出了很高的要求,所以若能夠對發(fā)動機系統(tǒng)進行實時在線檢測與故障預測,提前了解發(fā)動機的健康狀態(tài),預測到預警或故障狀態(tài)時,就可以及時維修,保障裝甲車的作戰(zhàn)能力,從而避免由于發(fā)動機故障導致的作戰(zhàn)效率下降,還能延長使用壽命。
學者就發(fā)動機的故障預測開展了大量研究工作。文獻[4]提出了一種基于相關系數(shù)與BP神經網(wǎng)絡的預測方法,將敏感性好的特征輸入到網(wǎng)絡,雖然利用粒子群算法(PSO)優(yōu)化了網(wǎng)絡參數(shù),但是并不能針對不明顯的特征數(shù)據(jù)進行有效預測。文獻[5]基于循環(huán)門單元算法(GRU)對柴油發(fā)電機組做故障預測,并有試驗例證提高了設備的運行效率和使用壽命,但是GRU算法參數(shù)量較多,存在過擬合的風險。文獻[6]針對風機機組的故障高發(fā)部分,運用BP神經網(wǎng)絡,根據(jù)溫度參數(shù)進行故障預測,試驗誤差控制較好,但BP網(wǎng)絡處理非線性問題能力相對不足,并不適用于風機運行時間較長的情況。文獻[7]提出采用模糊聚類理論對航空發(fā)動機的實時數(shù)據(jù)及歷史數(shù)據(jù)進行聚類,并提出故障預測的數(shù)據(jù)挖掘模型,能有效地做出檢測,但該算法并不能保證找到問題的最優(yōu)解,甚至可能收斂到局部極值點,而且時間復雜度大,很難處理大規(guī)模數(shù)據(jù)。文獻[8]引入遺傳算法,優(yōu)化了灰色模型,能有效地預測柴油機的故障形式,但對于不同時間序列的狀態(tài)參數(shù),該方法的預測精度有待提高。文獻[9]采用概率神經網(wǎng)絡對柴油機進行故障預測,相比于BP神經網(wǎng)絡預測效果更出色,在故障判別預測中具有一定的均衡性。文獻[10]中自行火炮故障預測模型是基于貝葉斯分類決策建立的,相比于傳統(tǒng)預測模型結果準確率更高,但其預測效率仍不高。
傳統(tǒng)的發(fā)動機運行狀態(tài)預測方法沒有充分利用各個特征之間的數(shù)據(jù)關系,而是將影響發(fā)動機運行狀態(tài)的特征并行輸入至決策模型,得到狀態(tài)預測結果。這種方法在特征之間數(shù)據(jù)結構清晰、相關性小的情況下可能會得到好的結果。然而,一般情況下影響發(fā)動機運行狀態(tài)的特征之間相互關聯(lián)、相互影響,因此,提出一種充分利用特征間的數(shù)據(jù)關系而進行運行狀態(tài)預測的智能方法至關重要。
同時,傳統(tǒng)的特征處理方法一般選擇去相關性的主成分分析(PCA)、線性判別分析(LDA)等,然后獲得處理后的特征集再進行運行狀態(tài)的預測結果。這種方法是將特征處理和狀態(tài)預測兩個過程獨立進行,算法的集成度不高。
圖卷積神經網(wǎng)絡(GCN)是深度學習領域的一種利用特征間數(shù)據(jù)結構進行模式預測的方法,它用來處理數(shù)據(jù)間存在的非歐距離關系,通過量化數(shù)據(jù)結構進而挖掘特征間的隱含關系,并以卷積計算為數(shù)據(jù)挖掘基礎,以全連接層反向傳播的并行處理機制實現(xiàn)輸入特征數(shù)據(jù)的模式識別。目前,圖卷積神經網(wǎng)絡已經廣泛地應用在行為識別、故障診斷、圖像辨識、情感檢測等領域。然而,GCN在計算過程中存在參數(shù)量大、計算復雜度高的缺點,要想充分訓練GCN網(wǎng)絡,需要一定的樣本數(shù)量。但是在裝甲車底盤發(fā)動機運行狀態(tài)的預測過程中,獲取大量故障數(shù)據(jù)實際上是困難的,長時間的故障模擬會損害發(fā)動機的使用壽命。因此,應利用參數(shù)量小、計算復雜度低的GCN網(wǎng)絡來實現(xiàn)裝甲車底盤發(fā)動機運行狀態(tài)的預測。鑒于此,本研究提出了一種影響裝甲車發(fā)動機運行狀態(tài)的預測方法:
1)利用圖卷積神經網(wǎng)絡將特征處理和狀態(tài)預測兩個過程集成,簡化發(fā)動機運行狀態(tài)的預測過程;
2)利用皮爾遜相關系數(shù)來量化影響裝甲車底盤發(fā)動機運行狀態(tài)的特征間的數(shù)據(jù)關系,并構建圖拉普拉斯矩陣;
3)引入切比雪夫多項式來代替GCN的圖卷積核來減少圖卷積過程的參數(shù)量及計算復雜度,并利用貪婪規(guī)則結合最大池化方式進行圖池化計算。
利用該輕量化的圖卷積神經網(wǎng)絡(LGCN)來實現(xiàn)裝甲車底盤發(fā)動機的運行狀態(tài)預測,以期為提前了解發(fā)動機的健康狀態(tài)、保障裝甲車的作戰(zhàn)能力、延長使用壽命提供有效方法。
選用某型裝甲車輛底盤發(fā)動機作為研究對象,發(fā)動機的技術參數(shù)見表1?;诩捎鸵簜鞲衅飨到y(tǒng)實現(xiàn)裝甲車輛發(fā)動機潤滑油理化指標的在線監(jiān)測,系統(tǒng)部署在底盤發(fā)動機上,安裝的六合一傳感器可以采集到溫度、水活性、混水(介電常數(shù))、黏度、密度及磨粒等信息。發(fā)動機上的集成油液傳感器通過 RS485 總線與采集盒相連,采集盒將各傳感器采集的油液信息進行處理后上傳至 CAN 總線,供給車載軟件使用。圖1示出發(fā)動機運行狀態(tài)數(shù)據(jù)獲取的硬件系統(tǒng)結構。
表1 底盤發(fā)動機的技術參數(shù)
圖1 硬件系統(tǒng)結構
在對發(fā)動機狀態(tài)數(shù)據(jù)進行獲取中,對于正常運行狀態(tài)每1 min采集一組數(shù)據(jù),分6天進行采集,每天采集1 h,共計獲得360組正常運行的數(shù)據(jù)。然后,進行了發(fā)動機故障模擬,模擬方法為在不損害發(fā)動機的前提下停止了潤滑油系統(tǒng)過濾器的工作,分4天進行采集,每天采集30 min,共計獲得120組故障運行數(shù)據(jù)。
GCN可以劃分為空間域圖卷積和譜域圖卷積??臻g域圖卷積根據(jù)空間數(shù)據(jù)結構直接進行卷積計算,具有非常廣泛的適用性。然而空間域圖卷積計算過程類似于卷積計算過程,時域的計算方式不能充分得到特征間的數(shù)據(jù)關系。而譜域圖卷積將空間域的特征轉換為表達信息更為充分的譜域進行特征處理。與空間域的圖卷積相比,在譜域的計算過程中不涉及特征之間的有向連接,即特征之間的連接沒有方向,使得計算過程更為簡化有效。
裝甲車輛底盤發(fā)動機的運行狀態(tài)受到溫度、水活性、磨粒、黏度、密度和介電常數(shù)的影響。通過皮爾遜相關系數(shù)分析可知特征之間存在明顯的相關性,本研究利用相關性數(shù)值來量化特征間的數(shù)據(jù)結構。同時,特征間的相關性是沒有方向的。因此,本研究利用圖卷積神經網(wǎng)絡實現(xiàn)裝甲車輛底盤發(fā)動機運行狀態(tài)的智能預測。譜域圖卷積的具體計算過程如下。
在GCN中,={,,}表示無向圖。其中為節(jié)點集,為邊集,為鄰接矩陣,它可以表示節(jié)點之間的量化連接關系。特征圖的結構可以利用拉普拉斯矩陣表示,圖2示出圖卷積過程中拉普拉斯矩陣的計算過程。圖中共包含4個節(jié)點,各個節(jié)點之間的連接通過連接線確定,度矩陣表示該節(jié)點與幾個節(jié)點相連,鄰接矩陣表示該節(jié)點與其他節(jié)點的連接關系,拉普拉斯矩陣為度矩陣減去鄰接矩陣的結果。以第一個節(jié)點為例,它與第二、第三和第四個節(jié)點相連,因此,度矩陣的第一個對角元素為3,鄰接矩陣第一行的第二、第三和第四列的元素均為1。
圖2 圖卷積中拉普拉斯矩陣計算過程
通過圖2的分析,拉普拉斯矩陣可以表示為
=-。
(1)
其中表示度矩陣,第個元素可計算為
(2)
在譜域空間的無向圖結構中,=。是一個半正定矩陣,它通過譜分解獲得:
(3)
==。
(4)
圖上的傅里葉變換將空域信號轉換為用于卷積計算的譜域,然后將其轉換回空域。圖上的信號轉換為譜域,可表示為
(5)
信號的傅里葉逆變換為
(6)
因此,圖卷積可以表示為
*=(()⊙())=
(()⊙())=
(7)
式中:*為圖卷積;⊙為哈達瑪積;為卷積核。設
()=diag()。
(8)
最后,圖卷積的形式可以轉換為
*=g()。
(9)
在譜域的圖卷積計算過程中,可學習的卷積參數(shù)可以表示為
(10)
2.2.1 圖卷積計算
然而,在譜域GCN的計算過程中,特征分解過程涉及較高的計算復雜度。通過式(3)可以看出,特征分解的卷積參數(shù)量和圖節(jié)點數(shù)的數(shù)量相同。同時,仍然需要和傅里葉基相乘,通過式(3)可以看出,譜域GCN計算的復雜度是()。因此,本研究在處理由溫度、水活性、磨粒、黏度、密度和介電常數(shù)構成的特征圖結構中,采用切比雪夫多項式來減少參數(shù)量和計算復雜度。
首先,采用一個多項式來代替卷積核:
(11)
其中代表多項式的最高階,為了減少參數(shù)量,小于,這可以使圖卷積核的卷積參數(shù)量從減到。然而,因為輸入信號需要乘以,圖卷積運算的計算復雜程度仍然是()。因此,本研究采用了切比雪夫多項式來代替圖卷積核,圖卷積核可以表示為
(12)
()=;
()=;
()=2T-1()--2()。
(13)
多項式擬合后,卷積計算可以表達為
*=g()=
(14)
2.2.2 圖池化計算
圖池化的計算是在圖卷積的過程中減少特征的冗余信息,同時,圖池化過程的參與可以使得GCN的結構清晰。圖快速池化的具體過程如下:
1)在經過圖卷積計算后,基于貪婪規(guī)則計算各個特征節(jié)點最匹配的節(jié)點用于計算每個節(jié)點最匹配的節(jié)點;
2)為了確保池化過程采用完整的二叉樹類型,假節(jié)點被添加,并且這個值是所有節(jié)點的中位數(shù);
3)對節(jié)點進行排序,然后對每對節(jié)點進行最大池化。
結合切比雪夫多項式的圖卷積核計算,以及圖快速池化的數(shù)據(jù)壓縮方法,本研究提出了用于裝甲車底盤發(fā)動機運行狀態(tài)預測的LGCN。
裝甲車輛底盤發(fā)動機的運行狀態(tài)受溫度、水活性、磨粒、黏度、密度和介電常數(shù)的影響。譜域GCN需要計算拉普拉斯矩陣來表示圖結構。圖2示出傳統(tǒng)的拉普拉斯矩陣的計算過程。要得到拉普拉斯矩陣,需要計算鄰接矩陣。度矩陣通過式(2)求解,而拉普拉斯矩陣通過式(1)求解。本研究利用皮爾遜相關系數(shù)(PCC)來量化特征間的數(shù)據(jù)結構,即鄰接矩陣中的元素替換為特征之間的PCC值,并用它來表示影響裝甲車底盤發(fā)動機運行狀態(tài)的特征之間的關系。因此,提出了一種基于PCC的拉普拉斯矩陣計算方法,PCC計算公式如下:
(15)
式中:和分別代表特征值。具體的連接形式表達如下:
={,,}。
(16)
(17)
式中:為影響裝甲車底盤發(fā)動機運行狀態(tài)的特征,為特征之間的連接矩陣。圖3示出基于PCC值對影響裝甲車底盤發(fā)動機運行狀態(tài)的特征量化結果。
圖3 影響裝甲車底盤發(fā)動機運行狀態(tài)的特征量化結果
正常運行包含360組數(shù)據(jù),故障運行包含120組數(shù)據(jù)。每種運行狀態(tài)隨機取80%數(shù)據(jù)作為訓練集,20%數(shù)據(jù)作為測試集。訓練集用來建立LGCN的預測模型,測試集來檢驗模型的性能。在LGCN中,預調整后的超參數(shù)如下:選擇學習率為0.01的Adam優(yōu)化器更新權重、偏差和圖參數(shù),批量大小為50,迭代次數(shù)為100,非線性ReLU激活函數(shù)用于圖卷積層,并應用批量歸一化(BN)以保持相同的參數(shù)分布,將Softmax函數(shù)應用于全連接層進行分類。包含2正則化項的損失函數(shù)如下式所示,正則化系數(shù)為0.01。
(18)
表2示出不同的輕量化圖卷積結構對裝甲車底盤發(fā)動機運行狀態(tài)的預測結果,同時也顯示了圖卷積層和池化層的結構設計及圖池化核個數(shù)的設定。在圖卷積核個數(shù)的設計過程中,發(fā)現(xiàn)隨著網(wǎng)絡結構的加深,卷積核個數(shù)成倍增加有利于提升網(wǎng)絡的預測性能。在沒有加入池化層時,整體的預測準確率在91.51%~95.98%之間,1分數(shù)在89.02%~94.67%之間,3個圖卷積層的網(wǎng)絡結構獲得了最佳的預測準確率和1分數(shù)。在加入池化層后,整體的預測性能有較為明顯的提升,這說明池化層減少了特征的冗余信息。整體的預測準確率在97.50%~98.75%之間,1分數(shù)在96.67%~98.31%之間。同時,分類穩(wěn)定性也明顯提升。最終,包含3個圖卷積層和池化層的輕量化圖卷積神經網(wǎng)絡結構獲得了最佳的預測準確率,為98.75%,1分數(shù)為98.31%。圖4示出在最優(yōu)網(wǎng)絡結構下預測準確率隨著迭代次數(shù)增加的變化曲線。
表2 不同輕量化圖卷積結構對分類性能的影響
圖4 裝甲車底盤發(fā)動機運行狀態(tài)的預測準確率變化曲線
為了證明LGCN的網(wǎng)絡分類性能,和傳統(tǒng)的GCN進行了對比,同時還對傳統(tǒng)的特征分類框架(特征處理+模式識別)下的性能進行綜合分析。在傳統(tǒng)特征處理方法上,選取PCA、核主成分分析(KPCA)、LDA、核線性判別分析(KLDA)4種去相關性的特征處理方法對影響裝甲車發(fā)動機運行狀態(tài)的特征進行處理,并利用分類性能優(yōu)異的支持向量機(SVM)、隨機森林(RF)和極限學習機(ELM)對原始特征集和特征處理后形成的特征集進行裝甲車底盤發(fā)動機運行狀態(tài)的預測分析。在3種分類模型中,經過模型最優(yōu)訓練后,同樣取20次計算的平均值和標準差作為最終的評價結果。
基于皮爾遜相關系分析圖得知,影響裝甲車底盤發(fā)動機運行狀態(tài)的特征之間存在明顯的相關性。此時,傳統(tǒng)的特征處理方法先要去除特征之間的相關性,然后利用去相關性后得到的特征集進行運行狀態(tài)的預測。在KPCA和KLDA中,首先利用核函數(shù)將低維數(shù)據(jù)映射到高維空間,再利用PCA和LDA進行特征處理。在映射過程中,經過參數(shù)預調節(jié),取核函數(shù)參數(shù)為50時得到的最佳特征處理效果進行分析。在利用4種方法進行特征處理時,取處理后累計特征貢獻率達90%以上的處理主成分形成的特征集用于后續(xù)的模式分類。
圖5a示出利用PCA處理后的二維可視化圖,可以明顯看出,正常運行和故障運行的兩種狀態(tài)在二維平面的降維效果重疊樣本較多,特征處理效果不明顯,大部分樣本出現(xiàn)了重疊的狀況。圖5b示出利用KPCA處理后的二維可視化圖,可以看出處理效果相比較于PCA明顯提升,僅有很少部分樣本重疊。圖5c示出LDA處理后的二維可視化圖,處理效果明顯優(yōu)于PCA,而且類間間距減小。圖5d示出KLDA處理后的二維可視化圖,在4種特征處理方法中,KLDA的特征處理效果最優(yōu),發(fā)動機正常運行和故障運行的樣本聚類效果明顯,樣本幾乎沒有重疊。
表3和表4示出多模式識別下的預測性能分析結果。在傳統(tǒng)的特征處理方法下,KLDA結合RF獲得了最佳的預測準確率,為95.73%,最佳的1分數(shù)為94.12%,已經較好地實現(xiàn)了裝甲車底盤發(fā)動機運行狀態(tài)的預測。但GCN和LGCN取得了更好的預測效果,GCN的預測準確率提升了0.57%,LGCN提升了3.02%。GCN的1分數(shù)提升了1%,LGCN提升了4.19%。這不僅說明GCN在裝甲車底盤發(fā)動機運行狀態(tài)預測中取得了比傳統(tǒng)處理方法更好的結果,也證明了本研究提出的LGCN在GCN基礎上取得了更優(yōu)的預測效果。
圖5 傳統(tǒng)特征處理方法的二維可視化聚類圖
表3 多模式識別模型的預測準確率結果對比 %
表4 多模式識別模型的預測F1分數(shù)結果對比 %
基于PCC量化的影響裝甲車底盤發(fā)動機運行狀態(tài)的特征相關性表明,特征間存在明顯的相關性,數(shù)據(jù)內部關聯(lián)明顯。利用提出的LGCN有效實現(xiàn)了發(fā)動機運行狀態(tài)的預測,與傳統(tǒng)的狀態(tài)預測方法相比,LGCN取得了最優(yōu)的預測效果,預測準確率達到了98.75%,1分數(shù)達到了98.31%。
通過與現(xiàn)階段常用的發(fā)動機狀態(tài)預測方法相比,驗證了LGCN的有效性。與傳統(tǒng)的預測方法相比,LGCN高度集成了特征處理和模式預測的兩個過程,為提前了解發(fā)動機的健康狀態(tài)、有效保障裝甲車的作戰(zhàn)能力、延長使用壽命提供了有效方法。