趙娟娟
(北京城建設計發(fā)展集團股份有限公司深圳分公司,廣東 深圳 518049)
目前,在有軌電車中所用的燃料電池比較多,質子交換膜燃料電池(PEMFC)是其中最為常見的一類,PEMFC 在電解質上選用質子導電材料,兼具功率密度高、電解質流失可控、電池響應及時、工作溫度低等優(yōu)勢[1]。本文以深度學習為基礎對燃料電池做出故障診斷研究,并進一步探索深度學習應用于故障診斷的前景。值得注意的是,有軌電車在運營狀態(tài)下所處的工況比較復雜,因此其電池各項數(shù)據(jù)也就較為多變,數(shù)據(jù)驅動在故障診斷中的理論基礎尚不成熟,所以需要建立起更加合理的診斷方法。
燃料電池在發(fā)生故障時大多會牽涉到多部件狀態(tài)變異,所以往往難以借助系統(tǒng)直接顯示的參數(shù)來確定具體故障,同時傳統(tǒng)診斷技術對于多項耦合數(shù)據(jù)的處理效果有限,所以就需要采用先進算法來做出判斷。作為一類出現(xiàn)較早的深度學習方法,DBN 目前在字體、語音、圖片識別方面已經(jīng)取得了較為成熟的發(fā)展。但DBN 在故障識別方面的應用仍較為局限,大多存在于機械軸承的故障診斷中。已有的研究表明[2-3],DBN 用于故障診斷具有顯著優(yōu)勢,能夠很好地滿足燃料電池在故障診斷數(shù)據(jù)處理方面的要求,本文以DBN為診斷算法基礎,探究該方法在PEMFC 故障診斷中的適用性及有效性。同時,考慮到所采集的初始數(shù)據(jù)中不可避免會存在冗余、噪聲及無效信息,所以首先通過SAGAFCM法對初始數(shù)據(jù)進行處理,篩選得出其中的故障樣本。
為獲取有軌電池在運行狀態(tài)下的燃料電池狀態(tài),本研究將出冷卻液入口高溫故障、氫氣泄露故障及空氣壓力低故障作為數(shù)據(jù)診斷對象,分別標記為F1、F2 及F3,將其與正常狀態(tài)N1 進行比對,上述四種健康狀態(tài)的取樣組數(shù)分別為600 組、260 組、105 組及2011 組。
已有的研究表明[4-5],燃料電池的故障診斷數(shù)據(jù)中存在大量噪聲且數(shù)據(jù)體量較大,因此也就不可避免會包括一些異常值。借助標準化處理數(shù)據(jù),根本上來看就是對數(shù)據(jù)做縮放、平移,將各數(shù)值的特征值調(diào)整至均值為0、方差為1,進而使得不同維度的數(shù)據(jù)能夠滿足相同的尺度要求。標準化處理所用的基本計算式如下:
式中,x'、x 分別為原始、標準化數(shù)據(jù);μ 為樣本的平均值,S 為樣本的標準差。
對原始數(shù)據(jù)做標準化處理即可得到標準化數(shù)據(jù)。通過標準化處理,不同數(shù)據(jù)的差距得到了顯著縮小,有助于深度學習中權重參數(shù)計算的收斂,并為下一步計算提供了便捷。
為降低初始數(shù)據(jù)中噪聲的影響,從原始樣本中提取出有價值的樣本數(shù)據(jù),在本研究中選用SAGAFCM法來處理原始數(shù)據(jù),剔除其中的無效數(shù)據(jù),得出故障分析樣本。在SAGAFCM法的處理下,對標準化后的數(shù)據(jù)聚類,并以此得出4 種健康狀態(tài)。在此基礎上,按照輸出結果的隸屬度矩陣識別各組數(shù)據(jù)中最大隸屬度所對應的健康狀態(tài),剔除其中與實際類型不符的無效數(shù)據(jù)。SAGAFCM能夠有效彌補在FCM計算中易于局部解處收斂的不足。已有的研究發(fā)現(xiàn),相較于FCM,SAGAFCM法更容易收斂至較低的值,且其收斂的速度也相較更快。
以SAGAFCM 法對表2 中數(shù)據(jù)進行清洗,分別剔除N1、F1 及F2 狀態(tài)下11 組、22 組及2 組異常數(shù)據(jù),而F3 保持不變,以此得到2941 組最終樣本,其中F1、F2、F3、N1 四種健康狀態(tài)下的清洗后組數(shù)分別有578組、258 組、105 組及2011 組。
在對數(shù)據(jù)完成預處理后,即可將故障樣本按照平均劃分的原則分為5 份,并以4:1 比例確定訓練、測試樣本的數(shù)量,各健康狀態(tài)下的樣本劃分見表1。
表1 每種健康狀態(tài)的樣本劃分
以表1 所得到的訓練樣本為訓練集,對所建立的DBN 網(wǎng)絡開展訓練,得出優(yōu)化后的網(wǎng)絡模型,并以測試樣本驗證模型的可行性、有效性,其故障診斷流程見圖1。
在對訓練后的故障診斷模型進行評價時,需要基于一定指標來得出評價結果,診斷的穩(wěn)定性、誤報率、有效性及分離性等都是常用的指標參數(shù)。在本研究中,模型的評價采用分類準確度進行表征,為了確保評價結果的有效性,每次評價選擇三次故障診斷的平均準確率作為參考。
在DBN 網(wǎng)絡結構、參數(shù)設定方面,目前行業(yè)內(nèi)缺乏規(guī)范化標準,所以就需要不斷調(diào)試,通過經(jīng)驗判斷出合適的網(wǎng)絡配置。所構建的DBN 網(wǎng)絡結構包括了網(wǎng)絡深度及各層的神經(jīng)元分布。較少的層數(shù)、神經(jīng)元個數(shù),也就使得計算難度降低,訓練周期短,但所帶來的訓練效果難以得到保障;而較多的層數(shù)、神經(jīng)元個數(shù),將使得深度學習對于目標特征有更全面、深入的掌握,但所對應的訓練時間也將所有提升,且過多層數(shù)、神經(jīng)元數(shù)量下可能導致過擬合的出現(xiàn),使得訓練效果反而劣化。所以,網(wǎng)絡結構的設計需要綜合考慮到樣本體量、特征來確定。
在本研究中,采取四層DBN 網(wǎng)絡結構,且首層、最后一層將分別承擔輸入、輸出層的功能這與數(shù)據(jù)自身的特征存在顯著關聯(lián),輸入層的神經(jīng)元數(shù)量與樣本維數(shù)一致,也即23 個。同時,輸出層結構上為分類層,在其中插入兩個隱藏層分別承擔特征提取、學習的功能,所以本研究中所建立的DBN 網(wǎng)絡結構可以看做由2 個RBM 和1 個分類器組成。在DBN 網(wǎng)絡中需要定義的參數(shù)較多,見表2。
表2 DBN 參數(shù)
由表4 可以發(fā)現(xiàn),在DBN 模型中不同參數(shù)的選擇對于訓練效果存在顯著影響。
(1)激活函數(shù) 控制表4 中其他參數(shù)恒定,分別在sigmoid 函數(shù)、tanh 函數(shù)及ReLU 函數(shù)下完成模型訓練,以此得出訓練樣本、測試樣本之間的精度見表3。從表中數(shù)據(jù)可以發(fā)現(xiàn),sigmoid 函數(shù)在訓練樣本中表現(xiàn)出最高的精度,而ReLU 函數(shù)在測試樣本中表現(xiàn)出最高的精度,但兩者的總體精度相差不大。
表3 不同激活函數(shù)結果
在不同激活函數(shù)下故障類型都具有較好的效果,而正常狀態(tài)分類則存在較大差異,其中ReLU 函數(shù)對N1 的診斷精度較其他兩種函數(shù)有約20%的提升,所以本研究在激活函數(shù)中選用ReLU 函數(shù)。
(2)網(wǎng)絡結構 網(wǎng)絡深度、神經(jīng)元數(shù)量對于診斷結果存在至關重要的影響,控制表4 中其他參數(shù)恒定,分別選用4 層、5 層網(wǎng)絡結構進行訓練。研究結果發(fā)現(xiàn),在網(wǎng)絡深度增大的同時,訓練效果反而呈現(xiàn)出下降的趨勢,這主要是由于網(wǎng)絡結構復雜化但樣本體量不變引起了過擬合,所以應當選擇與樣本相適應的結構類型。
在用訓練樣本訓練模型的過程中,損失函數(shù)收斂的情況見圖2。由此可以發(fā)現(xiàn),在RBM訓練及微調(diào)過程中,迭代至五次時損失函數(shù)即出現(xiàn)明顯收斂,這也表明模型最少僅需五次迭代即可完成訓練,其訓練周期較短。
不同健康狀態(tài)下測試樣本的診斷分類情況見表4。將SVM法及DBN 法的結果進行比對,見表5??梢园l(fā)現(xiàn),SVM法在高維度、大樣本數(shù)據(jù)的處理中存在缺陷,尤其是在F3 類型的測試樣本中全部被錯誤歸入F2 類型中。通過表5 的比對可以認為,DBN 在故障診斷中較SVM具有更強的適用性。
表4 測試樣本故障診斷結果
表5 DBN 與SVM 故障診斷結果對比
本研究選用DBN 法對故障樣本做了診斷分析,并以冷卻液循環(huán)、氫氣循環(huán)及空氣循環(huán)系統(tǒng)為研究對象采集樣本數(shù)據(jù),以SAGAFCM 法將其中無效數(shù)據(jù)清除,最后以DBN 法完成診斷。本研究將DBN 法的診斷結果與傳統(tǒng)SVM 法進行比對,發(fā)現(xiàn)DBN 法在對燃料電池不同模塊故障的診斷中兼具良好適用性、精度,展現(xiàn)出優(yōu)于SVM法的優(yōu)勢。