魏一,張躍文,李斌
大連海事大學(xué) 輪機工程學(xué)院,遼寧 大連 116026
船舶燃油系統(tǒng)作為船舶的核心動力裝置,通過燃油系統(tǒng)各個組件間的協(xié)作,將霧化好的燃油輸送至設(shè)備的噴油入口。燃油系統(tǒng)故障類型繁多,故障導(dǎo)致的重大事故屢見不鮮,并且傳統(tǒng)的故障診斷方法無法滿足現(xiàn)代化的需求[1-2]。因此,及時、準確地診斷船舶燃油系統(tǒng)異常,判斷和識別船舶燃油系統(tǒng)故障十分重要。
目前船舶燃油系統(tǒng)的故障診斷研究主要集中于2個方面:一是基于專家的定性故障診斷方法研究,一般通過專家經(jīng)驗判斷故障指標,推理路徑清晰,便于用戶參與,但是難以處理復(fù)雜的、數(shù)據(jù)量大的診斷對象,不適用于數(shù)據(jù)驅(qū)動情境下的研究[3];二是基于模型的定量故障診斷方法研究,一般借助機器學(xué)習(xí)算法,基于數(shù)據(jù)特征對故障參數(shù)進行診斷,常用的故障診斷方法包括反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)[4]、支持向量機(Support Vector Machine,SVM)[5]等。上述傳統(tǒng)算法能夠滿足對數(shù)據(jù)的有監(jiān)督(需要人工標注訓(xùn)練樣本類型)診斷[6],但無法實現(xiàn)船舶燃油系統(tǒng)的故障自動診斷,泛化能力較差。
高斯混合模型(Gaussian Mixture Model,GMM)算法是一種基于非參數(shù)的概率性方法,可以根據(jù)不同的歷史數(shù)據(jù)自適應(yīng)訓(xùn)練獲取模型參數(shù),對于不同類型的數(shù)據(jù)集有較好的靈活性[7]。GMM算法能夠很好地解決需人工標注訓(xùn)練樣本導(dǎo)致的成本增加[8]、泛化能力差的問題,實現(xiàn)無監(jiān)督的故障診斷過程,極大地提升故障診斷的效率。同時,為了進一步增加GMM算法的精度,引入了密度峰值聚類(Density Peaks Clustering,DPC)算法[9],以保證觀察數(shù)據(jù)對數(shù)似然增大,解決GMM算法存在的局限性。因此,針對已有研究的不足,本文擬提出基于DPC-GMM算法的船舶燃油系統(tǒng)故障診斷方法。針對采集的船舶燃油系統(tǒng)故障模式數(shù)據(jù)少的特點,首先,采用高斯白噪聲對原始數(shù)據(jù)樣本進行擴充;然后,采用本文提出的基于DPC-GMM算法的無監(jiān)督船舶燃油系統(tǒng)故障診斷方法,基于故障參數(shù)智能構(gòu)建故障診斷模型,進行故障的識別。以期實現(xiàn)對船舶燃油系統(tǒng)不同工作狀態(tài)的準確判斷,為船舶燃油系統(tǒng)狀態(tài)的監(jiān)測和故障診斷系統(tǒng)的建立提供新思路和新方法。
假設(shè)船舶燃油系統(tǒng)狀態(tài)的訓(xùn)練數(shù)據(jù)樣本X={x1,x2,…,xi},xi為系統(tǒng)狀態(tài)量,i=1,2,…,K,K為系統(tǒng)狀態(tài)類型數(shù)目。
GMM是一種描述混合密度函數(shù)分布的模型,采用若干個高斯概率密度函數(shù)的加權(quán)和來描述矢量特征在概率空間的分布狀況[10]。即每個高斯混合模型是由K個高斯分布組成,如圖1所示,形成不同系統(tǒng)狀態(tài)的分類器,將這些表征故障類別的高斯分布線性相加,得到GMM的概率密度函數(shù)[11]:
式中:Gj(xi|μj,∑j)為系統(tǒng)狀態(tài)量xi相對于第j類系統(tǒng)狀態(tài)的高斯概率分布函數(shù),μj和∑j分別是第j類系統(tǒng)狀態(tài)在X集上的均值與協(xié)方差,j=1,2,…,K;αj為第j類系統(tǒng)狀態(tài)的權(quán)重,且滿足約束條件
高斯概率密度分布函數(shù)表示為
式中,d為描述系統(tǒng)狀態(tài)特征的維數(shù)。
對應(yīng)的GMM似然函數(shù)為
GMM的基本思想是:首先,使用概率密度函數(shù)進行建模;然后,借助期望最大化(Expectation Maximum,EM)算法迭代獲取相應(yīng)參數(shù)的最優(yōu)解,根據(jù)正態(tài)分布的條件分布獲得K個高斯過程函數(shù)[12];最后,對測試樣本的船舶燃油系統(tǒng)狀態(tài)類型值進行計算。
基于GMM的故障診斷是以船舶燃油系統(tǒng)狀態(tài)數(shù)據(jù)樣本為基礎(chǔ),計算GMM的概率分布,獲得K個系統(tǒng)狀態(tài),然后采用高斯過程對系統(tǒng)狀態(tài)數(shù)據(jù)進行分類,進而進行故障診斷。借助DPC算法,自動聚類獲得系統(tǒng)狀態(tài)數(shù)據(jù)樣本的中心值,以作為GMM的K值輸入。
綜合式(1)和式(2)發(fā)現(xiàn),構(gòu)建GMM模型需要的初始參數(shù)主要包括K和θ,K值借助DPC算法獲得,而參數(shù)的常用估計方法是EM算法。
準確的θ才能構(gòu)建出高效的GMM分類模型。
采用EM算法逐步迭代來改善θ值的估計。迭代過程中,加大估計參數(shù)θ與觀測訓(xùn)練樣本xi之間的匹配率,使之滿足,其中l(wèi)為迭代次數(shù)。逐次迭代得到最優(yōu)參數(shù)值,從而找到使最大的θ*,即
結(jié)合式(4)與式(5),通過運算得到
結(jié)合式(8)與式(9),可得
其中,當(dāng)θ=θ'時,J(θ,θ')與P(X,θ)在θ點同時達到極值。綜合式(8),說明二者不僅有相同的單調(diào)性,極值點也一樣。
根據(jù)式(7),求偏導(dǎo)為0時對應(yīng)的θ′值,求解過程分為計算期望(E-step)與計算極大值(M-step)。
1)E-step:數(shù)據(jù)樣本xi屬于船舶燃油系統(tǒng)狀態(tài)類型i的概率,即
2)M-step:使用期望最大化算法求取GMM參數(shù)的迭代式,即
假設(shè)GMM的參數(shù)θ已知,利用E-step對GMM權(quán)值進行估計。M-step是基于估計的權(quán)值,以優(yōu)化并確定GMM的參數(shù)。重復(fù)上述2個步驟直到波動很小,在近似達到極值后結(jié)束迭代。
DPC算法是一種基于密度的聚類算法[9],其基于中心決策圖來確定密簇心和類簇個數(shù)K,其中K值通過前K個高密度點來判斷,然后將非簇心樣本點劃分到最鄰近的峰值密度樣本所在類簇,完成樣本數(shù)據(jù)的聚類。DPC具有無需指定聚類參數(shù),能夠發(fā)現(xiàn)非球類簇并識別噪聲點,有益于處理大批量數(shù)據(jù)的特點[13]。
GMM方法結(jié)合EM算法雖然可以保證每次迭代都能使觀察數(shù)據(jù)對數(shù)似然增大,但其收斂速度較慢[10]。選定較好的數(shù)據(jù)初始化結(jié)果能夠避免這個缺點,并解決參數(shù)初始化對GMM方法最終結(jié)果造成的影響。
先對輸入初始數(shù)據(jù)進行粗分類,再將EM算法迭代得到的數(shù)據(jù)作為GMM方法的初始化數(shù)據(jù)。將DPC算法與GMM算法結(jié)合可提高EM算法的收斂速度[14],從而提高方法的精度,并能從整體上降低模型的時間復(fù)雜度。
算法優(yōu)化過程如圖2的偽代碼所示。圖中,Th是最小誤差值。
本文提出模型的系統(tǒng)框架如圖3所示,圖中μ為均值,σ為方差。其工作原理分為3個步驟:
1)提取船舶燃油系統(tǒng)狀態(tài)的特征向量,并采用高斯白噪聲對數(shù)據(jù)樣本進行擴充;
2)采用DPC算法初始化船舶燃油系統(tǒng)狀態(tài)數(shù)據(jù)類型的數(shù)目,對不同類型數(shù)據(jù)進行GMM模型構(gòu)建,利用最大似然估計EM算法獲取聚類模型參數(shù);
3)利用GMM訓(xùn)練得到測試模型,根據(jù)輸入的新樣本診斷船舶燃油系統(tǒng)最可能的狀態(tài)。
船舶燃油系統(tǒng)故障診斷主要通過高壓油管的壓力波來體現(xiàn),當(dāng)燃油系統(tǒng)中的組件發(fā)生故障時,與之相關(guān)的特征指標會發(fā)生改變。所以,本文選取高壓油管的壓力波特征進行故障分析。為了獲得更好的診斷效果,基于文獻[15],選取8個壓力波特征參數(shù),包括燃油噴射最大壓力、噴油器啟閥壓力、次最大壓力、波形幅度、上升沿寬度、波形寬度、最大余波寬度以及波形面積(圖4)。
對采用40組原始數(shù)據(jù)的壓力波特征的描述性分析如圖5所示。
為了增大訓(xùn)練樣本的數(shù)量,使得建立的GMM更具代表性,將上述特征值分別加上了40,45,50,55,60,65,70,75,80 dB的高斯白噪聲,將40組原始數(shù)據(jù)擴充到了400組。然后再將這400組數(shù)據(jù)作為訓(xùn)練樣本,采用DPC算法尋找數(shù)據(jù)的最佳聚類中心,以作為EM算法初始化的中心值來構(gòu)建GMM模型。
通過DPC算法對數(shù)據(jù)進行聚類,結(jié)果表明船舶燃油系統(tǒng)有8種狀態(tài)(圖6)。
DPC算法聚類結(jié)果與本文中船舶燃油系統(tǒng)的8種狀態(tài)一致,如圖6所示,狀態(tài)1~8分別為:正常噴油、75%油量、25%油量、怠速油量、噴油器針閥卡死1、噴油器針閥卡死2、噴油器針閥泄漏、高壓油泵出油閥失效[14]。
將DPC算法獲取的聚類中心值作為EM算法的初始值來構(gòu)建GMM模型。
GMM模型中,μi為400×8維數(shù)據(jù),規(guī)模為400×400×8。
在測試階段,將8組船舶燃油系統(tǒng)故障特征值代入構(gòu)建的GMM模型中,比較基于對應(yīng)的每行樣本中的數(shù)值,數(shù)值大的維度代表對應(yīng)維度的船舶燃油系統(tǒng)狀態(tài)。得到如下結(jié)果:
實驗結(jié)果如式(13)所示,基于DPC-GMM算法的船舶燃油系統(tǒng)故障識別方法準確率達到了100%,能夠準確識別8類系統(tǒng)狀態(tài),并且不需要人工標注訓(xùn)練樣本,實現(xiàn)了無監(jiān)督的船舶燃油系統(tǒng)故障識別過程。
采用相同的訓(xùn)練樣本和測試樣本,運用BP神經(jīng)網(wǎng)絡(luò)算法對船舶燃油系統(tǒng)故障進行診斷,設(shè)置了5個神經(jīng)網(wǎng)絡(luò)隱含層、8個輸入神經(jīng)元、1個輸出神經(jīng)元,最大訓(xùn)練次數(shù)為5 000,訓(xùn)練精度默認。測試集輸出的結(jié)果為[1.81,5.61,3.01,3.05,5.00,5.61,5.61,5.61],與標注結(jié)果[1,2,3,4,5,6,7,8]進行對比,根據(jù)式(14),得到正確率為37.5%,故障診斷的準確率較差。
同樣,采用SVM方法識別上述船舶燃油系統(tǒng)狀態(tài),診斷故障類型。訓(xùn)練采用徑向基函數(shù)(Radical Basis Function,RBF),對DPC-GMM,BP神經(jīng)網(wǎng)絡(luò)和SVM支持向量機算法的實驗結(jié)果進行了對比,結(jié)果如表1所示。
表1 船舶燃油系統(tǒng)狀態(tài)的識別結(jié)果Table 1 Fault diagnosis of ship fuel system
由表1可見,采用DPC-GMM算法對船舶燃油系統(tǒng)進行故障診斷時,其效果明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和SVM算法,故障診斷的正確率達100%,所有故障類型都能正確劃分,診斷能力較強,解決了常用船舶燃油系統(tǒng)故障診斷方法泛化能力低的局限性。
對常用船舶燃油系統(tǒng)故障診斷方法的訓(xùn)練時間進行對比,同時還對比了直接采用GMM方法的訓(xùn)練時間,結(jié)果如表2所示。由表可見,本研究提出的基于DPC-GMM算法的船舶燃油系統(tǒng)故障診斷方法能夠?qū)崿F(xiàn)故障的精準與快速診斷。
表2 船舶燃油系統(tǒng)狀態(tài)識別模型訓(xùn)練時間對比Table 2 Training time of fault diagnosis model of ship fuel
綜合上述研究得出,本文提出的DPC-GMM方法解決了常用船舶燃油系統(tǒng)故障診斷方法存在的識別精度低、收斂速度慢的問題,也解決了GMM算法本身存在的收斂速度慢的局限性。
針對現(xiàn)有研究無法實現(xiàn)船舶燃油系統(tǒng)故障自動診斷、泛化能力較差的問題,本文提出了基于DPC-GMM算法的船舶燃油系統(tǒng)故障診斷方法,根據(jù)船舶燃油系統(tǒng)的特征抽取出8個維度的特征向量。構(gòu)建GMM時,應(yīng)用DPC算法對船舶燃油系統(tǒng)特征參數(shù)進行初始化,使用EM算法進行參數(shù)估計,建立完整、高效的故障診斷模型。實驗結(jié)果表明,本文提出的基于DPC-GMM算法的船舶燃油系統(tǒng)故障診斷方法,診斷準確率可達100%,優(yōu)于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)和SVM算法,同時可節(jié)約人工標注成本,是一種高效、無監(jiān)督的故障診斷方法,具有較高的實用價值,也為船舶燃油系統(tǒng)故障診斷問題提供了一種新的方法。