陳韻安
(浙江省南海實驗中學,浙江舟山,316000)
隨著現(xiàn)代工業(yè)的發(fā)展,各種各樣的工業(yè)設備為人類的生產(chǎn)生活創(chuàng)造了巨大的利潤和帶來了巨大的便利。與此同時,工業(yè)設備的結(jié)構(gòu)也越來越復雜,這導致工業(yè)設備的故障診斷也越來越困難。
故障診斷問題的目的是及時檢測出設備是否發(fā)生了故障,如果發(fā)生了故障則進一步診斷出是何種故障。工業(yè)設備的故障診斷方法大體上可以分為基于解析模型的診斷方法、基于信號處理的診斷方法和基于人工智能的診斷方法等。其中基于解析模型的方法又可進一步分為狀態(tài)估計診斷法、參數(shù)估計診斷法和一致性檢驗診斷法等。這種方法的前提是對研究對象的機理模型具有比較深入的認識,然而在實際中這點往往很難做到,因為研究對象的機理模型一般都非常復雜,很難得到準確的數(shù)學表達式?;谛盘柼幚淼脑\斷方法主要包括頻譜分析法、小波變換法等,它們的方法實現(xiàn)簡單,能夠及時檢測出故障,但是對故障種類的診斷不是很準確?;谌斯ぶ悄艿姆椒ㄖ饕ɑ趯<蚁到y(tǒng)的診斷方法、基于機器學習的方法等。專家系統(tǒng)故障診斷方法需要匯集眾多的專家知識形成知識庫,然后利用知識庫進行推理。在實踐中,獲取專家知識的過程比較困難,因此這種方法具有較大局限性。基于機器學習的方法只依賴于歷史運行數(shù)據(jù),通過正常的數(shù)據(jù)和包含各種故障的數(shù)據(jù)訓練出一個機器學習模型,然后對新的數(shù)據(jù)進行診斷。得益于機器學習理論方法的發(fā)展以及計算機性能的提升,這種方法得到了廣泛的應用。例如,文獻[3]比較了不同的機器學習方法在對航空發(fā)動機進行故障診斷時的性能和準確率。
本文提出的基于softmax回歸的故障診斷方法,是一種數(shù)據(jù)驅(qū)動的多分類方法。它的基本原理是在概率的框架下,利用softmax函數(shù)估計出各類故障的概率模型,然后對新的數(shù)據(jù)點進行分類診斷。在對新的數(shù)據(jù)點分類時,可以根據(jù)最小錯誤率的決策準則,也可以根據(jù)最小風險的決策準則。本文對softmax回歸、最小錯誤率決策準則、最小風險決策準則的基本原理進行了詳細闡述,并以某型航空發(fā)動機的運行數(shù)據(jù)為例子進行實驗驗證,包含了數(shù)據(jù)歸一化和數(shù)據(jù)降維、利用訓練集訓練softmax回歸模型、利用最小錯誤率決策準則和最小風險決策準則對測試集進行分類評估。實驗結(jié)果表明,本文提出的多類故障分類方法具有較高的準確率和較強的實用性。
在介紹softmax回歸之前,我們將討論分類問題中的最小錯誤率決策準則,并引入logistic函數(shù)和softmax函數(shù)分別對二分類問題和多分類問題進行建模,實現(xiàn)最小錯誤率準則下的分類。同時在本章最后引入最小風險決策準則,使得分類的總損失最小。
我們來研究一般情況下的分類問題,假設有K種類別,記為 Y = {C1, C2,· ··,CK}。我們來計算在已知輸入樣本向量x(假設維數(shù)為d)的條件下,樣本屬于各類的概率P(Ck|x ),k= 1,2,···,K ,稱之為后驗概率。將輸入樣本x判斷為Ck類時出錯的概率可以表示為:
設決策規(guī)則為h∶X→Y,所有樣本的整體錯誤率可以表示為:
最小錯誤率決策準則的目的是尋找合適的h(x)使得最小化式(2)。假設樣本都是獨立同分布的,則若對于每個樣本x,h(x)都能最小化錯誤率 Pe(h(x )| x)的話,那么也就能最小化所有樣本的整體錯誤率。因此,最小錯誤率決策準則下h(x)的選取標準為:
顯然,最小化錯誤率等價于最大化后驗概率,因此式(3)等價于:
在使用最小錯誤率決策準則進行分類時,首先要獲得各 類 后 驗 概率 P(Ck|x)。在實際中, P(Ck|x)一 般 很 難直接獲得,需要利用有限的訓練樣本盡可能準確地估計出P(Ck|x)。我們接下來將分別對兩類分了問題和多類分類問題分別引入logistic函數(shù)和softmax函數(shù)來對后驗概率P(Ck|x)建模。
從圈閉與有效烴源巖的位置關(guān)系看,除斷層溝通的構(gòu)造-巖性油氣藏外,已發(fā)現(xiàn)的孤立砂體巖性油氣藏均分布在有效烴源巖范圍內(nèi)或接觸有效烴源巖,處于有效烴源巖中心被其包裹的圈閉,其含油性要好于與烴源巖呈側(cè)向接觸的巖性圈閉,離有效烴源巖中心的距離越近,圈閉含油氣性越好,反之越差。
Logistic函數(shù)被廣泛應用于二分類問題中,其表達式為:
該函數(shù)的特點是:(1)值域為[0,1],與概率的范圍剛好吻合;(2)在R上單調(diào)遞增;(3)對稱中心為(0,0.5)。
圖1 logistic函數(shù)圖像
在對兩類分問題進行分類時,假設分類面是線性可分的,則分類的目的是尋找一個超平面 wTx+b= 0將兩類數(shù)據(jù)點分開。將 wTx+b= 0作為一個整體代入logistic函數(shù),得:
記兩類分別為第0類和第1類,記作 Y= {0 ,1}。令q=f(x)表示第1類的概率,則第0類的概率為1-q。對于具有m個樣本的訓練集,其概率分布列可表示為:
在logistic回歸中,式(7)中的q可以用式(6)中的h(x)替換,然后在訓練集上利用極大似然估計的方法,求得其中的參數(shù)w和b。若對x和w添加一維 x0= 1,w0= b,則可將參數(shù)w和b統(tǒng)一寫成參數(shù)θ。即對于具有m個樣本X和其觀測值Y,可以寫出似然函數(shù):
對數(shù)似然函數(shù)為:
代價函數(shù)定義為:
Softmax回歸的原理和思路與logistic回歸很類似,區(qū)別在于softmax回歸是利用softmax函數(shù)來對對后驗概率P(Ck|x)建模,后續(xù)的流程和logistic回歸相同。
假設總共有K個類別,輸入為d維的向量x,則對應的Softmax函數(shù)形式如下:
對應的似然函數(shù) ()Lθ 表示為:
對似然函數(shù) L(θ) 取對數(shù),可以得到所謂的對數(shù)似然函數(shù)l(θ):
代價函數(shù)為:
式(14)是一個凸函數(shù),可利用梯度下降法求得全局最小值點。梯度下降法求解時的梯度公式為:
梯度下降每一步的迭代更新公式為:
在分類問題中,有時我們關(guān)心的是錯誤率,而是分類出現(xiàn)錯誤所造成的損失。舉例來說,在故障診斷問題中,將正常的運行狀態(tài)誤判為發(fā)生故障的運行狀態(tài)和將故障狀態(tài)誤判為正常狀態(tài)所造成的損失是截然不同的。不同分類錯誤造成的損失不同時的決策準則,稱為最小風險決策準則。
分類問題的描述和符號定義與前面一致。記將Cj類的樣本x分類為Ci類時所產(chǎn)生的損失為ijλ,則將樣本x分類為Ci類的損失可以表示為:
設決策規(guī)則為h∶X→Y,所有樣本的期望總體損失為:
最小風險決策準則可表示為:
為了驗證前面的理論,我們以某型航空發(fā)動機的運行數(shù)據(jù)為實驗數(shù)據(jù),進行了實驗。實驗流程圖如圖2所示。
該航空發(fā)動機的原始運行數(shù)據(jù)的輸入是13維的傳感器測量數(shù)據(jù),輸出是5種可能的類別:正常狀態(tài)、風扇部件出現(xiàn)故障、壓氣機部件出現(xiàn)故障、高壓渦輪(簡記為HPT)部件出現(xiàn)故障和低壓渦輪(簡記為LPT)部件出現(xiàn)故障。原始數(shù)據(jù)劃分為訓練集(80%比例)和測試集(20%比例)。不同類別分類錯誤時的損失表見表1。歸一化處理的目的是為了統(tǒng)一各位特征之間的量綱,以使得算法更快收斂,這里我們采用的是最大最小值歸一化;數(shù)據(jù)降維是為了提取出數(shù)據(jù)中的有用信息,丟棄無用信息,提高算法的效率和準確性,這里我們采用的是線性判別分析(LDA)降維。
圖2 實驗設計流程圖
表1 不同類別故障的錯誤分類損失
我們在數(shù)據(jù)含有不同信噪比的噪聲的情況下,對比了最小錯誤率決策和最小風險決策的結(jié)果,包括正確率和期望損失兩方面,如表2所示。
表2 不同信噪比下兩種決策準則的正確率和期望損失對比結(jié)果
由表2可以看到,當信噪比在40dB以下時,最小錯誤率決策與最小風險決策準則都具有較高的正確率和較小的期望損失;當數(shù)據(jù)含有噪聲時,采用最小風險決策進行故障診斷與最小錯誤率準則相比,雖然正確率可能會更低,但是總的期望損失更小。
工業(yè)設備的故障診斷問題是一個很重要的問題,故障診斷的準確性影響著工業(yè)設備能否正常、安全運行。本文將工業(yè)設備的故障診斷問題描述為多分類問題,并推導了最小化錯誤率時的決策準則;采用softmax函數(shù)對后驗概率建模,并引入最小風險決策,考慮不同錯誤分類的損失不同的情況;以某型航空發(fā)動機運行數(shù)據(jù)為研究對象,對比了在使用softmax回歸進行故障診斷時,最小錯誤率決策準則與最小風險決策準則的區(qū)別。實驗結(jié)果表明,當噪聲比較小時,最小錯誤率決策與最小風險決策準則都具有較高的正確率和較小的期望損失,能夠較為準確地診斷出故障類型;當數(shù)據(jù)含有噪聲時,采用最小風險決策進行故障診斷與最小錯誤率準則相比,雖然正確率可能會更低,但是總的期望損失更小,更符合實際需要。
此外,本文也有以下地方值得改進:
(1)softmax回歸本質(zhì)上是線性分類,當數(shù)據(jù)集不存在線性分類面時,分類結(jié)果可能會不理想,可以考慮引入神經(jīng)網(wǎng)絡結(jié)構(gòu)處理非線性分類問題。
(2)可以將本論文的方法運用到其他具體設備的故障診斷問題上,以進一步驗證本文方法的有效性。