程哲,羅奕,王騰飛,文淵,董學琴
(桂林電子科技大學機電工程學院,廣西桂林 541004)
稀土作為支撐高新技術產業(yè)發(fā)展的關鍵資源,具有獨特且優(yōu)異的性能,被廣泛應用于航空航天、軍工、醫(yī)學等高技術關鍵領域,戰(zhàn)略地位顯著[1]。近年來我國的稀土冶煉工藝技術發(fā)展迅速,常見的稀土冶煉方法有兩大類,分別為濕法冶金和火法冶金。濕法冶金流程復雜,產品純度高;火法冶金流程簡單,生產效率高?;鸱ㄒ苯鹩职ü锜徇€原法、熔鹽電解法、金屬熱還原法等[2],其中的熔鹽電解法在稀土冶煉中因具有生產連續(xù)、產率高、成本低以及廢渣少的優(yōu)點應用十分廣泛[3]。熔鹽電解法的主要流程分為3個步驟,依次為給料過程、電解過程以及提取過程。粉體通過給料環(huán)節(jié)送入電解槽中,在電解槽中電解之后以高溫熔融狀態(tài)滴入槽中的坩堝中,再通過提取設備將熔融態(tài)成品取出??梢妵@電解工藝過程需要完成物料的準備、稱取、輸送、取出等系列輔助流程。這些流程傳統(tǒng)上主要依賴人工完成,存在精確度和效率低、質量不穩(wěn)定的弊端。為此針對性開發(fā)了自動輔機系統(tǒng)來完成這些輔助流程,因此給料自動輔機在稀土熔鹽電解過程中起著重要作用,一旦設備發(fā)生故障,會使得粉體原料無法完成電解工藝,導致生產中斷、產生次品等后果,所以必須相應研發(fā)自動輔機設備的故障診斷方法,監(jiān)測系統(tǒng)工作狀態(tài),及時檢測故障、預警不正常運行狀態(tài),這對在電解車間高溫腐蝕性惡劣環(huán)境下保證產品質量有重要意義。
為了提高生產線故障診斷效率,研究人員提出了各種故障診斷方法。故障樹分析法依據頂事件按照故障樹的建樹規(guī)則建立相應的模型,分析各級要素的聯(lián)系[4],其故障可視化能力強,結構清晰。故障樹分析法可直接應用定性定量分析結果計算重要度,依據重要度分析重要部位進行可靠性分析,或基于貝葉斯網絡進行故障原因推斷[5]。現(xiàn)有的基于貝葉斯網絡的故障樹分析法智能化和準確度較高[6],但對底層故障概率數據的準確度要求較高,實際應用效果不盡人意。文獻[7]建立了基于離散時間貝葉斯網絡的動態(tài)故障樹診斷模型,該模型針對受復雜工況影響的不確定、模糊、動態(tài)的故障概率數據[8],在故障樹中引入動態(tài)邏輯門,形成動態(tài)故障樹,結合貝葉斯網絡組成基于離散貝葉斯網絡的動態(tài)故障樹診斷模型,并進行改進,可以有效地定位故障可能發(fā)生的位置,但該模型模塊修改困難,人為調整容易破壞模型結構。文獻[9]提出一種將貝葉斯網絡和故障樹相集成的故障診斷方法,文獻[10]提出一種將概率神經網絡和故障樹相結合的方法。這兩種方法將神經網絡與故障樹分析法相結合,將故障樹節(jié)點作為神經網絡輸出,再通過神經網絡對事件進行故障定位,可以相對準確定位故障,數據需要人工進行處理,處理過程中可能出現(xiàn)人工誤差影響檢測結果。
影響稀土電解輔機系統(tǒng)工作狀況的參數種類較多,受環(huán)境因素影響較大,故障大多具有時序性。綜合以上分析,本文作者提出一種基于故障樹和LSTMSVM 的故障診斷方法,并將其應用于稀土電解輔機系統(tǒng)故障診斷。
設備原理如圖1 所示:設備啟動前先將粉體原料置于下方大料斗中,設備運行時氣泵工作,粉體經管道通過進料閥進入上方的料斗內,同時料斗下方的壓力傳感器將測得的進料質量反饋到控制系統(tǒng),當上方料斗內質量到達事先設好的標準時氣泵、進料閥、氣閥1 關閉,以此達到控制下料裝置單次給料量的目的。給料過程中,粉體在重力作用下下落到螺桿處,電機工作帶動螺桿轉動,將落下的粉體推出。為防止料斗內粉體堆積堵塞,分別設置攪拌結構、氣孔以及振動模塊用以輔助下料,防止出現(xiàn)粉體堵塞影響給料過程進行。
圖1 給料系統(tǒng)原理Fig.1 Principle of feeding system
對應的工作流程如圖2 所示。
圖2 給料工作流程Fig.2 Feeding workflow
粉體給料系統(tǒng)主要由電機、軸承、螺桿、攪拌器、料斗、壓力傳感器等組件構成。設備常見的異常工作狀況、故障產生原因以及常用的處理方法如表1所示。
表1 粉體下料設備常見故障Tab.1 Common failures of powder blanking equipment
電機過熱、氣泵溫度過高等不會直接影響生產過程,但其作為異常工作狀態(tài)可能造成潛在故障,應進行判斷并在必要時進行處理。
故障樹分析法于1961 年被提出,目前在傳動器件故障檢測[11]、風電機組可靠 性[12]、船舶風險 分析[13]等工程領域均有應用。故障樹分析法用樹狀圖來直觀地表示所有可能導致分析失效發(fā)生的原因[14],是對設備故障(頂事件)、工作單位故障(中間事件)和元器件故障(基本事件)的綜合分析,結合構成故障樹,由此樹推導出系統(tǒng)故障的概率。
給料設備故障為頂事件,通過分析粉體給料設備各組成部分工作聯(lián)系,結合實際生產過程中的故障案例調查分析故障層次關系,構造其故障樹模型,如圖3 所示。
圖3 粉體下料設備故障樹Fig.3 Powder blanking equipment fault tree
各事件名稱與符號對應如表2 所示。
表2 事件名稱與符號Tab.2 Event names and symbols
由圖3 可知,粉體下料設備故障樹由“與門”和“或門” 組成,且粉體下料設備故障樹底事件相互獨立,可得頂事件的概率表達式為
式中:P(T)和P(Xi)分別表示粉體下料系統(tǒng)頂事件和第i個底事件的發(fā)生概率。
底事件名稱及故障概率如表3 所示。
表3 底事件故障率Tab.3 Bottom events failure rates
頂事件發(fā)生概率計算公式:
其中:IP(Xi)為底事件Xi的概率重要度。
底事件相對概率重要度計算公式:
計算結果如表4—5 所示。
表4 發(fā)生概率Tab.4 Probability of occurrence
根據定量分析計算出的重要度結果,可對次級故障位置進行權重定義并對異常位置進行判斷定位。
在實際應用中,對于給料系統(tǒng)這種自動化系統(tǒng),由于不同模塊在工作中遵循一定的流程,不同流程工作狀態(tài)存在相互影響,單個事件在系統(tǒng)處于不同狀態(tài)下受到的影響不同,觸發(fā)故障的因素具有時序性,設備實際運行中發(fā)生故障時需要快速準確地對異常位置進行定位。而經過訓練的長短期記憶神經網絡對于處理時序性數據具有較大的優(yōu)勢,可通過對提取的實時數據與歷史數據相組合進行分析,結合故障樹概率模型所定義的故障上下級關系,以及所確定的權重大小對故障位置進行定位。另外,長短期記憶神經網絡在處理序列數據過程中可以在較好處理一維時序數據的同時減少傳統(tǒng)RNN 的梯度消失或梯度爆炸的問題[15],同時相對于傳統(tǒng)RNN 具有更快的訓練速度、更高的準確率。
長短期記憶網絡(LSTM,Long Short-Term Memory)是一種時間循環(huán)神經網絡,是對RNN 的改進,LSTM 在RNN 的基礎上引入了輸入門、遺忘門和輸出門對數據信息的傳輸進行控制[16],因此訓練速度相較于RNN 更快。其神經元基本結構如圖4 所示。
圖4 LSTM 神經元結構Fig.4 Structure of LSTM neurons
圖中圓圈表示向量計算;箭頭分叉表示向量復制;σ表示一個sigmoid 層,其輸出值為0~1,表示有多少信息可以通過該層,0 為都不能通過,1 為都能通過。
圖中水平線Ct為LSTM 模型的核心,它是一個記憶單元,其主要用途是確定上一級輸入Ct-1和下方輸入xt有多少成分保存在Ct中,長短時記憶神經網絡可以通過Ct選擇性保留信息。其表示公式為
遺忘門決定t時刻的輸入Ct-1哪些信息被舍棄,通過sigmoid 單元對ht以及xt的信息分析后輸出一個處于0~1 之間的向量,該向量中的數值表示Ct-1中信息被保留或丟棄的量。其表示公式為
式中:bf表示遺忘門的偏置項;Wf為此時前一層隱藏神經元在遺忘門輸出時的權重。
輸入門決定輸入哪些新信息,由一個sigmoid 單元和一個tanh 激活函數組成。其表示公式為
其中:Wi表示t時刻輸入層的權重;WC表示t時刻隱藏層的權重;xt表示t時刻的輸入;ht-1表示t-1時刻的隱藏狀態(tài);bi和bC分別表示輸入層與候選值的偏置。
輸出門主要用于判斷輸出的狀態(tài),輸入通過輸出門的sigmoid 層得到一個判斷條件,并結合tanh 層輸出的一個-1~1 之間的向量,該向量與輸出門得到的判斷條件相乘就得到了該單元的輸出。其表示公式為
通過多種影響因素數據建立數據矩陣,進行故障特征提取,對長短期記憶神經網絡進行訓練,實現(xiàn)從多種影響因素中定位故障所在故障樹分支,選擇權重較高的底事件作為輸出,輸出故障診斷結果。
基于LSTM 神經網絡原理,并結合粉體下料系統(tǒng)多種數據特點,通過修改長短期記憶神經網絡層數,修改部分參數以適應該故障數據以及使用adam 算法進行優(yōu)化以提高檢測準確度。該模型主要包括輸入層、LSTM 層、全連接層、Softmax 層以及分類輸出層五部分。
根據故障樹節(jié)點之間的相關規(guī)則,根據計算出的事件概率重要度(表5)提取出幾種設備故障狀態(tài)模式并進行編號分類,如表6 所示。
表5 底事件定量分析結果Tab.5 Quantitative analysis results of bottom events
表6 工作模式編號Tab.6 Working mode numbers
各模式故障診斷輸出結果如表7 所示。
表7 故障診斷輸出結果權重Tab.7 Weight of fault diagnosis output results
在診斷給料設備故障時,分別采集電動機功率、電動機溫度、下料速度、階段下料完成后上方料斗內剩余料量以及空氣濕度5 種數據信息,輸入到LSTM診斷模型進行分析,判斷出相應的故障樹分支節(jié)點,輸出診斷結果。模型診斷過程見圖5。
圖5 診斷過程Fig.5 Diagnosis process
數據歸一化處理是數據挖掘的一項基本工作,由于不同的評價指標具有不同的量綱和量綱單位,這種情況會影響數據的分析結果[17]。為了消除指標之間的量綱影響,需要對數據進行歸一化處理,以解決數據指標之間的可比性。原始數據經過數據歸一化處理后單位統(tǒng)一,處于同一個量綱,可以進行綜合對比評價。
本文作者應用的歸一化方法為min-max 標準化方法,即離差標準化,是對元數據進行線性變換,使其結果映射到[0,1]之間[18],其轉換公式如下:
其中:xmax為樣本某一屬性數據的最大值;xmin為樣本同一數據最小值。
故障診斷模型架構如圖6 所示,當下料系統(tǒng)發(fā)生故障時,模型匹配到相應故障樹并采集實時數據,將數據集經歸一化處理之后的數據集合A={a1,a2,a3,a4,a5} 輸入至已訓練好的長短期神經網絡模型中,診斷網絡根據故障模式分類規(guī)則(見表6)對故障進行識別診斷,識別出對應的故障模式,之后根據該模式對應的故障樹節(jié)點分支的底事件集合B={b1,b2,…,bn},計算故障樹分支中底事件的相對概率重要度確定權重,根據其對節(jié)點的影響權重,選取權重最大的事件為輸出結果,見表7 勾選項。
圖6 粉體下料系統(tǒng)故障診斷系統(tǒng)架構Fig.6 Architecture of fault diagnosis system of powder feeding system
數據集含有600 組數據,分別為6 種工作模式下所采集的數據,訓練集大小占數據集的70%。修改不同參數,測試過程收斂時迭代次數對比,如圖7—8 所示。
圖7 使用adam 時修改最小批量迭代次數對比Fig.7 Comparison of minimum batch iteration times when using adam
圖8 最小批取300 時求解器迭代次數對比Fig.8 Comparison of solver iterations when the minimum batch size is 300
由圖7—8 可見:使用adam 時相較于使用SGD收斂速度更快,最小批取值越小收斂速度越快,但最小批取值越小訓練速度越慢,所以最小批取30。使用adam 作為求解器,訓練過程中模型準確率曲線及損失函數曲線如圖9 所示。
圖9 訓練過程準確率曲線(a)及損失函數曲線(b)Fig.9 The accuracy curves(a)and loss function curves(b)of the training process
以數據集剩下的30%為測試集,對訓練好的模型進行準確率測試,測試結果混淆矩陣如圖10 所示。
圖10 測試結果混淆矩陣Fig.10 Test result confusion matrix
從圖10 可以看出:在180 次測試過程中,僅有4次故障類型診斷錯誤,最終準確率達到97.8%,可見該模型擁有較高的故障診斷準確率。
由于實際生產過程中溫度、濕度等數據容易存在干擾,故分別將溫度和濕度加入干擾數據后對模型進行準確度測試,10 次測試結果對比如圖11 所示。
圖11 引入干擾測試準確度對比Fig.11 Introduces an interference test accuracy comparison
由圖11 可知:在引入溫度與濕度干擾時,對診斷結果有影響,其中溫度干擾影響較大,濕度干擾影響較小,但仍能到達較高的準確度。由此可見,與故障樹分析法相結合的長短期記憶神經網絡應用于設備故障診斷效果顯著。
識別過程中最常出錯的位置是將狀態(tài)4 電機異常工作識別為正常工作狀態(tài),是由于電機異常工作如電機過熱或異常振動時不會立即影響設備工作過程,屬于亞健康的工作狀態(tài)而非即時故障。此時需要對其異常程度進行判斷,以決定是否需要立即進行維修。
分類方法選擇支持向量機(SVM),是一類按監(jiān)督學習方式對數據進行分類的分類器。該方法是非常經典的、也最受歡迎的分類方法之一。
部分參數設置如表8 所示。
表8 SVM 部分參數Tab.8 Partial parameters of SVM
數據集將異常工作數據進行標簽,分別定義為輕度異常(編號為1)以及重度異常(編號為2)。經過多次訓練,準確率均能達到100%,圖12 為測試數據混淆矩陣熱力圖。
圖12 測試數據混淆矩陣熱力圖Fig.12 Test data confusion matrix thermogram
分類結果值是擁有最大預測概率的分類組別,部分測試結果如表9 所示。
表9 測試結果Tab.9 Test results
由表9 看出:SVM 模型可以準確將輕度異常和重度異常分類。
本文作者提出基于故障樹和LSTM-SVM 相結合的粉體下料系統(tǒng)故障診斷方法,診斷過程中對多種故障模式狀態(tài)進行定性診斷。利用LSTM 進行故障診斷后結合故障樹的上下級關系以及所定義的權重比輸出診斷結果,并使用SVM 對非故障的異常工作狀態(tài)進行故障分級,判斷是否發(fā)展為故障;針對僅靠LSTM無法快速準確對復雜設備進行故障診斷以及將異常狀態(tài)診斷為故障的缺點,利用故障樹定量分析定義影響權重,搭配LSTM 進行故障診斷輸出結果,以及對非故障的異常工作狀態(tài)進行故障分級,可以較容易應用到實際工程中。隨著訓練數據的逐漸積累,可以進一步提高訓練速度和準確率。