鄭磊
(國能信息技術有限公司,北京 100011)
煤礦工作面設備(采煤機、液壓支架、刮板輸送機等)突發(fā)故障造成的非計劃性停機會影響煤礦正常生產,同時會縮短設備使用壽命,增加生產成本[1]。實現(xiàn)工作面設備故障預測及預防性檢修,提高設備的可靠性已成為熱點研究課題[2-3]。
時間序列(時序)分析是一種根據(jù)時序數(shù)據(jù)預測未來發(fā)展趨勢的方法。時序數(shù)據(jù)是同一指標按時間順序記錄的數(shù)據(jù)列,與設備運行相關的時序數(shù)據(jù)是在設備運行階段隨時間獲取的一系列觀測數(shù)據(jù)[4-5]。時序分析通常通過數(shù)據(jù)預處理、建模、預測3個步驟實現(xiàn)趨勢預測,在多個領域得到研究和應用。如E.Erdem等[6]基于時序數(shù)據(jù),采用自回歸移動平均值預測風速和風向;藺茜等[7]采用長短期記憶(Long Short-Term Memory,LSTM)網絡,根據(jù)電力變壓器監(jiān)測時序數(shù)據(jù),實現(xiàn)了電力變壓器運行狀態(tài)預測;王超等[8]通過分析與齒輪箱軸承溫度相關的特征時序數(shù)據(jù),采用LSTM網絡對齒輪箱軸承溫度進行預測,并通過滑動窗口對預測殘差進行合理分析,實現(xiàn)了對齒輪箱軸承故障的有效預測。但鮮有時序分析在煤礦工作面設備故障預測中應用的報道。
本文提出基于時序數(shù)據(jù)對工作面設備進行故障預測。煤礦工作面設備通常由多個復雜系統(tǒng)模塊組成,各模塊間具有強耦合性,且設備故障機理復雜,因此在進行故障預測時需對設備的運行狀態(tài)、環(huán)境參數(shù)、操作數(shù)據(jù)等進行實時監(jiān)測,獲取電氣、機械、熱工類多參數(shù)時序數(shù)據(jù)。本文以國家能源集團神東煤炭集團公司上灣煤礦8.8 m大采高綜采工作面設備為研究對象,采集設備的多狀態(tài)時序數(shù)據(jù),采用時序數(shù)據(jù)處理中常用的LSTM網絡建立故障預測模型,實現(xiàn)了設備故障的有效預測。
上灣煤礦工作面設備各監(jiān)測點數(shù)據(jù)均為單序列變化時序數(shù)據(jù),根據(jù)數(shù)據(jù)變化記錄時間戳,采樣時間無規(guī)則。以某采煤機4個監(jiān)測點數(shù)據(jù)為例,部分時序數(shù)據(jù)見表1??煽闯龈鹘M數(shù)據(jù)對應的時間戳均不相同,形成獨特的時序。為便于采用LSTM網絡處理數(shù)據(jù),需對原始數(shù)據(jù)進行預處理。
表1 采煤機部分時序數(shù)據(jù)
根據(jù)表1數(shù)據(jù),基于時序對齊算法將時序數(shù)據(jù)對齊并進行前值填充,具體方法:對監(jiān)測數(shù)據(jù)的時間列重新排序,以時間列為關鍵值,各監(jiān)測數(shù)據(jù)作為標簽值填入,對某一時刻空缺值以前值進行填充。對齊后的時序數(shù)據(jù)見表2。
表2 對齊后的采煤機部分時序數(shù)據(jù)
煤礦工作面設備故障種類多,各故障發(fā)生機理不同;單一設備監(jiān)測點多(可達120個),監(jiān)測數(shù)據(jù)量大[9-12]。針對某一故障選取最合理有效的相關因素是實現(xiàn)故障預測的關鍵環(huán)節(jié)。本文以采煤機過熱跳閘故障為例進行說明。
通過分析采煤機過熱跳閘故障表征現(xiàn)象和發(fā)生機理,得出引發(fā)過熱跳閘故障的相關因素集為{滾筒溫度,滾筒電流,滾筒啟停,變頻器跳閘狀態(tài),牽引溫度,變頻器設定速度,變壓器溫度,搖臂溫度}。采用Pearson相關系數(shù)分析法[13]對相關因素集進行相關性分析。相關系數(shù)為
(1)
r取值范圍為[-1,1],r>0表示存在正相關關系,r<0表示存在負相關關系,|r|≤0.3表示不存在線性相關關系,0.3<|r|≤0.5表示存在低度線性相關關系,0.5<|r|≤0.8表示存在顯著線性相關關系,0.8<|r|<1表示存在高度線性相關關系,|r|=1表示存在完全線性相關關系。
1.2.4 處置及改進階段:在培訓過程中,運用PDCA循環(huán)管理,定期總結,在對新入科的CSSD護士進行培訓過程中及時發(fā)現(xiàn)問題,提出改進措施,總結經驗并進行效果評價。消毒供應專業(yè)操作項目雜、設備設施多、工作量大,因此對消毒供應中心新入科護士的培訓是持續(xù)性的。對定期考核的成績應及時分析原因并進行改進。
根據(jù)監(jiān)測數(shù)據(jù),采煤機過熱跳閘故障相關因素間相關系數(shù)如圖1所示??煽闯鲎冾l器跳閘狀態(tài)和變頻器設定速度與其他因素間相關系數(shù)較小,因此將這2個因素舍棄,將{滾筒溫度,滾筒電流,滾筒啟停,牽引溫度,變壓器溫度,搖臂溫度}作為過熱跳閘故障預測因素集。
1-滾筒溫度;2-滾筒電流;3-滾筒啟停;4-變頻器跳閘狀態(tài);5-牽引溫度;6-變頻器設定速度;7-變壓器溫度;8-搖臂溫度;9-過熱跳閘。
采用LSTM網絡對采煤機過熱跳閘故障進行預測。以故障預測因素集作為LSTM網絡輸入,過熱跳閘故障作為LSTM網絡輸出。LSTM網絡由遞歸神經網絡發(fā)展而來,其細胞結構如圖2所示。
圖2 LSTM網絡細胞結構
細胞狀態(tài)為LSTM網絡的關鍵要素,是整個LSTM網絡的記憶空間。信息是否記憶由控制門控制,包括遺忘門、輸入門和輸出門。
遺忘門控制信息是否遺忘,即以一定的概率控制是否遺忘上一層的隱藏細胞狀態(tài)。圖2中LSTM網絡細胞單元輸入為上一層隱藏細胞狀態(tài)Ht-1(t為當前細胞層數(shù))和本層時序數(shù)據(jù)Xt,通過sigmoid激活函數(shù)(σ)得到遺忘門輸出ft。ft在[0,1]之間,其代表遺忘上一層隱藏細胞狀態(tài)的概率。
輸入門負責處理本層細胞的輸入,包括2個部分:第1部分使用sigmoid激活函數(shù),輸出it;第2部分使用tanh激活函數(shù),輸出at。
本層細胞狀態(tài)Ct由2個部分組成:第1部分為上一層細胞狀態(tài)Ct-1和本層細胞遺忘門輸出ft的乘積;第2部分為本層細胞輸入門的it和at乘積。
本層隱藏細胞狀態(tài)Ht的更新由2個部分組成:第1部分為由上一層隱藏細胞狀態(tài)Ht-1和本層時序數(shù)據(jù)Xt通過sigmoid激活函數(shù)得到的Ot;第2部分由本層細胞狀態(tài)Ct通過tanh激活函數(shù)得到的nt。二者相乘得到Ht。
(2)
在實際生產中,遲滯性故障與其相關因素間存在時間累積效應,即相關因素經過一段遲滯時間后才引發(fā)故障。因此故障數(shù)據(jù)與故障發(fā)生前一段時間的相關因素相關。在LSTM網絡訓練階段引入遲滯時間h,將輸入的故障預測因素集通過h與輸出故障數(shù)據(jù)建立聯(lián)系,即
(3)
式(3)表明,預測階段的輸出具有時間段h的滯后性,因此確定遲滯時間段h成為研究重點。
根據(jù)采煤機過熱跳閘故障預測因素集,選取實際生產中的9 000組數(shù)據(jù)為訓練集,3 000組數(shù)據(jù)為測試集,正常數(shù)據(jù)與故障數(shù)據(jù)比為10∶1。
對數(shù)據(jù)進行歸一化處理,把數(shù)據(jù)轉換至[-1,1]區(qū)間,將各數(shù)據(jù)絕對值變成相對值,其實質是一種線性變換,不會導致數(shù)據(jù)失效,反而能提高數(shù)據(jù)表現(xiàn)。歸一化公式如下。
(4)
式中:x*為歸一化時序數(shù)據(jù);x為原始時序數(shù)據(jù);xmax,xmin分別為原始時序數(shù)據(jù)最大值、最小值。
部分歸一化時序數(shù)據(jù)見表3。滾筒啟停以1表示啟動,0表示停止;過熱跳閘故障以0表示正常,1表示故障。
表3 部分歸一化時序數(shù)據(jù)
設置LSTM網絡細胞層數(shù)為10,隱藏細胞數(shù)為10,學習率為0.001,一次讀取樣本個數(shù)為120。以均方根誤差為指標,確定遲滯時間為60 min。則不同迭代次數(shù)下LSTM網絡迭代損失如圖3所示。從圖3可看出,隨著迭代次數(shù)增加,LSTM網絡迭代損失表現(xiàn)出持續(xù)性遞減,1 500次迭代后損失減小速度較小,驗證了LSTM網絡在時序數(shù)據(jù)下表現(xiàn)出良好的計算性能。確定迭代次數(shù)為1 500,以遲滯時間為變量對LSTM網絡迭代損失進行計算,結果如圖4所示??煽闯龅鷵p失最小時遲滯時間為30 min。
(a)迭代次數(shù)為1 000
圖4 不同遲滯時間下LSTM網絡迭代損失
根據(jù)上述結果確定LSTM網絡訓練的迭代次數(shù)為1 500,遲滯時間為30 min,采用測試集進行故障預測,結果如圖5所示。預測值為[0,1],當預測值有明顯上升趨勢或達0.5以上時,表明實現(xiàn)了故障預測。從圖5可看出,實際值在72 min左右達到1(發(fā)生故障),預測值從46 min開始持續(xù)上升至0.5,實現(xiàn)了故障超前26 min預測,與設定的故障遲滯時間相差4 min,驗證了模型具有良好的預測效果。
圖5 故障預測結果
(1)提出采用時序對齊算法對采集的煤礦工作面設備原始時序數(shù)據(jù)進行對齊及前值填充,形成了完備的基礎數(shù)據(jù)集。
(2)采用相關性分析驗證了故障與其影響因素間的相關性,選取了故障預測因素集。
(3)建立了工作面設備故障的LSTM網絡預測模型,根據(jù)工作面遲滯性故障與其相關因素間存在時間累積效應的特點,將遲滯時間段引入預測模型,通過試驗確定了遲滯時間段,并驗證了采用時序數(shù)據(jù)進行工作面設備故障預測的有效性。