鄭磊
(國能信息技術(shù)有限公司,北京 100011)
煤礦工作面設(shè)備(采煤機、液壓支架、刮板輸送機等)突發(fā)故障造成的非計劃性停機會影響煤礦正常生產(chǎn),同時會縮短設(shè)備使用壽命,增加生產(chǎn)成本[1]。實現(xiàn)工作面設(shè)備故障預(yù)測及預(yù)防性檢修,提高設(shè)備的可靠性已成為熱點研究課題[2-3]。
時間序列(時序)分析是一種根據(jù)時序數(shù)據(jù)預(yù)測未來發(fā)展趨勢的方法。時序數(shù)據(jù)是同一指標(biāo)按時間順序記錄的數(shù)據(jù)列,與設(shè)備運行相關(guān)的時序數(shù)據(jù)是在設(shè)備運行階段隨時間獲取的一系列觀測數(shù)據(jù)[4-5]。時序分析通常通過數(shù)據(jù)預(yù)處理、建模、預(yù)測3個步驟實現(xiàn)趨勢預(yù)測,在多個領(lǐng)域得到研究和應(yīng)用。如E.Erdem等[6]基于時序數(shù)據(jù),采用自回歸移動平均值預(yù)測風(fēng)速和風(fēng)向;藺茜等[7]采用長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò),根據(jù)電力變壓器監(jiān)測時序數(shù)據(jù),實現(xiàn)了電力變壓器運行狀態(tài)預(yù)測;王超等[8]通過分析與齒輪箱軸承溫度相關(guān)的特征時序數(shù)據(jù),采用LSTM網(wǎng)絡(luò)對齒輪箱軸承溫度進行預(yù)測,并通過滑動窗口對預(yù)測殘差進行合理分析,實現(xiàn)了對齒輪箱軸承故障的有效預(yù)測。但鮮有時序分析在煤礦工作面設(shè)備故障預(yù)測中應(yīng)用的報道。
本文提出基于時序數(shù)據(jù)對工作面設(shè)備進行故障預(yù)測。煤礦工作面設(shè)備通常由多個復(fù)雜系統(tǒng)模塊組成,各模塊間具有強耦合性,且設(shè)備故障機理復(fù)雜,因此在進行故障預(yù)測時需對設(shè)備的運行狀態(tài)、環(huán)境參數(shù)、操作數(shù)據(jù)等進行實時監(jiān)測,獲取電氣、機械、熱工類多參數(shù)時序數(shù)據(jù)。本文以國家能源集團神東煤炭集團公司上灣煤礦8.8 m大采高綜采工作面設(shè)備為研究對象,采集設(shè)備的多狀態(tài)時序數(shù)據(jù),采用時序數(shù)據(jù)處理中常用的LSTM網(wǎng)絡(luò)建立故障預(yù)測模型,實現(xiàn)了設(shè)備故障的有效預(yù)測。
上灣煤礦工作面設(shè)備各監(jiān)測點數(shù)據(jù)均為單序列變化時序數(shù)據(jù),根據(jù)數(shù)據(jù)變化記錄時間戳,采樣時間無規(guī)則。以某采煤機4個監(jiān)測點數(shù)據(jù)為例,部分時序數(shù)據(jù)見表1。可看出各組數(shù)據(jù)對應(yīng)的時間戳均不相同,形成獨特的時序。為便于采用LSTM網(wǎng)絡(luò)處理數(shù)據(jù),需對原始數(shù)據(jù)進行預(yù)處理。
表1 采煤機部分時序數(shù)據(jù)
根據(jù)表1數(shù)據(jù),基于時序?qū)R算法將時序數(shù)據(jù)對齊并進行前值填充,具體方法:對監(jiān)測數(shù)據(jù)的時間列重新排序,以時間列為關(guān)鍵值,各監(jiān)測數(shù)據(jù)作為標(biāo)簽值填入,對某一時刻空缺值以前值進行填充。對齊后的時序數(shù)據(jù)見表2。
表2 對齊后的采煤機部分時序數(shù)據(jù)
煤礦工作面設(shè)備故障種類多,各故障發(fā)生機理不同;單一設(shè)備監(jiān)測點多(可達120個),監(jiān)測數(shù)據(jù)量大[9-12]。針對某一故障選取最合理有效的相關(guān)因素是實現(xiàn)故障預(yù)測的關(guān)鍵環(huán)節(jié)。本文以采煤機過熱跳閘故障為例進行說明。
通過分析采煤機過熱跳閘故障表征現(xiàn)象和發(fā)生機理,得出引發(fā)過熱跳閘故障的相關(guān)因素集為{滾筒溫度,滾筒電流,滾筒啟停,變頻器跳閘狀態(tài),牽引溫度,變頻器設(shè)定速度,變壓器溫度,搖臂溫度}。采用Pearson相關(guān)系數(shù)分析法[13]對相關(guān)因素集進行相關(guān)性分析。相關(guān)系數(shù)為
(1)
r取值范圍為[-1,1],r>0表示存在正相關(guān)關(guān)系,r<0表示存在負相關(guān)關(guān)系,|r|≤0.3表示不存在線性相關(guān)關(guān)系,0.3<|r|≤0.5表示存在低度線性相關(guān)關(guān)系,0.5<|r|≤0.8表示存在顯著線性相關(guān)關(guān)系,0.8<|r|<1表示存在高度線性相關(guān)關(guān)系,|r|=1表示存在完全線性相關(guān)關(guān)系。
1.2.4 處置及改進階段:在培訓(xùn)過程中,運用PDCA循環(huán)管理,定期總結(jié),在對新入科的CSSD護士進行培訓(xùn)過程中及時發(fā)現(xiàn)問題,提出改進措施,總結(jié)經(jīng)驗并進行效果評價。消毒供應(yīng)專業(yè)操作項目雜、設(shè)備設(shè)施多、工作量大,因此對消毒供應(yīng)中心新入科護士的培訓(xùn)是持續(xù)性的。對定期考核的成績應(yīng)及時分析原因并進行改進。
根據(jù)監(jiān)測數(shù)據(jù),采煤機過熱跳閘故障相關(guān)因素間相關(guān)系數(shù)如圖1所示??煽闯鲎冾l器跳閘狀態(tài)和變頻器設(shè)定速度與其他因素間相關(guān)系數(shù)較小,因此將這2個因素舍棄,將{滾筒溫度,滾筒電流,滾筒啟停,牽引溫度,變壓器溫度,搖臂溫度}作為過熱跳閘故障預(yù)測因素集。
1-滾筒溫度;2-滾筒電流;3-滾筒啟停;4-變頻器跳閘狀態(tài);5-牽引溫度;6-變頻器設(shè)定速度;7-變壓器溫度;8-搖臂溫度;9-過熱跳閘。
采用LSTM網(wǎng)絡(luò)對采煤機過熱跳閘故障進行預(yù)測。以故障預(yù)測因素集作為LSTM網(wǎng)絡(luò)輸入,過熱跳閘故障作為LSTM網(wǎng)絡(luò)輸出。LSTM網(wǎng)絡(luò)由遞歸神經(jīng)網(wǎng)絡(luò)發(fā)展而來,其細胞結(jié)構(gòu)如圖2所示。
圖2 LSTM網(wǎng)絡(luò)細胞結(jié)構(gòu)
細胞狀態(tài)為LSTM網(wǎng)絡(luò)的關(guān)鍵要素,是整個LSTM網(wǎng)絡(luò)的記憶空間。信息是否記憶由控制門控制,包括遺忘門、輸入門和輸出門。
遺忘門控制信息是否遺忘,即以一定的概率控制是否遺忘上一層的隱藏細胞狀態(tài)。圖2中LSTM網(wǎng)絡(luò)細胞單元輸入為上一層隱藏細胞狀態(tài)Ht-1(t為當(dāng)前細胞層數(shù))和本層時序數(shù)據(jù)Xt,通過sigmoid激活函數(shù)(σ)得到遺忘門輸出ft。ft在[0,1]之間,其代表遺忘上一層隱藏細胞狀態(tài)的概率。
輸入門負責(zé)處理本層細胞的輸入,包括2個部分:第1部分使用sigmoid激活函數(shù),輸出it;第2部分使用tanh激活函數(shù),輸出at。
本層細胞狀態(tài)Ct由2個部分組成:第1部分為上一層細胞狀態(tài)Ct-1和本層細胞遺忘門輸出ft的乘積;第2部分為本層細胞輸入門的it和at乘積。
本層隱藏細胞狀態(tài)Ht的更新由2個部分組成:第1部分為由上一層隱藏細胞狀態(tài)Ht-1和本層時序數(shù)據(jù)Xt通過sigmoid激活函數(shù)得到的Ot;第2部分由本層細胞狀態(tài)Ct通過tanh激活函數(shù)得到的nt。二者相乘得到Ht。
(2)
在實際生產(chǎn)中,遲滯性故障與其相關(guān)因素間存在時間累積效應(yīng),即相關(guān)因素經(jīng)過一段遲滯時間后才引發(fā)故障。因此故障數(shù)據(jù)與故障發(fā)生前一段時間的相關(guān)因素相關(guān)。在LSTM網(wǎng)絡(luò)訓(xùn)練階段引入遲滯時間h,將輸入的故障預(yù)測因素集通過h與輸出故障數(shù)據(jù)建立聯(lián)系,即
(3)
式(3)表明,預(yù)測階段的輸出具有時間段h的滯后性,因此確定遲滯時間段h成為研究重點。
根據(jù)采煤機過熱跳閘故障預(yù)測因素集,選取實際生產(chǎn)中的9 000組數(shù)據(jù)為訓(xùn)練集,3 000組數(shù)據(jù)為測試集,正常數(shù)據(jù)與故障數(shù)據(jù)比為10∶1。
對數(shù)據(jù)進行歸一化處理,把數(shù)據(jù)轉(zhuǎn)換至[-1,1]區(qū)間,將各數(shù)據(jù)絕對值變成相對值,其實質(zhì)是一種線性變換,不會導(dǎo)致數(shù)據(jù)失效,反而能提高數(shù)據(jù)表現(xiàn)。歸一化公式如下。
(4)
式中:x*為歸一化時序數(shù)據(jù);x為原始時序數(shù)據(jù);xmax,xmin分別為原始時序數(shù)據(jù)最大值、最小值。
部分歸一化時序數(shù)據(jù)見表3。滾筒啟停以1表示啟動,0表示停止;過熱跳閘故障以0表示正常,1表示故障。
表3 部分歸一化時序數(shù)據(jù)
設(shè)置LSTM網(wǎng)絡(luò)細胞層數(shù)為10,隱藏細胞數(shù)為10,學(xué)習(xí)率為0.001,一次讀取樣本個數(shù)為120。以均方根誤差為指標(biāo),確定遲滯時間為60 min。則不同迭代次數(shù)下LSTM網(wǎng)絡(luò)迭代損失如圖3所示。從圖3可看出,隨著迭代次數(shù)增加,LSTM網(wǎng)絡(luò)迭代損失表現(xiàn)出持續(xù)性遞減,1 500次迭代后損失減小速度較小,驗證了LSTM網(wǎng)絡(luò)在時序數(shù)據(jù)下表現(xiàn)出良好的計算性能。確定迭代次數(shù)為1 500,以遲滯時間為變量對LSTM網(wǎng)絡(luò)迭代損失進行計算,結(jié)果如圖4所示。可看出迭代損失最小時遲滯時間為30 min。
(a)迭代次數(shù)為1 000
圖4 不同遲滯時間下LSTM網(wǎng)絡(luò)迭代損失
根據(jù)上述結(jié)果確定LSTM網(wǎng)絡(luò)訓(xùn)練的迭代次數(shù)為1 500,遲滯時間為30 min,采用測試集進行故障預(yù)測,結(jié)果如圖5所示。預(yù)測值為[0,1],當(dāng)預(yù)測值有明顯上升趨勢或達0.5以上時,表明實現(xiàn)了故障預(yù)測。從圖5可看出,實際值在72 min左右達到1(發(fā)生故障),預(yù)測值從46 min開始持續(xù)上升至0.5,實現(xiàn)了故障超前26 min預(yù)測,與設(shè)定的故障遲滯時間相差4 min,驗證了模型具有良好的預(yù)測效果。
圖5 故障預(yù)測結(jié)果
(1)提出采用時序?qū)R算法對采集的煤礦工作面設(shè)備原始時序數(shù)據(jù)進行對齊及前值填充,形成了完備的基礎(chǔ)數(shù)據(jù)集。
(2)采用相關(guān)性分析驗證了故障與其影響因素間的相關(guān)性,選取了故障預(yù)測因素集。
(3)建立了工作面設(shè)備故障的LSTM網(wǎng)絡(luò)預(yù)測模型,根據(jù)工作面遲滯性故障與其相關(guān)因素間存在時間累積效應(yīng)的特點,將遲滯時間段引入預(yù)測模型,通過試驗確定了遲滯時間段,并驗證了采用時序數(shù)據(jù)進行工作面設(shè)備故障預(yù)測的有效性。