劉 正
(國能神東煤炭集團有限責任公司 移動應用開發(fā)項目部,陜西 榆林 719315)
煤礦生產過程中,綜采工作面的推進距離是計算礦井產量以及確定工作面開采位置的基礎參數,也是分析和研究工作面回采過程中礦壓顯現、瓦斯運移以及涌水規(guī)律的重要依據,綜采工作面的推進距離包括機頭、中部和機尾推進距離。目前,綜采工作面推進距離的計算主要采用以下方法:在工作面形成后,在兩側平巷內間隔一段距離作標記,或者直接在巷幫煤壁上標示距離,以此來計算工作面的推進距離;采用采煤機割煤的累計刀數與滾筒截深的乘積來計算。神東綜采工作面推進距離采用人工上報的方式,每天上報當日零點班、早班和昨日4點班推進刀數進尺,進行生產外運完成情況的公司級匯總和通報,每月底由地測公司提供具體準確的推進進尺數據。
然而,現有的綜采工作面推進距離的計算方法都存在測量誤差大,無法準確地自動計算出工作面推進距離的問題。目前,隨著神東生產數據管理平臺的搭建,綜采工作面已經實現大量生產數據的采集,但是公司目前沒有利用這些數據進行自動計算分析,一方面造成了數據資源的浪費,另一方面人工上報涉及到的人員也多,造成不必要的人力資源浪費。隨著智能礦山建設的腳步加快,亟需通過利用已采集的生產數據實現推進進尺數據的自動記錄和管理,減少人工干預,實現降本增效。本文利用支架自帶的推移油缸行程數據進行數據處理和提取,完成了整個綜采工作面的推進距離計算。
現代化綜采工作面裝備的液壓支架系統都集成了多種傳感器,如支架雙立柱壓力傳感器、采高傳感器、傾角傳感器和推移行程傳感器等,這些數據通過支架電液控系統集中采集和上傳。對以上這些數據的利用多停留在實時監(jiān)測,并沒有深入地進行數據分析和挖掘,如對支架推移油缸行程數據的分析處理。
支架本身推移油缸行程數據是典型的時序數據,如何對該種數據進行有效處理和分析,把握數據本來面目,去偽存真,計算出累計推進距離,成為本算法的關鍵。
煤礦綜采工作面支架電液控制系統廠家主要有瑪柯、天瑪及EEP等。無論哪個廠家都能采集到支架推移油缸傳感器的實時數據,采集的數據都能滿足秒級響應。一臺支架推移油缸傳感器1 h采集的實時壓力數據量為3 600條,一個班按8 h計算產生28 800條數據。因此,支架推移油缸傳感器數據處理,屬于海量的時序數據處理。如何在海量數據里分析提取出期望的數據推進距離,成為擺在我們面前的一個課題。
通過單個傳感器歷史曲線提取和展示,觀察和分析推移行程曲線的特征:①首先其具有波形特征,且每個波形對應的是推移油缸伸縮動作;②波形下坡段為推移油缸在收縮,對應現場業(yè)務通常是在拉架;③波形上坡段為推移油缸在拉伸,對應現場業(yè)務通常是在推溜;④具有很長一段時間的穩(wěn)定期,傳感器數據在小幅度波動。
通過以上數據結構分析,掌握了數據的特點,就可以制定出整體的推進度計算方案,有針對性的對數據進行預處理,做到無用數據剔除,只保留“骨干”數據,環(huán)環(huán)相扣,最后再在此基礎上完成關鍵數據提取或計算。
整體計算方案:①依靠波形上坡段,計算累計推溜距離/推進距離;②依靠波形下坡段,計算累計拉架距離;③對波形穩(wěn)定期波形,只保留“骨干”,能剔除則剔除;④理論上一段時間范圍(如煤機割一刀煤時間段)內,累計推進距離和累計拉架距離基本相等,且隨著時間累積,這2個值無特殊原因,只能是愈來愈相等。
數據預處理分2步走:第1步,海量時序數據的“變化存儲”。具體講就是要先經專業(yè)采集軟件進行變化存儲,所謂的“變化存儲”就是數據有變化才采集和存儲,采用的是一種“旋轉門壓縮”算法,使得數據經過初步的壓縮處理。數據壓縮倍數為3 600條/42條,壓縮量近百倍。通過數據預處理,數據從源頭上成百倍被壓縮掉,但是基本的波形特征、骨干信息和數據細節(jié)都被保留了下來。第2步,數據質量篩選和閾值處理。經過專業(yè)采集軟件預處理后的數據量依然很龐大,因為其中還夾雜了不少數據質量戳為0的“BAD”數據,有必要進一步剔除這些干擾數據。另外,在對單臺液壓支架推移油缸行程數據的數據結構進行分析時發(fā)現,這些歷史數據中還有很多數據可以過濾掉,如波形穩(wěn)定期數據可以通過設置閾值進行處理。通過閾值的合理選取,巧妙地借助閾值,不僅可以過濾掉波形穩(wěn)定期大量無用數據,還可以克服支架推移油缸傳感器數據“抖動”問題,即數據小幅度波動的影響因素。閾值處理方法如圖1所示。
圖1 程序流程圖Fig.1 Program flow chart
經過上述的處理算法后,原始歷史數據數組A中非關鍵數據及干擾數據被過濾處理掉,只保留下骨干數組B,同時超過閾值Threshold的推移行程變化量Δ=(A[i]-A[i-1])被累計計算,當Δ>0時累加計算推溜距離,當Δ<0時累加計算拉架距離。
閾值Threshold對于不同的綜采工作面是不同的,一般為20 mm左右,最大不超過50 mm。其值的大小取決于地質條件(如遇到底板起伏不平或者軟底板,推移傳感器會出現小幅波動)及人員操作習慣。一個合理的閾值會屏蔽以上因素,擺除不必要的誤差影響,使得計算精度更加精準。
在一段時間內,計算出的累計推溜距離和累計拉架距離之和理論上為0,受到這段時間范圍開始時間邊界和結束時間邊界影響,2個累加值之和會出現不為0情況,屬于正常情況,該值一般不超過2個推移行程和。因此,可以單取累計推溜距離或累計拉架距離為推進距離,也可取上面2個計算結果的平均值為推進距離,就得到了單臺支架該段時間計算出的推進距離。
以上給出了某個時間范圍內的基于單臺支架推移行程傳感器的推進距離計算方法,這個時間范圍可以是2 h、8 h或24 h等等,時間范圍不能跨度太大,跨度越大,數據量越多,計算機處理的負荷有限。因此,當需要得到幾天、幾周、幾月或整個綜采工作面推采期間的累加推進距離時,就涉及到了連續(xù)時間段推進距離計算。
連續(xù)時間段推進距離計算是為了進行推進距離累加計算,得到更長時間范圍內的計算結果。當根據1.3中計算規(guī)則,分別計算出相鄰連續(xù)的2個時間段T1、T2的推進距離L1、L2進行累加時,發(fā)現跟用整個連續(xù)的一個時間段T=T1+T2計算的推進距離L會有出入,即L不一定等于L1+L2。究其原因時間分成兩段引起的。在進行整個時間段T推進距離計算時,T1時間段最后一個有效采集數據和T2時間段第1個有效采集數據有可能滿足閾值Threshold,而這時的推移行程變化量Δ=(A[i]-A[i-1])未被累計計算。綜合如上分析,對1.3中數據進行處理和計算前,只需將上個時間段的最后一個有效采集數據引入參與計算即可。
基于1.3中具體算法,可以得到一段時間內一臺、多臺或者整個綜采工作面支架推移行程傳感器數據處理后的推進距離數據。
整個綜采工作面的推進距離描述方案有很多,可按位置可分為機頭、中部、機尾推進距離,以上某一區(qū)域也可以選擇一臺或者多臺支架的推進距離數據進行計算。
多臺支架推進距離數據處理時,首先要剔除異常數據。異常數據產生的原因有支架傳感器故障或者異常、數據中斷等等,這些因素會導致數據明顯缺少,數值比較小,例如,有些支架計算出的推進距離數據直接為0。其次,采用數理統計分析方法,發(fā)現其中的數據分布規(guī)律,進行推進距離的數理統計分析。
傳感器比較可靠穩(wěn)定時,選擇單臺傳感器計算結果即可。多臺傳感器比較可靠穩(wěn)定時,選擇多臺傳感器計算結果的平均值即可。多數情況下借助數理統計分析,給出整個時間范圍內的整個工作面全部推移行程傳感器分析數據的統計學結果比較可靠。
介紹如下:某綜采工作面支架推移傳感器總數為176臺,采用的最大推移行程為1 000 mm。在時間段[startTime,endTime]內分別計算出的推進距離數據為{l1,l2,...ln-1,ln,…,l176},則每隔50 mm統計li數據出現的頻率Pi,劃分的組距數為lmax/50+1,以組距為x軸,頻率為y軸作頻率分布直方圖,然后取出現頻率最大數值對應支架數據或這一數組對應支架組數據的平均值作為推進距離,支架推進距離數據的頻率如圖2所示。
圖2 支架推進距離數據的頻率直方圖Fig.2 Frequency histogram of support advancing distance data
采用計算機編程的方式實現,然后對采集到的數據進行實時或者歷史計算,使得每個綜采工作面全部支架推移傳感器推進距離數據在線實時或者歷史自動提取。但是需要指出,算法的具體實現與所用編程語言無關。
該算法是依靠煤礦綜采工作面支架推移行程傳感器數據進行推進距離計算的核心方法。該方法突破依靠信號處理手段簡單的當作波形來檢測突變點或者斷點這種不科學處理手段,完全結合現場業(yè)務邏輯依靠支架推移油缸動作特點以及推移行程傳感器采集數據的特點,采用閾值處理方法進行推進距離數據提取,形成基于推移油缸行程數據計算整個綜采工作面推進距離的一套完整算法體系及處理流程。
神東礦區(qū)13礦14井30多個綜采工作面支架推移行程傳感器數據涉及到瑪柯、天瑪及EEP多個廠家電液控制系統,實時礦壓秒級響應。該算法體系成功應用于神東所有礦全部在采綜采面推進距離計算和展示,兩年多來,數據準確率在98%以上。
通過專業(yè)的采集軟件可以將數據采集上來。首先要將數據進行初步的過濾處理,篩選出質量戳好的數據,過濾掉異常數據。然后針對支架屬于井下大件設備,支架推移油缸大多數生產時進行調整動作,檢修時可以有個別油缸動作,而且具體油缸動作幅度也受限,不存在大量的無效動作支架推移油缸的情形。針對以上數據本身特點,先后采用10 s采集和變化采集的手段,2種方法均可以極大地控制采集到的數據量,而后者更優(yōu),壓縮倍率更高還不丟失數據細節(jié),壓縮率接近百倍。
對支架推移油缸傳感器歷史數據觀察和研究發(fā)現,數據里存在一些質量戳為“BAD”的數據,這些“BAD”數據剔除后不會影響到“骨干”數據存在,這些數據首先要被過濾掉。還有該類數據穩(wěn)定時有小幅度波動的情況,具體分析就是會受到煤礦綜采面底板等因素影響。然后選擇合理的閾值Threshold就可以擺除這些數據的影響,減小計算誤差。
閾值Threshold從最初的0,再到10,最后到20 mm,計算結果的準確性從80%提高至98%以上。誤差控制在2%以內,這是不可避免的,有地質影響,也有其他因素影響。
先期選擇每天的數據進行處理,最后時間段縮小為8 h,再到這個時間間隔參數Interval可以按小時自由設置,可以設置成2 h處理一次,支架推移距離基本上屬于“實時”推送。最后對比不同時間間隔下數據計算的誤差,找到原因后,對權力保護1.3做升級處理。最終消除時間碎片的計算誤差影響。提取到的數據如圖3所示。
圖3 基于支架推移行程的推進度計算數據Fig.3 Calculation data of the propulsion degree based on the pushing stroke of the support
根據圖3中哈拉溝22521綜采面提取的各支架推移數據記錄,進行整個綜采工作面支架推進距離數據的統計學分析。如圖4、5所示。
圖4展示數據為剔除了異常數據的面積圖,對應的面積即為哈拉溝煤礦22521綜采工作面某天時間內推過的煤層面積。圖4數據剔除了10個為0 mm的數據,3個低于3 000 mm的數據,還有2個超過9 000 mm的數據。最后有效數據量為115個。觀察可以發(fā)現,數據集中范圍為[6 000,8 000 mm]之間。對以上保留以后的數據再做加權平均值可以得到整個綜采工作面這天內推進的平均距離為6 920 mm,即6.9 m。也可以對上述數據繪制散點圖進行曲線擬合,效果r如圖5所示。還可以對上述數據進行頻率/組距分析,然后選擇出現頻率最大的組距內數據進行加權平均計算??傊?,在進行整個綜采工作面的數據處理時,首先要剔除異常值的干擾,然后在眾多的數據中進行如上數理統計分析,最后得到所要的數據結論,同時整體驗證了該數據處理算法的精確性和科學性。
圖4 基于支架推移行程傳感器計算工作面推進距離Fig.4 Calculation of working face advancing distance based on the bracket advancing stroke sensor
圖5 支架推進距離數據散點圖Fig.5 Scatter plot of support advancing distance data
(1)在深度分析現場業(yè)務及數據特點的基礎上,根據閾值處理方法進行數據過濾和壓縮,極大地降低了數據量;提供一種煤礦綜采面推移數據處理的全新方法,改變了以往只是依靠信號處理手段尋找間斷點的不科學方法。
(2)結合支架推移油缸動作特點以及推移行程傳感器采集數據的特點,采用閾值處理方法進行推進距離數據提取,保留關鍵數據特征。
(3)提供一種處理時序數據的方法,將數據動態(tài)地看待和處理;依托神東生產數據倉庫,給出一種具體詳細的支架推移油缸行程數據處理及推進距離提取算法;對支架推移傳感器采集的這種海量時序數據給出了具體的處理步驟及思路。
(4)通過對數據處理過程具體詳細描述以及核心算法研究,不僅給出某段時間某個支架推移行程傳感器數據的具體處理方法,還給出支架推移行程傳感器數據進行連續(xù)處理以及多傳感器數據的統計學處理手段,解決了煤礦綜采工作面液壓支架推移油缸行程數據處理技術和整個綜采工作面推進距離自動提取方法難題,形成一套計算支架推進距離的完整算法及處理體系。