袁源汪嘉文朱德昇王家臣王統(tǒng)海楊克虎
1.中國礦業(yè)大學(xué)(北京)機電與信息工程學(xué)院,北京 100083;2.中國礦業(yè)大學(xué)(北京)能源與礦業(yè)學(xué)院,北京 100083;3.山東能源臨沂礦業(yè)集團有限責(zé)任公司,山東臨沂 276022
推進煤礦智能開采是我國能源技術(shù)的發(fā)展趨勢,是信息革命的時代要求。 相比其他采煤法,放頂煤采煤法具有高產(chǎn)高效、巷道掘進率低等優(yōu)勢而被廣泛應(yīng)用。 優(yōu)化改進放煤工藝是實現(xiàn)煤礦智能開采的一個重要環(huán)節(jié)[1-2]。 傳統(tǒng)放頂煤開采過程環(huán)境感知困難,煤礦工人工作環(huán)境惡劣、粉塵多、視野窄,加之放煤工藝煩瑣,容易造成過放、欠放的現(xiàn)象,無法保證資源的回采率與煤質(zhì)的優(yōu)良率。 煤矸識別方法的引入可以讓煤礦工人更好地掌控放煤口的開關(guān)時機,為煤礦智能開采提供技術(shù)支持。
學(xué)術(shù)界對煤矸識別方法進行了大量的研究。針對放落煤和矸石的紋理形態(tài)、灰度特征,文獻[3-5]研究了基于圖像的煤矸識別方法,該方法因樣本集易受光照、粉塵干擾,識別精度受到了一定程度的影響;針對粒子波在煤層與矸石層傳播的差異性,文獻[6]研究了基于電磁波的煤矸識別方法,該方法適用于頂煤探測,由于存在波長衰減,探測范圍和煤矸識別精度被頂煤厚度所制約;針對煤與矸石所包含元素放射性強度的不同,文獻[7]研究了基于γ射線的煤矸識別方法,適用于頂煤探測,由于受到矸石占比變化的影響,回采率較低,且存在放射性危害;針對采煤機割煤時滾筒扭矩的變化,文獻[8]研究了基于扭矩信號的煤矸識別方法,該方法適用于采煤機割煤過程的煤矸識別,但識別裝置對傳感器要求較高;針對煤矸普氏系數(shù)的差異,文獻[9]研究了基于振動信號的煤矸識別方法,該方法識別效果受到了工作面復(fù)雜程度和機械振動的影響,抗干擾能力較差;針對煤和矸石放落到液壓支架尾梁和后部刮板輸送機上的聲信號物理特性差別,文獻[10-11]研究了基于聲信號的煤矸識別方法,該方法抗干擾能力較強,但是目前采集與識別系統(tǒng)尚未完善。
基于聲信號的煤矸識別方法,因其成本低、標(biāo)注便捷而廣受重視。 文獻[12]采用了獨立分量分析法對頂煤放落過程的聲信號進行分析處理,根據(jù)頻譜差異初步判斷了頂煤中的含矸率;文獻[13]考慮了環(huán)境噪聲,采用含噪的超完備獨立分量分析方法解決放頂煤過程中聲信號分離的問題;文獻[14]采用小波包變換的分析方法,發(fā)現(xiàn)頻譜會隨煤矸混合比例不同而產(chǎn)生差異;文獻[15]經(jīng)實驗分析得出煤矸聲波時域信號中的峰峰值、方差和峭度系數(shù)區(qū)分度明顯;文獻[16]通過獨立分量分析將放煤聲信號分離,并提取其梅爾倒譜系數(shù)特征作為神經(jīng)網(wǎng)絡(luò)的輸入,進行煤矸識別;文獻[17]通過希爾波特-黃變換的方法提取聲振信號特征,基于雙峰深度學(xué)習(xí)網(wǎng)絡(luò)實現(xiàn)煤矸分類。
目前,放頂煤聲信號特征提取和分類算法的研究對比較少,且大部分測試沒有現(xiàn)場數(shù)據(jù)的支持。本文完成了工作面放頂煤聲信號的采集,通過人工標(biāo)注建立放頂煤聲信號樣本庫來研究聲信號的機理,綜合分析樣本幀長、特征差異、算法性能,對機器學(xué)習(xí)分類模型進行評估。
放頂煤聲信號的特征可以用音調(diào)、響度、音色來描述。 聲信號的高低稱為音調(diào),聲信號振動的頻率越高,即聲源物體振動得越快,音調(diào)越高;聲信號的強弱稱為響度,聲信號的振幅越大,響度越大;聲信號的波形特征表現(xiàn)稱為音色,聲信號波形的各個諧波頻譜與包絡(luò)決定了音色的特性。 本文通過濾波去噪,分析振幅、相位與時間、頻率的對應(yīng)關(guān)系來提取聲信號的特征。
放頂煤聲信號的本質(zhì)為非平穩(wěn)信號[18],可使用非平穩(wěn)信號的時域分析方法進行特征提取,放頂煤聲信號的時域特征及計算公式見表1。
表1 放頂煤聲信號的時域特征及其計算公式Tab.1 Time-domain characteristics of caving coal acoustic signal and its calculation formula
表1 選取了有效值、標(biāo)準(zhǔn)差、偏度、峭度、峰峰值、波形因數(shù)、脈沖因數(shù)和峰值因數(shù)8 種特征。 其中,x(n)為放頂煤聲信號;N為序列長度;Xrms為信號的有效值;Xstd為信號的標(biāo)準(zhǔn)差;Xske為信號的偏度;Xkur為信號的峭度;Xp-p為信號的峰峰值;CF為信號的波形因數(shù);SF為信號的脈沖因數(shù);IF為信號的峰值因數(shù)。
放頂煤聲信號是數(shù)字采樣信號,可使用離散傅里葉變換(Discrete Fourier Transform, DFT)方法進行頻域特征提取。 離散傅里葉變換公式為
式中,X(k)為頻率系數(shù);WN為蝶形因子。
基于蝶形因子的周期性和對稱性,在DFT 基礎(chǔ)上改進,得到快速傅里葉變換(Fast Fourier Transform, FFT)方法,將復(fù)數(shù)乘法運算轉(zhuǎn)換為復(fù)數(shù)加法運算,大大降低了復(fù)雜程度與運算量,非常適用于計算機運算。 進一步計算得到聲信號的頻域特征及計算公式見表2。 其中,XFC為信號的重心頻率;XMSF為信號的均方頻率;XVF為信號的頻率方差。
表2 放頂煤聲信號的頻域特征及其計算公式Tab.2 Frequency-domain characteristics of caving coal acoustic signal and its calculation formula
放頂煤聲信號局部特征區(qū)別較大,可使用小波變換(Wavelet Transform, WT)[19]的方法進行時頻域特征提取。 小波變換可以完成多尺度化的時頻分析,但是其分辨率隨著頻率增加而降低,高頻處難以區(qū)分。 為對其適用性進行改進,衍生出小波包分解(Wavelet Packet Decomposition, WPD)[20]的方法,小波包分解引入了不同中心頻率的帶通濾波器,以獲得各個節(jié)點的信號分量。
各頻帶分量的能量:
式中,E(i,j)為第j層上的第i個小波包頻帶能量。
對各頻帶能量歸一化后,得到各頻帶能量占比:
執(zhí)行機器學(xué)習(xí)算法來完成對放頂煤聲信號樣本集數(shù)據(jù)的學(xué)習(xí)過程,獲得分類模型。 該模型本質(zhì)上是對聲信號數(shù)據(jù)集的劃分。
支持向量機 ( Support Vector Machine,SVM)[21]算法的目標(biāo)是找到一個最優(yōu)的分割面,使得樣本分類間隔最大。 在樣本空間中,劃分超平面為ωTx+b=0,線性支持向量機的目標(biāo)函數(shù)與約束條件為
式中,ω為超平面法向量;b為偏移項;(xi,yi)為樣本坐標(biāo)點;γ為樣本點到超平面的距離,通常取值為1。
支持向量機算法具有良好的學(xué)習(xí)能力,泛化能力強,可以將多分類問題以二分類的方法解決,但它對參數(shù)選擇要求較高。
K 近鄰算法(K-Nearest-Neighbor, KNN)[22]無須使用訓(xùn)練集進行訓(xùn)練,只需計算測試樣本到訓(xùn)練樣本的距離,選取距離測試集最近的k個訓(xùn)練樣本,通過加權(quán)投票法得到測試樣本的類別。
常用的距離衡量標(biāo)準(zhǔn)有LP 距離、歐氏距離、切比雪夫距離和曼哈頓距離。 其中歐氏距離為
式中,(xj,yj)為空間坐標(biāo)點;d為空間維數(shù)。
K 近鄰算法理解簡單、易于實現(xiàn),可用于分類、回歸問題,對異常值不敏感,但計算太復(fù)雜,屬于懶惰學(xué)習(xí),需要大量的存儲空間。
樸素貝葉斯算法(Naive Bayes Classifier,NBC)[23]是在貝葉斯定理的基礎(chǔ)上增加了條件特征獨立性假設(shè)的算法。
樸素貝葉斯的推斷標(biāo)準(zhǔn)為
式中,c為類別;M為屬性數(shù)目;xm為x在第m個屬性特征上的取值。
在實際分類問題中很難保證各項特征條件相互獨立,樸素貝葉斯模型精度受到了特征相關(guān)性的影響,但算法本身比較簡單,常用于多分類問題。
決策樹算法(Decision Tress, DT)[24]應(yīng)用了經(jīng)典的樹形結(jié)構(gòu)。 ID3(Iterative Dichotomiser 3)算法以信息增益作為特征。 C4.5 算法是ID3 的改進算法,支持對連續(xù)值輸入樣本節(jié)點的劃分,滿足對缺失值的處理要求。 CART(Classification And Regression Tree)算法為二叉樹結(jié)構(gòu)。
信息增益可表示為
式中,Ent(D)為信息熵;D為樣本集合;a為離散屬性。
有V個可能的取值,其中第v個分支節(jié)點包含了D中所有在屬性a上取值為av的樣本,記作Dv。
決策樹算法易于實現(xiàn),可在短時間內(nèi)對大量數(shù)據(jù)做出可行性較高的判斷,但解決多分類問題的效果不理想,且難以預(yù)測連續(xù)值。
隨機森林算法(Radom Forests, RF)[25]是決策樹的集合,它的核心思想是增加樹的多樣性。
RF 模型包含z輪訓(xùn)練,即z個決策樹模型,其分類序列可表示為[DT1(ζ),DT2(ζ),…,DTz(ζ)],再進行投票表決。 分類決策為
式中,M(ζ)為RF 分類模型;DTz(ζ)為單個分類模型;I為隨機變量的信息;T為輸出變量。
隨機森林算法常用于多分類任務(wù),具備較高的抗過擬合能力,對訓(xùn)練集樣本數(shù)量與特征數(shù)量有著較高要求。
神經(jīng)網(wǎng)絡(luò)算法[26],即人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)算法。 常用的模型為多層感知器(Multi-Layer Perceptron, MLP)。 神經(jīng)網(wǎng)絡(luò)算法模型的復(fù)雜程度隨著參數(shù)的增加而增加,復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)可以進一步完成更加復(fù)雜的學(xué)習(xí)任務(wù),但該算法存在訓(xùn)練效率低、易于過擬合等問題。
放頂煤聲信號樣本數(shù)據(jù)主要分為實驗?zāi)M采集數(shù)據(jù)與工作面現(xiàn)場采集數(shù)據(jù)。 實驗室未考慮綜放工作面惡劣環(huán)境與復(fù)雜工況,模擬論證階段的數(shù)據(jù)較為理想;工作面現(xiàn)場采集的數(shù)據(jù)反映了真實的放煤過程,但數(shù)據(jù)量較少,且大都是人工參與采集,采集裝置成本較高、適用性較差。 缺乏大量現(xiàn)場數(shù)據(jù)作為支撐,使得現(xiàn)有的煤矸識別方法難以投入實際生產(chǎn)中。
針對這一現(xiàn)象,本文設(shè)計了一種低成本、無須人工干預(yù)、可長時間采集、使用方便、適用性高的放頂煤液壓支架尾梁聲振數(shù)據(jù)采集裝置。 該裝置安裝于液壓支架尾梁內(nèi)側(cè),采用內(nèi)部電池供電,覆蓋防水透氣膜并置于防水外殼中,通過對比加速度傳感器信號變化,結(jié)合運動識別算法,判斷液壓支架是否為放煤狀態(tài)。 若是,則進一步采集放頂煤聲振數(shù)據(jù),并存儲于裝置中。
數(shù)據(jù)采集裝置電路結(jié)構(gòu)如圖1 所示,控制模塊選取了低功耗微控制器STM32L051 和高性能微控制器STM32F407,麥克風(fēng)為MEMS 麥克風(fēng)ICS-43432,振動傳模塊選取了MEMS 加速度計ADXL1002,存儲器容量為16 GB,采樣頻率為48 kHz,采樣深度為24 bit。
圖1 數(shù)據(jù)采集裝置電路結(jié)構(gòu)Fig.1 Circuit structure diagram of data acquisition device
本實驗數(shù)據(jù)均采集自山東能源古城煤礦3106綜放工作面現(xiàn)場,數(shù)據(jù)采集裝置實物如圖2 所示。將采集到的音頻文件進行人工標(biāo)注,劃分為不同類型的聲信號。 圖3 為放煤聲信號,圖4 為放矸聲信號。
圖2 放頂煤液壓支架尾梁聲振數(shù)據(jù)采集裝置Fig.2 Acoustic and vibration data acquisition device for tail beam of caving coal hydraulic support
圖3 不同噪聲影響下的放煤聲信號Fig.3 Coal sound signal under the influence of different noises
圖4 不同噪聲影響下的放矸聲信號Fig.4 Gangue sound signal under the influence of different noises
放頂煤聲信號樣本庫共有1 012.97 MB,總時長為5 825 s。 其中,放煤聲信號樣本共912.64 MB,總時長為5 296 s;放矸聲信號樣本共100.33 MB,總時長為529 s。
放頂煤聲信號時域特征提取,是采用了非平穩(wěn)信號時域分析的方法,獲得有效值、方差、偏度、峭度、峰峰值、波形因數(shù)、脈沖因數(shù)、峰值因數(shù)作為輸入的8 維特征向量。 頻域特征提取是通過FFT 算法對原始信號進行運算,得到重心頻率、均方頻率、頻率方差作為輸入的3 維特征向量。 時頻域特征提取是采用小波包分解的方法,設(shè)置小波基為sym8、最大分解層數(shù)為6,根據(jù)能量守恒定律計算出每個頻帶分量的能量占比,將其作為輸入的64維特征向量。 放煤聲信號和放矸聲信號的小波包分解頻帶能量占比如圖5、圖6 所示。
圖5 放煤聲信號小波包分解頻帶能量占比Fig.5 Frequency band energy ratio of wavelet packet decomposition of coal caving acoustic signal
圖6 放矸聲信號小波包分解頻帶能量占比Fig.6 Frequency band energy ratio of wavelet packet decomposition of gangue acoustic signal
本實驗環(huán)境為Windows10 系統(tǒng),CPU 為Intel Core i7-8750H 2.20 GHz,運行內(nèi)存為8 G,數(shù)據(jù)處理、模型訓(xùn)練與方法驗證均在PyCharm 上運行。
支持向量機、隨機森林、K 近鄰算法、樸素貝葉斯、決策樹和神經(jīng)網(wǎng)絡(luò)均使用預(yù)處理后的聲信號樣本進行訓(xùn)練,輸入特征分別為時域特征、頻域特征和時頻域特征。 考慮RF 模型性能與系統(tǒng)運行效率,設(shè)定隨機森林子樹數(shù)量n_estimators=100,通過oob_score 屬性打印模型的oob 分?jǐn)?shù),設(shè)定oob_score = True。 神經(jīng)網(wǎng)絡(luò)模型采用擬牛頓法優(yōu)化器,設(shè)定lbfgs= quasi-Newton,正則化參數(shù)alpha 設(shè)置為0.000 01,隱藏層參數(shù)設(shè)置為(5,5)。 其余模型參數(shù)均為默認(rèn)。
使用交叉驗證的方法對煤矸識別準(zhǔn)確率進行評估,采用k-fold 交叉驗證法,設(shè)置參數(shù)cv=10。分類模型的參數(shù)見表3。 每一種模型的識別時間均在3 ms 左右,滿足工作面的實時性要求。
表3 多種分類模型的參數(shù)Tab.3 Parameters of multiple classification models
基于放頂煤聲信號樣本集,運用不同的特征提取方法與分類算法完成模型分類應(yīng)用實驗與性能評估。
不同幀長的樣本會影響煤矸識別的準(zhǔn)確率,本文選取幀長為50 ms、100 ms、150 ms、200 ms、250 ms、300 ms 的6 種情況,幀移默認(rèn)為1/2 的幀長,針對不同特征與不同分類器進行對比實驗。
對于時域特征,SVM、MLP 的模型分類準(zhǔn)確率隨著幀長的增加而降低,如圖7 所示;RF、KNN、DT的模型分類準(zhǔn)確率隨著幀長增加而增加,在200 ms 之后趨于平緩,準(zhǔn)確率基本保持不變;NBC 的模型分類準(zhǔn)確率波動較大,在100 ms 時取得最大值。 RF、DT 模型表現(xiàn)較好,RF 模型在幀長為200 ms 時,最大值為91.60% 。
圖7 時域特征提取下不同幀長的煤矸識別準(zhǔn)確率Fig.7 Accuracy of coal gangue recognition in different frame lengths under time-domain feature extraction
對于頻域特征,RF 模型的分類準(zhǔn)確率隨著幀長的增加而緩慢增加(圖8),其余5 種算法的準(zhǔn)確率均有較大波動。 NBC 模型表現(xiàn)較差;KNN、RF、MLP 模型表現(xiàn)較好;KNN 模型在幀長為50 ms 時,煤矸分類準(zhǔn)確率為87.69% ,隨著幀長的增加準(zhǔn)確率有所下降, 在幀長為150 ms 時最大值為87.61% ,較為接近幀長50 ms 的表現(xiàn)。
圖8 頻域特征提取下不同幀長的煤矸識別準(zhǔn)確率Fig.8 Accuracy of coal gangue recognition in different frame lengths under frequency-domain feature extraction
對于時頻域特征,隨著幀長的增加,SVM 模型分類準(zhǔn)確率持續(xù)下降(圖9),其余5 種模型均有上升的趨勢。 RF、KNN、DT、MLP 模型表現(xiàn)較好;RF模型在幀長150 ms 時煤矸識別準(zhǔn)確率為93.05% ,之后增長趨于平緩,受限于樣本數(shù)量,其準(zhǔn)確率甚至有所下降,200 ms 幀長的煤矸識別準(zhǔn)確率,最大值為93.35% 。
圖9 時頻域特征提取下不同幀長的煤矸識別準(zhǔn)確率Fig.9 Accuracy of coal gangue recognition in different frame lengths under timedomain feature extraction
綜合考慮,本次實驗最佳幀長為200 ms,幀移為100 ms。 6 種機器學(xué)習(xí)算法模型中,SVM、NBC模型分類表現(xiàn)較差,之后的實驗主要是對其余4 種分類模型進行分析。
不同的特征選取會影響到煤矸識別的準(zhǔn)確率,本文研究不同特征向量對煤矸識別準(zhǔn)確率的影響。現(xiàn)采用矩形窗函數(shù)對聲信號進行分幀,設(shè)置幀長為200 ms,比較RF、KNN、DT、MLP 在不同特征選取下的分類準(zhǔn)確率(圖10)。
圖10 不同特征的煤矸識別準(zhǔn)確率Fig.10 Recognition accuracy of coal and gangue with different characteristics
RF、KNN、MLP 選取64 維時頻域特征作為輸入可獲得較高的準(zhǔn)確率, 分別為 93.06% 、90.02% 、90.92% 。 DT 選取時域特征作為輸入可獲得較高的準(zhǔn)確率,為89.08% ,但未達(dá)到90% ,不作考慮。 因此,選取時頻域特征,對聲信號樣本進行小波包分解,可提取更具備區(qū)分性的特征,有助于提升煤矸識別準(zhǔn)確率。
時頻域特征向量的維度會影響分類的準(zhǔn)確率,本文利用主成分分析( Principal Component Analysis, PCA)[27]對時頻域特征向量進行降維,將高維的特征向量映射到低維空間中,增大樣本采樣密度,降低運算耗時,減弱信息重疊現(xiàn)象對分類模型性能的影響。
本實驗設(shè)置窗函數(shù)為矩形窗,最佳幀長為200 ms,以時頻域特征作為輸入特征向量,共有64 維,對其進行主成分分析降維的結(jié)果共有64種。 輸入不同維度的特征向量,基于不同的機器學(xué)習(xí)算法進行模型訓(xùn)練,采用交叉驗證法測試煤矸分類準(zhǔn)確率。 圖11 為不同維度下多種分類模型的煤矸識別準(zhǔn)確率。 由圖11 可知,RF、KNN、DT、MLP 模型分類準(zhǔn)確率在降維的過程中均有提升,在64 維特征向量中存在較多無區(qū)分性特征,準(zhǔn)確率分別為93.06% 、90.56% 、85.87% 、91.05% 。在降維至1 維時,由于損失過多的有效特征,準(zhǔn)確率分別為54.91% 、58.36% 、54.89% 、59.00% 。 4種模型在降維過程中的煤矸分類準(zhǔn)確率最大值分別為94.51% 、90.85% 、88.27% 、91.96% ,RF 模型分類準(zhǔn)確率略高,可有效提升煤矸分類準(zhǔn)確率。 當(dāng)特征維度為20 維時,采用RF 分類模型,煤矸分類準(zhǔn)確率最高,為94.51% 。
圖11 不同維度下多種分類模型的煤矸識別準(zhǔn)確率Fig.11 Accuracy of coal and gangue recognition by various classification models in different dimensions
本文研究了放頂煤聲信號的特征提取方法,對比了主流機器學(xué)習(xí)算法的分類表現(xiàn),得出以下結(jié)論:
(1) 不同幀長的樣本選取會對煤矸分類的準(zhǔn)確率產(chǎn)生影響。 選擇幀長為200 ms、幀移為100 ms 時,基于時域特征提取與時頻域特征提取的分類準(zhǔn)確率最高,分別為91.60%與93.35%。
(2) 不同的特征選擇適用于不同的算法模型。本文的時頻域特征提取方法適用于RF、KNN 與MLP 分類器,煤矸分類準(zhǔn)確率分別為93.06% 、90.05% 、91.02% 。 相比于時域特征和頻域特征,時頻域特征能提高分類準(zhǔn)確率。
(3) 對于時頻域特征向量,降維有助于提升分類準(zhǔn)確率。 RF、KNN、DT、MLP 4 種模型的分類準(zhǔn)確率分別提升了1.45% 、0.29% 、2.40% 、0.91% ,其中RF 分類模型準(zhǔn)確率最高,為94.51% ,對應(yīng)的時頻域特征向量維度為20。
(4) RF、KNN、DT、MLP 在獲得較高分類準(zhǔn)確率的同時,模型大小分別為6.60 MB、6.98 MB、0.05 MB 和0.01 MB。 綜合考慮分類準(zhǔn)確率與模型大小,MLP 模型更具備低功耗平臺的適用性。