梁 斌,劉 澤,牛延博
(1.中國礦業(yè)大學(xué) 徐海學(xué)院,江蘇 徐州 221008;2.中國礦業(yè)大學(xué) 機(jī)電工程學(xué)院,江蘇 徐州 221116)
2020年2月,國家發(fā)改委、國家能源局等8部委聯(lián)合發(fā)布了《關(guān)于加快煤礦智能化發(fā)展的指導(dǎo)意見》,該指導(dǎo)意見明確提出:到2021年,基本實現(xiàn)綜采工作面內(nèi)少人或無人操作。采煤機(jī)作為煤炭綜合機(jī)械化開采的關(guān)鍵設(shè)備,對于煤礦的安全高效生產(chǎn)具有重要意義,其智能化程度是綜采工作面實現(xiàn)“少人化”或者“無人化”的重要因素。而提高采煤機(jī)智能化的關(guān)鍵因素之一就是實現(xiàn)采煤機(jī)截割模式的精準(zhǔn)識別[1]。
目前,學(xué)者們對于采煤機(jī)截割模式識別的方法進(jìn)行了一定的研究。劉譯文等[2]利用采煤機(jī)截割前后煤壁溫度的變化,建立了基于BP神經(jīng)網(wǎng)絡(luò)的采煤機(jī)截割模式識別模型;Asfahani等[3]提出利用γ射線進(jìn)行煤巖界面的識別,從而判斷采煤機(jī)滾筒截割模式的方法。但是,由于井下環(huán)境惡劣,地質(zhì)結(jié)構(gòu)復(fù)雜,紅外溫度傳感和γ射線識別狀況不佳,于是通過采煤機(jī)自身某些狀態(tài)參數(shù)的變化間接判斷其截割模式:馬正蘭等[4]依 據(jù)采煤機(jī)的截割載荷間接識別截割阻抗,繼而判斷采煤機(jī)截割狀態(tài);陳晨[5]、張?zhí)熨n[6]、徐志鵬[7]、閆忠良[8]等利用采煤機(jī)相關(guān)電流數(shù)據(jù),結(jié)合小波分解提取特征值,分析載荷來判斷采煤機(jī)截割模式;許靜[9]、張啟志[10]、蔣干[11]等通過對采煤機(jī)的截割聲音信號和搖臂振動信號進(jìn)行處理分析來獲取采煤機(jī)對應(yīng)截割模式的特征。但是由于滾筒截齒空間分布的復(fù)雜性,使得在不同時間尺度下,搖臂振動信號的特性大相徑庭。因此,上述學(xué)者所建立的基于單尺度特征信號的采煤機(jī)截割模式判別方式存在一定的局限性。
在采煤機(jī)截割的過程中,由于地質(zhì)構(gòu)造多變及滾筒截齒分布復(fù)雜等原因,其截割部的振動信號在不同時間尺度下會表現(xiàn)出千差萬別的振動特性,且包含豐富的截割模式特征信息。因此,有必要獲取截割部振動信號的多尺度特征信息。為此,本文作者提出了一種基于多尺度模糊熵和支持向量機(jī)的采煤機(jī)截割模式識別新方法。首先,通過提取不同截割模式下?lián)u臂振動信號的多尺度模糊熵,得到表征采煤機(jī)截割模式的特征向量;然后挑選特征向量作為樣本供支持向量機(jī)學(xué)習(xí),從而確定采煤機(jī)截割模式。
模糊熵(Fuzzy Entropy,F(xiàn)E)利用模糊函數(shù)的概念,在對兩個時間序列相似程度求解的過程中引入了指數(shù)函數(shù)的特性,其中包括連續(xù)性和非突變性,保證了時間序列自身相似性最大。其定義如下[12]:
1)變換N點時間序列{u(i):1≤i≤N},構(gòu)建m維向量:
u0(i))-(u(j+k)-u0(j))|}
(3)
式中,i、j= 1,2,…,N-m,i≠j。
式中,n,r分別為模糊函數(shù)邊界的梯度和寬度。
4)定義函數(shù):
5)重復(fù)步驟1)—步驟4),構(gòu)造m+1維向量:
6)根據(jù)以上推論可定義模糊熵為:
當(dāng)N不為無窮大時,上式可以表示為:
FuzzyEn(m,n,r,N)=lnφm(n,r)-lnφm+1(n,r)
(8)
在不同的截割模式下,采煤機(jī)搖臂截割源振動信號的頻段特征和復(fù)雜性特征在不同的時間尺度下存在一定的差異性。為了提高結(jié)果的準(zhǔn)確性,可提取采煤機(jī)搖臂振動信號在不同時間尺度下的模糊熵值,即多尺度熵(Multiscale Entropy,ME),其定義如下[13]:
1)時間序列粗?;?。選取適當(dāng)?shù)膮?shù),將N點時間序列Xi={x1,x2,…,xn}拆分組合成新的向量[14]:
式中,τ=1,2,…,n為尺度因子。當(dāng)τ=1時,{y1(1),y2(1),…,yn(1)}=Xi即原始時間序列。
2)對所有的時間序列yj(τ)進(jìn)行模糊熵求解,并將其畫成相應(yīng)的尺度因子函數(shù)。
圖1 時間序列粗粒化的過程
多尺度模糊熵(Multi-scale Fuzzy Entropy,MFE)是同一時間序列在不同尺度因子下的模糊熵值,相比單一模糊熵能夠更好的反映信號的復(fù)雜程度。模糊熵值與數(shù)據(jù)長度N、相似容限r(nóng)、嵌入維數(shù)m和模糊函數(shù)梯度n都有關(guān)系。對于嵌入維數(shù)m,在序列的聯(lián)合概率進(jìn)行動態(tài)重構(gòu)時,m越大包含越多的詳細(xì)信息,但m越大需要的數(shù)據(jù)長度就越長,因此,綜合考慮,m=2;相似容限r(nóng)過大會造成部分統(tǒng)計信息丟失,而在r過小時,估計出的統(tǒng)計特性不能全面反映原始信號,且導(dǎo)致信號對噪聲較為敏感,一般r取0.1~0.25SD(SD表示為原始數(shù)據(jù)的標(biāo)準(zhǔn)差),在本文r=0.15SD;相似容限邊界的梯度取決于模糊函數(shù)梯度n,n的增大會帶來梯度的增加,但當(dāng)n過大時,將出現(xiàn)細(xì)節(jié)信息丟失的問題。因此,為了獲取盡可能多的細(xì)節(jié)信息,本文中n=2。數(shù)據(jù)長度N對計算結(jié)果的影響因子較小,對于模糊熵,若取m=2,則一般地時間序列長度100~900,因此,在計算MFE時,N≥100τ。
當(dāng)選擇尺度因子τ=15時會得到大量模式識別所需的特征向量,因此需要從m個特征向量中選取n個與該模式相關(guān)性最高的特征向量,即特征向量篩選。這樣不僅可以更好的進(jìn)行模式識別,而且還能減少運(yùn)算的時間,避免維數(shù)災(zāi)難和信息冗余。Dash等利用距離熵來對樣本數(shù)據(jù)進(jìn)行排序篩選,該方法具有較好的聚類效果,有效地去除了不相關(guān)特征向量[15,16]。拉普拉斯分值算法(Laplasian Score,LS)融合了樣本的聚類特性和方差信息,由其挑選出的特征向量達(dá)到了更好的區(qū)分效果。
1)構(gòu)建鄰接圖。設(shè)樣本數(shù)據(jù)為Xn×m,n為樣本個數(shù),m為特征維數(shù)。任取兩個樣本數(shù)據(jù)xi、xj,如果xj是xi的臨近點,則鄰接圖只有一條邊即G=1,否則,G=0。鄰接圖G可以判斷數(shù)據(jù)中各點之間的鄰近關(guān)系。
2)計算鄰接權(quán)重。當(dāng)xixj連接時,通過熱核法可以確定該邊的權(quán)重:
式中,t為常數(shù)。鄰接權(quán)重Sij表示兩個點的接近程度,Sij的大小與兩個點的距離關(guān)系成正相關(guān);當(dāng)G=0時,鄰接權(quán)重Sij=0。為了使樣本數(shù)據(jù)點之間的差異更加明顯,利用鄰接權(quán)重的方法作為懲罰因子,給距離較近的點賦予一個較大的值,同樣的,給距離較遠(yuǎn)的點賦予一個較小的值。
3)特征評價指標(biāo)。鄰接圖G中的點聚集在一定范圍內(nèi)可以使樣本數(shù)據(jù)中的點具有局部特性,可通過以下的目標(biāo)函數(shù)實現(xiàn):
式中,Var(fr)為特征方差,表示第r個特征向量在所有樣本數(shù)據(jù)中相關(guān)程度的大??;∑ij(fri-frj)2Sij表示樣本數(shù)據(jù)在第r個特征向量中的分布情況,其中fri和frj分別表示樣本數(shù)據(jù)i、j在第r個特征向量的分布情況,兩者的值差越小,表示樣本數(shù)據(jù)的距離越近。
4)標(biāo)準(zhǔn)化特征評價指標(biāo)[17]。對式(11)的fr進(jìn)行標(biāo)準(zhǔn)化求解:
則第r個特征的拉普拉斯分值為:
拉普拉斯分值的大小代表了該數(shù)據(jù)在模式識別中的作用的大小,由其作為最終的n個模式識別向量的篩選依據(jù)。
根據(jù)實際工況,本文設(shè)定的采煤機(jī)截割模式主要有空載、截割頂板、截割底板、截割F1硬度煤巖、截割F2硬度煤巖。采集不同截割模式下的數(shù)據(jù)并提取多尺度模糊熵值,針對不同截割模式設(shè)置不同的分類器進(jìn)行模式識別。多分類支持向量機(jī)結(jié)構(gòu)如圖2所示。
圖2 多分類支持向量機(jī)結(jié)構(gòu)
本文搭建了采煤機(jī)截割實驗系統(tǒng)并進(jìn)行了地面實驗來驗證前文提到的模式識別方法。實驗現(xiàn)場及設(shè)備如圖3所示。
圖3 采煤機(jī)搖臂振動信號采集系統(tǒng)
利用上述系統(tǒng)對五種不同的截割模式進(jìn)行了信號采集,分別記為Signal1(空載)、Signal2(截割頂板)、Signal3(截割底板)、Signal4(截割F1硬度煤層)、Signal5(截割F2硬度煤層)。實驗過程中采煤機(jī)以2.5m/min的速度移動,采樣頻率為15kHz,在每種截割模式下提取六十組振動信號。一部分?jǐn)?shù)據(jù)作為支持向量機(jī)的學(xué)習(xí)樣本,一部分?jǐn)?shù)據(jù)作為測試樣本。對于五種截割模式分別選擇一組振動信號并畫出其時域波形,如圖4所示。
圖4 不同截割模式下的搖臂振動信號波形
實驗中求得的5種截割模式下振動信號的多尺度模糊熵值如圖5所示??梢钥闯?,不同截割模式下振動信號的多尺度熵曲線趨勢明顯不同,利用多尺度熵值無法直接判斷采煤機(jī)的截割模式。
圖5 搖臂振動信號的多尺度熵值
為了提取包含豐富信息的特征向量,計算了不同尺度下信號模糊熵的LS分值,選取了分值較小的前5個特征向量作為樣本數(shù)據(jù),并將每種截割模式下的樣本數(shù)據(jù)隨機(jī)分為兩部分,一部分包含25組數(shù)據(jù),一部分包含35組數(shù)據(jù),分別用于訓(xùn)練和測試。支持向量機(jī)中的核函數(shù)采用徑向基核函數(shù),懲罰參數(shù)c和核函數(shù)參數(shù)g通過交叉驗證法確定,最終結(jié)果如圖6所示。
圖6 支持向量機(jī)識別結(jié)果
測試數(shù)據(jù)中五種不同截割模式的識別率情況見表1。由表1可知,采煤機(jī)截割模式數(shù)據(jù)識別總體正確率達(dá)98.86%,其中,在截割頂板模式和截割F2硬度煤層模式中分別有一個數(shù)據(jù)被識別錯誤,其他模式下所有數(shù)據(jù)都被正確識別分類。造成錯誤識別的具體原因如下:在提取數(shù)據(jù)時,采煤機(jī)正處于兩種截割模式的轉(zhuǎn)換階段,信號波動不穩(wěn)或者發(fā)生重疊,提取的特征向量偏向錯誤的截割模式,導(dǎo)致識別錯誤。
表1 不同截割模式下的測試結(jié)果統(tǒng)計
為了驗證本文所提算法的優(yōu)越性,采用BP神經(jīng)網(wǎng)絡(luò)(BP-NN)進(jìn)行對比分析。同時,隨機(jī)選擇的5個模糊熵值作為特征向量(記為random selecting feature,RSF)進(jìn)行測試。最終產(chǎn)生4種不同的截割模式識別算法,分別為SVM+LS、SVM+RSF、BP-NN+LS和BP-NN+RSF,其中BP-NN的相關(guān)參數(shù)設(shè)置如下:輸入層節(jié)點數(shù)5,輸出層節(jié)點數(shù)5,隱含層節(jié)點數(shù)為10。利用前文樣本對SVM和BP-NN進(jìn)行訓(xùn)練后,并從數(shù)據(jù)庫中隨機(jī)選擇100個樣本進(jìn)行驗證,對比結(jié)果見表2??梢钥闯觯疚乃崴惴ǖ牟擅簷C(jī)截割模式識別精度最高,達(dá)到97.00%。這是因為利用LS篩選的特征值能夠更加準(zhǔn)確地表征不同的截割模式狀態(tài),且SVM比BP-NN具有更好的泛化能力。
表2 不同算法的截割模式識別結(jié)果
為了提高采煤機(jī)的智能化水平,提出了一種基于多尺度模糊熵和支持向量機(jī)的采煤機(jī)截割模式識別方法。通過拉普拉斯分值算法提取截割振動信號的模糊熵值,并對提取的數(shù)據(jù)進(jìn)行精簡與提煉。通過搭建的煤巖截割實驗系統(tǒng),對本文所提方法的可行性和優(yōu)越性進(jìn)行了對比分析,結(jié)果表明:本文所提算法具有較高的識別精度,能夠滿足智能化采煤機(jī)的發(fā)展需求。