徐 剛,王 磊,金洪偉,劉沛東
(1.西安科技大學(xué) 安全科學(xué)與工程學(xué)院,陜西 西安710054;
2.西安科技大學(xué) 西部礦井開采及災(zāi)害防治教育部重點(diǎn)實(shí)驗(yàn)室,陜西 西安710054)
瓦斯涌出量預(yù)測(cè)是以煤層瓦斯含量、自然因素和開采技術(shù)因素為基礎(chǔ),并結(jié)合不同的方法對(duì)工作面瓦斯涌出量進(jìn)行預(yù)測(cè)。礦井瓦斯災(zāi)害不僅影響煤礦安全生產(chǎn),而且威脅井下人員生命和礦井設(shè)施安全,針對(duì)以上問題國(guó)內(nèi)外學(xué)者對(duì)瓦斯涌出量提出了不同的預(yù)測(cè)方法。中國(guó)最早在90年代提出了梯度預(yù)測(cè)法預(yù)測(cè)瓦斯涌出量;1982年鄧聚龍?zhí)岢隽嘶疑到y(tǒng)理論對(duì)礦井瓦斯涌出量預(yù)測(cè)[1];赫斯特于1965年提出R/S(Rescaled-range)分析法,該理論應(yīng)用時(shí)間序列分析法預(yù)測(cè)瓦斯涌出量[2-3];1986年Rumelhart和McCelland的科學(xué)家小組提出BP網(wǎng)絡(luò)(Back Propagation)模型,之后將BP神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于礦井瓦斯涌出預(yù)測(cè)[4];目前中國(guó)應(yīng)用最廣泛的是分源預(yù)測(cè)法,且已發(fā)展到實(shí)用化階段[5];張子戌等提出瓦斯地質(zhì)數(shù)學(xué)模型法對(duì)礦井瓦斯涌出量進(jìn)行預(yù)測(cè)[6]。這些方法有各自的特點(diǎn),但預(yù)測(cè)結(jié)果不能有效包含所有變量的信息,均是對(duì)瓦斯涌出量的影響因素進(jìn)行量化而得到的結(jié)果,并且瓦斯涌出量一直處于動(dòng)態(tài)變化過程,受諸多因素的影響,單一的瓦斯涌出量數(shù)據(jù)具有明顯的波動(dòng)性和信息不完全性[7]。
工作面瓦斯涌出量既是制定煤礦瓦斯災(zāi)害防治的重要依據(jù),也是合理進(jìn)行煤與瓦斯共采的關(guān)鍵參數(shù)[8]。由于我國(guó)煤層受多期構(gòu)造影響,煤層瓦斯賦存規(guī)律極其復(fù)雜,導(dǎo)致影響瓦斯涌出的因素較多且影響程度存在較大差異,工作面回采過程中瓦斯涌出呈現(xiàn)出顯著的不確定性、動(dòng)態(tài)性和復(fù)雜性的特征[9],影響因素和瓦斯涌出量之間沒有明確的影響關(guān)系,難以用確定的數(shù)學(xué)模型表示,給瓦斯涌出量的預(yù)測(cè)帶來(lái)了巨大的困難。因子分析法是一種信息處理方法,它既可避免信息量的重復(fù),又可避免權(quán)重確定的主觀性,能將眾多變量所載的信息濃縮并轉(zhuǎn)存到主因子上,使分析結(jié)果具有客觀性和唯一性[10];而BP神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的非線性函數(shù)逼近能力、自適應(yīng)學(xué)習(xí)能力,對(duì)不確定性問題的處理和非線性系統(tǒng)的預(yù)測(cè)有明顯的優(yōu)勢(shì)[11-13]。因此,文中將因子分析法與BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型相耦合,首先對(duì)影響工作面瓦斯涌出量的因素降維處理并歸類,然后提取出主因子,將提取出的主因子作為BP神經(jīng)網(wǎng)絡(luò)的輸入端神經(jīng)元[14],構(gòu)建出礦井回采工作面瓦斯涌出量預(yù)測(cè)模型。該耦合模型可以充分利用各自的優(yōu)勢(shì)提高預(yù)測(cè)值的可靠性,對(duì)于科學(xué)合理地制定礦井瓦斯災(zāi)害防治措施具有重要意義。
因子分析法是一種從變量群中提取共性因子的統(tǒng)計(jì)技術(shù),能對(duì)多維變量進(jìn)行簡(jiǎn)化降維和自優(yōu)化處理[15-16],能夠在眾多變量中找出隱藏的具有代表性的因子,將具有共性變量歸入一個(gè)因子,從而以較少的幾個(gè)因子反映原數(shù)據(jù)的大部分信息,從而達(dá)到合理解釋變量的相關(guān)性和篩選變量的目的[17]。
建立如下因子分析法的數(shù)學(xué)模型
設(shè)有n個(gè)關(guān)于瓦斯涌出量的變量X1,X2,…,Xn,n個(gè)瓦斯涌出量的變量是由m個(gè)因子F1,F(xiàn)2,…,F(xiàn)m和一個(gè)An×m階因子載荷矩陣的乘積加上一個(gè)特殊因子ε(ε1,ε2,…,εn)組成(n≥m)[18],建立的因子分析數(shù)學(xué)模型為:Xn=An×m Fm+εn,即式(1)。
F1,F(xiàn)2,…,F(xiàn)m為m個(gè)公共因子,公共因子之間相互獨(dú)立;矩陣An×m稱為因子載荷矩陣;anm表示第n個(gè)變量在第m個(gè)因子變量上的權(quán)重,模型中的特殊因子εn相對(duì)于式中主因子Fm影響很小,在實(shí)際研究中忽略不計(jì)。因子分析法的主要步驟如下[19]
1.1.1 原始數(shù)據(jù)標(biāo)準(zhǔn)化處理
為了消除各變量數(shù)量級(jí)的差異,使變量之間更具可比性,將數(shù)據(jù)標(biāo)準(zhǔn)化法處理,即Z-Score法,避免數(shù)量級(jí)給計(jì)算結(jié)果帶來(lái)的影響。
1.1.2 因子分析的適用性檢驗(yàn)
因子分析前首先對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后對(duì)樣本數(shù)據(jù)是否適用因子分析法進(jìn)行檢驗(yàn)。一般采用Kaiser-Meyer-Olkin檢驗(yàn)和巴特萊特(Bartlettde)球形檢驗(yàn)。適用性檢驗(yàn)的判定依據(jù)是樣本變量的KMO(Kaiser-Meyer-Olkin)度量值和顯著性概率Sig值,當(dāng)KMO值大于0.6且顯著性概率Sig值小于0.01時(shí),樣本達(dá)到了顯著性水平,樣本矩陣間有共同因素存在,適合進(jìn)行因子分析。
1.1.3 因子的載荷及累計(jì)貢獻(xiàn)率
設(shè)Q為X=(X1,X2,…,Xn)′的協(xié)方差陣,Q的全部特征根為λ1≥λ2≥…≥λm≥0,標(biāo)準(zhǔn)正交特征向量為Ui(i=1,2,…,m)[20]。
由于協(xié)方差矩陣Q為實(shí)對(duì)稱矩陣,有標(biāo)準(zhǔn)正交特征向量構(gòu)成的矩陣U=(u1,u2,…,um),使得U-1QU=Λ,也就是U′QU=Λ,故
當(dāng)特殊因子方差等于0時(shí),根據(jù)式(2)可求得載荷矩陣A,即
將載荷矩陣A的前k列向量作為因子載荷矩陣,且因子累積貢獻(xiàn)率滿足式(4)時(shí)可以確定出因子的個(gè)數(shù)。
1.1.4 公因子提取及旋轉(zhuǎn)
公因子提取選用主成分中的相關(guān)性矩陣分析法,公因子提取的目的是用提取出來(lái)的較少幾個(gè)因子解釋樣本原始變量,較少幾個(gè)因子的累積方差覆蓋了原始數(shù)據(jù)超過80%的信息,減少了樣本變量包含的重疊信息,使不同變量的因子歸屬更加清晰。
公因子旋轉(zhuǎn)選用最大方差法。具體方法是對(duì)公式(5)中的正交矩陣Γ左乘載荷矩陣A,得到的新載荷矩陣B.即
記B的第i行第j列元素為bij,則有
式中 θ為正交旋轉(zhuǎn)角度,i=(1,2,…,p);r,j=(1,2,…,n)。
當(dāng)公共因子有m(m>2)個(gè)時(shí),一般只能迭代求得正交矩陣Γ,便可得到滿足因子旋轉(zhuǎn)條件的正交矩陣Γ.
1.1.5 因子得分的計(jì)算
因子得分是由各因子方差貢獻(xiàn)百分比與各因子系數(shù)乘積的線性組合表示[21]。計(jì)算因子得分目的是減少變量的維數(shù),以便在進(jìn)一步分析中用較少的因子代替原有變量進(jìn)行數(shù)據(jù)建模,因子得分可采用下式得到
式中Fi為主因子(表3中成分i=1,2,3);Cij為因子得分系數(shù)(表5);Xi為原始變量的標(biāo)準(zhǔn)化值(FAC值)。
隨著我國(guó)煤礦開采深度的不斷增加,影響礦井瓦斯涌出量的因素越來(lái)越復(fù)雜,但其主要影響因素有自然因素和開采技術(shù)因素2部分組成。自然因素包括煤層與圍巖瓦斯含量、煤層埋深、煤層厚度、頂?shù)装鍘r性、地下水條件、工作面長(zhǎng)度、大氣壓和溫度等;開采技術(shù)因素包括采煤方法、通風(fēng)壓力、回采速度、日產(chǎn)量、工作面風(fēng)量和回采率等。
崔家溝煤礦位于陜西省焦坪礦區(qū),在回采過程中由于地質(zhì)條件復(fù)雜瓦斯涌出規(guī)律不明顯,瓦斯涌出量忽高忽低,多元線性回歸等預(yù)測(cè)方法難以有效的適用,嚴(yán)重影響煤礦的安全生產(chǎn)。因此擬采用因子分析法與BP神經(jīng)網(wǎng)絡(luò)對(duì)工作面瓦斯涌出量進(jìn)行預(yù)測(cè),提高預(yù)測(cè)的準(zhǔn)確度,以采取針對(duì)性的瓦斯治理措施。經(jīng)過對(duì)工作面瓦斯涌出量的影響因素分析,考慮到崔家溝煤礦的大氣壓力、溫度、通風(fēng)壓力、工作面風(fēng)量及工作面長(zhǎng)度等影響因素基本保持不變,對(duì)工作面瓦斯涌出量影響較小,所以這幾個(gè)因素在建模時(shí)忽略不計(jì);并且崔家溝煤礦煤層地質(zhì)條件較好,工作面是厚煤層及特厚煤層,回采率變化較穩(wěn)定,基本保持在85%左右,對(duì)瓦斯涌出量影響較小,在建模時(shí)忽略不計(jì)。最終確定出工作面的瓦斯涌出量與本煤層瓦斯含量、煤層厚度、煤層埋深、煤層傾角、日產(chǎn)量、鄰近層瓦斯含量、煤層間距、回采速度等因素相關(guān)。通過分析礦井地質(zhì)資料、礦井通風(fēng)瓦斯報(bào)表及現(xiàn)場(chǎng)實(shí)測(cè)可得各相關(guān)影響因素的數(shù)據(jù),用X1~X8分別為上述相關(guān)影響因素,X9為絕對(duì)瓦斯涌出量,可得瓦斯涌出量及其相關(guān)影響因素統(tǒng)計(jì)表(表1)。
表1 工作面瓦斯涌出量及影響因素Table 1 Gas emission in working face and its influencing factors
SPSS 20是大型一種數(shù)據(jù)處理及統(tǒng)計(jì)軟件,內(nèi)置有因子分析模塊,可以對(duì)8個(gè)影響瓦斯涌出量的因素進(jìn)行因子分析處理。因子分析前首先對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后根據(jù)因子分析法的具體步驟對(duì)樣本數(shù)據(jù)進(jìn)行分析,即可得到檢驗(yàn)值表(表2)、特征值及累積方差統(tǒng)計(jì)表(表3)、旋轉(zhuǎn)后成分統(tǒng)計(jì)表(表4)和因子得分系數(shù)統(tǒng)計(jì)表(表5)。
表2 KMO和Bartlett檢驗(yàn)值Table 2 KMO and Bartlett inspection values
由表2可知,KMO(Kaiser-Meyer-Olkin)度量值為0.631>0.6,說(shuō)明各樣本變量之間具有較強(qiáng)的相關(guān)性。樣本變量顯著性概率Sig.值為0.000<0.01,說(shuō)明樣本數(shù)量充足,且KMO值和Sig值都符合要求,說(shuō)明原始變量適合進(jìn)行因子分析并能實(shí)現(xiàn)降維簡(jiǎn)化。
表3 特征值及累積方差Table 3 Eigenvalues and cumulative variance
由表3可知,前3個(gè)主成分的特征值大于1,并保留了超過80%原始變量攜帶的信息,較好的解釋了變量之間的關(guān)系。現(xiàn)提取特征值大于1的成分作為影響因子,且前3個(gè)主成分的累計(jì)方差為81.842%>80%,而每個(gè)成分的方差所占比例為:45.206%,20.684%,15.951%,由此確定出前3個(gè)因子為所提取的3個(gè)影響因子。
表4 旋轉(zhuǎn)后成分統(tǒng)計(jì)Table 4 Post-rotation component statistics
由表4可知,通過因子旋轉(zhuǎn)使因子的歸屬更加清晰。旋轉(zhuǎn)后成分中主成分1集中體現(xiàn)了:本煤層瓦斯含量和鄰近層瓦斯含量對(duì)瓦斯涌出量的影響;將其解釋為與瓦斯含量有關(guān)的影響因子;主成分2集中體現(xiàn)了:煤層埋深、煤層傾角、煤層間距、回采速度對(duì)瓦斯涌出量的影響;主成分3集中體現(xiàn)了:煤層厚度和日產(chǎn)量對(duì)瓦斯涌出量的影響。通過因子旋轉(zhuǎn)將復(fù)雜無(wú)規(guī)律的影響因素分為3個(gè)主成分,減少了變量的維數(shù)。
表5 因子得分系數(shù)統(tǒng)計(jì)Table 5 Factor score coefficient statistics
由表5可知,經(jīng)過因子分析后重新分配了變量作用在影響因子上的權(quán)重,降低了各指標(biāo)之間的相關(guān)性,減少了相關(guān)性較差的變量對(duì)幾個(gè)因子的同時(shí)影響,為瓦斯涌出量預(yù)測(cè)模型的建立奠定了基礎(chǔ)。
由式(9)可得出因子得分式(10)。
根據(jù)經(jīng)驗(yàn)公式建立模型為3-6-1三層BP神經(jīng)網(wǎng)絡(luò)模型,其中輸入端神經(jīng)元節(jié)點(diǎn)數(shù)為3個(gè),將因子分析得出主因子F1,F(xiàn)2,F(xiàn)3作為BP神經(jīng)網(wǎng)絡(luò)模型的輸入端神經(jīng)元;隱含層節(jié)神經(jīng)元點(diǎn)數(shù)為6個(gè);輸出端神經(jīng)元節(jié)點(diǎn)數(shù)為1個(gè),即礦井瓦斯涌出量值[22]。由式(10)計(jì)算出主因子F1,F(xiàn)2,F(xiàn)3總得分作為BP神經(jīng)網(wǎng)絡(luò)模型的輸入端神經(jīng)元(表6)。
表6 瓦斯涌出量及影響因子得分Table 6 Gas emission and influencing factor score
采用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱中traingdm()函數(shù)對(duì)樣本數(shù)據(jù)進(jìn)行訓(xùn)練。其中tansig()作為隱含層神經(jīng)元的傳遞函數(shù),purelin()作為輸出端神經(jīng)元傳遞函數(shù)[23]。所訓(xùn)練時(shí)模型主要參數(shù)設(shè)定為:學(xué)習(xí)速率為0.01,訓(xùn)練誤差精度為0.000 1.將表6中X9的前14組瓦斯涌出量作為訓(xùn)練樣本,后4組瓦斯涌出量作為檢驗(yàn)樣本,用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)模型對(duì)后4組瓦斯涌出量進(jìn)行預(yù)測(cè),經(jīng)過1 500次訓(xùn)練后函數(shù)收斂,可得訓(xùn)練結(jié)果及相對(duì)誤差(表7)和神經(jīng)網(wǎng)絡(luò)最佳訓(xùn)練成績(jī)(圖1)。
圖1 神經(jīng)網(wǎng)絡(luò)最佳訓(xùn)練成績(jī)Fig.1 Best training results of neural network
根據(jù)表1原始數(shù)據(jù),用式(11)計(jì)算多元回歸方程,使用Matlab軟件得到煤層瓦斯含量與各影響因素之間的多元回歸方程
多元回歸方程的決定系數(shù)R2=SSreg/SStotal.這里R2=0.688,可知該方程擬合較好,但精度不能滿足工程要求。運(yùn)用Matlab軟件計(jì)算得到影響崔家溝煤礦2303工作面瓦斯涌出量的各因素相對(duì)誤差結(jié)果(表7)。
表7 瓦斯涌出量預(yù)測(cè)值對(duì)比及誤差分析Table 7 Comparison and error analysis of gas emission forecast values m3·min-1
由表7可知,采用多元線性回歸法預(yù)測(cè)的瓦斯涌出量平均誤差為8.98%,最大誤差達(dá)到13.4%.而因子分析法預(yù)測(cè)的瓦斯涌出量誤差均在5%以下,平均誤差為3.25%,有效地提高了預(yù)測(cè)精度;綜合對(duì)比2種方法,因子分析法對(duì)BP神經(jīng)網(wǎng)絡(luò)輸入端變量進(jìn)行了降維優(yōu)化,預(yù)測(cè)值的可靠性較強(qiáng),預(yù)測(cè)效果較好。
1)提出了一種將因子分析法與BP神經(jīng)網(wǎng)絡(luò)耦合的工作面瓦斯涌出量預(yù)測(cè)方法。經(jīng)因子分析處理后變量的維數(shù)減少,變量之間相互影響的程度降低,變量作用在影響因子上的權(quán)重重新分配,使神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的收斂速度更快,為BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)工作面瓦斯涌出量奠定了基礎(chǔ)。
2)采用因子分析法與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的瓦斯涌出量預(yù)測(cè)模型對(duì)后4組瓦斯涌出量值進(jìn)行了預(yù)測(cè)和誤差分析。結(jié)果表明瓦斯涌出量預(yù)測(cè)值與實(shí)測(cè)值的相對(duì)誤差均在5%以下,平均相對(duì)誤差為3.25%,且誤差波動(dòng)范圍??;而采用多元線性回歸法預(yù)測(cè)的瓦斯涌出量平均誤差為8.98%,最大誤差達(dá)到13.4%,誤差波動(dòng)范圍較大,穩(wěn)定性差。說(shuō)明訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)效果較好,因子分析法與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的工作面瓦斯涌出量預(yù)測(cè)方法是行之有效的。