張兆威,滑懷田
(1.神華神東煤炭集團公司石圪臺煤礦,陜西 榆林 719000;2.山西工程技術(shù)學院,山西 陽泉 045000)
我國許多礦井的水文地質(zhì)條件復雜,隨著煤層開采深度的不斷加大,巖溶承壓水對工作面安全開采的威脅已日益凸顯[1]。因此研究多因素協(xié)同作用下工作面底板的突水規(guī)律,建立精度較高的突水危險性判別模型,對于保證工作面的安全回采具有重要的指導意義。
目前數(shù)值模擬手段和數(shù)據(jù)發(fā)掘分類技術(shù)已被廣泛應用在煤層底板突水的評價和預測研究中[2]。文章[3]運用FLAC3D數(shù)值模擬方法研究了斷層影響下底板突水通道的演化規(guī)律,文章[4]利用經(jīng)驗公式及理論計算等多種方法分析了灰?guī)r含水層對工作面底板破壞深度的影響。文章[5]以巖石的強度理論為基礎建立了精度更高的突水系數(shù)計算公式,文章[6]從煤層底板的充水通道、底板完整性等方面出發(fā),綜合運用突水系數(shù)法等多種手段對煤層帶壓開采的可行性進行了研究。文章[7]以五礦306中巷的實際地質(zhì)條件為背景,提出了巖巷掘進過斷層的安全技術(shù)措施。文中將選取18例礦井的實測數(shù)據(jù)作為學習樣本[8],首先運用主成分分析法對納入研究的6個自變量進行信息濃縮,然后計算各樣本的主成分得分值,并將其作為中間變量建立判別函數(shù),最后將主成分轉(zhuǎn)變回各原始變量,從而建立以樣本原始數(shù)據(jù)為自變量的底板突水危險性判別模型。
煤層底板突水是多因素綜合作用的結(jié)果,為了能夠較為全面地反映不同變量對底板突水的影響,在建模時往往希望納入較多的自變量,但因部分變量間可能存在著大量的信息重疊,如果直接用它們建立預測模型會由于變量間的強共線性使得模型精度降低。
Pearson相關系數(shù)是一個介于-1~1之間的值。它是在協(xié)方差的基礎上除以兩個隨機變量的標準差求得的。通過計算Pearson相關系數(shù)值的大小可以定量的反應兩變量之間的線性相關程度,當系數(shù)值為0~0.2為無關聯(lián),0.2~0.4為弱關聯(lián),0.4~0.6為中等關聯(lián),0.6~0.8為強關聯(lián),0.8~1.0為極強關聯(lián)。由表1可知含水層水壓與煤層傾角的相關系數(shù)值分別為0.612、隔水層厚度與采高的系數(shù)值為0.528,表明部分變量間的確存在強關聯(lián)性。
表1 各突水因素相關系數(shù)矩陣
主成分分析法屬于信息濃縮方法的一種,其目的是通過對原始變量進行合理的線性組合,從而減少分析的維度,避開多重變量間的共線性。
表2 各主成分解釋的總方差
在進行主成分分析時首先需要對變量X1~X6進行標準化,可記為Zx1~Zx6,從而消除各變量在數(shù)量級及量綱上對研究結(jié)果的影響。然后計算標化數(shù)據(jù)的協(xié)方差矩陣。最后求得協(xié)方差矩陣的特征值λ1≥λ2≥…≥λ6及其對應的單位特征向量。
表3 旋轉(zhuǎn)前因子載荷矩陣
圖1 碎石圖
從表3可知對于當前所提取的3個主成分很難對其代表的實際意義做出合理解釋,因此采用最大方差法對初始因子載荷矩陣進行正交旋轉(zhuǎn),見表4。在旋轉(zhuǎn)后F1~F3的方差貢獻率分別為30.075%、26.953%、26.878%,與旋轉(zhuǎn)前相比3個主成分的方差貢獻率均發(fā)生了變化,并且彼此間的差值也有所減小,但是在轉(zhuǎn)換前后3者的累計方差貢獻率并未發(fā)生變化仍為83.906%,這說明因子旋轉(zhuǎn)只是對信息量進行了重新分配。從旋轉(zhuǎn)后的因子載荷矩陣可知F1在斷層傾角及距斷層距離兩個自變量上有較大的載荷,因此說明F1主要反映的是斷層構(gòu)造對工作面底板突水的影響。雖然隔水層厚度、采高及含水層水壓、煤層傾角在F2、F3的載荷分布上各有側(cè)重但代表的實際意義依舊不是特別明確。
表4 旋轉(zhuǎn)后因子載荷矩陣
由表5可知主成分F1~F3的表達式分別為
表5 主成分得分系數(shù)矩陣
F1=0.352Zx1+0.152Zx2+0.395Zx3-0.082Zx4+0.200Zx5-0.347Zx6
(1)
F2=-0.223Zx1+0.475Zx2-0.197Zx3+0.492Zx4-0.047Zx5+0.331Zx6
(2)
F3=0.287Zx1+0.402Zx2-0.196Zx3-0.304Zx4+0.613Zx5+0.037Zx6
(3)
Fisher判別法是以方差分析原理為基礎,試圖找到一個由原始自變量組成的線性函數(shù),使得組間平方和盡可能的大,而樣本的總離差平方和盡可能的小。
2.3 ER-β 基因Alu I 多態(tài)性與促卵泡激素、黃體生成素和雌孕激素測量結(jié)果 廣西壯族絕經(jīng)婦女45~50歲5個ER-β 基因Alu I 酶切基因(AA、Aa、aa、a、A)組的血清雌二醇、孕酮水平中,AA基因組、Aa基因組、a基因組、A基因組,四組間兩兩比較,差異無顯著性(P>0.05),aa基因組與其它4組之間比較差異有顯著性(P<0.05):aa基因組的雌二醇和孕酮血液水平明顯高于其它4組(P<0.05),而aa基因組的促卵泡激素、黃體生成素明顯低于其它4組(P<0.01),見表3、表4。
y(x)=c1f1+c2f2+c3f3=CTF
(4)
式中:C=(C1,C2,C3)T,F=(f1,f2,f3)T則有
(5)
(6)
運用之前介紹的理論,將各樣本的主成分得分值作為自變量,分組變量為突水狀況,建立煤層底板突水的Fisher判別模型。
y=0.918F1+1.175F2-0.058F3+0.123
(7)
將式(1)~式(3)代入式(7)可得以樣本原始數(shù)據(jù)為自變量的判別模型
y=0.07x1+0.07x2+0.04x3+0.09x4-0.01x-3.66
(8)
對于判別分析只有當組均值不相等時,才能建立的有效的判別函數(shù),Wilks的Lamada值是在組內(nèi)平方和的基礎上除以樣本的總平方和求得的,其值越小說明組別間的均值差異越大,通過計算式(7)的Wilks的Lamada值只有0.4,因此認為G1(突水)、G2(不突水)之間的區(qū)分度非常明顯,所以在此基礎上所建立的判別函數(shù)是有統(tǒng)計學意義的。
判別得分和自變量間的相關系數(shù)被稱為模型的結(jié)構(gòu)矩陣,相關系數(shù)越大表明該自變量對于判別模型的影響越大,F(xiàn)1、F2、F3與判別得分的相關系數(shù)值分別為-0.535、0.440、0.737,所以該判別函數(shù)主要與F3有關,而通過前面的分析可知F3又主要攜帶的是含水層水壓、煤層傾角2個原始自變量的信息,這提示可能含水層水壓及煤層傾角兩個變量在判別中起到了主要的作用。事實上若只用含水層水壓及煤層傾角進行判別分析,模型的綜合正確率仍為72.2%。
表7 訓練樣本數(shù)據(jù)及Fisher模型判別結(jié)果
突水組重心處的函數(shù)值為1.263,不突水組重心處的函數(shù)值為-1.011。通過比較每個樣本點與各組重心的馬氏距離可以確定該案例的分組傾向性。最終的判別結(jié)果見表7,可見對于8例突水樣本模型成果預測出了6例,正確率為75%,對于10例不突水樣本模型成果預測出了9例正確率為90%,雖然2類樣本都存在不同程度的錯判但模型的綜合正確率已達83.3%。
為進一步檢驗模型的精度,將運用式(5)對3例待分組樣本進行判別分析,從表8可知對于3例樣本模型全部取得了與實際吻合的結(jié)果。
表8 測試樣本判別分析結(jié)果
(1)通過主成分分析法提取了F1、F2、F33個主成分,其累計方差貢獻率達到了83.707%,達到了信息濃縮的目的,并且避免了變量間的多重共線性問題。
(2)以主成分得分值為中間變量建立了煤層底板突水的Fisher判別模型,通過對18例訓練樣本進行回代判別,模型的綜合準確率為83.3%。在對3例待分組樣本的檢驗中誤判率為0,表明模型對于類似地質(zhì)條件下底板突水危險性的判別具有一定的參考價值。
(3)突水組與不突水組在含水層水壓及煤層傾角兩個變量上存在顯著差異,因此在全面收集樣本數(shù)據(jù)比較困難的情況下,可重點關注兩者的變化,并將其作為判別分析的主要指標。
(4)煤層底板突水是多因素綜合作用的結(jié)果,因此需要廣泛搜集更多具有代表性的突水數(shù)據(jù)作為訓練樣本,從而提高模型的精度和適用性。