孫文潔,楊 恒,徐陳超,張恩雨
(1.中國礦業(yè)大學(xué)(北京) 國家煤礦水害防治工程技術(shù)研究中心,北京 100083;2.東華理工大學(xué) 核資源與環(huán)境國家重點實驗室,江西 南昌 330013;3.華北科技學(xué)院 河北省礦井災(zāi)害防治重點實驗室,北京 101601)
水害是煤礦五大自然災(zāi)害之一,目前仍是威脅我國煤礦安全生產(chǎn)的第二殺手[1-4]。因此,有效減少與防治礦井水害事故對保障礦區(qū)安全生產(chǎn)具有重要的實際意義。如何精準(zhǔn)、快速地判別礦井突水水源是礦井水害防治的前提條件和核心工作。近些年來,許多專家學(xué)者基于水化學(xué)檢測結(jié)果,運(yùn)用多種方法判別礦井突水水源[5]。琚棋定、胡友彪等學(xué)者基于主成分分析和貝葉斯判別構(gòu)建礦井突水水源判別模型,通過在潘二礦區(qū)的實際應(yīng)用,準(zhǔn)確快速地識別出潘二礦區(qū)的突水水源類型[6]。許蓬與王明運(yùn)用同位素技術(shù)成功判別出巴彥高勒礦井的突水水源,為該礦制定礦井防治水措施提供了科學(xué)依據(jù)[7]。上述模型和方法雖均具有較高的實用價值,但各種研究方法在實際應(yīng)用中都存在一定的局限性,如貝葉斯判別法的結(jié)構(gòu)受樣本限制,其假設(shè)了樣本之間相互獨立,若樣本關(guān)聯(lián),其判別結(jié)果較差;同位素判別法的經(jīng)濟(jì)成本過高?;诖?,筆者采用因子分析及距離分析相結(jié)合的方法構(gòu)建礦井突水水源判別模型,以期提高判別精度。利用降維方法的因子分析可以有效地消除水樣判別指標(biāo)之間因信息互相疊加對突水水源判別的影響,能夠更加有效地表征不同含水層的水源特征[8-10]。距離分析能夠以數(shù)值的方式精確地反映出水樣判別指標(biāo)之間線性相關(guān)強(qiáng)弱程度。二者相耦合的方式能夠降低各因子之間信息交互的影響,并以數(shù)值的方式展現(xiàn)出判別結(jié)果。運(yùn)用該模型對東歡坨礦礦井突水水源進(jìn)行識別,以期為礦井突水水源快速準(zhǔn)確判別提供科學(xué)理論依據(jù)。
當(dāng)數(shù)據(jù)變量較多、維度較高時,變量之間常存在一定相關(guān)性,無法準(zhǔn)確反映出樣本主要信息,且變量太多會提高分析問題的難度,而因子分析及主成分分析以最少的信息丟失為前提,運(yùn)用彼此相互獨立的幾個因子來反應(yīng)原有變量的主要信息。魯金濤和李夕兵等學(xué)者運(yùn)用主成分分析成功提取出新莊孜礦的礦井突水水源判別指標(biāo)[11];宮鳳強(qiáng)等學(xué)者運(yùn)用因子分析法有效地消除了判別指標(biāo)之間因信息相互疊加對突水水源判別的影響[12]??梢姡蜃臃治黾爸鞒煞址治龇軌蛟诘V井突水水源判別中發(fā)揮重要作用。
其數(shù)學(xué)模型如下:設(shè)原有n個變量xi(i=1,2,3…n),每個變量(或是經(jīng)標(biāo)準(zhǔn)化處理后)的均值為0,標(biāo)準(zhǔn)差均為1,將n個變量xi進(jìn)行坐標(biāo)轉(zhuǎn)換線性組合,得到新變量yi,其表達(dá)式如下:
y1=μ11x1+μ12x2+μ13x3+…+μ1nxn+ε1
y2=μ21x1+μ22x2+μ23x3+…+μ2nxn+ε2
y3=μ31x1+μ32x2+μ33x3+…+μ3nxn+ε3
?
yn=μn1x1+μn2x2+μn3x3+…+μnnxn+εn
式中,xi與yi為兩變量對應(yīng)的樣本值;μij為因子載荷,其含義為第i個變量在第j個因子上的負(fù)荷(j=1,2,3,…,n);ε為特殊因子,其含義為原有變量不能被因子解釋的部分。
將k個因子的累計貢獻(xiàn)率Sk定義為:
式中,Sp為第p個因子的方差貢獻(xiàn);D為總方差[9]。
當(dāng)Sk﹥0.85時,確定因子數(shù)量k(k﹤n),得到新樣本yp(p=1,2,3,…,k)。
距離分析法是研究變量彼此之間關(guān)系緊密程度的數(shù)學(xué)統(tǒng)計方法,包括馬氏距離、歐氏距離、Pearson相關(guān)系數(shù)和平方歐式距離分析等。史秀志和施龍青學(xué)者分別用馬氏距離和歐式距離分析成功構(gòu)建礦井突水水源距離判別模型[13,14]。Pearson相關(guān)系數(shù)分析以數(shù)值的方式精準(zhǔn)地反映出變量之間線性關(guān)系的強(qiáng)弱程度,相關(guān)系數(shù)的取值范圍在-1~1之間。當(dāng)相關(guān)系數(shù)的絕對值大于0.8時,表明兩個變量之間具有較強(qiáng)的線性關(guān)系,計算公式如下:
東歡坨礦位于華北石炭-二疊紀(jì)煤田巖溶-裂隙水害區(qū),屬華北型沉積。各含水層之間水力聯(lián)系密切,水文地質(zhì)條件復(fù)雜[15,16]。礦井內(nèi)賦存有第四系沖積層孔隙承壓含水層、石炭-二疊系砂巖裂隙承壓含水層和中奧陶系灰?guī)r巖溶裂隙承壓含水層。目前主采5、8、9、11、12-1和12-2煤層。水文地質(zhì)勘察結(jié)果表明:沖積層強(qiáng)含水層組、煤5頂板強(qiáng)含水層組及煤12-2底板強(qiáng)含水層組對煤層開采構(gòu)成水害威脅,而奧灰含水層對煤層開采影響不顯著[17,18]。該礦與山東新汶礦區(qū)地質(zhì)條件相似,施龍青等學(xué)者運(yùn)用Matlab因子分析及距離分析成功構(gòu)建新汶礦區(qū)突水水源判別模型。因此,筆者結(jié)合東歡坨礦構(gòu)建礦井突水水源判別模型。
表1 東歡坨礦訓(xùn)練樣本
表2 東歡坨礦測試樣本
2.3.1 構(gòu)建因子分析模型
將兩組訓(xùn)練樣本數(shù)據(jù)導(dǎo)入SPSS軟件,采用因子分析進(jìn)行主成分提取。兩組KMO指數(shù)(檢驗統(tǒng)計量)分別為0.732和0.624,均滿足因子分析前提條件,即KMO≥0.60。對兩組數(shù)據(jù)進(jìn)行因子分析處理后,得到兩組水樣的解釋數(shù)據(jù),見表3和表4。
表3 Ⅰ類訓(xùn)練樣本因子特征值、方差貢獻(xiàn)率及累計貢獻(xiàn)率
表4 Ⅱ類訓(xùn)練樣本因子特征值、方差貢獻(xiàn)率及累計貢獻(xiàn)率
由表3和表4可知,前兩個主成分因子的累計貢獻(xiàn)率分別達(dá)到了92.379%和92.751%,均滿足Sk﹥0.85,確定因子個數(shù)為2,即兩個主成分因子可以對樣本進(jìn)行很好的概述。由累計方差貢獻(xiàn)率可以看出,第一個主成分因子對變量的解釋貢獻(xiàn)更高,因此,選取與第一類主成分因子有密切關(guān)系的離子成分作為判別礦井突水水源的水質(zhì)指標(biāo)。兩類訓(xùn)練樣本的六種離子在兩個因子上的旋轉(zhuǎn)載荷提取結(jié)果見表5。
表5 主因子提取結(jié)果
2.3.2 構(gòu)建距離分析模型
將兩類訓(xùn)練樣本的其他離子剔除,僅留下作為判別礦井突水水源的離子數(shù)據(jù),導(dǎo)入到SPSS中進(jìn)行距離分析,運(yùn)用Pearson系數(shù)計算各離子之間相關(guān)系數(shù)。兩類訓(xùn)練水樣離子相關(guān)系數(shù)分別見表6與表7。
表6 Ⅰ類訓(xùn)練水樣離子相關(guān)系數(shù)
表7 Ⅱ類訓(xùn)練水樣離子相關(guān)系數(shù)
將判別水樣類型與實際水樣類型比對,結(jié)果如下:10組測試水樣中,僅第1、7兩組水樣判別錯誤,第1組測試水樣為Ⅰ類水樣,第7組測試水樣為Ⅱ類水樣,其余測試水樣判別結(jié)果均正確。共對10組測試水樣判別15次,正確率為86.7%。
錢家營礦與東歡坨礦均隸屬于開灤(集團(tuán))有限責(zé)任公司,兩礦相隔較近。錢家營礦局部可采5號煤層,曾多次發(fā)生5煤頂板水害事故,礦井開采受5號煤層頂板水害影響嚴(yán)重[19]?,F(xiàn)根據(jù)錢家營礦突水水源臺賬,選取10組訓(xùn)練水樣(Ⅲ)與5組測試水樣(Ⅳ),運(yùn)用因子分析及距離分析模型判別其突水水源類型,水樣數(shù)據(jù)見表10。
表8 1—10組測試水樣判別結(jié)果
表9 1、7—10測試水樣判別結(jié)果
表10 錢家營礦水樣數(shù)據(jù)
因子分析及距離分析模型判別結(jié)果如下:表10中僅第三組測試水樣(水樣編號13)的離子相關(guān)系數(shù)小于0.8,該組水樣不是5煤頂板含水層水樣,其余均為5煤頂板含水層水樣。判別結(jié)果與實際情況一致。
由于SPSS因子分析模型需要從一定數(shù)量的水樣中篩選出一組合適的訓(xùn)練水樣,使其在因子分析中的KMO指數(shù)不小于0.6,方可進(jìn)行距離分析,因此對于水樣數(shù)據(jù)嚴(yán)重不足的礦井來說,該判別方法不一定適用,且篩選水樣過程較為繁瑣;該判別方法適用于單一突水水源判別,目前未嘗試對混合突水水源進(jìn)行判別。
1)運(yùn)用SPSS因子分析對水樣數(shù)據(jù)進(jìn)行降維,有效降低了突水水源判別指標(biāo)之間的交互影響,成功提取出水樣數(shù)據(jù)的主要信息;借助SPSS距離分析模型,成功計算出水樣離子相關(guān)系數(shù),直觀地體現(xiàn)了水化學(xué)指標(biāo)之間線性關(guān)系。
2)基于SPSS因子分析及距離分析判別模型,結(jié)合東歡坨礦含水層水樣數(shù)據(jù),成功建立東歡坨礦突水水源判別模型,判別率達(dá)86.7%,判別結(jié)果顯著,可信度高。
3)該判別方法可推廣至與東歡坨礦相鄰的錢家營礦,成功判別其5煤頂板突水水源,判別結(jié)果準(zhǔn)確無誤。