孫文潔,楊 恒,徐陳超,張恩雨
(1.中國(guó)礦業(yè)大學(xué)(北京) 國(guó)家煤礦水害防治工程技術(shù)研究中心,北京 100083;2.東華理工大學(xué) 核資源與環(huán)境國(guó)家重點(diǎn)實(shí)驗(yàn)室,江西 南昌 330013;3.華北科技學(xué)院 河北省礦井災(zāi)害防治重點(diǎn)實(shí)驗(yàn)室,北京 101601)
水害是煤礦五大自然災(zāi)害之一,目前仍是威脅我國(guó)煤礦安全生產(chǎn)的第二殺手[1-4]。因此,有效減少與防治礦井水害事故對(duì)保障礦區(qū)安全生產(chǎn)具有重要的實(shí)際意義。如何精準(zhǔn)、快速地判別礦井突水水源是礦井水害防治的前提條件和核心工作。近些年來,許多專家學(xué)者基于水化學(xué)檢測(cè)結(jié)果,運(yùn)用多種方法判別礦井突水水源[5]。琚棋定、胡友彪等學(xué)者基于主成分分析和貝葉斯判別構(gòu)建礦井突水水源判別模型,通過在潘二礦區(qū)的實(shí)際應(yīng)用,準(zhǔn)確快速地識(shí)別出潘二礦區(qū)的突水水源類型[6]。許蓬與王明運(yùn)用同位素技術(shù)成功判別出巴彥高勒礦井的突水水源,為該礦制定礦井防治水措施提供了科學(xué)依據(jù)[7]。上述模型和方法雖均具有較高的實(shí)用價(jià)值,但各種研究方法在實(shí)際應(yīng)用中都存在一定的局限性,如貝葉斯判別法的結(jié)構(gòu)受樣本限制,其假設(shè)了樣本之間相互獨(dú)立,若樣本關(guān)聯(lián),其判別結(jié)果較差;同位素判別法的經(jīng)濟(jì)成本過高。基于此,筆者采用因子分析及距離分析相結(jié)合的方法構(gòu)建礦井突水水源判別模型,以期提高判別精度。利用降維方法的因子分析可以有效地消除水樣判別指標(biāo)之間因信息互相疊加對(duì)突水水源判別的影響,能夠更加有效地表征不同含水層的水源特征[8-10]。距離分析能夠以數(shù)值的方式精確地反映出水樣判別指標(biāo)之間線性相關(guān)強(qiáng)弱程度。二者相耦合的方式能夠降低各因子之間信息交互的影響,并以數(shù)值的方式展現(xiàn)出判別結(jié)果。運(yùn)用該模型對(duì)東歡坨礦礦井突水水源進(jìn)行識(shí)別,以期為礦井突水水源快速準(zhǔn)確判別提供科學(xué)理論依據(jù)。
當(dāng)數(shù)據(jù)變量較多、維度較高時(shí),變量之間常存在一定相關(guān)性,無法準(zhǔn)確反映出樣本主要信息,且變量太多會(huì)提高分析問題的難度,而因子分析及主成分分析以最少的信息丟失為前提,運(yùn)用彼此相互獨(dú)立的幾個(gè)因子來反應(yīng)原有變量的主要信息。魯金濤和李夕兵等學(xué)者運(yùn)用主成分分析成功提取出新莊孜礦的礦井突水水源判別指標(biāo)[11];宮鳳強(qiáng)等學(xué)者運(yùn)用因子分析法有效地消除了判別指標(biāo)之間因信息相互疊加對(duì)突水水源判別的影響[12]??梢?,因子分析及主成分分析法能夠在礦井突水水源判別中發(fā)揮重要作用。
其數(shù)學(xué)模型如下:設(shè)原有n個(gè)變量xi(i=1,2,3…n),每個(gè)變量(或是經(jīng)標(biāo)準(zhǔn)化處理后)的均值為0,標(biāo)準(zhǔn)差均為1,將n個(gè)變量xi進(jìn)行坐標(biāo)轉(zhuǎn)換線性組合,得到新變量yi,其表達(dá)式如下:
y1=μ11x1+μ12x2+μ13x3+…+μ1nxn+ε1
y2=μ21x1+μ22x2+μ23x3+…+μ2nxn+ε2
y3=μ31x1+μ32x2+μ33x3+…+μ3nxn+ε3
?
yn=μn1x1+μn2x2+μn3x3+…+μnnxn+εn
式中,xi與yi為兩變量對(duì)應(yīng)的樣本值;μij為因子載荷,其含義為第i個(gè)變量在第j個(gè)因子上的負(fù)荷(j=1,2,3,…,n);ε為特殊因子,其含義為原有變量不能被因子解釋的部分。
將k個(gè)因子的累計(jì)貢獻(xiàn)率Sk定義為:
式中,Sp為第p個(gè)因子的方差貢獻(xiàn);D為總方差[9]。
當(dāng)Sk﹥0.85時(shí),確定因子數(shù)量k(k﹤n),得到新樣本yp(p=1,2,3,…,k)。
距離分析法是研究變量彼此之間關(guān)系緊密程度的數(shù)學(xué)統(tǒng)計(jì)方法,包括馬氏距離、歐氏距離、Pearson相關(guān)系數(shù)和平方歐式距離分析等。史秀志和施龍青學(xué)者分別用馬氏距離和歐式距離分析成功構(gòu)建礦井突水水源距離判別模型[13,14]。Pearson相關(guān)系數(shù)分析以數(shù)值的方式精準(zhǔn)地反映出變量之間線性關(guān)系的強(qiáng)弱程度,相關(guān)系數(shù)的取值范圍在-1~1之間。當(dāng)相關(guān)系數(shù)的絕對(duì)值大于0.8時(shí),表明兩個(gè)變量之間具有較強(qiáng)的線性關(guān)系,計(jì)算公式如下:
東歡坨礦位于華北石炭-二疊紀(jì)煤田巖溶-裂隙水害區(qū),屬華北型沉積。各含水層之間水力聯(lián)系密切,水文地質(zhì)條件復(fù)雜[15,16]。礦井內(nèi)賦存有第四系沖積層孔隙承壓含水層、石炭-二疊系砂巖裂隙承壓含水層和中奧陶系灰?guī)r巖溶裂隙承壓含水層。目前主采5、8、9、11、12-1和12-2煤層。水文地質(zhì)勘察結(jié)果表明:沖積層強(qiáng)含水層組、煤5頂板強(qiáng)含水層組及煤12-2底板強(qiáng)含水層組對(duì)煤層開采構(gòu)成水害威脅,而奧灰含水層對(duì)煤層開采影響不顯著[17,18]。該礦與山東新汶礦區(qū)地質(zhì)條件相似,施龍青等學(xué)者運(yùn)用Matlab因子分析及距離分析成功構(gòu)建新汶礦區(qū)突水水源判別模型。因此,筆者結(jié)合東歡坨礦構(gòu)建礦井突水水源判別模型。
表1 東歡坨礦訓(xùn)練樣本
表2 東歡坨礦測(cè)試樣本
2.3.1 構(gòu)建因子分析模型
將兩組訓(xùn)練樣本數(shù)據(jù)導(dǎo)入SPSS軟件,采用因子分析進(jìn)行主成分提取。兩組KMO指數(shù)(檢驗(yàn)統(tǒng)計(jì)量)分別為0.732和0.624,均滿足因子分析前提條件,即KMO≥0.60。對(duì)兩組數(shù)據(jù)進(jìn)行因子分析處理后,得到兩組水樣的解釋數(shù)據(jù),見表3和表4。
表3 Ⅰ類訓(xùn)練樣本因子特征值、方差貢獻(xiàn)率及累計(jì)貢獻(xiàn)率
表4 Ⅱ類訓(xùn)練樣本因子特征值、方差貢獻(xiàn)率及累計(jì)貢獻(xiàn)率
由表3和表4可知,前兩個(gè)主成分因子的累計(jì)貢獻(xiàn)率分別達(dá)到了92.379%和92.751%,均滿足Sk﹥0.85,確定因子個(gè)數(shù)為2,即兩個(gè)主成分因子可以對(duì)樣本進(jìn)行很好的概述。由累計(jì)方差貢獻(xiàn)率可以看出,第一個(gè)主成分因子對(duì)變量的解釋貢獻(xiàn)更高,因此,選取與第一類主成分因子有密切關(guān)系的離子成分作為判別礦井突水水源的水質(zhì)指標(biāo)。兩類訓(xùn)練樣本的六種離子在兩個(gè)因子上的旋轉(zhuǎn)載荷提取結(jié)果見表5。
表5 主因子提取結(jié)果
2.3.2 構(gòu)建距離分析模型
將兩類訓(xùn)練樣本的其他離子剔除,僅留下作為判別礦井突水水源的離子數(shù)據(jù),導(dǎo)入到SPSS中進(jìn)行距離分析,運(yùn)用Pearson系數(shù)計(jì)算各離子之間相關(guān)系數(shù)。兩類訓(xùn)練水樣離子相關(guān)系數(shù)分別見表6與表7。
表6 Ⅰ類訓(xùn)練水樣離子相關(guān)系數(shù)
表7 Ⅱ類訓(xùn)練水樣離子相關(guān)系數(shù)
將判別水樣類型與實(shí)際水樣類型比對(duì),結(jié)果如下:10組測(cè)試水樣中,僅第1、7兩組水樣判別錯(cuò)誤,第1組測(cè)試水樣為Ⅰ類水樣,第7組測(cè)試水樣為Ⅱ類水樣,其余測(cè)試水樣判別結(jié)果均正確。共對(duì)10組測(cè)試水樣判別15次,正確率為86.7%。
錢家營(yíng)礦與東歡坨礦均隸屬于開灤(集團(tuán))有限責(zé)任公司,兩礦相隔較近。錢家營(yíng)礦局部可采5號(hào)煤層,曾多次發(fā)生5煤頂板水害事故,礦井開采受5號(hào)煤層頂板水害影響嚴(yán)重[19]?,F(xiàn)根據(jù)錢家營(yíng)礦突水水源臺(tái)賬,選取10組訓(xùn)練水樣(Ⅲ)與5組測(cè)試水樣(Ⅳ),運(yùn)用因子分析及距離分析模型判別其突水水源類型,水樣數(shù)據(jù)見表10。
表8 1—10組測(cè)試水樣判別結(jié)果
表9 1、7—10測(cè)試水樣判別結(jié)果
表10 錢家營(yíng)礦水樣數(shù)據(jù)
因子分析及距離分析模型判別結(jié)果如下:表10中僅第三組測(cè)試水樣(水樣編號(hào)13)的離子相關(guān)系數(shù)小于0.8,該組水樣不是5煤頂板含水層水樣,其余均為5煤頂板含水層水樣。判別結(jié)果與實(shí)際情況一致。
由于SPSS因子分析模型需要從一定數(shù)量的水樣中篩選出一組合適的訓(xùn)練水樣,使其在因子分析中的KMO指數(shù)不小于0.6,方可進(jìn)行距離分析,因此對(duì)于水樣數(shù)據(jù)嚴(yán)重不足的礦井來說,該判別方法不一定適用,且篩選水樣過程較為繁瑣;該判別方法適用于單一突水水源判別,目前未嘗試對(duì)混合突水水源進(jìn)行判別。
1)運(yùn)用SPSS因子分析對(duì)水樣數(shù)據(jù)進(jìn)行降維,有效降低了突水水源判別指標(biāo)之間的交互影響,成功提取出水樣數(shù)據(jù)的主要信息;借助SPSS距離分析模型,成功計(jì)算出水樣離子相關(guān)系數(shù),直觀地體現(xiàn)了水化學(xué)指標(biāo)之間線性關(guān)系。
2)基于SPSS因子分析及距離分析判別模型,結(jié)合東歡坨礦含水層水樣數(shù)據(jù),成功建立東歡坨礦突水水源判別模型,判別率達(dá)86.7%,判別結(jié)果顯著,可信度高。
3)該判別方法可推廣至與東歡坨礦相鄰的錢家營(yíng)礦,成功判別其5煤頂板突水水源,判別結(jié)果準(zhǔn)確無誤。