李 凌,胡友彪,劉 瑜,琚棋定
(1.安徽理工大學(xué)地球與環(huán)境學(xué)院,安徽 淮南 232001;2.安徽理工大學(xué)深部煤礦采動(dòng)響應(yīng)與災(zāi)害防控國家重點(diǎn)實(shí)驗(yàn)室,安徽 淮南 232001)
礦井突水是影響煤礦安全生產(chǎn)的重要因素之一,我國煤礦生產(chǎn)中突水事故頻發(fā),礦井水害的發(fā)生不僅會(huì)造成巨大的經(jīng)濟(jì)損失,而且可能會(huì)造成人員傷亡。一旦發(fā)生煤礦突水事故,及時(shí)準(zhǔn)確地判斷突水水源,查明突水原因,是治理和預(yù)防礦井水害的關(guān)鍵。根據(jù)井田內(nèi)含水層的水化學(xué)特征,可以發(fā)現(xiàn)相應(yīng)含水層的內(nèi)在聯(lián)系,因此眾多專家學(xué)者圍繞含水層水樣的水化學(xué)特征對礦井突水水源判別方面展開研究。文獻(xiàn)[5]等通過水化學(xué)特征分析與灰色關(guān)聯(lián)判別相結(jié)合的方法建立礦井突水水源識別模型,在定性和定量分析的基礎(chǔ)上判別良莊煤礦51101工作面突水水源。文獻(xiàn)[6]等通過因子分析和距離判別相結(jié)合的方法來判斷礦井突水,為礦井水害防治提供理論基礎(chǔ)。文獻(xiàn)[7]等基于水化學(xué)和矩陣方程分析,分別建立了礦井突水的模糊綜合評判方法和矩陣方程分析模型。文獻(xiàn)[8]等采用基于主成分分析建立的PCA-GRA突水水源判別模型識別不同礦井的突水水源。用水化學(xué)成分判別突水水源具有準(zhǔn)確、快速、經(jīng)濟(jì)的特點(diǎn),其他根據(jù)礦井水樣的水化學(xué)特征進(jìn)行突水水源判別的方法還有基于Logistic回歸分析方法、聚類分析法、Fisher判別法、PCA-FDA、可拓判別法、BP神經(jīng)網(wǎng)絡(luò)、同位素法等。
以往建立的單一Bayes判別函數(shù),并沒有對水化學(xué)參數(shù)進(jìn)行處理,也忽略了含水層離子之間的內(nèi)在聯(lián)系,導(dǎo)致判別效果不理想。本文以袁店一礦為例,提出了一種基于多元統(tǒng)計(jì)分析和Bayes判別法結(jié)合的礦井突水水源判別方法,先利用因子分析和系統(tǒng)聚類分析對水樣水化學(xué)數(shù)據(jù)進(jìn)行處理,再結(jié)合Bayes判別法建立礦井突水水源判別模型。通過與單一Bayes判別法相比,本文方法能夠更加有效判別礦井突水水源。
袁店一礦位于淮北煤田臨渙礦區(qū)的南部,構(gòu)造特征總體上為走向北北西,傾向北東的單斜斷塊,發(fā)育有波幅較小的次級小褶曲,走向上地層線表現(xiàn)為波浪狀。研究區(qū)所在區(qū)域的主要含水層有新生界松散層“四含”水(四含水)、二疊系砂巖裂隙水(砂巖水)、太原組灰?guī)r巖溶裂隙水(太灰水)、奧陶系灰?guī)r巖溶裂隙水(奧灰水)。
生產(chǎn)實(shí)踐證明,四含直接覆蓋在煤系地層之上,巖性泥質(zhì)含量高,滲透性差及補(bǔ)給條件較差,富水性弱,是礦井充水的主要補(bǔ)給水源之一,但一般補(bǔ)給量不大。煤系砂巖含水層富水性較弱,地下水處于封閉~半封閉環(huán)境,補(bǔ)給條件差,以靜儲量為主,且具有衰減疏干的趨勢。含水層以砂巖為主,其中主采煤層頂?shù)装迳皫r裂隙水是煤礦生產(chǎn)過程中礦井直接充水水源。太原組灰?guī)r含水層巖溶裂隙發(fā)育具有不均一性,灰?guī)r巖溶裂隙在淺部較發(fā)育,向深部逐漸減弱,是10煤安全開采的主要隱患之一。由于奧灰水遠(yuǎn)離主采煤層,一般對煤層開采無直接充水影響。
表1 袁店一礦地下水化學(xué)特征 mg·L-1
編號Na++K+Ca2+Mg2+Cl-SO2-4HCO-3類型9544.982013.081 966.755.15783.41砂巖水10786.4413.138.23565.1943.63928.94砂巖水11987.058.362.661 143.679.88651.54砂巖水12859.9012.8210.661 136.687.41411.79砂巖水13593.1419.3914.151 392.734.12340.41砂巖水14943.4416.114.151 306.237374.36砂巖水15481.227.54.74223.9925.11312.42砂巖水16387.0411.3612.24309.1781.96705.44砂巖水17414.6713.025.23408.3432.93673.01砂巖水18340.989.194.18206.1118.52537.52砂巖水191135.4420.6216.321 058.84.53468.98砂巖水20735.4921.5412.58932.1521.4455.45砂巖水21807.3923.1314.511 094.1212.88407.76砂巖水221 188.6426.5920.521 596.8217408.79砂巖水23382.7915.544.32271.2231.91376.22砂巖水24343.9213.568.71210.9525.11495.14砂巖水25308.9626.635.8386.1381.09600.39砂巖水26486.735.7715.48193.2236.65531.02砂巖水27346.6134.39.67203.8565.87509.49砂巖水28471.414.3610.16196.7625.52379.67砂巖水29343.9213.568.71310.9525.11495.14砂巖水30232.5159.0234.34230.07299.23434.17太灰水31119.4269.8410.9217.369.97466.19太灰水32134.0965.118.1935.4575.32244.07太灰水33127.4988.0853.45217.9965.44372.47太灰水34537.1262.2935.51196.47181.93437.03太灰水35267.1716.3614.51113.5258.04511.81太灰水36143.2431.3934.3544.04103.72399.64太灰水37324.39109.8483.31145.55685.31288.29太灰水
(1)因子分析
主成分分析與因子分析的基本思路是在多個(gè)原始變量中利用它們之間的內(nèi)部相關(guān)性,通過降維分析獲得新的變量(主成分變量或因子變量),達(dá)到既能減少分析指標(biāo)個(gè)數(shù),又能概括原始數(shù)據(jù)主要信息的目的。其中主成分分析是將原來多個(gè)相互聯(lián)系的變量通過線性組合方式降維壓縮成幾個(gè)少數(shù)綜合變量去包含原數(shù)據(jù)盡可能多的信息,但是得到的綜合變量往往不具有明顯的現(xiàn)實(shí)意義。因子分析在包含原數(shù)據(jù)信息量方面有優(yōu)勢,而且利用盡可能少的因子來反映樣本信息,所以通過線性組合提取的公因子比主成分分析提取的主成分更具有解釋性。因子分析是研究多個(gè)變量間的相互聯(lián)系,找出綜合所有變量主要信息的幾個(gè)綜合指標(biāo)(通常稱為因子),所有變量都可以表示成無相關(guān)性的公因子的線性組合。通過下面的數(shù)學(xué)模型來實(shí)現(xiàn)
(1)
式中:X
、X
…X
為樣本的p
個(gè)指標(biāo),F
、F
…F
,為m
個(gè)因子變量,m
<p
。矩陣形式如下=+ε
(2)
式中:=(a
)為因子載荷矩陣,a
為因子載荷,表示因子變量,ε
為特殊因子(實(shí)際分析時(shí)忽略不計(jì))。利用Matlab對上述6類離子進(jìn)行相關(guān)性分析,得出離子間的相關(guān)系數(shù)(見表2)。表2 水化學(xué)指標(biāo)相關(guān)系數(shù)矩陣
運(yùn)用Matlab軟件中的因子分析對數(shù)據(jù)進(jìn)行處理,提取初始因子得到6類離子變量的初始因子特征值和解釋后的特征值(見表3)以及PCA分析圖(見圖1)。
表3 總方差解釋
圖1 PCA分析圖
(3)
式中:X
~X
為離子濃度。表4 因子荷載矩陣
(2)因子得分系統(tǒng)聚類分析
系統(tǒng)聚類分析法的基本思想是先計(jì)算樣品之間的距離或類與類之間的距離,把相似性質(zhì)(或距離最近)的樣品劃歸為一類,再重新計(jì)算該類與當(dāng)前各類之間的距離,按照最小距離歸類,直至所有樣品歸為一類為止。由于礦井水樣的采取點(diǎn)沒有明顯的規(guī)律,用聚類分析的方法,結(jié)合統(tǒng)計(jì)水樣的相似度作為校對標(biāo)準(zhǔn),把相似度高的水樣作為一類,這樣大致可以認(rèn)為同類型水樣所在取樣點(diǎn)位置的地下水具有相似的水化學(xué)特征。由數(shù)據(jù)生成的聚類分析譜系圖可以更加清楚地看出各個(gè)水樣的相似性和特征。
圖2 系統(tǒng)聚類譜系圖
本文中利用Matlab軟件中的組間平均連接法和平方歐式距離作為度量標(biāo)準(zhǔn),以37個(gè)水樣的因子得分作為變量進(jìn)行Q型系統(tǒng)聚類,根據(jù)因子得分系統(tǒng)聚類譜系圖(見圖2),確定因子得分之間的相關(guān)性。其中各水樣因子得分通過表達(dá)式(3)計(jì)算得到(見表5)。從聚類譜系圖中根據(jù)水樣間的相關(guān)性,將錯(cuò)誤水樣2、10、34、35、36、37號剔除,從圖中也可以看出四含水、砂巖水和太灰水之間存在一定的聯(lián)系,部分水樣可以歸為一類,說明各含水層之間存在著水力聯(lián)系。
表5 因子得分
(1)Bayes判別函數(shù)模型的建立
Bayes判別法是以最大后驗(yàn)概率法和錯(cuò)分概率最小為判別規(guī)則。通過求出各含水層的Bayes判別函數(shù)來進(jìn)行水樣的類型判別。利用上述因子分析法得到的水樣主成分因子得分,再結(jié)合聚類分析法剔除6個(gè)錯(cuò)誤水樣,用剩余的31個(gè)水樣通過Matlab軟件建立三種水樣的Bayes判別函數(shù):
(4)
式中:Y
、Y
、Y
分別表示四含水、砂巖水以及太灰水的判別函數(shù);F
F
、F
表示提取能代表樣本信息的因子。根據(jù)Bayes最大后驗(yàn)概率規(guī)則,將主因子得分代入3種判別式中,得到的函數(shù)值最大的類型即為水樣所屬類型。
若不采用因子分析與聚類分析時(shí)的單一Bayes判別函數(shù)為:
(5)
式中:S
、S
、S
分別表示四含水、砂巖水以及太灰水的判別函數(shù)。(2)判別效果檢驗(yàn)
將剔除錯(cuò)誤水樣后的31組訓(xùn)練樣本因子得分回代到建立的Bayes判別函數(shù)中,按最大后驗(yàn)概率法進(jìn)行歸類(見表6)。從表中可知,運(yùn)用多元統(tǒng)計(jì)分析建立的Bayes判別函數(shù)對四含水和煤系砂巖水的識別正確率達(dá)到了100%,對太灰水樣的識別也僅出現(xiàn)了一個(gè)錯(cuò)誤,總體識別準(zhǔn)確率為96.7%;相比未經(jīng)任何處理直接建立的Bayes判別結(jié)果(見表7)顯示:1組四含水誤判為太灰水,1組砂巖水誤判為四含水,3組太灰水誤判為四含水,準(zhǔn)確率為88.6%。由此可見,本文建立的判別模型能夠更有效識別突水水源類型,且對太灰水的判別效果更好。
表6 回判結(jié)果
表7 單一Bayes判別結(jié)果
(3)判別模型的應(yīng)用與分析
運(yùn)用本文方法建立的判別模型和不作任何處理的單一Bayes判別模型,以袁店一井收集的剩余的7組水樣作為預(yù)測水樣類型進(jìn)行判別,對比結(jié)果如表8所示。由表8可知,單一Bayes判別模型對太灰水的判別出現(xiàn)一個(gè)錯(cuò)誤,證明了運(yùn)用本文方法對太灰水樣的判別效果有明顯提升。
表8 預(yù)測水樣判別對比結(jié)果 mg·L-1
(1)以淮北袁店一礦水化學(xué)資料為基礎(chǔ),運(yùn)用因子分析法與聚類分析法相結(jié)合,預(yù)先對水樣離子數(shù)據(jù)進(jìn)行綜合分析,再利用剔除錯(cuò)誤水樣后的因子得分建立Bayes判別模型,其判別準(zhǔn)確率可達(dá)96.7%。
(2)運(yùn)用兩種多元統(tǒng)計(jì)分析方法對Bayes判別模型進(jìn)行定量化處理,將水樣離子質(zhì)量濃度代入判別模型中即可準(zhǔn)確判別水樣類型。與單一Bayes判別模型相比,能有效提高結(jié)果的準(zhǔn)確性。