蘇俏俏,黃平華,丁風(fēng)帆,胡永勝,郜鴻飛
(河南理工大學(xué) 資源環(huán)境學(xué)院,河南 焦作 454000)
中國是一個煤炭生產(chǎn)大國,2015年煤炭消耗量占總能源消耗量的63.7%,隨著能源的快速消耗,同時也帶來了環(huán)境污染和地下水突水事故。礦井水害已經(jīng)造成了較大的經(jīng)濟(jì)損失,并威脅到了人類生命[1],迅速、準(zhǔn)確地判定礦井突水水源對于礦區(qū)防治水工作具有重要意義。礦井突水水源判別方法是依靠相關(guān)科學(xué)技術(shù)手段對礦井突水來源進(jìn)行分析和判斷的理論方法[2]。水化學(xué)數(shù)據(jù)是地下水本質(zhì)的特征[3],由于各含水層賦存的巖石成分以及補(bǔ)徑排途徑不同,其水化學(xué)組成存在差異。因此,采用突水點(diǎn)的水化學(xué)組分來判別水源的歸屬是快速、準(zhǔn)確的。同時水化學(xué)分析水樣來源要與研究區(qū)水文地質(zhì)相互結(jié)合,提高水源識別的可靠性[4]。在國內(nèi)外學(xué)者的共同努力下,礦井突水水源判別的研究方法理論已日趨成熟。常用的主要類型有水位水溫判別法[5]、同位素法[6]、多元統(tǒng)計分析法[8-11]以及非線性分析等方法[12-14]。
近年來,我國學(xué)者也開展了各方面的研究工作。李燕等[15]運(yùn)用水化學(xué)離子成分守恒分析方法定量分析了礦井涌水的成分,從而確定了突水來源;潘國營等[16]運(yùn)用氫氧同位素對礦區(qū)突水水源進(jìn)行了有效的判別;陳陸望等[17]研究了利用微量元素結(jié)合貝葉斯判別線性模型分析臨渙礦區(qū)突水水源模式;王心義等[18-19]運(yùn)用模糊可變集理論結(jié)合不同的權(quán)重識別了礦井水源;毛志勇等[20-21]采用神經(jīng)網(wǎng)絡(luò)理論對于突水水源進(jìn)行了準(zhǔn)確識別,這些研究方法均取得了較好的成果。然而,目前的研究成果在以下幾方面還存在不足:①由于煤礦開采導(dǎo)致含水層之間水力聯(lián)系愈加緊密,不同含水層間可能會通過裂隙發(fā)生混合作用,所采取的水樣不一定能夠真實(shí)反映其所在含水層的水化學(xué)特征;②這些方法大部分未考慮水化學(xué)指標(biāo)間的信息重疊對水源判別精度的影響;③建立的水源識別模型未進(jìn)行交叉驗(yàn)證,不能充分估計已建模型在未知水樣預(yù)測時的準(zhǔn)確度。
為此,本文利用Piper三線圖方法剔除了異常水樣,選用剩余水樣作為訓(xùn)練樣本,并結(jié)合PCA法進(jìn)行主要水化學(xué)指標(biāo)數(shù)據(jù)的提取,最后通過LOOCV法選出分類性能較好的模型,建立Piper-PCA-Fisher礦井突水水源判別模型。從地下水水化學(xué)成分角度探究典型水樣的篩選,再結(jié)合多元統(tǒng)計模型進(jìn)行突水水源識別,從而考慮水化學(xué)特征對突水水源的影響,為以后礦井突水預(yù)測提供一種新思路。
焦作煤田位于太行山隆起帶與華北平原沉降帶之間的過渡地段,屬太行山東南麓山前沖、洪積緩傾斜平原,總的地勢為西北高東南低,微向東南傾斜。由于該區(qū)受北東向、北西和近東西向3組高角度斷裂的影響與控制,基巖地層被切割破碎,導(dǎo)致各含水層之間發(fā)生了一定的水力聯(lián)系。按照地層的巖性、厚度、含水空間特征及埋藏條件等,區(qū)內(nèi)可劃分4種類型的含水巖組,即第三、第四系砂礫巖孔隙含水巖組,二疊系砂巖裂隙含水巖組,石炭系薄層灰?guī)r巖溶裂隙含水巖組,奧陶系中統(tǒng)厚層灰?guī)r裂隙溶洞含水巖組。
研究從焦作礦區(qū)的井水、太行山泉水、煤礦區(qū)地下水中采集第四系地下含水層樣品12個;二疊系砂巖地下含水層樣品7個;石炭系灰?guī)r地下含水層樣品10個;奧陶系灰?guī)r地下含水層樣品12個,待判樣本11個,測試結(jié)果見表1。
表1 焦作礦區(qū)地下水水樣水化學(xué)指標(biāo)含量Tab.1 Water chemical index content of groundwater sample in Jiaozuo Mining Area mg/L
從焦作礦區(qū)的主要突水含水層采集52個水樣,除去11個待判水樣,將41個水樣經(jīng)過Piper三線圖進(jìn)行水化學(xué)分析。從圖1中可以看出,水質(zhì)類型主要呈Ca-HCO3-Mg-Na、HCO3-Ca-Mg-Na等過渡類型,少量呈HCO3-Na型和HCO3-Mg-Ca、HCO3-Ca-Mg型。因?yàn)樗畼観3、水樣Q4、水樣Q11以鈣鎂離子為主,水樣Q12呈HCO3-Na型水,與大部分水樣分布不同。所以它們不宜作為第四系水典型水樣。石炭系和奧陶系灰?guī)r水樣水質(zhì)類型主要呈HCO3-Mg-Ca型,少數(shù)呈HCO3-Na型、SO4-Na型、HCO3-Mg-Na-Ca型。由于水樣1呈現(xiàn)混合HCO3-Mg-Na-Ca型,水樣O5出現(xiàn) SO4-Na型,水樣C5、C10呈現(xiàn)HCO3-Na型。所以不宜作為灰?guī)r水典型水樣。二疊系砂巖水樣水質(zhì)類型主要呈HCO3-Na型,少量呈HCO3-Mg-Ca型。因?yàn)樗畼覥S6呈HCO3-Mg-Ca型水,與其他水樣相差較大,所以它不宜作為二疊系砂巖水典型水樣。剔除9個異常樣本后,選取了32個作為訓(xùn)練樣本。其中訓(xùn)練樣本中第四系水樣有8個,石炭系和奧陶系水樣有18個,二疊系水樣有6個。
圖1 焦作礦區(qū)水樣化學(xué)成分Piper圖Fig.1 Piper trilinear map of chemical composition of water sample in Jiaozuo Mining Area
首先對各突水水源指標(biāo)進(jìn)行主成分分析,根據(jù)變量信息貢獻(xiàn)率一般為85%以上的原則,綜合考慮判別指標(biāo)的聯(lián)系,選取前3個主成分,其累計方差貢獻(xiàn)率達(dá)90.6%,可以概括原始變量的基本信息,表征該區(qū)的水化學(xué)特征信息[14-15]。
根據(jù)PCA分析,提取出了新的判別指標(biāo)Y1、Y2、Y3,與原始指標(biāo)之間的關(guān)系表達(dá)式(公式中用Na+代替Na++K+):
(1)
然后根據(jù)表1中選取的32個樣本作為訓(xùn)練數(shù)據(jù),利用主成分分析得到的3個判別指標(biāo)。將這3個類型的第四系砂礫孔隙含水層(Ⅰ)、石炭系和奧陶系灰?guī)r含水層(Ⅱ)、二疊系砂巖含水層(Ⅲ)作為Fisher判別分析的3個正態(tài)總體,經(jīng)過計算后得到Fisher線性判別函數(shù),各判別函數(shù)表達(dá)式:
(2)
Fisher判別理論通過計算待判水樣判別函數(shù)值與3類水源組別的中心值的距離來判別該水樣屬于哪一個含水層。式(2)為典則判別函數(shù)的附加特征值,其第1類和第2類判別函數(shù)代表了樣品全部的信息。因此,所示為運(yùn)用第1和第2判別函數(shù)進(jìn)行分組的結(jié)果(圖2),據(jù)此可以清晰地看到各水樣投影點(diǎn)的位置,并根據(jù)水樣點(diǎn)距離各含水層中心點(diǎn)的平方馬氏距離進(jìn)行判別來源。第1和第2判別函數(shù)在各組別的中心值見表2。
圖2 第1和第2判別函數(shù)的分組Fig.2 Group of the first and second discriminant functions
表2 典則判別函數(shù)在各類別含水層的中心值Tab.2 Central value of criterion discriminant function in each type of aquifer
為了驗(yàn)證本文采用方法的有效性,采用將表1中的訓(xùn)練數(shù)據(jù)逐個回代到已建立的Piper-PCA-Fisher模型中,其中樣本中有4個水樣(Q2、Q6、Q7、Q8)回判錯誤,判別正確率為87.5%,與傳統(tǒng)的方法相比,利用傳統(tǒng)方法的Fisher判別模型回判錯了9個水樣,正確率為75.6%。
同時采用留一交叉驗(yàn)證法評估模型的穩(wěn)定性,在交叉驗(yàn)證中,樣本總體分類準(zhǔn)確率越高,模型的預(yù)判分類性能越好。留一交叉驗(yàn)證法對樣本總體分類的準(zhǔn)確率達(dá)到81.3%,而傳統(tǒng)模型則為61%。通過交叉驗(yàn)證、預(yù)判準(zhǔn)確率綜合比較認(rèn)為,Piper-PCA-Fisher的礦井突水水源識別模型能夠有效提升Fisher模型對突水水源的判別精度,具有更為優(yōu)越的預(yù)測性能。2種模型交叉驗(yàn)證分類結(jié)果見表3。
表3 2種模型交叉驗(yàn)證分類結(jié)果Tab.3 Cross validation classification results of two models
利用學(xué)習(xí)好的模型對焦作礦區(qū)的11個隨機(jī)選取的待判樣本(表1)進(jìn)行判別,并與傳統(tǒng)的模型進(jìn)行對比,預(yù)判結(jié)果見表4。由表4可以看出,Piper-PCA-Fisher水源識別模型判別準(zhǔn)確率達(dá)到91%。傳統(tǒng)Fisher水源識別模型的判別正確率為72.7%。水樣D1實(shí)際為第四系水,但是該模型誤判成了灰?guī)r水。原因可能是從水化學(xué)成分來看,第四系水水質(zhì)類型主要呈HCO3-Mg-Na-Ca、HCO3-Ca-Mg-Na等過渡類型;灰?guī)r水水質(zhì)類型主要呈HCO3-Mg-Ca型,少量呈HCO3-Mg-Na-Ca型,兩者水化學(xué)類型相似,影響了判別結(jié)果。從地質(zhì)因素分析來看,深部灰?guī)r含水層地下水通過斷裂構(gòu)造和第四系底部砂礫石含水層松散孔隙水和風(fēng)化裂隙水發(fā)生水力聯(lián)系,導(dǎo)致水源誤判。
表4 預(yù)測樣本的判別分類結(jié)果Tab.4 Discriminant results of testing samples
(1)采用Piper圖對各突水水源含水層水樣進(jìn)行篩選,能夠有效識別出異常水樣或發(fā)生混合的水樣。其中第四系含水層以HCO3-Mg-Na-Ca等過渡類型為主,表明第四系含水層可能發(fā)生了混合作用;灰?guī)r含水層以HCO3-Mg-Ca型為主;二疊系含水層以HCO3-Na型為主。
(2)用主成分分析對原始數(shù)據(jù)進(jìn)行特征提取,消除了判別時信息冗余造成的影響。這3個主成分為判別因子,建立了焦作礦區(qū)礦井突水水源Fisher判別模型。
(3)在礦井突水水源判別中,Piper-PCA-Fisher模型有較高的判別準(zhǔn)確率(91%),判別效果明顯優(yōu)于傳統(tǒng)Fisher判別模型(72.7%),為有效地識別礦井突水水源提供了一種新的思路。
(4)由于建立的突水水源模型是某一時間段礦區(qū)采集的水質(zhì)資料,但是考慮礦區(qū)水文地質(zhì)條件的復(fù)雜性和含水層受時間、溫度、人為等不同因素的影響,因此,要在充分分析研究區(qū)的基礎(chǔ)上廣泛收集不同時間段的數(shù)據(jù)以增強(qiáng)模型的實(shí)用性能力。