劉杰剛 徐新啟 時艷茹 虞青松 李 磊
(1.中國礦業(yè)大學資源與地球科學學院,江蘇省徐州市,221116;2.煤層氣資源與成藏過程教育部重點實驗室,江蘇省徐州市,221116;3.淄博礦業(yè)集團有限責任公司,山東省淄博市,257000)
多元統(tǒng)計分析模型在礦井突水水源判別中的應(yīng)用*
劉杰剛1,2徐新啟3時艷茹1虞青松1,2李 磊1,2
(1.中國礦業(yè)大學資源與地球科學學院,江蘇省徐州市,221116;2.煤層氣資源與成藏過程教育部重點實驗室,江蘇省徐州市,221116;3.淄博礦業(yè)集團有限責任公司,山東省淄博市,257000)
綜合運用分層聚類、逐步判別分析方法的計算原理,依據(jù)岱莊煤礦出水點及含水層水樣的水質(zhì)分析資料,建立多元統(tǒng)計分析模型,進行水質(zhì)相似度分析和主要出水水源判別。研究表明分層聚類方法能夠定量、直觀地反映各水源之間水質(zhì)的親疏關(guān)系;逐步判別分析法可以有效地判別突水點的類型歸屬,二者互為補充和驗證。
多元統(tǒng)計 分層聚類 逐步判別 出水水源 岱莊煤礦
礦井水害事故多發(fā)且容易造成嚴重的損失,一旦發(fā)生礦井突水,首先應(yīng)該判斷突水水源,為治理和進一步預(yù)防水害事故提供依據(jù)。礦井突水水源判別方法較多,其中水化學分析方法是一種快速、準確、經(jīng)濟的水源判別方法,應(yīng)用多元統(tǒng)計的水化學分析在實踐中取得了大量的成果。本文應(yīng)用多元統(tǒng)計分析模型 (分層聚類和逐步判別分析)對淄博礦業(yè)集團岱莊煤礦下組煤首采工作面出水水源水質(zhì)進行了分析與判別,從而研究多元統(tǒng)計水化學判斷方法的適用性。
淄博礦業(yè)集團岱莊煤礦下組煤首采工作面出水,隨后鉆進的水文探查孔顯示出水量隨鉆進深度增加而變大,最大達到105.3 m3/h。造成下組煤開采突水的水源可能有16#煤層的直接頂板十下灰?guī)r溶裂隙水、底板十三灰?guī)r溶裂隙水和奧陶系灰?guī)r巖溶水。針對不同含水層的防治方法不同,需要查明出水水源,從而進一步提出治理方案。
工作面出水后,岱莊礦先后在出水巷道掘進面取了5次水樣進行水質(zhì)化驗分析,又收集、整理了該礦十下灰水樣 (6個)、十三灰水樣 (15個)和奧灰水樣 (10個)的相關(guān)水質(zhì)分析資料,見表1,以此為基礎(chǔ)進行多元統(tǒng)計分析。
表1 含水層及出水點水質(zhì)分析成果表 (6大常規(guī)離子) mg·L-1
多元統(tǒng)計分析主要包括回歸分析、聚類分析、判別分析、因子分析等方法。本文選取礦井突水水源判別中廣泛運用的分層聚類和逐步判別分析建立多元統(tǒng)計分析模型,見圖1。
首先通過分層聚類方法計算各含水層及出水點水質(zhì)之間的相似性程度并繪制譜系圖,從而反應(yīng)各類別之間水質(zhì)的親疏關(guān)系,判別各含水層以及出水點間的水力聯(lián)系;然后采用逐步判別分析方法,通過對不同含水層水質(zhì)特征組分含量的分析,建立不同水源的判別函數(shù),再利用判別函數(shù)對待定水源進行識別,進而判斷出水點所屬的含水層。
圖1 多元統(tǒng)計分析模型示意圖
分層聚類分析方法首先將樣品或指標各視為空間中的一類,根據(jù)類與類之間的空間距離或相似程度將最相似的類合并為一類,然后再計算新類與其他類之間的相似程度,選擇最相似的類進行合并,如此每合并一次就減少一類,不斷進行這一過程,直到將所有樣品或指標合并為一類為止。本文以不同水源以及出水點為變量,通過它們的屬性 (水質(zhì))比較,進行水源的分類,屬于Q型聚類分析。
2.1.1 分析過程
設(shè)選取n個水質(zhì)樣本,其中每個樣本又包含m個水質(zhì)指標,則原始數(shù)據(jù)矩陣為:
式中:i——某個水質(zhì)樣本,1≤i≤n;
j——某種水質(zhì)指標,1≤j≤m;
xij——第i個樣本的第j種指標含量。
(1)原始數(shù)據(jù)的標準化處理。由于各水質(zhì)指標數(shù)量級不同,需要對原始數(shù)據(jù)進行標準化處理,使變量處于相同的量級。文中通過極差變化,將矩陣中的每一列都轉(zhuǎn)化成0到1間的值,標準化后的水質(zhì)含量zij為:
式中:max(xj)——第j種水質(zhì)指標的最大值;
min(xj)——第j種水質(zhì)指標的最小值。經(jīng)標準化處理后的矩陣記為:
(2)相似統(tǒng)計量。文中主要采用Q型聚類中的歐氏距離作為計算過程的相似統(tǒng)計量,空間樣本兩兩之間的歐氏距離為:
式中:i、k——代表兩個不同的樣本,1≤i,k≤n。
歐氏距離Dik越小,相似程度越好,其大小定量地表示出水樣之間的親疏程度。
(3)聚類方法。采用聚類分析中廣泛使用的類平均法中的組間連接法 (Between-groups linkage)進行聚類,用兩個類別中元素兩兩之間的平均平方距離來定義兩個類別間的距離平方。
2.1.2 聚類分析結(jié)果
結(jié)合水質(zhì)指標的重要性,選取K+Na+、Ca2+、Mg2+、Cl-、SO2-4、HCO-3六大常規(guī)離子的含量作為各水樣的變量。同一含水層各水質(zhì)指標取平均值做為數(shù)據(jù)的有效性。采用SPSS軟件先進行數(shù)據(jù)正規(guī)化 (Z scores)處理,然后采用類間連接法 (Between-groups linkage)進行聚類分析。最后得出相似矩陣見表2,譜系圖見圖2。
表2 聚類分析相似性矩陣
圖2 聚類分析譜系圖
表2反應(yīng)了含水層及出水點兩兩之間的相似距離,距離越短,說明兩者越相似,反之,兩者差別越大。圖2直觀反應(yīng)各類別聚類的先后順序。從分析結(jié)果可以看出:十三灰和奧灰之間距離最小,譜系圖中首先聚為一類,水質(zhì)特征最為相似,可能存在水力聯(lián)系;奧灰和十下灰之間距離最大,水質(zhì)特征差別最大;出水點與三個含水層的水質(zhì)相似程度為:十三灰>奧灰>十下灰,與前人灰色關(guān)聯(lián)度分析結(jié)果一致。分層聚類分析定量的反應(yīng)了水源之間的水質(zhì)親疏關(guān)系。
逐步判別分析是通過建立判別函數(shù),分析樣品所屬類型的一種方法。進行判別分析時,如果把所有的變量都代入判別函數(shù),不僅計算量大,而且變量間的不獨立性可能使計算的精度變低,此外,這些變量對區(qū)分各個母體所起的作用不盡相同,判斷能力有大有小。逐步判別分析主要是根據(jù)所給數(shù)據(jù)中每個變量在各類判別式中的重要性來挑選出判別效果最優(yōu)的變量進入判別式,然后再從判別式中去除那些因為新變量的選入而失去判別效果的變量,最終在判別式中只保留那些對母體判別能力較強的變量。
2.2.1 分析過程
(1)突水水源判別指標的選取。綜合考慮離子的重要性以及數(shù)據(jù)的有效性,結(jié)合前人的研究成果,選取 K+Na+、Ca2+、Mg2+、Cl-、SO2-4、HCO-3六大常規(guī)離子作為變量,見表1。
(2)判別變量的篩選和判別函數(shù)的建立。利用SPSS軟件剔除了Ca2+、Mg2+、Cl-、HCO-34種判別能力較差的預(yù)測變量,而篩選出了K+Na+、SO2-4兩個判別能力較強的預(yù)測變量進入判別函數(shù),最終得出該礦下組煤3個充水水源在Fisher準則下的逐步判別函數(shù)。
把待判水樣的K+Na+、SO2-4的實際濃度值代入3個方程中,計算出相應(yīng)函數(shù)值并比較,最后把水樣劃歸為函數(shù)值最大的含水層。
(3)判別效果的檢驗。將參與構(gòu)建判別函數(shù)的31個水樣分別代入判別函數(shù)中進行回判檢驗,結(jié)果見表3。
從表3可以看出,回判檢驗的正確率為83.9%,判別效果較好,可以利用判別函數(shù)對未知水樣進行判別。
表3 判別函數(shù)的回判檢驗結(jié)果
2.2.2 逐步判別分析結(jié)果
將出水點水樣K+Na+和SO2-4水質(zhì)含量代入3個判別函數(shù)方程中,計算出函數(shù)值并進行比較,結(jié)果見表4。
通過判別函數(shù)比較,5個待判水樣全部屬于十三灰水,逐步判別結(jié)果顯示主要出水水源為十三灰水。
表4 出水點逐步判別分析結(jié)果
通過上述兩種多元統(tǒng)計方法的分析,兩者均證明了出水點的水質(zhì)和十三灰的水質(zhì)最接近,分析結(jié)果一致,得到了互相驗證的目的,而且與前人灰色關(guān)聯(lián)分析和水質(zhì)模型分析結(jié)果相一致,說明判別結(jié)果準確,有一定的說服力。
多元統(tǒng)計分析模型中,分層聚類強調(diào)親疏關(guān)系,實現(xiàn)了定性和定量分析的有機結(jié)合,為水源分析判斷提供了客觀的數(shù)學依據(jù);逐步判別分析強調(diào)類型歸屬,計算過程簡單易行、構(gòu)建的模型穩(wěn)定,優(yōu)于其它判別模型。二者對水源判別各有所長,互為補充和檢驗,可以更加準確地分析水源,防止水源分析中出現(xiàn)誤差。
[1]熊偉,崔光磊.貝葉斯判別分析在礦井突水水源預(yù)測中的應(yīng)用 [J].中國煤炭,2012(11)
[2]楊永國,黃福臣.非線性方法在礦井突水水源判別中的應(yīng)用 [J].中國礦業(yè)大學學報,2007(3)
[3]楊海軍,王廣才.煤礦突水水源判別與水量預(yù)測方法綜述 [J].煤田地質(zhì)與勘探,2012(3)
[4]李燕,徐智敏等.礦井突水水源判別方法概述 [J].煤炭技術(shù),2010(11)
[5]周健,史秀志,王懷勇.礦井突水水源識別的距離判別分析模型 [J].煤炭學報,2010(2)
[6]修中標,魏延雙等.聚類分析在礦井水源判別中的應(yīng)用 [J].煤礦安全,2008 (2)
[7]杜強,賈麗艷.SPSS統(tǒng)計分析從入門到精通 [M].北京:人民郵電出版社,2011
[8]王心義,徐濤等.距離判別法在相似礦區(qū)突水水源識別中的應(yīng)用 [J].煤炭學報,2011(8)
Application of multivariate statistical analysis model to identification of water inrush source in coal mines
Liu Jiegang1,2,Xu Xinqi3,Shi Yanru1,Yu Qingsong1,2,Li Lei1,2
(1.School of Resource and Earth Science,China University of Mining and Technology,Xuzhou,Jiangsu 221116,China;2.Key Laboratory of Coalbed Methane Resource and Reservoir Formation History,Ministry of Education,Xuzhou,Jiangsu 221116,China;3.Zibo Mining Group Co.,Ltd.,Zibo,Shandong 257000,China)
The comprehensive utilization of the calculation principal ofhierarchical clustering and stepwise discrimination,the multivariate statistical analysis model was set up to analyze the similarity of water quality and discriminate the source of water inrush according to the position of water inrush and the information of water quality in the aquifer in Daizhuang Coal Mine.The research showed that the hierarchical clustering method can quantitatively and visually reflect the close or distant relationship of water quality from different sources,and the stepwise discrimination analysis can effectively discriminate the type of water inrush position.Therefore,they are in complementary and verifiable relationship for each other.
multivariate statistical analysis,hierarchical clustering,stepwise discrimination,source of water inrush,Daizhuang Coal Mine
TD745.21
A
*項目資助:“十二五”期間江蘇省一級學科重點學科建設(shè)項目資助 (蘇孝研 〔2011〕14號)
劉杰剛 (1989-),男,漢族,四川綿陽人,碩士研究生,主要從事煤與油氣地質(zhì)方面的研究工作。
(責任編輯 張艷華)