劉建坡 徐孝男 武 峰 李烽田 王永昕
(深部金屬礦山安全開(kāi)采教育部重點(diǎn)實(shí)驗(yàn)室,遼寧 沈陽(yáng) 110819)
隨著經(jīng)濟(jì)持續(xù)高速發(fā)展,我國(guó)地下工程(礦山、地下隧道工程、水電工程等)建設(shè)速度居于世界前列,其工程類型眾多且建設(shè)深度和規(guī)模不斷增大。在這種背景下,地下工程水文地質(zhì)特征愈加復(fù)雜,透水事故頻發(fā),例如,2019 年5 月17 日黑河翠宏山鐵多金屬礦發(fā)生特大突水事故,采空區(qū)塌陷引起地表濱河水庫(kù)大量水?dāng)y泥沙潰入井下,致使43 人被困8 人失蹤;2019 年12 月14 日四川宜賓杉木樹(shù)煤礦發(fā)生重大透水事故,越界開(kāi)采導(dǎo)致相鄰煤礦老空區(qū)積水瞬間沖破邊界煤柱涌入礦井,5 名作業(yè)人員當(dāng)場(chǎng)死亡;2021 年7 月15 日珠海石景山隧道右洞施工工程中發(fā)生特大突水事故,瞬時(shí)最大涌水量達(dá)到7 200 m3/h,水流帶出淤泥堆積數(shù)米,造成14 人死亡。各類透水災(zāi)害造成了嚴(yán)重的人員傷亡和重大經(jīng)濟(jì)損失,嚴(yán)重制約地下工程的安全建設(shè)作業(yè)。開(kāi)展透水災(zāi)害發(fā)生風(fēng)險(xiǎn)定量評(píng)估研究,對(duì)于透水災(zāi)害救災(zāi)決策制定具有重要意義。
針對(duì)地下工程透水事故的致災(zāi)因素及風(fēng)險(xiǎn)預(yù)測(cè)評(píng)估,國(guó)內(nèi)外專家學(xué)者展開(kāi)了大量研究。Bukowski[1]考慮了水壓、涌水懸浮物含量、圍巖和礦柱穩(wěn)定性以及井筒歷史突水情況幾個(gè)因素,提出了一種突水災(zāi)害發(fā)生風(fēng)險(xiǎn)評(píng)估系統(tǒng)。李利平等[2]開(kāi)發(fā)了包含不良地質(zhì)、超前地質(zhì)監(jiān)測(cè)信息等8 個(gè)風(fēng)險(xiǎn)評(píng)價(jià)因素的軟件系統(tǒng)用于突水災(zāi)害發(fā)生風(fēng)險(xiǎn)實(shí)時(shí)評(píng)價(jià)。李術(shù)才等[3]通過(guò)收集巖溶隧道典型突水突泥事故案例,分析相關(guān)致災(zāi)因素,建立了突水突泥風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系并對(duì)齊岳山隧道突水突泥風(fēng)險(xiǎn)進(jìn)行了評(píng)估工作。陳歌等[4]引入微震監(jiān)測(cè)技術(shù)開(kāi)展礦井水害防治和預(yù)測(cè)預(yù)報(bào)研究并系統(tǒng)分析了突水災(zāi)害煤巖體微震活動(dòng)性前兆規(guī)律。李文平等[5]針對(duì)煤礦底板奧灰水害問(wèn)題,收集了大量突水案例數(shù)據(jù),建立了地下突水災(zāi)害風(fēng)險(xiǎn)評(píng)估方法,并將突水風(fēng)險(xiǎn)分為安全、中等安全、潛在風(fēng)險(xiǎn)和高風(fēng)險(xiǎn)4 個(gè)等級(jí)。殷穎等[6]統(tǒng)計(jì)收集了160 個(gè)隧道突水突泥災(zāi)害案例,總結(jié)工程地質(zhì)、自然環(huán)境和人為誘發(fā)因素對(duì)突水突泥災(zāi)害發(fā)生頻率的影響程度,分析并總結(jié)各因素對(duì)突水突泥的影響規(guī)律。邱梅等[7]對(duì)梁莊煤礦13 號(hào)煤層下伏奧灰含水層的突水風(fēng)險(xiǎn)性進(jìn)行了預(yù)測(cè)評(píng)估。王迎超等[8]以雞公嶺隧道和峽口隧道2 個(gè)典型深埋巖溶隧道為背景,選取了地形地貌、層間裂隙等7 個(gè)指標(biāo)用于突水風(fēng)險(xiǎn)預(yù)測(cè)評(píng)估。在以上研究中,采取的評(píng)估方法主要有基于風(fēng)險(xiǎn)指標(biāo)判據(jù)的綜合評(píng)價(jià)方法和基于機(jī)器學(xué)習(xí)的綜合評(píng)價(jià)方法兩類。其中,基于風(fēng)險(xiǎn)指標(biāo)判據(jù)的綜合評(píng)價(jià)方法包括模糊綜合評(píng)價(jià)[8-9]、云模型[10-11]、屬性數(shù)學(xué)理論[12-13]、層次分析法[14-15]、D-S 證據(jù)理論[16]等;基于機(jī)器學(xué)習(xí)的綜合評(píng)價(jià)方法主要包括貝葉斯網(wǎng)絡(luò)[17]、神經(jīng)網(wǎng)絡(luò)[18-19]、隨機(jī)森林[20]、支持向量機(jī)[21]、萬(wàn)有引力法[22]等。決策樹(shù)是一種基于“信息增益”的方式對(duì)樣本進(jìn)行分類的機(jī)器學(xué)習(xí)方法,因其模型簡(jiǎn)單直觀且可解釋性較好,得到了廣泛應(yīng)用。
以上研究中多以瞬時(shí)最大涌水量等指標(biāo)定義災(zāi)害風(fēng)險(xiǎn)等級(jí),而累計(jì)涌水量對(duì)于救災(zāi)決策也具有重要指導(dǎo)作用。因此,在透水災(zāi)害風(fēng)險(xiǎn)等級(jí)確定時(shí),綜合考慮瞬時(shí)最大涌水量和累計(jì)涌水量,可為救災(zāi)決策提供更為全面的指導(dǎo)。本文通過(guò)系統(tǒng)分析國(guó)內(nèi)外107組典型地下工程透水事故案例,建立了透水事故發(fā)生風(fēng)險(xiǎn)評(píng)估數(shù)據(jù)庫(kù),基于瞬時(shí)最大涌水量和事故累計(jì)涌水量2 個(gè)指標(biāo),采用k均值聚類算法劃分了案例庫(kù)樣本的災(zāi)害等級(jí)。在此基礎(chǔ)上,選取水文條件、地層巖性和過(guò)程監(jiān)測(cè)信息3 個(gè)方面共6 個(gè)指標(biāo),基于決策樹(shù)方法建立了透水事故發(fā)生風(fēng)險(xiǎn)評(píng)估模型,為地下工程透水事故救災(zāi)決策提供理論和技術(shù)支撐。
建立透水風(fēng)險(xiǎn)評(píng)估模型,首先需要進(jìn)行統(tǒng)一標(biāo)準(zhǔn)的災(zāi)害等級(jí)劃分。本文采用k均值聚類算法確定透水事故的災(zāi)害等級(jí),并以此為基礎(chǔ),基于決策樹(shù)方法建立透水事故發(fā)生風(fēng)險(xiǎn)評(píng)估模型。
k均值聚類是常用的基于樣本劃分的聚類算法,其基本思想是事先指定類別數(shù)k,采用迭代的方式不斷更新聚類中心和劃分并通過(guò)損失函數(shù)的最小化選取最優(yōu)的劃分。本文在應(yīng)用該方法過(guò)程中,對(duì)于透水災(zāi)害案例數(shù)據(jù)集X的n個(gè)樣本數(shù)據(jù),每個(gè)樣本由m個(gè)屬性(例如:人員傷亡與經(jīng)濟(jì)損失、透水過(guò)程監(jiān)測(cè)信息等)的特征向量組成,即X={x1,x2,…,xn}。
當(dāng)透水災(zāi)害等級(jí)為k級(jí)時(shí),可以將n個(gè)樣本劃分為k個(gè)子集C,C={C1,C2,…,Ck},采用k均值聚類方法的計(jì)算步驟如下:
(4)迭代優(yōu)化。k均值算法使用誤差平方和準(zhǔn)則函數(shù)來(lái)評(píng)價(jià)聚類性能,最終聚類結(jié)果的誤差平方和E的計(jì)算公式如下:
為求最小化平方誤差,通常采用迭代的方法:重復(fù)步驟(2)和步驟(3),迭代t輪后若數(shù)據(jù)集X中各個(gè)樣本所對(duì)應(yīng)的災(zāi)害等級(jí)與第(t-1)輪迭代結(jié)果相同,則停止迭代,令:
式中,C(t)為第t次迭代得到的聚類結(jié)果。
決策樹(shù)廣泛應(yīng)用于各種分類與回歸問(wèn)題。一般情況下,一棵決策樹(shù)包含一個(gè)根結(jié)點(diǎn)、若干個(gè)內(nèi)部結(jié)點(diǎn)和若干個(gè)葉結(jié)點(diǎn),其中:根結(jié)點(diǎn)包含樣本全集,葉結(jié)點(diǎn)對(duì)應(yīng)于決策結(jié)果,其他每個(gè)結(jié)點(diǎn)則對(duì)應(yīng)于一個(gè)屬性測(cè)試,每個(gè)結(jié)點(diǎn)包含的樣本集合根據(jù)屬性測(cè)試的結(jié)果被劃分到子結(jié)點(diǎn)中,根結(jié)點(diǎn)到葉結(jié)點(diǎn)的最長(zhǎng)路徑的長(zhǎng)度稱為樹(shù)的深度。因此,該方法核心思想即通過(guò)逐層選擇最優(yōu)劃分屬性,將不同樣本劃分到相應(yīng)類別中,最終生成一棵穩(wěn)定性好、泛化能力強(qiáng)的決策樹(shù)。
假設(shè)給定包含n個(gè)樣本、共有k個(gè)災(zāi)害等級(jí)類別的透水災(zāi)害案例數(shù)據(jù)集S,每個(gè)樣本由u個(gè)屬性的特征向量組成,即S={(x1,y1),(x2,y2),…,(xn,yn)}。其中,X=(x1,x2,…,xn)為輸入實(shí)例樣本,yi∈{1,2,…,k}為災(zāi)害等級(jí)類別標(biāo)記(i=1,2,…,n)。
決策樹(shù)模型生成的計(jì)算步驟如下:
(1)計(jì)算數(shù)據(jù)集的信息熵。假定災(zāi)害數(shù)據(jù)集S中第i類災(zāi)害等級(jí)樣本所占的比例為pi(i=1,2,…,k),則S的信息熵定義為
式中,Entropy(S)代表災(zāi)害數(shù)據(jù)集S的信息熵,單位為bit。
(2)計(jì)算每個(gè)屬性對(duì)數(shù)據(jù)集的信息條件熵。對(duì)于S中某一屬性A(例如水壓、離子濃度等),屬性A對(duì)S的信息條件熵計(jì)算式如下:
式中,Entropy(S|A)代表屬性A對(duì)數(shù)據(jù)集S的信息條件熵,表示在A給定的條件下對(duì)S進(jìn)行分類的不確定性;Sj代表某一特定災(zāi)害等級(jí)的樣本集合;分別代表集合Sj和集合S的樣本個(gè)數(shù);Entropy(Sj)代表數(shù)據(jù)集Sj的信息熵,j=1,2,…,k。
(3)計(jì)算信息增益。
式中,Gain(S,A)代表屬性A對(duì)數(shù)據(jù)集S的信息增益,表示屬性A對(duì)數(shù)據(jù)集S進(jìn)行分類的不確定性減少的程度。通常,采用最大信息增益的屬性作為最優(yōu)劃分屬性。
本文統(tǒng)計(jì)了國(guó)內(nèi)外91 個(gè)地下工程共107 起透水事故案例,通過(guò)分析災(zāi)害發(fā)生原因、類型及致災(zāi)因素,建立起了透水災(zāi)害案例樣本數(shù)據(jù)庫(kù),其中金屬礦、隧道工程、煤礦透水案例數(shù)量分別為16、39 和52,占比分別為15%、36.4%和48.5%。
本研究選取瞬時(shí)最大涌水量和累計(jì)涌水量2 個(gè)指標(biāo),依據(jù)傳統(tǒng)透水災(zāi)害等級(jí)劃分標(biāo)準(zhǔn)(特大型、大型、中型和小型4 級(jí)[14])確定聚類數(shù)目k=4,根據(jù)式(1)~式(4),得到4 個(gè)包含不同樣本數(shù)的樣本集合(類別1、類別2、類別3 和類別4)。為了更直觀地看出每個(gè)類別實(shí)際代表的等級(jí),以實(shí)際災(zāi)害等級(jí)為依據(jù),對(duì)聚類結(jié)果進(jìn)行了統(tǒng)計(jì)分析(圖1、表1)。從圖中可以看出,類別1、類別2、類別3 和類別4 分別包含18、25、38 和26 個(gè)樣本數(shù)據(jù),分別占比16.8%、23.4%、35.5%和24.3%。其中,類別1 包含14 個(gè)小型(占比77.8%)、3 個(gè)中型和1 個(gè)大型透水樣本;類別2 中包含18 個(gè)中型(占比72.0%)、4 個(gè)小型和3個(gè)大型透水樣本;類別3 中包含31 個(gè)大型(占比81.6%)、5 個(gè)特大型和2 個(gè)中型透水樣本;類別4 中包含22 個(gè)特大型(占比84.6%)、3 個(gè)大型和1 個(gè)中型透水樣本。根據(jù)聚類結(jié)果的4 個(gè)樣本集合所含不同災(zāi)害等級(jí)樣本的數(shù)目情況可以判斷,類別1、類別2、類別3 和類別4 分別與小型、中型、大型和特大型災(zāi)害等級(jí)相對(duì)應(yīng)。
表1 樣本聚類結(jié)果與實(shí)際災(zāi)害等級(jí)對(duì)比Table 1 Comparison between sample clustering results and actual water inrush level
圖1 聚類結(jié)果統(tǒng)計(jì)描述Fig.1 Statistical description of clustering results
綜合考慮透水樣本指標(biāo)數(shù)據(jù)的完整性以及指標(biāo)與透水災(zāi)害等級(jí)相關(guān)性2 個(gè)條件,最終選取水文地質(zhì)條件、巖性因素和透水過(guò)程指標(biāo)三方面指標(biāo)。其中水文地質(zhì)條件包括水文條件加權(quán)值、地下水位高程差和工程埋深3 個(gè)指標(biāo);巖性因素為圍巖飽和單軸抗壓強(qiáng)度;透水過(guò)程指標(biāo)包括涌水量平均增長(zhǎng)速率和累積涌水量2 個(gè)指標(biāo),具體如下:
(1)水文條件加權(quán)值x1是主要含水層富水性(按鉆孔單位涌水量)、水源補(bǔ)給能力(按負(fù)地形面積占比)、地下水連通性三者的加權(quán)值,可以綜合反映該研究區(qū)域的水文情況,其中區(qū)域富水性分級(jí)標(biāo)準(zhǔn)見(jiàn)規(guī)程[23],文獻(xiàn)[24]給出了水源補(bǔ)給能力和地下水連通性的分級(jí)評(píng)分標(biāo)準(zhǔn)。
(2)地下水位高程差x2表示地下水位面與基準(zhǔn)面(巷道或隧道底板)的高程,是影響瞬時(shí)突水強(qiáng)度的重要因素之一[15]。
(3)隨著工程埋深x3增大,地下水逕流活動(dòng)、含水層水力聯(lián)系等顯現(xiàn)出逐漸增強(qiáng)的趨勢(shì)[25],在這種情況下發(fā)生透水事故往往更容易造成較嚴(yán)重的后果。
(4)圍巖巖石飽和單軸抗壓強(qiáng)度x4可以在一定程度上反映巷(隧)道圍巖的力學(xué)性質(zhì),是影響透水是否發(fā)生的一個(gè)重要因素[26]。
(5)典型突水災(zāi)害的涌水量時(shí)程曲線可分為兩種類型(圖2):第一種突水發(fā)生過(guò)程常伴隨著涌水點(diǎn)數(shù)目增多、涌水通道擴(kuò)張等現(xiàn)象,存在較為明顯的災(zāi)變期,例如底板灰?guī)r含水層承壓突水、頂板砂巖裂隙突水等;第二種突水發(fā)生過(guò)程通常無(wú)顯著前兆,往往是采掘過(guò)程不慎導(dǎo)通儲(chǔ)水構(gòu)造(老空區(qū)、巖溶溶腔等)造成的瞬時(shí)突水,若無(wú)其他層位的地下水補(bǔ)給,則表現(xiàn)為靜儲(chǔ)量疏干型。本研究中將兩類突水災(zāi)害涌水量時(shí)程曲線劃分為災(zāi)前穩(wěn)定階段、災(zāi)變階段和成災(zāi)階段3 個(gè)階段,其中第二種突水類型沒(méi)有進(jìn)行災(zāi)變階段的劃分。圖2 中,Qn、Qan、Qs和Qm分別代表穩(wěn)定涌水量、異常涌水量、突增涌水量和初次最大涌水量,t1、t2和t3表示達(dá)到相應(yīng)涌水量所對(duì)應(yīng)的時(shí)間,涌水量平均增長(zhǎng)速率x5可以通過(guò)圖中公式求得,累積涌水量x6為相應(yīng)時(shí)間區(qū)間下的面積S1和S2。
圖2 兩類突水災(zāi)害典型涌水量時(shí)程曲線示意Fig.2 Schematic of typical water inflow time-history curves of two types of water inrush hazard
指標(biāo)的可靠性是影響透水事故發(fā)生風(fēng)險(xiǎn)評(píng)估準(zhǔn)確性的重要因素。因此,在透水風(fēng)險(xiǎn)評(píng)估指標(biāo)確定的基礎(chǔ)上,統(tǒng)計(jì)不同災(zāi)害等級(jí)下樣本各指標(biāo)的平均值,并進(jìn)行了歸一化處理(圖3)。從圖3 可以看出,水文條件加權(quán)值、水位高程差、埋深、涌水量平均增長(zhǎng)速率和累積涌水量5 個(gè)指標(biāo)與災(zāi)害等級(jí)呈正相關(guān),而巖石飽和單軸抗壓強(qiáng)度與災(zāi)害等級(jí)呈負(fù)相關(guān)關(guān)系,這表明本研究中選取的指標(biāo)均與透水災(zāi)害等級(jí)存在較強(qiáng)的相關(guān)性,可用于透水事故發(fā)生風(fēng)險(xiǎn)評(píng)估模型的建立。
圖3 指標(biāo)歸一化均值與災(zāi)害等級(jí)的關(guān)系Fig.3 The relationship between the normalized mean of the indicators and the water inrush level
本研究將107 組透水事故樣本按照樣本數(shù)比7 ∶1 ∶2 劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集(表2),即:75個(gè)樣本作訓(xùn)練集建立決策樹(shù)模型,11 個(gè)樣本作驗(yàn)證集對(duì)生成的決策樹(shù)進(jìn)行剪枝優(yōu)化,21 個(gè)樣本作測(cè)試集對(duì)最終生成的剪枝決策樹(shù)進(jìn)行模型評(píng)估。表2 中,x1~x6代表各指標(biāo)屬性,y為災(zāi)害等級(jí),其數(shù)值0、1、2、3 分別對(duì)應(yīng)小型、中型、大型和特大型透水災(zāi)害等級(jí)。
表2 透水災(zāi)害樣本數(shù)據(jù)集的劃分Table 2 The division of the water inrush sample data set
透水事故發(fā)生風(fēng)險(xiǎn)評(píng)估決策樹(shù)模型的建立過(guò)程如下:首先,根據(jù)式(5)~式(7),可以獲得訓(xùn)練集(視為樹(shù)深度為0 的根結(jié)點(diǎn))的信息熵值1.979,并依據(jù)信息熵值計(jì)算得到最優(yōu)劃分屬性x1和劃分結(jié)點(diǎn)值6.28;之后,以最優(yōu)劃分屬性x1的值與劃分結(jié)點(diǎn)值6.28 的相對(duì)大小為依據(jù)將訓(xùn)練集樣本劃分為2 個(gè)子集,共同構(gòu)成樹(shù)深度為2 的內(nèi)部結(jié)點(diǎn);再后,重復(fù)以上過(guò)程,計(jì)算2 個(gè)子集的最優(yōu)劃分屬性和劃分結(jié)點(diǎn)值,進(jìn)而進(jìn)一步分裂這2 個(gè)子集,直至決策樹(shù)模型建立完成。在本研究中,訓(xùn)練集的決策樹(shù)模型樹(shù)深度為6(表3)。隨著樹(shù)深度的增加,內(nèi)部結(jié)點(diǎn)的數(shù)目成倍遞增,每個(gè)內(nèi)部結(jié)點(diǎn)所含樣本數(shù)逐層遞減,樣本劃分越精細(xì)。若某一內(nèi)部結(jié)點(diǎn)所含樣本均為同一災(zāi)害等級(jí),即該內(nèi)部結(jié)點(diǎn)為葉結(jié)點(diǎn),則停止繼續(xù)劃分,可直接給出該路徑下的風(fēng)險(xiǎn)等級(jí)。
表3 決策樹(shù)劃分依據(jù)Table 3 Decision tree division basis
在上述決策樹(shù)模型建立基礎(chǔ)上,采用驗(yàn)證集樣本進(jìn)行了驗(yàn)證,準(zhǔn)確率僅為63.6%,表明該模型泛化能力較差,不能滿足透水事故發(fā)生風(fēng)險(xiǎn)評(píng)估的需要。造成該問(wèn)題的主要原因是在模型建立過(guò)程中出現(xiàn)過(guò)擬合,圖4 中訓(xùn)練集樣本擬合精度隨著最大葉結(jié)點(diǎn)數(shù)目的增多而增加(當(dāng)最大葉結(jié)點(diǎn)為17 時(shí),評(píng)估準(zhǔn)確率達(dá)100%),但是驗(yàn)證集樣本的評(píng)估準(zhǔn)確率卻在最大葉結(jié)點(diǎn)超過(guò)9 之后出現(xiàn)顯著降低的現(xiàn)象。為解決該問(wèn)題,本研究中采用剪枝方式對(duì)決策樹(shù)模型進(jìn)行了處理,避免出現(xiàn)過(guò)擬合現(xiàn)象。在決策樹(shù)方法中,剪枝是防止生成的樹(shù)過(guò)擬合、提高模型評(píng)估準(zhǔn)確率的主要手段,其基本策略有“預(yù)剪枝”和“后剪枝”2 種:前者是在決策樹(shù)生成過(guò)程中對(duì)結(jié)點(diǎn)屬性進(jìn)行劃分時(shí)作判斷,后者是生成決策樹(shù)后自下而上地對(duì)非葉結(jié)點(diǎn)進(jìn)行判斷。后剪枝決策樹(shù)往往比預(yù)剪枝決策樹(shù)保留更多分支,避免過(guò)擬合的同時(shí)降低欠擬合風(fēng)險(xiǎn)。因此,本研究采用后剪枝策略,并以模型泛化性能是否提升作為剪枝標(biāo)準(zhǔn),對(duì)模型進(jìn)行了優(yōu)化處理。以圖5 中樹(shù)深度為5 的結(jié)點(diǎn)n28為例,該結(jié)點(diǎn)包含8 個(gè)透水樣本(6 個(gè)大型和2 個(gè)中型),嘗試對(duì)其剪枝(替換為葉結(jié)點(diǎn))并標(biāo)記為“大型”災(zāi)害等級(jí)之后的驗(yàn)證集樣本預(yù)測(cè)準(zhǔn)確率并未提升(仍為63.6%),故仍保留此內(nèi)部結(jié)點(diǎn)(保留n29和n30)。對(duì)于包含15 個(gè)透水樣本(12 個(gè)大型和3 個(gè)特大型)的結(jié)點(diǎn)n11,嘗試對(duì)其剪枝(替換為葉結(jié)點(diǎn))并標(biāo)記為“大型”災(zāi)害等級(jí)之后的驗(yàn)證集樣本預(yù)測(cè)準(zhǔn)確率顯著提升(從63.6%提升至81.8%),故對(duì)其進(jìn)行剪枝處理(剪掉n19,n20,n25和n26)?;谝陨霞糁Σ呗?建立了透水發(fā)生風(fēng)險(xiǎn)評(píng)估剪枝決策樹(shù)模型。通過(guò)針對(duì)驗(yàn)證集樣本進(jìn)行評(píng)估,準(zhǔn)確率提高至90.9%。
圖4 最大葉結(jié)點(diǎn)數(shù)檢驗(yàn)曲線Fig.4 Test curve for maximum number of leaf nodes
圖5 決策樹(shù)模型的剪枝處理過(guò)程Fig.5 The pruning process of decision tree
為了檢驗(yàn)透水發(fā)生風(fēng)險(xiǎn)評(píng)估模型的評(píng)估性能,采用測(cè)試集樣本對(duì)初始決策樹(shù)模型和剪枝決策樹(shù)模型進(jìn)行檢驗(yàn)評(píng)估,檢驗(yàn)結(jié)果如表4 所示。
表4 測(cè)試集樣本數(shù)據(jù)透水事故發(fā)生風(fēng)險(xiǎn)等級(jí)檢驗(yàn)結(jié)果Table 4 Assessment results of water inrush risk level of test set sample data
續(xù)表4
從表4 可以看出,初始決策樹(shù)模型評(píng)估準(zhǔn)確率為90.5%,剪枝決策樹(shù)模型避免了原模型產(chǎn)生的2 個(gè)樣本評(píng)估偏差,表明剪枝可以有效防止模型過(guò)擬合,進(jìn)而提升評(píng)估準(zhǔn)確率(從90.5%提升至100%)。在此基礎(chǔ)上,進(jìn)一步采用剪枝決策樹(shù)模型對(duì)107 組透水樣本進(jìn)行了評(píng)估(表5),準(zhǔn)確率達(dá)95.3%,表明剪枝決策樹(shù)模型具有較強(qiáng)的適用性。
表5 透水事故發(fā)生風(fēng)險(xiǎn)評(píng)估決策樹(shù)模型混淆矩陣Table 5 Confusion matrix of decision tree for risk assessment of water inrush hazard
本研究以國(guó)內(nèi)外透水事故案例為基礎(chǔ),基于k均值聚類算法確定了事故災(zāi)害等級(jí),采用決策樹(shù)方法建立了透水事故發(fā)生風(fēng)險(xiǎn)評(píng)估模型,結(jié)論如下:
(1)以瞬時(shí)最大涌水量和累計(jì)涌水量指標(biāo),基于k均值聚類算法所劃分的107 個(gè)透水事故樣本災(zāi)害等級(jí)與其實(shí)際災(zāi)害等級(jí)匹配度較好。
(2)透水事故發(fā)生風(fēng)險(xiǎn)評(píng)估指標(biāo)與事故等級(jí)具有較好的相關(guān)性,其中水文條件加權(quán)值、地下水位高程差、埋深、涌水量平均增長(zhǎng)速率和累積涌水量與災(zāi)害等級(jí)呈正相關(guān),巖石飽和單軸抗壓強(qiáng)度與災(zāi)害等級(jí)呈負(fù)相關(guān)。
(3)剪枝能夠有效提高透水事故發(fā)生風(fēng)險(xiǎn)評(píng)估決策樹(shù)模型的泛化性能。相對(duì)于初始決策樹(shù)模型,剪枝決策模型對(duì)于驗(yàn)證集和測(cè)試集樣本的評(píng)估準(zhǔn)確率分別從63.6%和90.5%提高到90.9%和100%,全部樣本的綜合評(píng)估準(zhǔn)確率為95.3%,表明該模型具有較好的適用性,能為地下工程透水災(zāi)害的救災(zāi)決策提供較好的理論和技術(shù)支撐。