李康楠,吳雅琴,杜 鋒,張 翔,王乙橋
(1.中國礦業(yè)大學(xué)(北京) 共伴生能源精準(zhǔn)開采北京市重點實驗室,北京 100083;2.中國礦業(yè)大學(xué)(北京)應(yīng)急管理與安全工程學(xué)院,北京 100083;3.中國礦業(yè)大學(xué)(北京) 機電與信息工程學(xué)院,北京 100083)
深部脆性巖體受外界擾動影響,發(fā)生動力失穩(wěn)現(xiàn)象致使其內(nèi)部彈性能極速釋放,從而導(dǎo)致巖體碎片彈射、拋擲與剝落,同時伴隨不同程度的爆炸聲響等現(xiàn)象,稱為巖爆地質(zhì)災(zāi)害[1-3]。巖爆災(zāi)害發(fā)生的影響因素多,不確定性大,嚴(yán)重干擾現(xiàn)場作業(yè)的有序進行;巖爆災(zāi)害危險性大,一旦發(fā)生中等、強烈?guī)r爆,往往會造成一定的人員傷亡和巨大的經(jīng)濟損失。隨著地下巖土工程逐步加深,巖爆災(zāi)害事故日益增多,高效準(zhǔn)確的巖爆烈度等級預(yù)測方法研究迫在眉睫[4-5]。
國內(nèi)外學(xué)者對巖爆烈度等級預(yù)測方法的研究大致可分為判據(jù)預(yù)測方法和綜合分析預(yù)測方法2 種[6]。判據(jù)預(yù)測方法首先會確立巖爆烈度等級的單因素分類標(biāo)準(zhǔn),然后將預(yù)測區(qū)域該因素的數(shù)值大小與預(yù)定標(biāo)準(zhǔn)進行對比,從而預(yù)測巖爆的烈度等級,如:Russenes[7]與Hoek[8]與二郎山[9]應(yīng)力系數(shù)判據(jù)、Turchaninov[10]判據(jù)、Kidybinski[11]與Singh[12]巖爆傾向性指數(shù)判據(jù)、N-Jhelum[13]判據(jù)、Aubertin[14]改進脆性指數(shù)判據(jù)、Wang[15]最大儲存彈性應(yīng)變能判據(jù)、陶振宇判據(jù)[16]等。巖爆誘發(fā)因素眾多,單因素很難全面揭示災(zāi)害發(fā)生規(guī)律,且各因素之間可能存在相互耦合的現(xiàn)象,故僅以單因素判據(jù)預(yù)測巖爆災(zāi)害缺乏可信度。因此,越來越多的學(xué)者采用多因素分析預(yù)測方法進行綜合研究,以期通過數(shù)學(xué)方法、機器學(xué)習(xí)與智能算法達到準(zhǔn)確預(yù)測巖爆烈度等級的目的。傳統(tǒng)數(shù)學(xué)方法如貝葉斯模型[17]、功效系數(shù)法[18]、支持向量機[19]、決策樹[20]等雖應(yīng)用廣泛,在一定程度上提升了巖爆烈度等級預(yù)測的準(zhǔn)確率,但存在一些方面的缺陷:在確定指標(biāo)權(quán)重與定性因素方面受人為主觀影響嚴(yán)重,很難客觀預(yù)測巖爆烈度等級;影響因素之間相互聯(lián)系、共同作用,預(yù)測過程往往忽略非線性因素。為彌補上述缺陷,國內(nèi)外學(xué)者展開機器學(xué)習(xí)與智能算法領(lǐng)域的研究,如SVM (Support Vector Machines)模型[21]、IPP-PNN(Improved Projection Pursuit-Probabilistic Neural Networks)模 型[22]、PCA-PNN(Principle Component Analysis-PNN)模型[23]、PCA-RBF(PCA-Radial Basis Function)[24]模型等,進一步提高了巖爆烈度等級的預(yù)測精度,但存在兩方面的局限性:所需訓(xùn)練樣本量與計算權(quán)值量大,導(dǎo)致模型復(fù)雜程度提高與運算時間延長;需要配合數(shù)據(jù)降維方法進行模型訓(xùn)練,易丟失重要的數(shù)據(jù)信息從而影響模型預(yù)測的準(zhǔn)確度,故需要繼續(xù)深入研究并探索新的預(yù)測方法。
深度學(xué)習(xí)算法卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)具有局部感知與權(quán)重共享的優(yōu)點,能夠極大減少連接權(quán)值的數(shù)量并降低模型復(fù)雜度,挖掘線性與非線性數(shù)據(jù)深層次的特征規(guī)律與數(shù)據(jù)之間的內(nèi)在聯(lián)系;無需配合額外的分析法即可降低多重共線性并提高模型的泛化能力,在短期電力負(fù)荷預(yù)測[25-26]、短時交通流預(yù)測[27-28]、電廠存煤量預(yù)測[29]與煤層底板突水預(yù)測[30]等方面都具有強大的功能??紤]到數(shù)據(jù)缺失使訓(xùn)練樣本減少從而導(dǎo)致模型準(zhǔn)確率降低的問題,筆者選用鏈?zhǔn)椒匠潭嘀夭逖a(Multiple Imputation by Chained Equations,MICE)法對空缺數(shù)據(jù)進行填補[31-33]。該方法能夠通過表達數(shù)據(jù)的不確定性并進行綜合分析,得到更加可靠與精確的插補結(jié)果?;贛ICE-CNN,選取120 組典型巖爆案例現(xiàn)場數(shù)據(jù),通過參數(shù)優(yōu)選、數(shù)據(jù)處理與網(wǎng)絡(luò)訓(xùn)練建立模型,并與RBF、SVM、PNN 模型的預(yù)測結(jié)果進行對比,期望得到更加可靠有效并利于工程實際的巖爆烈度等級預(yù)測模型。
基于CNN 的巖爆烈度等級預(yù)測模型建立流程如圖1 所示,模型的建立主要分成4 個步驟。第一步,列舉并選取巖爆災(zāi)害的影響因素,通過綜合分析建立契合本預(yù)測模型的指標(biāo)體系。第二步,搜集原始數(shù)據(jù),對數(shù)據(jù)進行基于拉伊達準(zhǔn)則的異常值剔除與基于MICE的缺失值插補,得到完整數(shù)據(jù)后進行數(shù)據(jù)集分割與數(shù)據(jù)轉(zhuǎn)換,搭建CNN 的初始框架并進行訓(xùn)練,從而優(yōu)選模型超參數(shù),建立基于CNN 的巖爆烈度等級預(yù)測模型。第三步,輸入現(xiàn)場數(shù)據(jù)進行驗證模型準(zhǔn)確度預(yù)測。第四步,建立基于RBF、SVM 與PNN 的巖爆烈度等級預(yù)測對比模型,輸入相同數(shù)據(jù)進行預(yù)測,并與CNN模型比較預(yù)測結(jié)果,并觀察預(yù)測結(jié)果的混淆矩陣,對比誤判結(jié)果的傾向性,最終得到最優(yōu)模型。
圖1 巖爆烈度等級預(yù)測模型建立流程Fig.1 Flow chart for establishing prediction model of rockburst intensity grade
本研究通過對國內(nèi)外大量文獻及礦井現(xiàn)場資料的查閱收集[7-9,14-16],得到了主流的巖爆分級標(biāo)準(zhǔn)與對應(yīng)計算公式,詳見表1。
表1 巖爆分級標(biāo)準(zhǔn)Table 1 Rockburst classification standard
巖爆災(zāi)害的發(fā)生與圍巖特征、地質(zhì)構(gòu)造、地應(yīng)力與外界擾動等因素密切相關(guān)[34-36],這導(dǎo)致了影響巖爆發(fā)生的因素眾多,使指標(biāo)選取困難。目前國內(nèi)外尚無統(tǒng)一的巖爆烈度等級預(yù)測指標(biāo)體系,但多數(shù)包含3~6 種巖爆判據(jù)或巖石力學(xué)參數(shù)。過多影響因素組成的預(yù)測指標(biāo)體系既不易于獲取,增加計算的冗余程度與預(yù)測時間,而且相關(guān)度小的因素數(shù)據(jù)離群點還會在一定程度上影響模型的學(xué)習(xí)與判斷;過少的指標(biāo)缺乏代表性,難以支撐災(zāi)害預(yù)測,從而導(dǎo)致預(yù)測結(jié)果出現(xiàn)較大偏差。由表1 的計算公式可以得到計算巖爆分類標(biāo)準(zhǔn)所常用的具有較好代表性的影響因素,在此基礎(chǔ)上,考慮現(xiàn)場獲取便捷,且能夠全面反映巖爆特征信息等條件,最終選取硐室最大切向應(yīng)力σθ、巖石單軸抗壓強度σc、巖石單軸抗拉強度σt、巖體應(yīng)力系數(shù)σθ/σc、巖石強度脆性系數(shù)σc/σt和彈性變形能系數(shù)Wet這6 種指標(biāo)組成巖爆預(yù)測指標(biāo)體系。
基于本研究所建立的巖爆預(yù)測指標(biāo)體系,通過現(xiàn)場實測、查閱資料等方式搜集巖爆烈度等級工程實例,得到120 組實際發(fā)生烈度的原始數(shù)據(jù)用來建立巖爆預(yù)測模型,部分?jǐn)?shù)據(jù)見表2,其中,無、弱、中等、強烈?guī)r爆4 種烈度等級分別用數(shù)字1、2、3、4 表示。
表2 部分工程實例原始數(shù)據(jù)[7-24]Table 2 Partial engineeri ng examples raw data[7-24]
CNN 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖2 所示。
圖2 CNN 網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure of CNN
1) 卷積層
卷積層線性抽取局部范圍內(nèi)的神經(jīng)元信息與特征,然后運用非線性激活函數(shù)對神經(jīng)元進行激活。卷積運算主要為2 個數(shù)值矩陣的變換運算,過濾器(卷積核)首先會選擇每次移動的距離(步長),然后與輸入矩陣進行對應(yīng)的映射點積運算,運算結(jié)果組成輸出矩陣(特征圖)。假定在l層的卷積層有n[l]個濾波器,權(quán)重為K[l]∈大小為3×3,其中n[l-1]是前一層的過濾器數(shù)量。這些過濾器以[1,1]的步伐遍歷整個輸入特征圖,卷積操作可用下式表達,輸出特征Y[l]是:
式中:f(·)為激活函數(shù);b為偏執(zhí)項。
2) 池化層
池化層可降低模型過擬合并提高模型的泛化能力。常用最大池化法進行降采樣,其表達式為:
式中:X為輸出;α為乘性偏置;S(x)為降采樣函數(shù)。
3) 全連接層 (Fully Connected Layers,F(xiàn)C)
全連接層能夠?qū)⒆詈笠粋€池化層所得到的特征圖平鋪為一條一維向量,從而將數(shù)據(jù)進行由高到低的維度變換,同時不丟棄任何有用的信息,其中每個輸入通過一個可學(xué)習(xí)的權(quán)重連接到每個輸出。
4) 損失函數(shù)層
損失函數(shù)可以表達模型預(yù)測值與真實值之間的不一致程度,損失函數(shù)與模型的魯棒性是負(fù)相關(guān),在模型的學(xué)習(xí)過程中起到一定的指導(dǎo)作用。本研究選用Softmax 損失函數(shù)[37]。
1) 基于拉伊達準(zhǔn)則的異常值剔除
在數(shù)據(jù)測量與記錄的過程中存在人工操作不當(dāng)、采動影響等產(chǎn)生的錯誤數(shù)據(jù),剔除錯誤數(shù)據(jù)能夠消除其對模型預(yù)測準(zhǔn)確性的影響。對120 組原始數(shù)據(jù)的前4 列數(shù)據(jù)進行處理,設(shè)數(shù)據(jù)集qi(i=1,2,···,m),計算剩余誤差vi,并計算標(biāo)準(zhǔn)偏差β,若某一值的剩余誤差va(1≤a≤m)滿足下式,則認(rèn)為該值為異常值并予以剔除。
式中:qa為數(shù)據(jù)集中第a個數(shù)據(jù);為數(shù)據(jù)集均值。
2) 基于MICE 的缺失值填補
對前4 列中經(jīng)過異常值剔除的數(shù)據(jù)在原本空缺的地方進行數(shù)據(jù)填補。通過在每個空缺位置使用插補模型進行多次填補產(chǎn)生若干完整數(shù)據(jù)集,然后對若干完整數(shù)據(jù)集分別進行分析,得到相應(yīng)的分析結(jié)果,對結(jié)果做出綜合推斷與比較分析,最終得到最優(yōu)估計值。本研究使用R 語言中的mice 程序包實現(xiàn)MICE。
本研究選用隨機森林(Random Forest,RF),貝葉斯線性回歸(Bayesian Linear Regression,BLR),極 限樹(Extra Tree,ET),K 臨近(K-Nearest Neighbor,KNN)4 種插補模型作為MICE 的估計器,并結(jié)合中值法(Median)與均值法(Mean)2 種傳統(tǒng)插補方法分別進行數(shù)據(jù)填補,為驗證MICE 的優(yōu)越性并優(yōu)選最佳插補模型,對比6 種填補結(jié)果的均方根誤差(ERMS),如圖3 所示。
圖3 不同插補模型/方法的ERMSFig.3 ERMS for different imputation models or methods
觀察圖3 可以得出MICE 比傳統(tǒng)插補方法擁有更高的精度,其中ET 模型的精度最高,故本研究選用ET 模型作為估計器對前4 列進行MICE 插補,插補后計算并補全后2 列數(shù)據(jù),完整數(shù)據(jù)如圖4 所示。
圖4 完整數(shù)據(jù)Fig.4 Complete data
3) 數(shù)據(jù)集分割
為使模型以有限的現(xiàn)場實測數(shù)據(jù)進行充分學(xué)習(xí),將樣本數(shù)據(jù)10 等分,其中訓(xùn)練集占8 份、驗證集與測試集分別為1 份[38],即120 組樣本數(shù)據(jù)中隨機抽取96 組作為CNN 模型的訓(xùn)練集樣本,12 組驗證集樣本,共108 組數(shù)據(jù)為預(yù)測模型建立過程中的訓(xùn)練樣本,剩余12 組測試集樣本作為工程實例以進一步驗證模型準(zhǔn)確率;3 部分?jǐn)?shù)據(jù)相互獨立且均具有代表性。
4) 數(shù)據(jù)轉(zhuǎn)換
CNN 在圖像分類預(yù)測方面具有良好的預(yù)測精度,故本研究需要將數(shù)值數(shù)據(jù)轉(zhuǎn)換為包含RGB 三通道的圖像數(shù)據(jù)[39]。由于本研究的訓(xùn)練樣本僅包含6 個指標(biāo),將數(shù)據(jù)平鋪為6×1×1 的一維圖像數(shù)據(jù),既可以充分提取樣本數(shù)據(jù)內(nèi)涵特征信息,又可降低特征維度使神經(jīng)網(wǎng)絡(luò)的訓(xùn)練與計算更加便捷。
1) CNN 神經(jīng)網(wǎng)絡(luò)構(gòu)造
第一層為圖像輸入層(Image input)。第二層為卷積層1(Conv_1),由于數(shù)據(jù)為一維,所以卷積核大小選取為z×1,而z為1 時會喪失感受野的作用,故需z>1;當(dāng)卷積核為偶數(shù)時,輸出特征圖比輸入特征圖尺寸變小,可學(xué)習(xí)的特征信息減少,故需z為奇數(shù)??紤]到卷積核過大可能忽略數(shù)據(jù)特征信息,故本研究所選用的卷積核大小為3×1;同理,本研究以1 為步長進行卷積操作能夠盡量減少信息的丟失;采用的硬件資源為單GPU,結(jié)合硬件配置選擇卷積核的數(shù)目為16;卷積層與池化層的特征邊緣處理方法有不填充與前后補零2 種,不填充即忽略最后未卷積的區(qū)域并降低特征圖尺寸,前后補零方式可以使最后輸出的特征圖尺寸和原圖尺寸一致。本研究選用前后補零的特征邊緣處理方法,可保證輸入與輸出特征圖尺寸Sc一致。輸出特征圖的尺寸計算公式如下:
式中:Co為輸出通道數(shù);Ho、Io分別為輸出特征圖的高和寬;Hi、Ii分別為輸入特征圖的高和寬;F1與F2分別為卷積核的高與寬;M為步長;P1、P2分別為補零的行數(shù)和列數(shù)。經(jīng)過計算,特征邊緣處理后的特征圖尺寸始終保持為6×1×1。
第三層為批量歸一化層(Batch norm)[40],該層對訓(xùn)練樣本進行局部歸一化,加快模型的收斂與運算速度,并且使模型更加穩(wěn)定。本研究對是否添加批量歸一化層進行對比訓(xùn)練,結(jié)果顯示,添加該層后預(yù)測準(zhǔn)確率略微提高,運算速度顯著提高。
第四層為激活函數(shù)層1(ReLU_1),激活函數(shù)通過添加非線性因素的方法捕捉非線性信息,進一步提高線性模型的表達能力,常用的激活函數(shù)有[41-42]:(1) Sigmoid 函數(shù),該函數(shù)在其飽和時的梯度值相對低下,梯度的耗散問題將會隨著模型中神經(jīng)網(wǎng)絡(luò)層數(shù)的增多而嚴(yán)重;(2) Tanh 函數(shù),該函數(shù)的缺點是仍然具有飽和的問題;(3) ReLU 函數(shù),可有效解決Sigmoid 函數(shù)所存在的梯度耗散問題,網(wǎng)絡(luò)稀疏性較大從而降低Tanh 函數(shù)存在的飽和問題,且運算效率高。3 個函數(shù)公式分別如下:
以訓(xùn)練樣本的預(yù)測準(zhǔn)確率為校驗?zāi)繕?biāo)對各激活函數(shù)進行模型訓(xùn)練,結(jié)果如圖5 所示。觀察圖5,以ReLU 函數(shù)進行模型訓(xùn)練的準(zhǔn)確率均較高,特別地,訓(xùn)練集準(zhǔn)確率達到100%,故本研究選取ReLU 函數(shù)作為激活層函數(shù)。
圖5 激活函數(shù)的選取Fig.5 Activation function selection
第五層為池化層1(Maxpool_1),常用的池化方法有平均池化法與最大池化法。平均池化法能夠最大限度地保留數(shù)據(jù)背景信息,最大池化法能夠盡可能地提取數(shù)據(jù)的特征紋理,本研究期望能夠挖掘到更多的數(shù)據(jù)特征,故選取最大池化法進行池化操作。池化核與步長的確定過程類似于卷積層卷積核與步長的確定過程,確定本研究池化核大小為3×1,步長為1,特征邊緣處理方法選擇前后補零。
第六層為卷積層2(Conv_2),由大小為3×1 的卷積核以1 的步長進行卷積操作,生成32 幅特征圖,特征邊緣處理方法選擇前后補零。第七層為批量歸一化層。第八層為激活函數(shù)層2。第九層為池化層2(Maxpool_2),特征邊緣處理方法選擇前后補零。
第十層為全連接層(FC),將上一層數(shù)據(jù)展開,經(jīng)過激活函數(shù)Softmax 激活后挖掘特征信息,得到4 類輸出,即巖爆烈度的4 個等級。本研究所建立的CNN神經(jīng)網(wǎng)絡(luò)共有12 層,各層參數(shù)見表3。
表3 CNN 網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)Table 3 Structural parameters of CNN
2) 超參數(shù)優(yōu)選
優(yōu)化器的選擇方面,目前常用且性能優(yōu)秀的優(yōu)化器有3 種:SGDM、RMSProp 和Adam[43]。SGDM 在梯度下降的過程中引入一階動量解決了可能僅找到局部最優(yōu)點而不是全局最優(yōu)的缺陷;RMSProp 加入了迭代衰減,不會在迭代過程中梯度下降過大使自適應(yīng)梯度出現(xiàn)變化異常等現(xiàn)象;Adam 結(jié)合了前2 種優(yōu)化器的優(yōu)點,在提高自適應(yīng)學(xué)習(xí)率、尋找全局最優(yōu)點等方面皆較為突出。以訓(xùn)練樣本的預(yù)測準(zhǔn)確率為校驗?zāi)繕?biāo),對RMSProp、SGDM 與Adam 進行模型訓(xùn)練,結(jié)果如圖6 所示,經(jīng)對比,Adam 能夠在較少的訓(xùn)練次數(shù)下達到較高的預(yù)測準(zhǔn)確率,故本研究選用Adam 優(yōu)化器進行模型優(yōu)化。
圖6 優(yōu)化器的選取Fig.6 Optimizer selection
由圖6 可知,訓(xùn)練次數(shù)達到200 時,預(yù)測準(zhǔn)確率便不再升高,繼續(xù)升高訓(xùn)練次數(shù)只會延長模型訓(xùn)練時間,故本研究的最大訓(xùn)練次數(shù)選為200。預(yù)測模型的超參數(shù)詳見表4。
表4 預(yù)測模型超參數(shù)Table 4 Prediction model hyperparameter
將本研究構(gòu)造的CNN 神經(jīng)網(wǎng)絡(luò)與選取的超參數(shù)相結(jié)合建立巖爆烈度等級預(yù)測模型,輸入訓(xùn)練樣本進行訓(xùn)練,訓(xùn)練集預(yù)測結(jié)果如圖7a 所示,驗證集預(yù)測結(jié)果如圖7b 所示。由兩圖可得,訓(xùn)練集預(yù)測準(zhǔn)確率達到100.00%;驗證集的預(yù)測準(zhǔn)確率達到91.67%,其中第七組真實值為弱巖爆,而預(yù)測值為中等巖爆,其他組預(yù)測結(jié)果均正確,錯誤率在合理范圍內(nèi)。由訓(xùn)練樣本預(yù)測結(jié)果可得,本研究所建立的CNN 巖爆烈度等級預(yù)測模型是合理可行的。
圖7 訓(xùn)練集與驗證集預(yù)測結(jié)果Fig.7 Prediction results of the training set and verification set
為進一步說明模型的可行性,將包含12 組數(shù)據(jù)的測試集分別輸入本次所建立的CNN 預(yù)測模型和3 個對比模型:RBF、SVM 與PNN 模型中進行預(yù)測,預(yù)測結(jié)果見表5。觀察各模型預(yù)測結(jié)果準(zhǔn)確率可知,CNN模型的預(yù)測結(jié)果準(zhǔn)確率最高,僅第9 組數(shù)據(jù)預(yù)測錯誤,其他組皆能夠正確預(yù)測巖爆烈度等級。
表5 各個模型的預(yù)測結(jié)果與準(zhǔn)確率Table 5 Prediction results and accuracy of each model
CNN 模型測試集混淆矩陣[44]如圖8a 所示。圖中可以看到有一組現(xiàn)場案例的實際結(jié)果為中等巖爆,而模型預(yù)測結(jié)果誤判為強烈?guī)r爆,預(yù)測結(jié)果略高一級,雖在應(yīng)急防治方面會消耗更多的人力物力,但在誤判的情況下依然能夠保證現(xiàn)場工作人員的生命安全。
圖8 CNN 與PNN 測試集混淆矩陣Fig.8 Confusion matrix of CNN and PNN test set
PNN 模型測試集混淆矩陣如圖8b 所示。PNN 預(yù)測模型的準(zhǔn)確率與CNN 模型相近,但觀察混淆矩陣,有2 組現(xiàn)場案例的實際結(jié)果為中等巖爆,而模型預(yù)測結(jié)果分別誤判為一組無巖爆與一組弱巖爆。當(dāng)誤判為弱巖爆時,現(xiàn)場人員的準(zhǔn)備與預(yù)防措施不夠充分,難以保障人身與財產(chǎn)的安全;而當(dāng)誤判為無巖爆時,巖爆災(zāi)害將對施工現(xiàn)場造成極大的破壞并嚴(yán)重危害工作人員的生命,造成巨大的財產(chǎn)損失。
通過以上分析可以得到,本研究所建立的基于CNN 的預(yù)測模型是可行的,且具有準(zhǔn)確率高、安全系數(shù)高等優(yōu)點。由于現(xiàn)場數(shù)據(jù)收集較為困難,缺乏地下水、微震、聲發(fā)射等影響巖爆的關(guān)鍵因素與動態(tài)指標(biāo);需要收集與應(yīng)用的現(xiàn)場數(shù)據(jù)量需進一步擴大,未來需要結(jié)合更多案例與更多影響指標(biāo)進行綜合研究。
a.建立巖爆烈度等級預(yù)測指標(biāo)體系,對原始數(shù)據(jù)進行基于拉依達準(zhǔn)則的異常值剔除與MICE 的缺失值填補,建立RF、BLR、ET、KNN 4 種插補模型并結(jié)合2 種傳統(tǒng)插補方法,依據(jù)ERMS評價指標(biāo)優(yōu)選MICE 的估計器,其中,ET 模型得到的觀測值與真值偏差最小,能夠保證模型預(yù)測的準(zhǔn)確度。
b.搭建CNN 神經(jīng)網(wǎng)絡(luò)初始框架,確定卷積核和池化核大小、特征邊緣處理方法與激活函數(shù)等;優(yōu)化模型超參數(shù),確定優(yōu)化器函數(shù)等,提高了模型預(yù)測準(zhǔn)確率,降低了運算時間,增強了模型的適用性。運用訓(xùn)練樣本對模型進行訓(xùn)練,訓(xùn)練集準(zhǔn)確率為100.00%,驗證集準(zhǔn)確率為91.67%。
c.建立基于RBF、SVM 與PNN 對比模型,并對實例應(yīng)用結(jié)果進行綜合分析顯示,基于CNN 的巖爆烈度等級預(yù)測模型準(zhǔn)確率最高,為91.67%。對比CNN與PNN 模型的混淆矩陣得到,在誤判的情況下CNN預(yù)測模型安全性更高。
d.未來需進一步擴大用來建立指標(biāo)體系與預(yù)測模型的現(xiàn)場數(shù)據(jù)量,結(jié)合現(xiàn)場案例的更多影響因素進行綜合分析。有必要運用先進算法進行超參數(shù)優(yōu)化,建立成熟的深度學(xué)習(xí)模型對巖爆災(zāi)害進行精確預(yù)測。