巴澤群 * 周玉鋒 周其勛 ** 周立成 * 劉逸平 * 劉澤佳 * 湯立群 *
*(華南理工大學(xué)土木與交通學(xué)院,亞熱帶建筑與城市科學(xué)全國(guó)重點(diǎn)實(shí)驗(yàn)室,廣州 510640)
?(廣州廣佛肇高速公路有限公司,廣州 510289)
**(廣州市高速公路有限公司,廣州 510030)
喀斯特地貌廣泛分布在我國(guó)西南部和中部地區(qū)。這種地貌是由地下水對(duì)可溶性巖石進(jìn)行溶蝕、沉積等作用形成的,因此容易產(chǎn)生地下溶洞等地質(zhì)現(xiàn)象。在實(shí)際工程中,溶洞會(huì)影響樁基施工安全,嚴(yán)重時(shí)可能導(dǎo)致地面坍塌。因此,在施工前了解地下環(huán)境并排除溶洞等安全隱患,有助于確保施工安全并減少經(jīng)濟(jì)損失。
目前,傳統(tǒng)溶洞探測(cè)方法包括鉆孔取樣法、彈性波CT 法[1]、地震反射波法[2-4]等機(jī)械類方法以及電磁波跨孔CT 法[5]、探地雷達(dá)法[1]、高密度電法[1]、電阻率層析法[6-8]、瞬態(tài)電磁場(chǎng)法[1,9]等電磁類方法。這些方法技術(shù)成熟且應(yīng)用廣泛,但仍存在著一些缺點(diǎn),如主要以二維截面探測(cè)為主,數(shù)據(jù)反演和解釋需要依賴專業(yè)知識(shí)和專家經(jīng)驗(yàn)等。亦有方法可進(jìn)行三維溶洞形態(tài)反演[10],但該方法建立在已對(duì)溶洞進(jìn)行定位的前提下,且數(shù)據(jù)反演較復(fù)雜。因此,傳統(tǒng)溶洞探測(cè)方法在探測(cè)效率、經(jīng)濟(jì)成本、時(shí)間成本和智能化方面亟待改進(jìn)。
在地質(zhì)勘探領(lǐng)域,已有部分學(xué)者利用智能方法開(kāi)展了一些探索性的研究工作。例如,Zhang 等[11]使用U-NET 網(wǎng)絡(luò)實(shí)現(xiàn)地球物理勘探信息的智能反演;Di 等[12]基于支持向量機(jī)/多層感知機(jī)等機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)地震數(shù)據(jù)的智能解釋和反演;Zheng 等[13]用主成分分析、K 聚類和線性判別式分析方法,使用聲速信號(hào)、電阻率、密度、孔徑數(shù)據(jù)等測(cè)井相信息進(jìn)行地層類型的預(yù)測(cè)和識(shí)別;Xiong 等[14]使用深度自編碼網(wǎng)絡(luò)推斷礦物儲(chǔ)備情況;Huang 等[15]基于交叉小波變換處理振動(dòng)時(shí)序信號(hào)獲得振動(dòng)相位譜和功率譜,并通過(guò)卷積神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行爆破位置的預(yù)測(cè);Li 等[16]使用地震屬性數(shù)據(jù)結(jié)合隨機(jī)森林、遺傳算法–支持向量機(jī)等機(jī)器學(xué)習(xí)方法,實(shí)現(xiàn)了煤層地下結(jié)構(gòu)的預(yù)測(cè);Yang等[17]基于卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等算法,通過(guò)振動(dòng)信號(hào)的時(shí)頻特征對(duì)地震源深度進(jìn)行了識(shí)別。這些研究使用了人工智能方法代替人工數(shù)據(jù)反演與解釋,表明了人工智能方法在地質(zhì)勘探領(lǐng)域的可行性和應(yīng)用潛力。
本文作者團(tuán)隊(duì)在前期對(duì)高效、智能的溶洞探測(cè)技術(shù)進(jìn)行了初步研究,提出了一種適用于單一土層環(huán)境的基于機(jī)器學(xué)習(xí)算法的球形溶洞定量探測(cè)方法[18]。在此基礎(chǔ)上,本文將研究場(chǎng)景推廣到更符合實(shí)際工程的多層巖土環(huán)境,并設(shè)計(jì)了基于(bidirectional long short-term memory, BiLSTM)神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型來(lái)實(shí)現(xiàn)多層巖土環(huán)境下的溶洞三維定量智能探測(cè)。本文技術(shù)路線如圖1所示,主要步驟如下:(1)借鑒淺層地震反射波法,建立含有單個(gè)無(wú)填充球形孔洞的多層巖土結(jié)構(gòu)模型,并計(jì)算樁錘激振下地表的加速度響應(yīng)信號(hào);(2)基于應(yīng)力波傳播的基本原理對(duì)響應(yīng)信號(hào)進(jìn)行分析以提取特征數(shù)據(jù);(3)針對(duì)不同溶洞工況進(jìn)行大量建模,構(gòu)建用于深度學(xué)習(xí)的數(shù)據(jù)集;(4)設(shè)計(jì)并優(yōu)化深度學(xué)習(xí)模型,實(shí)現(xiàn)多層巖土環(huán)境下溶洞的三維位置和大小的定量智能識(shí)別。本文提出的深度學(xué)習(xí)模型可不依賴于專業(yè)知識(shí)和專家經(jīng)驗(yàn),為高效、智能化的溶洞探測(cè)方法的工程應(yīng)用奠定基礎(chǔ)。
圖1 技術(shù)路線Fig.1 Technical roadmap
在實(shí)際工程中,大部分地下巖土體為分層的多層結(jié)構(gòu),具有多樣的巖土層種類和復(fù)雜的巖土層分布,這導(dǎo)致多層巖土環(huán)境下對(duì)溶洞大小和位置的預(yù)測(cè)變得非常困難。由于獲得實(shí)測(cè)數(shù)據(jù)需要高昂的經(jīng)濟(jì)成本和時(shí)間成本,本文采用有限元方法對(duì)多層巖土環(huán)境下的大量溶洞工況進(jìn)行建模,從而構(gòu)建不同溶洞工況下的響應(yīng)數(shù)據(jù)庫(kù),為基于深度學(xué)習(xí)的溶洞定量識(shí)別方法的探索奠定基礎(chǔ)。
本文的建模過(guò)程參考了廣東省廣州市廣佛肇高速公路SG03 段的地質(zhì)勘探數(shù)據(jù),根據(jù)其地勘數(shù)據(jù)對(duì)巖土層種類、巖土層組合以及各層巖土的厚度變化范圍進(jìn)行建模。本文建立的有限元模型如圖2(a)所示。其中,整個(gè)巖土體模型為一個(gè)邊長(zhǎng)30 m 的立方體,分為8 層,按照從上往下的順序進(jìn)行編號(hào),1~6 層為土層,7~8 層為巖層。為簡(jiǎn)化建模過(guò)程,土層和巖層均設(shè)置為各向同性、均勻密實(shí)的材料,且土層采用Mohr–Columb 本構(gòu)模型,巖層采用Drucker–Prager 本構(gòu)模型,詳細(xì)參數(shù)見(jiàn)表1。同時(shí),為簡(jiǎn)化模型,假設(shè)土體內(nèi)含一個(gè)無(wú)填充、真空的球形孔洞。激振源使用一個(gè)高度0.5 m,直徑1.5 m,重約6.8 t 的圓柱形樁,其材料采用線彈性本構(gòu),密度為7800 kg/m3,彈性模量為200 GPa,泊松比為0.3。激振形式采用樁錘自由下落的方式,撞擊地表時(shí)的速度設(shè)為4.42 m/s。如圖2(b)所示,為了獲取地表的加速度響應(yīng),以激振點(diǎn)為圓心,在距離其10 m 的采樣圓上均勻布置6 個(gè)加速度傳感器,按照順時(shí)針?lè)较蛞来尉幪?hào)為1~6 號(hào),且傳感器的采樣頻率為1000 Hz,采樣時(shí)間為0.6 s。值得注意的是,為了防止應(yīng)力波在模型邊界上的反射,土體側(cè)面和底面設(shè)置為無(wú)限元邊界。
表1 巖土層分布示例Table 1 Example of rock-soil structure
圖2 有限元模型示意圖Fig.2 Diagram of finite element model
如表2 所示,球形孔洞參數(shù)包括洞頂與激振線之間的水平偏移距離、洞頂深度和孔洞直徑。其中,洞頂水平偏移距離的取值范圍為1~10 m,取值間隔為1 m;洞頂深度取值范圍為5~21 m,取值間隔為3 m;孔洞直徑取值范圍為1~10 m,取值間隔為1 m。上述3 個(gè)取值變量依照取值要求隨機(jī)組合,生成大量涵蓋不同孔洞工況的模型。同時(shí),如表3 所示,設(shè)置9 種典型的多層巖土結(jié)構(gòu),與表2 的孔洞模型隨機(jī)組合,即可構(gòu)建9 種不同巖土結(jié)構(gòu)下含有不同孔洞工況的海量模型。
表2 溶洞工況設(shè)置Table 2 Settings of karst cave parameters
表3 巖土層結(jié)構(gòu)設(shè)置Table 3 Settings of rock–soil structures
通過(guò)統(tǒng)計(jì),每個(gè)有限元算例在搭載了Intel Core i5-10400F 型CPU 的計(jì)算機(jī)上的計(jì)算時(shí)間平均為5 h 以上。因此,構(gòu)建數(shù)據(jù)集需要大量的算力和時(shí)間開(kāi)銷。針對(duì)有限元算例計(jì)算時(shí)間長(zhǎng)的問(wèn)題,本文將有限元算例進(jìn)行等效工況擴(kuò)充。具體地,如圖2(c)所示,虛線圓框代表溶洞,藍(lán)色圓和綠色圓分別代表兩組加速度傳感器,藍(lán)色對(duì)應(yīng)x – y坐標(biāo)系,綠色對(duì)應(yīng)x′-y′坐標(biāo)系??梢钥闯?,以不同坐標(biāo)系描述的同一個(gè)溶洞具有不同的空間位置。因此,對(duì)于一個(gè)有限元算例,本文在其加速度采樣的圓圈上均布了288 個(gè)節(jié)點(diǎn),即每隔1.25°方位角布置一個(gè)加速度傳感器,進(jìn)而通過(guò)旋轉(zhuǎn)變換采樣不同的傳感器組合(6 個(gè)為一組)的方式來(lái)擴(kuò)充溶洞工況數(shù)據(jù),即每一個(gè)有限元算例可以等效擴(kuò)充為288 個(gè)工況。最終,每種巖土結(jié)構(gòu)對(duì)應(yīng)的溶洞工況數(shù)大致相同,平均約包含2880 條數(shù)據(jù)工況,總數(shù)據(jù)量為25 344 條。
為了提高深度學(xué)習(xí)模型的識(shí)別效果,本文基于應(yīng)力波反射的基本原理,對(duì)地表加速度響應(yīng)信號(hào)進(jìn)行特征工程,力求挖掘與預(yù)測(cè)目標(biāo)相關(guān)性強(qiáng)的特征并作為模型的輸入,從而提高模型的預(yù)測(cè)精度。
地下多層巖土結(jié)構(gòu)中存在許多波阻抗界面,如巖土層分界面、溶洞表面等,當(dāng)應(yīng)力波遇到這些界面時(shí),會(huì)發(fā)生反射現(xiàn)象。因此,可通過(guò)計(jì)算特征界面的應(yīng)力波反射信號(hào)的行程與時(shí)間,捕捉受溶洞和地下巖土體結(jié)構(gòu)影響的加速度信號(hào),進(jìn)而進(jìn)行特征工程。
首先,對(duì)于不含水的各向同性致密巖土體,其縱波波速的計(jì)算公式為
式中,vp為縱波波速,ν為泊松比,E為彈性模量,ρ為密度?;谑剑?),結(jié)合巖土體結(jié)構(gòu)中各層的厚度,可以估算不同界面應(yīng)力波反射信號(hào)的行程和走時(shí)。應(yīng)力波傳播路徑示意圖如圖3所示,其中圖3(a)展示了應(yīng)力波被激發(fā)后傳播至巖土層交界面被反射回地表并被傳感器接收的過(guò)程;圖3(b)展示了應(yīng)力波被激發(fā)后傳播至溶洞頂點(diǎn)被反射回地表并被傳感器接收的過(guò)程??疾鞄r土層界面反射情況時(shí),取傳感器與激振點(diǎn)連線的中位線與各巖土層交界點(diǎn)的位置作為反射參考點(diǎn),以計(jì)算應(yīng)力波的行程??疾烊芏幢砻娣瓷淝闆r時(shí),近似取溶洞洞頂作為反射參考點(diǎn)進(jìn)行計(jì)算。以一列應(yīng)力波的傳播過(guò)程分析作為示例,對(duì)于任意傳感器m,其自激振作用起到接收到巖土層界面反射信號(hào)的時(shí)間可按式(2)進(jìn)行計(jì)算
圖3 應(yīng)力波路徑示意Fig.3 Diagram of stress wave propagation
對(duì)于任意傳感器m,其自激振作用起到接收到溶洞洞頂反射應(yīng)力波的時(shí)間可按公式(3)進(jìn)行估算
其中,x,y,z代表溶洞洞頂反射點(diǎn)的空間坐標(biāo);xr,yr和zr代表巖土層反射點(diǎn)r 的空間坐標(biāo);xm,ym和zm代表傳感器m 的空間坐標(biāo)。hi代表應(yīng)力波經(jīng)過(guò)巖土層i的垂直距離,vpi代表巖土層i中縱波的波速?;谑剑?)和式(3),本文計(jì)算了各個(gè)巖土層交界面和溶洞洞頂?shù)膽?yīng)力波反射信號(hào)的接收時(shí)間,如表4 所示。其中包含了洞頂深度為2 m,6 m 和10 m 的溶洞模型的計(jì)算結(jié)果,所含溶洞的半徑均為2 m。圖4(a)給出了不同溶洞工況下的多層巖土體結(jié)構(gòu)加速度響應(yīng),其中黑色曲線為無(wú)溶洞情況下的多層巖土結(jié)構(gòu)的加速度響應(yīng)時(shí)程曲線,紅色、藍(lán)色和綠色曲線為溶洞深度遞增的多層巖土結(jié)構(gòu)的響應(yīng)時(shí)程曲線,且4 條圖線所對(duì)應(yīng)的巖土體分層情況一致。
表4 反射信號(hào)走時(shí)Table 4 Travel time of reflected stress wave
圖4 加速度響應(yīng)信號(hào)對(duì)比Fig.4 Contrast of acceleration response signals
綜合表4 和圖4(a)的結(jié)果可知,巖土層界面反射信號(hào)和溶洞洞頂反射信號(hào)的接收時(shí)間與加速度時(shí)序信號(hào)的波峰波谷時(shí)間接近,雖然無(wú)法準(zhǔn)確說(shuō)明每個(gè)波峰波谷包含哪些反射波成分,但是可以推斷在加速度曲線的極值數(shù)據(jù)中蘊(yùn)含著與巖土層界面位置和溶洞深度等相關(guān)的信息。同時(shí),若溶洞直徑增大,其反射面增大,響應(yīng)信號(hào)波峰波谷對(duì)應(yīng)的加速度大小以及所對(duì)應(yīng)的時(shí)間會(huì)相應(yīng)發(fā)生變化。因此,可以提取加速度信號(hào)的極值數(shù)據(jù)作為輸入數(shù)據(jù)的特征。具體地,將每個(gè)工況下的6 個(gè)傳感器的時(shí)序信號(hào)的極值點(diǎn)全部提取出來(lái),并按照出現(xiàn)的先后順序進(jìn)行排列,形成極值序列數(shù)據(jù)。通過(guò)統(tǒng)計(jì),平均每個(gè)加速度時(shí)序信號(hào)包含19 個(gè)極值點(diǎn),故極值特征的數(shù)據(jù)格式為[19, 6]。由以上的分析可知,極值特征與溶洞的深度和大小有較強(qiáng)的相關(guān)性。
圖4(b)展示了對(duì)應(yīng)于一個(gè)含有溶洞的多層巖土結(jié)構(gòu)的一組傳感器的時(shí)序信號(hào),其中溶洞洞頂?shù)乃狡凭嚯x為5 m,溶洞半徑為2 m。觀察不同傳感器的時(shí)序信號(hào)可知,由于傳感器空間方位的不同,傳感器接收的響應(yīng)信號(hào)也有一定的差異,這種差異來(lái)源于傳感器與溶洞的不同距離??梢酝茢啵煌臻g方位的傳感器采集的加速度時(shí)序信號(hào)蘊(yùn)含著溶洞的位置特征信息,即可以提取一組6 個(gè)不同空間位置傳感器的時(shí)序信號(hào),作為輸入數(shù)據(jù)的時(shí)空特征。具體地,首先提取每個(gè)傳感器采樣信號(hào)的0.15~0.60 s 時(shí)間段的加速度數(shù)據(jù),然后按照傳感器編號(hào)順序即空間位置順序排列時(shí)序信號(hào),得到格式為[6, 451]的時(shí)序數(shù)據(jù)作為后續(xù)深度學(xué)習(xí)模型的輸入。
深度學(xué)習(xí)是人工智能研究領(lǐng)域的重要方法,其基本原理是通過(guò)搭建人工神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò),建立輸入與輸出的映射關(guān)系,解決各種模式識(shí)別問(wèn)題。目前,深度學(xué)習(xí)方法廣泛應(yīng)用于文本翻譯、圖像識(shí)別、時(shí)間序列預(yù)測(cè)等領(lǐng)域。其中,BiLSTM 作為循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)的一種改進(jìn)模型,有著強(qiáng)大的時(shí)間序列數(shù)據(jù)學(xué)習(xí)能力??紤]到本文提取了以時(shí)間序列數(shù)據(jù)為主的輸入特征,因此引入BiLSTM 網(wǎng)絡(luò),以BiLSTM 網(wǎng)絡(luò)為核心模塊設(shè)計(jì)了雙數(shù)據(jù)通道的分離架構(gòu)網(wǎng)絡(luò)模型,對(duì)多層巖土環(huán)境下的不同溶洞工況進(jìn)行定量識(shí)別。
BiLSTM 由兩條方向相反的長(zhǎng)短期記憶(long short-term memory, LSTM)神經(jīng)網(wǎng)絡(luò)構(gòu)成,其結(jié)構(gòu)如圖5(a)所示,可以從正反兩個(gè)方向?qū)W習(xí)時(shí)間序列的特征。LSTM 網(wǎng)絡(luò)的基本單元為L(zhǎng)STM 神經(jīng)元,其基本原理如圖5(b)所示。其中,LSTM 神經(jīng)元由遺忘門(mén)ft,輸入門(mén)it,輸出門(mén)ot和細(xì)胞臨時(shí)狀態(tài)Ct~組成。LSTM 神經(jīng)元將上一時(shí)刻的輸出值ht?1和本時(shí)刻的輸入值xt進(jìn)行矩陣拼接,并將拼接矩陣激活后得到遺忘門(mén)、輸入門(mén)、細(xì)胞臨時(shí)狀態(tài)和輸出門(mén)。遺忘門(mén)控制上一時(shí)刻細(xì)胞狀態(tài)Ct?1的信息流入;輸入門(mén)決定了本時(shí)刻的細(xì)胞臨時(shí)狀態(tài)Ct~對(duì)本時(shí)刻細(xì)胞狀態(tài)Ct的影響程度;輸出門(mén)決定了LSTM 神經(jīng)元的輸出值。將LSTM 神經(jīng)元連接起來(lái),通過(guò)細(xì)胞狀態(tài)的傳播,即可實(shí)現(xiàn)序列數(shù)據(jù)的長(zhǎng)時(shí)記憶,從而全面、完整地提取時(shí)間序列的特征。
圖5 BiLSTM 示意圖Fig.5 Diagram of BiLSTM
本文采用BiLSTM 網(wǎng)絡(luò)作為多層巖土環(huán)境下溶洞識(shí)別深度學(xué)習(xí)模型的核心模塊,基于該網(wǎng)絡(luò)設(shè)計(jì)了如圖6(a)所示的雙數(shù)據(jù)通道融合架構(gòu)、如圖6(b)所示的雙數(shù)據(jù)通道分離架構(gòu)和如圖6(c)所示的單數(shù)據(jù)通道架構(gòu)。如圖6(a)所示,兩支通道的輸入數(shù)據(jù)分別為時(shí)序信號(hào)序列和極值特征,其分別通過(guò)BiLSTM 網(wǎng)絡(luò)層提取特征,隨之與多層全連接網(wǎng)絡(luò)連接,在相鄰網(wǎng)絡(luò)層間設(shè)置隨機(jī)失活層(dropout)以避免網(wǎng)絡(luò)過(guò)擬合,最后進(jìn)行兩個(gè)通道特征矩陣的拼接融合,并通過(guò)全連接層得到最后的預(yù)測(cè)結(jié)果。預(yù)測(cè)結(jié)果為4 個(gè)標(biāo)簽X,Y,Z和D,分別對(duì)應(yīng)了溶洞洞頂?shù)娜S坐標(biāo)和溶洞直徑。其網(wǎng)絡(luò)各層神經(jīng)元個(gè)數(shù)及激活函數(shù)設(shè)置如表5 所示。如圖6(b)所示,雙通道分離架構(gòu)的輸入數(shù)據(jù)分為兩支,分別為時(shí)序信號(hào)序列和極值特征,兩支數(shù)據(jù)通道的訓(xùn)練同步進(jìn)行。且兩支數(shù)據(jù)通道的網(wǎng)絡(luò)層神經(jīng)元權(quán)重、偏置等網(wǎng)絡(luò)參數(shù)的更新優(yōu)化互不影響,其中以時(shí)序信號(hào)序列為輸入的分支對(duì)應(yīng)的輸出為溶洞洞頂水平坐標(biāo)X,Y;以極值特征為輸入的分支對(duì)應(yīng)的輸出為溶洞洞頂深度Z和溶洞的直徑D。該網(wǎng)絡(luò)架構(gòu)的各個(gè)網(wǎng)絡(luò)層神經(jīng)元個(gè)數(shù)與激活函數(shù)設(shè)置如表6 所示。圖6(c)上部展示了以時(shí)序信號(hào)序列為輸入的單數(shù)據(jù)通道架構(gòu),其通過(guò)BiLSTM 層提取特征后,隨之連接多層全連接層,同時(shí)在相鄰全連接層間設(shè)置隨機(jī)失活層(dropout),最終輸出溶洞洞頂?shù)目臻g坐標(biāo)X,Y,Z和溶洞的直徑D;圖6(c)下部為以極值特征為輸入的單數(shù)據(jù)通道架構(gòu),其網(wǎng)絡(luò)設(shè)置與以時(shí)序信號(hào)序列為輸入的單通道架構(gòu)相同。單通道架構(gòu)的各層神經(jīng)元個(gè)數(shù)與激活函數(shù)設(shè)置如表7所示。
表5 雙通道融合架構(gòu)參數(shù)設(shè)置Table 5 Settings of dual-channel fusion architecture
表6 雙通道分離架構(gòu)參數(shù)設(shè)置Table 6 Settings of dual-channel separated architecture
表7 單通道架構(gòu)參數(shù)設(shè)置Table 7 Settings of single-channel architecture
圖6 不同網(wǎng)絡(luò)架構(gòu)Fig.6 Different model architectures
基于9 種巖土結(jié)構(gòu)下共25 344 個(gè)工況的數(shù)據(jù)集,以8:2 的數(shù)據(jù)量比例劃分訓(xùn)練集與測(cè)試集。其中,訓(xùn)練集數(shù)據(jù)量為20 275 條,測(cè)試集數(shù)據(jù)量為5069 條。從訓(xùn)練集中劃分出10%的數(shù)據(jù)作為驗(yàn)證集,并在訓(xùn)練集上訓(xùn)練數(shù)據(jù),在驗(yàn)證集上觀察模型訓(xùn)練效果,在測(cè)試集上檢驗(yàn)預(yù)測(cè)效果。在訓(xùn)練過(guò)程中,選擇平均平方誤差(meansquare error, MSE)作為損失函數(shù),其表達(dá)式為
其中,ypi表示第i個(gè)數(shù)據(jù)的預(yù)測(cè)值,yti表示第i個(gè)數(shù)據(jù)的真實(shí)值,n代表總數(shù)據(jù)量。網(wǎng)絡(luò)優(yōu)化器選擇Adam 優(yōu)化器,其算法由Kingma 等[19]提出,能夠?qū)崿F(xiàn)自適應(yīng)學(xué)習(xí)率調(diào)節(jié),并且初始學(xué)習(xí)率設(shè)置為0.001。網(wǎng)絡(luò)訓(xùn)練輪次上限設(shè)置為500 次,收斂條件為:若連續(xù)20 次訓(xùn)練迭代后,驗(yàn)證集的MSE 減小值小于0.1,則模型達(dá)到收斂,訓(xùn)練終止。平均每個(gè)網(wǎng)絡(luò)模型訓(xùn)練10 次,每次訓(xùn)練結(jié)果相互獨(dú)立。
圖7(a)展示了雙通道融合架構(gòu)訓(xùn)練過(guò)程中損失函數(shù)的變化情況,可以看出損失函數(shù)穩(wěn)定下降,收斂程度良好;圖7(b)展示了雙通道分離架構(gòu)的情況,其損失函數(shù)下降速度先快后慢,最終收斂;圖7(c)和圖7(d)分別展示了單通道架構(gòu)(時(shí)序信號(hào)序列)和單通道架構(gòu)(極值特征)的訓(xùn)練情況,其中單通道架構(gòu)(極值特征)的收斂狀態(tài)下的損失函數(shù)值約為3,相比其他網(wǎng)絡(luò)訓(xùn)練效果較差。由圖7 可知,4 種網(wǎng)絡(luò)架構(gòu)模型都能較好收斂。雙通道架構(gòu)的收斂效果更優(yōu),以雙通道分離架構(gòu)網(wǎng)絡(luò)模型的收斂程度為最好。
圖7 各網(wǎng)絡(luò)訓(xùn)練效果可視化Fig.7 Visualization of training process
本文提出的多層巖土環(huán)境下溶洞識(shí)別模型的識(shí)別目標(biāo)為溶洞的三維位置和大小,因此評(píng)價(jià)網(wǎng)絡(luò)性能的標(biāo)準(zhǔn)是溶洞參數(shù)的預(yù)測(cè)準(zhǔn)確率,對(duì)溶洞預(yù)測(cè)準(zhǔn)確與否的標(biāo)準(zhǔn)所示為
其中,r表示容許誤差,下標(biāo)pred 和true 分別表示預(yù)測(cè)值和真實(shí)值。當(dāng)預(yù)測(cè)結(jié)果同時(shí)滿足式(5)~式(8)時(shí),可判定模型完成了溶洞工況的準(zhǔn)確預(yù)測(cè);當(dāng)預(yù)測(cè)結(jié)果滿足上述任一公式條件時(shí),可判定該模型對(duì)于溶洞的對(duì)應(yīng)參數(shù)預(yù)測(cè)準(zhǔn)確。模型的預(yù)測(cè)準(zhǔn)確率計(jì)算式為
其中,Ntrue表示預(yù)測(cè)準(zhǔn)確的樣本數(shù),Ntotal表示參與預(yù)測(cè)的總樣本數(shù)。
本節(jié)對(duì)基于BiLSTM 的雙數(shù)據(jù)通道分離架構(gòu)、雙數(shù)據(jù)通道融合架構(gòu)和單數(shù)據(jù)通道架構(gòu)模型開(kāi)展對(duì)比分析,各模型在3 m 容差下的預(yù)測(cè)結(jié)果如表8 所示。其中,雙通道分離架構(gòu)網(wǎng)絡(luò)在3 m 容差下的綜合預(yù)測(cè)準(zhǔn)確率最高,達(dá)到了98.23%,高于雙通道融合架構(gòu)網(wǎng)絡(luò)的95.95%綜合預(yù)測(cè)準(zhǔn)確率、以時(shí)序信號(hào)作為輸入的單通道架構(gòu)網(wǎng)絡(luò)的95.51%綜合預(yù)測(cè)準(zhǔn)確率和以極值特征為輸入的單通道架構(gòu)的17.99%綜合預(yù)測(cè)準(zhǔn)確率。對(duì)比雙通道分離架構(gòu)和雙通道融合架構(gòu)的預(yù)測(cè)結(jié)果,可知雙通道分離架構(gòu)充分利用了時(shí)序信號(hào)與溶洞坐標(biāo)X和Y的相關(guān)性以及極值特征與溶洞深度Z和溶洞大小D的相關(guān)性,且雙通道分離架構(gòu)無(wú)需特征融合,規(guī)避了雙通道融合架構(gòu)特征融合困難、依賴調(diào)參的缺點(diǎn)。觀察雙通道分離架構(gòu)網(wǎng)絡(luò)模型與以極值特征為輸入的單通道架構(gòu)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果,可知極值特征與溶洞深度Z和溶洞大小D的相關(guān)性較強(qiáng),與溶洞水平位置X和Y的相關(guān)性較弱。觀察基于時(shí)序信號(hào)的單通道架構(gòu)網(wǎng)絡(luò)綜合預(yù)測(cè)結(jié)果,其預(yù)測(cè)準(zhǔn)確率相較雙通道融合架構(gòu)網(wǎng)絡(luò)僅有不到0.5%的差距;而與雙通道分離架構(gòu)網(wǎng)絡(luò)的綜合預(yù)測(cè)準(zhǔn)確率相比,存在約2.7%的差距??梢酝茢鄷r(shí)序信號(hào)包含了足夠的信息,具有不同水平方位、深度和大小的溶洞對(duì)溶洞表面反射應(yīng)力波的行程和走時(shí)會(huì)產(chǎn)生影響,因此通過(guò)對(duì)不同空間位置加速度傳感器信號(hào)進(jìn)行完整采樣,能夠從中挖掘溶洞的三維位置和大小特征,從而實(shí)現(xiàn)對(duì)溶洞的三維位置和大小的較高精度的識(shí)別,而加入極值特征有助于提高識(shí)別準(zhǔn)確率,說(shuō)明了本文特征工程的有效性。
表8 預(yù)測(cè)結(jié)果Table 8 Results of prediction
綜上所述,采用時(shí)序信號(hào)和極值特征的雙通道輸入有助于提高模型預(yù)測(cè)準(zhǔn)確率,其中,雙通道分離架構(gòu)模型能充分利用輸入特征與相應(yīng)識(shí)別目標(biāo)的強(qiáng)相關(guān)性,因此其能達(dá)到最優(yōu)的預(yù)測(cè)準(zhǔn)確率。
本文提出了一種基于深度學(xué)習(xí)的多層巖土環(huán)境的溶洞智能三維定量探測(cè)方法,所得到的主要結(jié)論如下:(1)地表加速度響應(yīng)時(shí)序信號(hào)包含足夠的信息,以時(shí)序信號(hào)為輸入的單通道架構(gòu)模型在3 m 容差下對(duì)溶洞位置和大小的識(shí)別準(zhǔn)確率達(dá)到了95.51%,加入極值特征可提高模型識(shí)別準(zhǔn)確率;(2)基于BiLSTM 的雙通道分離架構(gòu)網(wǎng)絡(luò)模型在3 m 容差范圍內(nèi)對(duì)多層巖土環(huán)境下溶洞的三維位置坐標(biāo)和直徑大小的綜合預(yù)測(cè)準(zhǔn)確率達(dá)到了98.23%,實(shí)現(xiàn)了多層巖土環(huán)境下溶洞的定量智能預(yù)測(cè)。本文研究的不足之處在于:(1)巖土結(jié)構(gòu)和溶洞的組合工況可能性極多,本文受到算力的限制,只能在一些有限的組合工況下進(jìn)行方法的驗(yàn)證;(2)僅進(jìn)行了基于有限元數(shù)據(jù)的可行性研究,未在實(shí)測(cè)數(shù)據(jù)上對(duì)方法進(jìn)行驗(yàn)證。