袁若浩 王保云
摘 要:云南作為泥石流受災(zāi)最嚴(yán)重的省份之一,每年均會(huì)遭受重大損失。為了應(yīng)對(duì)這種突發(fā)性災(zāi)害,本文基于DCHNNet(dual-channel hybrid neural network)提出了一個(gè)基于雙通道的改進(jìn)殘差結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)——雙通道殘差網(wǎng)絡(luò)(two-way residual network,TWRNet)。該網(wǎng)絡(luò)能夠廣泛應(yīng)用于泥石流溝谷圖像的潛在危險(xiǎn)性排查,實(shí)現(xiàn)泥石流災(zāi)害的預(yù)警。TWRNet首先采用切片的方式對(duì)數(shù)字高程(digital elevation model,DEM)數(shù)據(jù)和遙感數(shù)據(jù)分開(kāi)處理,并使用改進(jìn)的殘差結(jié)構(gòu)進(jìn)行特征提??;然后將特征進(jìn)行融合,并使用通道注意力機(jī)制SE(squeeze-and-excitation networks)模塊進(jìn)行通道增強(qiáng);最后給出泥石流溝谷的分類(lèi)結(jié)果。在訓(xùn)練過(guò)程中,本文使用了交叉熵和焦點(diǎn)損失構(gòu)成的聯(lián)合損失函數(shù)。實(shí)驗(yàn)結(jié)果表明, TWRNet在泥石流溝谷識(shí)別方面達(dá)到了最高89.28%的識(shí)別率和 87.50%的召回率,模型性能良好。使用圖像學(xué)習(xí)溝谷特征的方法來(lái)進(jìn)行泥石流孕災(zāi)溝谷的識(shí)別是可行的。
關(guān)鍵詞:泥石流;分類(lèi);卷積神經(jīng)網(wǎng)絡(luò);預(yù)測(cè)
中圖分類(lèi)號(hào):TP183;P642.23
文獻(xiàn)標(biāo)志碼:A
我國(guó)是一個(gè)泥石流頻發(fā)的國(guó)家,尤其是西南西北山區(qū),經(jīng)常會(huì)發(fā)生特大泥石流[1]。云南地處云貴高原西南部與青藏高原東南部之間,地勢(shì)呈西北高、東南低,境內(nèi)多為山地高原地形[2-3]。同時(shí),云南還具有多種季風(fēng)氣候,在雨季極易出現(xiàn)強(qiáng)降雨,多種因素的共同作用,使得云南多發(fā)泥石流災(zāi)害[4-5]。頻發(fā)的泥石流每年均會(huì)給該地區(qū)帶來(lái)重大的損失,若能合理有效地對(duì)泥石流的發(fā)生進(jìn)行預(yù)測(cè),對(duì)于山區(qū)的防災(zāi)減災(zāi)工作將具有重大意義。
泥石流災(zāi)害防治預(yù)警是防災(zāi)減災(zāi)重點(diǎn)研究課題之一,早期依靠實(shí)地考察,結(jié)合實(shí)地?cái)?shù)據(jù)使用統(tǒng)計(jì)分析的方法進(jìn)行泥石流研究。目前的研究方法主要為:基于數(shù)值模擬、基于統(tǒng)計(jì)理論和基于機(jī)器學(xué)習(xí)。數(shù)值模擬的方法是采用動(dòng)力學(xué)模型,將泥石流溝谷的具體信息輸入動(dòng)力學(xué)模型進(jìn)行數(shù)值模擬,常用工具有MassFlow、FLO-2D等。如以單個(gè)建筑為評(píng)價(jià)單元,模擬在極端降雨條件下的泥石流爆發(fā)過(guò)程[6];或者是根據(jù)不同降雨情況下的泥石流沖出物來(lái)進(jìn)行泥石流強(qiáng)度和危險(xiǎn)性的分區(qū)[7]。
統(tǒng)計(jì)理論的方法主要是圍繞泥石流的各種參數(shù)來(lái)進(jìn)行,通過(guò)函數(shù)去擬合參數(shù)之間的關(guān)系。如計(jì)算泥石流評(píng)價(jià)因子的主客觀權(quán)重值,引入基于方差最大化的組合賦權(quán)法對(duì)泥石流研究區(qū)進(jìn)行危險(xiǎn)分級(jí)[8];把不同評(píng)價(jià)因子組成對(duì)照組,探究不同指標(biāo)評(píng)價(jià)體系對(duì)泥石流危險(xiǎn)性評(píng)估的影響[9]等。這兩種方法中,數(shù)值模擬的數(shù)據(jù)獲取較為困難,且只能對(duì)個(gè)別溝谷進(jìn)行評(píng)價(jià),每次評(píng)價(jià)的數(shù)量較少;統(tǒng)計(jì)理論則存在專(zhuān)家選擇泥石流評(píng)價(jià)因子的主觀性,不利于大范圍開(kāi)展泥石流排查。
基于機(jī)器學(xué)習(xí)提取特征的方法則是將統(tǒng)計(jì)或計(jì)算得到的溝谷因子作為訓(xùn)練數(shù)據(jù),通過(guò)反向傳播優(yōu)化模型參數(shù),然后將優(yōu)化的模型用于泥石流溝谷的評(píng)價(jià)中。如通過(guò)BP神經(jīng)網(wǎng)絡(luò)方法對(duì)泥石流沖刷進(jìn)行建模,建立起泥石流危險(xiǎn)性的預(yù)測(cè)體系[10];基于隨機(jī)森林和支持向量機(jī)算法對(duì)泥石流易發(fā)性進(jìn)行評(píng)價(jià)[11]等。這些方法均取得了不錯(cuò)的結(jié)果。然而通過(guò)文獻(xiàn)查閱,幾乎沒(méi)有將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于泥石流的研究,這可能是因?yàn)槟嗍鞅旧硎切颖締?wèn)題,數(shù)據(jù)量較少,想要對(duì)泥石流溝谷快速識(shí)別存在一定難度[12],且利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)泥石流進(jìn)行快速識(shí)別主要是依靠DEM(digital elevation model,數(shù)字高程)數(shù)據(jù)和遙感數(shù)據(jù),而這兩種數(shù)據(jù)包含的信息又各不相同,直接將兩種數(shù)據(jù)輸入網(wǎng)絡(luò)訓(xùn)練會(huì)影響網(wǎng)絡(luò)分類(lèi)的準(zhǔn)確度。
基于數(shù)值模擬、統(tǒng)計(jì)理論和機(jī)器學(xué)習(xí)等方法存在的問(wèn)題,本文借鑒DCHNNet [13] (dual-channel hybrid neural network)雙通道網(wǎng)絡(luò)的思想,提出了一個(gè)基于雙通道的改進(jìn)殘差的神經(jīng)網(wǎng)絡(luò)TWRNet(two-way residual network)。該網(wǎng)絡(luò)利用兩個(gè)通道分別提取DEM與遙感圖像的特征信息,并添加經(jīng)過(guò)平均池化改進(jìn)的殘差結(jié)構(gòu)來(lái)獲取特征信息。通過(guò)該模型,我們可以快速且大面積地對(duì)泥石流溝谷進(jìn)行分類(lèi),準(zhǔn)確識(shí)別出具有潛在危險(xiǎn)的泥石流溝谷。
1 泥石流相關(guān)數(shù)據(jù)的構(gòu)建
1.1 研究區(qū)域概述
迪慶藏族自治州位于云南省西北部滇、藏、川三省交界處,其地勢(shì)北高南低,地形以山地、嶺峰為主,境內(nèi)有瀾滄江與怒江兩大流域。而瀾滄江上游流域溝壑縱橫,地形復(fù)雜,高差大,是泥石流災(zāi)害的高發(fā)地區(qū)。此外,迪慶藏族自治州境內(nèi)氣候?qū)俦眮啛釒Ц咴降丶撅L(fēng)氣候,年平均降雨量738 mm,5—10月雨季的降水量占全年降水量3/4左右,因此在雨季迪慶藏族自治州極易遭受泥石流侵害。圖1為迪慶藏族自治州州區(qū)域圖。
1.2 數(shù)據(jù)來(lái)源及整理
本文中的數(shù)據(jù)采用DEM和遙感數(shù)據(jù)。DEM數(shù)據(jù)來(lái)自公開(kāi)數(shù)據(jù)集USGS,分辨率為30 m。遙感數(shù)據(jù)全部來(lái)自高分一號(hào)衛(wèi)星(GF-1),分辨率為16 m,采用的光譜信號(hào)為藍(lán)波段、綠波段、紅波段、近紅外波段。其中DEM能提供溝谷的地形信息,比如主溝的長(zhǎng)度、匯水面積、土石量[14]、坡度、坡向[15]等。遙感數(shù)據(jù)能夠提供溝谷的地表信息,比如地表的植被覆蓋率、建筑物、水系條件等[16]。DEM和遙感數(shù)據(jù)涵蓋了常見(jiàn)的用于泥石流危險(xiǎn)性評(píng)價(jià)的因子,因此本文采用了上述兩種數(shù)據(jù)。
為了使數(shù)據(jù)能夠適應(yīng)我們的模型,實(shí)驗(yàn)要對(duì)數(shù)據(jù)進(jìn)行一些預(yù)處理。首先要區(qū)分出發(fā)生過(guò)泥石流的溝谷以及未發(fā)生過(guò)泥石流的溝谷。處理方式如下:對(duì)于發(fā)生過(guò)泥石流災(zāi)害的溝谷,本文查閱了《云南減災(zāi)年鑒》以及相關(guān)的新聞報(bào)道,將泥石流的發(fā)生地精確到村,并結(jié)合相關(guān)新聞報(bào)道,在瀾滄江流域選取82條確認(rèn)發(fā)生過(guò)泥石流的溝谷。而對(duì)于沒(méi)有被記錄的泥石流溝谷,通過(guò)谷歌地球的衛(wèi)星地圖選取附近有村莊或農(nóng)田的溝谷,并記錄下來(lái)。通過(guò)這種方法得到了85條無(wú)災(zāi)害記錄的溝谷。將上述發(fā)生泥石流的82條溝谷記為正樣本,無(wú)災(zāi)害記錄的85條泥石流溝谷記為負(fù)樣本。
在完成了溝谷的數(shù)據(jù)處理后,通過(guò)ArcGIS確定溝谷的點(diǎn)位,從 DEM 圖中提取這些溝谷,然后將收集到的所有圖像數(shù)據(jù)進(jìn)行匯總。為了使溝谷圖像更加分明,實(shí)驗(yàn)又按照溝谷的流域面積和主溝長(zhǎng)度將正負(fù)樣本各分了3類(lèi),之所以各分成3類(lèi)是因?yàn)樵S多研究均指出流域面積大小與溝谷危險(xiǎn)性具有強(qiáng)相關(guān)性[17-20],姚振國(guó)等[21]通過(guò)對(duì)泥石流溝谷流域面積與易發(fā)泥石流的溝谷條數(shù)進(jìn)行分析,發(fā)現(xiàn)兩者具有良好相關(guān)性,這說(shuō)明流域面積大小對(duì)泥石流的形成起重要的控制作用。因此,本文按照小、中、大的流域面積分類(lèi)方法將正負(fù)樣本各分為3類(lèi)。其中正樣本為0、1、2,負(fù)樣本為3、4、5。具體分類(lèi)方式如表1。
在正負(fù)樣本分成6類(lèi)之后,發(fā)現(xiàn)每類(lèi)樣本的數(shù)據(jù)并不平衡。因此,為了更好地對(duì)這些溝谷做出準(zhǔn)確的預(yù)測(cè),在進(jìn)行模型訓(xùn)練時(shí)又對(duì)數(shù)據(jù)進(jìn)行了增強(qiáng),增強(qiáng)方式為旋轉(zhuǎn)和翻轉(zhuǎn),詳細(xì)結(jié)果如表2。
增強(qiáng)后數(shù)據(jù)的正樣本數(shù)量增加到140個(gè),負(fù)樣本數(shù)量增加到148個(gè),總數(shù)量達(dá)到288個(gè)。然后依據(jù)深度學(xué)習(xí)常用的數(shù)據(jù)比例劃分方法,將訓(xùn)練集與測(cè)試集按照9 ∶1、8 ∶2和7 ∶3劃分比例輸入模型進(jìn)行訓(xùn)練。最后根據(jù)訓(xùn)練結(jié)果進(jìn)行泥石流危險(xiǎn)性分析。
2 實(shí)驗(yàn)方法
2.1 模型的總體框架
模型訓(xùn)練流程可以分為3個(gè)主要步驟。首先,對(duì)輸入數(shù)據(jù)進(jìn)行預(yù)處理,每條溝谷數(shù)據(jù)都包含1通道的DEM數(shù)據(jù)和4通道的遙感影像。這兩種數(shù)據(jù)經(jīng)過(guò)適當(dāng)處理后,被疊放成5層的數(shù)據(jù)塊,以符合TWR模型的輸入要求。其次,把增強(qiáng)后的數(shù)據(jù)分為訓(xùn)練集與測(cè)試集進(jìn)行訓(xùn)練,并輸出模型在測(cè)試集上的準(zhǔn)確率、精確率、召回率、F1-Score以及Kappa系數(shù)等評(píng)估指標(biāo)。最后,在訓(xùn)練的過(guò)程中,根據(jù)得到的參數(shù)和指標(biāo)不斷優(yōu)化模型,保存訓(xùn)練平穩(wěn)的最優(yōu)的模型參數(shù)。具體實(shí)驗(yàn)流程如圖3所示。
在本實(shí)驗(yàn)流程中,首先對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,將其轉(zhuǎn)化為適合輸入網(wǎng)絡(luò)的數(shù)據(jù)塊。這些數(shù)據(jù)塊經(jīng)過(guò)切片處理后,得到包含DEM數(shù)據(jù)和遙感數(shù)據(jù)的子塊。其次,將這些子塊分別輸入到TWR網(wǎng)絡(luò)中,通過(guò)網(wǎng)絡(luò)的特征提取結(jié)構(gòu)進(jìn)行特征提取,并通過(guò)數(shù)據(jù)融合的方式將提取的DEM數(shù)據(jù)和遙感數(shù)據(jù)的特征進(jìn)行合并,以獲取更豐富和綜合的特征表示。最后,將融合后的特征輸入到輸出層進(jìn)行分類(lèi),并輸出實(shí)驗(yàn)結(jié)果。通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的分析,可以評(píng)估模型的性能和準(zhǔn)確度,以便對(duì)泥石流溝谷進(jìn)行分類(lèi)和預(yù)測(cè)。
2.2 雙通道殘差網(wǎng)絡(luò)
實(shí)驗(yàn)設(shè)計(jì)的雙通道殘差網(wǎng)絡(luò)的詳細(xì)結(jié)構(gòu)如圖4所示。
如圖4,首先將DEM與遙感數(shù)據(jù)處理成疊放5層的數(shù)據(jù)塊,然后進(jìn)行切片操作,將數(shù)據(jù)分成 4通道的遙感數(shù)據(jù)與1通道的DEM數(shù)據(jù)。在接下來(lái)的特征提取階段,通過(guò)TWR的特征提取結(jié)構(gòu),得到D1、D2、D3、D4以及Y1、Y2、Y3、Y4這8個(gè)特征圖。其中,D2、D3與Y2、Y3的特征圖引入了改進(jìn)的殘差結(jié)構(gòu),這兩個(gè)改進(jìn)殘差結(jié)構(gòu)經(jīng)過(guò)了平均池化處理,這樣有助于增強(qiáng)特征的表達(dá)能力。在特征融合階段,將處理過(guò)后的特征圖進(jìn)行拼接,并經(jīng)過(guò)通道注意力機(jī)制SE(squeeze-and-excitation networks)模塊進(jìn)行通道增強(qiáng)。接著,經(jīng)過(guò)特征提取和最大池化操作,將特征輸入到全連接層,最終輸出溝谷的分類(lèi)結(jié)果。在整個(gè)模型的訓(xùn)練過(guò)程中,本文結(jié)合焦點(diǎn)損失函數(shù)(focal loss,F(xiàn)L)與交叉熵?fù)p失函數(shù)(cross-entropy,CE),構(gòu)造了一個(gè)新的聯(lián)合損失函數(shù)。它能夠強(qiáng)化正負(fù)樣本特征的差異,并提高模型得到分類(lèi)性能。圖5展示了改進(jìn)的殘差結(jié)構(gòu)和添加的SE結(jié)構(gòu)的詳細(xì)示意圖。
基于機(jī)器學(xué)習(xí)的方法進(jìn)行泥石流的相關(guān)研究,需要大量的數(shù)據(jù)集進(jìn)行訓(xùn)練,而泥石流相關(guān)數(shù)據(jù)較少,為了解決數(shù)據(jù)量過(guò)少而導(dǎo)致模型過(guò)擬合和泛化能力較差的問(wèn)題,本文引入了在小樣本學(xué)習(xí)中表現(xiàn)較好的殘差模塊,并添加了通道注意力機(jī)制SE來(lái)提升模型的性能[22]。假設(shè)網(wǎng)絡(luò)的輸入為x,設(shè)F1(·)、F2(·)為卷積操作,P1(·)、P2(·)為平均池化操作,y1、y2為殘差結(jié)構(gòu)的輸出,那么初始化權(quán)值偏置,通過(guò)前饋計(jì)算每層的狀態(tài)和激活值,得到
yi=Fi(x)+Pi(x) , i=1,2(1)
其中:Fi(x)表示特征圖經(jīng)過(guò)卷積后的輸出,Pi(x)表示特征圖經(jīng)過(guò)池化后的輸出。將得到的殘差輸出再分別經(jīng)過(guò)一次卷積處理,得到的結(jié)果進(jìn)行Concat拼接融合。假設(shè)拼接融合后的輸出為Q(x),通道注意力機(jī)制SE模塊的權(quán)重值為R(x),改進(jìn)結(jié)構(gòu)得到的最終輸出為y,那么可以得到
y=Q(x)×R(x)(2)
接下來(lái)再對(duì)輸出y進(jìn)行卷積、池化等處理,最后通過(guò)分類(lèi)函數(shù)輸出模型,預(yù)測(cè)各類(lèi)別的概率值。
2.3 基于交叉熵與焦點(diǎn)損失的聯(lián)合損失函數(shù)
損失函數(shù)的使用主要是在模型的訓(xùn)練階段,每個(gè)批次的訓(xùn)練數(shù)據(jù)送入模型后,通過(guò)前向傳播輸出預(yù)測(cè)值,然后損失函數(shù)會(huì)計(jì)算出預(yù)測(cè)值和真實(shí)值之間的差異值,也就是損失值。得到損失值之后,模型通過(guò)反向傳播去更新各個(gè)參數(shù),來(lái)降低真實(shí)值與預(yù)測(cè)值之間的損失,使模型生成的預(yù)測(cè)值往真實(shí)值方向靠攏,從而達(dá)到學(xué)習(xí)的目的。
首先使用交叉熵?fù)p失函數(shù)來(lái)進(jìn)行模型的訓(xùn)練,交叉熵?fù)p失函數(shù)為
LCE=-∑nixilogPi,i=1,2,3,4,5(3)
實(shí)驗(yàn)共分為6類(lèi)。其中:n為種類(lèi)數(shù)量;xi是標(biāo)簽,也就是如果預(yù)測(cè)類(lèi)別為i,則xi=1,否則等于0;Pi為神經(jīng)網(wǎng)絡(luò)的輸出,即類(lèi)別為i的概率。但是初始的樣本分類(lèi)并不均衡,為了進(jìn)一步消除樣本不平衡對(duì)模型的影響,實(shí)驗(yàn)又額外引入焦點(diǎn)損失函數(shù),它是一種用于處理樣本分類(lèi)不均衡的損失函數(shù),可以給難分樣本賦予更大的權(quán)重,使訓(xùn)練過(guò)程更加關(guān)注這些難分樣本。本文將其與交叉熵?fù)p失函數(shù)結(jié)合,用于對(duì)不同形態(tài)溝谷的潛在危險(xiǎn)性做出合理預(yù)測(cè)。6分類(lèi)的焦點(diǎn)損失函數(shù)可表示為
LFL=-α∑ni(1-Pi)γlogPi ,i=1,2,3,4,5(4)
其中:α為控制樣本不平衡問(wèn)題的參數(shù);γ為控制難易樣本不平衡問(wèn)題的參數(shù);n與Pi分別表示種類(lèi)數(shù)量和樣本預(yù)測(cè)正確的概率值。本文主要對(duì)樣本不平衡問(wèn)題進(jìn)行測(cè)試。令γ=2為固定值,然后對(duì)α進(jìn)行調(diào)整,經(jīng)過(guò)測(cè)試,當(dāng)α為0.02時(shí),使用聯(lián)合損失函數(shù),模型的準(zhǔn)確率會(huì)有小幅度提升,這比單獨(dú)使用交叉熵函數(shù)的準(zhǔn)確率提升了3%。所以實(shí)驗(yàn)最終確定損失函數(shù)為
L=LCE+LFL(5)
3 實(shí)驗(yàn)結(jié)果與分析
3.1 訓(xùn)練環(huán)境
實(shí)驗(yàn)采用的設(shè)備為CPU:Intel Xeon E5-2650 v3;內(nèi)存:128GB;GPU:NVIDIA GeForce RTX 3090。軟件為Ubuntu18.06、Pytorch1.9.0、Python3.8、CUDA11.1。本實(shí)驗(yàn)分為正負(fù)樣本,有6個(gè)通道,使用TWRNet作為骨干架構(gòu)來(lái)提取圖像特征。超參數(shù)的設(shè)置為學(xué)習(xí)率:0.001;focal loss : α=0.02;dropout率:0.5;batch_size:8;epoch:200。優(yōu)化方法為SGD。
3.2 結(jié)果分析
在上述環(huán)境下得到各網(wǎng)絡(luò)在測(cè)試集上的準(zhǔn)確結(jié)果如表3所示。
從表3可以看出,相比較其他網(wǎng)絡(luò)結(jié)構(gòu),TWRNet具有更好的溝谷特征識(shí)別能力。TWRNet在溝谷特征提取任務(wù)中的表現(xiàn)要優(yōu)于其他模型,接近0.9的準(zhǔn)確率說(shuō)明模型可以準(zhǔn)確提取具有潛在危險(xiǎn)的溝谷的特征。這一優(yōu)勢(shì)可能是由于TWRNet能夠同時(shí)處理空間幾何信息和光譜信息,從而能夠提取到溝谷更多的底層特征,提高了模型的分類(lèi)性能。
為了探究實(shí)驗(yàn)數(shù)據(jù)劃分對(duì)測(cè)試結(jié)果的影響,對(duì)數(shù)據(jù)劃分比例也進(jìn)行了實(shí)驗(yàn),分別采用了訓(xùn)練集與測(cè)試集9 ∶1、8 ∶2、7 ∶3的比例劃分方式。實(shí)驗(yàn)結(jié)果如表4所示。
從表4中可以看出,當(dāng)實(shí)驗(yàn)數(shù)據(jù)劃分比例為9 ∶1時(shí),準(zhǔn)確率最高,模型的分類(lèi)效果也是最好。所以本實(shí)驗(yàn)所有數(shù)據(jù)劃分均為9 ∶1。
3.3 性能評(píng)估
本節(jié)給出了所設(shè)計(jì)的模型與其他經(jīng)典模型的性能分析。在超參數(shù)確定以后,由于每次訓(xùn)練的各模型的準(zhǔn)確率都有微小波動(dòng),因此選取多次實(shí)驗(yàn)的均值對(duì)比作為實(shí)驗(yàn)結(jié)果。表5給出了各種網(wǎng)絡(luò)結(jié)構(gòu)在溝谷6分類(lèi)任務(wù)上的性能指標(biāo),包括總體精度(overall accuracy,OA)、精確率(precision)、召回率(recall)、F1- score以及卡帕系數(shù)(Kappa)。其中精確率是指所有被正確預(yù)測(cè)的正樣本占全部預(yù)測(cè)為正樣本的比例,它衡量了模型預(yù)測(cè)為正樣本的準(zhǔn)確性。召回率是指在所有發(fā)生過(guò)的泥石流溝谷中,模型正確預(yù)測(cè)且有泥石流發(fā)生的樣本占所有正樣本的比例,它衡量了模型對(duì)正樣本的識(shí)別能力。F1-score是綜合考慮精確率和召回率后計(jì)算得出的結(jié)果,它可以評(píng)估模型的綜合性能。表5中各項(xiàng)指標(biāo)為多次訓(xùn)練得到的平均結(jié)果。
表5的結(jié)果表明,相比其他網(wǎng)絡(luò)結(jié)構(gòu),TWRNet在溝谷特征識(shí)別方面具有更好的性能。其較高的召回率也說(shuō)明本文設(shè)計(jì)的模型對(duì)泥石流特征的捕獲更加精確。TWRNet性能的顯著提升可能歸因于以下兩個(gè)原因:
首先,TWRNet采用了雙通道思想進(jìn)行特征提取。相較于直接將數(shù)據(jù)輸入模型進(jìn)行訓(xùn)練,將數(shù)據(jù)分別輸入模型進(jìn)行特征提取可以捕捉到更豐富的特征信息。通過(guò)同時(shí)處理DEM和遙感數(shù)據(jù),TWRNet能夠充分利用這兩種數(shù)據(jù)的特征,從而提高了模型的性能。
其次,本文使用了交叉熵與焦點(diǎn)損失結(jié)合的聯(lián)合損失函數(shù)。它強(qiáng)化了正負(fù)樣本之間的差異,緩解了樣本不平衡問(wèn)題。焦點(diǎn)損失函數(shù)通過(guò)調(diào)整樣本的權(quán)重,使模型更關(guān)注難以分類(lèi)的樣本,從而提高模型對(duì)正樣本的分類(lèi)能力。通過(guò)結(jié)合交叉熵?fù)p失和焦點(diǎn)損失,聯(lián)合損失函數(shù)在訓(xùn)練過(guò)程中能夠更好地?cái)M合訓(xùn)練數(shù)據(jù),提升模型的泛化能力。
圖6是將正負(fù)樣本的溝谷數(shù)據(jù)輸入TWRNet進(jìn)行測(cè)試,隨機(jī)劃分了5次總數(shù)據(jù),得到6分類(lèi)的混淆矩陣和正負(fù)2分類(lèi)的混淆矩陣,并給出了各分類(lèi)的具體數(shù)量。
3.4 超參數(shù)設(shè)置
為了探討超參數(shù)對(duì)實(shí)驗(yàn)的影響以及確定最優(yōu)的模型參數(shù),實(shí)驗(yàn)又對(duì)損失函數(shù)的α取值與學(xué)習(xí)率進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果如表6、表7。
由表6可以看出,當(dāng)聯(lián)合損失函數(shù)的α為0.02時(shí),模型的準(zhǔn)確率比較高;由表7可以得到,在學(xué)習(xí)率為0.001時(shí),模型的效果是比較好的。因此實(shí)驗(yàn)將α設(shè)置為 0.02,學(xué)習(xí)率設(shè)置為0.001 0。
通過(guò)以上實(shí)驗(yàn)結(jié)果,發(fā)現(xiàn)TWRNet模型在6分類(lèi)任務(wù)中具有0.875的召回率和0.893的準(zhǔn)確率,表明該模型能夠有效地捕捉到大部分易發(fā)泥石流的溝谷特征。這意味著對(duì)于同一流域的其他溝谷圖像,該模型具有極高的可信度來(lái)判斷該圖像是否具有泥石流溝谷的特征。如果被預(yù)測(cè)為發(fā)生泥石流溝谷的類(lèi)別,那么該溝谷就存在發(fā)生泥石流的潛在可能性。因此,在雨季來(lái)臨時(shí),需要加強(qiáng)對(duì)泥石流的監(jiān)測(cè),特別是對(duì)天氣和雨情的監(jiān)測(cè),并制定緊急情況下的應(yīng)急預(yù)案,以便能夠及時(shí)應(yīng)對(duì)潛在的泥石流風(fēng)險(xiǎn)。
4 結(jié)論
通過(guò)對(duì)泥石流溝谷潛在危險(xiǎn)性的分析,得出了以下結(jié)論:
1)將DEM和遙感數(shù)據(jù)作為原始輸入數(shù)據(jù)、泥石流溝谷作為評(píng)價(jià)單元,實(shí)驗(yàn)設(shè)計(jì)了一種基于雙通道的改進(jìn)殘差網(wǎng)絡(luò)TWRNet,用于分析泥石流溝谷的潛在危險(xiǎn)性。這一方法為泥石流溝谷的識(shí)別問(wèn)題提供了新的思路和解決方案。
2)實(shí)驗(yàn)結(jié)果表明,TWRNet在2分類(lèi)與6分類(lèi)上的準(zhǔn)確率都能夠接近90%,相比其他經(jīng)典模型,TWRNet表現(xiàn)出更高的性能。這表明TWRNet在泥石流溝谷的特征識(shí)別方面取得了顯著的改進(jìn)。
3)盡管神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)和預(yù)測(cè)泥石流溝谷圖像特征方面表現(xiàn)出色,但仍存在一些問(wèn)題。首先,由于我們對(duì)泥石流發(fā)生的背景和形成機(jī)理的認(rèn)識(shí)有限,僅依靠某些特定條件的判斷,預(yù)測(cè)的精度有限。因此,將誘發(fā)因素(如降雨量)與地形地貌條件進(jìn)行綜合考慮,并采用多模態(tài)深度學(xué)習(xí)的方法,有可能取得更好的預(yù)測(cè)效果。其次,盡管TWRNet具有較高的預(yù)測(cè)準(zhǔn)確性,但對(duì)泥石流發(fā)生可能性的預(yù)測(cè)仍存在一定的偏差。因此,希望未來(lái)能夠發(fā)展更加完善的模型,以進(jìn)一步提高預(yù)測(cè)的準(zhǔn)確性。
參考文獻(xiàn):
井浩, 陶虎. 中國(guó)泥石流研究熱點(diǎn)與前沿: 基于中國(guó)知網(wǎng)的文獻(xiàn)分析[J]. 青海師范大學(xué)學(xué)報(bào)(自然科學(xué)), 2021, 37(2): 89-96.
[2] 吳平, 鄭文曉. 泥石流的形成條件及其防治措施[J]. 西部探礦工程, 2008(3): 4-5.
[3] 周小彬. 泥石流災(zāi)害形成條件的判別及其防治措施分析[J]. 西部探礦工程, 2006(10): 271-273.
[4] 劉坤香, 王保云, 孫顯辰, 等. 冰川型泥石流溝谷孕災(zāi)特點(diǎn)分析[J]. 電腦知識(shí)與技術(shù), 2020, 16(21): 208-209,212.
[5] 高速, 周平根, 董穎, 等. 泥石流預(yù)測(cè)、預(yù)報(bào)技術(shù)方法的研究現(xiàn)狀淺析[J]. 工程地質(zhì)學(xué)報(bào), 2002(3): 279-283.
[6] 楊騰飛. 高山峽谷水庫(kù)區(qū)區(qū)域泥石流危險(xiǎn)度評(píng)價(jià)研究[D]. 秦皇島: 燕山大學(xué), 2021.
[7] 陳攀, 葛永剛, 孫慶敏, 等. 基于小流域單元的泥石流易發(fā)性評(píng)價(jià)[J]. 科學(xué)技術(shù)與工程, 2022, 22(29): 12764-12771.
[8] 李寶幸, 蔡強(qiáng), 宋軍, 等. 基于FLO-2D的泥石流災(zāi)害風(fēng)險(xiǎn)評(píng)價(jià): 以麥多溝泥石流為例[J]. 自然災(zāi)害學(xué)報(bào), 2022, 31(4): 256-265.
[9] 喬淵, 劉鐵驥, 陳亮, 等. 基于Massflow模型的甘肅省岷縣二馬溝泥石流危險(xiǎn)性評(píng)價(jià)[J]. 水利水電技術(shù), 2020, 51(4): 184-192.
[10]孔艷. 滇西高山峽谷區(qū)泥石流危險(xiǎn)性預(yù)測(cè)及模擬[D]. 昆明: 云南師范大學(xué), 2019.
[11]李坤, 趙俊三, 林伊琳, 等. 基于RF和SVM模型的東川泥石流易發(fā)性評(píng)價(jià)研究[J]. 云南大學(xué)學(xué)報(bào)(自然科學(xué)版), 2022, 44(1): 107-115.
[12]韓俊, 王保云, 徐繁樹(shù), 等. 基于原型網(wǎng)絡(luò)對(duì)泥石流溝谷的分類(lèi)預(yù)測(cè): 以怒江流域?yàn)槔跩]. 現(xiàn)代計(jì)算機(jī), 2022, 28(2): 88-90.
[13]LU M, PENG T J, YUE G X, et al. Dual-channel hybrid neural network for modulation recognition[J]. IEEE Access, 2021, 9: 76260-76269.
[14]高旭焦. 云南迪慶藏族自治州老虎箐泥石流特征及防治對(duì)策研究[D]. 北京: 中國(guó)地質(zhì)大學(xué)(北京), 2018.
[15]謝謨文, 劉翔宇, 王增福, 等. 基于三維遙感系統(tǒng)的泥石流土石量計(jì)算及影響范圍模擬[J]. 水文地質(zhì)工程地質(zhì), 2011, 38(3): 115-119.
[16]彭銳. 小江流域泥石流特征綜合探測(cè)分析研究[D]. 昆明: 昆明理工大學(xué), 2019.
[17]劉海, 陳華. 基于層次分析法的未確知測(cè)度理論泥石流危險(xiǎn)性評(píng)價(jià)[J]. 長(zhǎng)江流域資源與環(huán)境, 2012, 21(8): 1032-1038.
[18]楊濤, 唐川, 朱金勇, 等. 四川省汶川縣綿虒鎮(zhèn)小流域泥石流危險(xiǎn)性評(píng)價(jià)[J]. 長(zhǎng)江科學(xué)院院報(bào), 2018, 35(10): 82-87.
[19]陳維, 趙鑫, 張海太, 等. 基于模糊綜合評(píng)判法的滇西北公路泥石流危險(xiǎn)性評(píng)價(jià)[J]. 公路, 2020, 65(2): 25-29.
[20]朱淵, 余斌, 亓星, 等. 地形條件對(duì)泥石流發(fā)育的影響: 以岷江流域上游為例[J]. 吉林大學(xué)學(xué)報(bào)(地球科學(xué)版), 2014, 44(1): 268-277.
[21]姚振國(guó), 劉建周, 牛貝貝, 等. 流域面積對(duì)溝道泥石流發(fā)育的影響分析[J]. 資源環(huán)境與工程, 2019, 33(2): 217-219.
[22]袁培森, 宋進(jìn), 徐煥良. 基于殘差網(wǎng)絡(luò)和小樣本學(xué)習(xí)的魚(yú)圖像識(shí)別[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2022, 53(2): 282-290.
(責(zé)任編輯:曾 晶)
Debris Flow Ravine Hazard Prediction Based on
Two-Way Residual Network
YUAN Ruohao1, WANG Baoyun*1,2
(1.School of Mathematics, Yunnan Normal University, Kunming 650500, China; 2.Key Laboratory of Modeling and Application of Complex Systems in Universities of Yunnan Province, Kunming 650500, China)
Abstract:
Yunnan, as one of the provinces most affected by debris flow disasters, suffers significant losses every year. In response to this sudden natural hazard, the author proposes a two-way residual network (TWRNet), based on the dual-channel hybrid neural network (DCHNNet). TWRNet is capable of extensively assessing the potential hazards of debris flow ravines through image analysis, facilitating early warning systems for debris flow disasters. TWRNet first separates and processes digital elevation model (DEM) data and remote sensing data using a slice-based approach, extracting features with an improved residual structure. Subsequently, the features are fused and enhanced using the channel attention mechanism called the SE module. Finally, the network provides classification results for debris flow ravines. The training process utilizes a joint loss function consisting of cross-entropy and focal loss. Experimental results demonstrate that TWRNet achieves a maximum recognition rate of 89.28% and a recall rate of 87.50% for debris flow ravine identification, exhibiting excellent model performance. Employing the method of image-based learning for the recognition of ravine features associated with debris flow hazards is feasible.
Key words:
debris flow; classification; convolutional neural network; prediction
貴州大學(xué)學(xué)報(bào)(自然科學(xué)版)2023年6期