賀躍光, 姜風航, 苗則朗, 包志軒, 易南洲
(1.長沙理工大學交通運輸工程學院,湖南 長沙 410004;2.中南大學地球科學與信息物理學院,湖南 長沙 410083;3.湖南省水利水電勘測設計研究總院,湖南 長沙 410119)
衛(wèi)星遙感技術可快速獲取區(qū)域影像,實現滑坡災害分析。 但在森林覆蓋區(qū),傳統光學、微波遙感技術主要獲取植被的林冠高程信息,難以消除植被覆蓋的影響。 機載激光雷達是一種主動式對地觀測系統,通過LiDAR 點云技術穿透植被,利用濾波算法有效去除地表植被點云,直接獲取真實地表形態(tài)特征,客觀反映林下滑坡信息,為林下滑坡提取領域提供有力的技術支持[1-2]。 深度學習是數據驅動方法,需要大量訓練數據才能有效地識別對象;而滑坡數據通過實地勘探和目視解譯以小區(qū)域形式生成,提供的數據量較少;持續(xù)同調(Persistent Homology)雖在圖像分割方面得到重視[3-7],但在滑坡提取領域尚未得到充分應用。 本文提出一種基于深度學習與持續(xù)同調的滑坡提取方法,通過LiDAR 點云技術構建高分辨率數字地形模型(DTM),并以其衍生產品作為數據源,制作研究區(qū)先驗滑坡樣本,導入Res-Unet 網絡模型中訓練,得到滑坡圖像分割結果;然后通過引入持續(xù)同調理論,對滑坡進行拓撲特征描述,提取曲率因子,依照持續(xù)同調理論檢測滑坡拓撲特征;最后綜合深度學習和持續(xù)同調結果,依照一定準則對研究區(qū)進行分析判別,獲取林下滑坡提取結果。
如圖1 所示,實驗以美國華盛頓州風河實驗森林(Wind River Experimental Forest)為研究區(qū),其海拔268~1389 m,經緯度54.77° ~54.90°N,121.77° ~122.1°W,面積241.68 km2。 該地區(qū)位于美國華盛頓州南部,夏季溫暖干燥、冬季涼爽潮濕,年降水量約2225 mm,地層巖性以玄武巖和安山巖為主,且地層常被火山泥石流及其噴出物覆蓋,包含冷杉、鐵杉、銀杉等多種植被,具有多樣性,從光學影像上難以直接獲取林下滑坡信息。
圖1 滑坡區(qū)與研究區(qū)
采用美國國家生態(tài)觀測網絡(The National Ecological Observatory Network,NEON)提供的LiDAR點云數據[8]為數據源。 先驗滑坡信息源于美國地質調查局收錄的美國本土滑坡編目數據庫[9]。 通過機載LiDAR 技術獲取點云數據,利用漸進三角網濾波算法將點云數據分為地面點和非地面點,然后使用插值法將地面點云數據生成所需DTM 影像。 內插方法主要包括反距離加權法、克里金插值和自然領域插值,其中反距離加權法插值精度更高[10]。 將地面點云以不規(guī)則三角網形式構建TIN 網,通過反距離加權法進行插值輸出高分辨率DTM 柵格影像。
采用DTM 影像及其衍生產品包括坡度影像、山體陰影構成的三通道影像制作樣本數據,其中DTM 柵格影像為5 m 空間分辨率。 根據先驗滑坡信息,對影像進行裁剪。 最終樣本數據集包含215 幅滑坡影像(正樣本)、83 幅非滑坡影像(負樣本)以及對應的標簽影像。
深度學習樣本數量越多,泛化能力越強,樣本數量不足或樣本質量不夠好時,需對樣本進行數據增強。實驗采用馬賽克(Mosaic)數據增強法對樣本集進行處理。 如圖2 所示,選取4 張樣本做隨機裁剪、旋轉、縮放和翻轉等處理,進行拼接,并將其作為新樣本加入樣本集。 此外,通過隨機裁剪,擴容樣本數據集,提高了模型魯棒性。
圖2 馬賽克數據增強
UNet 模型的結構類似對稱的U 形,簡單、高效,適合進行小樣本集訓練。 其前半部分為編碼部分,通過卷積層卷積處理,用ReLU 激活函數激活,并使用最大池化層增大感受野,壓縮特征圖;后半部分為解碼部分,通過多次采樣將特征圖恢復至原圖像尺寸。 為實現不同層級的特征融合,利用編碼特征對解碼特征進行細節(jié)補充。
傳統UNet 網絡中的低層和高層特征存在語義差異,直接拼接會出現特征缺失等情況,不利于模型學習。 實驗添加殘差模塊,疊加卷積層的輸入與輸出,增加短路連接,形成殘差學習,補充卷積過程中損失的特征信息,增強模型訓練過程中梯度的反向傳播。 如圖3所示,殘差模塊的輸出結果H(x)可分為直接映射x和殘差F(x)兩部分,公式為:
圖3 殘差模塊
殘差模塊通常包含多個卷積操作,將卷積后的特征圖與直接映射x相加得到新的特征圖。 模型在網絡訓練中直接學習擬合的殘差映射F(x),使所學滑坡特征更準確,并保證滑坡特征信息的完整性,Res-UNet結構如圖4 所示。
圖4 Res-UNet 結構
模型訓練算法為隨機梯度下降算法,訓練過程中使用網格搜索來調整模型超參數,用Adam 優(yōu)化器計算和調整權重。 利用不同卷積核采樣可獲得體現滑坡紋理的淺層特征,在網絡深層卷積結構中獲取從類別上有較好區(qū)分度的深層語義特征。 UNet 模型的損失函數選擇基于二分類交叉熵損失函數,計算公式為:
式中Tloss表示模型的交叉熵損失,其值越小,模型預測效果越好;P表示樣本像素的真實分布,取值0 或1;Q表示樣本像素的預測分布,取值范圍從0 到1。
Res-UNet 模型輸出結果為一張圖像,其像素值對應滑坡的預測概率。 設定閾值,將滑坡圖像二值化,獲得滑坡分割結果。
拓撲學不考慮物體的形狀和大小,而關注其位置關系,主要工具是持續(xù)同調。 通過計算數據集在不同尺度下的拓撲特征,能更真實地反映空間特征,在多尺度下持續(xù)出現的拓撲特征通常被認為是數據的真實特征,反之則被認為是誤差。 通過計算單純復形拓撲特征的存在時間,分析數據集的同調性質。
山脊可以凸顯滑坡體的“持續(xù)”形狀特征,為提取滑坡拓撲特征,首先識別山脊。 山脊常位于地面起伏變化較大的位置,數學上與地形曲面擬合函數的導數有關,表現為滑坡表面粗糙度或曲率的變化。 地形曲面擬合函數f(x,y)為:
式中x,y為局部坐標;a,b,c,d,e,f均為擬合函數的系數,通過最小二乘法從DTM 影像中擬合得到。
利用地形曲面函數的參數與局部坐標點計算該點處的最小曲率Kmin和最大曲率Kmax,并計算其平均值即可獲得平均曲率Kmean,提取研究區(qū)山脊:
以曲率標準差為閾值檢索并提取山脊,經離散化后提取圖像邊界上離散點坐標,以行表示點序,以列記錄坐標,構建離散點集,進行持續(xù)同調運算,并選擇Alpha 復合形作為持續(xù)同調中的單純復形。
計算持續(xù)同調過程中點集的拓撲特征,將滑坡在幾何上的拓撲特征轉化成了代數上的拓撲特征,并以山脊拓撲特征來指代滑坡。 為選擇合適的拓撲特征,以存在時間和產生時間為閾值:存在時間指拓撲特征從形成到消失的時間段,即特征持續(xù)時間;產生時間指特征形成的時間,即特征首次出現的時間(如圖5 所示)。
圖5 滑坡的持續(xù)同調特征提取流程
如圖6 所示,結合持續(xù)同調方法提取的滑坡拓撲信息和深度學習分割得到的滑坡區(qū)域,通過計算深度學習分割的滑坡區(qū)域中滑坡拓撲面積所占比例,設置閾值為0.3,對研究區(qū)進行判定,視達到閾值的滑坡區(qū)為實驗提取的滑坡區(qū)域。
圖6 提取可信滑坡區(qū)域
滑坡提取局部示例見圖7,其中左側為應用Res-UNet 模型分割滑坡的結果,可見采用深度學習進行滑坡提取可行。 然而該方法容易出現過擬合情況,使部分平緩區(qū)域被誤判為滑坡,僅采用改進的UNet 模型進行滑坡提取并未達到實驗目的。 圖7 右側為應用持續(xù)同調原理獲取的滑坡拓撲特征,將其與深度學習提取結果相疊加,可發(fā)現持續(xù)同調圈定滑坡范圍效果較好。
圖7 滑坡提取局部示例
從研究區(qū)中選取3 個區(qū)域,將提取滑坡數據與已知滑坡信息疊加,計算混淆矩陣,作為計算各種評價指標基礎,結果如圖8 所示。
圖8 各研究區(qū)分析結果
選擇準確度(Accuracy)、精度(Precision)、召回率(Recall)和F1值對滑坡提取結果進行精度評價。 計算公式為:
式中TP表示真陽性,標簽為滑坡時的滑坡面積;FP表示偽陽性,標簽為非滑坡時的滑坡面積;FN表示真陰性,標簽為滑坡時的非滑坡面積;TN表示偽陰性,標簽為非滑坡時的非滑坡面積。
表1 為精度評定結果。 實驗提取的準確度均值為79.7%,精度均值為63.1%,召回率均值為70.2%,F1均值為65.5%,所用方法達到預期精度。 可以看出,基于深度學習和持續(xù)同調的滑坡提取方法整體提取效果較理想,能準確識別研究區(qū)內的大部分滑坡。
表1 預測結果精度評價
1) LiDAR 技術具有較強的植被穿透能力,濾波后的地面點云能較精確地反映地表信息,基于LiDAR 技術的滑坡提取研究可有效捕捉真實地表信息,達到對植被茂密地區(qū)進行林下滑坡提取的目的。
2) 采用深度學習和持續(xù)同調相結合的滑坡提取方法進行林下滑坡提取,對3 個區(qū)域進行定量分析,準確度均值為79.7%,精度均值為63.1%,召回率均值為70.2%,F1均值為65.5%,表明結合Res-UNet 和持續(xù)同調的方法提取效果較理想,能準確識別研究區(qū)內的大部分滑坡。