張慧敏,張林生
深度學(xué)習(xí)方法應(yīng)用于邊坡滑坡圖像識(shí)別技術(shù)研究*
張慧敏,張林生
(重慶電子工程職業(yè)學(xué)院 通信工程學(xué)院,重慶 401331)
邊坡滑坡災(zāi)害在中國(guó)地質(zhì)災(zāi)害中尤為多見,給國(guó)家造成財(cái)產(chǎn)損失,危及人民生命安全,邊坡滑坡狀態(tài)監(jiān)測(cè)對(duì)預(yù)防治理地質(zhì)災(zāi)害、保護(hù)人民生命財(cái)產(chǎn)安全至關(guān)重要。將深度學(xué)習(xí)方法與邊坡滑坡監(jiān)測(cè)相結(jié)合開展研究,從而提升邊坡滑坡智能識(shí)別能力,提高判識(shí)準(zhǔn)確率。
邊坡;滑坡;深度學(xué)習(xí);圖像識(shí)別
邊坡監(jiān)測(cè)方法較多,如人工觀測(cè)法、北斗測(cè)量法、傳感器監(jiān)測(cè)法、圖像檢測(cè)法等方法,其中圖像檢測(cè)法基于數(shù)字圖像技術(shù)采集特定邊坡區(qū)域的圖像信息,運(yùn)用計(jì)算處理分析技術(shù)判識(shí)邊坡穩(wěn)定狀態(tài),從而實(shí)現(xiàn)對(duì)邊坡的無損監(jiān)測(cè)[1]。該方法較之其他監(jiān)測(cè)方法,具有安裝便捷、覆蓋面廣、智能化程度高、簡(jiǎn)明直觀等優(yōu)點(diǎn)。同時(shí)進(jìn)入21世紀(jì)后隨著計(jì)算機(jī)處理速度提升與GPU性能增強(qiáng),深度學(xué)習(xí)方法從理論走向工程應(yīng)用,到現(xiàn)在已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域[2]。
深度學(xué)習(xí)方法目前已取得了舉世矚目的成就,其在各行各業(yè)的應(yīng)用均取得了非常好的成果,DeepLearning++這一概念正在不斷地拓展應(yīng)用領(lǐng)域,改變?nèi)藗兊纳罟ぷ鞣绞絒3]。深度學(xué)習(xí)技術(shù)是深度神經(jīng)網(wǎng)絡(luò)的工程運(yùn)用。目前的深度神經(jīng)網(wǎng)絡(luò)采用的主要為卷積結(jié)構(gòu),因此,深度神經(jīng)網(wǎng)絡(luò)也被稱為深度卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)從20世紀(jì)問世發(fā)展到現(xiàn)在,發(fā)展出了許多知名的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。這些卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別和分類任務(wù)中表現(xiàn)突出,它們能夠很好地學(xué)習(xí)到圖像具有的特征。底層網(wǎng)絡(luò)的隱藏層能學(xué)習(xí)到圖像的底層特征,比如輪廓、像素、角點(diǎn)等,高層網(wǎng)絡(luò)的隱藏層能學(xué)習(xí)到綜合圖像底層特征之后的高級(jí)特征。這些高級(jí)特征所代表的信息量十分豐富,也賦予了卷積神經(jīng)網(wǎng)絡(luò)抽象的思維模式。使用這些高級(jí)特征對(duì)物體進(jìn)行識(shí)別并分類,相比于傳統(tǒng)的手工特征有著更加優(yōu)秀的性能。目前學(xué)術(shù)界研究成果中經(jīng)典的網(wǎng)絡(luò)有AlexNet、VGGNet、GoogleNet、ResNet、FPN網(wǎng)絡(luò)等。
卷積神經(jīng)網(wǎng)絡(luò)的卷積層來源于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的每個(gè)單元結(jié)構(gòu)如圖1所示。
圖1 單神經(jīng)元結(jié)構(gòu)圖
相對(duì)應(yīng)的公式為:
式(1)中:T為神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù);為輸入的信息;為偏置項(xiàng)。
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)是將多個(gè)這樣的神經(jīng)網(wǎng)絡(luò)單元組合起來,一個(gè)多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
相對(duì)應(yīng)的公式如下所示:
在卷積神經(jīng)網(wǎng)絡(luò)中,有著許許多多的隱層,它們層層堆疊在一起,每一層都會(huì)對(duì)上一層的輸出進(jìn)行處理,直到最終輸出層輸出結(jié)果。卷積神經(jīng)網(wǎng)絡(luò)對(duì)于圖像信息的處理就是層層提取特征,在淺層的網(wǎng)絡(luò)層提取圖像表層特征,如輪廓、角點(diǎn)、像素等。到了高層網(wǎng)絡(luò)層,提取到的是圖像特征信息聚合后的高層特征。高層特征更為抽象,所代表的信息更加的豐富。卷積神經(jīng)網(wǎng)絡(luò)一般包含有卷積層、批量標(biāo)準(zhǔn)化層、激活函數(shù)層、池化層、全連接層和Softmax函數(shù)層[4]。
這里不再對(duì)卷積神經(jīng)網(wǎng)絡(luò)展開介紹,深度學(xué)習(xí)方法的核心就是卷積神經(jīng)網(wǎng)絡(luò),用于工程應(yīng)用時(shí)對(duì)計(jì)算處理單元要求較高,因此為了提升算法實(shí)時(shí)性,需要搭配高性能計(jì)算處理硬件平臺(tái)。
本文對(duì)深度學(xué)習(xí)做了詳盡的調(diào)查,力圖找尋到一個(gè)合適的技術(shù)方案,以求在滿足精準(zhǔn)度的同時(shí)能完成效率較高的識(shí)別任務(wù)。
深度學(xué)習(xí)方法的應(yīng)用,首先是樣本集訓(xùn)練。根據(jù)工程要求,該研究以實(shí)物場(chǎng)景圖像與網(wǎng)絡(luò)圖像結(jié)合的方式構(gòu)建包含有道路、邊坡、巖土的訓(xùn)練、驗(yàn)證與測(cè)試數(shù)據(jù)集。其中,訓(xùn)練樣本均采用網(wǎng)絡(luò)圖像,道路、邊坡和巖土的樣本也可采用實(shí)物場(chǎng)景圖像與網(wǎng)絡(luò)圖像。本文采用結(jié)合自動(dòng)標(biāo)注的方法對(duì)樣本中的道路、邊坡、巖土類樣本進(jìn)行識(shí)別并自動(dòng)標(biāo)注。通過人工法對(duì)標(biāo)注結(jié)果進(jìn)行檢查并精修。對(duì)邊坡、巖土類樣本進(jìn)行人工標(biāo)注。
原始數(shù)據(jù)集部分樣本圖片如圖3所示。
圖3 原始數(shù)據(jù)集部分樣本圖片(圖片來源于百度網(wǎng)站)
本文采用模擬深度學(xué)習(xí)專業(yè)數(shù)據(jù)標(biāo)注軟件Labelme進(jìn)行樣本訓(xùn)練,通過使用深度學(xué)習(xí)技術(shù)對(duì)圖片進(jìn)行學(xué)習(xí)訓(xùn)練。然后再結(jié)合人工精修方法完善樣本。Labelme是一款圖形界面的圖像標(biāo)注軟件,使用python語(yǔ)言編寫,圖形界面使用的是PyQt。當(dāng)應(yīng)用于圖像分割任務(wù)時(shí),Labelme軟件能夠靈活地對(duì)圖像進(jìn)行多邊形、點(diǎn)、圓形、多線段、直線等標(biāo)注;當(dāng)應(yīng)用于圖像分類任務(wù)時(shí),Labelme軟件可對(duì)圖像進(jìn)行flag標(biāo)注。最后Labelme軟件生成的標(biāo)注數(shù)據(jù)集可以保存為coco數(shù)據(jù)集格式或者voc數(shù)據(jù)集格式。樣本標(biāo)注技術(shù)流程如圖4所示。
本文通過模擬仿真實(shí)驗(yàn)來驗(yàn)證深度學(xué)習(xí)方法的識(shí)別能力,模擬仿真實(shí)驗(yàn)選用網(wǎng)上公開的道路邊坡圖片,圖片中包含道路、邊坡、巖土等公路邊坡相關(guān)圖像。實(shí)驗(yàn)?zāi)康氖球?yàn)證深度學(xué)習(xí)方法是否能有效判識(shí)邊坡狀態(tài)。對(duì)50張道路邊坡圖片進(jìn)行模擬仿真分析,結(jié)果表明道路平均識(shí)別準(zhǔn)確率為85%,邊坡平均識(shí)別準(zhǔn)確率為61%,巖土平均識(shí)別準(zhǔn)確率為55%。通過研究發(fā)現(xiàn),道路識(shí)別率較高主要得益于道路特征信息清晰;邊坡受植被、錨索、防滑樁等異物影響,識(shí)別率較低;巖土背景更為復(fù)雜,不同類型巖土顏色差異較大,巖土輪廓特征各異,識(shí)別率較低。
圖4 樣本標(biāo)注技術(shù)流程
綜上所述,深度學(xué)習(xí)方法能夠應(yīng)用于邊坡滑坡圖像識(shí)別,其識(shí)別算法可以采用多種神經(jīng)網(wǎng)絡(luò)架構(gòu),比如SSD300、Faster R-CNN、YOLOv3、Mask R-CNN等網(wǎng)絡(luò)結(jié)構(gòu)。通過模擬仿真實(shí)驗(yàn)可知,道路識(shí)別率較高、邊坡和巖土識(shí)別率較低,由于邊坡和巖土多樣性及特征各異,外加干擾異物的影響。因此,為了提高邊坡和巖土識(shí)別率,需要采取以下改進(jìn)措施:①增大邊坡、巖土數(shù)據(jù)集訓(xùn)練樣本;②需要先期識(shí)別邊坡、巖土干擾異物(比如樹、植被、錨索、防滑樁等特征異物),然后再識(shí)別邊坡、巖土。本文研究?jī)?nèi)容具有一定的工程意義,對(duì)深度學(xué)習(xí)方法應(yīng)用于邊坡滑坡圖像識(shí)別技術(shù)研究具有一定的參考價(jià)值。
[1]常祥.基于改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)的圖像分類性能[J].重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,31(3):110-115.
[2]IOFFE S,SZEGEDY C.Batch normalization: Accelerating deep network training by reducing internal covariate shift[C]//International conference on international conference on machine learning.JMLR.org,2015.
[3]陳煒.基于ARM平臺(tái)的紅外制導(dǎo)仿真系統(tǒng)[D].西安:西安電子科技大學(xué),2018.
[4]REDMON J,DIVVALA S,GIRSHICK R,et al.You only look once:unified,real-time object detection[C]// 2016 IEEE conference on computer vision and pattern recognition(CVPR),IEEE,2016.
U416.14
A
10.15913/j.cnki.kjycx.2021.01.001
2095-6835(2021)01-0001-02
重慶市教委科學(xué)技術(shù)研究項(xiàng)目(編號(hào):KJQN201803104),重慶市教委科學(xué)技術(shù)研究項(xiàng)目(編號(hào):KJQN201903106)資助
張慧敏(1981—),女,博士,教授,研究方向?yàn)閳D像處理。
〔編輯:張思楠〕