洪 倩,陳楓楠,梁 冬,李 晉,陳曉楓,戚國輝
(1.國網(wǎng)經(jīng)濟技術研究院有限公司,北京102209;2.紫光軟件系統(tǒng)有限公司,北京100084)
快速準確監(jiān)控施工擾動區(qū)域?qū)Ψ乐谓ㄔO項目水土流失具有重要意義。高分2號衛(wèi)星屬于民用衛(wèi)星,其空間分辨率較高而影像資料獲取費用較低,可用于施工擾動區(qū)域的快速識別。建設項目施工擾動區(qū)域遙感監(jiān)測的傳統(tǒng)解譯方法主要是目視解譯,計算機自動分類技術方法目前還不是特別成熟。近年來,將人工智能算法應用到圖像識別中是一個研究熱點,而圖像識別中最廣泛的學習模式是卷積神經(jīng)網(wǎng)絡算法,該算法在目標監(jiān)測、圖像分類、語音識別及行為識別等領域引發(fā)了一場研究與應用熱潮。特高壓輸變電工程與一般建設項目不同,具有線路長、地形地貌復雜、施工標段多、擾動范圍分散、造成的水土流失嚴重、監(jiān)督管理困難等特點[1]。筆者對基于卷積神經(jīng)網(wǎng)絡算法的圖像識別方法進行研究,并利用高分2號衛(wèi)星遙感影像對榆橫—濰坊特高壓輸變電工程塔基施工擾動區(qū)域進行自動識別,以期探索開發(fā)建設項目施工擾動區(qū)域和人為水土流失快速監(jiān)測方法。
榆橫—濰坊1 000 kV特高壓交流輸變電工程(簡稱榆橫—濰坊工程)起于陜西省榆橫交流變電站、止于山東省濰坊變電站,途經(jīng)陜西、山西、河北、山東四省,是國家大氣污染防治行動計劃“四交四直”特高壓工程中第5條輸電通道,是國家“三縱三橫”特高壓東西主干網(wǎng)架、華北特高壓交直流主網(wǎng)架的重要組成部分,線路全長 2×1 048.5 km,其中陜西省境內(nèi)約 2×151.5 km、山西省境內(nèi)約 2×318.0 km、河北省境內(nèi)約2×215.0 km、山東省境內(nèi)約 2×364.0 km。 該項目涉及平原農(nóng)作物區(qū)、山地林區(qū)、丘陵草地區(qū)、平原草地區(qū)等不同地類,急需開展擾動區(qū)域監(jiān)測。
高分2號衛(wèi)星是國家高分辨率對地觀測系統(tǒng)重大專項首批啟動研制的衛(wèi)星,于2014年8月19日發(fā)射成功[2],是目前我國研制的空間分辨率最高、觀測幅寬最大、設計壽命最長的民用遙感衛(wèi)星。該衛(wèi)星遙感數(shù)據(jù)突破亞米級高分辨率大幅寬成像、長焦距大F數(shù)輕小型相機設計、高穩(wěn)定度快速姿態(tài)側(cè)擺、圖像高精度定位、低軌道遙感衛(wèi)星長壽命高可靠設計等關鍵技術,大幅提升了我國遙感衛(wèi)星觀測效能,打破高分辨率對地觀測數(shù)據(jù)依賴進口的被動局面,推動了植被、土地利用、水土保持等方面的遙感監(jiān)控。
高分2號衛(wèi)星遙感數(shù)據(jù)具有4個多光譜波段、1個全色波段,多光譜分辨率達到3.24 m、全色波段分辨率達到0.81 m。從該數(shù)據(jù)光譜波段來看,適合對特高壓塔基施工擾動區(qū)域植被、土壤和施工材料的監(jiān)測;從空間分辨角度看,能夠滿足水土保持行業(yè)對施工擾動面積監(jiān)控的精度要求。此外獲取數(shù)據(jù)成本較低、適合廣泛使用,因此選擇高分2號衛(wèi)星遙感數(shù)據(jù)進行特高壓塔基擾動區(qū)域監(jiān)控研究。
2.1.1 卷積神經(jīng)網(wǎng)絡算法
卷積神經(jīng)網(wǎng)絡最早出現(xiàn)于Yann Le Cun設計的LeNet-5中(LeNet-5包含了2個卷積層、2個池化層和3個全連接層),用于手寫字符識別,取得了較好的效果[3]。 此后陸續(xù)出現(xiàn)了 AlexNet、VggNet、GoogLeNet和 ResNet[4-7],其中:AlexNet有 8 層網(wǎng)絡,包含 5 個卷積層和3個全連接層,使用兩塊GPU并行加速訓練,用Relu作為激活函數(shù),通過數(shù)據(jù)增強、DropOut以及設置局部響應歸一化層(Local Response Normalization,簡稱LRN)防止過擬合問題;VggNet包含不同級別的網(wǎng)絡,常用的是 VggNet-16和 VggNet-19,VggNet使用3×3和1×1的卷積核,使用小卷積核改善了網(wǎng)絡的分類效果;GoogLeNet首次出現(xiàn)在ILSVRC14比賽中,在當時獲得了第一名,GoogLeNet團隊提出Inception網(wǎng)絡結構,將全連接變?yōu)橄∈柽B接,使得不同的卷積核可以提取不同尺度的特征信息;ResNet(全稱Residual Neural Network)由He K等提出,該模型有不同的網(wǎng)絡層數(shù)、使用殘差模塊(見圖1),常用的有50層、101層和152層,主要代表網(wǎng)絡類型有 ResNet50和ResNet101。在ResNet中通過使用殘差模塊,能夠?qū)⑿畔妮斎肜@道傳到輸出,簡化學習的復雜度。本研究使用ResNet50進行網(wǎng)絡訓練,見圖2。
圖1 殘差模塊示意
圖2 ResNet50的結構
本研究將 224×224×3(長度×寬度×通道數(shù),長、寬均為像素數(shù))的圖像作為輸入,進入第一個卷積層conv1(conv1中包括 64個 7×7的卷積核),步長為2(像素數(shù)),接下來進入BatchNorm層。ResNet使用BatchNorm加速訓練,以獲得穩(wěn)定的訓練結果,能夠?qū)γ恳粋€batch的均值和方差做歸一化處理;激活函數(shù)使用Relu,采用最大池化,使用softmax進行輸出。
2.1.2 參數(shù)訓練
本研究采用的硬件設備為 Ubuntu16.04系統(tǒng)(Intel Xeon E52603處理器,8G內(nèi)存,NVIDIA Quadro K620 顯卡),軟件為 Tensorflow1.12.0。 對樣本圖像進行假彩色合成,使用labelImg工具制作訓練樣本,用3 000張作為訓練集、測試集和驗證集,樣本比例為3∶1∶1。設置分類數(shù)為4,batch size為16,最小學習率為0.000 1,平均學習率為 0.002,權重衰減速率為0.000 2,每個殘差組內(nèi)殘差單元數(shù)量為5,泄露修正線性單元(Leaky ReLU)參數(shù)為0.1,優(yōu)化策略為Adaptive Moment Estimation方法,對模型進行50 000次訓練,最終精度為90.4%。
2.2.1 平原農(nóng)作物區(qū)分類結果
使用的高分二號衛(wèi)星遙感影像全色和多光譜融合后空間分辨率為1 m,可清晰識別平原農(nóng)作物區(qū)特高壓施工擾動區(qū)域并準確計算擾動面積。對平原農(nóng)作物區(qū)9S120號塔基施工擾動區(qū)域解譯分類結果見圖3,對平原農(nóng)作物區(qū)8個典型樣點(塔基)擾動面積解譯計算結果見表1??梢钥闯?,卷積神經(jīng)網(wǎng)絡分類計算結果可信度較高,與目視解譯結果幾乎相等,相對誤差最大為 7.28%、最小為 1.20%,平均誤差為 4.43%。
表1 平原農(nóng)作物區(qū)典型樣點擾動面積解譯計算結果統(tǒng)計
2.2.2 山地林區(qū)分類結果
山地林區(qū)14R067號塔基施工擾動區(qū)域解譯分類結果見圖4,9個典型樣點(塔基)擾動面積解譯計算結果見表2??梢钥闯觯谏降亓謪^(qū)利用卷積神經(jīng)網(wǎng)絡分類方法從高分2號衛(wèi)星遙感影像提取擾動面積的準確度較高,與目視解譯效果相當,相對誤差最大為11.77%、最小為 4.84%。
圖4 山地林區(qū)14R067號塔基擾動區(qū)域解譯結果
2.2.3 丘陵草地區(qū)分類結果
丘陵草地區(qū)14S079號塔基施工擾動區(qū)域解譯分類結果見圖5,7個典型樣點(塔基)擾動面積解譯計算結果見表3??梢钥闯?,用高分2號衛(wèi)星遙感影像可清晰識別丘陵草地區(qū)特高壓施工擾動區(qū)域,并可較準確地提取施工擾動面積,卷積神經(jīng)網(wǎng)絡分類計算相對誤差最大為7.68%、最小為5.37%,可信度較高。
表2 山地林區(qū)典型樣點擾動面積解譯計算結果統(tǒng)計
圖5 丘陵草地區(qū)14S079號塔基擾動區(qū)域解譯結果
表3 丘陵草地區(qū)典型樣點擾動面積解譯計算結果統(tǒng)計
2.2.4 平原草地區(qū)分類結果
平原草地區(qū)2S37號塔基施工擾動區(qū)域解譯分類結果見圖6,9個典型樣點(塔基)擾動面積解譯計算結果統(tǒng)計見表4??梢钥闯觯矸e神經(jīng)網(wǎng)絡分類計算結果可信度較高,與目視解譯效果相當,相對誤差最大為 7.21%、最小為 4.32%。
圖6 平原草地區(qū)2S37號塔基擾動區(qū)域解譯結果
表4 平原草地區(qū)典型樣點擾動面積解譯計算結果統(tǒng)計
利用卷積神經(jīng)網(wǎng)絡算法和高分2號衛(wèi)星遙感影像可以快速識別平原農(nóng)作物區(qū)、山地林區(qū)、丘陵草地區(qū)、平原草地區(qū)等不同地形地貌區(qū)施工擾動區(qū)域(范圍),并準確提取施工擾動面積,對各類地貌區(qū)典型樣點(特高壓輸變電工程塔基)施工擾動面積的分類計算結果與目視解譯結果基本一致,與實測值相比,相對誤差最大值為11.77%、最小值為1.20%,準確率較高,表明其可用于水土保持監(jiān)測和管理。
基于殘差網(wǎng)絡ResNet50識別施工擾動區(qū)取得了較好的效果,但仍有一些需要改進的地方。由于Res-Net50模型網(wǎng)絡層數(shù)較多、需要大量的參數(shù),因此訓練過程中參數(shù)調(diào)整的時間長、訓練難度較大、泛化能力不夠強。本研究使用ResNet50的預訓練模型進行網(wǎng)絡訓練,并未對算法進行細節(jié)方面的優(yōu)化,后續(xù)研究可考慮使用多種模型并結合空洞卷積、語義分割等方法進行網(wǎng)絡訓練,以提高識別精度。