佘佐明,申勇智,宋劍虹,向玉瑨
(貴陽市測繪院,貴州 貴陽 550000)
遙感衛(wèi)星數(shù)據(jù)及分析解譯初級成果在自然資源部門及其他相關(guān)業(yè)務(wù)領(lǐng)域中需求逐漸加大,在住房建設(shè)、礦業(yè)監(jiān)管、水土保持、生態(tài)修復(fù)、疫情防控等方面的應(yīng)用十分廣泛。筆者所在單位自2021年11月,在衛(wèi)星遙感解譯分析中開展了多個方面的研究與探索,包括地表礦區(qū)狀態(tài)信息發(fā)現(xiàn)、地表自然資源要素的變化監(jiān)測、城市“熱島效應(yīng)”,以及道路與水系等現(xiàn)狀要素的自動、半自動化提取等多個方面,通過解譯實現(xiàn)地表特征精細化量測及三維地物模型重建,更高效地掌握市區(qū)范圍的地表信息情況,建立解譯成果綜合數(shù)據(jù)庫,為下一步做好城市建設(shè)提供基礎(chǔ)數(shù)據(jù)支撐,為多類要素的快速查詢與分析提供科學(xué)依據(jù)。本文在道路要素自動化解譯過程中,利用機器學(xué)習(xí)、深度學(xué)習(xí)等人工智能技術(shù),自動與半自動化提取地理實體、地理場景數(shù)據(jù),并對數(shù)據(jù)進行優(yōu)化處理,結(jié)合交通流數(shù)據(jù)完善道路等級屬性,實現(xiàn)地理實體的多粒度、多模態(tài)智能高效提取。
針對高分辨率遙感影像,人工解譯道路提取方法費時費力的問題,近幾年,利用深度學(xué)習(xí)提取地表各種矢量要素的方法大大提高了道路獲取和更新的效率[1],其中卷積神經(jīng)網(wǎng)絡(luò)方法是最為熱門的。但方法中各個環(huán)節(jié)的模型參數(shù)具有較大的可變性,對于不同分辨率、不同矢量要素、不同地表紋理特征,這種參數(shù)的模型和參數(shù)具有一定的范圍適應(yīng)性,通常為輸入源感知的網(wǎng)絡(luò)訓(xùn)練模型[2-3]。通過建立貴陽市區(qū)域有代表性的影像道路樣本集,確定深度學(xué)習(xí)模型且通過模型學(xué)習(xí)獲得參數(shù)。
數(shù)據(jù)源樣本包括兩個影像集。一個為影像道路集,命名為GY_RoadSample,原始圖像分辨率為0.8 m,拍攝區(qū)域為貴陽市觀山湖公園周邊約10 km2范圍,采集時間為2021年11月,拼接后的影像尺寸較大。因大尺寸的訓(xùn)練圖像在進行訓(xùn)練時對硬件性能的要求較高,訓(xùn)練耗時也將更長。因此在實踐中制作了標準尺寸的影像,將圖像切分成邊長為64×64、128×128、256×256、512×512、1024×1024像素等大小的圖像,作為訓(xùn)練對象,每個訓(xùn)練圖像標注時,將道路覆蓋的像素賦值為255,剩余區(qū)域賦值為0,通過這種方法制成了道路訓(xùn)練Label集合[4-5]??紤]到多個試驗的驗證效率,試驗中使用了2173張訓(xùn)練圖像和163張驗證圖像。另一個為一部分非正方形的影像道路集,命名為GY_RoadSet,單個文件原始尺寸為1900×2300像素,由709張訓(xùn)練圖像和16張驗證圖像組成。為了防止在訓(xùn)練過程中模型對某個特定區(qū)域的特征形成小范圍的適應(yīng)性聚集的情況,所有原始圖像和標簽圖像均以隨機順序的方式排列,以降低試驗中有序樣本產(chǎn)生的影響[6]。
參考文獻[7—9]影像道路提取,在借鑒經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)結(jié)構(gòu)的基礎(chǔ)上設(shè)計了適用于貴陽市區(qū)域道路的識別模型。總體思路如圖1所示,在構(gòu)建過程中,主要考慮池化方式的確定、激活函數(shù)對比、網(wǎng)絡(luò)深度優(yōu)化和輸入尺寸選取4個方面的結(jié)果輸出、對比分析與參數(shù)調(diào)整。將之前建立的樣本數(shù)據(jù)集作為不同的數(shù)據(jù)源基礎(chǔ),針對以上4個方面分別進行試驗驗證,根據(jù)各次試驗的最優(yōu)結(jié)果選擇合理的運算模型,并進行參數(shù)集范圍的縮小與確定,最終形成適用于貴陽市區(qū)域的道路識別模型。試驗采取識別到單條道路即為該道路識別成功(不考慮形狀匹配)的判斷方式。
圖1 深度學(xué)習(xí)道路提取模型的分解過程
(1)池化方式的確定。在CNN中,池化的目標是降低特征的維度,且提取具有重要語義信息的特征。常用的典型池化方式有最大池化法和平均池化法。最大池化會忽視信息較少的特征,提取具有重點信息的特征作為輸出,從而達到關(guān)注重點特征的目的。當(dāng)特征圖中的信息都比較重要時,平均池化能較平均地提取特征圖中的信息,較好地保留圖像的背景信息。由于道路形狀大都由線狀、面狀要素構(gòu)成,與其他線狀要素相比,粗細寬度較均勻,在不考慮背景干擾的情況下,只提取線條特征,即值最大的像素點能代表臨近的特征,在訓(xùn)練樣本GY_RoadSample網(wǎng)絡(luò)算法時采用最大池化進行特征提取。
(2)激活函數(shù)的選擇。深度學(xué)習(xí)模型結(jié)構(gòu)中,神經(jīng)網(wǎng)絡(luò)模型的任意兩層神經(jīng)元之間通常存在一個激活函數(shù),將線性輸入轉(zhuǎn)換為非線性輸入,使神經(jīng)網(wǎng)絡(luò)逐步逼近非線性函數(shù),從而擁有更強的特征表示能力。激活函數(shù)主要包含Sigmoid、Tanh、ReLU、LeakyReLU、RReLU、PReLU和ELU等。
在傳統(tǒng)的試驗中,大多采用應(yīng)用廣泛的ReLU函數(shù)為激活函數(shù)。本文為了尋求最適合于貴陽道路網(wǎng)識別網(wǎng)絡(luò)的激活函數(shù),綜合考慮準確率與計算量建立試驗,將各個激活函數(shù)分別應(yīng)用于神經(jīng)網(wǎng)絡(luò)中,卷積層數(shù)量設(shè)為16,數(shù)據(jù)集采用GY_RoadSample,挑選10個大類和113個小類的數(shù)據(jù)源輸入,將各次試驗獲得的分類準確率對比,結(jié)果見表1。對于采取的數(shù)據(jù)范圍,使用上述激活函數(shù)所得到的分類準確率均較高且差異較小,綜合評價最高的為LeakyReLU函數(shù)。
表1 激活函數(shù)對比試驗結(jié)果
最終獲得的激活函數(shù)準確率如圖2所示。圖中粉色與綠色的曲線分別代表LeakyReLU和ReLU激活函數(shù),在測試過程中均獲得了非常高的分類準確率,且表現(xiàn)最穩(wěn)定。綜合考慮推理時間和準確率,試驗將主要以LeakyReLU作為道路識別網(wǎng)絡(luò)的激活函數(shù)。
圖2 不同激活函數(shù)分類準確率對比
(3)網(wǎng)絡(luò)深度的選擇。針對道路識別中CNN網(wǎng)絡(luò)的識別結(jié)果與最優(yōu)結(jié)果相差微小,考慮可能是由于層數(shù)少或經(jīng)典CNN網(wǎng)絡(luò)模型規(guī)模較小的原因[10]。因此,為探究網(wǎng)絡(luò)深度對道路網(wǎng)絡(luò)識別產(chǎn)生的影響,在隱藏層中,分別采用卷積層不同的網(wǎng)絡(luò)層數(shù)進行試驗。以按每次9層的方式遞增設(shè)定網(wǎng)絡(luò)深度,分別為16、25、34、43及52層。試驗采用的數(shù)據(jù)集為GY_RoadSample,采用留出法對訓(xùn)練集、測試集和驗證集的數(shù)量進行分配,比例為6∶2∶2,將劃分好的數(shù)據(jù)輸入到16、25、34、43及52層卷積層神經(jīng)網(wǎng)絡(luò)中,將各次訓(xùn)練的樣本批量數(shù)目Batchsize(單包大小)設(shè)置為16,結(jié)果見表2。可知,參與試驗的各種深度卷積神經(jīng)網(wǎng)絡(luò)差距較小,均獲得了較好的識別效果,分類準確率均達99%以上,層數(shù)為16層時模型結(jié)果最優(yōu),在25個訓(xùn)練周期時,分類準確率達99.73%。
表2 網(wǎng)絡(luò)深度對比實驗結(jié)果
如圖3所示,黑色曲線為16層時模型精度最高,結(jié)果表明,針對道路網(wǎng)絡(luò)的識別并不是網(wǎng)絡(luò)越深越好,隨著層數(shù)的增加,無論在測試集上還是驗證集上,分類準確率均存在下降的現(xiàn)象,反而卷積層數(shù)為16、25前后的神經(jīng)網(wǎng)絡(luò)設(shè)計比較適合。
圖3 不同深度卷積神經(jīng)網(wǎng)絡(luò)分類準確率對比
(4)輸入尺寸的選擇。將GY_RoadSample數(shù)據(jù)集按樣本數(shù)量隨機劃分為兩組:第1組數(shù)據(jù)的每個類別包含1000個樣本,地域無序排列;第2組數(shù)據(jù)的每個類別包含2000個樣本,地域無序排列。為了探討數(shù)據(jù)樣本數(shù)量及數(shù)據(jù)輸入尺寸對識別的影響,考慮設(shè)置32×32、64×64、128×128、256×256、512×512和1024×1024像素的幾種輸入尺寸。其中,256×256和512×512代表最接近真實原始數(shù)據(jù)樣本的分辨率。
采用的模型為15層的卷積神經(jīng)網(wǎng)絡(luò),數(shù)據(jù)集為GY_RoadSet,按6∶2∶2的比例將數(shù)據(jù)集劃分為訓(xùn)練集、驗證集和測試集,將包大小(Batchsize)設(shè)置為16,學(xué)習(xí)率設(shè)置為0.001,采用LeakyReLU作為激活函數(shù),訓(xùn)練20、25、30個周期。通過測試,結(jié)果見表3。
表3 輸入尺寸對比試驗結(jié)果
結(jié)果顯示,雖然總體識別效果相差不大,但輸入尺寸對識別精度仍有影響,且1024×1024與64×64像素的輸入設(shè)置所得到的分類準確率均不是最高,證明針對該網(wǎng)絡(luò)并不是輸入尺寸越大或越小識別效果越好。由表2可知,尺寸為128×128與512×512像素輸入得到的相對準確率最高,顯示了以數(shù)據(jù)集平均寬高的尺寸作為輸入所得到的準確率最優(yōu)??蓪⑨槍τ谧R別網(wǎng)絡(luò)模型的輸入尺寸定為128×128像素。經(jīng)過特征編碼后,可以得到較高級的特征圖像。
利用完成訓(xùn)練的網(wǎng)絡(luò)模型進行道路提取,待預(yù)測數(shù)據(jù)采用數(shù)據(jù)源為:2020年1月至2021年9月時間段的北京二號、高分二號、高分七號、高景一號數(shù)據(jù),其分辨率為0.8、0.8、0.65、0.5 m的貴陽市全域衛(wèi)星遙感影像數(shù)據(jù),覆蓋范圍為貴陽市主要區(qū)域,面積約為8500 km2,由貴州省自然資源衛(wèi)星應(yīng)用技術(shù)中心提供,數(shù)據(jù)經(jīng)過輻射定標、大氣校正與正射校正、數(shù)據(jù)配準等預(yù)處理,且變化監(jiān)測實施前的數(shù)據(jù)為具有相同的投影坐標系、不同時期的兩版鑲嵌影像數(shù)據(jù)。
為避免客觀因素干擾,通過CNN網(wǎng)絡(luò)模型實現(xiàn)貴陽市道路要素提取,采用硬件配置為:處理器為32核心英特爾處理器,主頻為2.16 GHz,型號為Xeon系列Silver 4216;內(nèi)存為運行帶寬2400 MHz,共計256 GB;圖形硬件顯卡共計4個,型號為NVIDIA Quadro RTX 4000 8+128 GB。待提取影像數(shù)據(jù)為2020年1月至2021年9月,分辨率為0.8 m的貴陽市全域衛(wèi)星遙感影像鑲嵌成果數(shù)據(jù),覆蓋面積約8500 km2。將模型預(yù)測概率閾值設(shè)為0.35,并自動剔除50×50像素的碎小圖斑。
利用CNN網(wǎng)絡(luò)模型提取貴陽市道路要素,按照待提取影像規(guī)模,采用單節(jié)點4進程進行運算,提取效果部分展示如圖4所示。
圖4 道路要素提取過程中的原始影像與二值化結(jié)果
將自動提取結(jié)果與三調(diào)道路數(shù)據(jù)比對,提取匹配度較好。為驗證道路連通性及剔除碎小無效圖斑后結(jié)果,利用ArcGIS軟件進行道路中心線提取,如圖5所示。首先對道路矢量面數(shù)據(jù)進行柵格二值化,然后將道路與非道路重分類設(shè)置為0和1兩類。
圖5 道路柵格二值化結(jié)果和道路中心線矢量化結(jié)果
利用ArcScan工具條矢量化命令,選擇中心線矢量化方法,設(shè)置柵格參數(shù),選擇在區(qū)域內(nèi)部生成要素,即生成道路中心線。此方法提取的道路中心線整體完整度較好,但丟失部分屬性信息,同時由于原始矢量面數(shù)據(jù)與影像判讀的實際情況存在差異,部分高架橋、樓體樹木陰影、隧道、交叉路口等存在大量拓撲問題,需進一步優(yōu)化處理。
使用CNN實現(xiàn)道路要素提取,從訓(xùn)練的模型提取效果來看,使用卷積神經(jīng)網(wǎng)絡(luò)所提取的道路線和面結(jié)果仍然存在一些結(jié)構(gòu)和拓撲問題。主要表現(xiàn)為:原始數(shù)據(jù)質(zhì)量問題,以及樣本數(shù)量和樣本覆蓋類別不夠,這使得影像道路識別難、準確性降低、泛化能力降低;車輛、綠化帶和建筑物的陰影與遮擋道路提取形成干擾、阻斷導(dǎo)致道路面出現(xiàn)碎小漏洞、縫隙等問題;河流、河堤、鐵路等線狀物體與道路的相似性也為道路提取制造了困難;道路中心線出現(xiàn)碎小短線未連接、道路交叉口、碎小支路等拓撲結(jié)構(gòu)問題,如圖6所示。
圖6 提取道路要素存在的部分問題
針對使用CNN實現(xiàn)道路要素提取過程中出現(xiàn)的上述困難和問題,通過調(diào)整解譯輸入、參數(shù)設(shè)置結(jié)合算法模型等多種后處理技術(shù)手段,對道路要素幾何特征進行優(yōu)化處理。
(1)對由于車輛、綠化帶和建筑物的陰影與遮擋道路提取形成的干擾、阻斷,導(dǎo)致道路面出現(xiàn)碎小漏洞、縫隙等問題,采用填補面洞的方式處理。
(2)利用ArcScan工具條矢量化命令,重新提取道路中心線,解決了由于干擾要素導(dǎo)致的零散道路中心線等存在的大量拓撲問題。
(3)通過優(yōu)化算法模型進一步對道路中心線存在的其他拓撲結(jié)構(gòu)問題進行優(yōu)化處理。
通過算法模型的優(yōu)化處理,解決了道路要素線和面存在的一些問題,如道路面縫隙、中心線零散、碎小面、道路中心線碎小短線、道路交叉口輪廓線抽稀等,如圖7所示。最終實現(xiàn)了基于CNN網(wǎng)絡(luò)模型對貴陽市道路要素的提取,并完成了幾何特征的優(yōu)化,使得整體上視覺效果有所改善,達到了預(yù)期效果,如圖8所示。
圖7 道路要素優(yōu)化處理前后效果對比
圖8 貴陽市道路要素提取成果
(1)道路提取時效性量化分析。為了驗證本次模型的時間效益,對本模型提取過程和成果進行量化分析,成果量化指標見表4。為了更加直觀地對模型提取結(jié)果進行分析,基于上述提取結(jié)果統(tǒng)計了模型運行各個步驟時的耗時情況,見表5。
表4 提取成果量化指標
表5 模型運行耗時情況
模型運行結(jié)果顯示,對于貴陽市特殊的地形地貌,能夠在98 986 s時間完成提取累計總長度約39 452.606 km的道路要素,綜合提取速度約為2.5 s/km。改進后的模型在滿足基本拓撲關(guān)系和道路匹配程度的要求下,在模型的算法優(yōu)化上實現(xiàn)了較好的時效性,由試驗成果與整體耗時情況對比可知,本文提出的模型對于道路要素的自動化提取效率符合預(yù)期,相對于目視解譯的方式,極大地減少了人工采集的時間,為研究自動化提取地理實體提供了經(jīng)驗基礎(chǔ)。
(2)道路幾何特征的準確性評價。經(jīng)過對全市域遙感衛(wèi)星影像的道路要素提取,選取部分重點區(qū)域作為樣本,以通過CNN提取的道路要素為試驗結(jié)果,將人工目視解譯判讀為驗證結(jié)果,對比基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型提取的要素與影像的套合程度,結(jié)果如圖9所示。
圖9 道路要素自動提取結(jié)果與人工采集數(shù)據(jù)匹配情況
對于不同的場景,基于神經(jīng)網(wǎng)絡(luò)模型的全自動化提取結(jié)果并不相同。在主城區(qū)范圍內(nèi),針對城市主干道提取的結(jié)果,與影像道路邊界匹配度較高;而針對高架橋、隧道的提取結(jié)果,與影像道路邊界匹配度較低,部分道路缺失,且高架橋梁拓撲關(guān)系錯誤。在鄉(xiāng)村郊區(qū)范圍內(nèi),針對鄉(xiāng)村道路、林間小路的提取結(jié)果,其與影像道路邊界匹配度較高。道路被樹林覆蓋時,會導(dǎo)致道路面要素出現(xiàn)空洞、不連續(xù)、不規(guī)則等情況,需要后期進行優(yōu)化擬合。
針對整體情況而言,通過深度學(xué)習(xí)技術(shù)進行道路提取的準確率約為80%(不完全統(tǒng)計)。完全使用全自動提取技術(shù)進行道路要素提取,受影像質(zhì)量、時相、現(xiàn)實復(fù)雜情況等因素的影響,會導(dǎo)致精度不可控,仍然需要后續(xù)的人工干預(yù)及結(jié)果優(yōu)化。此外,在道路要素特征的空間定義中,部分參數(shù)需要按照影像的不同差異進行針對性設(shè)置,真正的全自動化參數(shù)設(shè)置還有待深入研究。
針對貴陽市地域的道路特征,本文綜合考慮解譯過程中的準確性、運算能力及對貴陽市域環(huán)境的適應(yīng)性,對深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型中的幾個環(huán)節(jié)進行了分解。通過多輪對比試驗與分析,建立了適用于貴陽市道路要素遙感影像自動提取的模型,并對批處理數(shù)據(jù)進行優(yōu)化處理,結(jié)合人員參與完成部分道路屬性的完善工作,部分程度實現(xiàn)了道路實體的自動化智能高效提取。其中,涉及的現(xiàn)實問題與技術(shù)路線,可對市縣級衛(wèi)星遙感應(yīng)用技術(shù)部門開展的自然資源類業(yè)務(wù)工作提供參考。對于本文的成果,還存在一些不足,如在道路要素的準確度或精確度的評價上,還沒有建立科學(xué)的量化評價體系,目前還需要靠人工的方法判別和評價,下一步的研究方向?qū)⒃诘缆返膸缀翁匦陨辖⒑侠淼脑u價體系,在屬性特征上,結(jié)合交通流量數(shù)據(jù)[11-12],實現(xiàn)道路屬性信息的動態(tài)更新機制。