崔閏虎,張海洋,支俊俊
(1.全圖通位置網(wǎng)絡有限公司,北京 100176;2.安徽師范大學 地理與旅游學院,安徽 蕪湖 241002)
目前,我國城市軌道交通已經(jīng)歷50多年發(fā)展歷程,軌道交通不僅成為城市交通運輸領(lǐng)域的骨干,也帶動了城市軌道交通沿線的經(jīng)濟發(fā)展。以北京地鐵為例,2021 年,北京地鐵運營里程達783 km,日均客運量840 萬人次,年客運量超過30.66 億人次。但是,城市軌道交通保護區(qū)內(nèi)的工廠施工、基坑開挖、鉆探挖井等活動,對軌道交通地下結(jié)構(gòu)產(chǎn)生極大影響,成為城市軌道交通安全的重大隱患[1-2]。
在以往的城市軌道交通運營維護中,多采用人工巡檢方式對線路周邊生態(tài)環(huán)境、施工信息進行調(diào)查。近年來,隨著城市軌道交通蓬勃發(fā)展,運營里程不斷增加、覆蓋區(qū)域愈加廣闊,人工巡檢暴露出調(diào)查方式單一、調(diào)查周期長、更新時間慢等弊端[3],不僅耗費巨大人力、物力,巡檢信息還不能及時反映沿線施工狀態(tài)。
目前,多尺度遙感產(chǎn)品不斷涌現(xiàn),特別是穩(wěn)定可靠、更新周期短、持續(xù)性強、精度高的高分辨率遙感數(shù)據(jù),為城市軌道交通保護區(qū)監(jiān)測提供了數(shù)據(jù)保障[4-6]。但是,現(xiàn)有遙感影像分析方法與數(shù)據(jù)處理技術(shù)難以滿足城市軌道交通保護區(qū)監(jiān)測的實際需求[7],亟須更高效的方法及技術(shù)體系,利用高分遙感影像的宏觀性、時空全覆蓋性等優(yōu)勢,進行城市軌道交通保護區(qū)建筑信息識別[8-10]。
第一次世界大戰(zhàn)以來,得益于超級大國的激烈競爭及空間技術(shù)發(fā)展,遙感技術(shù)進入高速發(fā)展期。1972 年,美國發(fā)射“地球資源技術(shù)衛(wèi)星”后,各國開始效仿跟進。我國遙感技術(shù)后來居上,并于2013 年發(fā)射高分辨率對地觀測系統(tǒng)的“高分一號”衛(wèi)星。此后,我國遙感技術(shù)逐漸達到國際領(lǐng)先水平,基本形成應用廣泛的陸地衛(wèi)星格局。在遙感技術(shù)應用中,如何快速、有效地處理遙感數(shù)據(jù)并提取所需信息成為技術(shù)難點,而卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)的發(fā)展為解決該問題提供了有效方法。
1943 年,McCulloch 和Pitts 提出神經(jīng)元網(wǎng)絡,神經(jīng)網(wǎng)絡概念出現(xiàn);2006 年,卷積神經(jīng)網(wǎng)絡進入快速發(fā)展期;2012 年起,深度學習研究進展迅速,并提出一系列模型,卷積神經(jīng)網(wǎng)絡的應用領(lǐng)域逐漸廣闊。隨著數(shù)字圖像分析技術(shù)的發(fā)展、遙感影像精度的提高,圖像分割和數(shù)字圖像處理逐漸被應用于變化監(jiān)測。近年來,深度學習在建筑物識別、土地利用制圖等領(lǐng)域廣泛應用。
卷積神經(jīng)網(wǎng)絡是一類包含卷積計算,并且含有深層次結(jié)構(gòu)的深度前饋神經(jīng)網(wǎng)絡,是深度學習的代表算法之一[11]。卷積神經(jīng)網(wǎng)絡可自動提取目標特征,并發(fā)現(xiàn)樣本的集中特征規(guī)律,有效解決手動提取特征效率低下、分類準確率低等不足。卷積神經(jīng)網(wǎng)絡廣泛應用于目標識別、圖像分類等領(lǐng)域,但在軌道交通保護區(qū)監(jiān)測的實際運用中,仍存在提取建筑物精度低、速度慢等問題,建筑信息識別效率不能滿足工作需求。因此,研究通過遙感影像的變化檢測,對軌道交通保護區(qū)監(jiān)測區(qū)域進行預處理,將處理結(jié)果進行人工判讀以及卷積神經(jīng)網(wǎng)絡深度學習分類,可實現(xiàn)區(qū)域內(nèi)的變化識別。
2017 年,中國共產(chǎn)黨北京市委員會、北京市人民政府發(fā)布的《北京市城市總體規(guī)劃(2016—2035年)》明確北京市發(fā)展的重要指導思想之一:“協(xié)調(diào)地上地下空間的關(guān)系,促進地下空間資源綜合開發(fā)利用”,其中第53條明確指出:“堅持先地下后地上、地上地下相協(xié)調(diào)、平戰(zhàn)結(jié)合與平災結(jié)合并重的原則,統(tǒng)籌以地鐵為代表的地下交通基礎(chǔ)設施,統(tǒng)籌以綜合管廊為代表的各類地下市政設施,統(tǒng)籌以人防工程為代表的各類地下安全設施,統(tǒng)籌以地下綜合體為代表的各類地下公共服務設施,構(gòu)建多維、安全、高效、便捷、可持續(xù)發(fā)展的立體式宜居城市”[12]。由此,城市軌道交通保護區(qū)變化監(jiān)測工作成為重中之重。
因此,以北京地鐵為例,結(jié)合其實際需求,研究利用卷積神經(jīng)網(wǎng)絡、語義分割2種方法,對北京地鐵運營有限公司下屬16 條線路(非全北京市,即1 號線、2 號線、5 號線、6 號線、7 號線、8 號線、9 號線、10 號線、13 號線、15 號線、房山線、昌平線、亦莊線、S1 線、八通線、首都機場線)的城市軌道交通保護區(qū)內(nèi)違規(guī)施工行為進行監(jiān)測,并將信息上報至相關(guān)部門,保障地鐵運行安全,從而有效解決傳統(tǒng)監(jiān)測人工消耗大、低效率以及現(xiàn)有算法工程化中的薄弱環(huán)節(jié)。
研究數(shù)據(jù)主要包括以下2個部分:
(1) 源自2021 年第3 季度(2021 年7—9 月)、第4季度(2021年10—12月)北京市地鐵運營有限公司下屬16條地鐵線路的“北京二號”衛(wèi)星高分辨率遙感影像。影像多光譜波段分辨率為0.8 m,數(shù)據(jù)處理級別為L4A,數(shù)據(jù)位深為8 bit,文件格式為Tiff,坐標系為CGCS2000,采用高斯克呂格投影;采用其標準4波段進行真彩色合成得到遙感影像彩色合成圖進行本文的建筑信息識別。
(2)北京市地鐵運營有限公司及其下屬分公司提供的《北京地鐵安全保護區(qū)內(nèi)外部工程配合管理工作匯表》。
基于深度學習,從遙感影像中面向?qū)ο筇崛〗ㄖ?,算法采? 模塊架構(gòu)體系,包括主干特征提取模塊、區(qū)域推薦與特征截取模塊、對象預測模塊、語義分割模塊。算法總體技術(shù)路線見圖1。
圖1 算法總體技術(shù)路線
本算法使用 ResNet101 作為主干特征提取網(wǎng)絡,基于ResNet101 網(wǎng)絡提取的4 層特征,經(jīng)逐層采樣,獲得5 層特征金字塔(FPN)作為共享特征層。主干特征提取流程見圖2。
圖2 主干特征提取流程
要從遙感影像中找到建筑物位置,首先需要找到包含建筑物的外矩形框,再在外矩形框執(zhí)行語義分割,預測建筑物對象具體掩膜。但是,在1幅遙感影像上可以有無數(shù)個矩形框,如何找到包含建筑物的矩形框是其關(guān)鍵。算法使用特征金字塔獲得的5層共享特征層作為輸入,構(gòu)建區(qū)域建議卷積網(wǎng)絡預測特征層上每塊特征的預選框上是否包含建筑物。區(qū)域推薦流程見圖3。
圖3 區(qū)域推薦流程
雖然通過區(qū)域推薦卷積網(wǎng)絡模塊獲得建議框,但建議框僅為粗略的估計,該范圍是否包含建筑物,還需根據(jù)建議框從共享特征層截取其局部特征,才可用于精細的對象分類、角點調(diào)整及掩膜預測。對象分類預測使用全連接神經(jīng)網(wǎng)絡,全連接神經(jīng)網(wǎng)絡要求輸入節(jié)點數(shù)相同,考慮建議框范圍不一,其截取共享特征層局部特征的維度也不統(tǒng)一。因此,采用雙線性內(nèi)插法,將截取的共享特征層局部特征統(tǒng)一長寬維度為:7×7,即可順利輸入對象分類預測全連接神經(jīng)網(wǎng)絡進行分類預測及角點調(diào)整。特征截取流程見圖4。
圖4 特征截取流程
區(qū)域推薦卷積網(wǎng)絡模塊僅能粗略估計預選框是否包含建筑物,一些特征與建筑物類似的其他地物也可能被推薦為建議框。因此,還應根據(jù)建議框截取共享特征層的局部特征,并據(jù)此使用更有效的預測分類方法,預測建議框是否真的包含建筑物。算法使用目前在分類任務表現(xiàn)最好的全連接神經(jīng)網(wǎng)絡預測分類,通過共享特征層局部特征截取與局部特征維度統(tǒng)一,將獲得的二維特征圖拉直為一維列向量,即可作為全連接神經(jīng)網(wǎng)絡的輸入。預測建議框內(nèi)是否真實包含建筑物,每個建議框通過全連接神經(jīng)網(wǎng)絡輸出1個值,再使用Softmax 函數(shù)激活,如果激活后的值接近1,則說明該建議框內(nèi)部確實包含建筑物,反之則預測建議框不包含建筑物;同時,考慮建議框并非恰好是建筑物對象的外包圍矩形,因此算法還在全連接神經(jīng)網(wǎng)絡設計了1 個建議框角點調(diào)整參數(shù)輸出,每個建議框輸出1 個一維向量,向量包含4個值,分別調(diào)整建議框左上角xy坐標和右下角xy坐標。
基于建筑物目標檢測方法可獲預測框,即建筑物存在位置的外矩形,但無法精確獲得建筑物對象的輪廓,主流的基于深度學習預測圖像對象的方法是語義分割。目前,深度學習語義分割模型多由編碼器和解碼器組成,其中編碼器可理解為通過傳統(tǒng)卷積神經(jīng)網(wǎng)絡對原始圖像進行下采樣,獲取高維圖像特征的過程。直觀表現(xiàn)是特征圖分辨率減少、通道維數(shù)增加。解碼器則通過反卷積層和反池化層,將尺寸較小的高維特征層進行上采樣,恢復成原始圖像的尺寸,對原圖像內(nèi)部對象進行像素級預測,使其盡可能分類擬合出分類對象的輪廓,以達到對象像素級預測效果。語義分割模型的訓練方式和卷積神經(jīng)網(wǎng)絡一樣,前向傳播預測分類、反向傳播回歸擬合,訓練語義分割模型即根據(jù)損失函數(shù)調(diào)整編碼器和解碼器內(nèi)部參數(shù),使模型通過編碼器和解碼器后可以預測擬合出分類對象輪廓。典型的語義分割模型有FCN、U-Net、VGGNet、PSPNet等。
對象預測與語義分割流程見圖5。
圖5 對象預測與語義分割流程
設定損失函數(shù)及損失權(quán)重(見表1);設定訓練模型參數(shù),模型參數(shù)設置見表2;算法初步訓練結(jié)果見圖6。
表1 損失函數(shù)及損失權(quán)重
表2 模型參數(shù)設置
圖6 初步訓練結(jié)果
在白名單數(shù)據(jù)庫建設研究中,基于“北京二號”遙感衛(wèi)星獲取的亞米級遙感影像,通過該研究算法識別遙感影像中保護區(qū)內(nèi)的建筑信息,并根據(jù)北京地鐵運營有限公司提供的地鐵線網(wǎng)數(shù)據(jù),分別生產(chǎn)16 條地鐵線路及其站點的矢量數(shù)據(jù),并根據(jù)地鐵線路實際情況,分別建立地上32.5 m、地下52.5 m、過河102.5 m的緩沖區(qū)。整合所有數(shù)據(jù)后,生成保護區(qū)專題地圖。根據(jù)2021 年第3、4 季度的影像變化,結(jié)合建筑信息識別的變化,分析保護區(qū)內(nèi)現(xiàn)有施工情況。同時,對比北京地鐵運營有限公司提供的安全保護區(qū)內(nèi)外部工程配合管理工作匯表,分析是否存在違規(guī)施工行為。白名單數(shù)據(jù)庫建設流程見圖7。
圖7 白名單數(shù)據(jù)庫建設流程
以北京地鐵10 號線為例,對算法研究應用結(jié)果進行展示(見圖8)。
圖8 北京地鐵10號線算法研究應用成果
結(jié)合圖8展示內(nèi)容可知,總體上建筑信息識別的應用效果較好,對于保護區(qū)內(nèi)建筑部分的內(nèi)容基本均可識別,但對于保護區(qū)內(nèi)建筑邊界的識別效果不夠明晰,特別是受到植被、道路等要素的干擾后,效果較差,算法仍存在較大改善空間。
2021 年第3、4 季度北京地鐵所轄線路保護區(qū)監(jiān)測的結(jié)果為:共計54 處用地類型變化,總面積200 753.79 m2。保護區(qū)用地類型變化統(tǒng)計見表3。
表3 保護區(qū)用地類型變化統(tǒng)計
由表3 可知,在所有線路中北京地鐵10 號線用地類型變化情況較多,在保護區(qū)后續(xù)監(jiān)測中應成為重點。同時,由于本次試驗間隔較短,僅使用保護區(qū)2021 年第3、4 季度的高分影像進行對比,部分區(qū)域未發(fā)現(xiàn)明顯變化。從表3也可看到,部分區(qū)域變化情況多,但變化面積反而較小,可能是本次試驗重點研究了保護區(qū)內(nèi)的用地變化情況,對保護區(qū)外的區(qū)域并未涉及到,在后續(xù)工作中須進一步明確。
將監(jiān)測結(jié)果與北京市地鐵運營有限公司提供的北京地鐵安全保護區(qū)內(nèi)外部工程配合管理工作匯表對比,選取部分區(qū)域進行結(jié)果展示(見圖9—圖11)。
圖9 分鐘寺—成壽寺監(jiān)測區(qū)監(jiān)測結(jié)果
圖11 首經(jīng)貿(mào)—豐臺站監(jiān)測區(qū)監(jiān)測結(jié)果
根據(jù)圖9—圖11 展示的北京地鐵10 號線部分成果可以發(fā)現(xiàn),在影像上存在向北京市地鐵運營有限公司報備后再進行施工的工程,也存在有施工行為但未向北京市地鐵運營有限公司報備的情況。針對該類未報備情況,將所有信息記錄后,統(tǒng)一反饋至北京市地鐵運營有限公司,再通過現(xiàn)場踏勘調(diào)查等方式確認情況是否屬實,為北京地鐵的安全運營提供支撐。
關(guān)于該算法部分研究情況,對算法試驗的過程及最終效果進行總結(jié)發(fā)現(xiàn),目前算法仍有較大改善空間,未來計劃從5個方面改善算法,提高算法的應用效果:
(1)使用多源訓練數(shù)據(jù)增加魯棒性。
(2)使用批訓練方法(batch>1)避免震蕩和過擬合。
(3)嘗試256/512/1 024 尺寸訓練數(shù)據(jù),對比多尺度訓練數(shù)據(jù)效果。
(4)嘗試調(diào)整多任務損失權(quán)重,優(yōu)化模型。
(5)當模型穩(wěn)定后嘗試解凍主干特征提取網(wǎng)絡進一步優(yōu)化模型。
關(guān)于白名單數(shù)據(jù)庫建設的研究情況,根據(jù)試驗結(jié)果,監(jiān)測效果較理想。但是,在試驗過程中,對影像監(jiān)測結(jié)果與地鐵提供的報備表進行核查的效率較低,如何提高效率或減少環(huán)節(jié),有待進一步思考。
21 世紀以來,我國城市地下空間的開發(fā)數(shù)量迅速增長。地鐵作為地下空間的重要組成部分,其安全面臨傳統(tǒng)威脅與新興風險相互交織、偶發(fā)性節(jié)點破壞與系統(tǒng)性危機并存的復雜情況。隨著我國城市軌道交通建設規(guī)模不斷擴大,確保運營安全工作將是我國城市軌道交通行業(yè)面臨的重中之重。將遙感監(jiān)測應用于識別城市軌道交通保護區(qū)內(nèi)的建筑施工行為,可為保障城市交通安全添磚加瓦。但是,相關(guān)研究仍不夠深入,應在未來的工作中繼續(xù)尋求更優(yōu)的解決方案。