安曉亞,朱余德,晏雄鋒
1. 西安測繪研究所,陜西 西安 710054; 2. 地理信息工程國家重點實驗室,陜西 西安 710054; 3. 廣東國地規(guī)劃科技股份有限公司,廣東 廣州 510650; 4. 同濟大學(xué)測繪與地理信息學(xué)院,上海 200092
地圖綜合是制圖工藝的重要環(huán)節(jié),旨在解決有限圖幅空間與復(fù)雜表達內(nèi)容之間的矛盾。建筑物作為地圖表達內(nèi)容的重要組成部分,一直是地圖綜合研究的重要對象。地圖比例尺變小后,建筑物的符號圖形可能出現(xiàn)擁擠、壓蓋等視覺沖突問題,從而破壞地圖表達的清晰可讀性[1]。針對這一問題,需要組合運用選取、合并、移位、化簡等多種操作進行處理。其中,選取操作表現(xiàn)為保留部分具有代表性的建筑物目標(biāo),通過減少目標(biāo)數(shù)量以緩解圖形表達的沖突現(xiàn)象。著名的開方根定律[2]回答了選取過程中“保留多少”的問題,但是無法解決“保留哪些”的問題。對于后者,不僅需要考慮個體建筑物的重要性,還需要顧及群體的分布模式以及目標(biāo)間的空間關(guān)系不被破壞,整個過程涉及復(fù)雜的上下文特征分析與決策,是建筑物綜合中的關(guān)鍵難點問題。
早期研究提出了空間比率法、分布系數(shù)法、重力模型法、圓增長法等[3-4]居民地選取模型。這些方法主要面向中小比例尺的點狀居民地目標(biāo),重點考察語義指標(biāo)(如行政等級、人口規(guī)模),對目標(biāo)間的空間關(guān)系考慮不夠,應(yīng)用到建筑物目標(biāo)選取時容易破壞群體呈現(xiàn)的分布特征。針對該問題,計算幾何方法被引入作為結(jié)構(gòu)和關(guān)系控制以實施選取,例如文獻[5]運用最小生成樹對建筑物進行分組,針對不同分布模式的群組采用不同的處理策略;文獻[6]采用Delaunay三角網(wǎng)建立建筑物的空間鄰近關(guān)系,通過三角形網(wǎng)眼的漸進式合并重構(gòu)實現(xiàn)建筑物選取;文獻[7]利用Voronoi剖分圖描述建筑物的分布范圍、分布密度、分布中心與軸線特征,并提出動態(tài)選取方法;文獻[8]考慮了將專題信息融入選取過程;在該基礎(chǔ)上,文獻[9]提出適宜網(wǎng)絡(luò)環(huán)境的在線式選取方法。此外,相關(guān)學(xué)者針對直線型[10-11]、網(wǎng)格型[12]等不同模式的建筑物目標(biāo)群,從保持局部分布特征的角度設(shè)計了不同選取策略。
機器學(xué)習(xí)技術(shù)也被引入以實現(xiàn)智能化建筑物選取方法。例如,文獻[13—14]利用自組織神經(jīng)網(wǎng)絡(luò)的空間降維能力實現(xiàn)建筑物目標(biāo)選取;文獻[15—16]結(jié)合群目標(biāo)選取的一般性原則與生物進化過程中的適者生存規(guī)律,設(shè)計了利用遺傳算法的選取模型;文獻[17]將建筑物目標(biāo)表達為圖結(jié)構(gòu),通過圖節(jié)點之間的信息傳遞篩選出具備代表性的目標(biāo)??傮w而言,這些方法在提升建筑物選取的智能化水平上取得了一定進展,但是在選取規(guī)則及參數(shù)設(shè)置的合理性及模型的普適性方面仍然面臨挑戰(zhàn)。
建筑物選取質(zhì)量評價也是關(guān)注的重點問題,現(xiàn)有研究主要從重要目標(biāo)、典型特征、分布密度保持,以及與其他要素的關(guān)聯(lián)關(guān)系[18]等方面,采用定性和定量的方法進行評價。例如,文獻[13]通過比較選取前后建筑物分布密度變化情況來評價,其中每個建筑物的密度定義為對應(yīng)Voronoi多邊形面積的倒數(shù);文獻[16]從局部約束和上下文關(guān)系保持進行評價;文獻[19]則考慮了建筑物的面積、數(shù)量、密度上的變化,其中密度通過落在建筑物中心的圓圈來計算??傮w而言,雖然相關(guān)學(xué)者在選取質(zhì)量評價方面開展了大量研究工作,但是針對分布密度等方面的計算方法和度量指標(biāo)仍不統(tǒng)一,有待進一步探索。
近年來,圖卷積神經(jīng)網(wǎng)絡(luò)(graph convolutional network,GCN)作為一種新興的深度學(xué)習(xí)技術(shù)取得了快速發(fā)展[20]。GCN不但具備傳統(tǒng)深度學(xué)習(xí)網(wǎng)絡(luò)從樣本數(shù)據(jù)中學(xué)習(xí)知識、捕獲高層次特征的能力,更重要的是能處理節(jié)點鄰域非規(guī)范化的圖結(jié)構(gòu)數(shù)據(jù),極大地擴展了學(xué)習(xí)架構(gòu)的應(yīng)用范圍。正因為良好的兼容性,相關(guān)學(xué)者也將GCN及其變體引入了地圖目標(biāo)特征分析任務(wù),例如道路網(wǎng)絡(luò)分析與特殊設(shè)施探測[21]、建筑物群模式識別和城市功能區(qū)劃分[22-23]、建筑物形狀編碼與分類[24-26]等任務(wù)。本文提出一種基于GCN的建筑物綜合選取方法,該方法一方面通過幾何圖結(jié)構(gòu)來有效表達和集成選取過程中需要考慮的多種上下文因子,另一方面利用GCN的特征表征能力來分析建筑物之間的鄰近關(guān)系及空間分布特征,形成具備綜合選取決策的學(xué)習(xí)模型,克服傳統(tǒng)方法在模型普適性方面的不足。其基本過程是:首先,利用Delaunay三角網(wǎng)在空間鄰近關(guān)系建模方面的優(yōu)勢,構(gòu)建以建筑物目標(biāo)為節(jié)點、建筑物鄰近關(guān)系為邊的圖結(jié)構(gòu);然后,提取建筑物目標(biāo)的大小、方向、形狀特征作為對應(yīng)圖節(jié)點的描述特征;最后,采用半監(jiān)督學(xué)習(xí)方式訓(xùn)練GCN,使之具備決策單個建筑物保留與否的能力。
本文方法的基本思想是將建筑物的選取問題轉(zhuǎn)化為圖神經(jīng)網(wǎng)絡(luò)中的節(jié)點分類問題,即節(jié)點選取或舍棄??傮w框架如圖1所示,包括以下主要步驟。
圖1 基于圖卷積神經(jīng)網(wǎng)絡(luò)的建筑物選取總體框架Fig.1 Framework of building selection using graph convolutional networks
(1) 圖結(jié)構(gòu)建立:利用Delaunay三角網(wǎng)將待選取的目標(biāo)群構(gòu)建為一個圖,其中每個圖節(jié)點代表單個建筑物,節(jié)點間的邊(即三角網(wǎng)的邊)表示建筑物之間的鄰近關(guān)系。
(2) 圖卷積特征計算:計算建筑物的形狀、大小、方向、密度作為對應(yīng)圖節(jié)點的特征,利用基于圖傅里葉變換的卷積運算處理圖節(jié)點特征,提取圖節(jié)點隱含的高階特征。
(3) 半監(jiān)督圖節(jié)點分類:采用半監(jiān)督學(xué)習(xí)方式訓(xùn)練GCN模型,即基于部分標(biāo)注節(jié)點的學(xué)習(xí)判斷每個圖節(jié)點所代表的建筑物是選取或舍棄。
圖G=(V,E,A),是一種描述對象及其關(guān)系的數(shù)據(jù)結(jié)構(gòu),其中V={v0,v1,…,vn-1}是n個節(jié)點構(gòu)成的集合;E是連接節(jié)點的邊的集合;A是n×n的鄰接矩陣,表示每對節(jié)點之間邊的權(quán)重。每個節(jié)點可包含一個或多個特征,即圖信號f。
圖2 建筑物的圖構(gòu)建Fig.2 Graph construction for buildings
注:SBR為最小外接矩形。圖3 建筑物描述特征計算Fig.3 Feature computation for individual buildings
(1)
(2)
(3)
(4)
式中,N表示建筑物的節(jié)點數(shù)量;Ri表示建筑物第i個節(jié)點到建筑物中心點的距離;Ach表示建筑物凸殼的面積;Av表示建筑物目標(biāo)所在Voronoi圖多邊形面積。
本文采用基于圖傅里葉運算的卷積運算來處理上述構(gòu)建的圖及其節(jié)點特征,以提取高層次特征用于后續(xù)節(jié)點分類決策。對于一個圖信號f,即節(jié)點的某一個特征,其卷積運算表示為相對于拉普拉斯矩陣L的K階切比雪夫多項式[22],計算為
(5)
上述卷積運算僅限于矩陣之間的運算,因此計算效率極高。同時,其通過L的K階切比雪夫多項式可以實現(xiàn)每個節(jié)點K階局部鄰域的卷積運算,即節(jié)點的變量值不是與全局節(jié)點相關(guān)而只和它的K階鄰域內(nèi)的節(jié)點相關(guān),這個過程可以理解為對每個節(jié)點的K階鄰域內(nèi)的節(jié)點變量值的加權(quán)求和,與常規(guī)卷積運算的過程相似。
基于上述卷積運算可以構(gòu)造半監(jiān)督學(xué)習(xí)的GCN模型,從而處理輸入的圖信號并實施圖節(jié)點的分類操作。GCN模型通過疊加多個卷積層形成,通過逐層傳播提取圖節(jié)點隱含的高層次特征[29]。其中,第l+1層隱藏層的第j個圖的計算為
(6)
圖4展示了一個示例的GCN架構(gòu),由輸入層、圖卷積層和輸出層組成。輸入的圖結(jié)構(gòu)由12個建筑物構(gòu)建,每個節(jié)點提取7個特征后得到12×7維特征向量,即輸入圖信號。通過卷積層運算后,得到12×m維特征向量,其中m表示節(jié)點的特征維度,即該層中卷積核數(shù)量,其值可根據(jù)樣本數(shù)量和計算量進行設(shè)置。最后一個卷積層采用2個卷積核,并利用Softmax函數(shù)輸出12×2維預(yù)測概率向量,以表示每個節(jié)點分類(即保留或舍棄)的概率值。如果某一節(jié)點的保留概率較大(即大于0.5),則該節(jié)點對應(yīng)的建筑物目標(biāo)予以保留;否則,予以刪除。確定選取的建筑物目標(biāo)后,進一步依據(jù)地圖綜合規(guī)則對目標(biāo)形狀進行化簡[30],面積較小的目標(biāo)表示為小矩形,面積較大的目標(biāo)則表示為簡化后的形狀輪廓,最終輸出處理結(jié)果。
圖4 建筑物選取的圖卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)Fig.4 Graph convolutional network architecture for building selection
GCN模型采用半監(jiān)督方式進行訓(xùn)練,即通過對少量有標(biāo)簽數(shù)據(jù)進行學(xué)習(xí),來預(yù)測大量的無標(biāo)簽數(shù)據(jù)。與監(jiān)督學(xué)習(xí)相比較,由于只需標(biāo)注少量數(shù)據(jù),降低了人工標(biāo)注成本。每個節(jié)點的輸出包括兩個部分:節(jié)點預(yù)測概率值Z及標(biāo)簽值y,標(biāo)簽值y記錄節(jié)點保留與否,保留則取[1,0],否則取[0,1]。模型的學(xué)習(xí)目標(biāo)為最小化Z與y之間的差異,即損失值J,通過交叉熵計算
(7)
訓(xùn)練過程即根據(jù)損失值J相對于模型參數(shù)(即多項式系數(shù)θi,jk和偏置量bj)的偏導(dǎo)數(shù),按照給定的學(xué)習(xí)率對其進行不斷更新,直至穩(wěn)定。半監(jiān)督學(xué)習(xí)中,模型僅利用一部分節(jié)點的標(biāo)注。具體來說,GCN將所有圖節(jié)點作為輸入,包含有標(biāo)簽數(shù)據(jù)(訓(xùn)練集)和無標(biāo)簽數(shù)據(jù)(測試集),但在計算損失值時,僅對比有標(biāo)簽數(shù)據(jù)的損失值,跳過無標(biāo)簽數(shù)據(jù)。由于每次利用有標(biāo)簽數(shù)據(jù)更新參數(shù)后,無標(biāo)簽數(shù)據(jù)的預(yù)測值也隨之更新;最終,當(dāng)有標(biāo)簽數(shù)據(jù)的損失值最小化后,無標(biāo)簽數(shù)據(jù)的預(yù)測值也更新完成,并作為模型輸出實現(xiàn)節(jié)點分類預(yù)測。
試驗數(shù)據(jù)如圖5所示,區(qū)域范圍約為2.7 km×1.6 km,包含907個建筑物。在選取過程中,少數(shù)具有重要意義的建筑物目標(biāo)(如學(xué)校、醫(yī)院等)需要優(yōu)先保留,它們在形狀上往往較為復(fù)雜、面積也相較于其他目標(biāo)更大。在試驗數(shù)據(jù)集中,通過綜合考慮建筑物目標(biāo)的面積是否大于1200 m2,視覺上形狀是否相對復(fù)雜,或者語義上表達是否為酒店或?qū)W校等因素,最終人工標(biāo)注出了33個重要建筑物,在圖5中用紅色符號表示。需要注意的是,目標(biāo)是否具有重要性意義并不作為本文模型的輸入特征參與選取決策,而是用于后續(xù)選取結(jié)果的評價。試驗設(shè)置了兩個不同的選取比例,分別是30%和60%。綜合考慮學(xué)習(xí)性能和樣本標(biāo)注工作量,每個選取比例下都隨機選擇25%的建筑物人工標(biāo)注保留或舍棄,并以此作為訓(xùn)練數(shù)據(jù)訓(xùn)練GCN。
圖5 試驗數(shù)據(jù)Fig.5 Experimental data
上述907個建筑物在提取特征得到907×7維特征向量,作為GCN輸入。不同選取比例試驗中,GCN均包含2個卷積層。根據(jù)前期預(yù)訓(xùn)練結(jié)果并考慮模型訓(xùn)練效率、精度等因素,學(xué)習(xí)率、dropout值和學(xué)習(xí)率衰減系數(shù)在選取比例為30%時,分別設(shè)置為0.000 1、0.1和0.001;在選取比例為60%時,分別設(shè)置為0.000 5、0.1和0.000 1。圖6顯示了訓(xùn)練過程中精度、損失值的變化,發(fā)現(xiàn)模型經(jīng)過8000輪訓(xùn)練后逐漸收斂,測試精度達到70%以上。需要指出的是,受模型參數(shù)初始化、dropout機制等影響,模型存在一定隨機性,即每次訓(xùn)練輸出的結(jié)果存在極少數(shù)保留目標(biāo)不一致的現(xiàn)象,但這對整體選取結(jié)果影響并不大。
圖6 GCN方法訓(xùn)練過程中的精度與損失值變化Fig.6 Change in accuracy and loss value during training the GCN method
基于Mesh的選取方法[5]和基于SOM的選取方法[12]被用于驗證GCN方法的有效性。Mesh方法是考慮目標(biāo)鄰近關(guān)系實施選取的代表性方法,其以建筑物為節(jié)點構(gòu)建Delaunay三角網(wǎng),不斷尋找含有最短邊的三角形網(wǎng)眼并將關(guān)聯(lián)節(jié)點與鄰近節(jié)點進行融合,直至剩余的節(jié)點滿足預(yù)設(shè)選取數(shù)量條件。SOM方法則是傳統(tǒng)神經(jīng)網(wǎng)絡(luò)實施建筑物綜合的典型代表,其借助競爭型神經(jīng)網(wǎng)絡(luò)對輸入建筑物進行空間分布上的擬合,其中每個輸入神經(jīng)元屬性設(shè)置為建筑物中心點坐標(biāo),輸出神經(jīng)元數(shù)量設(shè)置為保留建筑物的個數(shù)。
圖7展示了3種方法在不同選取比例下的輸出結(jié)果。整體上,3種方法都能夠依據(jù)預(yù)設(shè)的數(shù)量控制關(guān)系實施有效的選取操作,選取結(jié)果一定程度上保留了原始目標(biāo)的空間分布特征。對比發(fā)現(xiàn),GCN方法在一些局部區(qū)域具備一定優(yōu)勢,例如圖7(b)、(d)、(f)矩形框所示區(qū)域選取30%的結(jié)果中,原始建筑物分布較鄰近區(qū)域更為密集,本文的GCN方法在該區(qū)域保留的建筑物相對更多,而其他兩種方法對該區(qū)域的建筑物則相對舍棄過多。
圖7 采用不同方法產(chǎn)生的建筑物選取結(jié)果Fig.7 Results of building selection using different methods
表1對比了不同方法對于重要建筑物的保留情況。當(dāng)選取比例為60%時,GCN方法輸出結(jié)果中保留了93.9%的重要建筑物目標(biāo),而Mesh和SOM方法則分別保留了90.9%和87.9%;當(dāng)選取比例為30%時,GCN方法保留了84.8%的重要目標(biāo),而Mesh和SOM方法僅保留了75.8%和66.7%。例如圖8中,A和B兩個相鄰分布的建筑物均具有較大面積,相對周圍其他目標(biāo)具有重要性意義。Mesh和SOM方法都只保留了其中一個目標(biāo),而GCN方法中兩個目標(biāo)都得到保留。分析可能的原因是Mesh和SOM方法主要關(guān)注建筑物目標(biāo)的位置信息及空間分布關(guān)系,未考慮建筑物目標(biāo)的個體差異,導(dǎo)致部分具有重要性意義的目標(biāo)被舍棄。GCN方法則將面積、形狀等一定程度上能夠反映建筑物目標(biāo)重要性的指標(biāo)作為圖節(jié)點的特征,并通過卷積運算實現(xiàn)相鄰目標(biāo)間的分析比較,從而更好地考慮目標(biāo)的重要性差異信息。
表1 不同方法對具有重要性意義建筑物的保留
圖8 典型區(qū)域不同方法選取結(jié)果比較(選取比例為30%)Fig.8 Comparison of selection results using different methods in a typical area (30% selection ratio)
本文從選取前后建筑物分布密度的變化方面來評價選取結(jié)果。具體地,將建筑物分布區(qū)域均勻地劃分為N×N個網(wǎng)格,定義每個網(wǎng)格區(qū)域的建筑物分布密度如下
(8)
式中,Di表示第i個格網(wǎng)內(nèi)建筑物的數(shù)量。
圖9展示了選取前后建筑物的分布密度圖,其中N取值為10??梢园l(fā)現(xiàn),本文方法在兩種選取比例條件下均較好地保持了原始建筑物的分布密度特征。對于Mesh方法,在選取比例為30%時,圖9(g)矩形框內(nèi)出現(xiàn)密度差異顯著的現(xiàn)象(即部分格網(wǎng)相比較鄰近網(wǎng)格密度顯著升高);而在原始密度圖中,該區(qū)域網(wǎng)格的密度差異并不顯著。對于SOM方法,當(dāng)選取比例為60%時,圖9(d)矩形內(nèi)的格網(wǎng)顏色較淺,表明該區(qū)域內(nèi)建筑物數(shù)量保留較少,這與原始建筑物分布密度特點不相符合。
圖9 不同方法選取結(jié)果的密度圖比較Fig.9 Visual comparison of building densities before and after selection
進一步地,本文定義密度差指標(biāo)(relative density difference index,RDDI)來定量化分析選取前后密度的變化,計算為
(9)
表2列出了2種不同選取比例下采用3種不同方法實施選取后的RDDI值??梢园l(fā)現(xiàn),本文方法產(chǎn)生的RDDI值均低于其他2種方法,表明本文方法能夠從整體上更好地保持建筑物目標(biāo)原有的空間分布特征。該結(jié)論也與定性化分析得出的結(jié)論一致。
表2 不同方法選取結(jié)果的密度變化情況
本文提出了一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的建筑物選取方法。該方法借助Delaunay三角網(wǎng)構(gòu)建建筑物目標(biāo)的圖結(jié)構(gòu),并提取建筑物目標(biāo)的特征作為圖節(jié)點的特征。在此基礎(chǔ)上,將建立的圖結(jié)構(gòu)輸入到GCN進行卷積特征計算,并采用半監(jiān)督學(xué)習(xí)的方式訓(xùn)練網(wǎng)絡(luò),最終預(yù)測每個圖節(jié)點對應(yīng)建筑物目標(biāo)的取舍。采用真實數(shù)據(jù)進行試驗,結(jié)果顯示:對比Mesh和SOM方法,GCN方法在保留重要建筑物目標(biāo)的同時也能夠較好地保持原有的空間分布特征。這表明GCN模型能夠有效集成建筑物目標(biāo)的多種上下文因子,通過卷積運算提取高層次特征,繼而從標(biāo)注樣本中有效學(xué)習(xí)選取規(guī)則。
本文方法仍依賴較大規(guī)模的訓(xùn)練數(shù)據(jù)才可以取得比較好的表現(xiàn),因此需進一步拓展模型結(jié)構(gòu)設(shè)計和學(xué)習(xí)訓(xùn)練方法方面的研究,降低模型對樣本的依賴性。后續(xù)研究方向包括:①考慮建筑物語義信息,構(gòu)建更加完備的上下文特征體系,提升選取決策能力;②發(fā)展新型的網(wǎng)絡(luò)學(xué)習(xí)模型,考慮跨層連接等設(shè)計方式,提升高層次特征的抽象提取與表達能力;③深入挖掘GCN對每個建筑物輸出的概率值,該值一定程度上體現(xiàn)了建筑物目標(biāo)的重要性排序,因此可以考慮以此為基礎(chǔ)發(fā)展目標(biāo)選取與其他綜合算子協(xié)同或者集成的綜合模型。