魏智威,丁 愫,童 瑩,程 璐,劉 洋
1. 中國科學(xué)院網(wǎng)絡(luò)信息體系技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100830; 2. 中國科學(xué)院空天信息創(chuàng)新研究院,北京 100830; 3. 浙江農(nóng)林大學(xué)環(huán)境與資源學(xué)院,浙江 杭州 311300; 4. 武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079
分布模式是重要的空間結(jié)構(gòu)特征,它表達(dá)了地理要素在空間內(nèi)呈現(xiàn)出的特定組織規(guī)律[1]。建筑物是地圖表達(dá)的基礎(chǔ)地理要素,建筑物群空間分布模式提取是城市空間理解[2-3]、城市三維模型可視化[4-5]、地圖自動(dòng)綜合[6-9]等領(lǐng)域研究的重要問題。
建筑物群空間分布模式提取主要包括建筑物群聚類與模式識(shí)別?;卩徑鼒D聚類,文獻(xiàn)[10]利用建筑物間距離進(jìn)行聚類;文獻(xiàn)[5,11—13]在此基礎(chǔ)上考慮了建筑物間大小、形狀等的相似性;文獻(xiàn)[14]則結(jié)合了城市形態(tài)學(xué)特征;文獻(xiàn)[1]則考慮了建筑物的語義特征。另外,文獻(xiàn)[15—18]將能量最小化、神經(jīng)網(wǎng)絡(luò)等智能化方法用于建筑物群聚類。建筑物聚群中有時(shí)會(huì)存在特殊的空間排列,基于模板匹配方法,文獻(xiàn)[19]識(shí)別了簡單直線排列;文獻(xiàn)[20—21]分別基于建筑物間空間關(guān)系定義了H型、T型、E型、L型、Z型、階梯形和格網(wǎng)型模板。文獻(xiàn)[22—23]基于鄰近圖分別提出了用于建筑物群典型化的格網(wǎng)型排列識(shí)別方法;文獻(xiàn)[24]通過對(duì)最小生成樹鄰近圖(minimum spanning tree,MST)剪枝,實(shí)現(xiàn)了直線型排列和曲線型排列的識(shí)別;文獻(xiàn)[25]則基于鄰近圖和stroke約束探測(cè)線性模式;文獻(xiàn)[26—27]基于鄰近圖剪枝,識(shí)別了多連通直線型排列和格網(wǎng)型排列;文獻(xiàn)[28]從空間推理出發(fā),提出了建筑物空間排列的層次識(shí)別方法;文獻(xiàn)[29—30]則對(duì)比了不同鄰近圖識(shí)別線性模式的適用性。另外,文獻(xiàn)[31—32]將隨機(jī)森林和圖卷積神經(jīng)網(wǎng)絡(luò)等智能化方法用于識(shí)別建筑物群模式。
上述研究主要是基于格式塔原則,認(rèn)為滿足空間鄰近、幾何相似和分布連續(xù)的建筑物群組在視覺判斷上更易被歸為整體構(gòu)造,即分布模式[12]。其中,格式塔原則要求的整體是指虛構(gòu)形體的完整性,并非要求目標(biāo)自身必須保持完整。但是,已有研究均將建筑物作為整體基于格式塔原則提取排列,導(dǎo)致提取的排列有時(shí)存在斷裂、遺漏等問題。另外,建筑物形態(tài)日趨復(fù)雜,有時(shí)從整體上表達(dá)復(fù)雜圖形相對(duì)困難。實(shí)驗(yàn)心理學(xué)研究表明,人眼視覺認(rèn)知遵循格式塔原則的同時(shí),也存在部分與整體的關(guān)系。凸多邊形是視覺認(rèn)知的幾何基元,人類會(huì)將圖形分解為凸或近似凸的多邊形進(jìn)行認(rèn)知,如身體姿態(tài)估計(jì)和手勢(shì)識(shí)別等[33-34]。同時(shí),建筑物圖形凸分解已成功應(yīng)用于城市三維模型可視化[35]、建筑物復(fù)雜空間關(guān)系表示[36]和室內(nèi)建筑物通風(fēng)效果評(píng)估[37]等。因此,基于格式塔原則提取建筑物群分布模式有時(shí)需要分解圖形,以保持視覺認(rèn)知上虛構(gòu)形體的完整性。直線模式是一種典型的空間分布模式,是其他建筑物群模式識(shí)別的基礎(chǔ)。本文試圖結(jié)合圖形凸分解識(shí)別建筑物群直線模式,其中,組成直線模式的元素既可以是建筑物,也可以是建筑物局部。
建筑物群直線模式表現(xiàn)為一組滿足格式塔原則(相似、鄰近)的沿直線排列建筑物[14]。首先,定義建筑物間“鄰近”“相似”和“沿直線排列”的空間關(guān)系;其次,定義直線模式。
相對(duì)鄰近圖(relative neighborhood graph,RNG)能用更少邊較完整地體現(xiàn)建筑物群的直線排列關(guān)系[30],本文利用RNG表達(dá)建筑物間鄰近關(guān)系。RNG構(gòu)建過程如下:首先,基于約束性三角網(wǎng)建立骨架線模擬建筑物“勢(shì)力范圍”,依據(jù)共享同一段骨架線的建筑物相互鄰近構(gòu)建鄰近圖,約束性三角網(wǎng)和骨架線構(gòu)建時(shí)考慮了外圍街區(qū)塊邊界多邊形的約束,如圖1(a)、(b)所示;其次,基于鄰近圖生成RNG,如圖1(c)所示。RNG可表示為G=(E,V),V為頂點(diǎn)集合V={v1,v2,…,vm},vm對(duì)應(yīng)建筑物Bm;E為邊集合E={e(vi,vj),vi∈V,vj∈V},e(vi,vj)表示建筑物Bi和Bj鄰近,記為P(Bi,Bj);e(vi,vj)長度(Le)為建筑物Bi和Bj間最短距離??紤]到分解后鄰接的兩建筑物間最短距離可能為0,若Le≤Td,則Le=Td,Td為閾值,可依據(jù)地圖上圖形之間可辨識(shí)的最小距離閾值確定(一般設(shè)為0.2 mm)[11]。另外,RNG需依據(jù)圖形分解結(jié)果進(jìn)行實(shí)時(shí)調(diào)整,過程如下:將分解后圖形以距離ε向內(nèi)做緩沖區(qū),ε為極小值(如0.1 mm);依據(jù)緩沖區(qū)處理結(jié)果對(duì)區(qū)域內(nèi)建筑物重新構(gòu)建三角網(wǎng)和骨架線生成對(duì)應(yīng)的鄰近圖和RNG,如圖1(d)所示。
圖1 建筑物鄰近關(guān)系Fig.1 Proximity relations between buildings
建筑物相似性可以用建筑物間大小、方向和形狀的相似性表示,定義見表1[13,30]。建筑物Bi和Bj相似記為S(Bi,Bj)
表1 相似性約束參數(shù)Tab.1 The measures for building similarity
S(Bi,Bj)=def{Ar≤δ1,Or≤δ2,Er≤δ3}
(1)
式中,δ1、δ2和δ3為閾值。
建筑物沿直線排列可以用RNG兩鄰接邊的方向差異和距離差異表示,定義見表2[30]。建筑物三元組{Bi,Bj,Bk}沿直線排列記為Str(Bi,Bj,Bk)
表2 直線排列約束參數(shù)Tab.2 The measures for linear building arrangements
Str(Bi,Bj,Bk)=def{Do≤η1,DL≤η2}
(2)
式中,η1、η2為閾值。
直線模式是一組滿足格式塔原則(相似、鄰近)的沿直線排列建筑物,可看成是由一個(gè)或多個(gè)存在2個(gè)重復(fù)元素的直線模式基元組合而成,直線模式基元定義見式(3)[14,28]
LP(Bi,Bj,Bk)=def{P(Bi,Bj)∧P(Bj,Bk)∧
S(Bi,Bj)∧S(Bj,Bk)∧
Str(Bi,Bj,Bk)}
(3)
式中,建筑物Bi、Bj和Bk既可以是獨(dú)立建筑物,也可以是圖形凸分解后獲取的建筑物??紤]到人眼視覺認(rèn)知負(fù)擔(dān),視覺認(rèn)知直線模式基元不會(huì)同時(shí)分解多個(gè)多邊形,規(guī)定:建筑物Bi、Bj和Bk中最多只能有一個(gè)是凸分解后獲取的建筑物。依據(jù)式(3)定義,直線模式基元即為一個(gè)最簡單的直線模式,任意存在2個(gè)重復(fù)元素的直線模式基元?jiǎng)t需合并為更長的直線模式。
依據(jù)式(3)定義,直線模式基元是構(gòu)成直線模式的基礎(chǔ)。因此,直線模式識(shí)別需首先探測(cè)建筑物群中直線模式基元;其次,合并其中存在2個(gè)重復(fù)元素的直線模式基元。本文結(jié)合圖形凸分解識(shí)別直線模式,考慮到建筑物圖形可能存在多種凸分解結(jié)果,需結(jié)合建筑物的不同凸分解結(jié)果探測(cè)可能存在的所有直線模式基元。式(3)規(guī)定:構(gòu)成直線模式基元的元素最多只有一個(gè)是凸分解后建筑物,故分解不同建筑物圖形探測(cè)直線模式基元的過程相互獨(dú)立。
依據(jù)上述分析,本文結(jié)合圖形凸分解識(shí)別建筑物群中直線模式過程如下:①獲取不同建筑物圖形凸分解的候選分割線集合;②獲取不同分割線組合條件下的建筑物圖形分解結(jié)果,依據(jù)式(3)定義探測(cè)建筑物群中不同分解結(jié)果下可能存在的所有直線模式基元;③依據(jù)圖形不同分解結(jié)果獲取的直線模式基元確定圖形的最佳分解,依據(jù)圖形的最佳分解確定直線模式基元識(shí)別結(jié)果,合并其中存在2個(gè)重復(fù)元素的直線模式基元。
圖形凸分解是利用分割線消除圖形中凹點(diǎn),并將圖形分解為若干個(gè)凸或近似凸的多邊形[33]。建筑物是典型人造地物,具有多直角表達(dá)的形態(tài)特點(diǎn),建筑物圖形凸分解需盡量保持其直角結(jié)構(gòu)。給定建筑物圖形Bm,組成建筑物的多邊形集合記為BPS={Pb,Ph1,Ph2,…,Phn},Pb為Bm外輪廓,Phn為Bm的洞(或島),Pb或Phn的節(jié)點(diǎn)集合記為PVS={v1,v2,…,vk},其中,Pb節(jié)點(diǎn)集合中節(jié)點(diǎn)逆時(shí)針排列,Phn節(jié)點(diǎn)集合中節(jié)點(diǎn)順時(shí)針排列。若點(diǎn)vk+1在邊vk-1vk的左(右)側(cè),稱vk為凸(凹)點(diǎn),如圖2(a)中點(diǎn)v3、v6、v9和v14;節(jié)點(diǎn)vk處角度(Anglek)為邊vk-1vk繞節(jié)點(diǎn)vk逆時(shí)針旋轉(zhuǎn)至邊vkvk+1角度,若|Anglek-90|<α∨|Anglek-270|<α,則Anglek為直角,α=10。
(2) 分割線分解圖形后需要能消除原圖形中凹點(diǎn),即若存在分割線Cp,利用Cp分解圖形后凹點(diǎn)數(shù)量未減少,則Cp需刪除。如圖2(a)所示,采用邊v3v4、v3v14、v6v7、v9v10分解圖形后,分解后獲取的圖形凹點(diǎn)總數(shù)量未減少,故需刪除。
(3) 考慮到圖形凸分解的目的是利用分割線消除圖形凹點(diǎn)。若連接兩凹點(diǎn)的邊分解圖形后能消除其關(guān)聯(lián)的兩凹點(diǎn),其是可行分割線,應(yīng)補(bǔ)充至分割線集合中。如圖2(b)所示,采用邊v3v9和v6v14分解圖形后,邊關(guān)聯(lián)的兩個(gè)凹點(diǎn)均被消除,故邊v3v9和v6v14是可行分割線。
圖2 建筑物圖形凸分解的分割線Fig.2 The cutlines for building decomposition
依據(jù)上述定義,可獲取消除給定建筑物圖形Bm中凹點(diǎn)的可行分割線集合CS={C1,C2,…,Cp}。如圖2(c)所示,虛線連接邊即為圖2(c)所示建筑物的可行分割線集合;圖形凸分解即從集合CS中選擇滿足約束條件的k條分割線將Bm分解為若干個(gè)多邊形。需要說明的是:本文結(jié)合圖形凸分解識(shí)別建筑物直線模式,選取分割線分解圖形的目的是獲取滿足分解約束條件且能與鄰近圖形構(gòu)成直線模式的多邊形,并非要求將圖形嚴(yán)格分解為若干個(gè)凸多邊形。
給定建筑物圖形Bm,其可行分割線集合為CS={C1,C2,…,Cp},從CS中選擇滿足約束條件的k條分割線SubCSx={C1,C2,…,Ck}分解圖形Bm的結(jié)果為SubBSx={SubB1,SubB2,…,SubBk+1},若?SubBy∈SubBSx與鄰近建筑物構(gòu)成直線模式基元,則SubBSx為一個(gè)有效分解??紤]到人眼視覺認(rèn)知負(fù)擔(dān),視覺認(rèn)知圖形時(shí)通常不會(huì)將圖形分解為較多零散多邊形,即k≤Tk,Tk為閾值[34]。另外,圖形凸分解存在一些通用約束原則:如同一凹點(diǎn)不會(huì)被分解兩次、分割線不能交叉等[33]。因此,結(jié)合SubBSx探測(cè)直線模式基元可表達(dá)為獲取滿足約束條件的排列組合問題,約束條件如下:
(1)k≤Tk,Tk為閾值;
(2) SubCSx={C1,C2,…,Ck}中任意兩條分割線不交叉;
(3) SubCSx={C1,C2,…,Ck}中任意兩條分割線消除的凹點(diǎn)不完全相同;
(4) ?SubBy∈SubBSx,使得By與鄰近建筑物構(gòu)成直線模式基元。
以圖3建筑物為例,其候選分割線集合為{v2v14,v3v5,v3v9,v6v8,v6v14,v9v11,v9v12},分割線間關(guān)系可以表達(dá)為弧長鏈接圖,如圖3所示;從CS中選擇k條分割線時(shí),弧長鏈接圖中存在連接關(guān)系的兩條分割線不能被同時(shí)選取,如已選擇分割線v3v9,分割線v6v14不能被選取。假設(shè)從CS中選擇3條分割線分解圖形,{v2v14,v3v9,v6v8}為滿足約束條件(1)、(2)和(3)的分割線集合;其次,依據(jù)選擇的分割線集合分解圖形,判斷分解結(jié)果中是否存在多邊形與鄰近建筑物構(gòu)成直線模式基元。
圖3 可行分割線間關(guān)系表示Fig.3 The relations between cutlines
因此,給定建筑物集合BS={B1,B2,…,Bm},對(duì)應(yīng)RNG為G=(E,V),V={v1,v2,…,vm},E={e(vi,vj),vi∈V,vj∈V},建筑物Bn∈BS的分割線組合記為SubCSx,分解結(jié)果為SubBSx,結(jié)合圖形凸分解的直線模式基元識(shí)別過程見算法1。
算法1:直線模式基元識(shí)別算法
輸入:BS={B1,B2,…,Bm},G=(E,V)
輸出:直線模式基元集合LS
初始化:存儲(chǔ)RNG邊關(guān)聯(lián)的二元建筑物集合S2a=Null,存儲(chǔ)RNG中1階鄰近的二元建筑物集合S2-a=Null,RNG備份CacheG=G
Foreache(vi,vj)∈EDo
IfS(Bi,Bj) Then添加(Bi,Bj)至S2a
Foreache(vi,vn)∈E∧e(vn,vj)∈EDo
IfS(Bi,Bj) Then添加(Bi,Bj)至S2-a
Foreach (Bi,Bj)∈S2aDo
Foreache(vn,vi)∈E∧e(vj,vn)∈EDo
If (Bi,Bj,Bn)構(gòu)成直線模式基元Then添加(Bi,Bj,Bn)至LS
Else Foreach SubCSxforBnDo
更新G=(E,V)
If?By∈SubBSx,使得(Bi,Bj,By)構(gòu)成直線模式基元Then
添加(Bi,Bj,By)至LS
G=CacheG
Foreach (Bi,Bj)∈S2-aDo
Foreache(vi,vn)∈E∧e(vn,vj)∈EDo
Foreach SubCSx forBnDo
更新G=(E,V)
If ?By∈SubBSx,使得(Bi,By,Bj)構(gòu)成直線模式基元Then
添加(Bi,By,Bj)至LS
G=CacheG
刪除LS中重復(fù)的元素;
Return LS
2.2節(jié)已結(jié)合圖形凸分解獲取了所有可能直線模式基元。但是,對(duì)于建筑物多邊形Bm,可能存在多個(gè)滿足2.2節(jié)定義約束條件的分解結(jié)果AS={SubBS1,SubBS2,…,SubBSn},需確定Bm的最佳分解以獲取最終的直線模式基元識(shí)別結(jié)果;其次,組合存在2個(gè)重復(fù)元素的直線模式基元。對(duì)于SubBSx∈AS,存在以下兩種情況:
(1) 存在多個(gè)SubBSx∈AS,使得By∈SubBSx與鄰近建筑物構(gòu)成直線模式基元,如圖4(a)所示,存在分割線集合{Cut1}、{Cut2}和{Cut1,Cut2}均滿足分解結(jié)果與鄰近建筑物B1和B2構(gòu)成直線模式基元??紤]到人眼視覺負(fù)擔(dān),若SubBSx∈AS對(duì)應(yīng)的分割線集合{C1,C2,…,Ck}中分割線數(shù)量越小,則SubBSx越優(yōu),即{Cut1}和{Cut2}較{Cut1,Cut2}更優(yōu)[34];若分割線數(shù)量相同,則分割線總長度越短,則SubBSx越優(yōu),即{Cut2}較{Cut1}更優(yōu)。
(2) 存在多個(gè)SubBSx∈AS,使得By∈SubBSx與鄰近建筑物構(gòu)成多個(gè)直線模式基元,如圖4(b)所示,基于{Cut3}獲取的分解結(jié)果與鄰近建筑物B3和B4構(gòu)成直線模式基元,基于{Cut4}獲取的分解結(jié)果與鄰近建筑物B5、B6構(gòu)成直線模式基元,基于{Cut3,Cut4}獲取的分解結(jié)果與鄰近建筑物B3、B4和B5、B6均構(gòu)成直線模式基元。若基于SubBSx∈AS能獲取更多直線模式基元,則SubBSx越優(yōu),即{Cut3,Cut4}較{Cut3}、{Cut4}更優(yōu)。
圖4 存在多個(gè)滿足約束條件分解結(jié)果的凹多邊形示例Fig.4The concave polygons which have different cutting results
基于式(3)定義,不同建筑物多邊形的分解相互獨(dú)立,確定不同建筑物多邊形的最佳分解不是全局優(yōu)化問題,可以依次依據(jù)SubBSx屬性確定對(duì)應(yīng)多邊形的最佳分解,SubBSx屬性定義見表3?;谇闆r(1)和(2)分析,分解結(jié)果SubBSx優(yōu)劣(Accept_Value)與SubBSx的Pat_Count、Cut_Count和Cut_Length屬性相關(guān);其中,Pat_Count最重要,Cut_Count次之,Cut_Length最不重要,Accept_Value定義見式(4)
表3 分解結(jié)果SubBSx的屬性Tab.3 The properties for SubBSx
Accept_Value=λ1×Pat_Count+λ2×Cut_Count+
λ3×Cut_Length
(4)
式中,λ1,λ2和λ3為權(quán)重,滿足α1?α2?α3。
假設(shè)當(dāng)前研究區(qū)域需分解的建筑物圖形集合為BS={B1,B2,…,Bm},Bm∈BS滿足2.2節(jié)中約束條件的分解結(jié)果集合記為AS={SubBS1,SubBS2,…,SubBSn},依據(jù)式(4),Accept_Value最大的SubBSx∈AS為Bm的最佳分解。基于最佳分解結(jié)果獲取直線模式基元,依據(jù)前文中直線模式定義,合并存在2個(gè)重復(fù)元素的直線模式基元,合并結(jié)果即為最終識(shí)別的直線模式。
選擇Ordnance Survey(OS)開源提供的街道層次地圖局部為試驗(yàn)數(shù)據(jù),建筑物1046個(gè),道路171條,如圖5所示。試驗(yàn)參數(shù)設(shè)置:δ1=2,δ2=20,δ3=1.3,η1=160,η2=2,Tk=2,直線模式識(shí)別結(jié)果如圖5(a)所示;局部放大結(jié)果如圖5(b)—(e)所示。共分解建筑物39個(gè)(其中,存在非直角建筑物11個(gè)),這表明本文方法能有效分解直角和非直角化建筑物;識(shí)別直線模式117個(gè)。為評(píng)價(jià)本文方法可靠性,將本文方法識(shí)別結(jié)果與人眼視覺認(rèn)知結(jié)果對(duì)比。人眼視覺認(rèn)知結(jié)果獲取方法如下:在告知建筑物圖形可分解前提下,由6名從事地圖學(xué)研究的碩(博)士生依據(jù)視覺感知各自勾選出試驗(yàn)區(qū)域中的直線模式,合并6人視覺認(rèn)知結(jié)果作為最終視覺認(rèn)知結(jié)果(認(rèn)知一致的直線模式直接合并,認(rèn)知不一致的直線模式依據(jù)6人投票后確定)。若識(shí)別的直線模式與人視覺認(rèn)知一致,記為tp;若識(shí)別的直線模式與人視覺認(rèn)知不一致,記為fp;漏識(shí)別的直線模式記為fn[28]。另外,直線模式識(shí)別結(jié)果與視覺認(rèn)知結(jié)果可能存在局部一致的情況,若視覺認(rèn)知獲取的直線模式為識(shí)別結(jié)果的一部分,記為tpp;若識(shí)別的直線模式為視覺認(rèn)知結(jié)果的一部分,記為fpp;記入fpp和tpp的直線模式不重復(fù)記入tp、fp和fn。直線模式識(shí)別準(zhǔn)確率(Accuracy)和召回率(Recall)定義見式(5)和式(6),結(jié)果見表4
圖5 結(jié)合圖形凸分解的直線模式識(shí)別結(jié)果Fig.5 The linear pattern recognition results by using polygon decomposition
Accuracy=tp/(tp+tpp+fp+fpp)
(5)
Recall=tp/(tp+tpp+fpp+fn)
(6)
由表4可知,結(jié)合圖形凸分解能識(shí)別試驗(yàn)區(qū)域內(nèi)大部分直線模式(Recall為96.6%),同時(shí),能實(shí)現(xiàn)較高的準(zhǔn)確率(96.6%),識(shí)別結(jié)果符合視覺認(rèn)知。
其中,本文識(shí)別方法獲取的結(jié)果與視覺認(rèn)知可能存在部分不一致,如圖5(b)—(e)中直線模式P1-P5。本文設(shè)置δ1=2,嚴(yán)格限制了直線模式中鄰近建筑物間面積差異,故P1只能識(shí)別部分;若設(shè)置δ1=3,則P1能被識(shí)別。另外,P2無法被識(shí)別是由于本文規(guī)定消除相同凹點(diǎn)的分割線不能被同時(shí)選??;若不考慮該原則,則P2能被識(shí)別,但可能誤識(shí)別直線模式P6。P3和P4誤識(shí)別是由于B4中凹點(diǎn)凹度小,而識(shí)別直線模式P3和P4對(duì)應(yīng)分割線長度長,即凸分解結(jié)果不符合視覺認(rèn)知。若圖形凸分解時(shí)設(shè)置凹度閾值TC,即凹度大于TC的凹點(diǎn)才存在分割線,則不會(huì)誤識(shí)別P3和P4。另外,P5只能識(shí)別部分是因?yàn)槠洳环媳疚闹本€模式定義。
本文直線模式識(shí)別方法以文獻(xiàn)[28]為基礎(chǔ),為驗(yàn)證結(jié)合圖形凸分解識(shí)別直線模式的有效性,基于相同方法在不分解建筑物圖形條件下識(shí)別試驗(yàn)區(qū)域中的直線模式,與本文方法的對(duì)比結(jié)果見表4。由表4可知,若不分解建筑物圖形識(shí)別直線模式,有21個(gè)直線模式無法識(shí)別,18個(gè)直線模式只能識(shí)別部分,相比本文方法準(zhǔn)確率低15.7%,召回率低30.5%。
表4 直線模式識(shí)別結(jié)果統(tǒng)計(jì)分析Tab.4 The statistical results for linear building pattern recognition results
同時(shí),選擇試驗(yàn)區(qū)域中3個(gè)典型區(qū)域?qū)Ρ确治霰疚姆椒ㄓ行?,如圖6所示。如圖6(a)所示,分解建筑物B1—B4能獲取直線模式P1—P5,且這些模式在視覺上均具有明顯的直線排列特點(diǎn);若不分解建筑物B1—B4,則P4和P5無法被識(shí)別、P1—P3只能識(shí)別部分。同理,若不分解對(duì)應(yīng)建筑物,圖6(b)和圖6(c)中直線模式P6、P7、P9、P10、P12無法被識(shí)別;P8和P11只能識(shí)別部分;而結(jié)合圖形凸分解以上模式均能被識(shí)別,且這些模式在視覺上均具有明顯的直線排列特點(diǎn)。由圖6可知,上述區(qū)域均有建筑物圖形局部異質(zhì)的特點(diǎn),這一定程度上說明相比已有方法,本文方法能更有效地識(shí)別建筑物局部異質(zhì)區(qū)域中直線模式。
另外,本文僅分解鄰近范圍內(nèi)存在相似建筑物的多邊形識(shí)別直線模式,如圖6(a)和圖6(b)中建筑物B1—B5被分解,而圖6(b)中建筑物B6等則未被分解。若同時(shí)分解建筑物B5和B6,基于式(3)能識(shí)別直線模式P13,但是,該模式無法被視覺感知。這說明人眼認(rèn)知直線模式時(shí),為有效降低視覺認(rèn)知負(fù)擔(dān),只會(huì)分解研究區(qū)域中的部分凹多邊形。
圖6 結(jié)合圖形凸分解識(shí)別直線模式對(duì)比Fig.6 The comparisons by using polygon decomposition
本文方法涉及較多參數(shù)設(shè)置,不同參數(shù)設(shè)置對(duì)直線排列識(shí)別結(jié)果影響較大,3.1節(jié)中試驗(yàn)參數(shù)為經(jīng)過試驗(yàn)對(duì)比設(shè)置的經(jīng)驗(yàn)閾值。
(1)η1和η2表達(dá)了建筑物沿直線排列的約束條件,若η1和η2取值過大,可能導(dǎo)致識(shí)別的直線模式結(jié)構(gòu)雜亂,如設(shè)置η1=150,則圖7(a)、(e)中虛線連接的建筑物會(huì)被識(shí)別為直線模式的一部分,與視覺認(rèn)知不符。若η1和η2取值過小,則會(huì)漏識(shí)別直線模式,如設(shè)置η1=175,則圖7(b)、(c)中虛線連接的建筑物會(huì)被認(rèn)為不構(gòu)成直線模式,與視覺認(rèn)知不符。經(jīng)過試驗(yàn)對(duì)比,實(shí)際應(yīng)用中取η1=160,η2=2較為合適[24-29]。
(2)δ1、δ2和δ3表達(dá)了建筑物圖形間相似程度的約束條件,若δ1和δ3取值較大,則面積或形狀差異大的建筑物可能被識(shí)別為直線模式,如設(shè)置δ1=3,則圖7(f)中虛線連接的面積差異較大的建筑物會(huì)被識(shí)別為直線模式的一部分,與視覺認(rèn)知不符。若δ2取值較大,則識(shí)別的直線排列可能較曲折,如設(shè)置δ2=30,則圖7(d)中虛線連接的方向差異較大的建筑物會(huì)被識(shí)別為直線模式的一部分,不符合視覺認(rèn)知。需要說明的是,基于不同需要直線模式定義不一樣,如參考文獻(xiàn)[24],圖7(f)中排列會(huì)被認(rèn)為是沿道路的線性模式,無須考慮δ1和δ3取值;參考文獻(xiàn)[25],若識(shí)別鋸齒狀線性排列時(shí),δ2有時(shí)也可能取較大值,以上直線模式均不在本文討論范圍。實(shí)際應(yīng)用中應(yīng)依據(jù)需要和研究區(qū)域中建筑物圖形特征確定參數(shù)閾值,若研究區(qū)域中建筑物圖形較為規(guī)則且圖形相對(duì)簡單,則δ1、δ2和δ3應(yīng)取值較小,如本文取值δ1=2、δ2=20和δ3=1.3;否則,參數(shù)閾值可適當(dāng)擴(kuò)大。
(3)Tk約束圖形凸分解的分割線數(shù)量,若Tk取值較小,可能存在漏識(shí)別;如設(shè)置Tk=1,則圖7(g)中直線模式P1會(huì)被漏識(shí)別;若Tk取值較大,依據(jù)2.1節(jié)定義,待判斷的分割線組合較多,會(huì)導(dǎo)致識(shí)別過程耗時(shí)。同時(shí),考慮到人眼視覺認(rèn)知負(fù)擔(dān),人視覺認(rèn)知圖形時(shí)通常不會(huì)將圖形分解為較多零散多邊形[34]。另外,建筑物圖形通常較為規(guī)則,且建筑物一定鄰近范圍的直線模式個(gè)數(shù)有限:經(jīng)過試驗(yàn)對(duì)比,實(shí)際應(yīng)用中取Tk=2或Tk=3較為合適。
圖7 參數(shù)分析Fig.7 Parameters analysis
不同地區(qū)建筑物形態(tài)各異,可能影響直線模式的識(shí)別。選擇OS開源提供的街道層次地圖中包含復(fù)雜建筑物的局部區(qū)域(建筑物404個(gè),道路104條)為試驗(yàn)數(shù)據(jù),試驗(yàn)參數(shù)不變,直線模式識(shí)別結(jié)果如圖8所示:共凸分解建筑物8個(gè),識(shí)別直線模式18個(gè);其中,11個(gè)為結(jié)合圖形凸分解才能識(shí)別的直線模式。由圖8可知,以上直線模式均符合視覺認(rèn)知,這表明本文方法針對(duì)復(fù)雜圖形仍能有效識(shí)別直線模式。但是,需要說明的是:①復(fù)雜建筑物較多的區(qū)域,建筑物通常排列不規(guī)則,直線模式較少,如圖8中區(qū)域Area_1和Area_2;同時(shí),分解復(fù)雜建筑物獲取的與鄰近圖形構(gòu)成直線模式的建筑物通常形狀并不復(fù)雜;②本文利用邊數(shù)差異度量圖形相似性可能不適用于復(fù)雜圖形,如圖8中建筑物B1和B2邊數(shù)相近,但B1和B2形狀不相似,針對(duì)包含復(fù)雜建筑物的區(qū)域需要利用轉(zhuǎn)角函數(shù)等復(fù)雜指標(biāo)度量建筑物間形狀相似性;③復(fù)雜圖形通常存在較多凹點(diǎn),依據(jù)2.1節(jié)定義,其可行分割線較多,因此,識(shí)別直線模式時(shí)可能存在較多待判斷的分割線組合,識(shí)別過程耗時(shí)。為有效提高直線模式識(shí)別效率,需針對(duì)復(fù)雜圖形設(shè)計(jì)提高效率的策略,如只針對(duì)分解后可能存在直線模式的分割線進(jìn)行判斷。
圖8 結(jié)合圖形凸分解的復(fù)雜圖形區(qū)域直線模式識(shí)別結(jié)果Fig.8 The recognized linear patterns in area with complex buildings by using polygon decomposition
另外,統(tǒng)計(jì)OS開源提供的街道層次地圖中765 961個(gè)建筑物圖形形狀特征,包括建筑物數(shù)量(BC)、平均面積(AveArea)、平均邊數(shù)(AveEC)、邊數(shù)小于等于8的建筑物占比(ER8)和直角占比(RR),結(jié)果見表5。由表5可知,AveEC為4.47,且ER8為98.03%,說明大部分建筑物圖形相對(duì)簡單;同時(shí),RR為96.06%,這表明建筑物呈現(xiàn)出明顯的多直角表達(dá)形態(tài)特征。因此,本文方法針對(duì)建筑物圖形具有較好的適用性。
表5 建筑物圖形特征統(tǒng)計(jì)Tab.5 The statistical results for characteristics of buildings
已有建筑物模式識(shí)別方法通常將建筑物作為整體考慮,本文結(jié)合圖形凸分解成功識(shí)別了直線模式。若將分解后建筑物也認(rèn)為是獨(dú)立建筑物,就能利用現(xiàn)有建筑物模式識(shí)別方法結(jié)合圖形凸分解識(shí)別其他類型建筑物群模式,如C型、T型模式。參考文獻(xiàn)[21]中方法,在分解后建筑物圖形中識(shí)別C型和T型模式,結(jié)果如圖9(a)、(b)所示;其中,C型模式P1—P4和T型模式P5—P6是結(jié)合圖形凸分解才能獲取的模式;同時(shí),這些模式一定程度上符合視覺認(rèn)知。
圖9 結(jié)合圖形凸分解的字母型模式識(shí)別結(jié)果Fig.9 The letter-like pattern recognition results using polygon decomposition
建筑物圖形表達(dá)具有整體相似和局部差異化特點(diǎn),為有效提取建筑物群中直線模式,本文既考慮了視覺認(rèn)知結(jié)構(gòu)整體性的格式塔原則,又結(jié)合圖形凸分解顧及了圖形從局部到整體的視覺認(rèn)知過程。試驗(yàn)結(jié)果證明,本文方法能更有效地識(shí)別建筑物群中直線模式,識(shí)別結(jié)果符合視覺認(rèn)知。同時(shí),本文方法也可用于其他類型建筑群模式的識(shí)別,為結(jié)合圖形凸分解從局部認(rèn)知地理圖形提供了重要支撐。但是,視覺認(rèn)知模式具有較大的靈活性,本文基于參數(shù)和鄰近圖嚴(yán)格定義直線模式有時(shí)會(huì)導(dǎo)致部分模式的漏識(shí)別和誤識(shí)別。另外,隨著地理信息內(nèi)容的逐漸豐富,融合語義信息和機(jī)器學(xué)習(xí)方法識(shí)別建筑物群模式是未來研究的重點(diǎn)。