胡斌斌,王 紅,2,姚君蘭
(1.湖北大學(xué)資源環(huán)境學(xué)院,湖北 武漢430062;2.區(qū)域規(guī)劃與環(huán)境響應(yīng)湖北省重點實驗室,湖北 武漢430062)
我國正逐步在國家、省、地、縣4級建立具有電子地圖功能,包含地名、區(qū)劃、界線矢量數(shù)據(jù)的基礎(chǔ)地名數(shù)據(jù)庫。國內(nèi)已建成1∶50 000、1∶250 000和1∶1 000 000的地名數(shù)據(jù)庫,湖北、山西等省份建立了1∶10 000的地名數(shù)據(jù)庫,個別城市,如北京、上海、沈陽、貴陽等建立了市級的地名數(shù)據(jù)庫[1]。根據(jù)地名管理的需求,省、市、區(qū)、縣、鄉(xiāng)、鎮(zhèn)、街道、村等各級名稱均包含在地名數(shù)據(jù)庫中。但區(qū)劃、界線信息僅覆蓋到縣一級,鄉(xiāng)、鎮(zhèn)、街道、村等僅有注記信息,并無空間范圍信息。鄉(xiāng)、鎮(zhèn)、街道、村等多屬于農(nóng)村地區(qū),包含大量散列式居民地。根據(jù)在政治、經(jīng)濟和文化等方面的意義,居民地可分為城市式和農(nóng)村式兩大類。農(nóng)村式居民地相較于城市式居民地其居民地所占面積較小,通常不超過50%,分布密度低且分布相對分散[2]。農(nóng)村式居民地根據(jù)不同的制圖區(qū)域、地形特點,其圖形結(jié)構(gòu)可分為街區(qū)式居民地、散列式居民地、分散式居民地和特殊形式居民地等。散列式農(nóng)村居民地未經(jīng)規(guī)劃,房屋大多依地形而建,相對集中,沒有明確的街道,外圍輪廓十分不明顯[3]。為補充散列式居民地邊界信息的不完備,本文結(jié)合散列式居民地的特點提出基于地名數(shù)據(jù)庫的散列式居民地邊界提取方法。
邊界提取的首要問題在于要素提取,以往要素提取大多依賴查詢屬性信息的完成。當(dāng)前中國正處于工業(yè)化、城鎮(zhèn)化的快速發(fā)展時期,新生地名快速涌現(xiàn),舊有地名變更頻繁,地名數(shù)量多,更新速度快[4]。在舊有地名變更或新生地名產(chǎn)生時,地名數(shù)據(jù)庫與基礎(chǔ)地理信息數(shù)據(jù)庫若無法同步更新,將出現(xiàn)地名數(shù)據(jù)庫與基礎(chǔ)地理信息數(shù)據(jù)庫相應(yīng)屬性無法對應(yīng)的情況,依據(jù)傳統(tǒng)的屬性選取方法可能無法提取變更后或新生地名所對應(yīng)的基礎(chǔ)地理信息數(shù)據(jù)庫要素。為解決地名數(shù)據(jù)庫與基礎(chǔ)地理信息數(shù)據(jù)庫因地名變更而導(dǎo)致的要素提取困難,本文通過空間位置信息對地名數(shù)據(jù)庫與基礎(chǔ)地理信息數(shù)據(jù)庫進行關(guān)聯(lián),建立地名數(shù)據(jù)與DLG數(shù)據(jù)的對應(yīng)關(guān)系,實現(xiàn)基于地名數(shù)據(jù)庫的要素提取。
完成要素提取需進一步對所提取要素進行邊界提取,通過建立凸殼形成凸多邊形構(gòu)成點群的外圍輪廓線提取邊界是相對簡單的一種方法,應(yīng)用也較普遍。計算平面點集的凸殼算法主要有:卷包裹法、格雷厄姆方法、分治算法、增量算法、實時算法、快速算法和周培德的Z3-8算法等[5]。居民地邊界形狀復(fù)雜多樣,而凸殼方法僅能生成凸多邊形,無法表達居民地整體形狀輪廓。如圖1所示,黑色邊界通過格雷厄姆法建立凸殼形成,包含大量無居民地要素的空白區(qū)域,并且遺漏了重要轉(zhuǎn)折點。為應(yīng)對居民地邊界形狀復(fù)雜多樣的特性,本文通過聚合面方法提取邊界。聚合面是一種制圖綜合操作,將指定距離內(nèi)的面要素合并成新的面要素,在居民地要素分布類型發(fā)生變化時通過改變聚合距離確保所提取邊界正確表達居民地形狀輪廓,適用性更強。
圖1 凸殼法邊界提取結(jié)果
本文以地名數(shù)據(jù)庫為基礎(chǔ),首先通過地名檢索獲取地名注記相關(guān)屬性項,并以此關(guān)聯(lián)地名數(shù)據(jù)和DLG數(shù)據(jù)。完成數(shù)據(jù)關(guān)聯(lián)后,以地名注記點建立泰森多邊形,通過按位置選取判斷地名注記、泰森多邊形、居民地要素三者的位置關(guān)系,提取地名所含居民地要素,流程如圖2所示。
圖2 居民地要素提取流程
本文地名數(shù)據(jù)庫依照國家地名數(shù)據(jù)庫標(biāo)準(zhǔn),屬性項設(shè)置包括:標(biāo)準(zhǔn)地名、少數(shù)民族民族書寫、羅馬字母拼寫、地名發(fā)音、別名、簡稱、類別名稱、使用時間、地理位置、語種、密級、地名含義、來歷、歷史沿革等內(nèi)容[6]。
基礎(chǔ)地理信息數(shù)據(jù)庫命名根據(jù)圖上區(qū)域?qū)?yīng)地圖分幅編號給定,散列式居民地包含依比例尺、半依比例尺和不依比例尺各類建筑物,在基礎(chǔ)地理信息數(shù)據(jù)庫中分別存儲為面狀要素、線狀要素和點狀要素。面狀要素對應(yīng)于依比例尺的建筑物或街區(qū)建筑,線狀要素對應(yīng)半依比例尺獨立房屋,點狀要素對應(yīng)普通不依比例尺房屋與窯洞等特殊不依比例尺房屋。
基于地名數(shù)據(jù)庫的要素提取流程主要包括地名數(shù)據(jù)與DLG數(shù)據(jù)對應(yīng)關(guān)系建立和建立泰森多邊形進行要素提取。
(1)建立地名數(shù)據(jù)與DLG數(shù)據(jù)的對應(yīng)關(guān)系
1)在地名數(shù)據(jù)庫檢索指定地名,獲取指定地名屬性項中類別名稱信息和地理位置信息,如圖3所示。
圖3 地名檢索
2)以地理位置信息計算圖幅編號獲取其對應(yīng)的基礎(chǔ)地理信息數(shù)據(jù)庫名稱。
3)通過將類別名稱信息與基礎(chǔ)地理信息數(shù)據(jù)庫分層標(biāo)準(zhǔn)進行比對,獲取地名注記在基礎(chǔ)地理信息數(shù)據(jù)庫中要素對應(yīng)圖層。
(2)基于泰森多邊形選取要素
1)以居民地注記點圖層生成泰森多邊形如圖4所示,每個泰森多邊形內(nèi)包含一個注記點,且泰森多邊形內(nèi)所包含的點到該注記點的距離最近[7]。
圖4 創(chuàng)建泰森多邊形
2)根據(jù)地名檢索選定注記點,以按位置選取,提取出包含該注記點的泰森多邊形,如圖5所示。
圖5 泰森多邊提取
3)通過按位置選取,分別提取點、線、面居民地圖層中被泰森多邊形所包含的居民地要素。即可提取出指定注記點所含居民地要素,實現(xiàn)基于地名數(shù)據(jù)庫的居民地要素提取,結(jié)果如圖6所示。
圖6 居民地要素提取結(jié)果
聚合面可將彼此緊密臨近的面要素(包括相鄰面在內(nèi))進行合并。該方法將矢量數(shù)據(jù)轉(zhuǎn)換為柵格,然后查找指定距離內(nèi)的要素將其連接,最后將結(jié)果重新轉(zhuǎn)換為具有正確的新邊界構(gòu)造的矢量數(shù)據(jù)即為所提取結(jié)果,流程如圖7所示。
圖7 邊界提取流程
由于散列式居民地包含多類型要素,在基礎(chǔ)地理信息數(shù)據(jù)庫中按點、線、面3種類型存放在不同圖層中。在對點、線居民地要素進行聚合面操作前需將不依比例尺的點、線居民地要素轉(zhuǎn)換為面,并與依比例尺的面狀居民地要素進行合并。
本文通過建立緩沖區(qū)的方法將點、線居民地要素轉(zhuǎn)換為面。根據(jù)1∶50 000地形圖圖式中居民地要素符號尺寸的相關(guān)規(guī)定,不依比例尺的普通點狀房屋在圖上符號半徑為0.4 mm,以20 m(0.4 mm×50 000)為半徑建立緩沖區(qū)轉(zhuǎn)換為面,特殊點狀房屋窯洞在圖上符號半徑為0.8 mm,40 m(0.8 mm×50 000)為半徑建立緩沖區(qū)轉(zhuǎn)換為面;半依比例尺的線狀獨立房屋在圖上寬度為0.4 mm,以20 m(0.4 mm×50 000)為半徑建立緩沖區(qū)轉(zhuǎn)換為面。
如圖8所示,居民地注記所含要素可能密集分布或離散分布。為使本方法適用性更強,需針對居民地要素分布狀況給定不同聚合距離,確保注記所含要素中存在離散要素時所提取邊界能反映此特征,正確表達居民地分布狀況。本文以迭代法判斷獨立閾值判定聚合距離,判定過程如下:
1)通過臨近分析獲取目標(biāo)注記各個要素中心點與臨近要素中心點之間的最近距離,可得有序數(shù)列(L1,L2,L3,…,Ln)。
2)以Ln為半徑,以各個居民地要素中心點為圓心,掃描面要素數(shù)量,可得整型有序數(shù)列(N1,N2,N3,…,Nn),其中Nn=1。若N1、N2、N3、…、Nn-1均大于1,則說明Ln所對應(yīng)居民地要素距離其他居民地要素最遠,且相對獨立,需單獨提取,以Ln-1為聚合距離。
3)若Nn=1不唯一,則以Ln-1為半徑,掃描面要素,到整型有序數(shù)列(N1,N2,N3,…,Nn-1,Nn),其中Nn=0,Nn-1=1。若Nn-1=1唯一,則以Ln-2為聚合距離。若Nn-1=1不唯一,則繼續(xù)上述過程,直至Nn-a=1(0<a<n)唯一,以Ln-a-1為聚合距離。
圖8 居民地分布圖
以此方法所得閾值作為聚合距離進行聚合面,可在居民地存在離散分布要素時避免離散要素與密集區(qū)域連成整體,從而使所提取邊界能正確反映居民地疏密狀況和形狀輪廓。
為驗證邊界提取結(jié)果的合理性,本文以某地單幅1∶50 000地形圖為數(shù)據(jù)源,依據(jù)所述數(shù)據(jù)標(biāo)準(zhǔn)制作地名數(shù)據(jù)庫和基礎(chǔ)地理信息數(shù)據(jù)庫,圖上包含點狀窯洞、線狀獨立房屋及面狀建筑在內(nèi)的大量農(nóng)村散列式居民地。以本文所述方法進行試驗,分別輸入居民地名稱“仁里府”與“李家河”進行檢索,最終邊界提取結(jié)果如圖9所示。
圖9 聚合面法邊界提取結(jié)果
圖9(a)說明該地名注記所含居民地要素存在離散分布,最終結(jié)果分界顯示;圖9(b)說明該地名注記點同時包含面狀依比例尺居民地要素(獨立房屋)及點狀不依比例尺居民地要素(窯洞),最終結(jié)果將所有要素包含在內(nèi)。
以上結(jié)果說明:聚合面邊界提取方法適用于多類型散列式居民地要素,能針對不同居民地的要素密集程度生成單個或多個邊界,所提取邊界能真實反映居民地輪廓形狀。
散列式居民地作為居民地的重要組成部分,在農(nóng)村廣泛存在,但目前針對它的研究卻相對較少。本文依據(jù)現(xiàn)有地名數(shù)據(jù)庫和基礎(chǔ)地理信息數(shù)據(jù)庫標(biāo)準(zhǔn)建立數(shù)據(jù)庫,綜合考慮居民地要素的多類型和所得邊界的合理性,以地名數(shù)據(jù)庫為基礎(chǔ)實現(xiàn)要素選取,以迭代法確定聚合面方法聚合距離完成邊界提取,試驗區(qū)域邊界提取結(jié)果與數(shù)據(jù)源吻合較好。
本文所述方法存在以下問題有待進一步研究:地名形狀特征各異,本文通過緩沖區(qū)將點狀、線狀居民地轉(zhuǎn)換為面的方法有待進一步改進,以使轉(zhuǎn)換結(jié)果能更準(zhǔn)確覆蓋各類地物;聚合面方法涉及柵矢轉(zhuǎn)換過程,效率較低,算法效率有待加強改進;居民地類型及分布十分多樣,本文并未考慮所有居民地類型和各種分布狀況,邊界提取過程如果能加入質(zhì)量控制能有效發(fā)現(xiàn)質(zhì)量問題,使方法適用性更強。
[1] 黃大寧,鄔群勇,滿旺,等.縣級地名時空數(shù)據(jù)庫的設(shè)計與實現(xiàn)[J].測繪科學(xué),2014,39(11):121.
[2] 盛文斌.散列式居民地的自動選取研究[D].鄭州:信息工程大學(xué),2010.
[3] 祝國瑞,郭禮珍,尹貢白.地圖設(shè)計與匯編[M].武漢:武漢大學(xué)出版社,2010.
[4] 中華人民共和國民政部.2005民政事業(yè)發(fā)展統(tǒng)計報告[Z].2006-04-03.
[5] 周培德.計算幾何——算法分析與設(shè)計[M].北京:清華大學(xué)出版社,2005.
[6] 姬煒,胡小勇,王建春.中國國家地名數(shù)據(jù)庫管理系統(tǒng)淺析[J].中國地名,2012(5):76-78.
[7] 陳春,泰森多邊形的建立及其在計算機制圖中的應(yīng)用[J].測繪學(xué)報,1987,16(3):223-231.