魏金明,張學(xué)明,周寧
(濟(jì)南市勘察測(cè)繪研究院,山東 濟(jì)南 250101)
地名是基礎(chǔ)地理信息,地名普查是一項(xiàng)公益性、基礎(chǔ)性的國(guó)情調(diào)查[1]。隨著經(jīng)濟(jì)社會(huì)的發(fā)展和區(qū)劃地名的變化,20世紀(jì)80年代初進(jìn)行的第一次全國(guó)地名普查成果資料已陳舊過時(shí),不能反映全國(guó)地名的現(xiàn)狀。為了滿足經(jīng)濟(jì)社會(huì)快速發(fā)展對(duì)地名服務(wù)日益增長(zhǎng)的需求,全面掌握地名基本信息,提高我國(guó)地名管理和服務(wù)水平,經(jīng)國(guó)務(wù)院批準(zhǔn),于2014年7月~2018年6月開展第二次全國(guó)地名普查[2]。普查內(nèi)容為查清行政區(qū)域范圍內(nèi)地名基本情況及相關(guān)屬性信息,對(duì)有地?zé)o名的有地名作用的地理實(shí)體進(jìn)行命名,對(duì)不規(guī)范地名進(jìn)行標(biāo)準(zhǔn)化處理,設(shè)置標(biāo)準(zhǔn)規(guī)范的地名標(biāo)志,建立、完善各級(jí)國(guó)家地名和區(qū)劃數(shù)據(jù)庫,加強(qiáng)地名信息化服務(wù)建設(shè),建立地名普查檔案。
進(jìn)行地名普查首先要編制相對(duì)完善的標(biāo)準(zhǔn)地名調(diào)查目錄和工作底圖。國(guó)內(nèi)多個(gè)專家對(duì)該項(xiàng)工作做了研究,如費(fèi)聯(lián)君等研究了基礎(chǔ)地理信息數(shù)據(jù)在地名普查中的應(yīng)用[2];邵光州等以大數(shù)據(jù)的視角提出從海量數(shù)據(jù)中挖掘地名的方法[3];林選妙等提出從GoogleEarth免費(fèi)資源中獲取地名[4]。濟(jì)南市借鑒上述方法,對(duì) 1∶50 000數(shù)字線劃圖、第一次地理國(guó)情普查成果[5]、第一次全國(guó)地名普查成果、各委辦局和下級(jí)行政組織提交的地名信息、地名錄志等資料內(nèi)的地名信息按區(qū)縣分街道進(jìn)行整理匯總,形成濟(jì)南市各區(qū)縣標(biāo)準(zhǔn)地名調(diào)查目錄。
由于濟(jì)南市地名調(diào)查目錄中多數(shù)標(biāo)準(zhǔn)地名未定位且下發(fā)的 1∶50 000數(shù)字線劃圖信息老舊,難以反映現(xiàn)狀,需要對(duì)標(biāo)準(zhǔn)地名進(jìn)行定位處理,獲取標(biāo)準(zhǔn)地名的空間位置。本文以地理空間框架數(shù)據(jù)為基礎(chǔ)數(shù)據(jù),采用自動(dòng)半自動(dòng)的數(shù)據(jù)提取方法,分類別提取標(biāo)準(zhǔn)地名對(duì)應(yīng)的地理實(shí)體,為編制外業(yè)普查工作底圖、獲取地名經(jīng)緯度四至打下基礎(chǔ)。通過數(shù)據(jù)準(zhǔn)備、地名匹配、數(shù)據(jù)提取、位置調(diào)整等工作步驟的詳細(xì)描述,說明地理空間框架數(shù)據(jù)在濟(jì)南市第二次地名普查中的應(yīng)用。
`對(duì)標(biāo)準(zhǔn)地名進(jìn)行定位,需要有基礎(chǔ)數(shù)據(jù)。為便于數(shù)據(jù)分類并保障數(shù)據(jù)的現(xiàn)勢(shì)性,選取濟(jì)南市地理空間框架數(shù)據(jù)為基礎(chǔ)數(shù)據(jù),并對(duì)其進(jìn)行類別規(guī)范、面點(diǎn)轉(zhuǎn)換等處理。
濟(jì)南市地理空間框架數(shù)據(jù)包括地理實(shí)體數(shù)據(jù)、地名地址數(shù)據(jù)、影像數(shù)據(jù)、電子地圖數(shù)據(jù)和專題數(shù)據(jù),具有全要素、現(xiàn)勢(shì)性強(qiáng)的特點(diǎn)。
地理實(shí)體數(shù)據(jù)包括居民點(diǎn)、水系、交通等9類28層數(shù)據(jù),每條數(shù)據(jù)依照《濟(jì)南市基礎(chǔ)地理信息要素分類與編碼》標(biāo)準(zhǔn)賦以分類代碼[6];地名地址數(shù)據(jù)按照《濟(jì)南市POI分類編碼》標(biāo)準(zhǔn)分為18大類、122小類、369子類,并對(duì)其類別代碼進(jìn)行賦值;保證數(shù)據(jù)的全要素性。數(shù)據(jù)全要素特點(diǎn)可保障基礎(chǔ)數(shù)據(jù)與地名普查數(shù)據(jù)類別的對(duì)應(yīng),便于數(shù)據(jù)類別規(guī)范化處理。
數(shù)字濟(jì)南地理空間框架建成后,參照多源數(shù)據(jù)更新技術(shù)[7],建立數(shù)據(jù)更新機(jī)制,每年對(duì)基礎(chǔ)地理信息數(shù)據(jù)進(jìn)行全面更新,對(duì)重要框架數(shù)據(jù)進(jìn)行實(shí)時(shí)更新,保障了數(shù)據(jù)的現(xiàn)勢(shì)性。數(shù)據(jù)現(xiàn)勢(shì)性強(qiáng)的特點(diǎn)保障匹配后的地名空間位置反映現(xiàn)狀。
對(duì)濟(jì)南市地理空間框架數(shù)據(jù)進(jìn)行地名匹配前,需進(jìn)行類別規(guī)范、面點(diǎn)轉(zhuǎn)換等優(yōu)化處理。具體處理流程如圖1所示:
圖1地理空間框架數(shù)據(jù)優(yōu)化技術(shù)流程圖
類別規(guī)范:根據(jù)地名分類標(biāo)準(zhǔn),將地理要素類別、POI類別與地名類別進(jìn)行分析對(duì)比,建立地理空間框架數(shù)據(jù)與地名數(shù)據(jù)之間的類別對(duì)應(yīng)關(guān)系。在框架數(shù)據(jù)內(nèi)添加地名類別屬性項(xiàng),依照類別對(duì)應(yīng)關(guān)系研發(fā)地名類別賦值工具,給地名類別屬性項(xiàng)賦值,使每條地理空間框架數(shù)據(jù)包含規(guī)范化的地名類別屬性。
面點(diǎn)轉(zhuǎn)換:根據(jù)地名數(shù)據(jù)定位規(guī)則,行政區(qū)域、湖泊、公園風(fēng)景區(qū)等面狀地理實(shí)體需要以點(diǎn)狀形式表示,但應(yīng)獲取其經(jīng)緯度四至。根據(jù)行政區(qū)域定位在駐地位置、湖泊定位在幾何中心等面點(diǎn)轉(zhuǎn)換規(guī)則,將面狀地理實(shí)體轉(zhuǎn)換為點(diǎn)狀地理實(shí)體,并建立面數(shù)據(jù)與點(diǎn)數(shù)據(jù)間的對(duì)應(yīng)關(guān)系,便于獲取其經(jīng)緯度四至信息。
整合優(yōu)化:分形狀將點(diǎn)數(shù)據(jù)和線數(shù)據(jù)合并,對(duì)數(shù)據(jù)內(nèi)容進(jìn)行除重、名稱規(guī)范等操作,使空間數(shù)據(jù)優(yōu)化為包括名稱、地名類別、面點(diǎn)關(guān)聯(lián)碼等屬性信息的一層點(diǎn)數(shù)據(jù)和一層線數(shù)據(jù)。
利用基于置信度的地址匹配方法[8],分類別匹配標(biāo)準(zhǔn)地名。
要進(jìn)行地名匹配,首先用分詞算法提取關(guān)鍵字,本文利用地址元素詞庫和改正詞庫為基礎(chǔ)詞庫,用地址分詞和普通分詞相結(jié)合的分詞算法,對(duì)標(biāo)準(zhǔn)地名、地址、地理實(shí)體概況三項(xiàng)屬性信息進(jìn)行分詞。具體分詞過程中,首先對(duì)標(biāo)準(zhǔn)地名進(jìn)行分詞并匹配,若置信度高停止匹配,若置信度不高則對(duì)地址進(jìn)行分詞并匹配,若置信度仍不高再對(duì)地理實(shí)體概況分詞并匹配。
置信度代表待匹配兩類數(shù)據(jù)的相似程度。將地名信息分詞結(jié)果作為關(guān)鍵字與待匹配數(shù)據(jù)分詞結(jié)果對(duì)比計(jì)算其置信度。置信度的計(jì)算公式為:
其中,D為置信度,k為權(quán)重系數(shù),n為分詞段數(shù),ρ為位置系數(shù),S為相似度。
濟(jì)南市地名調(diào)查目錄中地名信息分區(qū)縣按類別存放,地名匹配工作中,需分類別進(jìn)行匹配。雖然國(guó)家第二次地名普查分類標(biāo)準(zhǔn)中將地名分為100多項(xiàng)小類,但具體到濟(jì)南市各區(qū)縣,僅包含30項(xiàng)左右。地名匹配前,需在地名信息內(nèi)添加置信度、關(guān)聯(lián)空間碼兩項(xiàng)屬性項(xiàng)。匹配過程中,首先根據(jù)地名類別確定空間數(shù)據(jù)形狀(點(diǎn)數(shù)據(jù)、線數(shù)據(jù));之后匹配空間數(shù)據(jù)得出置信度;最后根據(jù)匹配賦值規(guī)則填寫置信度、關(guān)聯(lián)空間碼屬性項(xiàng)。匹配賦值規(guī)則為:
①根據(jù)空間數(shù)據(jù)中地名類別屬性信息匹配同類別數(shù)據(jù),得出置信度(D)和匹配關(guān)聯(lián)的空間標(biāo)識(shí)碼(FID)。
②D≥0.95時(shí),將D寫入置信度屬性項(xiàng),F(xiàn)ID寫入關(guān)聯(lián)空間碼屬性項(xiàng),完成匹配。
③0.95>D≥0.75時(shí),若置信度屬性項(xiàng)無信息,寫入D;已有信息,不做操作,轉(zhuǎn)入④。
④關(guān)聯(lián)空間碼屬性項(xiàng)無信息時(shí),寫入FID并轉(zhuǎn)入①繼續(xù)匹配。有信息時(shí),查看關(guān)聯(lián)空間碼個(gè)數(shù),個(gè)數(shù)為1時(shí),寫入FID并轉(zhuǎn)入①繼續(xù)匹配;個(gè)數(shù)為2時(shí),寫入FID完成匹配。當(dāng)關(guān)聯(lián)空間碼屬性信息包含多個(gè)FID時(shí),用頓號(hào)(、)將其隔開。
⑤D<0.75時(shí),匹配不同類數(shù)據(jù),得出置信度(D2=D-0.25)和匹配關(guān)聯(lián)的空間標(biāo)識(shí)碼(FID)。若置信度屬性項(xiàng)無信息,寫入D2;已有信息,不做操作,轉(zhuǎn)入⑥。
⑥關(guān)聯(lián)空間碼屬性項(xiàng)無信息時(shí),寫入FID并轉(zhuǎn)入⑤繼續(xù)匹配。有信息時(shí),查看關(guān)聯(lián)空間碼個(gè)數(shù),個(gè)數(shù)為1時(shí),寫入FID并轉(zhuǎn)入⑤繼續(xù)匹配;個(gè)數(shù)為2時(shí),寫入FID完成匹配。
地名匹配完成后,需根據(jù)匹配置信度,采取自動(dòng)半自動(dòng)的數(shù)據(jù)提取方法,利用“地名代碼”作為關(guān)聯(lián)碼,將空間數(shù)據(jù)提取到地名矢量數(shù)據(jù)內(nèi)。
地名代碼是地名的唯一識(shí)別碼,按照一定規(guī)則用數(shù)字對(duì)對(duì)地名進(jìn)行編碼以代替地名,根據(jù)《國(guó)家地名數(shù)據(jù)庫代碼編制規(guī)則》編制。地名代碼編碼規(guī)則如圖2所示。
圖2 地名代碼編制規(guī)則
地名代碼由四段共20位數(shù)字標(biāo)識(shí)。第一段為6位數(shù)字,表示縣級(jí)以上行政區(qū)劃代碼,使用2014年12月31日前最后更新的行政區(qū)劃代碼。第二段為3位數(shù)字,表示鄉(xiāng)級(jí)行政區(qū)劃代碼,統(tǒng)一使用同期更新的民政統(tǒng)計(jì)代碼相應(yīng)通用部分。第三段為5位數(shù)字,表示地名屬性類別,按照《地名分類與類別代碼編制規(guī)則》(GB/T 18521-2001)填寫。第四段為6位數(shù)字,表示附加碼,用以區(qū)分同一類別并且是同一行政區(qū)的地名和排序。
地名矢量數(shù)據(jù)分點(diǎn)數(shù)據(jù)、線數(shù)據(jù)兩類,具有相同的屬性結(jié)構(gòu)。其屬性結(jié)構(gòu)如表1所示。
地名矢量數(shù)據(jù)屬性結(jié)構(gòu) 表1
地名代碼(Code)是地名數(shù)據(jù)的唯一標(biāo)識(shí)碼,通過地名代碼屬性,可以將地名空間數(shù)據(jù)與地名屬性信息聯(lián)接,實(shí)現(xiàn)圖屬關(guān)聯(lián)。
自動(dòng)提?。簩?duì)于置信度大于等于0.95(D≥0.95)的地名數(shù)據(jù),在地名空間數(shù)據(jù)內(nèi)新增一條記錄,根據(jù)關(guān)聯(lián)空間碼從空間數(shù)據(jù)內(nèi)提取空間圖形并賦予該記錄,從地名信息內(nèi)提取地名代碼、名稱、地名類別和使用時(shí)間屬性賦予該記錄。
半自動(dòng)提?。簩?duì)于置信度小于0.95(D<0.95)的地名數(shù)據(jù),根據(jù)關(guān)聯(lián)空間碼和地名地址、概況等信息從匹配的3項(xiàng)空間圖形內(nèi)判斷是否有正確的空間圖形,如果有,則在地名空間數(shù)據(jù)內(nèi)新增一條記錄,將空間圖形、地名代碼、名稱、地名類別和使用時(shí)間賦予該記錄;如果沒有,則將其標(biāo)注為未定位地名。
濟(jì)南市地名調(diào)查目錄按類別存放,提取后形成各類別地名空間數(shù)據(jù)。將各類別地名空間數(shù)據(jù)按形狀合并,形成點(diǎn)狀地名空間數(shù)據(jù)(DMPT)和線狀地名空間數(shù)據(jù)(DMLN)。
地名地理實(shí)體定位、圖形類型及地理坐標(biāo)測(cè)量要求中,線狀地名在一個(gè)區(qū)縣內(nèi)用一條聯(lián)通的線段表示,點(diǎn)狀地名除行政區(qū)域、群眾自治組織定位在駐地位置外,其他類別定位在幾何中心,且測(cè)量誤差小于 20 m。工作中疊加影像底圖,逐項(xiàng)檢查、調(diào)整地名空間數(shù)據(jù),保證滿足測(cè)量要求。
濟(jì)南市地理空間框架數(shù)據(jù)中,影像底圖可分兩類。一類是數(shù)字正射影像圖(DOM),一類是瓦片影像地圖(緊湊型)[9]。DOM數(shù)據(jù)按圖幅存放,信息容量大,做底圖時(shí)需分圖幅逐項(xiàng)加載;瓦片影像地圖按顯示級(jí)別存放,可統(tǒng)一加載一個(gè)區(qū)縣或一個(gè)市的數(shù)據(jù),且瀏覽速度快。位置調(diào)整工作中影像底圖僅用于瀏覽,不做分析和信息提取處理,故采用瓦片影像地圖。瓦片影像地圖數(shù)據(jù)存放結(jié)構(gòu)如圖3所示。
圖3瓦片影像底圖數(shù)據(jù)存放結(jié)構(gòu)
位置調(diào)整的工作步驟為:①在ArcGIS軟件內(nèi)加載瓦片影像底圖數(shù)據(jù)和地名空間數(shù)據(jù),將其保存為WorkMap.mxd工作地圖,后期工作可直接打開該地圖。②將地名空間數(shù)據(jù)設(shè)置為編輯狀態(tài),逐項(xiàng)查看地名位置的準(zhǔn)確性,若位置不準(zhǔn)確則改正到準(zhǔn)確位置。③對(duì)線狀空間數(shù)據(jù)的地名代碼屬性進(jìn)行查重處理,對(duì)關(guān)聯(lián)圖形進(jìn)行除重、連接等操作,確保一個(gè)地名對(duì)應(yīng)一條聯(lián)通的線段。④保存編輯后的空間數(shù)據(jù),生成地名空間成果數(shù)據(jù)。
針對(duì)地名調(diào)查目錄中標(biāo)準(zhǔn)地名定位問題,以地理空間框架數(shù)據(jù)為基礎(chǔ)數(shù)據(jù),使用基于置信度的地址匹配方法,采用自動(dòng)半自動(dòng)的定位方法,通過數(shù)據(jù)準(zhǔn)備、地名匹配、數(shù)據(jù)提取、位置調(diào)整等工作步驟,生成地名空間成果數(shù)據(jù)。在濟(jì)南市歷下區(qū)地名普查工作中,對(duì) 5 200條地名數(shù)據(jù)進(jìn)行定位,自動(dòng)定位 3 192條,占61.4%,半自動(dòng)定位后定位總數(shù) 4 672條,占89.8%。推廣到濟(jì)南市其他區(qū)縣使用,定位率最低的也達(dá)到了60%,可有效提高工作效率,提升定位精度,為濟(jì)南市順利完成地名普查工作奠定了基礎(chǔ)。
生成的地名空間成果數(shù)據(jù)可用于編制外業(yè)普查工作底圖、獲取地名經(jīng)緯度四至等地名普查后期工作中。若外業(yè)普查采用紙質(zhì)工作底圖,可將成果數(shù)據(jù)快速布展到紙質(zhì)圖上;若采用移動(dòng)平板進(jìn)行外業(yè)普查,可將成果數(shù)據(jù)加載到移動(dòng)平臺(tái)內(nèi)。對(duì)于點(diǎn)狀、線狀地名的經(jīng)緯度四至,通過空間圖形自動(dòng)獲取;對(duì)于面狀地名的經(jīng)緯度四至,通過點(diǎn)、面關(guān)聯(lián)碼提取其面狀圖形后獲取。地名調(diào)查目錄內(nèi)未定位的標(biāo)準(zhǔn)地名,通過外業(yè)普查實(shí)地測(cè)量其地理實(shí)體。后期,將借鑒相關(guān)應(yīng)用實(shí)例,研究基于移動(dòng)平臺(tái)的地名外業(yè)普查解決方案。
[1] 向煜. 面向第二次全國(guó)地名普查的數(shù)字化調(diào)查系統(tǒng)建設(shè)研究[J]. 北京測(cè)繪,2016(4):62~65.
[2] 費(fèi)聯(lián)君,歐陽劍波. 基礎(chǔ)地理信息數(shù)據(jù)在地名普查中的應(yīng)用[J]. 地理空間信息,2016(9):17~18.
[3] 邵光州,胡小民,唐長(zhǎng)增等. 大數(shù)據(jù)環(huán)境下開展地名普查的實(shí)踐研究[J]. 中國(guó)地名,2015(9):17~20.
[4] 林選妙,黃麗蓉,張興等. Google Earth在全國(guó)地名普查項(xiàng)目中的應(yīng)用[J]. 大眾科技,2013(1):32~34.
[5] 楊伯鋼,張保鋼. 地理國(guó)情普查與地名普查的相關(guān)性分析[J]. 測(cè)繪科學(xué),2015(10):37~42.
[6] 趙向陽. 濟(jì)南市全要素級(jí)基礎(chǔ)地理信息共享框架研究[J]. 城市勘測(cè),2010(2):30~32.
[7] 張小波,李新雙,張俊等. 多源數(shù)據(jù)更新空間框架地理信息技術(shù)[J]. 城市勘測(cè),2016(6):57~59.
[8] 魏金明,仲偉政. 基于置信度的地址匹配方法初探[J]. 測(cè)繪科學(xué),2015(1):122~124.
[9] 劉建川,甘泉,張堯等. 瓦片影像地圖快速配準(zhǔn)與融合方法實(shí)現(xiàn)[J]. 測(cè)繪科學(xué),2015(11):85~88.