亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于實體匹配技術(shù)的點狀城區(qū)要素融合更新

        2022-10-31 11:59:24張大騫劉善磊
        地理空間信息 2022年10期
        關(guān)鍵詞:高德格網(wǎng)國情

        張大騫,劉善磊,楊 錦

        (1.江蘇省基礎(chǔ)地理信息中心,江蘇 南京 210013)

        網(wǎng)絡(luò)電子地圖中含有大量有價值的POI信息,這些POI數(shù)據(jù)對于人們的日常生活與工作具有重大參考意義。將現(xiàn)勢性較強的POI數(shù)據(jù)作為基礎(chǔ)地理信息更新參考數(shù)據(jù),可在一定程度上減少人工核實工作量,簡化部分基礎(chǔ)地理信息要素更新的作業(yè)流程[1-4]。針對高德數(shù)據(jù)與地理國情監(jiān)測數(shù)據(jù)兩類異源矢量空間數(shù)據(jù),本文在對數(shù)據(jù)進行預(yù)處理和質(zhì)量檢查的基礎(chǔ)上,研究了一種基于多特征組合的點實體匹配技術(shù),實現(xiàn)部分城市點狀要素數(shù)據(jù)的融合更新。

        1 方法

        為實現(xiàn)與地理國情監(jiān)測中點狀要素數(shù)據(jù)的融合更新,需將POI數(shù)據(jù)通過相關(guān)技術(shù)從互聯(lián)網(wǎng)爬取。本文基于FME搭建模板實現(xiàn)高德POI數(shù)據(jù)的爬取,針對獲取的POI數(shù)據(jù),經(jīng)數(shù)據(jù)預(yù)處理后進行實體匹配操作,最后對匹配結(jié)果進行驗證與分析評價,具體技術(shù)流程見圖1。

        圖1 技術(shù)流程圖

        2 POI數(shù)據(jù)獲取與預(yù)處理

        2.1 數(shù)據(jù)獲取

        利用FME研究基于API接口,解析JSON數(shù)據(jù),分割提取數(shù)據(jù)的屬性和位置信息,轉(zhuǎn)換成空間數(shù)據(jù)。利用該技術(shù)可以零代碼快速爬取互聯(lián)網(wǎng)POI數(shù)據(jù),具體的實現(xiàn)方法如下[5]:①前期準備。準備目標范圍矢量文件、獲取網(wǎng)站的密鑰、API密鑰列表文件等。②提取格網(wǎng)。由于單次僅可爬取400條記錄,需要對過大區(qū)域進行格網(wǎng)分割,用分割后的區(qū)域范圍循環(huán)發(fā)起爬取請求。讀取目標范圍矢量文件,構(gòu)建合適大小格網(wǎng),提取與目標范圍相交的格網(wǎng)。③構(gòu)建搜索范圍參數(shù)。逐一將格網(wǎng)圖形轉(zhuǎn)換為JSON數(shù)據(jù),提取JSON中格網(wǎng)圖形的左下角與右上角經(jīng)緯度坐標,按照API中boundary參數(shù)要求拼接參數(shù)。④構(gòu)建隨機API key參數(shù)。讀取存儲API key的文件,給格網(wǎng)數(shù)據(jù)增加APIkey數(shù)據(jù)列,平均分配賦值。⑤獲取數(shù)據(jù)并解析。構(gòu)建HTTP請求獲取數(shù)據(jù),提取有用數(shù)據(jù)部分,解析數(shù)據(jù)。⑥創(chuàng)建地理要素與輸出。構(gòu)建圖形,將圖形和屬性寫入矢量文件。

        2.2 坐標糾偏

        針對爬取獲得的POI數(shù)據(jù),需進行坐標糾偏,本文采取了一種網(wǎng)格逼近方法[6],通過FME的Python-Caller編寫坐標糾偏算法,將高德的GCJ-02糾偏為CGCS2000經(jīng)緯度數(shù)據(jù)。

        2.3 數(shù)據(jù)清洗

        數(shù)據(jù)清洗主要包括對數(shù)據(jù)的完整性、唯一性、合法性等進行檢查與處理。通過多種轉(zhuǎn)換器組合一次性實現(xiàn)數(shù)據(jù)的多方面檢查與處理。

        數(shù)據(jù)完整性的檢查與處理:利用AttributeCreator、AttributeManager等轉(zhuǎn)換器進行屬性創(chuàng)建與設(shè)置;利用AttributeValidator轉(zhuǎn)換器進行屬性驗證;利用AttributeSplitter轉(zhuǎn)換器進行屬性分離;利用AttributeRemover、BulkAttributeRemover等轉(zhuǎn)換器實現(xiàn)屬性刪除;利用AttributeRenamer、BulkAttributeRenamer等轉(zhuǎn)換器實現(xiàn)屬性重命名;利用FeatureMerger、FeatureReader、NeighborFinder等轉(zhuǎn)化器實現(xiàn)屬性的掛接補充。

        數(shù)據(jù)唯一性與合法性的檢查與處理:Tester轉(zhuǎn)換器可以實現(xiàn)單一條件過濾;TestFilter轉(zhuǎn)換器可以實現(xiàn)多個條件過濾;AttributeFilter轉(zhuǎn)換器可以實現(xiàn)屬性過濾;GeometryFilter轉(zhuǎn)換器可以實現(xiàn)幾何過濾;Geometry Validator轉(zhuǎn)換器可以實現(xiàn)幾何驗證;SpatialRelactor、SpatialFilter等轉(zhuǎn)換器可以實現(xiàn)空間關(guān)系判斷等。

        3 基于多特征組合的點實體匹配

        本文綜合利用實體的位置、屬性(語義)及環(huán)境特征,提出了基于距離、屬性(語義)與環(huán)境等多個相似特征組合的匹配方法來解決點實體匹配問題[7-15]。

        當匹配數(shù)據(jù)集覆蓋程度很弱時,距離參數(shù)無法作為匹配依據(jù),此時基于要素屬性進行點實體匹配,但不同點實體可能具有相似屬性,難以保證匹配的查準率。

        數(shù)據(jù)整體呈現(xiàn)為強覆蓋,數(shù)據(jù)密集的局部區(qū)域(單位面積內(nèi)實體數(shù)目較多)出現(xiàn)弱覆蓋現(xiàn)象(因為誤差大于該區(qū)域的點之間的平均距離),或由于點實體的重復(fù)數(shù)字化(兩次采集的點位可能不一樣)、點實體自重疊等(但只有一個實體含有屬性)錯誤,導(dǎo)致相互接近的兩個點實體不一定是同名實體。對于這些情況下的點實體匹配問題,本文綜合考慮點實體的距離、屬性及環(huán)境等多個相似特征來解決匹配問題(前提是至少存在部分屬性項匹配),有效地提高了匹配的查全率和查準率。

        采用基于距離、屬性與環(huán)境等多個相似特征的點實體匹配方法對點實體數(shù)據(jù)集進行實驗,基本過程是:先用統(tǒng)計的方法計算出匹配的距離閾值,然后針對其中一個點數(shù)據(jù)集中的每個實體,利用其緩沖區(qū)在另一個點數(shù)據(jù)集中搜索在緩沖區(qū)內(nèi)的候選匹配實體(緩沖區(qū)半徑為距離閾值);若只搜索到一個實體,則將其視為當前實體的匹配實體,如果存在多個候選匹配實體,則根據(jù)式(1)計算相似度,將相似度值最大的候選匹配實體視為當前實體的最佳匹配實體。

        式中,d為候選匹配實體與當前實體之間的距離;r為搜索目標實體緩沖區(qū)半徑;MSa,b為源實體a與目標實體b的屬性相似度;pEa,b為源實體a與目標實體b的環(huán)境相似度;A、β、γ為權(quán)重,可根據(jù)具體情況設(shè)定,但必須滿足A+β+γ=1。

        本文選擇樣本數(shù)據(jù)遵循了以下2個原則:①盡可能選擇點分布均勻的區(qū)域范圍;②選擇范圍內(nèi)的源數(shù)據(jù)與目標數(shù)據(jù)具有較大的重疊度,即源數(shù)據(jù)中的實體幾乎都能在目標數(shù)據(jù)中找到同名實體。

        1)為保證點實體質(zhì)量,利用DuplicateFilter轉(zhuǎn)換器去除重名的點實體,同時利用Tester轉(zhuǎn)換器去除不符合命名規(guī)則要求的點實體。

        2)針對其中一個點數(shù)據(jù)集,利用Bufferer轉(zhuǎn)換器建立緩沖區(qū),利用PointOnAreaOverlayer轉(zhuǎn)換器在另一個點數(shù)據(jù)集緩沖區(qū)內(nèi)搜索候選匹配實體。

        3)通過Tester轉(zhuǎn)換器將初始匹配結(jié)果分離出,接著通過PythonCaller編寫代碼計算它們的屬性相似度,將相似度值最大的候選匹配要素視為當前點實體的最佳匹配要素。

        4)輸出點實體的最終匹配結(jié)果,根據(jù)匹配類型,設(shè)計了“完全匹配”、“屬性不匹配”(空間同一而屬性不匹配)、“高德有”和“國情有”字段,“完全匹配”、“屬性不匹配”通過PythonCaller輸出,“高德有”和“國情有”則通過AttributeCreator輸出。

        3.1 數(shù)據(jù)驗證

        本文通過內(nèi)外業(yè)結(jié)合的核查方式來驗證各類高德數(shù)據(jù)對國情數(shù)據(jù)更新的補充作用,主要是針對匹配結(jié)果中帶“屬性不匹配”、“高德有”字段的不確定要素的核查,采用先內(nèi)后外的順序進行數(shù)據(jù)的驗證。

        街景地圖作為一種全新的地圖服務(wù)方式,目前已經(jīng)廣泛嵌入到各大地圖網(wǎng)站,除了360°高分辨率、高質(zhì)量的實景照片能夠給用戶帶來身臨其境的場景體驗之外,作為一種全新的測繪成果,全景地圖,能夠以所見即所得的方式應(yīng)用于地理空間數(shù)據(jù)采集與更新。本文主要借助智慧江蘇時空云平臺矢量數(shù)據(jù)、百度地圖的街景成果[16]對不確定要素進行內(nèi)業(yè)核查。

        在內(nèi)業(yè)核查驗證基礎(chǔ)上開展外業(yè)核查驗證工作,進行實地資料收集與整理。主要基于清華山維Eps、清華山維EpsField等內(nèi)外業(yè)一體化平臺核查數(shù)據(jù)的位置與名稱。內(nèi)外業(yè)一體化進行地理信息更新一般包含3個步驟:數(shù)據(jù)準備、外業(yè)調(diào)繪以及數(shù)據(jù)處理和整理,主要內(nèi)容如下[17]:

        1)數(shù)據(jù)準備主要包括正射影像和地圖切片的制作,矢量數(shù)據(jù)主要包括專題要素提取和格式轉(zhuǎn)換。

        2)在文件加密的基礎(chǔ)上,將柵格數(shù)據(jù)和矢量數(shù)據(jù)導(dǎo)入與內(nèi)外業(yè)平臺相同的調(diào)繪軟件,進行外業(yè)調(diào)繪。

        3)將外業(yè)調(diào)繪得到的軌跡數(shù)據(jù)、草繪數(shù)據(jù)、矢量數(shù)據(jù)和拍照攝像等數(shù)據(jù)進行處理,最終形成成果數(shù)據(jù)。

        3.2 實驗分析

        以溧陽市為實驗樣區(qū),基于地理國情的行政區(qū)劃和監(jiān)測數(shù)據(jù),獲取高德POI數(shù)據(jù)和國情監(jiān)測數(shù)據(jù)。提取出溧陽城區(qū)學(xué)校、居民小區(qū)、醫(yī)院、村居委會四類城市要素的高德POI數(shù)據(jù)及國情數(shù)據(jù)(圖2),利用多特征組合的點實體匹配技術(shù)進行融合匹配,最后進行內(nèi)外業(yè)驗證,分析結(jié)果如表1所示。

        圖2 實驗數(shù)據(jù)樣例

        表1 點狀要素數(shù)據(jù)融合分析

        分析表1可知,網(wǎng)絡(luò)獲取的POI數(shù)據(jù)對于地理國情監(jiān)測中典型城市點狀要素更新有一定的參考意義,如學(xué)校和小區(qū)數(shù)據(jù)具有較高的利用價值。但由于商業(yè)網(wǎng)絡(luò)電子地圖數(shù)據(jù)更多的是為位置導(dǎo)航做數(shù)據(jù)支撐,所提供的數(shù)據(jù)內(nèi)容與測繪地理信息部門采集的數(shù)據(jù)可能存在較大差異(如村居委會數(shù)據(jù)利用價值較低)。因此,應(yīng)綜合考慮數(shù)據(jù)實用價值,有效篩選對目標任務(wù)有價值的匹配數(shù)據(jù)。

        4 結(jié)語

        本文面向部分典型居民地要素,提出了一種基于網(wǎng)絡(luò)爬取與多特征點實體匹配的點狀要素更新方法,借助FME模板可以快速實現(xiàn)本文設(shè)計的技術(shù)流程,免去了大量代碼的編寫和調(diào)試工作,節(jié)省了時間和人力成本。通過FME模板實現(xiàn)網(wǎng)絡(luò)地圖POI數(shù)據(jù)與地理國情相關(guān)要素的融合,在一定程度上減少了內(nèi)外業(yè)工作量。后期將結(jié)合自然資源調(diào)查監(jiān)測工作中城市要素監(jiān)測需求,進一步提升多源實體匹配融合更新技術(shù)研究深度。

        猜你喜歡
        高德格網(wǎng)國情
        家國情 詩詞魂
        中華詩詞(2020年10期)2020-07-22 05:37:10
        實時電離層格網(wǎng)數(shù)據(jù)精度評估
        江蘇高德液壓機械有限公司
        資源再生(2019年3期)2019-04-29 03:44:34
        江蘇高德液壓機械有限公司
        資源再生(2019年1期)2019-03-04 01:57:02
        推廣生物乙醇汽油:迫切且合乎國情
        能源(2017年11期)2017-12-13 08:12:36
        基于空間信息格網(wǎng)與BP神經(jīng)網(wǎng)絡(luò)的災(zāi)損快速評估系統(tǒng)
        地理國情監(jiān)測知識支持庫初步設(shè)計
        遙感信息(2015年3期)2015-12-13 07:26:50
        高德貿(mào)易有限公司
        西部皮革(2015年22期)2015-02-28 18:15:17
        特定國情教情中的中小學(xué)校自主權(quán)
        平均Helmert空間重力異常格網(wǎng)構(gòu)制方法
        国产精品天堂avav在线| 日本在线观看不卡| 日韩在线精品在线观看| 国产免费一区二区av| 国产女主播一区二区三区在线观看| 国产自拍高清在线观看| 18禁黄久久久aaa片| 成人欧美在线视频| 精品国产亚洲av麻豆尤物| 麻豆三级视频网站在线观看| 麻豆国产精品一区二区三区 | 亚洲国产精品久久久久秋霞小说| 欧美牲交a欧美牲交aⅴ免费真| 亚洲 欧美 国产 日韩 精品| 性做久久久久久久| 日本高清中文字幕二区在线| 久久久大少妇免费高潮特黄| 欧美老妇牲交videos| 妺妺窝人体色www聚色窝| 一级免费毛片| 成人精品免费av不卡在线观看| 亚洲福利视频一区二区三区| 久久精品国产亚洲夜色av网站| 曰批免费视频播放免费直播 | 久久精品人妻无码一区二区三区| 亚洲一本大道无码av天堂| 亚洲伦理一区二区三区| 日本高清一区在线你懂得| 国产无套中出学生姝| 超清精品丝袜国产自在线拍| 久久99精品久久久久久野外| 国模少妇无码一区二区三区| 亚洲乱码中文字幕一线区| 草色噜噜噜av在线观看香蕉| 欧美国产日本高清不卡| 日本人妻少妇精品视频专区| 国产精品三区四区亚洲av| 美女露内裤扒开腿让男人桶无遮挡| 99热久久精里都是精品6| 日本丰满妇人成熟免费中文字幕| 国产亚洲亚洲精品视频|