亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于微博位置簽到數據的POI更新方法

        2013-01-27 05:54:10曹勁舟武紅宇
        地理空間信息 2013年2期
        關鍵詞:內點預處理次數

        曹勁舟,武紅宇

        (1.武漢大學 遙感信息工程學院,湖北 武漢 430079)

        基于微博位置簽到數據的POI更新方法

        曹勁舟1,武紅宇1

        (1.武漢大學 遙感信息工程學院,湖北 武漢 430079)

        POI的現(xiàn)勢性對于位置服務至關重要,但傳統(tǒng)人工實地調查效率低,現(xiàn)勢性無法滿足需求。以當前用戶參與數眾多的微博社交網絡為數據平臺,提出了一種基于微博位置簽到數據的POI更新方法。首先,對微博位置簽到數據進行預處理,剔除語義與空間位置不一致的噪聲點,在此基礎上提出一種基于RANSAC算法的位置簽到數據集地理配準方法,實現(xiàn)位置簽到數據與已有地理數據庫的可靠配準;然后,將位置簽到數據集與已有POI數據庫進行空間分析與匹配建模,對匹配不成功的位置簽到數據進行有效性驗證,提取有效新增數據入庫用以更新POI;最后,以武漢市的街旁網位置簽到數據進行POI更新實驗,能夠有效地發(fā)現(xiàn)新增POI和消失POI,為POI快速高效更新提供了全新的方式。

        POI;微博;位置簽到數據;更新

        隨著Web2.0技術的日益成熟和普及,LBS(location based service)成為當下發(fā)展最為迅猛的科技應用之一[1]。隨著LBS的快速發(fā)展,其對位置信息時效性的要求也越來越高。POI(point of interest)作為當前位置信息的重要載體,其實時性、數據來源的可靠性和廣泛性直接影響LBS業(yè)務的發(fā)展。傳統(tǒng)POI更新主要采用人工現(xiàn)場采集再入庫的方法[2],不僅費時費力、效率低下,其現(xiàn)勢性也無法滿足位置服務應用的整體需求。依靠互聯(lián)網信息的語義理解成為POI抓取和解析的一個新的研究方向[3],但由于網絡信息的復雜性以及地理信息以描述性的文字存儲,因此難以進行批量化、規(guī)范化的提??;利用電信企業(yè)庫中客戶信息資源和地址庫中空間信息資源,通過地址匹配技術實現(xiàn)POI的自動匹配更新雖已有一定的成果,但是沒有提出更大眾化的方法,仍然無法解決POI的快速更新難題[4]。

        微博位置簽到數據由用戶通過帶有GPS定位的移動智能終端上傳,具有數據量大、現(xiàn)勢性高、帶有社會化屬性等特點,是實現(xiàn)POI高效高質更新的一種潛在可用數據源。本文以當前用戶參與數眾多的微博社交網絡為數據平臺,提出了一種基于微博位置簽到數據的POI更新方法。

        1 POI數據更新技術框架

        微博位置簽到數據涵蓋了更新POI所必需的全部信息,可以實現(xiàn)POI的快速、準確更新,其技術流程圖如圖1所示。

        圖1 POI更新流程圖

        以微博位置簽到數據作為數據源,必須先對其進行預處理,剔除語義與空間位置不一致的噪聲點;再將位置簽到數據和已有POI數據庫進行空間分析和匹配建模,匹配不成功的即是POI原有庫中所不具備的數據,可以作為潛在的POI更新數據源,通過對其進行有效性驗證,提取有效新增數據入庫用以更新POI。

        2 數據預處理與地理配準

        微博位置簽到數據是大眾自愿上傳的,存在精度不高、數據冗余和格式不正確等[5,6]。所以,必須先對數據進行預處理,剔除一些沒有意義、關注人數很少或者信息缺失的點,合并大量重復的點,通過與已有POI數據集配準以提高數據精度,降低數據冗余度,滿足POI更新的要求。

        2.1 數據預處理

        微博位置簽到數據預處理主要包括以下內容:

        1)設置簽到次數和人數的閾值,以篩選剔除如表1第1條這樣一些沒有意義或者簽到次數很少、關注度低的數據。

        2)檢查數據的屬性信息是否齊全。對于缺失的信息,需建立一個標準格式對需要保留的數據按照標準格式進行修改。表1中第2條數據名稱屬性指示不全,全稱應為“武漢長江大橋”。

        3)對于大量的重復簽到數據進行合并處理。該操作可以利用POI數據字典與微博位置簽到數據進行比對,將對應于同一地理目標的不同別名、俗稱與標準名稱進行合并[7,8],如表1中第3~5條數據便是這種情況。

        (2)對我國現(xiàn)行糧食政策和管理產生影響。一是完成糧食增產目標的難度進一步加大。我國在“十三五”期間制定的糧食核心區(qū)增長目標是到2020年新增糧食產能1000億斤。在制定該規(guī)劃目標時,糧食統(tǒng)計口徑包括了谷物、薯類和豆類。如果統(tǒng)計口徑調整后,特別是對于方案一而言,糧食增產的任務全部落到了谷物上,而2015年以來,全國谷物總產量一直處于下降趨勢,要完成增長目標的難度較大。

        表1 微博位置簽到數據預處理統(tǒng)計表

        2.2 數據的地理配準

        由于移動智能終端的定位存在一定的誤差,導致微博位置簽到數據與已有POI數據集在空間上存在一定的偏移,因此要先將微博位置簽到數據進行地理配準。本文采用RANSAC算法對位置簽到數據和對應POI數據的仿射變換關系進行估算。RANSAC算法通過對數據集重復取樣來獲得基本子集,利用基本子集估算模型[9]。它根據一個容許誤差將匹配點對分為內點和外點,利用內點數據進行參數估計[10]。進行數據擬合需限定可以確定模型所需的最小數據集合。本文采用仿射變換模型,求解6個參數至少需要4個點對:

        1)從點對集S中隨機選取4個點對樣本,利用間接平差初始化仿射變換模型構建8個方程求解6個未知參數,并得到擬合的精度誤差。初始化模型設為最優(yōu)模型,初始誤差設為最小誤差。

        2)設置迭代次數閾值N,最少內點數閾值Z。從數據集中繼續(xù)隨機取出點對樣本,如果內點條件閾值diserror小于預設閾值,則認為該點對屬于內點集Si;若Si的大小超過了閾值Z,則用Si重新估計模型參數。如果得到的新擬合誤差小于最小誤差,則把當前內點集Si設為最優(yōu)內點集,由它估計的模型為最優(yōu)模型。

        3)在經過N次迭代后,由最優(yōu)的內點集Si估算得到的即為最優(yōu)模型,輸出模型參數[11]。

        3 數據匹配建模與POI更新

        為了確定可用于更新POI的潛在數據集,需要將微博位置簽到數據與現(xiàn)有POI數據庫進行匹配,將匹配成功的微博簽到數據剔除掉,匹配失敗的數據即可作為潛在的可用于POI數據更新的數據集。

        3.1 匹配建模

        位置簽到數據匹配建模包括空間匹配與屬性匹配。屬性匹配建立在空間幾何匹配的基礎上。

        1)空間匹配。通過空間分析確定每一個微博位置簽到數據與已有POI數據庫的空間匹配關系。以微博位置簽到數據為中心,通過設定一定的距離建立緩沖區(qū),將緩沖區(qū)與現(xiàn)有的POI數據進行疊置分析,同時關聯(lián)相應屬性表??紤]到可能存在多個微博位置簽到數據對應同一POI數據點,使得緩沖區(qū)間有重合,此時不應將緩沖區(qū)合并。

        2)屬性匹配。將微博位置簽到數據與緩沖區(qū)里面已有的POI數據集的屬性信息進行匹配,主要是指要素名稱的匹配。字符串的匹配是一種有效的方法,其思路是將待匹配的名稱和標準名稱均視為字符串,檢查待匹配字符串中的字符是否在對應的標準字符串中出現(xiàn),出現(xiàn)的視為有效字符,未出現(xiàn)的視為無效字符,以有效字符與無效字符數量的比值和規(guī)定的閾值比較確定是否匹配成功。具體步驟如下:

        ②設定匹配閾值λ,與PS2S1相比較來判斷二者是否匹配。如果滿足式(4),則表示符合匹配條件:

        ③將微博位置簽到數據與其對應的POI數據集都進行匹配后,將符合式(3)的中的最大值所對應的POI數據作為該微博位置簽到數據的匹配POI點;反之,則視為該微博位置簽到數據匹配失敗。

        3.2 有效性驗證與POI更新

        為了保證POI入庫數據的精度,必須對潛在POI數據進行有效性驗證。POI更新主要基于2種原因:①原POI數據庫中沒有包含該地理目標,但該目標已經具備加入POI的條件,此時只需直接將位置簽到數據入庫存儲;②POI所對應的地理目標位置發(fā)生改變,此時需通過對位置簽到數據的簽到次數、簽到人數、時間標簽等信息進行統(tǒng)計分析以確定需要更改或刪除POI。通過對簽到次數與簽到人數的比進行驗證,分析簽到次數的聚集程度,從而選擇符合要求的簽到數據作為合格的POI進行更新。

        本文使用式(5)作為判定條件:

        式中,λtt12是新時序t2與舊時序t1之間的簽到次數增長率;Ct2與Ct1分別是新舊時刻的簽到次數;|t2?t1|是時間跨度;ρ是簽到次數與人數的比值;C是簽到次數;U是簽到人數;T與T'是預設的閾值。

        POI對應的地理目標位置發(fā)生改變后,利用舊地理目標位置進行簽到的會逐漸減少,而利用新地理目標位置進行簽到的會逐漸增多。通過對一定時間跨度的簽到數據進行增長率的統(tǒng)計,即可以判斷原POI是否需要刪除以及新POI是否需要增加。

        4 實驗分析

        本實驗使用的數據街旁網2011年9月和10月2個時序的位置簽到數據集,覆蓋范圍包括整個武漢地區(qū)。數據的屬性信息主要包括名稱、簽到次數、簽到用戶數量、唯一標示符、城市名以及經緯度等。已有POI數據庫為2011年版四維圖新導航數據,其屬性信息包括名稱、字大以及類型編碼等。

        4.1 配準精度

        實驗采用微博位置簽到數據與已有POI數據名稱屬性完全匹配的188條數據進行精度分析。在迭代次數設為20,判斷內點條件閾值設為0.003,最少內點數閾值設為100的情況下,提取出有效內點集120條。對這120條數據按最優(yōu)仿射變換模型進行變換,對變換前后的匹配點與對應POI的距離偏差進行統(tǒng)計,配準后的距離偏差整體比配準前要小,配準后的偏差均值和標準差(見表2)也明顯減小,說明地理配準使位置簽到數據的精度得到顯著提高,如圖2所示。

        圖2 配準前后簽到數據與對應POI距離偏差統(tǒng)計

        表2 配準前后簽到數據與對應POI的距離偏差均值和標準差/m

        4.2 結果分析

        本實驗按照式(4)利用新時序2011年10月的簽到數據計算潛在更新POI的平均簽到增長率以及簽到聚集程度。閾值設定為簽到增長率0.3次/天,簽到聚集度10次/人。最后,統(tǒng)計出1 424條潛在更新POI可以入庫,更新率為31.1%。

        新增POI空間分布和類型統(tǒng)計表可以體現(xiàn)不同區(qū)域、不同類別的發(fā)展狀況[13]。由表3可以看出,餐飲行業(yè)因其流動性較大,地理位置容易發(fā)生變化,所以新增比例高;而政府機關不會經常變化其地理位置,所以新增比例低。

        表3 新增POI類型分布統(tǒng)計表

        圖3 新增POI空間分布圖

        由圖3可知,武漢地區(qū)新增POI集中于江岸區(qū)、光谷、武昌火車站以及長江大橋周邊等人流量大的繁華區(qū)域。圖4表示消失POI的空間分布,從圖中可以看出消失的POI數量相對較少,所占比例極低。

        圖4 消失POI空間分布圖

        5 結 語

        傳統(tǒng)的POI獲取方式效率低,現(xiàn)勢性已無法滿足LBS的應用需求。本文提出一種利用微博位置簽到數據作為數據源進行POI更新的方法,通過對來自大眾自發(fā)上傳的、帶有位置信息的簽到數據的預處理和地理配準,并與已有的POI數據庫進行匹配分析,能夠快速發(fā)現(xiàn)新增POI,找出已有數據庫中已經消失的POI。通過對來自街旁網微博位置簽到數據集的POI更新實驗,結果表明,基于微博位置簽到數據的POI更新技術流程合理可行,微博位置簽到數據內容類型豐富,屬性信息完整,在對定位偏差進行改正后精度基本達到要求,進行POI更新具有較高的可行性,具有廣泛的應用前景。

        [1] 梁力予,任露凌,萬艷華.“基于LBS的社交網絡”在城市公共空間管理與運營中的應用[J].信息安全與技術,2011(7):56-59

        [2] 韓向春,呂艷霞.基于Wiki技術的Web GIS數據更新[J].計算機工程,2008,34(11):283-285

        [3] Zhang H. Structed POI Data Extraction from Internet News [C].Beijing, 2010

        [4] 戴冬冬.基于地址匹配方法的POI數據更新研究[J].電腦知識與技術,2010,6(1):1-2

        [5] Goodchild M F. Citizens as Sensors: the World of Volunteered Geography [J]. Geo Journal,2007(4): 211-221

        [6] Goodchild M F, Glennon J A. Crowdsourcing Geographic Information for Disaster Response: A Research Frontier[J].International Journal of Digital Earth,2010, 3(3): 231-241

        [7] 毋一舟,賴俊陶,吳煜暉.基于LBS簽到數據更新POI的數據預處理研究[J].計算機與數字工程,2010,40(8):87-88

        [8] 杜萍,劉勇.基于本體的中文地名識別[J].西北師范大學學報:自然科學版,2011,47(6):87-93

        [9] 單欣,王耀明,董建萍.基于RANSAC算法的基本矩陣估計的匹配方法[J].上海電機學院學報,2006,9(4):66-69

        [10] 周劍軍,歐陽寧,張彤,等.基于RANSAC的圖像拼接方法[J].計算機工程與設計,2009,30(24):5 692-5 694

        [11] 曲天偉,安波,陳桂蘭.改進的RANSAC算法在圖像配準中的應用[J].計算機應用,2010,30(7):1 849-1 851

        [12] 李玉森,張雪英,袁正午.面向GIS的地理命名實體識別研究[J].重慶郵電大學學報:自然科學版,2008,20(6):719-724

        [13] 趙衛(wèi)鋒,李清泉,李必軍.利用城市POI數據提取分層地標[J].遙感學報,2011,15(5):973-988

        [14] 王文韜,謝陽群.LBS與社交網絡聯(lián)合應用的新模式研究[J].中國市場,2011(36):85-86

        [15] 周春輝,朱欣焰,蘇科華,等.基于LBS的興趣點查詢與更新機制研究[J].微計算機信息,2009,25(7):143-145

        Update Approach of POIs Based on Weibo Position Check-in Data

        byCAO Jinzhou

        The latest tendency of POI is critical for location-based services. The traditional POIs collecting based on on-the-spot investigation is inefficient. However, the fact is that it is unable to meet the demands of the location-based service applications. In this paper, a POIs update approach based on Weibo that involved the largest number users was proposed. Firstly, by preprocessing Weibo check-in data, coarse error points that were semantically and spatially inconsistent were removed, on the basis of which, a geo-referencing method based on Weibo check-in data in RANSAC algorithm was proposed for the purpose of fulfilling reliability of Weibo position checkin data with existing geo-database. Secondly, spatial analysis and matching modeling of check-in data set and the existing POIs database was implemented. After validation of unmatched data, extraction of valid new data as an updated POI into database was implemented.Finally, a POIs update experiment of Wuhan Jiepang position checkin data was implemented with the proposed approach. The experiment results show that the proposed approach can meet the requirements and effectively find new POIs and disappeared POIs. It provides a new way to update POIs quickly and efficiently and has a good prospect of application.

        POI,Weibo,position check-in data,update

        P208

        B

        1672-4623(2013)02-0015-04

        10.11709/j.issn.1672-4623.2013.02.004

        2012-12-17。

        項目來源:國家自然科學基金資助項目(61172175)。

        曹勁舟,主要從事3S集成與應用研究。

        猜你喜歡
        內點預處理次數
        機場航站樓年雷擊次數計算
        2020年,我國汽車召回次數同比減少10.8%,召回數量同比增長3.9%
        商用汽車(2021年4期)2021-10-13 07:16:02
        一類無界算子的二次數值域和譜
        基于預處理MUSIC算法的分布式陣列DOA估計
        制導與引信(2017年3期)2017-11-02 05:16:56
        基于罰函數內點法的泄露積分型回聲狀態(tài)網的參數優(yōu)化
        自動化學報(2017年7期)2017-04-18 13:41:04
        依據“次數”求概率
        淺談PLC在預處理生產線自動化改造中的應用
        基于內點方法的DSD算法與列生成算法
        絡合萃取法預處理H酸廢水
        基于自適應預處理的改進CPF-GMRES算法
        日韩美女高潮流白浆视频在线观看| 一二三四日本中文在线| 人妻献身系列第54部| 免费av在线国模| 国产精品99久久精品女同| 亚洲久悠悠色悠在线播放| 国产在线观看无码免费视频| 无码人妻一区二区三区在线视频| 天堂网av在线| 免费看黄片的视频在线观看| 精品国产性色无码av网站| 少妇人妻偷人精品无码视频| 亚洲黄片高清在线观看| 亚洲中文字幕精品视频| 蜜桃日本免费看mv免费版| 亚洲天堂99| 熟女少妇丰满一区二区| 最新国产不卡在线视频| 色偷偷噜噜噜亚洲男人| 亚洲精品一二区| 亚洲二区精品婷婷久久精品| 色综合天天综合网国产成人网 | 久久精品蜜桃亚洲av高清| 久热国产vs视频在线观看| 天天爽夜夜爽人人爽曰喷水| 国产精东一区二区三区| 亚洲夫妻性生活免费视频| 无码精品人妻一区二区三区影院| 日韩人妻无码精品久久伊人| 中文字幕一区二区三区在线不卡 | 欧美金发尤物大战黑人| 免费看奶头视频的网站| 亚洲一区二区三区毛片| 亚洲中文字幕无码爆乳app| 国产99久久亚洲综合精品| AV无码专区亚洲AVL在线观看 | 久久成人影院精品777| 夜夜综合网| 日韩精品一区二区三区视频| 亚洲男人的天堂av一区| 欧美成人猛交69|