亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于測繪地理信息技術的山洪質災害信息動態(tài)提取方法研究

        2020-03-01 00:56:17陳濟才李國明
        西部資源 2020年6期
        關鍵詞:萬維網(wǎng)

        陳濟才 李國明

        摘要:隨著網(wǎng)絡技術迅速發(fā)展,海量數(shù)據(jù)分布在萬維網(wǎng)內,如何從數(shù)據(jù)中挖掘到特定的需要的數(shù)據(jù)成為時下研究的熱點。網(wǎng)絡爬蟲是一種按照一定的規(guī)則,自動抓取萬維網(wǎng)信息的程序或者腳本。本文探討使用網(wǎng)絡爬蟲的概念和方法,開發(fā)基于互聯(lián)網(wǎng)的聚焦網(wǎng)絡爬蟲軟件,迅速通過互聯(lián)網(wǎng)搜索山洪災害點相關及時的第一手資料,形成對災害的第一認識。再經過人工判讀,精確動態(tài)提取、更新山洪災害信息專題成果。

        關鍵詞:萬維網(wǎng);聚焦網(wǎng)絡爬蟲;山洪災害;動態(tài)提取

        1.引言

        隨著網(wǎng)絡的迅速發(fā)展,萬維網(wǎng)成為大量信息的載體。網(wǎng)絡信息更新及時,傳遞速度快,只要信息收集者及時發(fā)現(xiàn)信息,就可以保證較強的信息時效性。面對海量數(shù)據(jù),如何有效地提取并利用這些信息成為一個巨大的挑戰(zhàn)。定向抓取相關網(wǎng)頁資源的聚焦爬蟲可提取特定的需要的信息。

        網(wǎng)絡爬蟲(又被稱為網(wǎng)絡機器人,網(wǎng)頁蜘蛛),是一種按照一定的規(guī)則,自動地抓取萬維網(wǎng)信息的程序或者腳本。聚焦爬蟲是一個自動下載網(wǎng)頁的程序,它根據(jù)既定的抓取目標,有選擇的訪問萬維網(wǎng)上的網(wǎng)頁與相關的鏈接,獲取所需要的信息。與通用爬蟲(general purpose web crawler)不同,聚焦爬蟲并不追求大的覆蓋,而將目標定為抓取與某一特定主題內容相關的網(wǎng)頁,為面向主題的用戶查詢準備數(shù)據(jù)資源。

        物聯(lián)網(wǎng)蘊含了大量的動態(tài)災害信息,是及時獲取目標區(qū)域災害點信息的重要途徑。傳統(tǒng)搜索引擎技術缺乏基于空間語義的認知和推理能力,無法識別災害發(fā)生的空間位置信息,無法提供基于互聯(lián)網(wǎng)的區(qū)域化災害動態(tài)監(jiān)控服務。本文基于聚焦網(wǎng)絡爬蟲有效收集網(wǎng)絡上的災害信息,精準過濾反映災害信息內容的網(wǎng)頁,獲取災害事件的時間、空間位置以及災害點信息。依托該系統(tǒng),可結合傳統(tǒng)的人工判讀技術,依據(jù)地物波譜特性、空間特征和成像機制以及所掌握的地學規(guī)律,通過分析地物影像特征來識別災害點,準確提取、更新災害信息專題數(shù)據(jù),及時發(fā)布,輔助決策者參考使用。

        2.聚焦網(wǎng)絡爬蟲概述

        聚焦網(wǎng)絡爬蟲可以在較短的時間里,使用較少的硬件資源,獲取到更多與主題相關的信息。

        相對于通用網(wǎng)絡爬蟲,聚焦爬蟲的工作原理較為復雜,根據(jù)一定的網(wǎng)頁分析算法過濾掉主題無關的鏈接,保留有用的鏈接并將其放入等待抓取的URL隊列。然后,它將根據(jù)一定的搜索策略從隊列中選擇下一步要抓取的網(wǎng)頁URL,并重復上述過程,直到達到系統(tǒng)的某一條件時停止。

        本文網(wǎng)絡爬蟲引擎采用聚焦網(wǎng)絡爬蟲(Focused Crawler),又稱主題網(wǎng)絡爬蟲(Topical Crawler),是指選擇性地爬行那些與預先定義好的主題相關頁面的網(wǎng)絡爬蟲。和通用網(wǎng)絡爬蟲相比,聚焦爬蟲只需要爬行與主題相關的頁面,極大地節(jié)省了硬件和網(wǎng)絡資源,保存的頁面也由于數(shù)量少而更新快,還可以很好地滿足一些特定人群對特定領域信息的需求。

        聚焦網(wǎng)絡爬蟲和通用網(wǎng)絡爬蟲相比,增加了鏈接評價模塊以及內容評價模塊。聚焦爬蟲爬行策略實現(xiàn)的關鍵是評價頁面內容和鏈接的重要性,不同的方法計算出的重要性不同,由此導致鏈接的訪問順序也不同。

        3.山洪災害信息

        山洪是指山區(qū)溪溝中發(fā)生的暴漲洪水。山洪具有突發(fā)性,水量集中流速大、沖刷破壞力強,水流中挾帶泥沙甚至石塊等,常造成局部性洪災,一般分為暴雨山洪、融雪山洪、冰川山洪等。山洪災害常伴有山體崩塌、山體滑坡、泥石流等。山洪災害信息是救災工作的重要決策依據(jù),直接關系到自然災害應急處置、救援救助等救災工作的有效開展。

        4.基于聚焦網(wǎng)絡爬蟲的災害信息動態(tài)提取方法研究

        開發(fā)基于互聯(lián)網(wǎng)的網(wǎng)絡爬蟲軟件,能迅速通過互聯(lián)網(wǎng)搜索災害點相關及時的第一手資料,形成對災害的第一認識。通過已開發(fā)的網(wǎng)絡爬蟲軟件,能將所有與某一主題相關的所有信息羅列并進行綜合分析篩選。

        通過借鑒國內外語義相似度在信息檢索方面的研究成果,開發(fā)基于互聯(lián)網(wǎng)的網(wǎng)絡爬蟲軟件,從各類信息數(shù)據(jù)庫中巨大的新聞事件類文本數(shù)據(jù)中及時發(fā)現(xiàn)并提取災害專題新聞報道信息。結合高分遙感影像數(shù)據(jù)、基礎地理信息矢量數(shù)據(jù),輔以人工判讀,以確定各災害專題信息發(fā)生的空間們位置信息,輸出災害信息動態(tài)提取成果專題圖,為災害信息動態(tài)更新提供服務。具體的技術路線參見下圖。

        (1)專題數(shù)據(jù)管理子系統(tǒng)

        負責災害信息描述數(shù)據(jù)(如泥石流、山洪、暴雨、地震等)、政府網(wǎng)站數(shù)據(jù)(網(wǎng)絡爬蟲目標網(wǎng)站)、語義規(guī)則庫(災害專題信息檢索模型的研究成果)的維護和更新。

        (2)信息檢索

        利用網(wǎng)絡爬蟲工具,從政府網(wǎng)站中抓取相關網(wǎng)頁并收集到本地,經過加工處理建立本地網(wǎng)頁快照庫,對本地網(wǎng)頁快照庫進行分析、整理,針對災害信息描述關鍵詞建立一種利于快速查找的數(shù)據(jù)結構即索引,并建立索引數(shù)據(jù)庫,以便在抓取到的網(wǎng)頁中進行快速深入的災害信息提取。

        (3)信息提取

        網(wǎng)頁信息數(shù)據(jù)庫中存儲的是HTML格式的文檔,這類文檔通常含有很多與網(wǎng)頁主題信息不相關的內容,比如導航條、廣告信息、版權信息等內容,它們只適合使用網(wǎng)頁瀏覽器進行瀏覽,而不宜作為數(shù)據(jù)交換方式由計算機處理。因此,需要開發(fā)網(wǎng)頁主題信息提取工具,從HTML這類非結構化的文檔中提取出主題信息,輸出并保存為結構化的文本,以便于對其進行下一步的分析處理。

        (4)信息過濾

        通過網(wǎng)頁主題信息提取后獲取的結構化文本數(shù)量多、數(shù)據(jù)冗余度高、不包含有效災害信息描述的文本比重高,需要采用正向過濾(文本中必須包含的關鍵詞組合)、反向過濾(文本中不能包含的關鍵詞組合)等技術手段盡可能刪除那些不包含有效災害信息的文本。最后,根據(jù)災害專題信息檢索模型,從剩下的文本中檢索并提取出有效的災害信息描述內容。

        (5)人工判讀

        通過軟件自動提取到的災害信息屬性并不精確,需要后期進行人工輔助判讀,結合高分影像,確定災害發(fā)生的具體位置、進一步明確災害屬性信息,同時剔除通過程序獲取到的重復信息。人工判讀確認的災害信息主要包括空間信息及屬性信息??臻g信息包括災害發(fā)生的位置信息及災害發(fā)生的幾何類型;屬性信息包括災害分類、災害發(fā)生時間信息、災害發(fā)生的區(qū)域、災害發(fā)生的文字描述等信息。

        (6)成果輸出及發(fā)布

        經過人工判讀后的災情信息是比較準確的,可直接用于更新災害專題信息數(shù)據(jù)庫。結合其他影像、矢量等數(shù)據(jù)發(fā)布災情信息動態(tài)提取成果專題,將山洪災害信息及時發(fā)布并打印輸出。

        同時提供網(wǎng)絡調用的服務接口,能通過設置地名關鍵詞、災害類型、發(fā)生時間范圍、行政區(qū)域或坐標范圍等篩選條件,可以將某一個位置周圍的歷史災害相關信息全部羅列出來供決策者輔助參考。

        5.結語

        在山洪災害信息提取中,基于聚焦網(wǎng)絡爬蟲方法對物聯(lián)網(wǎng)中海量數(shù)據(jù)信息利用程度較高,能夠綜合考慮災害事件的時間、空間位置以及災害點信息,快速獲取第一手資料數(shù)據(jù),再結合人工判讀,即可精確動態(tài)提取、更新山洪災害專題成果。也可以采集往年信息,建立預報模型,預測未來災害發(fā)生區(qū)域,災害種類等,可為決策者提供預防。本文基于聚焦網(wǎng)絡爬蟲,通過動態(tài)提取災害信息,結合人工判讀,研究了山洪災害信息的提取、更新方法,可為決策者提供輔助依據(jù)。本文關于采集往年信息,建立模型,預測未來災害發(fā)生區(qū)域、災害種類,未作進一步研究,希望拋磚引玉,引發(fā)一些思考。

        參考文獻:

        [1]袁文,袁武,張海冬.基于互聯(lián)網(wǎng)的區(qū)域性災害空間信息動態(tài)監(jiān)測技術[C].國家綜合防災減災與可持續(xù)發(fā)展論壇, 2010:200-207.

        [2]程向榮.分析測繪技術在地質災害中的作用[J].西部資源, 2018(01):123-124.

        [3]YADAV P,KALRA M M,YADAC K P.Enhancing the performance of web focused crawler using ontology [J].International Journal of Computers & Technology, 2013:4(2):477-482.

        [4]RUNGSAWANG A,ANGKAWATTANAWIT N.Learnable topic specific web crawler[J].Journal of Network and Computer Applications,2005(28):97-114.

        [5]MENEZER F.Complementing search engines with online web agents [J]. Decision Support Systems Archive, 2003, 35:195-212.

        [6]孫立偉,何國輝,吳禮發(fā).網(wǎng)絡爬蟲技術的研究:電腦知識與技術, 2010.

        [7]張玉東,郭俊鋒,王林生.測繪技術在地質災害中的作用[J].科技與企業(yè), 2012(20):251+253.

        [8]尹訓志,王俊亮,張杰.測繪技術在地質災害中的作用探究[J].大科技, 2018, 000(030):221-222.

        猜你喜歡
        萬維網(wǎng)
        基于萬維網(wǎng)大數(shù)據(jù)的農藥場地土壤污染快速預測方法研究*
        土壤學報(2022年3期)2022-08-27 08:41:48
        “開放共享,合作共贏”是推動互聯(lián)網(wǎng)不斷發(fā)展的精神力量
        共享比獨占更重要
        5 Fast Facts About the World Wide Web on Its 30th Birthday萬維網(wǎng)30年:小知識一覽
        英語世界(2019年7期)2019-09-10 07:22:44
        萬維網(wǎng)30歲,創(chuàng)始人發(fā)公開信表達“不滿意”
        簡單HTTP Server的設計與實現(xiàn)
        軟件工程(2017年1期)2017-03-22 12:39:23
        WWW是什么意思
        萬維網(wǎng)的HTTP和FTP協(xié)議
        藝術科技(2016年6期)2016-05-14 10:42:28
        WWW:通往世界的窗口
        CHIP新電腦(2015年2期)2015-12-22 17:54:09
        淺議互聯(lián)網(wǎng)網(wǎng)格技術
        美女视频黄a视频全免费网站色 | 亚洲av综合av一区| 永久黄网站色视频免费看| 四虎影视一区二区精品| 2021最新久久久视精品爱| 精品亚洲一区二区三区在线播放| 77777_亚洲午夜久久多人| 国产成人亚洲精品无码mp4| 98精品国产综合久久| 中文字幕亚洲精品综合| 国产亚洲欧美精品永久| 亚洲av国产精品色午夜洪2| 日韩精品欧美激情亚洲综合| 在线观看视频国产一区二区三区| 国产日产精品_国产精品毛片| 无套内射蜜桃小视频| аⅴ天堂一区视频在线观看| 亚洲综合中文日韩字幕| 一色桃子中文字幕人妻熟女作品 | 抖射在线免费观看视频网站| 男女啪啪视频高清视频| 人人妻人人澡人人爽欧美精品| 国产精品偷伦视频免费手机播放| 日韩亚洲午夜精品一区二区三区 | 污污污污污污WWW网站免费| 在线视频一区二区在线观看| 中文字幕一区二区人妻秘书| 亚洲人成未满十八禁网站| 亚洲 无码 制服 丝袜 自拍| 亚洲国产一区二区,毛片| 2021最新久久久视精品爱| 丰满又紧又爽又丰满视频| 精品久久久久香蕉网| 无码专区中文字幕DVD| 成人免费播放片高清在线观看| 久久精品国产久精国产爱| 中文字幕日本最新乱码视频| 国产高清天干天天视频| 亚洲中文字幕久久在线| 国产精品综合一区二区三区| 免费一区二区三区视频狠狠|