趙亮 俞海洋 李嬌 魏軍
摘 要:該文通過對傳統(tǒng)氣象災(zāi)害上報收集方法進行總結(jié)分析,發(fā)現(xiàn)傳統(tǒng)方法收集到的氣象災(zāi)害信息數(shù)據(jù)來源渠道多,數(shù)據(jù)存儲格式、標(biāo)準(zhǔn)不一致,數(shù)據(jù)應(yīng)用不規(guī)范,更新不及時,難以滿足實時氣象災(zāi)害風(fēng)險預(yù)警服務(wù)需求。因此,該文針對上述問題,提出一種基于網(wǎng)絡(luò)輿情監(jiān)測技術(shù)的氣象災(zāi)害信息收集方法,該方法可進一步提高氣象災(zāi)害風(fēng)險預(yù)警與評估的時效性和準(zhǔn)確性。
關(guān)鍵詞:互聯(lián)網(wǎng)時代 氣象災(zāi)害 信息收集與處理
中圖分類號:TP399 文獻標(biāo)識碼:A 文章編號:1672-3791(2017)07(a)-0004-02
我國是氣象災(zāi)害多發(fā)國家,每年汛期又是氣象災(zāi)害的多發(fā)期,遭遇的氣象災(zāi)害主要有暴雨、冰雹、大風(fēng)、高溫、臺風(fēng)、雷電等。在全球氣候持續(xù)變暖的大背景下,各類極端天氣氣候事件更加頻繁,氣象災(zāi)害造成的損失和影響不斷加重,因此,做好氣象災(zāi)害風(fēng)險預(yù)警與評估工作對于最大限度減少災(zāi)害造成的損失、保障經(jīng)濟社會發(fā)展和人民安全福祉具有至關(guān)重要的意義。
目前,氣象部門氣象災(zāi)害數(shù)據(jù)主要來自災(zāi)情直報、災(zāi)情普查、暴雨洪澇災(zāi)害風(fēng)險普查、民政部災(zāi)情、公路交通專業(yè)氣象災(zāi)害風(fēng)險普查等。由于氣象觀測站點建設(shè)相對稀疏和人力資源的限制,無法全面、及時地上報災(zāi)情信息,從而造成氣象災(zāi)害風(fēng)險預(yù)警與評估的實時性差、準(zhǔn)確性低。
隨著互聯(lián)網(wǎng)的不斷壯大,網(wǎng)絡(luò)已經(jīng)成為各類資源數(shù)據(jù)的重要來源。但是,網(wǎng)絡(luò)數(shù)據(jù)的龐大也曾讓人們望而卻步。隨著網(wǎng)絡(luò)技術(shù)的不斷提高,現(xiàn)如今利用網(wǎng)絡(luò)輿情監(jiān)測、云計算和大數(shù)據(jù)等技術(shù),可實現(xiàn)全天24 h不間斷監(jiān)測網(wǎng)絡(luò)信息,并快速發(fā)現(xiàn)網(wǎng)絡(luò)中的氣象災(zāi)情信息,大大提高災(zāi)情獲取的時效性,拓展了災(zāi)情收集渠道,及時獲取第一手資料??蛇M一步提高氣象災(zāi)害風(fēng)險預(yù)警與評估的實時性和準(zhǔn)確性。
1 基于網(wǎng)絡(luò)輿情監(jiān)測技術(shù)的氣象災(zāi)害信息收集方法
1.1 網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)
隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)媒體作為一種新的信息傳播形式,已深入人們的日常生活。網(wǎng)友言論活躍已達到前所未有的程度,不論是國內(nèi)還是國際重大事件,都能馬上形成網(wǎng)上輿論,通過這種網(wǎng)絡(luò)來表達觀點、傳播思想,進而產(chǎn)生巨大的輿論壓力,達到任何部門、機構(gòu)都無法忽視的地步??梢哉f,互聯(lián)網(wǎng)已成為思想文化信息的集散地和社會輿論的放大器。
“網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)”是針對在一定的社會空間內(nèi),圍繞中介性社會事件的發(fā)生、發(fā)展和變化,民眾對社會管理者產(chǎn)生和持有的社會政治態(tài)度于網(wǎng)絡(luò)上表達出來意愿集合而進行的計算機監(jiān)測的系統(tǒng)統(tǒng)稱。
輿情監(jiān)測的主要功能包括以下幾點:
(1)熱點識別能力??梢愿鶕?jù)新聞出處權(quán)威度、評論數(shù)量、發(fā)言時間密集程度等參數(shù),識別出給定時間段內(nèi)的熱門話題。
(2)傾向性分析與統(tǒng)計。對信息的闡述的觀點、主旨進行傾向性分析。以提供參考分析依據(jù)。分析的依據(jù)可根據(jù)信息的轉(zhuǎn)載量、評論的回言信息時間密集度。來判別信息的發(fā)展傾向。
(3)主題跟蹤。主題跟蹤主要是指針對熱點話題進行信息跟蹤,并對其進行傾向性與趁勢分析。跟蹤的具體內(nèi)容包括:信息來源、轉(zhuǎn)載量、轉(zhuǎn)載地址、地域分布、信息發(fā)布者等相關(guān)信息元素。其建立在傾向性與趁勢分析的基礎(chǔ)上。
(4)信息自動摘要功能。能夠根據(jù)文檔內(nèi)容自動抽取文檔摘要信息,這些摘要能夠準(zhǔn)確代表文章內(nèi)容主題和中心思想。用戶無需查看全部文章內(nèi)容,通過該智能摘要即可快速了解文章大意與核心內(nèi)容,提高用戶信息利用效率。而且該智能摘要可以根據(jù)用戶需求調(diào)整不同長度,滿足不同的需求。主要包括文本信息摘要與網(wǎng)頁信息摘要兩個方面。
(5)趨勢分析。通過圖表展示監(jiān)控詞匯和時間的分布關(guān)系以及趨勢分析,包括地域信息分布。以提供階段性的分析。如:信息傳播的區(qū)域分布,轉(zhuǎn)載量與轉(zhuǎn)載網(wǎng)站類型等。
(6)突發(fā)事件分析。突發(fā)事件不外乎有以下幾種:自然災(zāi)害、社會災(zāi)難、戰(zhàn)爭、動亂和偶發(fā)事件等。互聯(lián)網(wǎng)信息監(jiān)控分析系統(tǒng)主要是針對互聯(lián)網(wǎng)信息進行突發(fā)事件監(jiān)聽與分析。對熱點信息的傾向分析與趁勢分析,以監(jiān)聽信息的突發(fā)性。
(7)報警系統(tǒng)。報警系統(tǒng)主要是針對輿情分析引擎系統(tǒng)的熱點信息與突發(fā)事件進行監(jiān)聽分析,然后根據(jù)信息的語料庫與報警監(jiān)控信息庫進行分析。以確保信息的輿論健康發(fā)展。
(8)統(tǒng)計報告。根據(jù)輿情分析引擎處理后的結(jié)果庫生成報告,用戶可通過瀏覽器瀏覽,提供信息檢索功能,根據(jù)指定條件對熱點話題、傾向性進行查詢,并瀏覽信息的具體內(nèi)容,提供決策支持。
(9)預(yù)警。輿情預(yù)警是一種時效性要求很高、重要程度要求很高的精準(zhǔn)網(wǎng)絡(luò)輿情監(jiān)測功能。一個是滿足用戶對一些已經(jīng)發(fā)生的重要網(wǎng)絡(luò)事件的實時監(jiān)測,及時跟蹤事件的發(fā)展態(tài)勢;另一個是滿足用戶相關(guān)行為信息的監(jiān)測和預(yù)警。預(yù)警方式分為三種:在線彈框預(yù)警、手機短信預(yù)警和郵箱預(yù)警。監(jiān)測預(yù)警包括監(jiān)測和預(yù)警兩個過程,當(dāng)系統(tǒng)監(jiān)測到輿情信息后將及時發(fā)出預(yù)警,讓相關(guān)人員第一時間掌握輿情狀況。
1.2 互聯(lián)網(wǎng)中氣象災(zāi)害信息的提取
利用輿情監(jiān)測技術(shù),設(shè)置各類氣象災(zāi)害關(guān)鍵詞,即可完成互聯(lián)網(wǎng)中災(zāi)害信息的提取。該方法應(yīng)具有以下幾個特征
(1)多載體全網(wǎng)監(jiān)測??杀O(jiān)測搜索引擎、新聞門戶、論壇、博客、留言板、微博、微信、QQ群、電子報、SNS載體、各單位主頁。提供通用采集配置,支持大部分新聞、論壇的采集,并可配置指定URL,指定微博、微信賬戶的監(jiān)測。
(2)全天候不間斷監(jiān)測。可定時監(jiān)測,也可24 h全天候監(jiān)測,不放過每一條網(wǎng)絡(luò)災(zāi)情信息,第一時間發(fā)現(xiàn)網(wǎng)絡(luò)氣象災(zāi)情。
(3)信息智能提取技術(shù)。智能提取網(wǎng)頁中有效的災(zāi)情信息,如:發(fā)生時間、地點、影響等。并對具有關(guān)聯(lián)性的多個網(wǎng)頁內(nèi)容進行自動合并、自動提取等。
(4)結(jié)構(gòu)化采集技術(shù)。對非結(jié)構(gòu)化的網(wǎng)頁數(shù)據(jù)采集時進行結(jié)構(gòu)化的信息抽取和數(shù)據(jù)存儲,滿足多維度的信息挖掘和統(tǒng)計需要,形成結(jié)構(gòu)化的災(zāi)情信息記錄。
(5)關(guān)鍵詞管理功能??稍O(shè)置與氣象災(zāi)害相關(guān)的關(guān)鍵詞,如暴雨、大風(fēng)、暴雪等,根據(jù)設(shè)定的關(guān)鍵詞進行監(jiān)控。也可以實現(xiàn)自動提取關(guān)鍵詞功能,根據(jù)搜索到的有效信息,自動關(guān)聯(lián)其他關(guān)鍵詞,進一步豐富氣象災(zāi)害關(guān)鍵詞。
(6)災(zāi)情傳播途徑跟蹤。智能分析網(wǎng)絡(luò)輿情傳播途徑,并通過反向解析技術(shù)解析出URL所對應(yīng)的網(wǎng)站名稱。使整個監(jiān)管平臺能夠有效的實現(xiàn)“發(fā)現(xiàn)傳播源頭、追蹤傳播內(nèi)容、監(jiān)控傳播主體”,可通過該項功能查找氣象災(zāi)害主要傳播媒體。
2 網(wǎng)絡(luò)氣象災(zāi)害信息共享平臺
為了便于網(wǎng)絡(luò)氣象災(zāi)害信息的應(yīng)用,網(wǎng)絡(luò)氣象災(zāi)害數(shù)據(jù)庫設(shè)計的合理性則十分重要。該文中的設(shè)計原則有以下幾種。
(1)基本字段設(shè)置。為了充分利用原有氣象災(zāi)情數(shù)據(jù)庫(如災(zāi)情直報數(shù)據(jù)庫),該文參照《全國氣象災(zāi)情收集上報技術(shù)規(guī)范》設(shè)置數(shù)據(jù)庫字段,其數(shù)據(jù)庫字段屬性與其保持基本一致。
(2)災(zāi)情信息分類。根據(jù)災(zāi)害發(fā)生地點,本文將災(zāi)情信息分為兩種:面狀災(zāi)情和點狀災(zāi)情。所謂面狀災(zāi)情,指的是災(zāi)害發(fā)生地點具體到某個市或者縣,范圍比較粗略;而點狀災(zāi)情,指的是災(zāi)害發(fā)生地點具體到某個村鎮(zhèn)或者某條街道,范圍比較精確。
(3)地理信息。根據(jù)災(zāi)害發(fā)生地點,為每條災(zāi)情信息添加相應(yīng)的經(jīng)緯度信息。
(4)氣象要素信息。根據(jù)不同的災(zāi)害種類,為每條災(zāi)情信息匹配其相對應(yīng)的氣象要素。這樣便于后期氣象災(zāi)情數(shù)據(jù)的高效利用。
將網(wǎng)絡(luò)中搜集的災(zāi)情信息按照上述原則進行入庫,形成災(zāi)情信息共享,供氣象災(zāi)害風(fēng)險預(yù)警與評估業(yè)務(wù)平臺實時訪問。
3 關(guān)鍵技術(shù)
3.1 氣象災(zāi)情關(guān)鍵詞設(shè)置
利用網(wǎng)絡(luò)進行搜索,得到的結(jié)果準(zhǔn)確與否,很大程度上與所設(shè)置的關(guān)鍵詞相關(guān)。設(shè)置的關(guān)鍵詞過多,得到的信息越準(zhǔn)確,但是也有可能丟失過多有用信息;設(shè)置的關(guān)鍵詞過少,得到的冗余信息太多,又加大了篩選工作的難道。如何得到合適的關(guān)鍵詞,成為了該文中的關(guān)鍵技術(shù)。
該文主要是采用人機互動的方式完善關(guān)鍵詞管理功能,前期對人工搜索的災(zāi)害相關(guān)信息,進行整理分析,統(tǒng)計描述災(zāi)情使用詞匯的頻率。將頻率較高的詞匯設(shè)置為初始關(guān)鍵詞;后期系統(tǒng)根據(jù)初始關(guān)鍵詞,查找到相關(guān)信息,自動統(tǒng)計高頻詞匯,進行添加,實現(xiàn)關(guān)鍵詞的逐步完善。
3.2 氣象要素匹配技術(shù)
根據(jù)發(fā)生時間為每條災(zāi)情信息匹配其相關(guān)的氣象信息。通過自動調(diào)取氣象資料庫,包括A文件、Z文件、加密自動站資料、雷達資料和氣象衛(wèi)星云圖等,通過插值、雷達反演等方法獲取災(zāi)情發(fā)生地距離最近、時間最接近的氣象資料,采用自動和人工相結(jié)合的方法給每條災(zāi)情記錄信息添加產(chǎn)生氣象災(zāi)情的氣象要素實況的特征值。
3.3 氣象災(zāi)情數(shù)據(jù)篩選
(1)通過氣象要素實況資料的匹配剔除錯誤、標(biāo)記可疑災(zāi)情信息記錄。將氣象要素的實況資料與逐條災(zāi)情資料信息對比分析,對實況資料與災(zāi)情影響明顯不符的應(yīng)刪除,有疑問的,標(biāo)記為可疑記錄。
(2)從民政、統(tǒng)計、水利、農(nóng)業(yè)、交通運輸?shù)扔嘘P(guān)部門、氣象災(zāi)害大典、報紙和媒體等獲取災(zāi)情及影響數(shù)據(jù)再次實現(xiàn)對氣象災(zāi)情資料的篩選,確保災(zāi)情資料的合法可靠。
4 結(jié)語
氣象災(zāi)害災(zāi)情的快速收集和共享對于開展災(zāi)害性天氣的監(jiān)測、預(yù)報和服務(wù)工作至關(guān)重要?;诰W(wǎng)絡(luò)輿情監(jiān)測技術(shù)的氣象災(zāi)害信息收集方法可以有效解決現(xiàn)有災(zāi)情收集方法上報不及時,覆蓋范圍密度低等缺點??蓪崿F(xiàn)災(zāi)情的快速共享,有效提高氣象災(zāi)害風(fēng)險預(yù)警的時效性和評估的準(zhǔn)確性,加強氣象預(yù)報服務(wù)和災(zāi)害災(zāi)情分析能力,對于各級部門開展災(zāi)害災(zāi)情應(yīng)用亦有較強的指導(dǎo)意義。
參考文獻
[1] 帥向華,胡素平,劉欽,等.地震災(zāi)情網(wǎng)絡(luò)媒體獲取與處理模型[J].自然災(zāi)害學(xué)報,2013,22(3):178-184.
[2] 中國氣象局關(guān)于印發(fā)《氣象災(zāi)害風(fēng)險管理業(yè)務(wù)建設(shè)(2015—2016年)實施方案》的通知[氣發(fā)〔2015〕46號][Z].2015.
[3] 程鵬.氣象災(zāi)情收集與影響評估工作中存在的若干問題[J].湖北氣象,2005(4):39-40.
[4] 王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計算機學(xué)報,2013,36(6):1125-1138.
[5] 王清川.近58年廊坊市氣象災(zāi)情普查分析及問題與建議[J].防災(zāi)科技學(xué)院學(xué)報,2009,11(4):36-43.
[6] 杜鵑,汪明,史培軍.基于歷史事件的暴雨洪澇災(zāi)害損失概率風(fēng)險評估——以湖南省為例[J].應(yīng)用基礎(chǔ)與工程科學(xué)學(xué)報,2014,22(5):916-927.
[7] 蔡立輝,楊欣翥.大數(shù)據(jù)在社會輿情監(jiān)測與決策制定中的應(yīng)用研究[J].行政論壇,2015(2):1-10.
[8] 黃崇福.用智聯(lián)網(wǎng)緩解風(fēng)險分析中的4個問題[J].自然災(zāi)害學(xué)報,2014,23(2):1-7.
[9] 章國才.氣象災(zāi)害風(fēng)險評估與區(qū)劃方法[M].氣象出版社,2010.