亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于輿情數據的檔案信息跨維度收集與分類研究

        2019-12-02 15:42:44冉朝霞
        檔案管理 2019年6期
        關鍵詞:檔案收集網絡輿情突發(fā)事件

        冉朝霞

        摘? 要:當前檔案管理人員的互聯(lián)網輿情檔案信息收集、分類和有效處理能力都存在一些問題,應著力提升檔案管理人員對互聯(lián)網輿情檔案信息的跨維度收集和分類能力,準確把握互聯(lián)網輿情的內在特征及其演進過程中的潛在規(guī)律,實現(xiàn)對互聯(lián)網輿情檔案信息管理在技術和模式上的創(chuàng)新。

        關鍵詞:突發(fā)事件;網絡輿情;多維信息;檔案收集;檔案分類

        網絡輿情數據是社會組織或個人在社會實踐活動中直接形成的文字、圖像、視頻等多媒體數字信息,是對以往社會活動的清晰、確定的原始記錄,具有鮮明的原始記錄性,這與檔案的本質特性是相同的,決定了網絡輿情數據信息的檔案屬性。

        1 輿情數據檔案信息跨維度收集是檔案管理工作的技術保障

        1.1 輿情數據收集是檔案信息收集的基礎。當前,互聯(lián)網輿情數據收集系統(tǒng)主要包含三種數據收集技術:人工收集、搜索引擎收集和第三方互聯(lián)網機構定向收集。

        人工收集是指通過人工瀏覽網絡平臺,如門戶網站、博客、論壇、貼吧等,跟蹤敏感問題,通過人工監(jiān)測獲取有價值的數據和信息,經匯總、分析后觀察社會輿論走勢。人工收集是當前檔案管理人員較常用的輿情數據檔案信息收集方式之一。

        搜索引擎收集按其工作方式主要可分為三種,分別是全文搜索引擎收集、目錄索引類搜索引擎收集和元搜索引擎收集。搜索引擎收集的代表是360搜索、谷歌搜索和百度搜索。以百度搜索為例,據CNNIC發(fā)布的《2018年中國網民搜索行為研究報告》顯示:百度日均搜索量超過50億人次,截至2018年12月,搜索引擎是中國網民的最基礎應用,百度搜索滲透率為97.4%,使用率略遜于即時通信。檔案管理人員利用搜索引擎通過預先設定好的關鍵詞,可以得到相對準確的輿情信息,對敏感輿情信息及時抓取,分類保存輿情數據,時刻監(jiān)視輿情數據的動態(tài)變化。

        人工收集和搜索引擎收集是當前比較常用的互聯(lián)網輿情收集技術,但是這兩種收集方式的缺點是可提取關鍵信息的文本內容都比較短,容易因為數據稀疏導致在做相關運算時出現(xiàn)準確率和推薦召回率不高的狀況。克服這一技術難題的方法借助第三方互聯(lián)網輿情機構定向采集,通過對核心詞的外拓實現(xiàn)了準確率和推薦召回率的同步提升。

        第三方互聯(lián)網輿情監(jiān)測機構定向收集是指依托定向搜索和網絡爬蟲技術對web文本進行核心詞抓取、主題詞過濾、敏感詞檢測等技術,實現(xiàn)對網絡輿情的分類匯總。網絡爬蟲(Web Spider)是一段代碼或者一個小程序,它可以像蜘蛛在蜘蛛網上爬行一樣自動采集網站上的數據。Web Spider不但能為搜索引擎采集數據信息,亦可作為定向信息采集器,對某些網站下的特定信息進行定向采集。第三方社會輿情監(jiān)測機構定向收集擁有較為專業(yè)的數據監(jiān)測和分類系統(tǒng),可指定某個目標網站進行監(jiān)測,定向抽取目標網站最新主題帖內容或某個主題帖的所有回復帖的內容;亦可不指定目標網站對全部網站進行監(jiān)測,既可以對國內網站進行監(jiān)測,也可以對國外網站BBC、Facebook、CNN和Twitter等進行監(jiān)測。

        目前,技術比較成熟的國內第三方互聯(lián)網輿情專業(yè)監(jiān)測機構有人民網輿情監(jiān)測室、中正輿情研究中心和中青輿情在線等。以人民網輿情監(jiān)測室為例,可以全天候監(jiān)測百度貼吧、強國論壇、西祠社區(qū)、新浪論壇、新華網、搜狐社區(qū)、網易社區(qū)、鳳凰網、天涯社區(qū)以及用戶指定的其他動態(tài)網站,可以為檔案管理人員提供及時、準確和有針對性的輿情數據檔案信息收集服務功能。

        1.2 輿情數據預處理是檔案信息收集的前提。當前,輿情檔案信息數據預處理常用的技術手段有三種:

        第一,對文本進行預處理。文本預處理是對通過輿情采集器收集的未加工的 Web網頁進行初步處理,再對經初步處理過的網頁文本進行發(fā)現(xiàn)話題和數字建模,文本預處理最重要的環(huán)節(jié)是進行特征選擇和中文分詞。中文分詞對命名實體進行識別,采用 ICTCLAS 系統(tǒng)對所獲語料標注詞性和進行中文分詞,基于詞頻提煉出web模型的特征向量對中文分詞后的文本語料庫進行向量化分析。分詞技術是針對提交查詢的關鍵詞串進行處理,將收集到的網頁文本內容轉化為結構化向量。

        第二,對話題進行檢測。對文本經過預處理后的文本語料庫形成了擴展空間向量模型VSM向量集。利用 VSM 各向量間的相似度,對文本進行話題檢測和聚類,對文本內容分析的深度決定了聚類技術的效果,聚類技術的功能在于挖掘熱點話題。一般情況下,可提取關鍵信息的文本內容都比較短,容易因為數據稀疏導致在做相關運算時出現(xiàn)準確率和推薦召回率難以權衡的狀況??朔@一技術難題的方法就是引入詞擴展技術,通過對核心詞的外拓實現(xiàn)準確率和推薦召回率的同步提升。詞擴展技術是指利用特定算法對原始文本向量進行處理,使原始數據中的鄰近對象形成核心明確、分布較為離散且粒度小的話題集合,將話題集合進一步劃分為多個“微簇”,利用特定算法,對“微簇”進行二次聚類,用滿足一定的閾值要求、質量較高的核心對象代表“微簇”。

        第三,利用話題綜合評價標準對話題進行過濾。運用語義識別技術,對之前采集的數據信息進行更深一步的過濾識別,通過對數據信息中句子的結構、語法及部分關鍵詞的詞義進行過濾處理,從而將信息轉化為人們常用的語言,將大量復雜的信息簡單化。從進行過聚類、過濾處理后的文本中提取中心詞,將分析后的中心詞進行組合,通過結構化分析獲取中心詞組,計算中心詞組所涉及的文本數量,運算模塊根據文本參數進行加權計算,統(tǒng)計熱門關鍵詞組的文本數量,獲取熱門關鍵詞組的熱度值。

        2 輿情數據檔案信息科學分類是檔案管理工作的重要內容

        互聯(lián)網輿情數據檔案信息分類有兩種:一是即時分類,即時分類是在輿情的具體處理過程中,檔案管理人員根據輿情的具體內容呈現(xiàn)以及運行的情況,對輿情產生的原因和輿情產生的核心群體進行分析,著重對特定輿情的演進及應對進行分析預判。通過發(fā)現(xiàn)話題,捕捉受眾情緒特點,關注話語分布時空特征,揭示輿情演變規(guī)律。二是深度分類,深度分類是在輿情處理完成后,檔案管理人員依據輿情發(fā)展的結構性特點,挖掘出新的、深層次的熱點話題,跟進媒體報道,追蹤敏感事件,并通過IP定位發(fā)現(xiàn)受眾的空間分布及傳播路徑,建立事件識別模式,監(jiān)測熱點話題,發(fā)現(xiàn)突發(fā)事件特征、規(guī)律,提取、分析與公眾利益密切相關的部分,為互聯(lián)網輿情數據檔案信息入庫提供科學的分類依據。

        2.1 互聯(lián)網輿情檔案信息的定點分類。一般情況下,危及社會穩(wěn)定的輿情可能包含以下幾種形式:段子、謠言、社會思潮、理論爭鳴、示威游行或群體聚集產生的輿情等,輿情監(jiān)測系統(tǒng)須及時搜集這些輿情形式和信息,快速做出及時恰當的反應。檔案管理人員利用智能搜索軟件在對定點微博、微信、論壇、貼吧和重點網站等實行24小時不間斷監(jiān)控的基礎上,通過預先設置好的關鍵詞,對敏感信息和少數有影響力的意見領袖的言論進行定點抓取,并對收集到的社會輿情數據進行分類保存,持續(xù)觀察輿情數據的動態(tài)變化?!巴话l(fā)性群體事件中的網絡輿情往往開始于網絡中某位網友的爆料,抑或是媒體的報道,這些原始性信息會在公眾腦海中形成首因效應,并通過微博、博客等形式構造信息鏈條?!盵1]

        2.2 互聯(lián)網輿情檔案信息的定向分類。檔案管理人員對互聯(lián)網輿論要進行定向的有針對性的分析,判斷出哪些意見和觀點會自生自滅、自然消解,哪些意見和觀點會演進成重大輿情危機。檔案管理人員需要根據定向分析分類的結果和網絡輿情的瞬時變化做出輿情走勢預判,從情緒層面走向意見層面,再從意見層面走向行動層面?!摆厔菖c定向判斷是網絡輿情分析與分類的核心,是應對與引導的依據,根據匯總到的輿情信息,通過系統(tǒng)的分析,做出關于輿情發(fā)展趨勢與走向的基本判斷,這一判斷主要是在定量基礎上得出的定向判斷?!盵2]

        在網絡輿情的定向分析分類工作中,必須時刻警惕新要素的加入,這些作為行為主體的新要素一般都具有一定的影響力,檔案管理人員通過對新要素的話語結構和信息資源的再分配成為輿論場的行為主體,通過與公眾的互動獲得社會資本并將其轉化為注意力資源,在事態(tài)發(fā)展的關鍵節(jié)點實現(xiàn)對輿論格局的影響,左右輿情走向。社會輿情的定向分類“有助于判斷突發(fā)性群體事件相關輿情的意見傾向,對網民意見和網絡輿論的形成過程進行進一步分析,通過梳理,整理出網民對輿情事件的主體態(tài)度和總體傾向”。[3]

        2.3 互聯(lián)網輿情檔案信息的定量分類。從宏觀到微觀是一種研究事物的方法,檔案管理人員要具備用定量分析的方法對定性描述進行度量,可以在微觀層次上展現(xiàn)互聯(lián)網輿情的變化,在更小的粒度上對互聯(lián)網輿情進行定量評價,發(fā)現(xiàn)輿情的演化規(guī)律。

        檔案管理人員要從制度建設到日常運作層面切實回應民眾需求,在進行互聯(lián)網輿情定量分類時,檔案管理人員要重視微博和微信的轉載量和跟帖數量,因為突發(fā)性群體事件中微博和微信的轉載量和跟帖數量是互聯(lián)網輿情事件能否引起廣大網民關注的顯性指標,是網民意見的最直接表現(xiàn)。

        2.4 互聯(lián)網輿情檔案信息的定性分類。突發(fā)事件發(fā)生以后,人們獲知的相關信息并不一定是事件本身的真實信息,檔案管理人員首先要對事件真?zhèn)巫龆ㄐ耘袛?,一般來講輿論具有基于事實并且相對于事實本身的獨立性,輿情在傳播過程中,信息往往會發(fā)生變異,因此對事件真?zhèn)蔚呐袛嗍沁M行輿情定性分類的第一步?!叭藗冋J知這一世界往往通過多樣的、情景化的、理性與感性并存的方式,在抓取這些復雜的情感、價值、信仰以及意見時,大數據技術仍有其弱點。”[4]網絡輿情的定性分析與分類應盡快尋找有力證據,厘清事實和謠言邊界,杜絕輿情的外溢和偏離。

        3 加強互聯(lián)網輿情數據檔案信息跨維度動態(tài)管理

        3.1 構建互聯(lián)網輿情數據檔案信息管理跨維度互動模式。檔案管理人員應將互聯(lián)網輿情大數據檔案管理與互聯(lián)網內容治理相結合,讓數據流顯現(xiàn)關聯(lián);將互聯(lián)網輿情大數據檔案管理與政府科學決策相結合,讓信息流暢通無阻;將互聯(lián)網輿情大數據檔案管理和輿情日常管理相結合,讓輿情流和諧運轉。

        3.2 構建互聯(lián)網輿情數據檔案信息多元管理模式。傳統(tǒng)檔案管理結構模式中公眾的參與度比較低。大數據時代為輿論的快速形成和公眾對公共事務話語權的表達提供了討論空間,由單一主體治理變?yōu)槎嘣黧w治理,多元主體治理的基本結構體現(xiàn)了混合的特點,多元主體治理的邊界與范圍不是簡單的信息關聯(lián)和多元混合?;ヂ?lián)網和大數據技術拓寬了檔案管理的內容,改變了檔案管理人員和民眾的連接與互動方式,因此需要尋求一種新的檔案管理模型和良性互動的連接機制來消解傳統(tǒng)檔案管理成長的困境。

        3.3 構建互聯(lián)網輿情數據檔案信息管理回應指標體系。警惕輿情動態(tài)在復雜的演進過程中出現(xiàn)的不和諧因素,準確界定輿情等級,通過級別劃分、輿情聚類、有效處置和事后評估構建輿情回應的指標體系,通過行為干預及早進行有效處置,匯編典型事件檔案庫?;ヂ?lián)網輿情集中反映了當前熱點,聚焦了矛盾和沖突,暴露了隱匿于風暴漩渦中的濫觴,檔案管理人員應從追問事實到反思制度,從線上輿論和線下互動的有效對接到挖掘方法和社會洞察的有效結合,構建互聯(lián)網輿情檔案管理回應指標體系,改進和完善檔案管理中的制度性、結構性問題。

        參考文獻:

        [1]王玉瓊,胡娟.突發(fā)性群體性事件管理問題探討[J].管理學雜志,2017,26 (5) :42 - 44.

        [2]梁雪云.網絡輿情的分析與分類機制研究[J].今傳媒雜志,2016,5:16-17.

        [3]姜鑫.收集、判斷與溝通:突發(fā)性群體事件的網絡輿情研究[J].學術交流雜志2018,7:202-207.

        [4]KITCHIN R.Big data and human geography: Opportunities, challenges and risks[J].Dialogues in Human Geography,2017, 3(3):262-267.

        (作者單位:中共鄭州市委黨校公共管理教研部? 來稿日期:2019-07-14)

        猜你喜歡
        檔案收集網絡輿情突發(fā)事件
        對重大活動檔案收集的及時性建議
        院校檔案收集工作問題與對策探討
        科教導刊(2016年28期)2016-12-12 05:32:40
        當前檔案收集工作存在的不足及對策研究
        “互聯(lián)網+”背景下高校平安校園建設研究
        中國市場(2016年38期)2016-11-15 23:42:46
        淺析網絡輿情治理
        經營者(2016年12期)2016-10-21 07:51:37
        基于社會穩(wěn)定視角的網絡輿情預警機制構建的思考
        今傳媒(2016年9期)2016-10-15 22:02:52
        信息化技術在檔案收集管理中的應用探討
        突發(fā)事件網絡輿情的演化規(guī)律與監(jiān)控
        突發(fā)事件的輿論引導
        清朝三起突發(fā)事件的處置
        文史春秋(2016年8期)2016-02-28 17:41:32
        日本精品一区二区三区在线播放 | 人妻暴雨中被强制侵犯在线| 亚洲黄色一级毛片| 日本成人免费一区二区三区| 日本人妻精品有码字幕| 久久青青草原精品国产app| 国产精品午睡沙发系列| 亚洲欧洲无码精品ⅤA| 不卡免费在线亚洲av| 免费国产a国产片高清网站| 色窝窝免费播放视频在线| 亚洲AV无码成人精品区日韩密殿| 青青草在线免费观看在线| av无码一区二区三区| 伊人色综合九久久天天蜜桃| 永久免费的拍拍拍网站| 国产亚洲精品一区在线| 亚洲av永久中文无码精品综合| 亚洲熟妇av乱码在线观看 | 国产少妇露脸精品自拍网站| 深夜放纵内射少妇| 又色又污又爽又黄的网站| 久久精品国产只有精品96| 中文字幕一区二区黄色| 国产农村熟妇videos| 中文字幕欧美一区| 亚洲精品一区二区三区蜜臀| 精品久久有码中文字幕| 性生交大片免费看淑女出招 | 野花社区视频在线观看| 国产成人精品午夜福利免费APP| 亚洲精品无码久久久久牙蜜区 | 中文字幕久久熟女蜜桃| 国产精品午夜无码av天美传媒| 在线观看一区二区女同| 精品老熟女一区二区三区在线| 国产日韩av在线播放| 手机看片久久国产免费| 亚洲av一区二区三区网站| 无码精品人妻一区二区三区漫画| 亚洲熟女乱色一区二区三区|