胡瑞娟
摘 要: 在大數(shù)據(jù)背景下,群體性事件網(wǎng)絡(luò)輿情的分析與應(yīng)對面臨著巨大的挑戰(zhàn),因此,如何在大數(shù)據(jù)時代構(gòu)建群體性事件網(wǎng)絡(luò)輿情預(yù)警機(jī)制顯得尤為緊迫和重要。文章以論壇、微博、博客等具有評論功能的新聞網(wǎng)站為研究對象,對群體性事件網(wǎng)絡(luò)輿情分析研判,構(gòu)建網(wǎng)絡(luò)輿情預(yù)警機(jī)制,為預(yù)防和研判群體性事件的發(fā)生提供有益的思路。
關(guān)鍵詞: 大數(shù)據(jù); 群體性事件; 網(wǎng)絡(luò)輿情; 預(yù)警機(jī)制
中圖分類號:G647 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2017)05-13-04
Research on early warning mechanism of group event network public opinion
Hu Ruijuan
(PLA University of Foreign Languages, Luoyang, Henan 471003, China)
Abstract: In the background of big data, the analysis and coping of network public opinion of group events are facing great challenges. Therefore, it is very urgent and important to construct the early warning mechanism of group event network public opinion in the era of big data. This paper, taking the forum, micro-blog, blog and the other news website with discussion function as the research object, analyzing the group event network public opinion, builds an early warning mechanism of network public opinion to provide useful ideas for preventing and judging the occurrence of group event.
Key words: big data; group event; network public opinion; early warning mechanism
0 引言
當(dāng)前,大數(shù)據(jù)產(chǎn)業(yè)日趨活躍,技術(shù)演進(jìn)和應(yīng)用創(chuàng)新加速發(fā)展。截止2016年6月我國網(wǎng)民總數(shù)已達(dá)7.10億,手機(jī)網(wǎng)民達(dá)6.56億[1]。近年來各類群體性事件的頻繁發(fā)生,給人民生命財產(chǎn)和經(jīng)濟(jì)社會發(fā)展造成了重大損失。隨著我國網(wǎng)民數(shù)量激增和移動智能設(shè)備的普及,社交網(wǎng)絡(luò)等新媒體工具逐漸滲透到人們的生活當(dāng)中,群體性事件在網(wǎng)上傳播的速度越來越快,人們對群體性事件的關(guān)注度越來越高。如果各級人民政府不能積極應(yīng)對和有效適應(yīng)網(wǎng)絡(luò)輿情所帶來的沖擊,不能盡快建立切實(shí)可行的群體性事件的網(wǎng)絡(luò)輿情預(yù)警機(jī)制,那么潛在的社會輿情就會成為突發(fā)性群體性事件出現(xiàn)的催化劑和導(dǎo)火索[2]。
發(fā)生群體性事件,相關(guān)職能部門如何迅速收集網(wǎng)絡(luò)輿情信息,跟蹤事態(tài)變化,及時向有關(guān)部門通報,是新形勢和新環(huán)境下亟待解決的問題。本文以論壇、微博、博客等具有評論功能的新聞網(wǎng)站為研究對象,對群體性事件網(wǎng)絡(luò)輿情分析研判,構(gòu)建面向大數(shù)據(jù)的群體性事件網(wǎng)絡(luò)輿情預(yù)警機(jī)制,為預(yù)防和研判群體性事件的發(fā)生提供有益的思路。
1 大數(shù)據(jù)與Hadoop平臺
IDC公司從四個特征定義大數(shù)據(jù),即海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)和動態(tài)的數(shù)據(jù)體系(Velocity)、多樣的數(shù)據(jù)模態(tài)(Variety)和巨大的數(shù)據(jù)價值(Value)。根據(jù)大數(shù)據(jù)的生命周期,大數(shù)據(jù)的技術(shù)體系[3]可以分為大數(shù)據(jù)采集與預(yù)處理,大數(shù)據(jù)存儲與管理,大數(shù)據(jù)計算模式與系統(tǒng),大數(shù)據(jù)分析與挖掘,大數(shù)據(jù)可視化計算,以及大數(shù)據(jù)隱私安全等方面。我們通常選用Hadoop系統(tǒng)來存儲、管理、分析這些數(shù)據(jù),以獲取更多有價值的信息[4]。
Hadoop是Apache軟件基金會旗下的一個開源分布式計算平臺,以Hadoop分布式文件系統(tǒng)HDFS和MapReduce為核心的Hadoop為用戶提供了系統(tǒng)底層細(xì)節(jié)透明的分布式基礎(chǔ)架構(gòu)。HDFS的高容錯性、高伸縮性允許用戶將Hadoop部署在低廉的硬件上,形成分布式系統(tǒng);由于Hadoop擁有可計量、成本低、高效、可信等特點(diǎn),基于Hadoop的應(yīng)用已經(jīng)開始遍布互聯(lián)網(wǎng)領(lǐng)域。MapReduce分布式編程模型允許用戶在不了解分布式系統(tǒng)底層細(xì)節(jié)的情況下運(yùn)行應(yīng)用程序[5]。
2 群體性事件網(wǎng)絡(luò)輿情預(yù)警機(jī)制的理論基礎(chǔ)
對“群體性事件”的界定目前仍然有爭議,但一般是指具有某些共同利益的群體,為了實(shí)現(xiàn)某一目標(biāo),采取靜坐、沖擊、游行、集合等方式向黨政機(jī)關(guān)施加壓力,出現(xiàn)破壞公私財產(chǎn)、危害人身安全,擾亂社會秩序的事件。網(wǎng)絡(luò)輿情是由于各種事件的刺激而產(chǎn)生的,通過互聯(lián)網(wǎng)的傳播,人們對于該事件的所有認(rèn)知、態(tài)度、情感和行為傾向的集合。群體性事件網(wǎng)絡(luò)輿情是指民眾以網(wǎng)絡(luò)為平臺,借助網(wǎng)絡(luò)論壇、博客、電子郵件、網(wǎng)絡(luò)新聞組等網(wǎng)絡(luò)工具,圍繞即將發(fā)生或者已經(jīng)發(fā)生的群體性事件發(fā)布信息,并表達(dá)出社會政治態(tài)度。
⑴ 預(yù)警理論是群體性事件網(wǎng)絡(luò)輿情預(yù)警機(jī)制構(gòu)建的基礎(chǔ)。預(yù)警理論包括信息判斷分析、信息搜集、相關(guān)應(yīng)對措施制定、信息傳遞和信息反饋五個階段的內(nèi)容。在整個預(yù)警機(jī)制的運(yùn)行過程中,通過信息收集做出正確判斷分析,之后進(jìn)行信息傳遞,最后完成應(yīng)急措施的啟動。
⑵ 危機(jī)管理理論是群體性事件網(wǎng)絡(luò)輿情預(yù)警機(jī)制構(gòu)建的條件。危機(jī)管理主要包括危機(jī)發(fā)生前的防范、危機(jī)發(fā)生時的化解以及危機(jī)消除后的社會政治、經(jīng)濟(jì)和文化秩序的逐步恢復(fù),人們的日常生活和工作逐步轉(zhuǎn)入正規(guī)。
⑶ 群體性事件的網(wǎng)絡(luò)輿情預(yù)警工作存在的現(xiàn)實(shí)問題主要有:一是網(wǎng)絡(luò)輿情監(jiān)測不及時,相關(guān)的預(yù)警監(jiān)測部門沒有一個合理、有效的群體性事件網(wǎng)絡(luò)輿情定期人工排查制度,沒有定期對各大門戶網(wǎng)站出現(xiàn)的相關(guān)群體性事件的信息進(jìn)行深入排查,沒有在第一時間及時了解網(wǎng)民的思想動態(tài),沒有迅速發(fā)現(xiàn)網(wǎng)民思想動態(tài)后面存在的大量社會隱患;二是網(wǎng)絡(luò)輿情與群體性事件即時互動、互相強(qiáng)化、交流融合,加之網(wǎng)絡(luò)輿情預(yù)警機(jī)制不健全,大大增加了引導(dǎo)與監(jiān)控網(wǎng)絡(luò)輿情的難度。
3 面向大數(shù)據(jù)的群體性事件網(wǎng)絡(luò)輿情預(yù)警機(jī)制構(gòu)建
面向大數(shù)據(jù)的群體性事件網(wǎng)絡(luò)輿情預(yù)警機(jī)制的構(gòu)建依托爬蟲技術(shù)對新聞網(wǎng)頁、論壇、博客和微博等具有評論功能的網(wǎng)站進(jìn)行信息采集,利用大數(shù)據(jù)Hadoop平臺、MapReduce編程模型對采集的數(shù)據(jù)進(jìn)行預(yù)處理及挖掘分析,繼而對網(wǎng)絡(luò)輿情環(huán)境予以監(jiān)控與預(yù)警,包括監(jiān)測、匯集、分析、警報等,從整體上把握群體性事件網(wǎng)絡(luò)輿情,做到“防范于未然”。在預(yù)警機(jī)制構(gòu)建的過程中,預(yù)警系統(tǒng)信息的準(zhǔn)確性和可靠性對于整個群體性事件的順利解決起著舉足輕重的作用,所以要適時完善和補(bǔ)充預(yù)警系統(tǒng),保證其正常監(jiān)測和跟蹤群體性事件。面向大數(shù)據(jù)的群體性事件網(wǎng)絡(luò)輿情預(yù)警機(jī)制如圖1所示。
3.1 群體性事件跟蹤監(jiān)測子系統(tǒng)
群體性事件網(wǎng)絡(luò)輿情主要表現(xiàn)方式為:BBS論壇、博客、微博、新聞評論、跟帖轉(zhuǎn)帖等,其表達(dá)快捷、信息多元化、互動,具有傳統(tǒng)媒體無法比擬的優(yōu)勢。網(wǎng)絡(luò)的開發(fā)性和虛擬性決定了網(wǎng)絡(luò)輿情具有直接性、隨意性、突發(fā)性和隱蔽性等為主要特征。
跟蹤監(jiān)測子系統(tǒng)是群體性事件網(wǎng)絡(luò)輿情預(yù)警系統(tǒng)的基礎(chǔ),是獲取、存儲和管理有效網(wǎng)絡(luò)輿情信息的平臺,充當(dāng)了危機(jī)信號的識別器。近年來,群體性事件的出現(xiàn)及其走入平緩大都與網(wǎng)絡(luò)息息相關(guān),且以網(wǎng)絡(luò)輿情信息的方式呈現(xiàn)。跟蹤監(jiān)測子系統(tǒng)主要依托網(wǎng)絡(luò)爬蟲技術(shù)對論壇、博客、微博等相關(guān)網(wǎng)站進(jìn)行實(shí)時、自動監(jiān)測,獲取相關(guān)信息。再從海量網(wǎng)絡(luò)信息中檢索、匹配和篩選出針對用戶興趣有用的相關(guān)信息,這一過程中,要區(qū)分有效信息和虛假信息,過濾虛假輿情信息并對有效信息及主流信息予以整理。
3.2 群體性事件分析子系統(tǒng)
分析子系統(tǒng)是群體性事件網(wǎng)絡(luò)輿情預(yù)警系統(tǒng)的核心,是對所獲取信息的再創(chuàng)造的結(jié)果。分析子系統(tǒng)是根據(jù)輿情監(jiān)督李與研究的需要,在對相關(guān)輿情信息匯集整理的基礎(chǔ)上進(jìn)行深層次的加工和分析研究,把握網(wǎng)絡(luò)輿情的本質(zhì)內(nèi)容,預(yù)測其可能的發(fā)展方向,從而得出相關(guān)的結(jié)論。
分析子系統(tǒng)是通過對跟蹤監(jiān)測子系統(tǒng)中的信息仔細(xì)篩選,實(shí)現(xiàn)準(zhǔn)確有效的輿情采集和提取后,從海量信息中找到熱點(diǎn)、敏感話題,并對其趨勢進(jìn)行追蹤,是警報子系統(tǒng)功能實(shí)現(xiàn)的前提。從論壇、微博、博客等網(wǎng)站采集到的數(shù)據(jù)量是巨大的,而且這些數(shù)據(jù)中很多都是非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)使用HDFS存儲。對采集的數(shù)據(jù)進(jìn)行預(yù)處理包括:中文分詞、向量空間建模分析、文本分類和聚類以及輿情趨勢分析。中文分詞采用IKAnalyzer分析器,向量空間模型建模利用TF-IDF(詞頻-逆向文件頻率)向量表示法來表示特征向量,使用K-means算法實(shí)現(xiàn)文本聚類,統(tǒng)計輿情信息并進(jìn)行可視化展示,進(jìn)行輿情趨勢分析。采用MapReduce編程模型[6],可實(shí)現(xiàn)多范圍、多角度、多層次數(shù)據(jù)分析與挖掘,包括文本聚類分析、活躍分析、輿情評測分析、輿情關(guān)注等。
分布式文件系統(tǒng)(HDFS)和MapReduce編程模型是Hadoop的主要組成部分。MapReduce模型的計算流程如圖2所示。分布式文件系統(tǒng)主要負(fù)責(zé)各節(jié)點(diǎn)上的數(shù)據(jù)的存儲,并實(shí)現(xiàn)高吞吐的數(shù)據(jù)讀寫。MapReduce計算模型的核心部分是Map和Reduce兩個函數(shù)[8]。Map的輸入是in_key和in_value,指明了Map需要處理的原始數(shù)據(jù)。Map的輸出結(jié)果是一組
3.3 群體性事件預(yù)警子系統(tǒng)
預(yù)警子系統(tǒng)是群體性事件網(wǎng)絡(luò)輿情預(yù)警系統(tǒng)的重點(diǎn),是基于分析子系統(tǒng)的分析結(jié)果,依據(jù)特定的預(yù)警指標(biāo)體系,判斷該信息警報等級的信息系統(tǒng)。
基于分析子系統(tǒng)的分析結(jié)果來評估網(wǎng)絡(luò)輿情態(tài)勢,根據(jù)威脅估計模型對輿情的態(tài)勢發(fā)展和威脅程度進(jìn)行定量預(yù)測,做出輿情的預(yù)警等級報告,并與其他干預(yù)系統(tǒng)聯(lián)動引導(dǎo)輿情朝正面發(fā)展。根據(jù)不同預(yù)警指標(biāo),實(shí)時預(yù)警可分為爆發(fā)指標(biāo)預(yù)警、主題敏感度指標(biāo)預(yù)警和負(fù)面輿論指標(biāo)預(yù)警。其中爆發(fā)指標(biāo)預(yù)警按照輕重程度可以劃分為I級(輕度級)、II級(示警級)、III級(危險級)、IV級(極度危險級)和V級(立即爆發(fā)級)五個等級。在可視輸出上依次采用綠色、藍(lán)色、黃色、橙紅色和紅色五種顏色來加以表示。最低程度的恐怖警告將用綠色表示,然后依次為藍(lán)色、黃色、橘黃色,最高等級的恐怖警告將用紅色表示。
3.4 群體性事件處理子系統(tǒng)
處理子系統(tǒng)是群體性事件網(wǎng)絡(luò)輿情預(yù)警系統(tǒng)的最后一個階段。對于預(yù)警子系統(tǒng)發(fā)出的重要信息,必須依靠傳送渠道迅速傳遞。群體性事件的應(yīng)急結(jié)束后,仍需進(jìn)行恢復(fù)和重建工作。
群體性事件網(wǎng)絡(luò)輿情預(yù)警系統(tǒng)的四個子系統(tǒng)相輔相成、不可分割,子系統(tǒng)功能的實(shí)現(xiàn)及良好運(yùn)行承載著群體性網(wǎng)絡(luò)輿情預(yù)警的實(shí)現(xiàn)。通過跟蹤監(jiān)測子系統(tǒng),挖掘出某一群體性事件輿情信息;通過分析子系統(tǒng),分析其形成的網(wǎng)絡(luò)輿情的安全程度、公民的參與程度、未來發(fā)展態(tài)勢等;預(yù)警子系統(tǒng)依照其敏感程度與參與程度進(jìn)行預(yù)警報備等級;處理子系統(tǒng)發(fā)揮其功能,引導(dǎo)輿情,防控群體性事件的發(fā)生,從而確保社會的穩(wěn)定。
2016年上半年引起網(wǎng)絡(luò)輿論較大反應(yīng)的群體性事件有e租寶非法集資案、高考減招、出租車網(wǎng)約車、勞資糾紛等。針對各類群體性事件網(wǎng)絡(luò)輿情應(yīng)建立有效的應(yīng)對策略:首先,正確認(rèn)識網(wǎng)絡(luò)輿情給人們所造成的危機(jī),通過正確的方式對網(wǎng)絡(luò)輿情展開教育學(xué)習(xí);其次,由于網(wǎng)絡(luò)輿情發(fā)展擴(kuò)散非常迅速,所以在解決問題時要積極快速,充分利用正面力量;第三,要關(guān)注網(wǎng)民的心態(tài),注重用專業(yè)網(wǎng)絡(luò)團(tuán)隊和網(wǎng)民溝通交流。
4 結(jié)束語
面向大數(shù)據(jù)的群體性事件網(wǎng)絡(luò)輿情預(yù)警機(jī)制的構(gòu)建,一方面,可以在很大程度上減少群體性事件的發(fā)生,對于有效和快速解決群體性事件所帶來的危害,有著重要的推動作用;另一方面,通過對群體性事件的網(wǎng)絡(luò)輿情的相關(guān)信息的收集和分析,進(jìn)一步有效應(yīng)對和妥善處置發(fā)生的各類群體性事件,為政府開展預(yù)警工作提供一個可供借鑒和實(shí)施的方案,而且為社會主義和諧社會的構(gòu)建,創(chuàng)造一個良好的氛圍和環(huán)境。
參考文獻(xiàn)(References):
[1] 第38次《中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計報告》.CNNIC(中國互聯(lián)網(wǎng)絡(luò)信息中心),2016.7.
[2] Maclennan B,Kypri K,Langley J, et al.Public Sentiment Towards Alcohol and Local Government Alcohol policies in New Zealand[J]. International Journal of Drug Policy,2014.23(1):45-53
[3] 計算機(jī)學(xué)會大數(shù)據(jù)專家委員會.中國大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)發(fā)展白皮書,2013:45
[4] J.Allan. Topic detection and tracking: event-basedinformation organization[M]. Norwell, MA,USA: Kluwer Academic Publishers,2002.
[5] 夏火松,甄化春.大數(shù)據(jù)環(huán)境下輿情分析與決策支持研究文獻(xiàn)綜述[J].情報雜志,2015.34(2):1-6
[6] 李建江,崔健,王聃等.Map/Reduce并行編程模型研究綜述[J].電子學(xué)報,2013.39(11):2635-2642
[7] 王來華.政府如何應(yīng)對輿情危機(jī)[J].決策,2007.7.
[8] 張麗江.網(wǎng)絡(luò)輿情的宏觀影響初探[J].社會科學(xué),2010.
[9] 許鑫.網(wǎng)絡(luò)輿情指標(biāo)體系設(shè)計與分析[J].情報科學(xué),2009.7.
[10] 曾潤喜,徐曉林.網(wǎng)絡(luò)輿情突發(fā)事件預(yù)警系統(tǒng)、指標(biāo)與機(jī)制[J].情報雜志,2009.11:52-55
[11] 宋燕金.網(wǎng)絡(luò)輿論與思想政治教育人文環(huán)境的優(yōu)化[J].時代教育,2012.9.
[12] 祝華新.當(dāng)前我國網(wǎng)絡(luò)輿論載體和傳播方式的新變化[J].理論導(dǎo)報,2012.1.
[13] 赫英杰.論新時期高校網(wǎng)絡(luò)輿情引導(dǎo)的技術(shù)構(gòu)建機(jī)制[J].高校輿情研究,2010.
[14] 楊羽飛.基于Mapreduce的大規(guī)模中文短文本聚類算法的設(shè)計與實(shí)現(xiàn)[D].蘭州理工大學(xué),2014:20-21