謝樹云,全曉松,申云成
(昭通學(xué)院 信息科學(xué)與技術(shù)學(xué)院,云南 昭通 657000)
?
大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)輿情評(píng)估模型的構(gòu)建*
謝樹云,全曉松,申云成
(昭通學(xué)院 信息科學(xué)與技術(shù)學(xué)院,云南 昭通 657000)
當(dāng)前網(wǎng)絡(luò)輿情的發(fā)展呈現(xiàn)隨時(shí)間變化的過(guò)程,本文研究在大數(shù)據(jù)環(huán)境下實(shí)現(xiàn)預(yù)警的軟件模型的構(gòu)建。提出網(wǎng)絡(luò)輿情信息獲取的Mashup模式,建立評(píng)估數(shù)據(jù)集合;針對(duì)具體的網(wǎng)絡(luò)輿情評(píng)估指標(biāo)體系,提出一種通用的輿情綜合度量方法;實(shí)現(xiàn)對(duì)輿情的分級(jí)度量,把網(wǎng)絡(luò)輿情從高到低劃分為紅、橙、黃、綠等四個(gè)等級(jí),以供相關(guān)組織決策。
大數(shù)據(jù);網(wǎng)絡(luò)輿情;Mashup;評(píng)估體系;綜合度量
公共輿論是社會(huì)的皮膚,是社會(huì)氣候的晴雨表,當(dāng)前我國(guó)社會(huì)轉(zhuǎn)型期的各種社會(huì)思潮、社會(huì)矛盾、社會(huì)熱點(diǎn)等問(wèn)題和現(xiàn)代傳播方式聚集交融形成的網(wǎng)絡(luò)輿情是公眾表達(dá)對(duì)現(xiàn)實(shí)社會(huì)的各種態(tài)度、意見和情緒的綜合反映,網(wǎng)絡(luò)輿情的形成對(duì)社會(huì)公眾情緒、社會(huì)突發(fā)事件發(fā)展趨勢(shì)、政府政策制定都具有相當(dāng)影響力。目前網(wǎng)絡(luò)已經(jīng)成為一種整合多種傳播信息方式的綜合平臺(tái),致使互聯(lián)網(wǎng)的信息形成了浩如煙海的大數(shù)據(jù)時(shí)代。對(duì)此挖掘有價(jià)值屬性的網(wǎng)絡(luò)輿情對(duì)掌握社會(huì)思想動(dòng)態(tài)、敏銳捕捉社會(huì)突發(fā)事件發(fā)展趨勢(shì)、提高社會(huì)預(yù)警能力、社會(huì)治理能力和科學(xué)決策都具有現(xiàn)實(shí)的積極意義。
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展、各類互動(dòng)平臺(tái)的運(yùn)用和各種傳播方式整合到網(wǎng)路中,使互聯(lián)網(wǎng)傳播信息具有快捷性、互動(dòng)性、自主性、跨時(shí)空性、大數(shù)據(jù)性等特征,網(wǎng)絡(luò)信息已經(jīng)進(jìn)入了名副其實(shí)的大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)輿情的大數(shù)據(jù)導(dǎo)致政府引導(dǎo)、決策十分困難。及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)信息中包含的有價(jià)值屬性的信息,并作出最快速的反應(yīng),成為網(wǎng)絡(luò)大數(shù)據(jù)時(shí)代的第一要?jiǎng)?wù)。然而,在網(wǎng)絡(luò)輿情的大數(shù)據(jù)環(huán)境下,有價(jià)值的信息很多,但要挖掘出來(lái)卻很困難。若靠傳統(tǒng)人工方法從網(wǎng)絡(luò)中搜集信息方方面面的熱點(diǎn),并進(jìn)行原因、趨勢(shì)分析,顯然是絕無(wú)可能實(shí)現(xiàn)的。
對(duì)此,很多學(xué)者從信息挖掘、評(píng)估體系、輿情預(yù)警等方面進(jìn)行了研究。戴嬡提出了以網(wǎng)絡(luò)輿情綜合指數(shù)為一級(jí)指標(biāo)的網(wǎng)絡(luò)輿情安全評(píng)估指標(biāo)體系[1];吳紹忠、李淑華將輿情、輿情傳播和輿情受眾相結(jié)合,生成了網(wǎng)絡(luò)輿情預(yù)警等級(jí)指標(biāo)體系[2];王青、成穎、巢乃鵬等通過(guò)對(duì)主題輿情進(jìn)行E—R分析,從輿情熱度、輿情強(qiáng)度、輿情傾度、輿情生長(zhǎng)度4個(gè)維度設(shè)計(jì)了網(wǎng)絡(luò)輿情監(jiān)測(cè)與預(yù)警指標(biāo)體系[3];朱輝、駱公志提出網(wǎng)絡(luò)輿情評(píng)估EHA 三維指標(biāo)體系[4];徐迪提出了四級(jí)指標(biāo)體系[5]。
從網(wǎng)絡(luò)輿情產(chǎn)生的過(guò)程來(lái)看,主要由三個(gè)階段構(gòu)成。第一階段網(wǎng)絡(luò)輿情經(jīng)歷個(gè)體聚眾、內(nèi)化思想形成群體化輿論,第二階段網(wǎng)絡(luò)輿情在個(gè)體聚眾化的基礎(chǔ)上進(jìn)行聚核化過(guò)程凸現(xiàn)網(wǎng)絡(luò)輿論領(lǐng)袖,第三階段網(wǎng)絡(luò)輿情在聚眾化和聚核化的基礎(chǔ)上形成引導(dǎo)化輿論,實(shí)現(xiàn)引導(dǎo)網(wǎng)絡(luò)輿論形成區(qū)域化、群體化的社會(huì)影響和群體事件[6]。因而網(wǎng)絡(luò)輿情的發(fā)展具有階段性,更呈現(xiàn)整體發(fā)展過(guò)程??偟目磥?lái),之前的研究大多基于網(wǎng)絡(luò)輿情發(fā)展過(guò)程的階段性研究,而將網(wǎng)絡(luò)輿情發(fā)展過(guò)程理論和信息技術(shù)有機(jī)結(jié)合,并為網(wǎng)絡(luò)輿情評(píng)估提供一種過(guò)程模型的平臺(tái)少,網(wǎng)絡(luò)輿情評(píng)估仍然停留在階段性研究上。本文提出一種過(guò)程模型,以原始信息的詞語(yǔ)識(shí)別[7]、輿情擴(kuò)散中的數(shù)據(jù)統(tǒng)計(jì)、網(wǎng)民情緒態(tài)度等方面為依據(jù),采用多級(jí)評(píng)判的思想,參考風(fēng)暴等級(jí),把網(wǎng)絡(luò)輿情劃分為紅、橙、黃、綠等四個(gè)等級(jí),供相關(guān)部門決策。
2.1 輿情評(píng)估指標(biāo)體系
輿情評(píng)估指標(biāo)體系是多級(jí)評(píng)判的基礎(chǔ),現(xiàn)有輿情評(píng)估指標(biāo)體系存在不能反映網(wǎng)絡(luò)輿情發(fā)展的時(shí)間過(guò)程、計(jì)算過(guò)程復(fù)雜等問(wèn)題,因而本文提出表1的四維網(wǎng)絡(luò)輿情評(píng)估體系。
表1 輿情評(píng)估指標(biāo)體系
表1中,每個(gè)三級(jí)指標(biāo)都可以按照括號(hào)內(nèi)的方法計(jì)算權(quán)值,可以實(shí)現(xiàn)數(shù)值化。每組對(duì)應(yīng)于一個(gè)上級(jí)指標(biāo)的度量指標(biāo)權(quán)重之和等于1 ,滿足歸一性;第三級(jí)指標(biāo)的計(jì)算值由計(jì)數(shù)、分類計(jì)數(shù)、百分比等方法產(chǎn)生??梢员硎緸橄旅娴谋磉_(dá)式:
與其他的評(píng)估體系相比較,此體系的一個(gè)特點(diǎn)在于,強(qiáng)調(diào)時(shí)間對(duì)輿情的影響。在計(jì)算變化率時(shí),由于輿情的數(shù)量曲線可能是起伏的,因此不但要關(guān)注相鄰兩天的變化,還要兼顧一段時(shí)間內(nèi)的變化趨勢(shì)。
2.2 Mashup信息獲取
Mashup被稱為糅合技術(shù),是目前網(wǎng)絡(luò)上新出現(xiàn)的一種現(xiàn)象。在應(yīng)用中,Mashup把有合作關(guān)系的多個(gè)公共或者私有數(shù)據(jù)庫(kù)通過(guò)web應(yīng)用加在一起,形成整合。Mashup應(yīng)用本身不需要存儲(chǔ)大量數(shù)據(jù),而是對(duì)引用來(lái)的數(shù)據(jù)進(jìn)行處理,產(chǎn)生統(tǒng)計(jì)數(shù)據(jù)。目前Mashup技術(shù)被應(yīng)用于地圖、搜索、購(gòu)物、新聞、微博等Web服務(wù)。
2.3 等級(jí)評(píng)價(jià)
為便于理解輿情嚴(yán)重程度,需要對(duì)輿情按照嚴(yán)重程度從高到低劃分為紅、橙、黃、綠四種顏色等級(jí),前面小于等于10%的部分為紅色,大于10%且小于等于20%為橙色,大于20%且小于等于40%的為黃色,大于40%的為綠色。
網(wǎng)絡(luò)輿情信息的搜集評(píng)估評(píng)判過(guò)程可以表示為圖1。
圖1 網(wǎng)絡(luò)輿情評(píng)估過(guò)程Fig.1 Network public opinion evaluation process
評(píng)估過(guò)程主要包括四塊功能,分別是輿情信息搜集、評(píng)估體系建設(shè)、多級(jí)評(píng)判和結(jié)果應(yīng)用。
3.1 輿情信息搜集
輿情信息的源頭通常是發(fā)布的一條或者多條消息,如果網(wǎng)民關(guān)注它,此輿情就會(huì)被不斷轉(zhuǎn)載、點(diǎn)擊、搜索,并且追加更為詳細(xì)的相關(guān)消息、追加評(píng)論、發(fā)布態(tài)度,還會(huì)撰寫文章、發(fā)表觀點(diǎn)。一條消息的基本信息表示為一個(gè)集合。
IB(主題,作者,時(shí)間,基本內(nèi)容,作者態(tài)度傾向),。
對(duì)消息進(jìn)行分析,可以補(bǔ)充集合。
IA(主題類別、發(fā)布者影響度、主題署名度、內(nèi)容傾向)。
在傳播過(guò)程中,逐漸產(chǎn)生一些新的信息,表示為集合。
ID(傳播渠道、傳播范圍、單擊次數(shù)、轉(zhuǎn)載次數(shù)、主題搜索次數(shù)、頁(yè)面數(shù)量、受眾態(tài)度)。
對(duì)同一事件引起的輿情信息進(jìn)行計(jì)數(shù),產(chǎn)生集合。
IC(Web頁(yè)面數(shù)量)。
對(duì)這些信息進(jìn)行統(tǒng)計(jì),會(huì)產(chǎn)生信息集合。
IS(Web頁(yè)面數(shù)量變化率、頁(yè)面點(diǎn)擊數(shù)量變化率、主題搜索數(shù)量變化率)。
應(yīng)該說(shuō),信息搜集是整個(gè)模型中最重要的一個(gè)環(huán)節(jié)。
網(wǎng)絡(luò)輿情的信息源包括各種各樣的網(wǎng)站、新聞、博客、論壇、社區(qū)、聊天室、微信。諸如騰訊新聞、迅雷新聞等站點(diǎn)是比較固定的輿情來(lái)源,天涯社區(qū)之類的網(wǎng)站信息流量非常大,而聊天室的信息變化大,blog類的站點(diǎn)內(nèi)容相對(duì)單一。因此,對(duì)于不同的輿情資源,應(yīng)該采用不同的技術(shù)實(shí)現(xiàn)輿情搜集。如圖1,對(duì)于建立了合作關(guān)系的站點(diǎn),可以選擇采用Mashup糅合技術(shù),對(duì)于其他關(guān)注站點(diǎn),選擇采用信息監(jiān)控技術(shù),以獲取輿情動(dòng)態(tài)。另外,流動(dòng)性大的場(chǎng)合完成信息搜集困難一些,比如聊天室,需要考慮有效的技術(shù)。
3.2 評(píng)估體系建設(shè)
網(wǎng)絡(luò)輿情評(píng)估體系建設(shè)是有效評(píng)估的關(guān)鍵。首先,需要在實(shí)踐中不斷地對(duì)項(xiàng)目進(jìn)行調(diào)整,以期有效地反映公眾的態(tài)度。其次,對(duì)各個(gè)評(píng)估項(xiàng)目的重要程度開展分析,為每個(gè)項(xiàng)目確定合適的權(quán)重,實(shí)現(xiàn)網(wǎng)絡(luò)輿情評(píng)估體系的數(shù)據(jù)化。
3.3 多級(jí)評(píng)估
在對(duì)網(wǎng)絡(luò)輿情按照評(píng)估體系規(guī)范化之后,根據(jù)各個(gè)項(xiàng)目所占權(quán)重計(jì)算輿情的綜合評(píng)判結(jié)果,完成多級(jí)評(píng)判。
任一輿情的評(píng)判計(jì)算模型可以表示為
W=∑(Ai*∑(Bj*∑(Ck*w))),
其中Ai為一級(jí)指標(biāo)權(quán)重,Bj為二級(jí)指標(biāo)權(quán)重,Ck為三級(jí)指標(biāo)權(quán)重,w為某三級(jí)指標(biāo)的計(jì)算值。
多級(jí)評(píng)判的結(jié)果W表現(xiàn)為一個(gè)數(shù)字,數(shù)字越大表示輿情越重要。按照評(píng)判結(jié)果從大到小對(duì)輿情排序,劃分輿情等級(jí),實(shí)現(xiàn)輿情預(yù)警。
3.4 結(jié)果應(yīng)用
對(duì)結(jié)果的應(yīng)用主要表現(xiàn)在下面幾個(gè)方面:
(1)對(duì)不良網(wǎng)絡(luò)輿情進(jìn)行預(yù)警,進(jìn)行有效的引導(dǎo),避免發(fā)生危機(jī);
(2)關(guān)注民生,及時(shí)處理反映出來(lái)的問(wèn)題;
(3)幫助制定有效的不良輿情預(yù)案;
(4)幫助開發(fā)更先進(jìn)的輿情監(jiān)測(cè)產(chǎn)品。
本文研究了在既有的網(wǎng)絡(luò)輿情評(píng)估體系下,對(duì)網(wǎng)絡(luò)輿情信息進(jìn)行搜集、分析、統(tǒng)計(jì)、預(yù)警的軟件模型。首先信息搜集由文章分詞軟件模塊實(shí)現(xiàn)關(guān)鍵詞識(shí)別,其次使用數(shù)學(xué)方法進(jìn)行統(tǒng)計(jì);再次對(duì)統(tǒng)計(jì)數(shù)據(jù)按照網(wǎng)絡(luò)輿情評(píng)估體系給定的權(quán)值進(jìn)行計(jì)算,產(chǎn)生輿情信息的評(píng)估值;最后按照評(píng)估值對(duì)輿情信息分色排序,供輿情預(yù)警使用。有效的輿情預(yù)警不但依賴于網(wǎng)絡(luò)輿情評(píng)估體系建設(shè),也和信息搜集、分析、統(tǒng)計(jì)等原始數(shù)據(jù)密切相關(guān)。并且,隨著社會(huì)環(huán)境、信息流通環(huán)境、價(jià)值觀的變化,也會(huì)對(duì)評(píng)估方法產(chǎn)生影響。總之,網(wǎng)絡(luò)輿情評(píng)估是一個(gè)長(zhǎng)期的、不斷變化的過(guò)程,對(duì)它的研究不可停止。
[1]戴媛,郝曉偉,郭巖,等. 我國(guó)網(wǎng)絡(luò)輿情安全評(píng)估指標(biāo)體系的構(gòu)建研究[J]. 信息網(wǎng)絡(luò)與安全,2010(4):12 - 15.
[2]吳紹中,李淑華. 互聯(lián)網(wǎng)絡(luò)輿情預(yù)警機(jī)制研究[J]. 中國(guó)人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版),2008(3):38 - 42.
[3]王青,成穎,巢乃鵬. 網(wǎng)絡(luò)輿情監(jiān)測(cè)及預(yù)警指標(biāo)體系構(gòu)建研究[J]. 情報(bào)科學(xué),2011(7):7 - 10.
[4]朱輝,駱公志.網(wǎng)絡(luò)輿情評(píng)估EHA 三維指標(biāo)體系的構(gòu)建[J].南京郵電大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2013(15):37-42.
[5]謝海光,陳中潤(rùn). 互聯(lián)網(wǎng)內(nèi)容及輿情深度分析模式[J].中國(guó)青年政治學(xué)院學(xué)報(bào),2006(3):95 - 100.
[6]全曉松,陳永華,孔浩.新媒體環(huán)境下高校自組織網(wǎng)絡(luò)群輿論引導(dǎo)研究[J].西安電子科技大學(xué)學(xué)報(bào),2012,22(1):107-109.
[7]孔浩,全曉松,陳永華. 高校學(xué)生網(wǎng)絡(luò)社區(qū)輿論搜集中同義詞分詞器的設(shè)計(jì)與實(shí)現(xiàn)[J]. 北京郵電大學(xué)學(xué)報(bào),2012(5):5- 8.
Online public opinion assessment model for large data environments
XIE Shu-yun,QUAN Xiao-song,SHEN Yun-cheng
(College of Information Science and Technology, Zhaotong University,Zhaotong Yunnan 657000, China)
In the big data environment, you can find the public's attitudes toward social events from the network. Network access to information made public opinion Mashup mode, assessment data collection; specific evaluation index system of network public opinion, public opinion put forward a common integrated measurement method, to achieve the classification of public opinion measurement; low public opinion of the network is divided into red , orange, yellow, blue, black and five levels for decision making.
Big data; Internet public opinion; Mashup; Evaluation system; Comprehensive measure
2016-02-02
云南省教育廳科學(xué)研究基金:“校園網(wǎng)絡(luò)自組織群輿論數(shù)據(jù)挖掘與引導(dǎo)措施研究”(項(xiàng)目編號(hào):2012C180)。
謝樹云(1976-),男,云南昭通人,副教授、碩士。主要研究方向:計(jì)算機(jī)軟件。 全曉松(1966-),男,云南昭通人,副教授。主要研究方向:計(jì)算機(jī)軟件。 申云成(1979-),男,云南昭通人,副教授、博士。主要研究方向:計(jì)算機(jī)科學(xué)與技術(shù)。
TP393.09
A
1673-6125(2016)01-0054-04