張鵬 蘭月新 李昊青 周穎
摘要:[目的/意義]提前進(jìn)行網(wǎng)絡(luò)謠言監(jiān)控和預(yù)警是立體化防控網(wǎng)絡(luò)謠言、增強(qiáng)社會(huì)穩(wěn)定、提高政府執(zhí)政能力的關(guān)鍵。移動(dòng)互聯(lián)網(wǎng)時(shí)代,突發(fā)事件發(fā)生后極易在網(wǎng)絡(luò)上引起熱點(diǎn)輿情、網(wǎng)絡(luò)危機(jī)信息的傳播同時(shí)為網(wǎng)絡(luò)謠言的擴(kuò)散提供良好的土壤,無(wú)形中增大了政府部門(mén)應(yīng)對(duì)謠言的挑戰(zhàn)。[方法/過(guò)程]本文采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)構(gòu)建網(wǎng)絡(luò)謠言危機(jī)預(yù)警模型,擬實(shí)現(xiàn)對(duì)突發(fā)事件網(wǎng)絡(luò)謠言的監(jiān)控、預(yù)警仿真及風(fēng)險(xiǎn)的量化評(píng)估。實(shí)證分析案例選取天津“8-12”爆炸事故與“和頤酒店女生遇襲事件”,通過(guò)計(jì)算機(jī)對(duì)這兩起突發(fā)事件衍生的網(wǎng)絡(luò)謠言建立預(yù)警模型,并對(duì)模擬仿真結(jié)果進(jìn)行驗(yàn)證。[結(jié)果/結(jié)論]結(jié)果表明,遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型在突發(fā)事件網(wǎng)絡(luò)謠言危機(jī)預(yù)警方面具有較好的適用性,與僅采用BP神經(jīng)網(wǎng)絡(luò)模型相比預(yù)警的準(zhǔn)確性更好。
關(guān)鍵詞:突發(fā)事件;網(wǎng)絡(luò)謠言:BP神經(jīng)網(wǎng)絡(luò);遺傳算法;危機(jī)預(yù)警;預(yù)警指標(biāo)
DOl: 10 .3969/j .issn .1008 -0821 .2019 .12 .012
[中圖分類(lèi)號(hào)] G206.2 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1008-0821 (2019) 12-0101-08
中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心( CNNIC)第44次統(tǒng)計(jì)公報(bào)數(shù)據(jù)表明,截至2019年6月,中國(guó)現(xiàn)有網(wǎng)民總數(shù)約為8.54億,其中移動(dòng)互聯(lián)網(wǎng)上網(wǎng)人數(shù)達(dá)到8.47億,以手機(jī)為平臺(tái)的網(wǎng)民成為上網(wǎng)主力[1]。在眾多互聯(lián)網(wǎng)應(yīng)用中,其中參與微博的用戶數(shù)超過(guò)3億,微博上發(fā)聲的網(wǎng)民具有相當(dāng)?shù)木W(wǎng)民代表性。便攜式移動(dòng)上網(wǎng)設(shè)備的普及從根本上改變了公眾參與時(shí)事的廣度和深度,也對(duì)大眾輿論產(chǎn)生了深遠(yuǎn)的影響。
重大突發(fā)事件產(chǎn)生后,網(wǎng)絡(luò)環(huán)境中會(huì)很快形成熱點(diǎn)輿情,在多種因素的共同作用下,原始輿情會(huì)通過(guò)信息異化過(guò)程,極易演變?yōu)槎鄠€(gè)版本的網(wǎng)絡(luò)謠言。同時(shí)網(wǎng)絡(luò)輿情在信息傳播過(guò)程中往往伴隨網(wǎng)絡(luò)謠言的不斷生成和擴(kuò)散過(guò)程,呈現(xiàn)出網(wǎng)絡(luò)輿情信息異化的一些典型特征[2]。但由于突發(fā)事件引發(fā)的網(wǎng)絡(luò)謠言的匿名性、惡意性等會(huì)導(dǎo)致的各類(lèi)信息快速傳播,造成廣泛的負(fù)面影響,從而引發(fā)網(wǎng)絡(luò)謠言危機(jī)。如政府相關(guān)部門(mén)的監(jiān)測(cè)和干預(yù)不及時(shí)從而導(dǎo)致謠言泛濫并伴隨衍生謠言出現(xiàn),極易引發(fā)網(wǎng)絡(luò)群體性事件發(fā)生,甚至于出現(xiàn)網(wǎng)上危機(jī)向網(wǎng)下轉(zhuǎn)移的潛在風(fēng)險(xiǎn)。這些由網(wǎng)絡(luò)傳播造成的危機(jī),不僅對(duì)社會(huì)穩(wěn)定提出挑戰(zhàn),也同時(shí)對(duì)個(gè)體、經(jīng)濟(jì)、社會(huì)等實(shí)體環(huán)境產(chǎn)生惡劣影響,從而進(jìn)一步增大政府后期的治理與修復(fù)公信力的成本[3]。因此在這種復(fù)雜的網(wǎng)絡(luò)謠言危機(jī)狀態(tài)下,對(duì)網(wǎng)絡(luò)謠言識(shí)別、監(jiān)測(cè)、預(yù)警相比通常意義上的網(wǎng)絡(luò)輿情難度更大。而對(duì)網(wǎng)絡(luò)謠言預(yù)警的需求與目前國(guó)內(nèi)大多學(xué)者在定性分析網(wǎng)絡(luò)謠言擴(kuò)散機(jī)理和治理對(duì)策上所提供的學(xué)術(shù)支持相比,在監(jiān)測(cè)、預(yù)警等定量方面的研究方面需進(jìn)一步加強(qiáng),而從定量角度研究網(wǎng)絡(luò)謠言危機(jī)預(yù)警是適時(shí)啟動(dòng)應(yīng)急預(yù)案,同時(shí)也是分步分級(jí)應(yīng)對(duì)的基礎(chǔ)。
本文在前人研究基礎(chǔ)上,剖析網(wǎng)絡(luò)謠言的自身特征,建立相應(yīng)的預(yù)警指標(biāo)體系,構(gòu)建了基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)的仿真模型,并以天津“8·12”爆炸事故與“和頤酒店女生遇襲事件”為例進(jìn)行實(shí)證分析,結(jié)果表明構(gòu)建的模型對(duì)突發(fā)事件網(wǎng)絡(luò)謠言危機(jī)的定量預(yù)警能夠取得較好效果。
1 網(wǎng)絡(luò)謠言預(yù)警指標(biāo)體系構(gòu)建
“從某種意義上說(shuō)網(wǎng)絡(luò)謠言是網(wǎng)絡(luò)輿情在傳播過(guò)程中信息異化而產(chǎn)生的,同時(shí)起到對(duì)原始輿情的發(fā)展進(jìn)行促進(jìn)和誘導(dǎo)作用[2]”,而突發(fā)事件網(wǎng)絡(luò)謠言預(yù)警體系的建設(shè),需要在對(duì)其組成要素的本質(zhì)特征的理解而后進(jìn)行。但針對(duì)網(wǎng)絡(luò)謠言的有效預(yù)警的探討仍然是新聞學(xué)和傳播學(xué)等多學(xué)科中需要解決的難題,目前在這些學(xué)科中的定性探討方面有了一定研究,但在與計(jì)算機(jī)、大數(shù)據(jù)、人工智能領(lǐng)域相結(jié)合的定量的研究仍需加強(qiáng)。在此之前,借鑒研究相對(duì)成熟的網(wǎng)絡(luò)輿情構(gòu)建指標(biāo)體系,結(jié)合計(jì)算傳播學(xué)中有關(guān)指標(biāo)定量化的計(jì)算方式,以期建立網(wǎng)絡(luò)謠言預(yù)警模型。在指標(biāo)體系的構(gòu)建和選取過(guò)程中,本文參考了國(guó)內(nèi)外多位學(xué)者的相關(guān)理論,從多個(gè)角度對(duì)此問(wèn)題進(jìn)行理解。如在構(gòu)建網(wǎng)絡(luò)輿情預(yù)警指標(biāo)體系時(shí),有的學(xué)者強(qiáng)調(diào)了模糊數(shù)學(xué)和層次分析法的應(yīng)用,并最終將指標(biāo)體系定為包含民眾關(guān)注和態(tài)度傾向等在內(nèi)的四維度[4]:也有學(xué)者從突發(fā)事件發(fā)生后相關(guān)網(wǎng)絡(luò)輿情的傳播規(guī)律人手,建立包含警源在內(nèi)的3類(lèi)要素的指標(biāo)體系[5];另有學(xué)者從信息特征、事態(tài)擴(kuò)散和網(wǎng)民反應(yīng)3個(gè)方面出發(fā),構(gòu)建網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)評(píng)估體系[6];還有學(xué)者將輿情擴(kuò)散度、聚焦度等4個(gè)方面作為重大輿情事件監(jiān)測(cè)的一級(jí)指標(biāo)[7]。綜合前人研究成果,本文在相應(yīng)預(yù)警指標(biāo)體系構(gòu)建時(shí)以科學(xué)性和可行性為重點(diǎn),盡可能保證對(duì)研究對(duì)象傳播規(guī)律全面覆蓋的基礎(chǔ)上,同時(shí)考慮定量數(shù)據(jù)采集的可行性。
1.1 指標(biāo)構(gòu)建
由于目前針對(duì)網(wǎng)絡(luò)謠言的定量化研究尚不深入,因此相應(yīng)的預(yù)警指標(biāo)體系研究是預(yù)警工作的前提[8]。但對(duì)于突發(fā)事件網(wǎng)絡(luò)謠言危機(jī)預(yù)警工作該體系中的末級(jí)指標(biāo)多為定性指標(biāo),難以進(jìn)行定量分析應(yīng)用,無(wú)法充分體現(xiàn)網(wǎng)絡(luò)謠言所具有的動(dòng)態(tài)性。
有學(xué)者G.W奧爾波特將謠言所涉及事件的模糊性作為衡量謠言影響力的重要指標(biāo),公式為:謠言=事件的重要性×事件的模糊性[9]。而學(xué)者克羅斯則認(rèn)為公眾的辨識(shí)能力強(qiáng)弱(批判力)是謠言的產(chǎn)生和傳播能力的重要影響因子,因此他修正公式為:“謠言=事件的重要性×事件的模糊性/批判力”[10]。在此基礎(chǔ)上,有學(xué)者認(rèn)為促使謠言生成的關(guān)鍵因素還包括事件信息的敏感性,并改進(jìn)公式為:“謠言=(重要性+敏感性)×模糊性/批判力”[2]。
基于此,本文在前人對(duì)網(wǎng)絡(luò)輿情預(yù)警指標(biāo)體系研究的基礎(chǔ)上,結(jié)合網(wǎng)絡(luò)謠言的相關(guān)特征,構(gòu)建包括事件輿情熱度在內(nèi)的一級(jí)指標(biāo)和網(wǎng)絡(luò)搜索量在內(nèi)的二級(jí)指標(biāo),如圖1所示:
該指標(biāo)體系包含了事件輿情熱度、網(wǎng)絡(luò)謠言狀態(tài)和網(wǎng)絡(luò)謠言趨勢(shì)3個(gè)一級(jí)指標(biāo),每個(gè)一級(jí)指標(biāo)下選取3個(gè)相關(guān)度較高的二級(jí)指標(biāo)。
1.2 指標(biāo)的含義及分析
網(wǎng)絡(luò)謠言預(yù)警指標(biāo)體系中各指標(biāo)的選取既要能客觀地反映出網(wǎng)絡(luò)謠言的屬性和特征,又能夠盡量從客觀上使得這些指標(biāo)體系能夠量化。為更好地說(shuō)明本文所構(gòu)建的該預(yù)警體系,具體各級(jí)指標(biāo)將詳述如下:
1.2.1 事件輿情熱度
事件輿情熱度通常是指網(wǎng)民對(duì)某突發(fā)事件在一定時(shí)間里的關(guān)注程度。一般認(rèn)為某事件輿情熱度越高,則越容易滋生各類(lèi)網(wǎng)絡(luò)謠言。當(dāng)權(quán)威媒體在突發(fā)事件發(fā)生后難以提供時(shí)效性強(qiáng)的災(zāi)難新聞時(shí),網(wǎng)絡(luò)謠言因其快速、低成本和海量信息,對(duì)于公眾而言更易成為官方媒體缺失時(shí)的替代性新聞,混淆事實(shí)與觀點(diǎn)[11]。因此當(dāng)一件關(guān)系到經(jīng)濟(jì)民生、公共安全等的突發(fā)事件發(fā)生時(shí),如果主流媒體權(quán)威信息發(fā)布不及時(shí),那么就會(huì)產(chǎn)生謠言來(lái)填補(bǔ)這段“信息空窗期”,即所謂“災(zāi)難之后盡謠言[12]”。因此,本文選取網(wǎng)絡(luò)搜索量、轉(zhuǎn)發(fā)量和評(píng)論量3個(gè)二級(jí)指標(biāo)來(lái)表現(xiàn)突發(fā)事件輿情的熱度構(gòu)成。
大量研究實(shí)踐表明,網(wǎng)絡(luò)謠言在空間傳播的渠道主要包括博客(微博)、論壇和微信3類(lèi)。在本文選取的天津“8·12”爆炸事故案例中,微博作為擁有62. 96%網(wǎng)絡(luò)謠言的首發(fā)渠道,多次介入該公共事件的輿論引導(dǎo)過(guò)程。這意味著微博具有分化傳播權(quán)利和多元表達(dá)空間等優(yōu)勢(shì),搭建了官民傳播訴求實(shí)現(xiàn)的最佳平臺(tái)[13]。鑒于此,本文選取微博作為主要的數(shù)據(jù)來(lái)源。
1)網(wǎng)絡(luò)搜索量
當(dāng)某一敏感突發(fā)事件發(fā)生時(shí),人們迫切希望知道真相和內(nèi)情,但由于傳統(tǒng)媒體報(bào)道具有一定的滯后性,因此人們會(huì)有一個(gè)自發(fā)在網(wǎng)絡(luò)上尋求信息補(bǔ)足的過(guò)程,因此可以用某個(gè)關(guān)鍵詞的網(wǎng)絡(luò)搜索量來(lái)反映人們對(duì)某一事件的關(guān)注和興趣。網(wǎng)絡(luò)搜索量可用百度指數(shù)來(lái)量化,此指數(shù)表示網(wǎng)民使用百度搜索引擎工具對(duì)某一關(guān)注問(wèn)題的搜索量作為數(shù)據(jù)基礎(chǔ),通過(guò)百度內(nèi)聯(lián)算法分析出被搜索的信息在全部使用百度搜索工具的總搜索頻次的加權(quán)和。
2)評(píng)論量
評(píng)論量的計(jì)算可采用其他微博用戶評(píng)論某微博時(shí)的次數(shù)的總和。研究認(rèn)為若某網(wǎng)民用戶對(duì)某條原創(chuàng)微博進(jìn)行了相關(guān)評(píng)論,則表示他對(duì)此微博內(nèi)容的關(guān)注,據(jù)此推斷,如果某條微博被其他用戶評(píng)論的次數(shù)多,則代表該微博內(nèi)容具有較高的網(wǎng)絡(luò)熱度,對(duì)網(wǎng)民的吸引力較高。
3)轉(zhuǎn)發(fā)量
轉(zhuǎn)發(fā)量的計(jì)算可采用單個(gè)原創(chuàng)微博被其他用戶轉(zhuǎn)發(fā)的數(shù)量總和??梢哉J(rèn)為被轉(zhuǎn)發(fā)的微博代表了他人對(duì)此微博觀點(diǎn)的認(rèn)同。微博空間用戶可分為四種:發(fā)文者、轉(zhuǎn)發(fā)者、評(píng)論者和瀏覽者(本文中將點(diǎn)贊用戶包含在瀏覽者中一起考慮,但同時(shí)該點(diǎn)贊用戶也可能參與了轉(zhuǎn)發(fā)和評(píng)論,為了避免重復(fù)計(jì)數(shù),在本文中不進(jìn)行單獨(dú)統(tǒng)計(jì))。
1.2.2 網(wǎng)絡(luò)謠言狀態(tài)
1)事件模糊度
該指標(biāo)反映事件的模糊程度。該公式表明在公眾批判能力一定的前提下,某件事情和人們的切身利益相關(guān)度越高,該事件固有的不確定性和模糊性越強(qiáng),伴隨衍生謠言傳播的空間和可能性就越大。為方便數(shù)據(jù)采集,本文選取事件模糊度作為衡量網(wǎng)絡(luò)謠言產(chǎn)生可能性大小的指標(biāo)。判別謠言的模糊性大小的依據(jù)根據(jù)專(zhuān)家認(rèn)知后進(jìn)行評(píng)分獲得,取值范圍在[0,1]之間。評(píng)判原則為某突發(fā)事件輿情傳播時(shí),對(duì)該事件包含原因、經(jīng)過(guò)等信息很模糊,存在諸多疑點(diǎn),可判斷為0;而事情的前因后果都比較清楚、沒(méi)有疑問(wèn)則判斷為1。
2)輿情異化度
在這里輿情異化度是指原始輿情在信息異化的作用下,其分化,衍生出新輿情的強(qiáng)度。信息異化理論認(rèn)為輿情信息在傳播過(guò)程中由于受到“噪聲”干擾而發(fā)生扭曲、失真,即信息本真態(tài)的背離。突發(fā)事件網(wǎng)絡(luò)輿情由于不同“噪聲”干擾,可衍生出不同版本的網(wǎng)絡(luò)謠言,原始輿情異化程度越高,政府的防治難度越大。本文中該指標(biāo)采用輿情異化后出現(xiàn)的不同網(wǎng)絡(luò)謠言版本數(shù)量進(jìn)行衡量。
3)網(wǎng)民情緒傾向
指突發(fā)事件之后,網(wǎng)絡(luò)謠言?xún)?nèi)容表現(xiàn)出的情緒傾向,如質(zhì)疑、恐懼等。以天津“8·12”爆炸事故為例,按照“編號(hào)一主題詞一集體情緒”對(duì)網(wǎng)絡(luò)謠言文本進(jìn)行提煉和解讀,并將其分為“質(zhì)疑”、“恐慌”和“正能量”3類(lèi)[14]。其中“質(zhì)疑”類(lèi)謠言主要針對(duì)政府和主流媒體,影響程度較高,賦值為1;“恐慌”類(lèi)謠言來(lái)源于造謠者和傳謠者的心理特征,其影響程度次之,賦值為0;“正能量”謠言危害最低,賦值為一1。該指標(biāo)由統(tǒng)計(jì)時(shí)段內(nèi)各類(lèi)謠言賦值代數(shù)和來(lái)表示。
1.2.3 網(wǎng)絡(luò)謠言變化趨勢(shì)
1)媒體報(bào)道頻次
該指標(biāo)用與突發(fā)事件相關(guān)的微博信息發(fā)布量表示,反映了媒體對(duì)網(wǎng)絡(luò)謠言消解的程度。
2)信息公開(kāi)及時(shí)度
“在網(wǎng)絡(luò)輿論生態(tài)系統(tǒng)中造謠者和辟謠者是一對(duì)存在重要共生關(guān)系的對(duì)手”[15]。敏感性突發(fā)事件發(fā)生后,公眾急于尋求事情真相,政府和媒體作為權(quán)威信息的發(fā)布者,對(duì)于滿足公民知情權(quán)和消解謠言起到了至關(guān)重要的作用。隨著微博、微信、貼吧等新媒體的興起,極大拉近了普通民眾與突發(fā)事件的距離,網(wǎng)上言論參與到突發(fā)事件的發(fā)展過(guò)程當(dāng)中,甚至直接推動(dòng)和主導(dǎo)了事件,傳統(tǒng)的網(wǎng)上輿情處置“黃金24小時(shí)”也逐漸應(yīng)對(duì)乏力。在這種情況下,有學(xué)者提出了“黃金4小時(shí)”概念。但不論是24小時(shí)還是4小時(shí),突發(fā)事件后政府和媒體發(fā)布權(quán)威消息越及時(shí),謠言產(chǎn)生的概率越低。該指標(biāo)用謠言產(chǎn)生后政府或主流媒體發(fā)布的第一條辟謠信息所用平均時(shí)間來(lái)表示。
3)謠言識(shí)別能力
網(wǎng)絡(luò)謠言的產(chǎn)生和傳播不僅僅由突發(fā)事件本身的敏感性、重要性和模糊性決定,同時(shí)也依賴(lài)于對(duì)信息解讀者,即網(wǎng)民的認(rèn)知水平。一般認(rèn)為,網(wǎng)民個(gè)體由于知識(shí)積累或者相關(guān)從業(yè)經(jīng)驗(yàn)導(dǎo)致的認(rèn)知水平越高,對(duì)網(wǎng)絡(luò)謠言的抗御能力相對(duì)較強(qiáng)[16]。然而由于個(gè)人知識(shí)廣度和深度的限制,不同的人對(duì)同一謠言的可抗能力是不同的。該指標(biāo)可由專(zhuān)家打分法獲得,取值區(qū)間為[0,1],代表面對(duì)某一謠言時(shí)受眾的平均可抗水平,0為沒(méi)有抗力,1為完全能識(shí)別謠言。
2 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)
通過(guò)對(duì)網(wǎng)絡(luò)謠言傳播和擴(kuò)散特點(diǎn)的研究表明,影響網(wǎng)絡(luò)謠言傳播擴(kuò)散的因素很多且多個(gè)影響因素之間存在復(fù)雜的非線性關(guān)系。傳統(tǒng)的數(shù)學(xué)模型多為基于線性關(guān)系而構(gòu)建的,因而無(wú)法有效模擬多因素耦合導(dǎo)致的網(wǎng)絡(luò)謠言爆發(fā)的相關(guān)關(guān)系。而B(niǎo)P神經(jīng)網(wǎng)絡(luò)的特點(diǎn)是它能逼近任意連續(xù)函數(shù),且具備極強(qiáng)的非線性映射的能力。它的這種優(yōu)點(diǎn)非常適合處理內(nèi)部運(yùn)行機(jī)制復(fù)雜、具有全局性問(wèn)題特征的實(shí)際非線性問(wèn)題。BP神經(jīng)網(wǎng)絡(luò)算法目前已經(jīng)被廣泛應(yīng)用于系統(tǒng)模式識(shí)別、計(jì)算機(jī)圖像處理和各類(lèi)自然災(zāi)害風(fēng)險(xiǎn)評(píng)估與預(yù)警當(dāng)中。但從數(shù)學(xué)的角度看標(biāo)準(zhǔn)的BP神經(jīng)網(wǎng)絡(luò)存在一定局限性,該算法的優(yōu)點(diǎn)能對(duì)局部搜索進(jìn)行優(yōu)化,能夠有較好效果,但當(dāng)在求解復(fù)雜非線性函數(shù)全局極值的時(shí)候存在不足。因此當(dāng)使用標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)使用梯度下降法訓(xùn)練構(gòu)建的網(wǎng)絡(luò)結(jié)構(gòu)時(shí),它更可能陷入局部極值導(dǎo)致訓(xùn)練失敗。
遺傳算法是一種基于生物界自我遺傳機(jī)理的隨機(jī)搜索算法,通過(guò)反復(fù)交叉迭代等一系列操作可以有效求解全局最優(yōu)解。這有效地彌補(bǔ)了標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)算法的缺點(diǎn)。當(dāng)我們利用該算法進(jìn)行求解時(shí),問(wèn)題的每個(gè)個(gè)體(可能解)都被編碼成為一個(gè)“染色體”(具有遺傳信息),若干個(gè)個(gè)體構(gòu)成了群體(所有的可能解)。本文充分結(jié)合標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)和遺傳算法在各自領(lǐng)域的獨(dú)特優(yōu)勢(shì),并利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)所需要的初始權(quán)值和閥值。在此過(guò)程中,遺傳算法的全局搜索特征用于尋找相關(guān)問(wèn)題的最優(yōu)解所在的區(qū)域,再利用誤差反向傳播法找到此最優(yōu)解。步驟如下:
第一步,種群初始化。每個(gè)個(gè)體的“染色體”均可視為1個(gè)二進(jìn)制字符串,該字符串分別由輸入層與隱含層連接權(quán)值、隱含層閥值、隱含層與輸出層連接權(quán)值和輸出層閥值四部分編碼組成,將上面所有列出的權(quán)值和閥值的編碼組合以形成個(gè)體二進(jìn)制編碼,而初始群體即為一連串隨機(jī)生成的M個(gè)個(gè)體。
第二步,適應(yīng)度函數(shù)。將網(wǎng)絡(luò)謠言預(yù)測(cè)樣本的預(yù)測(cè)值與期望值之間的偏差的平方和作為目標(biāo)函數(shù)的輸出。目標(biāo)函數(shù)的輸出值越小代表網(wǎng)絡(luò)預(yù)測(cè)能力越好。但在遺傳算法中是適應(yīng)度值越大表示效果越好。因此,適應(yīng)度函數(shù)可以用目標(biāo)函數(shù)的倒數(shù)來(lái)進(jìn)行定義。(期望輸入為YK,預(yù)測(cè)輸出為CK,共有m組值)因此,可以得到適應(yīng)度函數(shù)為:
第三步,選擇、交叉與變異。遺傳算法中的選擇操作采用輪盤(pán)賭算法來(lái)進(jìn)行、交叉采用常用的單點(diǎn)交叉算子,而變異采用的通過(guò)隨機(jī)概率產(chǎn)生一些變異基因數(shù),通過(guò)采用隨機(jī)的方法選出發(fā)生變異的“染色體”基因。如果所選的基因編碼為1,則變?yōu)?;反之,則變?yōu)?。
第四步,重復(fù)第二和第三步,反復(fù)迭代直到達(dá)到進(jìn)化代數(shù)或滿足該算法誤差要求。此時(shí),就得到了通過(guò)遺傳算法優(yōu)化后所需的初始權(quán)值和閥值。
第五步,將上一步驟中獲得的權(quán)值和閥值用作標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)模型的初始權(quán)值和閥值。
第六步,按照標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,直到達(dá)到最大訓(xùn)練次數(shù)或滿足模型需要的訓(xùn)練誤差要求。保存當(dāng)前用到的所有的權(quán)值和閥值。
第七步,此時(shí)優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)將用于最終預(yù)警模型。
3 基于Matlab的模擬仿真
該仿真所需軟件環(huán)境為Matlab R2015b,使用該軟件附帶的BP神經(jīng)網(wǎng)絡(luò)工具箱,可以靈活搭建所需模擬情境,從而避開(kāi)復(fù)雜的計(jì)算機(jī)語(yǔ)言和程序算法,方便操作和實(shí)驗(yàn)。
3.1 輸入數(shù)據(jù)的歸一化處理
構(gòu)建網(wǎng)絡(luò)謠言危機(jī)預(yù)警模型指標(biāo)體系不僅有定性和定量之分,同時(shí)也有正向和負(fù)向之別,為允許各種類(lèi)型的指標(biāo)在一定程度上可衡量其相對(duì)大小,有必要規(guī)范化每個(gè)指標(biāo)的原始數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)化為[0,1]上的無(wú)量綱值,指標(biāo)歸一化處理方式如下文所示:
3.1.1 正向指標(biāo)處理
在本文中,正向指標(biāo)的值越大,代表越安全,對(duì)應(yīng)危機(jī)等級(jí)也越小。其無(wú)歸一化處理時(shí)以所有數(shù)據(jù)中最小值為基準(zhǔn),公式如下:
3.1.3 指標(biāo)性質(zhì)
如上文所述,網(wǎng)絡(luò)謠言危機(jī)預(yù)警指標(biāo)體系中每個(gè)末級(jí)指標(biāo)都需要進(jìn)行正、負(fù)性質(zhì)的區(qū)分,根據(jù)模型所需定義結(jié)果如表1所示。
3.2 隱含節(jié)點(diǎn)及輸出節(jié)點(diǎn)的選擇
本文對(duì)于模型所需的隱含節(jié)點(diǎn)與輸出節(jié)點(diǎn)的選擇是模型得以成功構(gòu)建的關(guān)鍵。本文隱含層節(jié)點(diǎn)數(shù)N是根據(jù)相關(guān)經(jīng)驗(yàn)來(lái)確定,一般采用式(3)進(jìn)行計(jì)算:
N=√m+n+α (3)
構(gòu)建的模型中輸入層節(jié)點(diǎn)數(shù)是m,輸出層節(jié)點(diǎn)數(shù)是n,α定義為1-10之間的常數(shù)。
3.3 案例選取與數(shù)據(jù)樣本
本文選取天津“8·12”爆炸事故與“和頤酒店女生遇襲事件”作為研究樣本,來(lái)檢測(cè)預(yù)警模型的適用性。數(shù)據(jù)主要來(lái)源于百度搜索引擎提供的百度指數(shù)和新浪微博每日提供的實(shí)時(shí)數(shù)據(jù)。天津“8·12”爆炸事故于2015年8月12日23:30左右發(fā)生,13日引發(fā)大規(guī)模網(wǎng)絡(luò)輿情,至23日事故引發(fā)的網(wǎng)絡(luò)輿情逐漸平息。據(jù)統(tǒng)計(jì),圍繞這次爆炸事故的細(xì)節(jié),網(wǎng)絡(luò)上共產(chǎn)生27個(gè)不同謠言版本。在“和頤酒店女生遇襲事件”發(fā)生的7天內(nèi),新浪微博該話題閱讀量就達(dá)到了27.4億人次,也同時(shí)創(chuàng)下當(dāng)時(shí)新的傳播記錄。同樣,該事件在形成網(wǎng)絡(luò)輿論的同時(shí),也衍生出了多個(gè)的網(wǎng)絡(luò)謠言版本。上述兩個(gè)案例所衍生的網(wǎng)絡(luò)謠言產(chǎn)生模式不同于一般的網(wǎng)絡(luò)謠言,沒(méi)有醞釀期而是直接在事件發(fā)生后第二天集中爆發(fā),且謠言從產(chǎn)生到最終消解時(shí)間較短,非常符合突發(fā)事件網(wǎng)絡(luò)謠言的相關(guān)特征。因此選取此兩例具有代表性的研究對(duì)象,案例模擬結(jié)果對(duì)于突發(fā)事件網(wǎng)絡(luò)謠言危機(jī)預(yù)警研究具有較強(qiáng)的代表意義。
天津“8·12”爆炸事故中的網(wǎng)絡(luò)輿論從12日晚到16日晚共6天時(shí)間,經(jīng)歷了產(chǎn)生到消亡的完整過(guò)程。由于網(wǎng)絡(luò)謠言爆發(fā)時(shí)間相對(duì)集中,因此本文以6個(gè)小時(shí)為單位,將12日晚18:00到16日晚18:00劃分為16個(gè)時(shí)間段進(jìn)行相關(guān)數(shù)據(jù)的采集和統(tǒng)計(jì):“和頤酒店女生遇襲事件”網(wǎng)絡(luò)輿情從3日晚產(chǎn)生到18日基本消解完畢,該案例以天為單位共提取了16個(gè)數(shù)據(jù)段。兩個(gè)案例中數(shù)據(jù)經(jīng)過(guò)歸一化處理后如表2(保留3位小數(shù))所示。
本文中筆者與之前構(gòu)建的標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)對(duì)單一突發(fā)事件網(wǎng)絡(luò)謠言預(yù)警模型設(shè)置11監(jiān)測(cè)時(shí)間段和選取1個(gè)觀測(cè)點(diǎn)進(jìn)行預(yù)警模擬相比[8],本文選取2個(gè)案例,共設(shè)置32個(gè)時(shí)間段,擬預(yù)設(shè)5個(gè)預(yù)測(cè)觀測(cè)點(diǎn)對(duì)構(gòu)建的網(wǎng)絡(luò)謠言危機(jī)預(yù)警模型進(jìn)行驗(yàn)證,為本文所倡導(dǎo)的模型的探索做了進(jìn)一步研究,為模型最大程度得到適用提供參考。
3.4 遺傳算法與BP神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置
3.4.1 BP神經(jīng)網(wǎng)絡(luò)算法
本文所述的突發(fā)事件網(wǎng)絡(luò)謠言危機(jī)預(yù)警模型的構(gòu)建,采用單隱層的三層BP神經(jīng)網(wǎng)絡(luò),從輸入層輸入遺傳算法優(yōu)化處理過(guò)的末級(jí)(歸一化)指標(biāo)數(shù)據(jù),輸出層可輸出相應(yīng)的網(wǎng)絡(luò)謠言危機(jī)預(yù)警級(jí)別,其結(jié)構(gòu)如圖2所示。
根據(jù)隱含層的節(jié)點(diǎn)計(jì)算式(3),在輸入節(jié)點(diǎn)數(shù)m=9,輸出節(jié)點(diǎn)數(shù)n=4的情況下,將α從1-10遍歷計(jì)算的結(jié)果,發(fā)現(xiàn)當(dāng)α=4時(shí),此時(shí)BP神經(jīng)網(wǎng)絡(luò)性能最佳,此時(shí)的隱含層節(jié)點(diǎn)數(shù)為8。在Matlab軟件BP工具箱的參數(shù)設(shè)置上,訓(xùn)練函數(shù)為“Traingdx”,隱含層和輸出層傳遞函數(shù)為S型函數(shù)“Logsig”,在本實(shí)驗(yàn)中將模型最大訓(xùn)練次數(shù)設(shè)定為1000,訓(xùn)練誤差目標(biāo)設(shè)置為0. 01,模型網(wǎng)絡(luò)學(xué)習(xí)率設(shè)置為0. 05,動(dòng)量系數(shù)設(shè)為0.9,其他參數(shù)使用默認(rèn)值。
3.4.2 遺傳算法
在本文中,遺傳算法中的種群大小可以隨機(jī)獲得50,最大遺傳代數(shù)為30,交叉率為0.7,變異率為0. 01,權(quán)值變化范圍[0,1]。
3.5 實(shí)驗(yàn)驗(yàn)證及結(jié)果分析
劃分突發(fā)事件網(wǎng)絡(luò)謠言危機(jī)的預(yù)警等級(jí),最重要的因素在于方便政府和相關(guān)部門(mén)對(duì)網(wǎng)絡(luò)謠言進(jìn)行管理,當(dāng)網(wǎng)絡(luò)謠言危機(jī)達(dá)到預(yù)案等級(jí)時(shí),啟動(dòng)相應(yīng)預(yù)案,提高社會(huì)和諧穩(wěn)定。根據(jù)《國(guó)家突發(fā)公共事件總體應(yīng)急預(yù)案》中劃分突發(fā)公共事件預(yù)警等級(jí)的原則,本文將網(wǎng)絡(luò)謠言危機(jī)預(yù)警標(biāo)準(zhǔn)劃分為4級(jí):分別為安全級(jí)別和輕警、中警、重警級(jí)別,輸出狀態(tài)分別對(duì)應(yīng)4個(gè)預(yù)警等級(jí),用1000、0100、0010、0001表示。
首先,將表2中樣本列表中的T1、T8、Tis、T22、T295個(gè)時(shí)間段作為BP神經(jīng)網(wǎng)絡(luò)的測(cè)試樣本,其余27個(gè)樣本作為訓(xùn)練樣本。經(jīng)過(guò)計(jì)算,從圖3中誤差進(jìn)化曲線看出,約經(jīng)過(guò)遺傳代數(shù)30的進(jìn)化可得到平均誤差與最佳誤差近乎相同,此時(shí)得到最佳初始權(quán)值與閥值。
其次,將最佳值返回到已經(jīng)訓(xùn)練好的標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)模型,得到測(cè)試樣本的所有的5個(gè)預(yù)警值(輸出的最大值轉(zhuǎn)化為1,其余轉(zhuǎn)化為0,如T.中0. 9231為該行最大值,則期望輸出為1,將該行其他數(shù)值轉(zhuǎn)化為0),從結(jié)果上看,遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)預(yù)警的實(shí)際輸出與期望輸出一致,如表3所示。
模擬仿真結(jié)果表明,本文構(gòu)建的網(wǎng)絡(luò)謠言危機(jī)預(yù)警指標(biāo)體系具有一定合理性,通過(guò)5個(gè)測(cè)試樣本的期望輸出與實(shí)際輸出對(duì)比,該網(wǎng)絡(luò)謠言危機(jī)預(yù)警模型具有良好的可預(yù)測(cè)性,可給有關(guān)部門(mén)進(jìn)行網(wǎng)絡(luò)謠言危機(jī)預(yù)警時(shí)作為參考。
4 結(jié)論與討論
4.1 討論
1)本文為突發(fā)事件網(wǎng)絡(luò)謠言危機(jī)預(yù)警提供了一種由遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型,其實(shí)際應(yīng)用效果與標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)算法相比更具科學(xué)性和實(shí)用性。受篇幅限制具體算法流程在本文中作簡(jiǎn)化處理,可參考文獻(xiàn)[8]。
2)本文以天津“8·12”爆炸事故與“和頤酒店女生遇襲事件”為例進(jìn)行實(shí)證分析,雖然兩個(gè)案例所伴生的網(wǎng)絡(luò)謠言產(chǎn)生模式不同于一般的網(wǎng)絡(luò)謠言,但符合突發(fā)事件網(wǎng)絡(luò)謠言的一般規(guī)律,可僅用兩個(gè)案例進(jìn)行預(yù)警預(yù)測(cè)分析仍存有一定的局限性,未能對(duì)該方法應(yīng)用于各種類(lèi)型的突發(fā)事件網(wǎng)絡(luò)謠言預(yù)警的效果進(jìn)行比對(duì)驗(yàn)證,將在下步研究中進(jìn)行該項(xiàng)工作。
4.2 結(jié)論
本文在研究分析突發(fā)事件網(wǎng)絡(luò)謠言自身特性的基礎(chǔ)上,構(gòu)建了相應(yīng)預(yù)警指標(biāo)體系,并采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),構(gòu)建模擬實(shí)驗(yàn)。該模型通過(guò)Matlab軟件自有的BP神經(jīng)網(wǎng)絡(luò)工具箱實(shí)現(xiàn)網(wǎng)絡(luò)謠言的定量預(yù)警。實(shí)驗(yàn)?zāi)M結(jié)果表明該預(yù)警模型具有對(duì)數(shù)據(jù)支持要求較低、便于量化的優(yōu)點(diǎn),具有較好的適用性。
本文介紹的方法有利于提升政府及相關(guān)部門(mén)對(duì)突發(fā)事件網(wǎng)絡(luò)謠言進(jìn)行監(jiān)測(cè),并對(duì)謠言發(fā)展的下一階段進(jìn)行預(yù)警,為管理部門(mén)及時(shí)采取有效措施提供了參考方法。在下面的研究中將進(jìn)一步對(duì)網(wǎng)絡(luò)謠言危機(jī)預(yù)警的指標(biāo)體系進(jìn)行完善,進(jìn)一步減少定性指標(biāo),提高數(shù)據(jù)采集的即時(shí)性和有效性,減少人為認(rèn)知的判斷,最終實(shí)現(xiàn)計(jì)算機(jī)實(shí)時(shí)跟蹤熱點(diǎn)輿情的監(jiān)測(cè)及轉(zhuǎn)變?yōu)檠苌{言后的自動(dòng)預(yù)警,并給出預(yù)警級(jí)別。
參考文獻(xiàn)
[1]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心,第44次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[R].http://www.cac.gov.cn/2019- 08/30/c_1124938750. htm.
[2]夏一雪,蘭月新,趙玉敏.大數(shù)據(jù)背景下網(wǎng)絡(luò)輿情信息異化控制模型研究[J].現(xiàn)代情報(bào),2018,38 (2):3-11.
[3]周穎,張鵬,高揚(yáng),等,面向突發(fā)事件的網(wǎng)絡(luò)謠言危害分析及應(yīng)對(duì)策略[J].中國(guó)公共安全:學(xué)術(shù)版,2017,(2):83-88.
[4]戴媛,我國(guó)網(wǎng)絡(luò)輿情安全評(píng)估指標(biāo)體系研究[D].北京:北京化工大學(xué),2008.
[5]曾潤(rùn)喜.網(wǎng)絡(luò)輿情突發(fā)事件預(yù)警指標(biāo)體系構(gòu)建[J].情報(bào)理論與實(shí)踐,2010,(1):77 -80.
[6]蘭月新,面向輿情大數(shù)據(jù)的群體性事件預(yù)警研究[M].天津:天津大學(xué)出版社.2017.
[7]柯惠新,劉績(jī)宏.重大事件輿情監(jiān)測(cè)指標(biāo)體系與預(yù)警分析模型的再探討[J].新聞學(xué)與傳播學(xué),2011,(12):39-45.
[8]張鵬,李昊青,蘭月新,等.基于BP神經(jīng)網(wǎng)絡(luò)的突發(fā)事件網(wǎng)絡(luò)謠言危機(jī)預(yù)警[J].電子政務(wù),2016,(11):40-47.
[9] Allport G W, Postman L The Psychology of Rumor[ M]. hlewYork:Henry Hoh,1947.
[10] Chorus A.The Basic Law of Rumor[ J]. Journal of Abnormaland Social Psychology, 1953, 48: 313-314.
[11]曹蓉.基于全樣本分析的網(wǎng)絡(luò)輿情指標(biāo)體系研究綜述[J].情報(bào)雜志,2015,(5):154-158.
[12]陳雪奇.災(zāi)難事件中謠言的新聞學(xué)意義闡釋[J]理論與改革,2014,(3):130-133.
[13]孫燕,謠言風(fēng)暴:災(zāi)難事件后的網(wǎng)絡(luò)輿論危機(jī)現(xiàn)象研究[J].新聞與傳播研究,2011,(5):52-62.
[14]王宏偉.輿情信息工作策略與方法[M].北京:中國(guó)人事出版社.2010.
[15]曾潤(rùn)喜,魏馮.政媒共治:災(zāi)難事件中網(wǎng)絡(luò)造謠與辟謠的信息行為研究基于“8·12天津爆炸事故”謠言的內(nèi)容分析[J].電子政務(wù),2016,(5):25-34.
[16]張鵬,蘭月新,李昊青,等.基于認(rèn)知過(guò)程的網(wǎng)絡(luò)謠言綜合分類(lèi)方法研究[J].圖書(shū)與情報(bào),2016,(4):8-15.
(責(zé)任編輯:孫國(guó)雷)
收稿日期:2019-04-23
基金項(xiàng)目:教育部人文社會(huì)科學(xué)基金“面向突發(fā)事件的網(wǎng)絡(luò)流言風(fēng)險(xiǎn)預(yù)警及對(duì)策研究”(項(xiàng)目編號(hào):17YJC630214);全國(guó)統(tǒng)計(jì)科學(xué)研究重點(diǎn)項(xiàng)目“輿情大數(shù)據(jù)環(huán)境下突發(fā)事件民意監(jiān)測(cè)與評(píng)估研究(項(xiàng)目編號(hào):2017L237);廊坊市科技計(jì)劃項(xiàng)目“基于大數(shù)據(jù)的突發(fā)事件網(wǎng)絡(luò)輿情預(yù)測(cè)技術(shù)研究”(項(xiàng)目編號(hào):2019013066)。
作者簡(jiǎn)介:張鵬(1981-),男,副教授,博士,研究方向:網(wǎng)絡(luò)輿情、網(wǎng)絡(luò)謠言研究。蘭月新(1981-),男,副教授,碩士生導(dǎo)師,研究方向:網(wǎng)絡(luò)輿情。李昊青(1983-),男,講師,館員,研究方向:網(wǎng)絡(luò)輿情與社會(huì)治理。周穎(1990-),男,碩士,研究方向:網(wǎng)絡(luò)輿情。