姚 婷,趙錦棟,楊 莉
(1 南京郵電大學(xué) 地理與生物信息學(xué)院,南京 210023;2 南京郵電大學(xué) 經(jīng)濟(jì)學(xué)院,南京 210023)
突發(fā)環(huán)境事件,是指由于污染物排放或自然災(zāi)害、生產(chǎn)安全事故等因素,導(dǎo)致污染物或放射性物質(zhì)等有毒、有害物質(zhì)進(jìn)入大氣、水體、土壤等環(huán)境介質(zhì),突然造成或可能造成環(huán)境質(zhì)量下降,危及公眾身體健康和財(cái)產(chǎn)安全,在導(dǎo)致生態(tài)環(huán)境破壞的同時(shí),也可能對(duì)社會(huì)城市化發(fā)展產(chǎn)生不利影響,亟需采取緊急措施予以應(yīng)對(duì)的事件。近年來,國內(nèi)突發(fā)環(huán)境事件不時(shí)出現(xiàn),不僅發(fā)生了傷亡事故,還會(huì)形成直接經(jīng)濟(jì)損失,同時(shí)也給社會(huì)穩(wěn)定和日常生活帶來了威脅。
隨著互聯(lián)網(wǎng)的迅速發(fā)展,微博從最初的社交屬性延展到如今的自媒體屬性,改變著人們的信息傳播模式以及傳媒習(xí)慣,并逐漸成為了在社會(huì)媒體中即時(shí)性最強(qiáng)、用戶范圍最廣的信息傳播平臺(tái)。但因微博的使用門檻較低、而且具有無需實(shí)名認(rèn)證、用戶量大、連通性高等特點(diǎn),則也較易滋生出不良輿論。在突發(fā)環(huán)境事件發(fā)生時(shí),不良輿論就可能通過微博這一途徑出現(xiàn)大范圍傳播,甚至發(fā)生不可控的事件與結(jié)果。
因此,當(dāng)突發(fā)環(huán)境事件發(fā)生時(shí),如何監(jiān)測微博中的不良輿論的傳播態(tài)勢(shì),正確引導(dǎo)輿論走向即已成為目前學(xué)界面臨的熱點(diǎn)問題。本文通過提取突發(fā)環(huán)境事件中的微博特征,利用機(jī)器學(xué)習(xí)技術(shù)建立突發(fā)環(huán)境事件中微博影響力的預(yù)測模型,研究微博影響力的影響因素,并分析微博用戶各類言論的影響力。在突發(fā)環(huán)境事件發(fā)生時(shí),有助于相關(guān)機(jī)構(gòu)快速做出反應(yīng),更加迅速、準(zhǔn)確定位高影響力微博與用戶,從而抑制微博上不良輿論的傳播,營造良好輿論氛圍。
目前國內(nèi)外學(xué)者對(duì)于突發(fā)事件中的輿情研究主要分為3方面:
(1)從輿情本體入手,研究輿情生成及演變路徑,主要通過采用搜索指數(shù)、發(fā)帖量等指標(biāo)對(duì)輿情演變階段進(jìn)行劃分,分析各階段的情感強(qiáng)度和主題特征,把握輿情走勢(shì),從而提出各階段的應(yīng)對(duì)措施。
(2)通過剖析突發(fā)事件應(yīng)急管理中網(wǎng)絡(luò)輿情的傳播規(guī)律,構(gòu)建傳播規(guī)律模型,對(duì)突發(fā)事件的輿情發(fā)展進(jìn)行預(yù)測,并采取相應(yīng)的措施。
(3)對(duì)輿情發(fā)展過程中的主體展開了深入研究,涉及政府部門、意見領(lǐng)袖、網(wǎng)民等,兼顧不同輿情主體的利益,研究突發(fā)事件網(wǎng)絡(luò)輿情主體博弈的過程,從而提出輿情演化過程中各主體需要采取的措施,以確保事件發(fā)生時(shí)網(wǎng)絡(luò)輿情的良性運(yùn)轉(zhuǎn)。
國內(nèi)外有關(guān)微博影響力的評(píng)價(jià)和研究主要包括2方面:
(1)對(duì)微博用戶影響力的研究和預(yù)測。學(xué)者們提出了多種針對(duì)評(píng)價(jià)和預(yù)測微博用戶影響力的方法和模型,包括h指數(shù)、BCI指數(shù)、TwitterRank模型等,使用的主要衡量因素包括關(guān)注數(shù)、粉絲數(shù)等。
(2)單條微博的影響力的評(píng)價(jià)。學(xué)者們普遍用轉(zhuǎn)發(fā)數(shù)來衡量微博影響力,每一條微博影響力的擴(kuò)大須依靠轉(zhuǎn)發(fā)行為,基于這一理論,提出了不同的微博影響力的預(yù)測模型,分析方法主要有多層線性模型、PageRank算法等,但由于數(shù)據(jù)采集困難、微博影響力難以量化等原因,該方面的研究較少。
綜上所述,國內(nèi)外關(guān)于微博影響力和突發(fā)事件中的輿情研究都已經(jīng)取得了長足的進(jìn)步,建立了較為完整的研究體系,但是目前的研究仍然有著一定的局限性,依然存在有待改進(jìn)的方面:
(1)突發(fā)事件中的輿情方面的研究視角較為單一?,F(xiàn)有的研究多半為針對(duì)輿情演化走勢(shì)的研究和預(yù)測,并沒有對(duì)輿情演化過程中的各類人群特征做深入剖析,重復(fù)勞動(dòng)較多,且對(duì)策、建議研究尚不成熟。
(2)微博影響力的研究大多以微博用戶為主體,對(duì)單條微博影響力的研究僅僅考慮粉絲、注冊(cè)時(shí)間等用戶層面的簡單影響因素,并且由于微博影響力量化的不科學(xué),這樣的分析方法和模型不具備很好的泛化性。
本文對(duì)當(dāng)前的研究不足進(jìn)行改進(jìn),并提供了方法和研究視角上的創(chuàng)新。在突發(fā)環(huán)境事件中,創(chuàng)新地從微博影響力角度入手,從多個(gè)層面綜合選取微博影響力的影響因素,利用機(jī)器學(xué)習(xí)技術(shù)建立微博影響力預(yù)測模型,并對(duì)各影響因素進(jìn)行分析。本研究有助于識(shí)別突發(fā)環(huán)境事件輿情演化過程中的高風(fēng)險(xiǎn)人群和高風(fēng)險(xiǎn)時(shí)期,提出輿論引導(dǎo)的建議和實(shí)踐上的參考,給予管理者決策支持。
在微博影響力預(yù)測模型的選取中,本文經(jīng)過對(duì)多個(gè)模型的性能比較,選取基于AdaBoost算法的預(yù)測模型作為最優(yōu)模型。
AdaBoost是一種迭代學(xué)習(xí)算法,其核心思想是將弱的基礎(chǔ)分類器迭代成一個(gè)強(qiáng)的最終分類器,本文使用決策樹作為基學(xué)習(xí)器。雖然在最初的迭代中,基礎(chǔ)分類器的分類效果并不理想,即誤判率較高,但經(jīng)過幾輪迭代,不斷增加誤分類樣本的權(quán)值,并在更新了權(quán)值樣本的基礎(chǔ)上不斷構(gòu)建新的分類器,從而使得分類精度得到有效提升。
AdaBoost算法沒有關(guān)于數(shù)據(jù)的假設(shè)分布,實(shí)用性很強(qiáng),而且對(duì)過擬合不那么敏感。
以本文研究的二分類問題為例,AdaBoost算法步驟如下:
假設(shè)個(gè)初始測試數(shù)據(jù)為{(,),(,),…,(x,y)},y∈{1,1},1為負(fù)樣本(低影響力樣本),1為正樣本(高影響力樣本);每個(gè)樣本x包括個(gè)特征,累計(jì)迭代次。
(1)初始化訓(xùn)練集數(shù)據(jù)的權(quán)重分布,使每個(gè)訓(xùn)練樣本具有均勻的權(quán)值分布,設(shè)為第個(gè)樣本的初始化權(quán)重。對(duì)應(yīng)的數(shù)學(xué)表述可寫為如下形式:
(2)循環(huán)訓(xùn)練次,1,2,…,。
①對(duì)權(quán)值分布更新為D的樣本進(jìn)行迭代,得到基本分類器G()。
②計(jì)算G()的分類誤差率,具體公式如下:
③計(jì)算G()的系數(shù)α,具體公式如下:
由式(3)可知,隨著e的減小,α不斷增大,同時(shí)分類精度越高,基本分類器在最終分類器中所占的權(quán)重越大。
④更新訓(xùn)練數(shù)據(jù)集的權(quán)重分布,具體數(shù)學(xué)公式如下:
其中,Z是規(guī)范化因子,推導(dǎo)出的數(shù)學(xué)定義式可寫為:
從公式中可以看出,基本分類器G(x)錯(cuò)分類的樣本權(quán)值在迭代過程中不斷擴(kuò)大,正確分類的樣本權(quán)值通過迭代不斷縮小,從而在此后的機(jī)器學(xué)習(xí)中更加重視錯(cuò)誤分類的樣本。
(3)實(shí)現(xiàn)基本分類器的組合,可由如下公式來表示:
得到最終分類器,即:
該模型用于對(duì)微博的影響力進(jìn)行預(yù)測,將提取得到的微博特征數(shù)據(jù)輸入模型,預(yù)測微博的影響力等級(jí)。
本文以“xx突發(fā)環(huán)境事件”為例,通過編寫爬蟲程序,對(duì)與事件相關(guān)的熱門話題下的微博展開爬取,共得到46265條微博數(shù)據(jù),每條微博數(shù)據(jù)都包括:用戶ID、所屬地址、微博內(nèi)容、發(fā)布日期、點(diǎn)贊數(shù)、評(píng)論數(shù)、轉(zhuǎn)載量等屬性。
獲取數(shù)據(jù)之后,對(duì)數(shù)據(jù)中重復(fù)、無效以及無關(guān)數(shù)據(jù)進(jìn)行刪除,經(jīng)處理后的微博數(shù)據(jù)剩余7540條。
3.2.1 指標(biāo)體系構(gòu)建
本文參考濮小燕提出的微博特征提取思路,結(jié)合突發(fā)環(huán)境事件的特點(diǎn)和實(shí)際情況,最終選擇從微博內(nèi)容、時(shí)間、用戶基本信息和用戶活躍度四個(gè)層面上對(duì)微博特征進(jìn)行提取,選取的微博特征及特征值劃分情況見表1。本文提取了18個(gè)微博特征變量。
表1 微博特征提取表Tab.1 Microblog features extraction table
3.2.2 微博情感特征提取
在微博特征的提取中,大部分微博特征可以直接進(jìn)行提取,所處輿情演化的階段這一指標(biāo)的特征值由輿情生命周期的劃分決定。微博的情感傾向和主題則分別使用了樸素貝葉斯分類器和LDA主題模型的方法進(jìn)行提取。本文選擇使用樸素貝葉斯分類器對(duì)微博情感傾向特征進(jìn)行提取。這里需用到的數(shù)學(xué)公式為:
式(8)表示對(duì)于某個(gè)樣本,特征出現(xiàn)時(shí),該樣本被分為類的條件概率。
本文從有關(guān)“xx突發(fā)環(huán)境事件”的微博數(shù)據(jù)中隨機(jī)選取三分之一進(jìn)行人工標(biāo)注,分為“積極”、“消極”和“中性”三類,這部分?jǐn)?shù)據(jù)用于樸素貝葉斯分類器的訓(xùn)練和模型預(yù)測精度的計(jì)算,預(yù)測精度由十折交叉驗(yàn)證的方法獲得。通過計(jì)算,分類器的預(yù)測精度可以達(dá)到0.945,符合本文研究的要求。通過訓(xùn)練得出的模型可以對(duì)其余數(shù)據(jù)的情感傾向進(jìn)行預(yù)測,提取微博的情感傾向特征。在7540條微博中,情感傾向?yàn)榉e極的博文數(shù)有2016條,情感傾向?yàn)橄麡O的博文數(shù)有3311條,情感傾向呈中性的博文數(shù)有2123條,這說明在突發(fā)環(huán)境事件中公眾的負(fù)向情感強(qiáng)度較正向情感強(qiáng)度更高。
3.2.3 微博主題特征提取
在主題特征的提取中,本文選擇有關(guān)“xx突發(fā)環(huán)境事件”的微博數(shù)據(jù),利用LDA主題模型提取主題。
LDA主題模型認(rèn)為一篇文檔包含多個(gè)主題,文檔中的每個(gè)單詞都屬于其中的一個(gè)主題。一篇文檔的形成,首先在文檔中抽取一個(gè)主題,然后再在這個(gè)主題下抽取一個(gè)單詞,最后,重復(fù)進(jìn)行前兩步,直到文檔中的全部單詞都被遍歷。
LDA的核心公式如下:
其中,為目標(biāo)語料庫中的一篇文檔;是該篇文章中的一個(gè)主題;是該主題中的一個(gè)單詞。
LDA主題模型提取主題結(jié)果見表2。
表2 LDA主題模型提取結(jié)果表Tab.2 LDA subject model extraction results
由表2可知,共提取出10個(gè)話題,每個(gè)話題包含5個(gè)特征詞,每個(gè)特征詞都給出了其關(guān)聯(lián)度。根據(jù)主題提取結(jié)果,結(jié)合事件的具體情況,大致可將微博數(shù)據(jù)按話題特征分為4類,分別是通知類、祈福類、批判類和其他。
3.2.4 微博影響力量化
本文選取微博的點(diǎn)贊數(shù)、評(píng)論數(shù)和轉(zhuǎn)發(fā)數(shù)三個(gè)指標(biāo)對(duì)微博影響力進(jìn)行綜合衡量,指標(biāo)權(quán)重由熵權(quán)法確定。
若選取個(gè)評(píng)價(jià)指標(biāo),個(gè)評(píng)價(jià)對(duì)象,構(gòu)成的數(shù)據(jù)矩陣R=(r),則:
則第個(gè)指標(biāo)的熵權(quán)w定義為:
其中,0≤w≤1,w為第個(gè)指標(biāo)的熵權(quán)。
計(jì)算得到的指標(biāo)權(quán)重及微博影響力計(jì)算方法見下式:
其中,、、、分別表示該條微博的影響力、點(diǎn)贊數(shù)、評(píng)論數(shù)和轉(zhuǎn)發(fā)數(shù)。
3.3.1 微博影響力預(yù)測模型評(píng)價(jià)
本文選取處理后的7540條微博作為實(shí)驗(yàn)數(shù)據(jù),每條數(shù)據(jù)包含18個(gè)微博特征變量。利用式(12)計(jì)算每條微博的微博影響力,根據(jù)研究事件的特點(diǎn),結(jié)合數(shù)據(jù)分布的真實(shí)狀態(tài),對(duì)微博影響力進(jìn)行二分類處理,設(shè)定分類閾值為3,即影響力數(shù)值大于等于3的微博為影響力高的微博,小于3的為影響力低的微博。
基于同樣的數(shù)據(jù)集,本文分別基于決策樹、AdaBoost、Bagging和隨機(jī)森林等算法構(gòu)建預(yù)測模型。使用十折交叉驗(yàn)證的方法計(jì)算各模型的性能,選擇預(yù)測精度、召回率和度量作為評(píng)價(jià)指標(biāo),計(jì)算結(jié)果見表3,與其他模型相比,基于Adaboost算法的預(yù)測模型在各項(xiàng)指標(biāo)上都有所提高,證明該模型性能最好,具有較強(qiáng)的泛化能力,預(yù)測效果較好。
表3 各預(yù)測模型性能比較表Tab.3 Performance comparison of prediction models
3.3.2 微博特征重要性分析
在本研究中,使用了18個(gè)微博特征,根據(jù)AdaBoost算法模型基于基尼系數(shù)計(jì)算變量的重要度的功能,繪制了變量的相對(duì)重要性圖,如圖1所示,即條形越長的變量對(duì)結(jié)果的貢獻(xiàn)越大,條形越短的變量重要程度越低。
圖1 微博特征值重要性表Fig.1 Microblog eigenvalue importance table
結(jié)果顯示,模型中的各微博特征重要性相差較大。其中,重要性較大的7個(gè)特征從大到小依次是:用戶粉絲數(shù)、微博長度、用戶一周發(fā)微博數(shù)、用戶一周發(fā)原創(chuàng)微博數(shù)、發(fā)表時(shí)間、用戶認(rèn)證類型和微博主題,而關(guān)鍵字特征、是否有@和鏈接等特征相對(duì)重要性較低。這說明粉絲數(shù)、微博長度、用戶活躍度等因素對(duì)微博影響力大小至關(guān)重要。
3.3.3 微博特征值影響力傾向分析
為了進(jìn)一步探究各微博特征值對(duì)微博影響力的影響傾向,對(duì)微博文本長度、粉絲數(shù)、發(fā)布本條微博前一周轉(zhuǎn)發(fā)微博數(shù)、發(fā)布本條微博前一周發(fā)布原創(chuàng)微博數(shù)這4個(gè)指標(biāo)進(jìn)行二分類處理,以中位數(shù)作為類別的判定標(biāo)準(zhǔn)。本文參考張繼東等人的研究思路,引入支持度的概念,并對(duì)微博特征值的影響力傾向的計(jì)算方法進(jìn)行了描述,同時(shí)又闡明了各特征值與影響力兩者的關(guān)聯(lián)情況。具體計(jì)算公式如下:
式(13)中,Support(v)表示特征值v的高影響力支持度,即在所有特征值為v的微博數(shù)據(jù)中高影 響 力 微 博 數(shù) 據(jù) 所 占 比 例;式 (14)中,表示全部微博數(shù)據(jù)的高影響力支持度;式(15)中,(v)表示特征值v的影響傾向值,數(shù)值的正負(fù)表示該特征值對(duì)微博影響力的影響傾向,數(shù)值的絕對(duì)值表示該特征值對(duì)微博影響力的影響大小。計(jì)算結(jié)果見表1,基于計(jì)算結(jié)果,分別在內(nèi)容、時(shí)間、用戶基本信息和用戶活躍度層面對(duì)微博特征值影響傾向展開研究,擬做闡釋分述如下。
(1)內(nèi)容層面。根據(jù)計(jì)算結(jié)果,分析內(nèi)容層面的微博特征值的影響傾向,微博的長度、主題和原創(chuàng)性對(duì)微博影響力的影響較大,這與變量的相對(duì)重要性圖相符。從微博長度來看,長文本微博比短文本微博的影響力更大;從主題特征來看,一般通知類的微博影響力最大,祈福類微博和批判類微博的影響力也大于平均水平,而其他主題的微博影響力較小;從微博原創(chuàng)性來看,相比非原創(chuàng)的微博,原創(chuàng)的微博具有更高的影響力。
(2)時(shí)間層面。時(shí)間層面包含微博所處輿情演化階段和微博發(fā)表時(shí)間兩個(gè)特征,每個(gè)特征包含4個(gè)特征值。從微博所處輿情演化階段來分析,處于爆發(fā)階段和反復(fù)階段的微博較暫衰階段和消退階段的微博影響力更高,其中爆發(fā)階段的微博影響力最高。這是因?yàn)樵谳浨楸l(fā)階段,事件的嚴(yán)重性和突發(fā)性導(dǎo)致公眾的關(guān)注度較高;而在輿情發(fā)展的反復(fù)階段,因?yàn)橛袀銮闆r和相關(guān)責(zé)任人刑事處罰等后續(xù)信息散布出來,導(dǎo)致次生輿情出現(xiàn),再度引起事件熱度提升。從微博發(fā)表時(shí)間來看,白天發(fā)布的微博比夜晚和凌晨發(fā)布的微博影響力更高,這也符合人們的作息習(xí)慣。
(3)用戶基本信息層面。在微博用戶基本信息層面,本文選取了4個(gè)特征,這4個(gè)特征對(duì)微博影響力的影響均比較顯著。其中,政府媒體和大V用戶發(fā)表的微博的影響力會(huì)更高,這主要是由于這2種用戶的粉絲數(shù)比普通用戶要更多,根據(jù)計(jì)算結(jié)果,政府媒體用戶和大V用戶的粉絲數(shù)分別是普通用戶的25392倍和1502倍;事件發(fā)生地的用戶所發(fā)表的微博影響力會(huì)更高,說明事件發(fā)生地的用戶相比其他地區(qū)用戶容易受到更多關(guān)注;相比普通行業(yè),政府、媒體、公益組織的用戶展現(xiàn)出更高的影響力傾向,同時(shí)化工行業(yè)的用戶也呈現(xiàn)出較高的影響力傾向,這說明突發(fā)環(huán)境事件的相關(guān)行業(yè)工作者發(fā)表的言論更容易受到公眾的關(guān)注,引發(fā)人們的共鳴。
(4)用戶活躍度層面。用戶使用微博的活躍度可以用博文數(shù)來衡量。實(shí)驗(yàn)結(jié)果顯示,原創(chuàng)微博發(fā)布頻率與影響力傾向成正比,轉(zhuǎn)發(fā)微博發(fā)布頻率與影響力傾向成反比。這是因?yàn)閷?duì)于受眾來說,只能接受有限的消息,某些博主發(fā)布微博較為頻繁可能導(dǎo)致粉絲的選擇分散,而有的博主發(fā)布微博的頻率較低,正是因?yàn)檫@樣,該博主一旦發(fā)博,其粉絲更可能認(rèn)真閱讀或轉(zhuǎn)發(fā)。
本文將“xx突發(fā)環(huán)境事件”中獲取的微博數(shù)據(jù)進(jìn)行人工分類處理,對(duì)各類微博言論的影響力進(jìn)行分析。首先將數(shù)據(jù)分為媒體或大V用戶發(fā)布的微博和普通用戶發(fā)布的微博兩類,對(duì)這2類微博的影響力進(jìn)行計(jì)算,發(fā)現(xiàn)第一類微博的影響力平均值高達(dá)56.62,而第二類微博的影響力平均值僅為0.52;接下來對(duì)第二類微博進(jìn)行細(xì)分,分為不良言論、鼓舞性言論和其他言論三類。參考崔珊提出的不良文本分類體系,結(jié)合數(shù)據(jù)實(shí)際情況,在不良言論方面主要選取了謠言類、暴恐類、政治有害類等微博言論,在鼓舞類言論方面主要選取了加油打氣、宣傳積極事例等具有鼓舞人心作用的積極言論。結(jié)合輿情演化路徑,分析輿情演化各階段中各類言論的影響力水平,分析結(jié)果如下。
輿情演化路徑中普通用戶各類言論影響力變化圖如圖2所示。根據(jù)圖2,在事件發(fā)展的整個(gè)過程中,不良微博言論的影響力水平最高,平均影響力數(shù)值達(dá)到了5.48;鼓舞類微博言論的影響力水平其次,平均影響力數(shù)值為1.84;其他微博言論的影響力水平最低,僅為0.29,這說明在突發(fā)環(huán)境事件中,由于不良言論的蠱惑性和欺騙性,很多不明真相的公眾并不能正確地判斷信息的可靠性,容易被外界環(huán)境所影響,而且還可能進(jìn)行二次轉(zhuǎn)發(fā);此外,網(wǎng)絡(luò)上的鼓舞類言論同樣影響力較大,具有積極的宣傳作用。結(jié)合輿情發(fā)展階段來看,在輿情發(fā)展的反復(fù)階段,普通用戶發(fā)布的各類微博言論的影響力均達(dá)到最高峰,在輿情發(fā)展的消退階段達(dá)到最低值,這說明輿情發(fā)展的反復(fù)階段是防范不良言論的緊要時(shí)期,同時(shí)也是積極引導(dǎo)的關(guān)鍵時(shí)期。
圖2 輿情演化路徑中普通用戶各類言論影響力變化圖Fig.2 Changes in the influence of various remarks of ordinary users in the evolution path of public opinion
本文構(gòu)建了微博影響力評(píng)價(jià)的指標(biāo)體系,利用AdaBoost算法建立突發(fā)環(huán)境事件中微博影響力的預(yù)測模型,并以“xx突發(fā)環(huán)境事件”為例進(jìn)行了實(shí)例驗(yàn)證,結(jié)合輿情演化的生命周期對(duì)微博影響力變化規(guī)律進(jìn)行研究。通過研究,發(fā)現(xiàn)影響輿情發(fā)展的主要影響因素,幫助相關(guān)部門了解輿情發(fā)展各階段的特征,對(duì)于突發(fā)事件發(fā)生后微博網(wǎng)絡(luò)輿情進(jìn)行準(zhǔn)確預(yù)測,及時(shí)制止不良言論,并進(jìn)行正確引導(dǎo),從而在突發(fā)環(huán)境事件發(fā)生時(shí),確保網(wǎng)絡(luò)輿情良性運(yùn)轉(zhuǎn)。
研究表明,模型效果比較理想,具有良好的預(yù)測能力,這對(duì)于相關(guān)部門在環(huán)境突發(fā)事件初期識(shí)別高影響力微博和打造高影響力微博具有重要的現(xiàn)實(shí)意義。突發(fā)環(huán)境事件中的微博的影響力受多層面微博特征的影響,其影響因素重要性排序?yàn)椋河脩艋拘畔ⅰ?nèi)容特征、用戶活躍度和時(shí)間特征。在輿情發(fā)展的整個(gè)過程中,媒體或大V用戶發(fā)布的微博影響力始終保持在很高水平;而在普通民眾發(fā)布的微博中,處于反復(fù)階段微博影響力水平最高,消退階段最低。從不同言論種類來看,不良言論的影響力最高、鼓舞類言論的影響力其次、其他言論的影響力較低。
基于上述數(shù)據(jù)分析及研究結(jié)果,在突發(fā)環(huán)境事件發(fā)生時(shí),用戶的基本信息對(duì)微博影響力最大,因此相關(guān)部門要重視自身微博平臺(tái)的運(yùn)營,積極與公眾互動(dòng),多與政府媒體和大V用戶建立合作,提升自身微博影響力;在發(fā)布時(shí)間方面,白天發(fā)布的微博影響力會(huì)更大,政府部門應(yīng)該在此階段發(fā)布重要內(nèi)容,來提高微博影響力;在發(fā)布內(nèi)容方面,媒體和相關(guān)部門要注意用詞的準(zhǔn)確度、真實(shí)性,發(fā)布長文本的微博來提高微博影響力,正確引導(dǎo)輿情發(fā)展方向;在發(fā)布頻率方面,要定期發(fā)布高質(zhì)量原創(chuàng)微博,盡量在用戶登錄微博的高峰期發(fā)帖。在輿情發(fā)展的整個(gè)過程中,根據(jù)各階段演化特征,在環(huán)境突發(fā)事件發(fā)生初期,相關(guān)部門應(yīng)加強(qiáng)對(duì)高風(fēng)險(xiǎn)微博用戶和高風(fēng)險(xiǎn)微博的防范,從源頭阻止不良言論傳播;輿情發(fā)展的爆發(fā)階段和反復(fù)階段是容易導(dǎo)致輿情發(fā)展失控的高風(fēng)險(xiǎn)時(shí)期,相關(guān)部門要采取正面教育、科學(xué)引導(dǎo)、及時(shí)澄清和準(zhǔn)確抑制的措施,保證輿情態(tài)勢(shì)的平穩(wěn)發(fā)展。