楊妺,王妍*,王傳彪,李昊展,劉銘
(1.中國傳媒大學數(shù)據(jù)科學與智能媒體學院,北京 100024;2.中國傳媒大學融合與傳播國家重點實驗室,北京 100024)
突發(fā)公共事件[1]是指突然發(fā)生的,可能會造成社會危害的事件,其中往往存在復雜的、富有爭議的因素,容易引起網(wǎng)民的關注和討論。互聯(lián)網(wǎng)的實時性和去中心化提升了信息的擴散速度和影響范圍,自媒體等意見領袖的加入使傳統(tǒng)的議程設置發(fā)生變化,傳播主體因其賬號影響力的高低不同,信息獲取的實效性不同,對輿情發(fā)展的推動力也不盡相同。
當輿情發(fā)生時,網(wǎng)絡信息傳播的過程是官方媒體首先發(fā)布事件報道形成信息源,而后意見領袖介入,對信息進行篩選、加工,并摻入自己的觀點[2]。網(wǎng)絡意見領袖不能直接控制網(wǎng)民“怎么想”,但他們可以利用信息權力,以迎合網(wǎng)民的方式解讀輿情,并將特定的價值理念編輯進“意見”,潛移默化地引導網(wǎng)民“想什么”[3]。網(wǎng)民會同時接收信息源和再加工的信息,并選擇是否加入到信息傳播的過程中。
因此,在突發(fā)性公共輿情事件中,回答如下三方面問題對于厘清輿情傳播脈絡,掌握輿情規(guī)律進而正確引導和控制輿情具有重要作用。
(1)知網(wǎng)事件輿論走勢存在什么規(guī)律,有哪些特征?
(2)社交網(wǎng)絡信息傳播呈現(xiàn)網(wǎng)絡傳播特征,每個人即是信息接收者,也是傳播者,輿情事件意見領袖和把關人對信息傳播的走勢起重要的主導作用,在知網(wǎng)事件中信息傳播的網(wǎng)絡結構特征和拓撲結構中的“意見領袖”等重要節(jié)點有哪些特征?
(3)關鍵節(jié)點(即意見領袖)起到什么作用,有怎樣的觀點輸出及情感傾向?
本文運用社會網(wǎng)絡分析方法探究參與輿情傳播的各個節(jié)點之間的拓撲關系,以及重要節(jié)點的作用,分析“知網(wǎng)被市場監(jiān)管局立案調(diào)查”輿情事件,在此基礎上使用LDA主題提取和情感識別,探究重要節(jié)點的輿論引導傾向。
對于重大突發(fā)事件引發(fā)的網(wǎng)絡輿情,有多種研究角度。根據(jù)拉斯韋爾5W模式,傳播過程中存在五種基本要素:傳播者、信息內(nèi)容、媒介、接收者和傳播效果,每種要素均可作為研究的切入點。劉波維[4]等人對輿情研究的視角進行分析,將不同視角的網(wǎng)絡輿情研究成果進行編碼和分析,得出輿情研究的幾大范疇,包括主體、客體、引發(fā)者、輿情傳播理論、輿情功能、傳播內(nèi)容等。本文從中選取用戶互動和信息內(nèi)容作為研究角度。
基于用戶互動的角度,眾多用戶在社交網(wǎng)絡上的互動行為構成了巨大的復雜網(wǎng)絡,此前有眾多研究人員利用社會網(wǎng)絡分析方法探究傳播結構及重要節(jié)點的識別?;谛畔?nèi)容的角度,有研究者運用話題識別和情感分析捕捉熱點話題,判斷輿論導向。
Huang[5]等認為可以將復雜網(wǎng)絡中度最大的節(jié)點看作“意見領袖”,通過影響這些節(jié)點來控制信息在網(wǎng)絡中傳播,這一方法被應用于多種復雜網(wǎng)絡的意見領袖挖掘。Kitsak[6]等人指出,網(wǎng)絡中節(jié)點的傳播能力與節(jié)點所處的位置有重要關系,處于網(wǎng)絡核心位置的節(jié)點有較高的影響力。趙蓉英[7]等采用社會網(wǎng)絡分析方法,進行突發(fā)事件網(wǎng)絡輿情關鍵節(jié)點識別研究,通過網(wǎng)絡社群圖分析、接近中心性分析和K-叢分析等,挖掘出與情傳播的內(nèi)在結構以及演化規(guī)律。劉小平[8]等通過測度部分媒體微博的網(wǎng)絡結構特征,結合中心度與LeaderRank算法衡量微博節(jié)點的影響力。孫羽[9]等基于網(wǎng)絡分析和文本挖掘劃分意見領袖社團,分析“特朗普美國大選游行事件”中各類意見領袖的特點。安璐[10]等從意見領袖的評論內(nèi)容及用戶間的交互人入手識別網(wǎng)絡意見領袖。劉嘉琪[11]等基于社會網(wǎng)絡分析方法,分析意見領袖、普通節(jié)點與在線群體影響力間的關系。
吳曉娟[12]利用LDA模型分析“藍色錢江縱火案”在不同輿情時期的微博話題演化過程。Yuan[13]等利用LDA提取颶風期間的Twitter數(shù)據(jù)中公眾關注的問題。Wang[14]等利用LDA模型識別新冠肺炎疫情期間用戶最常發(fā)布的主題,并結合點贊量、評論量和轉(zhuǎn)發(fā)量等數(shù)據(jù)對不同話題進行了用戶行為分析,研究了用戶關注度的變化和話題參與度差異。黃仕靖[15]等對數(shù)據(jù)文本進行情感分析及LDA主題模型建模,對不同階段及不同群體的輿情時空演化及差異進行內(nèi)容分析。劉雅姝[16]等在突發(fā)事件網(wǎng)民評論的話題圖譜上,利用LDA模型提取了話題圖譜實體中的話題和時間屬性,從多維特征融合角度追蹤突發(fā)事件輿情的演化過程。肖倩[17]等將卷積神經(jīng)網(wǎng)絡與LDA模型相結合,利用了輿情熱度與其傳播過程間的潛在關聯(lián),設計了熱點輿情識別方法。鄧春林[18]對突發(fā)公共安全事件的微博評論進行聚類,用LDA主題模型對評論文本進行關鍵要素提取,得出歸因維度,進而通過情感分析軟件對各維度進行情感傾向度分析。
已有研究提出構建社交網(wǎng)絡,利用網(wǎng)絡結構特征、節(jié)點位置、節(jié)點中心性特征、社群分析等多種方法研究意見領袖的識別,利用LDA主題提取模型研究輿情事件演化過程,對文本數(shù)據(jù)進行情感傾向分析。上述成果對突發(fā)事件的輿情研究具有重要的借鑒意義。但已有研究僅聚焦用戶互動或傳播內(nèi)容進行單一角度的信息傳播特征研究,本文將以上研究綜合起來,以更全面、更完整、更系統(tǒng)的視角分析突發(fā)性輿情事件。
因此,在以上學者的研究基礎上,本文采用社會網(wǎng)絡分析方法以突發(fā)事件“知網(wǎng)被市場監(jiān)管局立案調(diào)查”為例,先探究轉(zhuǎn)發(fā)網(wǎng)絡特征,識別網(wǎng)絡中的意見領袖,再進一步提取意見領袖的觀點輸出及情感傾向。
本文選取微博和百度作為主要研究平臺。研究對象是5月13日知網(wǎng)事件爆發(fā)期間參與信息傳播的博主,包括官媒用戶、自媒體用戶、普通用戶,共計37794名,以及部分博主發(fā)布的文章內(nèi)容。
本文使用Python語言爬蟲程序爬取微博數(shù)據(jù),獲得熱搜話題轉(zhuǎn)、贊、評情況。通過UID跟蹤微博主體轉(zhuǎn)發(fā)關系,經(jīng)過清洗后獲得知網(wǎng)報道轉(zhuǎn)發(fā)網(wǎng)絡。使用八爪魚采集器爬取百家號數(shù)據(jù),得到百度移動端和PC端的用戶搜索指數(shù),以及媒體發(fā)布的文章內(nèi)容。
3.3.1 網(wǎng)絡拓撲結構特征分析
當人們通過社會網(wǎng)絡交換信息的同時,也建立起了一個龐大的傳播信息網(wǎng)絡。個體間的相互作用對信息傳播有著至關重要的影響。本文建構了一個經(jīng)典的無權有向轉(zhuǎn)發(fā)網(wǎng)絡,使用Python中的Networkx包,網(wǎng)絡分析工具Gephi和Pajek,對轉(zhuǎn)發(fā)網(wǎng)絡進行定量的整體分析,對個體間關系和相互影響進行精細測量。
研究流程如圖1所示。
圖1 轉(zhuǎn)發(fā)網(wǎng)絡研究指標
各指標對應的表達式如表1所示。
表1 表達式
其中,ki表示與節(jié)點i直接相連的節(jié)點數(shù);N表示網(wǎng)絡中節(jié)點總數(shù);Ei表示節(jié)點i與相鄰點間直接連接的邊數(shù);dij表示目標節(jié)點i到節(jié)點j的距離;Aij是鄰接矩陣中的元素;c表示矩陣A中特征值最大值的倒數(shù);pij代表行動者i投入到相連點j的關系所占比例;q是除i或j之外的每個第三者,pqj代表第三者q投入到相連點j的關系所占比例。
3.3.2 意見領袖發(fā)表內(nèi)容分析
(1)LDA主題提取
LDA(隱含狄利克雷分布)[19]是一種文檔主題生成模型,也稱為一個三層貝葉斯概率模型,包含詞、主題和文檔三層結構。一篇文章的每個詞都是通過“以一定概率選擇了某個主題,并從這個主題中以一定概率選擇某個詞語”這樣一個過程得到。文檔到主題服從多項式分布,主題到詞服從多項式分布,本文需要提取出意見領袖輸出的核心報道主題。先進行分詞處理、分詞向量化,隨后使用Python中的庫pyLDAvis,指定單詞個數(shù)上限和主題個數(shù)等參數(shù),將數(shù)據(jù)填進模型,抽取出主題,最后用pyLDAvis可視化。
(2)情感分析
情感分析是判定文本中對某一話題所表現(xiàn)出的態(tài)度或情緒傾向性的過程、技術和方法,本文需要判斷意見領袖輸出的觀點攜帶的情感傾向。采用Python中的庫SnowNLP和Pandas,直接對文件中的文本進行情感值打分。SnowNLP[20]可以進行文本預處理,例如分詞、詞性標注提取關鍵詞等,同時該程序包也可以進行情感分析,使用的基本模型是貝葉斯模型,即對于有兩個類別c1和c2的分類問題來說,其特征為w1,…,wn,特征之間是相互獨立的,屬于類別c1的貝葉斯模型的基本過程為:,其中P(w1,…,wn)=P(w1,…,wn|c1)?P(c1)+P。最終得到的取值為[0,1],0表示極端負面,1表示極端正面。
研究流程如圖2所示。
圖2 文章內(nèi)容研究指標
知網(wǎng)在論文平臺中擁有極高的市場占有率,近年因連年漲價的高昂服務費被多所高校抵制。如圖3所示,從去年趙德馨教授的論文被下架,國家市場監(jiān)管總局就表示將核實研究知網(wǎng)是否涉嫌壟斷;到今年中科院停用知網(wǎng),國家市場監(jiān)管總局在網(wǎng)上留言回應,表示正在依法開展相關工作。2022年5月13日,市場監(jiān)管總局對知網(wǎng)涉嫌壟斷行為立案調(diào)查。
圖3 知網(wǎng)事件時間軸
圖4搜索指數(shù)源于百度移動端和PC端的用戶搜索情況。圖中標出五個較高極值點,對應上圖時間軸中紅色的時間節(jié)點。
圖4 知網(wǎng)搜索指數(shù)
此次事件前期潛伏期長,從去年開始關于知網(wǎng)的議題就開始頻繁出現(xiàn)在大眾視野中,基本都是負面議題,議程設置的功能得到充分發(fā)揮。事件爆發(fā)之前,知網(wǎng)的負面形象已經(jīng)在人群中廣泛傳播。
2021年12月中旬,因趙教授系列事件,知網(wǎng)短暫維持在較高搜索熱度,之后熱度回落。從今年二月底開始,知網(wǎng)一直處于較高搜索熱度,與畢業(yè)生準備畢業(yè)論文時間重合。4月18日知網(wǎng)搜索熱度飆升,當天中科院宣布年內(nèi)與知網(wǎng)無合作計劃。4月26日,國家市場監(jiān)督管理總局在網(wǎng)上留言表示已關注到各方面反映的知網(wǎng)涉嫌壟斷問題,正在依法開展相關工作。此前趙教授的妻子周秀鸞也進行維權,5月9日,知網(wǎng)就賠償金額過高提出上訴,二審被駁回。5月13日搜索熱度再次飆升,當天下午4點,由中國之聲首發(fā)報道,市場監(jiān)管總局宣布對知網(wǎng)涉嫌壟斷行為立案調(diào)查,此次輿情爆發(fā)。
此次事件爆發(fā)期短,因為這是一個收尾事件,前期知網(wǎng)的所作所為現(xiàn)在國家已經(jīng)開始調(diào)查,大眾得到了想看到的結果。
圖5為話題#知網(wǎng)涉嫌壟斷被立案調(diào)查#詞條中參與討論用戶的轉(zhuǎn)、贊、評情況。篩選出點贊量大于90的博主列入下圖,按點贊數(shù)由大到小排序,其中媒體官號與自媒體號均為13個,各占50%。發(fā)揮議程設置的功能,這些媒體和自媒體通過提供信息來吸引受眾關注到知網(wǎng)事件中。受眾不是被動的信息接收者,而是積極的網(wǎng)絡傳播參與者,通過轉(zhuǎn)、評、贊的方式給媒體予以反饋。其它媒體的信息均從信息源“中國之聲”獲得,它們承擔了意見領袖的作用。而“中國之聲”既是信息源,又是意見領袖,它作為信息源起到傳遞信息的功能,作為意見領袖發(fā)揮的作用是在他的追隨者中構成信息和影響的重要來源,并左右追隨者的態(tài)度。它的特殊地位給予它比其它媒體高出數(shù)十倍的數(shù)據(jù)量。
圖5 話題#知網(wǎng)涉嫌壟斷被立案調(diào)查#轉(zhuǎn)贊評情況
轉(zhuǎn)發(fā)是輿情信息擴散的方法和主要途徑,而意見領袖在其中處于關鍵位置,對于信息擴散起到主導作用,最大化地促進信息傳播。故本節(jié)構建轉(zhuǎn)發(fā)網(wǎng)絡,先分析網(wǎng)絡全局特征,再綜合多種指標識別網(wǎng)絡中的意見領袖節(jié)點。
將采集到的新浪微博轉(zhuǎn)發(fā)和被轉(zhuǎn)發(fā)用戶數(shù)據(jù)導入Gephi,繪制轉(zhuǎn)發(fā)網(wǎng)絡云圖,如圖6所示。運用Py‐thon計算得到轉(zhuǎn)發(fā)網(wǎng)絡的基本指標,如表2所示。根據(jù)運算結果可以看出,總計37794名用戶參與到知網(wǎng)話題的信息傳播,他們之間發(fā)生轉(zhuǎn)發(fā)的總次數(shù)為42482次,整體上節(jié)點用戶數(shù)量規(guī)模較大,相互之間傳播互動數(shù)量較少。參與傳播的人數(shù)多、范圍廣,原因可能是潛伏期已經(jīng)歷幾次傳播,了解知網(wǎng)事件的受眾規(guī)模大。
圖6 轉(zhuǎn)發(fā)網(wǎng)絡可視化(右無中國之聲)
表2 轉(zhuǎn)發(fā)網(wǎng)絡基本指標
知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡的平均度值為2.248,表示每個節(jié)點用戶之間平均相互發(fā)生聯(lián)系的用戶數(shù)量為2.248。此轉(zhuǎn)發(fā)網(wǎng)絡的直徑僅為2,表示網(wǎng)絡中任意兩點之間的最長距離較小。普通用戶主要與傳播網(wǎng)絡中的意見領袖直接建立轉(zhuǎn)發(fā)聯(lián)系,中介節(jié)點非常少。網(wǎng)絡密度接近0,為稀疏網(wǎng)絡。
5.2.1 連接狀況嚴重不均的異質(zhì)網(wǎng)絡
運用Gephi統(tǒng)計分析功能得出知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡直徑為2,即網(wǎng)絡中任意兩點間距離的最大值僅為2。平均聚類系數(shù)為0.042,該值體現(xiàn)用戶之間的聚集程度,即網(wǎng)絡中兩個用戶之間存在聯(lián)系的概率為0.042,用戶之間聯(lián)系不緊密。平均路徑長度為1.002,即用戶平均通過1.002個節(jié)點用戶就可以與其他節(jié)點用戶接觸。該網(wǎng)絡聚類系數(shù)小,平均長度遠小于6,不符合基于六度分隔理論的小世界網(wǎng)絡。
使用Gephi統(tǒng)計分析功能得出圖7度分布圖,為使圖中度分布顯著,則排除度最大節(jié)點中國之聲,得出知網(wǎng)事件轉(zhuǎn)發(fā)網(wǎng)絡中的結點的度符合冪律分布,故該網(wǎng)絡為節(jié)點度數(shù)嚴重不均勻的無標度網(wǎng)絡。
圖7 網(wǎng)絡節(jié)點度分布(除中國之聲)情況
網(wǎng)絡中轉(zhuǎn)發(fā)鏈路的長度短、寬度窄,傳播速度快,傳播效率高。用戶之間的接觸和信息交流嚴重不均勻,大部分普通用戶為底層邊緣節(jié)點,傳播路徑到他們即終止,只有少數(shù)關鍵節(jié)點在信息傳播中起主導作用。關鍵節(jié)點的識別將在下節(jié)詳細討論。
5.2.2 社群內(nèi)部層級擴散
運用Gephi的模塊化功能社區(qū)探測算法分解網(wǎng)絡。解析度越小,社區(qū)越多;解析度越大,社區(qū)越小。采用適中的解析度3,得出4個子網(wǎng)絡,如圖8所示。采用Modularity Class進行顏色渲染,直觀地得出四個凝聚子群,其規(guī)模差異大,集群現(xiàn)象明顯,如圖9所示。
圖8 模塊化社區(qū)探測結果
圖9 modularity class顏色渲染圖
規(guī)模最大的子網(wǎng)絡是由信息源“中國之聲”主導的,擁有整體網(wǎng)絡中92.42%的節(jié)點,數(shù)量超過三萬。它與其他三個子網(wǎng)絡均有緊密聯(lián)系,三個子網(wǎng)絡各自無過多聯(lián)系。
排名第二的子網(wǎng)絡以官媒“央視新聞”主導,另外四個大度節(jié)點“亭山樵者”、“五分之一刷”、“錦衣夜行焱十一”“蘿卜糖桃桃的抖森喵”均轉(zhuǎn)發(fā)了央視新聞的信息;排名第三的子網(wǎng)絡以自媒體博主“午后狂睡”主導,另外兩個大度節(jié)點“禾幾Voix”、“JinnoNagi的男朋友雷歐”均轉(zhuǎn)發(fā)了“午后狂睡”的信息;排名第四的子網(wǎng)絡以自媒體博主“夢嘚啵嘚佳”主導,大度節(jié)點“橄欖不菜”轉(zhuǎn)發(fā)了“夢嘚啵嘚加”的信息。而三個小規(guī)模子網(wǎng)絡的主導節(jié)點均轉(zhuǎn)發(fā)了信息源“中國之聲”的信息,傳播過程呈多階梯型擴散體系,從信息源到受眾中間出現(xiàn)多個層次的意見領袖,形成多級傳播,如圖10所示。
圖10 多級傳播示意圖
雖然信息傳播的參與人數(shù)多,但是輿論主要由一方主導,不存在輿論對立和輿論失焦的現(xiàn)象。在整個網(wǎng)絡傳播過程中,從一級傳播到多級傳播均有涉及。
5.3.1 節(jié)點指標測度分析
(1)K-Shell分解
K殼分解可用于區(qū)分網(wǎng)絡中節(jié)點的重要程度,識別網(wǎng)絡中的關鍵節(jié)點,分解過程是逐漸剝除當下度為1的節(jié)點,也就是最不重要的節(jié)點,重復循環(huán)該操作直至網(wǎng)絡中沒有度為1的節(jié)點。K值由小到大,重要程度遞增,4殼節(jié)點是網(wǎng)絡中的關鍵節(jié)點,中國之聲、央視新聞、午后狂睡等核心領導力節(jié)點均位于4‐shell中。各類節(jié)點數(shù)量如圖11所示。K核子圖如圖12所示,K值相同節(jié)點存在小范圍聚集情況,但各個子群聯(lián)系不緊密。
圖11 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡K?Shell數(shù)量
圖12 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡K?Shell子圖
(2)度中心性
該轉(zhuǎn)發(fā)網(wǎng)絡排名前10的節(jié)點用戶度中心性結果,如圖13所示。通過對節(jié)點用戶點度中心性分析可以看出,形成轉(zhuǎn)發(fā)網(wǎng)絡中心度排名前三的節(jié)點分別是初始源節(jié)點中國之聲、央視新聞、午后狂睡。前兩者是媒體官號,后者是影評博主,粉絲量都達到百萬千萬的級別,發(fā)揮著意見領袖的作用。節(jié)點用戶的度中心性越大,他們的節(jié)點圈越大,從圖6也可以看出這三個節(jié)點用戶的圈較大。
圖13 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡度中心性和出度情況
出度表示被轉(zhuǎn)發(fā)次數(shù),入度表示轉(zhuǎn)發(fā)次數(shù)。出度體量遠大于入度,信息流動呈單向化。用戶普遍僅轉(zhuǎn)發(fā)一次,最多轉(zhuǎn)發(fā)四次,如圖14所示。說明受眾對知網(wǎng)事件的參與度不深入,傾向于單一地轉(zhuǎn)發(fā)有影響力的信息源。
圖14 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡入度情況
其中中國之聲作為信息源頭,出度達到37729,相當于被轉(zhuǎn)發(fā)37729次。作為央廣旗下的媒體,同時具備信息源和意見領袖的作用,其消息來源真實度高,獲取信息早,社會地位高,更容易受到受眾的追捧,故度中心性處于壟斷地位。
(3)接近中心性
圖15列出接近中心性0.5以上的用戶,這些用戶到其他用戶的最短距離很小,接近幾何上的中心位置,更容易參與到信息傳播過程中。相對地獨立性也較強,不易受到其他節(jié)點的影響。有些節(jié)點同時擁有較大的度中心性和接近中心性,如中國之聲、央視新聞、午后狂睡、火法火法等。他們是知網(wǎng)信息傳播過程中的核心領導力,在形成的轉(zhuǎn)發(fā)網(wǎng)絡中發(fā)揮著重要的作用。
圖15 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡接近中心性
(4)結構洞
結構洞[21]是指兩個關系人之間的非重復關系。如果兩者之間缺少直接的聯(lián)系,而必須通過第三者才能形成聯(lián)系,那么行動的第三者就在關系網(wǎng)絡中占據(jù)了一個結構洞,結構洞是針對于第三者而言的。節(jié)點占據(jù)的結構洞越多,它的地位就越重要,通常用限制度來測量。
將數(shù)據(jù)導入Pajek中,算出限制度,如圖16,取數(shù)值小于0.24的節(jié)點,與對應節(jié)點的度中心性比對,基本走勢成反比。限制度指節(jié)點間存在阻礙的程度,值越小的節(jié)點,越不易受到控制,擁有更多的資源,具有更多的結構洞,他們是傳播網(wǎng)絡中的信息中樞,這些節(jié)點的度中心性也處于領先位置。
圖16 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡限制度
(5)特征向量中心性
特征向量中心性強調(diào)節(jié)點鄰居的數(shù)量和質(zhì)量,特征向量中心性高的節(jié)點連接了很多其他重要節(jié)點。圖17顯示的是用戶數(shù)量與特征向量中心性數(shù)值的關系。特征向量為1的節(jié)點均是通過和少量高分值節(jié)點相連來提高自身的重要性,他們是積極參與到傳播網(wǎng)絡中的普通用戶,多次轉(zhuǎn)發(fā)意見領袖的信息。但大部分普通用戶沒有深入?yún)⑴c到傳播過程中,對此事件的關注淺嘗輒止,值為0.0158的用戶高達91.42%。
圖17 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡特征向量中心性
5.3.3 意見領袖特征
意見領袖是關鍵節(jié)點,是信息中樞,擔任傳播中的核心領導力,在其中起到信息傳遞和意見分發(fā)的關鍵作用。綜上可知,他們的特征即是擁有較大的出度、k值、度中心性和接近中心性,以及較小的限制度。
通過對擁有這些特征的節(jié)點取交集,我們可以識別出網(wǎng)絡中的意見領袖,包括官媒“中國之聲”和“央視新聞”,影評人“午后狂睡”,動漫博主“火法火法”和“JinnoNagi的男朋友雷歐”,娛樂博主“夢嘚啵嘚佳”和“橄欖不菜”,軍事博主“禾幾Voix”,飯圈大粉“蘿卜糖桃桃的抖森喵”和“五分之一刷”,法律博主“普法達人張三”,科技博主“亭山樵者”。他們分屬不同領域,影響不同圈層,再次體現(xiàn)了此次事件的影響范圍之廣。其中信息源“中國之聲”處于轉(zhuǎn)發(fā)網(wǎng)絡中的壟斷地位,其出度值、度中心性和接近中心性以及首發(fā)微博的轉(zhuǎn)贊評都排在首位,并且數(shù)據(jù)量比其他意見領袖高數(shù)十倍。
上一節(jié)討論了意見領袖節(jié)點在轉(zhuǎn)發(fā)網(wǎng)絡中的特征和作用,即傳播主體之間的互動。本節(jié)針對意見領袖發(fā)布的文章內(nèi)容進行討論,也就是傳播內(nèi)容。
基于主流媒體及自媒體發(fā)聲,利用文本分析方法提取其語義信息,觀察意見領袖對輿情事件的加工解讀,繪制詞云如圖18所示?!爸袊?、“市場”、“壟斷”、“調(diào)查”、“學術”、“論文”等詞匯被提及頻率排行前列,媒體大多從客觀事實角度出發(fā)陳述事件,整體對該事件持中立態(tài)度。
圖18 媒體發(fā)文詞云圖
利用LDA主題提取方法得到主題數(shù)困惑度情況如圖19所示,選擇較低困惑度對應的主題數(shù),得到“事件闡述”、“經(jīng)營狀況”兩個主題。
圖19 主題數(shù)困惑度情況
兩個主題各自包含的排名前二十的單詞詞頻排序分別如圖20、圖21所示。“事件闡述”主題中,“知網(wǎng)”、“中國”、“論文”三個單詞P值大于0.95,與主題相關程度最高,該主題與事件發(fā)展始末的敘述高度相關?!敖?jīng)營狀況”主題中,前20個單詞與主題相關程度差別不大,大多數(shù)單詞用來描述知網(wǎng)當前經(jīng)營情況?!笆录U述”內(nèi)最低詞頻高于“經(jīng)營狀況”內(nèi)最高詞頻,說明媒體把主要關注點放在事件本身,衍生話題關注度較低。
圖20 “事件闡述”單詞詞頻排序
圖21 “經(jīng)營狀況”單詞詞頻排序
綜上,媒體報道主要從此次立案調(diào)查事件的發(fā)展始末闡述以及知網(wǎng)經(jīng)營狀況兩個角度展開。這兩個角度也是在解答受眾關心的問題,即知網(wǎng)為什么會被調(diào)查,以及知網(wǎng)在本行業(yè)的壟斷地位從何而來。
使用SnowNLP計算百家號正文情感得分,其分布情況如圖22所示。其中,得分大于0.55表示積極,0.45-0.55表示中立,小于0.45表示消極。
圖22 內(nèi)容情感態(tài)度
過半數(shù)文章對知網(wǎng)事件進行積極闡述,即對知網(wǎng)被市場監(jiān)管局調(diào)查持支持態(tài)度。其他文章均采用中立情緒敘述,沒有消極情緒的文章出現(xiàn)。同時,通過觀察原始得分數(shù)據(jù),所有文章得分均在0.48-0.62之間,說明媒體大多持中立偏積極的態(tài)度對事件進行報道。
之前對知網(wǎng)的報道大部分為負面報道,與其在業(yè)內(nèi)處于壟斷地位的經(jīng)營狀況和對學者的不公平待遇有關,已形成“學界苦知網(wǎng)久矣”的輿論傾向。此次知網(wǎng)被調(diào)查,媒體持的態(tài)度符合先前的議程走向,與先前知網(wǎng)系列報道輿情導向一致。
本研究基于5月13日的知網(wǎng)事件從傳播網(wǎng)絡和發(fā)布內(nèi)容兩個層面分析傳播規(guī)律和輿論傾向。得出如下結論:
(1)此次事件前期潛伏期長,爆發(fā)期短,參與傳播的人數(shù)多、范圍廣,轉(zhuǎn)發(fā)網(wǎng)絡符合無標度網(wǎng)絡特征。輿論主要由一方主導,不存在輿論對立和輿論失焦的現(xiàn)象。傳播呈單向流動,過程呈多階梯型擴散體系,從信息源到受眾中間出現(xiàn)多個層次的意見領袖,形成多級傳播。
(2)用戶個體化強,互動性低,互相聯(lián)系松散,普通用戶主要與傳播網(wǎng)絡中的意見領袖直接建立轉(zhuǎn)發(fā)關系,中介節(jié)點非常少。僅有少量普通用戶多次轉(zhuǎn)發(fā)關鍵節(jié)點的信息,大部分普通用戶沒有深入?yún)⑴c到傳播過程中。意見領袖擁有較大的出度、k值、度中心性和接近中心性,以及較小的限制度。識別出的意見領袖分屬不同領域,影響不同圈層。其中信息源“中國之聲”處于轉(zhuǎn)發(fā)網(wǎng)絡中的壟斷地位,其各個特征均排在首位。
(3)事件的議程設置與先前知網(wǎng)系列報道輿情導向一致。報道內(nèi)容均持中立偏積極的態(tài)度,無消極內(nèi)容,報道主題以事件闡述和經(jīng)營狀況為主。
本次突發(fā)性輿情事件的傳播特征分析可以為輿情預測和控制提供如下參考:(1)對于輿情預測,如果事件存在潛伏期,可以通過提取報道主題和情感傾向,觀察潛伏期的議程設置與此次事件是否一致,來預測用戶反應和輿論走向。若一致,則輿論由一方主導的幾率較大;若不一致,則需要警惕次生輿情引起的討論。(2)對于信息控制,可以用以上指標識別其中的關鍵節(jié)點,有針對地持續(xù)監(jiān)測,以減少工作量。通過控制這些節(jié)點,提取他們輸出信息內(nèi)容的主題,判斷與目標輿情傾向是否相符,來決定擴散還是抑制這些節(jié)點的傳播,讓他們充當把關者。