□遲鈺雪 劉怡君
[1.中國科學院科技戰(zhàn)略咨詢研究院 北京 100190;2.中國科學院大學 北京 100190]
大數(shù)據(jù)時代,信息的獲取與分析面臨著很多新的問題。網(wǎng)絡(luò)輿情方面,數(shù)據(jù)的“大”一方面體現(xiàn)在“數(shù)據(jù)體積”上,熱點事件產(chǎn)生海量、高增長率和多樣化的輿情信息數(shù)據(jù);另一方面體現(xiàn)在“數(shù)據(jù)邏輯”上,社交網(wǎng)絡(luò)用戶并非獨立存在,用戶間存在復雜的社交關(guān)系作為支撐。Web2.0的到來使社交網(wǎng)絡(luò)中的每個用戶既是信息的產(chǎn)生者,又是信息的接受者,輿論領(lǐng)袖的影響日益顯現(xiàn),網(wǎng)絡(luò)社交圈的內(nèi)在機理愈發(fā)復雜?!拜浾擃I(lǐng)袖”的概念于20世紀40年代由拉扎斯菲爾德、貝雷爾森等人首次提出[1]。Huffaker認為輿論領(lǐng)袖常常通過制造或激發(fā)某一特定主題的對話來設(shè)置議程,甚至能影響人們討論話題的方式[2]。雷海平認為微博話語場中的信息和意見日益為意見領(lǐng)袖所掌控和引領(lǐng)[3]。彭蘭則表示,某種意義上意見領(lǐng)袖是網(wǎng)民話語權(quán)的集成者,但同時也認為網(wǎng)絡(luò)現(xiàn)在未必賦予了所有人平等的話語權(quán)[4]。整體而言,社交網(wǎng)絡(luò)中信息的傳播存在“一對多”的輿論大V主導現(xiàn)象。當前,微博作為重要的社交平臺得到了迅速的發(fā)展,微博大V的粉絲動輒數(shù)百萬,回復轉(zhuǎn)發(fā)動輒上萬,而普通用戶發(fā)布的信息鮮有關(guān)注,輿論大V與普通用戶影響力差異懸殊,輿論大V已然成為微博平臺中的輿論領(lǐng)袖。
輿論領(lǐng)袖的影響力不可小覷,但社交網(wǎng)絡(luò)中仍存在著千千萬萬影響力遠不及輿論領(lǐng)袖的普通用戶?,F(xiàn)有對輿論領(lǐng)袖的研究中,宏觀層面多關(guān)注輿論領(lǐng)袖對輿論的影響,季丹等對意見領(lǐng)袖在危機信息傳播中發(fā)揮作用的關(guān)鍵因素進行了探究[5]。夢非則以社會化商務(wù)為研究背景,研究了意見領(lǐng)袖對購買意愿的影響[6]。李卓卓、顧品浩等人則結(jié)合輿論領(lǐng)袖對具體案例進行了輿情分析[7~8]。微觀層面對輿論領(lǐng)袖的研究多集中于輿論領(lǐng)袖的識別。陳遠等將社會網(wǎng)絡(luò)分析的方法應(yīng)用到輿論領(lǐng)袖的識別[9]。馬寧等則運用動態(tài)網(wǎng)絡(luò)分析法識別出了網(wǎng)絡(luò)輿論中的六類不同特點意見領(lǐng)袖[10]。樊興華等則將改進后的影響力擴散概率模型運用到了網(wǎng)絡(luò)意見領(lǐng)袖的篩選中[11]。輿論領(lǐng)袖對輿情的影響不容小視,但輿論領(lǐng)袖卻不能完全代表普通用戶的行為特征,而當前對輿論領(lǐng)袖的研究中,尚缺少將輿論領(lǐng)袖影響下普通用戶作為研究主體的研究。
相較于現(xiàn)有研究,本文以共同受到輿論大V影響的普通用戶群體為主要研究對象,從“數(shù)據(jù)邏輯”的角度,著重探討普通用戶間的行為表現(xiàn)、交互特點,發(fā)現(xiàn)在輿論大V“一對多”的影響下,普通用戶之間存在“多對多”的用戶交互模式。研究視角上,從宏觀、微觀兩個層面分析“多對多”的用戶交互模式。研究方法上,結(jié)合社會網(wǎng)絡(luò)分析的同時,引入社團發(fā)現(xiàn)算法挖掘用戶的交互特征。
信息來源日趨多元化的使得,輿論大V要有足夠的輿論引導力,關(guān)注度必不可少。楊曉茹認為在微博上想要發(fā)布的信息受到關(guān)注,博主需具備如下條件:(1)處于信息源的上端;(2)具有權(quán)力社會身份;(3)發(fā)言能引起共鳴[12]。然而網(wǎng)民作為獨立的個體,關(guān)注不意味著觀點上的認同。與此同時,作為一個動態(tài)的社區(qū),在線社交網(wǎng)絡(luò)中的話題、參與人、交互模式與情感趨向不可能一成不變,網(wǎng)民對輿論大V的認同感也會因時、因事而變。輿論大V對輿情的整體影響固然不容小覷,但在輿論大V影響下的普通網(wǎng)民群體的行為特征與趨向卻不能與輿論大V的行為特征與趨向一概而論。
對輿論大V發(fā)布于在線社交網(wǎng)絡(luò)上的信息,網(wǎng)民最直接的行為可總結(jié)為:轉(zhuǎn)發(fā)、回復與點贊,其中轉(zhuǎn)發(fā)行為的意義偏重于對信息的傳播,點贊行為的意義則主要為對信息的認同,相較之下,網(wǎng)民對輿論大V發(fā)布信息的回復不僅意味著網(wǎng)民已獲知該信息,更意味著網(wǎng)民對該信息形成了自己的觀點。與此同時,網(wǎng)民不僅可以直接回復輿論大V發(fā)布的信息,更可以對回復該信息的其他網(wǎng)民進行二級回復。對觀點的認同和反對均能促使用戶對特定信息進行回復,這使得“回復”這一行為儼然促成了一個因輿論大V而聚合的二級輿論場,而對“回復”產(chǎn)生信息的研究有助于我們認識輿論大V影響下普通網(wǎng)民群體的行為特征。
在此基礎(chǔ)上,基于社會網(wǎng)絡(luò)分析對回復關(guān)系進行抽象建模。社會網(wǎng)絡(luò)的概念由J.A.Barne在1954年提出,用點和線來表達網(wǎng)絡(luò),是社會網(wǎng)絡(luò)的形式化界定[13]。作為一種跨學科的研究方法,社會網(wǎng)絡(luò)分析被廣泛應(yīng)用在心理學[14]、社會學[15]、經(jīng)濟學[16]等學科。在網(wǎng)絡(luò)輿情方面,社會網(wǎng)絡(luò)分析的應(yīng)用也已較為成熟[17~18]。對回復信息,可將每個用戶視為一個節(jié)點v,回復關(guān)系為有向邊e,基于回復產(chǎn)生的信息構(gòu)造回復圖RG。RG=(V,E),節(jié)點集合為其中j,k∈[1,m],邊集合為
“社團”可視為網(wǎng)絡(luò)中具有相似特性或緊密鏈接的點和線的集合。網(wǎng)絡(luò)輿情中的社團發(fā)現(xiàn)有助于挖掘人群、觀點集合,并在此基礎(chǔ)上進一步分析輿情的傳播與演化。社團發(fā)現(xiàn)也可看作一種聚類算法,可依據(jù)社團之間是否有重疊而分成重疊社團發(fā)現(xiàn)算法和非重疊社團發(fā)現(xiàn)算法兩類[19],也可依據(jù)網(wǎng)絡(luò)社團特性,將其分為依據(jù)層次性的算法、依據(jù)重疊性的算法和層次性和重疊性同時體現(xiàn)的算法三類[20]。模塊度被視為評價社團發(fā)現(xiàn)算法的重要指標,模塊度modularity[21]計算公式如下:
其中,m為圖中總邊數(shù),lc代表社團c中所有內(nèi)部邊數(shù),Dc則代表社團c中所有頂點的度之和。fast unfolding算法是當前基于模塊度這一評價指標的最優(yōu)秀的算法之一,故在此采用fast unfolding算法對回復圖RG進行社團發(fā)掘[22]。
為對輿論大V影響下的普通用戶行為特征進行實證分析,從而進一步探究其中規(guī)律,以新浪微博為研究平臺,抽取具有千萬粉絲的官方媒體代表微博“央視新聞”為輿論大V樣本,該樣本滿足關(guān)注度高、社會地位高、居于信息源上端等特點。事件選取方面,取2016年、2017年的“男童墜井”和“榆林產(chǎn)婦”兩件突發(fā)性事件作為事件樣本,從央視新聞發(fā)布的事件相關(guān)微博中各選取三條作為研究對象?;跀?shù)據(jù)采集平臺,抓取每條微博的評論信息,經(jīng)數(shù)據(jù)預(yù)處理后,得到具體數(shù)據(jù)信息見表1。
時間因素和體量因素是宏觀層面反映回復信息特征的重要因素,在此基礎(chǔ)上對抓取的回復信息進行分析。獲取每條回復信息的時間標簽進行統(tǒng)計整理,得到回復信息數(shù)量折線圖如圖2。
分析發(fā)現(xiàn)除男童墜井事件的第二條微博,其他微博中的評論信息在第一天即達到峰值,前三天隨著時間的推移而急劇下降,后趨于平緩。追溯男童墜井事件的第二條微博,發(fā)現(xiàn)該微博發(fā)布時間為當天的23時37分,這意味著,23分鐘內(nèi)該微博的評論量就高達981條,若將事件發(fā)生后的24小時記為第一天,則這與上述結(jié)論在根本上并不矛盾。
進一步統(tǒng)計微博發(fā)布前三天微博回復信息占比如表2。由表2可知,微博發(fā)布前三天的回復數(shù)占總數(shù)近99%,網(wǎng)民的回復熱情消退迅速,這說明在輿論大V影響下,網(wǎng)民對信息“喜新厭舊”的心理明顯,作用到行為上則表現(xiàn)為大V影響下普通用戶間交互的周期較短。
結(jié)合圖1、表2可知:(1)相較于新聞的“七天原則”,輿論大V發(fā)布的單條微博評論信息的高關(guān)注期較短,僅為三天左右,大V影響下普通用戶間交互周期較短。(2)每例事件輿論大V都在不同時間發(fā)布了多條信息,故就事件整體而言輿論高關(guān)注期在5~7天。
從宏觀層面深入到微觀,具體探究普通用戶間的行為模式。發(fā)現(xiàn)基于評論對象,評論信息可分為兩類:(1)對輿論大V的直接評論;(2)對普通用戶評論信息的二次評論。在本實驗樣本中,間接評論占比如表3。
若對輿論大V的直接評論主要體現(xiàn)著輿論大V與普通用戶之間“一對多”的影響,間接評論則代表著普通用戶之間“多對多”的交互模式。通過表3可知,整體而言間接評論占比接近50%,這說明因輿論大V影響而聚合到一起的普通用戶社團中仍存在著復雜的用戶交互行為。
圖1 回復信息數(shù)量折線圖
圖2 榆林產(chǎn)婦事件微博1網(wǎng)絡(luò)圖
從數(shù)據(jù)集中抽取間接評論數(shù)據(jù)構(gòu)建回復關(guān)系圖RG(相同的回復關(guān)系僅計一次)。運用Gephi對回復關(guān)系圖進行可視化,以榆林產(chǎn)婦事件中的微博1和男童墜井事件中的微博2為例進行可視化,可視化結(jié)果如圖2、圖3。
通過兩類事件的網(wǎng)絡(luò)圖不難發(fā)現(xiàn)間接回復構(gòu)成網(wǎng)絡(luò)中的各點呈現(xiàn)兩種趨勢,一方面存在較為明顯的集聚效應(yīng),另一方面又存在大量的游離用戶集合。在此基礎(chǔ)上,運用fast unfolding社團發(fā)現(xiàn)算法對回復圖RG進行社團發(fā)掘。發(fā)掘后,統(tǒng)計各微博對應(yīng)的平均社團規(guī)模如表4。
表3 間接評論占比如表
圖3 男童墜井事件微博2網(wǎng)絡(luò)圖
表4 平均社團規(guī)模
分析表4,從社團數(shù)和平均節(jié)點數(shù)兩方面入手:
(1)社團數(shù):整體而言,可以發(fā)現(xiàn)社團數(shù)基本與總結(jié)點數(shù)成正比,這一定程度上意味著由間接回復關(guān)系構(gòu)成的回復圖RG中,其社團結(jié)構(gòu)存在一定的規(guī)律性。
(2)平均節(jié)點:各條微博在平均節(jié)點方面存在較大差異,但可以發(fā)現(xiàn)每例事件中,平均節(jié)點數(shù)最高者較最低者高出約一倍,且都為總結(jié)點數(shù)最高的微博。結(jié)合圖3、表4,推測總結(jié)點數(shù)較高的微博中存在大型社團致使平均節(jié)點數(shù)被拉高。
為進一步分析回復圖RG中的社團關(guān)系,需進一步了解不同規(guī)模社團的分布狀況。設(shè)社團i包含的節(jié)點數(shù)為cn(i),當cn=x時,社團數(shù)累計占比acR的計算公式為:
其中sumCommunity代表社團總數(shù),sumNode代表節(jié)點總數(shù)。
針對樣本數(shù)據(jù),計算使acnR>20%時最大的x值,及對應(yīng)的社團數(shù)累計占比和節(jié)點數(shù)累計占比得表5。
表5 累計占比表
表5數(shù)據(jù)顯示,對于使acnR>20%時最大的x值,對應(yīng)的節(jié)點數(shù)累計占比平均值約為76%,接近80%,也就是社團規(guī)模數(shù)最大的前20%個社團涉及的用戶占總用戶數(shù)的80%,這說明在輿論大V影響下的普通用戶間交互形成的社團適用于帕累托法則。帕累托法則的適用在進一步證實了之前提到的回復圖RG中集聚與分散并存現(xiàn)象的同時,對該現(xiàn)象進行了定量化的解釋。
值得注意的是,從圖3可以發(fā)現(xiàn)大型社團中多存在一個作為焦點的核心節(jié)點,且多為被回復節(jié)點。從結(jié)構(gòu)上看,與輿論大V在輿論傳播網(wǎng)絡(luò)中所處的地位類似,但追溯到具體回復內(nèi)容時發(fā)現(xiàn),這類核心節(jié)點有時收到的是用戶贊同的回復,說明其具備了一定的影響力,但有時這類節(jié)點不僅不具備輿論大V的影響力,還可能是聚合了相反觀點的“眾矢之的”,圖3中的規(guī)模最大社團中的核心節(jié)點便是這種情況。在輿論大V影響下普通用戶間交互形成的拓撲結(jié)構(gòu)中,存在著“同形不同義”的現(xiàn)象,該現(xiàn)象的存在值得后續(xù)在對觀點的進一步研究時給予關(guān)注。
自媒體時代,輿論大V可視為民眾觀點的集成者,但在輿論大V影響下的普通網(wǎng)民群體的行為特征與趨向卻不能與輿論大V的行為特征與趨向一概而論。在此基礎(chǔ)上,本文從大數(shù)據(jù)“數(shù)據(jù)邏輯”的角度出發(fā),以輿論大V影響下的普通網(wǎng)民群體的行為特征與趨向為研究對象。通過分析網(wǎng)民對輿論大V的反饋行為,選定回復關(guān)系構(gòu)造回復圖,結(jié)合社會網(wǎng)絡(luò)分析從宏觀、微觀兩個層面進行研究,發(fā)現(xiàn)從宏觀層面,網(wǎng)民對輿論大V發(fā)布的微博“喜新厭舊”的心理明顯,對單條微博的關(guān)注度消退迅速;微觀層面,從拓撲結(jié)構(gòu)來看,大V影響下的普通網(wǎng)民群體中集聚與離散現(xiàn)象并存,經(jīng)社團挖掘和進一步分析發(fā)現(xiàn)帕累托法則適用于輿論大V影響下的普通用戶間交互形成的社團規(guī)模。
在研究中我們發(fā)現(xiàn),普通用戶間的行為模式與潛在邏輯關(guān)系要比我們的預(yù)想更為復雜,“同形不同義”的現(xiàn)象就可見一斑。這種復雜性是主觀層面人類的心理、行為與客觀層面信息的發(fā)布、傳播多系統(tǒng)交叉結(jié)合的產(chǎn)物。為進一步探討,該領(lǐng)域在今后應(yīng)全面地結(jié)合多元信息,構(gòu)筑復雜系統(tǒng)進行刻畫與研究。
[1] 馬寧, 劉怡君.基于超網(wǎng)絡(luò)的輿論領(lǐng)袖識別應(yīng)用研究[J].中國科學院院刊, 2012, 27(5):586-594.
[2] HUFFAKER D.Dimensions of Leadership and Social Influence in Online Communities[J].Human Communication Research, 2010, 36(4):593-617.
[3] 雷海平.微博話語場中的意見領(lǐng)袖[J].現(xiàn)代交際月刊,2011(8):5-7.
[4] 彭蘭.微博話語權(quán)力格局的現(xiàn)實圖畫[J].人民論壇,2013(10):58-59.
[5] 季丹, 郭政.網(wǎng)絡(luò)意見領(lǐng)袖對危機信息傳播效果的影響因素研究[J].情報雜志, 2015, 34(2):22-27.
[6] 夢非.社會化商務(wù)環(huán)境下意見領(lǐng)袖對購買意愿的影響研究[D].南京:南京大學, 2012.
[7] 李卓卓, 丁子涵.基于社會網(wǎng)絡(luò)分析的網(wǎng)絡(luò)輿論領(lǐng)袖發(fā)掘—以大學生就業(yè)輿情為例[J].情報雜志, 2011, 30(11):67-70+66.
[8] 顧品浩, 蔣冠.突發(fā)性公共事件中的網(wǎng)絡(luò)意見領(lǐng)袖分析—以“楊達才事件”為例[J].情報雜志, 2013, 32(5):20-24.
[9] 陳遠, 劉欣宇.基于社會網(wǎng)絡(luò)分析的意見領(lǐng)袖識別研究[J].情報科學, 2015, 33(4):13-19+92.
[10] 馬寧, 田儒雅, 劉怡君, 李倩倩.基于動態(tài)網(wǎng)絡(luò)分析(DNA)的意見領(lǐng)袖識別研究[J].科研管理, 2014, 35(8):83-92.
[11] 樊興華, 趙靜, 方濱興, 李欲曉.影響力擴散概率模型及其用于意見領(lǐng)袖發(fā)現(xiàn)研究[J].計算機學報, 2013, 36(2):360-367.
[12] 楊曉茹.傳播學視域中的微博研究[J].當代傳播(漢文版), 2010(2):73-74.
[13] 甘丹.博客世界交流模式的社會網(wǎng)絡(luò)分析[D].濟南:山東大學, 2007.
[14] 羅瑤.虛擬社區(qū)成員知識分享動機研究[D].上海:復旦大學, 2013.
[15] 于樂.社會網(wǎng)絡(luò)中社團發(fā)現(xiàn)及網(wǎng)絡(luò)演化分析[D].北京:北京郵電大學, 2014.
[16] 鄒聰.基于股票價格相關(guān)系數(shù)的上證股市社會網(wǎng)絡(luò)分析[D].北京:北京工業(yè)大學, 2013.
[17] 張偉.基于復雜社會網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情演化模型研究[D].哈爾濱:哈爾濱工業(yè)大學, 2014.
[18] 蔣侃, 唐竹發(fā), 張煒.基于微博的企業(yè)網(wǎng)絡(luò)輿情結(jié)構(gòu)測度與分析—以“3.15”江淮汽車“生銹門”事件為例[J].情報雜志, 2014, 33(4):112-116+111.
[19] 駱志剛, 丁凡, 蔣曉舟, 等.復雜網(wǎng)絡(luò)社團發(fā)現(xiàn)算法研究新進展[J].國防科技大學學報, 2011, 33(1):47-52.
[20] 汪小帆, 劉亞冰.復雜網(wǎng)絡(luò)中的社團結(jié)構(gòu)算法綜述[J].電子科技大學學報, 2009, 38(5):537-543.
[21] NEWMAN M E J, GIRVAN M.Finding and evaluating community structure in networks[J].Phys Rev E,2004, 69(2):026113.
[22] BLONDEL V D, GUILLAUME J-L, LAMBIOTTE R, LEFEBVRE E.Fast unfolding of communities in large networks[J].Journal of Statistical Mechanics, 2008 (10):155-168.