涂貴宇 潘文林 張?zhí)燔?/p>
(1.云南民族大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院 昆明 650504)(2.云南民族大學(xué)軟件工程研究所 昆明 650504)
隨著新浪微博網(wǎng)絡(luò)社交平臺(tái)的興起,許多網(wǎng)民、媒體等蜂擁而至的在網(wǎng)絡(luò)社交平臺(tái)上對(duì)某一輿論發(fā)表觀點(diǎn)、實(shí)時(shí)交流,無(wú)形之間加快了信息傳播的速度和廣度。任何一個(gè)網(wǎng)絡(luò)中,或多或少都存在著占有不可或缺地位的節(jié)點(diǎn),這些節(jié)點(diǎn)一旦被移除或是攻擊,整個(gè)網(wǎng)絡(luò)很有可能會(huì)在連通性、穩(wěn)定性等方面受到一定程度的影響。例如在微博輿情傳播網(wǎng)絡(luò)中,通過(guò)控制關(guān)鍵人物就能把握輿情的走勢(shì)。因此,關(guān)鍵節(jié)點(diǎn)識(shí)別的理論研究意義和應(yīng)用價(jià)值不可估量。
針對(duì)輿情超網(wǎng)絡(luò)及關(guān)鍵節(jié)點(diǎn)的識(shí)別,國(guó)內(nèi)有不少研究。例如,趙劍華[1]等將SIR 傳播模型運(yùn)用于社交網(wǎng)絡(luò)輿情傳播的分析中;王晰?。?]等基于SNA闡述了移動(dòng)環(huán)境下網(wǎng)絡(luò)輿情傳播;蔣侃[3]等分析了輿情關(guān)鍵節(jié)點(diǎn)識(shí)別及擴(kuò)散;楊伊帆[4]發(fā)現(xiàn)加快網(wǎng)絡(luò)輿情消退的關(guān)鍵在于對(duì)次意見領(lǐng)袖實(shí)施干預(yù);魏瑩[5]等闡述用主路徑分析法鑒別關(guān)鍵節(jié)點(diǎn)和控制輿情擴(kuò)散;周麗娜[6]等通過(guò)鄰接結(jié)構(gòu)熵確定了超網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn);王日芬[7]等研究了社會(huì)網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)的識(shí)別及應(yīng)用;張磊[8]等基于超網(wǎng)絡(luò)建立語(yǔ)義社會(huì)網(wǎng)絡(luò)并對(duì)其關(guān)鍵節(jié)點(diǎn)識(shí)別進(jìn)行了研究;馬寧[9]等利用超邊排序算法對(duì)網(wǎng)絡(luò)輿情領(lǐng)袖進(jìn)行識(shí)別;高俊峰[10]對(duì)輿情內(nèi)的輿論領(lǐng)袖所起到的號(hào)召能力進(jìn)行測(cè)度研究;詹天成[11]等將微博內(nèi)網(wǎng)絡(luò)領(lǐng)袖間的關(guān)聯(lián)用社會(huì)網(wǎng)絡(luò)分析法進(jìn)行分析;胡亞雪[12]對(duì)面向微博輿情用戶挖掘及消息傳播預(yù)測(cè)關(guān)鍵技術(shù)進(jìn)行研究;許鵬程[13]等對(duì)知識(shí)超網(wǎng)絡(luò)中的領(lǐng)域?qū)<疫M(jìn)行識(shí)別;Zlatic Vinko[14]等對(duì)超網(wǎng)絡(luò)中的超邊進(jìn)行排序提出輿情超網(wǎng)絡(luò)模型中的SuperEdgeRank算法等。
本文將在前人研究的基礎(chǔ)上,對(duì)新冠肺炎輿情超網(wǎng)絡(luò)中的重要節(jié)點(diǎn)加以識(shí)別,更好地為有關(guān)政府機(jī)構(gòu)在新冠肺炎輿情傳播中對(duì)關(guān)鍵用戶的干預(yù)提供依據(jù),以控制新冠肺炎的網(wǎng)絡(luò)輿情走勢(shì)。
超網(wǎng)絡(luò)“Supernetwork”方法是由Nagurney[15]最先明確的,將超越而又超出現(xiàn)有網(wǎng)絡(luò)的網(wǎng)絡(luò)定義為超網(wǎng)絡(luò)。根據(jù)模型構(gòu)建基礎(chǔ),超網(wǎng)絡(luò)模型可分為基于網(wǎng)絡(luò)的超網(wǎng)絡(luò)模型(Supernetwork)和基于超圖的超網(wǎng)絡(luò)模型(Hypernetwork)[16]?;诰W(wǎng)絡(luò)的超網(wǎng)絡(luò)更傾向于梳理網(wǎng)絡(luò)層次關(guān)系,基于超圖的超網(wǎng)絡(luò)更傾向于體現(xiàn)節(jié)點(diǎn)之間的復(fù)雜關(guān)系,當(dāng)因素、層級(jí)涉及的越多的時(shí)候,基于網(wǎng)絡(luò)的超網(wǎng)絡(luò)模型應(yīng)用優(yōu)勢(shì)越明顯。因此,本文將利用基于網(wǎng)絡(luò)的超網(wǎng)絡(luò)模型進(jìn)行后續(xù)的研究。
馬寧[17]等闡述微博輿情網(wǎng)絡(luò)由社交子網(wǎng)、環(huán)境子網(wǎng)、心理子網(wǎng)、觀點(diǎn)子網(wǎng)4 個(gè)子網(wǎng)構(gòu)成;梁曉賀[18]等將微博輿情網(wǎng)絡(luò)分為社交子網(wǎng)、觀點(diǎn)子網(wǎng)、時(shí)序子網(wǎng)和情感子網(wǎng);張連峰[19]等認(rèn)為微博輿情網(wǎng)絡(luò)由環(huán)境子網(wǎng)、社交子網(wǎng)、內(nèi)容子網(wǎng)、情感子網(wǎng)和時(shí)序子網(wǎng)5 個(gè)子網(wǎng)構(gòu)成等。結(jié)合前人的研究思想及超網(wǎng)絡(luò)理論基礎(chǔ),將輿情超網(wǎng)絡(luò)劃分為IP 屬地子網(wǎng)、主體子網(wǎng)、內(nèi)容子網(wǎng)、觀點(diǎn)子網(wǎng)和時(shí)序子網(wǎng),見圖1(a)。在輿情超網(wǎng)絡(luò)中,主體子網(wǎng)、內(nèi)容子網(wǎng)、觀點(diǎn)子網(wǎng)三個(gè)核心層子網(wǎng)是相互貫通的,是輿情生命周期存在的主要條件。為了更精準(zhǔn)地識(shí)別關(guān)鍵節(jié)點(diǎn),將內(nèi)容子網(wǎng)拆分成信息子網(wǎng)和話題子網(wǎng)以及暫且隱去IP 屬地子網(wǎng)和時(shí)序子網(wǎng),剩下的主體子網(wǎng)、信息子網(wǎng)、話題子網(wǎng)、觀點(diǎn)子網(wǎng)間的關(guān)聯(lián),見圖1(b)。
圖1 輿情超網(wǎng)絡(luò)和輿情節(jié)點(diǎn)關(guān)聯(lián)
2.3.1 主體子網(wǎng)
以微博用戶為節(jié)點(diǎn),用戶間的評(píng)論關(guān)系為邊連接節(jié)點(diǎn),從而建立主體子網(wǎng)。
定義:節(jié)點(diǎn)為微博用戶,以用戶之間的評(píng)論關(guān)系構(gòu)造有向邊,由此構(gòu)造的用戶評(píng)論關(guān)系網(wǎng)絡(luò)見式(1)。
其中P={P1,P2,P3,…,Pn} 是微博用戶的有限集合,EP?P的計(jì)算方法見式(2)和式(3)。
其中,P1,P2,P3,…,Pn是微博用戶,是SP網(wǎng)絡(luò)中點(diǎn)的集合;(Pi,Pj)為SP網(wǎng)絡(luò)中邊的集合。
2.3.2 信息子網(wǎng)
以用戶發(fā)布的帖子內(nèi)容為節(jié)點(diǎn),圍繞該帖子參與討論的話題為邊連接節(jié)點(diǎn),從而建立信息子網(wǎng)。
定義:節(jié)點(diǎn)為用戶發(fā)布的帖子內(nèi)容,以用戶圍繞該帖子參與討論的話題為關(guān)系構(gòu)造無(wú)向邊,由此構(gòu)建的信息子網(wǎng)見式(4)。
其中C={C1,C2,C3,…,Cn} 是帖子內(nèi)容的有限集合,EC?C的計(jì)算方法見式(5)和式(6)。
其中,C1,C2,C3,…,Cn是帖子內(nèi)容,是SC網(wǎng)絡(luò)中點(diǎn)的集合;(Ci,Cj)為SC網(wǎng)絡(luò)中邊的集合。
2.3.3 話題子網(wǎng)
以用戶討論的話題為節(jié)點(diǎn),話題包含著的關(guān)鍵詞相似度為關(guān)系連接節(jié)點(diǎn),從而建立話題子網(wǎng)。
定義:節(jié)點(diǎn)為用戶討論的話題,以話題包含著的關(guān)鍵詞相似度為關(guān)系構(gòu)造無(wú)向邊,由此構(gòu)造的話題子網(wǎng)見式(7)。
其中T={T1,T2,T3,…,Tn} 是用戶討論的話題的有限集合,ET?T的計(jì)算方法見式(8)和式(9)。
其中,T1,T2,T3,…,Tn是用戶討論的話題,是ST網(wǎng)絡(luò)中點(diǎn)的集合;(Ti,Tj)為ST網(wǎng)絡(luò)中邊的集合。
2.3.4 觀點(diǎn)子網(wǎng)
觀點(diǎn)態(tài)度傾向可以分為三類:正面觀點(diǎn)、中立觀點(diǎn)和負(fù)面觀點(diǎn)。以用戶對(duì)某一話題發(fā)表的觀點(diǎn)中提取出的態(tài)度詞詞匯本體為節(jié)點(diǎn),態(tài)度詞的傾向性為關(guān)系連接節(jié)點(diǎn),從而構(gòu)建觀點(diǎn)子網(wǎng)。
定義:節(jié)點(diǎn)為用戶對(duì)某一話題發(fā)表的觀點(diǎn)中提取出的態(tài)度詞詞匯本體,以態(tài)度詞的傾向性為關(guān)系構(gòu)造無(wú)向邊,由此構(gòu)造的觀點(diǎn)子網(wǎng)見式(10)。
其中K={K1,K2,K3,…,Kn} 是態(tài)度詞詞匯本體的有限集合,EK?K的計(jì)算方法見式(11)和式(12)。
其中,K1,K2,K3,…,Kn是態(tài)度詞,是SK網(wǎng)絡(luò)中點(diǎn)的集合;(Ki,Kj)為SK網(wǎng)絡(luò)中邊的集合。
在多重因素共同作用下的輿情超網(wǎng)絡(luò)模型中,不同因素之間存在著不同類型的關(guān)系,其中包括同質(zhì)因素之間的關(guān)聯(lián)關(guān)系(即層內(nèi)關(guān)系)和異質(zhì)因素之間的映射關(guān)系(即層間映射關(guān)系)。主體子網(wǎng)到信息子網(wǎng)的映射表示某微博用戶發(fā)布了哪些帖子,可能同一個(gè)用戶發(fā)布多條帖子,也可能多個(gè)用戶發(fā)布了同一條帖子(即轉(zhuǎn)發(fā));信息子網(wǎng)到話題子網(wǎng)的映射表示用戶在某一條帖子中選擇自己感興趣的一個(gè)話題或是多個(gè)話題展開討論;話題子網(wǎng)到觀點(diǎn)子網(wǎng)的映射表示用戶對(duì)某一個(gè)話題發(fā)表了觀點(diǎn)。4層子網(wǎng)絡(luò)層內(nèi)和層間映射唇齒相依,由此構(gòu)建輿情超網(wǎng)絡(luò)模型。輿情超網(wǎng)絡(luò)模型超邊的定義見式(13)。
其中,超邊SEP?C?T?K表示用戶Pi發(fā)布了帖子Cj,參與討論話題Tm發(fā)表了包含態(tài)度詞Kn的觀點(diǎn)。
因此構(gòu)建的輿情超網(wǎng)絡(luò)模型(CPH)見式(14)。
模擬輿情超網(wǎng)絡(luò)模型使文中的研究思路和方法清晰易曉。主體子網(wǎng)P、信息子網(wǎng)C、話題子網(wǎng)T和觀點(diǎn)子網(wǎng)K中分別包含了6 個(gè)微博用戶、3 個(gè)信息節(jié)點(diǎn)、5 個(gè)話題及20 個(gè)態(tài)度詞。表1 展示了4層子網(wǎng)絡(luò)層間節(jié)點(diǎn)的映射關(guān)系。
表1 輿情具體超網(wǎng)絡(luò)模型示例
1)節(jié)點(diǎn)超度
超網(wǎng)絡(luò)中的節(jié)點(diǎn)超度是指包含這個(gè)節(jié)點(diǎn)的超邊數(shù)量。在輿情超網(wǎng)絡(luò)模型中節(jié)點(diǎn)超度值越大,其影響力就越大,該節(jié)點(diǎn)越可能成為活躍用戶。如在上述建立的輿情具體超網(wǎng)絡(luò)模型中,SDP1=2 ,SDP6=3 等。
2)超邊連接度
超網(wǎng)絡(luò)中的超邊連接度是指某條超邊所相鄰的其它超邊的數(shù)目。超邊連接度越大,該節(jié)點(diǎn)越可能成為核心人物。如在上述建立的輿情具體超網(wǎng)絡(luò)模型中,L(SE3)=5,L(SE7)=2 等。
3)平均最短距離
超網(wǎng)絡(luò)中平均最短距離是指某個(gè)節(jié)點(diǎn)到達(dá)其它所有節(jié)點(diǎn)的平均距離,平均最短距離越小的節(jié)點(diǎn)影響力越大,該節(jié)點(diǎn)越可能成為意見領(lǐng)袖。如在上述建立的輿情具體超網(wǎng)絡(luò)模型中,=0.25 ,=0.17 等。
首先基于python 爬取以#新冠肺炎#為主題的微博數(shù)據(jù),獲取用戶名稱、帖子及評(píng)論內(nèi)容;其次將jieba 分詞模塊運(yùn)用于微博文檔以及評(píng)論的分詞處理,去除無(wú)關(guān)的內(nèi)容,例如標(biāo)點(diǎn)、“回復(fù):”、“@”等樣式的;最后用python進(jìn)行LDA[20]模型話題生成。
根據(jù)微博用戶之間的評(píng)論關(guān)系、對(duì)應(yīng)用戶發(fā)布的帖子、參與討論的話題以及發(fā)表的觀點(diǎn)為關(guān)系,建立主體子網(wǎng)、信息子網(wǎng)、話題子網(wǎng)和觀點(diǎn)子網(wǎng),然后根據(jù)各子層間的映射關(guān)系,最終建立新冠肺炎輿情超網(wǎng)絡(luò)。主體子網(wǎng)絡(luò)共有341 個(gè)用戶節(jié)點(diǎn),信息子網(wǎng)包括258 條有效網(wǎng)民帖子及評(píng)論,話題子網(wǎng)包含47 個(gè)話題核心關(guān)鍵詞,觀點(diǎn)子網(wǎng)絡(luò)中共包含提取出的30個(gè)態(tài)度詞匯,見表2。
表2 新冠肺炎輿情超網(wǎng)絡(luò)各子層網(wǎng)絡(luò)
在構(gòu)建完成的新冠肺炎輿情超網(wǎng)絡(luò)中,以微博用戶為研究對(duì)象,計(jì)算微博用戶的節(jié)點(diǎn)超度值、超邊連接度、平均最短距離以及超邊排序值。
1)節(jié)點(diǎn)超度
在構(gòu)成該輿情主體子網(wǎng)的341 位用戶中,大多數(shù)用戶的節(jié)點(diǎn)超度值是1,表3 中列出了節(jié)點(diǎn)超度值排名前10 的微博用戶,這10 位用戶很有可能成為該新冠肺炎輿情超網(wǎng)絡(luò)中的活躍人物。
表3 超度值排名
2)超邊連接度
計(jì)算上述10 位預(yù)備活躍人物的超邊連接度,表4 中列出超邊連接度排名前7 的微博用戶,這7位微博用戶很有可能成為該新冠肺炎輿情超網(wǎng)絡(luò)中的核心人物。
表4 超邊連接度排名
3)平均最短距離
計(jì)算這7 位預(yù)備核心人物到達(dá)其他微博用戶的平均最短距離,識(shí)別出新冠肺炎輿情超網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn),即該新冠肺炎輿情超網(wǎng)絡(luò)中的輿情領(lǐng)袖,見表5。
表5 平均最短距離
從表5 中可知,平均最短距離最小的4 位分別是橋組、Real 厲害財(cái)經(jīng)、努力在搞機(jī)以及李青大夫。這四位關(guān)鍵節(jié)點(diǎn)用戶在新冠肺炎輿情超網(wǎng)絡(luò)中的部分超邊組成情況如表6所示。
表6 超邊組成情況
其中,在觀點(diǎn)態(tài)度詞列Ki中,0 表示用戶未發(fā)表觀點(diǎn),1 表示用戶發(fā)表了觀點(diǎn)。C1表示內(nèi)容為“接種過(guò)疫苗,第三次甚至第四次感染…”的帖子,該帖子包含話題#新冠肺炎#;C2表示內(nèi)容為“r/co?vid19positive 版有13 萬(wàn)人,每天有人發(fā)表自己得了新冠…”的帖子,該帖子包含話題#新冠肺炎#;C5表示內(nèi)容為“新冠、選舉、經(jīng)濟(jì),韓國(guó)正在進(jìn)行一場(chǎng)逆天的實(shí)驗(yàn),新冠疫情日增破40 萬(wàn),7 天均增世界第一…”的帖子,該帖子包含話題#韓國(guó)#、#新冠肺炎#和#尹錫悅當(dāng)選韓國(guó)總統(tǒng)#;C15表示內(nèi)容為“海外疫情不斷走高,全球經(jīng)濟(jì)…”的帖子,該帖子包含話題#新冠肺炎#;C31表示內(nèi)容為“十天前獲批首款國(guó)產(chǎn)新冠口服藥的河南真實(shí)生物科技有限公司…”的帖子,該帖子包含話題#科技#、#醫(yī)藥#、#新冠肺炎#和#首款國(guó)產(chǎn)新冠口服藥公司赴港上市#;C74表示內(nèi)容為“疫情大時(shí)代背景下,為了應(yīng)對(duì)潛在的經(jīng)濟(jì)下行壓力…”的帖子,該帖子包含話題#蘋果放緩部分招聘#;C17表示內(nèi)容為“主動(dòng)感染新冠會(huì)怎么樣?34 人挑戰(zhàn)實(shí)驗(yàn)結(jié)果發(fā)布…”的帖子,該帖子包含話題#新冠肺炎#;C14表示內(nèi)容為“韓國(guó)把新冠降級(jí)為乙類傳染病”的帖子,該帖子包含話題#視頻星計(jì)劃#、#疫情#和#韓國(guó)#。
本論文將超網(wǎng)絡(luò)理論運(yùn)用于新冠肺炎輿情傳播中的各個(gè)子網(wǎng)建模,應(yīng)用Matlab、python 仿真分析方法識(shí)別新冠肺炎輿情中的關(guān)鍵節(jié)點(diǎn)。介紹了輿情超網(wǎng)絡(luò)模型子網(wǎng)絡(luò),主要包括主體子網(wǎng)、信息子網(wǎng)、話題子網(wǎng)以及觀點(diǎn)子網(wǎng)4 層子網(wǎng)絡(luò),并依據(jù)層間的映射關(guān)系構(gòu)建輿情超網(wǎng)絡(luò)模型;還介紹了用于識(shí)別關(guān)鍵節(jié)點(diǎn)的超網(wǎng)絡(luò)測(cè)度指標(biāo);最后通過(guò)仿真分析,證明了超網(wǎng)絡(luò)分析法在關(guān)鍵節(jié)點(diǎn)識(shí)別中的可靠性。
在新冠肺炎輿情超網(wǎng)絡(luò)中識(shí)別出關(guān)鍵節(jié)點(diǎn),有助于相關(guān)部門實(shí)施相應(yīng)的引導(dǎo)和干預(yù)政策,避免因消息在傳播過(guò)程中出現(xiàn)“信息失真”現(xiàn)象而引起群眾恐慌,進(jìn)而妨礙疫情防控工作。在應(yīng)對(duì)突發(fā)的公共衛(wèi)生事件輿情傳播方面,要針對(duì)該類輿情事件對(duì)群眾進(jìn)行網(wǎng)民教育,切記不信謠不傳謠、有意識(shí)地培養(yǎng)正面意見領(lǐng)袖等,這需要在公共衛(wèi)生事件輿情超網(wǎng)絡(luò)中進(jìn)行更加深入的仿真分析。