亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于知識(shí)圖譜的抗疫意見領(lǐng)袖熱點(diǎn)話題檢測(cè)與分析

        2020-12-01 03:15:00任東亮林紹福黃鴻發(fā)付鈺
        軟件導(dǎo)刊 2020年10期
        關(guān)鍵詞:意見領(lǐng)袖新冠疫情網(wǎng)絡(luò)輿情

        任東亮 林紹福 黃鴻發(fā) 付鈺

        摘 要:新型冠狀病毒(COVID-19)疫情爆發(fā)期間,涌現(xiàn)出了眾多的抗疫意見領(lǐng)袖。通過(guò)對(duì)意見領(lǐng)袖話題傳播和演化進(jìn)行分析研究,可以為網(wǎng)絡(luò)輿情治理和疫情防控提供理論和知識(shí)支撐。采用N-Gram語(yǔ)言模型和Shingling相似度算法相結(jié)合的方式進(jìn)行話題檢測(cè),再通過(guò)Neo4j圖數(shù)據(jù)庫(kù)存儲(chǔ)與檢索意見領(lǐng)袖、話題、事件等多維實(shí)體特征,構(gòu)建以意見領(lǐng)袖為核心的話題圖譜。實(shí)驗(yàn)結(jié)果表明,話題準(zhǔn)確率達(dá)82.3%,召回率達(dá)81.6%,與傳統(tǒng)Single-Pass聚類相似度算法相比均有所提高。通過(guò)對(duì)圖譜分析,能夠簡(jiǎn)單直觀地展示出不同實(shí)體間多維輿情關(guān)系。同時(shí),可以提高檢索速度和分析效率,符合輿情傳播客觀規(guī)律。

        關(guān)鍵詞:新冠疫情;意見領(lǐng)袖;網(wǎng)絡(luò)輿情;知識(shí)圖譜;話題分析

        DOI:10. 11907/rjdk. 201625

        中圖分類號(hào):TP301 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2020)010-0020-05

        Abstract:Many anti-epidemic opinion leaders emerged during the outbreak of COVID-19 period. Through the analysis and research on the topic dissemination and evolution of opinion leaders,it can provide theoretical and knowledge support for network public opinion governance and epidemic prevention and control. This paper first uses the combination of N-Gram language model and shingling similarity algorithm for topic detection. Then by storing and retrieving the multi-dimensional entity characteristics such as opinion leaders, topics, events and so on, Neo4j graph database is used to build topic graph with opinion leaders as the core. The results show that topic accuracy reaches 82.3% and recall rate 81.6%, which are improved compared with the traditional Single-Pass clustering similarity algorithm.Through the analysis of the Graph, the multidimensional public opinion relationship between different entities can be displayed simply and intuitively.At the same time, it can improve the retrieval speed and analysis efficiency, and conform to the objective law of public opinion dissemination.

        Key Words: COVID-19 epidemic; opinion leader; network public opinion; knowledge graph; topic analysis

        0 引言

        抗疫意見領(lǐng)袖是指在疫情中作出貢獻(xiàn),并且在社交媒體平臺(tái)上能夠因傳播信息和表達(dá)意見而影響多數(shù)人態(tài)度傾向的公眾人物。他們通過(guò)積極制造或參與話題,引起網(wǎng)友的關(guān)注和討論,從而產(chǎn)生較大影響力[1]。新型冠狀病毒 (Corona Virus Disease 2019,COVID-19)疫情爆發(fā)并迅速蔓延,在這一突發(fā)公共衛(wèi)生事件背景下,涌現(xiàn)出了眾多的抗疫意見領(lǐng)袖,如鐘南山、馬云、韓紅等。他們發(fā)表的觀點(diǎn)具有強(qiáng)大的輿論號(hào)召力,他們本人也成為此次疫情事件中的意見領(lǐng)袖。在微博平臺(tái)上,網(wǎng)民們對(duì)意見領(lǐng)袖的話題及相關(guān)熱點(diǎn)事件發(fā)表自己的意見和看法,從而產(chǎn)生海量的文本信息。從這些文本信息中進(jìn)行話題挖掘抽取,可以了解網(wǎng)民對(duì)突發(fā)公共衛(wèi)生事件的觀點(diǎn),探索事件發(fā)展全過(guò)程的輿情演變規(guī)律。充分利用文本信息、發(fā)揮網(wǎng)絡(luò)平臺(tái)民意采集作用,可以預(yù)測(cè)突發(fā)公共衛(wèi)生事件宏觀發(fā)展走向,對(duì)協(xié)助網(wǎng)絡(luò)輿情引導(dǎo)具有重要意義[2]。

        在大數(shù)據(jù)環(huán)境下,傳統(tǒng)話題分析技術(shù)的應(yīng)用遠(yuǎn)遠(yuǎn)不能滿足網(wǎng)絡(luò)輿情管理實(shí)際需要,因此必須開拓創(chuàng)新,研究更為科學(xué)的知識(shí)組織技術(shù)和智能知識(shí)處理技術(shù)[3]。知識(shí)圖譜具有結(jié)構(gòu)規(guī)范、語(yǔ)義豐富以及支持高效查詢和復(fù)雜知識(shí)計(jì)算等特點(diǎn),能夠?yàn)檩浨橹黝}發(fā)現(xiàn)、熱點(diǎn)跟蹤、影響分析、傳播分析等提供有力支持[4-5]。從我國(guó)疫情防控階段和輿情發(fā)展特點(diǎn)分析,2020年1月中旬至3月底是疫情防控的關(guān)鍵階段,輿情爆發(fā),互聯(lián)網(wǎng)上充斥著各種各樣的觀點(diǎn),對(duì)該時(shí)期輿情數(shù)據(jù)分析有重要意義。本文采用網(wǎng)絡(luò)爬蟲技術(shù),從中國(guó)最大的社交媒體——新浪微博采集1月20日—3月25日共66天不同領(lǐng)域影響力較大且有一定代表性的10位抗疫意見領(lǐng)袖的文本信息。通過(guò)對(duì)這些信息中的短文本非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行話題檢測(cè),再與結(jié)構(gòu)化數(shù)據(jù)結(jié)合,進(jìn)行語(yǔ)義關(guān)系設(shè)計(jì),構(gòu)建出針對(duì)抗疫意見領(lǐng)袖的熱點(diǎn)話題輿情知識(shí)圖譜。完成圖譜構(gòu)建后,從意見領(lǐng)袖、話題影響力和基于時(shí)間的話題走勢(shì)3方面進(jìn)行話題分析。本文研究能為有關(guān)機(jī)構(gòu)應(yīng)對(duì)突發(fā)公共衛(wèi)生事件和網(wǎng)絡(luò)輿情有效治理提供參考。

        1 相關(guān)研究綜述

        1.1 話題檢測(cè)與分析

        1996年,美國(guó)國(guó)防高級(jí)研究計(jì)劃局(DARPA)迫切需要一種能夠?qū)崿F(xiàn)新聞數(shù)據(jù)流話題判斷的全自動(dòng)技術(shù),于是話題檢測(cè)與跟蹤技術(shù)的概念應(yīng)運(yùn)而生[6]。一種方法是基于LDA主題模型或者改進(jìn)的LDA主題模型,通常是將文檔理解為多個(gè)隱式主題的組合,這些主題由文檔中的特定詞匯表示;另一種是基于改進(jìn)聚類算法的話題檢測(cè)。其中,增量聚類是有效的文本數(shù)據(jù)流聚類算法,而Single-pass單向聚類算法是最簡(jiǎn)單和應(yīng)用最廣泛的算法?;诜謱泳垲惖腒-means算法是簡(jiǎn)單實(shí)用的分區(qū)聚類算法,但是K值和初始聚集中心點(diǎn)的選擇是K-means算法的關(guān)鍵和難點(diǎn)。根據(jù)主題的周期性特點(diǎn),饒浩[7]介紹了基于時(shí)間窗的原始指標(biāo),并基于主成分分析和兩層隱層BP神經(jīng)網(wǎng)絡(luò)對(duì)微博主題輿情進(jìn)行分析;黃賢英等[8]利用微博短文的發(fā)布、轉(zhuǎn)發(fā)和評(píng)論時(shí)間等信息實(shí)現(xiàn)其語(yǔ)義相似度修改,形成一種新的多維微博短文本相似度算法?;趯?duì)相關(guān)話題提取算法的分析研究,本文采用N-Gram語(yǔ)言模型和Shingling相似度算法相結(jié)合的方式,實(shí)現(xiàn)了微博話題檢測(cè)。

        1.2 輿情領(lǐng)域的知識(shí)圖譜研究

        知識(shí)圖譜(Knowledge Graph)最初由Google[9]提出,這項(xiàng)技術(shù)使得其搜索服務(wù)更加智能化。此后,學(xué)術(shù)界和企業(yè)界紛紛跟進(jìn),使得該技術(shù)在智能搜索、情報(bào)分析、自動(dòng)問(wèn)答等領(lǐng)域的應(yīng)用顯示出強(qiáng)大優(yōu)勢(shì)。在輿情領(lǐng)域,Kim等[10]提出一種基于知識(shí)圖譜可視化工具的社交網(wǎng)絡(luò)輿情挖掘方法,他們以韓國(guó)方便面事件為例,驗(yàn)證了該方法可用于社交網(wǎng)絡(luò)輿情分析,成為采用知識(shí)圖譜分析熱點(diǎn)事件的開端;Chen等[11]利用BICOMB和SPSS軟件,收集了1986-2016年中國(guó)知網(wǎng)290篇教學(xué)論文,構(gòu)建出熱點(diǎn)問(wèn)題和發(fā)展趨勢(shì)主題圖譜,并參與輿情調(diào)查研究,為查閱教學(xué)文獻(xiàn)提供了方便的可視化圖譜。在分析網(wǎng)絡(luò)輿情信息組織技術(shù)的基礎(chǔ)上,國(guó)內(nèi)學(xué)者如婁國(guó)哲等[12]給出網(wǎng)絡(luò)輿情知識(shí)圖譜結(jié)構(gòu)的定義,分析網(wǎng)絡(luò)輿情管理知識(shí)需求,闡述網(wǎng)絡(luò)輿情知識(shí)地圖構(gòu)建方法,提出基于知識(shí)圖譜的網(wǎng)絡(luò)輿情知識(shí)組織結(jié)構(gòu);馬哲坤等[13]通過(guò)突發(fā)詞項(xiàng)篩選、突發(fā)事件話題圖譜構(gòu)建、語(yǔ)義補(bǔ)充和改進(jìn),提出基于知識(shí)圖譜進(jìn)行網(wǎng)絡(luò)輿情突發(fā)事件主題內(nèi)容監(jiān)控,有效地提高了網(wǎng)絡(luò)輿情監(jiān)測(cè)的準(zhǔn)確性和全面性,使知識(shí)圖譜技術(shù)運(yùn)用得到進(jìn)一步發(fā)展。通過(guò)以上文獻(xiàn)可以得出,大部分輿情知識(shí)圖譜是基于文本構(gòu)建研究,關(guān)于以人物為研究對(duì)象的網(wǎng)絡(luò)輿情知識(shí)圖譜較少。本文通過(guò)構(gòu)建以意見領(lǐng)袖為核心的知識(shí)圖譜,結(jié)合疫情期間的熱點(diǎn)話題進(jìn)行分析,為網(wǎng)絡(luò)輿情治理和疫情防控提供理論和知識(shí)支撐。

        2 熱點(diǎn)話題檢測(cè)與圖譜構(gòu)建

        2.1 博文話題檢測(cè)

        本文主要采用N-Gram語(yǔ)言模型和Shingling相似度算法相結(jié)合的方式,實(shí)現(xiàn)微博話題檢測(cè)。微博數(shù)據(jù)本質(zhì)上是一系列獨(dú)立的短文本,每個(gè)文本中的單詞數(shù)通常不超過(guò)140字,并且文本可能包含一些特殊的格式,表示公共主題和用戶之間的交互關(guān)系。例如“@user”、“rt”表示轉(zhuǎn)發(fā)、“# subject #”表示參與某個(gè)特定主題的討論。同時(shí),文本還具有一些其它屬性,例如發(fā)布者的發(fā)送時(shí)間、來(lái)源、地理信息和用戶信息等。本文使用NLPIR-ICTCLASE中文分詞系統(tǒng)對(duì)每個(gè)微博文本進(jìn)行分詞,以刪除文本中的停用詞。單詞分割效果如圖1所示。

        處理停用詞后,進(jìn)行N-Gram處理,該處理涉及由N個(gè)單詞組成的集合。各單詞不僅具有先后順序,而且允許單詞相同[14]。N-Gram模型根據(jù)條件概率式(1)和乘法式(2)得到推導(dǎo)式(3)。

        其中,P表示由n個(gè)詞組成的句子,每一個(gè)單詞wi都要依賴于從第一個(gè)單詞w1到它之前一個(gè)單詞wi-1的影響。將每條微博轉(zhuǎn)換成若干詞語(yǔ)集合,每個(gè)集合中包括從該集合的起始詞語(yǔ)開始,連續(xù)出現(xiàn)的n個(gè)詞語(yǔ)。每個(gè)集合的起始詞語(yǔ)不同,第i個(gè)集合的起始詞語(yǔ)是原文本中第i個(gè)詞語(yǔ)。

        每條微博經(jīng)過(guò)處理后,任意兩個(gè)微博文本之間的相似度R(A,B)都是用Shingling算法計(jì)算而來(lái),并將相似度大于閾值E(0.6)的微博文本都放入同一個(gè)文本簇中,如式(4)所示。

        其中,S(A)表示微博A的若干詞語(yǔ)集合,[|S(A)?S(B)|]表示S(A)和S(B)的交集中包含的詞語(yǔ)集合數(shù)量,[|S(A)?S(B)|]表示S(A)和S(B)的并集中包含的詞語(yǔ)集合數(shù)量。通過(guò)以上方法,統(tǒng)計(jì)每個(gè)文本簇所有微博文本的詞語(yǔ)出現(xiàn)在話題詞典中的數(shù)量,將每個(gè)文本簇劃分到出現(xiàn)的詞語(yǔ)數(shù)量最多的一類話題中?;趯?duì)微博中話題影響力最大的前7個(gè)熱點(diǎn)話題共500條微博分析,本文采用DT會(huì)議制定的比較規(guī)范的話題檢測(cè)評(píng)價(jià)標(biāo)準(zhǔn)[15],經(jīng)過(guò)實(shí)驗(yàn),準(zhǔn)確率達(dá)82.3%,召回率達(dá)81.6%,與傳統(tǒng)Single-Pass聚類相似度算法[16]相比,準(zhǔn)確率和召回率均有所提高,如表1所示。

        2.2 抗疫意見領(lǐng)袖話題知識(shí)圖譜構(gòu)建

        分析已有文獻(xiàn)可知,大部分知識(shí)圖譜是基于文本構(gòu)建研究,關(guān)于結(jié)合突發(fā)公共衛(wèi)生事件并且以人物為研究對(duì)象的網(wǎng)絡(luò)輿情知識(shí)圖譜較少,因此以該突破點(diǎn)出發(fā)展開研究。知識(shí)圖譜從邏輯上分為模式層和數(shù)據(jù)層兩部分[17]。其中,模式層是知識(shí)圖譜的核心,主要存儲(chǔ)經(jīng)過(guò)提煉了的疫情語(yǔ)義知識(shí)結(jié)構(gòu),通過(guò)本體庫(kù)管理這一層;數(shù)據(jù)層存儲(chǔ)的是具體實(shí)體和關(guān)系數(shù)據(jù)信息,本文存儲(chǔ)在Neo4j圖數(shù)據(jù)庫(kù)中。

        2.2.1 模式層構(gòu)建

        模式層建立在數(shù)據(jù)層之上,是知識(shí)圖譜的核心,模式層通常使用本體進(jìn)行管理。本體是結(jié)構(gòu)化知識(shí)庫(kù)的概念模板,所形成的知識(shí)庫(kù)不僅具有層次性,而且冗余度較小??挂咭庖婎I(lǐng)袖熱點(diǎn)話題圖譜是指在新型冠狀病毒疫情突發(fā)公共衛(wèi)生事件下以意見領(lǐng)袖為研究對(duì)象的語(yǔ)義知識(shí)結(jié)構(gòu)庫(kù)和輿情事件庫(kù),其基本組成單元是<實(shí)體,關(guān)系,實(shí)體>、<關(guān)系,屬性,屬性值>和<實(shí)體,屬性,屬性值>三元組。其中定義了4種實(shí)體類別:話題、用戶、事件、意見領(lǐng)袖。模式層中定義的每種實(shí)體屬性如表2所示。

        通過(guò)對(duì)定義好的實(shí)體進(jìn)行研究,得到<事件,屬于,話題>、<用戶,發(fā)布,事件>、<意見領(lǐng)袖,參與,事件>、<意見領(lǐng)袖,包含,話題>4種實(shí)體關(guān)系,如圖2所示。其中,圓形表示實(shí)體類別,連線表示實(shí)體類別關(guān)系。

        2.2.2 數(shù)據(jù)層構(gòu)建

        本文通過(guò)新浪微博的公共數(shù)據(jù)接口爬取2020年1月20日-3月25日來(lái)自醫(yī)療專家、社會(huì)名人、政府官員3個(gè)不同領(lǐng)域博文影響力較大的10位抗疫意見領(lǐng)袖相關(guān)的? ? 4 795件熱點(diǎn)事件和2 080位微博用戶信息。圖數(shù)據(jù)庫(kù)相較于傳統(tǒng)的RDF存儲(chǔ)具有查詢效率高、搜索快和直觀簡(jiǎn)單等優(yōu)點(diǎn),故在存儲(chǔ)上選擇開源的Neo4j數(shù)據(jù)庫(kù),在平臺(tái)構(gòu)建上選擇SDN(Spring Data Neo4j),它是開源Spring數(shù)據(jù)項(xiàng)目的一個(gè)子項(xiàng)目。其提供了將帶注解的實(shí)體類映射到Neo4j數(shù)據(jù)庫(kù)的高級(jí)功能,為與關(guān)系圖的交互提供了基礎(chǔ),還可用于高級(jí)倉(cāng)庫(kù)支持。

        設(shè)計(jì)好實(shí)體類別和實(shí)體關(guān)系后,通過(guò)Springboot開發(fā)框架和Neo4j圖數(shù)據(jù)庫(kù)相結(jié)合的方式進(jìn)行數(shù)據(jù)存儲(chǔ),設(shè)計(jì)意見領(lǐng)袖熱點(diǎn)話題輿情知識(shí)圖譜并構(gòu)建平臺(tái)?;谖⒉┡廊〉娜繑?shù)據(jù),共構(gòu)建8 387個(gè)實(shí)例,16 497條關(guān)系邊。如圖3所示,考慮到圖譜展示效果,本文截取以韓紅、鐘南山、馬云等5位意見領(lǐng)袖為核心的輿情話題圖譜部分結(jié)構(gòu)。其中,不同灰度色和大小的圓形節(jié)點(diǎn)代表了不同的實(shí)體類別,連線代表了節(jié)點(diǎn)之間的關(guān)系,整體直觀地描述出以抗疫意見領(lǐng)袖為核心的熱點(diǎn)話題事件傳播過(guò)程。

        3 抗疫意見領(lǐng)袖熱點(diǎn)話題演化分析

        關(guān)于輿情話題演變,從現(xiàn)有文獻(xiàn)看,陳婷等[18]提出基于時(shí)間序列話題的網(wǎng)絡(luò)輿情熱點(diǎn)話題演化分析方法,通過(guò)添加時(shí)間序列標(biāo)簽,直觀分析輿情熱點(diǎn)話題內(nèi)容和強(qiáng)度的演化過(guò)程。從情感分析角度出發(fā),何天祥等[19]提出一種采用情感分析的網(wǎng)絡(luò)輿情演變分析方法。因此,本文在前人研究基礎(chǔ)上,在Neo4j圖數(shù)據(jù)庫(kù)中通過(guò)Cypher查詢語(yǔ)言與相關(guān)算法相結(jié)合的方式對(duì)知識(shí)圖譜進(jìn)行分析,以把握疫情突發(fā)公共衛(wèi)生事件下網(wǎng)絡(luò)話題輿情發(fā)展趨勢(shì),進(jìn)而了解事件發(fā)展過(guò)程[20-22]。

        3.1 意見領(lǐng)袖人物分析

        此次新冠疫情突發(fā)事件中產(chǎn)生了眾多的抗疫意見領(lǐng)袖,如鐘南山、馬云、韓紅等。他們發(fā)表了具有強(qiáng)大輿論號(hào)召力的觀點(diǎn),成為此次疫情事件中的熱點(diǎn)人物。通過(guò)對(duì)意見領(lǐng)袖、事件、話題三者關(guān)系進(jìn)行Cypher查詢統(tǒng)計(jì)分析,得到各領(lǐng)域意見領(lǐng)袖的事件報(bào)道數(shù)量和話題數(shù)量,如圖4所示。其中,抗疫科學(xué)家鐘南山參與的事件有647件,引起266條話題討論。歌唱家、慈善家韓紅參與的事件數(shù)有743之多,引起139條話題討論。

        人物影響力計(jì)算如式(5)所示。

        與通過(guò)Cypher查詢統(tǒng)計(jì)分析意見領(lǐng)袖、事件、事件屬性三者關(guān)系相結(jié)合的方式,可以計(jì)算出每位意見領(lǐng)袖的抗疫影響力。其中,i表示與意見領(lǐng)袖k相關(guān)的事件,retweet(i)表示第i件事轉(zhuǎn)發(fā)數(shù)之和,comment(i)表示第i件事評(píng)論數(shù)之和,likes(i)表示第i件事點(diǎn)贊數(shù)之和。將所有事件的影響力求和,可以得到如圖5所示的抗疫意見領(lǐng)袖排行榜,可以看到鐘南山的抗疫影響力達(dá)836萬(wàn)之多,位居榜首。

        3.2 熱點(diǎn)話題影響力分析

        經(jīng)過(guò)初期的話題檢測(cè)后,共提取到1 323個(gè)話題。通過(guò)對(duì)檢測(cè)到的話題進(jìn)行排名,可以快速?gòu)拇罅康脑掝}中檢測(cè)到抗疫熱門話題,有利于網(wǎng)絡(luò)輿情治理。提取不同話題包含的所有事件實(shí)體,話題熱度計(jì)算如式(6)所示。

        與通過(guò)Cypher查詢統(tǒng)計(jì)分析話題、事件、事件屬性三者關(guān)系相結(jié)合的方式,可以計(jì)算出話題中每一條原始微博的影響力。其中,w(label(z))表示z文本簇中話題類別對(duì)應(yīng)的權(quán)重,retweet(z)表示z文本簇中所有微博文本的轉(zhuǎn)發(fā)數(shù)之和,comment(z)表示z文本簇中所有微博文本的評(píng)論數(shù)之和,likes(z)表示第z個(gè)文本簇里所有微博文本的點(diǎn)贊數(shù)之和。構(gòu)建的意見領(lǐng)袖熱點(diǎn)話題影響力排行榜如圖6所示,本文選取前15個(gè)熱點(diǎn)話題,其中“終南山全程英語(yǔ)分享中國(guó)經(jīng)驗(yàn)”這個(gè)話題以164萬(wàn)多影響力位居榜首。

        3.3 基于時(shí)間的熱點(diǎn)話題走勢(shì)分析

        本文選取“韓紅愛心馳援武漢”這個(gè)熱點(diǎn)話題進(jìn)行分析。通過(guò)在圖譜中對(duì)話題、事件、事件屬性三者關(guān)系進(jìn)行Cypher查詢統(tǒng)計(jì)分析。提取該話題不同時(shí)間段包含的所有事件實(shí)體的評(píng)論、轉(zhuǎn)發(fā)、點(diǎn)贊、時(shí)間、內(nèi)容和其它屬性,在此基礎(chǔ)上,根據(jù)上述話題熱度計(jì)算式(6)計(jì)算話題影響力,得出一段時(shí)間輿情事件發(fā)展過(guò)程中話題出現(xiàn)階段和話題討論熱度等多維特征。如圖7所示,本文將輿情事件按潛伏期1月21號(hào)—2月11日、爆發(fā)期——2月11號(hào)—2月25日、衰退期2月25日—3月22日這3個(gè)階段進(jìn)行話題討論分析。從話題影響看,在潛伏期內(nèi),話題討論熱度不高,影響力較小;隨著事件的傳播,進(jìn)入輿論的爆發(fā)期,話題影響力呈現(xiàn)顯著增加,該時(shí)期的輿論事件也受到了很多關(guān)注和轉(zhuǎn)發(fā);當(dāng)處于衰退階段時(shí),話題影響力逐漸減弱,且這一時(shí)期持續(xù)最長(zhǎng)。

        4 結(jié)語(yǔ)

        隨著大數(shù)據(jù)時(shí)代的到來(lái),構(gòu)建一個(gè)準(zhǔn)確、完善、實(shí)時(shí)更新的知識(shí)圖譜仍然面臨諸多挑戰(zhàn)。本文通過(guò)微博數(shù)據(jù)采集、話題檢測(cè)構(gòu)建抗疫意見領(lǐng)袖熱點(diǎn)話題知識(shí)圖譜,能夠簡(jiǎn)單直觀地展示出疫情期間意見領(lǐng)袖、話題、事件等多維輿情關(guān)系,同時(shí)可以提高檢測(cè)速度和分析效率,符合輿情傳播客觀規(guī)律,實(shí)現(xiàn)較為滿意的分析效果,有助于輿情監(jiān)控相關(guān)部門在疫情防控期間的輿情分析與網(wǎng)絡(luò)治理。

        本文基本完成了預(yù)期的圖譜分析效果,但依然存在以下不足:本文只是從微博上采集抗疫意見領(lǐng)袖熱點(diǎn)事件,后期可以從多數(shù)據(jù)源獲取,使圖譜分析實(shí)驗(yàn)結(jié)果更加準(zhǔn)確;在話題檢測(cè)上,本文選擇了目前效果相對(duì)較好的算法,但是微博文本內(nèi)容長(zhǎng)度短、表達(dá)隨意、非規(guī)范化等特點(diǎn)致使文本向量高維且有效特征稀疏,后續(xù)研究中可對(duì)相關(guān)算法作出改進(jìn)。本文構(gòu)建的輿情知識(shí)圖譜可用于新冠疫情輿情監(jiān)測(cè)和引導(dǎo)等相關(guān)研究。

        參考文獻(xiàn):

        [1] 羅莉,周婷. 意見領(lǐng)袖對(duì)網(wǎng)絡(luò)輿情的作用[J]. 新聞戰(zhàn)線,2016,61(8):26-27.

        [2] 劉雅姝,張海濤,徐海玲,等. 多維特征融合的網(wǎng)絡(luò)輿情突發(fā)事件演化話題圖譜研究[J]. 情報(bào)學(xué)報(bào),2019,38(8):798-806.

        [3] 王蘭成,婁國(guó)哲. 基于知識(shí)圖譜的網(wǎng)絡(luò)輿情管理方法與實(shí)踐研究[J]. 情報(bào)理論與實(shí)踐, 2020,43(6):97-101.

        [4] 王晰巍,韋雅楠,邢云菲,等. 社交網(wǎng)絡(luò)輿情知識(shí)圖譜發(fā)展動(dòng)態(tài)及趨勢(shì)研究[J]. 情報(bào)學(xué)報(bào),2019,38(12):1329-1338.

        [5] 袁立庠. 微博的傳播模式與傳播效果[J]. 安徽師范大學(xué)學(xué)報(bào),2011,55(6):678-683.

        [6] 張仰森,段宇翔,黃改娟,等. 社交媒體話題檢測(cè)與追蹤技術(shù)研究綜述[J]. 中文信息學(xué)報(bào),2019,33(7):1-10,30.

        [7] 饒浩,陳海媚. 主成分分析與BP神經(jīng)網(wǎng)絡(luò)在微博輿情預(yù)判中的應(yīng)用[J]. 現(xiàn)代情報(bào),2016,36(7):58-62,70.

        [8] 黃賢英,陳紅陽(yáng),劉英濤. 短文本相似度研究及其在微博話題檢測(cè)中的應(yīng)用[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2015,36(11):3128-3133.

        [9] SINGHAL A. Introducing the knowledge graph: things, not strings[Z]. Official Google Blog,2012.

        [10] KIM Y,JEONG S R.Opinion-Mining methodology for social media analytics[J]. KSII Transactions on Internet and Information Systems,2015,9(1):391-406.

        [11] CHEN X D,SUN Y,HE T Z. Historical retrospect and future prospect of research on effective teaching in China——knowledge map‐ ping analysis based on the research over the past three decades (1986-2016)[J]. Advances in Higher Education,2018,2(2):1-10.

        [12] 婁國(guó)哲,王蘭成. 基于知識(shí)圖譜的網(wǎng)絡(luò)輿情知識(shí)組織方法研究[J]. 情報(bào)理論與實(shí)踐,2019,42(1):58-64.

        [13] 馬哲坤,涂艷. 基于知識(shí)圖譜的網(wǎng)絡(luò)輿情突發(fā)話題內(nèi)容監(jiān)測(cè)研究[J]. 情報(bào)科學(xué),2019,37(2):33-39.

        [14] 周水庚,俞紅奇,胡運(yùn)發(fā),等. 基于N—gram信息的中文文檔分類研究[J]. 中文信息學(xué)報(bào),2001,16(1):34-39.

        [15] 洪宇,張宇,劉挺,等. 話題檢測(cè)與跟蹤的評(píng)測(cè)及研究綜述[J]. 中文信息學(xué)報(bào),2007,22(6):71-87.

        [16] 李倩.? Single-Pass聚類算法的改進(jìn)及其在微博話題檢測(cè)中的應(yīng)用研究[D]. 濟(jì)南:山東師范大學(xué),2016.

        [17] 林萍,黃衛(wèi)東. 基于LDA模型的網(wǎng)絡(luò)輿情事件話題演化分析[J]. 情報(bào)雜志,2013,32(12):26-30.

        [18] 陳婷,王雪怡,曲霏,等. 基于時(shí)序主題的網(wǎng)絡(luò)輿情熱點(diǎn)話題演化分析方法[J]. 華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,50(5):672-676.

        [19] 何天翔,張暉,李波,等. 一種基于情感分析的網(wǎng)絡(luò)輿情演化分析方法[J]. 軟件導(dǎo)刊,2015,14(5):131-134.

        [20] SOHN D,GEIDNER N. Collective dynamics of the spiral of silence:the role of ego-network size[J]. International Journal of Public Opinion Research,2016,28(1):25-45.

        [21] BLEI D M,NG AY,JORDAN M I. Latent Dirichlet allocation[J]. Journal of Machine Learning Research,2003(3):993-1022.

        [22] 王義真,鄭嘯,后盾,等. 基于SVM的高維混合特征短文本情感分類[J]. 計(jì)算機(jī)技術(shù)與發(fā)展,2018,28(2):88-93.

        (責(zé)任編輯:孫 娟)

        猜你喜歡
        意見領(lǐng)袖新冠疫情網(wǎng)絡(luò)輿情
        新冠疫情視閾下感悟“四個(gè)自信”國(guó)家共識(shí)
        “心理成長(zhǎng)任務(wù)包”助力學(xué)生安度疫情
        關(guān)于疫情對(duì)地區(qū)經(jīng)濟(jì)金融影響情況的調(diào)研
        新冠疫情對(duì)縣域脫貧產(chǎn)業(yè)發(fā)展的影響及地方金融支持的建議
        傳播學(xué)視角下應(yīng)用型專業(yè)思想政治教育有效性研究
        亞太教育(2016年34期)2016-12-26 21:02:15
        微博動(dòng)員、維權(quán)倡議與記者的利益表達(dá)機(jī)制
        新聞界(2016年13期)2016-12-23 14:32:59
        新形勢(shì)下高校網(wǎng)絡(luò)文化建設(shè)管理機(jī)制研究
        微信營(yíng)銷意見領(lǐng)袖培養(yǎng)現(xiàn)狀研究
        今傳媒(2016年10期)2016-11-22 11:38:32
        “互聯(lián)網(wǎng)+”背景下高校平安校園建設(shè)研究
        淺析網(wǎng)絡(luò)輿情治理
        国产AV无码专区久久精品网站| 久久免费精品视频老逼| 风间由美中文字幕在线| 精品亚洲麻豆1区2区3区| 国产精品久久久久久久久绿色| 日本丰满熟妇hd| 在教室伦流澡到高潮hnp视频| 一区二区三区免费视频网站| 三级网站亚洲三级一区| 东北女人一级内射黄片| 女人被弄到高潮的免费视频 | 老色鬼在线精品视频| 精品国产乱码久久久软件下载| 色噜噜狠狠色综合欧洲| 国产青春草在线观看视频| 日本免费在线不卡一区二区| 一夲道无码人妻精品一区二区| 日韩欧美第一页| 日本人妻系列一区二区| 欧美亅性猛交内射| 男人进去女人爽免费视频| 中文字幕欧美一区| 人妻精品人妻一区二区三区四五| 人妻有码av中文幕久久| 精品一区二区三区免费视频| 国产成+人+综合+亚洲 欧美| 青青手机在线视频观看| 亚洲熟妇自偷自拍另类| 国产一区二区在线视频| 亚洲精品国产综合一线久久| 99热久久只有这里是精品| 性av一区二区三区免费| 毛片亚洲av无码精品国产午夜| 亚洲AV永久天堂在线观看| 97久久综合精品国产丝袜长腿| 亚洲日韩中文字幕在线播放| 少妇spa推油被扣高潮| 五月激情狠狠开心五月| 日本人妻免费一区二区三区| 97久久精品无码一区二区天美 | 亚洲av五月天天堂网|