亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        新冠肺炎疫情微博用戶情感與主題挖掘的協(xié)同模型研究

        2021-04-21 07:31:34王晰巍李玥琪劉婷艷
        情報(bào)學(xué)報(bào) 2021年3期

        王晰巍,李玥琪,劉婷艷,張 柳

        (1. 吉林大學(xué)管理學(xué)院,長春 130022;2. 吉林大學(xué)大數(shù)據(jù)管理研究中心,長春 130022;3. 吉林大學(xué)網(wǎng)絡(luò)空間治理研究中心,長春 130022;4. 吉林大學(xué)東北振興研究院,長春 130022)

        1 引 言

        新浪微博作為目前眾多社交平臺中在線人數(shù)及影響力最為廣泛的網(wǎng)絡(luò)社交媒體之一,已經(jīng)成為用戶獲取突發(fā)事件相關(guān)信息及發(fā)表個(gè)人輿論的主要陣地。2020 年新冠肺炎引起的輿情事件在微博等社交媒體上快速傳播,引起全國人民的廣泛關(guān)注。2020年3 月,國家互聯(lián)網(wǎng)信息辦公室發(fā)布了《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》,全國網(wǎng)信系統(tǒng)著力加強(qiáng)和創(chuàng)新互聯(lián)網(wǎng)內(nèi)容建設(shè)。針對此次新冠肺炎疫情期間的輿情事件,及時(shí)了解用戶在輿情事件中的情感分類及主題特征,有利于更好地幫助輿情管理部門提高網(wǎng)絡(luò)治理和輿情引導(dǎo)能力,消除社會(huì)恐慌,增強(qiáng)抗擊疫情的信心,最終達(dá)到有效進(jìn)行網(wǎng)絡(luò)空間治理的效果。

        目前,國外對于突發(fā)事件的情感分析研究,主要關(guān)注于采用不同的情感分析方法對用戶情感進(jìn)行分類[1-2],計(jì)算及分類模型等不同算法的優(yōu)化和設(shè)計(jì)[3],以及對突發(fā)事件輿情中情感的傳播機(jī)制和傳播網(wǎng)絡(luò)等進(jìn)行分析[4]。國內(nèi)研究主要關(guān)注通過劃分階段與主體等不同方面進(jìn)行情感態(tài)勢的演化研究,通過構(gòu)建輿情發(fā)展不同時(shí)期的情感圖譜對情感演化進(jìn)行可視化展示[5-6],并分析不同主體[7]情感傳播的機(jī)制及差異性[8],構(gòu)建情感演化等多種模型對輿情的演變進(jìn)行分析[9-11]等。從國內(nèi)外現(xiàn)有學(xué)者的研究成果來看,現(xiàn)有研究主要是通過輿情熱點(diǎn)事件先確定文本的主題內(nèi)容,再對主題進(jìn)行情感分類。對于新冠肺炎疫情這一突發(fā)重大公共衛(wèi)生事件的期間所引發(fā)的大量輿情,如何進(jìn)行主題情感和主題內(nèi)容挖掘的關(guān)聯(lián)性分析的研究成果相對較少。

        本文主要研究以下三個(gè)方面的內(nèi)容:①基于認(rèn)知的情感評價(jià)模型理論,構(gòu)建情感分類與主題挖掘的協(xié)同分析模型;②結(jié)合構(gòu)建的情感與主題挖掘協(xié)同分析模型,對新冠肺炎疫情期間的典型輿情話題進(jìn)行輿情周期內(nèi)的情感和主題特征分析;③結(jié)合新冠肺炎輿情周期內(nèi)的情感分布特征,制定相關(guān)的輿情引導(dǎo)策略。本文的理論貢獻(xiàn)在于通過構(gòu)建的情感與主題挖掘協(xié)同模型,為新冠肺炎疫情期間典型輿情話題的情感與主題挖掘的關(guān)聯(lián)分析提供分析案例;本文的實(shí)踐價(jià)值在于通過對新冠肺炎疫情事件下典型話題的網(wǎng)民情感與主題挖掘模型的實(shí)證分析,更好地呈現(xiàn)新冠肺炎期間微博用戶的情感及主題的關(guān)聯(lián)特征,為輿情監(jiān)管部門更好地引導(dǎo)新冠肺炎期間的網(wǎng)絡(luò)輿情,實(shí)現(xiàn)網(wǎng)絡(luò)生態(tài)治理提供一定的參考和借鑒。

        2 情感與主題挖掘的協(xié)同分析模型

        2.1 LDA文本主題分析

        潛在狄利克雷分配(Latent Dirichlet Allocation,LDA)是一種基于概率圖的三層貝葉斯經(jīng)典主題模型[12],在微博文本內(nèi)容主題識別及主題演化過程被多次應(yīng)用[13-14]。目前,學(xué)者們基于研究對象的不同,對LDA 主題模型進(jìn)行了拓展和改良,最具有代表性的改良LDA 模型包括:基于ATM(Author-Topic Model)的主題建模、Twitter-LDA 主題建模和基于Labeled LDA 的主題建模等。

        基于ATM 的主題建模,是通過引入文本的作者信息來指導(dǎo)LDA 主題的生成,較好的解決了微博的稀疏性問題[15]。Twitter-LDA 主題建模,在ATM模型基礎(chǔ)上補(bǔ)充了背景模型φB,同時(shí)假設(shè)用戶發(fā)布的每個(gè)文本僅有一個(gè)話題,允許在用戶和文本兩個(gè)層面同時(shí)建模?;贚abeled LDA 的主題建模,將微博視為被用戶打過標(biāo)簽的文本,利用已經(jīng)存在的標(biāo)簽資源進(jìn)行主題挖掘[16]。

        另外,也有學(xué)者將時(shí)間序列引入LDA 模型中,研究隨時(shí)間序列主題挖掘的模式,如DTM[17]、On-LineLDA[18]等。Sievert 等[36]搭建了一個(gè)基于網(wǎng)絡(luò)的交互式可視化系統(tǒng)LDAvis[19],該系統(tǒng)利用基于Rel‐evance 公式改進(jìn)的LDA 模型,允許用戶通過交互式界面調(diào)整,來確定表征特定話題的主題詞。

        2.2 文本情感傾向性分析

        文本情感傾向性分析,主要是對文本內(nèi)容所暗含的情感傾向及觀點(diǎn)、喜好進(jìn)行檢測、分析及挖掘。目前,國內(nèi)外對文本情感傾向性分析的研究,主要集中在采用無監(jiān)督的基于情感詞典的方法,以及有監(jiān)督的采用機(jī)器學(xué)習(xí)的方法進(jìn)行分析。

        基于情感詞典的分析方法,國外有較為成熟的SentiWordNet 和Inquirer 情感詞典,通過計(jì)算文本中關(guān)鍵詞與情感詞典中情感詞匯的相似度,結(jié)合模糊集的語義模式來計(jì)算情感強(qiáng)度[19]。國內(nèi)常用的情感詞典包括:大連理工大學(xué)的情感詞典[20]、知網(wǎng)情感詞典[21]、臺灣大學(xué)的NTUSD 中文情感極性詞典[22]等。但使用情感詞典進(jìn)行情感傾向性分析的研究,依賴于情感詞典與研究主題的契合性及情感詞典的完善性,對于句子級內(nèi)容的情感分析容易忽略上下文語境,從而影響最終的情感分類效果。

        采用機(jī)器學(xué)習(xí)的方法進(jìn)行文本內(nèi)容情感傾向性分析中,Pang 等[23]最先采用樸素貝葉斯、支持向量機(jī)以及最大熵學(xué)習(xí)分類器對電影評論的情感進(jìn)行分類研究。隨著深度學(xué)習(xí)在自然語言處理領(lǐng)域的普及應(yīng)用,在采用樸素貝葉斯[24]、SVM(Support Vector Machine)[25]等方式進(jìn)行情感分類研究的基礎(chǔ)上,有學(xué)者又提出基于CNN(Convolutional Neural Net‐works)對情感分類的模型[26-27],發(fā)現(xiàn)可以更好的結(jié)合上下文信息進(jìn)行有效的短文本分類任務(wù),以及采用深度雙向LSTM(Long Short-Term Memory)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行Twitter 及新浪微博文本[28]的情感分析和觀點(diǎn)提取等。

        2.3 基于認(rèn)知的情感評價(jià)模型

        基于認(rèn)知的情感評價(jià)模型,即OCC 模型,是由Ortony、Clore 和Collins 于1988 年在《情感的 認(rèn) 知結(jié)構(gòu)》一書中提出的,以計(jì)算機(jī)實(shí)現(xiàn)為目的的情感認(rèn)知理論[29]。其基本原理是根據(jù)相應(yīng)的評價(jià)標(biāo)準(zhǔn)將主體對環(huán)境誘因作出的反應(yīng)分為正向情感和負(fù)向情感,然后根據(jù)評價(jià)標(biāo)準(zhǔn)取值的不同配置來確定相應(yīng)的情感類型[30]。OCC 模型從事件的結(jié)果、對象的行為和對象的描述三個(gè)角度,共定義了22 種情感類別,通過情感評價(jià)標(biāo)準(zhǔn)的樹形結(jié)構(gòu)形象全面展示了不同類型的情感[31]。OCC 模型中每一類情感類型的出現(xiàn)都由不同的情感維度值觸發(fā)。

        有研究者已經(jīng)開始應(yīng)用OCC 模型進(jìn)行社會(huì)化媒體的情感分類研究。國外學(xué)者對OCC 模型在具體人物的情感分類的應(yīng)用進(jìn)行了定量分析,并對原本22 種情感分類模型進(jìn)一步整合[32]。國內(nèi)學(xué)者基于OCC 模型從網(wǎng)民認(rèn)知角度建立情感規(guī)則,采用LSTM 模型進(jìn)行深度學(xué)習(xí)對財(cái)經(jīng)微博文本情感分類[33]。也有學(xué)者提出,基于OCC 模型和貝葉斯網(wǎng)絡(luò)的情感句分類方法,通過分析OCC 模型的情感生成規(guī)則,實(shí)現(xiàn)句子級文本的情感分類[34];還有學(xué)者基于OCC 模型,建立了突發(fā)自然災(zāi)害網(wǎng)絡(luò)輿情情感規(guī)則,采用LSTM 模型對其訓(xùn)練,得到突發(fā)災(zāi)害事件網(wǎng)絡(luò)輿情多情感識別模型[32]。以往研究的情感分類過程中的人工標(biāo)注環(huán)節(jié),由于標(biāo)注過程因人而異,無固定規(guī)則可循因,具有較強(qiáng)的隨意性。為解決該問題,本文引入OCC 模型建立多任務(wù)情感識別模型,OCC 規(guī)則的引入使情感樣本的標(biāo)注更具有規(guī)范性和一致性,從而減少由標(biāo)注產(chǎn)生的人工誤差。

        2.4 情感與主題挖掘的協(xié)同分析模型構(gòu)建

        本文構(gòu)建的情感與主題挖掘協(xié)同分析模型如圖1 所示,采用情感分類與主題挖掘協(xié)同分析方法對輿情事件進(jìn)行分析。首先對收集到的網(wǎng)民評論數(shù)據(jù)進(jìn)行情感分類,得到網(wǎng)民評論數(shù)據(jù)的不同情感分布;整理得到的不同情感評論文本樣本;分別對正向評論樣本、負(fù)向評論樣本及中性評論樣本進(jìn)行主題挖掘,達(dá)到情感與主題的協(xié)同分析的目的。

        在情感分類環(huán)節(jié),綜合來看,情感詞典的分類方法更加依賴于詞典的全面性和準(zhǔn)確性,而機(jī)器學(xué)習(xí)的方法通過訓(xùn)練集的學(xué)習(xí)及處理具有更強(qiáng)的準(zhǔn)確性和客觀性。本文采用目前情感分析機(jī)器學(xué)習(xí)方法中最常用的樸素貝葉斯模型(Naive Bayesian Model,NBM)進(jìn)行情感分類。NBM 對于文本分類有著獨(dú)特的優(yōu)勢,在垃圾郵件分類中,準(zhǔn)確率可以達(dá)到90%以上,并且其原理簡單,分類可靠,支持增量式訓(xùn)練;不需要構(gòu)建情感詞典,就能得到分類概率值[35]。本文采用基于認(rèn)知的情感評價(jià)OCC 模型進(jìn)行情感標(biāo)注。從事件的結(jié)果和對象行為兩個(gè)角度出發(fā),根據(jù)事件演變的結(jié)果是否符合期望和事件中對象的行為是否符合用戶行為規(guī)則,將情感分為正向情感和負(fù)向情感[33-34]。

        在文本主題挖掘環(huán)節(jié),本文采用基于Relevance公式的LDA 文本主題挖掘模型,采用Sievert 等搭建的基于網(wǎng)絡(luò)的交互式可視化系統(tǒng)LDAvis 進(jìn)行主題抽取。LDA 主題挖掘中最重要的環(huán)節(jié)是超參數(shù)調(diào)整,即主題數(shù)K的選取及確定過程。所采用的主題數(shù)量設(shè)定方式,是將主題建模結(jié)果可視化,在二維空間上查看主題距離與交疊程度。LDAvis 工具允許用戶通過交互式調(diào)整來確定表征特定話題的最有用的詞語,從而提高話題的可讀性和獨(dú)立性,本文采用這一方法抽取話題表征詞。Relevance 公式為

        其中,w表示語料庫中的詞語;k表示話題;Pw表示詞語w在話題-詞語分布矩陣φ中的邊際概率;φkw表示詞語w與話題k的相關(guān)度;λ是一個(gè)在[0, 1]取值的可變參數(shù),λ趨近于0 時(shí),表示話題表征詞具有排他性(即在本話題下更獨(dú)有、更特殊的詞與本話題的相關(guān)性越強(qiáng));λ趨近于1 時(shí),表示在本話題下出現(xiàn)次數(shù)更多的詞,能表征該話題。用戶可以通過給定λ值,調(diào)節(jié)詞語w與話題k的相關(guān)程度,即r(w,k|λ)[36]。

        圖1 情感與主題挖掘協(xié)同分析模型

        3 數(shù)據(jù)采集及處理

        3.1 數(shù)據(jù)源采集

        在社交網(wǎng)絡(luò)綜合評價(jià)網(wǎng)站Alexa 中,新浪微博是眾多平臺中在線人數(shù)及影響力最為廣泛的網(wǎng)絡(luò)新媒體,具有獨(dú)特鮮明的傳播模式,并逐漸成為各類新聞、熱門話題事件的第一發(fā)布平臺。在新冠肺炎疫情期間輿情話題的選擇上,選取了全球新冠肺炎疫情爆發(fā)早期公眾關(guān)注的新浪微博熱點(diǎn)事件 “日本鉆石公主號郵輪” 作為輿情話題來源。根據(jù)百度指數(shù)統(tǒng)計(jì)數(shù)據(jù),該話題討論度在事件發(fā)展高峰期討論指數(shù)達(dá)10 萬[37],衍生相關(guān)話題用戶討論量累積達(dá)10 萬條[38],因而選擇該話題進(jìn)行輿情分析具有一定的代表性。

        采集的數(shù)據(jù)包括人民日報(bào)官方微博、新京報(bào)、央視新聞、環(huán)球時(shí)報(bào)、人民網(wǎng)等多家官方媒體,相關(guān)微博評論及部分大V 的微博發(fā)帖評論信息,共獲取微博原文、評論及轉(zhuǎn)發(fā)數(shù)據(jù)共22458 條,在后續(xù)研究中使用了正文、評論及轉(zhuǎn)發(fā)數(shù)據(jù)。采用網(wǎng)絡(luò)爬蟲火車頭采集器爬蟲軟件獲取用戶數(shù)據(jù),數(shù)據(jù)字段包括ID、用戶昵稱、微博評論內(nèi)容和轉(zhuǎn)發(fā)時(shí)間等。在數(shù)據(jù)處理環(huán)節(jié),本文利用火車頭腳本編輯器爬蟲軟件實(shí)現(xiàn)海量情感文本的爬取;用戶評論以結(jié)構(gòu)化的形式保存在電子表格中;刪除缺失數(shù)據(jù)、無關(guān)數(shù)據(jù)和異常數(shù)據(jù),將清洗后的數(shù)據(jù)用CSV 格式存儲(chǔ);將日期格式轉(zhuǎn)化為計(jì)算機(jī)程序可以識別的形式,最終獲得有效數(shù)據(jù)21071 條。

        3.2 輿情事件周期劃分

        根據(jù)百度指數(shù)的統(tǒng)計(jì)數(shù)據(jù),關(guān)鍵詞 “鉆石公主號” 郵輪新冠肺炎疫情事件輿情周期為2020 年2 月5 日至2020 年2 月26 日,輿情事件在2020 年2 月19日達(dá)到頂峰。根據(jù)輿情發(fā)展態(tài)勢大多數(shù)學(xué)者[39]將輿情周期劃分為四階段[40],結(jié)合本次輿情事件特點(diǎn)將輿情周期劃分為形成期、擴(kuò)散期、爆發(fā)期和終結(jié)期四階段[41],如圖2 所示。在形成期,話題進(jìn)入網(wǎng)民視野引發(fā)熱議,但討論量較低;在輿情擴(kuò)散期,隨著事態(tài)發(fā)展網(wǎng)民參與范圍擴(kuò)大,話題熱度逐漸升高,此階段網(wǎng)民評論數(shù)逐漸增加,并出現(xiàn)大量子話題;爆發(fā)期為2 月15 日至2 月19 日,網(wǎng)民評論數(shù)、話題熱度迅速增加達(dá)到頂峰,呈現(xiàn)爆發(fā)期的特質(zhì);終結(jié)期為2 月19 日至2 月26 日,話題熱度減退,轉(zhuǎn)發(fā)和討論的信息量驟減,參與的網(wǎng)民數(shù)量也逐漸減少,話題逐漸終結(jié),輿情事件消散。

        圖2 “日本鉆石公主號郵輪” 事件輿情生命周期劃分圖①

        4 數(shù)據(jù)結(jié)果

        4.1 輿情周期內(nèi)情感分布

        樸素貝葉斯分類器需要預(yù)先在訓(xùn)練樣本基礎(chǔ)上進(jìn)行訓(xùn)練,以建立分類模型。為此本文選擇獲得的數(shù)據(jù)樣本中近二分之一的文本信息進(jìn)行人工標(biāo)記,用作訓(xùn)練樣本,采用兩名情報(bào)學(xué)研究生進(jìn)行人工標(biāo)注,一致性比率為72.17%,保留一致性數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),最終獲得訓(xùn)練數(shù)據(jù)7210 條,訓(xùn)練數(shù)據(jù)樣本極性分布如圖3 所示。

        根據(jù)OCC 模型規(guī)則,在人工標(biāo)注過程中,若樣本傳達(dá)正向情感時(shí),則標(biāo)注為 “+1” ;若樣本傳達(dá)負(fù)向情感時(shí),則標(biāo)注為 “-1” 。在本文所選擇的 “日本鉆石公主號郵輪” 話題中,如 “希望乘客平安” “希望經(jīng)驗(yàn)有用” 等事件的結(jié)果是符合網(wǎng)民期望的,文本 “不傳謠” 是符合行為規(guī)則的,可判斷以上文本屬于正向情感; “外出接觸、立可攻擊” “交叉感染” 不符合網(wǎng)民期望,此類文本屬于負(fù)向情感。根據(jù)上述規(guī)則得到訓(xùn)練數(shù)據(jù),對NBM 進(jìn)行訓(xùn)練,并使用訓(xùn)練后的分類器對全部評論文本的情感進(jìn)行預(yù)測,得到情感分類結(jié)果。

        圖3 “日本鉆石公主號郵輪” 話題訓(xùn)練數(shù)據(jù)情感極性分布統(tǒng)計(jì)

        經(jīng)過訓(xùn)練的分類器,驗(yàn)證性能指標(biāo),得到其準(zhǔn)確率為0.8342,這說明分類效果較好,與未經(jīng)OCC規(guī)則標(biāo)注的準(zhǔn)確率相比提升了0.0272。結(jié)合近年來對網(wǎng)絡(luò)輿情的情感分類NBM、LSTM、CNN 和SVM 分類方法,本文與其研究結(jié)果[32]進(jìn)行了對比分析,具體結(jié)果如表1 所示,證明本次構(gòu)建的情感分類器具有較好的分類準(zhǔn)確率。

        為進(jìn)一步分析文本情感特點(diǎn),本文依據(jù)情感傾向度將情感分為負(fù)面情感、中性情感和正面情感,研究各階段不同類型情感數(shù)目占比。以情感數(shù)值0~0.4 作為負(fù)面情感,0.4~0.6 作為中性情感,0.6~1 作為正面情感[42],分別對四個(gè)階段做統(tǒng)計(jì)分析,分析結(jié)果如表2 所示。

        表1 不同分類器準(zhǔn)確率比較

        表2 “日本鉆石公主號郵輪” 評論文本情感分類統(tǒng)計(jì)

        輿情周期內(nèi)情感傾向度分布如圖4 所示。結(jié)合表2 和圖4 的數(shù)據(jù)分析結(jié)果,在 “日本鉆石公主號郵輪” 事件發(fā)展的全生命周期中,負(fù)面評論占比較多,均在40%左右;在終結(jié)期負(fù)面情感超過了整體情感分布的50%。從數(shù)據(jù)分析結(jié)果來看,正面情感在各個(gè)周期占比均很少,在各個(gè)周期均占總體評論的25%左右。中性情感傾向占比隨事件的發(fā)展逐漸變少,在事件發(fā)展的形成期及高峰期,中性情感的數(shù)據(jù)與負(fù)面情感數(shù)據(jù)數(shù)量持平。因此,從此次輿情話題事件可以看出,本次事件的整體傾向偏向于負(fù)面情感,且在事件發(fā)展的尾期用戶的負(fù)面評論較為激烈,正面情感占比出現(xiàn)低谷。

        圖4 輿情周期評論情感傾向值分布情況(彩圖請見http://qbxb.istic.ac.cn/CN/volumn/home.shtml)

        圖5 全時(shí)段日平均情感傾向值隨時(shí)間變化圖

        全時(shí)段日平均用戶情感傾向值如圖5 所示,獲得的情感分析結(jié)果呈現(xiàn)為取值區(qū)間從0 到1 的實(shí)數(shù)。本文將情感分析結(jié)果數(shù)值整體下調(diào)0.5,從而使用戶文本情感傾向概率分布在基線為 “0” 的左右兩側(cè),大于 “0” 一側(cè)為正面傾向,小于 “0” 一側(cè)為負(fù)面傾向,以獲得更為直觀的可視化效果。全時(shí)段日平均情感傾向值可以清晰的表征每日用戶評論的情感極性,可以觀察到負(fù)面情感極性最為強(qiáng)烈的是在事件發(fā)生的擴(kuò)散期和終結(jié)期兩個(gè)階段。

        4.2 輿情周期內(nèi)主題提取

        以用戶評論文本形成期階段正向數(shù)據(jù)集為例,文本使用jiebaR 進(jìn)行分詞,然后利用向量化工具將文檔集合向量化。調(diào)用R 語言中LDAvis 工具,依據(jù)以往研究預(yù)估設(shè)定主題數(shù)量為4[30]。經(jīng)過反復(fù)可視化調(diào)節(jié),確認(rèn)主題之間無交集情況后,再次確定最終主題數(shù)為3。經(jīng)過50 輪次的迭代過程,多次聚類之后,獲得形成期主題的識別結(jié)果如圖6 所示。LDA 主題模型會(huì)采用高頻關(guān)鍵字對主題進(jìn)行描述,參考以往研究為確保主題描述的全面性,本文將主題輸出關(guān)鍵字?jǐn)?shù)量設(shè)為30[30],其中某一主題(主題之間并沒有順序)的描述關(guān)鍵字序列為 “希望-感染-香港-疫情-船上-加油-10-武漢-3700-鉆石公主號-野味-發(fā)現(xiàn)-出門-此次-醫(yī)院-世界-新聞-人民-檢察-控制-新型冠狀病毒-結(jié)束……” 等。

        圖6 “日本鉆石公主號郵輪” 輿情話題形成階段可視化事例展示

        從圖6 中可以看出,LDAvis 工具直觀地顯示出不同主題在二維向量空間上的距離,不同圓圈的大小代表主題包含文本的數(shù)量。在二維空間向量上,3 個(gè)主題間具有明顯的差別,而且沒有交疊。這一數(shù)據(jù)結(jié)果表明,指定的3 個(gè)主題類別結(jié)果是可接受的。在LDA 模型中不存在 “完美結(jié)果” 的概念。圖6 中主題1、主題2、主題3 的距離中心位置均較分散且平均[43]。同時(shí),可以通過右上方λ參數(shù)設(shè)置窗口調(diào)整λ大小,如圖7 所示,以確定某一主題中的詞匯更加符合對該主題的描述,此示例經(jīng)多次試驗(yàn)后選擇的λ參數(shù)選為0.57。通過對上述主題挖掘及可視化方法,對 “日本鉆石公主號郵輪” 輿情事件不同階段的評論文本進(jìn)行正面、中性、負(fù)面情感傾向的主題挖掘,利用關(guān)鍵詞估計(jì)主題含義,最終主題結(jié)果如表3 所示。

        4.3 輿情周期內(nèi)主題分類

        以往研究在進(jìn)行輿情事件主題分析時(shí),常對主題類型進(jìn)一步劃分,以發(fā)現(xiàn)不同類型主題特征,并根據(jù)主題類型特征對網(wǎng)民情感內(nèi)容進(jìn)行有針對性的引導(dǎo)。參考Qu 等[44]劃分方式本文將主題劃分為意見相關(guān)型、信息相關(guān)型、情感相關(guān)型和行動(dòng)相關(guān)型四類主題,主題劃分結(jié)果如表4 所示。綜合來看,用戶在新冠肺炎疫情事件發(fā)生的輿情周期中評論文本的主題傾向性在不同類別上各有側(cè)重。正面情感主題主要集中于情感相關(guān)型、行動(dòng)相關(guān)型和意見相關(guān)型三種類型;中性情感主題更多分布于信息相關(guān)型和意見相關(guān)型等類型;負(fù)面情感主題集中于信息相關(guān)型、情感相關(guān)型和行動(dòng)相關(guān)型類型。

        圖7 “日本鉆石公主號郵輪” 話題1關(guān)鍵詞隸屬主題圖展示

        表3 “日本鉆石公主號郵輪” 話題評論文本情感類別主題挖掘結(jié)果

        5 討論與分析

        5.1 基于網(wǎng)民情感分布的輿情疏導(dǎo)

        由表2 和圖5 可以發(fā)現(xiàn),針對本次輿情話題網(wǎng)民情感走向總體偏向負(fù)面情感,這需要相關(guān)機(jī)構(gòu)進(jìn)行合理的引導(dǎo)及關(guān)注以防輿情事件走勢難以控制。本次事件中網(wǎng)民情感走向呈現(xiàn)兩種特點(diǎn):一是網(wǎng)民的正面情感容易伴隨輿情周期的演進(jìn)出現(xiàn)情感的急速轉(zhuǎn)變,如2 月10 日公布感染人數(shù)以及2 月21 日 “日本鉆石公主號郵輪” 乘客下船,網(wǎng)民情感迅速由正面轉(zhuǎn)為負(fù)面;二是網(wǎng)民的情感走向在輿情周期中出現(xiàn)了反復(fù)性的波動(dòng),即在擴(kuò)散期的負(fù)面情感聚集后,在終結(jié)期再次出現(xiàn)了負(fù)面情感聚集。

        突發(fā)公共衛(wèi)生事件因涉及廣大群眾的切身利益,因而輿情話題具有一定的敏感性,網(wǎng)民情感往往容易出現(xiàn)極端片面性,若缺乏合理的引導(dǎo)和緩解,則容易引發(fā)輿情危機(jī),故對事件發(fā)展輿情周期內(nèi)的網(wǎng)民情感進(jìn)行監(jiān)測是輿情引導(dǎo)的重要基礎(chǔ)[45]。首先,相關(guān)機(jī)構(gòu)應(yīng)該確定輿情引導(dǎo)的關(guān)鍵節(jié)點(diǎn),在網(wǎng)民情感出現(xiàn)整體負(fù)面趨勢時(shí),立刻引起重視,選擇合適時(shí)機(jī)盡早介入。其次,相關(guān)機(jī)構(gòu)應(yīng)該注意在輿情周期中觸發(fā)網(wǎng)民情感轉(zhuǎn)變的關(guān)鍵主題事件。關(guān)注輿情主題事件發(fā)生原因及事件類型,并給出解決其及衍生事件的相應(yīng)對策或緊急聲明,從根本上解決網(wǎng)民的需求從而進(jìn)行網(wǎng)民情感疏導(dǎo)。最后,做好節(jié)點(diǎn)的輿情引導(dǎo)工作的同時(shí),還要注意觀察輿情走向中衍生主題事件的情感演化特征,對可能出現(xiàn)的輿情熱點(diǎn)高峰進(jìn)行預(yù)判,防患于未然。

        表4 評論文本主題類型劃分

        5.2 基于情感與主題協(xié)同分析的輿情監(jiān)管

        在本次事件中,用戶的正面情感主題包括:形成期疫情信息的實(shí)時(shí)通報(bào)、采取措施的描述及檢測結(jié)果的實(shí)時(shí)更新等,擴(kuò)散期用戶情感表達(dá)的個(gè)體案例以及對用戶質(zhì)疑提問的積極回應(yīng),爆發(fā)期日本政府的緊急措施及國內(nèi)政府的救援計(jì)劃等,終結(jié)期對乘客行為的呼吁以及對日本政府應(yīng)對疫情的期望等。用戶的中性情感主題較為均勻的分散在事件發(fā)生周期的各階段中,包括用戶對事件發(fā)生的實(shí)況描述、關(guān)鍵信息分享以及用戶對當(dāng)局做法的建議等。用戶的負(fù)面情感主題主要集中在擴(kuò)散期和終結(jié)期,包含的話題類型為擴(kuò)散期網(wǎng)民對當(dāng)局決策的不同意見、疫情實(shí)時(shí)的緊張局勢以及終結(jié)期日本的兩次決策行為等。

        在理解網(wǎng)民情感分布的基礎(chǔ)上,相關(guān)部門可以確定不同情感類型的網(wǎng)民在不同輿情階段關(guān)注的主題內(nèi)容,從情感和主題兩方面入手對輿情進(jìn)行有效引導(dǎo),并對中性情感及負(fù)面情感主題進(jìn)行重點(diǎn)監(jiān)測及引導(dǎo)。中性情感主題出自網(wǎng)民內(nèi)生信息需求的網(wǎng)民間信息共享行為,這類主題容易產(chǎn)生網(wǎng)絡(luò)謠言,相關(guān)機(jī)構(gòu)應(yīng)聯(lián)合主流媒體、大眾媒體等有影響力的意見領(lǐng)袖發(fā)布科學(xué)準(zhǔn)確信息杜絕虛假信息的傳播[46],引導(dǎo)輿情向更好的態(tài)勢發(fā)展。對于負(fù)面情感主題,相關(guān)機(jī)構(gòu)要關(guān)注其主題內(nèi)容及主題類型,幫助相關(guān)機(jī)構(gòu)在了解主要觸發(fā)事件的基礎(chǔ)上,發(fā)現(xiàn)影響網(wǎng)民負(fù)面情感的小數(shù)量衍生輿情主題事件,挖掘網(wǎng)民負(fù)面情感的來源,從根本上提出全面的、有針對性的網(wǎng)民情感引導(dǎo)舉措;在主題類型方面,由于輿情事件發(fā)展的反復(fù)性,對于主題類型的關(guān)注有助于輿情演變后期對可能發(fā)生的觸發(fā)網(wǎng)民情感轉(zhuǎn)變的熱點(diǎn)事件進(jìn)行相似性預(yù)測,對網(wǎng)民情感進(jìn)行疏通及引導(dǎo)。

        5.3 基于不同主題類型的輿情引導(dǎo)

        由表4 可知,信息相關(guān)型主題中,用戶情感主要集中于中性及負(fù)面情感主題。中性主題包括事件實(shí)時(shí)信息播報(bào)及情況描述,負(fù)向情感主題包括事件發(fā)展的緊張局勢及對政府機(jī)構(gòu)采納的應(yīng)急措施的評價(jià)。情感相關(guān)型主題中,中性主題較少,網(wǎng)民情感比較明確;負(fù)面情感主題集中于隔離的實(shí)際情況和潛在的傳染危機(jī)等;積極情感主題包含積極情感的個(gè)體案例及對日本當(dāng)局下一步措施的呼吁等。行動(dòng)相關(guān)型主題中,對于政府高效處理措施以及相應(yīng)部門對網(wǎng)民質(zhì)疑的回應(yīng)持有正面情感;對政府的決策、無法理解持有負(fù)面情感。意見相關(guān)型主題,多為正面及中性情感傾向,內(nèi)容圍繞網(wǎng)民對政府決策的建議以及對乘客相關(guān)行為的呼吁。

        輿情監(jiān)管部門可以根據(jù)網(wǎng)民在輿情不同時(shí)期的網(wǎng)民生信息需求,利用關(guān)鍵時(shí)間節(jié)點(diǎn),向網(wǎng)民輸送具有時(shí)效性的針對性信息,在突發(fā)階段做到實(shí)時(shí)信息公開,在消散階段做到后續(xù)報(bào)道及更進(jìn),并與網(wǎng)民有效交互。對于信息相關(guān)型主題,相關(guān)機(jī)構(gòu)應(yīng)本著信息公開及信息真實(shí)的原則,通過更新事件最新現(xiàn)狀,介紹對不良事態(tài)采取的補(bǔ)救措施,在事件發(fā)酵的早起有效的引導(dǎo)網(wǎng)民情感,從根本上獲得網(wǎng)民的理解。對于情感型主題,相關(guān)機(jī)構(gòu)應(yīng)該通過媒體聯(lián)動(dòng)效應(yīng),搜尋事件發(fā)展當(dāng)事人案例,引導(dǎo)網(wǎng)民關(guān)注焦點(diǎn)轉(zhuǎn)化到積極案例的贊同、認(rèn)可及推廣環(huán)節(jié)。對于行動(dòng)型相關(guān)主題,建議相關(guān)機(jī)構(gòu)盡早發(fā)布有針對性的應(yīng)急舉措,以提升公信力及辦事效率,同時(shí),對不當(dāng)決策實(shí)時(shí)發(fā)表聲明,及時(shí)獲得網(wǎng)民的支持與理解。對于意見類相關(guān)主題,相關(guān)機(jī)構(gòu)應(yīng)及時(shí)采納并及時(shí)回應(yīng),定期召開會(huì)議給予答復(fù),以有效及時(shí)的安撫網(wǎng)民情感、回應(yīng)網(wǎng)民的需求。

        6 研究結(jié)論

        在理論層面,本文構(gòu)建了情感與主題挖掘協(xié)同分析模型,根據(jù)OCC 情感規(guī)則,采用樸素貝葉斯模型對用戶情感進(jìn)行分類,并基于Relevance 公式改進(jìn)LDA 主題模型,進(jìn)行主題提取,豐富了情感與主題挖掘協(xié)同分析的研究方法。在實(shí)踐層面,結(jié)合全球關(guān)注的突發(fā)公共衛(wèi)生事件新冠肺炎疫情 “日本鉆石公主號郵輪” 這一典型輿情話題,通過對用戶情感進(jìn)行分類,得到輿情生命周期的四個(gè)不同階段、不同情感類型下用戶關(guān)注的主題,并將用戶關(guān)注的文本主題劃分為信息相關(guān)型、情感相關(guān)型、行動(dòng)相關(guān)型和意見相關(guān)型四種類型,并從網(wǎng)民情感分布、情感主題協(xié)同分析、不同主題類型三個(gè)方面提出網(wǎng)民情感引導(dǎo)的措施。研究結(jié)果表明,采用情感與主題挖掘協(xié)同分析模型,對訓(xùn)練數(shù)據(jù)進(jìn)行標(biāo)注有助于構(gòu)建一致的標(biāo)注原則,從而增強(qiáng)情感分類器的準(zhǔn)確率,了解不同用戶情感特征及關(guān)注主題傾向,并根據(jù)不同階段及主題內(nèi)容采用相應(yīng)的突發(fā)公共衛(wèi)生事件的輿情引導(dǎo)策略,從而更好地實(shí)現(xiàn)網(wǎng)絡(luò)生態(tài)治理。

        另外,本文在研究中也存在一定的局限性:輿情事件的選擇,僅采用新冠肺炎疫情事件中 “日本公主號郵輪” 話題進(jìn)行分析,尚需要結(jié)合更多話題的輿情事件對情感與主題挖掘協(xié)同分析模型進(jìn)行進(jìn)一步驗(yàn)證。后續(xù)研究將會(huì)結(jié)合多話題的輿情事件進(jìn)行分析,以對本文提出的輿情分析模型進(jìn)行優(yōu)化,滿足突發(fā)公共衛(wèi)生事件背景下多話題輿情事件分析的需求。

        午夜福利不卡无码视频| 中文无码一区二区三区在线观看| 无码午夜成人1000部免费视频| 国产91成人精品亚洲精品| 一区二区丝袜美腿视频| 亚洲精品国产一区二区免费视频 | 日本无码欧美一区精品久久 | 国成成人av一区二区三区| 在线观看av网站永久| 久热这里只有精品视频6| 久久久久亚洲AV成人网毛片| 亚洲一区二区日韩在线| 最近免费中文字幕中文高清6 | 青青青伊人色综合久久| 国产成人精品人人做人人爽97 | av在线播放亚洲天堂| 丰满少妇人妻无码专区| 自拍偷自拍亚洲精品播放| 中文字幕麻豆一区二区| 东北熟妇露脸25分钟| 中文字幕欧美人妻精品一区| 国产人在线成免费视频麻豆| 玩弄丝袜美腿超短裙校花| 日本无遮挡真人祼交视频| 麻豆一区二区99久久久久| 久久与欧美视频| 亚洲不卡av一区二区三区四区| 国产免费爽爽视频在线观看 | 一区二区三区日本久久| 少妇真实被内射视频三四区| 天堂一区人妻无码| 亚洲精品国产不卡在线观看| 精品久久中文字幕系列| 亚洲国产日韩精品一区二区三区| 一区二区日韩国产精品| 国产午夜精品av一区二区三| 久久精品99国产精品日本| 亚洲av无码专区国产乱码不卡| 国产不卡视频一区二区在线观看| 日韩精品视频免费在线观看网站| 亚洲熟妇久久国产精品|