亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向視頻彈幕的網(wǎng)絡(luò)輿情事件監(jiān)測(cè)研究*

        2022-03-07 08:01:00黃立赫石映昕
        情報(bào)雜志 2022年2期
        關(guān)鍵詞:情感

        黃立赫 石映昕

        (1.西北工業(yè)大學(xué)馬克思主義學(xué)院 西安 710129;2.華北水利水電大學(xué)馬克思主義學(xué)院 河南 鄭州 450046)

        伴隨著社會(huì)性網(wǎng)絡(luò)的快速發(fā)展,用戶生成內(nèi)容(User Generated Content,UGC)已成為眾多社交平臺(tái)的顯著特征[1]。以嗶哩嗶哩,優(yōu)酷等為代表的視頻分享平臺(tái)逐漸演化成資源共享、情感表達(dá)、社交分享的信息載體。視頻彈幕作為一種日漸流行的在線評(píng)論形式,包含大量的視頻標(biāo)簽語義信息[2]。不同于以?shī)蕵坊瘶?biāo)引為主要特征的主題類型視頻彈幕,網(wǎng)絡(luò)輿情事件的視頻彈幕往往包含大量的社會(huì)標(biāo)引(Social tagging),網(wǎng)民通過發(fā)布、評(píng)論等行為,表達(dá)針對(duì)社會(huì)熱點(diǎn)事件的情感傾向?;谏鐣?huì)標(biāo)引的視頻彈幕不僅成為網(wǎng)民在線吐槽的欲望傳感器,更成為視頻觀眾情感波動(dòng)的前哨站。與通用的普通短文本分析不同的是,視頻彈幕所具有的實(shí)時(shí)交互性與臨場(chǎng)在線性等特點(diǎn),使得面向視頻彈幕的文本分析能夠精準(zhǔn)捕捉用戶的交互行為與情感傾向在時(shí)間分布上的顯著差異,動(dòng)態(tài)追蹤視頻彈幕中的話題遷移,感知事件漂移的輿情走向,對(duì)預(yù)警網(wǎng)絡(luò)輿情危機(jī),繪制可視化的事理圖譜等具有重要的研究?jī)r(jià)值。

        網(wǎng)絡(luò)輿情事件的發(fā)展在時(shí)間維上具有平滑性,表現(xiàn)為舊話題的消亡或新話題的產(chǎn)生或抑制。類似地,用戶的評(píng)論情感也會(huì)隨之演化,產(chǎn)生情感極性與情感強(qiáng)度的調(diào)整。本文在視頻彈幕情感計(jì)算的基礎(chǔ)上,引入彈幕遷移指數(shù),旨在量化網(wǎng)絡(luò)輿情事件的預(yù)警監(jiān)測(cè)指標(biāo),通過計(jì)算不同時(shí)間序列下話題權(quán)重與情感強(qiáng)度變化,繪制遷移指數(shù)動(dòng)態(tài)曲線,實(shí)現(xiàn)網(wǎng)絡(luò)輿情事件監(jiān)測(cè)的路徑分析。

        1 相關(guān)理論研究

        目前針對(duì)網(wǎng)絡(luò)輿情事件的文本主題建模主要可分為聚類分析和主題分析兩類。聚類分析模型通過計(jì)算文檔間的相似距離,實(shí)現(xiàn)文檔主題的識(shí)別,主要包括聚類算法[3]、TF-IDF算法[4]、關(guān)聯(lián)規(guī)則挖掘[5]等。主題模型(Topic Model)主要通過識(shí)別文本集合潛在的語義結(jié)構(gòu),抽取文本主題。LDA(Latent Dirichlet Allocation)主題模型[6]基于詞袋原理,將文本的語義表示從高維詞空間降到低維主題空間,建立基于概率模型的三層貝葉斯網(wǎng)絡(luò),已成為最受矚目的研究理論。然而,LDA主題模型的性能受文本長(zhǎng)度的影響,且未充分考慮詞之間的位置關(guān)系,因而無法有效抽取短文本主題。為此,Yan[7]提出BTM(Biterm Topic Model)雙詞主題模型,該模型通過抽取文檔中的雙詞,建立主題混合分布,改善了因文檔過短而出現(xiàn)的特征矩陣稀疏的問題。

        文本情感分析依據(jù)情感的粒度信息,可分為詞語級(jí)、句子級(jí)、篇章級(jí)。詞語級(jí)的情感分析是文本情感分析的基礎(chǔ),該類研究主要可分為基于無監(jiān)督的情感詞典方法以及基于有監(jiān)督的機(jī)器學(xué)習(xí)方法。句子級(jí)的情感分析通常在詞語級(jí)分析的基礎(chǔ)上,增加文檔上下文關(guān)聯(lián)、情感位置判斷、句法分析等要素,實(shí)現(xiàn)主觀句情感分類。篇章級(jí)通常將文檔視為單一評(píng)論對(duì)象,忽略不同對(duì)象間的情感評(píng)論差異,因而整體情感識(shí)別精度較低。此外,依據(jù)研究?jī)?nèi)容的不同,文本情感分析也可分為主客觀分類[8]、情感極性分析[9]以及多情感分類[10]。

        綜上所述,當(dāng)前學(xué)者對(duì)于網(wǎng)絡(luò)輿情事件的話題漂移研究,多集中于事件的主題識(shí)別與情感的演化分析,缺乏能夠量化的方法識(shí)別網(wǎng)絡(luò)輿情事件的情感變化關(guān)鍵時(shí)間窗口。此外,研究多側(cè)重網(wǎng)絡(luò)輿情事件的文本分析,利用視頻彈幕進(jìn)行用戶情感分析尚不多見。因此,本文針對(duì)以上不足,研究了視頻彈幕社區(qū)中用戶情感在時(shí)間維上的演化特征,通過引入彈幕遷移指數(shù)概念,從話題內(nèi)容與用戶情感的角度,實(shí)現(xiàn)了話題與情感的協(xié)同分析。模型研究思路如圖1所示。

        圖1 視頻彈幕監(jiān)測(cè)分析模型

        2 視頻彈幕主題與情感建模

        2.1彈幕主題識(shí)別本文采用BTM主題模型進(jìn)行主題識(shí)別,該模型假設(shè)詞對(duì)間的語義相關(guān)性與其在相同文本中共現(xiàn)的次數(shù)成正比,通過構(gòu)建主題混合分布,實(shí)現(xiàn)“雙詞對(duì)-主題-語料文本”三層Bayes概率建模。若網(wǎng)絡(luò)輿情事件的視頻文本數(shù)為M,包含的主題數(shù)為K,詞對(duì)數(shù)為|B|,BTM模型假設(shè)視頻文本話題詞的先驗(yàn)分布為Dirichlet分布,即θz=Dirichlet(α),φw|z=Dirichlet(β),語料庫(kù)的生成過程描述如下:a.抽取主題z下的詞分布;b.抽取文檔i的主題分布;c.抽取主題z~Multi(θ),并從主題z中抽取共現(xiàn)詞對(duì)b=(wi,wj),wi,wj~Multi(φz)。重復(fù)上述過程,最終構(gòu)建完整的視頻彈幕語料庫(kù)。BTM模型參數(shù)具體含義見表1。

        表1 BTM主題模型的參數(shù)

        2.2彈幕情感計(jì)算彈幕文本中的情感計(jì)算需要在情感極性判斷的基礎(chǔ)上,實(shí)現(xiàn)句子級(jí)的多粒度情感分析。本文借鑒鄭飏飏等[10]創(chuàng)建彈幕情感詞典的思想,以7分類情感指標(biāo)作為情感維度,將彈幕文本的情感粒度分為樂、好、怒、哀、懼、惡、驚等細(xì)分維度。此外,針對(duì)彈幕語言的特點(diǎn),首先建立彈幕顏文字詞典,再基于情感詞匯本體庫(kù)[11]、常用副詞表[12]以及否定詞表[13],建立多維情感詞典,最后計(jì)算彈幕語句的綜合情感強(qiáng)度。

        2.2.1 顏文字詞典的構(gòu)建 視頻彈幕作為一種融合用戶在線評(píng)論文本的新型視頻形式,包含大量觀眾對(duì)視頻內(nèi)容的觀點(diǎn)評(píng)價(jià)與情感傾向[14]。顏文字作為一種新的網(wǎng)絡(luò)熱詞形式,在多語言符號(hào)的基礎(chǔ)上逐漸演化成包含多種字符與圖案集的亞文化語言,廣泛存在于各大視頻彈幕網(wǎng)站中。顏文字詞典構(gòu)建過程如下:a.首先經(jīng)分詞、去停用詞、詞性標(biāo)注等預(yù)處理后,從實(shí)驗(yàn)數(shù)據(jù)集中,隨機(jī)抽取一定數(shù)量的顏文字,進(jìn)行人工情感標(biāo)注,建立顏文字種子情感分類表,并參照文獻(xiàn)[15]建立情感分類樹,進(jìn)行情感強(qiáng)度標(biāo)注,結(jié)果如表2所示。b.利用公式1依次計(jì)算新的顏文字與表2中的種子詞之間的互信息值,選取最大互信息值所含有的種子情感,作為其最終的情感類別。

        表2 顏文字種子情感分類表(部分)

        (1)

        其中,P(wnew,wseed)表示wnew與wseed同時(shí)出現(xiàn)在文本D中的概率;P(wnew),P(wseed)分別表示wnew,wseed單獨(dú)出現(xiàn)的概率。通過動(dòng)態(tài)遍歷情感分類樹中包含新顏文字的語句情感強(qiáng)度,綜合判斷句子級(jí)的情感值。假設(shè)顏文字詞典的正向情感集合為Wpos(包含“樂”“好”等情感維度),負(fù)向情感集合為Wneg(包含“怒”“哀”“懼”“惡”“驚”等情感維度),則含有新顏文字wnew的句子綜合情感強(qiáng)度Semoji(wi),計(jì)算如公式2所示。

        (2)

        其中,|Wpos|與|Wneg|分別表示正向情感集合與負(fù)向情感集合所含的顏文字?jǐn)?shù)。

        2.2.2 多維情感詞典的構(gòu)建 將顏文字詞典與情感詞典相結(jié)合,能夠?qū)崿F(xiàn)多元化的情感發(fā)現(xiàn)。本文依據(jù)大連理工大學(xué)構(gòu)建的情感詞匯本體庫(kù),抽取彈幕語句的情感詞,并結(jié)合否定詞表與程度副詞表,構(gòu)建面向視頻彈幕文本的多維情感詞典,具體流程如下:首先通過標(biāo)注彈幕文本的詞性,篩選出具有情感信息的形容詞、嘆詞和動(dòng)詞,并將抽取出的情感詞歸類到七元情感維度中,并確定否定詞對(duì)彈幕情感遷移的影響,情感分類映射關(guān)系如表3所示。經(jīng)否定詞修飾后的彈幕本文情感值計(jì)算,如公式3所示,其中n表示否定詞的個(gè)數(shù)。

        表3 含有否定詞的情感分類映射關(guān)系表

        注:正向情感(好,樂)經(jīng)過奇數(shù)次修飾后,情感態(tài)勢(shì)轉(zhuǎn)變成負(fù)向情感,其中強(qiáng)度較高的樂(0.4-0.5),好(0.4-0.5)映射成“怒”情感。負(fù)向情感“懼”“衰”“驚”經(jīng)過修飾后,表現(xiàn)為無情感,其中“怒”“惡”則轉(zhuǎn)換成不同程度的“好”情感

        (3)

        文本的情感識(shí)別還需要考慮程度副詞對(duì)情感強(qiáng)度的影響,為此,將經(jīng)過程度副詞修飾的情感強(qiáng)度定義為公式4所示,其中,|adv|表示程度副詞的修飾強(qiáng)度。

        Sadv(wi)=|adv|*s(wi)

        (4)

        同一條彈幕的情感值由其所包含的所有顏文字以及情感詞共同決定,通過對(duì)不同類別的情感維度進(jìn)行線性求和,最終得到彈幕的綜合情感值,計(jì)算如公式5所示。當(dāng)某類情感維度取得最大值時(shí),可將其視為某條彈幕主題的情感。

        (5)

        其中,Semoji(wi)表示彈幕文本的顏文字情感強(qiáng)度,S(wi)表示經(jīng)過否定詞與程度副詞修飾后的情感強(qiáng)度,k表示一條彈幕中屬于相同情感維度的顏文字與情感詞的總數(shù)。

        3 彈幕遷移指數(shù)構(gòu)建

        新媒體環(huán)境下,部分網(wǎng)絡(luò)輿情事件在演變成熱點(diǎn)事件之前,首先是以視頻的形式在自媒體中廣泛傳播[16]。研究如何及時(shí)有效地感知事件的主題變化,準(zhǔn)確預(yù)測(cè)輿情的演化走向,對(duì)提高網(wǎng)絡(luò)生態(tài)環(huán)境的預(yù)警與監(jiān)控能力具有重要的現(xiàn)實(shí)意義。視頻彈幕作為二次元時(shí)代流行的視頻互動(dòng)模式,包含大量的用戶評(píng)論以及情感評(píng)價(jià)信息。彈幕遷移指數(shù)作為監(jiān)控視頻彈幕事態(tài)變化的重要指標(biāo),能夠動(dòng)態(tài)感知網(wǎng)絡(luò)輿情事件的輿情危機(jī),繪制事件的生命周期節(jié)點(diǎn),達(dá)到動(dòng)態(tài)感知情感變化的目的。本文認(rèn)為彈幕遷移指數(shù)不僅要體現(xiàn)話題內(nèi)容的語義改變,更要突出話題情感的動(dòng)態(tài)變化。因此,彈幕遷移指數(shù)由話題遷移指數(shù)與情感遷移指數(shù)兩個(gè)分指標(biāo)共同決定。

        3.1話題遷移指數(shù)話題遷移指數(shù)主要從話題內(nèi)容的關(guān)鍵詞權(quán)重以及視頻興趣熱度的變化角度,刻畫網(wǎng)絡(luò)輿情事件話題遷移,具體構(gòu)建過程如下:首先由BTM主題模型得到主題-詞分布以及文檔-主題分布,再基于TF-IDF算法計(jì)算不同關(guān)鍵詞的權(quán)重,同時(shí)結(jié)合視頻彈幕熱度分析,通過點(diǎn)擊量,彈幕量,播放量等信息,計(jì)算時(shí)間序列下彈幕的熱度指數(shù)。最后,綜合上述指數(shù)特征分量,得到能夠反映彈幕話題遷移特征的指數(shù)信息。

        3.1.1 最優(yōu)話題數(shù)與話題關(guān)鍵詞權(quán)重計(jì)算 話題遷移指數(shù)通過對(duì)比相鄰時(shí)間片內(nèi)的主題變化,并結(jié)合話題特征詞權(quán)重與話題興趣熱度特征,實(shí)現(xiàn)話題遷移的路徑表示。不同時(shí)間序列下的最優(yōu)話題數(shù)是影響話題權(quán)重總和的關(guān)鍵參數(shù)。困惑度(Perplexity)是用來衡量BTM模型最優(yōu)話題數(shù)的重要指標(biāo),困惑度越小,模型的性能越優(yōu),相應(yīng)的主題數(shù)取到最優(yōu)值[17]。

        依據(jù)“二八原則”,從每個(gè)數(shù)據(jù)集中隨機(jī)抽取80%的數(shù)據(jù)作為訓(xùn)練集,20%數(shù)據(jù)作為測(cè)試集,經(jīng)過多次迭代測(cè)試。實(shí)際操作發(fā)現(xiàn),不同測(cè)試集的實(shí)驗(yàn)數(shù)據(jù)對(duì)模型困惑度取值的影響較大。因此,最終采用十折交叉驗(yàn)證法,將數(shù)據(jù)集隨機(jī)分成十份,其中九份作為訓(xùn)練集,一份作為測(cè)試集,進(jìn)行十次交叉測(cè)試,選取十次操作的平均值作為最終結(jié)果(如圖2所示)。由圖2可知,當(dāng)話題數(shù)K為25時(shí),曲線出現(xiàn)較為明顯的拐點(diǎn),且話題數(shù)量逐漸收斂。

        圖2 十折交叉后的模型困惑度曲線圖

        為了進(jìn)一步描述話題的內(nèi)在語義信息,探究情感極性與情感強(qiáng)度的內(nèi)在聯(lián)系。本文采用TF-IDF模型計(jì)算話題的特征詞權(quán)重,建立話題特征詞的詞頻權(quán)重矩陣,刻畫不同特征詞對(duì)話題的重要程度。假設(shè)t時(shí)刻視頻彈幕含有s個(gè)話題,則此時(shí)其話題權(quán)重可用公式6計(jì)算。其中,tfidfij表示t時(shí)刻第i個(gè)話題所含的第j個(gè)特征詞的tfidf值,s為話題數(shù),p為話題所含的特征詞數(shù)。

        (6)

        3.1.2 興趣熱度計(jì)算 興趣熱度體現(xiàn)了網(wǎng)絡(luò)輿情事件的傳播速度與傳播走向,能夠?yàn)轭A(yù)測(cè)其是否會(huì)轉(zhuǎn)化成網(wǎng)絡(luò)熱點(diǎn)事件提供必要的數(shù)據(jù)參考。因此,本文通過獲取視頻彈幕的點(diǎn)贊數(shù)、收藏?cái)?shù)、分享量、彈幕數(shù)以及播放量,建立多指標(biāo)的視頻興趣熱度評(píng)價(jià)模型,具體流程如下:首先,對(duì)上述指標(biāo)進(jìn)行歸一化和百分化處理,再通過層次分析法確定不同指標(biāo)的權(quán)重,使用1-9標(biāo)度方法確定判斷矩陣的元素aij,然后采用合積法求解判斷矩陣的特征值與特征向量,構(gòu)建指標(biāo)體系。為了確定指標(biāo)分配權(quán)重的合理性,需要進(jìn)行判斷矩陣的一致性檢驗(yàn),具體過程如下:a.分別計(jì)算一致性指標(biāo)CI與隨機(jī)一致性指標(biāo)RI,再得到一致性比率CR。當(dāng)CR<0.10時(shí),認(rèn)為判斷矩陣的一致性是合理的,否則需要修正判斷矩陣;b.將通過一致性檢驗(yàn)的判斷矩陣進(jìn)行層次加權(quán),最終得到如表4所示的興趣熱度指標(biāo)權(quán)重表。

        (7)

        表4 興趣熱度指標(biāo)權(quán)重分配表

        3.1.3 話題遷移指數(shù)構(gòu)建 話題遷移指數(shù)(Topic Drift Index, TDI)結(jié)合話題的關(guān)鍵詞權(quán)重與視頻興趣熱度指數(shù),依據(jù)不同時(shí)間測(cè)度下網(wǎng)絡(luò)輿情事件的話題tf-idf詞頻權(quán)重與興趣熱度的變化量,從話題內(nèi)容角度判斷網(wǎng)絡(luò)輿情事件是否存在主題漂移傾向。話題遷移指數(shù)計(jì)算如公式8所示。

        (8)

        3.2情感遷移指數(shù)情感遷移指數(shù)(Sentiment Drift Index, SDI)主要依據(jù)時(shí)間維下不同主題的情感值變化,體現(xiàn)網(wǎng)絡(luò)輿情事件在不同生命周期內(nèi)的情感波動(dòng),從情感變化的角度實(shí)現(xiàn)網(wǎng)絡(luò)輿情的測(cè)度分析?;?.2節(jié)的論述,情感遷移指數(shù)計(jì)算如公式9所示。其中,S(w)t1,S(w)t2分別表示t1,t2時(shí)視頻彈幕的綜合情感值。

        (9)

        3.3彈幕遷移指數(shù)彈幕遷移指數(shù)作為監(jiān)測(cè)網(wǎng)絡(luò)輿情事件的重要指標(biāo),能夠較為準(zhǔn)確地感知引起網(wǎng)絡(luò)輿情動(dòng)態(tài)變化的重要話題與時(shí)間窗口信息。本文綜合考慮網(wǎng)絡(luò)輿情事件的兩個(gè)核心要素:話題特征與情感特征,聯(lián)合建模話題遷移指數(shù)與情感遷移指數(shù),最終得到彈幕遷移指數(shù)(Bullet-screen Drift Index),計(jì)算如公式10所示。其中,δ1,δ2分別表示話題遷移指數(shù)、情感遷移指數(shù)在彈幕遷移指數(shù)中的比重。若情感遷移指數(shù)為負(fù)數(shù),則表示其情感轉(zhuǎn)為負(fù)向情感,此時(shí)將其絕對(duì)值代入公式10,并標(biāo)注該彈幕遷移指數(shù)為負(fù)值。

        BDI=δ1TDI+δ2SDI

        (10)

        4 實(shí)驗(yàn)結(jié)果與分析

        4.1數(shù)據(jù)來源與預(yù)處理本文以“章瑩穎事件”作為研究對(duì)象,使用八爪魚爬取bilibili和愛奇藝視頻網(wǎng)站的視頻彈幕數(shù)據(jù),驗(yàn)證網(wǎng)絡(luò)輿情事件的彈幕遷移指數(shù)在輿情分析中的合理性。考慮到視頻時(shí)間跨度較長(zhǎng)且彈幕密度與時(shí)間段存在較大關(guān)聯(lián),事件范圍設(shè)定在2017年6月13日-2020年10月28日,并設(shè)置時(shí)間窗口為6個(gè)月,將數(shù)據(jù)集劃分成6個(gè)子集,采集字段包括視頻發(fā)布日期、視頻數(shù)、點(diǎn)贊數(shù)、收藏?cái)?shù)、分享量、彈幕數(shù)、播放量等,共獲取有效彈幕文本2 702 243條,采集結(jié)果如表5所示。

        表5 視頻彈幕數(shù)據(jù)分布

        為了驗(yàn)證彈幕遷移指數(shù)對(duì)網(wǎng)絡(luò)輿情事件的預(yù)測(cè)效果,依據(jù)百度指數(shù),以“章瑩穎案”為搜索關(guān)鍵詞,繪制熱度指數(shù)曲線,如圖3所示。由圖3可知,該事件的輿情傳播呈現(xiàn)“雙峰”特征,依據(jù)賈亞敏[18]提出的輿情周期劃分方法對(duì)“章瑩穎案”進(jìn)行劃分,首次爆發(fā)時(shí)間段為2017.6.5-7.24,爆發(fā)主因是章瑩穎案情公布,涉事方就其下落展開激烈討論;首次衰退期為2017.7.25-2017.8.18,該時(shí)期隨著案情的持續(xù),警方陸續(xù)發(fā)布案件信息,基本鎖定嫌疑人;擴(kuò)散期為2017.8.19-2019.6.24,該時(shí)期以案件定性,受害家屬情感慰藉以及尋找章瑩穎為主線;增長(zhǎng)期為2019.6.25-2019.8.20,起因是案件進(jìn)入審判程序,遺體位置以及美國(guó)死刑制度引發(fā)熱議。

        圖3 “章瑩穎案”百度熱度指數(shù)曲線

        4.2參數(shù)分析話題遷移指數(shù)由主題權(quán)重值與興趣熱度值決定,需要確定調(diào)節(jié)參數(shù)α,β的取值。以5號(hào)窗口所含的彈幕為實(shí)驗(yàn)對(duì)象,實(shí)驗(yàn)過程如下:首先依據(jù)困惑度,計(jì)算該窗口下視頻彈幕所含的最優(yōu)主題數(shù),并分別計(jì)算該視頻的興趣熱度。然后將所含主題數(shù)相近的視頻歸為一類,觀測(cè)其興趣熱度的變化情況。經(jīng)比較得出:“章瑩穎事件”中主題數(shù)較少的視頻彈幕,往往傾向于描述該事件的案件信息、受害方情感等內(nèi)容,興趣熱度值相對(duì)較高。因此,測(cè)定得出:當(dāng)主題數(shù)小于5時(shí),該視頻的興趣熱度參數(shù)β=0.75,α=0.25,此時(shí),話題遷移指數(shù)較能客觀反映事件的熱點(diǎn)主題變化情況。當(dāng)主題數(shù)不小于5時(shí),該視頻的興趣熱度參數(shù)β=α=0.5。

        彈幕遷移指數(shù)主要由話題遷移指數(shù)與情感遷移指數(shù)構(gòu)成,不同指數(shù)間的參數(shù)權(quán)重會(huì)影響最終的實(shí)驗(yàn)結(jié)果。通常視頻彈幕的情感會(huì)隨著視頻主題內(nèi)容的變化而逐漸演化,在主題內(nèi)容沒有發(fā)生變化的條件下,視頻觀眾在相鄰時(shí)間片內(nèi)的情感變化程度較小。因此,為確定話題遷移指數(shù)參數(shù)δ1與情感遷移指數(shù)參數(shù)δ2的取值,實(shí)驗(yàn)過程如下:首先選取包含彈幕數(shù)最多的5號(hào)窗口文本,以“月”為單位,將其所含的視頻劃分成6個(gè)子窗口文本。然后利用2.1節(jié)的彈幕主題識(shí)別方法,抽取不同時(shí)間窗口下彈幕文本所含的主題。選取主題延續(xù)周期較長(zhǎng)的主題(至少在3個(gè)時(shí)間窗口內(nèi)均存在),并將其加入候選主題集。再依據(jù)2.2節(jié)彈幕情感計(jì)算過程,分別計(jì)算上述主題的情感強(qiáng)度,得到如表6所示的主題情感結(jié)果。

        表6 5號(hào)窗口文本的部分主題-情感計(jì)算結(jié)果(部分)

        通過賦值多個(gè)情感遷移指數(shù)參數(shù)δ2,計(jì)算候選主題集中每個(gè)主題在相鄰時(shí)間片下彈幕遷移指數(shù)間的平均相關(guān)系數(shù),實(shí)驗(yàn)結(jié)果如圖4所示。由圖4可知,當(dāng)因子δ2=0.45時(shí),平均相關(guān)系數(shù)取到最大,對(duì)情感遷移指數(shù)參數(shù)的賦值最合理。

        圖4 相鄰時(shí)間片下情感值間的相關(guān)系數(shù)分析

        4.3實(shí)驗(yàn)結(jié)果分析基于BTM模型進(jìn)行主題提取,設(shè)定關(guān)鍵詞數(shù)為30,利用TF-IDF算法計(jì)算每個(gè)主題下的關(guān)鍵詞權(quán)重,以窗口1中主題權(quán)值排名前5的主題為例,結(jié)果如表7所示。由表7可知,該時(shí)間窗口下存在多個(gè)主題共存,主題內(nèi)容側(cè)重描述事件的不同要素,且不同主題所含的關(guān)鍵詞權(quán)重具有較大差異,表明不同主題權(quán)重在語義層面上具有明顯差異。

        表7 “章瑩穎事件”主題識(shí)別結(jié)果

        采用表4分配的彈幕興趣熱度權(quán)重,計(jì)算不同時(shí)間窗口下視頻彈幕的主題興趣熱度,以窗口1中興趣熱度排名前5的視頻彈幕為例,計(jì)算結(jié)果如表8所示??紤]到同一個(gè)視頻中彈幕文本可能含有多個(gè)主題,所以以時(shí)間節(jié)點(diǎn)為計(jì)量周期,將興趣熱度視為該時(shí)段內(nèi)視頻彈幕所包含所有主題的熱度值。

        表8 “章瑩穎事件”興趣熱度指數(shù)

        以窗口1所包含的45個(gè)視頻彈幕為例,以視頻發(fā)布的時(shí)間作為依據(jù),共劃分為5個(gè)統(tǒng)計(jì)節(jié)點(diǎn)(每個(gè)時(shí)段含有9個(gè)視頻),結(jié)果如表9所示。分析表9可知,在主題權(quán)重增加的情況下,話題遷移指數(shù)可能會(huì)因?yàn)榕d趣熱度的提高,而出現(xiàn)下降的情況(如序號(hào)2、3所示)。此外,興趣熱度與話題遷移指數(shù)的變化方向基本一致,體現(xiàn)了興趣熱度在監(jiān)測(cè)網(wǎng)絡(luò)輿情事件的傳播偏向方面具有一定的參考意義。

        表9 “章瑩穎事件”話題遷移指數(shù)

        基于2.2節(jié)構(gòu)建的多維情感詞典,計(jì)算視頻彈幕的情感類別與情感強(qiáng)度,具體流程如下:首先選取不同階段中視頻彈幕所含權(quán)重最大的主題,選取情感強(qiáng)度最大的數(shù)值作為該視頻的最終情感值,并按照7維情感分類法確定視頻彈幕的情感分類,表10是編號(hào)為2的視頻彈幕中,主題權(quán)重最大的主題4的部分彈幕情感識(shí)別結(jié)果。主題4的主要內(nèi)容是警方公布審訊嫌疑人的過程,由表10可知,觀眾表達(dá)了針對(duì)該主題不同方面的情感訴求,在情感類別與情感強(qiáng)度上均具有顯著差異,其中“怒”“惡”兩種負(fù)面情感在整體上較為突出,且情感強(qiáng)度較高。圖5是不同時(shí)間窗口內(nèi)主題權(quán)重top3的情感分析結(jié)果,圖5中僅列出每個(gè)主題中情感強(qiáng)度最高的三個(gè)情感類別。由圖5可知,“章瑩穎事件”的主題情感在事件生命周期內(nèi)整體波動(dòng)較平穩(wěn),情感類別整體以“怒”和“惡”為主線,具體來說,事件發(fā)展初期,“惡”和“怒”情感強(qiáng)度達(dá)到局部峰值,原因是網(wǎng)民對(duì)克里斯滕森堅(jiān)稱無罪的行為,表達(dá)了強(qiáng)烈的憎惡與憤怒(TopicⅠ-2、TopicⅠ-3)。在事件爆發(fā)階段,“怒”情感強(qiáng)度達(dá)到整個(gè)生命周期的最大值,起因是FBI基本確認(rèn)章瑩穎死亡和章瑩穎家屬表達(dá)嚴(yán)懲疑犯的訴求(TopicⅡ-2、TopicⅡ-4),網(wǎng)民的“怒”情感進(jìn)一步釋放。在事件衰退與擴(kuò)散期,各種不同類型的情感分布比例相對(duì)均衡,表現(xiàn)為“怒”“哀”“驚”情感交替出現(xiàn),網(wǎng)民的整體情感類別強(qiáng)度逐漸平穩(wěn)且均有不同程度的弱化,網(wǎng)民關(guān)注焦點(diǎn)轉(zhuǎn)向?qū)ふ沂?、校園安全等事件主題(TopicⅢ-1、TopicⅣ-1),情感強(qiáng)度較弱的原因主要是民眾對(duì)章瑩穎家屬表達(dá)了同情與支持等正情感,同時(shí)對(duì)美國(guó)校園安全隱患表達(dá)了擔(dān)憂,從而抵消了部分正情感。在二次爆發(fā)階段,“怒”情感強(qiáng)度再次達(dá)到局部峰值,起因是案件進(jìn)入量刑階段,民眾對(duì)判決結(jié)果表達(dá)強(qiáng)烈不滿(TopicⅤ-1、TopicⅤ-2),輿情危機(jī)再次出現(xiàn)。在事件衰退期,輿情走向再次發(fā)生變化,逐漸表現(xiàn)為較低強(qiáng)度的“懼”與“衰”,原因是民眾對(duì)司法部門無法尋找遺體的失望,以及對(duì)海外人生安全問題的擔(dān)心。

        圖5 各事件窗口內(nèi)情感分析結(jié)果

        表10 視頻彈幕2中主題4的彈幕情感識(shí)別結(jié)果(部分)

        計(jì)算不同時(shí)間窗口下多個(gè)視頻彈幕的情感值,得到“章瑩穎事件”的情感漂移指數(shù),以窗口1為例,按照表9的時(shí)間節(jié)點(diǎn)劃分方法,情感遷移指數(shù)結(jié)果如表11所示。由表11可知,不同窗口內(nèi),伴隨著主題的演化,其情感類別與情感強(qiáng)度均發(fā)生了明顯的變化,情感遷移指數(shù)變化幅度較大,最高達(dá)到16.3%。

        以話題遷移指數(shù)與情感遷移指數(shù)為基礎(chǔ)(表9和表11),計(jì)算該事件的彈幕遷移指數(shù),其中參數(shù)δ1,δ2分別0.55,0.45,結(jié)果如表12所示。由表12可知,該窗口內(nèi),彈幕遷移指數(shù)整體變動(dòng)幅度較大,如從序號(hào)3到4時(shí),彈幕遷移指數(shù)由-5.4%迅速下降到-23.9%,經(jīng)分析發(fā)現(xiàn),該階段事件主題由尋找章瑩穎轉(zhuǎn)變成警方確定嫌疑人,以及嫌疑人背景介紹,情感遷移指數(shù)也急劇下降到-56.3%,輿情轉(zhuǎn)為高強(qiáng)度負(fù)向情感,此時(shí)應(yīng)及時(shí)提供情緒疏導(dǎo)機(jī)制,避免輿情演化成網(wǎng)絡(luò)暴力。

        表11 情感遷移指數(shù)

        表12 彈幕遷移指數(shù)

        4.4模型驗(yàn)證為了驗(yàn)證彈幕遷移指數(shù)監(jiān)控網(wǎng)絡(luò)輿情事件的可行性,本文以圖3“章瑩穎案”百度熱度指數(shù)曲線為對(duì)照,通過繪制其關(guān)鍵時(shí)間節(jié)點(diǎn)的熱度指數(shù)曲線,與視頻彈幕指數(shù)變化曲線進(jìn)行對(duì)比分析,結(jié)果如圖6所示。此外,為了探討視頻彈幕指數(shù)變化的誘因,在相同時(shí)間窗口內(nèi)繪制情感遷移指數(shù)與話題遷移指數(shù)的演化曲線,結(jié)果如圖7所示。

        圖6 “章瑩穎事件”百度熱度指數(shù)與視頻彈幕指數(shù)曲線對(duì)比

        圖7 “章瑩穎事件”情感遷移指數(shù)與話題遷移指數(shù)曲線

        以視頻為傳播媒介的網(wǎng)絡(luò)輿情事件,伴隨著其彈幕遷移指數(shù)(BDI)的變化,逐漸演變成輿情熱點(diǎn)事件。分析圖6可知以下結(jié)論:a.百度指數(shù)與BDI整體走勢(shì)基本一致,具體表現(xiàn)在二者均出現(xiàn)了兩次較大程度的上升,BDI首次上漲時(shí)間為2017.6.19-6.25,數(shù)值迅速上升至45.1%,而百度指數(shù)也在一周之內(nèi)上升到135,748的峰值水平。BDI二次峰值出現(xiàn)在2019.7.15-7.21(數(shù)值為45.4%),以此同時(shí),百度指數(shù)達(dá)到局部峰值125,518,表明該階段輿情出現(xiàn)二次爆發(fā)。b.在事件生命周期內(nèi),BDI的變化拐點(diǎn)先于百度指數(shù),表明BDI對(duì)網(wǎng)絡(luò)熱點(diǎn)事件的輿情預(yù)警能力較強(qiáng)。

        此外,事件在衰退期與擴(kuò)散期的輿情傳播通常較平穩(wěn),此階段可能因新的事件轉(zhuǎn)折點(diǎn)而出現(xiàn)輿情危機(jī)復(fù)發(fā)。BDI能夠聯(lián)合建模情感遷移指數(shù)(SDI)與話題遷移指數(shù)(TDI),實(shí)現(xiàn)話題語義層面的情感分析。由圖6,7可知:a.當(dāng)BDI出現(xiàn)持續(xù)的負(fù)向漂移時(shí),利用SDI與TDI的演化走勢(shì)能夠進(jìn)行話題情感追蹤,此時(shí)SDI與TDI表現(xiàn)為局部的指數(shù)漂移。具體來說,若SDI發(fā)生負(fù)向漂移且TDI沒有發(fā)生顯著變化(如圖7中2017.9.9-9.10),網(wǎng)絡(luò)輿情事件在短期內(nèi)演化成網(wǎng)絡(luò)輿情危機(jī)的可能性較大,此時(shí)網(wǎng)絡(luò)監(jiān)管部門應(yīng)及時(shí)介入,控制輿情走向;若TDI發(fā)生負(fù)向漂移且SDI沒有發(fā)生顯著變化(如圖7中2017.10.2-10.8),此時(shí)需查明輿情事件的主題權(quán)重變化趨勢(shì),對(duì)于主題權(quán)重變化較大的話題內(nèi)容,其演化成新的熱點(diǎn)話題概率較高,此時(shí)需要防范復(fù)發(fā)的話題情感危機(jī)。b.SDI與TDI可能同時(shí)出現(xiàn)逆向變化,抵消BDI的變化,此時(shí)應(yīng)進(jìn)一步追蹤TDI的興趣熱度,當(dāng)其在短期內(nèi)出現(xiàn)大幅度上升時(shí),可能出現(xiàn)以下兩種情況:網(wǎng)絡(luò)熱點(diǎn)事件演變成多個(gè)子事件,興趣熱度的上升是因?yàn)榫W(wǎng)民關(guān)注的話題焦點(diǎn)數(shù)的增加;網(wǎng)絡(luò)熱點(diǎn)事件的主題權(quán)重變化不大,此時(shí)興趣熱度的上升可能是由于網(wǎng)絡(luò)暴力、網(wǎng)絡(luò)謠言等外部因素誘導(dǎo)所出現(xiàn)的“輿情失語”,此時(shí)需要進(jìn)行必要的輿情干預(yù),讓網(wǎng)絡(luò)熱點(diǎn)事件回歸其原有的演化狀態(tài)。

        基于上述實(shí)驗(yàn)結(jié)果,可以從以下方面改進(jìn)網(wǎng)絡(luò)輿情事件的在線管控能力,首先,針對(duì)網(wǎng)絡(luò)輿情的內(nèi)在演化機(jī)理,需要將網(wǎng)絡(luò)事件的主題特征與網(wǎng)民群體的情感特征相結(jié)合,充分發(fā)揮多層級(jí)網(wǎng)絡(luò)大V、視頻UP主等意見領(lǐng)袖的輿情影響力,把控輿情傳播方向。其次,結(jié)合網(wǎng)絡(luò)輿情的外在表現(xiàn)特征,分析彈幕遷移指數(shù),定位輿情演化的重要轉(zhuǎn)折點(diǎn),通過信息公開,危機(jī)研判等手段,構(gòu)建協(xié)同聯(lián)動(dòng)的輿情風(fēng)險(xiǎn)的演化機(jī)制。此外,為了有效防范網(wǎng)絡(luò)事件的輿情危機(jī)復(fù)發(fā),通過繪制輿情事件的路徑演化曲線,提高對(duì)高強(qiáng)度負(fù)面情感的預(yù)判分析能力,建立健全負(fù)面情感輿情干預(yù)機(jī)制。

        5 總 結(jié)

        本文通過對(duì)視頻彈幕進(jìn)行話題情感識(shí)別,把話題遷移指數(shù)與情感遷移指數(shù)引入網(wǎng)絡(luò)熱點(diǎn)事件的分析中,提出了一種基于彈幕遷移指數(shù)的事件監(jiān)測(cè)模型,該模型基于BTM主題模型抽取視頻彈幕的話題信息,通過構(gòu)建包含顏文字的情感詞典,實(shí)現(xiàn)視頻彈幕的情感分析,最終基于話題遷移指數(shù)與情感遷移指數(shù)實(shí)現(xiàn)彈幕遷移指數(shù)的構(gòu)建,實(shí)現(xiàn)網(wǎng)絡(luò)輿情事件的在線監(jiān)測(cè)。實(shí)驗(yàn)結(jié)果驗(yàn)證了該模型在視頻情感分析中具有良好的性能。

        猜你喜歡
        情感
        表達(dá)情感有妙招
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        被情感操縱的人有多可悲
        無情感,不設(shè)計(jì)
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        《悅讀·家》開播激發(fā)愛國(guó)愛家情感共鳴
        海峽姐妹(2019年9期)2019-10-08 07:49:00
        冰凍的情感
        青年歌聲(2019年7期)2019-07-26 08:35:00
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        情感移植
        久久久精品中文字幕麻豆发布 | 四虎影视亚洲精品| 日韩av在线不卡一区二区三区| 今井夏帆在线中文字幕| 免费大片黄国产在线观看| 少妇无码一区二区三区| 色综合久久精品中文字幕| 白色月光免费观看完整版| 久久国产成人精品av| 日韩精品无码视频一区二区蜜桃 | 老熟妻内射精品一区| 亚洲网站免费看| 色婷婷亚洲一区二区三区在线| 中文字幕在线日亚州9| 人妻少妇av无码一区二区| 欧美亚洲国产丝袜在线| 激情五月天在线观看视频| 久久久亚洲精品一区二区三区| 婷婷综合久久中文字幕蜜桃三电影| 国产精品玖玖资源站大全| 最新国产女主播在线观看| 成人性生交大片免费看96| 精品2021露脸国产偷人在视频| 日本成人在线不卡一区二区三区| 人妻少妇被猛烈进入中文字幕| 成人免费毛片aaaaaa片| 精品无码av不卡一区二区三区| 国产一区二区三区精品成人爱| 精品无码人妻夜人多侵犯18| 疯狂做受xxxx高潮欧美日本| 吃下面吃胸在线看无码| 沐浴偷拍一区二区视频| 九色九九九老阿姨| 精品无码久久久九九九AV| 亚洲激情视频在线观看a五月| 无码国产精品一区二区av| 亚洲av理论在线电影网| 久久中文字幕av第二页| 日韩午夜理论免费tv影院| 妓院一钑片免看黄大片| 亚洲美女国产精品久久久久久久久|