亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        社交媒體平臺中健康報道標題對公眾情緒影響研究
        ——以人民日報微信公眾號為例

        2022-05-12 13:43:34張學波
        傳媒論壇 2022年3期
        關鍵詞:分詞詞典分類器

        張學波 王 卿

        當前,社交媒體平臺中表達的情緒對國內主流媒體、輿情生態(tài)和和諧社會倡導的主流文化具有重要影響作用。研究民眾的情緒可以揭示人們的生活狀態(tài)、生活訴求以及對民生健康的看法與意見,為政府擬定衛(wèi)生、健康等方面的相關政策提供實際建議。本研究致力于收集分析人民日報微信客戶端健康專欄的標題情緒,可有效獲知公眾對于這些健康議題信息的需求情況,挖掘出受眾對哪些健康議題關切,有利于為人民日報微信公眾號或者是其他健康類微信公眾號提供議題方面的借鑒。也有利于滿足公眾對健康報道、醫(yī)療衛(wèi)生信息的需求,消除有關健康問題公開的不確定性,提高公眾的安全和滿足感,有助于豐富大眾傳媒對健康傳播的報道、受眾和效果方面的研究,有助于重新審視媒體對于公眾情緒的影響。

        一、問題緣起及文獻綜述

        情緒表現(xiàn)為對外部刺激的各種心理和生理反應,例如恐慌,興奮和憤怒。情感分析是通過編寫代碼自動確定文本中包含的情緒狀態(tài),對于掌握公眾的輿情狀態(tài)和人們的訴求的實際意義十分關鍵。

        在此方面,國外相關的研究起步較早,范圍較廣泛,它主要涉及初步的情感傾向分析、更進一步的文本提取和多種情感的分類、情感分析相關的字典和語料庫建設等,其中情緒詞典和語料庫構建是基礎。情感詞典和機器學習是文本情感分析的兩種主要的操作方法。最早出現(xiàn)的是基于情緒詞典的方法,主要是指在已經(jīng)經(jīng)過人工構建的情緒詞典的基礎上,利用詞典中每個詞語的情緒標簽對待分類文本的情緒類別進行標注。Paltoglou(2012)以LIWC情緒詞典做參照,扒取了推特、我的空間和Digg等網(wǎng)絡平臺的文本,制訂出了一系列的計算規(guī)則來處理句子中的情緒詞,當情緒詞被不同的詞修飾時或者情緒詞本身的樣式發(fā)生變化時,那么相應的計算規(guī)則也會發(fā)生變化[1]。結果表明,他們提出的公式和規(guī)則得出的情感分析的效果皆比單純靠機器學習分析出的效果好。此種方法的效果缺點在于人工構建的情緒詞典無法完全覆蓋所研究的文本,并且當文本中出現(xiàn)的情緒詞較為隱晦時,研究者也不易標注。Mohammad(2011)通過Word Net、Affective Norms 和NRC 三個詞典,進一步設計計算規(guī)則,進行情緒分析,結果表明,相比于n-gram,情感詞庫對多個不同專業(yè)和領域的文本分析效果更佳[2]。

        國內許多文獻對微博中的微內容進行文本情感分析,對本研究內容的劃分具有重要的借鑒意義。封麗(2018)主要對微博中有關柴靜《穹頂之下》紀錄片的評論進行了情感計算,以正負中性三種對微博主體中的表情和文本情感極性計分,正向表情表示為1,負向表情表示為-1,中立向表情表示為0。她還注意到與表情、文本不同的是微博情感詞通常有“十分”“稍微”“沒有”等程度副詞,這些詞語也對情感表達具有特殊作用。最后得出對柴靜及其紀錄片存在的負面情感傾向主要有以下幾類:①純粹不安好心湊熱鬧;②只從個人好惡出發(fā),不喜歡柴靜則不認同《穹頂之下》;③從柴靜立場、經(jīng)歷等各方面對其動機進行挖掘,然后從陰謀論等方面認為柴靜紀錄片需要得到質疑;④《穹頂之下》這部紀錄片的話語表達以及拍攝所存在一些問題,這篇論文計算情感極性的方法值得本研究借鑒[3]。在文本情感分析方法剛剛興盛之時,就已有學者將其與社會網(wǎng)絡分析法相結合對霧霾輿情進行了研究,四川大學何躍、朱婷婷(2018)通過對新浪微博進行扒取以及聚類,進一步找出具有代表性的微博繪制網(wǎng)絡圖,展示出整個情感傳播網(wǎng)絡的子群、中心度等指標[4],這說明情感分析可以和社會網(wǎng)絡分析進行結合,對本研究指明了方向。

        情感詞典和機器學習是目前文本情感分析所涉及的兩種主要的方法,其中構建情感詞典的作用最為基礎。目前通過人工構建的中文情感詞典主要有譚松波酒店評論、臺灣大學情感語料庫、Hownet情感詞袋、BoSon語義情感詞庫等。本研究采用情感詞典的方法進行分析,主要借鑒BoSon語義情感詞庫和Hownet情感詞袋,目的是分析人民日報微信公眾號健康專欄的總體情感傾向,計算出標題和評論的情緒值,并探討標題情緒值、評論情緒值、點贊量以及評論量兩兩間的數(shù)據(jù)關系。

        二、文本分詞及情感詞典選用構建

        本研究選用Python3.6環(huán)境,統(tǒng)一使用“utf-8”格式編碼?!胺衷~”即將一個整句按照詞性分成不同的部分,要想進行自然語言處理,就必須得使用較為精確的分詞工具對文本中的語句進行切割。目前學界也出現(xiàn)了一些比較成功的有效分詞系統(tǒng),例如庖丁分詞系統(tǒng)、ICTCLAS中文分詞系統(tǒng)以及基于HMM模型的結巴分詞系統(tǒng)等等,本研究使用結巴中文分詞系統(tǒng)。情感詞典方面,國內已存在著一些具有針對性的情感詞典,例如臺灣大學語料庫、HowNet語料庫、BoSon語義情感詞典等。由于波森情感詞典主要在Twitter、微博、微信等社交媒體品平臺的基礎上爬取其文本,整合出詞典。故本研究以波森情感語料庫為主體,HowNet及其余詞典為輔,構建出本研究所采用的情感詞典。

        三、混淆矩陣構建及分類器驗證

        本研究數(shù)據(jù)來自2018年4月至12月的人民日報微信公眾號“健康”專欄的標題以及評論,經(jīng)清洗后得到標題共822條,評論共8843條。為測試實驗結果的準確率,選用4名志愿者對標題以及評論進行正面和負面傾向的人工標注。經(jīng)人工標注后,標題共359條為積極情感傾向,463條為消極情感傾向;評論共4907條為積極情感傾向,3936條為消極情感傾向。而機器標注結果為:標題共390條為積極情感傾向,432條為消極情感傾向;評論共4936條為積極情感傾向,3907條為消極情感傾向。標注后統(tǒng)計結果如下:

        表1 機器標注與人工標注對比表

        對情感計算結果的評估即是指對自然語言處理的結果進行評估,是計算過程中非常重要的一環(huán)。學界在近幾年評估自然語言處理的結果時,通常以召回率(R)、精確率(P)、準確度(A)以及F-measure值(綜合評估指標)作為評估指標,而這三項指標的計算往往是以人工標注的結果為參照[5]。

        準確度(A)是指分類器情感分類的準確度,是正確分類的樣本數(shù)除以樣本總數(shù),分類效果和準確度成正比。準確率(P),也稱為“查準率”,是指分類器的情緒分類的準確性,分類器正確分類的樣本的數(shù)量與所有正確樣本總量的比率。召回率(R)是指被分類器分類過的數(shù)量可以涵蓋到多少原本的分類數(shù)量。F-measure值是綜合評價指標,是指當P和R指標出現(xiàn)矛盾情況時,綜合兩者而得出的指標。在計算四個指標之前,首先要構建混淆矩陣?;煜仃嚢膫€數(shù)值:True Positive (TP)—將正面情感傾向句判斷為正面情感傾向句;True Negative(TN)—將負面情感傾向句判斷為負面情感傾向句;False Positive(FP)—將負面情感傾向句判斷為正面情感傾向句;False Negative (FN)—將正面情感傾向句判斷為負面情感傾向句。筆者假定人工參照結果全部正確,以人工標注為參照,分別對標題和評論分類的正確以及錯誤數(shù)目進行統(tǒng)計并構建混淆矩陣:

        表2 標題混淆矩陣

        表3 評論混淆矩陣

        根據(jù)準確率(A)計算公式:

        精確率(P)計算公式:Ppositive=

        召回率(R)計算公式:

        以及F-measure計算公式:

        其中λ是一個可以自行設定的系數(shù),當λ大于1時,精確率對F-measure值影響較大,當λ小于1時,召回率對Fmeasure值影響較大;當λ等于1時,二者對F-measure值具有同樣影響。在本研究中,取λ等于1,則此時F-measure值為F1值。F1值越大,則分類器越好。公式為:

        由表4,可得出結論:分類器在分析評論時較分析標題時更為準確,尤其是在分析正面情感評論時的精確率比分析正面情感標題的精確率高出9.5個百分點,究其原因,是二者表達方式不同。評論大多為短句,分析較為簡便,而標題糅合懸疑、設問、反問、感嘆等多種表達方式,不易把握其情感傾向,反觀評論,其正面情感表達方式大多比較單一,多數(shù)為“感謝小編”“感謝科普”“實用,收藏”云云。綜觀各項數(shù)據(jù),該分類器性能良好,分類較為準確,分類結果較為可信。

        表4 情緒值分類器各項評估指標

        四、假設檢驗

        (一)相關分析

        相關分析是指分析兩個或多個具有相關性的元素或變量之間的關系,以探討二者的密切相關程度。本研究將標題情緒值與評論情緒均值、點贊量以及評論量進行相關分析,以探求其中的顯著性。

        表5 相關分析結果表

        由上表可以看到,標題情緒值與評論情緒均值之間的相關系數(shù)為0.322,呈現(xiàn)為中等相關,P值接近于零,表明相關性在0.01層上顯著。而在標題情緒值與點贊量之間,雖然P值等于0.003,表明相關性是顯著的,但二者皮爾森相關系數(shù)僅為0.102,呈現(xiàn)為弱相關關系。此外,標題情緒值與文章評論量之間無顯著相關關系。

        (二)回歸分析

        由相關分析可知,標題情緒值與評論情緒均值之間的相關關系具有顯著性,故探討二者是否存在顯著的線性回歸方程具備一定的研究意義。本研究采用的是一元線性回歸分析,經(jīng)由SPSS分析之后,結果如下表。

        表6 Anova表

        由Anova表可看到,模型F統(tǒng)計量為94.846,表明顯著性水平的p值接近為零,說明因變量與自變量的線性關系明顯。

        表7給出了回歸標準系數(shù)以及顯著性檢驗的P值,可以看到回歸系數(shù)為0.322,P值接近于零,故模型達到了顯著性水平。由共線性診斷表,可看到特征值VIF不為零,說明不存在多重共線性現(xiàn)象。

        表7 系數(shù)表

        五、研究結論:

        (一)社交媒體平臺中健康報道的標題呈現(xiàn)通俗化、情感化趨勢

        微信是一種即時性社交媒體平臺,由于其具有的及時傳遞、隱秘性的特點,被許多親朋好友所青睞,本研究在對表達情緒傾向的詞語進行分析時發(fā)現(xiàn),恐嚇詞、人稱詞以及數(shù)詞的使用占比較多。其中例如“后果很嚴重”這類恐嚇詞的使用,會讓人們不得不聯(lián)想到自己的身體狀況,產(chǎn)生杞人憂天的恐懼心理,從而利用此種心理轉發(fā)文章,吸引人們的注意力;第一人稱、第二人稱這種人稱詞的使用頻率增多,將會凸顯出標題內容的口語化、親民性,從而消除文章與讀者的隔閡,更利于情感的傳遞;而例如“萬萬”“千萬”這種數(shù)詞的使用也夸張了原本標題的表達情感,凸顯出一種驚慌之意。總體上說,通過對標題中各類詞語使用情況的內容分析,可以得出人民日報微信公眾號標題呈現(xiàn)通俗化、情感化趨勢這一結論。

        (二)社交媒體平臺中健康報道的標題中蘊含的情感會顯著地轉移至評論者

        本研究通過文本情感分析的方法,主要以波森語義情感詞典和Hownet語料庫為基礎,構建情感詞典庫。以Python3.6為編程環(huán)境,jieba分詞為分詞工具包,編寫分類器,計算出2018年月到12月人民日報微信公眾號健康專欄的標題及其相對應評論的情緒值。進一步構建混淆矩陣,經(jīng)過實驗的評估,該分類器達到的最高準確率為86.9%,平均準確率為85.05%,最高召回率為88.2%,平均召回率為85.05%,分類效果較好。此處分類器的分類結果表明計算所得的情緒值較為可信,可為下一步探討標題情緒值和評論情緒值之間的關系奠定堅實基礎。

        隨后,將標題情緒值和評論情緒均值做假設檢驗,探討二者的相關性,結果表明,二者具有顯著的相關性,并進一步探討其中的因果關系,可初步得出結論:在人民日報健康專欄中,文章標題情緒可影響文章評論情緒,并且新聞標題蘊含的情緒越強烈,評論所蘊含的情緒也越強烈,二者成正相關關系。議程設置理論的第一層是指新聞事件由編輯部轉移到公眾之中,第二層是新聞事件的屬性轉移到公眾中,通過對標題情緒值和評論情緒值之間關系的假設檢驗,可以創(chuàng)新性地驗證“屬性議程設置”理論。

        猜你喜歡
        分詞詞典分類器
        米沃什詞典
        文苑(2019年24期)2020-01-06 12:06:50
        結巴分詞在詞云中的應用
        智富時代(2019年6期)2019-07-24 10:33:16
        BP-GA光照分類器在車道線識別中的應用
        電子測試(2018年1期)2018-04-18 11:52:35
        評《現(xiàn)代漢語詞典》(第6版)
        詞典例證翻譯標準探索
        值得重視的分詞的特殊用法
        加權空-譜與最近鄰分類器相結合的高光譜圖像分類
        結合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
        基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
        高考分詞作狀語考點歸納與疑難解析
        亚洲色无码国产精品网站可下载| 久青草影院在线观看国产| 一区二区精品国产亚洲| 成人丝袜激情一区二区| 免费黄色影片| 在线观看免费人成视频色9| 欧美性群另类交| 国产精品玖玖玖在线资源| 尤物视频在线观看| 日韩av无码成人无码免费| 亚洲va欧美va| 国产精品自线在线播放| 日本在线视频二区一区| 五月婷婷开心五月播五月| 综合色免费在线精品视频| 国产三级在线观看完整版| 亚洲第一页综合图片自拍| 欧美不卡视频一区发布| 热久久久久久久| 一级一片内射在线播放| 日本中文一区二区在线观看| 欧美猛少妇色xxxxx猛交| 精品人妻少妇一区二区三区不卡| 无码一区久久久久久久绯色AV| 日韩久久免费精品视频| 国产亚洲专区一区二区| 一本大道道久久综合av| 亚洲av无码xxx麻豆艾秋| 亚洲无码精品免费片| 人妻无码AⅤ不卡中文字幕| 日本高清不卡一区二区三区| 国产激情一区二区三区不卡av | 日日爽日日操| 青青青视频手机在线观看| 国产亚洲91精品色在线| 久久精品国产亚洲av无码偷窥| 精品亚洲一区二区三区在线观看 | 中文字幕亚洲精品码专区| 国产一区二区白浆在线观看| 中国一级黄色片久久久| 亚洲av永久无码天堂网毛片|