亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于模糊推理的微博新冠輿情分析

        2021-09-24 06:12:18孫凱強王樂豪
        科技與創(chuàng)新 2021年18期
        關鍵詞:模糊集關注度輿情

        管 健,孫凱強,王樂豪

        (南京信息工程大學自動化學院,江蘇 南京210044)

        1 引言

        據CNNIC最新發(fā)布的《第45次中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告》統(tǒng)計[1],中國網民規(guī)模為9.04億,網絡輿情是以網民為主體,以互聯(lián)網為平臺,所產生的具有一定影響力的表現(xiàn)。2020年,新冠疫情對中國造成巨大的損失,網絡成為民眾接收信息的主要方式,疫情期間發(fā)生的事件在龐大的網絡群體中產生了巨大的輿論,帶來的影響不可小覷。負面的新冠輿情會引導民眾走入歧途,導致一些極端的事件發(fā)生,也會對社會和經濟造成不小的威脅。筆者從事新冠疫情研究與預測方向,新冠輿情是研究的重點,所以設計了有效的方法實現(xiàn)對新冠輿情事件預警等級的快速評價,及時地作出預警,制定出有效的應對策略非常重要。本文基于模糊推理方法,以微博為平臺,通過對新冠輿情事件的分析,快速并準確地對新冠輿情事件作出預警等級的評價,可以準確并且迅速地輔助引導新冠輿論方向,從而使得負面的新冠輿論對社會和經濟等造成的損失最小化。

        2 新冠微博輿情指標的構建

        網絡輿情的研究一直是輿情研究的熱點,目前網絡輿情研究主要是指標的建立和模型的建立。指標的建立途徑如下:①從輿情整體出發(fā),對指標進行篩選;②從輿情事件的性質出發(fā),比如突發(fā)性事件等,確定特定的指標;③從不同的媒體平臺出發(fā),比如新聞、微博、論壇等;④從不同的主體出發(fā),比如國家、高校等多角度來建立[2-3]。對于指標權重的確立,本文運用熵權法確定指標權重,從而構建模型,建立預警等級,實現(xiàn)對微博上新冠事件的監(jiān)測和預警,最后根據案例的分析使得所提出的方法具有有效性和科學性。

        本文針對輿情預警的基準,以微博為平臺,從新冠本身出發(fā)。新冠期間,發(fā)生的輿論事件本身對社會造成的影響程度,構造危機評估體系。微博是輿論爆發(fā)極為明顯的一個平臺,匯聚了各個明星、媒體、知名博主等許多可以推動輿論發(fā)展的載體,但明星與知名博主本身由于情感的摻雜,存在復雜的情況。相對來說熱門微博帶有準確的信息表達能力,對于輿論的發(fā)展主題強調明確,相對客觀,所以有更多民眾參與討論,表達觀點。

        通過明確指標的設計規(guī)則,構造事件關注度、事件傳播速度、民眾情感傾向、民眾參與程度、累計點贊率和累計轉發(fā)率6個輿情二級指標,如圖1所示。

        圖1 輿情指標

        2.1 事件重要程度

        事件發(fā)生后,事件的關注度與傳播速度是從事件本身出發(fā),給社會造成的影響直接展示了事件的影響程度。事件關注度是事件發(fā)生日到微博當天發(fā)帖量最高的日期的天數(shù),天數(shù)越多代表影響程度越高。關注度的表達式為:

        式(1)中:S1為關注度;d1-d2為發(fā)帖量最高的日期與事件發(fā)生日期間隔天數(shù)。

        事件傳播速度表達式為:

        式(2)中:S2為傳播速度;S(t1)為截至6月份總發(fā)帖數(shù);t1為事件發(fā)生天數(shù)。

        2.2 民眾關注度

        微博上民眾對輿論事件關注度直接反映為參與評論的人數(shù)以及對事件的評論的情感傾向。本文中,針對4個事件運用scrapy框架爬蟲,從微博上爬取了截至6月份為止所有的微博博文和評論,爬取評論近80萬條。通過自然語言處理包HanLP對數(shù)據進行清洗,去除停用詞、表情、符號等,篩選評論近64萬條,采用重復二分法對數(shù)據進行訓練,訓練正向與反向情感的微博語料庫各2萬條用作測試集,對每條評論進行情感分類。民眾的負面情感越多,輿論的社會影響也隨之越深,表達式為:

        式(3)中:S3為負面情感比例;?為有效的負面情感數(shù)量;ρ為有效的正面情感數(shù)量。

        民眾關注度最直接的體現(xiàn)為民眾參與話題討論的程度,對6月份之前所有的相關微博的評論數(shù)量S4進行統(tǒng)計,直接反映了民眾的關注度。

        2.3 事件發(fā)展態(tài)勢

        事件的持續(xù)發(fā)展是輿論的持續(xù)的表現(xiàn),事件的累計點贊與轉發(fā)尤為體現(xiàn),累計點贊率與累計轉發(fā)率表達式為:

        式(4)(5)中:S(t2)為截至6月份總點贊數(shù);t2為事件持續(xù)傳播天數(shù);S(t3)為截至6月份總點贊數(shù);t3為事件持續(xù)傳播天數(shù)。

        3 基于模糊推理的微博新冠輿情分析模型建立

        3.1 推理的基本流程

        對微博新冠輿情的分析,首先建立合適的指標來描述分析對象。然后建立隸屬度函數(shù)據進行模糊化。利用給定的規(guī)則進行推理,將模糊數(shù)據合成出模糊推理值。最后對模糊推理值進行解模糊處理。主要分為5個流程,如圖2所示。

        圖2 模糊推理基本流程圖

        3.2 指標權重的確立

        本文采用基于模糊熵權法來確定指標權重,相較于目前針對多屬性權重確定方法,比如層次分析法(AHP)、德爾菲法等方法,采用熵權法擁有更多的客觀性,降低了主觀帶來的誤差[4-5]。

        得出屬性權重ω=(ω1,ω2,…,ωn)T。

        3.3 輿情分析指標模糊隸屬度

        模糊子集由其隸屬函數(shù)定義,對給定的論域U,U中的任一元素u,都有一個數(shù)μA(u)∈[0,1]與之對應,則稱A為U上的模糊集,μA(u)稱為A對U的隸屬度。

        首先對輿情分析中的一級指標進行模糊化,建立事件重要程度模糊集、民眾關注度模糊集、事件發(fā)展態(tài)勢模糊集三個一級指標通過模糊綜合評判的方式獲得其隸屬度。

        3.3.1 事件重要程度

        事件重要程度主要是由事件的影響程度以及事件的傳播速度融合來獲取的,利用模糊綜合加權平均作為該指標的隸屬度,權值為ω1、ω2。取事件重要度論域為A=[0,1],x1∈[0,1]為歸一化的影響程度,x2∈[0,1]為歸一化的傳播速度,則將重要程度的評價程度模糊子集分為A1={重要},A2={不重要}。為了更好地表示指標的特性與隸屬關系,本文選用平滑的Gauss型隸屬函數(shù)。事件的重要程度評價模糊隸屬函數(shù)為:

        式(7)(8)中:σ為寬度,根據實際情況取值為0.141 4。

        3.3.2 民眾關注度

        民眾關注度主要由民眾情感傾向與民眾參與程度融合獲取的,權值為ω3、ω4。取民眾關注度論域為B=[0,1],x3∈[0,1]為歸一化的情感傾向,x4∈[0,1]為歸一化的關注度,則將關注度評價程度模糊子集分為B1={高},B2={低}。則民眾關注度評價程度的模糊隸屬函數(shù)為:

        式(9)(10)中:σ為寬度,根據實際情況取值為0.141 4。

        3.3.3 事件發(fā)展態(tài)勢

        事件發(fā)展態(tài)勢由累計點贊率與累計轉發(fā)率融合來獲取的,權值為ω5、ω6。取事件發(fā)展態(tài)勢論域為C=[0,1],x5∈[0,1]為歸一化的點贊率,x6∈[0,1]為歸一化的轉發(fā)率,則將事件發(fā)展態(tài)勢評價程度模糊子集表示為C1={嚴重},C2={不嚴重}。則事件發(fā)展態(tài)勢評價程度模糊隸屬函數(shù)為:

        式(11)(12)中:σ為寬度,根據實際情況取值為0.141 4。

        為了提升算法的精度,將指標數(shù)據進行歸一化處理,本文采用L2范數(shù)歸一化,具體步驟如下:

        對一組向量X=[x1,x2,x3,…,xn],其L2范數(shù)定義為,則歸一化表達式為:

        3.4 計算微博輿情預警等級模糊隸屬度

        將輿情預警等級論域Z=[0,1],取模糊子集為Z1={輕級},Z2={中級},Z3={重級},Z4={特重級}。模糊隸屬度函數(shù)依舊選取Gauss型隸屬函數(shù)表達式為:

        式(14)(15)中:σ為寬度,根據實際情況取值為0.07。

        3.5 模糊推理規(guī)則

        對輿情事件等級進行評估時,每個一級指標下的二級指標經過計算得到的模糊評判值,基于模糊推理規(guī)則,結合專家經驗,提出如下規(guī)則庫[6-7]:

        由于三個一級指標對于整體輿情等級的判定屬于串聯(lián)疊加的關系,所以用“and”或者“并且”來連接條件規(guī)則,所以本文模糊規(guī)則如下所示:

        R(k):假如a是Aia并且b是Bib并且c是Cic那么z是Zjz

        其中,i=1,2,j=1,2,3,4。輸入變量參數(shù)個數(shù)為NA=2,NB=2,NC=2,所以規(guī)則數(shù)量k=NA×NB×NC為8個,a、b、c為輸入變量,z為輸出變量,Aia、Aib、Aic為前提條件項,分別為:

        Zjz輸出變量的一個模糊子集zm(m=1,2,3,4),即,z∈Z。

        3.6 合成模糊集

        最終的輿情等級的評判是由所有指標共同完成的,每個一級指標由其所有二級指標計算而來的輿情模糊隸屬度都會對最終的等級評判產生比較大的影響,等級評判的目的是選出所有前提條件下的最優(yōu)值。所以,選取“min-max”運算合成模糊集[8]。現(xiàn)將所有的條件與規(guī)則合成模糊集:

        3.7 計算輿情等級

        需要對每個事件給出輿情等級的評估,本文利用模糊集的貼近度來將等級對應的模糊集與屬性所對應的模糊集進行分類,給定論域U上的模糊集P與Q,貼近度d(P,Q)定義為:

        采用在論域Z=[0,1]上,有Z1={輕級},Z2={中級},Z3={重級},Z4={特重級},若存在1≤j≤4,則:

        d(Z′,Zi)(i=1,2,3,4)=max{d(Z′,Zj)}(19)

        則表示該微博事件輿情與Zi等級最貼近,則將Zi作為該微博事件的輿情等級[9]。

        4 案例分析

        4.1 獲取的數(shù)據進行歸一化處理

        選取國內4個新冠期間熱門微博事件韓紅基金會、李文亮事件、武漢封城、雙黃連口服液事件。根據指標獲取的數(shù)據,進行歸一化處理。從獲取的微博數(shù)據中,例如,事件的影響程度體現(xiàn)在微博熱門發(fā)帖數(shù)從事件出現(xiàn)開始到發(fā)帖數(shù)最高的一天持續(xù)的天數(shù),持續(xù)時間如圖3所示。

        圖3 4個新冠微博輿情事件微博發(fā)帖數(shù)日變化

        表1為處理好的4個新冠微博輿情事件的數(shù)據,4個微博輿情事件日發(fā)帖數(shù)持續(xù)時間最長的是武漢封城。

        由于是國內新冠疫情最嚴重的城市,武漢一直是人們關心的熱點,所以持續(xù)時間最長為76 d。李文亮輿情事件在發(fā)生之后,在李文亮先生去世之后,微博發(fā)帖數(shù)飛速升高,2020-03-19,國家監(jiān)委發(fā)布《關于群眾反映的涉及李文亮醫(yī)生有關情況調查的通報》,日熱門微博數(shù)達到最高,日熱門微博數(shù)189個,日熱門點贊數(shù)達到2 278 339個,之后微博日發(fā)帖數(shù)小有波折,但一直處于下降趨勢,06-14,日熱門微博數(shù)有突然增長趨勢,因為李文亮先生孩子出世,但并沒有超過頂峰,所以持續(xù)時間為48 d。韓紅基金會事件,在司馬三忌發(fā)帖針對韓紅基金會開始,日發(fā)帖數(shù)迅速長高,但由于民眾大多不相信,且政府官方及時澄清,所以微博影響程度不高,為7 d。雙黃連口服液事件從提出開始,立即有專家出來澄清,所以在微博上信息接收及時,該事件沒有得到較好的發(fā)酵,影響程度不高,2 d之后,日熱門微博數(shù)達到最高。

        通過公式(13)對指標數(shù)據進行歸一化處理,得到具體數(shù)據如表1所示。

        表1 新冠微博輿情事件的歸一化數(shù)據

        4.2 計算指標權重

        根據指標以及指標數(shù)據等各種輿情事件信息,邀請了同專業(yè)不同年級30名同學分別對二級指標對該指標的一級指標的影響程度作出評價,綜合評價結果如表2所示。

        表2 模糊評價表

        通過公式(13)給出的權重計算方法,得出所有事件重要度、民眾關注度、事件發(fā)展態(tài)勢的評價權重為ω1=[0.749 3,0.250 7]T,ω2=[0.669 2,0.330 8]T,ω3=[0.768 1,0.231 9]T。

        4.3 計算輿情等級

        根據3.5的推理規(guī)則中,每一條規(guī)則Rk都對應一個單值輸出,本文共8個規(guī)則,結合公式(7)~(12)計算模糊隸屬度,根據公式(16)(17)合成出最優(yōu)的模糊集,根據公式(18)(19)與公式(14)(15)計算4個輿情等級貼近度,每個事件利用計算貼近度的方式,計算結果如表3所示。

        表3 各事件的輿情等級評判

        5 結語

        網絡信息化條件越加豐富化的今天,網絡輿情分析及預警是目前一項重要的工程,需要多個因素指標共同研究,輿論的防控工作才會更能成為一個整體,輿情分析和預警工作是相關部門提高處理輿論的能力的重要基礎。基于模糊推理的微博新冠輿情分析模型對指標的研究有非常大的優(yōu)勢,理解起來很容易,具有比較高的價值。

        猜你喜歡
        模糊集關注度輿情
        基于上下截集的粗糙模糊集的運算性質
        雄安新區(qū)媒體關注度
        全國兩會媒體關注度
        暴力老媽
        E-不變凸模糊集
        輿情
        中國民政(2016年16期)2016-09-19 02:16:48
        輿情
        中國民政(2016年10期)2016-06-05 09:04:16
        輿情
        中國民政(2016年24期)2016-02-11 03:34:38
        “王者”泛海發(fā)布會聚焦百萬關注度
        國際公關(2015年10期)2015-12-17 01:09:58
        E-廣義凸直覺模糊集①
        亚洲国产美女精品久久| 久久人人爽av亚洲精品| 韩日午夜在线资源一区二区| 亚洲熟妇色xxxxx欧美老妇y| 麻豆人妻无码性色AV专区| 亚洲免费在线视频播放| 日韩人妻少妇一区二区三区| 天天综合亚洲色在线精品| 国产老妇伦国产熟女老妇高清| 国产免费资源高清小视频在线观看 | 亚洲一区二区三区小说| 亚洲av无码专区电影在线观看| 国产精品久久久久久2021| 亚洲中文字幕日本日韩| 国产亚洲成性色av人片在线观| 2021久久精品国产99国产精品| 国产精品无码片在线观看| 久久综合久中文字幕青草| 亚洲 欧美 偷自乱 图片| 国产熟人av一二三区| 无码一区二区三区不卡AV| 有码视频一区二区三区| 亚洲熟妇丰满多毛xxxx| 99re久久精品国产| 不打码在线观看一区二区三区视频| 国产精品国产三级国产专区不| 国产99在线 | 亚洲| 欧美日韩国产专区| 日本一区二区高清视频| 尹人香蕉久久99天天拍| 亚洲成av人片在线观看无码| 囯产精品无码一区二区三区AV| 久久精品国产亚洲av天美| 无码视频在线观看| 九九99久久精品在免费线18| 中文字幕一区二区三区四区久久| 国产av无码专区亚洲av麻豆| 人妻少妇被猛烈进入中文字幕| 97av在线播放| 狠狠爱婷婷网五月天久久| 性色做爰片在线观看ww|