魏 玲,郭新朋
(哈爾濱理工大學(xué) 管理學(xué)院,哈爾濱 150000)
近年來貝葉斯理論在我國的概率統(tǒng)計領(lǐng)域中快速發(fā)展,影響著各行各業(yè)的學(xué)術(shù)研究發(fā)展步伐,基于貝葉斯公式而形成的圖形化網(wǎng)絡(luò)——貝葉斯網(wǎng)絡(luò)(Bayesian Network,BN),利用概率推理方式對一些變量信息進行處理,從而獲取概率數(shù)據(jù),不僅可以解決不確定性和不完整性的問題,還能夠通過概率來推理出相關(guān)影響因素之間的潛在關(guān)系[1]。依據(jù)經(jīng)驗推斷結(jié)合貝葉斯公式產(chǎn)生的先驗概率結(jié)果,通常情況下被視為主觀概率,而這種概率結(jié)果所產(chǎn)生的結(jié)論也具有一定的主觀色彩,在網(wǎng)絡(luò)輿論危機的識別過程中,客觀性、系統(tǒng)性等特性是必然要求,所以利用貝葉斯理論中的后驗概率進行影響因素發(fā)生質(zhì)變的概率統(tǒng)計具有客觀性,其主要特性是對先驗概率的修正,從而為網(wǎng)絡(luò)輿論風(fēng)險分析提供概率統(tǒng)計基礎(chǔ)[2]。
本文提出了基于貝葉斯后驗的網(wǎng)絡(luò)輿論三角模糊數(shù)型危機識別方法。在三角模糊數(shù)型網(wǎng)絡(luò)輿論危機識別過程中,應(yīng)用貝葉斯網(wǎng)絡(luò)的概率推理技術(shù)結(jié)合貝葉斯理論中的后驗概率確定主要網(wǎng)絡(luò)輿論危機產(chǎn)生的影響因素,利用三角模糊數(shù)描述各專家對輿論危機產(chǎn)生影響因素評分的模糊性,文獻[3]利用貝葉斯網(wǎng)絡(luò)與三角模糊數(shù)相結(jié)合,分析了故障模式屬性與危害度之間的關(guān)系,但沒有進行去模糊處理,存在結(jié)果模糊的問題。根據(jù)貝葉斯網(wǎng)絡(luò)中的概率推理及信息數(shù)據(jù)處理規(guī)則對統(tǒng)計的概率進行均值化、去模糊化與歸一化,從而確定網(wǎng)絡(luò)輿論影響因素的危險指數(shù),并對比危險等級劃分表確定各影響因素的危險等級。利用模糊綜合評價理論中的評語集給出對應(yīng)影響因素的三角模糊數(shù)評語值,對危機影響因素進行加權(quán)處理,從而確定網(wǎng)絡(luò)輿論危機發(fā)生等級。
貝葉斯網(wǎng)絡(luò)的概率推理技術(shù)最先由Pearl[4]提出,用有向無環(huán)圖(DAG)表示,能夠解決不確定性的、復(fù)雜的問題,且貝葉斯公式是該概率網(wǎng)絡(luò)的理論基礎(chǔ)[5],具體定義如下:
定義1:條件概率。假設(shè)A、B為一個隨機試驗中的兩個事件,將事件A在事件B發(fā)生的條件下的概率稱之為條件概率,表示如下:
定義2:全概率公式。若Aj,j=1,…,m,其中m表示m個互不相容的事件,且P(Aj)〉0,j=1,…,m。
定義3:貝葉斯公式。將全概率公式(2)帶入條件概率公式(1)中,即可得到貝葉斯公式:
式中,B表示隨機試驗的結(jié)果,P(Ai)為先驗概率,P(Ai|B)為后驗概率。
由貝葉斯公式可知,后驗概率公式獲得情況如下描述,假設(shè)D是訓(xùn)練對象的集合,且每個訓(xùn)練對象用n維屬性向量,基于n維屬性向量共劃分為m個類,由此得到后驗概率計算公式[6]為:
根據(jù)貝葉斯理論中的聯(lián)合概率分布可知,貝葉斯網(wǎng)絡(luò)中的每個變量(屬性)之間存在著一定的關(guān)聯(lián)性,因此可得到如下公式進行條件獨立假設(shè):
由公式(5)可知,網(wǎng)絡(luò)中的每個節(jié)點則對應(yīng)一個變量(屬性),當(dāng)P(Bi|j)P(Aj)>P(Bi|k)P(Ak),1≤k≤m,1≤j≤m,j≠i且j≠k成立時,B屬于Aj。
貝葉斯網(wǎng)絡(luò)存在兩種結(jié)構(gòu),一種是用有向無環(huán)圖進行表示的結(jié)構(gòu),其中每個節(jié)點表示一種變量(屬性),且每個變量之間的弧表示變量(屬性)之間存在的因果關(guān)系,如圖1給出簡單貝葉斯網(wǎng)絡(luò)有向無環(huán)圖結(jié)構(gòu)。另一種則是條件概率表(Conditional Probability Table,CPT),可用該表表示每個節(jié)點變量對父節(jié)點變量的所有可能性。
圖1 簡單貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)
貝葉斯網(wǎng)絡(luò)概率推理技術(shù)不僅包含將靜態(tài)和動態(tài)結(jié)合分析,有效辨析專家經(jīng)驗和問題變化情況的正向推理,還包含后驗概率統(tǒng)計得出的結(jié)構(gòu)逆向獲取信息的推理方式,找到事件發(fā)展變化的原因。由于網(wǎng)絡(luò)輿論演化過程中的影響因素之間形成的條件概率數(shù)據(jù)有所缺失,故需將獲取的專家評分的先驗概率作為研究基礎(chǔ),結(jié)合貝葉斯的概率推理技術(shù)進一步研究[7]。
(1)正向推理。正向推理是貝葉斯網(wǎng)絡(luò)概率推理技術(shù)中的因果推理,即通過對網(wǎng)絡(luò)輿論中危機風(fēng)險影響因素發(fā)生的條件概率進行統(tǒng)計,從而對網(wǎng)絡(luò)輿論危機發(fā)生進行預(yù)測。
(2)逆向推理。逆向推理在貝葉斯網(wǎng)絡(luò)概率推理中也是診斷推理,通常指對已知的危機結(jié)果,利用逆向推理進行運算,即在計算出先驗概率的情況下,得出該變量(屬性)的后驗概率。
(3)雙向推理。雙向推理則利用部分正向推理的結(jié)果,在逆向推理過程中,對導(dǎo)致危機結(jié)果的原因進行逆向推理,從而實現(xiàn)對原因與結(jié)果的解釋。
在網(wǎng)絡(luò)輿論危機產(chǎn)生過程中,每個階段都是不同的狀態(tài),通常表現(xiàn)為多階段與多影響因素。在多階段中主要包含了網(wǎng)絡(luò)輿論危機潛伏期、過渡期、爆發(fā)期,每個時期相關(guān)聯(lián)的影響因素也是不同的,例如潛伏期中有潛在輿論驅(qū)動群體、隱性利益。而網(wǎng)絡(luò)輿論危機形成的整個周期有著共同的影響因素,政府公信力降低、媒體輿論信息傳播失真、網(wǎng)民關(guān)注度偏移等。貝葉斯網(wǎng)絡(luò)的多狀態(tài)離散處理系統(tǒng)可以將不同的狀態(tài)進行關(guān)聯(lián)分析,即將每個影響因素之間的界限進行模糊化處理,從而提高分析各影響因素發(fā)生概率的準(zhǔn)確值。
1.2.1 三角模糊數(shù)定義
根據(jù)傳統(tǒng)的三角模糊數(shù)理論可知,一個三角模糊數(shù)中包含三個可能值,即較低可能值、可能值、較高可能值,按照概率分布函數(shù)確定三角模糊數(shù)的隸屬函數(shù),給定一個隨機三角模糊數(shù),且已知 0≤Al≤Am≤Au,則變量b屬于?的隸屬度公式為:
1.2.2 三角模糊數(shù)運算法則[8]
(1)加法交換律
(4)除法運算
(5)數(shù)乘運算(給定任意實數(shù)β)
式(9)中,Aj(j=l,m,u)與Bi(i=l,m,u)中至少有一個大于零;式(10)中,Bi(i=l,m,u)大于零。
三角模糊數(shù)理論應(yīng)用于網(wǎng)絡(luò)輿論危機識別過程,由于網(wǎng)絡(luò)輿論危機的表現(xiàn)極具模糊化,且依據(jù)其三個發(fā)展階段可以看出,影響輿論變質(zhì)化的因素體現(xiàn)在網(wǎng)民、事件、政府、媒體等類別,因此針對某一個公共事件的網(wǎng)絡(luò)輿論危機識別的過程中必須依照專家的經(jīng)驗進行初步判斷,才能確定貝葉斯網(wǎng)絡(luò)的危機評定的基礎(chǔ)。
由貝葉斯網(wǎng)絡(luò)的先驗概率公式與專家經(jīng)驗結(jié)合計算可得,三角模糊數(shù)均值化公式如下:
基于上述三角模糊運算法則,給定任意一個正整數(shù)η和三角模糊數(shù),則將該三角模糊數(shù)去模糊化的公式如下:
給定M位專家的評語,按照下頁表1給出的三角模糊數(shù)評語值進行如下計算,第i個變量(屬性)B的三角模糊數(shù)概率矩陣可用,其中j=1,2,…,m。三角模糊數(shù)歸一化公式如下:
在式(13)與式(14)的聯(lián)合基礎(chǔ)上進行危機等級公式處理,如式(15):
表1 變量危機程度評語及其對應(yīng)的三角模糊數(shù)[9]
網(wǎng)絡(luò)輿論在不同的網(wǎng)絡(luò)平臺中已經(jīng)成為了人們進行及時獲取、交流與傳遞信息的一種方式。本文主要以2016年上半年發(fā)生的重大醫(yī)療事故事件——“魏則西事件”作為依據(jù)進行分析。該事件發(fā)生后不僅引起了政府對醫(yī)療的關(guān)注,還引起了一場網(wǎng)絡(luò)輿論浪潮,針對醫(yī)療機構(gòu)與百度搜索排名相關(guān)討論大幅度增加,造成的輿論導(dǎo)向群體極化現(xiàn)象也是比較嚴(yán)重的,因此對此事件應(yīng)用貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)下的三角模糊數(shù)進行網(wǎng)絡(luò)輿論危機識別是有必要的。
研究過程中向?qū)<胰后w征求意見,按照專家經(jīng)驗總結(jié)分析,并對收集回來的問卷進行模糊化處理,得到具體的評估值,應(yīng)用于貝葉斯網(wǎng)絡(luò)后驗概率的計算和三角模糊數(shù)的確定。問卷獲取來源的各個專家群體主要包含醫(yī)學(xué)領(lǐng)域的各大高校教授、互聯(lián)網(wǎng)競價排名領(lǐng)域的專家、高校科研管理部門主管以及政府相關(guān)處理部門的領(lǐng)導(dǎo)的意見,共發(fā)放了150份,回收有效問卷數(shù)量為138份。具體的危機識別過程如下:
貝葉斯網(wǎng)絡(luò)的構(gòu)建過程中首先需要確定網(wǎng)絡(luò)中的根節(jié)點和葉節(jié)點,其次是確定連接變量之間的有向關(guān)聯(lián)弧,因此通過對專家進行調(diào)查訪問得到表2的網(wǎng)絡(luò)輿論中主要影響因素及類別,并給出如圖2所示的網(wǎng)絡(luò)結(jié)構(gòu)圖。
從圖2中可以看出,貝葉斯網(wǎng)絡(luò)中有5個根節(jié)點,其余均為葉節(jié)點,且其中包含4個類別節(jié)點。其中根節(jié)點集合為{b1,b2,b6,b12,b14},葉節(jié)點為“網(wǎng)絡(luò)輿論”,而其余均為中間節(jié)點。
圖2 網(wǎng)絡(luò)輿論貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)
表2 網(wǎng)絡(luò)輿論貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)指標(biāo)說明
依據(jù)動態(tài)分析理論,確定模糊概率需要將同一影響因素在不同的時間段內(nèi)產(chǎn)生的不同結(jié)果進行統(tǒng)計,以每個影響因素的數(shù)值對比率作為變量后驗概率驗算基礎(chǔ)。依據(jù)式(4)確定每個變量的后驗概率,并根據(jù)專家對每個影響因素可能存在發(fā)生給出其先驗概率,應(yīng)用式(3)的條件概率進行計算。在問卷調(diào)查的專家中具有權(quán)威性的專家人數(shù)為5人,因此根據(jù)表1中給出的模糊語義值表述對問卷調(diào)查中這5位專家對影響因素的評價進行整合,給出根節(jié)點和中間節(jié)點的三角模糊數(shù)值矩陣,如下所示:
同理,根據(jù)專家對每個變量的觀點,如“還行”、“差不多”、“很可能”等模糊詞進行三角模糊處理,并利用式(12)、式(13)、式(14)對其進行操作。當(dāng)η=2時,有如下結(jié)果。
利用式(12)對每個變量的在貝葉斯網(wǎng)絡(luò)中的概率進行三角模糊數(shù)均值化處理如下頁表3所示。
按照式(13)進行去模糊化操作,實現(xiàn)將概率值精準(zhǔn)化,使其變?yōu)閷崝?shù),此時根據(jù)專家數(shù)可以確定η的取值為3,可得結(jié)果如下頁表4所示。
表3 三角模糊數(shù)均值化處理結(jié)果
表4 三角模糊數(shù)去模糊化處理結(jié)果
歸一化作為一種無量綱處理手段,不僅可以消除無關(guān)影響因素,還能進一步精確變量的概率準(zhǔn)確度,利用式(3)和式(14)對各根節(jié)點和中間節(jié)點進行處理,從而得到歸一化的處理結(jié)果,如表5所示。
表5 無量綱歸一化處理結(jié)果
當(dāng)專家數(shù)量M確定為5時,依據(jù)式(15)計算各個影響因素的危險指數(shù),計算結(jié)果如表6所示。
表6 變量危險指數(shù)
根據(jù)網(wǎng)絡(luò)輿情專家系統(tǒng)中給出的危險級別的劃分,如表7所示,可以將上述變量進行危險定級。
表7 危險級別劃分
根據(jù)式(6)的隸屬度公式對均值化后的三角模糊數(shù)進行操作,確定每個變量屬于哪一具體類別,為網(wǎng)絡(luò)輿論危機等級確定的結(jié)果提供類別劃分依據(jù),使得分析的結(jié)果更具有簡單性。
例如,計算變量b1~b5的隸屬度,確定其是否屬于圖1給出的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)中的類別,計算結(jié)果如表8所示。
表8 變量b1~b5隸屬度
當(dāng)隸屬度值大于零時才能說明該變量屬于對應(yīng)的類別,具有的風(fēng)險類型接近于實際情況,而隸屬度值等于零則表明該變量有非常大的可能不屬于該類別,或說與該類別的貼近度較低,因此一定程度上加大了該變量轉(zhuǎn)化成危機因素的風(fēng)險,即在原有風(fēng)險等級上增加10%的可能度[10]。
本文提出的網(wǎng)絡(luò)輿論危機識別方法,不僅可以實現(xiàn)對公眾輿論的影響因素分析,還能利用貝葉斯網(wǎng)絡(luò)的概率推理技術(shù)對每個影響因素的發(fā)生概率及危險化程度進行計算,將定性變量以定量的方式進行表示,從而提高三角模糊數(shù)與貝葉斯網(wǎng)絡(luò)的有效利用率,充分地分析突發(fā)事件的網(wǎng)絡(luò)輿論演化成危機的主體影響因素。為了進一步提高網(wǎng)絡(luò)危機識別速度,在未來的學(xué)術(shù)研究工作中將應(yīng)用分布式處理方式與快速檢索算法聯(lián)合處理,彌補本文在危機識別速度上存在的局限性。
參考文獻:
[1]Jensen F V,Nielsen T D.Bayesian Networks and Decision Graphs[J].Springer Berlin,2015,50(3).
[2]相麗玲,王晴.信息公開背景下網(wǎng)絡(luò)輿情危機演化特征及治理機制研究[J].情報科學(xué),2014,(4).
[3]翟勝,師五喜,修春波.基于模糊貝葉斯網(wǎng)的危害性分析方法[J].計算機應(yīng)用,2014,34(12).
[4]胡玉勝,涂序彥,崔曉瑜等.基于貝葉斯網(wǎng)絡(luò)的不確定性知識的推理方法[J].計算機集成制造系統(tǒng),2001,7(12).
[5]岳超源.決策理論與方法[M].北京:科學(xué)出版社,2003.
[6]馬賓,殷立峰.一種基于Hadoop平臺的并行樸素貝葉斯網(wǎng)絡(luò)輿情快速分類算法[J].現(xiàn)代圖書情報技術(shù),2015,(2).
[7]韓磊,吳樹芳,王子賢.貝葉斯網(wǎng)絡(luò)[J].電腦知識與技術(shù),2009,5(21).
[8]江文奇.基于FVIKOR的三角模糊數(shù)型多準(zhǔn)則決策方法[J].控制與決策,2016,31(7).
[9]王君,樊治平.知識管理者能力的一種模糊多指標(biāo)評價方法[J].系統(tǒng)管理學(xué)報,2003,12(3).
[10]黃智力,羅鍵.三角模糊數(shù)型不確定多指標(biāo)決策的可能度關(guān)系法[J].控制與決策,2015,30(8).