趙 越,茹婷婷
(吉林建筑工程學(xué)院 a.計(jì)算機(jī)科學(xué)與工程學(xué)院;b.基礎(chǔ)科學(xué)部,長春 130118)
貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法新探
趙 越a,茹婷婷b
(吉林建筑工程學(xué)院 a.計(jì)算機(jī)科學(xué)與工程學(xué)院;b.基礎(chǔ)科學(xué)部,長春 130118)
從大型數(shù)據(jù)庫中學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)一直是貝葉斯網(wǎng)絡(luò)學(xué)習(xí)的研究熱點(diǎn).針對(duì)此問題提出了一種基于預(yù)測能力的學(xué)習(xí)算法,通過預(yù)測能力建立并調(diào)整貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),把變量之間弧的存在性與方向有機(jī)地結(jié)合在一起。
貝葉斯網(wǎng)絡(luò);結(jié)構(gòu)學(xué)習(xí);預(yù)測能力
0引言
貝葉斯網(wǎng)絡(luò)是近幾年發(fā)展起來的處理不確定信息和進(jìn)行概率推理最有力的工具,是一種對(duì)概率關(guān)系的有向圖解描述。它結(jié)合了數(shù)據(jù)信息和真實(shí)世界的信息(先驗(yàn)信息),具有描述事件多態(tài)性和信號(hào)邏輯關(guān)系非確定性的能力。貝葉斯網(wǎng)絡(luò)使用概率理論來描述不同信號(hào)之間的條件相關(guān)性,運(yùn)用貝葉斯定理計(jì)算出后驗(yàn)概率,并可應(yīng)用于有條件地依賴多種控制因素的決策,它已成為人工智能領(lǐng)域處理不確定性問題的主要方法。
貝葉斯網(wǎng)絡(luò)學(xué)習(xí)主要包括參數(shù)學(xué)習(xí)和結(jié)構(gòu)學(xué)習(xí)兩部分內(nèi)容。結(jié)構(gòu)學(xué)習(xí)比參數(shù)學(xué)習(xí)要難得多,實(shí)際中由專家給出貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)是費(fèi)時(shí)、費(fèi)力的,在很多情況下甚至是不可能的,因此貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法是一項(xiàng)有益的研究。
貝葉斯網(wǎng)絡(luò)數(shù)學(xué)描述為:給定一個(gè)有向無環(huán)圖G和一個(gè)在離散變量集合V={v1,v2,…,vn}上的聯(lián)合概率分布P,如果在V中的變量和G節(jié)點(diǎn)之間存在一一對(duì)應(yīng)關(guān)系,并滿足P(v1,v2,…,vn)=∏ip(vi|pai)。其中,Pai是G中Vi的直接祖先節(jié)點(diǎn),將圖G和概率P的聯(lián)合稱為貝葉斯網(wǎng)絡(luò),要求P(v1,v2,…,vi|ζ)= ∏ip(vi|v1,v2,…vi-1,ζ),且各變量需滿足馬爾科夫獨(dú)立性條件 P(vi|v1,v2,…,vi-1,ζ)=p(vi|pa(vi),ζ)[1-2]。
在數(shù)據(jù)完備情況下,結(jié)構(gòu)學(xué)習(xí)算法可以分為基于統(tǒng)計(jì)測試的方法和基于搜索記分的方法。統(tǒng)計(jì)測試尤其是指條件獨(dú)立性測試;搜索記分的方法是選定一個(gè)適當(dāng)?shù)挠浄趾瘮?shù),通過不斷地改變網(wǎng)絡(luò)結(jié)構(gòu)計(jì)算出相應(yīng)的記分值,結(jié)合一些優(yōu)化算法在結(jié)構(gòu)空間進(jìn)行啟發(fā)搜索,直至搜索到的結(jié)構(gòu)具有最高記分為止[3]。由于貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)是一個(gè)組合空間,找到一個(gè)最高記分的網(wǎng)絡(luò)結(jié)構(gòu)已證實(shí)為NP難問題,因此需要進(jìn)行啟發(fā)式搜索。
本文在對(duì)貝葉斯網(wǎng)絡(luò)的原理和學(xué)習(xí)方法等進(jìn)行介紹的基礎(chǔ)上,著重對(duì)貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)機(jī)制進(jìn)行了研究。對(duì)基于預(yù)測能力的離散貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法進(jìn)行探討。由于預(yù)測能力就是預(yù)測正確率,預(yù)測能力相同是條件獨(dú)立性的充分必要,這樣通過預(yù)測能力的引入把變量之間弧的存在性與方向有機(jī)地結(jié)合在一起,得到了良好的效果。
[1]許麗佳,黃建國,王厚軍,龍兵.混合優(yōu)化的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2009(5):634-636.
[2]胡學(xué)鋼,胡春玲.一種基于依賴分析的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法[J].模式識(shí)別與人工智能,2006(4):446-448.
[3]張什永,彭云,王曉蒲.一種改進(jìn)的貝葉斯網(wǎng)絡(luò)知識(shí)合成算法[J].中國科學(xué)技術(shù)大學(xué)學(xué)報(bào),2011(1):88-92.
[4]楊善林,胡笑旋,毛雪岷.融合知識(shí)和數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)構(gòu)造方法[J].模式識(shí)別與人工智能,2006(1):32-33.
責(zé)任編輯:吳旭云
Research on structure learning of Bayesian network
ZHAO Yuea,RU Ting-tingb
(a.School of Computer Science and Technology;b.Department of Basic Science,Jilin Institute of Architecture and Civil Engineering,Changchun 130118,China)
Learning structure from large database has been a research focus of learning Bayesian Network.A learning algorithm is presented based on prediction ability,and through which Bayesian network structure is built and adjusted.The existence and direction of arcs among variables are combined organically.
Bayesian Network;structure learning;prediction ability
TP391
A
1009-3907(2011)06-0032-03
2011-05-10
吉林省教育廳“十一五”科學(xué)技術(shù)研究項(xiàng)目(吉教科合字2010第314號(hào))
趙越(1982-),男,吉林通化人,講師,碩士,主要從事機(jī)器學(xué)習(xí)方面的研究。