摘要: 在模式識別中,貝葉斯決策理論以其分類錯(cuò)誤發(fā)生概率最小的特點(diǎn)得到了廣泛應(yīng)用。本文根據(jù)原始的貝葉斯公式,分兩種情況推導(dǎo)了基于多元正態(tài)概率模型的貝葉斯判別函數(shù)及其決策面,并通過實(shí)驗(yàn)驗(yàn)證和分析了所推導(dǎo)的結(jié)論。
關(guān)鍵詞: 貝葉斯決策;多元正態(tài)概率模型; 決策面
1 貝葉斯決策理論概述
模式識別是通過對待識別模式的多種觀察或測量,將觀測數(shù)據(jù)構(gòu)成其特征向量,作為輸入,然后按照某一種判決法則來進(jìn)行分類的。然而客觀實(shí)際是十分復(fù)雜的,許多現(xiàn)象在觀察與測量時(shí)都具有某種不確定性和隨機(jī)性,如衛(wèi)星遙感影像。由于這種不確定性,各個(gè)類別之間呈現(xiàn)混淆、混沌的表象,給分類帶來了困難。這時(shí),需要采取統(tǒng)計(jì)的方法,對模式的統(tǒng)計(jì)特性進(jìn)行觀測,并采用統(tǒng)計(jì)判別的分類器,分析歸屬概率的大小,按照某種方法進(jìn)行分類。貝葉斯決策理論和方法就是在分類錯(cuò)誤發(fā)生概率最小的前提下進(jìn)行分類的一種統(tǒng)計(jì)模式識別的基本方法。
在實(shí)際工作中常常討論正態(tài)分布模式。由于很多隨機(jī)變量都具有正態(tài)分布或近似正態(tài)分布,而正態(tài)分布概率模型在數(shù)學(xué)上實(shí)現(xiàn)也比較方便,所以以正態(tài)分布的概率密度函數(shù)作為分類器設(shè)計(jì)的依據(jù),并按照正態(tài)分布概率模型抽取樣本集和進(jìn)行樣本分析是可行的。
2 多元正態(tài)概率模型的貝葉斯判別函數(shù)與決策面
由最小錯(cuò)誤率貝葉斯判別函數(shù)取對數(shù)形式,得
當(dāng)x的類概率密度函數(shù)服從多元正態(tài)概率模型時(shí),x的類概率密度函數(shù)為:
p (x | wi) = 1/ [(2π)n/2 |∑i|1/2]exp{-1/2 (x-u i)T ∑i-1 (x-u i)} 式(2)
代入式(1),有
式(3)
式(3)即為多元正態(tài)概率模型的貝葉斯判別函數(shù),其決策面方程應(yīng)是,即
式(4)
2.1協(xié)方差矩陣相等
當(dāng)各類協(xié)方差矩陣相等時(shí),從幾何上看,相當(dāng)于各類樣本集中于以該類均值點(diǎn)為中心的同樣大小和形狀的超橢球內(nèi)。
這時(shí),為了對x進(jìn)行分類,只要計(jì)算出x到每類的均值點(diǎn)的馬氏距離平方,最后把x歸于距離最小的類別。這種情況下的貝葉斯判別函數(shù)是一個(gè)線性判別函數(shù),二維情況的決策面是一條直線。
2.2 協(xié)方差矩陣不相等
當(dāng)各類協(xié)方差矩陣不相等時(shí)
這時(shí),對于某一模式x計(jì)算判別函數(shù)的值,最后把x歸于判別函數(shù)最大的類別。這種情況下的貝葉斯判別函數(shù)是一個(gè)非線性判別函數(shù),二維情況的決策面是曲線。
3 實(shí)驗(yàn)與分析
3.1 實(shí)驗(yàn)數(shù)據(jù)
有訓(xùn)練集資料矩陣表1所示,現(xiàn)已知樣本總數(shù)N=9、每類樣本數(shù)N1=N2=N3=3、維數(shù)n=2、類別數(shù)M=3。試在直角坐標(biāo)系中分別繪出以下兩種情況的分界線。
三類協(xié)方差相等;
三類協(xié)方差不等。
3.2 程序運(yùn)行結(jié)果與分析
3.2.1 協(xié)方差相等時(shí)的分界線
3.2.2 協(xié)方差不等時(shí)的分界線
程序的基本思想就是對坐標(biāo)系范圍內(nèi)的所有點(diǎn)進(jìn)行遍歷,依次代入判別函數(shù)。當(dāng)某一點(diǎn)代入判別函數(shù)后,任意兩個(gè)判別函數(shù)的差值足夠小時(shí),認(rèn)為該點(diǎn)就是這兩類的分界線,并把這個(gè)點(diǎn)畫出來??梢钥闯?,在二維情況下,當(dāng)協(xié)方差相等時(shí),三個(gè)類別的決策面為三條直線;而當(dāng)協(xié)方差不等時(shí),三個(gè)類別的決策面為曲線,從而從實(shí)驗(yàn)方面驗(yàn)證了理論推斷。在實(shí)現(xiàn)的過程中還應(yīng)給馬氏距離R設(shè)定閾值,屏蔽掉不合理的R值,如超出坐標(biāo)范圍等。
參考文獻(xiàn):
[1]舒寧,馬洪超,孫和利. 模式識別的理論與方法[M]. 武漢:武漢大學(xué)出版社,2004.
[2]邊肇祺,張學(xué)工. 模式識別(第二版)[M]. 北京:清華大學(xué)出版社,2000.
作者簡歷:
樊超,女,生于1988年,遼寧撫順人。現(xiàn)就讀于武漢大學(xué)遙感信息工程學(xué)院,精通鋼琴、架子鼓、吉他等樂器,專業(yè)成績優(yōu)異,曾獲武漢大學(xué)新生獎(jiǎng)學(xué)金以及歷年獎(jiǎng)學(xué)金,全國大學(xué)生英語競賽三等獎(jiǎng)。勤于研究,目前正協(xié)助老師做網(wǎng)絡(luò)GIS相關(guān)研究工作。