高 瑩 曹 寧 雒曉東
(1.西京學(xué)院 工程技術(shù)系,陜西 西安710123;2.西安市政設(shè)計(jì)研究院有限公司,陜西 西安710000)
總體來(lái)說(shuō), 貝葉斯理論的發(fā)展經(jīng)歷了以下幾個(gè)階段:1736 年Thomas Bayes 提出了重要的貝葉斯定理,1763 年其遺著《論有關(guān)機(jī)遇問(wèn)題的求解》被他的朋友Richard Price 整理發(fā)表,貝葉斯理論的價(jià)值才被世人認(rèn)識(shí),貝葉斯理論開始莫基。 隨后,Laplace 等作了進(jìn)一步的工作,目前以他姓名命名的定理的現(xiàn)代形式實(shí)際上歸功于Laplace 。 進(jìn)入到20 世紀(jì)50 年代,貝葉斯理論得到了充分發(fā)展,60、70 年代以來(lái),其發(fā)展達(dá)到鼎盛時(shí)期。 許多專家學(xué)者投身于貝葉斯理論的研究和應(yīng)用推廣中來(lái),力圖從不同的角度對(duì)貝葉斯理論進(jìn)行進(jìn)一步的探討和研究,形成了具有多分支的理論系統(tǒng)。
貝葉斯理論系統(tǒng)中的另一個(gè)重要分支就是貝葉斯決策理論。貝葉斯決策(Bayesian Decision Theory)就是在不完全情報(bào)下,對(duì)部分未知的狀態(tài)用主觀概率估計(jì), 然后用貝葉斯公式對(duì)發(fā)生概率進(jìn)行修正,最后再利用期望值和修正概率做出最優(yōu)決策。
貝葉斯統(tǒng)計(jì)理論與最優(yōu)決策的結(jié)合,首先在商業(yè)和社會(huì)科學(xué)中得到了很大的成功,其次是在物理、化學(xué)、生物等學(xué)科領(lǐng)域得到了廣泛的應(yīng)用,如今其概念和方法在社會(huì)許多領(lǐng)域得到了廣泛應(yīng)用,如在工程技術(shù)、管理科學(xué)、系統(tǒng)運(yùn)籌、醫(yī)療診斷等。
貝葉斯決策方法主要包括經(jīng)驗(yàn)貝葉斯決策、兩階段貝葉斯決策和序貫貝葉斯決策三種方法。
經(jīng)驗(yàn)貝葉斯決策的主要工具是經(jīng)驗(yàn)貝葉斯方法, 該方法由VonMises 提出,被Robbins 所廣泛發(fā)展。 其基本思想是在已知狀態(tài)參數(shù)向θ=(θ1,θ2,…,θp)各分量之間結(jié)構(gòu)關(guān)系的前提下,使用當(dāng)前抽樣數(shù)據(jù)及有關(guān)歷史數(shù)據(jù)對(duì)先驗(yàn)分布的一些數(shù)字特征進(jìn)行統(tǒng)計(jì)推斷。它在未知θ 是低維還是高維時(shí),處理問(wèn)題特別有效。 這種方法一般又分為兩種: 一種是假設(shè)θ 的先驗(yàn)分布屬于某一含有未知超參數(shù)的分布族,通過(guò)利用觀測(cè)數(shù)據(jù)來(lái)估計(jì)其中的未知參數(shù),這種方法稱為參數(shù)經(jīng)驗(yàn)貝葉斯方法,簡(jiǎn)稱PEB 方法。
兩階段貝葉斯決策是以先驗(yàn)兩階段確定理論為基礎(chǔ)的。 在第一階段,記π1(θ |λ)為參數(shù)的未知先驗(yàn)分布,其中λ 為一超參數(shù),這兒我們不直接對(duì)參數(shù)兄作估計(jì), 而是代之以元有第二階段的先驗(yàn)分布π2(λ),它可以是一個(gè)合適的正常先驗(yàn), 但常常是選擇一個(gè)合適的無(wú)信息先驗(yàn)。類似于經(jīng)驗(yàn)貝葉斯決策,這種方法也可以分為“可交換”和“一般意義下的”兩種情況。
序貫決策是一種多級(jí)決策的方法。 該決策過(guò)程是序貫進(jìn)行的,類似于序貫概率比檢驗(yàn)。它是在每次試驗(yàn)(或抽樣觀測(cè))之后,進(jìn)行一次統(tǒng)計(jì)推斷,看能否決定采取某種行動(dòng),若能,則做出決策,否則,則再進(jìn)行一次試驗(yàn)。因此,序貫決策的目的是在試驗(yàn)次數(shù)隨機(jī)的情況下,盡可能利用較小的樣本進(jìn)行統(tǒng)計(jì)推斷。序貫貝葉斯決策根據(jù)不同情況又分為三種:(1)最佳固定容量的序貫貝葉斯決策;(2)序貫貝葉斯因子檢驗(yàn)法;(3)決策樹法。 決策樹用一些標(biāo)記符號(hào)表示決策者所能采取的各種行動(dòng)路徑,通過(guò)樹枝狀展開,并利用概率表達(dá)其中的可能狀態(tài),經(jīng)運(yùn)算得知采取每種行動(dòng)路徑后能夠獲得的期望值。
貝葉斯方法屬于風(fēng)險(xiǎn)性決策方法,決策者雖不能控制客觀因素的變化,但卻掌握其變化的可能狀況及各種狀況的分布概率,并利用期望值即未來(lái)可能出現(xiàn)的平均狀況作為決策準(zhǔn)則。不確定性是生活中的常態(tài),貝葉斯方法不是使決策問(wèn)題完全無(wú)風(fēng)險(xiǎn),而是通過(guò)其他途徑增加信息量使決策中的風(fēng)險(xiǎn)減小。關(guān)于貝葉斯理論與方法的研究以深入到各個(gè)方面。
在許多復(fù)雜情況下.貝葉斯統(tǒng)計(jì)方法比經(jīng)典數(shù)理統(tǒng)計(jì)方法能更直接解決問(wèn)題.且可有效整合部分先驗(yàn)信息.但其需要高強(qiáng)度計(jì)算的特性曾限制了其廣泛應(yīng)用近幾十年來(lái).隨著高速計(jì)算機(jī)的發(fā)展以及MCMC算法的不斷提出.貝葉斯方法已被用于群體遺傳學(xué)、分子進(jìn)化、連鎖作圖和數(shù)量遺傳學(xué)等研究領(lǐng)域.已有許多學(xué)者研究了數(shù)量遺傳學(xué)中QTL作圖的貝葉斯方法從簡(jiǎn)單到復(fù)雜的。
貝葉斯網(wǎng)絡(luò)在經(jīng)濟(jì)和醫(yī)學(xué)等領(lǐng)域越來(lái)越多的應(yīng)用日益顯示出其發(fā)展前途,這些應(yīng)用通過(guò)正在建成許多應(yīng)用模型用于預(yù)測(cè)石油和股票價(jià)格、控制太空飛船和診斷疾病等等不斷地滲人我們的社會(huì)和經(jīng)濟(jì)生活中。 除此之外貝葉斯網(wǎng)絡(luò)還被應(yīng)用于信息恢復(fù)診斷與故障檢測(cè)、工業(yè)方面、電訊通信業(yè)、交通管理、文化教育和國(guó)防系統(tǒng)等各個(gè)領(lǐng)域。 在解決許多實(shí)際問(wèn)題中,我們可以使用貝葉斯網(wǎng)絡(luò)這樣的概率推理技術(shù)從不完全的、不精確的或不確定的知識(shí)和信息中做出推理。
隨著互聯(lián)網(wǎng)絡(luò)的發(fā)展, 垃圾郵件越來(lái)越多地充斥著人們的郵箱,部分學(xué)者開始研究現(xiàn)在反垃圾郵件的技術(shù),研究了用來(lái)評(píng)價(jià)垃圾郵件分類方法的語(yǔ)料庫(kù)和評(píng)價(jià)體系,著重對(duì)貝葉斯理論和貝葉斯參數(shù)估計(jì)理論進(jìn)行研究,并取得以下的研究成果:(1)在貝葉斯分類器的工作原理基礎(chǔ)上,設(shè)計(jì)了基于樸素貝葉斯反垃圾郵件模型;(2)在貝葉斯分類器的工作原理基礎(chǔ)上,提出一種新的郵件分類方法——貝葉斯參數(shù)估計(jì)郵件分類,設(shè)計(jì)實(shí)現(xiàn)了基于貝葉斯參數(shù)估計(jì)的反垃圾郵件模型;(3)通過(guò)對(duì)以上兩種方法進(jìn)行郵件過(guò)濾實(shí)驗(yàn)比較,證明在郵件分類中基于貝葉斯參數(shù)估計(jì)分類方法比樸素貝葉斯分類方法具有更高的召回率、正確率和F 值?;谪惾~斯參數(shù)估計(jì)的郵件分類算法為解決目前困擾人們的垃圾郵件問(wèn)題提供了一種新的解決方法和途徑。
水文過(guò)程的發(fā)生與發(fā)展取決于氣象因素和地理因素,是一個(gè)復(fù)雜的動(dòng)態(tài)過(guò)程;水文模型接受水文、氣象等多種輸入,運(yùn)用了許多水文模型與參數(shù),依賴于對(duì)輸入、輸出信息進(jìn)行解釋的專家們的判斷,這些復(fù)雜的因素導(dǎo)致了水文預(yù)報(bào)必然存在不確定性。水文模型不確定性是水文預(yù)報(bào)不確定性的重要來(lái)源之一,該不確定性始終存在并制約著防洪決策的正確性。 水文學(xué)家很早就認(rèn)識(shí)到了這一問(wèn)題,并試圖通過(guò)多方面的努力來(lái)消除或減少該不確定性。
貝葉斯概率水文預(yù)報(bào)突破了常規(guī)確定性水文模型在信息利用方面的局限性。 經(jīng)美國(guó)國(guó)家氣象局的實(shí)際應(yīng)用表明:不管水文預(yù)報(bào)的不確定性有多大,總可以保證從概率水文預(yù)報(bào)中獲得正的經(jīng)濟(jì)效益。 概率水文預(yù)報(bào)是水文預(yù)報(bào)發(fā)展的必然趨勢(shì),作為預(yù)報(bào)決策系統(tǒng)的重要組成部分,必將引起國(guó)內(nèi)外水文界的興趣和關(guān)注。
從1736 年出現(xiàn)貝葉斯理論至今, 貝葉斯理論已經(jīng)發(fā)展的較為成熟并被廣泛應(yīng)用于各個(gè)領(lǐng)域。雖然貝葉斯理論在某些領(lǐng)域的研究中還存在一些局限性和風(fēng)險(xiǎn)性,但是人們?cè)絹?lái)越感受到貝葉斯理論和方法的重要性。
[1]岳超源.決策理論與方法[M].北京:科學(xué)出版社,2005.
[2]徐澤水.不確定多屬性決策方法與應(yīng)用[M].北京:清華大學(xué)出版社,2006.
[3]施錫銓,范正綺.決策與模型[M].上海:上海財(cái)經(jīng)大學(xué)出版社,2003.
[4]簡(jiǎn)禎富.決策分析與管理[M].北京:清華大學(xué)出版社,2007.
[5]蘇巖.貝葉斯統(tǒng)計(jì)的發(fā)展及其爭(zhēng)鳴[J].保定師范??茖W(xué)校學(xué)報(bào),2003(02)
[6]陳文強(qiáng), 李小蕊, 史朋飛.基于貝葉斯決策的先驗(yàn)分布的選取方法[J].經(jīng)濟(jì)研究導(dǎo)刊,2009(04).