亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        選擇決策游戲與貝葉斯公式

        2021-11-03 03:44:48李增滬
        數(shù)學(xué)通報(bào) 2021年9期
        關(guān)鍵詞:后驗(yàn)跑車貝葉斯

        李增滬

        (北京師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院 100875)

        1 選擇決策游戲

        有個(gè)請(qǐng)嘉賓選擇獎(jiǎng)品的游戲,主辦方在編號(hào)為1,2,3的三個(gè)門中等可能地隨機(jī)選擇一個(gè),放入一輛跑車,另兩個(gè)門里各放一只山羊.節(jié)目的嘉賓不知道哪個(gè)門里是跑車.主持人請(qǐng)嘉賓選擇一個(gè)門,門后的獎(jiǎng)品由他獲得.嘉賓希望選中跑車.

        假設(shè)你是嘉賓,選擇了1號(hào)門,在此門打開之前,主持人打開了余下的門中的一個(gè),顯示里面是山羊,不妨假設(shè)他打開的是3號(hào)門.現(xiàn)在主持人給了你重新選擇的機(jī)會(huì),你是堅(jiān)持選1號(hào)門?還是改選2號(hào)門?

        這個(gè)游戲來(lái)源于一個(gè)著名的電視節(jié)目,曾經(jīng)引起廣泛關(guān)注和討論.下面針對(duì)兩種不同的游戲規(guī)則,在高中數(shù)學(xué)知識(shí)水平上,分別給出上面問(wèn)題的分析.

        規(guī)則1主持人知道跑車在哪個(gè)門里.在嘉賓初次選擇后,他只打開余下的門中有山羊的門.

        規(guī)則2主持人不知道跑車在哪個(gè)門里.在嘉賓初次選擇后,他在余下的兩個(gè)門中等可能地隨機(jī)打開一個(gè).

        同理有

        根據(jù)條件概率的定義得

        對(duì)于上面討論的選擇游戲的各種推廣及有關(guān)該問(wèn)題的細(xì)致討論,可以參閱[3,4,5]以及那里所列舉的參考文獻(xiàn).

        2 基于貝葉斯公式的分析

        貝葉斯公式的思想最早出現(xiàn)于貝葉斯的論文[1],發(fā)表于他去世后的1763年.后來(lái)拉普拉斯[2]獨(dú)立地發(fā)現(xiàn)了這個(gè)公式,此后其意義逐漸被人們理解和重視.統(tǒng)計(jì)學(xué)家經(jīng)過(guò)長(zhǎng)期的努力,發(fā)展出了以貝葉斯公式為基礎(chǔ)的系統(tǒng)的推理和決策方法,稱為貝葉斯方法.該方法的基本程序是首先根據(jù)實(shí)際情況確定先驗(yàn)概率,然后利用貝葉斯公式計(jì)算得到后驗(yàn)概率,對(duì)先驗(yàn)概率進(jìn)行修正和校對(duì),再根據(jù)后驗(yàn)概率做出推理和決策.

        貝葉斯公式(Bayes formula):設(shè)A1,A2,…,An是兩兩相斥的事件組,滿足P(Ai)>0,i=1,2,…,n且A1∪A2∪…∪An=Ω.對(duì)任意事件B?Ω,P(B)>0,有

        考慮按照規(guī)則1設(shè)計(jì)的選擇決策游戲.為了簡(jiǎn)單起見,下面假定當(dāng)主持人有兩個(gè)有山羊的門可以打開時(shí),他等可能地隨機(jī)選擇其中一個(gè)打開.在這種情況下,應(yīng)用貝葉斯公式,可以從條件概率的角度,給出上述決策問(wèn)題的另外一個(gè)分析和解答.

        (2)跑車在2號(hào)門里,主持人只有3號(hào)一個(gè)門可以打開,故P(B3|A2)=1;

        (3)跑車在3號(hào)門里,主持人只有2號(hào)一個(gè)門可以打開,故P(B3|A3)=0.

        利用全概率公式,主持人打開3號(hào)門的概率為

        再根據(jù)貝葉斯公式,在3號(hào)門打開的條件下,1號(hào)和2號(hào)門里有跑車的概率分別為

        這兩個(gè)條件概率是后驗(yàn)概率,它們利用主持人打開有山羊的3號(hào)門這個(gè)信息,修正了前面的先驗(yàn)概率.通過(guò)比較后驗(yàn)概率發(fā)現(xiàn),在規(guī)則1之下,改選2號(hào)門是正確的決策.

        3 多次選擇游戲

        考慮多個(gè)門的選擇決策游戲.假設(shè)主持人事先在編號(hào)為1,…,n的n(n≥3)個(gè)門中選擇了一個(gè),里面放入一輛跑車,而其他每個(gè)門里各放一只山羊.嘉賓不知道哪個(gè)門里是跑車.游戲規(guī)則是嘉賓選擇一個(gè)門,這個(gè)門里的獎(jiǎng)品由他獲得,嘉賓希望選中跑車.假定嘉賓選擇了k號(hào)門,在此門打開之前,主持人在余下的有羊的門中等可能地隨機(jī)選擇了一個(gè)并打開,不妨設(shè)打開的為m(m≠k)號(hào)門.接著主持人給了嘉賓一次重新選擇的機(jī)會(huì).試問(wèn)嘉賓能否通過(guò)改變選擇,提高成功獲得跑車的概率?

        命題1用Ai表示i號(hào)門里是車,Bi表示主持人打開i號(hào)門.假設(shè)i號(hào)門里是車的概率為P(Ai)=pi(1≤i≤n).那么在m號(hào)門打開的條件下,k和i(i≠k,m)號(hào)門里有車的概率分別為

        證明考慮到嘉賓已經(jīng)選k號(hào)門這個(gè)事實(shí),根據(jù)游戲規(guī)則,在k號(hào)門里是車的條件下有

        而在i(i≠k)號(hào)門里是車的條件下有

        P(Bi|Ai)=P(Bk|Ai)=0,

        利用全概率公式,主持人打開m(m≠k)號(hào)門的概率為

        根據(jù)貝葉斯公式,在m號(hào)門被打開的條件下,k和i(i≠m,k)號(hào)門里有車的概率分別為

        令c=(n-2)P(Bm)即得命題的結(jié)論.

        其中為公共常數(shù).這是嘉賓和主持人第1次互動(dòng)的后驗(yàn)概率,也是他們第2次互動(dòng)的先驗(yàn)概率.再次應(yīng)用命題1我們發(fā)現(xiàn),去掉打開的m1,m2號(hào)門,有車的概率在剩下的n-2個(gè)門里分別為

        其中c1和c2均為公共常數(shù).這是嘉賓和主持人第2次互動(dòng)的后驗(yàn)概率.不難發(fā)現(xiàn)

        P(Ak2|Bm2)

        所以嘉賓應(yīng)該改變自己的選擇,在k1和k2號(hào)之外另選一個(gè)門以獲得最大的成功概率.

        繼續(xù)上面的游戲,假設(shè)在嘉賓每次選擇一個(gè)門之后,主持人總是隨機(jī)打開余下的一個(gè)有羊的門,并給嘉賓一次重新選擇的機(jī)會(huì),直到剩下最后兩個(gè)門為止.試問(wèn)嘉賓應(yīng)該怎樣決策,才能保證每一步都以最大的概率選中跑車?

        分析5根據(jù)前面的討論,可以歸納出嘉賓應(yīng)該遵循的原則:(1) 每次得到重新選擇的機(jī)會(huì)時(shí),都改變自己的選擇;(2) 重新選擇的時(shí)候,首先選擇此前沒有被選過(guò)或者被選中次數(shù)最少的門;(3) 在此前被選次數(shù)相同的門中,選擇之前被選中最早的門.

        在關(guān)于多次選擇游戲的討論中,反復(fù)應(yīng)用了貝葉斯公式,而且這種方法具有一般性.在游戲中,主持人每打開一個(gè)門都提供了有用的信息,嘉賓需要不斷根據(jù)這些信息,利用貝葉斯公式計(jì)算出剩余的門里有跑車的后驗(yàn)(新的)概率分布,并據(jù)此修正自己的選擇以增加獲得跑車的概率.這種不斷改進(jìn)和校正決策的過(guò)程非常近似于人類的學(xué)習(xí)和思維模式,也是貝葉斯方法許多應(yīng)用的關(guān)鍵.例如著名的圍棋人工智能系統(tǒng)阿爾法狗(AlphaGo)系統(tǒng)就使用了這樣的想法.現(xiàn)在正是由于這個(gè)特點(diǎn),貝葉斯方法在人工智能領(lǐng)域發(fā)揮了非常重要的作用,已經(jīng)成為學(xué)習(xí)型人工智能的理論基礎(chǔ).

        注:本文可作為現(xiàn)行普通高中數(shù)學(xué)教材中貝葉斯公式部分的擴(kuò)展閱讀材料.

        猜你喜歡
        后驗(yàn)跑車貝葉斯
        基于對(duì)偶理論的橢圓變分不等式的后驗(yàn)誤差分析(英)
        貝葉斯統(tǒng)計(jì)中單參數(shù)后驗(yàn)分布的精確計(jì)算方法
        貝葉斯公式及其應(yīng)用
        一種基于最大后驗(yàn)框架的聚類分析多基線干涉SAR高度重建算法
        基于貝葉斯估計(jì)的軌道占用識(shí)別方法
        一種基于貝葉斯壓縮感知的說(shuō)話人識(shí)別方法
        電子器件(2015年5期)2015-12-29 08:43:15
        超酷的敞篷跑車
        2015款捷豹F型V8S敞篷跑車
        海外星云 (2014年22期)2015-01-19 09:51:50
        IIRCT下負(fù)二項(xiàng)分布參數(shù)多變點(diǎn)的貝葉斯估計(jì)
        基于貝葉斯后驗(yàn)?zāi)P偷木植可鐖F(tuán)發(fā)現(xiàn)
        欧美成人免费看片一区| 嗯啊好爽高潮了在线观看| 国产裸体美女永久免费无遮挡 | 亚洲av成人精品日韩一区| 亚州AV成人无码久久精品| 日本免费精品一区二区三区视频| 丝袜美腿亚洲一区二区| 亚洲精品suv精品一区二区| 青青草国产成人99久久| 欧洲一级无码AV毛片免费| 国产精品亚洲一区二区三区在线| 内射夜晚在线观看| 国产性一交一乱一伦一色一情| 日韩AV无码一区二区三不卡| 日本免费一区二区精品| 精品香蕉99久久久久网站| 欧美日韩一区二区综合 | 中文无码免费在线| 深夜一区二区三区视频在线观看| 亚洲国产成人av在线观看| 无尽动漫性视频╳╳╳3d| 欧美丝袜激情办公室在线观看| 免费人妖一区二区三区| 久久综合亚洲色一区二区三区| 中文字幕无码精品亚洲资源网久久 | 亚洲熟妇久久国产精品| 少妇三级欧美久久| 国产一区二区三区免费小视频| 国产一区二区视频在线免费观看| 成人三级a视频在线观看| 久久国产欧美日韩高清专区| 中文字幕日韩精品中文字幕| 国产亚洲精品美女久久久m| 中文字幕亚洲乱码熟女在线萌芽| 精品久久久无码不卡| 视频在线观看免费一区二区| 亚洲精品suv精品一区二区| 精品久久久久中文字幕APP| 久久精品亚洲一区二区三区画质| 国产精品无码一区二区三区| 狠狠久久久久综合网|