劉禹彤 趙毅
一、圣彼得堡悖論
圣彼得堡悖論來(lái)自于一個(gè)擲幣游戲關(guān)于概率期望值的悖論。擲幣游戲規(guī)則:設(shè)定擲出正面為成功,游戲者如果第一次投擲成功,得獎(jiǎng)金2元,游戲結(jié)束;否則,繼續(xù)投擲,第二次成功得獎(jiǎng)金4元,游戲結(jié)束;以此類推,如果第n次投擲成功,得獎(jiǎng)2n金元,游戲結(jié)束。
按照概率期望值的計(jì)算方法:將每一個(gè)可能結(jié)果的獎(jiǎng)金乘以該結(jié)果發(fā)生的概率,即可得到該結(jié)果的獎(jiǎng)金期望值,游戲的期望值即為所有可能結(jié)果的獎(jiǎng)金期望值之和。隨著實(shí)驗(yàn)次數(shù)n的增加,雖然發(fā)生概率小,但獎(jiǎng)金越來(lái)越多,且每一個(gè)結(jié)果的獎(jiǎng)金期望值均為1,則游戲的期望值將為“無(wú)窮大”。而且按照概率的理論,多次實(shí)驗(yàn)的結(jié)果將會(huì)接近于數(shù)學(xué)期望。
但是,以往經(jīng)驗(yàn)表明“沒(méi)有人愿意花25元去參加一次這樣的游戲?!边@就出現(xiàn)了計(jì)算的期望值與實(shí)際情況的“矛盾”。我們可以使用MATLAB軟件模擬實(shí)驗(yàn)過(guò)程來(lái)解釋這一問(wèn)題。
二、圣彼得堡實(shí)驗(yàn)的MATLAB模擬分析
由于投擲硬幣得到正面和反面的概率相同(等概率事件),即P(正面)=P(反面)=0.5。
1.單輪圣彼得堡游戲的MATLAB模擬
當(dāng)游戲參與者投擲硬幣出現(xiàn)正面時(shí)游戲結(jié)束,我們可以將每次投擲的隨機(jī)值由函數(shù)rand產(chǎn)生。如果該次rand函數(shù)運(yùn)算結(jié)果小于等于0.5,定義為投擲出反面,游戲繼續(xù);反之,則定義為投擲出正面,游戲終止。
由于圣彼得堡游戲的不確定性,為了獲得可信度較高的均值數(shù)據(jù),需要進(jìn)行多次模擬。下面討論中,對(duì)一次性連續(xù)多次的游戲模擬統(tǒng)稱為一輪游戲模擬。一輪圣彼得堡游戲由多個(gè)單次圣彼得堡游戲組成。截取每次運(yùn)行的投擲次數(shù)和獎(jiǎng)金數(shù)額這兩個(gè)結(jié)果,得到單輪多次圣彼得堡游戲的MATLAB模型(設(shè)本輪投擲運(yùn)行為100次)。從結(jié)果可以看出,在本輪模擬實(shí)驗(yàn)中單次游戲最高獎(jiǎng)金達(dá)到32元,但是平均獎(jiǎng)金只有10.62元,遠(yuǎn)小于32元。同時(shí)單次游戲最大投擲次數(shù)為5,但平均投擲次數(shù)只有1.98。
為了增加實(shí)驗(yàn)的可靠性,減少不確定性,增加單輪游戲的次數(shù),以此觀察實(shí)驗(yàn)結(jié)果與單輪100次模擬實(shí)驗(yàn)的結(jié)果的異同,以此找出規(guī)律(程序運(yùn)行5000次)。
結(jié)果表明:?jiǎn)未斡螒虻淖罡擢?jiǎng)金雖然達(dá)到了2048元,但平均獎(jiǎng)金只有13.4972元,遠(yuǎn)小于2048元。同時(shí),單次最大投擲次數(shù)增加為11,但平均投擲次數(shù)只有2.004。也就是說(shuō),對(duì)單次游戲來(lái)講,平均每次游戲能夠得到6.7351元。之所以可以達(dá)到13.4972元這樣的平均獎(jiǎng)金,是由于游戲的不確定性,產(chǎn)生了11次的最大單次投擲次數(shù),使該游戲的獎(jiǎng)金額大幅增加。
2.多輪圣彼得堡游戲的MATLAB模擬
在上圖中發(fā)現(xiàn)最大投擲次數(shù)隨著輪數(shù)的增加而增加,但是,增加速度并不明顯。其中,最大的投擲次數(shù)為16次,此時(shí),這一事件的概率為,約為1.5259×10-5。
在此基礎(chǔ)上驗(yàn)證了當(dāng)輪數(shù)為100000時(shí)的隨機(jī)模擬實(shí)驗(yàn),隨著輪數(shù)的劇增,但是,單輪最大投擲次數(shù)僅為18,最大獎(jiǎng)金額為 262144元。
說(shuō)明當(dāng)輪數(shù)趨向于無(wú)窮大時(shí),最大投擲次雖然數(shù)也會(huì)增加,但是增加速率極慢。
在上圖100個(gè)樣本值中,數(shù)據(jù)分布如下:
54個(gè)數(shù)據(jù)分布在0~10元,均值為9.4720元,34個(gè)數(shù)據(jù)分布在10~20元,均值為17.1560元,8個(gè)數(shù)據(jù)分布在20~30元,均值為24.8400元,只有4個(gè)數(shù)據(jù)在30元以上。
綜上分析,圣彼得堡游戲的定價(jià)可以按照其從小到大排序的88個(gè)數(shù)據(jù)的平均值為參照標(biāo)準(zhǔn),定價(jià)為12元左右。
3.單輪游戲的平均投擲次數(shù)
從下圖可以發(fā)現(xiàn)無(wú)論單輪的游戲次數(shù)是多少,其單輪的平均投擲次數(shù)的平均值為1.9911,最大值為2.1071,最小值為1.82,在直線y=2上下波動(dòng)震蕩(見下圖)。
三、結(jié)論
從以上的模擬實(shí)驗(yàn)的結(jié)果數(shù)據(jù)分析得出以下結(jié)論:
1.圣彼得堡游戲的平均單次投擲次數(shù)趨近于2
2.單輪圣彼得堡游戲的最高投擲次數(shù)增長(zhǎng)速度隨著次數(shù)的增加而變緩,趨近于0
3.單輪圣彼得堡游戲的平均獎(jiǎng)金的增長(zhǎng)速度隨著次數(shù)的增加而變緩,趨近于0
4.由于實(shí)驗(yàn)的不確定性,單次游戲可以有較高的獎(jiǎng)金,但是其概率極小,不會(huì)對(duì)其他參與者產(chǎn)生吸引力
由上述模擬結(jié)果分析得出:可以將游戲定價(jià)為12元時(shí),此時(shí)需要投擲硬幣4次才可以贏取獎(jiǎng)金4元,此時(shí)的概率為0.0625,這已經(jīng)是一個(gè)小概率事件了,而且可以保證游戲參與者中既有失敗者,又有成功者,而且游戲組織者的損失和收益也大致相當(dāng)。
參考文獻(xiàn):
朱琳,葉向.圣彼得堡悖論的計(jì)算機(jī)模擬分析[J]計(jì)算機(jī)系統(tǒng)應(yīng)用,2009(11).
(作者單位 劉禹彤:北京林業(yè)大學(xué)理學(xué)院 趙毅: 浙江財(cái)經(jīng)大學(xué))