李 勇 劉 璐
(北京師范大學(xué)統(tǒng)計(jì)學(xué)院 100875)
“三門問題”出自美國的電視游戲節(jié)目主持人Monty Hall的游戲情景[1],Marilyn vos Savant將游戲情景敘述如下[1]:
假設(shè)你在一個游戲節(jié)目中,你可以選擇三扇門.在一扇門后面是一輛車,另外兩扇門后面是山羊.你選了一扇門,比如說1號門,主持人知道門后面有什么,會打開另一扇有山羊的門,比如3號門,他對你說:“你想選2號門嗎?”改變你的選擇對你有利嗎?
該問題的解答,需要比較游戲參與者選中有汽車門的概率.
為探索三門問題正確答案,需要用概率語言描述前述游戲情景.目前爭論雙方都認(rèn)可如下的概率表述:
① 假設(shè)游戲開始前汽車被等概率地放置在每一扇門的后面;
② 游戲參與者初始選擇是隨機(jī)的,即在三扇門中隨機(jī)地選定其中的一扇;
③ 游戲參與者的選擇和汽車的放置是相互獨(dú)立的;
④主持人對于門后獎品的分布知情,主持人不會打開游戲參與者初始選定的門,也不會打開有汽車的門,只會打開有山羊的門.
在①至④成立的前提下,很多學(xué)者利用條件概率的工具“證明”了Selvin Steve結(jié)論是正確的,因此這種觀點(diǎn)被大多數(shù)人接受[3,4,5,6,7,8].
用A1,A2,A3分別表示1,2,3號門后面是車,用B1,B2,B3分別表示游戲參與者打開1,2,3號門,C1,C2,C3分別表示主持人打開1,2,3號門.據(jù)我們所知,人們都是基于C3發(fā)生的條件概率解決三門問題[3,4,5,6,7,8],而忽略了B1已經(jīng)發(fā)生的情況,其推導(dǎo)有問題.下面我們基于B1C3已經(jīng)發(fā)生的條件下,利用條件概率“解答”三門問題.由①可以確定
(1.1)
由①至③得
由④得
(1.2)
PC3|A2B1=1,PC3|A3B1=0,
因此,游戲參加者打開1號門,并且主持人打開門的概率為
因此游戲參加者堅(jiān)持選擇1號門獲得汽車的概率為
游戲參加者改選2號門獲得汽車的概率為
=6PA2B1PC3|A2B1
這樣就得到與Selvin Steve相同的結(jié)論.
目前,大多數(shù)學(xué)者認(rèn)可上述證明方法,認(rèn)為Selvin Steve結(jié)論是正確的.本文感興趣的是上述推導(dǎo)無懈可擊嗎?主持人的結(jié)論錯在哪里?引起蒙提霍爾悖論的原因是什么?
有部分學(xué)者指出在三門問題情景中,沒有規(guī)定主持人是以等概率在游戲者選剩下的有山羊門中選擇打開的門,即在實(shí)際游戲中公式(1.2)可能不成立.在(1.2)不成立的情況下,上一節(jié)中關(guān)于游戲者獲取汽車概率的計(jì)算就是錯誤的[4].
那么,根據(jù)三門問題的實(shí)際背景,應(yīng)該如何計(jì)算游戲者獲取汽車的概率呢?為此需要用概率語言刻畫游戲情境中主持人的行為如下:
⑤主持人在游戲者選剩下的有山羊門中以概率p打開編號最大的門.
在條件①至⑤下,可以利用隨機(jī)變量的知識解答三門問題.為此引入三個隨機(jī)變量X,Y,Z分別表示汽車所在門的編號,游戲參與者初始選擇門的編號,主持人打開門的編號.這樣,堅(jiān)持選擇1號門能夠獲得汽車的概率為
P1=P(X=1|Y=1,Z=3),
轉(zhuǎn)而選擇2號門能夠獲得車的概率為
P2=P(X=2|Y=1,Z=3) .
現(xiàn)在三門問題答案取決于P1和P2大小的比較:如果P1>P2,就應(yīng)該選擇不換門方案,即游戲參與者堅(jiān)持選1號門;如果P1 依據(jù)條件①至⑤,用條件概率知識和全概率公式可以計(jì)算P1和P2,下簡述證明過程.對于任意1≤i,j,k≤3,由①和②知 (2.1) 而由③知X和Y相互獨(dú)立,即 (2.2) 由④和⑤知 PZ=k|X=i,Y=j (2.3) 因此由概率的有限可加性和乘法公式有 PY=1,Z=3 P(Z=3|X=i,Y=1), 將(2.1), (2.1)和(2.3)帶入上式得 (2.4) 利用概率的乘法公式得 PX=1,Y=1,Z=3 =PX=1PY=1|X=1· (2.5) PX=2,Y=1,Z=3 =PX=2PY=1|X=2· (2.6) 由條件概率的定義,(2.4)至(2.6)式知 P1=PX=1|Y=1,Z=3 (2.7) P2=PX=2|Y=1,Z=3 (2.8) 由于對于任意p∈[0,1]總有 所以對于三門問題,游戲參與者換門獲得汽車的概率總是大于或等于不換門獲得汽車的概率,即游戲參與者應(yīng)該采取換門的對策. 在第2節(jié)中,我們在①至⑤約束下得到了換門和不換門獲得汽車的概率,下面考察該問題的隨機(jī)模擬結(jié)果,其算法步驟如下: a)初始化p=p0,其中p0∈[0,1]為指定的實(shí)數(shù),它刻畫了主持人打開門的規(guī)律; b)模擬密度矩陣為 的隨機(jī)數(shù)10000個,將其存儲為10000維向量x,該向量是10000次游戲中汽車擺放門的編號的模擬結(jié)果; c)按a)中方法再模擬隨機(jī)數(shù)10000個,將其存儲為10000維列向量y,該向量是10000次游戲中游戲參與者最初選擇門的編號的模擬結(jié)果; d)對于1≤i≤10000,模擬ui~U[0,1],模擬在第i次游戲中主持人打開門的編號 存儲10000維向量z,使得其第i分量為zi; e)在x,y,z中,選出滿足條件yi=1且zi=3的模擬結(jié)果,在選出的結(jié)果中計(jì)算xi=1的頻率F1(堅(jiān)持選1號門獲得汽車的頻率),計(jì)算xi=2的頻率F2(換為2好門獲得汽車的頻率). 表1給出了p=0.1×k(1≤k≤10)所對應(yīng)的獲得汽車的模擬頻率和概率的對比結(jié)果,其中p0,P1,F1,P2和F2的含義如前文所示,n是在10000次模擬中出現(xiàn)事件Y=1,Z=3的頻數(shù).從中可以看出:模擬出的各個條件頻率和相應(yīng)的條件概率很接近,其原因是模擬結(jié)果中滿足條件“游戲參加者選了1號門,主持人打開的是3號門”的頻數(shù)n都已經(jīng)比較大,使得條件頻率能夠接近相應(yīng)概率值的理論計(jì)算結(jié)果. 表1 游戲參與者獲得汽車的概率與頻率 三門問題給我們的啟示:在用數(shù)學(xué)知識解決實(shí)際問題時,必須用數(shù)學(xué)語言準(zhǔn)確刻畫問題情景,即數(shù)學(xué)抽象要與實(shí)際問題背景相一致;在數(shù)學(xué)抽象中加入了多余的假設(shè),將引發(fā)類似于蒙提霍爾悖論一樣的問題,這類問題所引發(fā)的爭論的起因是所加入的假設(shè)不同.3 三門問題結(jié)論的隨機(jī)模擬驗(yàn)證
4 引起三門問題爭論的原因