谷 飆
(西南財經(jīng)大學 人文學院,成都 611130)
?
從蒙提·霍爾問題看認知計算
谷飆
(西南財經(jīng)大學 人文學院,成都611130)
摘要:蒙提·霍爾問題涉及如何界定決策中的隨機事件、如何刻畫決策者的認知和概率計算。通過與相關(guān)抽彩問題的比較和認知計算得出的結(jié)論是:標準概率論在蒙提·霍爾問題的概率計算中仍然有效,但采用樸素條件化概率忽略了問題情境中的認知因素;改變選擇的決策在原問題中是期望效用最大化意義上合理的,但其推理論證存在邏輯循環(huán),關(guān)于概率轉(zhuǎn)移的解釋是錯誤的。蒙提·霍爾問題表明不確定性決策中認知推理和概率計算之間不協(xié)調(diào)。這個悖論說明決策合理性與相應(yīng)認知推理的邏輯可證性不等價,差異源于概率計算和不確定性推理依賴認知編碼,這意味著隨機性的知識是不可證的。
關(guān)鍵詞:蒙提·霍爾問題;認知計算;邏輯有效性;決策合理性
所有的博弈和決策問題都要涉及認知計算,認知事件的描述和決策問題的表征是決策的關(guān)鍵環(huán)節(jié)。認知與計算的關(guān)系一直是認知領(lǐng)域爭論的焦點。從邏輯的角度說就是“認知推理能否歸結(jié)為計算”。認知科學中提出過“為了理解大腦的認知功能,必須了解這一系統(tǒng)的計算目標”的論題,但確定完整認識活動的計算框架和規(guī)模是不大可能的,尤其是在不確定決策中控制認知和決策的概率計算依賴于隨機事件的認知描述,使得上述論題受到質(zhì)疑[1]112。認知與計算之間的糾纏是形形色色的認知疑難和決策悖論的根源,因而,解析認知決策悖論,玩一玩思維的魔方,也成為認知決策研究中風景獨異的一條進路。
一、蒙提·霍爾問題中的概率計算
蒙提·霍爾問題(Monty Hall problem)源自抽獎游戲。這個游戲的規(guī)則是:參賽者面對3扇關(guān)閉的門,其中一扇門的后面有汽車,選中后面有汽車的那扇門就可以贏得該汽車。而另外兩扇門后面則各藏有一只山羊。當參賽者選定了一扇門,節(jié)目主持人會打開剩下兩扇門中的一扇,露出其中一只山羊。主持人其后會問參賽者是否改變選擇,即,是放棄原來選的門換成剩下的沒打開的那扇門還是堅持原來的選擇。計算和決策問題是:在一扇門被打開的條件下原來選的門和剩下的門后面有汽車的概率是多少?改變選擇的期望效用值是否高于堅持原來選擇的期望效用值?
主張改變選擇的觀點認為,換一扇門中獎幾率為2/3,如果不換門中獎幾率為1/3,因而選擇換一扇門是合理的。其中,莎凡特的論證最有代表性。她解釋說:“當你第一次從3扇門中選擇1號門時,該門后有汽車的可能性為1/3,而另外兩扇門后有獎的可能性為2/3。但此時,主持人出場,給你提供一條新線索。如果獎品在2號門后,主持人會開3號給你看,如果獎品在3號門后,他則會開2號門。因此,如果你選擇換門,那么假如獎品在2號或3號門后你都將獲勝。但如果你不換門,只有當獎品在1號門后時才能獲勝?!痹谒磥?,解決這個問題的關(guān)鍵是主持人,因為她認為主持人總是會挑后面沒有獎品的門。這里的概率計算問題是,為什么“主持人提供的一條新線索”沒有改變已選擇那扇門中獎的概率,卻更新了剩下那扇門的概率呢?改變論者給出了兩種解釋。一種說法:主持人打開了剩下兩扇門中的一扇空門這件事并不能改變“參賽人選擇的門中獎機會為1/3”這一概率設(shè)定,這一信息對概率沒有影響;另一種說法:另外兩扇門后有獎的可能性為2/3,如果其中一扇沒有中獎,那么改選另一扇門的中獎機會為2/3。雖然這兩種說法對于信息的作用語焉不詳,但都使用了這樣一個認知計算: P(A∪B)=a,~B?P(A)=a。那么,這一計算是否正確呢?
我們先來回顧古典概率模型中的一個命題——抽彩的順序無關(guān)性:在一個等概抽彩中,一張彩票的中獎概率與抽取的先后順序無關(guān)。例如,一個抽彩中只有3張彩票,其中僅有一張能中獎。3個抽獎?wù)呒住⒁?、丙依次抽到編號?、2、3的彩票,3人得獎的概率均為1/3。具體地說,甲第一個抽取時是從概率相等的3張彩票隨機地抽一張,根據(jù)等概條件,他所抽到的1號彩票中獎概率為1/3;乙第二個抽取時是在剩下的兩張中抽一張,他抽到的2號彩票中獎為1/3=((3-1)!/(3-2)!)/(3!/(3-2)!)=2!/3!。輪到丙抽取時,他只能“抽到”剩下的3號彩票,但這張彩票中獎的概率和前兩張一樣是1/3=((3-1)!/(3-3)!)/(3!/(3-3)!)=2!/3!。這一看似乏味的計算意在說明,等概性不受抽取順序的影響,而且在一系列隨機事件下等概性可以保持。假設(shè)3個人中乙是急性子,不等其他人揭曉就把剛抽到的彩票撕開了發(fā)現(xiàn)沒中獎,此時已抽到1號彩票的甲得獎的概率變?yōu)?/2,還未來得及抽取的丙得獎的概率也是為1/2。為了說明這一計算,用A記“第i號中獎”, 用B記“第j號沒中獎”,i≠j, P(A)=1/3,B的概率P(B)=2/3,得知事件B發(fā)生后A的條件概率P(A|B)=P(A∩B)/ P(B)=1/3/2/3=1/2。 上式中A∩B表示事件“第i號中獎并且第j號沒中獎”,由A?B知 P(A∩B)=P(A)。
不難發(fā)現(xiàn),推理P(A∪B)=a,~B?P(A)=a是選言推理否定肯定式“A∪B,~B?A”的一種變形。差別在于,否定肯定式中A∪B是設(shè)定為真的前提,概率表示為P(A∪B)=1,當假設(shè)~B為真即P(~B)=1時,可以衍推P(A)=1。對于概率a≠1的事件A∪B以及A,上述計算只有當~B與A∪B的補事件c獨立才成立:
P(c)P(~B)=P(c∩~B)? P(c|~B)=
P(c∩~B)/ P(~B)=P(c)
?P(A |~B)=P(A∪B|~B)=P((A∪B)∩~B)/ P(~B)=a。
莎凡特的論證中“打開剩下兩扇門中的一扇是空門”與 “參賽人選擇的門中獎”的獨立性并不是題設(shè)前提,莎凡特將這一待證結(jié)論當作前提,做了一個循環(huán)論證。
概率論學者提出了相反的意見。他們按照 “無差別原則”和已知信息,設(shè)事件B “打開的門有山羊”的概率P(B)=2/3與事件A“參加者選擇的門有汽車”的先驗概率P(A)=1/3,以及事件A∩B “打開的門有山羊并且參加者選擇的門有汽車”的先驗概率P(A∩B)=1/3,然后計算可得:
P(A|B)= P(A∩B)/ P(B)=1/3/2/3 =1/2≠1/3=P(A)
這一計算得出的是樸素條件概率,其中只要事件B的概率P(B)≠0,那么條件概率P(A|B)= P(A∩B)/ P(B)就有定義。如果兩個事件A與B是相互獨立的,即等式P(A)P(B)= P(A∩B)成立,則P(A|B)= P(A∩B)/ P(B)= P(A),表明事件B已發(fā)生的信息不改變事件A的初始概率,否則B已發(fā)生的信息會導致事件A的概率更新。在蒙提·霍爾問題中,這一計算預(yù)設(shè)事件B “打開的門有山羊”是隨機的,它與事件B*“打開一扇有山羊的門”不同,后者可能是主持人的認知行為。由P(A) P(B)≠P(A)可知事件A與B是相關(guān)的,因而得知事件B“打開的門有山羊”會改變事件A“參加者選擇的門有汽車”的概率。這一條件概率之所以被稱為“樸素的”,是因為忽略了主持人的認知行動特征,將其行動條件簡單等同于隨機事件“一扇門被打開其中有山羊”。
二、交互認知:我知道什么?別人知道什么?我如何知道別人知道什么?
(一)兩種認知條件預(yù)設(shè)
如前所述,蒙提·霍爾問題上認為不必改變選擇的論證是以樸素條件概率計算為基礎(chǔ)的,它將主持人的行動結(jié)果簡單等同于一個隨機事件“一扇門被打開其中有山羊”,其預(yù)設(shè)是主持人隨機地打開剩下兩扇門中的一扇;認為應(yīng)該改變選擇的論證預(yù)設(shè)的是主持人知道哪扇門中有汽車哪扇門中有山羊,主持人的行為不是隨機的,而是有意 “打開一扇有山羊的門”。不過,這兩種認知預(yù)設(shè)都不在該游戲規(guī)則中,也不能從決策情境中推出。對于一個第一次玩游戲的局中人,當他選擇一扇門后等待驗證自己的好運氣時看到蒙提·霍爾打開另一扇門發(fā)現(xiàn)其中有山羊,他會如何推斷蒙提·霍爾的行為特征?在這樣的情境下,參賽者可能考慮的絕不僅限于上面兩種認知預(yù)設(shè),他可能做出各種猜測。例如,“主持人喜歡在參賽者已選了有汽車的門時打開一扇有山羊的門”或“主持人只在參賽者選了有山羊的門時打開有山羊的另一扇門”,不同猜測下選擇也截然不同。
(二)認知條件與計算模擬
在支持改變選擇的論證中,論者強調(diào)主持人知道大獎在哪扇門中,并將這一認知條件作為概率推理的基礎(chǔ)。Mueser 和 Granberg 為主持人的認知和行為做了明確的限制,提出了完整的問題描述[2]312:
(1)參賽者在3扇門中選一扇。他不知道門后是什么。主持人知道每扇門后面有什么。
(2)主持人必須開啟剩下兩扇門中的一扇,并且必須給參賽者提供換門的機會。
主持人永遠都會開啟一扇有山羊的門。
a.如果參賽者挑選了一扇有山羊的門,主持人必須開啟另一扇有山羊的門;
b.如果參賽者挑選了一扇有汽車的門,主持人隨機開啟另外兩扇門中的一扇。
(3)參賽者會被問是堅持他的原來的選擇,還是選擇剩下的那一扇門。
在上述約束條件下,我們用 B*表示“主持人打開一扇有山羊的門”,這是由一個規(guī)則確定的事件,計算相應(yīng)的條件概率:P(A|B*)=P(A∩B*)/ P(B*)=1/3 。用P(C|B*)表示“主持人打開一扇有山羊的門的條件下剩下那扇門后有汽車”,則P(C|B*)=1- P(A|B*)=2/3。這一結(jié)果與改變選擇論證中的結(jié)果相同,但這里的計算將B*作為一個確定事件,因而A與B*獨立,得到P(A|B*)= P(A),后一等式利用了條件事件(C|B*)與(A|B*)的互補性,在避開循環(huán)論證后得到P(C|B*)=1- P(A|B*)。
在這一“完整的”問題描述中,將“主持人知道每扇門后面有什么”作為推算的前提條件,那么這個條件對于參賽者的決定會產(chǎn)生什么影響呢?它能否使支持改變選擇的論證得到邏輯辯護?按照上面的限制條件(1),參賽者知道 “3個門后面有且僅有一個是汽車”,因而應(yīng)用“無差別原則”對它們賦予相等的概率或信念度;這里并沒有說明“主持人知道每扇門后面有什么”是參賽者與主持人之間的共同知識。另一方面,條件(2)要求“主持人永遠都會開啟一扇有山羊的門”,并不衍推“主持人知道每扇門后面有什么”,主持人的認知條件對前者是不必要的。條件(3)中主持人會問參賽者“是堅持他的原來的選擇,還是選擇剩下的那一扇門”,并沒有增加主持人與參賽者的相互認知信息。
由上述分析可知,“主持人知道每扇門后面有什么”對于“打開一扇沒有汽車的門”不是必要條件;另一方面,它也不是充分條件——知道以及應(yīng)該不能衍推行為。比如說,主持人在輪到他打開一扇沒有大獎的門時忘記了獎在哪扇門中,但是仍然打開了一扇門,結(jié)果其中沒有大獎。這可不是意外,對于n扇門游戲,隨機打開一扇其中沒有大獎的可能性為(n-1)/n。為了避免確定認知條件的困難,可以將游戲的主持人換為自動機,自動機可以完成主持人在游戲中的所有任務(wù),其規(guī)則為:
a.如果參賽者挑選了一扇有山羊的門,自動機必須開啟另一扇有山羊的門;
b.如果參賽者挑選了一扇有汽車的門,自動機隨機開啟另外兩扇門中的一扇。
用自動機代替主持人意在消除限制條件中認知概念帶來的含混性,其直接后果是:剩下的哪扇門被打開不再是認知推理的結(jié)果,而是以參賽者的選擇為前件的“如果,則”規(guī)則的運行。在以上述自動機為原型的計算機模擬實驗中,參賽者不改變原有選擇獲獎的比例是1/3左右,改變選擇獲獎的比例是2/3左右[3]168。
(三)直覺悖論與自欺論證
有論者認為,蒙提·霍爾問題的支持改變選擇的推理,以及計算機模擬的結(jié)果是反直覺悖論,那么論者所謂直覺是什么呢?直覺一詞頗多歧義,人們所指出的反直覺之處也不盡相同。有一個反對莎凡特論證的游戲設(shè)置是這樣的:游戲中有100扇門,它們之中只有一扇門后有汽車大獎,當參賽者選擇1號門后,主持人打開了從2號到99號的所有的門,其中沒有大獎,那么參賽者在已選的1號門與剩下的100號門之間該做何選擇呢?按照莎凡特論證,1號門中獎概率仍然是1%,而100號門中獎概率變?yōu)?9%,這可能嗎?這一論證揭露了莎凡特論證中的兩個反直覺之處。第一個是:游戲中參賽者最初的選項總是“不好的”,改變原來的選擇才是合理的。第二個是:主持人的行動總是帶來提高參賽者獲得大獎概率的信息。倘若后者是主持人行動的意圖,實施這一意圖的行動應(yīng)該是 “主持人在參賽者已選了有山羊的門時打開另一扇有山羊的門,并且,在參賽者已選了有汽車的門時不打開其他的門”,這樣,“主持人總是打開一扇有山羊的門”就不再是游戲的規(guī)則,參賽者和觀眾看到的應(yīng)該是“主持人有時會打開一扇有山羊的門”讓參賽者再做一次選擇。但是,主持人有選擇的行動是否是幫助參賽者獲得大獎?正如哈爾澎所指出,主持人選擇是否打開一扇有山羊的門可能出于相反的意圖:“主持人喜歡在參賽者已選了有汽車的門時打開一扇有山羊的門”。因而,需要更仔細地考察主持人的行動規(guī)則才能避免陷入反直覺論證陷阱[4]217。
在這個游戲中,對參賽者選擇的門、主持人打開的門,以及其他各扇門均做了相應(yīng)的編碼,這對于認知推理和概率計算是必要的。沒有編碼就沒有認知,也就沒有確定性和不確定性的區(qū)分。相對于兩個序列的編碼,認知確定性是指兩個序列的編碼間的確定匹配,認知不確定性是指兩個序列的編碼間的隨機匹配。在上述編碼下,當參賽者選擇了i號門,主持人可以按照某一順序打開一系列門,他隨機地打開除i號門之外的第一扇門后沒有大獎的概率是99%,隨機地打開第二扇門門后沒有大獎的概率是98/99,……,當他打開第98扇門,其后沒有大獎的概率為2/3。此時,另外兩扇門中有大獎的概率取決于他是如何打開這扇門的,換句話說,回到了原先的三門游戲。
由此可以看出,莎凡特論證中將復(fù)合事件“大獎在參賽者選定門之外的其他門中”的概率轉(zhuǎn)移到“大獎在剩下的一扇門”這一事件上,無論是假設(shè)“主持人知道每扇門后面有什么”還是認為“主持人隨機打開某些門”,其推理都是錯誤的。另一方面,當打開第98扇門時決策問題回到了蒙提·霍爾游戲,如前所說,這時改變選擇在期望收益最大化的意義上是合理的。在蒙提·霍爾游戲中,參賽者最初的“選擇”是隨機的,在一扇門打開后堅持這一選擇得到大獎的概率不會高于另一扇,改變選擇的決策是在弱意義下——不比堅持原選擇更差——是合理的,因為支持改變選擇的計算僅僅在特定的問題情境(三門游戲)中才適用。
如果從莎凡特論證得出 “改變原來的選擇才是合理的”,那么這一論證是自我否定的。假設(shè)有一個參賽者做了這樣的推理:1、2、3號門中奇數(shù)號門有兩個,偶數(shù)號門只有一個,她有了一個先驗信念:大獎在奇數(shù)號門中的可能性比在偶數(shù)號門中的可能性大,并且接受了莎凡特論證,她首先“選擇”了2號門,然后看著蒙提·霍爾打開了3號門是空門。當蒙提·霍爾像往常一樣等待她“改變選擇”時,她對蒙提·霍爾說:“我當然會選剩下的,不過,那就是我最初的選擇?!便V囋谟?,接受莎凡特論證意味著 “改變原來的選擇才是合理的”成為先驗信息,這使得參賽者可以 “先選擇一扇我不看好的門”。
莎凡特為了強化她的論證列出了兩張表,第一張表將三門編號為1、2、3,列出了大獎汽車在1、2、3號門后面而參賽者選擇1號門時可能的場合,第二張在同一編號下列出了參賽者最初選擇1號門而后改變選擇可能的場合,莎凡特將兩張表中得到汽車大獎的場合占全部場合的比例分別稱為“堅持原來選擇(1號門)得大獎的概率 ”和“改變想法另外選擇得到大獎的概率 ”。為明晰起見,列出修改過的對比表,見表1。
表1 得大獎概率
從表1看出,若將獲得大獎的概率等同于有利場合所占比例,則初選1號門獲得大獎的概率為1/3,爭議點是如何認定主持人開門后應(yīng)計入的場合與有利于獲大獎的場合:莎凡特將堅持原有選擇獲獎的有利場合等同于初選1號門獲得大獎的有利場合,而將第一行中主持人打開3號門或打開2號門算作一個有利場合,這實際上是假設(shè)主持人打開另外的哪扇門不影響參賽者的選擇;而她計算參賽者改變選擇獲得大獎的概率卻將主持人打開2號門(第二行)、打開3號門(第三行)算作兩個有利場合。事實上,在參賽者改變選擇的場合中,第一行主持人打開3號門或打開2號門對應(yīng)于參賽者改選2號門或改選3號門,是兩個不利的場合。在沒有其他信息的條件下,參賽者不能分辨第一行主持人打開3號門與第二行主持人打開3號這兩個場合,同樣也不能分辨第一行主持人打開2號門與第三行主持人打開2號這兩個場合。如果主持人是隨機打開3號門或2號門并且其后有山羊,則堅持選擇1號門獲大獎的有利場合與不利場合之比為1∶1,改變選擇獲大獎的有利場合與不利場合之比亦為1∶1。換句話說,將表1中第一行分成兩行計算有利場合與不利場合,就得到前述樸素條件概率。莎凡特關(guān)于堅持原有選擇和改變選擇獲大獎有利場合的計算源于其循環(huán)論證,即預(yù)設(shè)“主持人打開2號門其后有山羊或打開3號門其后有山羊”獨立于“參賽者最初選擇的門后有汽車”這一事件。
莎凡特列表中門的編號實際是一種編碼,在推理和決策分析中編碼標識狀態(tài)、行動、結(jié)果,理性決策者的認知與計算總是在一定編碼下刻畫和分析。但是,合理的認知計算不依賴于特定的編碼。表1第一行“主持人打開3號或2號”是指主持人可以隨機打開兩扇門中一扇門,這一不確定性對應(yīng)于主持人行動與兩扇門的某種編碼下的隨機匹配,這就產(chǎn)生了一系列問題:參賽者關(guān)于各扇門的編碼與主持人的編碼一致嗎?如果一致,參賽者如何知道主持人的行動選擇是在該編碼下是確定匹配還是隨機匹配?如果一定編碼是預(yù)先給定的,該編碼下選擇匹配就沒有時間性,“最初選擇”或“新的選擇”僅僅是編碼中的不同匹配序列。蒙提·霍爾問題引出的認知編碼的兩個問題,這里先指出第一個:參賽者“改變選擇”是否歸因于 “改變想法”,即表示行動轉(zhuǎn)變的編碼序列是否對應(yīng)于表示認知狀態(tài)的編碼序列的轉(zhuǎn)換?
三、認知計算
蒙提·霍爾問題又稱為“三門問題”,如果改變門和獎的數(shù)量,那么原來支持改變和支持不改變的論證會產(chǎn)生什么結(jié)論呢?以下構(gòu)造一個變體——“六門問題”說明認知計算在這類問題中的作用。6扇門中,有2扇門門后有獎品,4扇門門后沒有,游戲規(guī)則是:
(1)參賽者在6扇門中隨機挑選1扇門。
(2)主持人開啟剩下5扇門中的3扇,如果其中有2扇門門后有獎品,游戲結(jié)束。
(3)如果其中有1扇門門后有獎品,或其中3扇門都是空門,參賽者會被問是堅持他的原來的選擇,還是選擇剩下的2扇門中的任一扇門。
當打開的3扇門都是空門時,利用逆概率公式不難計算,參賽者已選的門有獎的概率是2/3,此時改選是以2/3中獎概率換取1/2的中獎概率和1/3概率換取中獎,其期望效用仍然是2/3??傊?,改選不會增加期望效用值。
當打開的2扇門是空門時,參賽者已選的門是空門的概率是2/3,此時改選將得獎的概率是1/2;參賽者已選的門有獎的概率是1/3,此時改選將得獎的概率是0。此時,改變選擇和不改變選擇的期望值都是1/3。
在這兩種情形下,主持人問參賽者是否改選后,可以再打開一扇門,使得3扇空門和1扇有獎門已打開,就回到了“三門問題”??梢钥闯觯傲T問題”的決策除了增加一些隨機事件的計算外,并沒有改變問題的實質(zhì)??梢宰C明,類似的“多門問題”都可以歸結(jié)為“三門問題”。兩種決策建議的論證中,莎凡特論證使用了啟發(fā)式信息,素樸條件化論證只使用樣本信息,這是該決策問題中認知和計算的兩種類型。
上述兩種決策都可以用包含狀態(tài)集、初始狀態(tài)、行動函數(shù)、轉(zhuǎn)換函數(shù)的自動機表示。其中行動函數(shù)確定了局中人在相應(yīng)博弈中的行動規(guī)則,轉(zhuǎn)換函數(shù)是狀態(tài)隨著行動變化的描述。蒙提·霍爾游戲可以這樣進行:輸入是編號1,2,3中的任意一個,當自動機掃描到i,則狀態(tài)轉(zhuǎn)換到f(q,i)=a并轉(zhuǎn)向編號j。后面每個階段的博弈是重復(fù)上述行動和轉(zhuǎn)換程序。不同的游戲規(guī)則用不同的自動機模擬,具體轉(zhuǎn)換依賴于在獎品放置序列與門的選擇、開啟序列之間的編碼匹配。計算機模擬蒙提·霍爾游戲展示了決策合理性的一種確證方式:如果概率計算在一種可行的計算下帶來期望收益最大化,則概率計算是合理的。決策論中描述選擇行為的模型是理性、認知和行動組成的三元組,其中合理性包括行動選擇的合理性和認知合理性,即決策者具有完善的邏輯推理能力和計算能力,理性選擇是局中人認知計算的結(jié)果。用計算機程序估計堅持選擇A門和選擇另一扇門的獲勝概率分別是多少,體現(xiàn)決策合理性中計算的作用。根據(jù)這個游戲的計算機模擬結(jié)果的統(tǒng)計,那些選擇換門的玩家獲勝得獎的幾率是沒有選擇換門者的兩倍。需要指出,用計算機重復(fù)游戲中“好”策略的取勝頻率并不代表該策略的概率計算和邏輯論證有效,至多表明其認知推理及計算在一定條件下是自我實現(xiàn)的。這里涉及與編碼有關(guān)的第二個問題:如果隨機自動模擬游戲局中人的認知行動,假定主持人知道上述編碼匹配,那么,他的認知行動在何種意義上是確定的或隨機的?是否有人完全知道變量序列{xi}與參數(shù){θi}序列的編碼匹配,同時又知道這種匹配是隨機的?在另一些條件下(比如說多門蒙提·霍爾游戲中允許主持人或模擬其角色的自動機表現(xiàn)博弈論所說的遺忘或顫抖的手),自我實現(xiàn)的預(yù)言就可能轉(zhuǎn)為自我否定的預(yù)言。
蒙提·霍爾問題表明,期望效用最大化作為合理性準則在抽彩游戲及其計算機模擬中可能是“成功”的,但在具體問題情境中需要引入某些啟發(fā)式信息,它們提供了認知推理的前提,而確定它們自身的可信性需要另外的認知前提,推理鏈條如此延伸會導致認知計算“爆炸”[5]224。在這一問題中,概率計算與推理論證相比要簡單得多,反映出不確定決策的合理性準則與認知推理的邏輯標準的差異,這種差異在使用認知編碼及其隨機匹配分析計算和推理的關(guān)系時顯現(xiàn)為不協(xié)調(diào)性,這啟發(fā)我們做出這樣的推測:關(guān)于隨機性的知識是不可證的。
參考文獻:
[1]格萊姆齊.決策不確定性與大腦 [M].賀京司,王曉嵐,李峰,等,譯.北京:中國人民大學出版社,2010:112-117.
[2]任曉明,陳曉平.決策博弈與認知[M].北京:北京師范大學出版社,2014:306-314.
[3]魏振軍.探訪隨機世界 [M].北京:中國統(tǒng)計出版社, 2010:180.
[4]HALPERN J.Reasoning about uncertainty[M].Cambridge massachusetts:MIT press,2005:217.
[5]陳波.悖論研究[M].北京:北京大學出版社,2014:224.
(責任編輯張佑法)
Cognition and Computation in Monte Hall Problem
GU Biao
(School of Humanities, Southwest University of Finance and Economics, Chengdu 611130, China)
Abstract:Monte Hall Problem involves in how to identify random events in decision, how to show the cognitive decision makers and the probability computation. Comparing with the raffle issues related and cognitive computing, we concluded that standard probability is still valid in the calculation of probability in Monty Hall problem, but using simple conditional probability ignores the cognitive factors in the problem situation; In the original problem, the Changing selection decision is reasonably in the expected utility maximization sense, but his reasoning and argument exists logic loop, and the explanation about the transfer probability is wrong. Analysis shows that there is incoherence between cognitive reasoning and probability computation in Monty Hall problem. This paradox illustrates that decision rationality and corresponding cognitive reasoning logic are inequitable, and the differences is that the result of probability calculation and uncertainty reasoning depends on cognitive encoding, which implies improvability of knowledge about randomness.
Key words:Monte Hall Problem; cognitive computation; logical validity; decision rationality
文章編號:1674-8425(2016)01-0005-07
中圖分類號:B81
文獻標識碼:A
doi:10.3969/j.issn.1674-8425(s).2016.01.002
作者簡介:谷飆(1967—),男,四川營山人,教授,哲學博士,研究方向:認知邏輯、博弈方法論。
基金項目:國家社會科學基金重大項目“現(xiàn)代歸納邏輯的新發(fā)展、理論前沿與應(yīng)用研究”(15ZDB018)
收稿日期:2015-12-14
引用格式:谷飆.從蒙提·霍爾問題看認知計算[J].重慶理工大學學報(社會科學),2016(1):5-11.
Citation format:GU Biao.Cognition and Computation in Monte Hall Problem[J].Journal of Chongqing University of Technology(Social Science),2016(1):5-11.
悖論專題主持人語:
北京大學陳波 教授
2015年11月28日,在北京大學哲學系舉辦了“悖論:研究與教學”小型研討會,來自國內(nèi)高校從事悖論研究與教學的30多位學者參加了會議,還有近20位對悖論有興趣者列席了會議。會議開得很成功,共有17位學者各做了25分鐘左右的發(fā)言和回答問題,其中既有比較資深的教授和博士生導師,也有近些年國內(nèi)新培養(yǎng)出來的哲學博士,還有兩位民間悖論研究者,他們大都在發(fā)言中表現(xiàn)出很高的學術(shù)水準:在悖論研究方面既有比較扎實的知識基礎(chǔ),又有一些自己的獨立研究成果,并且都對推進國內(nèi)高校的悖論教學表現(xiàn)出比較濃厚的興趣。與會者初步達成共識:以后國內(nèi)的悖論研究者每年聚會一次,大家在一起交流新信息和新的研究成果,由此推動國內(nèi)悖論研究和教學的深化。
我認為,悖論具有很大的認知價值,能夠開拓視野,引發(fā)思考,啟迪智慧,值得推向大學通識教育課堂和社會普羅大眾。這是因為:悖論課能夠給學生打開一片理智天空;激發(fā)學生的理智好奇心;引導學生對問題做獨立思考;引導學生去思考別人對問題的思考;引導學生去分辨什么樣的思考是好的思考,什么樣的思考是不好的思考;培養(yǎng)一種健康、溫和的懷疑主義態(tài)度,羅素將其視為有良好教養(yǎng)的知識分子的基本品質(zhì);培養(yǎng)一種寬容和接納的文明態(tài)度,不要輕易地下關(guān)于對錯的絕對判斷:走著瞧,等著看,看從某種觀點或方案中能夠發(fā)展出什么,衍生出什么,最后能夠做成什么。簡而言之,悖論課能夠培養(yǎng)陳寅恪所熱情倡導的“獨立之精神,自由之思想”。有人談到:“自由精神是什么?我無法給它下定義,只能告訴你我自己的信念……自由的精神就是,對什么是正確的不那么確定的精神?!?/p>
這里選刊北大悖論會議的4篇論文。谷飚教授的論文從概率論和認知邏輯的角度討論蒙提·霍爾問題,后者出現(xiàn)在美國的一個熱門電視節(jié)目中,曾引起公眾參與度極高的大討論。劉靖賢博士和王永峰合寫的論文回顧了羅素悖論、克里悖論、莫紹揆悖論和吉爾莫爾悖論與布勞威爾固定點定理和塔斯基固定點定理之間的內(nèi)在關(guān)聯(lián),進而探討了無類型限制方案在二階羅素悖論中的應(yīng)用,并證明一系列相關(guān)結(jié)果。王晶博士和李小五教授合寫的論文試圖證明:可知性悖論產(chǎn)生于Fitch-系統(tǒng)FS,其解決方案是通過弱化KP為RKP,建立推不出全知原則OMN的系統(tǒng)RKP。趙震博士的論文闡明了說謊者悖論的產(chǎn)生與自指和否定的密切關(guān)系。