王治強
摘 要:“囚徒困境”是博弈論的經典之一,是西方經濟學理論的重要組成部分。本文第一部分介紹完全信息靜態(tài)下的“囚徒困境”的模型,第二部分介紹重復的囚徒困境模型,最后的部分通過一個例子分析囚徒困境的經濟學意義。
關鍵詞:博弈論;囚徒困境;個體利益與集體利益
一、完全信息靜態(tài)下的囚徒困境的模型
“囚徒困境”是1950年美國蘭德公司提出的博弈論模型,來自一個有趣的案例。兩名罪犯被警察逮捕,警察已經明確兩人犯罪的事實,但苦于無法給出有力的證據而無法起訴兩名罪犯,警方非常希望能找出辦法讓兩人招供。因為在美國是這樣的,如果一個犯罪嫌疑人愿意成為污點證人指出其同伙所犯的罪行,并以此與司法機關交換條件,就有可能得到豁免。于是警方設計出了一套激勵機制,促使罪犯自己招供。如果兩人同時坦白犯罪的事實,那么各判5年;如果同時抵賴,那就只能無罪釋放;如果一個人坦白并指證另外一個犯人的罪行,那么認罪的人就判無罪,而被指證的人就要被判10年。如果從經濟學的“理性人”假設出發(fā),就會得到認罪都是劃算的,因為不管另外一個罪犯不管做何選擇,選擇認罪都會得到較低的判刑;但是從集體來講,兩人都不認罪才是最理性的選擇,這就是所謂的囚徒困境。我們用A、B來分別表示兩名罪犯,即局中人,用負數表示獲刑,即支付,就可得到囚徒困境的標準型表述,如圖1:
圖1 囚徒困境
在完全信息靜態(tài)下的囚徒困境中,局中人對另一個參與人的策略集合和支付函數都是完全了解,但不知道另一個參與人的行動。此外,兩個參與人同時選擇決策并且只決策一次。在這里的同時行動是一個信息概念而不是時間概念,只要參與人在進行自己的決策時不知道另一個參與人的選擇,就說他們在同時行動。也正是因為在這個博弈中只進行一次博弈,參與人之間容易產生不信任,即使做出了承諾也無法保證承諾的約束力。
二、重復的囚徒困境模型
所謂的重復博弈,即同樣結構的博弈重復多次,每一次稱為“階段博弈”。前一階段的博弈不改變后一階段博弈的結構,每階段博弈的結構相同。在重復博弈中,所有局中人都能觀察到過去的博弈歷史。由此可以得出有限次重復博弈的定義:給定一個博弈G,重復進行了T次,且在每次重復之前各局中人都能觀察到以前博弈的結果,這樣的博弈過程稱為G的一個T次重復博弈,記為G(T),G為G(T)的原博弈。G(T)中的每次重復稱為G(T)的一個階段。在囚徒困境多階段重復博弈中,只要兩個局中人的策略互動關系所持續(xù)的時間固定,或者說只要囚徒困境的重復次數是預先確定的有限數,那么在理性人假設之下,重復博弈的結果一定還是個人在每次博弈中追求當時的私利,即每個局中人在每次博弈中都采取背叛策略。可以通過一個價格大戰(zhàn)的囚徒困境來說明,現有甲乙兩個企業(yè)壟斷了一種商品的商場,如果他們都實行高價,各得利潤5萬;如果一高一低,高價一方得1萬低價一方得6萬;如果都實行低價,雙方利潤都是3萬。如圖2:
圖2 價格大戰(zhàn)的囚徒困境
出于對策略互動性的考慮,甲乙兩家企業(yè)需要對這個持續(xù)兩個階段的博弈進行全面的分析,并選擇他們各自最優(yōu)的定價策略。每個局中人都會采取逆向歸納法,決定各自的策略選擇。為了方便討論,我們將有限次重復博弈限定在兩個星期。我們首先從最后一個階段即第二個星期分析開始,此時雙方都會意識到,這是最后一次博弈,沒有“后效”,不會有什么約束了,不必為將來打算雙方都只追求這次博弈的利益。這樣,每個企業(yè)都會發(fā)現,背叛是自己的一個策略優(yōu)勢。于是為了各自的利益雙方都會實行低價策略,搶占市場份額。局中人都已經清楚,最后一次博弈對方肯定要實行低價策略,不管我現在對他如何好型,也不會在下一次得到好報。既然這樣,作為理性人的“我”現在沒有理由收縮產量維持高價策略。雙方都這樣想,于是這個兩階段博弈的第一階段博弈的結果,也和一次囚徒困境博弈一樣,是雙方都只追求當時的私利。按照這樣的推斷,從一開始,甲乙雙方都會采取背叛策略,即低價策略。這樣的話,兩階段的價格大戰(zhàn)博弈就無法走出囚徒困境。
三、“囚徒困境”的具體應用
著名經濟學家林毅夫在其著作《解讀中國經濟》里用囚徒困境說明了合作社與農民之間的矛盾,林毅夫將農民加入合作社看成一次性的博弈。在當時人力物力有限的情況下,為恢復生產,增強農民抵御自然災害的能力而成立的農村生產互助組織,后來農業(yè)合作社的活動不斷擴大,發(fā)展到完全的大公無私,發(fā)展成人民公社。農業(yè)合作社的形成是基于規(guī)模經濟,但是這種規(guī)模經濟的實現是基于農民的自覺性和農業(yè)生產的監(jiān)督。加入合作社,農民將農具交公,進行集體生產。生產后部分產品要交付政府采購機構,其余的才歸于公社農民共有。在分配剩余時也是按工分和投入,工分是按天算的,沒有真正實現按勞分配,實際上是按勞動日分配,沒有真正衡量到農民勞作的質量,只要時間夠了,這樣干多干少一個樣,這樣的制度使一些農民失去了生產的積極性和意愿,從而偷懶,因為當農民努力增加生產,大多部分產品都歸于其他的農民所有。
合作社的成立初期是取得了很好的效果的,1956年,人大會議通過組織章程,農民所提供的土地、農具全部歸公,但是農民“入社自愿,退社自由”,林毅夫教授將其稱為“退出權”。在這種政策前提下,當合作社里有越來越多的人不努力勞動,想達積極勞動的人的“便車”時,生產率就會下降,這時那些努力勞動的人就會發(fā)現加入合作社的收益還不如自己單干時多,就會退社。這種退社的自由一方面對努力勞動的人是一種自我權利的保護,另一方面對那些偷懶的人也是一種實質性的威脅。因為越來越多的不努力勞動而造成的農民退社,最終會導致合作社的解散,不好好干的人也必須回去單干,單干得到的收益沒有搭便車的收益高,偷懶實在是得不償失,這樣“入社自愿,退社自由”的規(guī)定實際上是有效防止了那些偷懶的社員。
當時,政府看到了合作社取得的成功,生產力不斷發(fā)展,就規(guī)定農民不許退社,強制農民留在公社里不許回去單干。到了1958年的人民公社組織章程刪去了“入社自愿,退社自由”的規(guī)定,直到1978年都不允許農民單干。所以,從1958年人民公社化后,社員博弈的過程就發(fā)生了根本變化,這樣就相當于一次性博弈,不再存在實質性約束。如果所有的人退出公社的自由都被剝奪了,就不存在合作社的解散或者積極勞動的人退社這種威脅,那么不愿意努力勞動的人就越繼續(xù)偷懶,這樣偷懶的人也越來越多,因為偷懶才是對自己最有利的選擇。因此,當越來越多的人選擇偷懶,消極勞動,公社的生產力就會下降。當存在退社自由時,集體生產的生產力是高于單干的生產力的,只要農民自由退社的權利被剝奪了,相應的激勵機制便不復存在,在這種強制性的合作生產里,集體生產的生產力遠遠低于單干的生產力,并沒有實現合作社成立之初的規(guī)模經濟。所以,在存在“退出權”時,農民在合作社里勞動生產就是一個理性的選擇;當“退出權”不存在時,就變成了一次性的博弈,這樣就產生了農民個體利益與合作社集體利益的沖突。(作者單位:四川大學經濟學院)
參考文獻:
[1] 林毅夫,《解讀中國經濟》,北京大學出版社,2012年版
[2] 王則柯,李杰,《博弈論教程》,中國人民大學出版社,2004年版
[3] 張銜:《博弈論》課堂講義,四川大學經濟學院,2014年