黃文棣
摘要:為了驗(yàn)證博弈理論對(duì)人類行為的解釋度,文章以傳統(tǒng)的囚徒困局為基礎(chǔ),改編出有限重復(fù)博弈的實(shí)驗(yàn),旨在找出理論對(duì)實(shí)際人的行為的可預(yù)測(cè)性。實(shí)驗(yàn)以高中學(xué)生為局中人其中分為普通生組和領(lǐng)袖生組,毎組各自進(jìn)行有限重復(fù)博弈游戲。結(jié)果顯示納什均衡未能充分達(dá)到,原因由于局中人的行為往往因?yàn)椴┺牡膹?fù)習(xí)性、背景、教育、訓(xùn)練、知識(shí)水平和經(jīng)驗(yàn)所影響,而未能作出最理性的決定。
關(guān)鍵詞:囚徒困局;有限重復(fù)博弈
一、引論
為了探討博弈理論用于現(xiàn)實(shí)的解釋力,筆者安排了一場(chǎng)游戲給不同學(xué)歷背景的學(xué)生博弈,本文詳細(xì)闡釋該博弈游戲的設(shè)計(jì)、理論基礎(chǔ)和結(jié)果分析。
游戲以經(jīng)典的囚徒困境為基礎(chǔ),筆者參考了Osborne(2004)雙寡頭壟斷的合作和背叛環(huán)境,設(shè)計(jì)出一個(gè)有限重覆囚徒困境博弈的環(huán)境供學(xué)生進(jìn)行分組比賽,模擬商業(yè)競(jìng)爭(zhēng)的情況,并且要求他們向盈利最大化的方向思考。在筆者的角度,就是驗(yàn)證一下博弈結(jié)果是否符合書中所示。結(jié)果出人意料,并不完全符合書中所指,值得深思。
為了進(jìn)行比較,筆者把這個(gè)實(shí)驗(yàn)試做了兩次,一次給普通中學(xué)生玩,另一次給領(lǐng)袖生玩。領(lǐng)袖生和普通生的區(qū)別在于領(lǐng)袖生積極參與活動(dòng),有上進(jìn)心,富團(tuán)隊(duì)精神,學(xué)習(xí)態(tài)度績(jī)極,經(jīng)常參與活動(dòng),在身心方面都得到均衡發(fā)展;而普通生組是隨機(jī)招募,沒有特定的組織背景,學(xué)習(xí)態(tài)度也欠積極,也不愛參加有益的活動(dòng)。這個(gè)實(shí)驗(yàn)的目的就是分別讓兩班不同學(xué)習(xí)經(jīng)驗(yàn)的人進(jìn)行重覆囚徒困境的游戲,驗(yàn)證一下現(xiàn)實(shí)會(huì)否依從理論所推論的進(jìn)行。
下文將把這個(gè)實(shí)驗(yàn)的方法和結(jié)果詳細(xì)闡釋及討論。
二、實(shí)驗(yàn)設(shè)計(jì)
改編Osborne (2004)雙寡頭壟斷的合作和背叛環(huán)境,以下列出其盈利剖面。
局中人:A 組及B組學(xué)生
勝負(fù)規(guī)則:1. 使最終盈利比對(duì)手多; 盈利不能為負(fù)數(shù),否則不分勝負(fù);
2. 盈利越多所獲得的分?jǐn)?shù)越高(追求最大盈利);
3. 能擊敗對(duì)手的將有額外分?jǐn)?shù)。
行動(dòng):以高價(jià)或低價(jià)發(fā)售產(chǎn)品
重覆博弈回合次數(shù):10個(gè)回合
納什均衡:原本根據(jù)書中所指,有限重覆博弈的納什均衡是任何回合都是(低價(jià),低價(jià)), 如果就這樣給學(xué)生玩,這就太消極了,所以這個(gè)實(shí)驗(yàn)帶有附加的規(guī)則,就是最后盈利不能是負(fù)數(shù)(可以為0,經(jīng)濟(jì)學(xué)上的均衡情況),否則當(dāng)作輸,這個(gè)規(guī)則加強(qiáng)了現(xiàn)實(shí)性,因沒有商業(yè)希望盈利是負(fù)數(shù)的,而且提高學(xué)生思考的積極性,所以這個(gè)實(shí)驗(yàn)的納什均衡跟書中有點(diǎn)不同,表1利用”冷酷觸發(fā)策略” 配合后退歸納法推出各回合的納什均衡。
因?yàn)樵诘?0回合不合作不用受到下一回合懲罰,而且可以較高盈利取勝,所以第10回合的納什均衡是(低價(jià), 低價(jià)),由于累績(jī)盈利不能為負(fù)數(shù)否則當(dāng)輸論,所以各局中人以第十回合累積盈利最少為0的結(jié)局進(jìn)行后退歸納法,倒推出在第三回合中如果不合作便不論如何也獲得最少是0的盈利,這個(gè)推論引用自(施錫銓, 2000),說明在有限重復(fù)博弈中有可能導(dǎo)致在均衡結(jié)局中出現(xiàn)一次非均衡結(jié)局的博弈。以上策略也可防止對(duì)方在中途不合作導(dǎo)致自己輸?shù)簟?這個(gè)實(shí)驗(yàn)理論上會(huì)將雙方的盈利偏離了最大化的方向。
三、結(jié)果及討論
實(shí)驗(yàn)一結(jié)果:普通中學(xué)生為局中人。
實(shí)驗(yàn)一的局中人是素質(zhì)比較低的學(xué)生,兩組局中人的回報(bào)都是負(fù)回報(bào),亦即是不能獲得任何分?jǐn)?shù),這令人非常氣餒,原先認(rèn)為以游戲的方式引導(dǎo)他們競(jìng)爭(zhēng),以該科目的實(shí)際分?jǐn)?shù)作為獎(jiǎng)勵(lì),應(yīng)該可以誘發(fā)他們主動(dòng)思考和作出正面的行為,就算他們不用任何數(shù)學(xué)辨法分析出最優(yōu)的行動(dòng),也不至于一開始B組就擺出一副完全不合作,而且必定是兩敗具傷的態(tài)勢(shì),直接點(diǎn)說就是損人不利己,是這個(gè)博弈的最差結(jié)局。
有限重覆博弈,毎一回合所作出的行動(dòng)是由歷史行動(dòng)所影響,B組一開始就選擇以不合作的態(tài)度去玩,似乎是他們從一開始就不相信A組會(huì)合作,那為什么會(huì)這樣的呢?筆者沒有問學(xué)生們?yōu)楹文菢?,因?yàn)榇鸢付嘉幢厥钦妗R怨P者的推斷,那可能是他們根據(jù)A組的日常生活行為比較自私而導(dǎo)致B組不相信他們,又或者A組是成績(jī)比較好的一組,兩敗具傷對(duì)B組有利,因?yàn)檫@樣可以控制A組的盈利。無論如何,這個(gè)結(jié)局的出發(fā)點(diǎn)是自私和兩敗具傷,負(fù)面的態(tài)度令這個(gè)博弈在一開始便偏離了盈利最大化的目的,是自己不好也不想人家好的態(tài)度。
實(shí)驗(yàn)二結(jié)果:領(lǐng)袖生為局中人。
然而,實(shí)驗(yàn)二的局中人是素質(zhì)比較高的學(xué)生,他們從小已接受紀(jì)律訓(xùn)練,自我要求高,熱愛思考和重視道德,這樣的素質(zhì),能沖破第三回合不合作的預(yù)測(cè),使雙方的盈利皆有機(jī)會(huì)在0之上。這個(gè)耐性一直持續(xù)至第六個(gè)回合,實(shí)在是令人安慰的。由此可以想像他們身處的道德世界是正面的,思考也較成熟,懂得以大局為重,以自己及別人的角度思考。但從另一個(gè)角度看他們,是訓(xùn)練有素但未有戰(zhàn)爭(zhēng)經(jīng)驗(yàn)的士兵,他們的世界太美好,未曾經(jīng)歷人性的險(xiǎn)惡。
實(shí)驗(yàn)二的轉(zhuǎn)變點(diǎn)(不均衡結(jié)局)是第七回合,C組出賣了D組,導(dǎo)致往后的博弈變?yōu)椋ǖ蛢r(jià), 低價(jià))的納什均衡。顯然,C組比D組更有野心,C組的背叛行為非但沒有受罰,反而使他們勝出。從好的方面看,他們有商業(yè)頭腦;從壞的角度看,他們的不合作較遲使出,技術(shù)上未夠爐火純清。
游戲完結(jié)后,D組同聲表示自己品格比較好一點(diǎn),原先他們的策略是在第八局中不合作的,結(jié)果別人比他們?cè)缌艘徊?。通過這游戲,他們學(xué)會(huì)了防人之心不可無的處世之道,再問他們下次再玩這個(gè)游戲會(huì)如何,他們都說早一點(diǎn)不合作比較好。
四、結(jié)論
筆者的原意本是一個(gè)小型的博弈游戲,豈料普通中學(xué)生組的表現(xiàn)著實(shí)令人失望。于是筆者便決定跟其他人再玩一次,結(jié)果就由一個(gè)小博弈變成驗(yàn)證博弈論的實(shí)驗(yàn)。
兩個(gè)實(shí)驗(yàn)的結(jié)果偏離了理論所預(yù)測(cè)的結(jié)果,可以分兩方面解釋:
1.局中人的思考復(fù)雜性。局中人只是高中生,沒有受過嚴(yán)格經(jīng)濟(jì)學(xué)或數(shù)學(xué)訓(xùn)
練,而且之前也沒接觸過這種游戲,不懂其思考方法,可見知識(shí)是重要的。
2.局中人生活的背景。亦即是局中人對(duì)對(duì)手的歷史行為的認(rèn)識(shí)程度,實(shí)驗(yàn)一
和實(shí)驗(yàn)二兩班局中人身處的背景不同,行為偏好也不同,普通生就是因?yàn)閷?duì)游戲態(tài)度不積極,結(jié)果兩敗具傷,極其負(fù)面,不能以理性為前題預(yù)測(cè)和解釋他們的行為。因此,透過教育改善人的積極性是需要的,這樣可減少一點(diǎn)社會(huì)成本。
這個(gè)實(shí)驗(yàn)證明了良好的教育能塑造出正面的道德行為,至少他們的出發(fā)點(diǎn)是正面的。這個(gè)社會(huì)上需要設(shè)定多些機(jī)制保障正面的行為,否則當(dāng)人學(xué)會(huì)了有限重覆博弈致勝策略后,懲罰好人將會(huì)成為主流,人們將只顧自己的利益而破壞了社會(huì)的整體盈利。然而,在現(xiàn)實(shí)商業(yè)中,也不一定需要以盈利較高勝出游戲,所以,正如施錫銓(2000)所指,在重復(fù)有限博弈中可通過談判協(xié)商來加強(qiáng)雙方合作的意欲,使雙方達(dá)致能使盈利最大化的納什均衡。
參考文獻(xiàn):
[1]Osborne, M.J. Introduction to Game Theory. Ch.2.2.2.2004.
[2]施錫銓.博弈論[M].上海財(cái)經(jīng)大學(xué)出版社,2000.
(作者單位:上海財(cái)經(jīng)大學(xué)香港教學(xué)點(diǎn))