段俞戎
【摘 要】囚徒困境這一現(xiàn)象在日常決策中越來越常見,這是一種博弈心理的體現(xiàn),同時,為減弱囚徒困境的影響,在很多情況下人們采用重復(fù)博弈這一方法。為了確切證明博弈這種現(xiàn)象的真實存在并分析其發(fā)生機制,實驗選取山東師范大學(xué)24名學(xué)生進行相關(guān)實例的測驗,并對數(shù)據(jù)進行比較分析,得出結(jié)論:重復(fù)博弈中人們確實更傾向于選擇合作策略,但是在高收益面前,人們也有可能會選擇背叛。
【關(guān)鍵詞】囚徒困境;博弈;風(fēng)險與收益
0 引言
決策中的博弈論與博弈心理在當今時代越來越受到重視,對其的研究也有利于深入了解人們的決策心理并理解人們某些行為背后的實際意義。博弈是指在一定的游戲規(guī)則約束下,基于直接相互作用的環(huán)境條件,各參與人依靠所掌握的信息,選擇各自策略(行動),以實現(xiàn)利益最大化和風(fēng)險成本最小化并權(quán)衡不同決策主體之間決策的的過程。簡單說就是人與人之間為了謀取利益而競爭。在博弈論中,以“囚徒困境”博弈模型最為著名。該模型講述了一個警察與小偷的故事。兩個嫌疑犯作案后被警察抓住,分別關(guān)在不同的屋子里接受審訊。警察知道兩人有罪,但缺乏足夠的證據(jù)。警察告訴每個人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個坦白而另一個抵賴,坦白的放出去,抵賴的判十年。于是,每個囚徒都面臨兩種選擇:坦白或抵賴。然而,不管同伙選擇什么,每個囚徒的最優(yōu)選擇是坦白:如果同伙抵賴、自己坦白的話放出去,抵賴的話判一年,坦白比不坦白好;如果同伙坦白、自己坦白的話判八年,比起抵賴的判十年,坦白還是比抵賴的好。根據(jù)上述描述,我們可以知道兩人同時選擇抵賴對于共同利益來說是最好的。而在多項研究中都表明,很少有人會選擇抵賴而與對方達成合作并得到最優(yōu)效果。這就是囚徒困境的存在,為了自己的利益達到最大化,大多數(shù)人會選擇背叛而非合作。囚徒的兩難境地確實抓住了自己效益最大化、不信任和需要相互防范背叛這種真實的一面。
重復(fù)博弈是指同樣結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈稱為階段博弈。以囚徒困境為例,如果囚徒的罪行較輕,每次判刑都不是很嚴重,那么兩個囚徒在刑滿釋放之后再作案,作案之后再判刑,釋放之后在作案,如此周而復(fù)始,他們之間進行的就是重復(fù)博弈,其中每次作案和判刑是階段博弈(周厚虎,2008)。在重復(fù)的囚徒困境中,博弈被反復(fù)地進行。因而每個參與者都有機會去“懲罰”另一個參與者前一回合的不合作行為。這時,合作可能會作為均衡的結(jié)果出現(xiàn)。欺騙的動機這時可能被懲罰的威脅所克服,從而可能導(dǎo)向一個較好的、合作的結(jié)果。因此,可以抵消單次囚徒困境的影響。
根據(jù)以上敘述,本次研究旨在驗證博弈論中囚徒困境的存在并分析其發(fā)生的心理機制并提出兩個假設(shè)。研究假設(shè):重復(fù)博弈可以抵消單次囚徒困境的影響使人們的行為趨向合作并得到最優(yōu)的共贏結(jié)果。
1 方法
1.1 被試
24名山東師范大學(xué)心理學(xué)院2013級卓心本的學(xué)生,男生2名,占8.33%;女生22名,占91.67%。平均年齡21歲(SD=0.68),智力正常,心理狀況良好,雙耳聽力正常。
1.2 實驗儀器與材料
問題情境:兩兩一組,共紅、藍兩種顏色可以選擇,同時選紅色兩隊各積3分,同時選藍色則各扣3分,當顏色選擇不一致時,選紅色的扣6分,而選藍色的積6分。
實驗記錄紙
1.3 實驗設(shè)計
將24人分為4個小組(A、B、C、D),每小組6人,AB為對抗組,CD為對抗組。采用重復(fù)博弈,共進行8次結(jié)構(gòu)相同的博弈,每四次結(jié)束后兩小組可選擇進行討論或者不進行討論。之后的2次博弈將獎勵與懲罰分數(shù)翻倍。
1.4 實驗程序
首先將24名被試分為4個小組(A、B、C、D),每小組6人,AB為對抗組,CD為對抗組。其次,告知被試指導(dǎo)語:你們小組可以選取紅、藍其中一種顏色,當兩組同時選紅色時兩隊各積3分,同時選藍色則各扣3分,當顏色選擇不一致時,選紅色的扣6分,而選藍色的積6分,請小組討論后決定。再次,進行重復(fù)實驗8次,每階段實驗結(jié)束后公布得分結(jié)果,每四次組間可選擇討論。然后,告知被試最后兩次實驗獎勵與懲罰分數(shù)翻倍,按上述程序進行實驗。最后,宣布實驗結(jié)束,公布最終實驗結(jié)果,得分為0分以上判定為贏。
2 結(jié)果
根據(jù)得分統(tǒng)計匯總表(表2)可以看出,A組得分最高,為+9分;其次是B組與D組,為-3分;最后是C組,為-15分。而在四組之中,只有A組的成績?yōu)檎?,另外三組成績均為負值。AB對抗組獲勝的是A組,CD對抗組獲勝的是D組,四組中間獲勝的是A組。
由圖1可以看出,第1輪,兩組的決策結(jié)果對A組優(yōu)于B組,從第2輪開始,A、B兩組的選擇趨于納什平衡,在第4輪,兩組沒有進行交流,得分也未出現(xiàn)變化,一直到第8輪打破這種平衡,兩組得分均趨向于不利方向。A、B兩組除最開始一次外,得分情況趨近一致,均為背叛1—合作6—背叛3。
由圖2可以看出,C、D兩組第1輪的決策結(jié)果對兩組均不利,第3輪兩組決策結(jié)果對D組優(yōu)于C組,第4輪趨于納什平衡,兩組選擇交流過后,第5輪仍處于平衡狀態(tài),在第6輪時打破,決策結(jié)果利于C組,第七輪又達到平衡,第8輪決策結(jié)果利于D組,第9輪開始,兩組的決策結(jié)果均趨向于不利方向。C、D兩組選擇相差較大,得分情況一直處于起伏不定的狀態(tài)。
根據(jù)得分匯總表整理繪制折線圖如下:
3 討論
根據(jù)整個實驗程序的設(shè)計,組間有討論機會,每次成績進行公布,我認為此次實驗為重復(fù)博弈的一個實驗。重復(fù)博弈是指同樣結(jié)構(gòu)的博弈重復(fù)多次,在重復(fù)的囚徒困境中,博弈被反復(fù)地進行。因而每個參與者都有機會去“懲罰”另一個參與者前一回合的不合作行為,使對方失分。這時,合作可能會作為均衡的結(jié)果出現(xiàn)。欺騙的動機這時可能被懲罰的威脅所克服,從而可能導(dǎo)向一個較好的、合作的結(jié)果。因此,可以抵消單次囚徒困境的影響。在此次實驗中就有所體現(xiàn),實驗不是只進行一次,而是連續(xù)進行多次,中間還有兩個組之間的討論時間,也就是說,一次結(jié)果之后你可以知道對方組是否背叛了你(與小組討論不一致),因此,在下一次中你就可以對他給予懲罰,而由于這種方式,使得每個組不管是礙于面子還是為了贏,最終的選擇可能都是合作,以達到雙贏的局面。同時,Wedekind C(1998)的研究也證明重復(fù)多次的選擇通常會導(dǎo)致更多的合作。
由表2可以看出,在本次實驗中,雖然沒有很明顯的體現(xiàn)出博弈達成雙贏的局面,但重復(fù)博弈仍起到了一定的作用,與假設(shè)大致相符。這種現(xiàn)象在AB、CD組中均有體現(xiàn),前4次博弈中,第一次博弈時,A組為了自己的利益,同時又不信任B組,未選擇合作策略,而其發(fā)現(xiàn)B組選擇了合作策略,因為懼怕之后B組的報復(fù)(背叛),又想繼續(xù)得分,于是在之后的三次中均選擇合作,這就是重復(fù)博弈優(yōu)勢的體現(xiàn),因為害怕對方的懲罰,又發(fā)現(xiàn)對方第二次、第三次均未背叛自己(選藍色),因此,雙方形成共贏的局面。中間討論時間,兩組拒絕交流,但因為有之前形成的“契約”在,而且雙方均擔心過早背叛會收到對方懲罰,影響之后的分數(shù),所以雙方后四次博弈中,第一次仍然選擇了合作,這時雙方發(fā)現(xiàn)對方都沒有選擇背叛,因此不用擔心來自對方懲罰,達到雙贏,于是在之后的兩次博弈中也選擇了合作,但在第八次,兩組都想獲得更高的利益,同時A組也為懲罰之前B組的背叛信號(拒絕交流),均選擇了背叛。第二次中間討論時間兩組也并未進行討論。最后兩次在發(fā)現(xiàn)上一次對方背叛之后,均不約而同的選擇了懲罰對方,繼續(xù)背叛,使得雙方最后兩次全為負分,得到“雙輸”的結(jié)果。
前4次博弈中,前兩次C、D均未選擇雙贏,一直是負分,而第三次中C組改變策略,選擇合作,雖然在第三次中D組仍然選擇背叛,但其看到了C組想要合作的內(nèi)心,又懼怕被C組懲罰,為了繼續(xù)得分,于是第四次雙方均選擇了合作。經(jīng)過中間交流,雙方達成共贏的想法,并且D組承諾說要讓C組一次。所以下一輪開始時,雙方都選擇了紅色,都未背叛,在第六次時,C組為了補償,選擇了背叛得到高分,接下來雙方都因為害怕對方對于自己背叛的懲罰,信守承諾,沒有背叛,雙方達成共贏,但在第八次,D組想獲得更高的利益趕超之前得分較高的A組,于是選擇了背叛。第二次中間討論時間兩組并未進行談判。由于D組之前的背叛,使得C組要對D組進行懲罰,而D組想繼續(xù)獲得高分,因此雙方都選擇背叛,使得雙方最后兩次全為負分,得到“雙輸”的結(jié)果。
盡管重復(fù)博弈確實能夠通過懲罰對方而使雙方由于對利益的追求以及“面子”問題不敢輕易選擇背叛,但是上述實驗結(jié)果最終表明“雙輸”,也情有可原。首先,對于A與B、C與D兩組來說,對手并不只是對方,還有其他兩組,就像之前D組所描述的那樣,為了在四個組中間爭先,為了超過得分較高的A組,自然要選擇背叛而獲取更高的利益;其次,在這種四組之間容易形成對比的情況下,競爭是非常強烈的,大家都不甘心屈居人后。孫昕怡等人(2009)的研究表明,成人平均合作率隨合作指數(shù)的升高而升高,但始終處于幾率水平之下,表現(xiàn)出競爭傾向。成人本來就對競爭比合作更為敏感,更愿意通過競爭的方式贏過他人。而且博弈論預(yù)測:當囚徒困境博弈是有限重復(fù)時,理性的玩家在每一回合中仍會背叛。所以說,盡管重復(fù)博弈對于雙贏局面起到了一定作用,但作用仍然有限。
4 結(jié)論
在博弈當中,人們?yōu)榱俗约旱睦嫱鶗x擇背叛策略,而重復(fù)博弈確實能夠改變?nèi)说男袨?,讓其更傾向于選擇合作策略,在全球化的今天,為了社會不斷發(fā)展,多方合作越來越受到人們的重視,通過重復(fù)博弈而達到合作雙贏的效果是非常好的解決途徑。
[責(zé)任編輯:田吉捷]