亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

從有限重復(fù)博弈實(shí)驗(yàn)展示人的行為可導(dǎo)致多樣性結(jié)局

2016-05-30 11:13:35黃文棣

中國(guó)集體經(jīng)濟(jì) 2016年21期

黃文棣

摘要：為了驗(yàn)證博弈理論對(duì)人類行為的解釋度，文章以傳統(tǒng)的囚徒困局為基礎(chǔ)，改編出有限重復(fù)博弈的實(shí)驗(yàn)，旨在找出理論對(duì)實(shí)際人的行為的可預(yù)測(cè)性。實(shí)驗(yàn)以高中學(xué)生為局中人其中分為普通生組和領(lǐng)袖生組，毎組各自進(jìn)行有限重復(fù)博弈游戲。結(jié)果顯示納什均衡未能充分達(dá)到，原因由于局中人的行為往往因?yàn)椴┺牡膹?fù)習(xí)性、背景、教育、訓(xùn)練、知識(shí)水平和經(jīng)驗(yàn)所影響，而未能作出最理性的決定。

關(guān)鍵詞：囚徒困局；有限重復(fù)博弈

一、引論

為了探討博弈理論用于現(xiàn)實(shí)的解釋力，筆者安排了一場(chǎng)游戲給不同學(xué)歷背景的學(xué)生博弈，本文詳細(xì)闡釋該博弈游戲的設(shè)計(jì)、理論基礎(chǔ)和結(jié)果分析。

游戲以經(jīng)典的囚徒困境為基礎(chǔ)，筆者參考了Osborne（2004）雙寡頭壟斷的合作和背叛環(huán)境，設(shè)計(jì)出一個(gè)有限重覆囚徒困境博弈的環(huán)境供學(xué)生進(jìn)行分組比賽，模擬商業(yè)競(jìng)爭(zhēng)的情況，并且要求他們向盈利最大化的方向思考。在筆者的角度，就是驗(yàn)證一下博弈結(jié)果是否符合書中所示。結(jié)果出人意料，并不完全符合書中所指，值得深思。

為了進(jìn)行比較，筆者把這個(gè)實(shí)驗(yàn)試做了兩次，一次給普通中學(xué)生玩，另一次給領(lǐng)袖生玩。領(lǐng)袖生和普通生的區(qū)別在于領(lǐng)袖生積極參與活動(dòng)，有上進(jìn)心，富團(tuán)隊(duì)精神，學(xué)習(xí)態(tài)度績(jī)極，經(jīng)常參與活動(dòng)，在身心方面都得到均衡發(fā)展；而普通生組是隨機(jī)招募，沒有特定的組織背景，學(xué)習(xí)態(tài)度也欠積極，也不愛參加有益的活動(dòng)。這個(gè)實(shí)驗(yàn)的目的就是分別讓兩班不同學(xué)習(xí)經(jīng)驗(yàn)的人進(jìn)行重覆囚徒困境的游戲，驗(yàn)證一下現(xiàn)實(shí)會(huì)否依從理論所推論的進(jìn)行。

下文將把這個(gè)實(shí)驗(yàn)的方法和結(jié)果詳細(xì)闡釋及討論。

二、實(shí)驗(yàn)設(shè)計(jì)

改編Osborne （2004）雙寡頭壟斷的合作和背叛環(huán)境，以下列出其盈利剖面。

局中人：A 組及B組學(xué)生

勝負(fù)規(guī)則：1. 使最終盈利比對(duì)手多；盈利不能為負(fù)數(shù)，否則不分勝負(fù)；

2. 盈利越多所獲得的分?jǐn)?shù)越高（追求最大盈利）；

3. 能擊敗對(duì)手的將有額外分?jǐn)?shù)。

行動(dòng)：以高價(jià)或低價(jià)發(fā)售產(chǎn)品

重覆博弈回合次數(shù)：10個(gè)回合

納什均衡：原本根據(jù)書中所指，有限重覆博弈的納什均衡是任何回合都是（低價(jià)，低價(jià)），如果就這樣給學(xué)生玩，這就太消極了，所以這個(gè)實(shí)驗(yàn)帶有附加的規(guī)則，就是最后盈利不能是負(fù)數(shù)（可以為0，經(jīng)濟(jì)學(xué)上的均衡情況），否則當(dāng)作輸，這個(gè)規(guī)則加強(qiáng)了現(xiàn)實(shí)性，因沒有商業(yè)希望盈利是負(fù)數(shù)的，而且提高學(xué)生思考的積極性，所以這個(gè)實(shí)驗(yàn)的納什均衡跟書中有點(diǎn)不同，表1利用”冷酷觸發(fā)策略” 配合后退歸納法推出各回合的納什均衡。

因?yàn)樵诘?0回合不合作不用受到下一回合懲罰，而且可以較高盈利取勝，所以第10回合的納什均衡是（低價(jià)，低價(jià)），由于累績(jī)盈利不能為負(fù)數(shù)否則當(dāng)輸論，所以各局中人以第十回合累積盈利最少為0的結(jié)局進(jìn)行后退歸納法，倒推出在第三回合中如果不合作便不論如何也獲得最少是0的盈利，這個(gè)推論引用自（施錫銓， 2000），說明在有限重復(fù)博弈中有可能導(dǎo)致在均衡結(jié)局中出現(xiàn)一次非均衡結(jié)局的博弈。以上策略也可防止對(duì)方在中途不合作導(dǎo)致自己輸?shù)簟?這個(gè)實(shí)驗(yàn)理論上會(huì)將雙方的盈利偏離了最大化的方向。

三、結(jié)果及討論

實(shí)驗(yàn)一結(jié)果：普通中學(xué)生為局中人。

實(shí)驗(yàn)一的局中人是素質(zhì)比較低的學(xué)生，兩組局中人的回報(bào)都是負(fù)回報(bào)，亦即是不能獲得任何分?jǐn)?shù)，這令人非常氣餒，原先認(rèn)為以游戲的方式引導(dǎo)他們競(jìng)爭(zhēng)，以該科目的實(shí)際分?jǐn)?shù)作為獎(jiǎng)勵(lì)，應(yīng)該可以誘發(fā)他們主動(dòng)思考和作出正面的行為，就算他們不用任何數(shù)學(xué)辨法分析出最優(yōu)的行動(dòng)，也不至于一開始B組就擺出一副完全不合作，而且必定是兩敗具傷的態(tài)勢(shì)，直接點(diǎn)說就是損人不利己，是這個(gè)博弈的最差結(jié)局。

有限重覆博弈，毎一回合所作出的行動(dòng)是由歷史行動(dòng)所影響，B組一開始就選擇以不合作的態(tài)度去玩，似乎是他們從一開始就不相信A組會(huì)合作，那為什么會(huì)這樣的呢？筆者沒有問學(xué)生們?yōu)楹文菢?，因?yàn)榇鸢付嘉幢厥钦妗Ｒ怨P者的推斷，那可能是他們根據(jù)A組的日常生活行為比較自私而導(dǎo)致B組不相信他們，又或者A組是成績(jī)比較好的一組，兩敗具傷對(duì)B組有利，因?yàn)檫@樣可以控制A組的盈利。無論如何，這個(gè)結(jié)局的出發(fā)點(diǎn)是自私和兩敗具傷，負(fù)面的態(tài)度令這個(gè)博弈在一開始便偏離了盈利最大化的目的，是自己不好也不想人家好的態(tài)度。

實(shí)驗(yàn)二結(jié)果：領(lǐng)袖生為局中人。

然而，實(shí)驗(yàn)二的局中人是素質(zhì)比較高的學(xué)生，他們從小已接受紀(jì)律訓(xùn)練，自我要求高，熱愛思考和重視道德，這樣的素質(zhì)，能沖破第三回合不合作的預(yù)測(cè)，使雙方的盈利皆有機(jī)會(huì)在0之上。這個(gè)耐性一直持續(xù)至第六個(gè)回合，實(shí)在是令人安慰的。由此可以想像他們身處的道德世界是正面的，思考也較成熟，懂得以大局為重，以自己及別人的角度思考。但從另一個(gè)角度看他們，是訓(xùn)練有素但未有戰(zhàn)爭(zhēng)經(jīng)驗(yàn)的士兵，他們的世界太美好，未曾經(jīng)歷人性的險(xiǎn)惡。

實(shí)驗(yàn)二的轉(zhuǎn)變點(diǎn)（不均衡結(jié)局）是第七回合，C組出賣了D組，導(dǎo)致往后的博弈變?yōu)椋ǖ蛢r(jià)，低價(jià)）的納什均衡。顯然，C組比D組更有野心，C組的背叛行為非但沒有受罰，反而使他們勝出。從好的方面看，他們有商業(yè)頭腦；從壞的角度看，他們的不合作較遲使出，技術(shù)上未夠爐火純清。

游戲完結(jié)后，D組同聲表示自己品格比較好一點(diǎn)，原先他們的策略是在第八局中不合作的，結(jié)果別人比他們?cè)缌艘徊?。通過這游戲，他們學(xué)會(huì)了防人之心不可無的處世之道，再問他們下次再玩這個(gè)游戲會(huì)如何，他們都說早一點(diǎn)不合作比較好。

四、結(jié)論

筆者的原意本是一個(gè)小型的博弈游戲，豈料普通中學(xué)生組的表現(xiàn)著實(shí)令人失望。于是筆者便決定跟其他人再玩一次，結(jié)果就由一個(gè)小博弈變成驗(yàn)證博弈論的實(shí)驗(yàn)。

兩個(gè)實(shí)驗(yàn)的結(jié)果偏離了理論所預(yù)測(cè)的結(jié)果，可以分兩方面解釋：

1.局中人的思考復(fù)雜性。局中人只是高中生，沒有受過嚴(yán)格經(jīng)濟(jì)學(xué)或數(shù)學(xué)訓(xùn)

練，而且之前也沒接觸過這種游戲，不懂其思考方法，可見知識(shí)是重要的。

2.局中人生活的背景。亦即是局中人對(duì)對(duì)手的歷史行為的認(rèn)識(shí)程度，實(shí)驗(yàn)一

和實(shí)驗(yàn)二兩班局中人身處的背景不同，行為偏好也不同，普通生就是因?yàn)閷?duì)游戲態(tài)度不積極，結(jié)果兩敗具傷，極其負(fù)面，不能以理性為前題預(yù)測(cè)和解釋他們的行為。因此，透過教育改善人的積極性是需要的，這樣可減少一點(diǎn)社會(huì)成本。

這個(gè)實(shí)驗(yàn)證明了良好的教育能塑造出正面的道德行為，至少他們的出發(fā)點(diǎn)是正面的。這個(gè)社會(huì)上需要設(shè)定多些機(jī)制保障正面的行為，否則當(dāng)人學(xué)會(huì)了有限重覆博弈致勝策略后，懲罰好人將會(huì)成為主流，人們將只顧自己的利益而破壞了社會(huì)的整體盈利。然而，在現(xiàn)實(shí)商業(yè)中，也不一定需要以盈利較高勝出游戲，所以，正如施錫銓（2000）所指，在重復(fù)有限博弈中可通過談判協(xié)商來加強(qiáng)雙方合作的意欲，使雙方達(dá)致能使盈利最大化的納什均衡。

參考文獻(xiàn)：

[1]Osborne， M.J. Introduction to Game Theory. Ch.2.2.2.2004.

[2]施錫銓.博弈論[M].上海財(cái)經(jīng)大學(xué)出版社，2000.

（作者單位：上海財(cái)經(jīng)大學(xué)香港教學(xué)點(diǎn)）