亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        博弈論中“一報(bào)還一報(bào)”策略與國(guó)際合作

        2013-12-31 00:00:00徐愷
        經(jīng)濟(jì)研究導(dǎo)刊 2013年23期

        摘 要:分析了囚徒困境、重復(fù)囚徒困境之間的納什均衡是不同的,因此,對(duì)國(guó)際合作的影響也是不同的。由此引出“一報(bào)還一報(bào)”的策略對(duì)促進(jìn)合作的影響。進(jìn)而提醒在運(yùn)用博弈論分析國(guó)際合作時(shí)需要注意中偏好假設(shè)的質(zhì)疑與回應(yīng)。

        關(guān)鍵詞:博弈論 重復(fù)囚徒困境 “一報(bào)還一報(bào)策略”

        中圖分類號(hào):F270 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-291X(2013)23-0022-03

        一、重復(fù)囚徒困境與合作

        囚徒困境博弈可以說(shuō)是國(guó)際政治、國(guó)際政治經(jīng)濟(jì)學(xué)研究中運(yùn)用最多的博弈模型了。但是囚徒困境博弈模型的一些重要特征并沒(méi)有被完全分析過(guò)。因此,首先,我們來(lái)具體分析囚徒困境的基本假設(shè)、收益結(jié)構(gòu)等。在囚徒困境博弈中,有兩個(gè)國(guó)家S1、S2。他們有兩種選擇:合作與背叛。假設(shè)他們不能通過(guò)言語(yǔ)溝通(這個(gè)假設(shè)也不是完全不合理的,例如雙方裁軍,雙方語(yǔ)言溝通也未必能阻止背叛),因此,各國(guó)都是在不知道對(duì)方選擇的情況下做出自己的選擇。如果兩國(guó)都合作,得到收益為3;如果兩國(guó)都背叛,將都得到收益1;如果一方合作,另一方背叛,那么合作的一方就由于被對(duì)方欺騙,收益為0。其收益矩陣為:

        圖1 囚徒困境

        注 R:對(duì)雙方合作的獎(jiǎng)勵(lì),T:對(duì)背叛誘惑的收益,S:給笨蛋的得益。P:雙方背叛的得益。

        其中,下標(biāo)1、2分別S1、S2的選擇。表示括號(hào)內(nèi)的左邊的數(shù)字代表S1的收益,右邊代表S2的收益。S1的偏好順序是D1C2> C1C2> D1D2> C1D2。由于博弈的對(duì)稱性,S2的偏好也是一樣。由于雙方占主導(dǎo)的策略是背叛。因此,納什均衡就是相互背叛。

        但是,在重復(fù)囚徒困境博弈時(shí),還要假定以下幾個(gè)條件:

        1.假定S1或者S2不能輪流使用合作和背叛來(lái)得益。其含義就是交替地背叛對(duì)方和被對(duì)方背叛的收益沒(méi)有雙方合作好。用公式表示就是R>(T+S)/2。

        2.參與人之間沒(méi)有什么手段可以用來(lái)實(shí)施威脅和做出承諾。① 這一條要求就是參與人可以自由選擇策略。

        3.假定不能在博弈之前確定對(duì)方會(huì)如何選擇。對(duì)對(duì)方選擇的認(rèn)識(shí)只能來(lái)自于與對(duì)方的博弈過(guò)程。

        4.不能消滅對(duì)方,也不能放棄對(duì)局。因此,對(duì)策者在每次對(duì)局中時(shí)選擇合作和背叛。

        5.不能改變對(duì)方的收益值。這個(gè)收益值已經(jīng)包含了每個(gè)對(duì)策者關(guān)于對(duì)方利益的考慮。②

        根據(jù)博弈重復(fù)的次數(shù),合作的可能性是有差別的。如果囚徒困境博弈進(jìn)行有限次,那么,雙方?jīng)]有合作的動(dòng)機(jī)。因?yàn)?,最后一次大家顯然不合作,由于預(yù)先知道雙方在最后一次要背叛,倒數(shù)第二次也就沒(méi)有合作的動(dòng)機(jī)。那么兩個(gè)自私者從第一步起就會(huì)背叛。

        但是博弈進(jìn)行無(wú)限次時(shí),情形就不同了。這里涉及未來(lái)的折現(xiàn)(the shadow of future)。未來(lái)折現(xiàn)是在重復(fù)博弈中一個(gè)很重要的概念。在阿克塞爾羅德看來(lái),參與人傾向于認(rèn)為未來(lái)所得的價(jià)值隨著時(shí)間的推移而減少。其次,參與人總會(huì)有些機(jī)會(huì)不再相遇。因此,下一步的收益總是被看做比當(dāng)前一步少。未來(lái)的序列收益可以通過(guò)折現(xiàn)系數(shù)(假定為w)而計(jì)算出來(lái)。假如每一步得到收益,那么下一步的收益也是1,但是只值現(xiàn)在的w(即1·w),依次類推,一般情況下,每一步收益為1分那么就有1+w+w2+w3+…=1/(1-w)。在無(wú)限次囚徒困境中,由于有可能當(dāng)前都背叛而得到的收益不能超過(guò)一直合作所能得到的收益,那么,理性的行為者就會(huì)選擇合作。這里問(wèn)題的關(guān)鍵就在于折現(xiàn)系數(shù)的大小了。

        例如,兩個(gè)參與人,假定另一個(gè)選擇“一報(bào)還一報(bào)”策略。這一個(gè)參與人選擇“一直背叛”策略或者選擇“一直合作”策略,那么,選擇“一直背叛”策略的收益為V1=T+wP+w2P+…=T+wP/(1-w)。如果這個(gè)選擇“一直背叛”策略的人改變策略,選擇一直合作,那么收益為V2=R+Rw+Rw2+…=R/(1-w)。那么這個(gè)參與人就會(huì)比較兩者的收益,如果為V2>V1,即R/(1-w)>T+wP/(1-w)或者w>(T-R)/(T-P),,那么這個(gè)就會(huì)選擇一直合作。

        從這里我們可以看出,一是在“囚徒困境”中,表現(xiàn)最好的策略也要取決于對(duì)方的策略。二是折現(xiàn)系數(shù)w很大,那么合作的可能性就是存在的。這也就否定了一直背叛是最優(yōu)策略。

        在重復(fù)囚徒困境中,既然沒(méi)有獨(dú)立于對(duì)方的最好策略,那么,什么策略表現(xiàn)得較好呢?阿克塞爾羅德利用計(jì)算機(jī)進(jìn)行兩次競(jìng)賽(the tournament approach),①發(fā)現(xiàn)最為簡(jiǎn)單的策略贏得了比賽;并且第二次計(jì)算機(jī)競(jìng)賽中,在大家知道第一次競(jìng)賽結(jié)果的基礎(chǔ)上,還是取得了勝利。他得出結(jié)論:“一報(bào)還一報(bào)”策略在競(jìng)賽中勝出。

        二、“一報(bào)還一報(bào)”策略(TIT-FOR-TAT Strategy)

        (一)策略定義與特征

        “一報(bào)還一報(bào)”策略在國(guó)內(nèi)大部分人都理解為“以其人之道,還治其人之身”、“以牙還牙”等,但這些詞語(yǔ)都是貶義詞,就有誤解“一報(bào)還一報(bào)”策略的意義。因此,有必要說(shuō)明“一報(bào)還一報(bào)”策略的真正含義?!耙粓?bào)還一報(bào)”的策略很簡(jiǎn)單,就是首先第一步選擇合作,其后的每一步都選擇跟對(duì)方上一步相同的策略。但是“一報(bào)還一報(bào)”策略卻具有一般策略所不具有的優(yōu)點(diǎn)。

        阿克塞爾羅德給出了“一報(bào)還一報(bào)”策略6種優(yōu)良特征:一是具有善良性,它不首先背叛。在計(jì)算機(jī)競(jìng)賽中,凡是善良的規(guī)則之間相處得很好,也就是能得到較高收益。只要對(duì)方不背叛,每個(gè)善良的規(guī)則一定是持續(xù)合作直到最后一步。二是具有寬容性。就是別人只背叛一次,“一報(bào)還一報(bào)”只報(bào)復(fù)別人的一次。而那些不太寬容的規(guī)則有可能會(huì)在報(bào)復(fù)別人的同時(shí),也是在自我報(bào)復(fù),姑而在計(jì)算機(jī)競(jìng)賽中這些不太寬容的規(guī)則收益也較低。因?yàn)椋耙坏┮环降谋撑颜T發(fā)一長(zhǎng)串的報(bào)復(fù)和反報(bào)復(fù),雙方都要吃虧。”這是人們考慮“反射效應(yīng)(echo effect)”不深入的緣故。一般的人都會(huì)想第一層次,“即選擇的直接效果,那就是背叛比合作來(lái)得收益高。第二層次是選擇的間接效果,即考慮對(duì)方是否會(huì)出發(fā)自己的背叛。但是第三層次就很少有人考慮了,即為了反應(yīng)對(duì)方的背叛行為,有人就會(huì)重復(fù)甚至擴(kuò)大自己以前的挑釁性選擇,……一個(gè)孤立的背叛變成了一連串無(wú)休止的報(bào)復(fù)。”②三是具有韌性(robustness)。就是“一報(bào)還一報(bào)”策略不僅能夠跟那些不太善良的策略相處而得到較高的收益,而且也能夠跟那些善良的策略相處而得到較高的收益,這就表明它在很大的環(huán)境中表現(xiàn)極佳。四是策略具有明晰性,在使用“一報(bào)還一報(bào)”策略時(shí),別人能夠很快識(shí)別出你的策略。五是不占他人便宜。從兩次競(jìng)賽的結(jié)果,“一報(bào)還一報(bào)”策略并不比其他的策略的收益高多少。因?yàn)?,試圖占便宜可以引起如下的風(fēng)險(xiǎn):一種是如果一個(gè)策略用背叛試探是否可以占便宜,它就得冒被那些可激怒的規(guī)則報(bào)復(fù)的風(fēng)險(xiǎn);另一種是雙方反擊一旦開(kāi)始,就難以擺脫僵局;第三種是放棄了其他的一些合作機(jī)會(huì)。③六是報(bào)復(fù)性,而且是即刻報(bào)復(fù)。在某些情況下,即刻報(bào)復(fù)比等一段時(shí)間才報(bào)復(fù)是有好處的,因?yàn)榧纯虉?bào)復(fù),可以讓對(duì)方知道背叛是會(huì)受到立即懲罰的。

        那么既然“一報(bào)還一報(bào)”策略自身有如此多的優(yōu)點(diǎn),但也還是一個(gè)缺點(diǎn),那就是報(bào)復(fù)性可以形成惡性循環(huán)。比如對(duì)方由于一次疏忽而選擇了背叛,那么“一報(bào)還一報(bào)”策略也就是背叛,這樣對(duì)方可能又會(huì)選擇背叛,于是就有可能形成了惡性循環(huán)。

        雖然有形成惡性循環(huán)的可能性,但是“一報(bào)還一報(bào)”策略還是一個(gè)善良的策略。那么合作如何建立,又如何維持了?

        (二)合作的建立和集體穩(wěn)定性

        一般說(shuō)來(lái),合作分為三個(gè)階段:起始階段、中間階段和最后階段。起始階段在無(wú)條件背叛的世界里合作如何產(chǎn)生的問(wèn)題。中間階段是基于回報(bào)的策略能夠在許多不同類型的策略組成的環(huán)境中成長(zhǎng)起來(lái)。最后階段是,基于回報(bào)的合作一旦建立起來(lái),就能防止其他不太合作的策略的侵入。

        第一,侵入和集體穩(wěn)定性。整個(gè)群體都采用一個(gè)策略,而一個(gè)新的策略的個(gè)體進(jìn)入這個(gè)群體中來(lái),這個(gè)新來(lái)者將只和原有群體中的個(gè)體相遇。而原來(lái)群體中的個(gè)體可以看作只和原有群體中的另一些個(gè)體相遇,因?yàn)檫@個(gè)新來(lái)者只是群體中的個(gè)體可以忽略的部分。因此,如果新來(lái)的個(gè)體在與原來(lái)的個(gè)體相遇時(shí)比兩個(gè)原有的個(gè)體相遇時(shí)收益高,那么就稱新來(lái)的策略可以侵入原有策略。由于原有的個(gè)體幾乎占有整個(gè)群體,所以侵入的概念等價(jià)于這個(gè)變異的個(gè)體干得比群體平均要好。如果一個(gè)策略不能被其他策略侵入,這個(gè)策略就是集體穩(wěn)定的。

        第二,“總是背叛”策略總是集體穩(wěn)定的?!翱偸潜撑选钡募w穩(wěn)定性就是意味著沒(méi)有任何單一的個(gè)體可以指望比繼續(xù)背叛和不合作做得更好。如果對(duì)方一定背叛,你合作就一定吃虧,你的收益為0。在一個(gè)都采取“總是背叛”的群體,一個(gè)人每一步收益都是1,如果沒(méi)有其他人愿意合作的話,那么任何都不可能得到更高的收益。如果你合作的話,你被對(duì)方剝削。因此,在這樣的群體中,任何個(gè)人合作是沒(méi)有用處的。這個(gè)情形最為典型的是第一次世界大戰(zhàn)之前歐洲各國(guó)之間的軍備競(jìng)賽。如果大家都在擴(kuò)充軍備,而你不擴(kuò)充軍備的話,那就等于自殺。這一點(diǎn)我們可以在丘吉爾的回憶錄中清晰的可見(jiàn)的。

        第三,當(dāng)未來(lái)足夠重要時(shí),“一報(bào)還一報(bào)”是集體穩(wěn)定的。并且未來(lái)重要性跟囚徒困境中收益結(jié)構(gòu)有關(guān)系。這一命題也是國(guó)際關(guān)系中論證國(guó)際合作是可能出現(xiàn)的重要證據(jù)之一,特別是新自由制度主義。因?yàn)樵趪?guó)際關(guān)系中,國(guó)家消失的可能性很小,這樣就滿足了無(wú)限次博弈的條件,而且隨著國(guó)際交往的增多,一次合作收益的損失(相對(duì)于背叛而言)可以在將來(lái)一次合作中彌補(bǔ)起來(lái),于是未來(lái)就會(huì)變得重要。于是采取“一報(bào)還一報(bào)”的策略就不會(huì)有其他的策略可以侵入。

        第四,只有當(dāng)未來(lái)足夠重要時(shí),任何可能首先合作的策略才可能是集體穩(wěn)定的。因?yàn)橐粋€(gè)策略是要集體穩(wěn)定時(shí),就必須保護(hù)自己不受任何策略包括“總是背叛”策略的侵入。這里是很直觀的,比如你在首先合作時(shí)被欺騙了一次,你要有報(bào)復(fù)的機(jī)會(huì)來(lái)懲罰對(duì)方。這樣對(duì)方會(huì)盤算如果遭到報(bào)復(fù)后其收益是否能大過(guò)一直合作,這也就命題的前提條件:未來(lái)足夠重要。

        第五,對(duì)于善良的策略,如果是集體穩(wěn)定的,它就必須能被對(duì)方的第一個(gè)背叛激怒?!叭绻粋€(gè)善良的策略不被在第n步所激怒,那么它就不是集體穩(wěn)定的,因?yàn)樗鼙恢辉诘趎步背叛的策略侵入?!边@一命題初看起來(lái)有點(diǎn)不好理解,其實(shí)道理還是明白的。比如,一個(gè)侵入的策略在第n步背叛,因?yàn)榍懊鎛-1步合作的收益和加上這一背叛的收益,以及雙方一直背叛的收益不能超過(guò)了這個(gè)侵入策略一直合作所能得到的收益,那么原來(lái)的策略就是一個(gè)穩(wěn)定的策略。

        第六,能以一個(gè)特定小概率的小群體侵入“總是背叛”的策略,那是那些具有最大識(shí)別力的策略,如“一報(bào)還一報(bào)”。即是只要“一報(bào)還一報(bào)”策略與“一報(bào)還一報(bào)”策略相遇的比例為p,那么,它與“總是背叛”策略相遇的比例就是1-p。只要p值達(dá)到能滿足“一報(bào)還一報(bào)”策略之間的平均收益超過(guò)了原來(lái)“總是背叛”策略與“總是背叛”相遇的收益,那么采用“一報(bào)還一報(bào)”策略的小群體就能侵入“總是背叛”群體。

        第七,如果一個(gè)善良的策略不能被單個(gè)個(gè)體侵入,那么它也不能被這類個(gè)體的小群體侵入。一旦合作建立起來(lái),不遵守合作一個(gè)小的新來(lái)者群體不能改變其原來(lái)合作的情形。例如在美國(guó)眾議院中議員之前的合作,由于新來(lái)的議員的人數(shù)較少,這就不會(huì)改變?cè)瓉?lái)的情形。

        通過(guò)以采取特殊的策略,可以證明在無(wú)條件的背叛情形下也能出現(xiàn)合作,這是第一層意思。這也否定了現(xiàn)實(shí)主義在無(wú)政府狀態(tài)下不可能合作的結(jié)論。當(dāng)然,這樣的合作是要有條件,如果由一些散亂的個(gè)體去努力,合作不可能建立。因?yàn)椋麄儧](méi)有足夠的機(jī)會(huì)相遇與再相遇。第二層意思是只要具有識(shí)別能力的個(gè)體之間有即使是很小的比例彼此相遇,合作也可能小群體內(nèi)先建立起來(lái)。第三層次是在小群體內(nèi)的合作可以擴(kuò)展到更大的群體中去。這些命題構(gòu)成阿克塞爾羅德的理論核心。而且命題6和命題7使阿克塞爾羅德成為博弈演化論中的先驅(qū)之一。那么,合作既然能夠在自私者之間出現(xiàn),我們?nèi)绾闻嘤献髂兀?/p>

        (三)合作的培育

        博弈論從兩個(gè)方面來(lái)提出建議來(lái)促進(jìn)合作。認(rèn)為在“重復(fù)囚徒困境”中,應(yīng)該遵行四個(gè)原則:

        一是不要嫉妒。博弈論認(rèn)為,在現(xiàn)實(shí)生活中,多大數(shù)情況都是非零和的。但是人們喜歡比較,經(jīng)常拿別人的成功跟自己比較,這樣就容易導(dǎo)致嫉妒。在國(guó)際關(guān)系理論中,其實(shí)就是相對(duì)收益與絕對(duì)收益的爭(zhēng)論。而在“囚徒困境”的形式下,抵消對(duì)方的優(yōu)勢(shì)只能通過(guò)背叛來(lái)實(shí)現(xiàn)。但也會(huì)造成惡性循環(huán),背叛導(dǎo)致更多的背叛和對(duì)對(duì)方的懲罰,這樣在給別人懲罰的同時(shí),也傷害了自己。因此,在一個(gè)非零和的世界里,為了自己做得好,你沒(méi)有必要非得比對(duì)方做得更好。特別是當(dāng)你要和許多不同的對(duì)手打交道時(shí)。① 但是,這里只是不要更別人比較,但要跟自己比較,要讓自己做得最好。

        二是不要首先背叛。這一點(diǎn)博弈論成為善良性規(guī)則。首先,不善良的規(guī)則有兩個(gè)壞處。第一是一些運(yùn)用相當(dāng)復(fù)雜的策略來(lái)試探是否可以欺騙而能逃脫懲罰,但是計(jì)算機(jī)競(jìng)賽的結(jié)果其收益都不是很好,因?yàn)橛行┣樵笀?bào)復(fù)而不被占便宜的策略存在。第二是根據(jù)命題7,不善良的規(guī)則很難在采用善良策略的群體中存在下來(lái)。由于較差的策略由于演進(jìn)的關(guān)系而被淘汰,剩下的就是較為善良的策略,這樣,也就不能生存下來(lái)了。那么,是否可以先背叛再合作呢?當(dāng)然是可以的,正所謂是“不打不相識(shí)”,但這是一個(gè)很有風(fēng)險(xiǎn)的策略。容易導(dǎo)致惡性循環(huán)。值得注意的是這里不要首先背叛是有前提的,一是要能有較長(zhǎng)時(shí)間的接觸(the future of shadow)。其次,在“總是背叛”等群體的情況下,合作是沒(méi)有回報(bào)的。因此,其結(jié)論就是分清其具體情形,在決定是否首先背叛,而不是只做“好好先生”。從這里我們也可以看出,國(guó)際關(guān)系是復(fù)雜的,相對(duì)收益和絕對(duì)收益的強(qiáng)調(diào)是應(yīng)該的,而且也是可能的,只是要區(qū)分具體的情形,具體問(wèn)題具體分析。

        三是對(duì)合作和背叛都要給予回報(bào),這一點(diǎn)可以從“一報(bào)還一報(bào)”優(yōu)越性中看出。“一報(bào)還一報(bào)”策略就是不管合作和背叛都給以同樣的回報(bào)。因?yàn)榻o予合作以回報(bào),這在倫理上是很正常的。但是,在給予惡人時(shí),倫理上都是要仁慈、寬恕。但正是這樣,才給惡人以欺負(fù)好人的機(jī)會(huì)。比如,像采取“兩報(bào)還一報(bào)”策略,如果對(duì)方違反兩次,就給予報(bào)復(fù);如果只違反一次,那么寬恕。這樣,就會(huì)給惡人有空子。因此,博弈論總結(jié)到,最優(yōu)寬恕水平與環(huán)境有關(guān)。特別是如果主要的危險(xiǎn)是來(lái)自那些善于占“好說(shuō)話”規(guī)則便宜的策略,那么,太多的寬恕就要付出代價(jià)。對(duì)背叛類似一對(duì)一的反應(yīng)可能在大多數(shù)情況下都是相當(dāng)有效的。

        四是不要耍小聰明。計(jì)算機(jī)競(jìng)賽的結(jié)果說(shuō)明,策略復(fù)雜不一定能贏得勝利。因?yàn)樵凇扒敉嚼Ь场敝?,雙方的行為都是相互影響的,自身的行為會(huì)影響到別人對(duì)你的預(yù)期(expectation),在決策時(shí)需要知道對(duì)方的行為,而對(duì)方行為的形成有來(lái)自于對(duì)你的預(yù)期,如果你給對(duì)方的預(yù)期是不清楚的話,這樣,你也就不能清晰地判斷對(duì)方行為,這樣就像是害人反而害己。所以,“一報(bào)還一報(bào)”策略具有清晰性,讓對(duì)方了解你的行為,這樣你也更好地形成對(duì)對(duì)方行為的判斷。

        博弈論是可以在國(guó)際關(guān)系理論運(yùn)用,論證合作在無(wú)政府狀態(tài)下合作是可能的,為新自由制度主義的產(chǎn)生和發(fā)展提供重要的理論支持。雖然也遭到一些批評(píng),但對(duì)于研究國(guó)際合作還是具有重要的理論意義。

        亚洲国产一区二区网站| 精品国精品国产自在久国产应用| 国产午夜亚洲精品理论片不卡| 国产免费一区二区av| 国产日产亚洲系列首页| 国产乡下妇女做爰| 午夜福利麻豆国产精品 | 国产nv精品你懂得| 亚洲最大av免费观看| 新视觉亚洲三区二区一区理伦| 国产精品久久久在线看| 久久婷婷人人澡人人爽人人爱| 放荡的闷骚娇妻h| 日韩中文字幕网站| 99伊人久久精品亚洲午夜| av无码国产精品色午夜| 国产精品成人国产乱| 亚洲V在线激情| 日韩激情av不卡在线| 级毛片内射视频| 中国农村熟妇性视频| 人妻少妇不满足中文字幕| 久久亚洲精品成人av观看| 亚洲中文字幕久久精品品| 日韩少妇内射免费播放| 国产桃色在线成免费视频| 青青草在线免费观看视频| 国产精品无码一区二区三区| 人人妻人人澡人人爽精品欧美| 青青手机在线视频观看| 亚洲日本精品国产一区二区三区| 亚洲中文字幕在线观看| 国产精品27页| 亚洲午夜精品第一区二区| 日韩精品极品视频在线观看免费 | 国产亚洲成年网址在线观看| 日韩精品视频高清在线| 中文字幕欧美人妻精品一区| 久久久久久久妓女精品免费影院| 亚洲一区二区三区自拍麻豆| 乱码1乱码2美美哒|