——基于路徑2的有限博弈分析"/>

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        哺乳動物腦在博弈中的影響探究
        ——基于路徑2的有限博弈分析

        2016-07-21 07:09:45吉寶衛(wèi)杜玉林
        山西青年 2016年12期

        吉寶衛(wèi) 杜玉林

        華東政法大學,上?!?01600

        ?

        哺乳動物腦在博弈中的影響探究
        ——基于路徑2的有限博弈分析

        吉寶衛(wèi)杜玉林

        華東政法大學,上海201600

        摘要:本文嘗試探究哺乳動物腦在博弈中所發(fā)揮的作用,認為具有公平、互利等特征的社會偏好(陳葉烽,2012)行為源于哺乳動物腦,通過兩條路徑去影響博弈。路徑2是指哺乳動物腦通過系統(tǒng)1最終改變前景理論中的參考點來干擾系統(tǒng)2做出理性的決策。

        關鍵詞:社會偏好理論;哺乳動物腦;有限次博弈

        一、文獻綜述

        Doux(2002)認為情感事件通過“場景記憶”進入哺乳動物腦,并被保存起來。費爾(2004)指出哺乳動物腦(中腦)對高等動物來說,是主管情感的腦區(qū)。這一腦區(qū)在哺乳動物出現(xiàn)的時候已經(jīng)形成,人類的大腦皮層是在后來的長期進化中形成的,覆蓋在哺乳動物腦系統(tǒng)上。哺乳動物腦所激發(fā)出來的主要是情感型行為。因為早期的動物沒有大腦,很多具有重大生存價值的行為,無法通過理性思維來實現(xiàn),所以哺乳動物腦激發(fā)出來的行為無需理性的推斷。據(jù)此我們認為社會偏好的“場景記憶”存儲在哺乳動物腦,并且通過路徑1直接產(chǎn)生不受理性控制的情感行為。

        卡內(nèi)曼(2012)認為系統(tǒng)1是自主而初始的印象和感覺,它是系統(tǒng)2中信息的主要來源和決策依據(jù)。系統(tǒng)1包括一些與生俱來的能力,這些能力與其他動物的本能一樣,比如確定聲源位置。而現(xiàn)代生物學認為,確定聲源位置的初級聽反射是由哺乳動物腦(中腦)控制完成的。我們據(jù)此認為系統(tǒng)1與哺乳動物腦有著某種信息溝通方式,甚至可以說哺乳動物腦是承載系統(tǒng)1的一個實體組成部分。我們認為哺乳動物腦是承載系統(tǒng)1部分功能的一個實體,系統(tǒng)1是先于大腦皮層形成的,從事簡單的大腦規(guī)律性應答活動,并為后來形成的系統(tǒng)2提供支持。路徑2是指存儲情感行為的哺乳動物腦通過系統(tǒng)1最終改變前景理論(Kahneman,1979)中的參考點來干擾系統(tǒng)2做出理性的決策。

        Kahneman(1979)在對前景理論編碼的論述中指出人們通常關注的是收益和損失,而不是財富或福利的最終狀態(tài),收益和損失是相對于某一參考點而言的,而參考點的位置以及收益和損失的編碼,會受到提供期望的表達方式和決策者預期的影響。表達方式對于參考點的影響已經(jīng)得到了大量實驗的證實,而本文提出的路徑2探討的是預期的改變,即存儲社會偏好行為的哺乳動物腦,通過影響系統(tǒng)1中決策者的預期,進而最終改變系統(tǒng)1中的參考點。系統(tǒng)1的預期與通常的預期不同,通常的預期需要經(jīng)過嚴密的邏輯分析才能產(chǎn)生,而這里的預期不需要這一前提。因為它是由系統(tǒng)1完成的,卡尼曼(2012,P5——9)指出系統(tǒng)1幾乎無法處理邏輯和統(tǒng)計的問題,但它仍然會對外界進行預測,且大多數(shù)時候是恰當和準確的,這可以使系統(tǒng)2免于承擔過多不必要的工作。因此這里的預期就像前景理論中的權重函數(shù)一樣,無法通過邏輯或理論的推導得出,只能經(jīng)過大量實驗才能檢驗其是否具有客觀存在性。我們還認為參考點的選擇是由系統(tǒng)1負責的,如果參考點的選擇是由具有更強理性思維的系統(tǒng)2負責的,表達方式的改變將無法改變參考點,這與大量的實驗結果不符。

        二、基于路徑2的相對收益分析

        假設A、B進行有限次囚徒博弈,策略集如表1所示,“()”里是絕對收益的數(shù)值,“[]”里是考慮參考點后相對收益的數(shù)值。

        表1 囚徒困境的有限次博弈

        由于最后一局不存在任何可信的威脅或許諾(Schelling,1960),通過逆向歸納法可知A、B一開始就都選擇不合作,最終有限次博弈的結果和單次博弈的結果沒有什么區(qū)別。路徑2的影響:哺乳動物腦與系統(tǒng)1有著密切聯(lián)系,而系統(tǒng)1負責向系統(tǒng)2提供參照點,于是系統(tǒng)1在社會偏好的影響下向系統(tǒng)2提供了合作的收益做為參考點,這導致不合作的相對收益是一種損失。Tversky(1981)指出結果相對于參考點看起來是一種收益,在確定效應作用下就會傾向于規(guī)避風險;反之,結果看起來是一種損失,決策者就會是風險偏好者。因此,為了規(guī)避這種損失A、B都愿意賭一把:嘗試選擇合作。

        我們認為路徑1是通過自我激勵完成合作的行為,而路徑2則是通過自我懲罰的機制完成對系統(tǒng)2不合作行為的抑制和對合作行為的嘗試。我們還認為路徑2在單局博弈中的作用要遠遠小于路徑1,但在重復博弈中卻又大于路徑1。系統(tǒng)2也具有預測能力,但系統(tǒng)2的理性預測(逆向歸納法)不僅無法使相對收益獲得累加性,而且還會糾正系統(tǒng)1的社會偏好參照點。除此之外,累加性還需要一個重要的結論:有限博弈中首局如果有人選擇不合作,那么雙方以后就幾乎沒有合作的可能性。這里我們將這一結論命名為“BW”結論,下面我們將證明這一結論的成立性。

        根據(jù)鮑爾斯(2004)的仿真實驗,人性38.2%自私,37.2%正義,24.6%善,本文據(jù)此推斷系統(tǒng)1已經(jīng)在進化中形成了上述初始的印象和感覺,即系統(tǒng)1相信博弈中存在合作的可能性。博弈被分為“零和”和“非零和”博弈,有限次博弈屬于非零和博弈,在非零和博弈中雙方利益有些是一致的有些是不一致的,雖然存在占優(yōu)均衡,但博弈雙方還是存在通過合作改善彼此利益的激勵。以A為例,A會考慮去爭取那些“一致的利益”,并且A有理由相信B也會做同樣的選擇,即A相信B有合作的可能性。如果博弈中存在合作可能性,A就必須在預期B策略的基礎上進行最恰當?shù)姆磻?,進而A就不再只面對一個占優(yōu)策略。

        (一)命題1:最優(yōu)反應策略應該具備“報復性”

        “報復性”是指在對方“無緣無故”的背叛之后立即以背叛報復(阿克塞爾羅德,2007)。在阿克塞爾羅德的計算機競賽中,所有的策略可以被分為兩類:

        1.善意策略,典型代表是“弗里德曼”,它的特點是絕不首先背叛,但當對方背叛時也會立即回應;

        2.惡意策略,典型代表是“唐寧”,它的特點是偶爾(無緣無故)背叛。

        首先看善意策略,由于沒有主動背叛的機制,只要是對方背叛就一定是無故的背叛,對方一定是惡意策略,事實上很多惡意策略都是“善意策略”的變形,報復性不僅可以避免損失的擴大,而且還會向對方清晰的發(fā)出“魯棒性”的信息,“迫使”許多惡意策略放棄“嘗試”展現(xiàn)“善”的一面。遇到善意策略時,報復性沒有任何損害,因此我們說善意策略應該具有報復性。

        下面看惡意策略,惡意要面對如下問題:1、主動背叛的機制;2、識別對方的反應;3、避免循環(huán)報復。區(qū)分報復與無故背叛是“識別對方的反應”中最難解決的問題,“喬斯”和“檢驗者”在這方面做的都很差,“喬斯”是在雙方都合作的情況下隨機背叛,并將對方下一局的背叛視為無故背叛進行報復,這導致報復循環(huán)。“檢驗者”則首局選擇背叛,并將下一局的背叛視為報復,如果遭到報復會用合作請求“原諒”,但“檢驗者”只進行一次這樣的識別。“唐寧”、“鎮(zhèn)定者”則不斷的進行識別,以防止做得太過導致報復循環(huán),但最后仍不理想,究其原因主要是因為:一、都低估了善意策略的報復性,盡管它們能占到便宜,但這導致雙方都損失了持續(xù)的合作收益;二、遇到惡意策略時,都以各自的方式摻雜背叛,因此識別對方的行為幾乎是不可能的,尤其是雙方都是這種不斷識別的策略。并且這些策略都極力想避免報復的循環(huán),導致其魯棒性不明顯,最終無法迫使“嘗試”的策略展現(xiàn)出“善”的一面。從本質上來看,惡意策略都應該對無故的背叛進行立即報復,之所以有些策略沒有及時進行報復是因為這些策略無法識別無故的背叛。

        無論善意還是惡意策略,都能識別出首局的背叛,因為沒有博弈的歷史,首局的背叛一定是無故的背叛。阿克塞爾羅德的競賽雖然無法窮盡所有策略,但窮盡了所有策略的基本性質,并且命題1也將策略的范圍縮小到“最優(yōu)反應策略”上來,并沒有包含所有的策略。綜上所述,最優(yōu)的策略應該具備“報復性”。

        (二)命題2:在有限次博弈中首局釋放合作意愿的效果最好、成本最低、希望最大

        由于不存在任何可信的威脅或許諾,因此A、B可利用的就是的歷史博弈,想要釋放合作的意愿只能通過博弈中的特定行為。由于首局博弈行為是后面判斷對方策略的重要參考,也就是說首局釋放信號影響的局數(shù)最多,因此首局釋放合作意愿的效果最好。

        表2 釋放合作意愿的機會成本或額外收益

        (三)命題3:在有限次博弈中首局選擇不合作,那么雙方以后就沒有合作的可能性

        表面上被動的善意策略是在主動追求持續(xù)的合作收益,而表面上主動的惡意策略卻是在被動的損失持續(xù)的合作收益。根據(jù)命題2的結論,我們可以推出最優(yōu)的惡意策略在首局一定選擇合作,因為首局的背叛不僅能夠被清晰的識別出是無故的,而且也向對方釋放自己是惡意策略的信號,這將導致該策略很難繼續(xù)獲得背叛的額外收益,所以惡意策略在首局一定要“偽裝”出具有合作的意愿。這里非最優(yōu)的惡意策略包括但不限于“唐寧”和“檢驗者”,它們的共同特點是一上來(首局)就選擇背叛,結果導致一系列的損失。在所有的最優(yōu)反應策略中,只有“完全背叛”策略才會在首局博弈中不表達“合作的意愿”。

        假設B在首局沒有合作,A會推斷:B在首局既然沒有釋放信號,那么B一定使用的是“完全背叛”的策略,因此A的最佳策略就是絕不首先釋放合作的信號。同樣B會預期到A會采取這一策略,因此B在以后的博弈中也沒有選擇合作的激勵,所以B要么在首局選擇合作,要么就一直背叛。綜上所述,在有限博弈中首局如果有人選擇不合作,那么雙方以后就沒有合作的可能性。

        (四)BW結論:有限博弈中首局如果有人選擇不合作,那么雙方以后就幾乎沒有合作的可能性

        “BW”結論是對命題3結論的削弱,因為系統(tǒng)1的直觀印象更符合“BW”結論。這里還需要指出的是,系統(tǒng)1的運行是非常高效和迅速的,“BW”結論正是對系統(tǒng)1運行過程的一個模擬,系統(tǒng)1本身無需上面的三個命題就能直接得出“BW”結論,時間也非常的短。

        三、相對收益對有限博弈的通用影響

        表3 有限N次囚徒博弈

        3.投入品增多。進入夏秋季節(jié),漁用飼料、肥料及漁藥等投入品使用頻率較高,使用量也比其他季節(jié)增多,大量的投入品施入水體,必然加劇水體污染,使水質難以控制,各種病害增加。

        由δ1=0,我們可以得到D1=1/(1+δ1)=1

        我們設:

        當A、B都合作時有相對收益Ui≡0

        Sn=0

        考慮系統(tǒng)1的情況,我們將命題3放松到“BW”結論,進行相對收益的縮放處理:

        γ=υn+μ—ε ψ=υn+ω—ε

        引入前景理論的權重函數(shù)和價值函數(shù)可得

        π(0)=0V(0)= 0

        表4 有限N次相對收益博弈

        結果如表4所示,路徑2導致A、B的參考點為ε,不合作的相對收益被視為損失,“BW”結論使得這種損失逐漸累加,依據(jù)前景理論的觀點,此時A、B對于不執(zhí)行系統(tǒng)2的納什均衡(都不合作)具有強烈的風險偏好。

        四、結語

        存儲社會偏好的哺乳動物腦影響系統(tǒng)1中參考點的選擇,導致系統(tǒng)2在前景理論的作用下無法進行理性的決策,非理性的選擇合作。相較于路徑1產(chǎn)生的合作,路徑2產(chǎn)生的合作將受到博弈次數(shù)的影響。賈擁民(2015)認為包括杏仁核在內(nèi)的邊緣系統(tǒng)通常被認為是產(chǎn)生損失厭惡的重要腦區(qū)。如果路徑2存在,那么通過功能性近紅外腦成像儀應該能觀察到相關腦區(qū)的活躍。如果路徑2確實存在,那么這里將產(chǎn)生一個重要的結論:有限次博弈的結果將受到博弈次數(shù)的影響,博弈次數(shù)越多剛開始就越容易產(chǎn)生合作。

        [參考文獻]

        [1]阿克塞爾羅德.合作的進化[M].上海人民出版社,2007.

        [2]卡尼曼.思考,快與慢[M].中信出版社,2012.

        [3]賈擁民,黃達強,鄭昊力.偏好的異質性與一致性[J].南方經(jīng)濟,2015(5).

        [4]汪丁丁,羅衛(wèi)東,葉航.人類合作秩序的起源于演化[J].社會科學戰(zhàn)線,2005(4).

        [5]Fehr et al.The Neural Basis of Altruistic Punishment[J].Science,Vol 305,27 August,2004.

        [6]Kahneman,D.and Amos Tversky.Prospect Theory:An analysis of Decision Making under Risk[J].Econometrica,vo1.47,1979(2):263-291.

        中圖分類號:S851.3

        文獻標識碼:A

        文章編號:1006-0049-(2016)12-0044-03

        少妇被又大又粗又爽毛片| 精品黄色av一区二区三区| 亚洲一区二区一区二区免费视频| 与漂亮的女邻居少妇好爽| 四虎影视成人永久免费观看视频| 久草热8精品视频在线观看| 国产亚洲精品hd网站| 久久黄色精品内射胖女人| 色窝窝无码一区二区三区| 18禁裸男晨勃露j毛免费观看| 亚洲偷自拍另类图片二区| 亚洲国产丝袜美女在线| 亚洲av高清一区二区三| 永久免费av无码入口国语片| 99热这里只有精品69| 日本成人在线不卡一区二区三区| 国产精品一区二区三区免费视频| 一本一道久久综合久久| 欧美日韩性视频| 一区二区三区在线观看视频免费 | 国产AV秘 无码一区二区三区 | 未满十八勿入av网免费| 99久久久无码国产精品9| 一本色道久久综合亚洲精品蜜臀| 国产高潮流白浆视频在线观看| 精品无码国产一区二区三区av| 国产成人亚洲精品91专区手机| 人妻在线中文字幕视频| 青青草国产在线视频自拍| 性色av无码久久一区二区三区| av无码天堂一区二区三区| 国产一区二区三区精品毛片| 成年站免费网站看v片在线| 亚洲av熟妇高潮30p| 国产精品国产三级国产一地| 国产在线观看91一区二区三区| 国内精品人妻无码久久久影院导航| 欧美中文字幕在线看| 成人自拍偷拍视频在线观看| 国产a国产片国产| av中文字幕综合在线|