亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于連續(xù)混合策略對長期蜈蚣博弈的分析①

        2017-07-19 10:39:54韓庭軒
        科技資訊 2017年18期
        關(guān)鍵詞:混合策略

        韓庭軒

        摘 要:蜈蚣博弈給逆向歸納法帶來巨大沖擊,因為參與人在整體環(huán)節(jié)的最優(yōu)選擇,而非每一子環(huán)節(jié)最優(yōu)選擇的集合。該文從理論角度出發(fā),基于理性人假設(shè),利用連續(xù)混合策略,通過正向順序計算收益期望,對長期蜈蚣博弈進行分析,并對其中的可能情況進行解釋。

        關(guān)鍵詞:蜈蚣博弈 逆向歸納法 理性人假設(shè) 混合策略

        中圖分類號:F32 文獻標(biāo)識碼:A 文章編號:1674-098X(2017)06(c)-0214-02

        蜈蚣博弈于1981年由Rosenthal提出。博弈中有兩個參與人,策略包括“合作”與“終止”。博弈雙方分先手與后手,輪流進行決策,當(dāng)一方選擇“終止”時,博弈即停止,否則雙方將持續(xù)合作直到最終環(huán)節(jié)。博弈的總收益會隨著過程的持續(xù)而不斷增大,但是每一參與者在自己本回合選擇“終止”時的自身收益,要小于對方在下一回合選擇“終止”時自己的收益。根據(jù)持續(xù)的回合數(shù),蜈蚣博弈可以被分為短期蜈蚣博弈、長期蜈蚣博弈和無限期蜈蚣博弈。

        在“蜈蚣博弈”出現(xiàn)之前,逆向歸納法一直是博弈論中的一個重要分析方法。逆向歸納法有兩個基本假設(shè):一是理性人假設(shè),博弈的參與者都是理性的,會做出使自己收益最大的決策;二是共同知識,博弈方對其他人行為的判斷都是正確的,并且相互知道其他人了解自己的判斷?!膀隍疾┺你U摗笔顷P(guān)于逆向歸納法的一個重要悖論。根據(jù)逆向歸納法的推理,由于雙方在每個環(huán)節(jié)都會選擇讓自己利益最大化的選擇,最終導(dǎo)致先手方拒絕合作,但這與實際中的選擇明顯不符。

        1 文獻綜述

        理論探究方面,孫洪罡等[1]基于風(fēng)險偏好分析參與者的支付滿意率。潘天群[2]在逆向歸納法的內(nèi)涵中加入交流理性的概念。何偉等[3]著眼于預(yù)期心理,認(rèn)為參與者一旦在主動選擇時能獲得與被動選擇最大利益相同的收益,就會產(chǎn)生終止的動機。方志耕等[4]將“灰數(shù)規(guī)整”與順推歸納法結(jié)合,通過計算期望值探究博弈終止時的納什均衡。胡曉娟[5]等利用“顫抖手”方法,詳細(xì)論證選擇波動時,參與人合作的條件。

        在實踐中,McKelvey和Palfrey[6]讓參與者分別在四階段低收益蜈蚣博弈、四階段高收益蜈蚣博弈和六階段蜈蚣博弈中做出選擇,發(fā)現(xiàn)參與者很少選擇第一輪終止,更多選擇倒數(shù)第二、三輪終止。

        2 基于連續(xù)混合策略對長期蜈蚣博弈的分析

        2.1 模型構(gòu)架

        博弈在時刻t1開始,在時刻t100結(jié)束,時刻用tn表示(1≤n≤100)。參與人1在時刻t1開始做選擇,之后雙方輪流做選擇。參與人1、2都做完一次決策記為一輪,輪次用i表示(1≤i≤50)。若博弈持續(xù)進行,達到最終時刻t100,且選擇人仍選擇C,則雙方收益都為51。若在tn時,某一參與人選擇策略S,則其得到的收益為W(1,n),對方收益為W(2,n)。

        蜈蚣博弈模型如圖1所示。

        在蜈蚣博弈中,會存在下列假設(shè),以保證各子博弈中,參與者在進行純策略選擇時,總會選擇S。

        2.2 連續(xù)混合策略的應(yīng)用

        我們基于理性人假設(shè)和共同知識,采用混合策略的方法分析問題。為便于計算,我們按照輪次對參與人的選擇概率及收益期望進行研究,并作出以下假設(shè)。

        假設(shè)2:參與人1、2在第i輪做選擇時,合作的概率分別為、。在tn時刻,參與人1、2的收益期望分別為E(1,n)、E(2,n)。收益期望函數(shù)如下:

        在混合策略中,若要參與人選擇合作,則需其合作的預(yù)期收益不小于終止的預(yù)期收益,并且其下次決策時的收益期望不小于本次決策時的收益期望。以參與人1為例,若其選擇合作,需滿足以下條件:

        根據(jù)以上分析結(jié)果,我們可以得到如下推論。

        推論1:作為理性經(jīng)濟人,參與人雙方為了使自身在整個系統(tǒng)內(nèi)獲得最大利益,不僅需要在每個子環(huán)節(jié)考慮到預(yù)期收益,同時還要預(yù)測到對方合作的可能性。

        逆向歸納法只考慮收益層面,忽略決策概率,并且獨立分析各子環(huán)節(jié),未充分考慮各環(huán)節(jié)間的聯(lián)系,僅單純認(rèn)為整體的最優(yōu)選擇是各子環(huán)節(jié)最優(yōu)選擇的集合。

        推論2:當(dāng)一方認(rèn)為另一方在下一輪行動中更具有合作傾向時,他在本輪就會合作;否則則會停止。

        另需說明,當(dāng)達到合作概率臨界值時,決策人會概率性地停止合作。這一臨界值又和下一輪的收益期望相關(guān),即收益期望與合作期望是相互影響的。

        依據(jù)以上闡釋理論,我們可以進一步得到如下推論。

        推論3:雙方的共同合作,是基于共同知識下對對方的信任;而雙方停止合作,是因為決策方認(rèn)為對方在下一輪的合作概率將等于或低于臨界值,即個人行為受對客體主觀判斷的影響。

        推論4:在達到臨界值之前,博弈一方愿意在自己決策的tn時合作,那么他在之前都會合作,這是基于他對對方的信任;在臨界值之后,博弈一方在自己決策的tn時終止,那么他在之后都會選擇終止,這是基于他認(rèn)為對方會選擇終止。

        推論5:個人的收益期望與對方合作期望是相互影響的,而逆向歸納法在逆向分析對方合作期望時更有實際意義。

        雙方的合作期望在整體上會呈現(xiàn)遞減的趨勢,在博弈后期,提升空間有限,決策方會選擇終止攫取最后的利益,這一方式尤其體現(xiàn)于最后四期。

        3 結(jié)語

        根據(jù)理性人假設(shè),參與人應(yīng)追求個人在博弈整體的最大利益,而非各子系統(tǒng)最優(yōu)方案的集合;根據(jù)收益情況,繼續(xù)博弈的潛在收益要大于過早結(jié)束的風(fēng)險;根據(jù)共同知識,雙方在知道對方愿意合作的前提下,在一定期間內(nèi)會形成穩(wěn)定的合作關(guān)系。因此,筆者提出,利用連續(xù)混合策略,正向順序計算收益期望,進而分析參與者選擇合作或終止的影響因素。該方法從整體角度對博弈系統(tǒng)進行剖析,將合作意愿這一與收益期望相互影響的要素獨立分析,重新解讀了動態(tài)博弈中對理性人假設(shè)的認(rèn)識,較好地解釋了蜈蚣博弈悖論。

        參考文獻

        [1] 孫洪罡,劉亞相,王麗波.支付滿意率——對博弈論理性假設(shè)的新思考[J].青島大學(xué)學(xué)報:自然科學(xué)版,2004(9):78-80.

        [2] 潘天群.交流理性與逆向歸納法悖論的消解[J].自然辯證法研究,2005(12):25-28.

        [3] 何偉,徐飛,陳潔.蜈蚣博弈新視角——預(yù)期心理的應(yīng)用[J].上海管理科學(xué),2006(3):1-5.

        [4] 方志耕,劉思峰,施紅星,等.破解“蜈蚣博弈”悖論:“灰數(shù)規(guī)整”順推歸納法研究[J].中國管理科學(xué),2008(2):180-186.

        [5] 胡曉娟,秦承忠,Perry Shapiro.“顫抖”蜈蚣博弈[J].產(chǎn)業(yè)經(jīng)濟評論,2011(6):29-39.

        [6] McKelvey,Palfrey.An Experimental Study of the Centipede Game[J].Econometrica,1992,60(4):803-836.

        猜你喜歡
        混合策略
        公平分配與討價還價博弈
        動量效應(yīng)與價值效應(yīng)
        基于博弈混合策略對卷煙質(zhì)量調(diào)研無響應(yīng)現(xiàn)象的研究
        混合策略的漢維輔助翻譯系統(tǒng)的設(shè)計與實現(xiàn)
        注冊制背景下上市公司與投資者的博弈分析
        會計之友(2016年22期)2016-12-17 15:26:44
        基于混合策略的自適應(yīng)教與學(xué)優(yōu)化算法
        水利工程中業(yè)主和監(jiān)理博弈行為分析
        基于靜態(tài)貝葉斯博弈的風(fēng)險評估方法研究
        基于混合策略博弈的我國工業(yè)碳減排分析
        已有薪資激勵背景下股票期權(quán)的推行前景和條件
        极品粉嫩嫩模大尺度无码| 色综合视频一区中文字幕| 无码区a∨视频体验区30秒| 香港三级日本三级a视频| 性欧美videofree高清精品| 久久久久久久久久久国产| av无码精品一区二区三区四区| 亚洲综合无码| 亚洲熟妇无码八av在线播放| 男人边吃奶边做好爽免费视频| 亚洲熟妇av乱码在线观看| 18禁黄无遮挡免费网站| 一本色道久久综合亚州精品| 国产理论亚洲天堂av| 国产不卡在线观看视频| 一区二区三区无码高清视频| 国产亚洲精品a片久久久| 亚洲va中文字幕| 人人做人人妻人人精| 杨幂Av一区二区三区| 亚洲中文字幕第一第二页| 国产中文字幕免费视频一区| 白白白在线视频免费播放| 丰满少妇人妻久久久久久| 性色av浪潮av色欲av| 国产精品九九九久久九九| 国产成人丝袜在线无码| 亚洲精品一区二区成人精品网站| 国产亚洲精品久久午夜玫瑰园 | 亚洲av人片在线观看调教| 日韩精品视频av在线观看| 丰满人妻被两个按摩师| 特级无码毛片免费视频尤物| 无码丰满少妇2在线观看| 久久成人黄色免费网站| 我的美艳丝袜美腿情缘| 精品一区中文字幕在线观看| 欧美老肥妇做爰bbww| 国产精品va无码一区二区| 国产成人影院一区二区| 一区二区日本影院在线观看|