亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        簡單二人零和博弈的一種圖解法

        2012-09-11 00:46:08馬贊甫劉妍珺
        關(guān)鍵詞:局中人圖解法納什

        馬贊甫,劉妍珺

        (1.貴州財經(jīng)大學(xué) 經(jīng)濟研究所,貴州 貴陽 550004;2.貴州財經(jīng)大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,貴州 貴陽 550004)

        簡單二人零和博弈的一種圖解法

        馬贊甫1,劉妍珺2

        (1.貴州財經(jīng)大學(xué) 經(jīng)濟研究所,貴州 貴陽 550004;2.貴州財經(jīng)大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,貴州 貴陽 550004)

        利用等分量線及支付凸多邊形這兩個基本概念,以圖解方式確定簡單二人零和博弈(2×n或m×2)的納什均衡.這一方法與通常的圖解法是互補的,可率先確定持有多個純策略的局中人的均衡策略.

        二人零和博弈;圖解;凸組合;等分量線

        二人零和博弈是現(xiàn)實生活中常見的博弈形式,也是博弈論發(fā)展早期數(shù)學(xué)家特別感興趣的一類博弈模型.事實上,與有限零和博弈相聯(lián)系的最小最大值原理[1]在博弈論中占有極為重要的地位.

        對于有限二人零和博弈混合戰(zhàn)略納什均衡的確定,一般是借助最小最大值原理,將之轉(zhuǎn)換為一個線性規(guī)劃問題,然后利用單純形方法確定最優(yōu)策略.而對于某局中人只有兩個純戰(zhàn)略的簡單的二人零和博弈,習(xí)慣上采用基于最小最大值原理的一般圖解法.一般圖解法簡單直觀,對于確定一個參與人的均衡戰(zhàn)略極為便利,早期的博弈論著作都對這一方法有所提及[2-3].

        一般圖解法只能確定一個局中人的最優(yōu)策略,確切地說,只能確定純戰(zhàn)略個數(shù)為2的局中人的最優(yōu)策略,在此基礎(chǔ)上再以代數(shù)方法確定另一參與人的均衡策略.我們提出另外一種基于凸組合的互補方法,可率先確定純戰(zhàn)略個數(shù)大于2的局中人的最優(yōu)策略.另外,這一方法也可直接確定博弈的值.

        1 二人零和博弈

        考慮一個二人有限零和博弈模型.假設(shè)局中人1的純策略有m個,局中人2的純策略有n個,分別記局中人1、2的混合策略為

        其中x1,…,xm,y1,…,yn≥0,分別滿足.當(dāng)局中人1選擇第i個純戰(zhàn)略而局中人2選擇第j個純戰(zhàn)略時,局中人1的支付為aij,局中人2的支付為(-aij),i=1,…,m,j=1,…,n.該博弈可由如下支付矩陣A給出:

        稱一個策略組合(X*,Y*)為納什均衡(Nash Equilibrium,N.E.),當(dāng)且僅當(dāng)X*∈argmXax{XTAY*}與Y*∈argmYax{X*TAY} 同時成立,此時稱v*=X*TAY*為博弈的值.

        對于由A所給出的二人零和博弈,當(dāng)m與n皆大于2的時候,確定均衡比較棘手,但對于兩者最小值為2的情形,有簡單的處理方法,即利用圖解法確定最優(yōu)策略.一般的對策論著作中都會介紹2×n或m×2型零和博弈的圖解法,基本思路是利用最小最大值原理,描繪最?。ɑ蜃畲螅┲登€,然后再求最小(或最大)值曲線的最高(或最低)點.我們稱這種方法為一般圖解法.

        一般圖解法能直接確定雙戰(zhàn)略擁有者的最優(yōu)戰(zhàn)略,但兩個以上純戰(zhàn)略持有者的均衡戰(zhàn)略是以間接方式給出的.我們提出另外一種互補方法,能直接確定多戰(zhàn)略持有者的均衡戰(zhàn)略,該方法的理論基礎(chǔ)是最大等收益法則.

        一般而言,若(X*,Y*)是純戰(zhàn)略均衡,則可根據(jù)最小最大值原理直接予以確定,若納什均衡(X*,Y*)不是純戰(zhàn)略均衡,則需滿足最大等收益法則.所謂最大等收益法則,即:如果

        存在兩個非零分量>0與>0,則當(dāng)局中人2選擇Y*時,局中人1的第i1、i2個純戰(zhàn)略所對應(yīng)的期望支付必須都等于v*,且均不小于其它任意純戰(zhàn)略所帶來的期望支付;類似地,若

        存在非零分量>0與>0,則當(dāng)局中人1選擇X*時,局中人2的第j1、j2個純戰(zhàn)略也對應(yīng)等量的最大的期望支付(-v*).

        利用最大等收益法則,可考慮一種凸組合圖解方法:在支付凸組合的基礎(chǔ)上,利用等分量線確定博弈的解與值.

        2 凸組合圖解法

        考慮一個由2×n階支付矩陣所定義的簡單零和博弈.設(shè)該博弈的納什均衡為(X*,Y*),所對應(yīng)的博弈值為v*=X*TAY*.由于AY*是矩陣n個列向量的凸組合:

        因此,當(dāng)均衡戰(zhàn)略X*=(x*,1-x*) 滿足0<x*<1時,必有

        則v*與向量AY*的任一分量值相等.這表明,均衡狀態(tài)對應(yīng)凸組合圖形中的一個向量,該向量的兩個分量必須相等.

        視支付矩陣A的每一列為二維坐標(biāo)平面上的一個點,對這n個點做凸組合,得到一個凸多邊形,另,定義等分量線v1=v2,則等分量線與凸多邊形的位置關(guān)系無外乎相離與相交兩種情況.

        1)凸多邊形位于等分量線同側(cè).如圖1所示.在這種情況下,參與人1存在一個(弱)占優(yōu)策略,博弈有一個重復(fù)剔除占優(yōu)均衡.

        圖1 等分量線與凸多邊形相離Fig.1 The separation set of iso-component line and convex polygon

        2)等分量線與凸多邊形相交,在這種情況下存在混合戰(zhàn)略均衡,且坐標(biāo)最小的一個交點給出博弈值及均衡策略.不妨考慮一個2×3的零和博弈,其一般形式如表1所示:

        表1 2×3型零和博弈的一般形式Tab.1 The General Form of 2×3 Zero-Sum Game

        可解得

        另一方面,由于局中人2在均衡狀態(tài)下以零概率選擇純戰(zhàn)略R,因此有

        就幾何位置而言,若支付點(a13,a23)T位于點(a11,a21)T及點(a12,a22)T所連直線

        的上方①該線段必須是下降的,否則其上側(cè)端點必對應(yīng)于參與人2的劣戰(zhàn)略,不可能出現(xiàn)于其混合戰(zhàn)略之中.因此,其它支付點當(dāng)位于該線段所在直線上方.為防止出現(xiàn)意外情況,畫圖前最好先剔除劣戰(zhàn)略.,則必有

        則局中人2選擇純戰(zhàn)略R對應(yīng)的負支付滿足

        或者說,給定局中人1的均衡戰(zhàn)略(x,1-x)T,相較純戰(zhàn)略R而言,局中人2選擇純戰(zhàn)略L或C將帶來更高的期望收益.如圖2所示,三角形的頂點L、C、R分別由支付矩陣的列向量1、2、3所確定,由于R點位于直線LC的上側(cè),這一幾何位置關(guān)系使得均衡狀態(tài)下的局中人2必須以零概率選擇純戰(zhàn)略R.

        進一步可證明,根據(jù)直線LC與等分量線交點N.E.的幾何位置可確定博弈值及均衡戰(zhàn)略組合.顯然,N.E.點可表示為三角形頂點L、C、R的一個凸組合,或者說,N.E.點坐標(biāo)(e11,e21)T滿足如下條件:

        圖2 等分量線與凸多邊形相交Fig.2 The intersection of iso-component line and convex polygon

        無疑,均衡未必單一,甚至存在無窮多均衡的情況.比如,當(dāng)支付列向量存在至少三點共線時,可能出現(xiàn)無窮多均衡.如圖3所示,支付點L、C、R共線,等分量線與直線LCR的交點N.E.存在無窮多的凸組合形式,此時有無窮多均衡.

        以上考慮的是2×n型零和博弈的圖解法,相仿佛的,對于m×2型零和博弈,可先確定參與人1的均衡戰(zhàn)略.方法是視支付矩陣A的每一行為二維坐標(biāo)平面上的一個點,對其進行凸組合得到一個凸多邊形,考慮等分量線與該凸多邊形坐標(biāo)最大的一個交點,該交點確定了博弈的均衡.

        圖3 無窮多均衡Fig.3 The infinite Nash Equilibrium

        3 示例及結(jié)語

        考慮一個2×n型的零和博弈.設(shè)參與人1有兩個純戰(zhàn)略:U、D,參與人2有三個純戰(zhàn)略:L、C、R;給定純戰(zhàn)略組合,參與人1的支付見表2.

        表2 一個2×n型零和博弈Tab.2A 2×n Zero-Sum Game

        圖4 2×n型零和博弈求解示意Fig.4The schematicdiagram for the 2×n zero-sum game

        圖5 一般圖解法示意Fig.5The General graphic method diagram for the zero-sum game

        再考慮一個m×2型的零和博弈.設(shè)參與人1有三個純戰(zhàn)略:U、M、D,參與人2有兩個純戰(zhàn)略:L、R;給定純戰(zhàn)略組合,參與人1的支付如表3所示.

        本例中需要先確定局中人1的均衡策略,如前所述,均衡由等分量線與凸多邊形坐標(biāo)最大的交點所決定.在圖6中,UM所在直線方程為17,與等分量線的交點為N.E.,博弈均衡由N.E.點給出,由于

        表3 一個m×2型零和博弈Tab.3A m×2 Zero-Sum Game

        圖6 m×2型零和博弈求解示意Fig.6The schematic diagram for the m×2 zero-sum game

        總之,與一般圖解法一樣,凸組合方法可以確定簡單零和博弈的納什均衡及均衡的值,不同點在于凸組合方法首先確定的是多個純策略擁有者的混合策略,而一般圖解法確定的是僅擁有2個純策略的局中人的混合策略.因此,凸組合方法可說是一般圖解法的互補方法.

        [1]John von Neumann.Zur Theorie der Gesellschaftsspiele[J].Mathematische Annalen,1928(100):295-300.

        [2]J·麥克金賽.博弈論導(dǎo)引[M].北京:人民教育出版社,1960.

        [3]王建華.對策論[M].北京:清華大學(xué)出版社,1986.

        責(zé)任編輯:畢和平

        A Graphic Method for the Simple Two-Person Zero-Sum Games

        MA Zanfu1,LIU Yanjun2
        (1.Institute of Economic Research,Guizhou University of Finance and Economics,Guiyang 550004,China;2.School of Mathematics and Statistics,Guizhou University of Finance and Economics,Guiyang 550004,China)

        By the introduction of iso-component line and convex polygon,a graphic method was presented to solve sim?ple zero-sum two-person games.This approach,which is complementary to the general graphic method,can determine the Nash equilibrium strategy of the player who holds more pure strategies.

        two-person zero-sum game;graphic method;convex combination;iso-component line

        F 224.32

        A

        1674-4942(2012)03-0249-05

        2012-02-27

        教育部人文社科基金項目(12YJC790140)

        猜你喜歡
        局中人圖解法納什
        THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
        THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
        基于HTML5的凸輪廓線圖解法App教學(xué)軟件研究
        2×2型博弈決策均衡的歸一化解法
        超對策模型中多形式結(jié)局偏好認知信息融合的0—1規(guī)劃方法
        談CAD圖解法和CAD電子圖上直點坐標(biāo)的技巧應(yīng)用
        圖解法巧答政治主觀試題
        基于圖解法的壓力機變位齒輪齒根過渡圓弧分析
        具有失真認知信息的兩層沖突環(huán)境建模與分析
        集體行動的博弈分析:基于相對公平相容約束
        99热这里只有精品国产66| 完整版免费av片| 亚洲午夜成人精品无码色欲| 国产精品制服| 国产成人精品免费久久久久| 中文字幕亚洲精品人妻| 国产91久久精品成人看网站| 亚洲一区二区三区特色视频| 国产精品亚洲а∨无码播放不卡| 亚洲 自拍 另类 欧美 综合| 97久久久久国产精品嫩草影院| 国内精品久久人妻互换| 日本人妻精品有码字幕| 日本a片大尺度高潮无码| av在线亚洲欧洲日产一区二区| 亚州AV无码乱码精品国产| 婷婷开心五月综合基地| 久久久亚洲免费视频网| 久久精品亚洲精品国产色婷| 精品人妻人人做人人爽| 久久国产免费观看精品| 少妇又紧又色又爽又刺| 午夜一区二区三区观看| 精品视频无码一区二区三区 | 日韩精品无码免费专区网站| 国产高清在线精品一区αpp| 日韩av综合色区人妻| 精品国产日韩一区2区3区| 少妇人妻在线无码天堂视频网| 无码一区二区波多野结衣播放搜索 | 少妇人妻中文字幕hd| 一本无码人妻在中文字幕免费| 色播在线永久免费视频网站| 精品国产精品久久一区免费| 亚洲最大水蜜桃在线观看| 精品久久久久成人码免费动漫 | 精品福利一区| 白浆高潮国产免费一区二区三区| 国产精品视频亚洲二区| av无码人妻中文字幕| 久久频精品99香蕉国产|