[摘要] 博弈論是運(yùn)籌學(xué)的一個(gè)重要分支。其中,非合作博弈是現(xiàn)代博弈理論中的核心內(nèi)容和重要基礎(chǔ)。本文重點(diǎn)介紹了非合作博弈中最核心的部分即Nash均衡。給出了純戰(zhàn)略納什均衡的相關(guān)定義,并同時(shí)得到了在經(jīng)濟(jì)決策中行為人的最優(yōu)決策。在此基礎(chǔ)上,以納什均衡作為理論支撐點(diǎn),結(jié)合得益矩陣分析解決了經(jīng)濟(jì)生活中的一些實(shí)際問(wèn)題。例如:針對(duì)偷水問(wèn)題。
[關(guān)鍵詞] 均衡點(diǎn) 得益矩陣 Nash均衡
博弈論是運(yùn)籌學(xué)的一個(gè)重要分支,是研究決策主體的行為發(fā)生直接相互作用時(shí)的決策,以及這種決策的均衡問(wèn)題。一個(gè)完整的博弈一般由以下幾個(gè)要素組成:博弈的參加者、各博弈方各自選擇的全部策略或行為的集合、博弈方的得益、結(jié)果、均衡等。
非合作博弈是現(xiàn)代博弈理論中的核心內(nèi)容和重要基礎(chǔ),而Nash均衡則是非合作博弈的核心部分。用博弈論解決現(xiàn)實(shí)納什均衡是現(xiàn)代博弈論中的核心內(nèi)容和重要基礎(chǔ)。要用博弈論解決現(xiàn)實(shí)經(jīng)濟(jì)生活中的決策問(wèn)題,對(duì)現(xiàn)實(shí)經(jīng)濟(jì)生活中的發(fā)展變化趨勢(shì)進(jìn)行預(yù)測(cè),其關(guān)鍵在于如何根據(jù)行為中的支付矩陣得出納什平衡點(diǎn),通過(guò)分析決策者的心理活動(dòng)來(lái)得到相關(guān)模型,從而依據(jù)模型來(lái)針對(duì)生活中的實(shí)際問(wèn)題制定相關(guān)的政策以預(yù)防不良現(xiàn)象的發(fā)生。
一、非合作博弈
一般地,將不允許存在有約束力協(xié)議的博弈稱為“非合作博弈”。在該博弈中,每個(gè)博弈方的策略都是針對(duì)其他博弈方策略或策略組合的最佳對(duì)策。事實(shí)上,具有這種性質(zhì)的策略組合,正是非合作博弈理論中最重要的一個(gè)解概念“納什均衡”。
在博弈論里,有各種各樣的均衡概念,上述定義是所有均衡概念的共同特征。而在一個(gè)博弈中,可能有多個(gè)均衡存在。純戰(zhàn)略納什均衡在非合作博弈分析中具有十分關(guān)鍵的作用和地位,因此將著重介紹純戰(zhàn)略納什均衡的定義。
1.純戰(zhàn)略納什均衡
一般常用G表示一個(gè)博弈;如G有n個(gè)博弈方,每個(gè)博弈方的全部可選策略的集合稱為“策略空間”,分別用表示;表示博弈方i的第j個(gè)策略,其中j可取有限個(gè)值(有限策略博弈),也可取無(wú)限個(gè)值(無(wú)限策略博弈);博弈方i的得益則用表示,是各博弈方策略的多元函數(shù)。n個(gè)博弈方的博弈G常寫(xiě)成。
有了博弈、博弈方的策略空間和得益的表示法,可以給出純戰(zhàn)略納什均衡的定義如下:
定義1: 在博弈中,如果由各個(gè)博弈方的每一個(gè)策略組成的某個(gè)策略組合中,任一博弈方i的策略,都是對(duì)其余博弈方策略組合的最佳對(duì)策,即
對(duì)任意都成立,則稱為G的一個(gè)“純戰(zhàn)略納什均衡”。純戰(zhàn)略納什均衡的求解,通??梢圆捎玫靡婢仃嚤硎境鲈诓煌呗韵赂鞑┺姆降男б?,下面通過(guò)囚徒困境問(wèn)題可進(jìn)一步加深對(duì)純戰(zhàn)略納什均衡概念的理解。
該博弈問(wèn)題是1950年圖克提出的,它雖然非常簡(jiǎn)單,但卻很好地反映了非合作博弈的根本特征,并且該博弈模型是解釋眾多經(jīng)濟(jì)現(xiàn)象,研究經(jīng)濟(jì)效率問(wèn)題的非常有效的基本模型和范式。其故事如下:
警方抓到兩個(gè)盜竊犯,惜證據(jù)尚不足,遂寄希望于嫌犯自己招供。警方把兩個(gè)犯人隔離起來(lái),分別審問(wèn),交代政策如下:坦白從寬,抗拒從嚴(yán)!如果你招了,另一個(gè)人沒(méi)招,那么就將你釋放,另一人判10年;同樣如果你不招,另一個(gè)人招了,那么你得被判10年,另一個(gè)人被釋放。如果兩個(gè)人都招,警方證據(jù)就足了,兩人都判8年。至於兩個(gè)人都不招的情況,不用警方交代,兩個(gè)人都得判,但因證據(jù)不力,判得都要輕許多,比如1年。警方最后說(shuō),那邊還有個(gè)警察,對(duì)你的同伙交代一模一樣的政策呢。
對(duì)于囚徒A和囚徒B來(lái)說(shuō),其雙方想法如下:
(1)如果對(duì)方招了,我招是8年,不招是10年,還是招劃算。
(2)如果對(duì)方不招,我招是無(wú)罪釋放,不招是1年,還是招劃算。
(3)如果對(duì)方不招,我招是無(wú)罪釋放,不招是1年,還是招劃算。
下面可將雙方整個(gè)博弈過(guò)程的結(jié)果用一矩陣形式表示出來(lái)。這種矩陣稱為博弈的“得益矩陣(支付矩陣)”。
表1A與B的得益矩陣
由于法庭對(duì)罪犯分別審訊,因而該問(wèn)題還可以歸結(jié)為非合作博奕模型。
其中,局中人集合,1代表囚徒A,2代表囚徒B。兩個(gè)人具有相同的策略集合:,其中C代表坦白,D代表抗拒的策略。對(duì)于策略組合兩個(gè)局中人的支付函數(shù)如下:
由支付函數(shù)可以看出,囚徒A的策略是坦白,囚徒B的最佳策略也是坦白,故納什均衡點(diǎn)為(坦白,坦白)。
在囚徒困境中,每個(gè)參與人都能猜出對(duì)方的策略,故稱這種納什均衡為純戰(zhàn)略納什均衡。
囚徒困境反映了一個(gè)很深的問(wèn)題,這就是個(gè)人理性與集體理性的矛盾。即使兩個(gè)囚徒在被警察抓住之前建立一個(gè)攻守同盟(死不坦白),這個(gè)攻守同盟也沒(méi)有用,因?yàn)樗粯?gòu)成納什均衡,沒(méi)有個(gè)人要積極性遵守協(xié)定。
囚徒困境問(wèn)題在經(jīng)濟(jì)學(xué)上也有著廣泛的應(yīng)用,例如:兩個(gè)寡頭企業(yè)選擇產(chǎn)量的博弈。如果兩企業(yè)聯(lián)合起來(lái)形成卡特爾,選擇壟斷利潤(rùn)最大化的產(chǎn)量,每個(gè)企業(yè)都可以得到更多的利潤(rùn)。但卡特爾協(xié)定并不是一個(gè)納什均衡,因?yàn)榻o定對(duì)方遵守協(xié)議的情況下,每個(gè)企業(yè)都想增加生產(chǎn),結(jié)果是,每個(gè)都只能得到納什均衡產(chǎn)量的利潤(rùn),它嚴(yán)格小于卡特爾產(chǎn)量下的利潤(rùn)。
二、純戰(zhàn)略納什均衡在經(jīng)濟(jì)生活中的具體運(yùn)用
1.偷水問(wèn)題
針對(duì)盜水現(xiàn)象,供水部門(mén)常采用罰款的手段處理那些被發(fā)現(xiàn)的盜水用戶,但隨著居民的科技文化水平的提高,盜水手段越來(lái)越高明,因此被發(fā)現(xiàn)的概率越來(lái)越小,那么采用通常的罰款手段對(duì)防止用戶盜水的作用越來(lái)越微弱,看來(lái)利用新的經(jīng)濟(jì)原理、采取新的制裁措施顯得尤為必要了。
假定用戶每家都有一個(gè)水表,而且每家實(shí)際用水沒(méi)有通過(guò)此水表。假定水表測(cè)量準(zhǔn)確無(wú)誤。
(1)設(shè)N家總水表測(cè)出的實(shí)際用水量為A。
(2)第i家水表所示用水量為,B為N家盜水總和。
不妨設(shè)每度水的單價(jià)為1元,則供水局對(duì)第i家征收水費(fèi)為即可防止用戶盜水,理由如下:
為說(shuō)明方便,不防簡(jiǎn)化為兩家用戶甲和乙,甲和乙都有兩種策略選擇:偷水和不偷水,在甲和乙之間就形成了一場(chǎng)博弈。
設(shè)甲和乙的實(shí)際用水量分別為和,偷水量分別為和,相應(yīng)的得出甲和乙的得益矩陣:
表2 甲和乙的得益矩陣
可見(jiàn):(1)對(duì)甲來(lái)說(shuō),在不做損人而不利己的事的前提下,他會(huì)選擇不偷水,因?yàn)榧兹暨x擇偷水,則他期望乙不要偷水,此時(shí)他的最大利益為0,既然利益為0,他選擇不偷水也可以達(dá)到,又何必勞神又費(fèi)事。甲若選擇不偷水,乙必定也會(huì)選擇不偷水,因?yàn)榇藭r(shí)乙無(wú)論偷水還是不偷水,利益都為0,在不做損人而不利己的事的前提下乙必定會(huì)選擇不偷水。
(2)對(duì)乙來(lái)說(shuō),由于同樣的道理,他也會(huì)選擇不偷水這一策略。這樣,(不偷水,不偷水)就成了一個(gè)純戰(zhàn)納什均衡點(diǎn)。甲和乙誰(shuí)改變策略都得不到好處,當(dāng)然就會(huì)維持均衡點(diǎn),那么這個(gè)均衡就是相當(dāng)穩(wěn)定的,這樣供水部門(mén)也達(dá)到了防止用戶偷水的目的。
另外,即使有人做損人而不利己的事,供水局也有辦法對(duì)付,那就是對(duì)第i家征收水費(fèi)為,其中.即可達(dá)到目的。同樣,以兩家用戶為例,此時(shí)用戶i所收水費(fèi),同樣地可得出甲和乙的得益矩陣。
表3 甲和乙的得益矩陣
顯然,對(duì)甲和乙來(lái)說(shuō)為了使自己得益最大,都會(huì)不約而同的選擇不偷水.對(duì)于多個(gè)用戶同樣可以進(jìn)行分析,最后所有的用戶都會(huì)選擇不偷水的策略。因此供水部門(mén)只需任意選擇一個(gè)大于1的a,宣布對(duì)用戶i征收的水費(fèi)即是防止用戶偷水的有效措施。
接下來(lái),談?wù)剬?duì)偷水用戶進(jìn)行一次性罰款和對(duì)偷水量由N家共同分?jǐn)傋龇ǖ臒o(wú)效性.
供水局若發(fā)現(xiàn)偷水戶i則往往采取一次性罰款M,對(duì)用戶i來(lái)說(shuō):
(1)不偷水,得益為0;
(2)偷水,若被發(fā)現(xiàn),得益為;
(3)偷水,若被發(fā)現(xiàn),得益為.但是用戶偷水被發(fā)現(xiàn)的概率往往是很小的。
假設(shè)被發(fā)現(xiàn)的概率為P,則用戶i偷水損益的期望值為:
因此只有,即時(shí)才能使用戶不偷水。
假設(shè)偷水被發(fā)現(xiàn)的概率為1%,用戶偷水=100,則罰款M>1000元才可能使用戶不偷水。因此一般性的罰款并沒(méi)有達(dá)到應(yīng)有的目的。
由上可知,利用純戰(zhàn)略納什均衡理論對(duì)日常生活中的一些實(shí)際現(xiàn)象確實(shí)可以進(jìn)行一定的定量分析,以此做出更好的決策安排。但是本文探討的只是博弈論的一個(gè)很小的方面,對(duì)于均衡問(wèn)題中的子博弈精煉納什均衡等問(wèn)題本文沒(méi)有討論。對(duì)于納什均衡還可以進(jìn)一步進(jìn)行推廣。如日常生活中,小到下棋打牌,大到企業(yè)之間的競(jìng)爭(zhēng)與合作,國(guó)家之間的傾銷與反傾銷、制裁和報(bào)復(fù)等,都可以歸結(jié)為博弈問(wèn)題。
參考文獻(xiàn):
[1]謝識(shí)予:納什均衡論[M].上海:上海財(cái)經(jīng)大學(xué)出版社,1999
[2]張維迎:博弈論與信息經(jīng)濟(jì)學(xué)[M].上海:上海人民出版社,1996
[3]全賢唐張健:經(jīng)濟(jì)博弈分析[M].北京:機(jī)械工業(yè)出版社,2003
[4]李本慶丁越蘭:環(huán)境污染與規(guī)制的博弈論分析[J].海南大學(xué)學(xué)報(bào),人文社會(huì)科學(xué)版.2006,4:541~544
[5]潘天群:社會(huì)現(xiàn)象的博弈論解讀[M].中央編譯出版社.1998
[6]黃濤:博弈論教程[M].首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社.1996
[7]陳芝蘭:博弈論及其在經(jīng)濟(jì)生活中的應(yīng)用[J].經(jīng)濟(jì)新論,23-24
[8]RobertGibbons,APrimer in Game Theory,Harvester Wheatsheaf,1992
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。