楊亞軒
【摘 要】博弈論是運籌學(xué)的一個重要分支,涵蓋的內(nèi)容廣泛,其中,非合作博弈是現(xiàn)代博弈論中的重要基礎(chǔ)和核心內(nèi)容。本文簡要介紹了博弈論的相關(guān)內(nèi)容,又重點講述了非合作博弈中最關(guān)鍵的部分也即納什均衡,最后以治理污水排放為例說明博弈論在實際經(jīng)濟(jì)生活中的應(yīng)用。
【關(guān)鍵詞】博弈論;非合作博弈;納什均衡;應(yīng)用
文章編號:ISSN1006—656X(2013)12-0043-01
一、博弈論的概述
博弈論(game theory),又稱對策論,是研究決策主體的行為發(fā)生直接相互作用時的決策以及這種決策的均衡問題,也就是一些個人或組織,面對特定的環(huán)境條件,在一定的規(guī)則約束下,同時或先后,一次或多次,從各自的行為或策略中進(jìn)行選擇并加以實施,各自取得相應(yīng)結(jié)果的過程。
一個完整的博弈一般包含幾個要素:參與者,行動,策略,結(jié)果,均衡等。參與者、行動和結(jié)果統(tǒng)稱為博弈規(guī)則,博弈分析的目的是使用博弈規(guī)則來決定均衡。但是,博弈的行動不等同于博弈的策略,博弈的結(jié)果不等同于博弈的均衡。根據(jù)參與人的數(shù)量,可分為二人博弈和多人博弈;根據(jù)參與人是否合作,可分為合作博弈和非合作博弈;根據(jù)博弈結(jié)果的不同,可分為零和博弈、常和博弈和變和博弈。
博弈論對我們的經(jīng)濟(jì)生活有重要意義,人們之間決策行為相互影響的例子有很多:從國家角度出發(fā),在國際貿(mào)易中合理運用博弈論可使本國和其他國家都受益,取得雙贏效果;從個人角度出發(fā),在生活中合理運用博弈論可使自己選擇最優(yōu)策略,減少不必要的成本開支。
二、非合作博弈——納什均衡
非合作博弈是指不允許存在有約束力協(xié)議的博弈。完全信息靜態(tài)博弈屬于非合作博弈,該博弈中,每個博弈方的策略都是針對其他博弈方策略或策略組合的最佳對策,具有這種性質(zhì)的策略組合,正是非合作博弈理論中最重要的一個概念“納什均衡”。
用表示一個博弈,如果有個博弈方,每個博弈方的全部可選策略的集合稱為“策略空間”,用表示;表示博弈方的第個策略,其中可取有限個值(有限策略博弈),也可取無限個值(無限策略博弈);博弈方的得益用表示,是各博弈方策略的多元函數(shù)。個博弈方的博弈常寫成。在博弈中,如果由各個博弈方的每一個策略組成的某個策略組合中,任一博弈方的策略,都是對其余博弈方策略組合的最佳對策,即
,對任意都成立,則稱為的一個“納什均衡”。
納什均衡的求解,常采用得益矩陣法。在囚徒困境中,每個參與者都能猜出對方策略,稱該納什均衡為純策略納什均衡。囚徒困境問題反映了非合作博弈的根本特征,體現(xiàn)了個人理性與集體理性的矛盾。兩寡頭企業(yè)選擇產(chǎn)量的博弈就是囚徒困境問題在經(jīng)濟(jì)學(xué)上的應(yīng)用。若兩企業(yè)聯(lián)合形成卡特爾,選擇壟斷利潤最大化的產(chǎn)量,每個企業(yè)都能得到更多利潤。但卡特爾協(xié)定不是納什均衡,給定對方遵守協(xié)議,每個企業(yè)都有增加產(chǎn)量的沖動,最后每個企業(yè)只能得到納什均衡產(chǎn)量的利潤,它嚴(yán)格小于卡特爾產(chǎn)量下的利潤。
在某類博弈中,每個理性人都不能猜出對方的策略,參與人是以一定的概率選擇某種策略的,這樣的策略稱為混合策略,相應(yīng)的均衡稱為混合策略納什均衡。純策略是混合策略的特例。相關(guān)的例子有日常生活中的打撲克、劃拳等。
三、治理河流污水排放的制度設(shè)計
環(huán)境保護(hù),人人有責(zé),限制企業(yè)的污水排放符合社會各界的呼聲。檢查和制止排污是政府的職責(zé),對于以利潤最大化為目標(biāo)的企業(yè),其一直采取各種措施盡可能降低生產(chǎn)成本。政府和企業(yè)間的關(guān)系可用經(jīng)濟(jì)學(xué)中的監(jiān)督博弈來解釋。
該博弈的參與者是政府和企業(yè),政府的策略選擇是檢查或不檢查,企業(yè)的策略選擇是排污或不排污。假設(shè)是企業(yè)治理污水(不排污)增加的生產(chǎn)成本,若排污,為自己多得的收益。是政府檢查所需成本。是政府對企業(yè)排污的罰款金額。是企業(yè)排污對社會利益的損害。假設(shè)且,即政府對排污企業(yè)采取重罰措施。對應(yīng)不同策略組合的得益矩陣可見下表。
政府和企業(yè)的得益矩陣
在以上假設(shè)條件下,政府和企業(yè)都猜不出對方會采取何種策略,因而不存在純策略納什均衡,只能求解混合策略納什均衡。如果假定條件不成立,通過劣策略剔除可得到占優(yōu)策略,即(檢查,不排污)或(不檢查,排污)為占優(yōu)均衡。
在得益矩陣中,用表示政府檢查的概率,表示企業(yè)排污的概率。給定,政府檢查和不檢查的期望收益分別為:
由,得。即如果企業(yè)排污概率小于,政府的最優(yōu)選擇是不檢查;如果大于,政府的最優(yōu)選擇是檢查;如果等于,政府隨機(jī)地選擇檢查或不檢查。
政府的最終目標(biāo)是降低企業(yè)排污概率并保護(hù)環(huán)境。據(jù)的結(jié)果,有兩種措施:一是增大分母,即采取重罰措施,使企業(yè)平日不敢排污;二是減小分子,即降低檢查成本。現(xiàn)階段可行做法是設(shè)立舉報電話,避免政府盲目檢查,提高辦事效率。
再者,給定,企業(yè)選擇排污和不排污的期望收益分別為:
由得,即如果政府的檢查概率小于,企業(yè)的最優(yōu)選擇是排污?,F(xiàn)實中,政府對排污的懲罰越重,企業(yè)因排污獲得的收益越低,企業(yè)的排污概率就越小。反之,企業(yè)的排污概率就越大。
企業(yè)因排污獲得收益的大小,政府難以準(zhǔn)確把握。前面談到的企業(yè)都是以利潤最大化為目標(biāo)的企業(yè),適于民營企業(yè)?,F(xiàn)實中大多排污者是國有企業(yè),這就涉及企業(yè)經(jīng)營的控制權(quán)收益問題。企業(yè)因排污獲得的生產(chǎn)成本降低部分可以很容易轉(zhuǎn)化為企業(yè)經(jīng)營者的控制權(quán)收益,這些收益包括獎金、福利或者因企業(yè)效益上升而帶來的升遷機(jī)會。反過來,如果企業(yè)因為排污而受罰,經(jīng)營者并沒有控制權(quán)損失,因為罰款由企業(yè)出,經(jīng)營者只是沒有控制權(quán)收益而已。
四、小結(jié)
本文以納什均衡為理論基礎(chǔ),分析了純策略納什均衡和混合策略納什均衡在經(jīng)濟(jì)生活中的應(yīng)用。但本文探討的只是博弈論中一個很小的方面,對均衡問題中的子博弈精煉納什均衡等沒有涉及到,但它們的應(yīng)用也很廣泛。在日常經(jīng)濟(jì)生活中,小到購物時的討價還價,大到企業(yè)間的競爭與合作、國家間的傾銷與反傾銷等,都可歸結(jié)為博弈問題。
參考文獻(xiàn):
[1]彭祥,胡和平.黃河水資源配置博弈均衡模型[J].水利學(xué)報,2006,(10).
[2]張維迎.博弈論與信息經(jīng)濟(jì)學(xué)[M].上海:上海人民出版社,1996.