侯貴生 殷孟亞 楊磊
摘 要:隨著我國社會工業(yè)化進程的推進,經(jīng)濟發(fā)展與環(huán)境保護矛盾日益突顯。因此,以重復博弈理論為基礎,基于環(huán)境規(guī)制強度,構(gòu)建政府與企業(yè)環(huán)境行為的博弈模型,通過對模型的分析得出雙方的納什均衡策略,為實現(xiàn)環(huán)境保護與經(jīng)濟發(fā)展的共贏提供理論依據(jù)。
關鍵詞:環(huán)境規(guī)制強度;環(huán)境行為;重復博弈
中圖分類號:F123.15;F224.32 文獻標志碼:A 文章編號:1673-291X(2016)05-0114-02
引言
隨著我國環(huán)境污染日益加劇,政府對企業(yè)的環(huán)境規(guī)制強度也日趨增強。企業(yè)所采取的環(huán)境行為必然受到政府環(huán)境規(guī)制強度變化的影響,而政府的環(huán)境行為也必然以企業(yè)的策略為依據(jù),因而雙方的策略選擇無疑成為學者們關注的課題。王冬梅等(2004)分析了環(huán)境保護政府與企業(yè)之間的四種博弈關系[1]。羅麗艷(2007)運用重復博弈的“囚徒困境”模型分析了人與自然間的無限次重復博弈關系,指出了合作的可能性[2]。
本文以政府環(huán)境規(guī)制決策和企業(yè)環(huán)保行為來分別反映兩者的環(huán)境行為,通過研究環(huán)境規(guī)制強度動態(tài)調(diào)整條件下政府與企業(yè)環(huán)境行為的重復博弈問題,分析政府與企業(yè)環(huán)境行為的均衡策略,從而為政府政策選擇與企業(yè)環(huán)保決策提供理論參考。
一、基于環(huán)境規(guī)制強度的政府與企業(yè)環(huán)境行為的一次博弈分析
假設政府和企業(yè)分別為一個博弈參與人,兩者都有兩種策略選擇:政府(完全規(guī)制,不完全規(guī)制),企業(yè)(積極環(huán)保,消極環(huán)保)。兩者收益不僅與自身的策略選擇相關,還與對方的策略選擇相關。通過建立政府與企業(yè)環(huán)境行為的博弈樹來對雙方一次階段博弈進行分析。
在博弈過程中,政府與企業(yè)都明確自身和對方的收益情況,也都能觀察到對方的策略選擇,因此,利用逆推歸納法來分析各階段博弈過程。下面首先對第二階段企業(yè)環(huán)境行為策略選擇進行分析。
綜上,當政府已知企業(yè)的策略選擇情況時,在相應環(huán)境規(guī)制強度下,政府總收益的差值大于成本的差值時,政府會選擇不完全規(guī)制策略;否則會選擇完全規(guī)制策略。
由政企環(huán)境行為一次階段博弈可知,博弈雙方具有純策略納什均衡,但納什均衡受總收益和成本的變化趨勢的影響,因此,政企環(huán)境行為一次階段動態(tài)博弈不存在唯一固定的純策略納什均衡,不是帕累托最優(yōu)策略,而(不完全規(guī)制,積極環(huán)保)應是政企環(huán)境行為博弈的帕累托改進策略。
二、政府與企業(yè)間的重復博弈模型
在政府與企業(yè)環(huán)境行為的博弈中,參與主體均為有限理性,意味著政府環(huán)境規(guī)制強度的選擇具有長期性,是重復博弈過程,往往不可能一開始就找到最優(yōu)策略,需要參與主體不斷學習[3]。
重復博弈分為有限次重復博弈和無限次重復博弈,在重復博弈中,博弈方考慮的不是現(xiàn)在本階段的博弈,而是整個博弈的總體收益情況[4]。由于資金具有不同的時間價值,就要考慮收益的時間價值問題,因此,引入收益折算的貼現(xiàn)因子δ[5]。設在一無限次重復博弈中,某博弈方的階段得益為π1,π2,…πt,將各階段得益折算到當前階段所得到的總得益為[6]:
在重復博弈中,還存在一種嚴厲的懲戒機制,冷酷策略就是經(jīng)典的懲戒機制之一。根據(jù)冷酷戰(zhàn)略,在政企環(huán)境行為重復博弈過程中,雙方都能夠觀察到自己和對方的博弈歷史,雙方的收益就是各階段收益折算到當前的貼現(xiàn)值之和[7]。設政府和企業(yè)的貼現(xiàn)因子都為δ,Ve表示企業(yè)積極環(huán)保時無限次重復博弈的貼現(xiàn)值,Vs表示企業(yè)消極環(huán)保時無限次重復博弈的貼現(xiàn)值,并假設政府開始選擇不完全規(guī)制策略,且一旦企業(yè)選擇消極環(huán)保策略,政府將會永遠選擇完全規(guī)制策略。則有:
假設企業(yè)選擇消極環(huán)保,政府在察覺到企業(yè)的消極環(huán)境行為后,采取懲戒機制,且會永遠選擇完全規(guī)制。
三、結(jié)論
在一次階段博弈中,博弈雙方具有純策略納什均衡,但納什均衡受總收益和成本的變化趨勢的影響,因此,政企環(huán)境行為博弈不存在唯一固定的純策略納什均衡,但博弈中的機會主義行為不可避免。在政企環(huán)境行為無限次重復博弈中,由于懲戒機制的存在,博弈雙方都會權(quán)衡長期利益,從而避免機會主義行為,最終政企博弈雙方達成唯一的純策略納什均衡,即(不完全規(guī)制,積極環(huán)保)。
參考文獻:
[1] 王冬梅,李萬慶.博弈論在環(huán)境保護中的應用[J].城市環(huán)境與城市生態(tài),2004,17(5):45-47.
[2] 羅麗艷.循環(huán)經(jīng)濟:人與自然重復博弈煩人合作解[J].內(nèi)蒙古財經(jīng)學院學報,2007,(1):18-22.
[3] 李建斌,劉楊.重復博弈視角下地企業(yè)環(huán)保行為規(guī)制[J].山東社會科學,2009,162(2):64-67.
[4] 謝識予.經(jīng)濟博弈論[M].上海:復旦大學出版社,2006.
[5] 胡元林,陳怡秀.環(huán)境規(guī)制對企業(yè)行為的影響[J].經(jīng)濟縱橫,2014,(7):51-54.
[6] 張倩,曲世友.環(huán)境規(guī)制下政府與企業(yè)環(huán)境行為的動態(tài)博弈與最優(yōu)策略研究[J].預測,2013,(4):35-40.
[7] 張學剛,鐘茂初.政府環(huán)境監(jiān)管與企業(yè)污染的博弈分析及對策研究[J].中國人口·資源與環(huán)境,2011,21(2):31-35.
[責任編輯 張宇霞]