葉杰
【摘要】處理好企業(yè)排污問題對環(huán)境保護具有關鍵意義。關注環(huán)境規(guī)制條件下同行企業(yè)間排污行為的互動關系,以造紙企業(yè)為例,從有限理性假設和收益最大化假設出發(fā),構建政府規(guī)制背景下排污企業(yè)排污行為的演化博弈分析框架。通過數(shù)理推導和數(shù)值模擬發(fā)現(xiàn),政府給予造紙商的正向激勵和負向激勵之和與各類情況下兩類排污策略收益的比較以及當?shù)嘏盼燮髽I(yè)排污策略的初始比例,對特定區(qū)域造紙企業(yè)排污策略的演化方向和演化結果具有決定意義。因此,政府在制定環(huán)境規(guī)制政策時,應該對正負激勵效用、各類情況下兩類排污策略收益以及當?shù)嘏盼燮髽I(yè)排污策略的初始比例進行綜合考慮。
【關鍵詞】環(huán)境規(guī)制;排污企業(yè);排污策略;演化博弈
【中圖分類號】F205【文獻標識碼】A【文章編號】1004-0994(2019)22-0115-9
【基金項目】教育部哲學社會科學研究重大課題攻關項目“新型政商關系研究”(項目編號:17JZD008);國家社會科學基金青年項目“省直管縣改革對縣級政府基本公共服務供給績效的政策效應研究”(項目編號:17CGL052)
一、問題的提出
眾所周知,引發(fā)環(huán)境污染和生態(tài)破壞的主要因素是工業(yè)化進程中的企業(yè)污染物排放。因此,在各個國家的工業(yè)化進程中,環(huán)境規(guī)制與企業(yè)排污之間的關系成為學界長期關注的問題。綜合起來說,環(huán)境規(guī)制可分為介入派和放任派兩個派別。以庀古為代表的介入派認為,可以通過征收稅費的方式,即通過庀古稅和達斯古帕塔的社會貼現(xiàn)率讓政府介入企業(yè)的污染物排放行為之中,從而開啟了政府參與污染物治理的研究進程[1]。以西蒙為代表的放任派則認為,公共資源問題的根源在于缺乏明確的產(chǎn)權,沒有市場價格或者市場價格不能正確反映公共資源的價值。因此,國家可以通過生態(tài)私有化使環(huán)境與生態(tài)資源融入經(jīng)濟體系,讓公共資源進入市場配置領域[2]。不僅如此,放任派還對介入派進行了批判,并認為政府介入環(huán)境保護和企業(yè)污染物排放是缺乏效率的,由于存在優(yōu)先治理問題選擇和公共選擇誤區(qū)等問題,政府介入環(huán)保問題無效甚至有害[3,4]。
不論理論上政府是否應介入企業(yè)排污,出于回應民眾對環(huán)境污染和生態(tài)破壞強烈不滿的需要,各國政府在實踐上都進行了不同程度的環(huán)境規(guī)制。究其本質而言,環(huán)境規(guī)制指的是政府或規(guī)制機構為應對經(jīng)濟活動的外部性,依法對企業(yè)污染行為進行的限制和調節(jié),環(huán)境規(guī)制的執(zhí)行過程實質上是相關主體的博弈過程[5]。針對環(huán)境規(guī)制下企業(yè)排污相關主體的博弈互動問題,國內外學者主要進行了三個方面的研究:第一,在政府和企業(yè)博弈研究方面,原毅軍等[6]從政府環(huán)境政策在污染控制過程中的傳導機制入手,指出政府的環(huán)境政策通過影響排污企業(yè)的污染控制行為從而對環(huán)保產(chǎn)業(yè)的發(fā)展產(chǎn)生影響。蒙肖蓮等[7]的博弈分析結果顯示,應通過鼓勵污染處理或者就地污染最小化,達到對企業(yè)排污行為的理性控制。Moledina等[8]則構建了信息不對稱條件下的動態(tài)博弈模型,其研究結果顯示,針對不同的政策工具,企業(yè)會做出不同的應對策略。吳利華等[9]還運用動態(tài)博弈理論,研究單獨的排污稅政策以及排污稅與減排補貼的組合政策對企業(yè)污染控制行為的影響機理。第二,在公眾參與的博弈研究方面,劉家順等[10]將公眾引入博弈模型,論證了“生態(tài)經(jīng)濟人”假設較之于“經(jīng)濟人”假設更能解釋企業(yè)的排污行為問題。徐詠梅[11]基于不完全信息博弈,指出公眾的環(huán)保參與既可以縮小企業(yè)的排污不達標空間,又可以擴大政府部門的監(jiān)督空間。甄美榮等[12]也構建了以地方政府、排污企業(yè)與公眾為主體的企業(yè)排污治理演化博弈模型,認為建立公眾參與監(jiān)督的有效途徑且做好受損公眾的賠償裁定是治理企業(yè)污染的關鍵之一。第三,在地方政府間的博弈研究方面,潘峰等[13]建立了地方政府間的演化博弈模型,分別研究了未引入約束機制和引入約束機制下的地方政府環(huán)境規(guī)制策略及其影響因素。在此基礎上,他們還分析了地方政府在環(huán)境規(guī)制執(zhí)行中的行為特征,發(fā)現(xiàn)環(huán)境規(guī)制執(zhí)行成本等多種因素都會影響地方政府的進化穩(wěn)定策略[14]。
總體上看,已有文獻中關于排污企業(yè)間互動機制的研究相對缺乏。從筆者所搜集到的文獻看,梅林海等[15]的研究涉及對生態(tài)工業(yè)園區(qū)內同類企業(yè)、不同類企業(yè)間的多種利益博弈格局,但該項研究尚處于起步階段。汪星等[16]雖然分析了基于環(huán)境約束、科技創(chuàng)新和要素集聚三維因素上的同類產(chǎn)品制造企業(yè)間的非合作博弈,但該研究是建立在完全信息假設基礎之上的。本文認為,要想對政府環(huán)境規(guī)制前提下企業(yè)排污行為進行深入研究,必須加強對企業(yè)間排污行為互動的研究,畢竟排污企業(yè)之間的博弈是客觀存在的,且對于企業(yè)排污策略的選擇和調整具有重要意義。為此,本文將在已有研究的基礎上,從不完全信息假設出發(fā),以造紙企業(yè)為例,通過構建演化博弈模型,深入分析政府規(guī)制背景下同行企業(yè)排污策略的選擇和調整的影響因素及內在規(guī)律,為政府規(guī)制和企業(yè)排污的相互關系提供理論和實踐上的些許依據(jù)和貢獻。
二、造紙商排污策略的選擇與調整屬于演化博弈問題
對于特定區(qū)域內的不同造紙商群體來說,選擇直接排污還是凈化處理后排污,是一個博弈問題。一方面,雙方都具有策略選擇的自主性,即任何造紙商都有權決定自身的排污策略;另一方面,雙方的選擇收益不是獨立的,己方的策略選擇收益受到對方策略選擇的影響。而在排污策略選擇的實際過程中,造紙商又表現(xiàn)出明顯的非完全理性特征。
所謂的“非完全理性特征”,指的是博弈決策方在選擇過程中不能在理性計算能力和情緒控制方面做到完美。具體來說,就是人們在進行策略選擇和實施的過程中,會受到識別問題能力、分析推理能力、記憶能力、預測能力、準確行為能力的制約,不能做出完全符合利益最大化原則的決定。即便上述各方面的能力趨于完美,博弈決策方也可能受到情感波動以及顫抖手均衡[17]式的偶犯錯誤的影響。因此,有限理性和演化博弈理論認為,對于現(xiàn)實中的決策行為者來說,完全理性是很難滿足的要求,當社會經(jīng)濟環(huán)境和決策問題較復雜時,人們的理性局限尤為明顯[18]。
在排污行為博弈的過程中,造紙商群體的上述非完全理性特征也是十分顯著的。首先,造紙商不能完全掌握直接排污和凈化處理后排污兩類策略的收益比較情況;其次,造紙商對作為博弈參與者的其他造紙商的排污策略選擇并不清楚,而博弈參與者的策略選擇會影響己方策略選擇的收益;最后,具有合法強制力的政府是否會介入,介入的程度及其帶來的收益影響,造紙商也無從知曉,不能準確判斷。當然,造紙商排污策略選擇過程中的非完全理性還可能出現(xiàn)在特定理由、特定情境下的“突發(fā)奇想”與“偶犯錯誤”。因此,在選擇直接排污還是凈化處理后排污的問題上,造紙商只具有有限理性。
有限理性下造紙商的初始決策具有“擲骰子”的性質,即初始決策并不一定是最優(yōu)的,并不一定能帶來收益最大化。換言之,對于實現(xiàn)收益最大化的目標而言,初始決策可能是在“犯錯”。為了獲取更大的收益,造紙商不會將初始的排污策略固定下來,而是會采取不斷試錯和不斷調整的方式,在各類策略收益比較中,最終確定最優(yōu)策略。這種假設是大致符合大部分造紙商排污策略選擇和演化的現(xiàn)實情境的。
促使造紙商不斷試錯、調整的是其自我反思能力。這種反思既體現(xiàn)在對原有排污策略收益的計算上,也體現(xiàn)在對其他排污策略收益的估計中,更體現(xiàn)在對對方排污策略選擇及其收益的認知和判斷上面。更為直接地說,這種認知和判斷就是學習和模仿。在現(xiàn)實情境中,各個造紙商會通過各種途徑觀察、了解其他造紙商的排污策略,在比較的過程中,深化對自身排污策略收益情況的認識,通過學習和模仿比己方收益更大的排污策略以及規(guī)避和放棄收益較小的排污策略,不斷將排污策略調整到符合自身收益最大化的狀態(tài)上來,進而實現(xiàn)穩(wěn)定均衡狀態(tài)。
這種學習、模仿和調整與生物進化博弈過程中的“復制動態(tài)”機制具有非常高的吻合度。因此,本文將借助演化博弈分析框架模擬和分析造紙商排污策略選擇和調整的過程和狀態(tài)。演化博弈分析的重點在于有限理性博弈方各成員的策略選擇、策略調整和策略演變趨勢以及不同策略比例的穩(wěn)定程度。這樣的分析非常有助于我們理解各種社會均衡現(xiàn)象及其效率意義[18]。進一步地,演化博弈分析還以其所具有的簡潔性、科學性、解釋力和美感[19],為我們提供了理解和想象排污企業(yè)(包括造紙企業(yè)在內)排污策略選擇和調整現(xiàn)實情境的一個新的觀察視角和分析路徑。
三、構建模型
設某一區(qū)域內的造紙行業(yè),其中造紙商群體甲采取凈化處理后排放污水的方式,造紙商群體乙采取直接排放污水的方式。很顯然,不同污水處理方式的收益不同,造紙商群體的博弈收益可表達為:①兩類造紙商群體都選擇凈化處理后排放污水,則雙方都將獲得收益S;②兩類造紙商群體都選擇直接排放污水,則雙方都將獲益T;③如其中一方采取凈化處理后排放污水的策略,而另一方采取直接排放污水的策略,則前者將獲得收益R,后者將獲得收益K。出于演化博弈模型推導的需要,我們還將對兩類造紙商群體不同選擇組合下的收益大小做出假設。
假設1:T>S。假設的基本邏輯是,當兩類造紙商群體都選擇凈化處理后排放污水時,需要在污水處理設備、排污廠房和排污人員等方面付出經(jīng)費,而兩類造紙商群體都選擇直接排放污水時,則不需要支付上述經(jīng)費。因此,兩類造紙商都采取直接排污策略的收益大于采取凈化后排污策略的收益。
假設2:K>T。假設的基本邏輯是,造紙商群體B選擇伴隨生產(chǎn)成本提高的凈化后排污策略,造紙商群體A選擇直接排污策略,則群體A可以獲得額外的價格競爭優(yōu)勢,這種優(yōu)勢是在兩類群體都采取直接排污策略時所沒有的。反之亦然。因此,具有額外價格競爭優(yōu)勢情形下的群體A收益大于沒有額外價格競爭優(yōu)勢情形下的群體B收益。
假設3:S>R。假設的基本邏輯是,造紙商群體B選擇直接排污,造紙商群體A選擇凈化處理后排污,則造紙商群體A會形成額外的價格競爭劣勢,這種劣勢是在兩類群體都采取凈化處理后排污時所沒有的。反之亦然。因此,具有額外價格競爭劣勢的造紙商群體A收益小于沒有額外價格競爭劣勢的造紙商群體B收益。
綜合假設1、假設2和假設3,不難發(fā)現(xiàn),在缺乏政府介入和環(huán)境規(guī)制這樣類似于“叢林生存”的情形下,對方凈化處理后排污而己方直接排污的收益最大,雙方都直接排污時的收益其次,雙方都凈化處理后排污的收益再次,對方直接排污而己方凈化處理后排污的收益最小。各類情形下的造紙商收益排序可表示為:K>T>S>R>0。收益矩陣可表示為表1。
很顯然,按照上述收益排序假設,在缺乏政府介入和環(huán)境規(guī)制的情形下,為了實現(xiàn)利潤最大化,該區(qū)域內的造紙商群體會選擇直接排放污水的策略,并達成納什均衡狀態(tài)(T,T)。然而,這種狀態(tài)不僅會破壞區(qū)域環(huán)境,還會引發(fā)當?shù)睾拖掠尉用竦牟粷M和抗議,不符合可持續(xù)發(fā)展的戰(zhàn)略要求和為人民服務的執(zhí)政理念。因此,政府必須采取相關措施,對造紙企業(yè)的排污行為進行相應規(guī)制。從規(guī)制經(jīng)濟學的基本原理和環(huán)境規(guī)制的實踐經(jīng)驗來看,政府一般會從正向激勵和負向激勵兩個方面對造紙商排污行為進行規(guī)制。具體而言,正向激勵表現(xiàn)為對凈化處理后排污的造紙商進行財政補貼和稅收減免,負向激勵表現(xiàn)為對直接排放污水的造紙商進行停業(yè)休整和處以罰金。將正向激勵標示為M(M>0),負向激勵標示為N(N>0),則環(huán)境規(guī)制背景下的造紙商群體博弈收益矩陣可表示為表2。
由于造紙商只會在直接排放污水和凈化處理后排放污水兩種策略選擇中進行取舍,因此,在模型分析過程中,只需要對其中一種排污策略的演化過程進行分析即可[20]。本文選取凈化處理后排污進行演化過程分析。按照演化博弈的分析進路,本文將關注凈化處理后排污比例的動態(tài)變化,以達到研究該類排污選擇調整的過程和趨勢及該類選擇比例穩(wěn)定性的目的。不難發(fā)現(xiàn),比例動態(tài)變化的速度反映了該區(qū)域內造紙商學習、模仿采取凈化處理后排污方式的速度。
從邏輯上說,影響直接排污策略比例動態(tài)變化速度的因素來自于兩個方面:第一個因素是采取凈化處理后排污策略的造紙商的存量情況。很顯然,存量越大,則可供采取直接排污策略的造紙商學習和模仿的機會越多,學習和模仿的難度越小。存量大小可以用采取凈化處理后排污策略的造紙商數(shù)量占該區(qū)域內參與博弈的造紙商總數(shù)的百分比表示。影響凈化處理后排污策略比例動態(tài)速度的第二個因素是凈化處理后排污策略的激勵程度。很顯然,激勵越大,則凈化處理后排污策略對采取直接排污策略的造紙商的吸引力越大。激勵大小可用凈化處理后排污的收益超過兩種排污選擇平均收益的差值(當然差值也有可能為負)表示。這樣,我們就可以利用存量大小和激勵大小兩個參數(shù)構建動態(tài)微分方程,并以此表示選擇凈化處理后排污策略的動態(tài)變化速度。動態(tài)微分方程見式(1)。
按照演化博弈理論,可用式(7)所代表的動態(tài)微分方程數(shù)值分析造紙商排污策略的變化和穩(wěn)定性:①當f(x)>0時,其現(xiàn)實意義是隨著時間的變化,有越來越多的造紙商選擇凈化處理后排污的策略;②當f(x)<0時,其現(xiàn)實意義是隨著時間的變化,有越來越多的造紙商改變凈化處理后排污的策略而選擇直接排污的策略;③當f(x)=0時,其現(xiàn)實意義是在此情形下,沒有造紙商會改變自身的排污策略,也即采取凈化后排污策略和直接排污策略的比例不會發(fā)生變化。換言之,在此情形下,博弈雙方的學習和模仿行為停止了,此時的x即為演化中的穩(wěn)定點。因此,分析和研究造紙商群體間排污策略的學習、模仿及選擇直接排污策略的造紙商比例的穩(wěn)定性時,求解f(x)等于零時的x數(shù)值,也就是選擇凈化處理后排污的初始比例的數(shù)值就成為解題的關鍵了。
不過,還有一種情形是,即便選擇凈化處理后排污策略的造紙商初始比例x是穩(wěn)定點,也即造紙商群體通過學習和模仿找到了最佳排污策略,兩種排污策略的比例保持穩(wěn)定,但也有可能會出現(xiàn)個別或一小部分造紙商群體“偶犯錯誤”,做出非正常的選擇和改變。在此情形下,可能會發(fā)生兩種情況:第一種情況是,這種“偶犯的錯誤”不會對整個區(qū)域的造紙商排污策略選擇造成實質性影響,即博弈群體在個別或一小部分造紙商群體的干擾下仍然保持穩(wěn)健性;第二種情況是,這種“偶犯的錯誤”會帶動其他造紙商群體排污策略的改變,進而引發(fā)社會意義上的“蝴蝶效應”[21],從而使造紙商群體的博弈狀態(tài)發(fā)生改變并收斂到其他的“穩(wěn)定狀態(tài)”。
演化博弈理論認為,如果某個穩(wěn)定點受到干擾后,兩類策略比例仍能保持穩(wěn)定,博弈狀態(tài)不發(fā)生改變,則這個穩(wěn)定點被定義為局部漸進穩(wěn)定點,由該穩(wěn)定點決定而形成的穩(wěn)定狀態(tài)被定義為進化穩(wěn)定策略。反之,在個別和一小部分博弈群體的“偶犯錯誤”的影響下,其他博弈群體經(jīng)過學習和模仿后,改變了自身原有的博弈策略,也即這個穩(wěn)定點受到微小擾動后,經(jīng)過一段時間,原來的博弈狀態(tài)發(fā)生了實質性改變。此時,我們將這個穩(wěn)定點稱為非局部漸進穩(wěn)定點,穩(wěn)定點決定而形成的穩(wěn)定狀態(tài)被稱為非進化穩(wěn)定策略。在應用數(shù)學中,動力系統(tǒng)的運動穩(wěn)定性理論[22]對此進行了數(shù)學證明并提供了局部漸進穩(wěn)定點和進化穩(wěn)定策略的判定標準:當穩(wěn)定點x*處的動態(tài)微分方程f(x)的導數(shù),即f(x)<0時,x是局部漸進穩(wěn)定點,該博弈狀態(tài)是進化穩(wěn)定策略;當f(x)≥0時,x不是局部漸進穩(wěn)定點,該博弈狀態(tài)不是進化穩(wěn)定策略。
五、參數(shù)分析與數(shù)值模擬
本部分將從實踐模擬的角度,以“命題陳述與證明”部分為基礎,通過origin平臺,從數(shù)值模擬的角度分析不同參數(shù)條件下,造紙商群體排污策略的選擇、調整以及策略的穩(wěn)定性。
1. M+N
圖3給出的三條曲線的現(xiàn)實含義是,當政府給予造紙商的正向激勵和負向激勵程度一般,使其大于相同選擇情境下的直接排放策略收益與不同選擇情境下的凈化處理后排放策略收益的差值,但又小于不同選擇情境下的直接排放策略收益與相同選擇情境下的凈化處理后排放策略收益的差值時,即當M+N