馬彥敏,李恩平
(太原理工大學經(jīng)濟管理學院,山西 晉中 030600)
煤炭作為中國的基礎(chǔ)能源,對于支撐國民經(jīng)濟的發(fā)展發(fā)揮著重要的作用,但是傳統(tǒng)的煤炭開采方式經(jīng)常會引發(fā)地表坍塌、污染周邊水資源、破壞土地資源等一系列生態(tài)環(huán)境問題。目前,“2030年前碳排放達到峰值、2060年前實現(xiàn)碳中和”已成為我國的目標,在這一愿景下,煤炭企業(yè)應(yīng)該由傳統(tǒng)以環(huán)境為代價的開采方式轉(zhuǎn)變?yōu)榫G色、低碳的開采方式,以實現(xiàn)煤炭行業(yè)的可持續(xù)發(fā)展。綠色開采是指在煤炭的生產(chǎn)、銷售過程中,煤炭企業(yè)始終貫徹綠色發(fā)展理念,尤其是在生產(chǎn)過程中企業(yè)能夠主動選擇執(zhí)行綠色開采技術(shù),提高開采效率[1-2]。綠色開采技術(shù)的執(zhí)行需要煤炭企業(yè)進行一定的成本投入,而企業(yè)出于自身利潤最大化的考慮,積極主動性會減弱。政府作為煤炭企業(yè)綠色開采的監(jiān)管者,有責任通過給予補貼或?qū)嵤土P來提高煤炭企業(yè)執(zhí)行綠色開采技術(shù)的積極性[3],促使煤炭企業(yè)走上綠色開采的路徑。
政府對煤炭企業(yè)監(jiān)管的過程實質(zhì)上是博弈的過程,學者們運用靜態(tài)博弈和動態(tài)博弈的方法分別進行了研究。在靜態(tài)博弈方面,呂雁琴等[4]通過分析政府和煤炭企業(yè)在生態(tài)補償問題上的博弈行為,為新疆煤炭資源開發(fā)生態(tài)補償機制提出了建議;徐水太等[5]研究了礦山企業(yè)如何通過與政府博弈,最終積極主動地發(fā)展綠色循環(huán)經(jīng)濟。在動態(tài)博弈方面,馬媛等[6]、張偉等[7]通過建立政府和煤炭企業(yè)的演化博弈模型,從動態(tài)的角度探討兩個群體綠色開采監(jiān)管的演化穩(wěn)定策略。但是多數(shù)研究都是以政府和單一的煤炭企業(yè)作為博弈主體,有關(guān)政府和兩個大型煤炭企業(yè)進行三方博弈的研究較為缺乏。因此,本文通過構(gòu)建煤炭企業(yè)A、煤炭企業(yè)B以及政府綠色開采監(jiān)管策略的演化博弈模型,探討三方主體在動態(tài)博弈后的穩(wěn)定策略,并用MATLAB數(shù)值仿真分析促使系統(tǒng)達到最優(yōu)策略狀態(tài)的因素,進而為煤炭企業(yè)的綠色開采提出建議。
本文的研究主體為煤炭企業(yè)A、煤炭企業(yè)B和政府。根據(jù)演化博弈理論[8],博弈參與方都是有限理性的,需要通過不斷的學習、改進來接近最優(yōu)策略,而不是在最開始就找到最優(yōu)策略,因此為研究煤炭企業(yè)A、煤炭企業(yè)B和政府在不同策略組合下的成本、收益以及損失,需作出如下假設(shè)。
假設(shè)1:博弈的參與者包括煤炭企業(yè)A(m)、煤炭企業(yè)B(r)、政府(t),并且在博弈過程中三方群體都是有限理性的,即以自身利潤最大化為目標。
假設(shè)2:煤炭企業(yè)A和煤炭企業(yè)B為當?shù)氐膬杉掖笮兔禾科髽I(yè),它們?yōu)榱送瓿烧逻_的指標,會存在相互搭便車的行為。
假設(shè)3:煤炭企業(yè)A的行為策略空間為執(zhí)行綠色開采技術(shù)和不執(zhí)行綠色開采技術(shù)(簡記為M,NM);煤炭企業(yè)B的行為策略空間為執(zhí)行綠色開采技術(shù)和不執(zhí)行綠色開采技術(shù)(簡記為R,NR);政府的行為策略空間為監(jiān)管和不監(jiān)管(簡記為T,NT)。
假設(shè)4:煤炭企業(yè)A執(zhí)行綠色開采技術(shù)的概率為x,不執(zhí)行綠色開采技術(shù)的概率為1-x;煤炭企業(yè)B執(zhí)行綠色開采技術(shù)的概率y,不執(zhí)行綠色開采技術(shù)的概率為1-y;政府監(jiān)管的概率為z,不監(jiān)管的概率為1-z。
根據(jù)上述假設(shè),需設(shè)置相關(guān)變量(表1)。不失一般性,假設(shè)各變量均大于0。
表1 變量設(shè)置Table 1 Variable settings
根據(jù)上述假設(shè)和變量,可以得到煤炭企業(yè)A、煤炭企業(yè)B、政府在選擇不同策略時的收益矩陣,見表2。
表2 煤炭企業(yè)A、煤炭企業(yè)B和政府三方博弈的收益矩陣Table 2 The income matrix of the tripartite game among coal enterprise A,coal enterprise B and the government
在模型構(gòu)建的基礎(chǔ)上,首先求解出煤炭企業(yè)A、煤炭企業(yè)B和政府的復(fù)制動態(tài)方程,然后通過雅可比矩陣分析三方綠色開采監(jiān)管策略的演化穩(wěn)定性。
根據(jù)表1和表2可知,煤炭企業(yè)A在博弈時執(zhí)行綠色開采技術(shù)的期望收益、不執(zhí)行綠色開采技術(shù)的期望收益、平均期望收益計算分別見式(1)~式(3)。
EM=zy(Im+Rm+Sm-Cm)+
z(1-y)(Im+Sm-Cm)+
(1-z)y(Im+Rm-Cm)+
(1-z)(1-y)(Im-Cm)=
yRm+zSm+Im-Cm
(1)
ENM=zy(Im+Lm-P)+
z(1-y)(Im-P)+(1-z)y(Im+Lm)+
(1-z)(1-y)Im=yLm-zP+Im
(2)
x(yRm+zSm+Im-Cm)+
(1-x)(yLm-zP+Im)
(3)
由演化博弈理論可知,煤炭企業(yè)A的復(fù)制動態(tài)方程為式(4)。
x(1-x)[y(Rm-Lm)+z(Sm+P)-Cm]
(4)
煤炭企業(yè)B在博弈時執(zhí)行綠色開采技術(shù)的期望收益、不執(zhí)行綠色開采技術(shù)的期望收益、平均期望收益計算分別見式(5)~式(7)。
ER=zx(Ir+Rr+Sr-Cr)+
z(1-x)(Ir+Sr-Cr)+(1-z)x(Ir+Rr-Cr)+
(1-z)(1-x)(Ir-Cr)=xRr+zSr+Ir-Cr
(5)
ENR=zx(Ir+Lr-P)+z(1-x)(Ir-P)+
(1-z)x(Ir+Lr)+(1-z)(1-x)Ir=
xLr-zP+Ir
(6)
y(xRr+zSr+Ir-Cr)+(1-y)(xLr-zP+Ir)
(7)
則煤炭企業(yè)B的復(fù)制動態(tài)方程為式(8)。
y(1-y)[x(Rr-Lr)+z(Sr+P)-Cr]
(8)
政府在博弈時監(jiān)管的期望收益、不監(jiān)管的期望收益、平均期望收益計算分別見式(9)~式(11)。
ET=xy(G-C0)+x(1-y)(G′-C0)+
(1-x)y(G′-C0)+(1-x)(1-y)(-C0)=
xy(G-2G′)+xG′+yG′-C0
(9)
ENT=xyG+x(1-y)G′+(1-x)yG′=
xy(G-2G′)+xG′+yG′
(10)
z[xy(G-2G′)+xG′+yG′-C0]+
(1-z)[xy(G-2G′)+xG′+yG′]
(11)
則政府的復(fù)制動態(tài)方程為式(12)。
(12)
將式(4)、式(8)和式(12)聯(lián)立,得到煤炭企業(yè)A、煤炭企業(yè)B、政府的復(fù)制動力系統(tǒng),見式(13)。
(13)
令F(x)=F(y)=F(z)=0,可以得到局部均衡點。多群體演化博弈的演化穩(wěn)定點(ESS)必然為純策略納什均衡,即在非對稱博弈中混合策略均衡一定不是演化穩(wěn)定均衡[9]。因此,后續(xù)研究僅需要分析8個純策略均衡點,即E1(0,0,0),E2(0,0,1),E3(0,1,0),E4(0,1,1),E5(1,0,0),E6(1,0,1),E7(1,1,0),E8(1,1,1)。
FRIEDMAN[10]提出,通過分析復(fù)制動力系統(tǒng)所對應(yīng)雅可比矩陣的局部穩(wěn)定性,可以得到該系統(tǒng)的演化穩(wěn)定策略(ESS),而雅可比矩陣見式(14)。
(14)
由式(13)和式(14)可知,煤炭企業(yè)A、煤炭企業(yè)B、政府復(fù)制動力系統(tǒng)的雅可比矩陣見式(15)。
因此,雅可比矩陣J的特征值分別為:λ1=(1-2x)[y(Rm-Lm)+z(Sm+P)-Cm],λ2=(1-2y)[x(Rr-Lr)+z(Sr+P)-Cr],λ3=(1-2z)(-C0)。依此類推,分別將8個純策略均衡點代入式(15)中,可以得到各均衡點的特征值。根據(jù)李雅普諾夫判別法[11],如果雅可比矩陣中某均衡點的所有特征值λ>0,則稱該均衡點為源,即為不穩(wěn)定點;如果某均衡點的所有特征值λ<0,則稱該均衡點為匯,即為漸近穩(wěn)定點(ESS);如果某均衡點的特征值λ有正有負,則稱該均衡點為鞍,即為不穩(wěn)定點。因此分別對8個純策略均衡點進行穩(wěn)定性分析,見表3。
表3 均衡點的穩(wěn)定性分析Table 3 Stability analysis of equilibrium point
根據(jù)表3,分兩種情形對演化穩(wěn)定策略進行討論。
情形1:當Ri-Li>Ci(i=m,r)時,即煤炭企業(yè)A或煤炭企業(yè)B的超額收益與機會主義收益之差大于雙方企業(yè)執(zhí)行綠色開采技術(shù)的成本,均衡點E1(0,0,0)和E7(1,1,0)的所有特征值均小于0,即該系統(tǒng)有(0,0,0)和(1,1,0)兩個演化穩(wěn)定點,分別表示煤炭企業(yè)A和煤炭企業(yè)B均選擇不執(zhí)行綠色開采技術(shù)、政府選擇不監(jiān)管以及煤炭企業(yè)A和煤炭企業(yè)B均選擇執(zhí)行綠色開采技術(shù)、政府選擇不監(jiān)管。
情形2:當Ri-Li 綜上可知,經(jīng)過一段時間的三方博弈,煤炭企業(yè)A和煤炭企業(yè)B最終的穩(wěn)定策略可能是均執(zhí)行綠色開采技術(shù),也可能是均不執(zhí)行綠色開采技術(shù),而政府最終的穩(wěn)定策略是不監(jiān)管,即對雙方是否執(zhí)行綠色開采技術(shù)無作為。但是本文致力于提供煤炭企業(yè)A執(zhí)行綠色開采技術(shù)、煤炭企業(yè)B執(zhí)行綠色開采技術(shù)、政府不監(jiān)管的發(fā)展模式,即鼓勵達到(x=1,y=1,z=0)的理想策略狀態(tài),因此下文僅分析Ri-Li>Ci(i=m,r)的情形。 為了驗證當Ri-Li>Ci(i=m,r)時,煤炭企業(yè)A、煤炭企業(yè)B、政府三方的演化穩(wěn)定策略以及分析相關(guān)參數(shù)對演化結(jié)果的影響,采用MATLAB2018a軟件進行數(shù)值仿真及分析。本文相關(guān)參數(shù)值根據(jù)文獻[12]、文獻[13]和有關(guān)專家的意見設(shè)置,并且滿足“Ri-Li>Ci(i=m,r)”的限制條件。因此各參數(shù)初始值的設(shè)置分別為:Rm=17,Rr=14,Lm=6,Lr=4,Cm=8,Cr=7,Sm=9,Sr=8,P=3,C0=4,t=100。在三維空間上描述不同初始點向均衡點演化的過程,演化路徑如圖1所示。結(jié)果表明,當煤炭企業(yè)A或煤炭企業(yè)B的超額收益與機會主義收益之差大于雙方執(zhí)行綠色開采技術(shù)的成本時,系統(tǒng)最終趨向于均衡點(0,0,0)和(1,1,0),即該系統(tǒng)有兩個演化穩(wěn)定策略(煤炭企業(yè)A和煤炭企業(yè)B均不執(zhí)行綠色開采技術(shù)、政府不監(jiān)管以及煤炭企業(yè)A和煤炭企業(yè)B均執(zhí)行綠色開采技術(shù)、政府不監(jiān)管),該數(shù)值仿真也符合雅可比矩陣穩(wěn)定性分析的結(jié)果。 圖1 不同初始點的動態(tài)演化路徑Fig.1 The dynamic evolution path of different initial points 由于本文將煤炭企業(yè)A、煤炭企業(yè)B以及政府看作一個博弈系統(tǒng),而煤炭企業(yè)A和煤炭企業(yè)B在演化過程中穩(wěn)定狀態(tài)的形成具有相似性,因此僅對三方主體初始意愿、煤炭企業(yè)A的機會主義收益、執(zhí)行綠色開采技術(shù)的成本,政府監(jiān)管成本以及政府獎懲對系統(tǒng)演化結(jié)果的影響進行分析。 3.2.1 初始意愿對系統(tǒng)演化結(jié)果的影響 初始意愿對系統(tǒng)演化結(jié)果的影響如圖2所示。從圖2可以看出,當煤炭企業(yè)或政府的初始意愿較低時,系統(tǒng)最終趨向于均衡點(0,0,0),即煤炭企業(yè)A和煤炭企業(yè)B均選擇不執(zhí)行綠色開采技術(shù)、政府選擇不監(jiān)管;當煤炭企業(yè)或政府的初始意愿較高時,系統(tǒng)最終趨向于均衡點(1,1,0),即煤炭企業(yè)A和煤炭企業(yè)B均選擇執(zhí)行綠色開采技術(shù)、政府選擇不監(jiān)管。 圖2 初始意愿對系統(tǒng)演化結(jié)果的影響Fig.2 The influence of initial intention on the system evolution results 3.2.2 相關(guān)參數(shù)對系統(tǒng)演化結(jié)果的影響 1)初始意愿均為0.5時分為兩種情況,具體如下所述。 ①Lm、Cm、C0對系統(tǒng)演化結(jié)果的影響。在初始意愿不變的前提下,分別取Lm=6,4,3、Cm=6,8,9、C0=2,4,5,演化路徑如圖3所示。結(jié)果表明:當Rm-Lm>Cm時,即煤炭企業(yè)A的超額收益與機會主義收益之差可以彌補其執(zhí)行綠色開采技術(shù)的成本,煤炭企業(yè)A為了自身利潤的最大化,最終會選擇執(zhí)行綠色開采技術(shù)。煤炭企業(yè)B由于和煤炭企業(yè)A在演化過程中穩(wěn)定狀態(tài)的形成具有相似性,最終也會選擇執(zhí)行綠色開采技術(shù)。由于煤炭企業(yè)A和煤炭企業(yè)B均自主執(zhí)行綠色開采技術(shù),則政府的監(jiān)管概率會逐漸降低,最終會對雙方企業(yè)無作為。因此,系統(tǒng)最終趨向于均衡點(1,1,0),并且機會主義收益越小、執(zhí)行綠色開采技術(shù)的成本越小,系統(tǒng)趨向于(1,1,0)的速度越快,進而越能提高煤炭企業(yè)A和煤炭企業(yè)B執(zhí)行綠色開采技術(shù)的意愿。 圖3 各參數(shù)對系統(tǒng)演化結(jié)果的影響Fig.3 The influence of various parameters on the system evolution results 當C0分別取2,4,5時,政府選擇監(jiān)管將產(chǎn)生一定的成本,此時煤炭企業(yè)A和煤炭企業(yè)B會通過更新設(shè)備等措施來避免政府的懲罰,則之后雙方會趨向于自發(fā)地執(zhí)行綠色開采技術(shù),政府也趨向于不監(jiān)管。因此,系統(tǒng)最終趨向于均衡點(1,1,0),并且政府監(jiān)管成本越小,系統(tǒng)趨向于(1,1,0)的速度越快,進而越能提高煤炭企業(yè)A和煤炭企業(yè)B執(zhí)行綠色開采技術(shù)的意愿。 ②Sm+P對系統(tǒng)演化結(jié)果的影響。在初始意愿不變的前提下,分別取Sm+P=7.2,7.3,12,16,20,演化路徑如圖4所示。結(jié)果表明:當Sm+P為7.2時,政府給予煤炭企業(yè)A的獎懲較低,由于企業(yè)群體是有限理性的,所以煤炭企業(yè)A執(zhí)行綠色開采技術(shù)的意愿較低,煤炭企業(yè)B執(zhí)行綠色開采技術(shù)的意愿也較低,則系統(tǒng)最終趨向于均衡點(0,0,0);當Sm+P為7.3,12,16,20時,煤炭企業(yè)A和煤炭企業(yè)B執(zhí)行綠色開采技術(shù)的意愿均會增加,雙方之后便會趨向于自發(fā)地執(zhí)行綠色開采技術(shù),政府也趨向于不監(jiān)管,則系統(tǒng)最終趨向于均衡點(1,1,0)??傊?,隨著政府獎懲取值的變化,系統(tǒng)會出現(xiàn)兩個演化均衡點(0,0,0)和(1,1,0),但是政府獎懲存在一個臨界值(7.2~7.3),當實際值大于該臨界值時,系統(tǒng)會向(1,1,0)演化,并且實際值越大,系統(tǒng)趨向于(1,1,0)的速度越快,進而越能提高煤炭企業(yè)A和煤炭企業(yè)B執(zhí)行綠色開采技術(shù)的意愿。 圖4 政府獎懲對系統(tǒng)演化結(jié)果的影響Fig.4 The influence of government rewards and punishments on the system evolution results 2)初始意愿較低時。當煤炭企業(yè)A、煤炭企業(yè)B以及政府的初始意愿均較低時,經(jīng)過研究發(fā)現(xiàn),Cm、Sm+P有助于系統(tǒng)向理想狀態(tài)轉(zhuǎn)變,演化路徑如圖5所示。結(jié)果表明:Cm的取值范圍為2.2~2.6,并且Cm存在一個臨界值(2.2~2.3),當實際值小于該臨界值時,會使煤炭企業(yè)A、煤炭企業(yè)B由不執(zhí)行綠色開采技術(shù)轉(zhuǎn)變?yōu)樽园l(fā)地執(zhí)行綠色開采技術(shù);Sm+P的取值范圍為>57.7,并且政府獎懲存在一個臨界值(57.7~57.8),當實際值大于該臨界值時,會使煤炭企業(yè)A、煤炭企業(yè)B由不執(zhí)行綠色開采技術(shù)轉(zhuǎn)變?yōu)樽园l(fā)地執(zhí)行綠色開采技術(shù)。 圖5 Cm、Sm+P對系統(tǒng)演化結(jié)果的影響Fig.5 The influence of Cm and Sm+P on the system evolution results 3)初始意愿較高時。當煤炭企業(yè)A、煤炭企業(yè)B和政府的初始意愿均較高時,Lm、Cm、C0、Sm+P等參數(shù)對系統(tǒng)演化結(jié)果的影響小于初始意愿對系統(tǒng)演化結(jié)果的影響,具體如圖2所示。 本文基于演化博弈理論研究了煤炭企業(yè)A、煤炭企業(yè)B和政府綠色開采監(jiān)管策略的變化過程,結(jié)果表明:煤炭企業(yè)A和煤炭企業(yè)B由均不執(zhí)行綠色開采技術(shù)轉(zhuǎn)變?yōu)樽园l(fā)地執(zhí)行綠色開采技術(shù)受到初始意愿、機會主義收益、執(zhí)行綠色開采技術(shù)的成本、政府監(jiān)管成本以及政府獎懲的影響。具體而言:當三方主體的初始意愿為中立時,機會主義收益、執(zhí)行綠色開采技術(shù)成本、政府監(jiān)管成本的降低會促使系統(tǒng)達到煤炭企業(yè)A和煤炭企業(yè)B均執(zhí)行綠色開采技術(shù)、政府不監(jiān)管的狀態(tài),政府獎懲在滿足特定條件時會促使系統(tǒng)達到最優(yōu)策略狀態(tài);當三方主體的初始意愿較低時,執(zhí)行綠色開采技術(shù)成本、政府獎懲在滿足特定條件時會促使系統(tǒng)達到最優(yōu)策略狀態(tài);三方主體較高的初始意愿也有助于系統(tǒng)向理想狀態(tài)演化。針對結(jié)論,本文提出如下建議。 1)有效降低煤炭企業(yè)A和煤炭企業(yè)B的機會主義收益以及執(zhí)行綠色開采技術(shù)的成本。在執(zhí)行綠色開采技術(shù)的過程中,煤炭企業(yè)A和煤炭企業(yè)B可能會相互搭便車,這將阻礙雙方綠色開采行為的有效進行,因此,應(yīng)該建立有效的溝通機制,加強雙方的信任關(guān)系,降低機會主義收益;同時,煤炭企業(yè)A和煤炭企業(yè)B通過掌握關(guān)鍵的綠色開采技術(shù)、靈活運用綠色開采優(yōu)惠政策以及加強技術(shù)人員的培訓(xùn)等措施來降低成本投入,促使雙方企業(yè)均執(zhí)行綠色開采技術(shù)。 2)降低政府的監(jiān)管成本。政府監(jiān)管成本過高會削弱政府的監(jiān)管力度,這將直接影響煤炭企業(yè)的綠色開采行為。因此可以通過精簡監(jiān)管機構(gòu)以使各機構(gòu)之間權(quán)責分明、確保政府人員正確合理地運用經(jīng)濟管理權(quán)、引入第三方檢查機制等措施來降低政府部門的監(jiān)管成本,提升煤炭企業(yè)A和煤炭企業(yè)B執(zhí)行綠色開采技術(shù)的意愿,促使雙方企業(yè)均執(zhí)行綠色開采技術(shù)。 3)完善政府獎懲政策。政府作為監(jiān)管者,對煤炭企業(yè)A和煤炭企業(yè)B補貼、懲罰的程度會直接影響雙方企業(yè)的綠色開采行為。因此,可以通過加大政府監(jiān)管力度精準地進行補貼和懲罰,如政府可以根據(jù)煤炭企業(yè)執(zhí)行綠色開采技術(shù)程度的不同給予差異化獎勵,以使政府的獎懲政策更加完善,從而更好地引導(dǎo)煤炭企業(yè)A和煤炭企業(yè)B執(zhí)行綠色開采技術(shù)。3 數(shù)值仿真與分析
3.1 數(shù)值仿真
3.2 數(shù)值分析
4 結(jié)論與建議