宋作玲 史欣
[摘要]在制造商、零售商、回收商等企業(yè)聯(lián)合回收模式下,聯(lián)合回收聯(lián)盟根據(jù)政府的激勵獎懲機制權(quán)衡自己的成本與績效。探討了政府進行補貼和懲罰策略對于聯(lián)合回收行為的影響,運用演化博弈的方法進行數(shù)學建模和數(shù)值仿真。仿真結(jié)果表明:兩種情況下達到穩(wěn)定狀態(tài),一種是綠色回收收益多于傳統(tǒng)回收收益時,另一種是懲罰監(jiān)管成本與補貼激勵成本之差小于被懲罰的損失時。其余情況下,聯(lián)合回收主體是否選擇綠色回收由政府采取何種激勵機制的概率決定。通過博弈分析可以為政府監(jiān)管機制選取以及聯(lián)合回收行為決策提供依據(jù)。
[關鍵詞]政府獎懲機制;電子廢棄物;聯(lián)合回收;演化博弈
[中圖分類號]F252.19???? [文獻標識碼]A???? [文章編號]1005-152X(2022)03-0058-05
Evolutionary Game Analysis of Government Reward and Punishment Mechanism in E-waste Joint Recycling
SONG Zuoling1,2, SHI Xin3
(1. College of Transportation, Shandong University of Science & Technology, Qingdao 266590;2. College of Economics & Management, Shandong University of Science & Technology, Qingdao 266590;3. College of Transportation Engineering, Dalian Maritime University, Dalian 116026, China)
Abstract: The paper pointed out that under the joint recycling setup involving the alliance made up of the manufacturer, retailer, and recycler, etc., the joint recycling alliance would weigh its own costs and performance according to the reward and punishment mechanism of the government. Then, it discussed how government subsidy or punishment would impact the joint recycling behavior, and used the evolutionary game method for mathematical modeling and numerical simulation. The simulation result indicated that equilibrium could be reached in two scenarios: one being when the green recovery return was more than the traditional recovery return; the other being when the difference between the punishment regulatory cost and the subsidy incentive cost was less than the loss from punishment. In other cases, whether thejoint recycling subjects chose green recovery was determined by the probability of the incentive or punitive measures taken by the government. The game analysis in this paper could provide reference for the selection of government supervision mechanism and the decision making onjoint recycling behaviors.
Keywords: government reward and punishment; e-waste;joint recycling; evolutionary game
0 引言
2020年,習近平主席在聯(lián)合國大會上宣布了中國的低碳目標,在2030年前實現(xiàn)碳達峰,2060年實現(xiàn)碳中和,充分顯示了中國政府參與環(huán)境治理的決心。作為工業(yè)門類最多的制造大國,在制造業(yè)開展碳中和目標對于整體目標達成尤為重要。
政府環(huán)境戰(zhàn)略目標、社會環(huán)境意識提高、環(huán)境和社會事故頻發(fā)等促使生產(chǎn)企業(yè)責任延伸的實踐,制造商作為焦點企業(yè)與供應鏈上下游參與者以及利益相關方協(xié)同,以實現(xiàn)經(jīng)濟、環(huán)境、社會綜合績效提升。據(jù)《中國廢棄電子產(chǎn)品循環(huán)經(jīng)濟潛力報告》顯示,2030年我國電子廢棄量將超過2700萬t,對環(huán)境破壞嚴重,因此,通過回收利用產(chǎn)生價值增值、節(jié)能降耗勢在必行。
使用關鍵詞或摘要“回收”“政府”“博弈”檢索核心期刊、EI、CSSCI共查詢出269篇,主要集中于閉環(huán)供應鏈、逆向物流等領域,側(cè)重研究政府補貼、激勵機制對于電子廢棄物、廢舊家電、電池、共享單車的回收渠道、機制、定價策略等的影響。
已有研究從制造商和零售商、回收商視角或者政府監(jiān)管和制造商回收廢棄電子視角的博弈分析較多[1-3],少有文獻從政府獎懲和聯(lián)合回收視角進行博弈行為分析。聯(lián)合回收作為回收主體和渠道的一種有效方式,應該作為博弈主體進行分析,是對制造商和零售商、回收商聯(lián)盟模式的拓展分析,并且將政府環(huán)境規(guī)制引入供應鏈可持續(xù)治理。同時,考慮綠色回收產(chǎn)生的社會效益,進而找到促進回收逆向供應鏈的驅(qū)動機制。
回收聯(lián)盟采用技術(shù)創(chuàng)新、基礎設施布局、綠色研發(fā)、分類拆解等方式實現(xiàn)電子廢棄物的有效循環(huán)利用[4]。為了解決回收聯(lián)盟回收意愿低、綠色回收開發(fā)成本大、回收率低、回收利潤低等問題,政府可以對采取綠色回收的回收供應鏈聯(lián)盟給予一定的補貼,同時政府對于沒有有效履行延伸責任的供應鏈聯(lián)盟收取一定的環(huán)境污染處罰[5-6]。然而,政府監(jiān)管也存在一定難度和監(jiān)管成本。因此,權(quán)衡環(huán)境治理成本、監(jiān)管成本、環(huán)境治理效益也是政府參與供應鏈治理的問題之一。
綜上,本文構(gòu)建了包括回收聯(lián)盟和政府兩方的博弈模型,進行模型仿真并得出結(jié)論和建議。
1 模型假設與參數(shù)設置
假設博弈雙方僅具有有限理性,則:
(1)策略集合。政府對于回收聯(lián)盟治理的策略集記為 S1=(補貼,罰款);回收聯(lián)盟是否實施綠色回收的策略集記為S2=(綠色回收,傳統(tǒng)回收)。
(2)局中人行為策略采取的比例。假設政府實施激勵機制的概率為X,則政府采取懲罰機制的概率為 1-X;聯(lián)合回收主體選擇綠色回收的概率為Y,則其選擇不分類回收的概率為1-Y。
(3)參數(shù)假設及含義。聯(lián)合回收商選擇“綠色回收”時的收益為Pg;聯(lián)合回收商采用“傳統(tǒng)回收”方式得到的收益為Pt;回收聯(lián)盟選擇“綠色回收”時的可持續(xù)收益為 Sg;聯(lián)合回收商實施“綠色回收”的成本為 Cg;聯(lián)合回收商采用傳統(tǒng)回收方式的成本為 Ct;若聯(lián)合回收商主動選擇綠色回收,政府將給予一定的補貼,補貼系數(shù)為α,補貼程度為R;聯(lián)合回收商采用傳統(tǒng)回收方式受到政府懲罰的風險系數(shù)為β;聯(lián)合回收商采用傳統(tǒng)回收方式受到政府懲罰的損失為F。從政府層面,回收商選擇“綠色回收”時帶來的環(huán)境與社會效益為Eg;政府采取激勵或懲罰措施需要一定的人力物力,選擇激勵治理方式時監(jiān)管成本為Cr,不包括給予企業(yè)聯(lián)盟的補貼部分,選擇懲罰治理方式時監(jiān)管成本為Cf;回收商選擇沿用“傳統(tǒng)回收”進行廢棄電子產(chǎn)品的回收處理工作時,必將造成環(huán)境的破壞,由此政府進行環(huán)境污染及社會治理費用為Ce。政府和回收聯(lián)盟采取不同策略的收益見表1。
2 處理企業(yè)與回收中心之間的演化博弈模型構(gòu)建
假設政府選擇“補貼”策略的期望收益為 G1,選擇“罰款”策略的期望收益為G2,平均收益記為E(G);回收商選擇“綠色回收”的期望收益為R1,選擇“傳統(tǒng)回收”的期望收益為R2,平均收益記為E(R)。根據(jù)上述假設和收益矩陣表1,可知政府對回收商實施補貼激勵機制的期望收益為:
政府采取懲罰機制的期望收益為:
則政府采取混合策略,即采取補貼激勵策略與懲罰策略的平均期望收益為:
根據(jù)演化博弈原理,可得政府策略的復制動態(tài)方程:
同理,聯(lián)合回收主體選擇綠色回收的期望收益為:
聯(lián)合回收主體選擇傳統(tǒng)回收的期望收益為:
則聯(lián)合回收主體采取混合策略的平均期望收益為:
求得聯(lián)合回收主體的復制動態(tài)方程,進而構(gòu)建出政府—聯(lián)合回收主體演化博弈的復制動態(tài)方程組為:
在實際情況中,政府與聯(lián)合回收主體的最優(yōu)策略選擇不可能一次性完成,需要不斷進行演化博弈來優(yōu)化方案。在雙方博弈過程中,若聯(lián)合回收主體自覺選擇綠色回收廢棄電子產(chǎn)品,則政府為了社會經(jīng)濟均衡發(fā)展會減弱對其的激勵與約束機制。反過來,當聯(lián)合回收主體沿用傳統(tǒng)回收方式時,政府就會加大激勵與約束機制的實施力度。因此,為了使研究結(jié)果更適用于現(xiàn)實生活,要對局中人策略進行穩(wěn)定性分析。利用 Friedman 提出的局部穩(wěn)定性分析法,通過構(gòu)建Jacobian矩陣來分析各均衡狀態(tài)的穩(wěn)定性。
令 FX=? ,F(xiàn)Y=? ,根據(jù)演化穩(wěn)定策略的性質(zhì)與微分方程穩(wěn)定性定理可知,當時,該點所對應的策略集為穩(wěn)定策略。
對方程組求導得:
解得:
情形一:聯(lián)合回收主體采取策略的演化穩(wěn)定性分析。
(1)當X=X0時,等式F(Y)=0恒成立,則區(qū)間內(nèi)任意 Y 點均處于穩(wěn)定狀態(tài)。
(2)當X>X0時,有Y=0 >0 ,Y=1 <0 ,
因此Y=1是穩(wěn)定演化策略,聯(lián)合回收主體在此情況下選擇“綠色回收”。
(3)當X<X0時,有Y=0 <0 ,Y=1 >0 ,
因此Y=0是穩(wěn)定演化策略,聯(lián)合回收主體選擇“傳統(tǒng)回收”。
綜上,當聯(lián)合回收主體選擇綠色回收廢棄電子產(chǎn)品付出的成本小于該方式下獲得的收益時,無論政府是否實施激勵與約束機制,有限理性聯(lián)合回收主體都會選擇綠色回收;當聯(lián)合回收主體選擇綠色回收廢棄電子產(chǎn)品付出的成本大于該方式下獲得的收益時,則聯(lián)合回收主體對于回收方式的選擇依賴于政府實施激勵與約束機制給其帶來利益還是損失。
情形二:政府采取策略的演化穩(wěn)定性分析。
(1)當Y=Y0時,等式F(X)=0恒成立,則區(qū)間內(nèi)任意X點均處于穩(wěn)定狀態(tài)。
(2)當 Y>Y0時,有X =0 <0 ,X =1 >0 ,
因此X=0是穩(wěn)定演化策略,政府在此情況下選擇“懲罰”。
(3)當 Y<Y0時,有X =0 >0 ,X =1 <0 ,
因此X=1是穩(wěn)定演化策略,政府在此情況下選擇“補貼”。
綜上,當政府實施懲罰機制的成本與采取補貼激勵措施的成本之和低于聯(lián)合回收主體被懲罰的損失時,無論聯(lián)合回收主體是否選擇綠色回收廢棄電子產(chǎn)品,有限理性的政府都會選擇實施懲罰機制;當政府實施懲罰機制的成本與采取補貼激勵措施的成本之和高于聯(lián)合回收主體被懲罰的損失時,有限理性的政府策略的選擇取決于回收商對于回收手段的選擇。
情形三:雙方混合策略的演化穩(wěn)定性分析。
依據(jù)動態(tài)系統(tǒng)復制方程式,可以得出當0≤X0≤1,0≤Y0≤1時,總共有五個復制動態(tài)均衡點,分別為(0,0)、(1,0)、(1,1)、(0,1)、(X0,Y0)。對于由微分方程描述的動態(tài)演化,其均衡點的穩(wěn)定性一般通過雅克比矩陣分析,該系統(tǒng)的雅克比矩陣為:
將五個復制動態(tài)均衡點帶入,同時滿足det(J)>0和 tr(J)<0的點是漸進穩(wěn)定的,對應著一個演化博弈。五個點的特征根見表2。
根據(jù)表2可知該復制動態(tài)方程組有四個鞍點和一個中心點,因此當政府與聯(lián)合回收主體的策略集為(X0,Y0)時,系統(tǒng)才能達到穩(wěn)定。
3 模型仿真
根據(jù)博弈情境進行參數(shù)賦值,運用Matlab軟件進行模型仿真。
3.1 回收收益對于策略行為的影響
當綠色回收收益大于傳統(tǒng)回收收益,即 Pg>Pt 時,設置仿真1 數(shù)值為 Pg=5,Pt=4,Sg=1,Cg=2.5,Ct=1,α=0.5,β=0.5,F(xiàn)=1,R=4,Cf=2,Cr=1,Ce=1,則政府與聯(lián)合回收主體混合策略動態(tài)演化如圖1所示。