(新疆大學(xué)經(jīng)濟與管理學(xué)院,烏魯木齊 830046)
環(huán)境規(guī)制是指國家為了保護環(huán)境而采取的對經(jīng)濟活動具有限制性的一切法律、政策、措施及其實施過程[1],根據(jù)執(zhí)行方式可分為命令控制型、市場激勵型與自愿傳遞型[2]。命令控制型對企業(yè)而言多為費用型成本,難以起到提高競爭力與盈利能力的作用;市場激勵型對企業(yè)而言多為投資型成本,在一定條件下可幫助企業(yè)獲得更高的盈利能力[3]。目前我國的自愿傳遞型環(huán)境規(guī)制政策并不成熟,在適用度和普遍性上都不具有代表性,故本文重點研究命令控制型與市場激勵型規(guī)制政策[4]。
表1 環(huán)境規(guī)制類型及內(nèi)容
如何合理地制定政策并使其達到預(yù)期效果是一項十分困難的工作,因為政策的結(jié)果有時是不可預(yù)測的,針對同一項政策的效果研究也可能得出相悖的結(jié)論[5]。以本文研究的企業(yè)治污創(chuàng)新為例,企業(yè)投入成本研發(fā)創(chuàng)新的驅(qū)動力在很長一段時間內(nèi)都被認為是市場的需求和技術(shù)的普及,很少涉及環(huán)境方面的法律法規(guī)[6]。古典經(jīng)濟學(xué)觀點認為增加的環(huán)境規(guī)制對于企業(yè)屬于額外成本,而經(jīng)濟損失最終會導(dǎo)致企業(yè)競爭力的下降[7]。 波特[8,9]于1995年提出了著名的 “波特假說”:設(shè)計合理的環(huán)境監(jiān)管可以促進企業(yè)從事創(chuàng)新活動,從而部分或完全抵消因環(huán)境規(guī)制所帶來的成本增加,而且這些 “創(chuàng)新補償”效應(yīng)可能會使企業(yè)更具備競爭優(yōu)勢。近年來諸多國內(nèi)外學(xué)者就 “波特假說”的正確性進行了大量論證:Testa等[10]通過研究發(fā)現(xiàn)環(huán)保標準可以刺激企業(yè)進行技術(shù)研發(fā),Rassier和Earnhart[11]通過對化工企業(yè)的研究發(fā)現(xiàn)監(jiān)管體系會促進企業(yè)新技術(shù)研發(fā)并對經(jīng)營績效有積極影響,國內(nèi)學(xué)者景維民和張璐[12]與沈能和劉鳳朝[13]的研究也印證了這一點;但同時也有諸多學(xué)者得出了相反的結(jié)論:Lanoie等[14]通過對制造業(yè)的研究指出其付出的環(huán)境規(guī)制成本遠高于 “創(chuàng)新補償”,Rexhaeuser和 Rammer[15]也指出環(huán)境規(guī)制會導(dǎo)致企業(yè)盈利能力的下降,“波特假說”是否成立或在何種條件下及多大程度上可以成立,一直是環(huán)境經(jīng)濟學(xué)持續(xù)討論的話題。
經(jīng)濟社會是一個非線性的復(fù)雜系統(tǒng),當來自不同視角的不同政策作用于同一個系統(tǒng)時,旨在促進某一特定方面的措施往往會產(chǎn)生意想不到的結(jié)果[16]。前人的研究大都著眼于通過相關(guān)數(shù)據(jù)的顯著性特征論證不同環(huán)境規(guī)制政策對企業(yè)的影響,本文從微觀企業(yè)出發(fā),構(gòu)建多Agent主體模型,探究一段時期內(nèi)微觀Agent主體 (企業(yè))相互之間及微觀Agent主體與市場環(huán)境的交互作用,以模擬和評估不同政策所帶來的結(jié)果,試圖為政府在環(huán)境規(guī)制方面的政策制定帶來新的研究思路與觀察視角。
大量的文獻證明,只有在 “建立靈活和動態(tài)的監(jiān)管框架”的前提下, “波特假說”的情況才能成立:Sartorius和 Zundel[17]指出在進行環(huán)境規(guī)制的過程中政府要給予市場中的企業(yè)相對寬裕的“演化時間”使其做出行為選擇并進行創(chuàng)新活動,這對于正確評估環(huán)境規(guī)制手段的影響是非常重要的;Ramanathan等[18]指出企業(yè)在面臨必須強制執(zhí)行的命令控制型規(guī)制手段和可以發(fā)揮逐利特性的市場激勵型規(guī)制手段時,其選擇會有較大的差異與不確定性,Bergquist等[19]的研究同樣證實了這一點;張平等[20]的研究表明費用型環(huán)境規(guī)制政策對企業(yè)的自主研發(fā)投入產(chǎn)生了擠出效應(yīng),而投資型環(huán)境規(guī)制政策并未出現(xiàn)這一趨勢;謝喬昕[21]的研究證明我國的環(huán)境規(guī)制強度正逐年提高,且有一定的波動性,這種趨勢不利于我國企業(yè)的自主創(chuàng)新投入,Blyth等[22]也認為環(huán)境規(guī)制政策的變動與不確定性提升了企業(yè)進行創(chuàng)新研發(fā)的風(fēng)險溢價。
基于上述研究,我們將在模型中重點考察3方面內(nèi)容:
(1)演化時間:市場內(nèi)的Agent主體能否在一定時期內(nèi)實現(xiàn)預(yù)期的演化結(jié)果?如果能,需要多久達到預(yù)期,達到預(yù)期的時間與環(huán)境規(guī)制政策有什么樣的關(guān)系?如果不能,會處于什么樣的結(jié)果,無法實現(xiàn)理想預(yù)期的原因是什么?
(2)固定性與不確定性 (主要對于費用型環(huán)境規(guī)制政策而言):固定成本與不斷增加的成本對于Agent主體的行為選擇有什么樣的影響?更高強度的漸進規(guī)制能否取得更為顯著的效果?
(3)費用型與投資型:對企業(yè)而言,多為費用型成本的強制命令與多為投資型成本的市場激勵環(huán)境規(guī)制政策的效果有何不同?哪一種更能達到預(yù)期?兩種環(huán)境規(guī)制手段是否會相互干擾?
與其他建模方法 (如系統(tǒng)動力學(xué)模型)相比,基于Agent主體的模型并不要求存在確定的函數(shù)關(guān)系,取而代之的是多個可以根據(jù)環(huán)境選擇行為決策的Agent主體,通過設(shè)定Agent之間的關(guān)系 (如競爭、合作)、Agent與市場環(huán)境的交互關(guān)系 (如Agent的平均報價會影響市場交易價格)可以觀測到各項因素之間的相互影響隨著時間的推移如何改變Agent的經(jīng)濟行為,并研究多個Agent的行為決策構(gòu)成的總體特征,多Agent模型已被廣泛應(yīng)用于包括經(jīng)濟在內(nèi)的多個領(lǐng)域以評估政策影響[23]。
根據(jù)上述相關(guān)研究,結(jié)合多主體模型的算法原則,本文對Agent主體進行建模:
(1)模型對污染物總量恒為10000的社會進行時長7300天 (20年)的政策評估模擬;
(2)假定排污處理的市場是準入的:不產(chǎn)生污染物的企業(yè)也可以作為排污處理Agent進入排污處理市場;產(chǎn)生污染物并進行排污處理的企業(yè)既是污染物生產(chǎn)企業(yè),同時也可選擇成為排污處理Agent;
(3)排污處理Agent分為兩類:僅付出費用型成本的非創(chuàng)新Agent,與既付出費用型成本又付出投資型成本的創(chuàng)新Agent,在環(huán)境規(guī)制政策僅涉及費用型成本時,創(chuàng)新Agent數(shù)量恒為0;
(4)排污處理Agent的行為規(guī)范:在供給總量為10000的污染物交易市場購入污染物 (因非創(chuàng)新Agent與創(chuàng)新Agent的生產(chǎn)方式不同,故兩類Agent購入污染物的價格不同),付出一定成本處理污染物,其中創(chuàng)新Agent額外獲得市場激勵型環(huán)境規(guī)制政策的經(jīng)濟獎勵;
(5)排污處理Agent具有逐利性,僅當有盈利能力時才進入市場;并設(shè)置 “資產(chǎn)余額”,即進入市場后的所有資產(chǎn)虧空為0時退出市場;
(6)模型所需的其他基礎(chǔ)設(shè)定:資產(chǎn)余額的核算周期=1天,Agent最大連接數(shù)=4,Agent進入或退出市場的頻率=15 天/個, 突變率=0 等[24,25]。
本文在未引入市場激勵時,對政府采用固定強度 (本文參數(shù)設(shè)定恒為20)與漸進強度 (本文參數(shù)設(shè)定由20遞增至100)的強制性命令下的環(huán)境污染進行模擬;之后引入市場激勵,并沿用上文的漸進強度進行環(huán)境污染仿真,更符合現(xiàn)實情況。
無論是固定強度或漸進強度,未經(jīng)處理的污染物數(shù)量均隨著時間的推移由初始的總量逐漸下降,并逐漸各自趨于一個均衡值 (見圖1),文中的參數(shù)設(shè)定總量為10000,均衡值約為6000,其具體數(shù)值與實際環(huán)境規(guī)制強度有關(guān)。
圖1 強制命令下的未處理污染物數(shù)量
但是,從未處理污染物的數(shù)量來看,更高的環(huán)境規(guī)制強度并沒有起到很明顯的效果,其主要原因:(1)在總量固定的前提下,已處理污染物的數(shù)量取決于污染物的交易價格,而后者是由污染物的供應(yīng)者與排污處理Agent共同決定的市場價格。故當供應(yīng)者有意交易更多的污染物時,便會降低其所要付出的成本,因污染物的交易價格為負,即會表現(xiàn)為污染物交易價格的上升 (見圖2)。而在未引入市場激勵的前提下,排污處理A-gent唯一的收入來源即為交易污染物時的收入,交易價格的上升會使得排污處理Agent的交易意愿下降;(2)初始的環(huán)境規(guī)制強度一定程度上決定了初始的污染物交易價格,而初始較低的交易價格會使得逐利的排污處理Agent數(shù)量快速上升,進而拉低了排污處理Agent的利潤空間 (見圖3)。排污處理Agent的交易意愿下降,最終表現(xiàn)為未處理污染物數(shù)量處于均衡值。
圖2 強制命令下的污染物交易價格
圖3 強制命令下的處理污染物Agent數(shù)量
從圖2與圖3的時間對比中,我們可以看到,排污處理Agent的數(shù)量變動大致與污染物交易價格變動相一致,且有一定的遲滯性。其主要原因:(1)在未引入市場激勵的前提下,排污處理A-gent唯一的收入來源即進行污染物的交易,故污染物的交易價格決定了未進入市場的排污處理A-gent是否有意愿進入市場及已進入市場的排污處理Agent是否有經(jīng)濟收益; (2)排污處理Agent在進入市場后, “資產(chǎn)余額”的存在使其在退出市場時具有一定的延遲性:在盈利時期積累的資產(chǎn)可用于彌補蕭條時期的虧損,使得排污處理A-gent不會在價格下降時立刻退出市場,這有助于Agent在短期無法盈利時仍存活于市場,也有助于一個市場的成熟、穩(wěn)定與發(fā)展。
從污染物交易價格來看,漸進強度的環(huán)境規(guī)制下交易價格波動幅度更大,排污處理Agent數(shù)量變動幅度也更大,其主要原因:(1)環(huán)境規(guī)制強度在短期內(nèi)降低了污染物交易價格,導(dǎo)致排污處理Agent迅速增加,這一定程度上也導(dǎo)致了未處理污染物數(shù)量的快速減少與污染物交易價格的大幅變動;(2)市場進出壁壘、不對稱信息、交易成本等因素以及 “資產(chǎn)余額”的存在使得市場內(nèi)的排污處理Agent數(shù)量變動滯后于價格變動并繼承了其更大的波動幅度。
由上文可知,在僅實行強制命令的前提下,漸進強度的效果與固定強度差距并不明顯,且會帶來一定的意外效應(yīng),如加劇交易價格波動情況與增加Agent相互競爭使排污處理Agent更頻繁地進入或退出市場;且實際情況中,大多數(shù)排污處理Agent都是相似的,其進入市場的時間、生產(chǎn)規(guī)模、盈利能力、抗風(fēng)險能力、行為決策具有很高的相似度,這意味著一旦市場條件惡化到一定程度,排污處理Agent的數(shù)量及相關(guān)指標的變動是非線性或難以用確切的方程表示的,這進一步印證了基于多主體模型探究多個微觀決策主體行為的宏觀擴散效應(yīng)的優(yōu)勢。
對上文各項數(shù)據(jù)分析可得,未處理污染物數(shù)量、排污處理Agent數(shù)量、污染物交易價格等均在第1000天 (3年)前后到達均衡值,并在此后圍繞均衡值波動。故本文選擇于第1001天引入市場激勵環(huán)境規(guī)制政策,并根據(jù)激勵強度的不同,設(shè)立對于進行自主創(chuàng)新排污處理的市場激勵系數(shù)μ=1、2、3、4(μ=0即為上文中未引入市場激勵的漸進強度仿真結(jié)果),激勵系數(shù)越高,表明企業(yè)從創(chuàng)新活動中取得的收益越高。
因引入創(chuàng)新市場激勵,排污處理Agent現(xiàn)可分為進行創(chuàng)新Agent與非創(chuàng)新Agent。其中前者享受創(chuàng)新市場激勵,但因生產(chǎn)方式不同,進行創(chuàng)新處理所需污染物的交易價格為μ=1、2、3、4的價格;后者不享受創(chuàng)新市場激勵,因生產(chǎn)方式不變,故污染物的交易價格仍與μ=0時保持一致。
在模擬的前1000天內(nèi),仿真結(jié)果與上文中無市場激勵的結(jié)果相同:隨著漸進強度的實施,污染物的交易價格升高,非創(chuàng)新Agent數(shù)量隨著價格滯后波動,使得未處理的污染物數(shù)量持續(xù)下降。隨著創(chuàng)新市場激勵的引入,創(chuàng)新Agent也開始出現(xiàn) (見圖4)。
圖4 引入市場激勵下的創(chuàng)新Agent數(shù)量
隨著時間的推移,創(chuàng)新Agent數(shù)量在μ=1時持續(xù)為0,與不引入市場激勵 (μ=0)時相同,μ=2及以上時則情況不同,說明市場激勵強度存在門檻值,較低的激勵強度下并不能增加社會對污染物的自主創(chuàng)新處理;μ=3與μ=4時的創(chuàng)新A-gent數(shù)量增長趨勢大致相同,均在較短時間內(nèi)達到了市場能容納的最大數(shù)量;μ=2時情況與前兩種略有不同,雖然在足夠長的時間后能夠達到預(yù)期的規(guī)制效果,但其是否能滿足環(huán)境規(guī)制計劃的時效性有待商榷。
現(xiàn)對于污染物交易價格進行考察 (見圖5),在μ=0即不引入市場激勵時,僅存在非創(chuàng)新A-gent,而非創(chuàng)新Agent的唯一收入來源為交易污染物時的收入,故μ=0時的交易價格始終為負;但當引入市場激勵后,污染物一定程度上成為了創(chuàng)新Agent用于創(chuàng)新處理并獲得市場激勵的生產(chǎn)資料,故其交易價格一度出現(xiàn)了正值,這意味著產(chǎn)生污染物的企業(yè)在將污染物轉(zhuǎn)移給創(chuàng)新Agent時不但不需要向創(chuàng)新Agent支付處理費用,甚至可以通過產(chǎn)生污染物而獲利。原計劃為促進污染處理技術(shù)、提升污染處理水平的措施反而使得各企業(yè)更有意愿加大排污力度,這種意外效應(yīng)在μ=3、μ=4等市場強度較高的情況下尤為明顯。此后污染物交易價格的持續(xù)升高使得創(chuàng)新Agent失去盈利能力,一部分創(chuàng)新Agent在資產(chǎn)余額為0時退出市場,引起了創(chuàng)新Agent數(shù)量的下降與之后污染物交易價格的下降,可見污染物交易價格與市場內(nèi)創(chuàng)新Agent數(shù)量將長時間處于周期較長的波動中。
圖5 引入市場激勵下的污染物交易價格
在繼續(xù)假定社會污染物總量為10000的前提下,考察不同的市場激勵強度對社會未處理污染物總量的影響 (見圖6)。我們同樣可以看到較為明顯的門檻效應(yīng):低激勵強度μ=1時,未處理污染物數(shù)量與未引入市場激勵μ=0時變化不大,均為在原均衡值附近波動;而在較高的激勵強度μ=3、μ=4下,社會未處理污染物數(shù)量明顯下降,而且變動幅度更小,均衡狀態(tài)為平穩(wěn);μ=2時情況與前兩種略有不同,在模擬周期的前半段 (前3600天),污染物數(shù)量與變動情況與μ=0、μ=1大致相同,但在足夠長的演化時間后,其最終結(jié)果與μ=3、μ=4相近。這說明適中的激勵強度μ=2可以達到預(yù)期結(jié)果,但需要相當長的見效周期。
圖6 引入市場激勵下的未處理污染物數(shù)量
最后考察引入市場激勵對非創(chuàng)新Agent數(shù)量的影響 (見圖7)。結(jié)果與上文多項指標的變動情況大致相同:低激勵強度μ=1時與不引入市場激勵幾乎一致;高激勵強度μ=3、μ=4時,創(chuàng)新A-gent對非創(chuàng)新Agent產(chǎn)生擠出效應(yīng),非創(chuàng)新Agent在較短時間內(nèi)退出市場,此時市場內(nèi)Agent類型全部成為創(chuàng)新Agent;激勵強度適中μ=2時的情況與前兩種略有不同,短期內(nèi)非創(chuàng)新Agent數(shù)量依然保持一定水平,但在足夠長的演化時間后,非創(chuàng)新Agent全部退出市場。
圖7 引入市場激勵下的非創(chuàng)新Agent數(shù)量
由上文可知,在引入市場激勵后,其政策效果根據(jù)激勵強度的不同呈現(xiàn)門檻效應(yīng)并具有最優(yōu)區(qū)間:在低激勵強度μ=1下,該政策沒有造成意外效應(yīng),但同時也無法達到政策預(yù)期效果,更廣泛地說,一個較低水平的激勵強度可能不足以促進特定市場的建立與發(fā)展;在高激勵強度μ=3、μ=4下,該政策能在較短時間內(nèi)達到預(yù)期效果,但會引起意外效應(yīng),如鼓勵企業(yè)產(chǎn)生更多的污染物、創(chuàng)新Agent將同樣對污染處理有積極作用的非創(chuàng)新Agent擠出市場等問題。所以,就政府而言,以較小的意外效應(yīng)和財政支出來建立污染物交易市場,理論上是可行的,但要嚴格把控政策強度的最優(yōu)區(qū)間 (如控制在本文參數(shù)中μ=2),且要有足夠長的時間使其中的各類Agent演化出政策預(yù)期的結(jié)果,并使該市場成熟、穩(wěn)定地發(fā)揮預(yù)定的作用。
本文通過多Agent主體模型的構(gòu)建與仿真對不同的強制命令型與市場激勵型環(huán)境規(guī)制政策及其組合的影響結(jié)果進行研究,通過對演化時間、規(guī)制強度的確定性、規(guī)制政策的類型3個方面的考察,得出以下結(jié)論:
(1)以較少的政府投入促進特定市場的建立和發(fā)展是可行的,但因為市場激勵存在一定的門檻效應(yīng),要避免無效的低強度激勵。且即使激勵強度被證明是有效的,市場內(nèi)的微觀主體仍然需要相對寬裕的演化時間做出選擇并予以行動,這就導(dǎo)致了政府在預(yù)計政策效果時要有時間概念,特定市場的建立與成熟可能要經(jīng)過數(shù)十年或以上的時間,對其的激勵行為要有一定的持續(xù)性。
(2)高強度激勵會縮短微觀主體行為選擇的擴散時間,能更快速地達到預(yù)期成效,但高強度的政策往往會帶來意外效應(yīng):以強制命令型與市場激勵型環(huán)境規(guī)制政策為例,更高強度的命令手段有利于減少社會污染物排放總量,但會破壞自主創(chuàng)新的市場環(huán)境;較強的市場激勵會提高企業(yè)的創(chuàng)新排污處理意愿,但同時會鼓勵污染物生產(chǎn)者排放更多的污染物以獲取利益,還會因競爭關(guān)系而從市場擠出非創(chuàng)新排污處理主體。
(3)政策的不確定性與變動性會影響微觀主體的決定,而且會放大市場內(nèi)交易價格與微觀個體的波動情況。頻繁的激勵變動旨在能夠靈活地調(diào)整政策主要作用領(lǐng)域的情況,雖然從宏觀視角上,更大幅度的波動能夠更快地達到預(yù)期效果,但這也意味著市場上的微觀主體可能會面對不切實際的交易價格以及有可能出現(xiàn)的資產(chǎn)虧空,不利于一個市場的建立、成熟與穩(wěn)定。
從政策設(shè)計角度來看,我們無法對一項環(huán)境規(guī)制政策或任何宏觀政策在多個領(lǐng)域的影響進行全面預(yù)測[26],這有可能會導(dǎo)致作用于多個領(lǐng)域的政策或作用于同一領(lǐng)域不同目標的政策相互掣肘,通過社會復(fù)雜系統(tǒng)內(nèi)部的聯(lián)系相互干擾,使多項政策產(chǎn)生意外效應(yīng)或無法達到預(yù)期的成效[27],所以合理地制定政策并使其達到預(yù)期效果是一項十分困難的工作,我們需要更為微觀與復(fù)雜的研究思路與觀察視角。