摘要:文章應(yīng)用演化博弈理論建立了企業(yè)群體內(nèi)規(guī)模相當(dāng)?shù)钠髽I(yè)之間在環(huán)境技術(shù)創(chuàng)新選擇上的博弈模型,并分析討論了五種不同的博弈狀態(tài),結(jié)果得出所有博弈方都采取“主動創(chuàng)新”策略不僅是上述博弈的一個(gè)穩(wěn)定狀態(tài),而且是一個(gè)演化穩(wěn)定策略,同時(shí),文章也指出政府應(yīng)該為這一穩(wěn)定狀態(tài)的實(shí)現(xiàn)提供完善的制度保障。
關(guān)鍵詞:環(huán)境技術(shù)創(chuàng)新;演化博弈;制度保障
環(huán)境技術(shù)創(chuàng)新是指所有能夠維持、改善生態(tài)環(huán)境或提高人類生存環(huán)境質(zhì)量的技術(shù)創(chuàng)新活動或過程,環(huán)境技術(shù)創(chuàng)新在解決全球環(huán)境問題、促進(jìn)企業(yè)節(jié)能減排、提升企業(yè)競爭力等方面都發(fā)揮著重要作用。因此,以促進(jìn)經(jīng)濟(jì)發(fā)展和提高企業(yè)競爭力為主,并能夠節(jié)約資源,改善環(huán)境績效的環(huán)境技術(shù)創(chuàng)新戰(zhàn)略,引起了社會各界的廣泛重視,特別地,如何激勵企業(yè)積極主動實(shí)施環(huán)境技術(shù)創(chuàng)新已成為當(dāng)前環(huán)境政策制定者需要考慮的重要議題之一。
20世紀(jì)70年代由史密斯(Smith,1973)和普瑞斯(Price,1974)提出了演化博弈理論的基本概念——演化穩(wěn)定策略(Evolutionary Stable Strategies, ESS),泰勒和金克(Taylor Jonker,1978)提出了復(fù)制動態(tài)(Replicator Dynamics),此后演化博弈理論在經(jīng)濟(jì)學(xué)、生態(tài)學(xué)以及社會學(xué)等領(lǐng)域得到了廣泛的應(yīng)用,特別地,演化博弈在環(huán)境問題和企業(yè)技術(shù)創(chuàng)新領(lǐng)域的應(yīng)用也取得了一系列成果。本文應(yīng)用演化博弈理論,從對稱角度,對企業(yè)之間的環(huán)境技術(shù)創(chuàng)新行為進(jìn)行了演化博弈分析,旨在揭示規(guī)模相同的企業(yè)之間在進(jìn)行環(huán)境技術(shù)創(chuàng)新時(shí)的各自選擇。
一、 基本模型
針對環(huán)境技術(shù)創(chuàng)新,有的企業(yè)會積極采取措施努力實(shí)現(xiàn)創(chuàng)新,有的企業(yè)則不愿主動創(chuàng)新,而是等待時(shí)機(jī)采取模仿或跟隨創(chuàng)新企業(yè)。為此,我們不妨假設(shè)有兩個(gè)企業(yè),企業(yè)1和企業(yè)2,他們的企業(yè)規(guī)模相當(dāng),市場占有率基本一致。如果雙方都選擇積極主動地實(shí)施環(huán)境技術(shù)創(chuàng)新,則各得到a單位的收益;如果雙方都選擇跟隨或模仿他人的環(huán)境技術(shù)創(chuàng)新,則各得到d單位的收益;當(dāng)其中一方選擇積極主動實(shí)施環(huán)境技術(shù)創(chuàng)新而另一方選擇跟隨或模仿環(huán)境技術(shù)創(chuàng)新時(shí),前者得到b單位的收益,而后者得到c單位的收益。雙方的支付收益如表1所示。
現(xiàn)在我們來分析區(qū)域內(nèi)的企業(yè)群體隨機(jī)地進(jìn)行該博弈,假設(shè)有比例為x的企業(yè)采取主動環(huán)境技術(shù)創(chuàng)新的策略,比例為1-x的企業(yè)采用跟隨或模仿策略。究竟有多大比例的企業(yè)采取主動環(huán)境技術(shù)創(chuàng)新策略不僅取決于該類型企業(yè)的期望收益,更重要的是與該類型企業(yè)的期望收益超出全部企業(yè)平均收益的幅度有關(guān),顯然,這部分超額收益越大越能激勵更多的企業(yè)采取主動創(chuàng)新策略。由此可見,“主動創(chuàng)新”類型博弈方比例x是隨時(shí)間的變化而變化的,其動態(tài)變化速度可以用下列動態(tài)微分方程表示:
其中,u1為企業(yè)群中采取主動環(huán)境技術(shù)創(chuàng)新策略的企業(yè)的期望收益,u為該企業(yè)群中所有企業(yè)的平均期望收益。
從模仿者角度來看,博弈方學(xué)習(xí)模仿的速度取決于兩個(gè)因素:其一是模仿對象的數(shù)量大小,可以用相應(yīng)類型博弈方的比例來表示;其二是模仿對象的激勵程度,可以用模仿對象策略得益超過平均得益的幅度來表示,因?yàn)檫@關(guān)系到模仿成功的大小。
根據(jù)表1所示的收益矩陣,可以得到兩種策略的企業(yè)的期望收益和所有企業(yè)的平均收益分別為:
u1=xa+(1-x)b(2)
u2=xc+(1-x)d(3)
u=xu1+(1-x)u2(4)
其中,u2為企業(yè)群中不實(shí)施環(huán)境技術(shù)創(chuàng)新策略的企業(yè)的期望收益。
將(2)式、(3)式、(4)式帶入(1)式中,可以得到:
二、 分析與討論
狀態(tài)1:x* 1=0,這說明初始時(shí)刻不存在“主動創(chuàng)新”策略類型博弈方,且采用這種策略類型博弈方變化速度為0。從模仿者角度來看,只有出現(xiàn)模仿的對象才能進(jìn)行模仿,當(dāng)x=0時(shí)就說明沒有模仿的榜樣,因此,所有的博弈方都不會有意識地改變他們的策略。
狀態(tài)2:x* 2=1,這說明初始時(shí)刻所有博弈方均為“主動創(chuàng)新”策略類型,既然都是主動創(chuàng)新者也就不存在模仿行動。因此,對于有限理性的博弈方而言,因?yàn)闆]有模仿者,所有的博弈方都不會有意識地改變他們的策略。
三、 演化穩(wěn)定策略
即使上述學(xué)習(xí)過程已經(jīng)停止,即所有博弈方都通過學(xué)習(xí)找到了最好的策略,也不能排除博弈方還會“犯錯誤”,即博弈方仍然可能會偏離上述復(fù)制動態(tài)收斂到的納什均衡策略。因此,有必要分析上述復(fù)制動態(tài)收斂到的穩(wěn)定狀態(tài)是否具有一定的“容錯性”。為此,我們不妨假設(shè),博弈群體中e比例的博弈方在收斂到“主動創(chuàng)新”策略后犯了錯誤,選擇了“跟隨或模仿”策略。此時(shí)選擇“主動創(chuàng)新”策略的博弈方比例為1-e。按照前面的分析,采取“主動創(chuàng)新”與“跟隨或模仿”策略博弈方的期望收益和群體平均收益分別為:
uc=(1-e)·1+e·0=1-e(6)
un=(1-e)·0+e·0=0(7)
ucn=(1-e)·uc+e·un=(1-e)2(8)
因?yàn)?,uc=(1-e)>0,且接近于1,因此,犯錯誤博弈方的期望收益遠(yuǎn)遠(yuǎn)低于沒有犯錯誤的博弈方收益,也遠(yuǎn)遠(yuǎn)低于群體的平均收益。因此,犯錯誤方會逐步改正錯誤,最終仍然會趨于x*=1,即所有博弈方都采取“主動創(chuàng)新”策略。由此分析得知,x*=1不僅是復(fù)制動態(tài)收斂的一個(gè)穩(wěn)定狀態(tài),而且具有對少數(shù)錯誤偏離的穩(wěn)健性,因此,x*=1是上述復(fù)制動態(tài)下的一個(gè)進(jìn)化穩(wěn)定策略。同理,我們可以分析上述復(fù)制動態(tài)的另一個(gè)穩(wěn)定策略x*=0,即所有博弈方都采取“跟隨或模仿”策略,結(jié)果顯示,有少量博弈方偏離這個(gè)穩(wěn)定狀態(tài),復(fù)制動態(tài)會使結(jié)果越來越遠(yuǎn)離它,最終不再收斂于它,由此得出,該策略不具有對少量犯錯行為的抗干擾性,不是上述復(fù)制狀態(tài)下的進(jìn)化穩(wěn)定策略。
四、 結(jié)論與建議
環(huán)境技術(shù)創(chuàng)新是解決環(huán)境問題的根本出路和必然選擇,而企業(yè)又是環(huán)境技術(shù)創(chuàng)新的重要力量之一。一定區(qū)域范圍內(nèi)的企業(yè)在環(huán)境技術(shù)創(chuàng)新方面的選擇會相互影響相互促進(jìn),特別是規(guī)模相當(dāng)?shù)钠髽I(yè)之間,如果政府能夠?yàn)閯?chuàng)新成果提供相對完善的制度保障和必要的社會支撐體系,則會有越來越多的企業(yè)采取主動環(huán)境技術(shù)創(chuàng)新策略,即使個(gè)別企業(yè)會偶爾偏離這一選擇,最終也會重新回到主動創(chuàng)新的隊(duì)伍中來。因此,各地政府應(yīng)建立健全知識產(chǎn)權(quán)保護(hù)制度、積極完善財(cái)政補(bǔ)貼、技術(shù)融資等社會服務(wù)體系,努力為企業(yè)環(huán)境技術(shù)創(chuàng)新提供更好的社會環(huán)境。
參考文獻(xiàn):
1. 王麗萍.企業(yè)環(huán)境技術(shù)創(chuàng)新研究綜述.天府新論,2012,(2):45-49.
2. 謝識予.經(jīng)濟(jì)博弈論.上海:復(fù)旦大學(xué)出版社,2002.
3. Weibull W. Evolutionary Game Theory,Cambridge:MIT Press,1995.
4. 盧方元.環(huán)境污染問題的演化博弈分析.系統(tǒng)工程理論與實(shí)踐,2007,(9):148-152.
5. 楊麗,魏曉平.基于演化博弈的企業(yè)技術(shù)創(chuàng)新行為分析.科技管理研究,2010,(21):18-21.
6. 劉海濤,孫明貴.關(guān)于企業(yè)技術(shù)創(chuàng)新能力的分析.經(jīng)濟(jì)與管理研究,2009,(7):97-100.
7. 王建成,吳俊.基于蛙鳴博弈的企業(yè)技術(shù)創(chuàng)新行為研究.湖南文理學(xué)院學(xué)報(bào)(社會科學(xué)版),2009,(6):44-46.
8. 馬小明,張立勛.基于壓力—狀態(tài)—響應(yīng)模型的環(huán)境保護(hù)投資分析.環(huán)境保護(hù),2002,(11).
9. 許健,呂永龍,王桂蓮.我國環(huán)境技術(shù)產(chǎn)業(yè)化的現(xiàn)狀與發(fā)展對策.環(huán)境污染治理技術(shù)與設(shè)備,1999,(2).
10. 沈斌,馮勤.基于可持續(xù)發(fā)展的環(huán)境技術(shù)創(chuàng)新及其政策機(jī)制.科學(xué)學(xué)與科學(xué)技術(shù)管理,2004,(8).
11. 耿建新,尚會君,劉長翠.企業(yè)環(huán)境信息披露與管制的理想框架.環(huán)境保護(hù),2007,(8).
12. 呂永龍,許健,胥樹凡.我國環(huán)境技術(shù)創(chuàng)新的影響因素與應(yīng)對策略.環(huán)境污染治理技術(shù)與設(shè)備,2000,(5).
13.鐘暉,王建鋒.建立綠色技術(shù)創(chuàng)新機(jī)制.生態(tài)經(jīng)濟(jì),2000,(3).
14.彭海珍,任榮明.環(huán)境政策工具與企業(yè)競爭優(yōu)勢.中國工業(yè)經(jīng)濟(jì),2003,(7).
15. 趙細(xì)康.環(huán)境政策對技術(shù)創(chuàng)新的影響.中國地質(zhì)大學(xué)學(xué)報(bào)(社會科學(xué)版),2004,(1).
16. 陳經(jīng)偉.美國推進(jìn)環(huán)境技術(shù)創(chuàng)新與擴(kuò)散的做法與啟示.科學(xué)管理研究,2005,(4).
17. 曲如曉.環(huán)境保護(hù)與國際競爭力關(guān)系的新視角.中國工業(yè)經(jīng)濟(jì),2001,(9).
18. 朱昶.企業(yè)綠色發(fā)展戰(zhàn)略及其體系研究.武漢理工大學(xué),2003.
19. 翟欣翔.面向生態(tài)—技術(shù)創(chuàng)新的經(jīng)濟(jì)圈城市發(fā)展能級評價(jià)研究.天津大學(xué),2004.
20. 秦穎.企業(yè)環(huán)境管理的驅(qū)動力研究.大連理工大學(xué),2006.
基金項(xiàng)目:教育部人文社會科學(xué)研究青年基金項(xiàng)目(11YJC790078);河南省政府決策研究招標(biāo)課題(項(xiàng)目號:2012B267);河南省高等學(xué)校人文社會科學(xué)研究項(xiàng)目(項(xiàng)目號:2012-GH-101);河南理工大學(xué)博士基金項(xiàng)目(項(xiàng)目號:B2009-60)。
作者簡介:王麗萍,河南理工大學(xué)經(jīng)濟(jì)管理學(xué)院副教授,管理學(xué)博士。
收稿日期:2012-12-28。