詹宏偉
(重慶工商大學(xué)馬克思主義學(xué)院,重慶 400067)
習(xí)近平同志在十九大報(bào)告中指出:“我國(guó)經(jīng)濟(jì)已由高速增長(zhǎng)階段轉(zhuǎn)向高質(zhì)量發(fā)展階段,正處在轉(zhuǎn)變發(fā)展方式、優(yōu)化經(jīng)濟(jì)結(jié)構(gòu)、轉(zhuǎn)換增長(zhǎng)動(dòng)力的攻關(guān)期?!盵1]轉(zhuǎn)變發(fā)展方式是我國(guó)經(jīng)濟(jì)發(fā)展面臨的緊迫任務(wù),但轉(zhuǎn)型的阻力很大。突破阻力、促進(jìn)發(fā)展方式轉(zhuǎn)型是需要進(jìn)一步研究解決的重大現(xiàn)實(shí)難題。本文認(rèn)為,現(xiàn)代博弈論可以為我們解決這個(gè)問(wèn)題提供有益的啟示。
博弈論(Game Theory)又稱對(duì)策論,已經(jīng)成為一門(mén)世界性顯學(xué),應(yīng)用十分廣泛。博弈論是研究不同社會(huì)主體在給定約束條件和互動(dòng)背景下,為獲得最大化利益,選擇最優(yōu)策略的決策方法。其實(shí)質(zhì)是具體地研究不同利益主體如何分配社會(huì)利益并構(gòu)建利益格局的問(wèn)題??梢詮娜齻€(gè)方面把握博弈論的含義:其一,參與博弈的局中人(players博弈參與人)要解決的問(wèn)題是如何決策才能最大化自己的利益;其二,不同主體在一定約束條件下做出爭(zhēng)取利益最大化決策;其三,一定的社會(huì)主體在與他者互動(dòng)的過(guò)程中爭(zhēng)取最大化利益。著名博弈論學(xué)者羅伯特·奧曼(Robert J.Aumann)和瑟吉由·哈特(Sergiu Hart)認(rèn)為:“博弈論研究那些決策會(huì)相互影響的決策者們[參與人(players)]的行為。術(shù)語(yǔ)‘博弈’一詞來(lái)自互動(dòng)決策問(wèn)題?!盵2]14也就是說(shuō),博弈論是研究互動(dòng)行為的理論。博弈論的貢獻(xiàn)大大深化和具體化了互動(dòng)背景下人類(lèi)行為的研究,富有極強(qiáng)的啟發(fā)性和可操作性。
由上可知,博弈論的理論前提是經(jīng)濟(jì)人假設(shè)。其實(shí),博弈論還有另一個(gè)前提:利益多元化。如果人們的利益完全一致,就不存在不同利益主體圍繞利益進(jìn)行博弈和爭(zhēng)奪的情形了,也就不存在研究博弈問(wèn)題的博弈論了。在公有制為主體、多種所有制共同發(fā)展的社會(huì)主義市場(chǎng)經(jīng)濟(jì)體制下,合理的局部利益和個(gè)體利益得到承認(rèn)和肯定。在根本利益一致的前提下,人們之間的具體利益出現(xiàn)分歧,利益多元化是不爭(zhēng)的事實(shí)。競(jìng)爭(zhēng)是市場(chǎng)經(jīng)濟(jì)的靈魂,而競(jìng)爭(zhēng)的本質(zhì)就是博弈。這樣,博弈論在我國(guó)具備了應(yīng)用的前提條件。
例如,我們可以運(yùn)用博弈論研究當(dāng)代中國(guó)的發(fā)展方式轉(zhuǎn)型問(wèn)題。從政治經(jīng)濟(jì)學(xué)的角度看,傳統(tǒng)發(fā)展和科學(xué)發(fā)展分別對(duì)應(yīng)不同的發(fā)展方式,形成兩種不同的利益關(guān)系和利益格局,這兩種利益關(guān)系和利益格局是對(duì)立的,科學(xué)發(fā)展的利益障礙來(lái)源于傳統(tǒng)發(fā)展方式下形成的利益關(guān)系和利益格局,依靠傳統(tǒng)發(fā)展?fàn)I生的生產(chǎn)關(guān)系主體或利益主體阻礙科學(xué)發(fā)展,因?yàn)榭茖W(xué)發(fā)展損害其利益,威脅其生存??梢?jiàn),發(fā)展方式轉(zhuǎn)型的難題在于如何突破與傳統(tǒng)發(fā)展相應(yīng)的利益格局[3]。那么,如何破解這一難題呢?博弈論可以給我們很多有價(jià)值的啟發(fā)。
從博弈結(jié)果來(lái)看,可把博弈分為零和博弈和共贏博弈。零和博弈即博弈雙方一方的收益意味著另一方的損失,即一方所得正好是另一方所失、一方的幸福建立在另一方的痛苦之上。博弈雙方的收益之和是“零”,而且永遠(yuǎn)是零,雙方利益是根本沖突和對(duì)立的,雙方?jīng)]有合作的可能?!霸冢▋扇耍┝愫筒┺闹?,局中人2的盈利正好是局中人1盈利的負(fù)值。因此,兩局中人的獎(jiǎng)勵(lì)是截然相反的——一局中人贏當(dāng)且僅當(dāng)另一局中人輸?!盵4]129歷史上的大國(guó)關(guān)系,幾乎所有新興大國(guó)的崛起都是通過(guò)戰(zhàn)爭(zhēng)手段獲取財(cái)富和領(lǐng)地,通過(guò)戰(zhàn)爭(zhēng)取代老牌大國(guó)的地位。古希臘歷史學(xué)家修昔底德在其名著《伯尼奔尼撒戰(zhàn)爭(zhēng)史》中提出了著名的“修昔底德陷阱”理論[5],揭示的就是歷史上強(qiáng)國(guó)之間的零和博弈,結(jié)果兩敗俱傷。
與零和博弈相對(duì)的是共贏博弈,即在博弈的局中人之間通過(guò)競(jìng)爭(zhēng)達(dá)到共贏的局面,共贏的結(jié)果是利人利己,至少是利己不損人,通過(guò)合作贏得皆大歡喜的結(jié)局。比如兩人分割一塊蛋糕,其中一人多得另一人必然少得,此為零和博弈;如果轉(zhuǎn)換思路,兩人在競(jìng)爭(zhēng)過(guò)程中把蛋糕做大,每人分得的蛋糕因此不斷增加,則這種博弈是共贏博弈。
利益調(diào)整的方法有激進(jìn)的方法,也有漸進(jìn)的方法,激進(jìn)方法一般是零和博弈的方法,漸進(jìn)方法一般是共贏博弈的方法,這兩種方法各有利弊,應(yīng)根據(jù)實(shí)際情況搭配使用。調(diào)整利益格局的一個(gè)穩(wěn)妥的做法是增量調(diào)整激進(jìn)為主、存量調(diào)整漸進(jìn)為主,這是改革開(kāi)放以來(lái)比較成功的策略[6]。為什么成功呢?因?yàn)椴扇×斯糙A性改革策略,阻力較小。共贏性改革的本質(zhì)是帕累托改進(jìn),“在福利經(jīng)濟(jì)學(xué)里,帕累托改進(jìn)指的是在不損害其他人的前提下改善某個(gè)人的福利的資源配置變動(dòng)”[7]。帕累托改進(jìn)型的利益格局調(diào)整可減少阻力。
在發(fā)展方式轉(zhuǎn)型調(diào)整利益格局的過(guò)程中,要慎重決策,努力通過(guò)共贏博弈的方式實(shí)現(xiàn)帕累托改進(jìn)型的利益格局調(diào)整。發(fā)展方式的轉(zhuǎn)型,往往需要進(jìn)行多方面的利益調(diào)整,理性的做法是首先選擇和挖掘共贏性的帕累托改進(jìn),為改革和利益調(diào)整聚集人氣,贏得社會(huì)的擁護(hù)。這是利益格局調(diào)整和改革必須堅(jiān)持的一個(gè)重要策略。在我國(guó)企業(yè)并購(gòu)案例中,政府鼓勵(lì)兼并企業(yè)安置被兼并企業(yè)職工。這種做法曾經(jīng)受到自由主義人士的指責(zé),認(rèn)為政府干預(yù)企業(yè)是不對(duì)的,不符合構(gòu)建現(xiàn)代企業(yè)制度的改革的定義。其實(shí),從社會(huì)大局來(lái)看,這種干預(yù)是必要的,它保證了市場(chǎng)博弈的共贏結(jié)果,實(shí)現(xiàn)了帕累托改進(jìn),減少了產(chǎn)業(yè)升級(jí)的阻力和震蕩。再比如,如何解決產(chǎn)能過(guò)剩問(wèn)題?按照新自由主義人士的辦法,就是讓市場(chǎng)競(jìng)爭(zhēng)自然淘汰了事,政府不用操心。但是政府必須考慮過(guò)剩產(chǎn)能淘汰導(dǎo)致經(jīng)濟(jì)增長(zhǎng)下滑和失業(yè)增加及其引起的種種問(wèn)題。而產(chǎn)能轉(zhuǎn)移與合作可以減少震蕩和爭(zhēng)取共贏,即把具有一定價(jià)值的過(guò)剩產(chǎn)能轉(zhuǎn)移到落后國(guó)家或地區(qū)去,如從東部地區(qū)轉(zhuǎn)移到中西部地區(qū),可以消化一部分過(guò)剩產(chǎn)能;特別需要指出的是,近幾年我國(guó)政府大力推動(dòng)國(guó)際產(chǎn)能合作,創(chuàng)造條件,使中國(guó)與其他國(guó)家進(jìn)行產(chǎn)能合作,是一個(gè)十分經(jīng)典的帕累托改進(jìn)——“目前,許多國(guó)家對(duì)基礎(chǔ)設(shè)施建設(shè)和推進(jìn)工業(yè)化的需求很大,而中國(guó)很多裝備和產(chǎn)能質(zhì)優(yōu)價(jià)廉,綜合配套能力強(qiáng)。李克強(qiáng)指出,支持中國(guó)裝備走出去和推進(jìn)國(guó)際產(chǎn)能合作,在擴(kuò)大產(chǎn)品進(jìn)出口的基礎(chǔ)上疊加產(chǎn)業(yè)出口,不僅注重消費(fèi)品更注重投資品出口,既利當(dāng)前、更惠長(zhǎng)遠(yuǎn),能實(shí)現(xiàn)各方共贏。這有助于頂住經(jīng)濟(jì)下行壓力、拓展中國(guó)發(fā)展新空間,有利于相關(guān)國(guó)家加快發(fā)展、擴(kuò)大就業(yè),并可為中國(guó)與發(fā)達(dá)國(guó)家合作開(kāi)拓第三方市場(chǎng)創(chuàng)造更多機(jī)遇?!盵8]中國(guó)倡導(dǎo)和推進(jìn)的“一帶一路”倡議和組建“亞洲基礎(chǔ)設(shè)施投資銀行”的意義是多方面的,其中一個(gè)重要方面是可以消化改革開(kāi)放以來(lái)中國(guó)形成的巨大的并正在日益過(guò)剩的產(chǎn)能,同時(shí)可以有力促進(jìn)“一帶一路”沿線國(guó)家和地區(qū)的發(fā)展。這也是典型的帕累托改進(jìn)。
調(diào)整利益格局不可能總是共贏結(jié)果和帕累托改進(jìn),也有許多零和結(jié)果,這種利益調(diào)整就是零和博弈式的。當(dāng)不破除一些既得利益就無(wú)法實(shí)現(xiàn)發(fā)展方式轉(zhuǎn)型的時(shí)候,就要積極集聚“勢(shì)能”,在風(fēng)險(xiǎn)可控的情況下,果斷采取激進(jìn)的方式突破既有利益格局,大膽調(diào)整存量利益格局,勇敢改革,破舊立新,構(gòu)建新的、符合科學(xué)發(fā)展方式的利益格局,從而促進(jìn)發(fā)展方式轉(zhuǎn)型取得實(shí)質(zhì)性進(jìn)展。例如,對(duì)于污染型企業(yè)的增長(zhǎng)、對(duì)于權(quán)錢(qián)勾結(jié)形成的利益鏈、對(duì)于“假冒偽劣”和“坑蒙拐騙”的獲利等,必須采取強(qiáng)硬措施加以解決;對(duì)于行政壟斷形成的利益和國(guó)企高管不正常的高薪等,要堅(jiān)決改革和調(diào)整。當(dāng)然,動(dòng)這樣的“奶酪”需要巨大的勇氣和高超的智慧。所謂巨大的勇氣就是不能懼怕阻力,不被風(fēng)險(xiǎn)嚇?。凰^高超的智慧,就是要在風(fēng)險(xiǎn)可控的條件下動(dòng)手,以免引起社會(huì)動(dòng)亂和打亂經(jīng)濟(jì)發(fā)展步伐。
對(duì)于一般性的有違發(fā)展方式轉(zhuǎn)型的既得利益,也要積極調(diào)整,但要盡量想辦法將零和博弈轉(zhuǎn)變?yōu)楣糙A博弈。例如,我國(guó)資源價(jià)格嚴(yán)重扭曲,價(jià)格被人為壓低,導(dǎo)致價(jià)格不能反映資源的稀缺情況,使得浪費(fèi)資源和破壞環(huán)境的粗放型增長(zhǎng)方式長(zhǎng)期得不到根本改變。因此,為了科學(xué)發(fā)展和可持續(xù)發(fā)展,資源價(jià)格改革勢(shì)在必行。但資源價(jià)格改革涉及的面太大,其關(guān)涉到的對(duì)象不僅有大量企業(yè),而且有廣大低收入群眾和貧困群眾。如果資源價(jià)格理順,那么對(duì)于科技實(shí)力強(qiáng)的企業(yè)和資源開(kāi)發(fā)企業(yè)和地區(qū)是有好處的,也有利于發(fā)展轉(zhuǎn)向集約型的科學(xué)發(fā)展方式;但必定增加低收入群眾的經(jīng)濟(jì)壓力。此時(shí),可以考慮把這種一方贏而另一方輸?shù)牧愫筒┺霓D(zhuǎn)換為共贏博弈,具體做法是:在理順資源價(jià)格的同時(shí),為利益受損的一方或幾方提供幫助或補(bǔ)貼,即給低收入群眾提供一定的補(bǔ)貼,具體操作上可采取類(lèi)似階梯水價(jià)的機(jī)制,使得低收入人群基本生活不受影響。這樣,本來(lái)是零和博弈的利益調(diào)整,變成了“使每個(gè)人的利益都增加,或者至少使一部分人的利益增加同時(shí)又不損害其他人的利益”的帕累托改進(jìn),即共贏博弈。這樣,為促進(jìn)發(fā)展方式轉(zhuǎn)型進(jìn)行的利益格局調(diào)整就會(huì)得到全社會(huì)成員的擁護(hù)。
零和博弈的典型情形是所謂的“囚徒困境”,下面進(jìn)一步分析如何突破發(fā)展方式轉(zhuǎn)型的“囚徒困境”。
囚徒困境是一種重要而常見(jiàn)的博弈,其中的囚徒A和B,是博弈中的兩個(gè)局中人,當(dāng)然,現(xiàn)實(shí)生活中往往不止有兩個(gè)局中人,但為了簡(jiǎn)化和便于分析,這里選擇兩個(gè)局中人的博弈類(lèi)型,三個(gè)及以上的局中人的情形原理與此類(lèi)同。
圖1 “囚徒困境”矩陣
囚徒困境的內(nèi)容是,假設(shè)警察抓住了兩個(gè)犯罪嫌疑人A和B,并告知他們政策:他們可以選擇坦白或不坦白,但后果不一樣:如果一個(gè)人坦白而另一個(gè)不坦白,那么坦白者立即釋放,不坦白者判刑6年;如果兩人都坦白,那么每人都判刑3年;如果兩人都不坦白(抵賴),那么由于證據(jù)不足,每人關(guān)押1年后釋放。在這種情形下,兩個(gè)囚徒會(huì)如何選擇呢?
博弈論假設(shè)局中人都是理性經(jīng)濟(jì)人,即都追求自己利益的最大化(當(dāng)然包括追求自身?yè)p害的最小化)。那么追求利益最大化和損害最小化的局中人A和B會(huì)如何決策呢?“囚徒困境”示意圖(圖1)顯示了分析過(guò)程,先來(lái)看看A的決策,他會(huì)思考和權(quán)衡:如果B不坦白,自己也不坦白,則自己判刑1年,而自己坦白則免于判刑;但A自己無(wú)法保證B不坦白,萬(wàn)一B坦白了,而A自己選擇不坦白,則自己就慘了,要判刑6年,B卻無(wú)罪釋放;顯然,A的最優(yōu)決策是選擇坦白??梢?jiàn),無(wú)論B作何選擇,A選擇坦白是最安全和最有利的。作為同樣是理性經(jīng)濟(jì)人的B,其思考和決策過(guò)程與A完全一樣,即無(wú)論A作何選擇,B選擇坦白是最安全和最有利的。這樣,形成了(坦白、坦白)這樣的博弈決策組合,其支付結(jié)構(gòu)是(-3,-3)。這樣的支付結(jié)構(gòu)或利益分配格局,比起策略組合(不坦白,不坦白)的支付結(jié)構(gòu)(-1,-1)要差。可以看到,作為兩個(gè)理性經(jīng)濟(jì)人,各自處心積慮算計(jì)和權(quán)衡,最后的收益卻不是最理想的,而是兩敗俱傷??梢?jiàn),每個(gè)人都追求自身利益最大化,結(jié)果不一定最佳,集體利益和每個(gè)人的利益沒(méi)有實(shí)現(xiàn)最大化,損失沒(méi)有實(shí)現(xiàn)最小化。這就是“囚徒困境”揭示的悖論,它在社會(huì)生活中具有普遍性,發(fā)展方式轉(zhuǎn)型也面臨這樣的困境和悖論。
在我國(guó)發(fā)展方式轉(zhuǎn)型過(guò)程中,遇到大量囚徒困境之類(lèi)的難題,需要尋求破局之法,以調(diào)整和優(yōu)化利益格局,促進(jìn)發(fā)展方式的轉(zhuǎn)型。下面分析兩個(gè)典型案例:
案例一:企業(yè)環(huán)保囚徒困境及其破解
發(fā)展方式轉(zhuǎn)型要求保護(hù)環(huán)境,由高碳發(fā)展轉(zhuǎn)向低碳發(fā)展,由黑色發(fā)展轉(zhuǎn)向綠色發(fā)展;但是由于囚徒困境的局限,經(jīng)濟(jì)發(fā)展往往很難實(shí)現(xiàn)這種轉(zhuǎn)型。美國(guó)著名經(jīng)濟(jì)學(xué)家保羅·薩繆爾森在《經(jīng)濟(jì)學(xué)》一書(shū)中,提供了一個(gè)著名的囚徒困境例子。在不受管制的環(huán)境下,每一個(gè)追求利潤(rùn)最大化的企業(yè)都寧肯污染環(huán)境,也不愿意安裝昂貴的污染處理設(shè)備。在這種環(huán)境下,如果一個(gè)企業(yè)采取利他主義態(tài)度,率先安裝處理污染的設(shè)備,那么,它就會(huì)增加生產(chǎn)成本,產(chǎn)品價(jià)格上升、客戶也會(huì)因此減少。如果該項(xiàng)成本增加到足夠高,則企業(yè)甚至?xí)飘a(chǎn)。這樣,為了降低成本,所有的企業(yè)都不安裝污染處理設(shè)備。但是環(huán)境污染得不到治理,越來(lái)越惡化,最后整個(gè)社會(huì)成員(包括那些排污的企業(yè)主及其員工)都是環(huán)境惡化的受害者。[10]
怎樣破除這一囚徒困境呢?辦法是制定和實(shí)施獎(jiǎng)懲的法規(guī)或措施。具體做法可以這樣:其一,對(duì)不進(jìn)行污染處理的企業(yè)實(shí)行處罰,處罰引起的成本高于其不安裝或不運(yùn)行排污設(shè)施節(jié)約的成本。其二,對(duì)于環(huán)保模范企業(yè),可以政府采購(gòu)優(yōu)先,從而擴(kuò)大產(chǎn)品銷(xiāo)量,獲得更大的利潤(rùn);可以由新聞媒體報(bào)導(dǎo),提高其社會(huì)聲譽(yù),引起消費(fèi)者的關(guān)注和信賴,從而擴(kuò)大銷(xiāo)量,獲得更大的利潤(rùn)。實(shí)行這些環(huán)保措施后,積極增加環(huán)保投入,實(shí)行清潔生產(chǎn)、綠色生產(chǎn),就是每一個(gè)理性的企業(yè)的自覺(jué)選擇了,這樣經(jīng)濟(jì)增長(zhǎng)與環(huán)境保護(hù)實(shí)現(xiàn)雙贏,包括企業(yè)主和企業(yè)員工在內(nèi)的所有社會(huì)成員,都從中受益。
案例二:企業(yè)創(chuàng)新囚徒困境及其破解
創(chuàng)新驅(qū)動(dòng)是發(fā)展方式轉(zhuǎn)型的重點(diǎn)和根本,而企業(yè)是創(chuàng)新的主體。但是企業(yè)往往陷入創(chuàng)新囚徒困境,嚴(yán)重制約創(chuàng)新。這里的創(chuàng)新包括技術(shù)創(chuàng)新、商業(yè)模式創(chuàng)新等。不創(chuàng)新的經(jīng)濟(jì)很難持續(xù)增長(zhǎng),效益和效率很難提高,但創(chuàng)新是需要付出高昂成本的,而且失敗的幾率很大,這是所謂的“不創(chuàng)新等死、創(chuàng)新找死”之說(shuō)的由來(lái)。因此,一般的企業(yè)都等著別人創(chuàng)新,如果失敗了,自己規(guī)避了風(fēng)險(xiǎn);如果成功了,自己可以跟進(jìn)和模仿。這一決策看來(lái)是很理性的,但是大家都這樣思謀和決策,結(jié)果是都沒(méi)有行動(dòng),誰(shuí)也不愿意第一個(gè)“吃螃蟹”,創(chuàng)新無(wú)法進(jìn)行,陷入創(chuàng)新囚徒困境。
怎樣破解這一困境呢?第一,政府切實(shí)地保護(hù)知識(shí)產(chǎn)權(quán),保護(hù)創(chuàng)新成果;第二,政府資助創(chuàng)新失敗者,率先創(chuàng)新者如果失敗了,政府給予補(bǔ)償,如成立創(chuàng)新失敗補(bǔ)償基金,減少創(chuàng)新失敗造成的損失;第三,運(yùn)用市場(chǎng)的辦法,推動(dòng)社會(huì)和市場(chǎng)風(fēng)險(xiǎn)投資的形成和發(fā)展,通過(guò)風(fēng)險(xiǎn)投資分?jǐn)偤头稚?chuàng)新失敗的成本;第四,推動(dòng)形成創(chuàng)新文化;第五,倡導(dǎo)和推動(dòng)形成寬容失敗的文化,擯棄“成者為王敗者為寇”的傳統(tǒng)觀念。創(chuàng)新失敗者是光榮的,不僅不應(yīng)該受到歧視,而且應(yīng)該給予精神的安慰和實(shí)際的幫助。失敗是成功之母,創(chuàng)新失敗者得到精神的安慰和實(shí)際的幫助,就有機(jī)會(huì)在以后的創(chuàng)新活動(dòng)中取得成功。
如果真正采取上述各種措施,創(chuàng)新囚徒困境一定會(huì)被打破,并形成企業(yè)和社會(huì)成員競(jìng)相創(chuàng)新、人人創(chuàng)新、萬(wàn)眾創(chuàng)新的可喜局面,那么創(chuàng)新驅(qū)動(dòng)的發(fā)展方式就能形成。
我國(guó)政府為推動(dòng)發(fā)展方式轉(zhuǎn)型可謂殫精竭慮,做出了巨大努力,出臺(tái)了各種措施,但一些措施的效果卻差強(qiáng)人意,其重要原因是,我們針對(duì)問(wèn)題推出措施的時(shí)候,往往沒(méi)有充分考慮到措施的可行性、可落實(shí)性問(wèn)題,沒(méi)有充分考慮到解決問(wèn)題的措施的落實(shí)需要付出成本的問(wèn)題,從而導(dǎo)致很多措施要么束之高閣,要么大打折扣。怎樣解決這一問(wèn)題呢?博弈論啟發(fā)我們,制定推進(jìn)發(fā)展方式轉(zhuǎn)型的政策措施和制度安排,要盡量形成有利于發(fā)展方式轉(zhuǎn)型的納什均衡。
所謂納什均衡(Nash equilibrium)是一種所有局中人的最優(yōu)決策組合,給定這一組合中參與人的選擇,沒(méi)有任何人積極改變自己的選擇。就是說(shuō),如果在博弈之前,所有的局中人達(dá)成一個(gè)協(xié)議,在不存在外部強(qiáng)制執(zhí)行的情況下,每一個(gè)人都積極遵守這個(gè)協(xié)議,那么這個(gè)協(xié)議就構(gòu)成一個(gè)納什均衡[11]。
當(dāng)我們推出促進(jìn)發(fā)展方式轉(zhuǎn)型的措施和制度安排構(gòu)成納什均衡時(shí),相關(guān)各方和人員就會(huì)自覺(jué)執(zhí)行有關(guān)制度,相關(guān)措施就容易落到實(shí)處,有利于發(fā)展方式的轉(zhuǎn)型。
但是,需要特別指出的是,并不是所有納什均衡都是好的,即不是所有的納什均衡都有利于促進(jìn)發(fā)展方式轉(zhuǎn)型。事實(shí)上,有一些壞的納什均衡,雖然大家都遵守,甚至是很自覺(jué)地遵守,但是卻不利于發(fā)展方式轉(zhuǎn)型。例如前文說(shuō)到的環(huán)境保護(hù)囚徒困境、創(chuàng)新囚徒困境,都是壞的、不利于發(fā)展方式轉(zhuǎn)型的納什均衡。再比如,為了適應(yīng)知識(shí)經(jīng)濟(jì)發(fā)展趨勢(shì)和創(chuàng)新驅(qū)動(dòng)的發(fā)展要求,我國(guó)早就提出了從應(yīng)試教育轉(zhuǎn)向素質(zhì)教育的理念,并且政府、有關(guān)方面和許多專家都充分論證和說(shuō)明了素質(zhì)教育對(duì)個(gè)人、家庭和國(guó)家的巨大意義,啟發(fā)了人們的認(rèn)識(shí),家庭、學(xué)生、學(xué)校也都認(rèn)識(shí)到了應(yīng)試教育的危害性,對(duì)其提出了嚴(yán)厲的批判,希望素質(zhì)教育理念得到貫徹。但是,在當(dāng)下中國(guó),素質(zhì)教育理念只是引起人們頭腦一陣騷動(dòng),實(shí)踐中幾乎沒(méi)有任何改變,應(yīng)試教育反而越演越烈,家庭、學(xué)生、學(xué)校都全力投入應(yīng)試教育,樂(lè)此不疲,素質(zhì)教育理念已經(jīng)被大多數(shù)人拋諸腦后了。原因是什么呢?從博弈論的視角來(lái)看,原因在于我們的教育體制已經(jīng)形成了一個(gè)與應(yīng)試教育相適應(yīng)的納什均衡。具體來(lái)說(shuō),中考和高考仍然是唯分?jǐn)?shù)論,這一制度安排決定了應(yīng)試教育的納什均衡。就是說(shuō),補(bǔ)課、灌輸式教學(xué)、題海戰(zhàn)術(shù)、犧牲綜合素質(zhì)提升將幾乎所有時(shí)間投入應(yīng)試科目的學(xué)習(xí)。這些應(yīng)試教育措施,如果一部分人抵制,但其他人不抵制,那么不抵制者升學(xué)考試得高分、進(jìn)入名校,而抵制者相反,升學(xué)考試分?jǐn)?shù)不高、無(wú)法進(jìn)入名校。那么,理性的人怎么選擇呢?學(xué)校、家長(zhǎng)、學(xué)生都不約而同地選擇應(yīng)試教育,不需要誰(shuí)去動(dòng)員和監(jiān)督,大家會(huì)自動(dòng)做出如此決策或選擇,從而形成了一個(gè)應(yīng)試教育的納什均衡。但是,這是一個(gè)壞的納什均衡,一個(gè)不適應(yīng)創(chuàng)新驅(qū)動(dòng)發(fā)展要求的納什均衡,必須打破!思路是:重新設(shè)計(jì)有關(guān)制度,把素質(zhì)教育設(shè)計(jì)成為一個(gè)納什均衡,破解應(yīng)試教育納什均衡。當(dāng)然這種新制度設(shè)計(jì)還在探索之中,很艱難,但方向是正確的,應(yīng)該堅(jiān)持下去。
下面分析發(fā)展經(jīng)濟(jì)如何讓保護(hù)環(huán)境成為一種納什均衡。前文提到環(huán)境保護(hù)的囚徒困境,政府可以采取獎(jiǎng)懲措施予以破解。但是,環(huán)保法卻幾乎形同虛設(shè),被戲稱“沒(méi)有長(zhǎng)牙齒的環(huán)保法”。為什么環(huán)保法無(wú)法有效落實(shí)呢?從博弈論的角度看,就是現(xiàn)有制度和政策下,環(huán)保法無(wú)法形成一個(gè)納什均衡,導(dǎo)致各方面執(zhí)行的積極性不高。環(huán)保法的執(zhí)行涉及到中央政府、地方政府、相關(guān)企業(yè)、企業(yè)員工、企業(yè)周邊居民等。中央政府站在全局高度希望環(huán)保法得到貫徹,污染企業(yè)的周邊居民是直接受害者,也希望真正落實(shí)環(huán)保法。但是,作為局中人的企業(yè)出于成本的考慮,同時(shí)擔(dān)心如果其他企業(yè)不遵守而自己遵守,自己就會(huì)吃虧,所以企業(yè)的決策或選擇就是不執(zhí)行或假執(zhí)行環(huán)保法。再來(lái)看另一個(gè)局中人地方政府,在目前的財(cái)稅體制和政績(jī)考核體制下,如果因?yàn)槲廴径P(guān)停企業(yè),地方政府的稅收會(huì)受到損失、政績(jī)考核會(huì)較差、關(guān)閉企業(yè)帶來(lái)的失業(yè)也會(huì)給地方政府帶來(lái)巨大的壓力,因此,作為理性人的地方政府,自然不會(huì)認(rèn)真、嚴(yán)格執(zhí)行環(huán)保法,對(duì)所轄地的企業(yè)盡力偏袒和保護(hù)。這樣,各方就不可能自覺(jué)遵守環(huán)保法了[12]。
如何突破困局?博弈論啟發(fā)我們,必須改革相關(guān)的規(guī)則或制度:第一,改革地方官員政績(jī)考核制度[13],降低GDP在政績(jī)考核體系中的權(quán)重,較大提升環(huán)境保護(hù)的權(quán)重,從而促使地方政府自覺(jué)地在不污染環(huán)境的前提下發(fā)展經(jīng)濟(jì)和增加GDP。第二,加大對(duì)企業(yè)污染環(huán)境的處罰力度,使得企業(yè)受到的處罰大于排放污染物節(jié)約的成本,企業(yè)就會(huì)自覺(jué)地在保護(hù)環(huán)境的前提下發(fā)展生產(chǎn),例如,構(gòu)建生態(tài)環(huán)境損害賠償制度[14],該制度能夠促使造成生態(tài)環(huán)境損害的企業(yè)承擔(dān)相應(yīng)賠償責(zé)任,企業(yè)便會(huì)因利益受損而自覺(jué)減少對(duì)生態(tài)環(huán)境的損害[15]。第三,設(shè)置排污產(chǎn)權(quán),將排污權(quán)商品化,可交易化,通過(guò)市場(chǎng)方法激勵(lì)企業(yè)節(jié)能環(huán)保。于是,環(huán)境保護(hù)的納什均衡就可以形成了。