摘要:建立地方政府“穩(wěn)評”操縱行為形成的演化博弈模型,在博弈均衡分析基礎(chǔ)上,通過Agent仿真實(shí)驗(yàn)揭示基層“穩(wěn)評”操縱行為發(fā)生的演化路徑。研究結(jié)果表明:第一,地方政府“穩(wěn)評”操縱行為的形成是政府執(zhí)行機(jī)構(gòu)、“穩(wěn)評”主管部門及社會群體的動態(tài)交互過程,其“適應(yīng)性”的主體選擇受到某些參數(shù)變化影響。第二,在有限理性條件下,不同群體行動的博弈支付矩陣、監(jiān)督參與程度以及懲戒機(jī)制對于基層“穩(wěn)評”操縱行為的形成產(chǎn)生密切關(guān)聯(lián),同時“操縱-監(jiān)督參與”實(shí)施成本的變化,將會改變基層“穩(wěn)評”操縱行為發(fā)生的約束條件和個體預(yù)期,進(jìn)而影響到公職人員在“穩(wěn)評”運(yùn)作中采取蒙蔽操控的機(jī)會主義行動意愿。
關(guān)鍵詞:“穩(wěn)評”;操縱行為;政策執(zhí)行;演化博弈
中圖分類號:D63文獻(xiàn)標(biāo)識碼:A文章編號:0257-5833(2018)05-0021-11
伴隨我國步入經(jīng)濟(jì)發(fā)展新常態(tài)以及全面深化改革進(jìn)程的推進(jìn),經(jīng)濟(jì)社會結(jié)構(gòu)轉(zhuǎn)型步伐不斷加快,發(fā)展中的不確定性社會風(fēng)險因素也在一定領(lǐng)域和范圍內(nèi)凸顯,風(fēng)險防控應(yīng)對能力體現(xiàn)出政府公共部門應(yīng)對現(xiàn)代挑戰(zhàn)及社會治理的綜合水平。近年來,作為社會風(fēng)險防范的一種創(chuàng)新性制度安排,社會穩(wěn)定風(fēng)險評估(下文簡稱“穩(wěn)評”)得到了中央層面認(rèn)可并積極推動,成為地方重大決策尤其是工程建設(shè)項(xiàng)目上馬實(shí)施的前置條件,“穩(wěn)評”相關(guān)主題話語也獲得政府公共部門及學(xué)界密集表達(dá)和廣泛關(guān)注。2012年8月,國家發(fā)改委正式發(fā)布《重大固定資產(chǎn)投資項(xiàng)目社會穩(wěn)定風(fēng)險評估暫行辦法》(國發(fā)改投資[2012]第2492號),次年2月又補(bǔ)充發(fā)布了《重大固定資產(chǎn)投資項(xiàng)目社會穩(wěn)定風(fēng)險評估報告編制大綱及說明》(國發(fā)改投資[2013]第428號),“穩(wěn)評”上升為各類工程建設(shè)項(xiàng)目行政審批(核準(zhǔn)/備案)的必備準(zhǔn)入程序。在此政策指引下,中國各地不同層級政府相繼制定了本地區(qū)職能機(jī)構(gòu)或?qū)I(yè)系統(tǒng)(如質(zhì)監(jiān)系統(tǒng)、環(huán)保系統(tǒng)、司法系統(tǒng))的“穩(wěn)評”工作文件或規(guī)范要求,以發(fā)揮其在社會風(fēng)險治理層面的基礎(chǔ)性作用。與此同時,“評估作業(yè)程序”與“評估報告”逐步演化為“穩(wěn)評”制度實(shí)現(xiàn)的核心載體與工作績效體現(xiàn),圍繞上述兩項(xiàng)內(nèi)容不少地區(qū)開展了相應(yīng)督查、評比、典型示范活動,并以一定形式確立具體目標(biāo)考核內(nèi)容和行政責(zé)任依據(jù)。
然而,實(shí)踐、制度和理念的發(fā)展往往不平衡,現(xiàn)實(shí)工作運(yùn)行并非符合預(yù)期。一線地方政府調(diào)查發(fā)現(xiàn),伴隨著經(jīng)濟(jì)利益和政績考核的現(xiàn)實(shí)擠壓,基層行政官員突破制度限制,制造虛假性評估操作程序及業(yè)務(wù)績效等消極行為逐步暴露出來,一些地區(qū)甚至陷入“象征性執(zhí)行”的工作困境田先紅、羅興佐:《官僚組織間關(guān)系與政策的象征性執(zhí)行——以重大決策社會穩(wěn)定風(fēng)險評估制度為討論中心》,《江蘇行政學(xué)院學(xué)報》2016年第5期。 ,對“穩(wěn)評”制度目標(biāo)和工程項(xiàng)目建設(shè)構(gòu)成新的衍生風(fēng)險。事實(shí)上,對于基層政府部門來說,如果“穩(wěn)評”制度規(guī)則與其自身期望或利益需求不相符合,或者面臨某些關(guān)鍵性阻礙時,將缺乏制度落地的積極性,并可能試圖改變制度的運(yùn)作方式,發(fā)生欺騙性操縱行動以迎合特定需要。換言之,地方政府實(shí)踐中出現(xiàn)了針對“穩(wěn)評”運(yùn)作施加人為控制和敷衍性回應(yīng),而該類扭曲行為恰是在目標(biāo)責(zé)任考核的背景環(huán)境下發(fā)生??傮w來看,地方“穩(wěn)評”實(shí)施中操縱行為主要體現(xiàn)在“評估活動作業(yè)”和“工作績效輸出”兩個方面,其本質(zhì)是基層政府部門考核對象為了特定利益目標(biāo)而施加的投機(jī)性蒙蔽行為。
本文認(rèn)為,盡管地方政府機(jī)構(gòu)部門在“穩(wěn)評”實(shí)施中出現(xiàn)蒙蔽性操縱行為具有多種根源,但有效監(jiān)督空間的不足或缺失是關(guān)鍵因素之一,操縱行為的生成演化是一個組織內(nèi)外部個體的博弈系統(tǒng),并依賴于制度執(zhí)行相應(yīng)監(jiān)督約束環(huán)境,立足博弈路徑探尋“穩(wěn)評”操縱行為的發(fā)生機(jī)制,有助于從微觀角度把握基層行政官僚的行動選擇過程。鑒此,本文試圖基于復(fù)雜性系統(tǒng)的觀點(diǎn),將基層“穩(wěn)評”操縱行為的形成及控制治理置于不同主體間交互系統(tǒng)進(jìn)行研究,建立“操縱-監(jiān)督參與”框架的動態(tài)分析思路,應(yīng)用演化博弈和Agent仿真實(shí)驗(yàn)方法,深入系統(tǒng)內(nèi)部探索基層“穩(wěn)評”操縱行為的形成演化規(guī)律與控制防范,從而為我國“穩(wěn)評”制度的優(yōu)化和有針對性地加強(qiáng)治理提供科學(xué)依據(jù)和理論支持。
一、文獻(xiàn)綜述與研究視角
國內(nèi)外對于制度視野下的組織內(nèi)操縱行為有著不同的研究視角,然而以小集團(tuán)和個體利益為本位采取蒙蔽性欺騙(Blinded Deception)是共同特征。Lawrence提出操縱是組織和個體面對特定制度壓力的能動回應(yīng)行為以及施加主觀控制的策略手段T. B. Lawrence, “Institutional Strategy”, Journal of Management, Vol. 25, No. 2, 1999, pp. 161-187.;James和Isaac揭示了考核中錦標(biāo)賽機(jī)制如何導(dǎo)致組織活動中的操縱行為和結(jié)果D. James and R. M. Isaac, “Asset Markets: How They Are Affected by Tournament Incentives for Individuals”, American Economic Review, Vol. 90, No. 4, 2000, pp. 995-1004.;Kra¨kel認(rèn)為在競技的社會情境下,組織及個體傾向于通過非理性操縱行動獲取期望目標(biāo)或名義績效M. Kra¨kel, “Doping and Cheating in Contest-like Situations”, European Journal of Political Economy, Vol. 23, No. 4, 2007, pp. 988-1006.。在社會層面,F(xiàn)erguson曾構(gòu)建了一個社會傳染模型(Social Contagion Model),指出包括社會情境、環(huán)境特征、利益需求、規(guī)則偏好等因素共同影響組織內(nèi)操縱行為Merideth J. Ferguson, From Bad to Worse: A Social Contagion Model of Organizational Misbehavior, Vanderbilt University, 2007, p. 170.;周雪光周雪光:《基層政府間的“共謀現(xiàn)象”——一個政府行為的制度邏輯》,《開放時代》2009年第12期。和艾云艾云:《上下級政府間“考核檢查”與“應(yīng)對”過程的組織學(xué)分析:以A縣“計劃生育”年終考核為例》,《社會》2011年第3期。以中國基層政府聯(lián)合應(yīng)對上級檢查為視角,對績效信息操縱行為進(jìn)行了深入論證分析,說明了操縱行為手段導(dǎo)致目標(biāo)偏離政策初衷的現(xiàn)實(shí)作用機(jī)制。目前,國內(nèi)關(guān)于政府部門操縱行為主題的研究,主要基于“壓力型體制”的組織情境,探討操縱行為如何干擾政策形成和決策過程,進(jìn)而誘發(fā)經(jīng)濟(jì)社會發(fā)展風(fēng)險。
本文研究視角見圖1:
演化博弈論(Evolutionary Game Theory)將博弈分析和演化動態(tài)結(jié)合起來,以有限理性為基礎(chǔ)考察社會現(xiàn)象,對于探索基層“穩(wěn)評”運(yùn)作中操縱行為具有很強(qiáng)的適用性及解釋力?,F(xiàn)實(shí)中,基層政府部門作為一個有限理性群體,在既有行政系統(tǒng)中表現(xiàn)出高度的適應(yīng)性和“學(xué)習(xí)”特征,能夠跟隨內(nèi)外環(huán)境的變化動態(tài)調(diào)整其主體行為,進(jìn)而適應(yīng)“穩(wěn)評”制度執(zhí)行及行政活動的整體需要。同時,作為制度設(shè)計的重要組成部分,上級監(jiān)管領(lǐng)導(dǎo)組織及社會參與構(gòu)成“穩(wěn)評”運(yùn)行支撐的關(guān)鍵影響群體,其實(shí)際存在狀態(tài)也置于主體關(guān)聯(lián)互動的系統(tǒng)情境,對“穩(wěn)評”運(yùn)作環(huán)境產(chǎn)生影響作用,通過多重互動最終“涌現(xiàn)”出包括操縱行為在內(nèi)的復(fù)雜系統(tǒng)特征。依托演化博弈論原理,基層政府“穩(wěn)評”執(zhí)行者和監(jiān)管參與方的進(jìn)化博弈過程都包括兩個可能的行為機(jī)制:選擇機(jī)制和變異機(jī)制。前者是在初期博弈中能夠獲得較高收益的行為策略,在下一期被更多組織個體選擇,而后者則是“穩(wěn)評”執(zhí)行中博弈主體以隨機(jī)方式的選擇策略。在某一時段或進(jìn)化階段,能夠相對適應(yīng)生存下來的大部分個體采用策略就是演化穩(wěn)定策略。從基層“穩(wěn)評”執(zhí)行者的角度來看,如果操縱行為是“穩(wěn)評”中絕大多數(shù)組織個體選擇的演化穩(wěn)定策略,則作為變異方的“非操縱”要么改變行為策略,要么退出演化系統(tǒng)而消失。上述過程可以用演化博弈工具進(jìn)行分析論證。
二、地方“穩(wěn)評”執(zhí)行操縱行為演化博弈模型
本文的分析始于一個基本的情景設(shè)定:地方政府是由具有多重目標(biāo)和不同利益的各個部門機(jī)構(gòu)組成,無論“穩(wěn)評”操作程序還是評估報告輸出,都存在于特定利益博弈選擇過程之中?,F(xiàn)實(shí)中,地方政府有相當(dāng)寬的施政裁量權(quán),當(dāng)官員面臨復(fù)雜多樣的政策目標(biāo)(如經(jīng)濟(jì)發(fā)展、民生環(huán)保、文化黨建、計生扶貧等)時,其對于某項(xiàng)制度(或政策)的重視程度,雖然受到一定政治壓力及職業(yè)晉升的影響,但一線基層組織對其把握并非被動。
現(xiàn)實(shí)中,“穩(wěn)評”制度執(zhí)行依然存在于傳統(tǒng)的“政績錦標(biāo)賽”行政體制,且工作活動自身融合了基層組織部門與上級政府機(jī)構(gòu)、社會力量之間的復(fù)雜信息、資源互動,具有典型的復(fù)雜自適應(yīng)系統(tǒng)(CAS)特征,并在群體交互中“涌現(xiàn)”一些新的策略舉動,基層部門的操縱行為即是該過程中的突出表現(xiàn)之一。為便于研究并根據(jù)基層“穩(wěn)評”現(xiàn)實(shí)運(yùn)作情況,本文簡化操作為兩大群體Agent:基層政府評估主體(以下稱基層主體)、主管部門和公眾(即監(jiān)督主體)。
(一)模型假設(shè)與博弈支付矩陣
由于現(xiàn)實(shí)“穩(wěn)評”存在明顯信息不對稱及博弈主體有限理性,上述設(shè)定群體在“穩(wěn)評”運(yùn)作過程中很難確定是否獲得自身利益最大化。因此,在一定的行政系統(tǒng)環(huán)境下,基層主體可以按照制度規(guī)則如實(shí)履行評估要求,實(shí)現(xiàn)“穩(wěn)評”制度既定目標(biāo)(以下簡稱“不操縱”),也可以通過蒙蔽性操縱手段進(jìn)行人為的信息扭曲,以獲取諸如項(xiàng)目實(shí)施和短期經(jīng)濟(jì)政績的特定利益(以下簡稱“操縱”)。而無論采取何種策略行為,均是經(jīng)過行政系統(tǒng)中“學(xué)習(xí)適應(yīng)”、不斷進(jìn)行策略調(diào)整的結(jié)果。與此同時,上級領(lǐng)導(dǎo)監(jiān)管機(jī)構(gòu)(以維穩(wěn)機(jī)構(gòu)部門為主)和社會公眾力量是“穩(wěn)評”實(shí)施的內(nèi)外監(jiān)督組織/群體(以下簡稱“主管部門及社會”),現(xiàn)實(shí)中也存在兩種現(xiàn)實(shí)行動選擇:一是對基層主體進(jìn)行剛性監(jiān)督監(jiān)管,支持社會參與發(fā)揮作用(以下簡稱“監(jiān)督參與”);二是出于特定需要或環(huán)境限制消極監(jiān)督,回避阻礙外部社會參與(以下簡稱“不監(jiān)督參與”)。其中,“主管部門及社會”是一個較為寬泛的概念,這里主要指與“穩(wěn)評”實(shí)施相關(guān),主導(dǎo)“穩(wěn)評”規(guī)則制定和督查的黨政機(jī)構(gòu)以及社會第三方力量;社會組織和公眾參與到地方工程項(xiàng)目“穩(wěn)評”工作過程,一方面由于政府自身要求而吸收公共服務(wù)支持,另一方面也出于一定的社會利益需求和重大工程項(xiàng)目的自身價值。在上述行為鏈條中,若確認(rèn)“基層主體”沒有按照“穩(wěn)評”制度程序行事,進(jìn)行了虛假人為操縱,則應(yīng)給予其相應(yīng)行政及物質(zhì)懲罰并接受一定政治成本付出。
根據(jù)以上設(shè)定并借鑒博弈論著名的“聲譽(yù)模型”(Reputation Model)U. Gneezy, “Deception: The Role of Consequences”, American Economic Review, Vol. 95, No. 1, 2005, pp. 384-394.思想,本文研究對“基層主體”和“主管部門及社會”做如下分析假設(shè):
① “穩(wěn)評”運(yùn)作中一線政府部門行政官僚及執(zhí)行者(基層主體,下同)選擇“操縱”付出的成本為CM,主要包括兩個方面:一是耗費(fèi)在人為信息蒙蔽和評估項(xiàng)目結(jié)果控制上的資源付出以及行政系統(tǒng)內(nèi)部干預(yù)等;二是受到懲戒問責(zé)時的實(shí)際損失(組織與個體)。
② “穩(wěn)評”實(shí)際運(yùn)作中基層主體選擇人為“操縱”獲得的可能收益為RM,主要包括減少工程項(xiàng)目審批等“行政壁壘”所付出的精力資源,以及推動項(xiàng)目快速上馬而實(shí)現(xiàn)的短期經(jīng)濟(jì)發(fā)展績效和相關(guān)個體政績增值。
③ “主管部門及社會”監(jiān)督參與成本為CPS,主要包括機(jī)構(gòu)推進(jìn)“穩(wěn)評”實(shí)施的必要協(xié)調(diào)監(jiān)管活動費(fèi)用、承擔(dān)系統(tǒng)內(nèi)部干預(yù)的支付成本,以及推動組織社會參與合作所產(chǎn)生的隱性交易成本。現(xiàn)實(shí)體制下,“穩(wěn)評”監(jiān)督參與的有效度來自更上層級權(quán)威和政府主導(dǎo)型網(wǎng)絡(luò)中的資源投入及民主空間。
④ “主管部門及社會”在監(jiān)督參與行動環(huán)境下,若確認(rèn)工程項(xiàng)目評估運(yùn)行良好(不操縱),則給予基層主體相應(yīng)獎勵或認(rèn)可,此處令其為ANM;反之(發(fā)生操縱)則給予嚴(yán)厲處罰或責(zé)任懲戒,令其為PM,以彌補(bǔ)由此可能造成的后續(xù)社會問題(如引發(fā)不穩(wěn)定沖突事件)產(chǎn)生的系列損失LM。
其中,“主管部門及社會”作為基層“穩(wěn)評”制度實(shí)現(xiàn)的關(guān)鍵群體,除了發(fā)揮基本監(jiān)督作用之外,在構(gòu)筑良性的網(wǎng)絡(luò)治理、改善社會參與公共事務(wù)環(huán)境層面扮演重要角色,這同樣會影響以上兩大群體的行為成本,包括基層主體選擇“操縱”而付出的成本CM,和博弈方的監(jiān)督參與成本CPS,進(jìn)而通過“穩(wěn)評”活動成本的變化影響最終博弈進(jìn)化結(jié)果。根據(jù)進(jìn)化博弈論原理,本文建立可能的博弈行為組合及支付矩陣(見表1):
表1地方“穩(wěn)評”操縱行為博弈支付矩陣評估機(jī)構(gòu)主體(基層主體)不操縱操縱主管部門及社會監(jiān)督參與(-CPS-ANM, -CM+ANM+RM)(-LM-CPS+PM, -PM)不監(jiān)督參與(0, -CM+RM)(-LM, 0)
(二)地方“穩(wěn)評”操縱行為演化博弈的均衡分析
1. 構(gòu)建收益函數(shù)
在“穩(wěn)評”運(yùn)行初始階段,假設(shè)主管部門及社會“監(jiān)督參與”的行為概率為x,“不監(jiān)督參與”的行為概率為1-x,基層主體選擇“操縱”的概率為y,采取“不操縱”的概率為1-y。“監(jiān)督參與”和“不監(jiān)督參與”的利益期望以及平均收益分別為U1、U2、U1?!安倏v”和“不操縱”的利益期望以及平均收益分別為V1、V2、V1。具體公式定義如下所示:
U1=y-CPS-ANM+(1-y)(-LM-CPS+PM)
=y(LM-PM-ANM)+(PM-LM-CPS) (1)
U2=(1-y)(-LM)=yLM-LM(2)
U1=xU1+(1-x)U2
=xy(LM-PM-ANM)+x(PM-LM-CPS)+(1-x)(yLM-LM)
=-xy(PM+ANM)+x(PM-CPS)+(y-1)LM (3)
V1=x(-CM+ANM+RM)+(1-x)(-CM+RM)
=xANM+RM-CM(4)
V2=-xPM(5)
V1=yV1+(1-y)V2
=xy(ANM+PM)+y(RM-CM)-xPM (6)
2. 建立復(fù)制動態(tài)方程
根據(jù)進(jìn)化穩(wěn)定復(fù)制者動態(tài)(Replicator Dynamic,RD)及演化博弈的相關(guān)研究[美] 約翰·梅納德·史密斯:《演化與博弈論》,潘香陽譯,復(fù)旦大學(xué)出版社2008年版;[美] 赫伯特·金迪斯:《演化博弈論:問題導(dǎo)向和策略互動模型》(第2版),王新榮譯,中國人民大學(xué)出版社2016年版。,以下構(gòu)建本文研究中有關(guān)穩(wěn)評基層主體和“主管部門及社會”參與群體之間的復(fù)制動態(tài)方程,具體如下:
(1)主管部門及社會“監(jiān)督參與”概率的復(fù)制動態(tài)方程
F(x)=dxdt=x(U1-U1)=x(x-1)(yPM+yANM-PM+CPS)(7)
當(dāng)y=PM-CPSPM+ANM,F(xiàn)(x)=0,所有x取值都使函數(shù)值為0,意味著相應(yīng)x的所有取值都為穩(wěn)定狀態(tài)。
當(dāng)y≠PM-CPSPM+ANM,由式(7-7)可以解出存在x=0,x=1兩個可能的穩(wěn)定狀態(tài),即此條件下F(x)=dxdt=0。
進(jìn)一步對F(x)求導(dǎo),得到:
dF(x)dx=(2x-1)(yPM+yANM-PM+CPS)(8)
根據(jù)微分方程的穩(wěn)定性原理及演化穩(wěn)定策略的性質(zhì),令dF(x)dx<0,對PM-CPS的不同取值范圍進(jìn)行判別分析:
①當(dāng)PM-CPS<0,即PM-CPSPM+ANM<0時,yPM+yANM-PM+CPS>0恒成立,此時若要滿足前置條件dF(x)dx<0,則必有x=0,即x=0為演化穩(wěn)定策略;
② 當(dāng)0 若y>PM-CPSPM+ANM,則dF(x)dxx=0<0,dF(x)dxx=1>0,故x=0為均衡點(diǎn); 若y (2)基層主體“穩(wěn)評”運(yùn)作中采取“不操縱”概率的復(fù)制動態(tài)方程 F(y)=dydt=y(V1-V1)=y(1-y)[RM-CM+x(ANM+PM)](9) 當(dāng)x=CM-RMANM+PM,則恒有F(y)≡0,這意味所有y取值的函數(shù)值F(y)均實(shí)現(xiàn)穩(wěn)定狀態(tài); 當(dāng)x≠CM-RMANM+PM RM-CM+x(ANM+PM)>0 y=1,令F(y)=0,可以得到該結(jié)果實(shí)現(xiàn)存在兩個取值,即:y=0或y=1。 同上,令dF(y)dy=(1-2y)[RM-CM+x(ANM+PM)]<0,對CM-RM的不同取值范圍狀況進(jìn)行討論: ① 若CM-RM<0(亦即RM-CM>0),可以推出RM-CM+x(ANM+PM)<0恒成立,根據(jù)dF(y)dy<0的前置預(yù)設(shè),此時y=1是其演化穩(wěn)定策略; ② 若CM-RM>ANM+PM,亦即CM-RMANM+PM>1,可得RM-CM+x(ANM+PM)<0恒成立,此時y=0是其演化穩(wěn)定策略; ③ 若0 當(dāng)x>CM-RMANM+PM時,dF(y)dyy=0>0,dF(y)dyy=1<0,y=1是均衡點(diǎn); 當(dāng)x 需要說明的是,以上確立的均衡點(diǎn)是“穩(wěn)評”中相關(guān)群體一定博弈策略選擇條件下的理性選擇,但按照博弈進(jìn)化原理P. Harrald, Evolutionary Games And Equilibrium Selection, Cambridge: The Massachusetts Institute of Technology(MIT) Press, 1998;孫慶文、陸柳、嚴(yán)廣樂:《不完全信息條件下演化博弈均衡的穩(wěn)定性分析》,《系統(tǒng)工程理論與實(shí)踐》2003年第7期。,均衡點(diǎn)并不一定是參與群體的最終“穩(wěn)定策略”,故此時還需要進(jìn)行博弈均衡分析。簡言之,博弈均衡就是使博弈各方實(shí)現(xiàn)各自認(rèn)為的最大效用,而所有參與者都不愿改變自己策略的一種相對靜止?fàn)顟B(tài)。
(三)博弈均衡分析
如上文分析,根據(jù)演化博弈論的基本思想和本文研究界定,基層“穩(wěn)評”運(yùn)行中相關(guān)方(“基層主體”與“主管部門及社會”)以其不同策略選擇(“操縱-不操縱”、“監(jiān)督參與-不監(jiān)督參與”)的概率參數(shù)相對各自收益點(diǎn)取值大?。▁=CM-RMANM+PM,y=PM-CPSPM+ANM)而出現(xiàn)不同的均衡點(diǎn)。進(jìn)一步而言,當(dāng)策略選擇滿足以下條件時:
0 根據(jù)復(fù)制動態(tài)方程及(x,y)不同取值,其博弈策略演化趨勢可以用圖2表示說明。 進(jìn)一步分析不同概率條件下基層“穩(wěn)評”運(yùn)行中不同關(guān)聯(lián)群體的博弈選擇策略: ① 當(dāng)(x,y)取值位于I區(qū)域時,博弈收斂于均衡點(diǎn)x=1,y=0,即(監(jiān)督參與、不操縱)是“基層主體”和“主管部門及社會”群體的進(jìn)化穩(wěn)定結(jié)果。 ② 當(dāng)(x,y)取值位于II區(qū)域時,博弈收斂于均衡點(diǎn)x=1,y=1,即(監(jiān)督參與、操縱)是“基層主體”和“主管部門及社會”群體的進(jìn)化穩(wěn)定結(jié)果。 ③ 當(dāng)(x,y)取值位于III區(qū)域時,博弈收斂于均衡點(diǎn)x=0,y=1,即(不監(jiān)督參與、操縱)是“基層主體”和“主管部門及社會”群體的進(jìn)化穩(wěn)定結(jié)果。 ④ 當(dāng)(x,y)取值位于IV區(qū)域時,博弈收斂于均衡點(diǎn)x=0,y=0,即(不監(jiān)督參與、不操縱)是“基層主體”和“主管部門及社會”群體的進(jìn)化穩(wěn)定結(jié)果。 (四)演化博弈穩(wěn)定結(jié)果分析 以上運(yùn)用演化博弈方法研究了中國基層政府“穩(wěn)評”實(shí)施過程中,一線組織部門操縱行為選擇與“穩(wěn)評”主管機(jī)構(gòu)及外部社會力量監(jiān)督參與的互動機(jī)制,旨在從動態(tài)的角度對現(xiàn)行地方行政體制下的“穩(wěn)評”人為操縱形成機(jī)理進(jìn)行探索挖掘。在“基層主體”與“主管部門及社會”有限理性條件下,根據(jù)演化博弈原理得到如下進(jìn)化穩(wěn)定策略選擇: ① 若PM-CPS<0,則x=0是演化穩(wěn)定策略,即“主管部門及社會”對于現(xiàn)實(shí)中“穩(wěn)評”推動實(shí)施“監(jiān)督參與”的成本大于基層政府“操縱”行為處罰,最終會導(dǎo)致“不監(jiān)督參與”的選擇結(jié)果。 ② 若CM-RM<0,則y=1是演化穩(wěn)定策略,即基層主體選擇“操縱”的增加收益大于其“操縱”所實(shí)際付出的成本,無論穩(wěn)評實(shí)施中的“監(jiān)督參與”狀況如何,基層主體最終會選擇“操縱”。 ③ 若CM-RM>ANM+PM→CM>RM+ANM+PM,則y=0是演化穩(wěn)定策略,即基層主體選擇操縱行為成本大于其操縱實(shí)施所增加的收益和遭受懲戒、以及選擇“不操縱”策略所獲獎勵之和,則根據(jù)上述分析推演,有限理性的基層政府部門主體會選擇“不操縱”結(jié)果。 三、仿真實(shí)驗(yàn)研究 演化博弈分析建立于“共同知識”“共同知識”(Common Knowledge)是博弈論一個重要概念及理論假定,可概括為博弈方在無窮遞歸意義上均知悉的事實(shí),簡單來說就是彼此知道彼此的“底細(xì)”,包括信息、行為、決策等。本文研究中假定基層“穩(wěn)評”實(shí)施中,博弈方均明確知悉相互信息狀況及行動取向,并在此基礎(chǔ)上根據(jù)各自收益函數(shù)展開博弈演化。參見L. Samuelson, “Dominated Strategies and Common Knowledge”, Games and Economic Behavior, Vol. 4, No. 2, 1991, pp. 284-313。的理論假定,但在現(xiàn)實(shí)“穩(wěn)評”實(shí)施中,“共同知識”的假定實(shí)際上是無法完全滿足的,這也使進(jìn)化博弈方法受到一定的詮釋限制。在演化博弈基礎(chǔ)上本節(jié)引入Agent仿真方法,將基層政府部門“穩(wěn)評”實(shí)施中的關(guān)聯(lián)主體界定為具有適應(yīng)性和能動性的智能體,依托前文提出的“操縱-監(jiān)督參與”博弈框架進(jìn)行動態(tài)模擬,通過智能體之間以及系統(tǒng)環(huán)境之間的交互作用,揭示基層“穩(wěn)評”操縱行為形成影響機(jī)制。作為一種探索系統(tǒng)演化趨向的“思想試驗(yàn)”工具,基于Agent仿真有利于將復(fù)雜系統(tǒng)的微觀行為和宏觀“涌現(xiàn)”現(xiàn)象聯(lián)系起來,發(fā)掘群體行為進(jìn)化廖守億、戴金海:《復(fù)雜適應(yīng)系統(tǒng)及基于Agent的建模與仿真方法》,《系統(tǒng)仿真學(xué)報》2004年第1期。。本研究采用Netlogo進(jìn)行仿真模擬,實(shí)現(xiàn)過程中Agent外部環(huán)境被虛擬成現(xiàn)實(shí)基層“穩(wěn)評”實(shí)施中的微觀環(huán)境。 (一)仿真實(shí)驗(yàn)設(shè)計 本文基于Agent構(gòu)建仿真實(shí)驗(yàn)?zāi)P桶ú┺闹黧w和博弈環(huán)境。博弈主體整合成兩類:一類為實(shí)施了操縱行為的基層組織執(zhí)行者,即“穩(wěn)評”實(shí)施過程中采取欺騙性蒙蔽手段以實(shí)現(xiàn)特定項(xiàng)目或政策需要,用Manipulator來表示;另一類為監(jiān)督參與方,即在“穩(wěn)評”實(shí)施過程中給予監(jiān)管職責(zé)的上級組織和外部社會參與者,用Participator來表示。 同時,依托Netlogo軟件自有功能,設(shè)定一個25*25二維正方形網(wǎng)格來表示基層政府“穩(wěn)評”工作活動的執(zhí)行環(huán)境:若某格點(diǎn)上存在一個Agent,則該點(diǎn)顯示出特定顏色(如紅色或藍(lán)色),否則轉(zhuǎn)變?yōu)楸尘邦伾?,且?guī)定每一格點(diǎn)同一時刻只出現(xiàn)一個Agent(見圖3)。如前所述,地方“穩(wěn)評”實(shí)施中操縱行為生成演變是一種動態(tài)過程,是一定環(huán)境下博弈進(jìn)化均衡結(jié)果,為揭示這一過程,本模型構(gòu)建通過相應(yīng)格點(diǎn)上Agent消亡來描述其對應(yīng)主體的“反向退出”狀態(tài),而以該格點(diǎn)上新的Agent產(chǎn)生來模擬表現(xiàn)其他主體的加入,以變異說明Agent對應(yīng)主體狀態(tài)的變化(如操縱-不操縱、監(jiān)督參與-不監(jiān)督參與)。以上群體均立足自身屬性及所處環(huán)境,按照一定行為規(guī)則做出相應(yīng)策略行動,在反復(fù)博弈過程中學(xué)習(xí)、模仿、演變,最終達(dá)到演化穩(wěn)定狀態(tài)。 根據(jù)上文所做的“穩(wěn)評”博弈進(jìn)化分析,構(gòu)建Agent模型中主體屬性:(1)起始行為策略:記錄在t時刻,監(jiān)督參與或不監(jiān)督參與、“穩(wěn)評”操縱行為或不操縱行為;(2)下一觀察期策略選擇:依據(jù)t時刻主體博弈收益,記錄t+1時刻預(yù)采用行為選擇;(3)本次收益:記錄行為選擇者所獲個體收益。按照Agent建模的設(shè)定思想,有限理性的Agent個體具有認(rèn)知能力和學(xué)習(xí)能力,在多數(shù)情況下通過交互作用不斷學(xué)習(xí)和積累經(jīng)驗(yàn),并進(jìn)行動態(tài)調(diào)整行為,在本文模型中兩類Agent會根據(jù)自身行為、對手行為策略和博弈過程不斷修正行為,直至確定最終“穩(wěn)評”工作活動中的行為選擇。
(二)仿真結(jié)果分析
在Netlogo主程序界面中,依托前一節(jié)構(gòu)建的博弈模型進(jìn)行系統(tǒng)編程,以實(shí)現(xiàn)對博弈主體、環(huán)境及整個模型輸入輸出的約束性控制。首先進(jìn)行初始參數(shù)的環(huán)境設(shè)定,如前所述設(shè)定“穩(wěn)評”活動兩類Agent群體數(shù)量,其中基層部門正常執(zhí)行評估的單位數(shù)量初定為N1=100,“穩(wěn)評”活動監(jiān)督參與單位初定為N2=20,操縱行為發(fā)生概率p=0.1(0
根據(jù)以上參數(shù)輸入得到仿真圖像(見圖4),即雙方演化均衡為(操縱,不監(jiān)督參與)。按照模型設(shè)定,地方“穩(wěn)評”政策執(zhí)行中操縱行為選擇取向是通過群體比例的變化來體現(xiàn),即基層主體發(fā)生“穩(wěn)評”操縱行為占有比例和監(jiān)督參與群體比例變化,以下進(jìn)一步調(diào)整相關(guān)參數(shù)運(yùn)行程序并觀察仿真結(jié)果。
1. 改變懲戒支付成本
更改針對基層“穩(wěn)評”單位及個體實(shí)施人為操縱的懲戒支付(成本)Φ,而其它各參數(shù)初始設(shè)定值保持不變,觀察模型反映出來的群體比例變化。以下將Φ值由2調(diào)整為4,即加大基層單位及個體“穩(wěn)評”操縱行為的懲罰力度,運(yùn)行主程序后得到的仿真結(jié)果如圖5所示。
上圖仿真結(jié)果顯示,當(dāng)懲戒支付成本Φ值提高,監(jiān)督參與Agent比例不斷增加,基層“穩(wěn)評”執(zhí)行者采取操縱行為的Agent比例逐步下降,在仿真演化某一時點(diǎn)時達(dá)到均衡狀態(tài)。同時,隨著懲罰力度的加大,均衡狀態(tài)下基層“穩(wěn)評”執(zhí)行者采取操縱行為的群體比例有所減小,進(jìn)一步調(diào)整懲戒Φ值為8進(jìn)行程序運(yùn)行,仿真結(jié)果亦顯示出此項(xiàng)特征。換言之,通過加大監(jiān)督參與群體力量和違規(guī)懲戒,可以降低基層部門執(zhí)行者在“穩(wěn)評”活動中施加操縱行為的預(yù)期收益(Income),提高支付成本(Cost),在某一時點(diǎn)達(dá)到群體演化的均衡,實(shí)現(xiàn)更低水平操縱行為的選擇實(shí)施比例。這一結(jié)果體現(xiàn)出來自行政系統(tǒng)懲罰問責(zé)以及外部社會監(jiān)督參與因素,對于降低基層“穩(wěn)評”人為控制性操縱行為的有效性。
2. 變動監(jiān)督參與成本
如前文所述,針對基層“穩(wěn)評”的監(jiān)督參與活動存在運(yùn)作成本CPS,這影響監(jiān)督參與的運(yùn)行質(zhì)量,并可能間接影響到基層“穩(wěn)評”執(zhí)行主體的操縱行為選擇。此處通過更改監(jiān)督參與成本c的值,其它各參數(shù)初始值不變,觀測模型仿真反映出來的主體Agent比例變化。圖6是將模型參數(shù)c值由初始的10調(diào)整為20,運(yùn)行程序后得到的仿真結(jié)果。可以看出:由于活動成本的增加,針對“穩(wěn)評”工作運(yùn)行的監(jiān)督參與群體比例逐步減小,采用操縱行為策略的基層執(zhí)行主體Agent的比例呈現(xiàn)上升態(tài)勢,在某一時點(diǎn)達(dá)到均衡狀態(tài)。將該結(jié)果與初始參數(shù)仿真結(jié)果(見圖4)進(jìn)行對比后不難發(fā)現(xiàn),隨著監(jiān)督參與成本的增加,均衡狀態(tài)下針對“穩(wěn)評”的監(jiān)督參與Agent比例不斷向低值區(qū)間趨近,最終幾乎趨向?yàn)?,而實(shí)施操縱行為的基層“穩(wěn)評”單位比例則遠(yuǎn)超出初始設(shè)定值。
基于進(jìn)化博弈框架的Agent仿真分析可以看出,監(jiān)督參與狀況以及相應(yīng)懲戒實(shí)施特征對于基層“穩(wěn)評”活動中的操縱行為發(fā)生具有重要影響,這一作用過程通過兩類Agent比例變化得到體現(xiàn)。所有主體行為共同塑造了“穩(wěn)評”作業(yè)活動的系統(tǒng)環(huán)境,并進(jìn)一步影響關(guān)聯(lián)主體的選擇策略及行為模式。
四、結(jié)論與政策建議
我國“穩(wěn)評”制度旨在防范減緩重大事項(xiàng)發(fā)展中的社會風(fēng)險,而地方政府實(shí)施中的蒙蔽操縱行為顯然違背了制度初衷,增加了新的風(fēng)險危害。本文引入復(fù)雜性系統(tǒng)觀點(diǎn),將基層“穩(wěn)評”操縱行為形成及治理置于不同主體間互動的復(fù)雜系統(tǒng)來研究,運(yùn)用進(jìn)化博弈論和Agent仿真工具對基層“穩(wěn)評”實(shí)施中操縱行為的生成演化進(jìn)行分析。研究結(jié)果表明:(1)地方政府“穩(wěn)評”操縱行為的形成是執(zhí)行機(jī)構(gòu)、“穩(wěn)評”主管部門以及社會群體的動態(tài)交互過程,其行為選擇受到環(huán)境因素變化影響。(2)在有限理性條件下,不同群體行動的博弈支付矩陣、監(jiān)督參與程度及懲戒機(jī)制對于基層“穩(wěn)評”操縱行為的形成產(chǎn)生密切關(guān)聯(lián),而“操縱-監(jiān)督參與”框架下運(yùn)行成本的變化,將會改變基層“穩(wěn)評”操縱行為發(fā)生的約束條件和個體預(yù)期。為此,本研究擬提出如下政策建議:
第一,要加大地方基層部門“穩(wěn)評”執(zhí)行中欺騙性操縱的政治問責(zé)及懲戒力度,包括物質(zhì)層面、行政層面、聲譽(yù)層面的嚴(yán)厲處罰,提高制度違規(guī)的機(jī)會成本,減少基層組織機(jī)構(gòu)的“違規(guī)收益”,在行政系統(tǒng)內(nèi)部形成良性的學(xué)習(xí)擴(kuò)散效應(yīng)。同時,積極推動基層“穩(wěn)評”活動信息公開和評估報告專業(yè)性審查,探索引入跨部門異體督查形式,拓展新型社會參與渠道(如互聯(lián)網(wǎng)、社交媒體、第三方評估),改變行為主體策略選擇的同體監(jiān)督關(guān)系。
第二,要強(qiáng)化地方“穩(wěn)評”制度實(shí)施的系統(tǒng)支持。本文研究結(jié)論表明,當(dāng)基層政府執(zhí)行機(jī)構(gòu)遵循并嚴(yán)格履行“穩(wěn)評”制度程序,堅持“不操縱”策略獲得的綜合收益大于由此付出成本,并得到來自行政組織有力支持時,將會抑制“操縱”行為的主觀動機(jī),該群體最終會傾向“不操縱”的行動策略。因此,“穩(wěn)評”主管機(jī)構(gòu)(以地方“維穩(wěn)辦”為主)應(yīng)注重宣傳樹立典型,促進(jìn)“穩(wěn)評”制度正面效應(yīng)的擴(kuò)散發(fā)揮,擴(kuò)大配套資源保障、行政物質(zhì)激勵等支持,幫助基層部門更好地開展“穩(wěn)評”工作,降低“不操縱”行為成本付出,進(jìn)而減少操縱行為的發(fā)生。
第三,要優(yōu)化地方“穩(wěn)評”實(shí)施的監(jiān)督參與環(huán)境。本文研究發(fā)現(xiàn),主管部門及外部社會力量在“穩(wěn)評”工作中的監(jiān)督參與成本過高,也會影響內(nèi)外監(jiān)督參與力量的實(shí)際效能,進(jìn)而給蒙蔽性操縱行為的發(fā)生提供便利。為此,應(yīng)當(dāng)注重搭建多層次的“穩(wěn)評”監(jiān)督參與空間,提供包括法制、組織、信息在內(nèi)的堅實(shí)支撐保障,拓展疏通督導(dǎo)渠道。針對目前不少地區(qū)“穩(wěn)評”實(shí)際操作中關(guān)鍵信息披露的不足,應(yīng)當(dāng)不斷完善細(xì)化“穩(wěn)評”制度實(shí)施規(guī)則,借助新型媒介創(chuàng)新發(fā)展社會組織及公眾參與,豐富外部社會公眾監(jiān)督形式和內(nèi)容,增加對地方政府機(jī)構(gòu)的監(jiān)管約束力,通過行政系統(tǒng)內(nèi)外協(xié)同用力,降低基層組織“穩(wěn)評”操縱行為的發(fā)生概率。
(責(zé)任編輯:瀟湘子)