俞 樂,周洪濤,曾 偉
(華中科技大學(xué) 自動化學(xué)院,湖北 武漢430074)
作為經(jīng)濟社會的一個頑疾,合謀存在于人類社會發(fā)展的各個階段、各個領(lǐng)域[1]。針對建設(shè)領(lǐng)域合謀腐敗現(xiàn)象,學(xué)者多采取經(jīng)濟學(xué)領(lǐng)域委托代理模型與博弈模型相結(jié)合的研究模式。LAFFONT 運用博弈模型和不完全契約分析了組織行為,建立了監(jiān)管人、委托人和代理人三方博弈模型[2]。余曉鐘等建立了業(yè)主、承包商和監(jiān)理方三方合謀靜態(tài)博弈模型,在模型分析的基礎(chǔ)上提出了加大監(jiān)督力度、合謀懲罰力度、完善信用體系和降低信息不對稱等防治合謀的方法[3]。陳贅等建立了博弈的不完全信息動態(tài)博弈模型,得出了合謀條件及防范機制[4]。KREPS 在重復(fù)博弈分析下得出多次重復(fù)博弈更有可能出現(xiàn)群體合謀腐敗的結(jié)論。烏云娜等針對合謀人并非完全理性,提出用前景理論刻畫合謀人在合謀過程中的不同風(fēng)險態(tài)度,更準(zhǔn)確地解釋了合謀人對不確定的收益和損失所產(chǎn)生的不同心理效應(yīng)[5]。上述研究多為一次性博弈,而建設(shè)項目施工周期長,行為人有可能在不同的子項目中多次相遇,即存在多次博弈。并且當(dāng)前研究多利用演化博弈理論刻畫工程招投標(biāo)中圍標(biāo)行為的防范[6],工程質(zhì)量合謀行為防范研究鮮有所見。因此,筆者將前景理論與演化博弈相結(jié)合,改善原有的博弈模型假設(shè),并對博弈模型進行系統(tǒng)動力學(xué)仿真驗證。通過仿真分析可行的防合謀機制,使政府工程項目監(jiān)管博弈模型更具實際運用價值。
假設(shè)1 博弈中只存在3 類群體:政府項目投資人、監(jiān)理方和承包商,后兩者組成合謀體。政府行動集是{打擊合謀,不打擊合謀}。監(jiān)理方和承包商的行動集均為{合謀,不合謀},監(jiān)理方合謀是為了自身利益向承包商尋租,有意疏于對承包商施工行為的監(jiān)管;承包商合謀是為了追求最大的經(jīng)濟利益,通過向監(jiān)理方行賄達到隱藏自身努力程度的目的。
假設(shè)2 博弈群體中個體均為有限理性的行為人,做決策時基于自身對策略價值的感知而非實際效用情況,且這種感知價值的特征符合累計前景理論,即具有收益滿足V=Σiπ(pi)v(Δwi),其中,pi為事件i發(fā)生的客觀概率;Δwi為事件i發(fā)生后參與者所得的實際收益與參照點的差[7];v(Δwi)為參與者對于Δwi的主觀價值函數(shù);決策權(quán)重π(pi)為參與者的主觀概率,其是客觀概率的函數(shù)。行為人對既定的收入或損失(不存在風(fēng)險)不存在心理效應(yīng)的偏差,不用v(x)收益函數(shù)表示;而行為人對于合謀所導(dǎo)致的收入或損失的不確定性才存在心理效應(yīng)v(x)(如合謀時的額外收益、意外懲罰或未知的獎勵)。
政府和監(jiān)理方博弈是不完全信息模型。假設(shè)只有監(jiān)管且打擊成功與否對于合謀方有心理效用,政府打擊成功的概率為α。合謀方對政府打擊力度抱有僥幸心理,是前景理論主觀概率形成的原因,合謀方主觀認(rèn)為打擊成功的概率為π(α)。
假設(shè)3 模型參數(shù)假設(shè)。政府實行代建制項目的社會收益為Vg,對項目監(jiān)管查處成本為Cg,政府對監(jiān)理和承包商的監(jiān)管強度即懲罰系數(shù)分別為Ks和Kc。監(jiān)理方合法收入為Vs,從承包商抽得的不法額外收益為Rc,合謀被打擊后的懲罰為KsRc。承包商的合法收入為Vs,因合謀壓縮的額外收益為RTc,合謀被打擊后的懲罰為KcRTc。Hs表示因項目提前竣工或節(jié)余資金等國家給予監(jiān)理方的獎勵。Fs表示合謀發(fā)生并被成功查處后監(jiān)理方遭受的名譽損失。引入質(zhì)量安全風(fēng)險成本,監(jiān)理方與承包商的安全風(fēng)險成本線性相關(guān),即若承包商承擔(dān)的安全風(fēng)險成本為L,則監(jiān)理方承擔(dān)的安全風(fēng)險成本為kL,k為風(fēng)險傳遞系數(shù)。
根據(jù)模型假設(shè)及相關(guān)博弈分析理論,假設(shè)政府是否監(jiān)管不再對合謀雙方有心理效用,只有打擊成功與否對合謀方有心理效用,政府選擇打擊合謀的比例為y,選擇不打擊合謀的比例為1 -y;監(jiān)理方選擇與承包商合謀的比例為x,選擇不合謀的比例為1 -x。政府與監(jiān)理方博弈收益矩陣如表1 所示。
表1 政府、監(jiān)理博弈收益矩陣
政府打擊合謀失敗的損失為:
政府打擊合謀成功的收入為:)
由表1 可知,監(jiān)理選擇與承包商合謀的期望收益Us1,選擇不合謀的期望收益Us2,平均收益Us,復(fù)制動態(tài)方程F(x)分別為:
同理,政府選擇打擊合謀的收益Ug1,選擇不打擊合謀的收益Ug2,平均收益Ug,復(fù)制動態(tài)方程F(y)分別為:
令(F(x),F(xiàn)(y))= (0,0),得到該復(fù)制動態(tài)系統(tǒng)有5 個均衡點,分別為:E1(0,0),E2(0,1),E3(1,0),E4(1,1),E5(x*,y*)(E5(Cg/π(α)vg,-Rc/π(α)vs),其中vs=v(-KsRc)+v(-Fs)+v(-kL)-Rc-v(Hs),vg=RT+RT')。但這些系統(tǒng)均衡點不一定滿足演化博弈穩(wěn)定策略,需根據(jù)每個均衡狀態(tài)的具體情況加以判斷[8]。筆者根據(jù)FRIEDMAN 提出的方法[9],一個由微分方程描述的群體動態(tài)均衡點的穩(wěn)定性可由該系統(tǒng)的雅克比矩陣的局部穩(wěn)定性分析得到。因此,分別對式(8)和式(12)求x、y的偏導(dǎo)數(shù),可得雅克比矩陣:
矩陣的行列式detj和跡trj分別為:
演化穩(wěn)定策略(ESS)的判定,可以用均衡點的雅克比矩陣的行列式detj及trj的符號判斷。對于離散系統(tǒng),當(dāng)且僅當(dāng)detj>0 且trj<0 時,該均衡點是穩(wěn)定的。因此上述5 個平衡點的穩(wěn)定性受π(α)vg-Cg和Rc+π(α)vs大小的影響,分別計算各點的detj及trj,共4 種情況:
(1)π(α)vg-Cg>0 且Rc+π(α)vs>0 時,E1、E3是鞍點,E2不穩(wěn)定,E4是ESS;
(2)π(α)vg-Cg>0 且Rc+π(α)vs<0 時,E1、E2、E3、E4均是鞍點,E5是中心點,沒有ESS;
(3)π(α)vg-Cg<0 且Rc+π(α)vs>0 時,E1、E4是鞍點,E2不穩(wěn)定,E3是ESS;
(4)π(α)vg-Cg<0 且Rc+π(α)vs<0 時,E1、E2是鞍點,E4不穩(wěn)定,E3是ESS。
綜上所述,演化博弈的每一個平衡點都不是滿足一般情況的ESS。但是,在某些特定狀況下存在ESS:①當(dāng)π(α)vg-Cg<0,即π(α)<Cg/vg時,E3是ESS;②當(dāng)π(α)vg-Cg>0 且Rc+π(α)·vs>0,即Cg/vg<π(α)<-Rc/vs時,E4是ESS。
用VesimPLE6.3 建立工程防合謀演化博弈SD 模型,主要由4 個流位、2 個流率、22 個中間變量,以及11 個外部變量組成,如圖1 所示。
圖1 工程防合謀演化博弈SD 模型
假設(shè)起始時間為0,終止時間為5 000,時間間隔為0.25,以某代建項目為例,政府收益Vg=10,政府打擊合謀成本Cg= 0.5,監(jiān)理方代建費為總效益的2%,節(jié)余獎勵為節(jié)余金額的30%。則監(jiān)理方合法收益Vs=2,監(jiān)理方合謀額外收益Rc= 0.5,承包商合謀額外收益RTc= 0.2,獎勵Hs= 0.06。筆者設(shè)定對監(jiān)理方的懲罰系數(shù)Ks和對承包商的懲罰系數(shù)Kc都為3,合謀名譽損失Fs=4,監(jiān)理方質(zhì)量安全成本kL=0.05。
依據(jù)以上外部變量取值,vs= -10.37,vg=2.8,E5(0.17/π(α),0.05/π(α)),取邊際遞減敏感性程度系數(shù)α 為0.88,厭惡損失效應(yīng)程度λ為2,v(x)測算公式為[10]:
2.2.1 π(α)<Cg/vg時演化過程仿真
(1)博弈雙方初始戰(zhàn)略均采用Nash 均衡純策略。取π(α)<Cg/vg=0.1,博弈雙方初始均采用Nash 均衡E1(0,0),E2(0,1),E3(1,0),E4(1,1),輸入純戰(zhàn)略Nash 作為初始值進行模擬,雙方演化過程如圖2 和圖3 所示。
圖2 監(jiān)理初始值為均衡狀態(tài)
圖3 政府初始值為均衡狀態(tài)
對于E1和E4,當(dāng)監(jiān)理方總是不選擇與承包商合謀時,政府業(yè)主方的最佳決策是不監(jiān)管打擊;當(dāng)監(jiān)理方總是選擇與承包商合謀時,政府業(yè)主方的最佳決策是采取監(jiān)管進行打擊。但是對于E2和E3卻是監(jiān)理方選擇不合謀,政府反而總采取打擊措施;而監(jiān)理方與承包商合謀時,政府反而不進行監(jiān)管打擊,導(dǎo)致自身利益受損。E2和E3可以理解為沒有任何個體采用新的不同策略,即沒有新策略供個體進行學(xué)習(xí)改進,因此也能處于一定的穩(wěn)定狀態(tài)。
進一步分析可知,E1有微小突變(0.2,0),會迅速演變到E3狀態(tài)達到穩(wěn)定;E2突變(0.2,1),系統(tǒng)將迅速穩(wěn)定到E4狀態(tài);E4突變(1,0.99),也將迅速演化到E3狀態(tài)穩(wěn)定下來;E3突變(1,0.1)仍能演化到E3(1,0)穩(wěn)定下來。E4和E3突變演化圖如圖4 和圖5 所示。
(2)博弈雙方初始戰(zhàn)略均采用混合策略。當(dāng)博弈雙方采取混合戰(zhàn)略如x=0.2,y=0.4 時,也會迅速演化到E3(1,0)狀態(tài),即監(jiān)理方選擇合謀,而政府卻不打擊。演化過程如圖6 所示。
由上述分析可知,在行為人對不確定得失的主觀概率π(α)<Cg/vg時,E3(1,0)狀態(tài)是演化穩(wěn)定策略,這種穩(wěn)定狀態(tài)很難被打破。即當(dāng)監(jiān)理方主觀判斷政府打擊成功概率小于一定值時,監(jiān)理方會選擇合謀,政府也會漸漸因利益原因選擇不打擊合謀,該情況不利于政府項目的質(zhì)量安全。
2.2.2Cg/vg<π(α)<Rc/vs時演化過程仿真
為滿足Cg/vg<π(α)<Rc/vs,需重新取值,令Vg=3,Cg=0.01,Vs=0.6,Rc=0.4,RTc=0.2,Hs=0.045,Ks=Kc=2,F(xiàn)s=1,kL=0.03。此時Cg/vg=0.05,-Rc/vs=0.1,取π(α)=0.07。
(1)博弈雙方初始戰(zhàn)略均采用Nash 均衡純策略。在Cg/vg<π(α)<-Rc/vs的情況下,對各個穩(wěn)定狀態(tài)的演化過程和發(fā)生微小突變的演化過程圖進行對比,發(fā)現(xiàn)E1在微小突變(0.1,0)下,會穩(wěn)定到E3(1,0)狀態(tài);E2突變(0.1,1)會穩(wěn)定到E4(1,1)狀態(tài);E3突變(1,0.1)也會穩(wěn)定到E4(1,1)狀態(tài);E4(1,0.9)突變穩(wěn)定到E4(1,1)。E2和E4的突變演化過程圖如圖7 和圖8 所示。
圖4 E4 狀態(tài)在x=1,y=0.99 的突變
圖5 E3 狀態(tài)在x=1,y=0.1 的突變
圖6 初始狀態(tài)混合戰(zhàn)略x=0.2,y=0.4 的突變
圖7 初始E2(0.1,1)突變到E4(1,1)
圖8 初始E4(1,0.9)突變到E4(1,1)
(2)一般情況初始值。博弈雙方初始時采取x=0.2,y=0.4 的一般戰(zhàn)略,演化過程如圖9 所示。混合戰(zhàn)略(0.2,0.4)會迅速演變到E4(1,1)狀態(tài)。
這證明了行為人不確定得失的主觀概率Cg/vg<π(α)<-Rc/vs時,E4(1,1)狀態(tài)是演化穩(wěn)定策略,該穩(wěn)定狀態(tài)很難被打破。即當(dāng)監(jiān)理方主觀判斷政府打擊合謀成功的概率在一定范圍時,監(jiān)理方會選擇合謀,政府也會選擇打擊合謀。
但是從數(shù)據(jù)選取和π(α)的取值范圍可知,這種情況是較難出現(xiàn)的,政府對于高風(fēng)險追求的監(jiān)理方,為避免出現(xiàn)(合謀,不打擊)不利狀況,必須采取打擊策略,使演化能穩(wěn)定到(合謀,打擊)的狀態(tài)。
圖9 初始狀態(tài)混合策略(0.2,0.4)穩(wěn)定到E4(1,1)
2.2.3 π(α)vg-Cg>0 且Rc+π(α)vs<0 時演化過程仿真
(1)混合戰(zhàn)略Nash 演化仿真。用第一組數(shù)據(jù),取π(α)>Cg/vg=0.3,在該情況下有E5(0.6,0.15)。仿真結(jié)果證明E1、E2、E3、E4都不是穩(wěn)定狀態(tài),微小突變會使它們互相演變。E5的演化過程如圖10 所示,在2π(α)vg-Cg>0 且Rc+π(α)vs<0 時,E5是中心點,此時不存在穩(wěn)定點。
圖10 初始狀態(tài)E5(0.6,0.15)和混合狀態(tài)(0.6,0.7)對比
由圖10 可知,當(dāng)博弈一方選擇混合戰(zhàn)略Nash 均衡,另一方隨機選擇,隨著時間和博弈次數(shù)的增加,雙方策略的變更波動大且極不易控制。
(2)動態(tài)懲罰機制的改良演化。針對沒有穩(wěn)定點并且波動難以控制的狀況,筆者引進動態(tài)懲罰機制進行改良。合謀比例x表示合謀導(dǎo)致的工程安全風(fēng)險嚴(yán)重程度,則安全風(fēng)險嚴(yán)重程度越高,政府打擊成功后的懲罰力度成比例增加。加入動態(tài)懲罰Ks=Kc=3x后的演化過程如圖11 所示。由圖11 可知,一定程度上的加大懲罰力度基數(shù)或減小打擊成本能有效降低監(jiān)理方合謀率。
圖11 動態(tài)懲罰改良后的演化過程
(1)差異化監(jiān)管威懾機制。政府要實時了解監(jiān)理行業(yè)現(xiàn)狀,監(jiān)理方風(fēng)險態(tài)度,對監(jiān)理方進行分類,有針對性地進行監(jiān)管。對于π(α)較低的監(jiān)理方,為避免出現(xiàn)(合謀,不打擊)的演化穩(wěn)定結(jié)果,在π(α)<Cg/vg時,政府應(yīng)加大監(jiān)管和打擊力度;對于π(α)較高的監(jiān)理方,可在一定程度上壓縮監(jiān)管成本,使其能出現(xiàn)3π(α)vg-Cg>0 且Rc+π(α)vs<0 時較穩(wěn)定且合謀概率較低的狀態(tài),壓縮的成本還可用于監(jiān)管π(α)較低的監(jiān)理方。
(2)科學(xué)的懲罰機制。科學(xué)的懲罰機制能在合理的范圍內(nèi)加大懲罰力度(倍數(shù))來抑制合謀的同時,也能避免長期演化的波動性。從合謀防治長效機制角度來看,有效結(jié)合動態(tài)懲罰政策,即懲罰力度隨合謀導(dǎo)致的工程安全風(fēng)險程度不同而變化,有利于達到穩(wěn)定控制合謀的目的。
(3)監(jiān)管成本控制。通過施工現(xiàn)場監(jiān)控、人員定位等手段使施工現(xiàn)場透明化,監(jiān)理方和承包商的行為均在一定監(jiān)控范圍內(nèi),承包商隱瞞努力程度的信息不對稱無法形成,合謀便無法達到。另外組織監(jiān)理方、承包商參觀政府監(jiān)控安全中心,宣傳合謀懲罰條例和處罰實例,讓合謀方體驗到政府的打擊能力和懲罰的嚴(yán)厲性,有助于提高監(jiān)理方π(α),且達到威懾作用。
(4)健全行業(yè)名譽體系,加強社會監(jiān)督。政府應(yīng)積極依法制定監(jiān)理行業(yè)信譽評價體系,客觀評價監(jiān)理行業(yè)水準(zhǔn)。良好的信譽體系能讓政府清晰地了解監(jiān)理行業(yè)現(xiàn)狀,將信譽較低甚至合謀多次的監(jiān)理方納入行業(yè)黑名單,無論私有或是政府項目都不與其簽訂代理合約,這種信譽低的監(jiān)理方也必將被行業(yè)淘汰。
[1] 羅建兵.合謀的生成與制衡:理論分析與來自東亞的數(shù)據(jù)[D].上海:復(fù)旦大學(xué)圖書館,2006.
[2] 樂云,單明. 建設(shè)工程領(lǐng)域工程合謀現(xiàn)象研究綜述[J].工業(yè)技術(shù)經(jīng)濟,2013,1(1):145 -151.
[3] 余曉鐘,張煥杰.政府工程項目業(yè)主、承包商和監(jiān)理方的合謀博弈分析[J]. 經(jīng)濟問題探索,2008(11):86 -92.
[4] 陳贅,劉肇城. 公共工程項目主體合謀條件的動態(tài)博弈分析[J].公路與汽車,2006(6):104 -105.
[5] 烏云娜,楊益晟,馮天天,等.基于前景理論的政府投資代建項目合謀監(jiān)管威懾模型研究[J]. 管理工程學(xué)報,2013,1(2):168 -176.
[6] 范如國,李丹.基于演化博弈的工程投標(biāo)中的圍標(biāo)行為及對策分析[J].價值工程,2011,30(1):64-66.
[7] 周國華,張羽,李延華,等.基于前景理論的施工安全管理行為演化博弈[J]. 系統(tǒng)管理學(xué)報,2012,7(4):501 -508.
[8] 易余胤,盛昭瀚,肖條軍.合作研發(fā)中機會主義行為的演化博弈分析[J].管理科學(xué)學(xué)報,2005,8(4):80-87.
[9] FRIEDMAN D.On economic applications of evolutionary game theory[J].Journal of Evolutionary Economics,1998(8):15 -43.
[10] 賈璐. 基于SD 工程建設(shè)安全監(jiān)管煙花博弈研究[J].南昌大學(xué)學(xué)報:工科版,2012,3(1):42 -48.