劉德海,鮑雪言,王謝寧
(1.東北財經(jīng)大學(xué)管理科學(xué)與工程學(xué)院,遼寧 大連 116025;2. 東北財經(jīng)大學(xué)經(jīng)濟計量分析與預(yù)測研究中心,遼寧 大連 116025)
恐怖襲擊事件中悲觀/樂觀情緒如何影響博弈均衡結(jié)果
劉德海1,2,鮑雪言2,王謝寧1
(1.東北財經(jīng)大學(xué)管理科學(xué)與工程學(xué)院,遼寧 大連 116025;2. 東北財經(jīng)大學(xué)經(jīng)濟計量分析與預(yù)測研究中心,遼寧 大連 116025)
恐怖襲擊事件對人類社會的文明底線構(gòu)成了嚴峻挑戰(zhàn)。無論恐怖分子還是政府反恐力量,雙方均具有非常明顯的情境決策、甚至非理性決策的特征。本文基于等級依賴期望效用理論,分析了恐怖分子和政府反恐力量對于事態(tài)發(fā)生的主觀概率具有樂觀或者悲觀預(yù)期時,情緒因素對于傳統(tǒng)博弈均衡結(jié)果的影響,以及該理論結(jié)果對于完善反恐措施的管理含義。研究結(jié)果表明,當僅有某一方存在著樂觀或者悲觀情緒時,能夠準確地研判事態(tài)發(fā)生概率的對手將調(diào)整選擇策略的均衡概率,即任何一方的情緒因素都將影響到對手的策略選擇。當雙方都存在著情緒因素時,存在樂觀情緒的恐怖分子更加傾向于采取非理性的冒險行動,從而造成事態(tài)均衡結(jié)果具有更大的不確定性。因此,反恐中需要加強情報工作從而準確研判暴恐分子心理狀態(tài)。
恐怖事件;等級依賴期望效用模型;情緒;政府和恐怖分子;悲觀和樂觀
當前恐怖主義成為各國政府和學(xué)術(shù)界關(guān)注的熱點問題。澳大利亞智庫“經(jīng)濟與和平研究所”(Institute for Economics and Peace)最新公布的統(tǒng)計數(shù)據(jù)顯示,2013年全球范圍內(nèi)發(fā)生的恐怖襲擊事件達到了1萬起,較2000年1500起增加了數(shù)倍[1]。近幾年亞洲成為恐怖分子襲擊高發(fā)地。從近幾年恐怖襲擊的態(tài)勢來看,恐怖組織手法越來越多樣化,“基地”和IS等恐怖組織呈現(xiàn)網(wǎng)絡(luò)發(fā)展趨勢,恐怖組織的戰(zhàn)略思維能力和協(xié)同執(zhí)行能力不斷上升,襲擊目標從政府機關(guān)和標志性建筑轉(zhuǎn)向普通民眾。如何有效地開展反恐斗爭已是各國政府亟待解決的問題。
關(guān)于反恐問題博弈分析的現(xiàn)有文獻中,主要是針對政府反恐策略和恐怖分子策略進行研究,比如,恐怖分子的社會網(wǎng)絡(luò)分析[2-3],反恐資源調(diào)度優(yōu)化[4-6],恐怖主義產(chǎn)生的社會經(jīng)濟根源[7],政府預(yù)警措施的優(yōu)化策略[8]。上述文獻均在傳統(tǒng)博弈的分析框架下,恐怖分子與政府反恐力量均為完全理性的參與者,尚未考慮到恐怖分子的非理性行為,以及博弈雙方存在的認知差異[9]。近十年來,博弈論基礎(chǔ)理論圍繞著參與者有限理性和非理性的基本假設(shè)加以擴展,涌現(xiàn)了一些新興的分支領(lǐng)域。其中,Quiggin提出的等級依賴期望效用(Rank-Dependent Expected Utility, 簡記為RDEU)[10]擴展了經(jīng)典的期望效用理論。經(jīng)典的Von Neumann 和Morgenstern期望效用理論(Expected Utility Theory)該理論假設(shè)概率是線性的,即滿足獨立性原則[11]。但是,阿萊悖論等大量實驗經(jīng)濟學(xué)研究發(fā)現(xiàn)[12],期望效用理論的基本假設(shè)與現(xiàn)實中決策行為并不完全一致,傳統(tǒng)的期望效應(yīng)理論并不能刻畫在不確定條件下(比如情緒因素)參與者對風(fēng)險和收益滿足程度。等級依賴期望效用模型考慮了參與者的情緒(悲觀、樂觀)對風(fēng)險和收益影響,認為決策的權(quán)重不僅僅依賴于局中人已知每種結(jié)果的概率,還應(yīng)依賴于局中人對這些結(jié)果的情緒因素[13]。一些學(xué)者運用等級依賴期望效用理論分析了經(jīng)典的鷹鴿博弈模型納什解的存在性條件,顯示了不同情緒類型的局中人博弈導(dǎo)致出現(xiàn)新的Nash均衡解[14]??紤]到突發(fā)事件中當事者較強的非理性情緒因素,一些學(xué)者分別運用等級依賴期望效用理論分析了情緒因素對于群體性突發(fā)事件的均衡結(jié)果影響[15-16]。
在世界各國恐怖襲擊事件的防御與處置過程中,不僅恐怖分子存在著實施攻擊前過于樂觀的冒險行為、在世界各國嚴厲打擊下轉(zhuǎn)為悲觀失望開始自首等各種情緒,各國反恐力量也不僅存在著對于反恐嚴峻性估計不足的過于樂觀態(tài)度,而且還存在著面對各種新形態(tài)的恐怖主義蔓延和肆虐出現(xiàn)了“新悲觀主義”的焦慮和惶恐情緒[17]。本文首先在傳統(tǒng)博弈框架下建立了政府反恐力量和恐怖分子的博弈模型并分析混合Nash均衡;然后分別考慮了雙方不同情境下的情緒因素,即單方或者雙方,悲觀或者樂觀,對于恐怖襲擊博弈的均衡結(jié)果影響。本文研究表明,政府反恐力量和恐怖分子的情緒因素對于暴恐事件雙方的決策行為產(chǎn)生復(fù)雜而重大的影響。反恐斗爭中政府反恐力量需要加強情報搜集、信息分析工作,準確把握暴恐分子的心理狀態(tài),從而制定出最優(yōu)的防御/打擊決策。
根據(jù)Quiggin[10]的等級依賴期望效用理論,本文給出如下定義。
定義1:對于隨機變量X={xi;i=1,2,…,n},X取xi的概率P{X=xi}=pi,對各個xi排序并規(guī)定x1>x2>…>xn,定義xi的效用等級(Rank position)記為RPi,作為其分布函數(shù):
RPi=P{X≤xi}=pi+pi+1,i=1,2,…,n
(1)
直觀上,xi的等級越高,不超過xi發(fā)生的概率就越大,xi在決策中占的權(quán)重就越大。
定義2:等級依賴期望效用模型是指偏好序“?”可以用由效用函數(shù)u和情緒函數(shù)ω定義的實值函數(shù)V來表示,即對隨機變量X、Y,有:X?Y?V(X,u,ω) ?V(Y,u,ω)[12]。在一個風(fēng)險結(jié)構(gòu){p1,x1,…,pn,xn}中,等級依賴期望效用模型表示為:
π(xi)=ω(p1+p2+…+pi)-ω(p1+p2+…+pi-1)
(2)
根據(jù)(1)和(2)式,可以得到:
π(xi)=ω(pi+1-RPi)-ω(1-RPi)
(3)
其中,π(xi)是決定權(quán)重的函數(shù),其中π(x1)=ω(p1),情緒函數(shù)ω(·)滿足ω(0)=0,ω(1)=1的單調(diào)增函數(shù)。當且僅當ω是凸函數(shù)時,π(xi)關(guān)于效用等級RPi是單調(diào)遞減的;當且僅當ω是凹函數(shù)時,π(xi)關(guān)于效用等級RPi是單調(diào)遞增的。
3.1恐怖分子與政府反恐力量的傳統(tǒng)博弈模型
考慮恐怖分子與恐怖反恐力量同時行動(或者先后行動但是彼此觀察不到)問題,本文建立了表1所示的反恐問題傳統(tǒng)博弈模型。其中,c1表示政府防御的成本,c2表示恐怖分子襲擊的成本。a表示政府防御的收益,一般來說,a>c1。f表示政府反恐力量進行有效防御后恐怖分子遭受的損失。e表示恐怖分子襲擊成功后獲得的收益,一般來說,e>c2,f>e。b表示政府遭受恐怖襲擊造成的損失,其絕對值大于政府防御的成本,b>c1。上述參數(shù)取值范圍均為非負。
表1 恐怖分子與政府反恐力量的傳統(tǒng)博弈模型
上述傳統(tǒng)博弈模型僅存在著唯一的混合策略納什均衡解,即政府反恐力量與暴恐分子均以一定的概率進行防御或發(fā)動暴恐襲擊。由于整個社會完全轉(zhuǎn)入反恐戰(zhàn)爭的戰(zhàn)時狀態(tài)需要付出高昂的成本代價,因此政府反恐力量僅能以一定的概率有選擇性地采取機動靈活的防御措施。另一方面,暴恐分子在政府和整個社會的嚴厲打擊下轉(zhuǎn)換襲擊的手段和目標,甚至可能轉(zhuǎn)入潛伏狀態(tài)。此時,混合均衡結(jié)果意味著反恐斗爭面臨著“貓捉老鼠”的長期化和復(fù)雜性趨勢。
假設(shè)政府采取防御的概率為p,其中p∈(0,1),恐怖分子襲擊的概率設(shè)為q,q∈(0,1)。根據(jù)收益函數(shù)可以計算混合策略Nash均衡解的均衡概率為:
p*=(e-c2)/(e+f),q*=c1/(a+b)
在世界各國恐怖襲擊事件的防御與處置過程中,由于事態(tài)的突發(fā)性和震撼性,恐怖分子和政府反恐力量雙方均可能存在著較為強烈的樂觀或者悲觀情緒。例如,911事件后十余年內(nèi)“基地”組織沒有成功在美國本土進行恐怖主義活動、2011年美國成功擊斃本拉丹、美國實施阿富汗撤軍計劃等事件反映了美國對于持續(xù)十余年反恐戰(zhàn)爭的樂觀情緒。但是,2015年法國巴黎連環(huán)恐怖襲擊事件凸顯了國際反恐形勢依然嚴峻,反恐斗爭面臨著長期化、復(fù)雜化和艱巨化,一些學(xué)者和機構(gòu)對于完全消除恐怖主義深感悲觀[17]。顯然,上述樂觀或悲觀情緒直接導(dǎo)致政府部門選擇了不同的反恐策略。
為了從理論上進一步剖析恐怖分子和政府反恐力量雙方情緒因素對于事態(tài)發(fā)展結(jié)果的影響,本文運用等級依賴期望效用理論,擴展了雙方的效用函數(shù)形式。不同的情緒因素將對參與者關(guān)于事件發(fā)生的主觀概率造成一定的偏差,其中,對于樂觀情緒將賦予事件更大的發(fā)生概率,對于悲觀情緒將賦予事件較低的發(fā)生概率。因此,受到情緒因素影響的主觀概率函數(shù)表示為:ω(pi)=pir,其中,pi為事件xi發(fā)生的客觀概率,pi∈[0,1]。根據(jù)客觀概率的取值范圍,當ri=1時,局中人不帶有情緒;當ri<1時主觀高估了發(fā)生概率,稱其為“樂觀”情緒。根據(jù)(2)式可知,該事件在效用函數(shù)中所占權(quán)重將降低;當ri>1時主觀低估了發(fā)生概率,稱其為“悲觀”情緒。同理,該事件在效用函數(shù)中所占權(quán)重將上升。具體如圖1所示,圖中縱軸表示概率累計分布,即情緒函數(shù)ω;凹曲線表示悲觀情緒下將低估事件的發(fā)生概率。對于事件xi,悲觀情緒下其在效用函數(shù)中所占權(quán)重π(xi)將大于中性(不帶有情緒)情境下所占權(quán)重△pi。
圖1 悲觀情緒下事件xi在效用函數(shù)中所占權(quán)重的示意圖
3.2恐怖分子與政府的等級依賴期望效用模型
根據(jù)表1所示的傳統(tǒng)博弈支付矩陣,可以得出政府反恐力量采取各種策略獲得的效用按照從大到小排序:a-c1>0>-c1>-b,即效用等級或者秩位。根據(jù)定義(1)、(2)和(3),可以分別計算出政府反恐力量的效用等級和決策權(quán)重,具體如表2所示。
表2 考慮情緒的政府等級依賴期望效用
根據(jù)公式(2),得出政府反恐力量的等級依賴期望效用模型:
Vg=(a-c1)(pq)r1+(b-c1)(1-q+pq)r1+c1(1-p-q+2pq)r1-b
(4)
同理,根據(jù)表1傳統(tǒng)博弈的支付矩陣,得出恐怖分子采取各種策略獲得效用的從大到小排列:e-c2>0>-f-c2。
恐怖分子的等級依賴期望效用模型:
Va=(e-c2)(q-pq)r2+(-f-c2)[1-(1-pq)r2]
(5)
表3 考慮情緒的恐怖分子等級依賴期望效用
根據(jù)考慮情緒因素的等級依賴效用函數(shù)(4)和(5),分別對雙方行動概率p和q求偏導(dǎo)并令偏導(dǎo)為0,納什均衡解的存在性取決于該方程組解的存在性:
(6)
(7)
4.1情境1:恐怖分子處于樂觀或悲觀情緒
當政府反恐力量處于冷靜研判并準確預(yù)期的狀態(tài)時,r1=1。但是,暴恐分子在宗教極端思潮的裹挾下,其對于襲擊行動處于狂熱的過度樂觀情緒;或者在政府反恐力量的強大震懾下開始悲觀失望,即r2≠1。分析該種情境下恐怖分子情緒因素對于表1傳統(tǒng)博弈均衡結(jié)果的影響。
首先,將r1=1代入政府反恐力量的等級依賴期望效用(6)式,可得恐怖分子襲擊的均衡概率:q*=c1/(a+b)。
其次,把q*=c1/(a+b)代入恐怖分子的等級依賴期望效用(7)式,得到:
(8)
通過求解上述方程,可以得到政府反恐力量的混合策略Nash均衡解p*。
(9)
(10)
分析該結(jié)果,當政府處于冷靜研判狀態(tài)并被恐怖分子感知時,暴恐分子的最優(yōu)襲擊策略不變。但是,當暴恐分子存在著情緒因素后,或者在極端宗教思潮裹挾下產(chǎn)生樂觀情緒,或者在政府嚴厲打擊下產(chǎn)生悲觀情緒,政府反恐力量正確捕捉到這一信息后,政府將改變原先的最優(yōu)反恐決策。因此,政府反恐力量需要加大情報搜集,準確研判暴恐分子的心理狀態(tài),進而制定最優(yōu)的反恐決策。
4.2情境2:政府反恐力量處于樂觀或悲觀情緒
此時恐怖分子能夠做出準確的預(yù)期,即r2=1。但是,政府反恐力量對于反恐態(tài)勢做出了錯誤的判斷,或者處于盲目樂觀的情緒中(例如911事件后美國推行單邊主義反恐政策,發(fā)起了兩場反恐戰(zhàn)爭),或者陷入了悲觀情緒,即r1≠1。分析該種情景的均衡解。
首先,將r2=1,代入恐怖分子的等級依賴期望效用(7),可得政府反恐力量的均衡概率:p*=(e-c2)/(e+f)。由收益限制條件e>c2和f>e,可知p*=(e-c2)/(e+f)<1/2。
其次,把p*=(e-c2)/(e+f)代入政府反恐力量的等級依賴期望效用(6),得到:
(11)
可以證明,通過求解上述方程,可以得到恐怖分子的Nash均衡解q*。
(12)
對(12)式求導(dǎo),可得:
(13)
結(jié)論1:在考慮情緒因素的政府和恐怖分子的博弈過程中,如果一方處于冷靜研判并準確預(yù)期的狀態(tài),另一方行動處于過度樂觀(悲觀)的情緒情境下,博弈的原混合策略Nash均衡將發(fā)生改變:
(3)如果政府處于過度樂觀(悲觀)的情緒情境,恐怖分子處于冷靜研判并準確預(yù)期的狀態(tài)(r1≠1,r2=1),并且當恐怖分子襲擊的概率大于或等于0.5(q≥0.5)時,政府反恐力量的過分反應(yīng)將造成其行動收斂到防御策略,考慮情緒因素的反恐博弈模型原混合均衡結(jié)果轉(zhuǎn)化為純策略納什均衡結(jié)果(防御,不襲擊)。
4.3情境3:恐怖分子和政府反恐力量都處于樂觀或悲觀的情緒
在恐怖襲擊事件中,政府反恐力量和恐怖分子雙方都有可能處于極端情緒中,從而導(dǎo)致了對于事態(tài)的判斷出現(xiàn)過度樂觀(或者悲觀)的偏差,即r1≠1且r2≠1。此時,若存在p,q的值使(6)和(7)成立,則說明考慮情緒因素下反恐博弈仍存在混合策略Nash均衡解。
證明:分析政府反恐力量均衡策略p*的存在條件。為了判斷公式(7)的連續(xù)性,設(shè)右端為函數(shù)f(p)=(e-c2)(1-p)r2q(r2-1)-(f+c2)(1-pq)(r2-1)p,求導(dǎo):
(14)
由此可知公式(7)為p的單調(diào)遞減函數(shù)。
考慮到如下邊界值:
根據(jù)中值定理,可知(0,1)之間存在p=p*(r2,q),使得(7)式?Va/?q=0成立。所以,考慮恐怖分子和政府反恐力量雙方情緒因素的反恐博弈模型中,政府反恐力量的防御策略存在著唯一的混合策略Nash均衡解p=p*(r2,q)。
同理,分析恐怖分子均衡策略q*的存在條件。為了判斷公式(6)的連續(xù)性,設(shè)右端為函數(shù)g(q)=q(a-c1)(pq)(r1-1)+q(b-c1)(1-q+pq)(r1-1)+c1(2q-1)(1-p-q+2pq)(r1-1),求導(dǎo):
在上式右端中,前兩項均大于零,分析第三項取值范圍。由于(2p-1)(2q-1)∈[-1,1],(1-p-q+2pq)∈[0,1],因此第三項也大于零,即?g(q)/?q>0。由此可知公式(6)為q的單調(diào)遞增函數(shù)。
考慮如下邊界值:
根據(jù)中值定理,可知(0,1)之間存在q=q*(r1,p),使得(6)式?Vg/?p=0成立。所以,考慮恐怖分子和政府反恐力量雙方情緒因素的反恐博弈模型中,恐怖分子的襲擊策略存在著唯一的混合策略Nash均衡解q=q*(r1,p)。
結(jié)論2:考慮情緒因素的政府反恐力量和恐怖分子博弈模型中,兩個局中人都處于情緒的狀態(tài)情況下,存在著唯一的混合策略Nash均衡解(p*(r2,q),q*(r1,p))。
為了更加直觀地闡釋結(jié)論2的混合策略Nash均衡結(jié)果,下一節(jié)將結(jié)合我國新疆6.28暴恐事件的案例(該案例參見文獻18),給出相應(yīng)的數(shù)值分析。
5.1事件回顧及收益值假設(shè)
2014年6月28日中午,新疆維吾爾自治區(qū)南部和田地區(qū)發(fā)生嚴重的暴力恐怖襲擊事件,墨玉縣警方立即啟動應(yīng)急反應(yīng)機制平息事態(tài),并對嫌犯展開搜捕行動[19]。據(jù)《新疆日報》報道[20],墨玉縣7個鄉(xiāng)鎮(zhèn)180個村自發(fā)參與圍捕的群眾達3萬人以上,共同聯(lián)手摧毀暴恐團伙。自治區(qū)決定拿出3億余元獎勵所有參與近期圍捕專項行動的群眾及相關(guān)人員。先期對和田地區(qū)違捕專項行動中涌現(xiàn)出的先進集體和先進個人進行表彰獎勵,金額達423萬元。
由于恐怖襲擊事件具有無法重現(xiàn)性、社會敏感性和突發(fā)性,難以獲取相應(yīng)數(shù)據(jù),國內(nèi)外研究文獻在理論建模分析基礎(chǔ)上,普遍采取了社會仿真分析和數(shù)值分析方法[5,6,8]。結(jié)合新疆6.28暴恐事件的案例,確定表1中博弈模型收益值。其中,一些數(shù)據(jù)難以準確度量,但是作為數(shù)值分析的參考,并不影響收益函數(shù)的基本性質(zhì)和主要結(jié)論。
首先,假設(shè)有效遏制暴恐事件多發(fā)態(tài)勢的反恐收益可視為地方社會經(jīng)濟穩(wěn)定發(fā)展的紅利。根據(jù)墨玉縣人民政府辦公室發(fā)布的信息,隨著縣域經(jīng)濟的加速發(fā)展,2013年墨玉縣GDP增長3.95億元,即a=39500萬元。同理,恐怖分子發(fā)動襲擊成功將會導(dǎo)致公共安全和社會資源財富的損失,即b=39500萬元??紤]到反恐投入,除了先期獎勵423萬元以外,3萬余群眾自發(fā)參與到圍剿行動中,根據(jù)2013年新疆地區(qū)最低日工資標準121.6元, 3萬人參與圍捕專項行動的經(jīng)濟成本可設(shè)定為364.8萬元,因此,“6.28”暴恐事件當?shù)刂苯拥姆纯滞锻度霝閏1=364.8+423=787.8萬元。
其次,根據(jù)聯(lián)合國發(fā)表一份報告,2001年9·11恐怖襲擊后,恐怖分子在制造任何一次大的恐怖襲擊時,成本都沒有超過5萬美元[21]。這些恐怖襲擊包括巴厘島爆炸案、馬德里爆炸案及伊斯坦布爾大爆炸等??紤]2014年6月人民幣對美元平均匯率6.15,不妨將恐怖分子發(fā)動襲擊的成本設(shè)為c2=5×6.15=30.75萬元。
第三,我國修改后的《刑事訴訟法》增設(shè)違法所得特別沒收程序,對于恐怖活動犯罪等重大犯罪案件,犯罪嫌疑人、被告人潛逃或者死亡,應(yīng)追繳其違法所得及其他涉案財產(chǎn)。根據(jù)《中國民生發(fā)展報告2014》,2012年全國家庭凈財產(chǎn)均值為43.9萬元[22]。所以,假設(shè)恐怖分子發(fā)動襲擊行動失敗需要付出的代價為f=43.9萬元。
第四,2013年新疆維吾爾自治區(qū)本級公共安全支出52.9億元,自治區(qū)財政還對各市、州、地區(qū)另外轉(zhuǎn)移支付了45.7億元的公共安全經(jīng)費,兩項合計為98.6億元,同比增長了5.6%??植婪肿訉嵤┍┝σu擊活動的目的即是擾亂社會秩序,破壞民族團結(jié),意在達成宗教、政治或意識形態(tài)上的意圖。其發(fā)動襲擊對公共安全造成的影響雖然無法準確統(tǒng)計,但可以通過每年各地方(新疆現(xiàn)有88個縣或縣級市)用于公共安全的經(jīng)費支出進行推算。結(jié)合上面的數(shù)據(jù),可以得出如果恐怖分子在墨玉縣發(fā)動襲擊成功,那么可以設(shè)定他們獲得的收益為e = 986000×(1+5.6%)/88=11832萬元。
上述收益值滿足表1中混合均衡的存在條件:p*=(e-c2)/(e+f)=0.9937,q*=c1/(a+b)=0.00997。由于新疆“6.28”案例中參數(shù)值相差三個數(shù)量級,該混合均衡結(jié)果取值接近于純策略{防御,不襲擊}均衡結(jié)果(p*=1,q*=0)。
5.2數(shù)值分析結(jié)果
將上述數(shù)值代入(6)(7)式,得到:
?Vg/?p=r1[38712.2q(pq)(r1-1)+38712.2q(1-q+pq)(r1-1)+787.8(2q-1)(1-p-q+2pq)(r1-1)]=0
(15)
?Va/?q=r2[11801.25(1-p)r2q(r2-1)-74.65(1-pq)(r2-1)p]=0
(16)
圖2 雙方持有樂觀情緒的混合均衡
圖3 雙方持有悲觀情緒的混合均衡
若(15)、(16)式存在等于零的解,則Nash均衡存在,判斷即兩個函數(shù)是否存在著交點或者具有多個交點。相應(yīng)數(shù)值結(jié)果如圖2-5所示。由于案例中有關(guān)參數(shù)的數(shù)量級相差較大,因此圖中橫軸政府防御的均衡概率普遍較大(接近于無情緒時均衡值p*= 0.9937)。
分析圖2,隨著政府反恐力量的樂觀情緒增大(r1減小),將誘導(dǎo)暴恐分子采取更大的襲擊概率(襲擊策略的混合均衡q*增大);但是隨著暴恐分子樂觀情緒的增大(r2減小),政府反恐力量將傾向于增大防御(防御策略的混合均衡概率p*增大)。在圖3中,隨著暴恐分子悲觀情緒的上升(r2增大),政府防御策略的均衡概率下降;但是當政府反恐力量悲觀情緒上升時(r1增大),暴恐分子的襲擊概率略微增大。
圖4 政府樂觀和恐怖分子悲觀的混合均衡
圖5 恐怖分子樂觀和政府悲觀的混合均衡
在圖4中,隨著政府反恐力量的樂觀情緒增大(r1減小),將誘導(dǎo)暴恐分子采取更大的襲擊概率(襲擊策略的混合均衡q*增大);但是隨著暴恐分子悲觀情緒的增大(r2增大),政府反恐力量將相應(yīng)地減少防御(防御策略的混合均衡概率p*變小)。在圖5中,隨著政府反恐力量悲觀情緒的上升(r1增大),暴恐分子的襲擊概率略微增大;隨著暴恐分子樂觀情緒的增大(r2減小),政府防御的均衡概率p*也將相應(yīng)地增大。
盡管由于新疆“6.28”案例中有關(guān)參數(shù)存在著數(shù)量級差異,但是上述結(jié)果仍然反映了結(jié)論2,即任何一方存在著對事態(tài)發(fā)展的悲觀/樂觀情緒時,勢必影響到另一方的均衡策略選擇。基本上,當暴恐分子對于事態(tài)研判為悲觀情緒時,政府反恐力量將在混合均衡中減少防御策略的概率;當暴恐分子對于事態(tài)發(fā)展具有樂觀情緒時,政府反恐力量將不得不增大防御策略的概率。
恐怖襲擊具有襲擊者有暴力恐怖,目標多元化,宗教色彩等一系列非理性、時間緊迫的極端約束條件的非常規(guī)特征。除了常規(guī)前向歸納推理、有限理性博弈模型等的不同角度外,本文從當事雙方對于事態(tài)發(fā)生主觀概率存在著樂觀或悲觀情緒的角度提供了一種新闡述。在恐怖襲擊事件實施和應(yīng)急處置過程中,政府反恐力量和恐怖分子的心理可能隨著態(tài)勢變化出現(xiàn)情緒波動,雙方非理性的情緒因素對其決策和執(zhí)行過程都會產(chǎn)生行為偏差。
本文運用期望等級依賴效用理論,分析了政府反恐力量和暴恐分子的樂觀/悲觀情緒對于博弈均衡結(jié)果的影響。研究表明:如果一方處于冷靜研判并準確預(yù)期的狀態(tài),另一方行動處于過度樂觀(悲觀)的情緒情境下,博弈的原混合策略Nash均衡將發(fā)生改變。其中,當恐怖分子襲擊的概率較大,同時政府處于悲觀情緒、恐怖分子處于準確預(yù)期的狀態(tài)時,相對于政府的樂觀情緒,原混合均衡結(jié)果將以更快速度轉(zhuǎn)化為純策略納什均衡結(jié)果(防御,不襲擊)。當雙方都存在情緒因素情境下,任何一方存在著對事態(tài)發(fā)展的悲觀/樂觀情緒時,勢必影響到另一方的均衡策略選擇。其中,當暴恐分子對于事態(tài)研判為悲觀情緒時,政府反恐力量將在混合均衡中減少防御策略的概率;當暴恐分子對于事態(tài)發(fā)展具有樂觀情緒時,政府反恐力量將不得不增大防御策略的概率。因為存在著樂觀情緒的恐怖分子其更加易于冒險采取襲擊行動,從而造成事態(tài)均衡結(jié)果更大的不確定性。
本文的研究結(jié)果表明,在開展反恐斗爭、制定應(yīng)急預(yù)案的過程中,政府反恐力量需要準確把握暴恐事件的態(tài)勢,一方面避免自身做出過于盲目樂觀的判斷造成不必要損失,另一方面需要從戰(zhàn)術(shù)上高度重視敵人,把形勢估計得更嚴重一些、問題想得更困難一些,從而有利于加大防御發(fā)揮出不戰(zhàn)而屈人之兵的反恐震懾效果。同時,政府反恐力量需要盡可能捕捉和把握暴恐分子的心理狀態(tài),從而制定出最優(yōu)的防御/打擊決策。因此,加強情報搜集、信息分析工作[23],是反恐斗爭中的一個關(guān)鍵環(huán)節(jié)。
[1] 王芳菲. 全球2013年恐怖襲擊達1萬起,非洲亞洲最多[EBOL]. [2014-11-20]. http://www.hnr.cn/news/kx/201411/t20141120_1715564.html.
[2] 付舉磊, 孫多勇, 肖進, 等. 基于社會網(wǎng)絡(luò)分析理論的恐怖組織網(wǎng)絡(luò)研究綜述[J]. 系統(tǒng)工程理論與實踐, 2013, 33(9): 2177-2186.
[3] Ressler S. Social network analysis as an approach to combat terrorism: Past, present, and future research[J]. Homeland Security Affairs, 2006, 2(2): 1-10.
[4] 韓傳峰,孟令鵬,張超,等.基于完全信息動態(tài)博弈的反恐設(shè)施選址模型[J].系統(tǒng)工程理論與實踐,2012, 32 (2):366-372.
[5] 柴瑞瑞, 孫康, 陳靜鋒, 等. 連續(xù)恐怖襲擊下反恐設(shè)施選址與資源調(diào)度優(yōu)化模型及其應(yīng)用[J]. 系統(tǒng)工程理論與實踐, 2016, 36(2): 464-472.
[6] Nikoofal M E, Zhuang Jun. On the value of exposure and secrecy of defense system: First-mover advantage vs. robustness[J]. European Journal of Operational Research, 2015, 246(1): 320-330.
[7] Sandler T, Enders W. An economic perspective on transnational terrorism[J]. European Journal of Political Economy, 2004, 302(20): 301-316.
[8] Pinker J E. An analysis of short-term responses to threats of terrorism[J]. Management Science, 2007, 53(6): 865-80
[9] 劉德海, 周婷婷. 基于認知差異的恐怖主義襲擊誤對策分析[J].系統(tǒng)工程理論與實踐, 2015, 35(10): 2646-2655.
[10] Quiggin J. A theory of anticipated utility[J]. Journal of Economic Behavior and Organization, 1982, 3(4): 323-343.
[11] Von Neumann J, Morgenstern O. Theory of games and economics behavior[M]. Princeton: Princeton University Press, 1944.
[12] Allais M. Extension of the theories of general economic equilibrium and social output to the case of risk[J]. Econometric, 1953, 2(4): 503-546.
[13] Enrico D, Wakker P P. On the intuition of rank-dependent utility[J]. The journal of risk and uncertainty, 2001, 23(3): 281-298.
[14] 龔日朝. 基于秩依期望效用理論的鷹鴿模型博弈均衡分析[J]. 管理科學(xué)學(xué)報, 2012, 15(9): 35-44.
[15] 熊國強, 張婷, 王海濤. 情緒影響下群體性沖突的RDEU博弈模型分析[J]. 中國管理科學(xué), 2015, 23(9): 162-170.
[16] 方樂,張松,周婷婷,等. 考慮情緒因素的群體性突發(fā)事件等級依賴期望效用模型[J].電子科技大學(xué)學(xué)報(社會科學(xué)版), 2015, 17(2): 34-40.
[17] 趙可金.反恐十年的美國與世界[N]. 學(xué)習(xí)時報,2011年9月12日,第2版.
[18] 劉德海, 韓呈軍. 基于心智模型的恐怖主義襲擊擴展式演化博弈分析[C]. 第十三屆全國青年管理科學(xué)與系統(tǒng)科學(xué)學(xué)術(shù)會議, 2015年10月17日, 西安.
[19] 邱永崢, 王盼盼. 新疆和田發(fā)生恐怖襲擊事件[N]. 環(huán)球時報, 2013-6-29, 第4版.
[20] 張昕宇等. 筑起打擊暴恐犯罪的銅墻鐵壁:自治區(qū)重獎圍捕暴徒的群眾引起強烈反響[N]. 新疆日報, 2014年8月6日,第3版.
[21] 劉媛. 據(jù)稱恐怖分子襲擊倫敦地鐵成本低廉僅兩千美元[EBOL].[2006-01-04]. http://news.xinhuanet.com/world/2006-01/04/content_4006760.htm
[22] 謝宇, 張曉波, 李建新, 等. 中國民生發(fā)展報告2014[M]. 北京:北京大學(xué)出版社,2014.
[23] 劉德海. 信息交流在群體性突發(fā)事件處理中作用的博弈分析[J]. 中國管理科學(xué), 2005, 13(3): 95-102.
HowdoesthePessimisticorOptimisticEmotionInfluencetheGameEquilibriumOutcomeinIncidentsofViolenceandTerrorism
LIUDe-hai1,2,BAOXue-yan2,WANGXie-ning1
(1.School of Management science and Engineering, Dongbei University of Finance & Economics, Dalian 116025,China;2. Center of Econometric Analysis and Forecasting, Dongbei University of Finance & Economics, Dalian 116025,China)
Terrorist’s attack has become a severe challenge for human society. Both terrorists and government anti-terrorist force possess the obvious characteristics of scenario-dependent decision and irrational emotion decision. For example, the player with the optimistic emotion usually overestimates the probability of the event, and the player with the pessimistic emotion usually underestimates the probability of the event. Obviously, it has important influence on the optimal decision and equilibrium results.
1003-207(2017)10-0080-09
10.16381/j.cnki.issn1003-207x.2017.10.009
C931
A
2016-05-10;
2017-02-21
國家自然科學(xué)基金資助項目(71271045, 71571033,71503033, 71602021);東北財經(jīng)大學(xué)學(xué)科建設(shè)支持計劃特色學(xué)科項目(XKT-201411)
劉德海(1974-),男(漢族),遼寧遼陽人,東北財經(jīng)大學(xué)管理科學(xué)與工程學(xué)院教授、博導(dǎo),研究方向:突發(fā)事件應(yīng)急管理,E-mail:Ldhai2001@163.com.
And then, the effect of emotion on the equilibrium outcomes of the traditional government-terrorist game model is discussed, where governmental anti-terrorist force or terrorist has an optimistic or pessimistic expectation on the subjective probability about terror attack. Taken by the method of case analysis, the special scenario that both two parties have an optimistic or pessimistic emotion based on Xinjiang 6.28 terrorist incident in Moyu County is further discussed. Lastly, the paper discusses the management meaning on improving anti-terrorist strategy.
The results show that when any one player has an optimistic or pessimistic expectation, the opponent without any emotion should adjust his/her equilibrium probability. That is to say, any party’s emotion should influence the opponent’s strategy selection. When both two parties have the emotional factor, the terrorist with optimistic expectation should be more inclined to take excessive risk, which causes the equilibrium outcome has the more uncertainty.
The paper’s results are useful for the anti-terrorism and emergency plans. First, the government should avoid the short-sighted optimism in order to reduce the unnecessary loss. Second, the government should come to a more serious appraisal of the situation and think of more difficulties, because a stronger defense can banish every attack thought. Third, the government should strengthen the intelligence collecting and information analysis. Thus, anti-terrorism need to strengthen intelligence for accurately judging terrorist’s psychological states.
Keywords: terror attack; Rank-Dependent Expected Utility theory; emotion; government and terrorist; pessimism and optimism