楊繼君,曾子軒
(1.國家行政學院應急管理培訓中心,北京100089;2.廣西財經(jīng)學院 管理科學與工程學院,南寧530003)
近些年來,一系列非常規(guī)突發(fā)事件比如“5.12”汶川大地震、“6.1”東方之星沉船事件以及“8.12”天津港大爆炸事故等不斷沖擊公眾視線,考驗著政府的應急處置能力和應急決策水平。這類突發(fā)事件的共同特點是[1]:其爆發(fā)具有突發(fā)性和不可預測性;危機的發(fā)展具有高度的動態(tài)性和不確定性;所造成的結果具有深度危害性。如何依據(jù)非常規(guī)突發(fā)事件的演化態(tài)勢快速制定有效的應對方案是應急決策者面臨的首要現(xiàn)實問題。首先對非常規(guī)突發(fā)事件發(fā)展態(tài)勢進行分析和預測,在此基礎上制定應對方案是科學決策的前提,在實踐中發(fā)揮著越來越重要的作用。
態(tài)勢預測是指在一定的時間和空間范圍內,識別、理解環(huán)境因素,并且對事物的未來發(fā)展趨勢進行預測。目前,態(tài)勢預測在網(wǎng)絡安全中進行了大量的研究,取得了較為豐富的研究成果[2-4],但在突發(fā)事件特別是非常規(guī)突發(fā)事件中的研究比較少見,僅有少數(shù)學者對突發(fā)事件的某一特定類型或某一方面進行了研究。比如,Turoff等[5]提出將基于信息的態(tài)勢預測引入到突發(fā)事件應急管理中,認為應該將對各類應急信息的獲取和判斷納入到組織的例行管理中。楊繼君等[6]從應急資源需求的角度建立了非常規(guī)突發(fā)事件態(tài)勢演化模型,為應急決策者在突發(fā)事件爆發(fā)后應急救援物資的調度提供決策支持。宗芳等[7]通過建立Ordered Probit模型對交通事故中受傷人數(shù)進行預測,可為交通管理部門迅速準確預測事故態(tài)勢。任福民等[8]對國內外在極端氣象事件的態(tài)勢監(jiān)測和預測方法進行了總結,并對極端氣象事件的監(jiān)測和預測業(yè)務發(fā)展及相關科學問題給出了展望。劉怡君等[9]從信息、網(wǎng)民、心理和觀點四個緯度構建了非常規(guī)突發(fā)事件社會輿論超網(wǎng)絡模型,可對非常規(guī)突發(fā)事件的社會輿論演化態(tài)勢進行預測,卞曰瑭等[10]也做過類似研究。本文在上述研究成果的基礎上,從非常規(guī)突發(fā)事件演化的信息流出發(fā),以序貫博弈理論為分析工具,構建基于態(tài)勢預測的非常規(guī)突發(fā)事件應急決策模型,為探索非常規(guī)突發(fā)事件態(tài)勢演化規(guī)律提供新方法,同時也為應急決策提供更為準確、科學的參考依據(jù)。
局中人決策有先后順序的動態(tài)博弈,統(tǒng)稱為序貫博弈[11]。序貫博弈使用序貫理性假設[12],即在給定的信念下,局中人的策略必須是序貫理性的。可以認為,局中人要根據(jù)他們對未來可能結果的權衡,決定當前的行動策略。從應急決策過程上講,鑒于非常規(guī)突發(fā)事件的一系列特殊屬性,應急決策者必須依據(jù)非常規(guī)突發(fā)事件(后簡稱“突發(fā)事件”)的階段性處置結果和演化態(tài)勢動態(tài)調整應急處置與救援方案,也就是說,應急決策者制定的應急處置與救援方案不是一次性完成的,而是隨著對事態(tài)信息的不斷收集與完善來動態(tài)調整應對方案,這種對應對方案的動態(tài)調整過程就類似于博弈論中的序貫博弈過程。
應急決策中的序貫博弈過程有如下幾個主要特征[13]:(1)突發(fā)事件是動態(tài)發(fā)展變化的,它隨著應對方案的實施而由一種狀態(tài)向另一種狀態(tài)轉化;(2)突發(fā)事件的信息不斷完善,從模糊到清晰,從不完全到完全;(3)在信息不完全條件下所制定的應對方案能夠便于在信息完全時刻及時調整;(4)應急決策者是根據(jù)突發(fā)事件所處狀態(tài)和階段性的救災成果對其信念進行修正而生成新的應對方案。下面以圖1為例簡要描述這一過程,在此規(guī)定,序貫博弈中的2個局中人為突發(fā)事件和應急決策者。
圖1 應急決策的序貫博弈過程模型
(1)從t0→t1為T0階段,突發(fā)事件首先爆發(fā)并選擇自己的狀態(tài),造成一定的人員傷亡和財產(chǎn)損失,此時突發(fā)事件的初始狀態(tài)信息記為h0。
(2)從t1→t2為T1階段,應急決策者在t1時刻根據(jù)觀察到的突發(fā)事件初始狀態(tài)信息h0來判斷其狀態(tài)的概率(先驗概率)。在通常情況下,由于初始狀態(tài)信息h0極度缺乏,因此應急決策者利用自己以往的經(jīng)驗來修正突發(fā)事件所處狀態(tài)的概率(后驗概率),然后依據(jù)期望效用最大化原則(即風險損失最小化)選擇最優(yōu)的應對方案并進行處置和救災;同時對突發(fā)事件的相關信息進行進一步的收集(記為h1)。
(3)在T1階段,突發(fā)事件隨著應急決策者所采用應對方案實施的結果及其自身演化規(guī)律,從原來的狀態(tài)演化為新的狀態(tài)。
(4)從t2→t3為T2階段,應急決策者對階段性救災成果進行評估,并根據(jù)已掌握的新的信息h1和自己對突發(fā)事件所處狀態(tài)的信念進行推斷或修正。采用貝葉斯公式計算突發(fā)事件狀態(tài)判斷的后驗概率,然后依據(jù)期望效用最大化原則選擇新的最優(yōu)應對方案進行應急處置與救援。t2→t3為新的應對方案實施時間段;同時對突發(fā)事件的狀態(tài)信息進行收集(記為h2)。
(5)在T2階段,隨著新的應對方案實施,突發(fā)事件向另一狀態(tài)演化,應急決策者又根據(jù)收集的信息h2制定最新的應對方案并實施,依次往復,直到突發(fā)事件得到有效控制并消除為止。
如上所述,突發(fā)事件應急決策過程實質上是應急決策者和突發(fā)事件之間的序貫博弈過程,也是應急決策者不斷收集事態(tài)信息的過程。為了研究方便,假定把突發(fā)事件按照時間序列劃分為若干個階段,每一階段采用一個特定子事件(處于某一特定狀態(tài))進行描述,比如天津港“8.12”特大爆炸事故依據(jù)時間序列分可為4個階段,對應的典型子事件分別為:火災與爆炸事件(記為τ1狀態(tài))、環(huán)境污染事件(記為τ2狀態(tài))、社會穩(wěn)定與城市安全事件(記為τ3狀態(tài))、事故調查與整改事件(記為τ4狀態(tài))?;谛畔⒘鞯膽睕Q策過程為:在進行每一階段信息收集后,應急決策者需要做出兩種決策:一是停止信息收集,以目前所獲取的信息為基礎預測事件演化態(tài)勢并制定應對方案,此時實施該應對方案對應一個風險損失值(方案實施風險);二是繼續(xù)進行下一階段信息收集,而信息的收集必然會延誤應急決策的制定和實施,這種因時間約束而必須付出的代價被稱為信息收集成本,隨后求得在期望信息量下最優(yōu)應對方案的期望風險損失。本文所建模型就是通過對決策風險損失與信息收集成本的比較來制定和評估最優(yōu)應對方案,從而作為應急決策的依據(jù),其框架模型如圖2所示。
圖2 基于態(tài)勢預測的應急決策框架模型
在圖2中,表示在第i(i=1,2,…,N)階段突發(fā)事件處于第j狀態(tài)即為τj(j=1,2,…,J)。
假定突發(fā)事件在某一階段有J種可能狀態(tài),把第j狀態(tài)記為τj(j=1,2,…,J),對應的最優(yōu)應對方案記為σi(i=1,2,…,J)。令Pji表示突發(fā)事件的實際狀態(tài)為τj時,應急決策者采取應對方案σi的效用函數(shù),該效用函數(shù)采用實施該方案所造成的風險損失(記為Bji)的相反數(shù)來度量即:
每一階段進行信息收集所付出的代價記為Ck(k=1,2,…,N信息收集的樣本空間記為{Ii|i=1,2,…,R}(R為樣本空間可取值類型),對應的樣本值依次記為{hi|i=1,2,…,R} ∈I。對突發(fā)事件信息收集的目的就是要預判突發(fā)事件的各種實際狀態(tài)出現(xiàn)的概率,即檢驗在特定階段突發(fā)事件狀態(tài)τj為真時,應急決策者采取相應的最優(yōu)應對方案。
突發(fā)事件發(fā)生后,應急決策者憑借其自身經(jīng)驗,一般會對突發(fā)事件的狀態(tài)有一個大致的判斷并進行初始應急決策,隨著對突發(fā)事件狀態(tài)信息的不斷收集和完善,應急決策者需要對先前的判斷加以修正,在此基礎上制定新的應對方案并加以實施,依次往復,直到突發(fā)事件得到有效控制和消除為止。應急決策者利用當前收集到的信息對他先前的判斷進行修正通常采用貝葉斯方法[14,15]。應急決策者對突發(fā)事件狀態(tài)的先期判斷用概率表示,被稱為先驗概率,記為:μ(τi),μ(τ2),…,μ(τJ),滿足至于先驗概率的確定有多種方法[16,17],比較簡單的方法是假定各先驗概率服從平均分布(突發(fā)事件爆發(fā)初期信息極度匱乏時比較適用),比較復雜的方法有最大熵法[18]、邊緣分布密度法[19]以及互信息原理[20]等。在應急決策中,突發(fā)事件狀態(tài)的先驗概率可根據(jù)應急決策者的經(jīng)驗加以確定,特別在突發(fā)事件爆發(fā)的初期,由于收集到的信息h0嚴重不足(一般情況下假定為空集即h0=φ),此時可以假設突發(fā)事件狀態(tài)的先驗概率服從平均分布。隨著處置工作的展開,應急決策者開始收集到突發(fā)事件的相關信息h1時,已知條件概率μ(h1|τj),則突發(fā)事件處于j(記為τj)狀態(tài)的后驗概率可以根據(jù)如下貝葉斯公式求?。?/p>
其中,μ(τj)為突發(fā)事件處于j狀態(tài)的先驗概率。
眾所周知,應急決策者對突發(fā)事件狀態(tài)信息的收集不是一次性完成的,而是隨著處置工作的展開不斷收集和完善的過程。為了研究方便,假定把整個應急處置過程也分N個階段,當信息收集進行到第Tk(k=0,1,2,…,N)階段時(此時的信息集記為hk),應急決策者可以把第Tk-1階段確定的后驗概率作為第Tk階段的先驗概率,然后按照式(3)確定第Tk階段的后驗概率,在此基礎上確定最優(yōu)應對方案。
式中,μ(τj|hk-1)為應急處置進入第Tk階段突發(fā)事件處于τj狀態(tài)的先驗概率,當k=1時即表示突發(fā)事件爆發(fā)初始階段第一次信息收集前的先驗概率(初始階段記為T0階段,此時假定信息集為空集h0=φ),則有μ(τj|h0)=μ(τj|φ)=μ(τj),此時式(2)變成了式(3)的一種特殊情況。
在進行突發(fā)事件狀態(tài)信息收集之前,應急決策者對下一階段收集到的信息是無法確定的,此時需要引入樣本空間概率分布的概念。假定樣本空間{Ii|i=1,2,…,R} 中各樣本的分布概率為μ(I1),μ(I2),…,μ(IR),通常情況下可認為各樣本是平均分布的即μ(I1)=μ(I2)=…=μ(IR)=,此時可以根據(jù)樣本空間概率分布μ(Ii)求出下一階段信息收集的期望后驗概率。令μe(τj|hk)為第Tk階段信息收集后對第Tk+1階段進行信息收集的期望后驗概率,則有:
應急決策者在選擇救援方案時,不僅僅考慮依據(jù)突發(fā)事件的狀態(tài)來確定應對方案概率的大小,而且還要考慮選擇各方案時的機會成本即從若干個應對方案中選擇一個方案加以實施時,也就喪失了在該種情況下選擇其他方案的機會。在應急決策中,由于突發(fā)事件的信息收集是一個不斷完善的漸進過程,因此在應對方案的選擇過程中存在一定程度的風險,在此規(guī)定將應急決策者選擇某一方案的收益與該狀態(tài)下(實際狀態(tài))選擇最優(yōu)方案的收益之差確定為應急決策者的決策損失(通過決策損失間接反映應急決策者所獲得的效用)。根據(jù)式(1)界定的決策損失Bji,在信息收集進行了k次后(即應急處置進入第Tk階段),各個狀 態(tài) 假 設為真 的 概 率分別 為μ(τ1|hk),μ(τ2|hk),…,μ(τJ|hk),此時采用應對方案σi的決策損失(記為L(hk,σi))可表示如下:
應急決策者在已收集到的信息范圍內采取決策損失最小的方案即選擇的應對方案滿足下式:
是否需要繼續(xù)進行信息收集的決策還取決于下一階段信息收集的預期風險損失以及下一階段信息收集所付出代價的估計。采用期望后驗概率來界定預期決策風險損失(記為Le(hk,σi))即信息收集進行了k次后在對下一次信息收集結果進行估計的基礎上采用應對方案σi的決策風險損失,顯然有:
此時應急決策者的預期決策風險損失及其采用的應對方案滿足下式:
應急決策者的目標就是通過計算當前階段的決策風險損失(L(hk,))與需要下一階段繼續(xù)收集信息而做出決策的預期決策風險損失(Le(hk,))及其繼續(xù)進行信息收集所付出的代價(Ck+1)進行比較,若滿足式(9),則停止進行下一階段的信息收集,采用當前最優(yōu)應對方案進行應急處置:
假定某沿海地區(qū)針對即將到來的臺風災害制定了四套應對方案(記為σ1、σ2、σ3、σ4),分別對應臺風的四種可能狀態(tài):τ1(特別重大)、τ2(重大)、τ3(較大)、τ4(一般)。假定每階段信息收集付出的代價為1個單位(Ck=1,k=1,2,…,N),樣本空間為臺風災害所造成的損失程度即I1(特別嚴重)、I2(嚴重)、I3(較重)、I4(一般)。臺風災害各狀態(tài)與各應對方案所對應的收益矩陣如下頁表1所示,根據(jù)Bji=max(Bj1,Bj2,…,BjJ)-Bji,(j,i=1, 2,…,J)求得損失矩陣Bji如下頁表2所示。
表1 收益矩陣
表2 決策風險損失矩陣
根據(jù)以往臺風資料統(tǒng)計給出如下判斷:
(1)如果臺風狀態(tài)為τ1(特別重大),所造成災害損失嚴重程度的概率分別為:
(2)如果臺風狀態(tài)為τ2(重大),所造成災害損失嚴重程度的概率分別為:
(3)如果臺風狀態(tài)為τ3(較大),所造成災害損失嚴重程度的概率分別為:
(4)如果臺風狀態(tài)為τ4(一般),所造成災害損失嚴重程度的概率分別為:
利用所建立模型進行應急決策。分析過程如下:
(1)初始階段,假定應急決策者沒有收集到臺風災害的任何信息(h0=φ)而進行直接決策
此時,首先假定臺風的初始狀態(tài)為等概率分布即μ(τ1|φ)=0.25 ,μ(τ2|φ)=0.25 ,μ(τ3|φ)=0.25 ,μ(τ4|φ)=0.25 ,采用各應對方案(σ1、σ2、σ3、σ4)的風險損失計算如下:
①當采用應對方案σ1時,其風險損失為:
②當采用應對方案σ2時,其風險損失為:L(h0,σ2)=L(φ,σ2)=162.5
③當采用應對方案σ3時,其風險損失為:L(h0,σ3)=L(φ,σ3)=212.5
④當采用應對方案σ4時,其風險損失為:L(h0,σ4)=L(φ,σ4)=300
從上述計算可知:L(h0,σ*i)=min{L(h0,σ1),L(h0,σ2),L(h0,σ3)=L(h0,σ1)=150,此時應急決策者最好采用應對方案σ1。
(2)進行第一階段的災害信息收集(h1)
此時假定各災害造成的損失程度是等概率的即μ(I1)=μ(I2)=μ(I3)=μ(I4)=0.25 ,則各自的期望后驗概率為:
此時采用各應對方案(σ1,σ2,σ3,σ4)的期望風險損失計算如下:
①當采用應對方案σ1時,其期望風險損失為:
②當采用應對方案σ2時,其期望風險損失為:Le(h1,σ2)=165.9
③當采用應對方案σ3時,其期望風險損失為:Le(h1,σ3)=215.4
④當采用應對方案σ4時,其期望風險損失為:Le(h1,σ4)=298.9
(3)L(h0,σ1)=150>Le(h1,σ1)+C2=149.65 即應急決策者不收集信息而直接采用應對方案σ1所造成的風險損失要比進行第一階段信息收集再采用σ1所造成的期望風險損失要大,故應急決策者應該進行第一階段的信息收集,這說明應急決策者所擁有的事態(tài)信息不足,可能導致決策的準確性偏低。
(4)假設第一階段收到的災害損失結果為I1(信息收集h1的結果表明災害特別嚴重)時,這時實際的后驗概率為:
(5)假設進行第二階段的災害信息收集(h2),期望后驗概率為:
由于L(h1,σ1)=58.2?Le(h2,σ1)+C2=149.2 ,故應急決策者不需要進行第二階段的信息收集而直接進行決策選擇,這也說明過度的信息收集會延誤決策,由此會導致更大的災害損失。
綜上分析,應急決策者的應急決策過程為:當臺風災害來臨時,應急決策者根據(jù)以往臺風資料統(tǒng)計和自身經(jīng)驗判斷,可以直接啟動應對方案σ1,此時的風險損失最小;然后應急決策者進行第一階段的信息收集,如果此時收到的災害信息h1表明災害特別嚴重(I1),則可以預測此次臺風災害的態(tài)勢為特別重大(τ1),繼續(xù)采用應對方案σ1進行應急處置和救援,此時應急決策者的效用最大,處置效果最好。
非常規(guī)突發(fā)事件具有突發(fā)性、動態(tài)性、不可預測性、深度危害性等一系列特殊屬性,這就要求應急決策者必須在環(huán)境復雜、時間緊迫、信息缺失和壓力巨大的特殊背景下快速制定應對方案并加以實施,然而現(xiàn)實情況不允許應急決策者隨心所欲地隨便決策(責任追究),需要在簡單分析工具的支持下制訂科學合理的應對方案。博弈論作為一種簡單的決策分析工具,為該問題的解決提供了新的途徑。首先闡述應急決策過程實質上是一個應急決策者和突發(fā)事件間的序貫博弈過程,隨后從序貫博弈的視角構建了基于信息流的應急決策模型,在對突發(fā)事件的演化態(tài)勢進行預測的基礎上制訂應對方案。最后的算例分析說明了危機情景下應急決策的質量依賴于應急決策者對事態(tài)信息收集和掌握的程度。過度的收集信息會延誤決策,而信息收集不足又會影響決策的精確性,二者勢必都會造成更大的災害損失,因此應急決策者對信息收集要掌握適度原則。另外,算例分析也驗證了所建模型的有效性和可行性。