亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于前景理論的核電廠作業(yè)行為監(jiān)管演化博弈研究

2023-10-09 06:26:38陳甲華王平平倪素素

南華大學學報(社會科學版) 2023年3期

關鍵詞：策略

陳甲華,王平平,倪素素

(南華大學經(jīng)濟管理與法學學院,湖南衡陽 421001)

核電廠預防和減少人因事件是減少核事故風險的重要途徑。研究表明:全球核電廠中由人因失誤導致的事件數(shù)占運行事件總數(shù)的58%。張力等認為核電廠人因事件的根本原因分為基本操作能力較差、理論知識欠缺、違章、組織管理缺陷及其他原因等21種,其中由操縱員違章引發(fā)的事件占事件總數(shù)的12.6%[1]。國際上切爾諾貝利核電廠事故就是由于操縱員多次違背操作規(guī)章和安全準則導致反應性失控引發(fā)的災難性事故[2]。國家核安全局2016年通報的核電廠人員行為導致的16起運行事件中,人員違反程序誤操作占6起[3]。國家核安全局2021年發(fā)布核電運行事件共19起,其中違反“核動力廠運行限值和條件規(guī)定的操作或者狀況”準則的事件共6起[4],核電廠人員操作行為是導致人因事件的重要因素之一。

操縱員的行為與操作失誤之間的關系是當下的熱門研究領域。傳統(tǒng)的主控室操縱員的主要任務是監(jiān)視和操作系統(tǒng),而隨著計算機智能化規(guī)程系統(tǒng)的引入,數(shù)字化主控室成為常見的主控室操作平臺,數(shù)字化主控室的信息提供能力和信息處理能力有極大的優(yōu)越性[5]。數(shù)字化主控室的操縱員主要涉及兩類任務,即第一類任務和界面管理任務[6]。數(shù)字化主操控室的操縱員需要執(zhí)行的主要任務有監(jiān)視和發(fā)覺、狀態(tài)評價、響應計劃和響應執(zhí)行,并通過人機交互系統(tǒng)監(jiān)視和控制系統(tǒng)[7-8]。監(jiān)視行為是從主控室獲取系統(tǒng)運行信息的行為[9]。從傳統(tǒng)的手動控制者變?yōu)楸O(jiān)視者、控制者和決策者集一身的角色[10],在緊急情況下,操縱員需要處理的信息更繁瑣,操縱員的任務負荷會隨之增加[11]。鄒衍華以這四個作業(yè)行為單元為研究對象,探究數(shù)字化主控室操縱員的作業(yè)行為特征及失誤機理,揭示操縱員作業(yè)行為的邏輯動態(tài)演化機制[12]。操縱員需要處理的操作任務變得復雜,執(zhí)行操作任務的事件窗口減小,使得操縱員的認知、心理和體力負荷都發(fā)生變化。劉雪陽從認知行為的角度出發(fā),通過分析主控室操縱員的認知行為特征和失誤機理之間的關系,構建了失誤因果模型[13],為操縱員的失誤機理提供模型支持。何旭洪等在核電廠事故狀態(tài)的情況下,將操縱員的認知行為過程分為5個階段,并采用認知行為模型分析操縱員認知過程中的失誤情況,最后得到操縱員發(fā)生認知失誤的階段和根源[14]。孫倩琳等從認知可靠性與人因失誤分析方法入手,提出了認知可靠性與人因失誤分析方法(CREAM)中共同績效條件(CPC)定義比較模糊而且還有重合,針對預測事件時的不確定性,提出CPC的改進方法以及建立人因失誤概率計算模型[15],對優(yōu)化操縱員的行為形成因子有重要意義。數(shù)字化主控室操縱員的界面管理任務支持和保障第一類任務的完成,如信息導航、信息調用、數(shù)據(jù)搜索以及頁面配置和管理等[6]。Embrey發(fā)現(xiàn)界面管理任務會消耗操縱員的注意力,對第一類任務的績效有影響[16]。在Embrey研究的基礎上,O’hara J M等指出界面管理任務對操縱員的具體影響是降低了操縱員第一類任務的績效[17]。戴立操等從監(jiān)視和發(fā)覺、狀態(tài)評價、響應計劃、響應執(zhí)行的四個作業(yè)單元中探究界面管理任務對操縱員的影響,為操縱員影響因子體系研究提供基礎[18]。

除了對操縱員的行為與失誤機理之間關系的研究,現(xiàn)有的部分文獻還將風險、情緒等主觀心理因素加入對核電廠人員行為的研究中。王盛引入道德風險的概念,分析了核電安全管理中道德風險的產(chǎn)生是由核電企業(yè)的經(jīng)理人和普通員工引發(fā)的[19]。Huang Q S等采用博弈分析方法,建立核電企業(yè)和政府之間道德風險監(jiān)管的博弈模型,分析了靜態(tài)混合策略均衡和有限次動態(tài)博弈,認為政府加大對違反安全規(guī)則的處罰力度,降低監(jiān)管成本,就可以降低道德風險[20]。Rao L L等則從安全行為和差錯兩個方面考察核電廠操縱員的感知風險對其工作質量的影響,利用中國兩座核電廠的349名操縱員的數(shù)據(jù)進行研究,結果發(fā)現(xiàn)感知風險與安全行為呈負向線性關系,與差錯呈二次關系,此外領導支持在感知風險、安全行為和差錯之間的關系中起調節(jié)作用[21]。Kim K N等以博弈論的方法考察了內部威脅影響的定量框架[22]。Ni S S等將依賴期望效用理論引入核電廠內部威脅事件中,探究情緒因素對內部敵手和核安保部門策略的影響,結果發(fā)現(xiàn)不同情緒狀態(tài)和情緒強度的組合對博弈均衡結果有影響,還會影響博弈的速度[23]。

在現(xiàn)有的研究中很少有學者從利益相關者的角度出發(fā)探究操縱員違章行為的監(jiān)管問題,核電營運單位如何管控操縱員的違章行為,監(jiān)管機構如何監(jiān)管核電營運單位的質量控制和操縱員的作業(yè)行為,避免核事故風險的隱患,都是待解決的問題。在學術研究中,博弈論被大量應用于不同利益主體的復雜經(jīng)濟行為[24]和質量管理體系的內在機理問題[25],而主體在做決策時并不總是完全理性的,主觀心理因素會影響主體的行為和決策[26]。相對于傳統(tǒng)的期望效用理論,前景理論認為決策主體在面對收益和損失時的風險偏好不同,在面對收益時會變得風險厭惡,面對損失時會變得風險追求,因此,本文基于前景理論構建監(jiān)管機構、操縱員和核電營運單位三方的操作行為監(jiān)管演化博弈模型,探討三方策略選擇。

一前景理論

Kahneman D和Tversky A在1979年正式提出了關于風險決策的前景理論[27]:個人對價值的感知并不是價值本身這個絕對值,而是相較于參考點的相對值來衡量主體的收益或者損失,將主體對收益或者損失的感知界定為前景價值V,用權重函數(shù)π(pi)和主觀價值函數(shù)v(Δwi)兩個變量描述。

(1)

(2)

其中,pi代表事件發(fā)生的概率,權重函數(shù)π(pi)描述了個人對事件發(fā)生可能的判斷,滿足π(0)=0,π(1)=1;Δwi=wi-w0表示發(fā)生事件i時,主體相較于參考點w0的價值之差,主觀價值函數(shù)v(Δwi)反映主體根據(jù)價值之差形成的感知,公式(2)中參數(shù)α表示風險敏感系數(shù)(0<α<1),數(shù)值越大代表主體對于該收益或者損失價值的敏感度越弱,越不容易影響價值主體的決策。參數(shù)β(β>1)表示損失規(guī)避系數(shù),數(shù)值越大表明主體相對于收益而言,對事件的損失更敏感。

在前景理論中,個人面對收益和損失的敏感程度不同,面對同等的收益和損失時,對損失往往會更敏感。

二基于前景理論的演化博弈模型

(一)模型主體關系

操縱員是在主控室操縱控制系統(tǒng)的運行人員,操縱員違章行為是指違背有關程序規(guī)則進行操作的行為,在實際操作過程中操縱員可能會習慣性堅持不恰當做法以及為了走捷徑而違章操作。核安全監(jiān)管機構(簡稱監(jiān)管機構)會定期對核電營運單位設施進行檢查,并對操縱員進行監(jiān)督和考核。核電營運單位負責核設施的質量控制和操縱員的行為管理控制,核電營運單位發(fā)現(xiàn)操縱員違章操作時,按要求要第一時間上報監(jiān)管機構,例如2020年11月5日,生態(tài)環(huán)境部部務會議通過的政策文件[28]中要求在核電廠運行階段,發(fā)生包括“違反核動力廠運行限值和條件規(guī)定的操作或者狀況”等12類事件時,在事件發(fā)生24小時內,核電營運單位必須口頭通告國家核安全局和所在地區(qū)監(jiān)督站;在事件發(fā)生后三天內,核電營運單位必須向國家核安全局和所在地區(qū)監(jiān)督站遞交書面通告。世界上有核電的國家普遍都建立了經(jīng)驗反饋系統(tǒng),一旦發(fā)生有共性的事件,會及時進行信息公開,告知其他核電廠,所以監(jiān)管機構核實之后會按照規(guī)則發(fā)布事件信息,對核電營運單位通報批評。博弈主體之間的關系見圖1。

圖1 三方博弈主體關系

(二)模型假設

假設1:前景理論中的收益或者損失價值參考點為0。

假設2:監(jiān)管機構、操縱員和核電營運單位為博弈的參與方,三方都是有限理性的。監(jiān)管機構的策略空間是{嚴格監(jiān)管,不嚴格監(jiān)管},監(jiān)管機構嚴格監(jiān)管的概率是x,不嚴格監(jiān)管的概率是1-x;操縱員的策略空間是{違章操作,合規(guī)操作},操縱員違章操作的概率為y,合規(guī)操作的概率則為1-y;核電營運單位的策略空間是{積極管控,消極管控},積極管控的概率是z,消極管控的概率則為1-z。x,y,z分別為博弈三方嚴格監(jiān)管、違章操作、積極管控的概率,且滿足x>0,y<1,z<1。

假設3:監(jiān)管機構嚴格監(jiān)管時需要付出的成本C1,監(jiān)管機構監(jiān)管使得其公信力提升,獲得收益為G1,則感知收益V(G1),監(jiān)管機構不嚴格監(jiān)管時需要付出的成本C2,而監(jiān)管機構不嚴格監(jiān)管、操縱員違章、核電營運單位消極管控時,可能會使得核電營運單位有發(fā)生更大事故的風險,增加整個社會遭受事故風險的概率,同時使得監(jiān)管機構公信力降低,監(jiān)管機構造成的損失為G2,則感知損失為V(-G2)。

假設4:操縱員違章操作時,需要承擔事故風險的成本為P1,則感知成本為V(-P1),監(jiān)管機構嚴格監(jiān)管或者核電營運單位積極管控時,操縱員需要承擔相應處罰甚至被吊銷執(zhí)照的損失為S1。操縱員合規(guī)操作時需要改變自己之前的習慣性不恰當行為,嚴格按照程序操作,需要付出的成本為P3,感知成本為V(-P3),當操縱員合規(guī)操作、核電營運單位積極管控或者監(jiān)管機構嚴格監(jiān)管時,操縱員對其安全操作行為獲得的收益為P2,則感知收益為V(P2)。

假設5:核電營運單位積極管控付出的成本為C3,操縱員違章操作對核電營運單位造成的經(jīng)濟損失是S2,核電營運單位積極管控或者監(jiān)管機構嚴格監(jiān)管時,核電營運單位就會被通報,造成的損失為N1,則感知損失為V(-N1)。當操縱員違章操作、核電營運單位積極管控時,核電營運單位發(fā)現(xiàn)操縱員違章操作,會避免更大事故的發(fā)生,獲得收益N2,則感知收益為V(N2),當操縱員違章操作、核電營運單位消極管控,核安全監(jiān)管機構嚴格監(jiān)管時,對核電營運單位進行處罰F1。當操縱員合規(guī)操作、核電營運單位積極管控時,核電營運單位對質量控制的滿足度增加,獲得收益N3,則感知收益為V(N3)。

假設6:核安全監(jiān)管機構、操縱員和核電營運單位三方有不同的感知價值,各個主體的感知價值對感知收益和感知損失的敏感度不同,設三方對于感知收益的敏感程度分別為α1、α2、α3,對感知損失的敏感程度分別β1、β2、β3。

(三)模型構建

基于以上假設,若監(jiān)管機構實施嚴監(jiān)管的策略,核電營運單位積極管控以及操縱員違章操作時,監(jiān)管機構采取嚴格監(jiān)管策略付出的成本為C1,公信力提升的收益為V(G1),則監(jiān)管機構的收益感知為-C1+V(G1),同理,可構建監(jiān)管機構、操縱員和核電營運單位三方的收益支付感知矩陣,見表1。

表1 收益支付感知矩陣

由價值函數(shù)可得,監(jiān)管機構嚴格監(jiān)管的概率為1時,監(jiān)管機構公信力提升G1,監(jiān)管機構不嚴格監(jiān)管時,若違章行為沒有被發(fā)現(xiàn),監(jiān)管機構損失G2,監(jiān)管機構的感知收益為:

V(-G1)=π(1)v(G1)+π(0)v(-G2)=G1α1

(3)

監(jiān)管機構不嚴格監(jiān)管的概率為1時,若違章行為沒有被發(fā)現(xiàn),監(jiān)管機構損失G2,監(jiān)管機構嚴格監(jiān)管時,公信力提升G1,監(jiān)管機構的感知損失為:

V(-G2)=π(1)v(-G2)+π(0)v(G1)=-β1G2α1

(4)

同理可得:

V(-P1)=-β2P1α2,V(P2)=P2α2,

V(-P3)=-β2P3α2,V(N2)=N2α3,

V(N3)=N3α3

由上述收益支付感知矩陣可知,監(jiān)管機構嚴格監(jiān)管的預期收益E11、不嚴格監(jiān)管的預期收益E12和預期平均收益E1分別為:

E11=-C1+G1α1+y(1-z)F1

(5)

E12=-C2-y(1-z)β1G2α1

(6)

E1=xE11+(1-x)E12

(7)

則監(jiān)管機構的復制動態(tài)方程為:

β1G2α1)]

(8)

其中,ΔC=C1-C2

則操縱員的復制動態(tài)方程為:

S1)-x(1-z)(P2α2+S1)]

(9)

核電營運單位的復制動態(tài)方程為:

xy(F1+N2α3)+(1-y)N3α3]

(10)

令F(x)=0(x)=0,F(y)=0,F(z)=0V(-N1)=-β3N1α3,求出(0,0,0)、(0,0,1)、(0,1,0)、(0,1,1)、(1,0,0)、(1,0,1)、(1,1,0)、(1,1,1)8個特殊均衡點和(x*,y*,z*)1個混合策略均衡點,其中(x*,y*,z*)是下列方程組的解。因為多種群演化博弈的穩(wěn)定均衡點是嚴格的純策略納什均衡,所以(x*,y*,z*)不是穩(wěn)定均衡策略點。

(11)

用雅可比矩陣J對其余的均衡點進行穩(wěn)定性分析。令

L=-β2P1α2+β2P3α2-z(P2α2+S1)-

x(1-z)(P2α2+S1)

M=-C3-(1-x)yβ3N1α3+xy(F1+N2α3)+

(1-y)N3α3,

則雅可比矩陣為:

若均衡點滿足其對應的雅克比矩陣的特征根小于0,則該均衡點是演化博弈模型的局部漸進穩(wěn)定點,對應的策略為模型的演化穩(wěn)定策略(ESS)。均衡點的特征值取值見表2。

表2 均衡點的特征值取值情況

(四)演化博弈均衡點分析

由均衡點的取值情況可知,(0,1,1)的特征值中有大于0的取值,所以其余7個均衡點都有可能是演化穩(wěn)定策略。

當監(jiān)管機構、操縱員和核電營運單位三方博弈的演化穩(wěn)定策略為(1,0,1)時,監(jiān)管機構在操縱員操作行為中履行監(jiān)督管理的職責,核電營運單位在操縱員操作行為中履行管理控制的職責,操縱員合規(guī)操作的利益大于違章操作的損失,傾向于合規(guī)操作,此時的策略選擇是最優(yōu)的,因此本文選擇研究分析在(1,0,1)的策略選擇下三方風險敏感度系數(shù)和損失規(guī)避系數(shù)對演化路徑的影響。

當ΔCβ2P3α2,C3

三方博弈均衡點是否穩(wěn)定除了和獲得的實際收益、付出的實際成本有關,還和各自的風險感知收益和成本有關,因此考慮風險感知如何影響主體策略選擇,對于分析系統(tǒng)最終演化穩(wěn)定均衡策略是必要的。

三演化博弈數(shù)值仿真

Python是一種開源的程序設計語言,具有簡潔、易讀、可擴展性強的特點,并且具有豐富的科學計算擴展庫,十分適合工程技術、科研人員處理實驗數(shù)據(jù)。故本文采用Python對上述三方博弈的演化過程進行數(shù)值仿真。

(一)穩(wěn)定策略仿真分析

滿足博弈穩(wěn)定點1,0,1的穩(wěn)定條件是:ΔCβ2P3α2,C3

圖2 均衡點(1,0,1)的數(shù)值仿真

(二)風險敏感度系數(shù)和損失規(guī)避系數(shù)分析

1.監(jiān)管機構風險敏感度系數(shù)和損失規(guī)避系數(shù)分析

在演化博弈的初始參數(shù)值和操縱員與核電營運單位的風險敏感度系數(shù)和損失規(guī)避系數(shù)不變的情況下,取α1=0.22,β1=1.25,將三方的策略概率初始值仍然分別設置為x=y=z=0.5和x=0.3,y=0.9,z=0.6,仿真結果見圖3(a)和圖3(b)。

圖3 α1=0.22,β1=1.25的演化穩(wěn)定均衡

由仿真結果可知,減小監(jiān)管機構的風險敏感系數(shù)和損失規(guī)避系數(shù)使得三方的最優(yōu)策略不再穩(wěn)定,監(jiān)管機構選擇嚴格監(jiān)管的策略最終概率大概穩(wěn)定在0.6。此時β1保持不變,將α1改變?yōu)橹暗闹?即α1=0.88,演化穩(wěn)定策略又變回(1,0,1),見圖4(a)和圖4(b)。這說明影響最優(yōu)穩(wěn)定策略的因素之一為監(jiān)管機構的風險敏感系數(shù)。

圖4 α1=0.88,β1=1.25的演化穩(wěn)定均衡

2.操縱員風險敏感系數(shù)和損失規(guī)避系數(shù)分析

在演化博弈的初始參數(shù)值和監(jiān)管機構與核電營運單位的風險敏感度系數(shù)和損失規(guī)避系數(shù)不變的情況下,取α2=0.22,β2=1.25,將三方的策略概率初始值仍然分別設置為x=y=z=0.5和x=0.3,y=0.9,z=0.6進行仿真,仿真結果見圖5(a)和圖5(b)。

圖5 α2=0.22,β2=1.25的演化穩(wěn)定均衡

由仿真結果可知,減小操縱員的風險敏感系數(shù)和損失規(guī)避系數(shù)使得三方的穩(wěn)定策略不變,依然穩(wěn)定在最優(yōu)策略上,但是操縱員的策略演化速度減慢。

3.核電營運單位風險敏感系數(shù)和損失規(guī)避系數(shù)分析

在演化博弈的初始參數(shù)值和監(jiān)管機構與操縱員的風險敏感度系數(shù)和損失規(guī)避系數(shù)不變的情況下,取α3=0.22,β3=1.25,將三方的策略概率初始值仍然分別設置為x=y=z=0.5和x=0.3,y=0.9,z=0.6進行仿真,仿真結果見圖6(a)和圖6(b)。

圖6 α3=0.22,β3=1.25的演化穩(wěn)定均衡

由仿真結果可知,減小核電營運單位的風險敏感系數(shù)和損失規(guī)避系數(shù)使得三方的穩(wěn)定策略變?yōu)?1,0,0),核電營運單位對價值的敏感性減弱,即比起損失更在乎收益。此時β3保持不變,將α3改變?yōu)橹暗闹?即α3=0.88,β3=1.25,演化穩(wěn)定策略又變回(1,0,1),仿真結果見圖7(a)和圖7(b)。這說明影響最優(yōu)穩(wěn)定策略的因素之一為核電營運單位的風險敏感系數(shù)。

圖7 α3=0.88,β3=1.25 的演化穩(wěn)定均衡

四結語

本文構建了核安全監(jiān)管機構、操縱員和核電營運單位三方之間操作行為監(jiān)管的演化博弈模型,并通過數(shù)值仿真進行演化穩(wěn)定性分析,探討了影響三方穩(wěn)定策略的條件和因素。

(一)影響三方演化穩(wěn)定策略的因素有:監(jiān)管機構嚴格監(jiān)管和不嚴格監(jiān)管的成本之差ΔC、監(jiān)管機構嚴格監(jiān)管的公信力提升帶來的感知收益G1α1、操縱員違章操作的風險感知成本β2P1α2、操縱員違章需要承擔的損失S1、核電營運單位積極管控或者監(jiān)管機構嚴格監(jiān)管時,操縱員對其安全操作行為付出的成本的感知收益P2α2、操縱員合規(guī)操作遵守程序付出的感知成本β2P3α2、核電營運單位積極管控的成本C3、核電營運單位對質量控制的滿意度的感知收益N3α3。

當監(jiān)管機構嚴格監(jiān)管和不嚴格監(jiān)管的成本之差小于其監(jiān)管的公信力提升帶來的感知收益;操縱員違章操作的風險感知成本、操縱員違章需要承擔的損失與核電營運單位積極管控或者監(jiān)管機構嚴格監(jiān)管時,操縱員對其安全操作行為付出的成本的感知收益之和大于合規(guī)操作的感知成本;核電營運單位積極管控的成本小于在核電營運單位對質量控制的滿意度的感知收益,此時能達到最優(yōu)策略(1,0,1),即監(jiān)管機構選擇嚴格監(jiān)管、操縱員選擇合規(guī)操作以及核電營運單位選擇積極管控。

(二)監(jiān)管機構和核電營運單位的風險敏感系數(shù)是影響最優(yōu)穩(wěn)定策略的因素。監(jiān)管機構風險敏感系數(shù)的減小,會使得監(jiān)管機構最終選擇嚴格監(jiān)管策略的概率穩(wěn)定在0.6左右;核電營運單位的風險敏感系數(shù)的減小,會使得核電營運單位消極管控時造成的損失敏感度減弱,三方博弈最終不能穩(wěn)定在最優(yōu)策略上,說明監(jiān)管機構和核電營運單位的風險態(tài)度對策略選擇有較大影響。但是數(shù)值仿真結果顯示,操縱員的風險敏感系數(shù)和損失規(guī)避系數(shù)對最終策略的選擇沒有影響,只對操縱員的策略演化速度有抑制作用,即選擇合規(guī)操作的操縱員不會因為風險敏感度、損失規(guī)避程度而改變其嚴格按照規(guī)章程序操作的策略。