李莎莎,崔鐵軍
(1.遼寧工程技術(shù)大學(xué) 工商管理學(xué)院,遼寧 葫蘆島 125105;2.遼寧工程技術(shù)大學(xué) 安全科學(xué)與工程學(xué)院,遼寧 阜新 123000)
在實(shí)際系統(tǒng)運(yùn)行過程中,系統(tǒng)的安全性和收益可從人、機(jī)、環(huán)、管4方面論證。機(jī)子系統(tǒng)是其中最為可靠的系統(tǒng),在規(guī)定時(shí)間內(nèi)和條件下一般不發(fā)生故障,可保證系統(tǒng)穩(wěn)定收益。環(huán)境子系統(tǒng)一般受到各種調(diào)節(jié)措施限制,因而變化不大。機(jī)子系統(tǒng)發(fā)生故障主要是人子系統(tǒng)采取的不當(dāng)和不安全行為造成的;環(huán)子系統(tǒng)主要作用于人子系統(tǒng),并轉(zhuǎn)化為人的不安全行為。同時(shí)管子系統(tǒng)主要約束人的不安全行為和不當(dāng)操作。系統(tǒng)的管理者可使用懲罰和獎(jiǎng)勵(lì)行為來應(yīng)對(duì)操作者的安全和不安全行為,從而保障系統(tǒng)可靠安全獲得收益。收益是多方面的,比如安全收益、經(jīng)濟(jì)收益和質(zhì)量收益等。在系統(tǒng)運(yùn)行過程中,系統(tǒng)的實(shí)際操作者或工作者與系統(tǒng)的管理者或所有者,圍繞操作者收益和管理者收益展開博弈,博弈目標(biāo)是在對(duì)方承受范圍內(nèi)使己方的收益最大。
關(guān)于各種系統(tǒng)內(nèi)不同主體相互博弈及其收益分析的研究較多[1-10],這些研究在各自領(lǐng)域都有較好的適應(yīng)性,同時(shí)解決了實(shí)際問題。但操作者不同行為、管理者不同行為,及二者不同行為之間的相互影響是不同的。2操作者的安全與不安全行為就有4種組合方式。其行為可能以不同邏輯方式導(dǎo)致后繼結(jié)果產(chǎn)生,如2者同時(shí)產(chǎn)生不安全行為,則導(dǎo)致后繼不安全結(jié)果發(fā)生;或是二者之一產(chǎn)生不安全行為就會(huì)導(dǎo)致后繼不安全結(jié)果發(fā)生。同樣管理者對(duì)于每個(gè)操作者行為都會(huì)制定獎(jiǎng)懲行為,這亦會(huì)相互影響。那么操作者行為和管理者行為交織在一起則相當(dāng)復(fù)雜,對(duì)整個(gè)系統(tǒng)而言判斷最終收益情況是困難的。
因此本文提出基于系統(tǒng)故障演化過程(System Fault Evolution Process,SFEP)思想[11-14],借助空間故障網(wǎng)絡(luò)(Space Fault Network,SFN)和博弈方法,研究系統(tǒng)中操作者和管理者的不同行為給各自帶來的收益,并判斷博弈勝出方。建立系統(tǒng)操作者與管理者行為博弈演化與收益分析方法。
SFEP是表示系統(tǒng)故障過程中各種事件及其邏輯關(guān)系的方法,SFN用于表示和研究SFEP。SFN包括節(jié)點(diǎn)和有向線段,節(jié)點(diǎn)代表事件,包括起始的原因事件,經(jīng)歷的過程事件和系統(tǒng)最終故障情況的最終事件;有向線段表示事件之間的傳遞關(guān)系,從原因事件指向結(jié)果事件;傳遞概率表示原因事件導(dǎo)致結(jié)果事件的可能性;中間事件和最終事件有多個(gè)原因事件時(shí)下角標(biāo)標(biāo)注原因事件間邏輯關(guān)系,如圖1所示。這樣SFN可表示復(fù)雜的SFEP及其事件間邏輯關(guān)系及演化流程,研究方法包括轉(zhuǎn)化法和結(jié)構(gòu)法[11-15]。因此SFEP可表示任意具有事件和事件間邏輯關(guān)系特征的系統(tǒng)演化過程,同樣作為表示方法的SFN亦可處理具有類似特征的過程。由操作者和管理者組成博弈系統(tǒng),由于其不同的行為會(huì)導(dǎo)致不同的收益,那么對(duì)于同一事件的不同行為得到的收益就可作為SFN的邊緣事件,分析得到最終系統(tǒng)收益情況。
圖1 SFN模型
博弈論源于20世紀(jì)初,又稱對(duì)策論,是分析事物之間矛盾的工具之一,涉及2個(gè)或多個(gè)參與者決策和行為的相互影響,是確定局勢(shì)的常用數(shù)學(xué)方法。主要研究參與者之間對(duì)抗和合作交織情況下,如何決策從而使己方在過程中獲得較大利益并同時(shí)使對(duì)方接受。方法邏輯源于Bayesian決策理論,本質(zhì)上是邏輯完備的,是在多個(gè)參與者及行為相互影響下的最優(yōu)決策方法。博弈是系統(tǒng)局勢(shì),至少應(yīng)包括參與者、策略和收益3要素,參與者是博弈存在的基礎(chǔ),可以是任何與其他系統(tǒng)存在競(jìng)爭(zhēng)合作關(guān)系的系統(tǒng);策略是參與者根據(jù)系統(tǒng)局勢(shì)和各方情況在采取具體行為前進(jìn)行的分析與考量;收益指各參與方在經(jīng)過一系列競(jìng)爭(zhēng)合作采用各種策略后,己方獲得的目標(biāo)收益。
對(duì)系統(tǒng)操作者與管理者實(shí)施不同行為的相互影響,最終達(dá)到各方收益的過程是博弈過程,具有各行為相互作用構(gòu)成的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu),適合使用SFN處理。
首先給出假設(shè):1)系統(tǒng)博弈主體為操作者和管理者;2)操作者行為包括安全和不安全行為;3)管理者行為包括懲罰和獎(jiǎng)勵(lì)行為;4)操作者代表系統(tǒng)操作和工作人員;5)管理者代表系統(tǒng)管理和所有人,管理者收益等同于系統(tǒng)收益;6)每個(gè)操作者和管理者只對(duì)1個(gè)邊緣事件產(chǎn)生行為。強(qiáng)調(diào)操作者和管理者行為的演化最終結(jié)果時(shí)稱為系統(tǒng)收益;強(qiáng)調(diào)操作者和管理者對(duì)立時(shí)稱為管理者收益。建立博弈演化與收益分析方法,從基本參數(shù)確定、博弈過程的博弈邏輯關(guān)系、博弈演化結(jié)果表示與確定3方面具體實(shí)現(xiàn)。
(1)
式中:Cavg為操作者采取的安全和不安全行為給操作者帶來的收益集合;P為安全行為發(fā)生概率;CA為安全行為給操作者帶來的收益集合;CU為不安全行為給操作者帶來的收益集合;Q為懲罰發(fā)生概率;R1為操作者執(zhí)行安全行為給操作者帶來的收益集合;R2為操作者執(zhí)行安全行為給系統(tǒng)帶來的收益集合;R3為操作者執(zhí)行不安全行為給操作者帶來的收益集合。
(2)
式中:Xavg為管理者采取的懲罰和獎(jiǎng)勵(lì)行為給系統(tǒng)帶來的收益集合;XF為懲罰行為給系統(tǒng)帶來的收益集合;XZ為獎(jiǎng)勵(lì)行為給系統(tǒng)帶來的收益集合;R4為操作者執(zhí)行不安全行為給系統(tǒng)帶來的收益集合;B1為管理者對(duì)操作者不安全行為實(shí)施懲罰行為的罰金集合;H為操作者不安全行為帶來的系統(tǒng)損失集合;B2為管理者對(duì)操作者安全行為實(shí)施獎(jiǎng)勵(lì)行為的獎(jiǎng)金集合。
在SFEP中,各種事件是相互交織在一起的網(wǎng)絡(luò)結(jié)構(gòu),其聯(lián)系是因果關(guān)系,常見的包括與、或和傳遞關(guān)系。與關(guān)系表示原因事件同時(shí)存在導(dǎo)致結(jié)果事件;或關(guān)系表示只要有1個(gè)原因事件存在就可導(dǎo)致結(jié)果事件;傳遞關(guān)系表示有且只有1個(gè)原因事件可導(dǎo)致結(jié)果事件。當(dāng)然還有更復(fù)雜的邏輯關(guān)系存在于事件之間,例如泛邏輯學(xué)中柔性邏輯關(guān)系有20種[17-18]。這里為說明方便只給出常用的與或邏輯關(guān)系的操作者收益和管理者收益表達(dá)式。采用悲觀和樂觀2個(gè)角度研究其收益關(guān)系。悲觀情況下操作者收益和管理者收益的與或邏輯表達(dá)式,如式(3)~(4)所示:
(3)
(4)
樂觀情況下,操作者收益和管理者收益的與或邏輯表達(dá)式,如式(5)~(6)所示:
(5)
(6)
由式(3)~(6)可知,悲觀情況下操作者的收益盡可能大,管理者收益盡可能??;反之樂觀情況下,操作者的收益盡可能小,管理者收益盡可能大。因此樂觀和悲觀是對(duì)管理者而言的。
系統(tǒng)故障發(fā)生往往是很多原因造成的,可歸結(jié)為人、機(jī)、環(huán)、管4方面。機(jī)器可靠性最高,如人按照規(guī)章制度安全操作,機(jī)器不會(huì)出現(xiàn)不安全狀態(tài)導(dǎo)致故障;同理環(huán)境對(duì)系統(tǒng)故障的影響在非極端條件下亦不明顯,且一般通過對(duì)人的干擾使人產(chǎn)生不安全行為造成故障,因此在整個(gè)系統(tǒng)中,人和管顯得特別重要。
在SFEP中,最初的原因事件稱為邊緣事件,可描述操作者對(duì)系統(tǒng)的操作行為。無論安全或不安全行為,在多個(gè)邊緣事件描述的多個(gè)操作者行為后,總能通過SFEP得到SFN,進(jìn)而最終演化得到眾多操作者在系統(tǒng)層面的收益。當(dāng)然這些邊緣事件的主體可能是同1個(gè)操作者,也可能是多個(gè)操作者,但從操作行為角度這并不重要,操作行為的事件數(shù)量才是關(guān)鍵。同理,對(duì)應(yīng)于任何操作都有相應(yīng)的管理行為,包括懲罰和獎(jiǎng)勵(lì)??梢姴僮髡?、操作行為、管理者、管理行為的數(shù)量相同,都對(duì)應(yīng)于同一組邊緣事件,最終演化得到眾多管理者在系統(tǒng)層面的收益。對(duì)操作者和管理者而言,經(jīng)歷整個(gè)SFEP后,如果操作者收益CSFN大于管理者收益XSFN,則操作者勝出,對(duì)管理者不利;反之CSFN小于XSFN,則管理者勝出,對(duì)操作者不利。作為系統(tǒng)的管理者和投資方希望后者出現(xiàn);而作為操作者和被雇傭者則希望前者出現(xiàn),可見操作者和管理者構(gòu)成了博弈關(guān)系。
將SFEP表示為SFN后由事件和連接組成,邊緣事件可代表操作者和管理者行為后的收益,對(duì)應(yīng)的最終事件可代表博弈演化后操作者和管理者的收益;連接表示二者行為后收益之間的邏輯關(guān)系,連接蘊(yùn)含著傳遞概率,表示原因事件導(dǎo)致結(jié)果事件的發(fā)生概率。由于事件代表操作者和管理者收益,因此設(shè)傳遞概率為1。CSFN和XSFN及關(guān)系,如式(7)所示:
(7)
根據(jù)SFN通過式(7)得到SFEP的博弈演化過程表達(dá)式CSFN和XSFN,進(jìn)一步解析式(3)~(6)得到博弈演化過程收益表達(dá)式。樂觀和悲觀2種情況分別對(duì)應(yīng)式(5)~(6)和式(3)~(4),再將所有操作者收益如式(1)和對(duì)應(yīng)的管理者收益如式(2),帶入博弈演化過程收益表達(dá)式,可最終得到二者博弈結(jié)果。
根據(jù)式(1)~(2)和圖1,得到邊緣事件的操作者收益和管理者收益,根據(jù)系統(tǒng)結(jié)構(gòu)系統(tǒng)層面的操作者收益和管理者收益如式(8)所示:
(8)
進(jìn)一步,式(8)結(jié)合式(3)~(4)進(jìn)行悲觀角度的操作者和管理者博弈,如式(9)所示:
(9)
式(8)結(jié)合式(5)~(6)進(jìn)行樂觀角度的操作者和管理者博弈,如式(10)所示:
(10)
通過上述過程即可求出悲觀和樂觀情況下CSFN和XSFN的關(guān)系,樂觀時(shí)管理者的系統(tǒng)收益最大化,悲觀時(shí)操作者的群體利益最大化。當(dāng)確定了圖1中4項(xiàng)工作對(duì)于操作者和管理者的收益具體值后,帶入式(9)~(10)可求得CSFN和XSFN的具體數(shù)值,并比較關(guān)系獲得悲觀和樂觀情況下的博弈勝出者,進(jìn)而為操作者和管理者選擇適合的行為進(jìn)行收益博弈提供決策依據(jù)。由于是數(shù)值帶入過程,且式(9)~(10)計(jì)算簡(jiǎn)單,因此這里對(duì)帶入計(jì)算不做贅述。
1)研究博弈過程的博弈邏輯關(guān)系?;赟FN的事件間邏輯關(guān)系,采用悲觀和樂觀2個(gè)角度研究事件間相互作用后的收益關(guān)系。給出悲觀和樂觀情況下操作者收益和管理者收益的與或邏輯表達(dá)式。
2)研究博弈過程的演化結(jié)果。基于SFN的演化過程得到系統(tǒng)層面的操作者和管理者的博弈演化過程表達(dá)式和博弈演化過程收益表達(dá)式,并最終判斷勝出者。通過實(shí)例說明算法的流程和有效性。