亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高鐵運營安全監(jiān)督系統(tǒng)獎懲機(jī)制優(yōu)化研究

        2018-10-29 05:05:16李科宏張亞東
        關(guān)鍵詞:路局獎懲鐵路局

        李科宏,張亞東,郭 進(jìn)

        (西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院,成都610031)

        0 引 言

        目前,我國高速鐵路已經(jīng)由大規(guī)模建設(shè)階段逐步向穩(wěn)定運營階段轉(zhuǎn)化,因此,國家鐵路局和鐵路總公司制定和出臺了各項安全規(guī)章來對高鐵運營過程進(jìn)行安全管理.高鐵運營安全監(jiān)管制度是保證各項規(guī)章貫徹實施的關(guān)鍵,有必要建立完善的監(jiān)管獎懲機(jī)制以控制系統(tǒng)中各相關(guān)方的違規(guī)行為.在委托運輸管理模式[1]下,有關(guān)高鐵運營安全監(jiān)督系統(tǒng)獎懲機(jī)制存在問題的研究大多為定性分析.陳茂瑩[2]認(rèn)為應(yīng)該完善針對委托路局的獎懲考核機(jī)制以確保其完成經(jīng)營目標(biāo).韓世通[3]認(rèn)為應(yīng)當(dāng)修訂和完善激勵約束機(jī)制以加強(qiáng)高鐵委托運輸管理.姬志洲等[4]使用博弈論研究鐵路企業(yè)與監(jiān)管部門之間存在的行為以提高監(jiān)管效率.在其他領(lǐng)域,張弓亮等[5]使用演化博弈論對高速公路共謀逃費行為進(jìn)行了分析,認(rèn)為增強(qiáng)對監(jiān)管者的監(jiān)管和處罰力度等措施可以有效遏制共謀逃費現(xiàn)象.蔡玲如[6]使用演化博弈論對環(huán)境污染的治理問題進(jìn)行了研究,認(rèn)為將懲罰力度與被監(jiān)督檢查方的違規(guī)率相聯(lián)系有助于抑制博弈過程的波動.賈璐[7]使用演化博弈論對工程安全監(jiān)管過程中的相關(guān)方進(jìn)行分析,提出了制定懲罰策略的建議.李振龍等[8]使用演化博弈論建立了超速駕駛行為的博弈模型,提出通過獎懲措施來規(guī)范交通管理者和超速駕駛員的行為.朱慶華等[9]使用演化博弈論分析了碳減排政策下地方政府與制造企業(yè)雙方的博弈關(guān)系,并引入政府動態(tài)補償策略,剖析政企雙方策略的互動機(jī)制.

        之前的工作中[10],我們通過分析高鐵運營安全監(jiān)督系統(tǒng)現(xiàn)狀,建立了高鐵公司、國家鐵路局和委托路局三方組成的系統(tǒng)靜態(tài)演化博弈模型.通過演化博弈理論證明結(jié)合系統(tǒng)動力學(xué)(SD)仿真,得到了系統(tǒng)各方在博弈過程中產(chǎn)生利益沖突的長期動態(tài)波動特征并驗證了該模型不存在演化穩(wěn)定策略均衡(ESS).本文通過對靜態(tài)模型進(jìn)行優(yōu)化,分別提出動態(tài)獎勵,動態(tài)獎懲和優(yōu)化動態(tài)獎懲模型,最終通過優(yōu)化動態(tài)獎懲模型使系統(tǒng)演化博弈的波動趨勢得到有效抑制并達(dá)到最優(yōu),為提高高鐵安全監(jiān)督的效果提供了理論支持.

        1 高鐵運營安全監(jiān)督系統(tǒng)動態(tài)獎勵演化博弈模型分析

        1.1 動態(tài)獎勵模型描述及建立

        假設(shè)國家鐵路局以比率X對委托路局的安全生產(chǎn)狀況進(jìn)行監(jiān)管,X=0和1分別表示不監(jiān)管和實時監(jiān)管.假設(shè)國家鐵路局對委托路局進(jìn)行監(jiān)管的支付成本為CS.如果國家鐵路局不進(jìn)行監(jiān)管,則委托路局可能違反高鐵委托運輸協(xié)議及安全規(guī)章,導(dǎo)致事故發(fā)生率上升,其將承擔(dān)后期的資產(chǎn)和聲譽損失成本為Ls;如果國家鐵路局對委托路局和高鐵公司進(jìn)行監(jiān)管,發(fā)現(xiàn)他們存在違規(guī)行為將分別對其進(jìn)行處罰PR和PE.假設(shè)委托路局按照國家鐵路局的相關(guān)規(guī)章和與高鐵公司簽訂的委托協(xié)議進(jìn)行安全投入,安全投入率為Y,其正常生產(chǎn)所獲得的收益為πR,而違反協(xié)議進(jìn)行違規(guī)操作時,將獲得收益CR(即節(jié)約的安全投入成本),同時承擔(dān)高鐵事故率上升的期望損失成本W(wǎng)R.假設(shè)高鐵公司以比率Z對委托路局進(jìn)行安全監(jiān)督,高鐵公司嚴(yán)格監(jiān)督的成本為CE,但在嚴(yán)格監(jiān)督的情況下可能由于監(jiān)督人員素質(zhì)等原因出現(xiàn)監(jiān)督失誤,失誤率為RE;假定高鐵公司安全監(jiān)督獲取的正常收入為πE,而不監(jiān)督時,將承擔(dān)后期的期望損失成本LE.

        由于之前建立的靜態(tài)演化博弈模型并不存在ESS,為了抑制系統(tǒng)各方在博弈過程中產(chǎn)生的波動性,國家鐵路局可以根據(jù)安全監(jiān)管的結(jié)果,使用動態(tài)獎勵機(jī)制對委托路局和高鐵公司進(jìn)行獎勵[9].假設(shè)對委托路局的獎勵與其安全投入率成正比,對高鐵公司的獎勵與其履行監(jiān)督職責(zé)的比率成正比,即B′R=αYBR,B′E=βZBE,其中,BR,BE分別為國家鐵路局對委托路局和高鐵公司的一般性獎勵,α,β分別為獎勵系數(shù)(初始都為1).則使用動態(tài)獎勵策略,國家鐵路局,高鐵公司與委托路局博弈三方的收益矩陣如表1所示.

        1.2 動態(tài)獎勵模型三方復(fù)制動態(tài)系統(tǒng)

        根據(jù)演化博弈理論,結(jié)合表1可得動態(tài)獎勵場景下,高鐵運營安全監(jiān)督系統(tǒng)博弈演化的復(fù)制動態(tài)方程組為

        表1 國家鐵路局、委托路局和高鐵公司的收益矩陣Table 1 Payoff matrix of the regulatory agencies,commissioned railway bureau and high-speed railway company

        由式(1)可得博弈系統(tǒng)的雅可比矩陣為

        其中,

        由于模型的表達(dá)式比較復(fù)雜,為了方便求解分析,首先對相關(guān)變量進(jìn)行賦值解得各個均衡點,然后通過理論推導(dǎo)和SD仿真分析博弈模型各個均衡點的穩(wěn)定性.通過文獻(xiàn)[9]并結(jié)合領(lǐng)域內(nèi)專家經(jīng)驗,得到模型中各參數(shù)設(shè)置如表2所示.

        表2 仿真參數(shù)設(shè)置Table 2 Simulation parameter setting

        1.3 動態(tài)獎勵模型求解及穩(wěn)定性證明

        Friedman提出通過分析系統(tǒng)在均衡點時雅可比矩陣(Jacobian)行列式和特征值的方法來得到系統(tǒng)復(fù)制動態(tài)方程均衡點的穩(wěn)定性[11-12].根據(jù)李雅普諾夫(Lyapunov)穩(wěn)定性理論,若所有特征值均具有非正實部,則系統(tǒng)穩(wěn)定,否則系統(tǒng)不穩(wěn)定.將表2中的參數(shù)設(shè)置帶入式(1)和式(2)中計算可以得到模型各均衡點對應(yīng)的特征值及其穩(wěn)定狀態(tài),如表3所示.由表3可知,該模型并不存在ESS.

        1.4 基于SD的動態(tài)獎勵模型穩(wěn)定性分析

        在高鐵運營安全監(jiān)督系統(tǒng)演化博弈過程中,每個博弈參與者會主動模仿同種群其他高收益參與者的行為,從而動態(tài)改變自己的策略,因此,可以使用SD方法來分析均衡解的穩(wěn)定性[6-7,13].根據(jù)上述博弈模型的假設(shè),運用Vensim PLE 5.6a建立系統(tǒng)的動態(tài)獎勵演化博弈模型如圖1所示.該模型由3個子系統(tǒng)構(gòu)成,分別為國家鐵路局子系統(tǒng)、高鐵公司子系統(tǒng)及委托路局子系統(tǒng).其中模型的所有變量賦值及變量間的關(guān)系可以參照表1和式(1)中的3個復(fù)制動態(tài)方程.

        表3 動態(tài)獎勵策略模型各均衡點及其特征值Table 3 Equilibrium point and characteristic values of the game model based on dynamic rewarding scenario

        圖1 高鐵運營安全監(jiān)督系統(tǒng)動態(tài)獎勵演化博弈SD模型Fig.1 System dynamics model of high-speed railway operation safety supervision evolution game system based on dynamic rewarding scenario

        以E10為例進(jìn)行仿真,模型設(shè)定如下:INITIALTIME=0,F(xiàn)INALTIME=40,TIMESTEP=0.007 812,Units for Time=week,Integration Type:Euler.仿真結(jié)果如圖2所示.由圖2(a)可知,博弈三方表現(xiàn)出了相對穩(wěn)定的狀態(tài);但是如果其初始選擇策略發(fā)生微小改變(X=0.434 6改變?yōu)閄=0.43),則仿真結(jié)果如圖2(b)所示,說明均衡點E10的平衡狀態(tài)并不穩(wěn)定.

        圖2 E10策略下系統(tǒng)演化博弈過程Fig.2 Game results under the equilibrium solutionE10 strategy and mutation

        2 高鐵運營安全監(jiān)督系統(tǒng)動態(tài)獎懲演化博弈模型分析

        2.1 動態(tài)獎懲模型求解及穩(wěn)定性證明

        在控制博弈過程波動性的研究中,文獻(xiàn)[6-7]提出將違規(guī)處罰與其違規(guī)概率相聯(lián)系來控制模型策略的波動.因此在動態(tài)獎勵模型的基礎(chǔ)上,本文提出動態(tài)獎懲模型,在動態(tài)獎勵的同時國家鐵路局對委托路局和高鐵公司進(jìn)行動態(tài)處罰,即對委托路局的處罰與其違法行為的比率成正比,對高鐵公司的處罰與其忽視監(jiān)督職責(zé)的比率成正比,分別為,其中γ,δ和PR,PE分別為對委托路局和高鐵公司的處罰系數(shù)和一般性處罰.令處罰系數(shù)γ,δ都等于1,則將帶入式(1)和式(2)中,可以解得8個純策略均衡解和2個混合策略解,分別求其相應(yīng)的特征值,可以得到每個均衡解的穩(wěn)定狀態(tài)如表4所示.

        表4 動態(tài)獎懲策略模型各均衡點及其特征值Table 4 Equilibrium point and characteristic values of the dynamic rewarding and punishment game model

        2.2 基于SD的動態(tài)獎懲模型穩(wěn)定性分析

        通過SD仿真對動態(tài)獎懲模型的各均衡點進(jìn)行驗證,系統(tǒng)演化博弈SD模型如圖3所示.

        在動態(tài)獎懲場景下,當(dāng)隨機(jī)選取系統(tǒng)博弈三方的初始策略分別為X=0.1,Y=0.1,Z=0.1時,系統(tǒng)演化博弈模型的仿真結(jié)果如圖4所示.

        從圖4可以看出,動態(tài)獎懲場景下,系統(tǒng)博弈三方的博弈演化過程都大概收斂于

        說明存在ESS使博弈過程最終趨于穩(wěn)定狀態(tài),這同表4顯示的結(jié)果一致.同時,動態(tài)獎懲場景下的系統(tǒng)演化博弈過程在前期仍然有比較大幅的波動,雖然最終國家鐵路局的安全監(jiān)管率和高鐵公司的監(jiān)督檢查率穩(wěn)定值都比較高,但委托路局的安全投入率穩(wěn)定值卻剛剛過半.由于在實際當(dāng)中,國家鐵路局的安全監(jiān)管應(yīng)該比較有限,高鐵運營安全生產(chǎn)更多依靠高鐵公司的實時監(jiān)督,說明最終模型仿真的穩(wěn)定效果并不理想.

        圖3 高鐵運營安全監(jiān)督系統(tǒng)動態(tài)獎懲演化博弈SD模型Fig.3 SD model of high-speed railway operation safety supervision evolution game system based on dynamic rewarding and punishment scenario

        圖4 動態(tài)獎懲場景下的系統(tǒng)演化博弈過程Fig.4 Game results based on dynamic rewarding and punishment scenario

        3 高鐵運營安全監(jiān)督系統(tǒng)優(yōu)化動態(tài)獎懲演化博弈模型分析

        3.1 優(yōu)化動態(tài)獎懲模型求解及穩(wěn)定性證明

        為了使系統(tǒng)各方的博弈過程達(dá)到最優(yōu),在動態(tài)獎懲模型的基礎(chǔ)上提出優(yōu)化動態(tài)獎懲模型繼續(xù)進(jìn)行追加處罰和獎勵,即國家鐵路局對委托路局和高鐵公司的處罰和獎勵,分別為

        式中:γ1,γ2,δ1,δ2和α1,α2,β1,β2分別為國家鐵路局對委托路局和高鐵公司的處罰和獎勵系數(shù),且都設(shè)為1.

        同樣,通過式(1)和式(2),可以解得8個純策略均衡解和1個混合策略均衡解,然后得到每個均衡解的穩(wěn)定狀態(tài).特別地,對于,由于復(fù)制動態(tài)方程組中包含X為分母的情況,所以其不能為零.因此,使用占位符R代替X.對于,其對應(yīng)的特征值為 :λ1=-R2-2R-1/2,λ2=-R2/4-3R-1,λ3=15R2/4+19R/2-6,由于R接近于0,可以得到λ1,λ2,λ3都小于0,所以該均衡解是ESS.同理可以證明其他均衡解E2′-E9′都不是ESS.9個均衡解的特征值及其均衡狀態(tài)如表5所示.

        3.2 基于SD的優(yōu)化動態(tài)獎懲模型穩(wěn)定性分析

        使用SD仿真對模型的各均衡點進(jìn)行驗證,則優(yōu)化后的系統(tǒng)演化博弈SD模型,如圖5所示.

        在優(yōu)化動態(tài)獎懲模型下,當(dāng)隨機(jī)選取系統(tǒng)博弈三方的初始策略分別為X=0.5,Y=0.5,Z=0.5時,系統(tǒng)演化博弈模型的仿真結(jié)果如圖6所示.

        表5 優(yōu)化動態(tài)獎懲模型各均衡點及其特征值Table 5 Equilibrium point and characteristic values of the optimized dynamic rewarding and punishment game model

        圖5 高鐵運營安全監(jiān)督系統(tǒng)優(yōu)化動態(tài)獎懲策略演化博弈SD模型Fig.5 System dynamics model of high-speed railway operation safety supervision evolution game system based on optimized dynamic rewarding and punishment scenario

        圖6 優(yōu)化動態(tài)獎懲場景下的系統(tǒng)演化博弈過程Fig.6 Game results based on optimized dynamic rewarding and punishment scenario

        綜上,通過理論證明,結(jié)合SD對高鐵運營安全監(jiān)督系統(tǒng)演化博弈進(jìn)行仿真是解決演化博弈均衡解穩(wěn)定性分析的有效方法.通過仿真發(fā)現(xiàn),動態(tài)獎勵場景下委托路局選擇進(jìn)行安全投入的比率存在波動增大的現(xiàn)象;動態(tài)獎懲場景下,其波動狀態(tài)得到有效抑制,安全投入率的演化過程存在ESS,但并未達(dá)到最優(yōu);優(yōu)化動態(tài)獎懲場景下,委托路局違反協(xié)議的行為得到有效控制,安全投入率在短期內(nèi)達(dá)到最優(yōu).

        4 結(jié)論

        本文通過對高鐵運營安全監(jiān)督系統(tǒng)靜態(tài)演化博弈模型進(jìn)行優(yōu)化,分別建立了基于動態(tài)獎勵,動態(tài)獎懲和優(yōu)化動態(tài)獎懲場景下的,包括國家鐵路局、高鐵公司和委托路局三方在高鐵運營安全監(jiān)督過程中的系統(tǒng)演化博弈模型,并通過演化博弈理論結(jié)合SD仿真,分析了3種場景下博弈三方策略的動態(tài)選擇博弈過程.通過使用動態(tài)獎懲和優(yōu)化動態(tài)獎懲模型,可以有效控制博弈三方策略選擇的波動性,獲得ESS.特別的,通過優(yōu)化動態(tài)獎懲模型,國家鐵路局的安全監(jiān)管率下降的同時,高鐵公司的安全監(jiān)督檢查率和委托路局的安全投入率都得到了有效提高,使三方在長期博弈過程中達(dá)到最優(yōu)狀態(tài).以上結(jié)果為委托運輸管理模式下,高鐵運營安全監(jiān)管機(jī)制的設(shè)計和應(yīng)用提供了思路,具有重大的理論和實踐意義.

        本文中模型參數(shù)的賦值是基于參考文獻(xiàn)[7]并結(jié)合本領(lǐng)域?qū)<医?jīng)驗的基礎(chǔ)上得到的,與實際情況可能存在差異,在未來的工作中,將進(jìn)一步結(jié)合現(xiàn)場實際數(shù)據(jù)對模型進(jìn)行仿真研究,以得到更具說服力的結(jié)果.

        猜你喜歡
        路局獎懲鐵路局
        基于模糊馬爾可夫鏈的獎懲系統(tǒng)*
        既有災(zāi)害監(jiān)測系統(tǒng)接入鐵路局中心系統(tǒng)方案研究
        呼和浩特鐵路局GSM-R系統(tǒng)現(xiàn)場應(yīng)用故障分析與處理
        路局車輛調(diào)度管理工作的思考
        路局補充醫(yī)療保險系統(tǒng)應(yīng)用及優(yōu)化
        論如何正確對待高校學(xué)生獎懲工作
        長江叢刊(2017年10期)2017-11-24 21:42:52
        我國納稅信用體系建設(shè)研究
        路局至總公司視頻會議網(wǎng)絡(luò)補強(qiáng)方案研究
        獎懲
        建立站段路局三級減速頂設(shè)備維修管理信息化系統(tǒng)的研究
        欧洲日本一线二线三线区本庄铃| 亚洲精品国产一区二区免费视频| 免费的日本一区二区三区视频| 亚洲综合激情五月丁香六月| 亚洲日韩欧美国产高清αv| 久久久久久久久高潮无码| 国产一区二区三区成人av| 日本孕妇潮喷高潮视频| 欧美艳星nikki激情办公室| 窝窝午夜看片| 国产一区二区三精品久久久无广告| 亚洲专区欧美| 国产精品欧美久久久久老妞| 人妻精品人妻一区二区三区四五| 精品久久中文字幕一区 | 久久综合成人网| 欧美中出在线| 男女男在线精品免费观看 | 国产精品videossex久久发布| 精品久久久久久无码中文字幕| 女人被做到高潮免费视频| 久久久国产精品粉嫩av| 国产自拍在线观看视频| 伊人久久大香线蕉午夜av| 国产成人精品一区二区三区免费| 在线观看一区二区女同| 亚洲av手机在线一区| 亚洲最大在线视频一区二区| 国产欧美日韩中文久久| 中文字幕人妻丝袜乱一区三区| 久久精品无码一区二区三区不卡| 日本看片一区二区三区| 国产精品内射久久一级二| 俺去啦最新地址| 亚洲精品国精品久久99热一| 国产精品美女久久久久浪潮AVⅤ| 丝袜美腿福利视频在线| 无码中文字幕日韩专区| 久久久久无码国产精品不卡| 激情人妻中出中文字幕一区| 黄片视频免费在线播放观看|