亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

高鐵運營安全監(jiān)督系統(tǒng)獎懲機(jī)制優(yōu)化研究

2018-10-29 05:05:16李科宏張亞東

交通運輸系統(tǒng)工程與信息 2018年5期

李科宏，張亞東，郭進(jìn)

(西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院，成都610031)

0 引言

目前，我國高速鐵路已經(jīng)由大規(guī)模建設(shè)階段逐步向穩(wěn)定運營階段轉(zhuǎn)化，因此，國家鐵路局和鐵路總公司制定和出臺了各項安全規(guī)章來對高鐵運營過程進(jìn)行安全管理.高鐵運營安全監(jiān)管制度是保證各項規(guī)章貫徹實施的關(guān)鍵，有必要建立完善的監(jiān)管獎懲機(jī)制以控制系統(tǒng)中各相關(guān)方的違規(guī)行為.在委托運輸管理模式[1]下，有關(guān)高鐵運營安全監(jiān)督系統(tǒng)獎懲機(jī)制存在問題的研究大多為定性分析.陳茂瑩[2]認(rèn)為應(yīng)該完善針對委托路局的獎懲考核機(jī)制以確保其完成經(jīng)營目標(biāo).韓世通[3]認(rèn)為應(yīng)當(dāng)修訂和完善激勵約束機(jī)制以加強(qiáng)高鐵委托運輸管理.姬志洲等[4]使用博弈論研究鐵路企業(yè)與監(jiān)管部門之間存在的行為以提高監(jiān)管效率.在其他領(lǐng)域，張弓亮等[5]使用演化博弈論對高速公路共謀逃費行為進(jìn)行了分析，認(rèn)為增強(qiáng)對監(jiān)管者的監(jiān)管和處罰力度等措施可以有效遏制共謀逃費現(xiàn)象.蔡玲如[6]使用演化博弈論對環(huán)境污染的治理問題進(jìn)行了研究，認(rèn)為將懲罰力度與被監(jiān)督檢查方的違規(guī)率相聯(lián)系有助于抑制博弈過程的波動.賈璐[7]使用演化博弈論對工程安全監(jiān)管過程中的相關(guān)方進(jìn)行分析，提出了制定懲罰策略的建議.李振龍等[8]使用演化博弈論建立了超速駕駛行為的博弈模型，提出通過獎懲措施來規(guī)范交通管理者和超速駕駛員的行為.朱慶華等[9]使用演化博弈論分析了碳減排政策下地方政府與制造企業(yè)雙方的博弈關(guān)系，并引入政府動態(tài)補償策略，剖析政企雙方策略的互動機(jī)制.

之前的工作中[10]，我們通過分析高鐵運營安全監(jiān)督系統(tǒng)現(xiàn)狀，建立了高鐵公司、國家鐵路局和委托路局三方組成的系統(tǒng)靜態(tài)演化博弈模型.通過演化博弈理論證明結(jié)合系統(tǒng)動力學(xué)(SD)仿真，得到了系統(tǒng)各方在博弈過程中產(chǎn)生利益沖突的長期動態(tài)波動特征并驗證了該模型不存在演化穩(wěn)定策略均衡(ESS).本文通過對靜態(tài)模型進(jìn)行優(yōu)化，分別提出動態(tài)獎勵，動態(tài)獎懲和優(yōu)化動態(tài)獎懲模型，最終通過優(yōu)化動態(tài)獎懲模型使系統(tǒng)演化博弈的波動趨勢得到有效抑制并達(dá)到最優(yōu)，為提高高鐵安全監(jiān)督的效果提供了理論支持.

1 高鐵運營安全監(jiān)督系統(tǒng)動態(tài)獎勵演化博弈模型分析

1.1 動態(tài)獎勵模型描述及建立

假設(shè)國家鐵路局以比率X對委托路局的安全生產(chǎn)狀況進(jìn)行監(jiān)管，X=0和1分別表示不監(jiān)管和實時監(jiān)管.假設(shè)國家鐵路局對委托路局進(jìn)行監(jiān)管的支付成本為CS.如果國家鐵路局不進(jìn)行監(jiān)管，則委托路局可能違反高鐵委托運輸協(xié)議及安全規(guī)章，導(dǎo)致事故發(fā)生率上升，其將承擔(dān)后期的資產(chǎn)和聲譽損失成本為Ls；如果國家鐵路局對委托路局和高鐵公司進(jìn)行監(jiān)管，發(fā)現(xiàn)他們存在違規(guī)行為將分別對其進(jìn)行處罰PR和PE.假設(shè)委托路局按照國家鐵路局的相關(guān)規(guī)章和與高鐵公司簽訂的委托協(xié)議進(jìn)行安全投入，安全投入率為Y，其正常生產(chǎn)所獲得的收益為πR，而違反協(xié)議進(jìn)行違規(guī)操作時，將獲得收益CR(即節(jié)約的安全投入成本)，同時承擔(dān)高鐵事故率上升的期望損失成本W(wǎng)R.假設(shè)高鐵公司以比率Z對委托路局進(jìn)行安全監(jiān)督，高鐵公司嚴(yán)格監(jiān)督的成本為CE，但在嚴(yán)格監(jiān)督的情況下可能由于監(jiān)督人員素質(zhì)等原因出現(xiàn)監(jiān)督失誤，失誤率為RE；假定高鐵公司安全監(jiān)督獲取的正常收入為πE，而不監(jiān)督時，將承擔(dān)后期的期望損失成本LE.

由于之前建立的靜態(tài)演化博弈模型并不存在ESS，為了抑制系統(tǒng)各方在博弈過程中產(chǎn)生的波動性，國家鐵路局可以根據(jù)安全監(jiān)管的結(jié)果，使用動態(tài)獎勵機(jī)制對委托路局和高鐵公司進(jìn)行獎勵[9].假設(shè)對委托路局的獎勵與其安全投入率成正比，對高鐵公司的獎勵與其履行監(jiān)督職責(zé)的比率成正比，即B′R=αYBR，B′E=βZBE，其中，BR，BE分別為國家鐵路局對委托路局和高鐵公司的一般性獎勵，α，β分別為獎勵系數(shù)(初始都為1).則使用動態(tài)獎勵策略，國家鐵路局，高鐵公司與委托路局博弈三方的收益矩陣如表1所示.

1.2 動態(tài)獎勵模型三方復(fù)制動態(tài)系統(tǒng)

根據(jù)演化博弈理論，結(jié)合表1可得動態(tài)獎勵場景下，高鐵運營安全監(jiān)督系統(tǒng)博弈演化的復(fù)制動態(tài)方程組為

表1 國家鐵路局、委托路局和高鐵公司的收益矩陣Table 1 Payoff matrix of the regulatory agencies,commissioned railway bureau and high-speed railway company

由式(1)可得博弈系統(tǒng)的雅可比矩陣為

其中，

由于模型的表達(dá)式比較復(fù)雜，為了方便求解分析，首先對相關(guān)變量進(jìn)行賦值解得各個均衡點，然后通過理論推導(dǎo)和SD仿真分析博弈模型各個均衡點的穩(wěn)定性.通過文獻(xiàn)[9]并結(jié)合領(lǐng)域內(nèi)專家經(jīng)驗，得到模型中各參數(shù)設(shè)置如表2所示.

表2 仿真參數(shù)設(shè)置Table 2 Simulation parameter setting

1.3 動態(tài)獎勵模型求解及穩(wěn)定性證明

Friedman提出通過分析系統(tǒng)在均衡點時雅可比矩陣(Jacobian)行列式和特征值的方法來得到系統(tǒng)復(fù)制動態(tài)方程均衡點的穩(wěn)定性[11-12].根據(jù)李雅普諾夫(Lyapunov)穩(wěn)定性理論，若所有特征值均具有非正實部，則系統(tǒng)穩(wěn)定，否則系統(tǒng)不穩(wěn)定.將表2中的參數(shù)設(shè)置帶入式(1)和式(2)中計算可以得到模型各均衡點對應(yīng)的特征值及其穩(wěn)定狀態(tài)，如表3所示.由表3可知，該模型并不存在ESS.

1.4 基于SD的動態(tài)獎勵模型穩(wěn)定性分析

在高鐵運營安全監(jiān)督系統(tǒng)演化博弈過程中，每個博弈參與者會主動模仿同種群其他高收益參與者的行為，從而動態(tài)改變自己的策略，因此，可以使用SD方法來分析均衡解的穩(wěn)定性[6-7,13].根據(jù)上述博弈模型的假設(shè)，運用Vensim PLE 5.6a建立系統(tǒng)的動態(tài)獎勵演化博弈模型如圖1所示.該模型由3個子系統(tǒng)構(gòu)成，分別為國家鐵路局子系統(tǒng)、高鐵公司子系統(tǒng)及委托路局子系統(tǒng).其中模型的所有變量賦值及變量間的關(guān)系可以參照表1和式(1)中的3個復(fù)制動態(tài)方程.

表3 動態(tài)獎勵策略模型各均衡點及其特征值Table 3 Equilibrium point and characteristic values of the game model based on dynamic rewarding scenario

圖1 高鐵運營安全監(jiān)督系統(tǒng)動態(tài)獎勵演化博弈SD模型Fig.1 System dynamics model of high-speed railway operation safety supervision evolution game system based on dynamic rewarding scenario

以E10為例進(jìn)行仿真，模型設(shè)定如下：INITIALTIME=0，F(xiàn)INALTIME=40，TIMESTEP=0.007 812，Units for Time=week，Integration Type:Euler.仿真結(jié)果如圖2所示.由圖2(a)可知，博弈三方表現(xiàn)出了相對穩(wěn)定的狀態(tài)；但是如果其初始選擇策略發(fā)生微小改變(X=0.434 6改變?yōu)閄=0.43)，則仿真結(jié)果如圖2(b)所示，說明均衡點E10的平衡狀態(tài)并不穩(wěn)定.

圖2 E10策略下系統(tǒng)演化博弈過程Fig.2 Game results under the equilibrium solutionE10 strategy and mutation

2 高鐵運營安全監(jiān)督系統(tǒng)動態(tài)獎懲演化博弈模型分析

2.1 動態(tài)獎懲模型求解及穩(wěn)定性證明

在控制博弈過程波動性的研究中，文獻(xiàn)[6-7]提出將違規(guī)處罰與其違規(guī)概率相聯(lián)系來控制模型策略的波動.因此在動態(tài)獎勵模型的基礎(chǔ)上，本文提出動態(tài)獎懲模型，在動態(tài)獎勵的同時國家鐵路局對委托路局和高鐵公司進(jìn)行動態(tài)處罰，即對委托路局的處罰與其違法行為的比率成正比，對高鐵公司的處罰與其忽視監(jiān)督職責(zé)的比率成正比，分別為，其中γ，δ和PR，PE分別為對委托路局和高鐵公司的處罰系數(shù)和一般性處罰.令處罰系數(shù)γ，δ都等于1，則將帶入式(1)和式(2)中，可以解得8個純策略均衡解和2個混合策略解，分別求其相應(yīng)的特征值，可以得到每個均衡解的穩(wěn)定狀態(tài)如表4所示.

表4 動態(tài)獎懲策略模型各均衡點及其特征值Table 4 Equilibrium point and characteristic values of the dynamic rewarding and punishment game model

2.2 基于SD的動態(tài)獎懲模型穩(wěn)定性分析

通過SD仿真對動態(tài)獎懲模型的各均衡點進(jìn)行驗證，系統(tǒng)演化博弈SD模型如圖3所示.

在動態(tài)獎懲場景下，當(dāng)隨機(jī)選取系統(tǒng)博弈三方的初始策略分別為X=0.1，Y=0.1，Z=0.1時，系統(tǒng)演化博弈模型的仿真結(jié)果如圖4所示.

從圖4可以看出，動態(tài)獎懲場景下，系統(tǒng)博弈三方的博弈演化過程都大概收斂于

說明存在ESS使博弈過程最終趨于穩(wěn)定狀態(tài)，這同表4顯示的結(jié)果一致.同時，動態(tài)獎懲場景下的系統(tǒng)演化博弈過程在前期仍然有比較大幅的波動，雖然最終國家鐵路局的安全監(jiān)管率和高鐵公司的監(jiān)督檢查率穩(wěn)定值都比較高，但委托路局的安全投入率穩(wěn)定值卻剛剛過半.由于在實際當(dāng)中，國家鐵路局的安全監(jiān)管應(yīng)該比較有限，高鐵運營安全生產(chǎn)更多依靠高鐵公司的實時監(jiān)督，說明最終模型仿真的穩(wěn)定效果并不理想.

圖3 高鐵運營安全監(jiān)督系統(tǒng)動態(tài)獎懲演化博弈SD模型Fig.3 SD model of high-speed railway operation safety supervision evolution game system based on dynamic rewarding and punishment scenario

圖4 動態(tài)獎懲場景下的系統(tǒng)演化博弈過程Fig.4 Game results based on dynamic rewarding and punishment scenario

3 高鐵運營安全監(jiān)督系統(tǒng)優(yōu)化動態(tài)獎懲演化博弈模型分析

3.1 優(yōu)化動態(tài)獎懲模型求解及穩(wěn)定性證明

為了使系統(tǒng)各方的博弈過程達(dá)到最優(yōu)，在動態(tài)獎懲模型的基礎(chǔ)上提出優(yōu)化動態(tài)獎懲模型繼續(xù)進(jìn)行追加處罰和獎勵，即國家鐵路局對委托路局和高鐵公司的處罰和獎勵，分別為

式中：γ1,γ2,δ1,δ2和α1,α2,β1,β2分別為國家鐵路局對委托路局和高鐵公司的處罰和獎勵系數(shù)，且都設(shè)為1.

同樣，通過式(1)和式(2)，可以解得8個純策略均衡解和1個混合策略均衡解，然后得到每個均衡解的穩(wěn)定狀態(tài).特別地，對于，由于復(fù)制動態(tài)方程組中包含X為分母的情況，所以其不能為零.因此，使用占位符R代替X.對于，其對應(yīng)的特征值為：λ1=-R2-2R-1/2,λ2=-R2/4-3R-1,λ3=15R2/4+19R/2-6，由于R接近于0，可以得到λ1,λ2,λ3都小于0，所以該均衡解是ESS.同理可以證明其他均衡解E2′-E9′都不是ESS.9個均衡解的特征值及其均衡狀態(tài)如表5所示.

3.2 基于SD的優(yōu)化動態(tài)獎懲模型穩(wěn)定性分析

使用SD仿真對模型的各均衡點進(jìn)行驗證，則優(yōu)化后的系統(tǒng)演化博弈SD模型，如圖5所示.

在優(yōu)化動態(tài)獎懲模型下，當(dāng)隨機(jī)選取系統(tǒng)博弈三方的初始策略分別為X=0.5，Y=0.5，Z=0.5時，系統(tǒng)演化博弈模型的仿真結(jié)果如圖6所示.

表5 優(yōu)化動態(tài)獎懲模型各均衡點及其特征值Table 5 Equilibrium point and characteristic values of the optimized dynamic rewarding and punishment game model

圖5 高鐵運營安全監(jiān)督系統(tǒng)優(yōu)化動態(tài)獎懲策略演化博弈SD模型Fig.5 System dynamics model of high-speed railway operation safety supervision evolution game system based on optimized dynamic rewarding and punishment scenario

圖6 優(yōu)化動態(tài)獎懲場景下的系統(tǒng)演化博弈過程Fig.6 Game results based on optimized dynamic rewarding and punishment scenario

綜上，通過理論證明，結(jié)合SD對高鐵運營安全監(jiān)督系統(tǒng)演化博弈進(jìn)行仿真是解決演化博弈均衡解穩(wěn)定性分析的有效方法.通過仿真發(fā)現(xiàn)，動態(tài)獎勵場景下委托路局選擇進(jìn)行安全投入的比率存在波動增大的現(xiàn)象；動態(tài)獎懲場景下，其波動狀態(tài)得到有效抑制，安全投入率的演化過程存在ESS，但并未達(dá)到最優(yōu)；優(yōu)化動態(tài)獎懲場景下，委托路局違反協(xié)議的行為得到有效控制，安全投入率在短期內(nèi)達(dá)到最優(yōu).

4 結(jié)論

本文通過對高鐵運營安全監(jiān)督系統(tǒng)靜態(tài)演化博弈模型進(jìn)行優(yōu)化，分別建立了基于動態(tài)獎勵，動態(tài)獎懲和優(yōu)化動態(tài)獎懲場景下的，包括國家鐵路局、高鐵公司和委托路局三方在高鐵運營安全監(jiān)督過程中的系統(tǒng)演化博弈模型，并通過演化博弈理論結(jié)合SD仿真，分析了3種場景下博弈三方策略的動態(tài)選擇博弈過程.通過使用動態(tài)獎懲和優(yōu)化動態(tài)獎懲模型，可以有效控制博弈三方策略選擇的波動性，獲得ESS.特別的，通過優(yōu)化動態(tài)獎懲模型，國家鐵路局的安全監(jiān)管率下降的同時，高鐵公司的安全監(jiān)督檢查率和委托路局的安全投入率都得到了有效提高，使三方在長期博弈過程中達(dá)到最優(yōu)狀態(tài).以上結(jié)果為委托運輸管理模式下，高鐵運營安全監(jiān)管機(jī)制的設(shè)計和應(yīng)用提供了思路，具有重大的理論和實踐意義.

本文中模型參數(shù)的賦值是基于參考文獻(xiàn)[7]并結(jié)合本領(lǐng)域?qū)＜医?jīng)驗的基礎(chǔ)上得到的，與實際情況可能存在差異，在未來的工作中，將進(jìn)一步結(jié)合現(xiàn)場實際數(shù)據(jù)對模型進(jìn)行仿真研究，以得到更具說服力的結(jié)果.