董 超,劉 杰
(昆明理工大學(xué) 公共安全與應(yīng)急管理學(xué)院,昆明 650031)
當(dāng)前人們出行方式多元化,越來越多的人選擇快速的民航交通運(yùn)輸,然而民航作為高風(fēng)險(xiǎn)行業(yè)始終是大眾和媒體關(guān)注的焦點(diǎn),民航事故的發(fā)生不僅造成人員傷亡和財(cái)產(chǎn)損失,更會(huì)造成人們的恐慌,安全和效益始終是我國(guó)民航發(fā)展需要考慮的問題。2018年中國(guó)民航運(yùn)輸航空百萬小時(shí)重大事故率十年滾動(dòng)值為0.013,遠(yuǎn)低于同期世界平均水平0.153;2006年至2018年的數(shù)據(jù)統(tǒng)計(jì)表明,民航運(yùn)輸總周轉(zhuǎn)量、旅客運(yùn)輸量、民航貨郵運(yùn)輸量、運(yùn)輸機(jī)場(chǎng)旅客吞吐量、運(yùn)輸機(jī)場(chǎng)起降架次年平均增速分別為12.15%、12.17%、7.24%、12.22%、10.46%;2010年至2018年我國(guó)運(yùn)輸航空機(jī)隊(duì)年平均引進(jìn)飛機(jī)247架,年均增長(zhǎng)率為11.05%。然而民航業(yè)快速發(fā)展的同時(shí),事故征候數(shù)卻在以年均15.73%的水平增加[1]。
事故致因理論表明,關(guān)注和減少未遂事故的發(fā)生有助于避免更大的災(zāi)難事故,統(tǒng)計(jì)事故征候數(shù)可評(píng)估航空公司安全狀況水平,對(duì)事故征候數(shù)進(jìn)行預(yù)測(cè)和研究,有助于科學(xué)制定民航發(fā)展規(guī)劃。陳芳等[2]利用ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行月度事故征候率預(yù)測(cè)指導(dǎo)安全績(jī)效水平的制定;甘旭升等[3]和梁文娟等[4]分別針對(duì)損壞飛機(jī)萬時(shí)率和某航空公司月度飛行事故征候萬時(shí)率,利用ARIMA模型和SVM模型的組合進(jìn)行了預(yù)測(cè)分析,結(jié)果表明組合預(yù)測(cè)比單一模型預(yù)測(cè)精度高;王永剛等[5-7]分別用灰色馬爾科夫、灰色理論結(jié)合神經(jīng)網(wǎng)絡(luò)、最優(yōu)變權(quán)組合模型預(yù)測(cè),研究表明組合模型預(yù)測(cè)事故征候更精確;孫瑞山等[8]改進(jìn)了灰關(guān)聯(lián)度分析,利用三角模糊數(shù)預(yù)測(cè)機(jī)組失誤導(dǎo)致事故征候的預(yù)測(cè)區(qū)間,該方法可用于短期預(yù)測(cè);王燕平等[9]基于飛機(jī)起降架次進(jìn)行事故征候預(yù)測(cè),表明利用起落架次這一指標(biāo)預(yù)測(cè)的可行性;陳芳等[10]、單晶晶等[11]、郭九霞等[12]分別使用弱化緩沖算子處理預(yù)序列結(jié)合離散灰色模型、SVM和RBF神經(jīng)網(wǎng)絡(luò)、GBO-Markov 組合模型,進(jìn)行民航不安全事件的預(yù)測(cè)。
以上學(xué)者的研究大多數(shù)是以提高預(yù)測(cè)精度為目的而選擇相應(yīng)的預(yù)測(cè)模型,通過耦合不同的數(shù)學(xué)模型大幅度提高預(yù)測(cè)的精度。對(duì)于數(shù)據(jù)量少且短期的預(yù)測(cè)適宜用灰色模型、馬爾科夫、回歸分析及其組合模型等;而對(duì)于具有大量數(shù)據(jù)、明顯時(shí)間序列特征的預(yù)測(cè),學(xué)者們傾向于SVM、神經(jīng)網(wǎng)絡(luò)和ARIMA等的組合預(yù)測(cè)。實(shí)際預(yù)測(cè)過程中,與預(yù)測(cè)變量事故征候相關(guān)的眾多因素卻較少用于預(yù)測(cè),環(huán)境因素的不斷變化會(huì)影響預(yù)測(cè)變量,尋找影響事故征候的主要因素并協(xié)助預(yù)測(cè),有助于提高預(yù)測(cè)精度。鑒于此,依據(jù)官方公布的民航行業(yè)發(fā)展統(tǒng)計(jì)公報(bào),選取與事故征候相關(guān)的16個(gè)因素并提取相關(guān)數(shù)據(jù),首先進(jìn)行灰色關(guān)聯(lián)分析,然后選擇關(guān)聯(lián)度較高的影響因素,建立GM(1,N)預(yù)測(cè)模型進(jìn)行預(yù)測(cè),同時(shí)使用GM(1,1)模型和多元線性回歸對(duì)比預(yù)測(cè)精度,擬通過3種方法的對(duì)比研究找到更加有效和準(zhǔn)確的方法預(yù)測(cè)事故征候。
1982年我國(guó)學(xué)者鄧聚龍發(fā)表的兩篇灰色系統(tǒng)理論論文標(biāo)志著灰色系統(tǒng)學(xué)科的誕生?;疑到y(tǒng)是指信息部分明確、部分未知的系統(tǒng),研究針對(duì)廣泛存在于生活中的少量樣本和缺乏有效信息的不確定性問題[13]。灰色理論被廣泛應(yīng)用到經(jīng)濟(jì)、石油、農(nóng)業(yè)、航空等科學(xué)研究領(lǐng)域并取得了豐碩的研究成果。
1.1.1 灰色關(guān)聯(lián)分析
灰色關(guān)聯(lián)分析同數(shù)理統(tǒng)計(jì)的相關(guān)分析法相類似,都是進(jìn)行系統(tǒng)特征分析,不同的是灰色關(guān)聯(lián)分析更適用于較少數(shù)量的分析樣本,并且數(shù)學(xué)計(jì)算模型通俗易懂,計(jì)算量小?;疑P(guān)聯(lián)分析考察不同序列曲線的相似程度,序列的曲線越相似,序列間的關(guān)聯(lián)度越大[14]。
灰色關(guān)聯(lián)分析過程如下:
(1)確定參考序列和比較序列
設(shè)參考序列為X0(k)=(x0(1),x0(2),…,x0(n)),比較序列為Xi(k)=(xi(1),xi(2),…,xi(n)) ,其中k=1,2…n;i=1,2…m;式中n為參考序列元素個(gè)數(shù);m為比較序列的個(gè)數(shù)。
(2)無量綱化處理參考序列和比較序列
(1)
(3)求參考序列與比較序列的差
(2)
(4)計(jì)算兩序列最大差和最小差
(3)
(5)計(jì)算灰關(guān)聯(lián)系數(shù)
(4)
式中0<ρ<1,一般取ρ=0.5。
(6)計(jì)算關(guān)聯(lián)度
(5)
(7)優(yōu)劣勢(shì)排序
比較序列和參考序列的關(guān)聯(lián)程度主要依據(jù)計(jì)算的關(guān)聯(lián)度大小排序描述,ri越大,說明比較序列和參考序列曲線形狀越接近,通過排序即可得到優(yōu)劣次序。
1.1.2 GM(1,1)模型
GM(1,1)模型計(jì)算過程中不涉及預(yù)測(cè)變量的其他相關(guān)變量,僅需要對(duì)原始數(shù)據(jù)序列進(jìn)行檢驗(yàn)或者處理,這種特性使GM(1,1)模型得到了非常廣泛的應(yīng)用[15]。具體建模過程如下:
(1)建立預(yù)測(cè)變量的原始序列
X0(t)=(x0(1),x0(2),…,x0(n))
(6)
(2)對(duì)預(yù)測(cè)變量的原始序列執(zhí)行一次累加(1-AGO)
(7)
得到1-AGO序列X1(t)={x1(1),x1(2),…,x1(n)},其中x0(1)=x1(1)
(3)對(duì)原始序列X0(t)進(jìn)行光滑性檢驗(yàn)
(8)
若原始序列X0(t)滿足式(9),則原始序列為準(zhǔn)光滑序列,可以建立GM(1,1)模型。
(9)
(4)建立GM(1,1)模型
(10)
(5)構(gòu)造數(shù)據(jù)矩陣B和數(shù)據(jù)向量Y
(11)
Y=[x0(2),x0(3),…,x0(n)]T
(12)
(6)使用最小二乘法計(jì)算參數(shù)a和b
(13)
(7)求解預(yù)測(cè)模型的時(shí)間響應(yīng)方程
(14)
(8)構(gòu)建還原模型
(15)
(9)模型精度的殘差檢驗(yàn)
設(shè)ε(t)為殘差序列,φ(k)為相對(duì)誤差序列,則ε(t)和φ(k)可以用來檢驗(yàn)建立的預(yù)測(cè)模型精度,如式(16)和(17)所示。
(16)
(17)
1.1.3 GM(1,N)模型
預(yù)測(cè)變量往往與其他變量存在關(guān)系,GM(1,N)模型的引入很好地利用了這一特點(diǎn),N為內(nèi)在的因素?cái)?shù)量,它比僅僅從單一序列進(jìn)行建模的GM(1,1)更科學(xué)合理[16]。具體建模過程如下:
(1)構(gòu)建GM(1,N)模型
?
(18)
(2)使用式(13)計(jì)算參數(shù)a和bi,此時(shí)B和Y分別為
(19)
(20)
(3)GM(1,N)模型的近似時(shí)間響應(yīng)式
(21)
(4)累減還原后得到預(yù)測(cè)模型
(22)
(5)同樣利用式(16)和(17)進(jìn)行模型精度的殘差檢驗(yàn)。
(1)構(gòu)建多元回歸模型
假設(shè)因變量為y,t個(gè)自變量分別為x1,x2,…,xt,描述t個(gè)自變量和誤差項(xiàng)ε影響因變量y的多元回歸模型一般形式可表示為:
y=β0+β1x1+β2x2+…+βtxt+ε
(23)
式中,β0,β1,β2,…,βt為回歸模型的參數(shù);ε為誤差項(xiàng)。
(2)估計(jì)的多元回歸方程
(24)
(3)參數(shù)的最小二乘法估計(jì)
(25)
(26)
(4)回歸模型精度的殘差檢驗(yàn)
設(shè)ε(t)為絕對(duì)誤差序列,φ(k)為相對(duì)誤差序列,則ε(t)和φ(k)可以用來檢驗(yàn)建立的回歸預(yù)測(cè)模型精度。
(27)
(28)
本文從民航業(yè)發(fā)展公報(bào)中提取了2010-2019年與事故征候(A)相關(guān)的16個(gè)指標(biāo):A1運(yùn)輸總周轉(zhuǎn)量(億噸公里),A2旅客運(yùn)輸量(億),A3貨郵運(yùn)輸量(萬噸),A4運(yùn)輸機(jī)場(chǎng)旅客吞吐量(億),A5運(yùn)輸機(jī)場(chǎng)貨郵吞吐量(萬噸),A6運(yùn)輸機(jī)場(chǎng)起降架次(萬),A7運(yùn)輸機(jī)隊(duì)(架),A8運(yùn)輸機(jī)場(chǎng)(個(gè)),A9定期航班航線(條),A10航線里程(萬公里),A11運(yùn)輸飛機(jī)平均日利用率(小時(shí)),A12營(yíng)業(yè)收入(億元),A13嚴(yán)重事故征候萬時(shí)率,A14航班正常率,A15旅客投訴(件),A16并固定資產(chǎn)投資(億元),將考察的各指標(biāo)依次編號(hào)為A1-A16并進(jìn)行數(shù)據(jù)建模分析。事故征候與各考察指標(biāo)的關(guān)系見圖1所示,從中可以明顯看出與事故征候呈線性關(guān)系的指標(biāo)。
圖1 事故征候和考察指標(biāo)的關(guān)系
2.1.1 事故征候與各指標(biāo)的灰色關(guān)聯(lián)分析
以事故征候(A)為參考序列,A1-A16各指標(biāo)為比較序列,利用Python編程語言依據(jù)式(1)-式(5)進(jìn)行灰色關(guān)聯(lián)度分析。由計(jì)算結(jié)果可知,事故征候與航線里程、運(yùn)輸機(jī)隊(duì)規(guī)模、旅客運(yùn)輸量、定期航班航線數(shù)量、運(yùn)輸機(jī)場(chǎng)旅客吞吐量、運(yùn)輸機(jī)場(chǎng)起降架次關(guān)聯(lián)度較高,分別為0.951 6、0.945 5、0.944 1、0.943 4、0.942 0、0.932 3,進(jìn)行灰色預(yù)測(cè)時(shí),優(yōu)先使用關(guān)聯(lián)度較高的指標(biāo)進(jìn)行預(yù)測(cè)。
2.1.2 GM(1,1)模型預(yù)測(cè)事故征候
將2010-2019年事故征候數(shù)作為原始序列,利用式(7)進(jìn)行一次累加得到1—AGO序列,通過式(8)進(jìn)行光滑性檢驗(yàn),結(jié)果顯示序列通過光滑性檢驗(yàn)可以用來建立GM(1,1)模型,由式(11)、(12)、(13)可得:
將a、b和a/b的值代入式(14),可得GM(1,1)預(yù)測(cè)模型的時(shí)間響應(yīng)方程:
代入式(15)進(jìn)行預(yù)測(cè)計(jì)算,利用式(16)和(17)進(jìn)行模型精度的殘差檢驗(yàn),結(jié)果顯示平均相對(duì)誤差為7.48%,具體計(jì)算結(jié)果見表1。
續(xù)圖1
2.1.3 GM(1,N)模型預(yù)測(cè)事故征候
由灰色關(guān)聯(lián)分析可知,在統(tǒng)計(jì)的16個(gè)指標(biāo)要素中與事故征候關(guān)聯(lián)度達(dá)到0.9以上的有9個(gè),使用這9個(gè)指標(biāo)數(shù)據(jù),建立灰色GM(1,N)預(yù)測(cè)模型,通過計(jì)算發(fā)現(xiàn)當(dāng)5≤N≤10時(shí),即建立GM(1,5)- GM(1,10)模型后計(jì)算預(yù)測(cè)結(jié)果誤差很大,故只建立GM(1,2)、GM(1,3)、GM(1,4)模型用于研究。以GM(1,4)為例說明建模計(jì)算過程,將事故征候作為特征序列,航線里程、運(yùn)輸機(jī)隊(duì)規(guī)模、旅客運(yùn)輸量作為相關(guān)因素序列。GM(1,2)、GM(1,3)數(shù)學(xué)建模過程類似。
特征序列和相關(guān)因素的1-AGO序列分別為:
X1(1)=(221,451,746,1 048,1 372,1 766,2 285,2 872,3 440,4 010)
X2(1)=(276.5,625.56,953.57,1 364.17,1 827.89,2 359.59,2 994.39,3 742.69,4 580.67,5 528.89)
X3(1)=(1 597,3 361,5 302,7 447,9 817,12 467,15 417,18 713,22 352,26 170)
X4(1)=(2.68,5.61,8.8,12.34,16.26,20.62,25.5,31.02,37.14,43.74)
X1(1)的緊鄰均值生成序列Z1(1)(k)為:
Z1(1)(k)=(336,598.5,897,1 210,1 569,2 025.5,2 578.5,3 156,3 725)
利用式(19)和(20)構(gòu)建B和Y,使用式(13)計(jì)算參數(shù)a和bi,則有:
代入B和Y可得:
a=1.212 2,b2=0.679 3,b3=0.998 1,b4=-566.361 6
將a和bi的值代入式(21)可得GM(1,4)的近似時(shí)間響應(yīng)式
代入相關(guān)數(shù)據(jù)進(jìn)行預(yù)測(cè)計(jì)算,利用式(16)和(17)進(jìn)行模型精度的殘差檢驗(yàn),結(jié)果顯示平均相對(duì)誤差為15.90%,其它模型具體計(jì)算結(jié)果見表1。
相關(guān)性分析表明,事故征候和指標(biāo)間存在線性關(guān)系,所以對(duì)事故征候和其他16個(gè)指標(biāo)利用SPSS軟件執(zhí)行多元線性回歸分析。為避免自變量間多重共線性的問題,得到向后篩選策略共經(jīng)過7步完成回歸方程的建立,回歸擬合情況最優(yōu),調(diào)整R2為0.966,回歸方程的自變量為A7運(yùn)輸機(jī)隊(duì)規(guī)模,A12營(yíng)業(yè)收入,其擬合預(yù)測(cè)直線方程為:
各預(yù)測(cè)模型的平均相對(duì)誤差分別為7.48%、15.52%、27.86%和15.9%,計(jì)算結(jié)果顯示平均相對(duì)誤差為4.62%,具體計(jì)算結(jié)果見表1。
表1 各預(yù)測(cè)模型結(jié)果及誤差
通過灰色模型和多元回歸模型得到2010-2019年事故征候數(shù),模型曲線擬合情況見圖2,3種模型的擬合預(yù)測(cè)結(jié)果和平均相對(duì)誤差見表1,發(fā)現(xiàn)多元回歸的平均誤差為4.62%,遠(yuǎn)優(yōu)于GM(1,1)和GM(1,N)模型,而GM(1,2)模型的平均相對(duì)誤差在GM(1,N)灰色預(yù)測(cè)模型中最小,GM(1,4)模型對(duì)2016-2019年的事故征候擬合精度較高。
圖2 預(yù)測(cè)模型擬合情況
預(yù)測(cè)模型的價(jià)值在于對(duì)未來的預(yù)測(cè),因此使用擬合精度最高的多元回歸模型預(yù)測(cè)2020年和2021年的事故征候數(shù)。由民航業(yè)發(fā)展統(tǒng)計(jì)公報(bào)統(tǒng)計(jì)可知,運(yùn)輸機(jī)隊(duì)規(guī)模(A7)2019年較2018年增長(zhǎng)了4.92%,近8年統(tǒng)計(jì)數(shù)據(jù)表明,運(yùn)輸機(jī)隊(duì)規(guī)模年平均增長(zhǎng)率為10.19%。營(yíng)業(yè)收入(A12)方面,2019年較2018年增長(zhǎng)了4.76%。近8年統(tǒng)計(jì)數(shù)據(jù)表明,營(yíng)業(yè)收入年平均增長(zhǎng)率為11.61%。分別以上一年度增長(zhǎng)率和年平均增長(zhǎng)率計(jì)算2020年和2021年運(yùn)輸機(jī)隊(duì)規(guī)模和營(yíng)業(yè)收入,將以上指標(biāo)數(shù)值代入回歸模型方程,可得2020年事故征候數(shù)預(yù)測(cè)在616~645之間,而2021年事故征候數(shù)預(yù)測(cè)在650~711之間,事故征候數(shù)將隨著民航業(yè)的不斷壯大發(fā)展而呈上升趨勢(shì)。
(1)多元線性回歸模型擬合精度很高,適宜對(duì)事故征候進(jìn)行預(yù)測(cè),擬合模型相關(guān)指標(biāo)未來的數(shù)值可以通過結(jié)合上一年度的增長(zhǎng)率和近幾年平均增長(zhǎng)率估計(jì)得到,從而預(yù)測(cè)出事故征候未來的數(shù)值區(qū)間。鑒于此,依據(jù)該模型預(yù)測(cè)得到2020年和2021年事故征候的預(yù)測(cè)區(qū)間分別為616~645和650~711,事故征候數(shù)呈現(xiàn)上升趨勢(shì),仍需要重視行業(yè)的安全。
(2)GM(1,1)模型預(yù)測(cè)過程簡(jiǎn)單,僅需要對(duì)預(yù)測(cè)的變量準(zhǔn)確統(tǒng)計(jì),短期預(yù)測(cè)較為準(zhǔn)確。GM(1,N)模型預(yù)測(cè)過程中,需要執(zhí)行變量間的灰色關(guān)聯(lián)分析,從關(guān)聯(lián)度大的指標(biāo)中選取不同的因素進(jìn)行建模比較,從而找到預(yù)測(cè)精度更高的模型。GM(1,4)在短期預(yù)測(cè)中精度更高,但前提是需要有準(zhǔn)確的相關(guān)因素?cái)?shù)據(jù)作為支撐。實(shí)際利用GM(1,4)模型時(shí),相關(guān)因素的預(yù)測(cè)可以結(jié)合歷史平均水平或者將來期望的水平。
(3)從GM(1,N)和多元回歸擬合預(yù)測(cè)的分析過程來看,影響事故征候的指標(biāo)主要是運(yùn)輸機(jī)隊(duì)規(guī)模、運(yùn)輸機(jī)場(chǎng)、旅客運(yùn)輸量、航線里程、營(yíng)業(yè)收入。因而,在制定民航發(fā)展規(guī)劃時(shí),考慮用這些主要影響指標(biāo)制定事故征候的紅線水平數(shù)量具有重要的指導(dǎo)意義。同時(shí),歷史統(tǒng)計(jì)表明事故征候的變化呈現(xiàn)曲線上升趨勢(shì),進(jìn)一步提高模型預(yù)測(cè)精度可以從多元非線性擬合的角度出發(fā)進(jìn)行預(yù)測(cè),以提高模型的適用性和精度。