裝甲兵學院 朱思瑾 李 康 沈吉鋒 劉新永
本文試圖通過對30年來全國安全生產(chǎn)歷史數(shù)據(jù)的分析、擬合,并進行短期預測,從而為正確判斷未來安全生產(chǎn)形勢,制訂相應措施提供可靠依據(jù)。
ARMA模型是一種比較成熟的模型,適于短期預測。模型建立,要求時間序列是隨機和平穩(wěn)的,而且需要長期連續(xù)數(shù)據(jù),編寫程序進行模型的辨識。
2.1.1 AR模型
AR模型也稱為自回歸模型,它的預測方式是通過過去的觀測值和現(xiàn)在的干擾值的線性組合預測。自回歸模型的數(shù)學公式為:
式中:p為自回歸模型的階數(shù);
Φi(i=1,2,…,p)為模型的待定系數(shù),et為誤差;Yt為一個時間序列。
2.1.2 MA模型
MA模型也稱為滑動平均模型,它的預測方式是通過過去的干擾值和現(xiàn)在的干擾值的線性組合預測?;瑒悠骄P偷臄?shù)學公式為:
式中:q為模型的階數(shù);jθ(j=1,2,……q)為模型的待定系數(shù),et為誤差,tY 為觀測值。
2.1.3 ARMA模型
自回歸模型和滑動平均模型的組合,便構(gòu)成了用于描述平穩(wěn)隨機過程的自回歸滑動平均模型ARMA。數(shù)學公式為:
2.1.4 ARMA模型的預測步驟
(a)對時間序列進行差分,以得到一個平穩(wěn)隨機序列,然后O一1均值化序列。
(b)計算差分后序列的自相關(guān)系數(shù)和偏相關(guān)系數(shù),以選擇一個合適的ARMA模型。
(c)用最小二乘法對ARMA模型分析,計算模型參數(shù)值。
(d)對估計得到的模型,進行適應性檢驗,重新改進模型,直至得到最優(yōu)模型為止。
(e)進行預測。
1983年至2012年中國工業(yè)企業(yè)事故死亡人數(shù)、職工人數(shù)來源于《安全生產(chǎn)年鑒》、《中國統(tǒng)計年鑒》和《中國勞動統(tǒng)計年鑒》等正式出版物。以1983-2012年全國工業(yè)企業(yè)事故死亡人數(shù)、死亡率作為建?;A(chǔ)數(shù)據(jù),如表l所示:
表1 1983~2012年全國工業(yè)企業(yè)事故死亡人數(shù)與死亡率
表2 根據(jù)ARMA模型所得自相關(guān)系數(shù)和偏相關(guān)系數(shù)值
先對原始數(shù)據(jù)進行初步分析,通過繪制數(shù)據(jù)趨勢圖檢驗時間序列??梢园l(fā)現(xiàn),2O世紀8O年代初到90年代初,工傷死亡人數(shù)略呈平穩(wěn)下降,然后明顯上升。1996年后逐漸下降,2000年又出現(xiàn)上升趨勢。但死亡率除個別年代出現(xiàn)波動外,總體上是呈下降趨勢,時間序列為非平穩(wěn)序列。由于ARMA模型只能分析0-1均值化的時間序列,而計算出序列的均值為0.045,表明對序列的影響很小,故忽略不計,認為數(shù)據(jù)是均值化的。根據(jù)ARMA模型的自相關(guān)和偏相關(guān)分析法編寫程序,識別模型的階數(shù)。相關(guān)系數(shù)和偏相關(guān)系數(shù)分析如表2所示。
經(jīng)過自相關(guān)分析圖分析,ρk的取值范圍在置信區(qū)間[-2.59,2.59]內(nèi),可見序列是一隨機列,而且當k>3時,在零值附近上下波動,可見序列是一平穩(wěn)序列當ρ k>2時,取值都在[-2.59,2.59]內(nèi),且有收斂到零的趨勢,根據(jù)定階準則,證明符合AR(2)模型。
模型參數(shù)的估計使用最小二乘法.用統(tǒng)計軟件SAS分析,結(jié)果如下:Zt=0.003993-0.5830747Xt,F(xiàn)值為7.05,遠遠大于F0.01(2,43),所以回歸是高度顯著的.分析表明AR(2)是合適的。
從本研究的具體估計結(jié)果來看.多數(shù)年份相對誤差在10%以下,說明此方法預測比較精確,短期預測可信度較高。而2000年以來有所上升.這與我國經(jīng)濟發(fā)展正處于快速發(fā)展上升周期,不斷加大的能源需求,而安全生產(chǎn)投人相對滯后等因素有較大關(guān)系。
[1]徐國祥.統(tǒng)計預測和決策[M].上海財經(jīng)大學出版社,2006.
[2]王振龍.時間序列分析[M].中國統(tǒng)計出版社,2003.