崔偉杰
國家安全生產(chǎn)監(jiān)督管理總局研究中心
安全生產(chǎn)統(tǒng)計分析是安全科學的重要研究內(nèi)容之一,安全生產(chǎn)統(tǒng)計分析在揭示安全生產(chǎn)規(guī)律和指導安全生產(chǎn)實踐中發(fā)揮重要的作用[1]。目前,各種統(tǒng)計分析方法在安全統(tǒng)計分析工作中得到廣泛應用[2],但在實際安全生產(chǎn)統(tǒng)計分析工作中發(fā)現(xiàn),還有一些問題容易被疏忽。因此,本文借助于SPSS軟件,通過一些實例來共同探討安全生產(chǎn)統(tǒng)計分析中的問題。
以煤礦為例,影響煤礦安全生產(chǎn)的因素有煤炭開采條件、煤炭產(chǎn)量、煤礦機械化程度、煤礦從業(yè)人員素質(zhì)、政府安全監(jiān)管力度等[3],但這些因素之間往往存在一定相關性,各因素之間的相關性會影響煤礦安全生產(chǎn)主要影響因素的篩選。
問題1:在研究煤礦百萬噸死亡率的影響因素時,需要將煤礦百萬噸死亡率與各影響因素進行相關性分析,但大多數(shù)情況下都是采用一般相關性分析法,只將煤礦百萬噸死亡率與各影響因素逐個分析,而忽視各影響因素之間的相關性對結(jié)果的影響。
案例1:利用1987~2006年國有重點煤礦的統(tǒng)計數(shù)據(jù),見表1,對煤礦百萬噸死亡率與煤炭產(chǎn)量分別進行一般相關性和偏相關分析,判斷兩者之間的關系。
表1 1987~2006年國有重點煤礦部分統(tǒng)計數(shù)據(jù)
SPSS軟件計算得出國有重點煤礦采煤機械化程度與國有重點煤礦煤炭產(chǎn)量的相關系數(shù)為0.761,兩者之間顯著相關。因此,在研究國有重點煤礦百萬噸死亡率與國有重點煤礦煤炭產(chǎn)量的關系時,應考慮國有重點煤礦采煤機械化程度對結(jié)果的影響。
從國有重點煤礦百萬噸死亡率與國有重點煤礦煤炭產(chǎn)量的一般相關分析結(jié)果看,兩者的相關系數(shù)為-0.51,相關性是顯著的。但是,把國有重點煤礦采煤機械化程度作為控制變量后,從偏相關分析結(jié)果看,兩者的相關系數(shù)為0.284,其相關性是不顯著的。
結(jié)論1:在國有重點煤礦采煤機械化程度與煤炭產(chǎn)量顯著相關的情況下,通過偏相關分析發(fā)現(xiàn),國有重點煤礦百萬噸死亡率與國有重點煤礦煤炭產(chǎn)量之間相關性不顯著,因此,國有重點煤礦煤炭產(chǎn)量不是影響國有重點煤礦百萬噸死亡率的主要因素。
當安全生產(chǎn)各影響因素之間存在一定的相關性時,采用一般相關分析和偏相關分析可能會得出截然相反的結(jié)論[4]。因此,在選擇影響安全生產(chǎn)的主要因素時,首先要考慮各因素(自變量)之間的相關性,若各因素之間相關性較強,應采用偏相關分析法研究兩者之間的關系。
建立安全生產(chǎn)預測模型通常需進行以下三個步驟的操作:第一步數(shù)據(jù)是否滿足所選模型的使用條件。第二步建立模型。第三步模型的統(tǒng)計檢驗。
但在安全生產(chǎn)統(tǒng)計分析工作中,第1和第3個步驟容易被忽視。
問題2:以煤礦為例,建立ARIMA模型預測煤礦百萬噸死亡率時,原始序列經(jīng)預處理后,可能會變成純隨機性(白噪聲)序列[5],不能滿足模型使用。
案例2:以2001~2016年全國煤礦百萬噸死亡率統(tǒng)計數(shù)據(jù)(見表2)作為原始序列,檢驗其進行一階差分后的序列是否為純隨機性序列。
從圖1、2可見,一階差分序列的自相關和偏自相關圖全部都在置信區(qū)間內(nèi),因此,該序列為純隨機性序列,沒有可提取的信息和繼續(xù)分析的必要,一階差分后的序列不能滿足ARIMA模型的使用條件,一階差分后的數(shù)據(jù)不能用來建立模型。
結(jié)論2:在建立安全生產(chǎn)預測模型時,一定要對
表2 2001~2016年全國煤礦百萬噸死亡率
原始數(shù)據(jù)或預處理后的數(shù)據(jù)進行檢驗,判斷選用的數(shù)據(jù)是否滿足所選模型的使用條件,若數(shù)據(jù)不符合使用條件,就不能用該模型進行數(shù)據(jù)分析。
圖1 一階差分序列的自相關圖
圖2 一階差分序列的偏自相關圖
問題3:建立數(shù)學模型后,在沒有對模型和參數(shù)進行統(tǒng)計檢驗的情況下,直接利用模型進行數(shù)據(jù)分析和預測,造成結(jié)果的不準確。
案例3:利用2001~2016年全國煤礦百萬噸死亡率統(tǒng)計數(shù)據(jù)(見表2),分別借助EXCEL和SPSS軟件建立回歸方程,并進行對比分析。
表3是借助EXCEL軟件得出的三次曲線回歸方程基本數(shù)據(jù),模型的擬合優(yōu)度為0.9911,擬合的效果非常好,但是沒有使用EXCEL軟件對所建模型進行相關統(tǒng)計檢驗。
表3 煤礦百萬噸死亡率三次曲線回歸方程基本數(shù)據(jù)(EXCEL)
表4是借助SPSS軟件得出的三次曲線回歸方程基本數(shù)據(jù),模型的擬合優(yōu)度、各項系數(shù)的結(jié)果與使用EXCEL軟件得出的結(jié)果完全一致,但是使用SPSS軟件對所建模型進行相關統(tǒng)計檢驗后發(fā)現(xiàn),雖然模型通過檢驗,但是X2和X3的系數(shù)未通過檢驗(Sig.取值>0.05)。因此,即使模型的擬合效果非常好,但是該模型不具有顯著的統(tǒng)計學意義,也就不能使用該模型進行數(shù)據(jù)分析和預測。
表4 煤礦百萬噸死亡率三次曲線回歸方程基本數(shù)據(jù)(SPSS)
結(jié)論3:建立安全生產(chǎn)預測模型后,一定要對模型進行必要的統(tǒng)計檢驗(方程和系數(shù)的顯著性檢驗、殘差檢驗等),確保所建模型具有統(tǒng)計學意義,保證安全生產(chǎn)數(shù)據(jù)分析和預測結(jié)果的準確性。
安全生產(chǎn)統(tǒng)計分析是綜合運用安全科學、系統(tǒng)科學和統(tǒng)計學的原理和方法,對大量安全生產(chǎn)有關的信息資料進行收集、整理、分析、研究,來揭示安全生產(chǎn)的特征和變化規(guī)律。統(tǒng)計分析方法的選擇和應用是否科學對結(jié)論產(chǎn)生至關重要的影響,因此,在今后的安全生產(chǎn)統(tǒng)計分析工作中,應更加注重安全生產(chǎn)統(tǒng)計分析方法選擇的科學性和方法應用的嚴謹性,確保安全生產(chǎn)統(tǒng)計分析的結(jié)論能夠準確的反映出安全生產(chǎn)問題的本質(zhì)和一般規(guī)律。