李勝楠,凌標燦,2
(1.華北科技學(xué)院 研究生院,北京 101601;2.中礦龍科能源科技(北京)股份有限公司,北京 101601)
基于SPSS對全國各地區(qū)安全生產(chǎn)狀況的聚類分析
李勝楠1,凌標燦1,2
(1.華北科技學(xué)院 研究生院,北京 101601;2.中礦龍科能源科技(北京)股份有限公司,北京 101601)
為對全國各地區(qū)的安全生產(chǎn)狀況有一個清晰直觀的認識,了解不同地區(qū)安全管理水平的差異性,基于SPSS軟件對2009~2016年我國各地區(qū)的安全生產(chǎn)統(tǒng)計數(shù)據(jù)進行系統(tǒng)聚類分析,將我國31個省、市、自治區(qū)的安全生產(chǎn)狀況劃分為4類,通過分析不同類別地區(qū)安全生產(chǎn)狀況的特點及原因,為控制和預(yù)防生產(chǎn)安全事故提供依據(jù)。
安全生產(chǎn)狀況;系統(tǒng)聚類分析;SPSS
安全生產(chǎn)狀況反映了一個地區(qū)的安全生產(chǎn)水平,分析不同地區(qū)安全生產(chǎn)狀況的特點,有利于采取針對性措施,減少安全生產(chǎn)事故的發(fā)生,進而提高經(jīng)濟發(fā)展水平。
本文以2009~2016年我國各省、市、自治區(qū)的安全生產(chǎn)指標數(shù)據(jù)為基礎(chǔ),結(jié)合國家統(tǒng)計局《中國統(tǒng)計年鑒》中對各地區(qū)生產(chǎn)總值(GDP)、交通事故情況和火災(zāi)事故情況的統(tǒng)計數(shù)據(jù),從億元GDP生產(chǎn)安全事故死亡率X1、工礦商貿(mào)事故死亡人數(shù)X2、交通事故死亡人數(shù)X3、火災(zāi)事故死亡人數(shù)X4和特大事故起數(shù)X5五個指標數(shù)據(jù)出發(fā)[1],基于SPSS軟件對我國31個省、市、自治區(qū)的安全生產(chǎn)狀況進行聚類分析。分析數(shù)據(jù)選取為8年數(shù)據(jù)的均值。通過具體分類情況,有利于分析全國的安全生產(chǎn)形勢,為政府、企業(yè)的下一步安全生產(chǎn)工作規(guī)劃提供方向和依據(jù)。
1.1 基本概念
系統(tǒng)聚類法(層次聚類法)是聚類分析方法中最常用的一種方法,它根據(jù)樣本的多指標(變量)、多個觀察數(shù)據(jù)、定量的確定樣品、指標之間存在的相似性或親疏關(guān)系,并據(jù)此連接這些樣品或指標,歸成不同類群,構(gòu)成樹狀圖或冰狀圖。它的優(yōu)點在于可以指出由粗到細的多種分類情況,結(jié)果可由一個聚類圖展示出來。具體步驟如下:設(shè)Ω={w1,w2,…,wn}
(1) 計算n個樣本兩兩之間的距離{dij},記為矩陣D=(dij)n×n;
(2) 首先構(gòu)造n個類,每一個類中只包含一個樣本,每一類的平臺高度均為零;
(3) 合并距離最近的兩類為新類,并且以這兩類間的距離值作為聚類圖中的平臺高度;
(4) 計算新類與當前各類的距離,若類的個數(shù)已經(jīng)等于1,轉(zhuǎn)入步驟(5),否則回到步驟(3);
(5) 畫聚類圖;
(6) 決定類的個數(shù)和類。
1.2 聚類過程及結(jié)果
選取2009~2016年我國各省、市、自治區(qū)的安全生產(chǎn)事故統(tǒng)計數(shù)據(jù)5個指標的平均值[2],如表1所示:
表1 全國安全生產(chǎn)事故統(tǒng)計數(shù)據(jù)(2009~2016年平均值)
進入SPSS程序,選擇分析→分類→系統(tǒng)聚類,進行系統(tǒng)聚類分析(Hierarchical Cluster Analysis),引入X1至X5為變量,對樣本(個案)進行Q型聚類分析[3]。
(1) 數(shù)據(jù)標準化
由于五個指標中既有絕對指標又有相對指標,具有不同的量綱,為了使這些指標能放到一起加以比較,提高精度,故采用極差標準化方法對數(shù)據(jù)進行標準化處理。
(1)
(2)
(2) 計算類與類之間的距離
這里選擇歐式距離的方法,進入SPSS18.0程序,選擇分析→分類→系統(tǒng)聚類→方法,然后從度量標準對話框中的區(qū)間項選擇歐式距離(Euclidean distance)。
(3) 應(yīng)用SPSS對數(shù)據(jù)進行聚類分析
聚類方法采用離差平方法(Ward法)。從聚類方法框中選擇離差平方和法(Ward’s method),該方法基于方差分析思想,若分類合理,則同類樣品間離差平方和最小,類與類間離差平方和最大[4,5]。
表2 案例處理摘要
a. Euclidean 距離 已使用
表2表示在31個樣本中,有效個案為31個,無效個案為0個,樣本有效率100%,聚類分析結(jié)果可靠。
由于相似矩陣為31×31階矩陣,本文中未表示,相似矩陣反映了各地區(qū)安全生產(chǎn)狀況的相似程度,越接近于1,說明相似程度越高。
表3 案例聚類分析
表3所列各項的意義如下:階——聚類步驟號;群集組合——在某步中合并的個案;系數(shù)——樣本歐式距離。數(shù)值越大,二者越不相似;首次出現(xiàn)階群集——新生成聚類;下一階——對應(yīng)步驟生成的新類將在第幾步與其他個案或新類合并[6,7]。
由表中顯示,在第1階,由序號1北京市和序號2天津市先合并成一類,它們的系數(shù)為0.025。北京市億元GDP生產(chǎn)安全事故死亡率為0.45、工礦商貿(mào)事故死亡人數(shù)35.5人、交通事故死亡人數(shù)940.83人、火災(zāi)事故死亡人數(shù)30.33人、特大事故0.17起。天津市億元GDP生產(chǎn)安全事故死亡率為0.50、工礦商貿(mào)事故死亡人數(shù)20.17人、交通事故死亡人數(shù)904.33人、火災(zāi)事故死亡人數(shù)25.17人、特大事故0.17起。表明2者在各個指標數(shù)據(jù)上都非常相似,這個合并完的類將在第13階中用到。在第13階中,剛剛新生成的這個新類和序號21海南省又合成一類,它們的系數(shù)為1.230。直到經(jīng)過30步后,所有的樣本均聚成一大類。
為了能夠準確的對我國31個省、市、自治區(qū)進行分類,并確定最精確分類數(shù)量。采用樹形圖加以判斷。樹形圖能夠直觀的對所分析的數(shù)據(jù)進行分類,且提供比較合適的類數(shù)。本文根據(jù)億元GDP生產(chǎn)安全事故死亡率為、工礦商貿(mào)事故死亡人數(shù)、交通事故死亡人數(shù)、火災(zāi)事故死亡人數(shù)、特大事故起數(shù)這五個指標,對31個省、市、自治區(qū)的安全生產(chǎn)狀況進行分類,樹狀圖如圖1所示:
圖1 聚類分析結(jié)果樹狀圖
根據(jù)樹狀圖可以清晰直觀地看出整個樣本的分類情況,把直尺豎著放在圖上,圖與直尺相交的線,即為一類。樹狀圖上方的數(shù)字是按距離比例進行重新標定的結(jié)果,不影響對分類結(jié)果的觀察與結(jié)論。從圖中可以看出,把我國31個省、市、自治區(qū)劃分為4類或者是5類都比較合理,類間距離較大,說明各類的特點比較突出,能夠從不同類的角度分析事故的特點。若分成6類或者是更多類,類間距離較小,類與類之間的區(qū)別不明顯,達不到準確的分析結(jié)果。
通過以上的分析,把指定樣本聚成4類,聚類結(jié)果如表4所示。
為更加了解各類指標的特征,對所分四類中的均值、最大值及最小值進行計算比較,得到的結(jié)果如表5所示。
表4 聚類結(jié)果
表5 實例分析均值表
結(jié)合表4、表5可知,系統(tǒng)聚類分析結(jié)果將我國31個省、市、自治區(qū)的安全生產(chǎn)狀況劃分為4類,我國的安全生產(chǎn)狀況具有明顯的地域特征。
(1) 北京、天津、河北、內(nèi)蒙古、吉林、上海、安徽、福建、江西、山東、廣西、海南、陜西、甘肅和新疆15個省、市、自治區(qū)為第1類。北京、天津兩市是華北地區(qū)相鄰的直轄市,經(jīng)濟發(fā)展水平較高,礦山等高危行業(yè)擁有量較少,且地域條件、教育條件、安全監(jiān)管等條件相似,故各類指標相似,分類結(jié)果與預(yù)想相符合,也驗證了分類的準確性。該類地區(qū)工礦商貿(mào)、交通和火災(zāi)事故死亡人數(shù)均值總和為2009.91人,處于中等。安徽省工礦商貿(mào)事故死亡人數(shù)最多,為325.67人,這是由于該省是我國煤炭大省,2014年煤炭產(chǎn)量為1.33億噸,關(guān)閉小煤礦后全省煤礦數(shù)量約有百處。山東省交通事故死亡人數(shù)最多,這是由于該省是人口大省和經(jīng)濟發(fā)展大省,二級以上公路里程3.95萬公里,連續(xù)多年位居全國第一,并且在公布的全國10大交通事故高危路段中有兩處位于山東省,該兩處的事故起數(shù)和死亡人數(shù)均位于前列,這就導(dǎo)致了該省交通事故頻發(fā)。該類地區(qū)要根據(jù)各個省市的特點,加強安全生產(chǎn)工作,以此促進經(jīng)濟的進一步發(fā)展。
(2) 山西、遼寧、黑龍江、河南、湖北、湖南、重慶、四川、貴州、云南10個省、市為第2類,安全生產(chǎn)狀況較差。與第1類的事故死亡人數(shù)總和相似,為2246.13人,工礦商貿(mào)事故平均死亡人數(shù)最多,特大事故頻發(fā),平均每年發(fā)生特大事故3.83起,安全生產(chǎn)狀況亟待解決。山西、河南兩省礦山較多,遼寧、黑龍江兩省是我國的東北老工業(yè)基地,湖北、湖南兩省民營企業(yè)過多,生產(chǎn)效率和企業(yè)管理條件過于落后。山西省是我國煤炭大省,隨著開采強度和深度的不斷增大,地質(zhì)條件日趨復(fù)雜,再加上整體規(guī)模偏小、開采方式和技術(shù)裝備水平比較落后、缺乏先進的管理技術(shù)和高素質(zhì)人才等原因,山西省的各個煤礦不同程度地顯現(xiàn)出了許多問題與缺陷,各類事故時有發(fā)生,導(dǎo)致特大事故起數(shù)位居全國首位。重慶市交通事故死亡人數(shù)最少,這與當?shù)貙嵭械膯涡械老⑾⑾嚓P(guān),不僅緩解了堵車的情況還大大降低了交通事故的發(fā)生。四川省地貌復(fù)雜,以山地為主,具有山地、丘陵、平原和高原4種地貌類型,擁有已探明儲量的礦產(chǎn)資源132種,占全國資源種數(shù)的70%,已探明天然氣儲量超過3.8萬億立方米,位居全國第一,是川氣東送的起點,因而使得該省工礦商貿(mào)、交通事故死亡人數(shù)均居首位。但歷年數(shù)據(jù)呈現(xiàn)逐年遞減趨勢,說明政府已重視該項工作,安全生產(chǎn)形勢明顯好轉(zhuǎn)。2013年底,四川省開展道路交通安全綜合整治工作,在高速公路貨車“雙超”治理、普通公路治超、農(nóng)村道路交通安全管理等方面取得階段性成效,使得道路交通安全形勢持續(xù)好轉(zhuǎn),現(xiàn)已建成公路安保工程(路側(cè)護欄)1.73萬公里;2014年,全省共關(guān)閉(退出)金屬非金屬礦山863個;2015年工礦商貿(mào)10萬從業(yè)人員事故死亡率、道路交通萬車死亡率大幅下降,其降幅明顯高于全國水平[8]。
(3) 江蘇、浙江、廣東3省為第3類。工礦商貿(mào)、交通和火災(zāi)事故死亡人數(shù)均值總和為5834.39人,死亡人數(shù)最多,是事故高發(fā)大省。根據(jù)《中國統(tǒng)計年鑒》中地區(qū)生產(chǎn)總值統(tǒng)計表顯示,該三省位于全國前4名,是經(jīng)濟發(fā)展大省。億元GDP生產(chǎn)安全事故死亡率均值為0.86,在4類中為最低,說明該類地區(qū)在發(fā)展經(jīng)濟的同時注重安全工作,安全意識較高。但交通、火災(zāi)事故死亡人數(shù)均為4類地區(qū)中最高,這可能是由于該類地區(qū)處于東南沿海地區(qū),化工企業(yè)數(shù)量較多,并且隨著電子商務(wù)的發(fā)展,該類地區(qū)成為電商大省,服裝、紡織業(yè)、日用化妝品業(yè)逐漸增多,同時帶動交通運輸業(yè),進而不免增加交通、火災(zāi)事故。相關(guān)部門要加強該類地區(qū)的相關(guān)檢查,重點部位重點監(jiān)察,將事故發(fā)生率降到最低[9-11]。
(4) 西藏、青海、寧夏3個地區(qū)為第4類。該類地區(qū)億元GDP生產(chǎn)安全事故死亡率均值為2.57,在4類中為最高,其余四項指標均為最低。該類地區(qū)生產(chǎn)總值位于全國底端,所占比例較小,進而導(dǎo)致億元GDP生產(chǎn)安全事故死亡率最高,這也說明了該類地區(qū)安全生產(chǎn)意識差,對安全工作的投入力度和重視程度明顯不足。
本文通過運用數(shù)理統(tǒng)計的聚類分析方法,以SPSS軟件為分析工具,將我國31個省、市、自治區(qū)的安全生產(chǎn)狀況分為4類,聚類方法為離差平方法,度量標準為歐式距離,分類結(jié)果與預(yù)想相符合,這說明本文采用的分析方法的正確性。分類的結(jié)果也揭示了安全生產(chǎn)狀況具有明顯的地域特征,受到諸多因素的影響,并具體分析了各類地區(qū)在各個指標上的安全生產(chǎn)狀況,相關(guān)部門要根據(jù)地區(qū)存在的具體問題,采取針對性措施,從而有效改善安全生產(chǎn)狀況,達到事半功倍的效果。
[1] 馮彧,康玉杰. 抓好企業(yè)安全生產(chǎn)應(yīng)突出把握的幾個問題[J]. 吉林勞動保護,2013(09):36-37.
[2] 李生才,笑蕾. 2014年7~8月國內(nèi)生產(chǎn)安全事故統(tǒng)計分析[J]. 安全與環(huán)境學(xué)報,2014(05):350-352.
[3] 嚴先鋒,杜強,賈麗艷. SPSS統(tǒng)計分析從入門到精通.2版[M]. 北京:人民郵電出版社,2008:95-103.
[4] 任智剛,周建新,張興凱. 基于SPSS聚類分析的企業(yè)職業(yè)傷害風(fēng)險分級標準研究[J]. 中國安全生產(chǎn)科學(xué)技術(shù),2006(03):43-46.
[5] 張在旭,尚高龍. 基于SPSS聚類分析的黃河三角洲經(jīng)濟園區(qū)特色產(chǎn)業(yè)集聚發(fā)展研究[J]. 河南科學(xué),2013(09):1502-1506.
[6] 凌標燦,魏洪霞. 各城市消費水平差異層次聚類及因子分析[J]. 華北科技學(xué)院學(xué)報,2017(01):110-116.
[7] 李杰,張靖巖,郭建中,等. 基于聚類分析的我國火災(zāi)空間分布研究[J]. 中國安全生產(chǎn)科學(xué)技術(shù),2012(02):61-64.
[8] 李德忠. 四川:安全生產(chǎn)工作取得新突破[J]. 中國安全生產(chǎn),2015(03):42-43.
[9] 王莎莎,倪曉陽,王洪,等. 基于MATLAB的系統(tǒng)聚類法在我國安全生產(chǎn)事故分析中的應(yīng)用[J]. 工業(yè)安全與環(huán)保,2010(08):52-54.
[10] 黃盛初,周心權(quán),趙愛國. 安全生產(chǎn)發(fā)展規(guī)律聚類分析[J]. 中國煤炭,2005(11):13-18+29+12.
[11] 崔柳. 煤礦安全生產(chǎn)水平分層聚類分析[J]. 遼寧工程技術(shù)大學(xué)學(xué)報(自然科學(xué)版),2015(12):1356-1360.
Hierarchical cluster analysis of safety production condition of various regions in China based on SPSS
LI Sheng-nan1, LING Biao-can1,2
(1.GraduateSchool,NorthChinaInstituteofScienceandTechnology,Beijing101601,China; 2.ZhongkuangLongkeEnergyTechnology(Beijing)Co.,Ltd.,Beijing101601,China)
In order to have a clear understanding of the safety production situation of each province in China, and understand the difference of the level of safety management in different places based on SPSS software, the hierarchical cluster analysis of production safety statistical data of China’s provinces in 2009~2016 is conducted. Production safety situation of China’s 31 provinces, municipalities and autonomous regions are divided into four categories. The analysis of safe production conditions of different types of areas provides the basis for the control and prevention of production safety accidents.
Safe production status; Hierarchical cluster analysis; SPSS
2017-04-13
中央高?;究蒲袠I(yè)務(wù)費資助(3142017031)
李勝楠(1993-),女,河北承德人,華北科技學(xué)院在讀碩士研究生,研究方向:工業(yè)衛(wèi)生及職業(yè)危害防治、危險化學(xué)品安全技術(shù)。E-mail:18730601629@163.com
X928
A
1672-7169(2017)02-0084-06