劉紅, 何鵬
(上海海事大學(xué) 交通運(yùn)輸學(xué)院,上海 201306)
船舶海事事故的發(fā)生會(huì)造成人員和財(cái)產(chǎn)的重大損失,研究船舶發(fā)生海事事故的影響因素,對(duì)避免和減少船舶海事事故的發(fā)生有重要的理論和現(xiàn)實(shí)意義.國(guó)外最新研究關(guān)注于機(jī)艙火災(zāi)及爆炸中的組織因素影響和人為因素對(duì)海事安全的影響[1-2];采用的方法主要有模糊故障樹(shù)分析法[3]和分類(lèi)樹(shù)模型[4],重點(diǎn)研究受限水域中的海事安全問(wèn)題.我國(guó)學(xué)者對(duì)海事事故影響因素的研究則主要集中在碰撞事故與人為失誤的關(guān)聯(lián)性分析[5-6]、船舶機(jī)損事故人為失誤分析[7]、海船船員適任性評(píng)價(jià)[8]、船舶碰撞危險(xiǎn)度評(píng)價(jià)[9]及船員駕駛行為的研究[10]上.
粗糙集理論是PAWLAK[11]于1982年提出的一種能夠定量分析不精確、不一致、不完整信息和知識(shí)的數(shù)據(jù)處理工具.它無(wú)須先驗(yàn)知識(shí),可從樣本數(shù)據(jù)中提取簡(jiǎn)明、直接、易于理解的決策規(guī)則,進(jìn)而計(jì)算各屬性對(duì)決策的重要度,是目前數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的有力工具之一,在模式識(shí)別、機(jī)器學(xué)習(xí)、決策分析、知識(shí)獲取及知識(shí)發(fā)現(xiàn)等領(lǐng)域有廣泛應(yīng)用.
目前全球海上事故頻發(fā),事故原因多樣.本文嘗試通過(guò)對(duì)近年來(lái)國(guó)內(nèi)外船舶海事事故的調(diào)查與數(shù)據(jù)統(tǒng)計(jì),運(yùn)用粗糙集理論挖掘船舶海事事故中人、船及環(huán)境因素的深層次影響及關(guān)聯(lián)程度,為海事監(jiān)管部門(mén)和航運(yùn)企業(yè)避免海事事故的發(fā)生提供參考.
對(duì)一個(gè)給定的決策系統(tǒng)S=(U,C∪D),條件屬性集合C的約簡(jiǎn)是C的一個(gè)非空子集C′,滿足(1)I(C′,D)=I(C,D);(2)不存在C″,使I(C″,D)=I(C′,D).稱C的所有約簡(jiǎn)的集合為C的核,記作o(C),即o(C)=∩r(C),其中r(C)是C的所有簡(jiǎn)化簇.[13]設(shè)P?A=C∪D,xi,xj∈U,定義I(P)={(xi,xj)∈U×U|?p∈P,p(xi)=p(xj)}為不可區(qū)分(不分明)關(guān)系.
設(shè)全集U按決策屬性D被分成不相交的類(lèi)族,即D={X1,X2,…,Xm},則U中C的區(qū)分矩陣記作M(C)={mi,j}n×n.其中,當(dāng)xi,xj∈D的同一等價(jià)類(lèi)時(shí),mi,j=φ;xi,xj∈D的不同等價(jià)類(lèi)時(shí),mi,j={c∈C:f(c,xi)≠f(c,xj)},11.4 屬性重要度與屬性值隸屬度
在粗糙集中,使用信息表描述論域中的數(shù)據(jù)集合.信息表的行代表對(duì)象,列代表屬性,一個(gè)屬性對(duì)應(yīng)一個(gè)等價(jià)關(guān)系.為了找出某些屬性(集)的重要性,從表中去掉一些屬性后考察沒(méi)有該屬性后分類(lèi)會(huì)如何變化.如果去掉該屬性,相應(yīng)分類(lèi)變化較大,則說(shuō)明該屬性的強(qiáng)度大,即重要性高;反之,說(shuō)明該屬性重要性低.因此,對(duì)于一個(gè)區(qū)分矩陣M(C)={mi,j}n×n,相應(yīng)的屬性a的重要性計(jì)算公式為
(1)
式中:λij為屬性出現(xiàn)在區(qū)分矩陣的長(zhǎng)度;C(mi,j)為mi,j包含屬性的個(gè)數(shù).
為提取具有較多共同特性的重要規(guī)則,必須對(duì)約簡(jiǎn)后生成的大量規(guī)則集進(jìn)行優(yōu)化運(yùn)算.針對(duì)提取出的條件規(guī)則,進(jìn)行屬性值的計(jì)算.條件屬性值的隸屬度表示決策事件(決策屬性值)Dj依賴于條件事件Cij(條件屬性值)的程度,屬性值的隸屬度(可信度)Fij可定義為
(2)
式中:Ci,j∩Dj≠φ,0 基于粗糙集理論的數(shù)據(jù)挖掘一般需要經(jīng)過(guò)數(shù)據(jù)預(yù)處理、求核屬性、屬性約簡(jiǎn)、規(guī)則生成及分析解釋結(jié)果等幾個(gè)步驟完成. 在遵循海事事故統(tǒng)計(jì)數(shù)據(jù)篩選的完整性、可靠性、時(shí)效性、足量性原則的前提下共搜集到國(guó)內(nèi)外168份海事事故報(bào)告,這些事故的原始資料分別來(lái)自:中國(guó)(中國(guó)交通運(yùn)輸部海事局網(wǎng)站、中國(guó)交通運(yùn)輸部海事局編寫(xiě)的《水上交通事故調(diào)查報(bào)告》、上海海事局編寫(xiě)的《海事案例集》)、英國(guó)海事調(diào)查委員會(huì)(MAIB,Marine Accident Investigation Bureau)、澳大利亞運(yùn)輸安全委員會(huì)(ATSB,Australian Transport Safety Bureau)、美國(guó)國(guó)家運(yùn)輸安全委員會(huì)(NTSB,National Transportation Safety Board of United States)、美國(guó)海岸警衛(wèi)隊(duì)(USCG,US Coast Guard)、加拿大運(yùn)輸安全委員會(huì)(TSB, Transportation Safety Board of Canada)和新西蘭運(yùn)輸事故調(diào)查委員會(huì)(TAIC,Transport Accident Investigation Commission of New Zealand). 在168份海事事故報(bào)告中,依據(jù)數(shù)據(jù)的完整性、可靠性、實(shí)效性原則,最終確定100份作為研究樣本.這100份樣本來(lái)源于世界主要海運(yùn)國(guó)家的海事事故調(diào)查機(jī)構(gòu)對(duì)2000—2011年共12年間發(fā)生在其管轄水域中的海事事故所做的調(diào)查報(bào)告,詳見(jiàn)表1. 表1 事故樣本統(tǒng)計(jì) 影響海事事故的因素主要是人、船、環(huán)境和管理等.本文通過(guò)分析影響海事事故的因素及所搜集到的國(guó)內(nèi)外100份海事事故報(bào)告,從人、船和環(huán)境的角度提取影響海事事故的主要因素,選擇事故類(lèi)型、事故發(fā)生時(shí)間、船旗國(guó)、噸位、船型、船齡、氣象、人為因素、事故等級(jí)等9個(gè)因素建立決策表:論域U={1,2,3,…,100},條件屬性集合C={A,T,F,G,S,E,W,H}.具體說(shuō)明如下: A為事故類(lèi)型,VA={1,2,3,4,5,6},其中1={碰撞},2={火災(zāi)或爆炸},3={設(shè)備機(jī)器故障},4={擱淺或沉船},5={自然災(zāi)害},6={其他}. T為事故發(fā)生時(shí)間,VT={1,2,3,4,5,6},其中1=[0000,0400],2=[0400,0800],3=[0800,1200],4=[1200,1600],5=[1600,2000],6=[2000,2400]. F為事故船舶的船旗國(guó),VF={1,2,3,4,5},其中,1={亞洲},2={歐洲},3={美洲},4={非洲},5={其他}. G為事故船舶噸位,VG={1,2,3,4,5},其中,1=[0,500],2=(500,3 000],3=(3 000,10 000],4=(10 000,30 000],5=(30 000,+∞). S為事故船型,VS={1,2,3,4,5,6},其中,1={漁船、游艇等小型船舶},2={干散貨船,雜貨船},3={油船、化學(xué)品等液貨船},4={集裝箱船},5={客船,滾裝船,多用途船},6={其他船型}. E為事故船舶船齡,VE={1,2,3,4,5},其中,1=[0,5),2=[5,10),3=[10,20),4=[20,30),5=[30,+∞). W為事故發(fā)生時(shí)的天氣,VW={1,2,3,4},其中,1={良好},2={大風(fēng)或大浪},3={大霧或能見(jiàn)度低},4={其他惡劣天氣}. H為事故發(fā)生的人為因素,VH={1,2,3},其中,1={人為處置得當(dāng)或無(wú)明顯失誤},2={一般性失誤},3={嚴(yán)重或重大失誤}. 決策屬性D為事故等級(jí),是事故造成的影響,依據(jù)傷亡人數(shù)、經(jīng)濟(jì)損失、環(huán)境污染等因素確定.劃分為一級(jí)和二級(jí).一級(jí)表示大事故及以上事故,二級(jí)表示一般及以下事故.VD={1,2},其中,1={一般及以下事故},2={大事故及以上事故}. 利用華沙大學(xué)的粗糙集數(shù)據(jù)處理系統(tǒng)RSES[14]導(dǎo)入經(jīng)過(guò)離散化處理的船舶事故等級(jí)決策表,共100條記錄、9個(gè)屬性,前面8個(gè)為條件屬性,最后一個(gè)為決策屬性.利用粗糙集理論中常見(jiàn)的數(shù)據(jù)約簡(jiǎn)和規(guī)則生成算法——基因遺傳算法,進(jìn)行屬性約簡(jiǎn).通過(guò)基因遺傳算法約簡(jiǎn)共產(chǎn)生15個(gè)約簡(jiǎn)集,各自包含不同的屬性. 條件屬性集的核為 o(C)={A,T,G,W}∩{A,T,F,S}∩{A,T,F,E,W}∩{H,G,S,E}∩{A,T,W,H}∩{A,T,S,E}∩{A,F,S,E,H}∩{A,F,S,W,H}∩{H,G,S,W}∩{T,G,S,E,H}∩{T,F,G,S,H}∩{A,S,E,W,H}∩{T,F,G,E,W,H}∩{F,G,S,E,H}∩{T,G,S,W,H}={φ} 根據(jù)式(1)分別對(duì)8個(gè)屬性的重要度進(jìn)行計(jì)算,結(jié)果見(jiàn)圖1. 圖1顯示:船舶類(lèi)型的影響程度最大,其次是人為因素,再次是事故發(fā)生時(shí)間段、天氣、事故類(lèi)型、噸位、船齡和船旗國(guó).船旗國(guó)對(duì)事故的影響程度最小. 圖1 各條件屬性與重要度 15個(gè)約簡(jiǎn)后的集合對(duì)應(yīng)產(chǎn)生不相同的916條規(guī)則,與沒(méi)有約簡(jiǎn)的決策規(guī)則集相比擴(kuò)大近9倍.規(guī)則集樣本的擴(kuò)大提高了決策規(guī)則的可靠性. 在已得到的決策規(guī)則基礎(chǔ)上,運(yùn)用粗糙集的屬性值的隸屬度公式(2),計(jì)算出決策表中各條件屬性相對(duì)于不同決策屬性值的隸屬度.圖2為各人為因素與不同等級(jí)海事事故的隸屬度關(guān)系曲線. 圖2 不同人為因素相對(duì)事故等級(jí)的隸屬度 3.2.1 人為影響因素?cái)?shù)據(jù)挖掘結(jié)果分析 由圖2可知:不管是重大事故還是一般事故,人為因素與事故發(fā)生的隸屬度成正比,即失誤程度越大,發(fā)生事故的可能性越大,造成的損失也越大.但人為處理得當(dāng)或無(wú)明顯失誤對(duì)重大事故的影響比對(duì)一般性事故的影響更大,反映出人員處理事故的能力對(duì)事故損失影響的重要性.因此,提高人員對(duì)事故的應(yīng)變能力對(duì)避免重大事故的發(fā)生有重要作用.船公司應(yīng)對(duì)船上人員進(jìn)行安全培訓(xùn),提高業(yè)務(wù)處理水平和安全意識(shí),減少重大人為失誤的發(fā)生. 3.2.2 船舶影響因素?cái)?shù)據(jù)挖掘結(jié)果及分析 (1)事故船舶類(lèi)型因素.圖3顯示:干散貨船、油船和集裝箱船發(fā)生重大事故與一般事故的隸屬度趨勢(shì)基本一致.大型集裝箱船與油船等專業(yè)性船舶發(fā)生大事故及以上事故的隸屬度相對(duì)較低,也就是發(fā)生事故后出現(xiàn)嚴(yán)重受損的可能性較低.由此可見(jiàn)提升船舶的專業(yè)化有助于提高船舶的安全性.其中集裝箱船發(fā)生事故的隸屬度在這3類(lèi)船舶中最低,反映出集裝箱船的安全性能較好.而漁船、游艇等小型船、客船及滾裝船、多用途船舶發(fā)生重大事故的隸屬度明顯高于其他船型,極易發(fā)生船舶全損及沉沒(méi)等大事故及以上事故,因此應(yīng)加強(qiáng)這類(lèi)船舶的安全管理. (2)船齡因素的隸屬度.圖4顯示:船齡在5~10年的船舶發(fā)生事故的隸屬度最低,表明這一船齡段船舶與人員環(huán)境等磨合得較好,發(fā)生事故的概率較低.新船船齡在0~5年的船舶比5~10年船齡的船舶更易發(fā)生事故.隨著船齡增大、船體腐蝕、設(shè)備老化等,大事故及以上事故的隸屬度呈逐漸增大的趨勢(shì).船齡在30年及以上船舶發(fā)生大事故及以上等級(jí)事故的隸屬度接近0.6,表明老齡船舶發(fā)生嚴(yán)重事故的危險(xiǎn)度比較高.船齡在10~20年時(shí)船舶發(fā)生一般及以下等級(jí)事故的隸屬度稍高,0~5年船舶發(fā)生一般及以下等級(jí)事故的隸屬度稍低. 圖3 不同船舶類(lèi)型相對(duì)事故等級(jí)的隸屬度 圖4 船齡因素相對(duì)事故等級(jí)的隸屬度 (3)船舶噸位的隸屬度.圖5顯示:船舶小于500總噸時(shí),發(fā)生事故的危險(xiǎn)程度明顯高于其他噸位級(jí)別的船舶,極易發(fā)生船舶全損的危險(xiǎn)事故.船舶噸位在30 000總噸以上的船舶發(fā)生大事故及以上等級(jí)事故的隸屬度明顯低于中等及以下噸位船舶的隸屬度.由此可見(jiàn)船舶的大型化有助于提高船舶的安全性.船舶噸位在500~10 000總噸時(shí)發(fā)生一般及以下等級(jí)事故的隸屬度比較高,明顯高于其他噸位船舶.大于30 000總噸時(shí)發(fā)生一般及以下等級(jí)事故的隸屬度最低. 圖5 船舶噸位因素相對(duì)事故等級(jí)的隸屬度 (4)船旗國(guó)的隸屬度.圖6顯示:船旗國(guó)為美洲國(guó)家時(shí)船舶發(fā)生大事故及以上等級(jí)事故的隸屬度最高.可能主要源于很多船公司為節(jié)省費(fèi)用掛南美洲國(guó)家如巴拿馬及其他國(guó)家的船旗有關(guān).歐洲船旗國(guó)的事故隸屬度較低.船旗國(guó)屬于美洲和亞洲國(guó)家的船舶發(fā)生一般及以下等級(jí)事故的隸屬度明顯高于其他各洲,且美洲稍高于亞洲. 圖6 船旗國(guó)因素相對(duì)事故等級(jí)的隸屬度 3.2.3 外部環(huán)境影響因素?cái)?shù)據(jù)挖掘結(jié)果及分析 (1)事故發(fā)生時(shí)間因素的隸屬度.圖7顯示:在[0000,0400],[0400,0800],[2000,2400]時(shí)間段發(fā)生大事故及以上事故的隸屬度較高,尤其在[0000,0400]時(shí)間段達(dá)到最高,即該時(shí)間段最易發(fā)生大事故,可能是因?yàn)榇瑔T疲勞造成的.同時(shí)可以看出夜晚發(fā)生事故的概率明顯大于白天.這可能是因?yàn)樵谝雇砗叫兄?,發(fā)生突發(fā)事件時(shí),人的視覺(jué)、注意力和反應(yīng)判斷能力受到影響所致.在[1600,2000]時(shí)間段發(fā)生一般及以下等級(jí)事故的隸屬度高于其他時(shí)間段,[0800,1200]發(fā)生事故的隸屬度最低. 圖7 事故發(fā)生時(shí)間因素相對(duì)事故等級(jí)的隸屬度 (2)事故類(lèi)型的隸屬度.圖8顯示:船舶碰撞情況下發(fā)生大事故或以上事故的隸屬度最高;火災(zāi)或爆炸、設(shè)備機(jī)器故障、擱淺或沉沒(méi)情況下發(fā)生大事故或以上事故的隸屬度大體相當(dāng).而對(duì)于一般及以下等級(jí)事故碰撞及擱淺或沉沒(méi)的隸屬度較高.擱淺或沉沒(méi)情況下發(fā)生大事故或以上事故與發(fā)生一般及以下等級(jí)事故的隸屬度大體相當(dāng). 圖8 事故類(lèi)型相對(duì)事故等級(jí)的隸屬度 (3)氣象因素的隸屬度.圖9顯示:大霧、能見(jiàn)度低情況下發(fā)生大事故或以上事故的隸屬度稍高于大風(fēng)或大浪,可能是因?yàn)榇箪F或其他惡劣天氣的能見(jiàn)度低,導(dǎo)致船舶碰撞、擱淺及觸礁的事故更容易發(fā)生.而一旦發(fā)生此類(lèi)事故很可能造成船舶人員傷亡及經(jīng)濟(jì)損失.大風(fēng)或大浪條件下發(fā)生一般及以下等級(jí)事故的隸屬度最高,天氣良好時(shí)發(fā)生一般及以下等級(jí)事故的隸屬度最低. 圖9 氣象因素相對(duì)事故等級(jí)的隸屬度 以國(guó)內(nèi)外最新的100份海事事故報(bào)告為樣本,運(yùn)用粗糙集理論從人、船、環(huán)境的角度研究事故類(lèi)型、事故發(fā)生時(shí)間、船旗國(guó)、噸位、船型、船齡、氣象、人為因素與事故等級(jí)之間的重要性隸屬度關(guān)系,克服主觀影響,所得結(jié)論具有一定的普遍性. 本文的研究結(jié)論在人為因素、事故類(lèi)型、天氣因素及船旗國(guó)因素對(duì)事故等級(jí)的影響方面與以往學(xué)者的研究結(jié)論基本一致:即人為因素與事故發(fā)生的隸屬度成正比;碰撞型事故類(lèi)型在各事故中隸屬度最高;天氣越惡劣,事故發(fā)生隸屬度越高;船旗國(guó)為美洲國(guó)家的船舶發(fā)生大事故及以上等級(jí)事故的隸屬度最高. 在事故發(fā)生時(shí)間、船齡、船舶類(lèi)型及船舶噸位與海事事故的關(guān)系方面,本文的研究結(jié)論與以往學(xué)者的研究結(jié)論有所不同,結(jié)果顯示: (1)在[0000,0400]時(shí)間段發(fā)生大事故及以上等級(jí)海事事故的概率較高,與閆化然[6]對(duì)碰撞事故的研究結(jié)論有所不同,表明不同類(lèi)型事故的高發(fā)時(shí)間段存在差異. (2)5~10年船齡的船舶事故隸屬度最低.0~5年船齡的船舶比5~10年船齡的船舶事故隸屬度高,說(shuō)明新船比5~10年船齡的船舶更易發(fā)生事故.原因可能在于新船需要在人、船舶、環(huán)境和管理上更好地磨合,但在磨合中比較容易出現(xiàn)事故.這點(diǎn)在海事事故以往的研究中未有體現(xiàn). (3)總體上事故碰撞率與船舶噸位大小成反比,但500總噸以下小船的碰撞危險(xiǎn)度最高. (4)漁船、游艇、雜貨船發(fā)生事故的隸屬度較高,比較容易引發(fā)大事故及以上等級(jí)事故.集裝箱船等大型專業(yè)化船舶發(fā)生事故的隸屬度較低,不易發(fā)生重大事故,但三大主力船型中的散貨船發(fā)生一般事故的隸屬度最高,更易發(fā)生事故. 參考文獻(xiàn): [1] SCHR?DER-HINRICHS J U, BALDAUF M, GHIRXI K T. Accident investigation reporting deficiencies related to organizational factors in machinery space fires and explosions[J]. Accident Anal & Prevention, 2011, 43(3): 1187-1196. [2] LENNé M G, SALMON P M, LIU C C,etal. A systems approach to accident causation in mining: an application of the HFACS method[J]. Accident Anal & Prevention, 2012, (48): 111-117. [3] CELIK M, LAVASANI S M, WANG J. A risk-based modeling approach to enhance shipping accident investigation[J]. Safety Sci, 2010, 48(1): 18-27. [4] KOKOTOS D X, LINARDATOS D S. An application of data mining tools for the study of shipping safety in restricted waters[J]. Safety Sci, 2011, 49(2): 192-197. [5] 劉正江, 吳兆麟. 基于船舶碰撞事故調(diào)查報(bào)告的人的因素?cái)?shù)據(jù)挖掘[J]. 中國(guó)航海, 2004, 59(2): 1-6. [6] 閆化然. 基于粗糙集的船舶碰撞受損的影響因素分析研究[D]. 大連: 大連海事大學(xué), 2011. [7] 鄒建軍, 胡以懷. 船舶機(jī)損事故中人為失誤的分析[J]. 上海海運(yùn)學(xué)院學(xué)報(bào), 2003, 24(2): 119-123. [8] 徐東華, 吳兆麟. 基于粗糙集數(shù)據(jù)約簡(jiǎn)的海事事故致因研究[J]. 大連海事大學(xué)學(xué)報(bào), 2009, 35(3): 37-39. [9] 劉茹茹,胡勤友.一種主觀的船舶碰撞危險(xiǎn)度評(píng)價(jià)模型[J]. 上海海事大學(xué)學(xué)報(bào), 2012, 33(1): 41-44. [10] 鄭濱, 金永興. 基于屬性約簡(jiǎn)的海事人為失誤致因分析[J]. 上海海事大學(xué)學(xué)報(bào), 2010, 31(1): 91-94. [11] PAWLAK Z. Rough set[J]. Int J Comput & Inform Sci, 1982, 11(5): 341-356 [12] 張文修, 吳偉志, 梁吉業(yè), 等. 粗糙集理論與方法[M]. 北京: 科學(xué)出版社, 2001. [13] PAWLAK Z. Rough sets: theoretical aspects of reasoning about data[M]. Dordrecht: Kluwer Academic Publishers, 1991. [14] University of Warsaw. RSES 2.2 User’s Guide[G/OL]. (2005-01-19)[2012-04-06]. http://logic.mimuw.edu.pl/~rses.2 基于粗糙集的海事事故影響因素分析的數(shù)據(jù)預(yù)處理
2.1 海事事故統(tǒng)計(jì)數(shù)據(jù)的來(lái)源及篩選
2.2 海事事故統(tǒng)計(jì)數(shù)據(jù)的預(yù)處理
3 基于粗糙集的海事事故影響因素?cái)?shù)據(jù)挖掘與分析
3.1 決策表生成、約簡(jiǎn)及屬性重要度
3.2 海事事故主要影響因素?cái)?shù)據(jù)挖掘結(jié)果分析
4 結(jié) 論