亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Apriori算法的海事事故中人為失誤致因分析

        2014-08-21 11:49:36李鈴鈴
        交通信息與安全 2014年2期
        關鍵詞:項集海事數(shù)據(jù)挖掘

        李鈴鈴 仇 蕾

        (河海大學管理科學研究所 南京211100)

        0 引 言

        我國是海洋大國,海洋問題事關國家根本利益。近年來,海事事故頻頻發(fā)生,嚴重制約了我國海洋事業(yè)的發(fā)展。研究表明,90%的海事事故是由人為失誤引發(fā)的,人為失誤又是由各種因素導致的,避免或減少海事事故的關鍵是減少這些因素的發(fā)生。筆者研究的主要內容就是找出人為失誤和這些因素之間的關系,并獲得影響力較強的因素。

        以往研究主要采用查詢、報表、聯(lián)機應用分析等傳統(tǒng)的方法,但這些方法只能初步識別出引發(fā)海事事故的人為失誤行為,無法分析出人為失誤與各影響因素之間的相互關系。筆者利用數(shù)據(jù)挖掘中的關聯(lián)規(guī)則,挖掘出了它們之間存在的相互關系。關聯(lián)規(guī)則分析是指在大型數(shù)據(jù)庫系統(tǒng)中,迅速找出各事物之間潛在的、有價值的關聯(lián),并用規(guī)則的形式表現(xiàn)出來。陳興偉和王志明[1]對海事各原因與結果之間的關聯(lián)性進行了分析,發(fā)現(xiàn)船員因素與碰撞事故關聯(lián)性最大。張曉輝、劉正江與吳兆麟[3]利用單維關聯(lián)規(guī)則挖掘出人為失誤與單因素之間對應關系。由于海事事故的發(fā)生是由多種因素混合組成造成的,光是挖掘出人為失誤和單因素之間的對應關系還遠遠不夠。筆者在前人研究的基礎上,運用多維關聯(lián)規(guī)則中的Apriori算法,借助Matlab軟件工具,不僅挖掘出人為失誤和單因素之間的對應關系,還挖掘出人為失誤與影響因素組合之間的相互關系,更符合海事事故發(fā)生的實際情況,為相關部門的管理決策提供依據(jù)和支持。

        1 基于Apriori算法的海事事故中人為失誤致因分析模型

        1.1 關聯(lián)規(guī)則

        1.1.1 Apriori算法

        關聯(lián)規(guī)則是數(shù)據(jù)挖掘中非常重要的分支,目前已經(jīng)提出了很多算法,最著名的是R.Agrawal等人提出的Apriori算法[4],以下是Apriori算法的相關概念。

        1)項集或候選集。Item={Item1,Item2,…,Itemk}稱為k項集或k項候選集。假設DB包含m項屬性(A,B,…,M),1項集1_Item={{A},{B},…,{M}},2項集2_Item={{A,B},{A,C},…,{A,M},{B,C},{B,D},…,{B,M},…,{C,D},…,{L,M}},共有[m×(m-1)/2]項項集;3項集3_Item={{A,B,C},{A,B,D},…,{A,B,M},{A,C,D},{A,C,E},…,{B,C,D},{B,C,E},…,{B,C,M},…,{K,L,M}};依次類推,m_Item={A,B,C,…,M},有一個項集。

        2)支持度和可信度。支持度support簡稱sup,指某條規(guī)則的前件或后件對應支持度與總數(shù)的百分比。A的支持度sup(A)=|TR|TRA|/|n|,(AB)=sup(A∪B)=|TR|TR(A∪B)|/|

        n|,其中,n是DB中總數(shù)的記錄數(shù)目??尚哦萩onfidence簡稱為conf,規(guī)則AB具有可信度conf(AB),表示DB中包含A的事物同時也包含B的百分比,是A∪B的支持度和前件A的支持度的百分比:conf(AB)=sup(A∪B)/sup(A)。

        3)強項集或頻繁項集。如果k項候選集的支持度大于或者等于設定的最小支持度,則稱該k項候選項集為k項強項集或者k項頻繁項集。

        4)關聯(lián)規(guī)則。若A,B為項集,AItem,BItem并且A∩B=,關聯(lián)規(guī)則是形如AB的蘊含式,算法普遍基于Support-Confidence模型。即在滿足最小支持度時,若強項集可信度滿足最小可信度,稱此k項強項集為關聯(lián)規(guī)則。例如,若(A,B)為二項強項集,sup(A∪B)≥min_sup且conf(AB)≥min_conf,則稱AB為關聯(lián)規(guī)則。

        1.1.2 多維關聯(lián)規(guī)則

        根據(jù)關聯(lián)規(guī)則所涉及的維數(shù)可以將其分成單維關聯(lián)規(guī)則和多維關聯(lián)規(guī)則[5]。當關聯(lián)規(guī)則中屬性只有一維,那么就稱為單維關聯(lián)規(guī)則或一維關聯(lián)規(guī)則;否則稱為多維關聯(lián)規(guī)則。例如,天氣(霧)→瞭望不當,規(guī)則左右兩邊的屬性只涉及一維,則稱為單維關聯(lián)規(guī)則;若天氣(霧)∧時間(03:30)→瞭望不當(“∧”指天氣因素和時間因素同時存在),是規(guī)則的左邊涉及天氣和時間兩維,則稱為多維關聯(lián)規(guī)則。由于海事事故的發(fā)生通常是由多種人為失誤和影響因素造成,運用多維關聯(lián)規(guī)則進行挖掘更符合實際情況。

        1.2 人為失誤和影響因素

        海事事故中,人為失誤指的是由于操作人員的錯誤決策和行為[9],導致船舶系統(tǒng)出現(xiàn)故障、效率降低或性能受損,從而引發(fā)海事事故。筆者將人為失誤分成了13種;導致人為失誤的影響因素分為4類,分別是個人因素、組織管理因素、船舶因素和自然因素,共有32種因素。為方便計算,對人為失誤和影響因素進行編碼,見表1、表2。

        表1 人為失誤編碼Tab.1 Code of human errors

        表2 影響因素編碼Tab.2 Code of factors

        海事事故的原始數(shù)據(jù)是雜亂無章,并且不完全的,需要對原始數(shù)據(jù)進行簡化。保留事故記錄中的導致事故發(fā)生的字段和事故結果字段,刪掉其他字段,對事故記錄進行簡化。然后對事故的屬性進行編碼,并對屬性值進行預處理,將其映射為整數(shù)。海事事故記錄中的數(shù)據(jù)類型主要有3種:第1種是布爾型,如瞭望不當、未準確定位等;第2種是枚舉型,如能見度、天氣等;第3種是數(shù)值型,如時間、交通流。需要對數(shù)據(jù)進行處理[12]。

        1)將布爾型數(shù)據(jù)進行轉化。以瞭望不當為例,如果事故記錄中有這項人為失誤,則該屬性的屬性值為1;否則屬性值為0。

        2)對枚舉型數(shù)據(jù)進行處理。以天氣為例,主要有晴、陰、雨、霧4種天氣,處理之后為:B27=1,晴;B27=2,陰;B27=3,雨;B27=4,霧。

        3)對數(shù)值型數(shù)據(jù)進行離散化處理。以海事事故發(fā)生的時間為例,對該屬性的屬性值進行離散化:B32=1,00:00~06:00時;B32=2,06:00~08:00 時;B32=3,08:00~16:00 時;B32=4,16:00~18:00時;B32=5,18:00~24:00時。

        1.3 分析步驟

        運用Apriori算法分析人為失誤誘因的步驟見圖1[14]。

        圖1 基于Apriori算法的海事事故中人為失誤誘因分析步驟圖Fig.1 Causation analysis of human miss in marine accidents based on Apriori algorithm

        具體步驟如下。

        1)先將海事事故調查報告轉化成表格的形式。

        2)將表格轉化成整數(shù)形式的數(shù)據(jù)庫。

        3)計算每項人為失誤在數(shù)據(jù)庫中出現(xiàn)的次數(shù)count(Am)。

        4)計算每項人為失誤和影響因素同時出現(xiàn)的次數(shù)count(Am∪Bn)。

        5)根據(jù)步驟(3),(4)計算所有的支持度s(Am→Bn)和可信度c(Am→Bn)。

        6)設定支持度和可信度閾值,若可信度和支持度都大于閾值,則獲得相應的規(guī)則。

        7)計算出每項人為失誤和影響因素組合同時出現(xiàn)的次數(shù)count(Am∪(Bn1∪Bn2))。

        8)根據(jù)步驟(3),(7)計算出人為失誤和影響因素組合的支持度s(Am→(Bn1、Bn2))和可信度s(Am→(Bn1、Bn2))。

        9)通過與閾值比較,獲得相應的關聯(lián)規(guī)則,并從中獲得導致人為失誤的主要誘因。

        2 實例分析

        2.1 報告來源

        為了讓數(shù)據(jù)更加符合研究的要求,從世界主要海運國家海事調查機構中精選了100份近年來的事故調查報告,并對這些調查報告進行研究分析,表3為報告的主要來源。

        表3 海洋事故調查報告來源Tab.3 Sources of marine accident investigation report

        報告具有以下幾個特性。

        1)時效性。事故報告選自近10年的事例,具有更好地參考價值。

        2)權威性。事故報告必須是國家授權的海事調查機構或者海事管理機構發(fā)布的,這樣對當事船的任何一方都不會有偏見。

        3)隨機性。選擇事故報告時不要刻意考慮事故發(fā)生的時間、地點、船型、駕引人員情況、船舶所屬公司和國籍等因素,保證人為失誤與影響因素之間的關系不受報告來源影響。

        4)完整性。書面報告要符合特定的格式,內容完整,事實表述清楚,分析有條有理。

        2.2 實例分析

        根據(jù)精選的100份調查報告建立1個海事事故數(shù)據(jù)庫D,count(D)=100。每1個事故都有1個屬性集合I={i1,i2,…,im,…,i45}。式中:im=0或1。由于已將人為失誤分為13種,影響因素分為32種,所以總數(shù)是45。D中每一個事故都是I中1組因素的集合,即D∈I。設A是人為失誤的集合,B是影響因素的集合,如果A∈T、B∈T,那么稱事故T含A,B。其中:A={A1,A2,…,A13},B={B1,B2,…,B32}。

        在對事故進行關聯(lián)分析之前[15],要對最小支持度和最小可信度閾值進行合理的設定。閾值設定得過高,會忽略掉許多重要的規(guī)則;設定得過低,則會出現(xiàn)大量的矛盾規(guī)則和冗余規(guī)則。以往的研究中基本是采用經(jīng)驗法設定閾值,也就是憑借主觀經(jīng)驗對閾值進行設定。事實證明,運用經(jīng)驗法設定的閾值要么偏高,要么偏低,不符合實際情況。筆者采用的是基于支持度變化的閾值設定方法,首先選擇1個初始閾值進行計算,通過迭代,最終確定最適合用戶的閾值。實例中,將初始支持度閾值設定為0.4,通過迭代確定最終的支持度閾值為0.305,可信度閾值為0.347。

        1)第1次關聯(lián)分析。首先計算每項人為失誤和影響因素所對應的支持度s(Am→Bn)和可信度c(Am→Bn),將計算的結果與閾值進行比較,如果大于閾值,則獲得相應的關聯(lián)規(guī)則。

        支持度和可信度由式(1)、式(2)計算,獲得的關聯(lián)規(guī)則見表4。

        表4 第1次數(shù)據(jù)挖掘產生的關聯(lián)規(guī)則Tab.4 The first data mining association rules generated

        2)第2次關聯(lián)分析。首先計算每項人為失誤和影響因素組合所對應的支持度s(Am→(Bn1、Bn2))和可信度s(Am→(Bn1、Bn2)),若計算結果大于閾值,則獲得相應的關聯(lián)規(guī)則。

        支持度和可信度由式(3)、式(4)計算,獲得的關聯(lián)規(guī)則見表5。

        2.3 挖掘結果

        采用不同的可信度和支持度閾值,運用關聯(lián)規(guī)則挖掘出來的結果也不一樣。筆者通過迭代確定合適的支持度和可信度閾值,對海事事故數(shù)據(jù)進行了2次挖掘。首先對人為失誤和單因素之間的對應關系進行了挖掘。以其中1項人為失誤瞭望不當為例,挖掘出主要的影響因素有B9,B11,B15,B18,B28,B30和B31,也就是注意力、信息處理能力、知識經(jīng)驗培訓、配員、監(jiān)督、能見度、航道和交通流。

        表5 第2次數(shù)據(jù)挖掘產生的關聯(lián)規(guī)則Tab.5 The second data mining association rules generated

        第2次是挖掘人為失誤和影響因素組合之間的關系。以瞭望不當為例,挖掘出的主要影響因素組合為(B9,B30),(B11,B30),(B18,B30)和(B28,B31),也就是(信息處理能力、航道),(知識經(jīng)驗培訓、航道),(監(jiān)督、航道)和(能見度、交通流)。

        3 結論及建議

        針對海事事故數(shù)據(jù)復雜量多等特點,運用多維關聯(lián)規(guī)則的數(shù)據(jù)挖掘方法,建立了基于Apriori算法的海事事故中人為失誤致因分析模型。通過對模型計算結果進行分析,得到一些有意義的結論和改進措施。

        1)人員的注意力、信息處理能力、知識經(jīng)驗培訓,船舶的配員、監(jiān)督以及一些外部條件如天氣的能見度、通行航道和交通流是導致人為失誤,引發(fā)海洋事故的主要因素。所以要想減少海事事故的發(fā)生率,要從內部條件和外部環(huán)境2方面預防事故的發(fā)生。

        從內部條件方面,選拔一些素質較高的工作人員,如思維反應比較敏捷,受教育程度較高的工作人員;在這個基礎上制定合理的監(jiān)管制度,并對人員進行合理的配置。

        外部環(huán)境方面,盡量在天氣較好、能見度較高的時候進行航行;選擇路線較為安全,船舶流量較少的航線航行,以此減少事故發(fā)生的外部風險。

        2)當外部的條件不是特別利于航行時,如航道不順,交通流太密集,或能見度不高時,應當立即調整人員配置,加大監(jiān)管措施,以減少事故的發(fā)生率。

        3)研究表明,當交通流很密集的航行區(qū)域出現(xiàn)能見度較低的天氣時,發(fā)生海事事故的概率較高。所以當航海出現(xiàn)這種情況的時候,可以適當?shù)卣{整航行計劃,如暫時將船舶停靠至附近的碼頭或者選擇合適的時間段航行,降低事故發(fā)生概率。

        同時,筆者所做研究仍然存在一些不足之處。

        1)沒有針對特定海域的海事事故分析研究,所以不具有太強的針對性。

        2)在對海事事故進行關聯(lián)分析時,仍然沒有找出理想的針對海事事故數(shù)據(jù)的閾值設定方法。

        [1] 陳興偉,王志明.港口水域安全風險分析法[J].中國航海,2009,32(1):69-71.

        [2] 曲生偉.海上交通事故案例[M].武漢:武漢理工大學出版社,2011.

        [3] 劉正江,吳兆麟.基于船舶碰撞事故調查報告的人的因素數(shù)據(jù)挖掘[J].中國航海,2004(2):1-6.

        [4] 陳 燕.數(shù)據(jù)挖掘技術與應用[M].北京:清華大學出版社,2010.

        [5] 王宏雁,王 琪.多層多維關聯(lián)規(guī)則在交通事故研究中的應用[J].交通科學與工程,2009,25(1):73-77.

        [6] 劉 紅,何 鵬.基于粗糙集的海事事故影響因素分析[J].上海海事大學學報,2013,34(2):18-23.

        [7] 畢建欣,張岐山.關聯(lián)規(guī)則挖掘算法綜述[J].中國工程科學,2005,7(4):89-94.

        [8] 張曉輝,劉正江,吳兆麟.基于水上交通安全事故基礎數(shù)據(jù)的模式發(fā)現(xiàn)[J].大連海事大學學報,2011,37(2):40-42

        [9] 付玉慧.海事事故中人為失誤的作用機理[J].大連海事大學學報,2004(3):106-108.

        [10] 程 巖,黃梯云.粗糙集中定量關聯(lián)規(guī)則的發(fā)現(xiàn)及其規(guī)則約簡的方法研究[J].管理工程學報,2001(3):73-77.

        [11] 劉 洋,馬壽峰.基于聚類分析的非參數(shù)回歸短時交通流預測方法[J].交通信息與安全,2013,31(2):27-31.

        [12] 王冬秀,賴先濤,李 輝,等.道路交通事故中關聯(lián)規(guī)則挖掘研究[J].計算機與信息化,2012(8):207-208.

        [13] 蔣 宏,方守恩,陳雨人,等.基于時間序列和灰色模型的交通事故預測[J].交通信息與安全,2012,30(4):93-98.

        [14] 郭秀娟.基于關聯(lián)規(guī)則數(shù)據(jù)挖掘算法的研究[D].長春:吉林大學,2004.

        [15] 朱曉東,李幫義.基于支持度變化的關聯(lián)規(guī)則重挖掘技術[J].電氣技術與自動化,2005,34(2):75-77.

        猜你喜歡
        項集海事數(shù)據(jù)挖掘
        信息精要與海事掃描
        水上消防(2021年5期)2022-01-18 05:33:42
        信息精要與海事掃描
        水上消防(2021年3期)2021-08-21 03:12:22
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        信息精要與海事掃描
        水上消防(2020年5期)2020-12-14 07:16:30
        信息精要與海事掃描
        水上消防(2020年3期)2020-07-25 02:36:32
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        關聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
        卷宗(2014年5期)2014-07-15 07:47:08
        一種頻繁核心項集的快速挖掘算法
        計算機工程(2014年6期)2014-02-28 01:26:12
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        那有一级内射黄片可以免费看| 亚洲av无码专区在线亚| 亚洲精品高清av在线播放| 高清不卡av一区二区| 日本一区二区三区免费播放| 无码少妇一区二区三区| 中文字幕无码高清一区二区三区| 亚洲av成人波多野一区二区| 久久精品丝袜高跟鞋| 无码人妻黑人中文字幕| 国产视频在线一区二区三区四区| 丝袜人妻中文字幕首页| 久久成人成狠狠爱综合网| 精品午夜福利无人区乱码一区| 91福利国产在线观一区二区| 免费国产不卡在线观看| 久久无码人妻丰满熟妇区毛片| 亚洲av无码一区二区二三区| 日韩在线精品在线观看| 在线看亚洲一区二区三区| 久久久久国色av免费观看性色| 国产精品va在线播放我和闺蜜 | 亚洲国产美女精品久久久| 亚洲综合五月天欧美| 色男色女午夜福利影院| av国产传媒精品免费| 国产亚洲日韩一区二区三区| 情色视频在线观看一区二区三区| 亚洲av网站在线观看一页| 小荡货奶真大水真多紧视频| 精选麻豆国产AV| 日本一级三级在线观看| 久久久久亚洲av片无码| 成人区人妻精品一区二区不卡网站 | a级国产乱理论片在线观看| 亚洲成a人片在线观看中文!!!| 一区二区三区视频亚洲| 欧美日韩国产码高清综合人成| 精品人妻无码中文字幕在线| 国产一区二区视频在线看| 亚洲av无码国产精品色午夜字幕 |