雷紫淇 王凡帆 於尚霏 申靜雯
(中國(guó)礦業(yè)大學(xué)(北京) 北京 100083)
電梯是人民群眾生產(chǎn)生活中的重要運(yùn)輸工具,應(yīng)用范圍廣,使用頻率高。國(guó)家市場(chǎng)監(jiān)督管理總局發(fā)布的《2022 年全國(guó)特種設(shè)備安全狀況的通告》顯示,截至2022 年底,全國(guó)共發(fā)生特種設(shè)備事故和相關(guān)事故108 起,其中電梯事故22 起,占全年特種設(shè)備安全事故總數(shù)的20.37%,死亡17 人[1]。此外,根據(jù)國(guó)家市場(chǎng)監(jiān)督管理總局特種設(shè)備安全監(jiān)察局發(fā)布的全國(guó)特種設(shè)備安全狀況通報(bào),近10 年全國(guó)電梯每年的增長(zhǎng)率都在10%以上,2022 年的全國(guó)特種設(shè)備數(shù)量是2013 年的2.1 倍。巨大的保有量導(dǎo)致電梯事故時(shí)有發(fā)生,且具有一定的突發(fā)性、偶然性和隨機(jī)性,因此結(jié)合法律法規(guī)和電梯安全事故案例,進(jìn)行總結(jié)分析,通過(guò)對(duì)事故原因和事故特征的提取,構(gòu)建致因預(yù)測(cè)模型,在事故發(fā)生后,能夠通過(guò)事故特征及時(shí)得到較為準(zhǔn)確的事故發(fā)生直接原因、間接原因等相關(guān)信息,提高事故后的解決效率,是十分必要的。
隨著實(shí)際安全管理問(wèn)題和現(xiàn)處社會(huì)經(jīng)濟(jì)大環(huán)境復(fù)雜性不斷被人們所認(rèn)識(shí),關(guān)于科學(xué)的研究方法論體系也在不斷拓展。為預(yù)防和減少事故的發(fā)生,專(zhuān)家在多個(gè)領(lǐng)域?qū)κ鹿拾l(fā)生的各種影響因素進(jìn)行了研究,構(gòu)建不同的事故致因模型,提出不同的事故致因理論,并借用Python 語(yǔ)言、C 語(yǔ)言、R 語(yǔ)言等對(duì)導(dǎo)致事故發(fā)生的各個(gè)因素之間的關(guān)聯(lián)進(jìn)行了研究。將事故特征和事故致因間關(guān)聯(lián)關(guān)系也運(yùn)用在化工、建筑、道路交通等領(lǐng)域,但該項(xiàng)研究在電梯安全領(lǐng)域運(yùn)用較少。
海外的學(xué)者已進(jìn)行過(guò)有關(guān)電梯安全事故的探討,并且以此研究的產(chǎn)出分別從人力、設(shè)備、資料、法律以及環(huán)境等多角度提供了優(yōu)化做法及建議。例如,國(guó)外Zarikas V 和Loupis M 通過(guò)分析希臘電梯安全事故,得出了與電梯安裝、服務(wù)和運(yùn)行相關(guān)的各種統(tǒng)計(jì)推斷,結(jié)果顯示有65%的事故發(fā)生在電梯安裝和維護(hù)作業(yè)人員身上,并指出安全管理制度沒(méi)有落實(shí)好是電梯事故發(fā)生的主要原因[2]。國(guó)內(nèi)張武橋[3]用數(shù)理統(tǒng)計(jì)分析的方法,基于電梯運(yùn)營(yíng)安全事故樣本數(shù)據(jù),通過(guò)事故發(fā)生的地點(diǎn)、形態(tài)、環(huán)節(jié)、原因等,歸納總結(jié)電梯運(yùn)營(yíng)事故發(fā)生的潛在規(guī)律和根本原因,最后從主成分角度和安全理論維度分析了電梯運(yùn)營(yíng)安全的影響因素。藍(lán)麒[4]從電梯安全脆弱性角度對(duì)電梯安全協(xié)同治理進(jìn)行了深入分析,構(gòu)建了電梯安全協(xié)同治理體系框架。
然而,造成電梯事故的原因方面,多數(shù)研究者主要參照電梯安全管理實(shí)踐知識(shí)和統(tǒng)計(jì)分析來(lái)進(jìn)行探討。在國(guó)內(nèi),李玨等人[5]通過(guò)找出導(dǎo)致電梯事故的關(guān)鍵人為因素,并對(duì)其關(guān)聯(lián)性進(jìn)行分析,使用人因分析與分類(lèi)系統(tǒng)(HFACS)模型對(duì)電梯事故進(jìn)行分類(lèi)統(tǒng)計(jì)與研究。并利用卡方檢驗(yàn)以及概率比分析HFACS 上層與下層人因之間的關(guān)聯(lián)性,最終提出針對(duì)預(yù)防電梯事故的實(shí)施方案。但目前關(guān)于電梯安全事故的研究主要側(cè)重于構(gòu)建電梯安全風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系,或者是對(duì)于單個(gè)因素、單個(gè)事故表征的研究,將電梯安全事故表征與事故致因因素結(jié)合起來(lái)綜合分析,并建立高質(zhì)量致因預(yù)測(cè)模型的研究并不是很全面。
為獲得較為準(zhǔn)確全面的語(yǔ)料庫(kù),基于Python 語(yǔ)言,用爬蟲(chóng)技術(shù)對(duì)電梯安全相關(guān)法律法規(guī)和電梯事故案例進(jìn)行爬取。獲得《中華人民共和國(guó)特種設(shè)備安全法》《特種設(shè)備安全監(jiān)督檢查辦法》《特種設(shè)備事故報(bào)告和調(diào)查處理規(guī)定》《特種設(shè)備安全監(jiān)察條例》等相關(guān)法律法規(guī)以及近10 年來(lái)我國(guó)部分電梯安全事故案例。
分析所獲語(yǔ)料,發(fā)現(xiàn)有重復(fù)值、缺失值、異常數(shù)據(jù)等不利因素存在,為保證爬取所獲文本的質(zhì)量以及后續(xù)模型建造的質(zhì)量和準(zhǔn)確性,借助Python 語(yǔ)言,再對(duì)其進(jìn)行數(shù)據(jù)的預(yù)處理,包括清洗數(shù)據(jù)、分詞、過(guò)濾停用詞等,見(jiàn)圖1。
圖1 數(shù)據(jù)預(yù)處理
針對(duì)預(yù)處理后的語(yǔ)料,提取電梯安全事故報(bào)告中的“直接原因”“間接原因”“事故特征”“事故發(fā)生前設(shè)備狀態(tài)”和“事故分類(lèi)”等相關(guān)因素并總結(jié),見(jiàn)圖2。
圖2 特征提取
將提取總結(jié)后的相關(guān)因素?cái)?shù)據(jù)化處理,并將電梯安全事故的直接原因和間接原因整理為人的因素、管理因素、設(shè)備因素和環(huán)境因素4 個(gè)方面[6,7],數(shù)據(jù)化處理結(jié)果見(jiàn)表1。
表1 電梯安全事故樣本數(shù)據(jù)的數(shù)據(jù)化處理
網(wǎng)格搜索算法是通過(guò)遍歷研究中所給定的數(shù)據(jù)參數(shù)組合,來(lái)完善所建模型。如果在遍歷過(guò)程中超參數(shù)的選擇不恰當(dāng),就會(huì)出現(xiàn)欠擬合或者過(guò)擬合的現(xiàn)象,導(dǎo)致最終預(yù)測(cè)結(jié)果不準(zhǔn)確。網(wǎng)格搜索算法將在規(guī)定的參數(shù)范圍內(nèi),按照步長(zhǎng)依次調(diào)整規(guī)范參數(shù),在一次次調(diào)整參數(shù)的過(guò)程中訓(xùn)練學(xué)習(xí)器,最后在所有參數(shù)中找到檢驗(yàn)集上精度最高的參數(shù),為機(jī)器的深度學(xué)習(xí)提供幫助[8]。
使用網(wǎng)格搜索參數(shù)尋優(yōu)尋找隨機(jī)森林全局最優(yōu)參數(shù)組合,首先將數(shù)據(jù)集隨機(jī)劃分為k個(gè)驗(yàn)證集,在k個(gè)子集中選取k-1 個(gè)子集作為訓(xùn)練集,1 個(gè)子集作為測(cè)試集;利用k-1 個(gè)訓(xùn)練子集訓(xùn)練模型,并使用網(wǎng)格搜索設(shè)置需要調(diào)整的參數(shù)大致范圍及步長(zhǎng),計(jì)算每個(gè)參數(shù)下模型的評(píng)估能力;利用交叉驗(yàn)證重復(fù)上述過(guò)程k次,計(jì)算k次模型評(píng)估能力的平均值,并獲取模型性能最優(yōu)情況下的參數(shù)取值。
經(jīng)網(wǎng)格搜索計(jì)算,最終得出參數(shù)的最優(yōu)組合,見(jiàn)表2。其中,max_depth 為樹(shù)的最大深度,min_samples_leaf 表示一個(gè)節(jié)點(diǎn)在分支后的每個(gè)子節(jié)點(diǎn)的樣本數(shù)量的最小值,random_state 為隨機(jī)種子數(shù),用以復(fù)現(xiàn)模型,min_samples_split 是節(jié)點(diǎn)可分裂的最小值,n_estimators 為CART 樹(shù)個(gè)數(shù)[9]。
表2 網(wǎng)格搜索獲取隨機(jī)森林最佳參數(shù)
電梯事故往往會(huì)損害生命財(cái)產(chǎn)安全,因此在模型準(zhǔn)確率方面具有較高的要求,而在該網(wǎng)格搜索得到的參數(shù)建模下,隨機(jī)森林模型的預(yù)測(cè)準(zhǔn)確率可達(dá)0.972,將使該預(yù)測(cè)模型擁有較高的準(zhǔn)確率,滿(mǎn)足實(shí)際應(yīng)用的需求。
隨機(jī)森林是一種機(jī)器學(xué)習(xí)算法,在眾多算法中,它使用頻率最高的就是集成學(xué)習(xí)。它的基本思想是將多個(gè)分類(lèi)器組合在一起,從而使整體更完備和周密,達(dá)到一個(gè)預(yù)測(cè)效果更好的集成分類(lèi)器。更具體一點(diǎn),該算法會(huì)將決策樹(shù)作為一個(gè)基本單元,大量的決策樹(shù)一起勾勒了一個(gè)龐大的隨機(jī)森林,如圖3 所示。
圖3 隨機(jī)森林
形成隨機(jī)森林首先要構(gòu)建單棵決策樹(shù),這棵決策樹(shù)會(huì)包括兩個(gè)部分:樣本和特征。而樹(shù)的構(gòu)建會(huì)包含特征選擇、樹(shù)的生成以及剪枝3 個(gè)部分,在一個(gè)訓(xùn)練集合中含有N個(gè)樣本,有放回并且隨機(jī)地選擇n(n≤N)個(gè)樣本,隨后用這些選擇好的樣本來(lái)訓(xùn)練一棵決策樹(shù),且作為決策樹(shù)根處的節(jié)點(diǎn)。同時(shí),假設(shè)訓(xùn)練集的特征個(gè)數(shù)是K,每次選擇k個(gè)構(gòu)建決策樹(shù)。
需要指出的是,樹(shù)的生成是一個(gè)遞歸的過(guò)程。一般而言,隨著不斷的劃分,決策樹(shù)的分支節(jié)點(diǎn)所包含的樣本最終會(huì)慢慢歸集到同一個(gè)屬性,使得節(jié)點(diǎn)的“純度”越來(lái)越高。
驗(yàn)證隨機(jī)森林模型需要通過(guò)合適的評(píng)價(jià)指標(biāo),其中擬合優(yōu)度R2可以檢驗(yàn)?zāi)P蛯?duì)樣本數(shù)據(jù)的擬合程度,取值在0 到1 之間,擬合優(yōu)度越高,代表模型的可解釋程度越高。均方根誤差RMSE可以反映樣本的離散程度, 取值為大于0 的整數(shù),取值越低說(shuō)明精度越高,但其大小受預(yù)測(cè)數(shù)值的大小影響。擬合優(yōu)度R2和均方根誤差RMSE的計(jì)算公式如下[10]。
式中:
n——總樣本數(shù);
i——小于n的變量;
Yi——真實(shí)值;
在MATLAB 中,利用網(wǎng)格搜索所得隨機(jī)森林最優(yōu)參數(shù),用隨機(jī)森林模型來(lái)構(gòu)建電梯事故致因預(yù)測(cè)模型。如圖4 所示,當(dāng)決策樹(shù)設(shè)為100 時(shí),誤差范圍基本保持在[0.015,0.02]區(qū)間內(nèi),錯(cuò)誤基本穩(wěn)定。
圖4 誤差曲線(xiàn)圖
模型根據(jù)80%的訓(xùn)練集和20%的測(cè)試集對(duì)真實(shí)值和預(yù)測(cè)值的結(jié)果進(jìn)行對(duì)比,如圖5、圖6 所示。
圖5 訓(xùn)練集預(yù)測(cè)結(jié)果對(duì)比
圖6 測(cè)試集預(yù)測(cè)結(jié)果對(duì)比
從圖7 中可以看出,“直接原因”項(xiàng)對(duì)“事故特征”項(xiàng)的影響最大,其次是“間接原因”項(xiàng)和“事故發(fā)生前設(shè)備狀態(tài)”項(xiàng)。
圖7 特征重要性柱狀圖
利用指標(biāo)計(jì)算公式,驗(yàn)證基于隨機(jī)森林算法的電梯安全事故致因預(yù)測(cè)模型的擬合優(yōu)度R2、均方根誤差RMSE。對(duì)于預(yù)測(cè)模型的評(píng)價(jià)指標(biāo)見(jiàn)表3[10]。
表3 模型評(píng)價(jià)指標(biāo)
2021 年8 月16 日,新疆維吾爾自治區(qū)烏魯木齊市某區(qū)發(fā)生1 起電梯墜落事故,造成1 人死亡,經(jīng)濟(jì)損失150 萬(wàn)元。經(jīng)調(diào)查分析,引發(fā)事故的直接原因是死者安全意識(shí)淡薄、違反安裝技術(shù)規(guī)程,間接原因是施工現(xiàn)場(chǎng)安全管理落實(shí)不到位[11]。將該事故報(bào)告中的事故特征數(shù)據(jù)化處理后輸入電梯安全事故致因預(yù)測(cè)模型中,見(jiàn)表4、表5。
表4 墜落事故直接原因預(yù)測(cè)概率
表5 墜落事故間接原因預(yù)測(cè)概率
由表4 可知,基于隨機(jī)森林算法的電梯安全事故直接原因預(yù)測(cè)模型中共有176 棵決策樹(shù),其中預(yù)測(cè)概率最高的2 項(xiàng)是違規(guī)作業(yè)(P3)和結(jié)構(gòu)或零部件損壞(M2)。由表5 可知,基于隨機(jī)森林算法的電梯安全事故間接原因預(yù)測(cè)模型中共有171 棵決策樹(shù),其中預(yù)測(cè)概率最高的2 項(xiàng)是安全管理不到位(A1)和維修保養(yǎng)不到位(P4)。
綜上根據(jù)相對(duì)多數(shù)投票法,模型對(duì)該案例事故的直接原因和間接原因的預(yù)測(cè)結(jié)果與實(shí)際調(diào)查結(jié)果基本一致,且從人為因素、管理因素、設(shè)備因素等多個(gè)角度進(jìn)行合理預(yù)測(cè),驗(yàn)證了所獲模型的有效性。
2022 年8 月18 日,北京市豐臺(tái)區(qū)某街道發(fā)生1起電梯擠壓事故,造成1 人死亡。經(jīng)過(guò)調(diào)查分析,引發(fā)此次事故的直接原因是維保人員在完成電梯維修作業(yè)后,違反安全操作規(guī)章進(jìn)入電梯底坑,導(dǎo)致其受到右側(cè)井道壁與轎廂側(cè)壁的持續(xù)擠壓,造成死亡。間接原因是相關(guān)公司對(duì)管理區(qū)域內(nèi)電梯監(jiān)督不到位以及電梯有限公司對(duì)員工的作業(yè)沒(méi)有行之有效的監(jiān)管措施[12]。將該事故報(bào)告中的事故特征數(shù)據(jù)化處理后輸入電梯安全事故致因預(yù)測(cè)模型中,見(jiàn)表6、表7。
表6 擠壓事故直接原因預(yù)測(cè)概率
表7 擠壓事故間接原因預(yù)測(cè)概率
由表6 可知,基于隨機(jī)森林算法的電梯安全事故直接原因預(yù)測(cè)模型中共有175 棵決策樹(shù),其中預(yù)測(cè)概率最高的3 項(xiàng)是違規(guī)作業(yè)(P3)、維修保養(yǎng)不到位(P4)和無(wú)證上崗(A3)。由表7 可知,基于隨機(jī)森林算法的電梯安全事故間接原因預(yù)測(cè)模型中共有175 棵決策樹(shù),其中預(yù)測(cè)概率最高的2 項(xiàng)是安全管理不到位(A1)和維修保養(yǎng)不到位(P4)。
綜上根據(jù)相對(duì)多數(shù)投票法,模型對(duì)該案例事故的直接原因和間接原因的預(yù)測(cè)結(jié)果與實(shí)際調(diào)查結(jié)果基本一致,再次驗(yàn)證所獲模型的有效性。
電梯安全事故的發(fā)生不是僅受某個(gè)單因素的影響,而是多個(gè)因素共同造成的。在日常電梯的使用過(guò)程中存在諸多安全因素,且這些因素并非完全獨(dú)立,各因素間有錯(cuò)綜復(fù)雜的關(guān)聯(lián)關(guān)系,無(wú)法直觀從眾多事故報(bào)告中找出關(guān)聯(lián)規(guī)則。基于上述原因,本文利用Python語(yǔ)言,對(duì)所需文本進(jìn)行爬取和預(yù)處理,分析整理電梯安全事故影響因素。再使用網(wǎng)格搜索獲得隨機(jī)森林最佳參數(shù),接著用隨機(jī)森林算法構(gòu)建基于機(jī)器學(xué)習(xí)的電梯安全事故致因分析模型,獲得預(yù)測(cè)較為準(zhǔn)確的致因分析模型,最后通過(guò)2 個(gè)實(shí)例對(duì)模型進(jìn)行準(zhǔn)確性和實(shí)用性檢驗(yàn)。所建模型能夠幫助事故后的快速歸因,提高事故解決效率。
1)規(guī)范電梯的設(shè)計(jì)、建造和安裝。為確保電梯運(yùn)行安全,在電梯最初設(shè)計(jì)時(shí),就要將工作人員和使用人員的安全放在第一位。同時(shí),確保在電梯基礎(chǔ)零件的建造上,謹(jǐn)慎選擇零件材料,提高電梯的自身質(zhì)量,將非人為因素對(duì)電梯安全事故的影響降到最低。
2)完善相關(guān)人員的培訓(xùn)制度。在眾多的事故報(bào)告中可見(jiàn),從電梯安裝、維修保養(yǎng)到事故后的救援,都存在由于部分相關(guān)人員專(zhuān)業(yè)性不足導(dǎo)致不可預(yù)估的后果。為此,必須保證各生產(chǎn)安裝電梯人員和區(qū)域電梯救援管理人員的專(zhuān)業(yè)性,以及電梯工作人員在工作時(shí)的專(zhuān)注性和嚴(yán)謹(jǐn)性。提高相關(guān)人員的專(zhuān)業(yè)性,不僅會(huì)減少工作人員的危險(xiǎn)系數(shù),同時(shí)也會(huì)降低電梯發(fā)生事故的概率以及增加事故后救援的成功率。
3)重視日常安全檢查和定期保養(yǎng)。電梯作為日常生活中使用頻率高的運(yùn)輸工具,大多電梯都處于持續(xù)運(yùn)行的狀態(tài)下,同時(shí)還有人為因素的影響,電梯零件極易損耗,進(jìn)而增加電梯發(fā)生安全事故的概率。這就需要電梯檢查保養(yǎng)工作人員定期逐一排查電梯的安全隱患,按照規(guī)章制度進(jìn)行電梯后續(xù)的維修保養(yǎng)工作。
4)注重宣傳電梯安全以及自救知識(shí)。電梯在現(xiàn)代化的生產(chǎn)生活中必不可少,但仍有相當(dāng)比例的人不了解電梯的急救知識(shí),導(dǎo)致在電梯發(fā)生事故時(shí),不能做出正確反應(yīng)。這就需要社會(huì)增強(qiáng)電梯安全以及電梯自救知識(shí)宣傳力度,讓公眾掌握理論知識(shí),才能在發(fā)生電梯事故時(shí),盡可能減輕電梯事故對(duì)自身的傷害。
5)及時(shí)完善安全規(guī)章制度。在科技的快速發(fā)展下,規(guī)章制度也要與時(shí)俱進(jìn)。管理部門(mén)應(yīng)該根據(jù)實(shí)際情況,定期淘汰或修改無(wú)效的規(guī)章制度,及時(shí)建立適合的安全管理體系。