張建榮, 張 偉, 薛楠楠, 趙挺生
(華中科技大學(xué)土木與水利工程學(xué)院,湖北 武漢 430074)
塔式起重機(jī)作為主要的建筑工程施工起重設(shè)備,對(duì)提高作業(yè)人員的勞動(dòng)效率、加快施工進(jìn)度具有不可替代的作用。但由于塔式起重機(jī)的安裝、使用和拆卸過(guò)程均存在較大的危險(xiǎn)性以及施工現(xiàn)場(chǎng)安全管理不到位等原因,近年來(lái)塔式起重機(jī)安全事故頻發(fā),造成了較大的人員傷亡和財(cái)產(chǎn)損失。其主要原因:一方面是作業(yè)人員存在僥幸心理,認(rèn)為塔式起重機(jī)安全事故都是一般事故,較大事故發(fā)生的概率極低;另一方面是各單位對(duì)塔式起重機(jī)安全事故類型認(rèn)識(shí)不足,未制訂有針對(duì)性的應(yīng)急預(yù)案。因此,借鑒以往發(fā)生的塔式起重機(jī)安全事故報(bào)告和相關(guān)數(shù)據(jù),采用可行的預(yù)測(cè)方法對(duì)塔式起重機(jī)安全事故等級(jí)和類型進(jìn)行預(yù)測(cè),可為制定塔式起重機(jī)安全監(jiān)控監(jiān)測(cè)方案和隱患排查治理提供依據(jù),將有助于降低塔式起重機(jī)安全事故發(fā)生的概率和危害后果。
塔式起重機(jī)安全事故預(yù)測(cè)的本質(zhì)是一個(gè)分類問(wèn)題,常用的分類模型有邏輯回歸(Logistics Regression,LR)、K近鄰(K-Nearest Neighbor,KNN)、決策樹(Decision Tree,DT)、多層感知器(Multilayer Perceptron,MLP)等模型,在面對(duì)高維特征的小數(shù)據(jù)集時(shí),這些分類器訓(xùn)練得到的模型泛化能力有限。而集成學(xué)習(xí)(Ensemble Learning,EL)通過(guò)集成基分類器獲取更優(yōu)的預(yù)測(cè)結(jié)果,且對(duì)類別不平衡數(shù)據(jù)集的分類問(wèn)題預(yù)測(cè)更準(zhǔn)確。隨機(jī)森林(Random Forest,RF)算法是一種基于多棵決策樹和裝袋(Bootstrap Aggregating,Bagging)算法的集成學(xué)習(xí)模型,通過(guò)并行集成基學(xué)習(xí)器降低過(guò)擬合的風(fēng)險(xiǎn),目前在很多領(lǐng)域得到了廣泛的應(yīng)用。如徐緒堪等構(gòu)建了洪澇災(zāi)害突發(fā)事件分類的隨機(jī)森林模型,以為全過(guò)程應(yīng)急管理提供支撐;劉睿等將隨機(jī)森林算法應(yīng)用于巫山縣滑坡易發(fā)性區(qū)劃,結(jié)果表明隨機(jī)森林算法具有較高的準(zhǔn)確性和穩(wěn)定性;李文娟等將隨機(jī)森林算法應(yīng)用于強(qiáng)對(duì)流潛勢(shì)預(yù)測(cè)和分類,結(jié)果發(fā)現(xiàn)該算法對(duì)大范圍強(qiáng)對(duì)流天氣進(jìn)行預(yù)測(cè)的準(zhǔn)確率高;周德紅等利用隨機(jī)森林算法來(lái)計(jì)算各指標(biāo)對(duì)分類效果的權(quán)重,并分析得出了液化天然氣儲(chǔ)運(yùn)企業(yè)泄漏事故的主要原因;盧彬等以空氣中污染物濃度數(shù)據(jù)和同期氣象數(shù)據(jù)構(gòu)建隨機(jī)森林模型用來(lái)預(yù)測(cè)銀川市空氣質(zhì)量,結(jié)果表明其預(yù)測(cè)精度達(dá)到了88.03%。
上述研究表明,隨機(jī)森林算法善于處理不同領(lǐng)域的分類問(wèn)題,但在建筑工程安全領(lǐng)域的研究與應(yīng)用還較少。為此,本文采用隨機(jī)森林算法構(gòu)建塔式起重機(jī)安全事故預(yù)測(cè)模型,對(duì)該事故等級(jí)和類型進(jìn)行預(yù)測(cè),主要包括:①塔式起重機(jī)安全事故致因的系統(tǒng)分解;②構(gòu)建基于隨機(jī)森林算法的塔式起重機(jī)安全事故預(yù)測(cè)模型;③采用實(shí)際發(fā)生的塔式起重機(jī)安全事故數(shù)據(jù),對(duì)塔式起重機(jī)安全事故等級(jí)和類型進(jìn)行模擬預(yù)測(cè);④識(shí)別塔式起重機(jī)安全事故的關(guān)鍵致因。該研究結(jié)果可為塔式起重機(jī)安全隱患排查和應(yīng)急預(yù)案制定提供依據(jù),以便預(yù)防塔式起重機(jī)安全事故的發(fā)生和提高塔式起重機(jī)作業(yè)安全水平。
塔式起重機(jī)安全的影響因素眾多,且一向是國(guó)內(nèi)外學(xué)者研究的熱點(diǎn)。如Shapira等采用專家訪談法對(duì)塔吊使用階段的安全影響因素及其影響程度進(jìn)行了研究;丁科等從項(xiàng)目條件、氣候環(huán)境、人為因素、安全管理和其他因素五個(gè)方面建立了塔式起重機(jī)安全事故風(fēng)險(xiǎn)因素清單,并結(jié)合案例分析了不同風(fēng)險(xiǎn)因素發(fā)生的概率;Tam等采用問(wèn)卷調(diào)查和結(jié)構(gòu)化訪談方法對(duì)塔式起重機(jī)安全事故進(jìn)行了研究,發(fā)現(xiàn)影響塔式起重機(jī)安全的主要因素是人的行為,包括從業(yè)者安全教育培訓(xùn)不足、工作疲勞和責(zé)任感等;Marquez等通過(guò)對(duì)兩起塔式起重機(jī)安全事故進(jìn)行深入分析,發(fā)現(xiàn)塔式起重機(jī)基礎(chǔ)不穩(wěn)固是導(dǎo)致其安全事故發(fā)生的主要原因之一;趙挺生等運(yùn)用系統(tǒng)思想研究了塔式起重機(jī)安全,提取了56項(xiàng)塔式起重機(jī)安全影響因素,并建立了廣義的塔式起重機(jī)安全AcciMap模型。
在上述研究基礎(chǔ)上,依據(jù)《塔式起重機(jī)安全規(guī)程》(GB 5144—2006)、《建筑起重機(jī)械安全監(jiān)督管理規(guī)定》(建設(shè)部令第166號(hào))、《建筑施工塔式起重機(jī)安裝、使用、拆卸安全技術(shù)規(guī)范》(JGJ 196—2010)和《建筑施工安全檢查標(biāo)準(zhǔn)》(JGJ 59—2011)以及塔式起重機(jī)安全管理相關(guān)的法律、安全技術(shù)標(biāo)準(zhǔn)和規(guī)范,參照Rasmussen的社會(huì)技術(shù)系統(tǒng)層次模型,將塔式起重機(jī)安全事故致因系統(tǒng)分解為項(xiàng)目安全管理(P
)、現(xiàn)場(chǎng)人員管理(H
)、塔吊設(shè)備管理(M
)和環(huán)境管理(E
)4個(gè)子系統(tǒng)和21個(gè)因素,如圖1所示。圖1 塔式起重機(jī)安全事故致因系統(tǒng)Fig.1 Tower-crane safety accident cause system
該系統(tǒng)同時(shí)考慮事故致因之間的橫向和縱向影響關(guān)系,如人員安全意識(shí)淡薄(H
)會(huì)導(dǎo)致同子系統(tǒng)的個(gè)人安全防護(hù)不足(H
),安全生產(chǎn)檢查不充分(P
)會(huì)導(dǎo)致異子系統(tǒng)的工人違規(guī)作業(yè)(H
)。這種子系統(tǒng)間以及因素間的關(guān)聯(lián),是確保預(yù)測(cè)塔式起重機(jī)安全事故等級(jí)和類型準(zhǔn)確性的不可缺少的條件。從國(guó)家應(yīng)急管理部、各地應(yīng)急管理局和相關(guān)網(wǎng)站,搜集得到我國(guó)2013—2019年間發(fā)生的194起塔式起重機(jī)安全事故的詳細(xì)事故調(diào)查報(bào)告,其中有111起安全事故發(fā)生在近三年內(nèi),反映當(dāng)前我國(guó)塔式起重機(jī)安全管理形勢(shì)不容樂觀。依據(jù)《生產(chǎn)安全事故報(bào)告和調(diào)查處理?xiàng)l例》規(guī)定的生產(chǎn)安全事故等級(jí)劃分標(biāo)準(zhǔn),194起塔式起重機(jī)安全事故均為一般安全事故或較大安全事故,其中一般安全事故占事故總數(shù)的比例為84.54%,較大安全事故占事故總數(shù)的比例僅為15.46%。根據(jù)塔式起重機(jī)安全事故的特點(diǎn),將其進(jìn)一步歸納為坍塌、物體打擊、脫鉤、意外高墜、構(gòu)件墜落、碰撞和觸電7種事故類型,如圖2所示。其中,坍塌事故不僅發(fā)生頻率最高,而且在較大安全事故中的占比最高,因此其危害最大。
圖2 塔式起重機(jī)安全事故類型和等級(jí)數(shù)量分布Fig.2 Distribution of tower-crane safety accident types and levels
通過(guò)閱讀事故報(bào)告,將塔式起重機(jī)安全事故致因系統(tǒng)中各影響因素的發(fā)生情況、事故等級(jí)、事故類型作為樣本數(shù)據(jù),并進(jìn)行數(shù)據(jù)化處理,見表1。塔式起重機(jī)安全事故致因系統(tǒng)的21項(xiàng)影響因素屬于無(wú)序分類變量,若某項(xiàng)因素發(fā)生,則將其量化值記為“1”,否則記為“0”;事故等級(jí)為無(wú)序分類變量,若該事故為一般安全事故,則記為“0”,若該事故為較大安全事故,則記為“1”;事故類型也為無(wú)序分類變量,記事故類型為坍塌和物體打擊的事故為“1”和“2”,因脫鉤、碰撞等事故類型數(shù)量較少,所以與意外高墜事故歸為一類,記為“3”。
表1 塔式起重機(jī)安全事故樣本數(shù)據(jù)的數(shù)據(jù)化處理Table 1 Data sample processing of tower-crane safety accidents
將194份塔式起重機(jī)安全事故調(diào)查報(bào)告中數(shù)據(jù)進(jìn)行數(shù)據(jù)化處理,轉(zhuǎn)化為194條數(shù)據(jù)記錄,再隨機(jī)劃分為訓(xùn)練集和測(cè)試集,并確保兩份數(shù)據(jù)集中3種不同事故類型均有分布。其中,訓(xùn)練集數(shù)據(jù)記錄為164條,包含24條較大安全事故和140條一般安全事故;測(cè)試集數(shù)據(jù)記錄為30條,包含6條較大安全事故和24條一般安全事故。為了提升最終預(yù)測(cè)結(jié)果的準(zhǔn)確性,通過(guò)SMOTE法來(lái)降低訓(xùn)練集中類別的不平衡性,即通過(guò)人工合成將較大安全事故數(shù)據(jù)記錄擴(kuò)充為140條,最終訓(xùn)練集包含280條事故數(shù)據(jù)記錄。
隨機(jī)森林(RF)算法由Breiman于2001年提出,是一種集成學(xué)習(xí)模型,它是在以分類與回歸樹(Classification and Regression Trees,CART)為基學(xué)習(xí)器、融合裝袋(Bagging)算法的基礎(chǔ)上,在樹的訓(xùn)練過(guò)程中引入隨機(jī)特征選擇,降低了樣本的相關(guān)性,從而解決了單棵決策樹模型的過(guò)擬合問(wèn)題,使得模型具有良好的噪聲容忍度。隨機(jī)森林算法即CART決策樹與Bagging算法相結(jié)合,其流程如圖3所示。
圖3 隨機(jī)森林算法流程圖Fig.3 Flow chart of random forest algorithm
Bagging算法以降低結(jié)果的方差來(lái)避免過(guò)擬合的發(fā)生,它通過(guò)有放回的抽樣方法在原始數(shù)據(jù)集進(jìn)行m
輪抽樣,得到新數(shù)據(jù)集Q
(i
=1,2,…,m
),新數(shù)據(jù)集中存在重復(fù)的數(shù)據(jù)。對(duì)于某條數(shù)據(jù),每輪被采集到的概率為1/m
,如公式(1)所示,每輪隨機(jī)采樣,訓(xùn)練集大約有36.8%的數(shù)據(jù)未被采集,這些數(shù)據(jù)未參加訓(xùn)練集模型的擬合,稱為“袋外數(shù)據(jù)”,可作為驗(yàn)證集測(cè)試模型的泛化能力。(1)
決策樹學(xué)習(xí)采用自頂向下的遞歸方法,其基本思想是以信息熵為度量構(gòu)造一個(gè)熵值下降最快的樹,分類與回歸樹以基尼系數(shù)作為特征分裂依據(jù),在分類問(wèn)題中,假設(shè)有K
個(gè)類別,第k
個(gè)類別的概率為p
,則概率分布的基尼系數(shù)為(2)
對(duì)于給定的樣本集合Q
,其基尼系數(shù)為(3)
式中:C
為樣本集合Q
中屬于第k
類的樣本子集;K
為類別的數(shù)量。樣本集合Q
可根據(jù)特征A
是否取某一可能值a
被分割成Q
和Q
兩部分,即Q
={(x
,y
)∈Q
|A
(x
)=a
}(4)
Q
=Q
-Q
(5)
式中:(x
,y
)表示樣本集合Q
中的一個(gè)樣本,其中x
表示樣本的特征值,y
表示樣本的標(biāo)簽。則在特征A
的條件下,樣本集合Q
的基尼系數(shù)定義為(6)
基尼系數(shù)Gini(Q
)表示樣本集合Q
的不確定性,基尼系數(shù)Gini(Q
,A
)表示在條件A
=a
分割后樣本集合Q
的不確定性,且基尼系數(shù)越小,模型不純度越低。基于隨機(jī)森林算法的塔式起重機(jī)安全事故預(yù)測(cè)模型構(gòu)建過(guò)程如下:
(1) 從280條塔式起重機(jī)安全事故數(shù)據(jù)記錄中隨機(jī)有放回地抽取樣本,得到?jīng)Q策樹S
(i
=1,2,…,m
)。(2) 從決策樹S
隨機(jī)選取21項(xiàng)特征中的部分特征,以基尼系數(shù)最小化準(zhǔn)則進(jìn)行最優(yōu)分割點(diǎn)篩選,直到滿足停止分裂條件。(3) 每一棵樹都能進(jìn)行一次預(yù)測(cè),最終的分類結(jié)果取m
棵決策樹輸出結(jié)果的眾數(shù)。D
個(gè)數(shù)據(jù)(i
=1,2,…,N
),采用隨機(jī)森林算法構(gòu)造分類器,可得到N
×N
維混淆矩陣:(7)
式中:cm
表示第i
類被分類器判斷成第j
類的概率。然后引入準(zhǔn)確率Accuracy、精準(zhǔn)率Precision、召回率Recall和F1-score作為評(píng)價(jià)指標(biāo),對(duì)模型預(yù)測(cè)的準(zhǔn)確度進(jìn)行評(píng)價(jià),具體評(píng)價(jià)指標(biāo)的計(jì)算公式如下:
準(zhǔn)確率Accuracy的計(jì)算公式為
(8)
類別i
的精準(zhǔn)率Precision的計(jì)算公式為(9)
類別i
的召回率Recall的計(jì)算公式為(10)
F1-score綜合了精準(zhǔn)率和召回率的產(chǎn)出結(jié)果,其值越高代表模型的輸出結(jié)果越好,其計(jì)算公式為
(11)
上式中:TP
表示被正確預(yù)測(cè)為第i
類的數(shù)量;TN
表示被正確預(yù)測(cè)不為第i
類的數(shù)量;FP
表示被錯(cuò)誤預(yù)測(cè)為第i
類的數(shù)量;FN
表示被錯(cuò)誤預(yù)測(cè)不為第i
類的數(shù)量。本文以Jupyter Notebook為實(shí)現(xiàn)平臺(tái),利用Python的Scikit-learn開源機(jī)器學(xué)習(xí)模型庫(kù)建立基于隨機(jī)森林算法的塔式起重安全事故預(yù)測(cè)模型,通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理并對(duì)模型參數(shù)進(jìn)行調(diào)整,對(duì)模型預(yù)測(cè)結(jié)果的準(zhǔn)確率進(jìn)行評(píng)價(jià),并與MLP、KNN、DT分類算法進(jìn)行對(duì)比發(fā)現(xiàn),隨機(jī)森林算法在處理塔式起重機(jī)安全事故等級(jí)預(yù)測(cè)的二分類問(wèn)題上的準(zhǔn)確率較高(見表2)??紤]到較大事故的高危害性,除準(zhǔn)確率外,其余3項(xiàng)指標(biāo)的計(jì)算均以較大事故的預(yù)測(cè)結(jié)果為依據(jù)進(jìn)行計(jì)算。采用隨機(jī)森林算法可進(jìn)一步預(yù)測(cè)塔式起重機(jī)安全事故類型,得到各因素影響權(quán)重,通過(guò)混淆矩陣對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià)。
表2 不同分類算法對(duì)塔式起重機(jī)安全事故等級(jí)預(yù)測(cè)的準(zhǔn)確率Table 2 Accuracy of tower-crane safety accidents’ level prediction based on different classification algorithms
隨機(jī)森林算法是基于Bagging框架的決策樹模型,因此隨機(jī)森林的參數(shù)擇優(yōu)包括RF框架參數(shù)擇優(yōu)和決策樹參數(shù)擇優(yōu),本文利用網(wǎng)格搜索法對(duì)塔式起重機(jī)安全事故等級(jí)預(yù)測(cè)時(shí)的最佳參數(shù)進(jìn)行調(diào)優(yōu),見圖4。
圖4 網(wǎng)格搜索三維可視化圖Fig.4 Three-dimensional visualization of grid search
由圖4可見,當(dāng)基于隨機(jī)森林算法的塔式起重機(jī)安全事故等級(jí)預(yù)測(cè)模型的決策樹數(shù)量為26個(gè)、最大深度為4、節(jié)點(diǎn)可分最小樣本數(shù)為34個(gè)時(shí),模型袋外準(zhǔn)確率得分最高,訓(xùn)練模型達(dá)到最優(yōu)。
為了驗(yàn)證隨機(jī)森林算法分類模型的優(yōu)越性,調(diào)用30份塔式起重機(jī)安全事故數(shù)據(jù)記錄作為測(cè)試集,其中較大安全事故6份、一般安全事故24份,再分別利用DT、MLP、KNN、RF算法進(jìn)行分類預(yù)測(cè),并比較其預(yù)測(cè)結(jié)果,各分類算法的分類預(yù)測(cè)結(jié)果用混淆矩陣表示,見圖5。由于較大塔式起重機(jī)安全事故往往會(huì)造成更多的人員傷亡和財(cái)產(chǎn)損失,所以較大事故預(yù)測(cè)的準(zhǔn)確度越高越好。
圖5 不同分類算法對(duì)塔式起重機(jī)安全事故等級(jí)預(yù)測(cè)的混淆矩陣Fig.5 Confusion matrix of tower-crane safety accident level prediction based on different classification algorithms
由圖5可見:隨機(jī)森林算法表現(xiàn)最優(yōu),24份一般安全事故中有23份預(yù)測(cè)正確,6份較大安全事故中有4份預(yù)測(cè)正確;其他分類器雖然預(yù)測(cè)一般安全事故較為準(zhǔn)確,但預(yù)測(cè)較大安全事故的錯(cuò)誤率高,因此整體準(zhǔn)確率不如隨機(jī)森林算法。
隨機(jī)森林算法在分類問(wèn)題上具有較高的準(zhǔn)確性和穩(wěn)定性,因此本文采用與第3.1節(jié)相同的測(cè)試集在訓(xùn)練好的隨機(jī)森林模型上進(jìn)行測(cè)試,此時(shí)基于隨機(jī)森林算法的塔式起重機(jī)安全事故類型預(yù)測(cè)模型的決策樹數(shù)量為61個(gè)?;陔S機(jī)森林算法的塔式起重機(jī)安全事故類型預(yù)測(cè)的混淆矩陣,見圖6。
圖6 基于隨機(jī)森林算法的塔式起重機(jī)安全事故類型預(yù)測(cè)的混淆矩陣Fig.6 Confusion matrix of tower-crane safety accident type prediction based on Random Forest (RF)
由圖6可見:14份坍塌事故中有13份預(yù)測(cè)正確,1份誤預(yù)測(cè)為意外高墜及其他事故;10份物體打擊事故中有5份預(yù)測(cè)正確,2份誤預(yù)測(cè)為坍塌事故,3份誤預(yù)測(cè)為意外高墜及其他事故;6份意外高墜及其他事故全部預(yù)測(cè)正確。
采用公式(8)~(11)計(jì)算各個(gè)事故類型的準(zhǔn)確率、精準(zhǔn)率、召回率和F1-score,其結(jié)果見表3。
由表3可知,隨機(jī)森林算法模型在預(yù)測(cè)坍塌事故和意外高墜及其他事故時(shí)表現(xiàn)較好,召回率分別為0.93和1,所有事故類型預(yù)測(cè)的準(zhǔn)確率為0.8,總體上達(dá)到較高水平。
表3 基于隨機(jī)森林算法的塔式起重機(jī)安全事故類型預(yù)測(cè)的準(zhǔn)確率Table 3 Accuracy of tower-crane safety accidents’ type prediction based on Random Forest (RF)
塔式起重機(jī)安全事故致因影響權(quán)重計(jì)算是對(duì)事故后果的反演,通過(guò)對(duì)導(dǎo)致事故發(fā)生的各影響因素的分析,推演事故發(fā)生過(guò)程和解析事故的因果關(guān)系,以建立事故預(yù)警機(jī)制,進(jìn)行安全防范。采用隨機(jī)森林算法算法對(duì)導(dǎo)致塔式起重機(jī)安全事故因素的影響權(quán)重進(jìn)行計(jì)算的流程如下:
(1) 對(duì)于基于隨機(jī)森林算法的塔式起重機(jī)安全事故預(yù)測(cè)模型中的決策樹S
,使用相應(yīng)的袋外數(shù)據(jù)計(jì)算其袋外數(shù)據(jù)誤差,記為E
1。(2) 隨機(jī)對(duì)袋外樣本中某一特定塔式起重機(jī)安全事故影響因素X
加入噪聲干擾,再次計(jì)算其袋外數(shù)據(jù)誤差,記為E
2。(3) 假設(shè)隨機(jī)森林中有m
棵樹,記因素X
的影響權(quán)重為I
,其計(jì)算公式為(12)
采用公式(12)分別計(jì)算影響事故等級(jí)和事故類型的各因素的權(quán)重并降序排列,其結(jié)果見表4。
表4 塔式起重機(jī)安全事故致因影響權(quán)重Table 4 Weight of influence of tower-crane safety accident causes
由表4可知:對(duì)塔式起重機(jī)安全事故等級(jí)影響權(quán)重最大的3個(gè)因素分別為專項(xiàng)施工方案不完備(P
)、人員安全意識(shí)淡薄(H
)、安全技術(shù)交底不充分(P
);對(duì)塔式起重機(jī)安全事故類型影響權(quán)重最大的3個(gè)因素分別為安全生產(chǎn)檢查不充分(P
)、工人無(wú)證上崗(H
)、人員安全意識(shí)淡薄(H
)。除去重復(fù)的影響因素,共得到5個(gè)關(guān)鍵因素。P
)、安全技術(shù)交底不充分(P
)、安全生產(chǎn)檢查不充分(P
)、項(xiàng)目領(lǐng)導(dǎo)層忽視安全(H
)、安全管理人員履職不充分(H
)、工人無(wú)證上崗(H
)、結(jié)構(gòu)構(gòu)件破壞或連接不可靠(M
)。將該事故報(bào)告經(jīng)數(shù)據(jù)化處理后輸入基于隨機(jī)森林算法的塔式起重機(jī)安全事故預(yù)測(cè)模型中,經(jīng)由決策樹根節(jié)點(diǎn)逐層判斷至葉節(jié)點(diǎn)可得到預(yù)測(cè)結(jié)果,見表5。表5 基于隨機(jī)森林算法的塔式起重機(jī)安全事故案例預(yù)測(cè)結(jié)果Table 5 Prediction results of a tower-crane safety accident case based on Random Forest (RF)
由表5可知:基于隨機(jī)森林算法的塔式起重機(jī)安全事故等級(jí)預(yù)測(cè)模型中共有26棵決策樹,其中10棵預(yù)測(cè)為一般安全事故,16棵預(yù)測(cè)為較大安全事故;基于隨機(jī)森林算法的塔式起重機(jī)安全事故類型預(yù)測(cè)模型中共有61棵決策樹,其中44棵預(yù)測(cè)為坍塌事故,2棵預(yù)測(cè)為物體打擊事故,15棵預(yù)測(cè)為意外高墜及其他事故。根據(jù)相對(duì)多數(shù)投票法,模型對(duì)該起案例的事故等級(jí)和類型的預(yù)測(cè)結(jié)果與實(shí)際情況基本一致,從而驗(yàn)證了模型的有效性和實(shí)用性。
(1) 基于系統(tǒng)思維和Rasmussen管理框架,將塔式起重機(jī)安全事故致因系統(tǒng)分解為項(xiàng)目安全管理、現(xiàn)場(chǎng)人員管理、塔吊設(shè)備管理和環(huán)境管理4個(gè)子系統(tǒng)和21個(gè)因素。
(2) 以194份塔式起重機(jī)安全事故報(bào)告為數(shù)據(jù)樣本,構(gòu)建了基于隨機(jī)森林算法的塔式起重機(jī)安全事故預(yù)測(cè)模型,經(jīng)計(jì)算得到隨機(jī)森林算法對(duì)塔式起重機(jī)安全事故等級(jí)和類型預(yù)測(cè)的準(zhǔn)確率分別為0.9和0.8,高于MLP、KNN、DT等單一分類器。
(3) 采用隨機(jī)森林算法對(duì)導(dǎo)致塔式起重機(jī)安全事故因素的影響權(quán)重進(jìn)行計(jì)算,得到5個(gè)關(guān)鍵因素為專項(xiàng)施工方案不完備(P
)、安全技術(shù)交底不充分(P
)、安全生產(chǎn)檢查不充分(P
)、人員安全意識(shí)淡薄(H
)和工人無(wú)證上崗(H
)。(4) 以某塔式起重機(jī)較大坍塌事故為例對(duì)模型進(jìn)行驗(yàn)證,發(fā)現(xiàn)模型對(duì)該案例事故等級(jí)和類型的預(yù)測(cè)均正確,且5個(gè)關(guān)鍵因素中有4個(gè)因素在本案例事故中出現(xiàn),與因素影響權(quán)重的計(jì)算結(jié)果高度吻合。
(5) 在今后的研究中需細(xì)分塔式起重機(jī)安全事故21個(gè)致因因素,加大對(duì)塔式起重機(jī)安全事故致因的研究深度,進(jìn)一步擴(kuò)大研究樣本,并建立具備實(shí)時(shí)存儲(chǔ)、編輯等功能的塔式起重機(jī)安全事故數(shù)據(jù)庫(kù),以提高事故等級(jí)和類型預(yù)測(cè)結(jié)果的準(zhǔn)確性。