王莉靜,趙海盟,戴遠(yuǎn)東,樂亮
(天津城建大學(xué)控制與機(jī)械工程學(xué)院,天津 300384)
施工升降機(jī)是建筑行業(yè)中通用的載人、載貨施工機(jī)械,主要應(yīng)用于城市高層、超高層建筑施工現(xiàn)場[1]。隨著我國高層、超高層建筑施工作業(yè)的持續(xù)增加,每年由升降機(jī)引起的安全生產(chǎn)事故也呈上升趨勢[2]。為進(jìn)一步提高施工升降機(jī)的作業(yè)安全性,國內(nèi)外學(xué)者在施工設(shè)備可靠性分析[3]方面進(jìn)行了大量研究。Moller和Beer運(yùn)用模糊集合理論,即根據(jù)模糊數(shù)學(xué)的隸屬度理論把定性評價(jià)轉(zhuǎn)化為定量評價(jià),實(shí)現(xiàn)了可靠性的定量化評價(jià)[4];沈建榮[5]通過分析影響施工升降機(jī)的運(yùn)行質(zhì)量的因素,提出了一種改善運(yùn)行質(zhì)量的措施來提高可靠性;鄧錚強(qiáng)等[6]建立了一套安全管理綜合評價(jià)指標(biāo)體系,利用改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行評價(jià)預(yù)測;程躍等[7]提出了一種基于支持向量機(jī)的非概率可靠性分析方法;翟勝等[8]提出了一種基于貝葉斯網(wǎng)絡(luò)的多態(tài)系統(tǒng)可靠性分析方法,利用貝葉斯網(wǎng)絡(luò)的多態(tài)變量節(jié)點(diǎn)來描述故障模式的多態(tài)性。這些可靠性分析方法雖然在其研究領(lǐng)域取得了有較好的應(yīng)用,但由于施工升降機(jī)的設(shè)備劣化程度受運(yùn)行工況、作業(yè)環(huán)境和人為操作規(guī)范性等多種主客觀因素的共同制約,僅通過單一類型算法模型進(jìn)行可靠性分析,其準(zhǔn)確度較低。
因此,在2020年1月開始實(shí)施的《施工升降機(jī)安全監(jiān)控系統(tǒng)》的國家標(biāo)準(zhǔn)規(guī)定下[9],通過采集、分析施工升降機(jī)“人-機(jī)-管理”多因素的融合數(shù)據(jù),提出了一種基于隨機(jī)森林(random forest,RF)算法及集成學(xué)習(xí)(ensemble learning,EL)融合的施工升降機(jī)可靠性分析模型,并進(jìn)行相關(guān)實(shí)例分析,驗(yàn)證其準(zhǔn)確性和適用性。
施工升降機(jī)的作業(yè)環(huán)境一般較惡劣,其運(yùn)行是否可靠直接影響著施工人員的生命安全和建筑效率[10]。因此,基于專家調(diào)查法,綜合分析人-機(jī)-管理3個(gè)方面因素,選取28個(gè)指標(biāo)建立施工升降機(jī)可靠性指標(biāo)體系,如圖1所示。
圖1 施工升降機(jī)可靠性指標(biāo)體系Fig.1 Construction lift reliability index system
施工升降機(jī)的可靠性等級引用梯形隸屬函數(shù)[11]進(jìn)行描述,梯形隸屬函數(shù)可由4個(gè)參數(shù)確定,分別為a1、a2、a3、a4。設(shè) 模 糊 集 為Y=(a1,a2,a3,a4),且a1≤a2≤a3≤a4,則梯形隸屬函數(shù)表示為
根據(jù)5名資深施工升降機(jī)專家的經(jīng)驗(yàn),將施工升降機(jī)的可靠性評價(jià)等級劃分為5個(gè)級別,則可靠性評價(jià)等級與對應(yīng)的模糊系數(shù)關(guān)系見表1。
表1 可靠性等級與模糊系數(shù)Tab.1 Reliability grade and fuzzy coefficient
通過與某工程施工單位合作,采集了SCD200型號施工升降機(jī)在2020年10月—2021年10月期間的200組歷史數(shù)據(jù)樣本,每組樣本中包含28個(gè)可靠性相關(guān)因素。首先利用RF算法對28個(gè)可靠性分析指標(biāo)進(jìn)行特征重要度計(jì)算,約減不重要因素,再利用基于EL的可靠性模型進(jìn)行分析。
為避免“維數(shù)災(zāi)難”,首先利用RF算法對28個(gè)指標(biāo)進(jìn)行預(yù)處理,對訓(xùn)練樣本按照隨機(jī)有放回的方式進(jìn)行抽取,并生成新子集進(jìn)行迭代;再按照3∶5的比例對樣本劃分,將袋外數(shù)據(jù)作為測試集,并計(jì)算各指標(biāo)重要度;最后利用平均準(zhǔn)確率下降(mean decrease accuracy,MDA)法對每個(gè)指標(biāo)的重要度進(jìn)行排序,以達(dá)到降維的目的。設(shè)定參數(shù)決策樹個(gè)數(shù)M為200,特征屬性為log2(M+1),決策樹的迭代過程如圖2所示,不難發(fā)現(xiàn)出袋錯(cuò)誤量在決策樹數(shù)量為35后趨于穩(wěn)定,此時(shí)可決系數(shù)R2為0.88,如圖3所示。
圖2 決策樹迭代過程Fig.2 Decision tree iterative process
圖3 擬合優(yōu)度散點(diǎn)圖Fig.3 Goodness of fit scatter diagram
其次,利用袋外數(shù)據(jù)對28個(gè)可靠性分析指標(biāo)進(jìn)行重要度計(jì)算,屬性重要度結(jié)果如圖4所示,其中各個(gè)指標(biāo)的重要度值見表2。
圖4 指標(biāo)重要度分析Fig.4 Index importance analysis
表2 重要度系數(shù)表Tab.2 Importance coefficient table
根據(jù)各指標(biāo)重要度系數(shù)排序,選取V19、V14、V26、V10、V9、V15、V25、V13共8個(gè)可靠性因素,故將此8個(gè)相關(guān)因素作為EL算法進(jìn)行可靠性模型的輸入數(shù)據(jù),約減其余重要度低的相關(guān)因素。
最后,將篩選的8個(gè)因素?cái)?shù)值乘以對應(yīng)重要度系數(shù),組成新的樣本,并設(shè)定參數(shù)決策樹個(gè)數(shù)為200,特征屬性為log2(M+1),則新樣本的決策樹的迭代過程如圖5所示,出袋錯(cuò)誤量在決策樹數(shù)量為12后趨于穩(wěn)定,此時(shí)R2為0.94,相比較舊樣本的R2有所提升,如圖6所示,說明經(jīng)過篩選后的新樣本擬合優(yōu)度更好,準(zhǔn)確率更高。
圖5 新樣本決策樹迭代過程Fig.5 New sample decision tree iteration process
圖6 新樣本擬合度散點(diǎn)圖Fig.6 Scatter plot of new sample fit degree
根據(jù)RF算法得出的重要度分析結(jié)果,得到8個(gè)可靠性相關(guān)因素。在200組歷史樣本數(shù)據(jù)中隨機(jī)選取120組數(shù)據(jù)作為訓(xùn)練樣本,完成遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)(genetic algorithm-back propagation neural network,GA-BP)、粒子群算法優(yōu)化支持向量機(jī)(particle swarm optimization-support vector machine,PSO-SVM)以及樸素貝葉斯(Bayesian network,BN)基學(xué)習(xí)器的訓(xùn)練數(shù)據(jù),其余80組數(shù)據(jù)作為測試樣本完成對算法模型的檢測,數(shù)據(jù)分布如圖7所示。
圖7 樣本數(shù)據(jù)分布圖Fig.7 Sample data distribution diagram
GA-BP神經(jīng)網(wǎng)絡(luò):引用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),將8個(gè)可靠性相關(guān)因素作為訓(xùn)練樣本數(shù)據(jù)歸一化后輸入網(wǎng)絡(luò),可靠性等級作為輸出,根據(jù)文獻(xiàn)[12]設(shè)定GA算法相關(guān)參數(shù)。利用GA算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集準(zhǔn)確率為96.67%,測試集準(zhǔn)確率為88.75%。
PSO-SVM:一般地,在SVM模型中懲罰函數(shù)C與gamma值兩個(gè)參數(shù)非常重要[13],根據(jù)文獻(xiàn)[14]的優(yōu)化流程利用PSO優(yōu)化SVM算法進(jìn)行最優(yōu)求解。設(shè)置PSO參數(shù)局部搜索能力c1為1.5,c2為1.7,最大進(jìn)化數(shù)量為200,種群最大數(shù)量為20。可以得出SVM最優(yōu)的懲罰函數(shù)C為64.6241,gamma值為0.20315,最佳分類準(zhǔn)確率為93.3333%。再利用最優(yōu)參數(shù)對SVM模型進(jìn)行訓(xùn)練,訓(xùn)練集準(zhǔn)確率為93.33%,測試集準(zhǔn)確率為92.50%。
BN:貝葉斯網(wǎng)絡(luò)實(shí)際上是一種利用對圖形的推理表示變量與變量之間因果關(guān)系的模型。根據(jù)文獻(xiàn)[15]采用故障樹建模的方法來建立BN模型,對可靠性指標(biāo)進(jìn)行分析,首先采用交叉驗(yàn)證選取訓(xùn)練集和測試集,將測試集在總數(shù)據(jù)集的占比設(shè)為40,將分類標(biāo)簽轉(zhuǎn)化為數(shù)據(jù),并計(jì)算條件概率,最后對每個(gè)特征的每個(gè)取值進(jìn)行數(shù)量統(tǒng)計(jì),再使用測試集進(jìn)行數(shù)據(jù)測試;訓(xùn)練集準(zhǔn)確率為94.17%,測試集準(zhǔn)確率為90.83%。
集成學(xué)習(xí)模型算法:將GA-BP神經(jīng)網(wǎng)絡(luò)、PSOSVM和BN進(jìn)行集成使用,采用并行集成方式及學(xué)習(xí)法結(jié)合策略,使得模型可以自適應(yīng)的針對多種數(shù)據(jù)做出更加準(zhǔn)確的分類。集成學(xué)習(xí)模型訓(xùn)練集和檢測集上訓(xùn)練測試結(jié)果分別如圖8、圖9所示。
圖8 EL訓(xùn)練集的實(shí)際分類和預(yù)測分類Fig.8 Actual classification and predictive classification diagram of EL training set
圖9 EL測試集的實(shí)際分類和預(yù)測分類Fig.9 The actual and predicted classification diagram of the EL test set
由圖8、圖9可知,利用EL訓(xùn)練的訓(xùn)練集準(zhǔn)確率為99.20%,檢測集準(zhǔn)確率為97.50%。表明了EL具有較好的分類能力,不論是在訓(xùn)練集還是測試集中都有較高的分類準(zhǔn)確率,避免了“維數(shù)災(zāi)難”,且具有較高的泛化能力,運(yùn)算速度快,集成學(xué)習(xí)模型具有良好的魯棒性。各學(xué)習(xí)器的數(shù)據(jù)集分類準(zhǔn)確率結(jié)果對比見表3。
表3 各學(xué)習(xí)器的數(shù)據(jù)集分類準(zhǔn)確率結(jié)果對比Tab.3 Comparison of data set classification accuracy of each learner %
針對施工升降機(jī)的可靠性評價(jià)問題,提出了一種基于RF-EL算法的施工升降機(jī)可靠性分析模型,得到的主要結(jié)論為:
(1)利用RF算法對遠(yuǎn)程監(jiān)控平臺采集的施工升降機(jī)28個(gè)可靠性相關(guān)因素進(jìn)行了量化和重要度分析,最終確定超負(fù)荷運(yùn)行時(shí)間、載重量、風(fēng)速、當(dāng)前速度、吊籠傾角、輸入電壓、作業(yè)環(huán)境、故障報(bào)警次數(shù)8個(gè)相關(guān)因素,通過對8個(gè)相關(guān)因素的RF算法二次分析,R2從0.88提升至0.94,證明經(jīng)過約減后的8個(gè)相關(guān)因素組成的新樣本擬合更好,準(zhǔn)確率更高。
(2)分別利用BP神經(jīng)網(wǎng)絡(luò)、SVM和BN基學(xué)習(xí)器對120組訓(xùn)練樣本進(jìn)行訓(xùn)練,并通過80組測試樣本進(jìn)行驗(yàn)證,在訓(xùn)練集中表現(xiàn)最好的是利用GA算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)算法,其分類準(zhǔn)確率為96.67%;在測試集中表現(xiàn)最好的是利用PSO算法優(yōu)化的SVM算法,其分類準(zhǔn)確率為92.50%;再將3個(gè)基學(xué)習(xí)器集成后利用EL進(jìn)行訓(xùn)練及驗(yàn)證,可得出EL在訓(xùn)練集中準(zhǔn)確率為99.20%,測試集中準(zhǔn)確率為97.50%。
(3)經(jīng)過實(shí)例驗(yàn)證分析,證明RF-EL算法對施工升降機(jī)可靠性分析具有良好的準(zhǔn)確性、穩(wěn)定性。該模型的建立以及實(shí)際應(yīng)用對保障施工升降機(jī)的高效、安全、可靠運(yùn)行具有重要的現(xiàn)實(shí)意義。