賈云博,張永炘,黃偉文,何東城,蔡岱翰
(廣東創(chuàng)成建設(shè)監(jiān)理咨詢有限公司,廣東 廣州520000,E-mail:yunbo.jia@qq.com)
電力事業(yè)的發(fā)展,決定了經(jīng)濟(jì)技術(shù)的進(jìn)步和發(fā)展。無論是經(jīng)濟(jì)欠發(fā)達(dá)地區(qū)還是東部沿海地區(qū),電力工程的建設(shè)遍布各地。為了保證電力工程施工的質(zhì)量,需要對電力工程現(xiàn)場施工進(jìn)行安全管理,提高對施工工人的安全保障能力[1]。但是僅依靠人員現(xiàn)場管理,信息傳遞的效率低下、方式落后,無法兼顧施工生產(chǎn)的全部環(huán)節(jié)[2]。
通過精細(xì)化管理,將信息技術(shù)與安全行為識別有機(jī)結(jié)合,可在保證工程質(zhì)量的同時,確保施工人員的行為安全[3]。Wei 等[4]研究了一種基于深度學(xué)習(xí)的視頻不安全行為捕捉方法,利用注意力機(jī)制,提高工人身份識別的效率,保證其在電力施工的現(xiàn)場行為具有安全性。FANG 等[5]研究了基于計算機(jī)視覺的信息化安全管理方法,通過與信息處理技術(shù)的融合,開發(fā)了一種應(yīng)用于施工安全的管理框架,有效保障了施工過程中的安全監(jiān)管效果。
針對電力施工現(xiàn)場的安全行為監(jiān)管識別問題,本文研究了基于KanBIM 和物聯(lián)網(wǎng)技術(shù)的電力工程現(xiàn)場安全行為識別方法。利用目標(biāo)識別技術(shù),以安全帽識別和違規(guī)行為識別等作為研究對象,并利用BIM 平臺,構(gòu)建安全管理模型,加強(qiáng)對施工現(xiàn)場工人行為的安全性識別管理能力,為保障施工人員的安全提供了新的思路。
KanBIM 技術(shù)是一種軟硬件結(jié)合的信息管理系統(tǒng),結(jié)合信息技術(shù)和運(yùn)行程序管理,能夠有效實(shí)現(xiàn)對于施工質(zhì)量和施工安全等方面的精益建設(shè)[6]。在此基礎(chǔ)上,結(jié)合信息建設(shè)技術(shù),促進(jìn)信息融合管理,能夠提供詳細(xì)的關(guān)于工程施工和人員管理的流程,從而實(shí)現(xiàn)對現(xiàn)場操作人員的行為安全性管理[7]。
物聯(lián)網(wǎng)技術(shù)是一種智能化的網(wǎng)絡(luò)系統(tǒng),涵蓋了信息采集、信息傳感、數(shù)據(jù)交換和網(wǎng)絡(luò)通信等多個方面[8]??梢杂行?shí)現(xiàn)對于工人的行為和著裝等進(jìn)行監(jiān)管。物聯(lián)網(wǎng)技術(shù)主要包括4 個層次,分別為感知層、網(wǎng)絡(luò)層、管理層和應(yīng)用層[9]。其中最主要的技術(shù)包括RFID 技術(shù)(Radio Frequency Identification,視頻識別技術(shù))和WSN 技術(shù)(Wireless Sensor Network,無線傳感網(wǎng)絡(luò))。
KanBIM 將項(xiàng)目計劃層層分解,通過工程的日施工計劃安排,對施工人員的工作范圍進(jìn)行大致規(guī)劃,從而可以有效辨別出位于非工作區(qū)域的人員。結(jié)合物聯(lián)網(wǎng)的監(jiān)控技術(shù),對于施工人員的行為是否規(guī)范和安全進(jìn)行識別,及時示警并進(jìn)行全方位管理。施工現(xiàn)場會出現(xiàn)各種各樣的數(shù)據(jù),大量的數(shù)據(jù)會造成識別效率的降低[10]。而通過數(shù)據(jù)處理技術(shù),利用數(shù)據(jù)融合和聚集函數(shù)的設(shè)定,實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)的融合,提高行為識別的準(zhǔn)確性,降低冗余信息干擾,提高系統(tǒng)處理速度,做到及時高效。
電力施工的安全行為識別管理系統(tǒng),主要由四部分組成,分別為KanBIM、RFID 和WSN 監(jiān)控傳感網(wǎng)絡(luò)、信息融合處理系統(tǒng)、預(yù)警系統(tǒng)等,其結(jié)構(gòu)圖如圖1 所示。
圖1 安全識別系統(tǒng)結(jié)構(gòu)圖
施工現(xiàn)場的安全行為識別工作,可以通過構(gòu)建網(wǎng)絡(luò)模型,來提高系統(tǒng)工作效率。最常用到的網(wǎng)絡(luò)模型主要為卷積神經(jīng)網(wǎng)絡(luò)模型(Convolutional Neural Networks,CNN)。卷積神經(jīng)網(wǎng)絡(luò)主要包括3 個層,即輸入層、輸出層和隱藏層[11]。
隱藏層位于輸入和輸出層的中間,正向傳播中,其對應(yīng)的輸入可以表示為:
式中,nj表示隱藏層中第j個神經(jīng)元的輸入;aji為對應(yīng)神經(jīng)元的權(quán)重系數(shù);Xi為輸入層中第i個神經(jīng)元給隱藏層的輸入。
隱藏層的輸出可以表示為:
式中,Cj表示隱藏層中第j個神經(jīng)元的輸出;f為系統(tǒng)激活函數(shù)。
輸出層接受的輸入數(shù)據(jù)可以表示為:
式中,nk表示輸出層中第k個神經(jīng)元的輸入;bkj為對應(yīng)神經(jīng)元的權(quán)重系數(shù);
輸出層的輸出可以表示為:
式中,Ok表示輸出層中第k個神經(jīng)元的輸出。
當(dāng)神經(jīng)網(wǎng)絡(luò)進(jìn)行反向傳播時,可以得到系統(tǒng)代價函數(shù)E的表示式:
式中,Yk為輸出層輸出中對應(yīng)第k個神經(jīng)元的期望。
輸出層的殘差δo可以表示為:
對應(yīng)隱藏層的殘差δC可以表示為
從輸入層到隱藏層的權(quán)重增量可以表示為:
式中,μ為權(quán)重增量的下降步長。
從隱藏層到輸出層的權(quán)重增量可以表示為:
更新后的權(quán)重表示式為:
式中,上標(biāo)i+1 表示更新后的數(shù)據(jù),上標(biāo)i對應(yīng)更新之前的數(shù)據(jù)。
在CNN 卷積神經(jīng)網(wǎng)絡(luò)中,其正向傳播可以獲得網(wǎng)絡(luò)各節(jié)點(diǎn)的數(shù)據(jù)值,反向傳播的優(yōu)勢在于可以避免重復(fù)計算,提高系統(tǒng)運(yùn)行效率,較好地完成訓(xùn)練工作。為了提高卷積神經(jīng)網(wǎng)絡(luò)在目標(biāo)識別算法中的效率,人們開發(fā)了Faster R-CNN 網(wǎng)絡(luò)。Faster R-CNN 是在CNN 網(wǎng)絡(luò)的基礎(chǔ)上,通過候選區(qū)域選擇算法和降低冗余特征操作過程等,極大地提高模型的計算效率[12]。
盡管Faster R-CNN 網(wǎng)絡(luò)具有極高的工作效率,但是將其應(yīng)用于安全行為識別時,還是存在誤檢率高的問題[13]。為了提高模型對于安全行為的識別效率,需要對Faster R-CNN 網(wǎng)絡(luò)框架進(jìn)行改進(jìn),改進(jìn)方法主要包括增加錨點(diǎn)數(shù)量、改進(jìn)損失函數(shù)和特征圖像插值預(yù)測等。
(1)錨點(diǎn)數(shù)量增加。錨點(diǎn)數(shù)量是卷積網(wǎng)絡(luò)中的一個重要參數(shù),直接決定和影響了特征圖像的生成情況,默認(rèn)網(wǎng)絡(luò)架構(gòu)中的錨點(diǎn)數(shù)量為9 個,主要包括3 種圖像尺寸和3 種圖像縱橫比,從而確定出復(fù)雜施工現(xiàn)場中的檢測區(qū)域,如安全帽、手機(jī)等物體。對于這些影響作業(yè)安全的小物體,9 個錨點(diǎn)數(shù)量不足以精確描述其位置和圖像情況,算法的召回難度高,難以進(jìn)行回歸和分類等處理。因此需要加入更細(xì)致的錨點(diǎn),從而完成對于小目標(biāo)物體的檢測,提高系統(tǒng)的檢測能力。
(2)損失函數(shù)改進(jìn)。損失函數(shù)的大小,決定了在復(fù)雜的電力工程現(xiàn)場中,目標(biāo)圖像數(shù)據(jù)集中樣本比例不均衡問題。根據(jù)樣本訓(xùn)練中的難易程度,對其賦予一定的權(quán)重系數(shù),可以有效增強(qiáng)模型便于對特征物體的辨識能力,便于對安全行為進(jìn)行監(jiān)控。
改進(jìn)后的損失函數(shù)基于交叉熵的理論,損失函數(shù)L的表示式為:
式中,p為樣本值為1 的概率情況,y為標(biāo)簽;γ為模型損失函數(shù)的調(diào)節(jié)系數(shù);α為模型平衡因子。
與交叉熵函數(shù)相比,改進(jìn)的損失函數(shù)增加了調(diào)節(jié)系數(shù)γ,通過調(diào)節(jié)系數(shù)的設(shè)置,可以有效提高模型對于困難樣本的挖掘能力,減少對于簡單樣本的專注損失。平衡因子α的作用在于,解決模型數(shù)據(jù)集中目標(biāo)類別不夠均衡和全面的問題。
(3)特征圖像插值預(yù)測。由于樣本量化后的數(shù)據(jù),預(yù)測區(qū)域和實(shí)際區(qū)域之間出現(xiàn)了較大的誤差,進(jìn)而影響了模型的檢測精度。因此需要對區(qū)域選擇部分進(jìn)行插值處理,利用雙線性插值數(shù)據(jù)代替原始模型的插值數(shù)據(jù),通過獲得候選框浮點(diǎn)量化數(shù)據(jù),提升模型預(yù)測結(jié)果的準(zhǔn)確度。
(1)準(zhǔn)確率。表示式為:
式中,TP為正樣本數(shù)量,F(xiàn)P為負(fù)樣本數(shù)量。
(2)召回率。表示式為:
式中,F(xiàn)N為正樣本被預(yù)測為負(fù)樣本的數(shù)量。
(3)F1 值。F1 值的作用在于對召回率和準(zhǔn)確率兩個指標(biāo)進(jìn)行綜合考慮。表示式為:
(4)平均準(zhǔn)確率。表示式為:
式中,MAP主要對于各種檢查目標(biāo)在模型中檢測效果加以評價;Nc為所有檢測目標(biāo)類別的數(shù)量;Ni為數(shù)據(jù)集中i類數(shù)據(jù)的目標(biāo)數(shù)量。
將目標(biāo)識別技術(shù)應(yīng)用于電力現(xiàn)場的安全管理中,可以有效發(fā)揮KanBIM 和物聯(lián)網(wǎng)技術(shù)的優(yōu)勢。利用目標(biāo)識別技術(shù),有效識別現(xiàn)場工人的位置信息、著裝信息、操作信息等。及時發(fā)現(xiàn)施工過程中的違規(guī)和安全隱患問題,對這些行為加以示警,防患于未然,有效確保施工現(xiàn)場的人員生命安全。以安全帽為例,作為施工現(xiàn)場中必不可少的設(shè)備,通過RFID、BIM 及物聯(lián)網(wǎng)通信技術(shù),可以把工人安全帽佩戴是否正確,著裝是否規(guī)范等管理,結(jié)合到統(tǒng)一的平臺中,及時通知、及時處理、及時糾正。對于現(xiàn)場工人的其他不規(guī)范操作,如玩手機(jī)、注意力不集中等行為,同樣可以通過視頻監(jiān)控加以識別,通過示警、通告等方式,及時加以教育和糾正,提高整個現(xiàn)場的管理效率。
基于Tensor Flow 學(xué)習(xí)框架對模型的識別效果加以驗(yàn)證,本文主要研究關(guān)于施工現(xiàn)場中安全帽的佩戴識別和工人違規(guī)操作的識別兩個方面。
在安全帽的識別方面,對于數(shù)據(jù)集的建立,需要采集足夠多的圖像,本文共采集7662 張圖像,包括各種復(fù)雜作業(yè)現(xiàn)場場景中安全帽的佩戴圖像和未佩戴圖像。由于本文網(wǎng)絡(luò)模型的訓(xùn)練要求,通過本文改進(jìn)Faster R-CNN 網(wǎng)絡(luò)模型的不斷完善,可以有效實(shí)現(xiàn)目標(biāo)的檢測,大幅提高系統(tǒng)檢測精度。
對于違規(guī)行為的數(shù)據(jù)集建立,同樣需要根據(jù)分類情況加以收集,保證數(shù)據(jù)集的建立涵蓋多個分類,且圖像數(shù)據(jù)盡量均衡,避免出現(xiàn)由于分類不清導(dǎo)致的模型錯檢情況。本文共采集圖像19822 張,涵蓋工人操作過程中看手機(jī)、打電話、扶眼鏡、視線偏離、正常操作等多種情況。
安全行為識別管理過程中圖像識別的流程如圖2 所示。
圖2 圖像識別流程圖
3.2.1 改進(jìn)后模型與原模型對比
將經(jīng)過訓(xùn)練后的模型,在相同的數(shù)據(jù)情況下,利用原Faster R-CNN 模型與本文改進(jìn)模型進(jìn)行對比,比較其識別精度情況,對比結(jié)果如表1 所示。
表1 模型精度情況對比
由表1 中結(jié)果可以看到,本文改進(jìn)后的模型與原始網(wǎng)絡(luò)架構(gòu)相比,在各方面均有了不同程度的提高,MAP提高了約15%左右,對于佩戴安全帽人員的檢測準(zhǔn)確率提高約5%,未佩戴人員的檢測準(zhǔn)確率提高了接近25%。檢測精度方面,原模型的檢測精度為91.51%,本文模型的檢測精度為99.99%,大幅提高了檢測模型的精度。可知本文模型的檢測效果更好,且適用于小目標(biāo)的檢測,包括工程現(xiàn)場的安全帽、手機(jī)、多目標(biāo)、小個體的識別,對于吸煙、打電話等不規(guī)范行為的識別精度更高。
3.2.2 錨點(diǎn)數(shù)量的影響
為了驗(yàn)證本文模型改進(jìn)的效果,在原始模型的基礎(chǔ)上,單純改變算法中錨點(diǎn)的數(shù)量,對比不同數(shù)量情況下的識別效果,其結(jié)果如圖3 所示。
圖3 錨點(diǎn)數(shù)量對于圖像精度的影響
圖3 中可以看到,隨著錨點(diǎn)數(shù)量的上升,MAP值逐漸增大,證明其可以有效提高模型識別能力。其原因在于,錨點(diǎn)的增加,可以有效提高模型對于小目標(biāo)的識別能力,從而提高對于安全帽佩戴不規(guī)范、不佩戴安全帽等行為的管理能力和管理效果。
3.2.3 損失函數(shù)和特征圖像插值預(yù)測的改進(jìn)效果
在相同的錨點(diǎn)數(shù)量為12 的情況下,選擇不同的損失函數(shù)和不同的插值策略,其對比結(jié)果如表2所示。
表2 不同改進(jìn)方案效果
表2 中可以看到,當(dāng)其他條件相同,僅僅是改變損失函數(shù)時。本文改進(jìn)后算法的MAP值均優(yōu)于原先的模型,未改變插值策略時,兩者的差約為9.04%,而改變插值算法后,兩者的差約為3.9%。說明損失函數(shù)的優(yōu)化,能夠有效提高模型的識別效果。
同理,在相同的損失函數(shù)情況下,改變插值策略,同樣能夠有效提高模型的識別效果。損失函數(shù)優(yōu)化前,相同條件下,MAP的差為9.95%。而使用優(yōu)化后的損失函數(shù)時,兩者的差為5.05%。同樣說明本文的插值策略是有利于跳過模型識別能力的。
3.2.4 不同模型對比
相同條件下,比較本文改進(jìn)后算法與其他算法之間的效果。計算結(jié)果如表3 所示。
表3 不同模型方案效果對比
表3 中可以看到,對比不同的網(wǎng)絡(luò)模型,本文算法得到MAP值依然是最高的,優(yōu)于其他算法,對于傳統(tǒng)Faster R-CNN 模型的改進(jìn)效果明顯,MAP值提高15%。
將本文算法應(yīng)用于工程施工中的安全行為監(jiān)控。利用大量的圖像數(shù)據(jù)作為算法的訓(xùn)練集和測試集,避免由于樣本量的不足而導(dǎo)致的算法偏差。使用本文網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,設(shè)定學(xué)習(xí)率為0.001,周期為100,得到的各識別參數(shù)結(jié)果如表4 所示。
表4 各行為的識別結(jié)果
表4 中可以看到,利用本文模型對于施工現(xiàn)場的工人行為進(jìn)行監(jiān)測,常見的行為識別準(zhǔn)確率為99%,模型召回率為98%,F(xiàn)1 值大小為98%。說明本文算法對于工人的行為具有很好的識別率,對于看手機(jī)和打電話等行為的識別率甚至達(dá)到100%,其他行為的識別也在98%以上,可以有效監(jiān)管和避免工作過程中的不安全行為。
相同條件下,將本文算法與其他算法模型進(jìn)行對比,對比結(jié)果如表5 所示。
表5 不同模型方案效果F1 值對比
由表5 可以看到,本文算法模型的識別率,均高于輕型CNN 結(jié)構(gòu)和HOG-RF 網(wǎng)絡(luò)模型。對于所有的工人常規(guī)操作,本文算法幾乎可以識別出全部的行為,識別準(zhǔn)確率超過99%。
根據(jù)行為識別,可以有效對工人的不規(guī)范著裝和非正常行為等進(jìn)行標(biāo)記和識別,對于在非工作區(qū)域和非安全區(qū)域進(jìn)行活動也能夠及時處理。可以證明,本文基于KanBIM 和物聯(lián)網(wǎng)的安全行為識別方法,能夠有效提高施工現(xiàn)場安全行為管理,保障人員的生命財產(chǎn)安全。
對于工程施工來說,保證現(xiàn)場的安全性,是其重中之重。基于KanBIM 和物聯(lián)網(wǎng)的安全行為識別方法,通過網(wǎng)絡(luò)模型實(shí)現(xiàn)對工人的安全行為進(jìn)行識別和管理。利用改進(jìn)的Faster R-CNN 模型對工人的安全行為進(jìn)行監(jiān)控,并將該模型應(yīng)用到施工人員的安全帽佩戴和行為規(guī)范性識別方面,實(shí)驗(yàn)結(jié)果證明該模型具有極高的識別精度和識別效率,對不安全行為的識別準(zhǔn)確度超過99%,具有重要的應(yīng)用價值。且將該模型與其他經(jīng)典模型進(jìn)行對比,結(jié)果證明該模型具有明顯的優(yōu)勢,識別的準(zhǔn)確率更高,可用于施工現(xiàn)場的安全行為規(guī)范管理工作。