國網(wǎng)思極位置服務(wù)有限公司 石 帥 鄭岳峰
隨著社會(huì)經(jīng)濟(jì)的高速發(fā)展,國家電力事業(yè)取得了卓有成效的進(jìn)步,電力基建項(xiàng)目逐年增加,為社會(huì)生產(chǎn)及人們生活帶來了極大的便利。但基于電力作業(yè)環(huán)境的復(fù)雜性與特殊性,施工人員的安全問題、施工現(xiàn)場(chǎng)管控也面臨著嚴(yán)峻的挑戰(zhàn)[1]。傳統(tǒng)電力基建施工現(xiàn)場(chǎng)管控多采用人工監(jiān)督檢查的方式,需要耗費(fèi)大量人力,且效率低、時(shí)效性差,容易出現(xiàn)疏忽,難以實(shí)現(xiàn)整體把控及實(shí)時(shí)監(jiān)控。
隨著人工智能技術(shù)發(fā)展,應(yīng)用圖像數(shù)據(jù)構(gòu)建基建現(xiàn)場(chǎng)安全狀態(tài)評(píng)估成為可能,卷積神經(jīng)網(wǎng)絡(luò)通過對(duì)低層特征的組合,能夠獲得抽象高層特征與屬性,檢測(cè)精度高、速度快,其中以YOLO 算法應(yīng)用最為普遍,其識(shí)別效果優(yōu)良,檢測(cè)速度快[2],v3可對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行調(diào)整,是目標(biāo)檢測(cè)領(lǐng)域取得的重要成果。研究在電力基建施工現(xiàn)場(chǎng)引入YOLO-v3算法,旨在為現(xiàn)場(chǎng)管控提供技術(shù)支持,其對(duì)于電力基建發(fā)展有著重要的意義。
作為一種單階段檢測(cè)器,YOLO 能夠?qū)⒆罱K的檢測(cè)結(jié)果直接給出,省略了候選區(qū)域步驟,在保障檢測(cè)精度的基礎(chǔ)上,提升了檢測(cè)速度。檢測(cè)期間以整個(gè)圖像特征為依據(jù),避免了背景所致的錯(cuò)誤。從YOLO-v3結(jié)構(gòu)看,其應(yīng)用的是Darknet-53特征提取網(wǎng)絡(luò),其包括53個(gè)卷積層,多個(gè)3×3、1×1卷積核,在設(shè)計(jì)層面,將快捷鏈路加入層與層之間,對(duì)小目標(biāo)具有良好的檢測(cè)能力[3]。Darknet-53殘差卷積過程,首先行3×3(步長=2)卷積,保存卷積layer,然后分別進(jìn)行1×1、3×3卷積,獲得的結(jié)果與layer 相加,為最終結(jié)果。殘差網(wǎng)絡(luò)方便優(yōu)化,通過增加深度可促進(jìn)準(zhǔn)確率的提升,將跳躍連接應(yīng)用于內(nèi)部殘差塊,可以有效解決深度增加所致的梯度消失問題。
在卷積部分,應(yīng)用DarknetConv 2D 結(jié)構(gòu),卷積時(shí)進(jìn)行L2正則化處理,然后實(shí)施BN 標(biāo)準(zhǔn)化處理與Leaky Relu 處理,前者主要目的是加快收斂,同時(shí)防止梯度消失。Leaky Relu 則能夠解決函數(shù)進(jìn)入負(fù)區(qū)間、神經(jīng)元停止學(xué)習(xí)的問題,其表達(dá)式為:
其中,ai 表示的是在[1,+∞]的固定參數(shù)。
具體到電力基建施工現(xiàn)場(chǎng)管控工作中,該系統(tǒng)主要由監(jiān)視設(shè)備、現(xiàn)場(chǎng)終端系統(tǒng)及數(shù)據(jù)傳輸網(wǎng)絡(luò)、視頻存儲(chǔ)服務(wù)器等組成,利用視頻監(jiān)控能夠?qū)κ┕がF(xiàn)場(chǎng)的圖片數(shù)據(jù)信息進(jìn)行采集,并向現(xiàn)場(chǎng)終端系統(tǒng)匯總。對(duì)于圖片數(shù)據(jù),在現(xiàn)場(chǎng)便能夠進(jìn)行實(shí)時(shí)處理,獲得結(jié)果,或通過數(shù)據(jù)傳輸網(wǎng)絡(luò)向遠(yuǎn)程端傳輸,進(jìn)行遠(yuǎn)程管控[4]。
電力基建施工現(xiàn)場(chǎng)管控系統(tǒng)如圖1所示。該系統(tǒng)屬于實(shí)時(shí)目標(biāo)檢測(cè)模型,其利用視頻監(jiān)控設(shè)備采集圖片數(shù)據(jù),應(yīng)用人工智能算法提取目標(biāo)特征,并進(jìn)行模型訓(xùn)練,完成目標(biāo)檢測(cè)、文字識(shí)別等。施工現(xiàn)場(chǎng)管控系統(tǒng)不僅能夠?qū)崿F(xiàn)對(duì)安全帽穿戴、抽煙、標(biāo)識(shí)牌等的檢測(cè),而且能夠明確安全隱患,提供預(yù)警信息,促進(jìn)基建現(xiàn)場(chǎng)安全管控水平的提升。
圖1 電力基建施工現(xiàn)場(chǎng)管控系統(tǒng)
Darknet-53網(wǎng)絡(luò)是YOLO-v3的主體,其與Darknet 19相比,網(wǎng)絡(luò)結(jié)構(gòu)深,以殘差結(jié)構(gòu)防止深層網(wǎng)絡(luò)訓(xùn)練的梯度消失問題。YOLO-v3網(wǎng)絡(luò)應(yīng)用全卷積結(jié)構(gòu),以FPN 多尺度融合作為參考,經(jīng)Darknet 主干特征提取3個(gè)分支,通過拼接,對(duì)特征圖向量的維度進(jìn)行擴(kuò)充。獲得的3個(gè)特征圖能夠完成對(duì)相應(yīng)尺度錨邊界框的特征提取[5]。特征圖越大表明感受野越小。基于此在對(duì)精細(xì)目標(biāo)進(jìn)行檢測(cè)時(shí),可以選擇小尺寸錨邊界框;較大目標(biāo)可以應(yīng)用較大尺寸錨邊界框。
通常,應(yīng)用視頻監(jiān)控設(shè)備能夠?qū)さ厣瞎ぷ魅藛T的情況進(jìn)行實(shí)時(shí)獲取,以視頻流的方式完成對(duì)現(xiàn)場(chǎng)目標(biāo)的定位與檢測(cè)。一般監(jiān)控設(shè)備安裝在現(xiàn)場(chǎng)邊緣的高處地帶,高度為10m 左右,俯視角范圍為15°~30°,獲取的施工畫面為非正面成像,目標(biāo)縱向尺寸經(jīng)投影其長寬比會(huì)出現(xiàn)一定的改變,對(duì)錨邊界框初始值確定有直接的影響。針對(duì)電力基建現(xiàn)場(chǎng)5種管控目標(biāo),應(yīng)用Kmeans 算法實(shí)施聚類分析,獲得對(duì)應(yīng)預(yù)測(cè)值,不同分支網(wǎng)絡(luò)對(duì)應(yīng)各尺寸的特征見表1。
表1 錨邊界框預(yù)測(cè)值
網(wǎng)絡(luò)輸出結(jié)果如下。
一是(tx,ty),其指的是預(yù)測(cè)邊界框特征圖、中心坐標(biāo)偏移量,預(yù)測(cè)邊界框與錨邊界框的寬高比用(tw,th)表示。
二是(Pw,pH)是預(yù)設(shè)錨邊界框?qū)捀叱叽纭S纱双@得預(yù)測(cè)邊界框中心坐標(biāo),可以采用(bx,by)表示,寬高表示為(bw,bh)。b0表示置信度,不同類別概率用bc表示,計(jì)算式為:
其中網(wǎng)格的左上角坐標(biāo)為(Cx,Cy),σ(x)為sigmoid 函數(shù),預(yù)測(cè)值可加速網(wǎng)絡(luò)收斂,區(qū)間為[0,1]。
電力基建現(xiàn)場(chǎng)工作環(huán)境特殊,對(duì)施工人員要求高,不僅需要對(duì)常規(guī)違規(guī)行為進(jìn)行檢測(cè),而且需要檢測(cè)抽煙、看手機(jī)等行為,該模型需要對(duì)同一目標(biāo)多個(gè)類別情況進(jìn)行識(shí)別,該過程需要對(duì)損失函數(shù)進(jìn)行優(yōu)化,總損失函數(shù)表達(dá)式為:
網(wǎng)絡(luò)優(yōu)化應(yīng)用損失函數(shù),采用均方誤差損失函數(shù)對(duì)邊界框?qū)捀撸╞w,bh)進(jìn)行預(yù)測(cè),中心點(diǎn)坐標(biāo)(bx,by),b0為置信度,應(yīng)用二值交叉熵?fù)p失函數(shù)對(duì)邊界框各個(gè)類別的概率bc進(jìn)行預(yù)測(cè),其能夠?qū)崿F(xiàn)對(duì)目標(biāo)多類別的有效識(shí)別,避免內(nèi)存溢出。
以某電力公司電力基建現(xiàn)場(chǎng)安裝的移動(dòng)監(jiān)控?cái)z像頭作為視頻采集工具,共獲得了1500h 視頻時(shí)長,從中截取57000張有效數(shù)據(jù)集,根據(jù)8∶1∶1的比例將所抽取的數(shù)據(jù)組成訓(xùn)練集、驗(yàn)證集與測(cè)試集,數(shù)據(jù)集涵蓋了攝像頭在不同時(shí)間段的數(shù)據(jù),配置的環(huán)境參數(shù)及訓(xùn)練時(shí)長見表2。
表2 環(huán)境配置參數(shù)
網(wǎng)絡(luò)參數(shù)包括學(xué)習(xí)率、動(dòng)量常數(shù)、權(quán)值衰減系數(shù),學(xué)習(xí)率在訓(xùn)練模型的收斂中有著重要的意義,為使模型收斂,需要設(shè)計(jì)學(xué)習(xí)率為較小參數(shù),若該值過大,會(huì)出現(xiàn)目標(biāo)函數(shù)超出極小點(diǎn)的情況,若該值過小,會(huì)減慢收斂速度,因此設(shè)為0.001。收斂常數(shù)設(shè)置為0.7,能夠促進(jìn)收斂速率的提升。權(quán)值衰減系數(shù)主要目的是對(duì)模型復(fù)雜度對(duì)損失函數(shù)影響的調(diào)節(jié),該值過大會(huì)導(dǎo)致?lián)p失函數(shù)值過大,設(shè)置為0.0004能夠發(fā)揮較好的調(diào)節(jié)作用。
在模型訓(xùn)練中網(wǎng)絡(luò)總損失函數(shù)Loss 值在初始的4000次迭代中有著較快的下降速度,直至32000次迭代后逐漸處于穩(wěn)定狀態(tài),保持為0.5左右,體現(xiàn)出良好的網(wǎng)絡(luò)收斂性能,參數(shù)實(shí)現(xiàn)了優(yōu)化。
網(wǎng)絡(luò)預(yù)測(cè)需要經(jīng)過的步驟包括:一是得分閾值為0.6,預(yù)測(cè)邊界框各個(gè)類別概率bc 為篩選,將每個(gè)類別概率過低邊界框去除。二是交并比閾值為0.5,針對(duì)某一類別對(duì)應(yīng)的預(yù)測(cè)邊界框性nms 非極大值抑制,篩選符合條件的作為輸出結(jié)果。
將YOLO 神經(jīng)網(wǎng)絡(luò)優(yōu)化前及優(yōu)化后獲得的目標(biāo)圖像檢測(cè)結(jié)果進(jìn)行比較,可以發(fā)現(xiàn)在設(shè)備錯(cuò)誤識(shí)別率方面,優(yōu)化后的模型錯(cuò)誤識(shí)別率達(dá)到100%,而優(yōu)化前的錯(cuò)誤識(shí)別率為83.3%,設(shè)備錯(cuò)誤識(shí)別率詳見表3。
表3 設(shè)備錯(cuò)誤識(shí)別率
由此可見,應(yīng)用電力基建施工管控技術(shù)能夠提升對(duì)錯(cuò)誤的識(shí)別準(zhǔn)確率。
對(duì)優(yōu)化前后的性能進(jìn)行比較分析,發(fā)現(xiàn)優(yōu)化前出現(xiàn)施工人員漏檢、安全帶漏檢及電焊手套漏檢的情況;經(jīng)過優(yōu)化后安全帽、安全帶及人等均能夠被精準(zhǔn)定位及有效檢測(cè),未出現(xiàn)漏檢或錯(cuò)檢,不僅如此,人在站立狀態(tài)下或下蹲狀態(tài)下均能夠被有效識(shí)別,魯棒性強(qiáng),即便施工人員有重疊,經(jīng)過優(yōu)化網(wǎng)絡(luò)依然可以精準(zhǔn)定位各個(gè)目標(biāo)。優(yōu)化前后性能的比較見表4,顯示優(yōu)化后有著更好的精度,這是因?yàn)榻?jīng)過優(yōu)化YOLO 可將俯視拍攝的畫面進(jìn)行有效的處理,使得目標(biāo)與檢測(cè)框重合度高,檢測(cè)效果好。
表4 優(yōu)化前后性能比較
研究應(yīng)用YOLO-v3算法建立了電力基建施工現(xiàn)場(chǎng)管控系統(tǒng),其能夠?qū)崿F(xiàn)對(duì)電力設(shè)備鋪設(shè)位置、類別的預(yù)測(cè),提升對(duì)違規(guī)行為的檢測(cè)精度及檢測(cè)效率,具有良好的魯棒性,能夠滿足電力基建施工現(xiàn)場(chǎng)管控需求。在后續(xù)工作中,需要與施工實(shí)際結(jié)合,進(jìn)一步探究YOLO-v3算法的應(yīng)用優(yōu)勢(shì),為電力基建事業(yè)發(fā)展提供支持。