程曉陸 高超 葉曉琪 斯榮
摘 要:在智能電網(wǎng)發(fā)展的大背景下,目前的電網(wǎng)生產(chǎn)安監(jiān)管理模式已經(jīng)不適應智能電網(wǎng)的要求,安監(jiān)管理模式和方式的創(chuàng)新迫在眉睫。鑒于此,首先收集電網(wǎng)違規(guī)場景圖片構建VOC數(shù)據(jù)集,利用LabelImg軟件對數(shù)據(jù)集進行標注;然后采用YOLOv3深度學習目標識別算法實現(xiàn)對數(shù)據(jù)集的訓練、調(diào)試,并分析模型的性能指標;最后輸入額外的目標樣本測試成功,為后續(xù)更多新技術應用的研究開發(fā)提供了新的思路和方向。
關鍵詞:深度學習算法;YOLOv3;目標識別;電力安全監(jiān)察
0? ? 引言
隨著智能電網(wǎng)的發(fā)展,本就存在諸多問題的安監(jiān)模式已越來越不適應當前電網(wǎng)的要求。毋庸置疑,電網(wǎng)安監(jiān)需要做出改變,但目前提出的安監(jiān)模式改革大多是針對管理體系,很少有人提出安監(jiān)方式的改變。
針對管理體系,孫睿等人提出了適應智能電網(wǎng)的“大安全”運營管理體系[1],這一概念是對現(xiàn)有安全責任、安全保證和安全監(jiān)督管理三大基本體系的提升和拓展,真正以“全員、全過程、全方位”為原則,以人員、設備/系統(tǒng)和管理體系本身為管理對象,全面強化和提升安監(jiān)管理部門對安全生產(chǎn)活動的管理職能。該管理模式的目標是立足三大基礎管理體系,實現(xiàn)運營安全管理體系與智能電網(wǎng)技術支撐體系的有效融合,最終實現(xiàn)“精益安全作業(yè)、安全數(shù)據(jù)集約管理、安全監(jiān)督工作專業(yè)化、全過程安全風險預控、安全事件迅速響應和安全決策智能化”。
近年來,人工智能發(fā)展勢頭迅猛,在很多領域都得到了卓有成效的運用,這也給安監(jiān)技術的改變創(chuàng)新帶來了契機,而提升安全監(jiān)督信息化水平也是創(chuàng)新電力安監(jiān)模式的主要方向。應用智能安監(jiān)設備,能夠輔助現(xiàn)場人員提前發(fā)現(xiàn)風險,在作業(yè)中有效規(guī)避風險;與安全生產(chǎn)子系統(tǒng)進行數(shù)據(jù)對接,減少現(xiàn)場錄入工作量,在提升工作效率的同時,有助于提升現(xiàn)場風險管理水平。
基于深度學習的目標檢測算法[2-4]主要分為基于建議框的方法(R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN、FPN)和免建議框的方法(YOLO、SSD、DSSD、RetinaNet)。2015年,YOLO算法的出現(xiàn)使得深度學習目標檢測算法開始有了兩步(two-stage)和單步(single-stage)之分。YOLO算法通過共享卷積特征的方式提取候選框和進行目標識別,檢測速度較Faster R-CNN有近10倍的提升。2016年,微軟研究院的Jifeng Dai等人提出R-FCN算法,通過共享卷積層特征實現(xiàn)目標提取。后續(xù)的SSD算法,利用卷積核來預測邊界框的類別分數(shù)和偏移量,不僅提高了檢測精度,同時還提升了檢測速度。
這些發(fā)展使得深度學習目標檢測算法開始能夠滿足實時檢測任務的需求。但到目前為止,將深度學習應用于電力安監(jiān)技術的研究幾乎沒有[5],本文希望通過研究為后續(xù)深度學習算法在安監(jiān)技術領域的應用提供一些新的想法和方向。
本文收集電網(wǎng)違規(guī)場景圖片以構建數(shù)據(jù)集,用圖片標注軟件LabelImg對數(shù)據(jù)集中的樣本進行準確標注,輸入進YOLOv3網(wǎng)絡對其進行模型訓練,分析得到的模型性能指標并進行測試,進一步探索了智慧現(xiàn)場中電力安全工作的創(chuàng)新方向。
1? ? YOLOv3目標識別算法
YOLOv3的網(wǎng)絡結構是基于Darknet-53的特征提取結構,具體如圖1所示。
可以將YOLOv3的總體結構分為兩個部分,分別為主干特征提取網(wǎng)絡和預測卷積操作。主干特征提取網(wǎng)絡的主要功能是提取目標物體的特征,其實也就是不斷卷積的過程。輸入416×416×3(其中416×416是圖片大小,3為通道數(shù))的圖片,然后對其不斷進行下采樣的操作,將輸入圖片的高和寬不斷壓縮,將通道數(shù)不斷擴張,從而獲得一堆特征層(可表示輸入進來的圖片的特征)。
之后,選取最后3個特征層,輸入到第二部分的預測卷積操作,3個特征層的大小分別為:13×13×1 024、26×26×512、52×52×256。預測卷積操作是首先將13×13×1 024的特征層進行五次卷積,將得到的結果分別進行兩種處理:一種是在兩次卷積后進行分類預測和回歸預測,檢測圖片中是否存在真實物體,若存在真實物體再判斷這個物體的種類并調(diào)整先驗框;另一種是在進行上采樣后將特征層轉換為26×26×256,然后與26×26×512的特征層進行堆疊對比,這實際上也是構建特征金字塔的過程,利用特征金字塔可進行多尺度特征融合提取更有效的特征。而對堆疊結果的操作同13×13×1 024特征層的操作相同。這樣的網(wǎng)絡結構十分簡單,也正是因為如此,YOLO網(wǎng)絡的識別速度極快。又因為檢測是以整個圖像作為輸入,內(nèi)部數(shù)據(jù)的聯(lián)系相對緊密,這樣一來就可以降低對背景的錯誤識別概率,同時網(wǎng)絡的適應性較好,在測試集與訓練集內(nèi)的數(shù)據(jù)不完全相同時依然有較好的識別效果,與同期的識別算法相比,YOLOv3的準確率能達到其兩倍以上。
2? ? 電網(wǎng)違規(guī)場景數(shù)據(jù)集的建立
2.1? ? 樣本圖片的獲取
本文選擇了具有一定實際意義的“未佩戴安全帽”為違規(guī)施工場景,那么目標識別算法就需要通過學習訓練以達到識別出“安全帽”和“頭部”的目的。所以,首先通過網(wǎng)絡平臺的圖片搜索引擎獲取了1 018張樣本圖片,圖片包含了人員不佩戴安全帽和人員佩戴安全帽的各個角度,以確保目標識別算法的訓練效果。
2.2? ? 圖像標注
本文選擇了LabelImg軟件對樣本圖片進行標注。標注的標簽類型為“head”和“hat”。用LabelImg軟件標注后會得到標注目標的PASCAL_VCO格式的xml標記文件。文件中的信息包含圖片的大小(寬度、高度、深度)和標記目標邊界框的左上角和右下角的坐標,以便得到目標物體的中心點坐標,從而學習并記憶該目標物體的特征。