張江龍, 劉慧鑫, 蘇家琰, 陳雅楠
(1.國網(wǎng)福建省電力有限公司 信息通信分公司,福建 福州 350003;2.國網(wǎng)福建省電力有限公司 電力科學研究院,福建 福州 350007)
隨著近年來經(jīng)濟的發(fā)展,我國電網(wǎng)的迅速擴建,輸電線路的巡檢工作量劇增,巡檢人員緊缺等問題日益突出。在實際工作中,高壓、特高壓輸電線路一般位于偏僻的平原或者山澗,復雜、危險的環(huán)境也給巡檢人員帶來極大的不便[1]。
近年來,隨著通信技術(shù)和檢測技術(shù)的迅速發(fā)展,許多新興的線路檢測方法也應(yīng)運而生。張志勁等[2]用紫外成像儀對不同故障類型下的電暈放電光子數(shù)進行檢測分析,并運用于電力線路檢測。劉齊和何立夫等[3-4]通過紅外成像技術(shù)獲得故障區(qū)域的紅外圖像特征,實現(xiàn)電氣設(shè)備故障隱患檢測。李建峰和Xu等[5-6]在復雜地形環(huán)境中使用無人機代替人工,實現(xiàn)智能線路巡檢。通過在輸電線路桿塔中安裝攝像頭,使用智能算法分析視頻圖片也能實現(xiàn)隱患識別。劉寧[7]提出一種基于雙區(qū)域濾波和多尺度Retinex圖像融合的去霧算法,提高輸電線路隱患發(fā)現(xiàn)率和降低人工工作量。楊旗等[8]提出采用反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)算法對輸電線路中的典型隱患進行有效識別。然而,大多數(shù)的方法存在工作效率低、監(jiān)測準確率低和成本高昂的特點,使得它們難以推廣;同時這些智能檢測方法雖能對輸電線路本身進行隱患識別,但是難以識別輸電線路周圍的環(huán)境隱患。
為解決上述問題,本文提出一種基于深度殘差網(wǎng)絡(luò)的輸電線路隱患識別模型,實現(xiàn)輸電線路自身和環(huán)境隱患的自動識別。該模型首先利用拉普拉斯梯度算子自動過濾傳輸失敗或模糊等不合格的圖片,接著通過正則表達式和聚類生成隱患標簽,然后使用深度殘差網(wǎng)絡(luò)(deep residual networks, Deep ResNet)提取圖片高層語義特征,最后使用四種不同類型的分類器對深度殘差網(wǎng)絡(luò)參數(shù)進行微調(diào)。本文模型在單臺intel i5處理器計算機上的每張圖片識別速度為0.47 s,具有93%的準確率,提高了輸電線路和周邊環(huán)境隱患自動識別水平,減少了輸電巡線工作量,提升了電網(wǎng)公司數(shù)字化和智能化水平。
數(shù)據(jù)預(yù)處理的目的是從原始輸電線路視頻監(jiān)控數(shù)據(jù)庫中自動過濾傳輸失敗或模糊等不合格的圖片,篩選出可用圖片。步驟包含圖片灰度化、圖像清晰度計算(邊緣檢測)、閾值選擇和剔除小于閾值的圖片這四個部分。首先將數(shù)據(jù)庫中輸電線路圖片轉(zhuǎn)化為灰度圖,接著運用拉普拉斯算子(Laplacian)、標準化均值方差(standard mean difference, SMD)和布倫納(Brenner)梯度函數(shù)這三種算法分別來計算圖片的清晰度,并確定三種算法的閾值,大于閾值的為清晰圖片。最后通過對比三種方法在篩選可用圖片時的耗時、精確度和召回率,選擇拉普拉斯算子來量化圖片的清晰度并篩選可用圖片。
隱患標簽的生成包含隱患文本信息的提取和隱患文本的聚類兩個步驟。首先,觀察標注圖片文本的結(jié)構(gòu),利用正則表達式提取標注文本的關(guān)鍵信息。然后通過語義相似度分析,對相似文本進行聚類,從而生成隱患圖片標簽。
隱患標簽代表圖片的最終訓練標簽,其中“通道”和“巡視”占80%以上,“隱患”不到20%。本文模型主要關(guān)注隱患信息,因此把“巡視”、“本體”和“通道”合并成一類,“隱患”和“鳥害”合并為另一類,最終形成二分類問題。
基于視覺信息提取的圖像特征可以傳達輸電圖片隱患信息,例如是否有大型基建、吊機等施工工具,是否存在鳥窩等。為了更精確地提取圖片特征信息,本文模型使用深度殘差網(wǎng)絡(luò)作為輸電隱患圖片的特征提取模型。其中,每層殘差網(wǎng)絡(luò)由卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN)組成,CNN的層數(shù)越深,可抽取的特征層數(shù)就越豐富,但其明顯的缺點是網(wǎng)絡(luò)的深度越高就越容易出現(xiàn)網(wǎng)絡(luò)退化。Deep ResNet通過引入殘差單元思想,能夠很好地應(yīng)對神經(jīng)網(wǎng)絡(luò)的退化問題,在訓練神經(jīng)網(wǎng)絡(luò)模型時進一步加深網(wǎng)絡(luò)的深度,可以提取出更豐富的圖片特征信息。
殘差網(wǎng)絡(luò)由很多殘差單元堆疊而成,每個殘差單元可以表示為:
yl=h(xl)+Γ(xl+wl)
(1)
xl+1=f(yl)
(2)
式中:xl和xl+1分別為第l層的輸入和輸出;Γ為殘差函數(shù);h(xl)為恒定映射層,h(xl)=xl;f為激勵函數(shù),本文選擇線性整流函數(shù);wl為第l層殘差單元的權(quán)重值,wl={wl,k|1≤k≤K};K為殘差單元的層數(shù)(值一般為2或者3)。如果f是恒定映射函數(shù),即xl+1≡yl,式(1)可以變成
xl+1=h(xl)+Γ(xl,wl)
(3)
以此類推可以得出:
(4)
假設(shè)深度殘差網(wǎng)絡(luò)訓練的損失為ε,采用梯度下降法來進行模型參數(shù)的訓練,根據(jù)鏈式法則可得式(5)。
(5)
式(5)的第一項確保了任意從淺層傳輸過來的信息可以直接到達層。這種殘差跳躍式的結(jié)構(gòu),使某一層的輸出可以直接跨過幾層作為后面某一層的輸入,其意義在于通過疊加多層網(wǎng)絡(luò)解決整個學習模型的錯誤率不降反升的難題。
本文模型運行環(huán)境為Windows 10操作系統(tǒng),Inter(R) Core(TM) i5-6360U CPU,8G內(nèi)存,使用Python作為分析語言,模型的訓練使用Keras和Sklearn。
對2 500張樣本圖片進行算法評價,其中2 350張為可用圖片,150張為傳輸失敗或模糊圖片。通過對比篩選可用圖片時的耗時、精確度和召回率選擇最優(yōu)算法,結(jié)果如表1所示。其中,Laplacian耗時最短,精確度最高;SMD耗時最長、精確度適中;Brenner梯度函數(shù)耗時居中,但是精確度最低。在保證召回率在99%的前提下,要想保證圖片精確度高可用并且提取耗時短,本模型最終選擇Laplacian。
表1 Laplacian、SMD、Brenner算法性能對比
圖1 不同分類器的分類效果
本文模型在邏輯回歸、隨機森林、自提升分類器和支持向量機這四種機器學習模型中進行模型參數(shù)的微調(diào)。四種分類器在測試集的效果如圖1所示。可以看出四個分類器準確率均能達到85%以上,但從F1值來看,隨機森林和基于決策樹的自提升分類器的分類效果遠差于支持向量機和邏輯回歸,這可能與決策樹模型在2 048個特征下易發(fā)生過擬合有關(guān)。綜合各項指標,支持向量機的分類效果最好。
綜上所述,該模型的分析流程如圖2所示?;谏疃葰埐罹W(wǎng)絡(luò)和支持向量機的組合算法,每張圖片處理時間為0.47 s,并獲得93%準確率和79%的F1值。
圖2 輸電線路隱患圖片自動識別的邏輯分析流程
本文采用機器學習的有監(jiān)督學習方法來建模,形成了一個端到端輸電圖片隱患自動識別分類器,并獲得93%準確率和79%的F1值,大大提高識別準確率。本文模型具有很強的推廣性,一是模型大小為341 M字節(jié),可以通過容器的方式運行在終端,應(yīng)用于云邊協(xié)同的場景;二是模型可以便捷地應(yīng)用于其他視頻分析場景,如應(yīng)用于變電站視頻監(jiān)控,同時可以內(nèi)嵌到人工智能平臺,遷移到其他專業(yè)領(lǐng)域應(yīng)用。