張驥,張金鋒,朱能富,余娟,陳子亮
(1. 南京南瑞集團公司,南京 211000; 2.國網(wǎng)安徽省電力公司,合肥 230061; 3.安徽大學電子信息工程學院,合肥 230601)
變電站實時監(jiān)控技術(shù)近年來得到迅猛的發(fā)展,其中基于圖像處理的電力設(shè)備檢測和識別技術(shù)成為研究的熱點[1-2]。由于現(xiàn)實中所拍攝的圖像往往包含許多其它目標而不僅僅是感興趣的電力設(shè)備目標本身,同時所拍攝的圖像背景也較為復雜,如不同的光照條件、拍攝角度等,這使得同一目標在不同圖像中呈現(xiàn)不同的模式。
傳統(tǒng)的電力設(shè)備(如絕緣子和刀閘)識別方法主要依靠目標顏色特征和幾何特征,這些方法往往受亮度變化和復雜背景等因素的影響,導致這些方法往往擁有較差的泛化能力[3]。如文獻[4]提出一種簡單快速的刀閘狀態(tài)識別方法,該方法直接在刀閘邊界圖像上進行Hough變換[5]來確定刀閘的狀態(tài)。文獻[6]提出了一種基于刀閘幾何信息的實時刀閘狀態(tài)監(jiān)控算法,該算法主要利用Hough變換獲得刀臂直線,并利用余弦定理計算兩刀臂直線之間的夾角來判斷刀閘的狀態(tài)。文獻[7]提出絕緣子圖像的多種特征提取技術(shù),包括利用灰度共生矩陣提取圖像的紋理特征、利用二值圖像提取不變矩特征、利用圖像的幾何特征提取邊界輪廓,為絕緣子檢測和識別提供信息。文獻[8]開發(fā)一種能自動識別刀閘位置及狀態(tài)的機器人,該方法利用SIFT算法進行模板匹配來尋找刀閘位置,然后進行Hough變換提取直線以判斷刀閘狀態(tài)。文獻[9]則利用ASIFT算法實現(xiàn)輸電線路視頻與標準圖庫中絕緣子圖片的匹配,進而識別和定位視頻中的絕緣子。
文獻[10]指出上述方法還存在著穩(wěn)定性較差、抗干擾能力不強等問題。為了提高定位和識別精度,近年來許多研究者利用機器學習的方法來進行絕緣子或刀閘的定位和狀態(tài)識別。如文獻[10]提出了一種基于霍夫森林的刀閘狀態(tài)識別方法,利用霍夫森林進行刀閘斷開和閉合狀態(tài)模型的學習,訓練出刀閘斷開和閉合兩種狀態(tài)的模型,利用該模型對輸入圖像進行刀閘定位和狀態(tài)識別。文獻[11]利用SVM(Support Vector Machine)來訓練絕緣子圖像,并結(jié)合Hough變換來定位圖像中的絕緣子。文獻[12]將圖像的灰度特征矩陣轉(zhuǎn)換為差異表示矩陣并對其均值化、歸一化和稀疏化,然后利用DBN網(wǎng)絡(luò)對得到的差異特征進行訓練,達到識別絕緣子故障的目的。文獻[3]提出一個六層的卷積神經(jīng)網(wǎng)絡(luò)(CNNs)在絕緣子圖像上訓練檢測模型,成功地利用該訓練模型精確的定位絕緣子。文獻[13]提出了一種新的差異特征描述方法,可以表示圖像的灰度差異、形狀變化等多個特征,用于目標識別以及實際航拍圖像的絕緣子識別。文獻[14]提出了一種基于全卷積神經(jīng)網(wǎng)絡(luò)(FCNs)的刀閘狀態(tài)識別方法,該方法利用FCNs對絕緣子和刀閘目標進行分割定位,并利用絕緣子和刀閘之間的幾何關(guān)系來識別刀閘目標的狀態(tài)。但這類方法存在多刀閘目標相互干擾的問題。
為了解決多刀閘目標干擾問題和進一步提高刀閘狀態(tài)識別精度,設(shè)計了一種基于改進深度學習的多刀閘狀態(tài)識別方法。該方法通過改進的卷積神經(jīng)網(wǎng)絡(luò)來深度學習包含絕緣子、刀閘等目標的圖像,獲得可靠的訓練模型。利用訓練模型來定位絕緣子和刀閘的位置,最后根據(jù)絕緣子和刀閘目標的幾何形狀特征來識別刀閘狀態(tài)。實驗結(jié)果表明該方法能夠精確地定位絕緣子和刀閘的位置,顯著提高刀閘狀態(tài)識別的精度。
卷積神經(jīng)網(wǎng)絡(luò)通過增加網(wǎng)絡(luò)的層數(shù)來模擬人類視覺系統(tǒng)的信息處理過程[15]。從最底層到最頂層逐漸提取圖像信息的有效抽象化特征表示,即越高層數(shù)上的圖像特征具有越強的表征能力。卷積神經(jīng)網(wǎng)絡(luò)可以歸結(jié)為輸入層、多個隱含層和輸出層,其通過共享網(wǎng)絡(luò)參數(shù)來減少網(wǎng)絡(luò)間的權(quán)重,以此來降低訓練樣本數(shù)量和提高訓練速度。
設(shè){(x(1),y(1)),(x(2),y(2)),…,(x(n),y(n))}表示訓練集,x(i)表示輸入圖像,y(i)表示圖像標簽。對于單一圖像,hw,b(x)表示其預(yù)測得分,則其損失項可表示為:
(1)
整個訓練集的損失函數(shù)可以表示為:
(2)
可使用隨機梯度下降法來更新權(quán)重和偏置參數(shù):
(3)
式中α表示學習率,其作用是調(diào)節(jié)梯度下降的速度。有關(guān)CNNs的具體細節(jié)見文獻[15]。圖1是CNNs提取圖像深度信息的示意圖。
為了降低特征維數(shù)和避免出現(xiàn)過度擬合(over-fitting),CNNs需要進行池化操作[16]。池化操作可以提高特征描述的鑒別力,常用的池化操作是平均池化(mean-pooling)、最大池化(max-pooling)和隨機池化(Stochastic pooling)操作[17]。然而這些池化操作不足以保證特征表示的魯棒性和有效性,因此文中對CNNs中池化操作進行空間加權(quán)的改進以進一步提高深度特征表示的魯棒性和有效性。
對于圖1中的卷積特征映射可以表示為H×W×D維的張量,其中H和W表示卷積特征映射的大小(長度和寬度),D表示特征映射的數(shù)量??臻g加權(quán)掩碼可以表示為K個H×W大小的池化通道,令Pk表示第k個空間掩碼的池化特征,則其可以表示為:
(4)
(5)
P是圖1中池化層的輸出,是輸入圖像的K×D特征表示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)
圖2給出了基于改進CNNs刀閘狀態(tài)識別方法的流程圖,文中方法分為訓練階段和刀閘狀態(tài)識別階段。在訓練階段,利用攝像機人工拍攝獲取包含絕緣子、刀閘和不同背景的3 000幅圖像作為訓練集。在訓練圖像集上構(gòu)建6層的CNNs來迭代訓練網(wǎng)絡(luò)模型,訓練前利用高斯分布(均值為0,標準差為0.01)來隨機初始化CNNs的權(quán)值,文中使用ReLU(Rectified Linear Unit)激活函數(shù)代替?zhèn)鹘y(tǒng)的sigmoid激活函數(shù),其數(shù)學表達式為f(x)=max(0,x),其目的是避免梯度擴散以提高隨機梯度下降法的收斂速度[17],訓練過程見圖2(a)所示。
圖2 文中方法的刀閘狀態(tài)識別過程
定位絕緣子和刀閘后,需要對多刀閘狀態(tài)進行識別。文中狀態(tài)識別條件為:(1)刀閘與絕緣子的連通性,如果一個刀閘區(qū)域與兩個絕緣子區(qū)域連通,則認為該刀閘處于閉合狀態(tài),否則是處于斷開狀態(tài);(2)刀閘區(qū)域的長寬比,如刀閘區(qū)域的長寬比小于0.2,則認為該刀閘處于閉合狀態(tài),否則是處于斷開狀態(tài)。刀閘狀態(tài)識別過程見圖2(b)所示。
本節(jié)主要驗證所提出刀閘狀態(tài)識別方法的有效性。文中隨機選擇300幅圖像作為測試,每幅圖像包含多個絕緣子和刀閘目標。所有樣本來源于合肥某小區(qū)變電站,通過固定攝像機拍攝所得。實驗是在Windows 7環(huán)境下,編譯軟件為Visual Studio 2010和OpenCV 2.4.9,實驗硬件為Pentium Dual-Core CPU 2.50 GHz。所使用深度學習的訓練時間為18小時。
文中利用漏檢率(Miss Rate: MR)和誤檢率(False Positive Rate: FPR)對絕緣子和刀閘檢測效果進行評價,利用識別精度(Recognition Precision: RP)對刀閘狀態(tài)識別結(jié)果進行評價[20]。漏檢率MR、誤檢率FPR和識別精度RP分別定義為:
(6)
(7)
(8)
式中 TP(True Positive)、FP(False Positive)、TN(True Negative)和FN(False Negative)分別為將分類正確的正樣本數(shù)、分類錯誤的負樣本數(shù)、分類正確的負樣本數(shù)、分類錯誤的正樣本數(shù)[20]。
表1給出了文獻[8]、文獻[10]、文獻[14]和本文方法的實驗結(jié)果。從表1可以看出,相對于文獻[8]、文獻[10]、文獻[14]方法,該方法具有較低的漏檢率和誤檢率,具有較高的刀閘狀態(tài)識別精度。同時也可以看出,基于深度學習的方法(文中算法和文獻[14]算法)在檢測和識別上都有很大的優(yōu)勢,特別是文中方法的識別精度達到93.2%。圖3~圖6給出了兩組不同刀閘類型、不同場景、不同拍攝角度、不同開關(guān)狀態(tài)、不同背景和不同光照強度下刀閘狀態(tài)識別結(jié)果。其中圖3(a)是輸入待識別的刀閘圖像,圖3(b)是基于改進CNNs輸出的絕緣子和刀閘目標定位結(jié)果,圖3(c)顯示目標(絕緣子和刀閘)定位結(jié)果和刀閘狀態(tài)識別結(jié)果。圖3和圖4是一種刀閘類型的兩幅圖像,圖5和圖6是另一類型的刀閘圖像。從圖3~圖6可知,基于深度學習的刀閘狀態(tài)識別方法可以精確定位絕緣子和刀閘目標、識別不同角度和不同開關(guān)狀態(tài)的刀閘狀態(tài)。對于一幅待識別圖像,文中刀閘狀態(tài)識別時間小于5 s。
表1 刀閘檢測和狀態(tài)識別結(jié)果
圖3 圖像1刀閘狀態(tài)(閉合)識別結(jié)果
圖4 圖像2刀閘狀態(tài)(斷開)識別結(jié)果
圖5 圖像3刀閘狀態(tài)(閉合)識別結(jié)果
絕緣子定位和刀閘狀態(tài)識別是電力傳輸系統(tǒng)中至關(guān)重要的問題,為解決復雜背景和多刀閘目標干擾等因素,提出了一種基于改進深度學習的刀閘狀態(tài)識別方法。該方法利用改進的CNNs算法精確定位絕緣子和刀閘位置,并利用檢測的刀閘區(qū)域長寬比和與絕緣子區(qū)域的連通性來判斷刀閘的開關(guān)/閉合狀態(tài)。實驗結(jié)果證明了該方法具有較低的漏檢率和誤檢率,及較高的刀閘狀態(tài)識別精度,可以精確識別不同角度、不同開關(guān)狀態(tài)、不同背景和不同光照強度下的刀閘狀態(tài),可為現(xiàn)代電網(wǎng)的智能化、無人化改造提供一定的理論基礎(chǔ)。