賀月 常永娟
摘? 要:隨著我國電網(wǎng)智能化、信息化的建設與發(fā)展,電網(wǎng)中的電力設備通過長期的運維、檢修和試驗,積累了大量的各種形式的電力數(shù)據(jù)。其中,相比于主要以數(shù)值形式存儲的結構化數(shù)據(jù)而言,電力設備巡檢圖像等非結構化數(shù)據(jù),具有更廣泛的應用場景和更高的價值密度,但由于不能被計算機直接識別和處理,其挖掘過程也存在更多的難點。本文提出基于改進Faster R-CNN模型的電力設備圖像目標檢測方法。以主變壓器的巡檢圖像為例,考慮了主變壓器各個部件的尺寸差異較大以及部件位置之間存在關聯(lián)性的特點,對Faster R-CNN模型的結構進行了改進,有效提高了主變壓器多部件類別和位置識別的準確率,為識別不同部件的缺陷和故障現(xiàn)象奠定了基礎。
關鍵詞:巡檢圖像? 變壓器部件? 改進Faster R-CNN模型? 訓練? 檢測
中圖分類號:TM73 ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ?文章編號:1674-098X(2021)03(a)-0133-04
Research on Image Data Mining of Transformer Inspection Based on Improved FAST R-CNN
HE Yue? CHANG Yongjuan
(Information and Communication Branch of State Grid Hebei Electric Power Co., Ltd., Shijiazhuang, Hebei Province, 050013 China)
Abstract: With the construction and development of China's power grid intelligence and informatization, the power equipment in the power grid has accumulated a large number of various forms of power data through long-term operation and maintenance, maintenance and test. Compared with the structured data mainly stored in numerical form, unstructured data such as inspection images of power equipment have more extensive application scenarios and higher value density. However, because it can not be directly recognized and processed by computer, the mining process also has more difficulties. In this paper, a target detection method based on improved Faster R-CNN model for power equipment image is proposed. Taking the inspection image of main transformer as an example, considering the large size difference of each component of main transformer and the correlation between component positions, the structure of Faster R-CNN model is improved, which effectively improves the accuracy of multi component classification and location identification of main transformer, and lays a foundation for identifying defects and fault phenomena of different components.
Key Words: Inspection image; Transformer parts; Improved Faster R-CNN model; Training; Detection
在智能變電站建設中,隨著巡檢機器人的普及和大量變電站圖像數(shù)據(jù)的積累,基于圖像的電力設備狀態(tài)自動識別方法逐步得到應用,例如隔離開關分合狀態(tài)識別、瓷瓶異物識別等等。采用計算機視覺技術代替?zhèn)鹘y(tǒng)的人力巡檢,可以有效提高巡檢的頻率和效率,并減少人工判斷的主觀性對準確率的影響。作為變電站最重要的設備之一,主變壓器的穩(wěn)定運行關系到變電站乃至整個電力系統(tǒng)供電的安全可靠[1]。因此,基于變壓器圖像的缺陷和故障識別有著重要的實用價值,而變壓器部件的檢測是其中的一個關鍵性環(huán)節(jié)。只有在準確檢測出變壓器各個部件的類別和位置后,才能夠針對不同的部件可能發(fā)生的缺陷和故障類型,如儲油柜滲漏油、呼吸器硅膠變色等,制定相應的識別算法,從而實現(xiàn)變壓器缺陷和故障的自動識別[2]。
對于電力設備和部件的自動檢測,基本思路是從現(xiàn)場獲得包含待識別目標的圖像,并進行特征提取和分析,再通過檢測模型檢測出圖像中電力設備和部件的類別與位置[3]。較為直接的方法是基于模版的匹配算法,即在現(xiàn)場圖像中將待識別目標人工框定出來并作為模版,再通過模板與新的圖像各個區(qū)域的相似度計算,對新的圖像中的目標進行匹配。這種方法受限于拍攝點的定位和拍攝角度的精度,準確率和穩(wěn)定性難以保證[4]。本文以檢測準確性較高的Faster R-CNN為基礎,對模型結構進行改進,使模型可以動態(tài)地適應部件大小差異,同時充分考慮變壓器部件位置的關聯(lián)性,加入相對位置特征,進一步提高部件檢測準確率。
1? 用于變壓器部件檢測的改進Faster R-CNN
Faster R-CNN分為三個模塊,即特征提取、建議框(proposal)生成和類別與位置檢測。綜合考慮準確率要求和數(shù)據(jù)集規(guī)模,特征提取部分的卷積神經(jīng)網(wǎng)絡(即Stage1-Stage5)采用ResNet-50結構。輸入的圖像首先通過ResNet-50網(wǎng)絡被轉化為一張?zhí)卣鲌D(feature map),然后將特征圖輸入?yún)^(qū)域建議網(wǎng)絡(Region Proposal Network,RPN),生成n個建議框,每個建議框包括2個概率值(分別代表建議框內包含和不包含目標物體的概率)以及4個代表建議框位置的坐標值。最后,將特征圖和從n個建議框中篩選出來的個建議框都輸入興趣區(qū)域池化層(Region of Interest pooling,RoI pooling)、全連接層(Full Connect,F(xiàn)C)以及softmax分類器或bounding-box回歸器,從而輸出每個建議框的k+1個概率值(代表包含k類目標的概率和只包含背景的概率)以及4k個坐標值(代表k類目標的坐標)[5]。
為了實現(xiàn)變壓器部件的準確檢測,在Faster R-CNN的基礎上提出改進模型,如圖1所示。改進主要包括兩部分:一是將特征提取模塊Stage2輸出的淺層特征圖也輸入類別與位置檢測模塊,以提升對小目標的檢測效果,并與原有的Stage5輸出的深層特征圖配合,動態(tài)地適應檢測目標大小的變化;二是在建議框生成和類別與位置檢測模塊中都引入了部件之間的相對位置信息作為特征,并采用隨機森林(Random Forest,RF)模型對概率和坐標進行修正,以提高部件檢測的準確性[6]。
2? 訓練和檢測過程
訓練過程分為兩部分。一是對神經(jīng)網(wǎng)絡部分進行訓練,主要在所采用的四步訓練法基礎上進行修改,以適應雙特征圖;二是對隨機森林模型進行訓練,主要對相對位置特征出現(xiàn)各種缺失的情況進行訓練,以提高模型對缺失值的魯棒性。
訓練完成后,利用改進FasterR-CNN進行變壓器部件檢測的過程如算法1所示,帶星號部分將在下文進一步解釋。
算法1 變壓器部件檢測算法
Input:一張圖像,,置信度閾值*
Output:一個集合,包含k1個,每個包括一個部件類別的1個概率值和4個坐標值
將一張圖像輸入ResNet-50,生成特征圖1和特征圖2
初始化集合為空集
While的元素數(shù)目 將特征圖1輸入建議框生成模塊*,生成n1個建議框 將n1個建議框、特征圖1和特征圖2輸入類別與位置檢測模塊*,生成n1×k個box(忽略背景類別),每個box包括一個類別的1個概率值和4個坐標值,所有box形成集合boxes 刪除集合boxes中類別已在出現(xiàn)過的box 將boxes中概率值最大的box作為 If的概率值<置信度閾值then Break Else將加入集合 End if End while 帶星號部分解釋如下:(1)變量n1決定了輸入類別與位置檢測模塊的建議框數(shù)量;置信度閾值決定了輸出的的概率閾值;(2)集合里的每個都框定了一個圖像中被檢測到的變壓器部件,包括其類別及概率值;(3)每個建議框在建議框生成模塊和類別與位置檢測模塊中的相對位置特征由該建議框和各個的坐標生成。 3? 算例分析 3.1 算例情況 選取某220kV變電站2016—2017年的2000張主變壓器巡檢圖像作為實驗數(shù)據(jù)集,每張圖像的分辨率均為800(寬)×600(高),部分圖像如圖2所示。根據(jù)所采用的數(shù)據(jù)集中變壓器的型式,選取變壓器的本體儲油柜、#1-#9散熱器組、#10-#18散熱器組、本體瓦斯繼電器、本體呼吸器、有載開關呼吸器共6類尺寸差異較大的部件進行檢測,并對所有圖像中6類部件的位置進行標注。采用10倍交叉驗證方法進行實驗,再將所有測試圖像匯總進行統(tǒng)計。 對于改進FasterR-CNN(簡稱FRCNN-improved)模型的神經(jīng)網(wǎng)絡部分,被選擇輸入類別與位置檢測模塊的建議框數(shù)目(即n1)在訓練和測試過程中分別設置為2000和300,而RPN中采用尺寸分別為82、322、1282和5122的四種anchor,每種尺寸的anchor均包括2:1、1:1和1:2三種長寬比。同時通過參數(shù)尋優(yōu),設置模型的學習率為0.003,每批訓練圖像數(shù)量為8張,訓練步數(shù)為50000步,由于數(shù)據(jù)集的每張圖像都只包含一臺主變壓器,即每類部件最多只有1個,因此在所有模型中,對于同一張圖像的每類部件,都只取1個概率值最高的檢測框作為最終檢測結果。評價變壓器部件檢測準確性的指標之一,采用目標檢測任務中常用的指標mAP。雖然mAP能比較全面地評價模型準確性,但其計算比較復雜,需要通過多次改變置信度閾值獲得多組查準率和查全率進行計算,工程意義不夠明確。為了更直觀地反映模型在實際工程應用中的效果,經(jīng)過參數(shù)尋優(yōu),設定置信度閾值等于0.6,并統(tǒng)計各類部件的查準率(記為P)和查全率(記為R),以及總體查準率和查全率。另外,統(tǒng)計每張圖像的平均檢測耗時,采用Nvidia GeForce GTX 750 Ti GPU 進行訓練和測試。另外,在判斷某類部件的檢測框是否正確標注時,采用檢測框與ground-truth box的交集和并集的面積比(Intersection over Union,IoU)進行判定。當IoU>0.5時,認為檢測框正確框出了部件。 3.2 算例結果 采用訓練集圖像對上述各種模型進行訓練后,對測試集圖像進行部件檢測,對于mAP和總體的查準率、查全率,總體查準率和查全率均高于94%??梢?,對于FasterR-CNN模型結構的兩點改進,都有助于提高模型的檢測準確性。由于在檢測過程中需要通過迭代逐次生成final_box,故FRCNN-improved的檢測耗時最多,但因為主變壓器的巡檢是定期任務,對實時性的要求不高,而每張圖像2.1s的效率已明顯高于人工對目標進行標定的效率,故模型可以滿足實際工程的需求。 參考文獻 [1] 傅世權.大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術在電力企業(yè)中的應用探討[J].信息記錄材料,2019,20(11):128-129. [2] 湯偉,楊鋮.基于數(shù)據(jù)挖掘技術的電力調度系統(tǒng)設計與實現(xiàn)[J].自動化與儀器儀表,2019(5):55-58. [3] 陳俊星.基于數(shù)據(jù)挖掘技術的電力設備狀態(tài)評估[D].北京:北京交通大學,2019. [4] 霍曉峰.數(shù)據(jù)挖掘技術在電力系統(tǒng)故障診斷中的應用[D].北京:華北電力大學,2017. [5] 朱克東.智能電網(wǎng)環(huán)境下電力數(shù)據(jù)挖掘研究[D].南京:東南大學,2018. [6] 皇甫漢聰,肖招娣.基于Apriori算法的電力系統(tǒng)二次設備缺陷數(shù)據(jù)挖掘與分析研究[J].電子設計工程,2019,27(5):6-9,15.