曾 軍,王東杰,范 偉,劉濱濱,趙洪山
(1.國網(wǎng)河北省電力有限公司,河北 石家莊 050000;2.國網(wǎng)河北省電力有限公司保定供電分公司,河北 保定 071000;3.華北電力大學,河北 保定 071000)
早在20 世紀70年代,就有國外學者開始研究紅外熱成像的識別,并首先將其應用于軍事領域[1]。我國雖然起步較晚,但從90年代開始就應用于各個領域。在2008年,國家頒布了《帶電設備紅外診斷應用規(guī)范》[2],各個科研院所逐步發(fā)掘紅外熱成像識別在電氣領域的應用。相比于可見光圖像,紅外圖像具有對比度低、信噪比低和灰度級少的特點[3]。所以可見光圖像和紅外圖像的識別方法有較大的差異。目前,國內(nèi)外關于紅外熱成像目標檢測和識別的研究主要包括:基于圖像特征的分類識別和基于模板匹配的目標識別[4]。其中,基于圖像特征的分類識別目前主要是基于深度學習[5],而基于模板匹配的目標識別主要是通過圖像分割、對比和增強等方法,對圖像進行處理。本文屬于第二種方法。
關于圖像分割的方法,文獻[6-9]分析了關于常見的Sobel,Prewitt,Roberts 等多種邊緣檢測算法,同時提出通過K-means 聚類提取圖像的邊緣,但是只通過K-means 聚類會導致提取的部分失去圖像細節(jié),為接下來的圖像識別帶來問題。文獻[10-13]通過K-means 分割圖像,并用形態(tài)學進行濾波,保留主要成分,但是形態(tài)學濾波對于有些圖像可能會導致過度切割,最終可能會導致識別失敗。關于圖像匹配的算法,文獻[14]主要通過SIFT(scale invariant feature transform)算法實現(xiàn)對快速移動物體的識別,但是SIFT 算法相比于SURF 算法計算復雜度高,計算速度慢,會影響識別的實時性。文獻[15]采用SURF 匹配算法和RANSAC(random sample consensus)篩選算法,將提取的圖像特征通過篩選,提高SURF 算法的魯棒性,但是此方法難以用于單個圖像中的多目標匹配問題。
本文基于紅外熱成像針對電氣設備三相組件進行識別,如電壓互感器、絕緣子串、絕緣套管等組件都屬于三相組件,最終實現(xiàn)這類組件的故障定位。針對前文中出現(xiàn)的過度分割、計算時間較長、普適性較低的問題,本文提出先通過改進K-means 聚類和形態(tài)學的結合,準確提取紅外熱成像中的高溫區(qū)域,因為電力組件的溫度即使在正常情況下也會明顯不同于環(huán)境溫度[16],所以其中一般包括了三相組件、干擾及噪聲的紅外熱成像。通過SURF 算法,識別紅外高溫區(qū)域中的電力設備某一相組件,再通過感知哈希算法,對比圖像中被分割出的其他區(qū)域,最終確定三相的位置。算法具有一定的普適性,不只是適用于某一種電力設備,為基于電力設備的三相組件溫度故障診斷提供技術支持。
電力設備三相組件的溫度即使在正常情況下,較環(huán)境溫度也會高出很多。所以通過紅外攝像頭采集的紅外熱成像中,電力設備的三相溫度一般明顯偏高,以此作為分割圖像的實際基礎。但是因為目前電力設備的紅外熱成像主要通過攝像頭采集,所以圖像是基于RGB(red green and blue)顏色模型[17]。每一個像素點都是由紅(R)、綠(G)和藍(B)按照不同的比例混合而成,但是像素點之間的色相差異無法體現(xiàn)[18]。而L*a*b 顏色模型(文中簡稱Lab)模型則是以數(shù)字化方式描述人類視覺感應的顏色系統(tǒng),其理論上包括了人眼可以看見的所有色彩的色彩模式,是對傳統(tǒng)RGB 模型的補充。Lab 用3 組數(shù)值表示色彩[19]。
1)L:亮度數(shù)值,0~100,數(shù)值越高亮度越高;
2)a:表征紅色和綠色,當顏色從紅色變化到綠色時,a 值的變化范圍為+127~-128;
3)b:表征黃色和藍色,當顏色從黃色變化到藍色時,b 值的變化范圍為+127~-128。
本文以某三相電壓互感器的紅外熱成像為例,通過灰度直方圖可以明顯看到。RGB 模型各個分量的直方圖灰度分布的區(qū)分度并不大,灰度主要集中在低頻部分。如圖1(b)、1(d)、1(f)所示。Lab 模型的灰度分布模型中的a 分量和b 分量的圖像反差明顯,直方圖呈現(xiàn)互補的趨勢,如圖2所示。表明可以利用a 和b分量的疊加對圖像進行分割。本文利用a 分量和b 分量組成的二維圖像數(shù)據(jù)空間(以下簡稱ab 分量)作為三相識別定位的顏色空間對圖像進行聚類分割。
圖1 某紅外圖片的RGB 各分量的圖像及直方分布圖Fig.1 Image and histogram of RGB components of an infrared picture
圖2 某紅外圖片的a 和b 分量的圖像及直方分布圖Fig.2 Image and histogram of the a and b components of an infrared image
1.2.1 基于ab 分量模型的K-means 聚類圖像分割
K-means 聚類算法不需要訓練樣本,是一種無監(jiān)督的統(tǒng)計方法。大致步驟如下:
1)先從給定像素大小為N的樣本空間數(shù)據(jù)集中選取K個點作為初始聚類中心;
2)計算各個圖像數(shù)據(jù)樣本到每個初始聚類的距離,把圖像數(shù)據(jù)樣本合并到離它最近的那個聚類中心所在的類;
3)計算新形成的每個類的圖像樣本數(shù)據(jù)對象的平均值來得到新的聚類中心;
4)重復以上步驟,直到相鄰兩次的聚類中心沒有任何變化,說明樣本調(diào)整結束,聚類準則函數(shù)達到最優(yōu)。
傳統(tǒng)的K-means 聚類將全部的數(shù)據(jù)集作為樣本,從中任取K個像素點作為初始聚類中心。并采用歐氏距離(Euclidean distance),計算各個點到聚類中心的距離[20]。為提高圖像識別算法的實時性,任取整個像素矩陣N中10%的數(shù)據(jù)作為樣本n,并在n中隨機取K個點作為初始聚類中心。同時改用曼哈頓距離(Manhattan distance)描述數(shù)據(jù)個體之間的相似度的距離。它是標準坐標系上的絕對軸距總和, 結果是兩個坐標差的絕對值之和。
1)將M×N的a分量和b分量矩陣,通過合并變換,變?yōu)?×MN的矩陣,即用每個像素點的a分量值和b分量值作為該像素點的坐標(X,Y);
2)任取整個像素矩陣中10%的數(shù)據(jù)作為樣本n,從中隨機取k個點做為聚類中心,初始聚類中心{P11,P21,P31,…,Pk1};
3)假設共迭代r次(r∈R),在第r次迭代中按照下列準則將每個像素賦值給k類之一,即:
式中:Xijr,Yijr為第r次迭代中屬于類j(j=1,2,3,…,k)的第i個像素的橫、縱坐標;P(X)rj、P(Y)rj為第r次迭代中的類j的聚類中心;Qjr為第r次迭代賦給類j的像素集合。
4)更新聚類中心Pjr的方法為:
式中:Nj為Qjr中的像素點總個數(shù)。
5)滿足下述條件則停止,否則繼續(xù)迭代下一次。
式中:ε為計算精度。
通過上述的K-means算法對電氣設備組件的紅外圖像進行初步分割,得到圖像中溫度較高的區(qū)域。電力設備組件即使在正常情況下,溫度也會不同于環(huán)境溫度。所以,本文提取的高溫區(qū)域,會包含電力設備的故障相、正常相以及其他噪聲及干擾區(qū)域。
1.2.2 形態(tài)學膨脹處理
如果只是通過K-means切割圖像將會出現(xiàn)過度切割的現(xiàn)象。以某包含三相電壓互感器的紅外圖像為例,對其應用上述的K-means 切割算法,圖3中的一個電壓互感器在圖4中出現(xiàn)了過度的切割,被分割為圖4中的區(qū)域5、6 和7。這將不利于后期的識別。
圖3 原圖Fig.3 Original image
圖4 過度分割Fig.4 Over-segmentation
應用形態(tài)學主要是圖像濾波和提取圖像邊緣。本文通過形態(tài)學中的膨脹計算,把背景周圍的背景點合并到物體中,防止在K-means 算法中出現(xiàn)過度切割的問題。下面給出膨脹方法灰度形態(tài)學變換過程。
式中:A為待處理的圖像,B為結構元素。式(5)表示A用B來膨脹,先對B做關于原點的映射,再將其映射平移x,這里A與B映射的交集不為空集。膨脹計算可以增加算法的魯棒性,在膨脹計算后保障被識別區(qū)的完整性。雖然,噪聲同樣也被放大,但是通過后面的圖像配準和識別可以基本忽略噪點的影響。
上述1.2 中的算法作為對紅外熱成像預處理,在保證計算速度和分割精度的情況下,分割出紅外熱成像的高溫區(qū)域,其中包含了故障相元件和正常相元件以及噪聲及干擾區(qū)域。
已分割的高溫區(qū)域既包括三相組件,同時也包括噪聲區(qū)域和干擾區(qū)域。本文通過SURF 算法提取出其中和該組件可見光圖像相似度最高的區(qū)域,實現(xiàn)單相識別。SURF 是一種局部特征,具有旋轉(zhuǎn)、尺度不變性,對光照變化和仿射、透視變換也具有較強的魯棒性[21]。與SIFT 算法相比,SURF 加入了Hessian 近似矩陣和積分圖像,降低了計算的復雜度,提高了速度。SURF 算法在積分圖像的基礎上,利用Hessian 算子進行特征點的檢測與求取。
式中:
為提高運算速度、簡化計算,將上式中的高斯二階濾波器轉(zhuǎn)換為9×9 的盒子濾波器,并用它作為最小尺度空間對圖像進行濾波和斑點檢測。化簡后,Hessian 近似矩陣Happr的行列式可以表達為:
式中:ω為權重系數(shù),ω≈0.9。Dxx,Dyy,Dxy表示9×9簡化模板和圖像卷積的結果。根據(jù)式(6),記錄圖像任意點處響應的計算結果值,得到在某一尺度σ下的響應值。使用不同尺寸的模板,可以形成多尺度斑點響應的金字塔圖像,便可以在此基礎上進行斑點響應極值點的搜索。
為了確保圖像的旋轉(zhuǎn)不變性,為每個特征點分配一個主方向。首先以特征點為中心,計算半徑為6s(s為特征點所在的尺度值)的圓形鄰域內(nèi),對圖像進行Haar 小波響應運算。之后使用σ=2s的高斯加權函數(shù)對Haar 小波響應運算響應值進行高斯加權。遍歷整個圓形區(qū)域,其中最大Harr 響應累加值所對應的方向為特征點主方向。
確定SURF 的特征點描述算子,同樣使用Haar計算小波響應。首先在主方向上將以20s為邊長的矩形分為4×4 的子塊,每個子塊利用尺寸為2s的Haar小波模板進行響應值計算。得到如下結果表示每個區(qū)域的描述符V:
式中:dx和dy分別為在水平和垂直方向上的Haar 小波響應值。由此可獲得由 4×4 個子區(qū)域構成,4×(4×4)=64 維的SURF 特征的描述符,并歸一化處理。
特征點匹配,就是通過某種相似性度量建立兩類圖像特征之間一一對應關系。特征點匹配的準確性影響圖像配準精度[22]。為了合理增加兩個圖片之間的匹配點個數(shù),提高算法的魯棒性。本文采用基于拉普拉斯響應正負號的雙向匹配策略對SURF 描述子進行匹配。匹配條件如下:
式中:tr(HiA)為A圖像的Hessian 矩陣的跡;tr(HjB)為B圖像的Hessian 矩陣的跡。通過分別遍歷A和B的Hessian 矩陣的跡的符號,選取雙方中所有和對方符號相同的特征點,作為匹配的特征點。
通過上述SURF 算法,將分割出的區(qū)域和一相電氣設備元件的可見光圖像進行特征點匹配,找出被分割圖像各個區(qū)域中匹配特征點最多的區(qū)域,以此確定被識別的電氣設備三相組件中的某一相。
將上述算法結合感知哈希算法(perceptual hash algorithm),將電氣設備組件的一相定位擴充為三相,以提取被識別圖像中的某類組件的三相位置區(qū)域。感知哈希算法是一種生成圖像“指紋”字符串的算法,目前已廣泛應用音頻、圖像、視頻和生物識別[23],具體步驟如下:
1)將圖片縮放到8×8 的像素圖片
2)將圖片轉(zhuǎn)換為灰度圖片
式中:G代表灰度圖片;R、G、B分別代表圖像RGB模型的各個分量;
3)壓縮圖片
通過離散余弦變換(discrete cosine transform,DCT)壓縮圖片,將圖片從空域轉(zhuǎn)換到頻域,變換公式為:
式中:f(i,j)為原始圖像;F(u,v)是DCT 變換后的系數(shù);N為壓縮后像素矩陣的大小,c(u)和c(v)是補償系數(shù);
4)縮小DCT
因為DCT 矩陣的特點是能量主要集中在左上角,所以保留左上角8×8 的矩陣;
5)生成圖像“指紋”
將8×8 的DCT 矩陣轉(zhuǎn)化為哈希值,進一步縮小DCT 矩陣。規(guī)則如下:
式中:F(i,j)為8×8 的DCT 矩陣中的各個元素;avg(DCT)為DCT 矩陣的平均值。
6)對比指紋
通過計算漢明距離反映兩個圖像之間的對比度,當漢明距離小于10 時被認為圖像非常相似。漢明距離計算公式[24]:
式中:HP1,HP2分別代表兩個圖像樣本的感知哈希算子。h1和h2分別為64bit 的哈希值。
本文通過2.1 和2.2 中的SURF 算法,可以確定分割出的每個區(qū)域和可見光圖像之間的匹配特征點。但是,算法注重盡可能增加特征向量點,但沒有對其進行甄別,所以只篩選出和可見光圖像匹配最多的紅外區(qū)域。假設可見光圖像為某一項電氣設備,則會挑選出與其最相似的部分,這部分可確定為三相設備中的某一相。一般對于電力設備而言,三相設備在同一張熱成像中只是大小不同,但是角度、形態(tài)基本相同。通過對比已選出的區(qū)域和其他區(qū)域的哈希值,篩選出另外兩相,最終確定三相區(qū)域。本文整體算法大致流程如圖5所示。
圖5 算法總流程圖Fig.5 Algorithm general flow chart
本文針對電氣設備的紅外圖像進行三相的識別和定位,為了更好地驗證本文方法的有效性,選取了多組圖片進行測試。測試環(huán)境:處理器:Intel(R)Core(TM) i5-5200U CPU @2.20GHz(4 核CPU);內(nèi)存:4096MB RAM;操作系統(tǒng):Windows 10;Matlab 2017a。
首先設計實驗,體現(xiàn)本文K-means 算法的分割效果和時間。選取一張三相高壓電壓互感器紅外熱成像作為樣本進行測試,測試采用歐氏距離和通過全局隨機取初始聚類中心的傳統(tǒng)K-means 算法,以及本文的算法。每個方法每次計算時,重復聚類10 次以防止出現(xiàn)局部最優(yōu)。每種方法共計算10 次。測試結果如圖6所示。
通過圖6可知本文對于分割圖像的方法計算速度明顯提高。
圖6 兩種算法計算時長Fig.6 The length of time required for the two algorithms to calculate
如1.2.2 中所述,通過形態(tài)學膨脹計算,可以有效避免過度切割的問題。本文將K-means 切割和形態(tài)學膨脹計算結合。從分割效果來看,本文的算法更有利于避免出現(xiàn)過度分割,將過分割率作為分割精度,結果如表1所示。
表1 兩種算法的分割精度Table 1 Segmentation accuracy of two algorithms
過分割率越低說明越接近于正確的分割結果,發(fā)生嚴重過度分割的概率越低。由此可見本文的分割算法精度更好。效果如圖7所示。
相比圖4,將圖4中的區(qū)域5、6 和7 合并為圖7中的區(qū)域7,形成了完整的互感器區(qū)域,有效避免了過度切割的問題,這將有利于后面的識別。
確定了正確的分割區(qū)域后,進行三相的識別和定位。將圖分割出來的各個區(qū)域和對應的可見光圖片,通過本文2.2 的算法進行匹配,如圖8所示。
圖8 SURF 特征點匹配Fig.8 SURF feature point matching
圖7中共分割出39 個區(qū)域,并按照圖7進行標號。每個區(qū)域分別和圖8(c)匹配后,結果如表2所示。
表2 特征點匹配結果Table 2 Feature point matching result
通過本文的算法,圖像匹配點數(shù)明顯提高,這會進一步提高系統(tǒng)可靠性。但是,依然存在噪聲干擾的問題。例如,圖7中的區(qū)域31 并不是要被識別的區(qū)域,但是依然出現(xiàn)了匹配點。所以為了避免這種情況,本文結合感知哈希算法提高識別的準確度。選取匹配點數(shù)最多的圖7中的區(qū)域18,和其他區(qū)域?qū)Ρ裙V?,得到如圖9所示的結果。
圖9 各區(qū)域間漢明距離Fig.9 Hamming distance between regions
區(qū)域7,區(qū)域13 和區(qū)域18 和區(qū)域18 的哈希值的漢明距離最小,說明區(qū)域7、13 和區(qū)域18 最相近,而這3 個區(qū)域就是電氣設備的三相,如圖10所示。
圖10 最終識別效果Fig.10 Final recognition effect
為驗證算法的可靠性和普適性,又對其他的電氣設備紅外熱成像進行了三相組件的識別定位,如圖11所示。結果表明,本文的三相定位效果較為滿意。
圖11 其他類型設備三相的識別定位Fig.11 Three-phase identification and positioning of other types of equipment
本文針對紅外熱成像信息少,噪聲多等特點,以電氣設備的紅外圖像為對象,進行三相設備的識別和定位。主要分為兩步,首先是進行圖像的分割,因為電氣設備三相組件發(fā)熱的原因,所以通過將改進的K-means 算法和形態(tài)學相結合分割圖像,提取其中包含了三相設備的高溫區(qū)域。此算法在保證分割效果的同時兼顧了實時性。之后,采用SURF 算法和可見光圖片進行匹配,選出匹配點最多的區(qū)域后,在通過感知哈希算法計算各個區(qū)域之間的漢明距離,最相近的3 個區(qū)域即為電氣設備的三相。通過實驗,本算法不只是針對某一種電氣設備,而是具有一定的普適性,得到了較為滿意的結果。同時為單一紅外熱成像的多相似目標識別提供了思路。