洪向共,周世芬
(南昌大學 信息工程學院,南昌 330031)
隨著光伏產業(yè)的迅速發(fā)展,光伏新能源在各個方面正扮演越來越重要的作用,而光伏電站的運行很大程度上取決于光伏面板的狀態(tài).近年來,紅外成像技術由于其特殊的成像原理與物體的熱輻射有關,在軍事和民用等領域得到了廣泛的應用[1].同時將紅外圖像監(jiān)測應用到光伏電站監(jiān)測也得到了廣泛的使用,因此借助紅外技術和光伏面板表面發(fā)熱的特點,可以很好的進行光伏面板的檢測.而且,利用紅外圖像的圖像分割技術對光伏面板進行處理,確定故障設備已得到廣泛應用[2],但是紅外圖像與可見光圖像相比,紅外熱成像系統(tǒng)通常具有低對比度和分辨率,不利于人體觀察,分析等缺點,以及紅外圖像中的信息容易被噪聲污染而帶有隨機噪聲.而且光伏面板和周圍背景物體的熱量交互會造成分割困難,難以分割紅外圖像.因此如何正確、快速地分割紅外圖像中的光伏面板對于接下來光伏面板的故障識別非常重要.
為了解決上述問題,針對以上紅外圖像的特點,國內外學者提出了許多的分割方法,大致可以分為:基于閾值的分割方法[3],基于邊緣檢測的分割方法[4];基于區(qū)域的分割方法;基于聚類的方法[5-7];基于活動輪廓的方法[8]等.閾值分割方法中,Otsu 閾值方法是較為經典的一種分割方法,其中文獻[9]提出了改進的二維Otsu 算法和自適應遺傳算法相結合的方法,提高了閾值查找速度和紅外圖像的分割效率,但是不適合直方圖為單峰或背景較為復雜的紅外光伏圖像;而文獻[10]是一種基于邊緣檢測和Otsu 相結合的分割方法,但是該方法沒有考慮到紅外圖像的空間信息,且不適合直方圖是單峰的圖像;文獻[11]則通過將區(qū)域生長和FCM 聚類算法相結合,對紅外圖像進行分割,提高了分割速度和精度;文獻[12]是基于主動輪廓的方法.該方法適應對象的拓撲結構,在圖像分割中得到了廣泛的應用.但在紅外圖像中,背景區(qū)域和目標區(qū)域都是不均勻的,兩者之間沒有明顯的強度差異;文獻[13]則通過增強紅外圖像對比度和修改k-means 聚類所使用的距離公式對圖像進行分割.文獻[14]提出了一種基于粒子群優(yōu)化算法的模糊C均值算法,可以提高圖像分割的準確性和魯棒性;文獻[15]利用圖像相似度來校正傳統(tǒng)FCM的歐幾里德距離作為相似準則的數據點,進而修改目標函數.由此可以知道,不同的分割方法有不同的特點,還沒有統(tǒng)一的分割方法來對紅外圖像進行處理.
針對紅外光伏圖像的特點,本文引入模糊C均值聚類方法.模糊C均值(FCM)聚類是一種廣泛用于圖像分割的經典方法,但是它有一些缺點,例如不考慮空間信息或對噪聲敏感,聚類數和中心初始化是隨機的,影響分割精度[1].因此針對FCM 聚類算法的缺點,在FCM 算法的基礎上,本文利用直方圖確定聚類算法的初始聚類中心,并通過用高斯核函數代替歐式距離,同時將鄰域空間信息引入到目標函數中,推導出新的FCM 目標函數,將該方法用于紅外圖像分割.
模糊C均值(FCM)算法是最傳統(tǒng)和經典的圖像分割算法之一.在本節(jié)中,我們將簡要介紹模糊C均值算法.模糊C均值聚類算法由Dunn 首次提出,之后被Bai XZ 改進[16],該算法是一種迭代聚類算法,廣泛應用于醫(yī)學圖像、工業(yè)圖像等分割.
標準FCM 聚類算法是通過使用迭代搜索聚類中心和像素與中心之間的隸屬度關系來計算目標函數的最小值.因此FCM 算法的目標函數可以寫成
其中,n是像素數目,c表示聚類中心數,表示i相對度,Xk表示聚類中心.隸屬度的約束條件為于類k的隸屬度,m表示模糊權重系數,Xi表示像素灰
因此求解聚類問題變成了一個非線性優(yōu)化問題,要求解在約束公式(2)下的目標函數最小值,可通過引入拉格朗日乘子,將方程變成如下:
文獻[17]中提出了基于核函數的FCM 聚類算法,利用核函數代替FCM 聚類算法中的常用的歐式距離公式,本小節(jié)將對KFCM 聚類算法的原理進行介紹和推導,為接下來的本文提出的算法做準備.
核聚類方法可以通過非線性變換放大類之間的特征差異,非線性變換將輸入模式空間映射到高維特征空間.隨后,聚類過程在高維空間中進行.在下文中,高維特征空間中的輸入數據Xi,i=1,2,3,…,N的圖像由下式表示:Φ(Xi),i=1,2,3,···,N,其中Φ(Xi)表示非線性映射功能.典型的核函數是多項式核函數:K(X,Y)=Φ(X)?Φ(Y),且如果滿足Mercer核條件時,可以不用知道映射函數,輸入空間的內積運算就可用核函數代替歐幾里德距離進行聚類計算.因此在FCM 聚類目標函數中使用核函數,得到如下公式:
其中,
本文采用的是高斯核函數作為聚類核函數,有:
將式(6)代入到式(4)和(5)得到式(7):
在滿足約束條件(2)的情況下,引入拉格朗日乘子對目標函數求極小值,將式(3)和(7)結合成式(8),并對其求隸屬度迭代函數和聚類中心迭代函數.
通過在函數J中對uik和Xk分別求其偏導數,并令偏導數等于零即:
可以分別得到隸屬度迭代函數和聚類中心迭代函數為:
本小節(jié)將會在核FCM 聚類算法的基礎上提出一種新的結合空間鄰域像素信息的聚類算法.方法流程圖如圖1所示.
圖1 論文方法流程圖
與此同時,由文獻[16]中所提到距離權重參數njk可知,已知目標的可能區(qū)域和目標的近似質心情況下,就可以構造一個權重來克服這個問題.如果一個像素接近目標的質心,那么它應該具有高度隸屬于目標的隸屬度.因此,隨著像素與目標近似質心距離的減小,各位置處的權值增大.
(Xj,Yj)為像素j在可能區(qū)域的坐標;d是目標可能區(qū)域對角線的長度,本文取圖像對角線的長度;(X0,Y0)是目標√近似質心的坐標.
目標函數如下:
可以看出,隨著k的增加,nik趨于減小.為了獲得目標函數J的極值,uik將隨著nik的值的減小而趨于增加.因此,屬于目標的像素點的隸屬度增加,這就是我們增加的權重可以克服由強度不均勻性引起的分割困難的原因.
鄰域像素之間具有相似的灰度值,一般而言,如果這些像素之間的灰度差異較小,則這些像素更可能屬于同一類別,這種鄰域像素關系在聚類過程中非常重要,而前面的FCM 聚類算法和核FCM 聚類算法都沒有考慮到鄰域像素是相互影響信息的.如果鄰域像素和聚類中心的灰度差異很大,則像素應該獲得較小的權重,以減少其對聚類的影響.另一方面,像素應該獲得大的權重.而高斯函數的特征符合要求.表達式被描述為
其中,Xj表示像素Xi的鄰域像素,Xk表示聚類中心,NR表示像素Xi的鄰域窗口的大小.
將其結合到式(8),得到如下
式中,α是控制鄰域像素對聚類的影響.由式(6)可知,式(14)可轉換成
對式(15)通過使用拉格朗日乘子最小化,和對函數J中對uik和Xk分別求其偏導數,獲得新的隸屬度函數和聚類中心函數如下:
其中,通過 α來控制鄰域像素對隸屬度和聚類中心的影響.
根據紅外光伏圖像可知,圖像大致分為兩個區(qū)域,光伏面板和背景區(qū)域,所以能通過直方圖觀察圖像的峰峰值,獲得初始聚類中心,由文獻[18]可知,通過對直方圖進行平滑濾波處理,可得到較為清晰明顯的紅外圖像直方圖,如圖3所示為圖2的直方圖及平滑濾波之后的直方圖.其中橫坐標為灰度值,縱坐標為像素個數.
然后通過文獻[18]中的方法,也就是式(18)和(19)求取峰峰值:
上式中的hd(i)為平滑后的直方圖,i是灰度值,從圖中可以看出,有很明顯的兩個波峰,將其作為聚類算法的初始聚類中心值.
由于改進的模糊核C均值聚類分割獲得的二值化圖像在其邊緣附近會有小區(qū)域,導致過分割,因此本小節(jié)主要是對改進的模糊核C均值聚類分割獲得的獲得的二值化圖像進行小面積去除,而由圖2 可知,光伏面板是屬于最大的連通區(qū)域,因此可直接對二值圖像求取圖像的最大連通區(qū)域,將其做為光伏圖像的目標區(qū)域,然后將剩余區(qū)域設置為背景,獲得全新的二值圖像.
本文的完整的分割算法過程如下:
步驟1:利用直方圖確定聚類算法的初始聚類中心.
步驟2:根據式(16)和(17)分別更新隸屬度矩陣和聚類中心.
步驟3:判斷是否達到迭代條件,達到就停止,否則繼續(xù)迭代.
步驟4:根據最終獲得的隸屬度矩陣對每個像素進行分類,實現(xiàn)圖像的分割.
步驟5:對圖像進行后處理,去除小面積區(qū)域,獲得全新二值圖像.
圖2 灰度圖
圖3 圖像直方圖
為了驗證本文算法的分割效果,對紅外光伏面板圖像進行Matlab 仿真實驗.實驗中選用的大量圖像進行實驗,本文選用了幾幅圖像進行說明和驗證,同時算法中模糊權重系數m=2,聚類數目C=2,迭代誤差為1e-5,且根據文獻[19]和大量實驗可知,高斯核函數的系數設為σ=6.5,鄰域窗口為3×3較為合適以及參數nik中的中心點(X0,Y0)定為圖像的中心點.
本文進行實驗的圖像數據是通過無人機航拍獲得的,紅外光伏圖像的分辨率為240×320.同時評估分割算法的好壞,本文將分割結果與手動分割出來的區(qū)域進行對比,對本文算法進行評估.
而為了更好地評價不同算法的準確率,本文采用定量計算的方法進行評估,選用的評估標準為:查準率(precision,P),查全率(recall,R).
對于圖像區(qū)域提取來說,集合S1為算法得到的正確像素點(包括邊界點),集合S2為算法提取區(qū)域的全部像素點,集合S3為人工提取區(qū)域的像素集合.式中P的值越大,說明出現(xiàn)錯分割的區(qū)域更小,同時R值越大,說明分割出來的紅外光伏面板區(qū)域也越大.因此,兩者的值是越大越好,說明算法分割的效果好.
本文采用Otsu 算法、文獻[20]算法與KFCM(模糊核C均值聚類算法)進行測試和比較,驗證算法的性能.紅外光伏面板圖像分割結果如下圖所示,文中選用了3 幅圖像進行分割.分割結果如圖4所示,其中圖4(a)是紅外光伏面板圖像原圖的灰度圖,圖4(b)是紅外光伏面板圖像的手動切割圖,圖4(c)是Otsu 算法的分割結果圖,圖4(d)是文獻[20]算法的分割結果圖,圖4(e)是KFCM(模糊核C均值聚類算法)聚類算法的分割結果圖,圖4(f)是本文算法的分割結果圖.
從圖4中可以看出,與圖4(a)中的原圖相比,Otsu算法和文獻[20]算法的分割結果普遍出現(xiàn)了較為嚴重的錯分割結果,且KFCM(模糊核C均值聚類算法)算法也出現(xiàn)了過分割和欠分割的情況,而本文提出的算法的實驗結果分割結果較為理想,符合要求.
而且通過表1中的數據可以知道,雖然有一幅圖像的查全率(R)比其它三種算法低,但由于圖像背景和目標的灰度值太相近,才造成欠分割,且查全率(R)的值相差不大,而查準率(P)比其它三種算法高出很多,這說明本文的算法出現(xiàn)的在原圖中分割出來的區(qū)域更多,錯分割情況較少,分割結果也較為準確,同時本文中其它圖像的查全率(R)和查準率(P)都比其它的三種算法高,因此綜合考慮圖像的分割效果和表中的數據可知,本文提出算法相比其它的三種算法分割效果更好,出現(xiàn)錯分割的情況少,更符合圖像手動分割的結果.
圖4 實驗結果圖
本文通過對紅外光伏面板圖像特征的分析,提出了一種基于改進模糊C均值聚類的分割方法,該方法利用直方圖的特點確定聚類的初始中心,同時在傳統(tǒng)的模糊C均值(FCM)的基礎上,用高斯核函數來替換原來的歐式距離,而且考慮到鄰域像素和像素之間的關系,將其引入到FCM中,改變聚類算法的目標函數,使其能更好的考慮到領域信息.實驗結果表明,本文提出的算法分割效果相比Otsu 算法、k-means 算法和KFCM(模糊C均值聚類)算法更接近手動分割的目標區(qū)域,有效的改善了分割效果,具有較強的自適應性和魯棒性,但是本文算法對于圖像中目標和背景灰度值相近的區(qū)域分割效果不是很好,從第一幅圖和表中第一行數據可知,分割效果不是很好.因此本文未來將著重研究這方面的分割算法.
表1 算法結果性能評價指標比較表(%)
同時本文算法分割出來的目標區(qū)域為后期紅外光伏面板圖像特征提取和故障識別檢測奠定了基礎.