國電電力新疆新能源開發(fā)有限公司 孟憲梁 楊 志 黃文廣 華風(fēng)數(shù)據(jù)(深圳)有限公司 袁昌國 饒 巍
魯東大學(xué)數(shù)學(xué)與統(tǒng)計科學(xué)學(xué)院 張中正 付恩強(qiáng) 劉廣臣
隨著全球能源不斷地消耗,且化石燃料所導(dǎo)致的環(huán)境問題日益突出,世界各國對清潔可再生能源的開發(fā)研究投入越來越大,其中利用太陽能,光伏發(fā)電的技術(shù)得到了迅猛發(fā)展,廣泛應(yīng)用于各個領(lǐng)域,但太陽能光伏電站在長期運(yùn)行過程中,會出現(xiàn)一些影響光伏組件安全運(yùn)行的問題,如隱裂、EVA 黃變、熱斑等,其中熱斑效應(yīng)對光伏組件性能影響最大[1],已成為危害最大、發(fā)生最頻繁的一類故障熱斑效應(yīng)是造成光伏組件損壞的主要原因之一,提早發(fā)現(xiàn)光伏組件熱斑效應(yīng)并及時解決,可有效減少損失[2]。
熱斑檢測一般使用電氣檢測和圖像分析2種模式進(jìn)行檢測,電氣檢測是基于分析太陽能發(fā)電的電氣數(shù)據(jù),通過對發(fā)電數(shù)據(jù)的波動分析出是否存在故障[3]。該方法需要線路接入和電路監(jiān)控,會增加光伏組件的額外成本。圖像分析通常對紅外圖像進(jìn)行分析,運(yùn)用圖像處理技術(shù)在紅外圖像中找到熱斑的位置。小規(guī)模的光伏組件熱斑檢測可使用便攜式紅外儀進(jìn)行直接觀測,但大規(guī)模光伏發(fā)電站采用這種檢測方式效率低下,而利用人工智能技術(shù)能達(dá)到快速、便捷及高效的完成檢測[4]。
目前,光伏電站運(yùn)維工作一般是先通過監(jiān)測光伏發(fā)電系統(tǒng)的輸出功率和輸出電壓粗略判斷運(yùn)行故障,然后根據(jù)經(jīng)驗對故障類型進(jìn)行分類,再進(jìn)行相應(yīng)的處理。
但隨著光伏電站規(guī)模的不斷擴(kuò)大,光伏系統(tǒng)的運(yùn)行故障類型及頻次也在不斷上升,這不僅增加了光伏電站的運(yùn)維工作量及工作難度,而且增加了運(yùn)維成本。所以,傳統(tǒng)的運(yùn)維模式顯然已經(jīng)不再適用于當(dāng)前的大規(guī)模光伏電站。
圍繞此問題,國內(nèi)外都進(jìn)行了相應(yīng)研究。在分析Otsu 法和最大散度閾值法的基礎(chǔ)上,提出自適應(yīng)最大散度閾值差法來進(jìn)行紅外圖像識別[5]。基于邊緣檢測方式,使用Canny 邊緣檢測算子作為診斷模塊進(jìn)行光伏板故障識別[6]。先對光伏電池片的各種運(yùn)行狀態(tài)進(jìn)行狀態(tài)分類編碼,然后通過可擴(kuò)展脈沖神經(jīng)網(wǎng)絡(luò)方法實現(xiàn)了對光伏熱斑的識別[7]。利用深度學(xué)習(xí)算法的CNN 對光伏板圖像進(jìn)行自動識別判斷,找出有故障電池板的精確位置,以及確定故障的類型[8]。
在基于人工智能技術(shù)的光伏電站巡檢系統(tǒng)中,無人機(jī)遙感技術(shù)、地面數(shù)據(jù)分析站等技術(shù)雖然已經(jīng)相對成熟,但是在后期數(shù)據(jù)的處理方面,尤其結(jié)合深度學(xué)習(xí)算法的應(yīng)用方面,國內(nèi)外的研究和應(yīng)用都還較少,因此這是一個值得探究的領(lǐng)域。
本文采用基于多層卷積神經(jīng)網(wǎng)絡(luò)的光伏組件紅外熱斑故障識別方法,解決由于特征數(shù)目過少,無法精確分類,即欠擬合問題或由于特征數(shù)目過多,導(dǎo)致在分類過程中過于注重某個特征導(dǎo)致分類錯誤,即過擬合的問題。通過深度學(xué)習(xí)算法對實時數(shù)據(jù)、無人機(jī)采集圖像等數(shù)據(jù)的綜合分析,快速、準(zhǔn)確地進(jìn)行故障定位及檢測,不僅可以做到故障早預(yù)防、早發(fā)現(xiàn)、早解決,避免電量損失及事故發(fā)生,還可以進(jìn)行智能化的故障定位及識別,大幅度提高光伏電站的發(fā)電量,降低維修事故及成本。
分析時間跨度:某天上午8:00-14:00光伏板紅外錄像數(shù)據(jù)。
圖片采樣頻率:紅外視頻每12幀間隔采樣圖片數(shù)據(jù)。
圖片命名方式:具有熱斑的標(biāo)記為1,其余標(biāo)記為0。
為了使算法能夠在紅外圖像中更加準(zhǔn)確的識別到熱斑和異物,我們采取了如下的操作:首先將訓(xùn)練集和驗證集中的紅外圖片(如圖1所示)轉(zhuǎn)換成黑白兩色,以使圖片特征更加明顯。由于光斑和異物明顯的呈現(xiàn)黑白兩色,將其轉(zhuǎn)換成單通道的圖片并不影響識別過程。為了獲得更多的數(shù)據(jù),我們將圖片隨機(jī)水平翻轉(zhuǎn)、隨機(jī)旋轉(zhuǎn),并將數(shù)值歸一化至[0,1]。測試集不執(zhí)行數(shù)據(jù)增強(qiáng)工作。處理之后的圖片展示如圖2。
圖1 紅外狀態(tài)下的圖片數(shù)據(jù)
圖2 黑白轉(zhuǎn)換后的圖片數(shù)據(jù)
卷積神經(jīng)網(wǎng)絡(luò)是一種人工神經(jīng)網(wǎng)絡(luò),其的結(jié)構(gòu)可以分為3層。
2.1.1 卷積層——主要作用是提取特征
卷積層是CNN 的核心,卷積層由多個卷積核組成,每個卷積核和上一層特征圖的局部區(qū)域相連接,卷積核是一個權(quán)值矩陣,卷積核通過在上一層特征圖上不斷移動進(jìn)行卷積運(yùn)算,從而完成特征提取,卷積核移動的過程中,在同一層上其權(quán)值參數(shù)是共享的。卷積運(yùn)算后,通過非線性激活函數(shù)的作用,增強(qiáng)網(wǎng)絡(luò)的表達(dá)能力。卷積層對應(yīng)的計算公式如下所示:
式中:xlj 為經(jīng)過卷積運(yùn)算后第l 層第j 個神經(jīng)元的輸出,xil-1是第l-1層第i 個神經(jīng)元的輸出,*為卷積運(yùn)算,為卷積核,blj 為偏置,f 為激活函數(shù)。
通過卷積層,網(wǎng)絡(luò)的特征圖通常變得更深,可以對輸入數(shù)據(jù)進(jìn)行深層次分析,充分進(jìn)行特征提取。網(wǎng)絡(luò)訓(xùn)練時,為卷積核中權(quán)值和偏置設(shè)定初始值,訓(xùn)練過程中不斷調(diào)整卷積核中權(quán)值和偏置,使網(wǎng)絡(luò)性能達(dá)到最優(yōu)。
2.1.2 池化層——主要作用是重采樣,卻不會損壞識別結(jié)果
池化層通常在卷積層之后,類似于卷積層,池化層和上一層特征圖的局部區(qū)域相連接,進(jìn)行池化操作。常用的池化操作包括平均池化和最大池化,平均池化是對特征圖局部區(qū)域求取平均值,最大池化是對特征圖局部區(qū)域求最大值。和卷積層不同,池化層沒有權(quán)值等參數(shù),只是一種運(yùn)算規(guī)則,池化層不會改變上一層網(wǎng)絡(luò)特征圖的個數(shù)。池化層的計算公式如下所示:
式中:subsampling 表示池化函數(shù)
2.1.3 全連接層——主要作用是分類
全連接層位于CNN 的最后部分。經(jīng)過卷積和池化操作后,特征圖平鋪為一維向量作為全連接層的輸入,其中每個神經(jīng)元和下一層所有神經(jīng)元全部連接。根據(jù)任務(wù)要求,設(shè)定合適的全連接層和輸出層神經(jīng)元節(jié)點(diǎn)數(shù),完成相應(yīng)的分類或回歸任務(wù)。其計算公式如下所示[9]:
為了避免過擬合,全連接層通常要采用隨機(jī)失活(Dropout)技術(shù),Dropout 是一種正則化技術(shù),通過設(shè)置Dropout 值的大小,使得網(wǎng)絡(luò)中部分節(jié)點(diǎn)不參與CNN 的訓(xùn)練過程,從而降低模型的復(fù)雜度,提高模型的適應(yīng)能力。
CNN 能夠有效的將大數(shù)據(jù)量的圖片降維成小數(shù)據(jù)量,有效的保留圖片特征,符合圖片處理的原則圖像,解決了需要處理的數(shù)據(jù)量太大,導(dǎo)致成本很高,效率很低,圖像在數(shù)字化的過程中很難保留原有的特征,導(dǎo)致圖像處理的準(zhǔn)確率不高等問題。通過獲得的數(shù)據(jù),我們首先對其進(jìn)行分類,將正常的光伏圖片標(biāo)記為0,將不正常的圖片標(biāo)記成1,對圖片進(jìn)行灰度處理,對數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng),將數(shù)據(jù)分為訓(xùn)練集、驗證集和測試集,將處理過的數(shù)據(jù)放入到神經(jīng)層進(jìn)行訓(xùn)練,首先對預(yù)處理后的數(shù)據(jù)進(jìn)行卷積化操作,然后進(jìn)行池化操作,這個過程中提取數(shù)據(jù)中重要的特征,拋棄對于學(xué)習(xí)累贅的特征,這個過程我們重復(fù)多次,提取特征中最重要的數(shù)據(jù)指標(biāo),然后將神經(jīng)層中的數(shù)據(jù)進(jìn)行全連接,通過全連接層輸出0,1這兩種類別。
本文利用無人機(jī)拍攝太陽能光伏板的遠(yuǎn)紅外視頻,結(jié)合圖片處理和深度學(xué)習(xí)的方法,解決智能識別太陽能光伏板故障的問題。
我們先對數(shù)據(jù)進(jìn)行采集,最終應(yīng)用于樣本數(shù)據(jù)進(jìn)行訓(xùn)練的圖片一共有4100張,其中正常圖片1100張,故障圖片3000張,將圖片劃分成70%的訓(xùn)練集,20%的驗證集以及10%的測試集。
后對采集數(shù)據(jù)進(jìn)行預(yù)處理,將經(jīng)過預(yù)處理理后的圖片劃分為訓(xùn)練集和測試集,其中訓(xùn)練集占70%,測試集占30%,隨后基于訓(xùn)練集利用卷積神經(jīng)網(wǎng)絡(luò)算法進(jìn)行模型訓(xùn)練,并將訓(xùn)練得到的模型帶入測試集中進(jìn)行評估驗證,最后利用經(jīng)過評估驗證的模型進(jìn)行熱斑紅外圖片的識別。
CNN 算法在光伏組件紅外熱斑故障識別中具有較大的優(yōu)越性,為了展示模型的效果,在同樣條件下建立多個其他模型與其進(jìn)行對比,用與CNN 相同的70%的訓(xùn)練集,20%的驗證集以及10%的測試集展示預(yù)測效果,綜合分析各個算法模型指標(biāo)。數(shù)據(jù)顯示,CNN 算法在光伏組件紅外熱斑故障識別中能力顯著優(yōu)于其它算法,該算法預(yù)測的準(zhǔn)確率高、時效性好、穩(wěn)健性強(qiáng)。綜合來看,我們選取CNN 算法模型。圖3展示了CNN、Resnet18和Resnet50等多種算法模型在訓(xùn)練、驗證及上的準(zhǔn)確率,圖4展示了各種算法的損失函數(shù)。評估各項評價指標(biāo)對比結(jié)果后,針對bach_size 不同的取值如32或者64等參數(shù)的調(diào)優(yōu)將數(shù)據(jù)帶入模型中進(jìn)行訓(xùn)練。
圖3 不同模型Train Acc(A) 和Val Acc (B)對比圖
圖4 不同模型Val Acc_Loss 對比圖
通過訓(xùn)練得到的數(shù)據(jù),我們將迭代后穩(wěn)定下來的結(jié)果進(jìn)行平均值處理,對比模型的優(yōu)劣。
我們從得到的結(jié)果可以看出CNN 算法總體上優(yōu)于Resnet18以及Resnet50算法,在計算耗時上,如表1的數(shù)據(jù)顯示CNN 算法耗時較短,具有更好的時效性,避免產(chǎn)生不必要的損失。在模型的準(zhǔn)確率上,由上圖3和表1所示CNN 算法較其他兩種算法準(zhǔn)確率高,圖4可知CNN 的loss 值最低且不斷地在降低,沒有到達(dá)局部最優(yōu)解。綜上所述,CNN 算法在光伏組件紅外熱斑故障識別中效果最優(yōu)。
表1 不同模型之間數(shù)據(jù)的對比
確定卷積神經(jīng)網(wǎng)絡(luò)的超參數(shù);對紅外圖片進(jìn)行卷積池化操作,其中用BatchNorm2d 方法對卷積層處理過的紅外圖象數(shù)據(jù)進(jìn)行歸一化操作,以免因數(shù)據(jù)過大而導(dǎo)致的網(wǎng)絡(luò)性能不穩(wěn)定,并且運(yùn)用交叉熵?fù)p失函數(shù)和Adam 優(yōu)化器進(jìn)行訓(xùn)練,防止出現(xiàn)過擬合現(xiàn)象;對處理好的數(shù)據(jù)進(jìn)行全連接操作;經(jīng)過5次卷積完成對紅外圖片的特征提取。
對卷積神經(jīng)網(wǎng)絡(luò)的多種超參數(shù)進(jìn)行確定,以優(yōu)化模型的精度;通過卷積神經(jīng)網(wǎng)絡(luò)對于圖像的訓(xùn)練集和驗證集進(jìn)行訓(xùn)練,得到的模型帶入測試集,并驗證模型準(zhǔn)確率;通過不同超參數(shù)下準(zhǔn)確率的比較,選取準(zhǔn)確率高的超參數(shù);通過不同參數(shù)之間的比較,發(fā)現(xiàn)當(dāng)批處理(batch)=64時模型的準(zhǔn)確率會比較高并取預(yù)測結(jié)果穩(wěn)定下的平均值為0.938,達(dá)到預(yù)期的結(jié)果。
通過模型導(dǎo)出測試集的csv 文件進(jìn)行構(gòu)建混淆矩陣并計算其AUC[10]。即對所有正負(fù)樣本獲得一個score,然后對score 從大到小排序,令最大score 對應(yīng)樣本的rank 為n,第二大score 對應(yīng)樣本的rank 為n-1,以此類推。然后把所有的正類樣本的rank 相加,再減去所有正樣本和正樣本配對的情況(即排在它后面正例的個數(shù))。得到的就是所有的樣本中有多少對正類樣本的score 大于負(fù)類樣本的score。然后再除以M×N,從而得到AUC 如下:
其中M 為正類樣本的數(shù)目,N 為負(fù)類樣本的數(shù)目,rank 的值表示能夠產(chǎn)生score 前大后小這樣的組合數(shù)。
計算所得混淆矩陣如表2所示:
表2 基于CNN 模型構(gòu)建所得混淆矩陣
利用上述混淆矩陣,通過AUC 計算得到結(jié)果的準(zhǔn)確率很高,幾乎完美的分出了想要得到的結(jié)果。
通過采用了上述技術(shù)方案,本發(fā)明可利用無人機(jī)拍攝太陽能光伏板的遠(yuǎn)紅外視頻,利用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)算法,解決智能識別太陽能光伏板熱斑故障的問題。
本文利用無人機(jī)拍攝的太陽能光伏板遠(yuǎn)紅外圖像,采用CNN、Resnet18和Resnet50多種主流深度學(xué)習(xí)方法建模,并進(jìn)行對比分析,尋求模型的最優(yōu)體系。每種深度學(xué)習(xí)方法基于樣本數(shù)據(jù)進(jìn)行調(diào)參,選出最優(yōu)的參數(shù)組合來擬合模型,達(dá)到局部最優(yōu)。采用無人機(jī)搭載紅外攝像機(jī)獲取一手的光伏板圖像數(shù)據(jù),保證了訓(xùn)練數(shù)據(jù)的高質(zhì)量要求。并采用多種圖片處理方法,能夠有效的提取圖片特征,提高了模型的學(xué)習(xí)效率??梢詫夥瀹愇镞M(jìn)行實時動態(tài)監(jiān)測,極大的減少了光伏板監(jiān)測和維護(hù)工作的復(fù)雜度。對可能存在異物遮擋的光伏板進(jìn)行識別、定位,以便工作人員及時、準(zhǔn)確的尋找到損壞的太陽能光伏板,并清理光伏板上的異物,從而提高光伏的發(fā)電效率。