王騰達(dá) 孫昊 李前
關(guān)鍵詞:機(jī)器學(xué)習(xí);光伏組件;熱斑故障;故障危害識別
1光伏組件熱斑故障介紹及產(chǎn)生原因
1.1介紹
光伏組件熱斑故障是指光伏電池組件表面出現(xiàn)局部溫度升高或局部損壞的現(xiàn)象。光伏組件熱斑故障通常是由電池組件中的某些問題引起的,如電池片質(zhì)量不均勻、電池片間接觸不良、接觸電阻過大、電池片內(nèi)部和蓋板中存在缺陷等。熱斑故障會對光伏組件的性能和壽命產(chǎn)生不利影響。局部溫度升高可能會導(dǎo)致光伏組件的整體效率下降,因?yàn)闊岚邥囊徊糠止饽埽蛊洳荒苻D(zhuǎn)化為電能。熱斑故障可能會導(dǎo)致局部電池片損壞,使得整個(gè)組件的性能下降,并最終影響電池組件的壽命。
1.2產(chǎn)生原因
光伏組件熱斑故障的產(chǎn)生受到多種因素影響,因此需要綜合考慮并采取相應(yīng)的措施來預(yù)防和解決。具體影響因素如下:①電池片質(zhì)量不均勻。在光伏組件制造過程中,可能會存在電池片質(zhì)量不均勻的情況,導(dǎo)致部分區(qū)域的電池片性能較差,易發(fā)生局部升溫,形成熱斑。②電池片間接觸不良。光伏組件中的電池片通過電池片間的導(dǎo)線連接,如果連接方式有問題或存在松動現(xiàn)象,可能導(dǎo)致局部電池片間接觸不良,產(chǎn)生局部高電阻,使得該區(qū)域溫度升高,引發(fā)熱斑。③電池片內(nèi)部缺陷。電池片內(nèi)部可能存在生產(chǎn)過程中出現(xiàn)的缺陷,如晶體缺陷、金屬污染等,這些缺陷會導(dǎo)致局部電池性能下降,產(chǎn)生熱斑。④蓋板缺陷。如果光伏組件的蓋板存在缺陷,如局部失效、損壞,可能導(dǎo)致太陽能光線過度聚焦在局部區(qū)域,引起局部溫度升高,產(chǎn)生熱斑。⑤接觸電阻過大。如果光伏組件中的連接件存在接觸電阻過大的情況,會使得局部電路過熱,形成熱斑。⑥溫度梯度效應(yīng)。當(dāng)光伏組件表面存在溫度梯度時(shí)(不同區(qū)域間的溫度差異),可能會導(dǎo)致局部熱斑,尤其是在不均勻的發(fā)電場景下,易產(chǎn)生此效應(yīng)。⑦遮擋物影響。光照條件良好,任何遮擋物都可能導(dǎo)致局部區(qū)域過度受熱,從而在光伏組件表面形成熱斑。⑧污染和覆蓋。光伏組件表面的污染或長期的陰影覆蓋可能導(dǎo)致局部區(qū)域的溫度升高,引發(fā)熱斑。
2相關(guān)算法介紹
2.1決策樹
決策樹是一種機(jī)器學(xué)習(xí)模型,模擬了一個(gè)樹形結(jié)構(gòu),結(jié)構(gòu)中的每個(gè)節(jié)點(diǎn)代表一個(gè)特征或?qū)傩?,每條邊代表該特征可能的取值,主要用于分類和預(yù)測任務(wù)。其通過一系列的決策規(guī)則來對數(shù)據(jù)進(jìn)行分類或預(yù)測,每個(gè)決策規(guī)則都基于特征的屬性。決策樹的構(gòu)建過程是通過對數(shù)據(jù)集進(jìn)行分割,直到達(dá)到終止條件則停止。新數(shù)據(jù)會按照相同規(guī)則被決策樹分類到最終的葉節(jié)點(diǎn),從而得到相應(yīng)的預(yù)測結(jié)果。決策樹模型能夠?yàn)閱栴}提供清晰而直觀的解釋,進(jìn)而推斷結(jié)果,因此得到了廣泛應(yīng)用。決策樹具體算法根據(jù)不同的特征選擇策略被劃分,這些算法在決策樹構(gòu)建和分裂的過程中采用不同的策略和指標(biāo)。迭代二分器3代(iterative dichotomiser 3,ID3)算法使用信息增益來選擇最佳的特征進(jìn)行分裂;分類回歸樹4.5代(classification and regression trees 4.5,C4.5)算法是ID3算法的改進(jìn)版本,使用信息增益比來選擇特征,并且C4.5還可以處理連續(xù)型特征;分類回歸樹(classification and regression trees,CART)算法是一種既可用于分類,又可用于回歸的機(jī)器學(xué)習(xí)算法。在決定如何對數(shù)據(jù)進(jìn)行分裂時(shí),CART算法使用基尼指數(shù)來評估特征的重要性,從而選擇最佳特征進(jìn)行分裂。
2.2梯度提升決策樹
梯度提升決策樹(gradient boosting decisiontree,GBDT)是一種集成學(xué)習(xí)方法,通過將弱分類器(通常是決策樹)組合成一個(gè)強(qiáng)分類器來提高預(yù)測性能。GBDT使用的梯度提升算法是一種迭代的優(yōu)化算法,通過逐步優(yōu)化損失函數(shù)來構(gòu)建一個(gè)強(qiáng)大的集成模型。在每次迭代中,GBDT都會嘗試調(diào)整損失函數(shù)的梯度方向,不斷擬合殘差,從而逐步提升模型的性能。GBDT的基學(xué)習(xí)器通常采用決策樹,每棵決策樹都可對已構(gòu)建決策樹的預(yù)測誤差進(jìn)行優(yōu)化,逐步減小殘差,最終構(gòu)成一個(gè)強(qiáng)大的集成模型。為了避免過擬合,引入正則化項(xiàng),將決策樹的深度限制在一定范圍內(nèi),以避免模型過于復(fù)雜。同時(shí),設(shè)置葉子節(jié)點(diǎn)的最小樣本數(shù),保證每個(gè)葉子節(jié)點(diǎn)中包含足夠的樣本數(shù)據(jù),提高模型的準(zhǔn)確性和魯棒性。在訓(xùn)練完成后,通過將多個(gè)弱分類器的預(yù)測結(jié)果進(jìn)行加權(quán)求和,集成學(xué)習(xí)可以有效地減少學(xué)習(xí)器的偏差和方差,并提高整體模型的魯棒性和泛化臺旨力。
3基于機(jī)器學(xué)習(xí)的光伏組件故障危害識別
3.1故障特征提取
在深度學(xué)習(xí)中,數(shù)據(jù)集的數(shù)量和質(zhì)量對模型練習(xí)和預(yù)測結(jié)論都具有重要影響。模型擁有更多數(shù)據(jù),這有助于獲取新的信息,使模型可以更好地學(xué)習(xí)數(shù)據(jù)里的模型和關(guān)聯(lián)性。但是,數(shù)據(jù)的品質(zhì)也非常重要,既需要準(zhǔn)確和完備的數(shù)據(jù),同時(shí)還需要防止噪聲和極端值的影響。特征工程的任務(wù)是將繁雜的原始數(shù)據(jù)轉(zhuǎn)換成適合機(jī)器學(xué)習(xí)算法模型的高效特征,包括獲取有關(guān)特征和篩選具有較強(qiáng)預(yù)測能力的特征。通過選擇適合模型的特征,模型可以更好地捕獲數(shù)據(jù)間的模型和關(guān)聯(lián)性,提升模型的預(yù)測精密度;可以幫助提升模型的輸入數(shù)據(jù)質(zhì)量,增強(qiáng)模型的預(yù)測能力。因此,特征工程在機(jī)器學(xué)習(xí)算法中至關(guān)重要。
3.1.1熱斑數(shù)據(jù)特征提取
為了獲取熱斑溫度的有關(guān)特點(diǎn),應(yīng)該考慮熱斑與周圍環(huán)境溫度的差異。通過對比熱點(diǎn)區(qū)域溫度和光伏發(fā)電板正常區(qū)域溫度,可以計(jì)算差異值,而不是直接應(yīng)用熱點(diǎn)的溫度值。為了盡可能獲取更多特征,文中所選的溫度有關(guān)特征包括:熱點(diǎn)區(qū)域最高溫度和正常區(qū)域平均溫度的差異、熱點(diǎn)區(qū)域平均溫度和正常區(qū)域平均溫度的差異、熱點(diǎn)區(qū)域最低溫度和正常區(qū)域平均溫度的差異、熱點(diǎn)區(qū)域溫度標(biāo)準(zhǔn)偏差、熱點(diǎn)區(qū)域溫度標(biāo)準(zhǔn)差、正常區(qū)域溫度標(biāo)準(zhǔn)偏差、正常區(qū)域溫度標(biāo)準(zhǔn)差和熱斑區(qū)域最大溫差。通過選取熱點(diǎn)區(qū)域長度、寬度和總面積,描述熱點(diǎn)特征。在特征處理環(huán)節(jié),對提取特征開展綜合處理,清除失效特征,保證最后參加提取的特征合理。
3.1.2光伏組件數(shù)據(jù)特征提取
為了能獲取故障光伏組件的信息特性,本文結(jié)合故障光伏組件的特性和目前數(shù)據(jù)處理流程,利用光伏組件損害的特性進(jìn)行故障診斷。因?yàn)楣夥M件的傷害程度與熱斑的特性、數(shù)量相關(guān),所以要從這兩個(gè)方面開展特征獲取。熱點(diǎn)的級別和面積與光伏組件的傷害程度相關(guān),挑選光伏組件中熱斑故障的最高級別、單個(gè)熱斑區(qū)域內(nèi)的最大面積、全部熱點(diǎn)區(qū)域內(nèi)的占地面積和熱點(diǎn)的最高溫度作為熱點(diǎn)特征的有關(guān)特征。挑選獲取熱斑數(shù)、高風(fēng)險(xiǎn)級別熱斑數(shù)、中危熱斑數(shù)和低危熱斑數(shù)作為熱斑數(shù)的有關(guān)特征。特征獲取結(jié)束后,對標(biāo)值特征開展歸一化處理,對熱點(diǎn)故障傷害級別開展量化處理。同時(shí),清除失效特征,對特征進(jìn)行相應(yīng)降維處理,保證最后特征集具有代表性和可執(zhí)行性。
3.2故障分類流程
本文采用兩個(gè)分類模型對光伏組件的故障危害進(jìn)行分類。第一個(gè)分類模型是熱斑故障危害等級分類模型,負(fù)責(zé)對光伏組件上的熱斑進(jìn)行分類并劃分出不同的故障危害等級。第二個(gè)分類模型是光伏組件故障危害等級分類模型,根據(jù)第一個(gè)模型的分類結(jié)果,對有熱斑的光伏組件進(jìn)一步劃分,以確定其故障危害等級。本文通過聯(lián)立兩個(gè)分類模型,構(gòu)建了光伏組件故障危害分類模型,實(shí)現(xiàn)了對光伏組件故障危害等級的準(zhǔn)確劃分。光伏組件故障危害等級分類流程如圖1所示。
本文使用人工標(biāo)注的方法對7030張光伏組件的圖像進(jìn)行熱斑識別危害等級的劃分。通過這種方式,建立了熱斑數(shù)據(jù)集,并從中提取相關(guān)特征。其中,訓(xùn)練集占比為80%,驗(yàn)證集占比為20%。采用交叉驗(yàn)證的方法來評估模型的性能。
4實(shí)驗(yàn)結(jié)果與分析
本文提出一種以決策樹為基礎(chǔ)分類器的梯度提升決策樹算法,對光伏組件故障進(jìn)行識別,并提取熱斑故障的相關(guān)特征,對熱斑危害等級進(jìn)行分類。通過選取K近鄰(k-nearest neighbors,KNN)算法和支持向量機(jī)(support vector machines,SVM)算法作為比對算法,進(jìn)行不同機(jī)器學(xué)習(xí)算法下的光伏組件故障分類方法研究。
4.1熱斑故障分類
先對熱斑故障進(jìn)行分類,熱斑故障分類算法指標(biāo)評價(jià)結(jié)果如表1所示。由表1可知,相較于KNN、SVM算法,GBDT算法在熱斑故障分類算法中各個(gè)指標(biāo)上都能取得較優(yōu)的效果。
4.2光伏組件故障分類
在對熱斑故障進(jìn)行分類后,再對光伏組件故障進(jìn)行分類,光伏組件故障分類算法指標(biāo)評價(jià)結(jié)果如表2所示。GBDT算法同樣在不同的指標(biāo)上取得最優(yōu)效果,特別是錯誤率大大降低。在實(shí)際應(yīng)用中,可以提前發(fā)現(xiàn)和診斷光伏組件故障,并采取相應(yīng)的維護(hù)和修復(fù)措施,以確保光伏系統(tǒng)的正常運(yùn)行和發(fā)電效率具有重要意義。
5結(jié)論
本文針對光伏組件的安裝位置和數(shù)量較多、監(jiān)測成本高昂、檢修困難等管理問題,提出了光伏組件故障危害識別算法。利用紅外圖像的溫度信息來判別熱斑故障,并采用機(jī)器學(xué)習(xí)模型進(jìn)行熱斑故障的分類識別。通過對紅外圖像的數(shù)據(jù)進(jìn)行處理和分析,得到熱斑故障的相關(guān)特征,然后利用機(jī)器學(xué)習(xí)算法建立相應(yīng)的分類模型對熱斑故障進(jìn)行精準(zhǔn)檢測和分類。本文使用KNN、SVM和GBDT 3種算法進(jìn)行光伏組件故障危害分類,并對其性能進(jìn)行測試。結(jié)果表明,GBDT算法相較于KNN、SVM算法在不同的評價(jià)指標(biāo)上能取得較優(yōu)的效果,可為光伏組件故障的準(zhǔn)確診斷和危害等級劃分提供有效的解決方案,提高光伏電站的運(yùn)行維護(hù)管理水平和運(yùn)行可靠性。未來,可將機(jī)器學(xué)習(xí)技術(shù)與其他領(lǐng)域的先進(jìn)技術(shù)結(jié)合,如物聯(lián)網(wǎng)、大數(shù)據(jù)分析,進(jìn)一步提升光伏組件故障識別的能力。