杭州華電下沙熱電有限公司 林 翀 周皖奎 丁智華
由于光伏面板長期在室外環(huán)境工作,不可避免的發(fā)生受損、老化等問題,導(dǎo)致熱斑、裂紋等故障,影響了光伏面板的穩(wěn)定運(yùn)行,縮短了使用壽命。因此光伏組件的故障診斷成為業(yè)界所關(guān)注的重點(diǎn)話題?,F(xiàn)階段光伏發(fā)電廠的信息化系統(tǒng)已十分完善,光伏組件實(shí)時(shí)的生產(chǎn)數(shù)據(jù)被系統(tǒng)采集和儲(chǔ)存,因此基于數(shù)據(jù)驅(qū)動(dòng)的光伏組件故障診斷方法開始流行。葉進(jìn)[1]等通過改進(jìn)的DBSCAN 算法,基于電站的經(jīng)緯度對地理位置進(jìn)行聚類,對比將發(fā)電量較低的電站判定為異常。孫艷[2]采用核極限學(xué)習(xí)機(jī)對采集數(shù)據(jù)和各狀態(tài)之間的關(guān)系進(jìn)行學(xué)習(xí),并使用改進(jìn)粒子群算法對模型參數(shù)進(jìn)行優(yōu)化。王元章等[3]分析不同故障特性圖并建立BP 神經(jīng)網(wǎng)絡(luò),對正常工作、短路故障及異常老化故障進(jìn)行學(xué)習(xí)和診斷。李紅濤等[4]使用最小二乘支持向量機(jī)學(xué)習(xí)短路電流,開路電壓,最大功率點(diǎn)電流和壓值之間的關(guān)系,在小樣本量的試驗(yàn)中準(zhǔn)確率超過了90%。
光伏組件常見的故障有熱斑、玻璃開裂、導(dǎo)線老化、導(dǎo)線短路、內(nèi)部斷路等。當(dāng)光伏組件發(fā)生故障時(shí)輸出的電流、電壓會(huì)隨之改變。如發(fā)生熱斑時(shí),由于熱斑區(qū)域大量消耗能量會(huì)導(dǎo)致輸出電流降低。但隨著故障的不同和外界環(huán)境的變化,電流、電壓的變化規(guī)律也十分復(fù)雜,因此需要能有效識(shí)別故障狀態(tài)與電流、電壓間關(guān)系的方法。本文提出基于隱馬爾可夫模型(Hidden Markov model,HMM)對組件的劣化狀態(tài)進(jìn)行判斷,實(shí)現(xiàn)對故障提前發(fā)出警告目的。
HMM 是一種時(shí)間序列模型,其假設(shè)觀測到的值都是由當(dāng)前狀態(tài)所決定,在語音識(shí)別、文字識(shí)別等領(lǐng)域使用較多。對于一個(gè)HMM 通常有三個(gè)基本問題:觀測序列的概率計(jì)算問題。對于已知的HMM,λ=(A,B,π) 和觀測序列O={o1,o2,…ot},計(jì)算觀察值序列O 出現(xiàn)的概率P(O|λ);馬爾科夫模型的參數(shù)學(xué)習(xí)問題。當(dāng)觀測序列O={o1,o2,…ot}已知時(shí),學(xué)習(xí)λ 的的參數(shù)(A,B,π),使得觀測序列出現(xiàn)的概率P(O|λ)最大;最優(yōu)序列的計(jì)算問題。當(dāng)模型的參數(shù)(A,B,π)和觀測序列O={o1,o2,…ot}給定時(shí),找到能最好解釋當(dāng)前觀測序列的狀態(tài)序列,即求解使P(I|O)最大的狀態(tài)序列I={i1,i2,…it}。對于光伏組件的故障診斷,將不同的發(fā)電功率等級(jí)設(shè)定為模型的當(dāng)前狀態(tài),而觀測到的參數(shù)種類為當(dāng)前觀測值。用HMM對故障進(jìn)行預(yù)警分為兩個(gè)步驟:使用不同狀態(tài)下的光伏組件歷史生產(chǎn)數(shù)據(jù)訓(xùn)練對應(yīng)的模型,再將實(shí)時(shí)的生產(chǎn)數(shù)據(jù)輸入訓(xùn)練好的模型分別計(jì)算其概率,概率最大者為實(shí)時(shí)的狀態(tài)。
根據(jù)狀態(tài)序列是否可知,參數(shù)學(xué)習(xí)問題可分為有監(jiān)督和無監(jiān)督兩種,由于狀態(tài)序列由發(fā)電功率等級(jí)表示、是已知的,因此使用有監(jiān)督算法:轉(zhuǎn)移概率矩陣A的求解。由狀態(tài)i 轉(zhuǎn)移到為狀態(tài)j 的樣本個(gè)數(shù)為Sij個(gè),則由狀態(tài)為i 轉(zhuǎn)移到狀態(tài)j 的概率的估計(jì)值為aij組成的矩陣即為轉(zhuǎn)移概率矩陣A;觀測概率矩陣B 的求解。狀態(tài)為i 且觀測值為j 的樣本個(gè)數(shù)為Tij個(gè),則狀態(tài)為i 且觀測值為j 的概率估計(jì)值為bi(j)組成的矩陣即為觀測概率矩陣B;初始狀態(tài)概率πi的估計(jì)值為所有樣本中初始狀態(tài)為i 的頻率。
概率計(jì)算問題可直接使用的是前向-后向算法。
前向算法:前向概率定義為在t 時(shí)刻部分觀測序列為o1,o2,o3,…,ot,狀態(tài)是qi的概率,記作αt(i)=P(o1,o2,…,ot,it=qi|λ)。其計(jì)算步驟為:對前向概率賦初值。αt(i)=πibi(o1),i=1,2,…,N;遞推計(jì)算各時(shí)刻的前向概率。bi(ot+1),i=1,2,…,N;終止計(jì)算。αT(i)。
后向算法:后向概率定義為在t 時(shí)刻部分觀測序列為ot+1,ot+2,ot+3,…,oT,狀態(tài)是qi的概率,記作βt(i)=P(ot+1,ot+2,…,oT,it=qi|λ),其計(jì)算步驟為:對后向概率賦初值。βT(i)=1,i=1,2,…,N;遞推計(jì)算各時(shí)刻的前向概率。βt+1(j),i=1,2,…,N;終止計(jì)算。πibi(o1)β1(i)。
根據(jù)前向概率和后向概率的計(jì)算方式,觀測序列概率P(O|λ)統(tǒng)一寫成aijbj(ot+1)βt+1(j),t=1,2,…,T-1。
模型狀態(tài)序列。光伏組件在運(yùn)行時(shí),隨著外界環(huán)境的不同如氣溫、光照強(qiáng)度等,其發(fā)電功率也會(huì)發(fā)生變化。發(fā)電功率和氣溫、光照強(qiáng)度進(jìn)行單獨(dú)比較并非完全相關(guān),應(yīng)是多個(gè)外界因素共同決定。因此可用發(fā)電功率抽象描述整個(gè)外界環(huán)境,并將其作為隱馬爾可夫的狀態(tài)。在同一環(huán)境下短時(shí)間內(nèi)為降低故障組件對光伏總體發(fā)電功率的影響,選取所有光伏組件發(fā)電功率的中位數(shù)來準(zhǔn)確的描述環(huán)境。隱馬爾可夫的狀態(tài)是離散值而發(fā)電功率是連續(xù)值,因此需對發(fā)電功率進(jìn)行離散化,以10W 為間隔將發(fā)電功率分成15種狀態(tài),一段時(shí)間的狀態(tài)形成模型的狀態(tài)序列。
圖1 HMM 故障預(yù)警流程
圖2 原始故障
圖3 模型故障預(yù)測結(jié)果
模型觀測序列。不同外界環(huán)境下其電流和電壓數(shù)據(jù)不一樣,可將其視為外界環(huán)境“產(chǎn)生”的值,即模型的觀測值。由于馬爾科夫模型的觀測值也是離散的,因此也需將電流、電壓值進(jìn)行離散化,采用K 均值聚類的方式將樣本中的電流、電壓值進(jìn)行聚類,電流—電壓關(guān)系大致可分為20類,每一類作為一種觀測值,一段時(shí)間的觀測值形成模型的觀測值序列。
模型的訓(xùn)練。光伏組件的故障診斷涉正常狀態(tài)和遮擋、導(dǎo)線短路、導(dǎo)線開路、電池老化四種不同的故障狀態(tài),一共有5種狀態(tài)。收集5種狀態(tài)的歷史數(shù)據(jù)并訓(xùn)練HMM 可得到5個(gè)HMM。將需診斷的數(shù)據(jù)分別輸入到訓(xùn)練好的模型,計(jì)算當(dāng)前觀測序列出現(xiàn)的概率P(O|λ)可得到5個(gè)不同的概率值,概率最大的即為對應(yīng)的狀態(tài)。
模型結(jié)果分析。從2019年的光伏發(fā)電數(shù)據(jù)中收集不同工作狀態(tài)下的數(shù)據(jù),正常狀態(tài)共50個(gè)樣本,遮擋、導(dǎo)線短路、導(dǎo)線開路、電池老化各20個(gè)樣本,時(shí)間序列長度為300分鐘。每1分鐘模型運(yùn)行一次給出診斷結(jié)果。由圖2、圖3可知模型對光伏設(shè)備的故障預(yù)測基本保持較高的準(zhǔn)確率,其中模型易將遮擋故障預(yù)測為電池老化,這也符合實(shí)際的認(rèn)知。由此可知模型對光伏組件故障預(yù)警具有實(shí)際意義。