牛宇童,馮天波,李 慶,崔昊楊
(1.上海電力大學(xué)電子與信息工程學(xué)院,上海 200090;2.國網(wǎng)上海市電力公司信息通信公司,上海 200030;3.國網(wǎng)上海市電力公司閘北發(fā)電廠,上海 200432)
對于新建光伏電站而言,準(zhǔn)確的光伏發(fā)電預(yù)測較為困難。目前較多發(fā)電量預(yù)測的深度學(xué)習(xí)方法往往依賴高質(zhì)量海量數(shù)據(jù)[1],然而新建電站氣象條件相關(guān)光伏發(fā)電量樣本數(shù)據(jù)積累不夠,從而使預(yù)測時效性和準(zhǔn)確率難以保證[2]。此外,在數(shù)據(jù)傳輸損失和噪聲干擾的影響下,光伏發(fā)電量數(shù)據(jù)丟失(統(tǒng)計表明可達40%以上[3])或存在臟數(shù)據(jù)[3]的情況并不少見,造成可用數(shù)據(jù)樣本更為匱乏。在小樣本數(shù)據(jù)增強的相關(guān)研究中,肖等[4]提出基于GAN 數(shù)據(jù)生成模型和RCGAN 負(fù)荷預(yù)測模型的SLF 方法,對小樣本進行樣本擴充,所得結(jié)果具有良好的穩(wěn)定性和準(zhǔn)確性。Zhang 等[5]采用SolarGAN 方法補全缺失的光伏數(shù)據(jù),誤差減少至23.9%。上述研究未考慮到GAN 算法本身也需要大量的原始數(shù)據(jù)來支持網(wǎng)絡(luò)的訓(xùn)練收斂,若數(shù)據(jù)量較少,容易陷入模式崩塌和梯度爆炸。此外,目前小樣本光伏預(yù)測的方法由于未充分考慮氣象參數(shù)的影響權(quán)重,分析不充足,輸入不充分,所以依然存在一定的預(yù)測誤差[6]。對此,提出基于遷移學(xué)習(xí)改進WGAN 和LSTM 的小樣本光伏發(fā)電量短期預(yù)測方法。相較于文獻[5]中的傳統(tǒng)WGAN 模型,本文在此基礎(chǔ)上引入深度遷移學(xué)習(xí),學(xué)習(xí)已有的源域數(shù)據(jù)集知識,并遷移至對缺失樣本的數(shù)據(jù)增強,生成與原始數(shù)據(jù)高度相似分布的樣本;將氣象參數(shù)根據(jù)與發(fā)電量的相關(guān)程度賦予不同權(quán)重作為輸入,在LSTM 方法中增加了誤差補償機制,進一步降低誤差。本文所提方法不僅解決了傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)樣本不足的問題,提高了生成對抗網(wǎng)絡(luò)的泛化能力,同時有效提高了新建光伏電站小樣本情況下光伏發(fā)電量預(yù)測準(zhǔn)確率。
本文針對新建光伏電站小樣本光伏發(fā)電量短期預(yù)測分別構(gòu)建了數(shù)據(jù)增強模型和光伏預(yù)測模型,技術(shù)路線如圖1 所示。引入深度遷移學(xué)習(xí)算法對模型微調(diào)(fine-tuning),并以訓(xùn)練參數(shù)優(yōu)化后的WGAN 模型對目標(biāo)數(shù)據(jù)集樣本進行高效擴充。在LSTM 預(yù)測中,通過對擴充數(shù)據(jù)中的氣象參數(shù)與發(fā)電量作相關(guān)性和可視化分析,按照相關(guān)性程度賦予不同的權(quán)重作為輸入數(shù)據(jù),并采用相似氣象條件發(fā)電值對預(yù)測結(jié)果誤差進行補償,得到最終的預(yù)測結(jié)果。
圖1 小樣本光伏發(fā)電量短期預(yù)測的技術(shù)路線
常規(guī)的GAN 模型由生成網(wǎng)絡(luò)G(generative network)和判別網(wǎng)絡(luò)D(discriminative network)構(gòu)成,如圖2 所示。G 網(wǎng)絡(luò)由LSTM 模型構(gòu)成,用以生成數(shù)據(jù);D 網(wǎng)絡(luò)由CNN 模型構(gòu)成,用以對生成數(shù)據(jù)和實際數(shù)據(jù)進行分類。同時交替訓(xùn)練LSTM模型和CNN 模型:G 網(wǎng)絡(luò)學(xué)習(xí)光伏數(shù)據(jù)集的數(shù)據(jù)分布,D 網(wǎng)絡(luò)判別光伏數(shù)據(jù)來自實際樣本數(shù)據(jù)而不是生成樣本數(shù)據(jù)的概率。G 網(wǎng)絡(luò)的訓(xùn)練過程是最大化D 網(wǎng)絡(luò)判別出錯的概率。G 和D 的博弈存在唯一解,當(dāng)D 估計概率為1/2 時,G 完成高類似光伏樣本數(shù)據(jù)的生成過程。GAN 同時可反向傳播訓(xùn)練,通過G 和D 的博弈即可完成對抗訓(xùn)練過程。常規(guī)GAN 的目標(biāo)函數(shù)如下[7]:
圖2 WGAN 結(jié)構(gòu)
式中:Pdata為實際目標(biāo)缺失數(shù)據(jù)集的樣本分布。
設(shè)輸入G 的天氣變量和光伏參數(shù)為z~Pz,G 網(wǎng)絡(luò)生成樣本G(z)的分布為Pg,D 網(wǎng)絡(luò)判別概率為C(x)。訓(xùn)練D 以更準(zhǔn)確地判別生成樣本和實際樣本,同時訓(xùn)練G 以最小化C[G(z)]。常規(guī)GAN 使用JS 散度來衡量Pdata和Pg兩個概率分布的相似度,由于Pdata和Pg幾乎不重疊,無論兩者差異大小,JS 散度均為常數(shù)log2,并導(dǎo)致生成網(wǎng)絡(luò)梯度消失[8]。為解決該問題,利用Wasserstein 距離代替JS 散度對概率分布進行量化[9]:
式中:∏(Pdata,Pg)為生成/實際光伏數(shù)據(jù)的聯(lián)合分布。對于任意聯(lián)合分布γ,取其中實際目標(biāo)數(shù)據(jù)集光伏數(shù)據(jù)x和生成樣本數(shù)據(jù)z,計算出兩類樣本距離||x-z||,得到該聯(lián)合分布γ 下樣本的期望值,在所有可能的聯(lián)合分布中對該期望值取下限值。WGAN 的整體結(jié)構(gòu)和訓(xùn)練過程與常規(guī)GAN 一致。WGAN 整體訓(xùn)練的目標(biāo)函數(shù)為[5]:
對于式(3),將隨機噪聲和實際目標(biāo)數(shù)據(jù)集的樣本即(z+x)同作為G 網(wǎng)絡(luò)的輸入。D 網(wǎng)絡(luò)應(yīng)滿足1-Lipschitz 函數(shù)集的限制條件:
鑒于原始數(shù)據(jù)集樣本量不足難以訓(xùn)練WGAN,使用預(yù)訓(xùn)練的網(wǎng)絡(luò)來重新微調(diào),遷移學(xué)習(xí)的流程如圖3 所示。先用源域數(shù)據(jù)集對WGAN 預(yù)訓(xùn)練,得到初始化網(wǎng)絡(luò)參數(shù),凍結(jié)訓(xùn)練參數(shù)并對模型進行層遷移,保留除全連接層外的模型參數(shù)和權(quán)重;使用少量目標(biāo)域數(shù)據(jù)訓(xùn)練完整的新全連接層并對權(quán)重進行保存;采用層凍結(jié)的方法對部分關(guān)鍵層或整個模型的訓(xùn)練參數(shù)進行微調(diào)。訓(xùn)練完成后,遷移部分的權(quán)重參數(shù)對模型起到了優(yōu)化效果,使得生成樣本更加接近實際樣本的分布。因此,將源域數(shù)據(jù)集內(nèi)學(xué)到的知識用于指導(dǎo)生成網(wǎng)絡(luò)的迭代優(yōu)化,完成源域內(nèi)知識到目標(biāo)域的遷移。
圖3 遷移學(xué)習(xí)流程
利用三層LSTM 對擴充的目標(biāo)數(shù)據(jù)集進行預(yù)測。在三層LSTM 層中,第一層結(jié)構(gòu)為32×20,32 是網(wǎng)絡(luò)輸入樣本數(shù),20是樣本數(shù)據(jù)緯度。第二層為32×16,第三層為32×12,輸入層為1×32,輸出層為1×1。使用Relu 函數(shù)作為激活函數(shù),采用Adam 算法對各層權(quán)值進行優(yōu)化,設(shè)置Dropout 機制來避免過擬合。以此,LSTM 對時序數(shù)據(jù)進行建模,并且克服了RNN中的“梯度消失”和“梯度爆炸”問題,從而實現(xiàn)光伏序列數(shù)據(jù)預(yù)測[10]。
為減小氣象因素誤差,本文增加誤差修正環(huán)節(jié)。選取目標(biāo)數(shù)據(jù)集中的現(xiàn)場溫度、光照強度等氣象數(shù)據(jù)構(gòu)造特征向量,建立目標(biāo)函數(shù)如下[11]:
目標(biāo)函數(shù)需滿足以下條件:
式中:M為氣象數(shù)據(jù)集;V1,V2,V3…分別為溫度、光照強度等光伏氣象數(shù)據(jù);ρx為相關(guān)系數(shù),且ρ1+ρ2+ρ3+…=1;dij為各樣本點到V1,V2,V3…等光伏氣象數(shù)據(jù)的歐氏距離;為濾除氣象數(shù)據(jù)奇點數(shù)據(jù)和偶發(fā)因素,設(shè)定J*為最大可允許修正量,超出此范圍則修正無效。
在小樣本氣象數(shù)據(jù)庫中,搜索并比較與預(yù)測發(fā)電量值對應(yīng)的氣象數(shù)據(jù)最相似的樣本,索引該組氣象數(shù)據(jù)對應(yīng)的光伏發(fā)電量實際值Pc和預(yù)測值Pr,取Pc和Pr差值的絕對值對LSTM 的初步發(fā)電量預(yù)測值進行誤差補償,獲得最終發(fā)電量預(yù)測值,并將最終預(yù)測值實時上傳數(shù)據(jù)庫,以便進行下一次誤差補償時更加精確。計算公式如下[11]:
式中:Po為LSTM 神經(jīng)網(wǎng)絡(luò)的初步發(fā)電量預(yù)測值。對分子取絕對值做限幅,意味著整體預(yù)測可能偏高。由于目標(biāo)數(shù)據(jù)集中發(fā)電量最高值Pmax在10~12 之間,對于計算出高于Pmax的數(shù)值,直接取預(yù)測值進行截斷。
實驗在CUDA8.0,Tesnoeflow1.4,Nvidia Titan1080ti GPU(12G)平臺下進行,以GEFCom2014 年太陽軌道的公開太陽數(shù)據(jù)集[12]為源域數(shù)據(jù)集,以2018 年DataFoutain 公開的光伏電站數(shù)據(jù)集作為目標(biāo)數(shù)據(jù)集進行案例研究。使用均方誤差(MSE)、均方根誤差(RMSE)和歸一化均方根誤差(NRMSE)作為評價指標(biāo)對模型精度進行評估。
為評估無監(jiān)督模型生成結(jié)果,設(shè)計了基于完整數(shù)據(jù)集生成小樣本數(shù)據(jù)集實驗。以DataFoutain 的光伏電站數(shù)據(jù)集為基礎(chǔ),按照40%缺失率隨機刪除,生成目標(biāo)缺失小樣本數(shù)據(jù)集;用數(shù)據(jù)增強模型補全缺失的40%數(shù)據(jù),將生成的數(shù)據(jù)與實際數(shù)據(jù)進行比較。使用下式隨機刪除光伏電站數(shù)據(jù)集中的部分?jǐn)?shù)據(jù)[5]:
式中:enj為光伏電站數(shù)據(jù)集中第j個樣本的向量表示;Mmj為光伏電站數(shù)據(jù)集中第j個樣本的0-1 矩陣,作內(nèi)積處理。0 為缺失,1 則保留,從而生成40%缺失率的目標(biāo)缺失數(shù)據(jù)集。使用式(2)~(4)構(gòu)造WGAN 模型,訓(xùn)練判別網(wǎng)絡(luò)時選擇優(yōu)化函數(shù)RMSProp。同時,訓(xùn)練生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)時選擇優(yōu)化函數(shù)為Adam,對模型的參數(shù)進行更新[13]。設(shè)置Epoch 為30,Batchsize 為16。由于太陽數(shù)據(jù)集和光伏電站數(shù)據(jù)集并不完全相同,對其作領(lǐng)域自適應(yīng)優(yōu)化。對兩個數(shù)據(jù)集的數(shù)據(jù)進行二分類,盡可能篩選出太陽數(shù)據(jù)集中與光伏電站數(shù)據(jù)集特征分布相近的數(shù)據(jù),因此,將基于太陽數(shù)據(jù)集特征訓(xùn)練的判別網(wǎng)絡(luò)用于光伏電站數(shù)據(jù)集。對二分類時的損失函數(shù)進行優(yōu)化來提高分類準(zhǔn)確性,優(yōu)化目標(biāo)為[9]:
式中:pj=0 表示太陽數(shù)據(jù)集的數(shù)據(jù)標(biāo)簽;qj=1 表示光伏電站數(shù)據(jù)集的標(biāo)簽。得到分類后的太陽數(shù)據(jù)集后,利用前文的遷移學(xué)習(xí)流程對光伏電站數(shù)據(jù)集進行數(shù)據(jù)增強,得到目標(biāo)擴充數(shù)據(jù)集。通過與原始目標(biāo)數(shù)據(jù)集進行比較,可得擴充樣本和實際樣本的MSE為0.079,NRMSE為0.503。而以同樣本數(shù)據(jù)庫測試表明,SolarGAN 和GAN-Z 等常規(guī)模型的MSE分別為0.196 和0.369,因此本文方法生成的數(shù)據(jù)更符合實際數(shù)據(jù)分布。
對輸入數(shù)據(jù)進行有效預(yù)處理可減少訓(xùn)練和計算代價并提高模型預(yù)測精度。本文對擴充后的光伏電站數(shù)據(jù)集進行了標(biāo)準(zhǔn)化處理,所有數(shù)據(jù)都在0~1 的特定范圍內(nèi)重新縮放。擴充數(shù)據(jù)集每周期每天200 個ID,則45 d 訓(xùn)練集數(shù)據(jù)量為9 000 條。對45 d 內(nèi)的氣象和電壓電流等參數(shù)作散點圖,圖4(a)、(b)分別為平均功率和電壓的特征散點圖。發(fā)現(xiàn)平均功率和電壓等各特征參數(shù)基本都存在明顯異常值。根據(jù)統(tǒng)計學(xué)知識,異常值判定遵循以下基本規(guī)則:data∈[均值-3×標(biāo)準(zhǔn)差,均值+3×標(biāo)準(zhǔn)差],凡是不在此范圍內(nèi)的數(shù)據(jù)均作奇點數(shù)據(jù)進行刪除處理,并用上一點有效值替代。
圖4 目標(biāo)數(shù)據(jù)集部分特征散點圖
為探明各特征參數(shù)變化對光伏發(fā)電量的影響,本文計算了各氣象和電壓電流等參數(shù)與發(fā)電量的Pearson 相關(guān)系數(shù),公式如下[14]:
式中:X為各特征參數(shù)值;Y為光伏發(fā)電量值;總體相關(guān)系數(shù)ρ為X、Y之間的協(xié)方差和標(biāo)準(zhǔn)差乘積的比值。若其值越接近+1 則相關(guān)性越密切,其值大于等于0.8 時,視為高度相關(guān)。各特征參數(shù)與發(fā)電量的Pearson 系數(shù)如表1 所示,根據(jù)相關(guān)性系數(shù)的大小對各特征參數(shù)賦予不同的權(quán)重。
表1 Pearson 系數(shù)結(jié)果
為使相關(guān)性直觀體現(xiàn),本文對部分特征參數(shù)與發(fā)電量之間的變化關(guān)系數(shù)據(jù)進行了可視化處理。從圖5 中發(fā)現(xiàn),圖5(a)、(b)分別為光照強度/40 和平均功率/480 的曲線,(a)、(b)中特征參數(shù)的變化曲線和發(fā)電量基本重合,光照強度和平均功率的Pearson 系數(shù)值也超過了0.8,所以其與發(fā)電量表現(xiàn)出較強相關(guān)性。圖5(c)為板溫的曲線,板溫的變化曲線與發(fā)電量只有小部分重合,Pearson 系數(shù)值為0.519,表現(xiàn)出中等強度相關(guān)性。圖5(d)為風(fēng)速曲線,(d)中特征參數(shù)的變化曲線和發(fā)電量的重合較少,Pearson 系數(shù)值也只有0.128,表現(xiàn)出較弱相關(guān)性。綜合分析Pearson 系數(shù)值和可視化圖可以發(fā)現(xiàn),與發(fā)電量具有較強相關(guān)性的為光照強度、電流A 和平均功率,具有中等強度相關(guān)性的為板溫,具有較弱相關(guān)性的為現(xiàn)場溫度、轉(zhuǎn)換效率A、轉(zhuǎn)換效率C、功率C、電流B、電流C、風(fēng)速和風(fēng)向,其余特征參數(shù)不具有相關(guān)性,可忽略不計。
圖5 部分特征參數(shù)與發(fā)電量的相關(guān)性曲線圖
通過對不同權(quán)重比時的模型預(yù)測結(jié)果的RMSE作比較,如表2 所示,可以看到,0.8∶0.1 時模型誤差最小。所以賦予特征參數(shù)最優(yōu)權(quán)重:光照強度、電流A、平均功率和板溫權(quán)重為0.8,其他弱相關(guān)性變量權(quán)重為0.1,此時,預(yù)測值與實際值更為符合。將所有特征參數(shù)賦予對應(yīng)的權(quán)重作為預(yù)測模型的輸入,得到光伏電站數(shù)據(jù)集的光伏發(fā)電量預(yù)測。發(fā)現(xiàn)初步預(yù)測結(jié)果仍有一定誤差,利用前文誤差補償方法,對結(jié)果進行誤差補償修正。修正前后的結(jié)果對比如圖6 所示。由于式(7)~(9)和歷史實際發(fā)電值對初步預(yù)測結(jié)果的修正作用,使得修正發(fā)電量后的預(yù)測結(jié)果比未經(jīng)修正的結(jié)果誤差降低了37.2%。
表2 不同權(quán)重比時的模型RMSE 結(jié)果
圖6 誤差修正結(jié)果對比
為進一步驗證本文方法的有效性,將本文預(yù)測結(jié)果與常規(guī)LSTM 方法和GA-BP 方法進行比較(圖7),可以看出,在多峰值處本文方法所得結(jié)果更符合原始發(fā)電曲線。而通過比較本文方法和LSTM 模型、GA-BP 模型幾個方法的發(fā)電量誤差,可以看出,LSTM 模型、GA-BP 模型誤差波動性較強,在-4~2之間波動,誤差較大,而本文方法的誤差穩(wěn)定在-1~1之間(圖8),本文方法的誤差相比常規(guī)方法至少降低了33.4%。
圖7 光伏預(yù)測方法結(jié)果對比
圖8 光伏預(yù)測方法誤差對比
與其它未與GAN 數(shù)據(jù)增強相結(jié)合的常規(guī)人工神經(jīng)網(wǎng)絡(luò)方法相比,本文結(jié)合太陽數(shù)據(jù)集對光伏電站小樣本數(shù)據(jù)集進行數(shù)據(jù)擴充,通過遷移學(xué)習(xí)方法優(yōu)化WGAN 網(wǎng)絡(luò)的初始參數(shù)設(shè)置,在有效擴充新建光伏電站小樣本量的同時保證了生成樣本的質(zhì)量,提高了生成對抗網(wǎng)絡(luò)的泛化能力;充分考慮氣象多元參數(shù)作為輸入,并根據(jù)相關(guān)性大小賦予不同權(quán)重,發(fā)電預(yù)測誤差降低了33.4%。然而,對氣象參數(shù)賦予的權(quán)重比只適用于光伏場景,其他新能源場景需要根據(jù)相關(guān)性另作分析;基于GAN 的網(wǎng)絡(luò)的訓(xùn)練階段比較耗時,需要減少訓(xùn)練階段的計算時間,滿足實時處理的需要。