劉 牮,李佳偉
(上海理工大學(xué) 機(jī)械工程學(xué)院,上海 200093)
隨著分布式發(fā)電技術(shù)與電力物聯(lián)網(wǎng)的發(fā)展,電力系統(tǒng)的組成更加多樣化,用電調(diào)度和電力市場的平穩(wěn)運行面臨新的挑戰(zhàn)。為滿足電網(wǎng)安全運行的需求,提高電力系統(tǒng)的可靠性與穩(wěn)定性,電力負(fù)荷數(shù)據(jù)的重要性不言而喻。然而,電力負(fù)荷具有隨機(jī)性和不確定性,并且傳統(tǒng)負(fù)荷數(shù)據(jù)的預(yù)測與生成受到很多因素影響,如天氣、季節(jié)、社會活動等,這些因素對于電網(wǎng)的穩(wěn)定性構(gòu)成威脅。
文獻(xiàn)[1]提出一種基于模糊集隸屬度改進(jìn)均值生成函數(shù)的方法,通過新的模糊集隸屬度改進(jìn)均值生成函數(shù)構(gòu)造,在與最優(yōu)子集模型結(jié)合后,使用模型對負(fù)荷進(jìn)行短期預(yù)測;文獻(xiàn)[2]提出一種考慮風(fēng)電場出力波動趨勢和相關(guān)性的建模方法生成風(fēng)電負(fù)荷數(shù)據(jù);文獻(xiàn)[3]提出基于支持向量回歸的負(fù)荷數(shù)據(jù)生成方法;文獻(xiàn)[4]將卷積神經(jīng)網(wǎng)絡(luò)和支持向量回歸模型相結(jié)合,通過卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取,將新特征輸入支持向量回歸模型進(jìn)行預(yù)測。然而,文獻(xiàn)[1]的方法只適合進(jìn)行短期數(shù)據(jù)預(yù)測,且無法生成大量數(shù)據(jù);文獻(xiàn)[2]和文獻(xiàn)[3]的方法容易受到特殊因素影響,如天氣因素等,使得生成結(jié)果往往具有局限性,而不具有普遍性;文獻(xiàn)[4]的模型雖然能夠生成大量精確的電力負(fù)荷數(shù)據(jù),但該方法模型結(jié)構(gòu)復(fù)雜、計算量較大,且網(wǎng)絡(luò)訓(xùn)練時間較長。
本文運用對抗神經(jīng)網(wǎng)絡(luò)模型生成新的電力負(fù)荷數(shù)據(jù),該方法不會受到特殊因素影響,使新生成的數(shù)據(jù)更具有普遍性,并且具有網(wǎng)絡(luò)結(jié)構(gòu)簡單、訓(xùn)練時間短等優(yōu)點。對抗神經(jīng)網(wǎng)絡(luò)是一種無監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),伴隨著監(jiān)督式學(xué)習(xí)性能瓶頸的到來,針對非監(jiān)督學(xué)習(xí)的研究越來越多。運用DCGAN網(wǎng)絡(luò)進(jìn)行電力負(fù)荷場景建模,分析驗證其在保留電力負(fù)荷數(shù)據(jù)原始序列時間、空間相關(guān)特性方面的能力。該模型通過生成器與判別器兩者之間的相互博弈,從中學(xué)習(xí)歷史負(fù)荷數(shù)據(jù)時空分布規(guī)律,并使用DCGAN網(wǎng)絡(luò)生成電力數(shù)據(jù),可防止出現(xiàn)原始GAN在訓(xùn)練過程中梯度下降、訓(xùn)練不穩(wěn)定以及無法進(jìn)行單純的數(shù)據(jù)生成等問題。將電力數(shù)據(jù)通過坐標(biāo)系轉(zhuǎn)化為曲線圖,將這些曲線圖作為數(shù)據(jù)樣本、深度卷積生成對抗網(wǎng)絡(luò)結(jié)構(gòu)作為模型進(jìn)行訓(xùn)練,得到的新的電力負(fù)荷數(shù)據(jù)。通過將訓(xùn)練得到的新數(shù)據(jù)與原始數(shù)據(jù)進(jìn)行相關(guān)性分析,并與傳統(tǒng)支持向量法與均值生成函數(shù)法進(jìn)行對比,結(jié)果證明本文模型能夠生成大量符合要求的新數(shù)據(jù)。
GAN網(wǎng)絡(luò)優(yōu)化目標(biāo)函數(shù)如下:
對于判別器而言,這是一個二分類問題,V(G,Z) 為二分類里常見的交叉熵?fù)p失。
對于生成器而言,為了盡可能地欺騙判別器D,判別概率D(G(z)) 需要最大化,也即使log(1-D(G(z))) 最小化。在實際訓(xùn)練過程中,生成器與判別器交替進(jìn)行訓(xùn)練,不斷往復(fù),當(dāng)判別器與生成器二者達(dá)到納什均衡,生產(chǎn)樣本和真實樣本就達(dá)到了以假亂真的程度。
Fig.1 Adversarial neural network model圖1 對抗神經(jīng)網(wǎng)絡(luò)模型
CNN網(wǎng)絡(luò)主要由3 種模塊構(gòu)成:卷積層、采樣層和全連接層。CNN網(wǎng)絡(luò)訓(xùn)練過程可理解為:首先通過第一層卷積提取圖片特征圖(feature map);然后通過第一層采樣層對特征圖進(jìn)行特征選擇,去掉不需要的特征后得到新的特征圖;第二層卷積層再次對上一層采樣層的feature map提取特征,第二層采樣層也對上一層進(jìn)行二次選擇;全連接層根據(jù)上述過程的特征結(jié)果進(jìn)行分類。
DCGAN將CNN與GAN的兩種網(wǎng)絡(luò)進(jìn)行結(jié)合,將卷積網(wǎng)絡(luò)引入模型中。卷積網(wǎng)絡(luò)具有非常強(qiáng)的特征提取能力,將其加入到GAN網(wǎng)絡(luò)進(jìn)行無監(jiān)督訓(xùn)練生成的新的電力負(fù)荷數(shù)據(jù)。由于GAN網(wǎng)絡(luò)訓(xùn)練具有不穩(wěn)定性,DCGAN選擇使用CNN結(jié)構(gòu)以穩(wěn)定GAN的訓(xùn)練。
網(wǎng)絡(luò)改進(jìn)如下:
(1)取消所有pooling層,G網(wǎng)絡(luò)中使用轉(zhuǎn)置卷積進(jìn)行上采樣,D網(wǎng)絡(luò)中用加入stride的卷積代替pooling。
(2)在D和G中均使用batch normalization,去掉FC層,使網(wǎng)絡(luò)變?yōu)槿矸e網(wǎng)絡(luò)。
(3)G網(wǎng)絡(luò)中使用ReLU作為激活函數(shù),最后一層使用tanh。
(4)D網(wǎng)絡(luò)中使用LeakyReLU作為激活函數(shù)。
DCGAN對卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)作出的改變,可以提高樣本質(zhì)量和收斂速度。在預(yù)處理環(huán)節(jié),將圖像scale到tanh的[-1,1],學(xué)習(xí)率必須很小。本文設(shè)置學(xué)習(xí)率為rate=0.000 2,初始化參數(shù)由均值為0、方差為0.002 的正態(tài)分布中得到,LeakyReLU的斜率是0.2,將momentum參數(shù)beta從0.9 降為0.5,以防止震蕩及不穩(wěn)定。在訓(xùn)練過程中,判別器與生成器均采用adam優(yōu)化算法。對數(shù)據(jù)結(jié)果進(jìn)行比較分析,隨著訓(xùn)練的逐步進(jìn)行,基于DCGAN網(wǎng)絡(luò)的模型可生成大量滿足多樣性和準(zhǔn)確性的數(shù)據(jù)序列。
圖2-圖4 分別為總迭代次數(shù)e=10、e=50、e=200 時的生成結(jié)果,從圖中可以看出,神經(jīng)網(wǎng)絡(luò)逐漸學(xué)習(xí)到數(shù)據(jù)變化分布規(guī)律,生成的結(jié)果越來越好。在網(wǎng)絡(luò)訓(xùn)練過程中,迭代次數(shù)越多,模型生成的曲線越清晰,并且可以大量生成電力負(fù)荷數(shù)據(jù)曲線,在程序中稍加修改還可得到生成的單張數(shù)據(jù)曲線圖。如圖5 為迭代次數(shù)為300 時其中的某單張電力數(shù)據(jù)曲線圖,通過坐標(biāo)系可提取出曲線中的電力數(shù)據(jù)。
Fig.2 Result generated when e=5圖2 e=5 時生成結(jié)果
Fig.3 Result generated when e=50圖3 e=50 時生成結(jié)果
Fig.4 Result generated when e=200圖4 e=200 時生成結(jié)果
Fig.5 Single electric data curve generated when e=300圖5 e=300 時生成的單張電力數(shù)據(jù)曲線
經(jīng)驗?zāi)B(tài)分解(EMD)可用來處理非平穩(wěn)數(shù)據(jù)序列:假如一個原始數(shù)據(jù)序列X(t)的極大值或極小值數(shù)目比上跨零點或下跨零點的數(shù)目多2 個(或2 個以上),則需要對該數(shù)據(jù)序列進(jìn)行平穩(wěn)化處理。先選取序列長度為T的數(shù)據(jù)序列X(t):x1,x2,…,xT,令h(t)=X(t),找出全部的極大值點,并用樣條函數(shù)插值作為原數(shù)據(jù)序列X(t)的上包絡(luò)線,找出全部的極小值點。將樣條函數(shù)插值作為原數(shù)據(jù)序列的下包絡(luò)線,m(t)為均值序列,用數(shù)據(jù)序列h(t)減去該平均包絡(luò)后得到去掉低頻的一個新數(shù)據(jù)序列hl(t),從而得到第一個IMF分量C1(t):C1(t)=hk(t)。
第一個IMF分量代表原始數(shù)據(jù)序列中最高頻的組成成分。用X(t)減去第一個IMF分量C1(t),得到一個去掉最高頻成分后的新數(shù)據(jù)序列r1(t)。同理,對r1(t)用同樣的方法經(jīng)過平穩(wěn)化處理便得到第二個IMF分量C2(t),一直到序列rn(t)不可再被分解時,rn(t)便可作為數(shù)列X(t):x1,x2,....xT的均值或趨勢:
經(jīng)過前面的多次平穩(wěn)化處理后,可得到原始序列中的多組IMF分量和殘差表示:
從上述過程可以看出,EMD算法是一種將原始數(shù)據(jù)用多組特征波形進(jìn)行疊加的算法,具體流程如圖6 所示。
Fig.6 Algorithm flow圖6 算法流程
將輸入的電力負(fù)荷數(shù)據(jù)序列通過經(jīng)驗?zāi)B(tài)分解算法進(jìn)行多時間尺度分解,得到若干個IMF分量和一個趨勢分量Rn。不同分量代表序列在不同時間周期上的波動規(guī)律,能更準(zhǔn)確地反映電力負(fù)荷時間序列的變化,并保留序列本身的特征。
本文對原始電力負(fù)荷數(shù)據(jù)和生成的電力負(fù)荷數(shù)據(jù)分別求出其每個時間點上的平均值,將得到的兩個樣本轉(zhuǎn)換成電力數(shù)據(jù)曲線,通過EMD算法將兩個曲線進(jìn)行經(jīng)驗?zāi)B(tài)分解,便可得到其特征尺度數(shù)據(jù)序列和一個趨勢分量,如圖7、圖8 所示。從圖中可清晰看出生成的數(shù)據(jù)與原始數(shù)據(jù)樣本在時間分布上的相似程度,最后的趨勢分量更能體現(xiàn)生成數(shù)據(jù)可保留原始數(shù)據(jù)隨時間變化趨勢的特征規(guī)律,表明基于對抗生成網(wǎng)絡(luò)的模型能夠準(zhǔn)確生成大量符合要求的負(fù)荷數(shù)據(jù)。
Fig.7 Raw data load curve圖7 原始數(shù)據(jù)負(fù)荷曲線
Fig.8 Data load curve圖8 數(shù)據(jù)負(fù)荷曲線
為進(jìn)一步證明電力原始樣本與生產(chǎn)樣本之間的關(guān)系,對兩組數(shù)據(jù)使用皮爾遜分析法作相關(guān)性檢驗。皮爾遜相關(guān)系數(shù)是用來反映兩個變量線性相關(guān)程度的統(tǒng)計量。其中,r為相關(guān)系數(shù),用來表現(xiàn)兩組被測數(shù)據(jù)之間的線性相關(guān)程度,r的絕對值越大,兩組變量之間的相關(guān)性越強(qiáng);n為數(shù)據(jù)樣本數(shù)量,對應(yīng)觀測值和均值。
兩個變量之間的皮爾遜相關(guān)系數(shù)定義為兩個變量之間的協(xié)方差和標(biāo)準(zhǔn)差的商:
皮爾遜相關(guān)系數(shù)體現(xiàn)了兩者之間的線性關(guān)聯(lián)性,系數(shù)取值總是在-1~1 之間,接近0 的變量被稱為無相關(guān)性,接近1 或-1 被稱為具有強(qiáng)相關(guān)性。
利用皮爾遜分析法對本文方法獲得的數(shù)據(jù)與傳統(tǒng)支持向量法和均值生成函數(shù)法獲得的數(shù)據(jù)進(jìn)行分析,得到結(jié)果如表1、表2 所示。
從表1、表2 結(jié)果可以看出,原始的電力負(fù)荷數(shù)據(jù)與生成的電力負(fù)荷數(shù)據(jù)之間的皮爾遜相關(guān)性系數(shù)為0.971,而支持向量法的相關(guān)性系數(shù)為0.968,均值生成函數(shù)法的相關(guān)性系數(shù)為0.968。數(shù)據(jù)結(jié)果表明,本文方法比兩種傳統(tǒng)方法的相關(guān)性更強(qiáng),證明了基于對抗生成網(wǎng)絡(luò)模型在電力負(fù)荷數(shù)據(jù)生成上的可行性與優(yōu)越性。
Table 1 Descriptive statistics表1 描述統(tǒng)計
Table 2 Pearson correlation表2 皮爾遜相關(guān)性
在實驗過程中,傳統(tǒng)方法在數(shù)據(jù)生成上往往只能生成少量樣本,隨著深度學(xué)習(xí)和人工智能技術(shù)的發(fā)展,對于樣本數(shù)量的需求不斷增加。本文模型在訓(xùn)練穩(wěn)定后能充分學(xué)習(xí)原始數(shù)據(jù)分布規(guī)律,每一輪都可得到大量數(shù)據(jù)樣本,為增加神經(jīng)網(wǎng)絡(luò)的泛化能力提供了大量數(shù)據(jù)支持,可提高電力系統(tǒng)的穩(wěn)定性與可靠性。
電力負(fù)荷數(shù)據(jù)是電力設(shè)備與配電網(wǎng)設(shè)計的關(guān)鍵因素之一。社會經(jīng)濟(jì)的發(fā)展對電力設(shè)備與配電網(wǎng)設(shè)計提出了更高要求,這就需要大量精準(zhǔn)的電力負(fù)荷數(shù)據(jù)。本文基于實測數(shù)據(jù)使用DCGAN場景建模方法,通過實驗驗證了該方法在保留原始數(shù)據(jù)樣本時空規(guī)律特性等方面的能力,證明了該方法的可行性,能夠在數(shù)據(jù)樣本匱乏的情況下大量生成符合要求的數(shù)據(jù)。本文基于DCGAN的建模方法相比傳統(tǒng)場景建模方法能更好地體現(xiàn)無監(jiān)督神經(jīng)網(wǎng)絡(luò)的優(yōu)越性,可降低人為因素影響、減少訓(xùn)練時間、降低成本等。但是,如何改進(jìn)DCGAN模型以更準(zhǔn)確地把握電力負(fù)荷序列的時序特性,仍有待進(jìn)一步研究。