閆威,李南,沈月秀,施力欣,胡濱,周舟
(國網(wǎng)浙江省電力有限公司嘉興供電公司,浙江 嘉興 314000)
隨著石油、煤炭等資源的大量消耗,生態(tài)環(huán)境所受到的負面影響日益嚴重。在美國,三分之一的溫室氣體排放來自交通運輸[1],為減少溫室氣體排放,大多數(shù)國家開始注意到電動汽車這一綠色交通工具。電動汽車與電網(wǎng)之間的聯(lián)系也愈加緊密。由于電動汽車用戶充電行為的隨機性以及電動汽車充電功率的波動性,電動汽車充電行為對電力系統(tǒng)安全穩(wěn)定運行提出了重要挑戰(zhàn)[2]。而可靠的電動汽車充電負荷預測技術可以幫助電力系統(tǒng)調(diào)度中心有效應對電動汽車隨機充電所帶來的影響。因此,研究可靠穩(wěn)定的電動汽車充電負荷預測技術具有重要意義。
另一方面,由于電動汽車用戶的習慣需求不同,電動汽車的充電行為也會出現(xiàn)一定的差異。不同的電動汽車充電行為以及駕駛規(guī)律會對電動汽車日充電負荷產(chǎn)生很大的影響。因此,對不同電動汽車用戶的不同充電行為進行聚類分析,可以建立更有針對性的電動汽車充電模型,便于提取典型用戶。由此可見,合理的電動汽車用戶聚類分析工作可以提高對于不同用戶群體的特征分析水平,有利于更好地搭建不同群體的充電負荷模型。
目前,許多學者已經(jīng)在電動汽車充電負荷預測和電動汽車用戶聚類分析領域取得了很大的進展。文獻[3]提出了一種基于隨機森林算法的模型,用于充電站電動汽車充電負荷預測。文獻[4]展示了一種考慮用戶后悔心理影響的充電負荷預測方法。文獻[5]提出了一種基于出行起訖點矩陣、考慮時空分布的電動汽車負荷預測方法,由于采用蒙特卡洛法建立負荷預測模型,如參數(shù)選擇不合適,會出現(xiàn)誤差過大從而降低預測準確度的情況。文獻[6-7]考慮氣象等多種因素對于充電負荷變化的影響。文獻[8-9]采用Bass模型,考慮汽車保有量、季節(jié)特性等因素進行電動汽車充電負荷預測,而Bass 模型通常用于中長期充電負荷預測,在短期、日前預測中表現(xiàn)并不突出。近年來,機器學習領域發(fā)展迅速,各種機器學習方法被應用到各類功率、流量、負荷預測中。同時,部分學者使用機器學習方法搭建電動汽車負荷預測模型,取得了一定的成果。文獻[10]提出了基于圖WaveNet 的模型,考慮電動汽車充電樁節(jié)點信息進行電動汽車充電負荷預測。文獻[11]搭建LS-SVM(最小二乘支持向量機)、LSTM(長短期記憶)網(wǎng)絡進行充電負荷預測。文獻[12]中利用譜聚類對電動汽車負荷曲線進行聚類,針對每一組曲線進行對應預測。但上述模型在面對復雜信息時難以挖掘分析數(shù)據(jù)之間的深層關系,并且網(wǎng)絡中參數(shù)較多,訓練網(wǎng)絡模型時待優(yōu)化參數(shù)過多,使得訓練時間過長。
目前,GAN(生成對抗網(wǎng)絡)是機器學習領域新興的的神經(jīng)網(wǎng)絡算法,GAN可有效捕捉輸入信息之間的深層聯(lián)系,面對復雜信息的輸入時,擁有較強的特征分析能力。文獻[13]中使用GAN實現(xiàn)壓縮采樣馬賽克圖像的顏色恢復。文獻[14]搭建了用于股票價格信息預測的GAN 模型。文獻[15]提出了一種輕量級actor-critic 的生成對抗網(wǎng)絡,將GAN 模型與actor-critic 相連,使得GAN有著更好的動態(tài)性能以及在線學習能力,提高微電網(wǎng)的魯棒性與適應性。
GAN 已經(jīng)在其他領域取得了大量的應用成果,但是在電動汽車充電負荷預測領域的研究并不深入。因此,考慮到充電負荷受到用戶群體充電習慣差異、氣象信息、歷史負荷等因素的影響,建立了基于CNN-GAN(卷積神經(jīng)網(wǎng)絡-生成對抗網(wǎng)絡)的電動汽車充電負荷預測模型,通過對比多種機器學習算法,驗證本文所提出方法的可行性。
GAN是由生成模型G與判別模型D組成的神經(jīng)網(wǎng)絡模型[16]。其中,生成模型目標是分析真實樣本的深層分布信息,模擬真實樣本的詳細分布,制造與真實樣本極其相似的虛擬樣本;判別模型的目標是能夠準確識別輸入樣本是虛擬樣本或真實樣本,并輸出對應結果。GAN結構如圖1所示。
圖1 GAN結構Fig.1 GAN structure
生成模型和判別模型通過最大、最小博弈,在更新優(yōu)化過程中,對生成模型和判別模型分別進行更新,最終達到納什均衡狀態(tài)。由于當輸入數(shù)據(jù)是x或G(z)時,判別模型的最后結果只能為1或0,所以判別模型基于交叉熵的損失函數(shù)如式(1)所示:
式中:E為期望函數(shù);log為自然對數(shù)。
生成模型目標為生成能過“騙過”判別模型的虛擬樣本,因此其損失函數(shù)如式(2)所示:
生成模型與判別模型持續(xù)進行最大最小博弈,不斷提高對應的生成能力或判別能力,直到完成更新優(yōu)化練過程,因此GAN基于交叉熵的損失函數(shù)為:
基于CNN-GAN 的電動汽車負荷預測流程如圖2所示,主要包括GMM(高斯混合模型)聚類分析、數(shù)據(jù)集構建、GAN更新訓練過程。
至于太陽中為何為會有“雞”呢?自宋代以來,更有不少學者曾試圖為其尋找可能的說解與答案。如在《云笈七籖》卷五十六《諸家氣法》中說:
圖2 預測流程Fig.2 Prediction flow
GMM聚類分析是針對大量電動汽車充電樣本進行聚類分析。數(shù)據(jù)集構建過程依據(jù)GMM 聚類分析結果,針對每一組進行對應數(shù)據(jù)預處理,選擇多種對于充電負荷預測影響較大的元素,確定輸入數(shù)據(jù)形式以及訓練樣本與測試樣本個數(shù)。在GAN更新訓練過程中,由完成數(shù)據(jù)預處理的訓練樣本作為真實樣本,將一組隨機高斯噪聲向量作為生成模型初始輸入;生成模型將生成虛擬樣本與真實樣本共同送入判別模型,判別模型輸出判別結果,通過半監(jiān)督回歸得到預測值;根據(jù)各模型的損失函數(shù)計算各層網(wǎng)絡誤差,反向傳遞誤差,順序更新D與G,最終獲得各參數(shù)最優(yōu)權重。
完成訓練后,使用各組對應GAN預測模型進行預測,并與其他方法進行對比。在對比驗證環(huán)節(jié),各對比方法使用相同的測試樣本數(shù)據(jù)集,采用百分比偏差λMAPE與均方根誤差λRMSE兩項指標評價各方法準確性。
電動汽車充電負荷的時間分布主要由充電電量、充電速度和充電時間3個方面決定。因此,選取上述3種因素作為GMM聚類分析的特征向量。
GMM由多個高斯分布函數(shù)線性組合[17]。其基本形式如式(4)所示:
式中:u代表三維特征向量;λ代表GMM 模型參數(shù),包括均值、協(xié)方差、權重;K代表子高斯分布個數(shù);Ck為第k個模型概率,?(x|λk)為第k個子模型高斯分布密度函數(shù)。
通過EM(期望最大化)算法計算得到各項參數(shù),該算法分為E和M兩個步驟。
在E 步驟中依據(jù)當前參數(shù)計算第j個數(shù)據(jù)uj來自于模型k的概率rjk,即:
在M 步驟,計算新一輪迭代參數(shù),包括更新均值、協(xié)方差矩陣和權重系數(shù),可分別表示為:
式中:N為樣本數(shù)量。重復E 步驟與M 步驟,直到│λi+1-λi│<ε,結束迭代。
完成GMM聚類分析后得到3組聚類結果,根據(jù)不同的用戶標簽,分別計算第一、二、三組的日充電負荷;重復計算得到多周的各組充電負荷日數(shù)據(jù)。
根據(jù)聚類結果,構建每組數(shù)據(jù)集。多數(shù)用戶的出行存在一些周期性規(guī)律,同時與氣溫、降雨量等氣象因素密切相關。因此,為了提取用戶出行規(guī)律與預測日充電負荷的內(nèi)在關系,選擇氣溫、降雨量、濕度、歷史負荷等信息作為輸入數(shù)據(jù),如表1所示。
表1 輸入數(shù)據(jù)構成Table 1 Input data composition
表中預測日日期周一至周五設置為0.2~0.6,周六、周日為2.2 與2.7,可以更好區(qū)分工作日與非工作日。
傳統(tǒng)的深度學習模型由于網(wǎng)絡架構較為復雜,導致網(wǎng)絡待訓練參數(shù)過多,出現(xiàn)優(yōu)化時間較長甚至網(wǎng)絡崩潰的問題。CNN 擁有較強的特征提取能力,共享卷積核以及權值共享技術,很大程度上減少了待訓練參數(shù)的個數(shù),因此采用CNN搭建生成模型與判別模型,可以提高GAN模型的特征提取能力以及面對陌生樣本時的泛化能力,提高模型訓練效率及充電負荷的預測準確性。
2.3.1 生成模型
生成模型目標為學習模擬x的深層特征信息,提高自身的模擬能力,使得其生成的虛擬樣本G(z)可以混淆判別模型的識別,因此使用反卷積層搭建生成模型,便于放大樣本的真實分布。同時考慮到二維卷積模型在面對大量樣本時,抗噪能力優(yōu)于一維卷積模型,因此采用全連接層以及重組層將輸入數(shù)據(jù)轉(zhuǎn)換為二維數(shù)據(jù),然后利用多個反卷積層以及ReLU(線性整流函數(shù)層)[18]提取深層特征信息,增強虛擬樣本的真實性,最后通過全連接層以及tanh 函數(shù)激活轉(zhuǎn)換為虛擬樣本的輸出規(guī)格,獲得虛擬樣本。生成模型的具體結構如圖3所示。
圖3 生成模型結構Fig.3 Structure of the generative model
本文生成模型的目標為模擬真實輸入樣本,生成與真實樣本相似的虛擬樣本,因此,生成模型的損失函數(shù)如式(9)所示:
式中:f(·)為判別模型中間層對應輸出。生成模型將通過不斷優(yōu)化減小LG使得虛擬樣本與真實樣本差別不斷縮小。
2.3.2 判別模型
判別模型同樣采用CNN進行搭建,由于判別模型主要進行特征提取的工作,方便判別模型識別x與G(z)之間的差別,增強其對于輸入樣本的識別能力,因此在網(wǎng)絡結構中采用卷積層進行搭建,如圖4所示。首先,將輸入的虛擬樣本與真實樣本通過全連接層與重組層轉(zhuǎn)換為二維數(shù)據(jù),便于二維CNN計算;然后通過多個卷積層,池化進行卷積計算,提取樣本關鍵特征信息;最后通過全連接層輸出判別模型結果,通過半監(jiān)督回歸輸出充電負荷預測值。
圖4 判別模型結構Fig.4 Structure of the discriminative model
在判別模型中,輸出分為兩部分,第一部分為傳統(tǒng)判別模型輸出,其損失函數(shù)表示為Lunsup;第二部分為半監(jiān)督回歸輸出,損失函數(shù)表示為Lsup;則總損失函數(shù)LD表示如下:
2.3.3 更新訓練
本文GAN 預測模型通過Adam 交替更新訓練D與G,其中學習率設定為0.01,迭代次數(shù)設置為50,訓練步驟如下:
1)一組噪聲向量輸入至生成模型,得到一組虛擬樣本。
2)將虛擬樣本及其對應的真實樣本送入GAN判別模型,利用半監(jiān)督回歸得到充電負荷預測結果。
3)通過式(12)與鏈式法則計算判別模型中各層的誤差,判別模型的參數(shù)將通過Adam算法進行更新。
4)將判別模型的預測誤差反向傳回至生成模型,計算G各層誤差,更新生成模型的各層網(wǎng)絡參數(shù)。
5)進行下一批訓練樣本,并重復步驟1—4,直到所有電動汽車充電負荷訓練樣本遍歷一次。
6)當完成預設的迭代次數(shù)時,可以結束模型的訓練更新。否則,再次重復步驟1—5,更新訓練GAN模型,結構如圖5所示。
圖5 訓練結構Fig.5 Training structure
本文采用平均百分比偏差λMAPE與均方根誤差λRMSE兩項評價指標評價各方法預測效果,具體形式如下:
式中:與分別為i時刻充電負荷預測值與真實值。
為驗證本文所提出的CNN-GAN 預測模型的可行性,采用華東某地8 周的電動汽車充電樣本,將其分為兩部分,其中前6周電動汽車樣本作為訓練樣本,用于訓練CNN-GAN 預測模型,后2 周電動汽車樣本作為測試樣本,測試模型預測效果。首先通過GMM聚類分析,得到3組聚類結果,構建數(shù)據(jù)集。針對每1組用戶,將對應數(shù)據(jù)集送入各方法預測模型,各方法預測模型所輸入的訓練樣本集與測試樣本集完全相同。其中,負荷數(shù)據(jù)的時間步長為15 min,即每日可分為96 個時刻,采用本文所提出的預測方法與ANN(人工神經(jīng)網(wǎng)絡)、SVM(支持向量機)和ELM(極限學習機)3種預測方法進行對比,各組預測結果如圖6—8所示。
圖6 第一組預測結果Fig.6 The first set of prediction results
圖7 第二組預測結果Fig.7 The second set of prediction results
圖8 第三組預測結果Fig.8 The third set of prediction results
由圖6—8 可以看出,第一組與第三組用戶充電時間主要集中在白天,夜間存在少部分用戶,其中,第一組用戶充電負荷峰值出現(xiàn)在12:00 左右,充電負荷峰值較大,同時,該組用戶快充比例較大,充電時間較短并且主要集中于午間;第三組用戶充電負荷峰值出現(xiàn)在2:00 左右,相比第一組用戶,該組慢充用戶比例略有上升,充電時間主要集中于下午,夜間存在部分用戶;第二組用戶充電負荷變化趨勢與其他兩組相反,在白天出現(xiàn)低谷,該組用戶更傾向于長時間慢充,充電時間多集中于夜間。在預測效果方面,由圖6可以看到,第一組黑色區(qū)域中,ELM方法出現(xiàn)了較為明顯的偏差,同時ANN 方法相比SVM 與CNNGAN方法也存在較大的偏差。在第二組預測效果方面,圖7 中黑圈范圍內(nèi)ANN 方法存在較大的預測波動,SVM方法預測波動較為頻繁,而本文所提出的CNN-GAN 方法與實際充電負荷曲線較為貼近,實際負荷偏差較小。在第三組中,由于樣本數(shù)量較少,導致各方法預測精度出現(xiàn)一定的下降,但CNN-GAN 方法相比其他方法與真實曲線更為貼近。
表2為各項指標的對比,可以發(fā)現(xiàn),本文所提出方法的λMAPE、λRMSE明顯優(yōu)于其他預測方法。各組用戶群體預測中CNN-GAN模型的λMAPE分別為3.69%、3.41%、4.34%,對比ELM 方法的λMAPE最大提升7.7%,λRMSE也低于其他3 種預測方法,由此可見,CNN-GAN 預測方法的精度高于其他方法。
本文考慮電動汽車用戶的充電習慣對于充電負荷的影響,采用GMM 對電動汽車充電樣本進行聚類分析,分析不同電動汽車用戶群體之間的充電行為差異區(qū)別,提取典型用戶行為特征;針對各組用戶群體建立基于CNN-GAN 與半監(jiān)督回歸的模型進行電動汽車充電負荷預測,該模型以天氣因素及歷史負荷數(shù)據(jù)為輸入,經(jīng)過生成模型與判別模型的對抗訓練,最終通過半監(jiān)督回歸輸出預測結果,提高了預測準確率。在結果分析中,本文對比了多種方法在各組用戶群體充電負荷預測的結果,證明了本文提出的方法在預測精度上的優(yōu)勢。電動汽車負荷影響因素較多,本文用戶數(shù)據(jù)樣本僅考慮了充電電量,充電速度以及充電時間3個主要因素的影響,后續(xù)工作將針對用戶不同的駕駛需求進行分析研究。