李文英 ,楊高才 ,文明 ,羅姝晨 ,于宗超 ,姜羽 ,王鼎湘
(1.國網(wǎng)湖南省電力有限公司經(jīng)濟技術研究院,湖南 長沙 410000;2.湖南大學 電氣與信息工程學院,湖南 長沙 410082)
電力系統(tǒng)需要滿足負荷需求,不間斷地穩(wěn)定供應電力.通過分析電力負荷的歷史行為、趨勢及影響因素,預測未來需求,稱為電力負荷預測.近年來,電力系統(tǒng)整合了多種電力資源(如可再生能源),其中具有較強波動性的風能和太陽能將負荷預測現(xiàn)象推向了一個更具挑戰(zhàn)性的階段.從電力系統(tǒng)的角度來看,可靠的預測結果可以有效減少風能和太陽能發(fā)電不確定性的不利影響,幫助調(diào)度部門及時制定和調(diào)整調(diào)度計劃,降低運行成本.負荷預測是實現(xiàn)電力供需平衡的前提,在電力規(guī)劃中起著至關重要的作用.
電力負荷的預測方法按時間尺度可分為四種:超短期預測[1]、短期預測[2-4]、中期預測[5]和長期預測[6].其中,短期負荷預測結果可為電力系統(tǒng)調(diào)度方案的制定提供依據(jù).
現(xiàn)有的負荷預測方法可分為兩類:經(jīng)典的基于模型的方法和基于機器學習的方法.基于模型的負荷預測是一種非黑箱模型[7].常用的方法有回歸分析[8]、指數(shù)平滑[9]、加權最小二乘[10]等.負荷預測結果與其驅(qū)動因素之間的對應關系是明確的,但在預測前需要了解負荷特性并明確模型類型,要根據(jù)場景選擇預測方法,保證預測的準確性.基于模型的預測方法在使用時具有極大的局限性,并且模型主要是捕獲線性關系,在處理較為復雜的時序數(shù)據(jù)時達不到理想的預測精度.
除了經(jīng)典的基于模型的方法外,由于機器學習方法能擬合時序數(shù)據(jù)各時間戳的非線性關系,基于機器學習的方法近年來也越來越受到關注.該種方法主要使用支持向量回歸、基于核的方法和前饋神經(jīng)網(wǎng)絡等,通過特征工程構造對預測結果具有因果的特征集合,最終得到時序預測模型.然而,這些模型中的大多數(shù)僅實現(xiàn)了靜態(tài)建模預測,在單獨的時間尺度上考慮信息,而不能挖掘多變量時序數(shù)據(jù)間的動態(tài)依賴關系.
深度神經(jīng)網(wǎng)絡具有較強的非線性擬合能力,能夠?qū)W習復雜的多變量時序數(shù)據(jù)表示.目前,學者們已開發(fā)出不同的深度神經(jīng)網(wǎng)絡來解決時間序列預測問題,例如使用循環(huán)神經(jīng)網(wǎng)絡及其變體,自編碼器、時間卷積和Transformer等.
由于同一街區(qū)內(nèi)的住宅可能受到相似因素的影響,各住宅的電力負荷具有一定的潛在空間依賴性.然而,現(xiàn)有的大多數(shù)基于機器學習的方法僅利用電力負荷和天氣信息等歷史時間值,未能探索這種依賴關系,不同單位之間的空間相關性[11]通常被忽略[12].圖神經(jīng)網(wǎng)絡(GNN)能夠挖掘單元間的潛在依賴關系,目前在交通流預測和風速預測等任務中的應用已經(jīng)證明了其優(yōu)越性.與深度神經(jīng)網(wǎng)絡不同,GNN 擅長對類似圖的數(shù)據(jù)結構進行建模,這使得它們非常適合捕獲電網(wǎng)中不同住宅之間復雜的潛在空間依賴性.然而,基于GNN 的時空模型卻很少用于電力負荷預測問題研究,主要由于其在使用過程中可能遇到下述問題:
1)GNN 需要圖結構作為基礎,而電力負荷數(shù)據(jù)并沒有顯示的圖結構.目前一些研究使用k-近鄰來創(chuàng)建正則的圖結構.然而當使用不恰當?shù)膋構建圖結構時,會產(chǎn)生過平滑或冗余的問題.使用較小的k構建出來的圖結構,為了聚合和更新圖結構上的全部節(jié)點信息,需要增加后續(xù)GNN 的層數(shù),然而GNN 是一種低通濾波器[13],當GNN 的層數(shù)過多時,會產(chǎn)生過平滑的問題.使用較大的k構建出來的圖結構,會將不存在的關系引入圖結構,為后續(xù)耦合關系的提取帶來誤差[14].
2)變量之間的耦合關系隨著時間的推移而變化,如何動態(tài)地捕捉變量之間的關系是一個值得考慮的問題.
3)用于捕捉時序特征的RNN(循環(huán)神經(jīng)網(wǎng)絡)/GRU(門控循環(huán)單元)/LSTM(長短時記憶網(wǎng)絡)雖然擅長描述非線性關系,但沒有考慮到因果時滯效應,對于時序數(shù)據(jù)的記憶有限,難以捕捉長期依賴關系.
針對上述問題,本文提出了一種基于小世界理論的多變量時間序列預測方法——小世界時空圖注意力網(wǎng)絡(Small-World Spatio-Temporal Graph Attention Network,SWST-GAT).在電力負荷預測中自適應的建模與捕捉同一街區(qū)內(nèi)的住宅用電量間的潛在空間依賴性,解決了現(xiàn)有多變量多步負荷預測技術中的問題.主要貢獻具體如下:
1)提出一種基于小世界特性的k-近鄰網(wǎng)絡構建技術,解決了GNN 在多變量時序分析中圖建模時存在的過平滑或冗余的問題.
2)提出了一個基于節(jié)點重要性引導的注意力機制,與圖注意層相結合,動態(tài)地捕捉變量之間的耦合關系.
3)使用門控擴張因果卷積層提取時間序列數(shù)據(jù)的因果時滯特征,捕捉長期依賴關系,并提出基于動態(tài)系統(tǒng)的復雜性和耗散性質(zhì)的超參數(shù)時間跨度和擴張率估計,幫助門控擴張因果卷積層的超參數(shù)選取.
本文提出的SWST-GAT 模型的任務是對多變量時序X∈?N×n×d進行圖結構構建后,將圖結構與多變量時序數(shù)據(jù)X∈?N×n×d輸入到ST-GCM 模塊中,使用空間卷積層提取各個變量間的耦合關系,使用時間卷積層提取每一個變量在時間維度的因果時滯關系,時間與空間卷積層交替作用,以同時提取多變量時序數(shù)據(jù)的時空特征,對變量時序數(shù)據(jù)X∈?N×n×d進行擬合,預測下一時刻的目標變量yi,t+TS+1或下一段時間的目標變量Y=[yi,t+TS+1,yi,t+TS+2,…,yi,t+TS+pr],使用最小正則化L2損失來訓練網(wǎng)絡,以構建從X到Y映射(f·).
本文提出的多變量時序多步預測模型SWSTGAT的總體框架如圖1所示,具體概括如下.
圖1 SWST-GAT的網(wǎng)絡架構Fig.1 Network structure of SWST-GAT
1)圖結構構建模塊:提出一種基于小世界特性的k-近鄰網(wǎng)絡構建技術,構建多變量時間序列的靜態(tài)圖結構G=(V,E),其中V為節(jié)點集合,每一個節(jié)點代表一個變量,E是邊集,每條邊表示邊兩端的節(jié)點間存在耦合關系.
2)ST-GCM:ST-GCM 為“三明治”結構,由NA、GCN 和GDCCN 組成.因此,NA 將度中心性引導的注意力機制(Degree Centrality Guided Attention,DCGA)和壓縮激勵模塊(Squeeze and Excitation Networks,SENet)相結合來自動學習各個節(jié)點和連邊的相對重要性,增加重要的節(jié)點和連邊的權重,抑制無用的節(jié)點和連邊的權重,同時使用GDCCN 捕捉變量的時間維度的因果時滯特征.
3)為了確定GDCCN 層的兩個關鍵超參數(shù)的選擇,提出了基于動態(tài)系統(tǒng)的復雜性和耗散性質(zhì)的TS估計和dr估計算法.
由于k的選擇關系到網(wǎng)絡的拓撲結構是否能夠反映多變量時間序列的分布,因此,鄰近數(shù)k在網(wǎng)絡構建過程中起著非常重要的作用[15].目前討論如何選擇鄰近數(shù)k的研究成果較少.當選擇較小的k時,我們將得到一個極其稀疏的隨機網(wǎng)絡,此時圖結構不連通,產(chǎn)生信息孤島,多變量間的信息并不能共享.當k逐漸增大時,網(wǎng)絡將開始向全連接網(wǎng)絡演進,網(wǎng)絡連接會逐漸變密,導致網(wǎng)絡極度冗余.圖結構的傳播效率和稀疏性可通過復雜網(wǎng)絡的網(wǎng)絡平均一致性h和網(wǎng)絡平均聚類系數(shù)ACC 進行描述,h用于衡量復雜網(wǎng)絡的全局傳輸容量;ACC 用于量化復雜網(wǎng)絡中節(jié)點之間的連接程度.其計算公式如下:
其中,h為全局效率(Global Efficiency,GE)的逆,GE與網(wǎng)絡中節(jié)點之間的距離成反比.表示節(jié)點vi到節(jié)點vj之間的最短距離.
其中,ki(ki-1)/2 是ki相鄰節(jié)點之間可能的邊數(shù),E(i)是節(jié)點vi的ki相鄰節(jié)點之間的實際邊數(shù).
因此,本文擬通過h和ACC 對圖結構傳播效率和稀疏性的定量計算,尋找兩者之間的平衡,從而確定鄰近數(shù)k.基于小世界網(wǎng)絡性質(zhì)的自適應k-近鄰選擇算法的流程如圖2所示.
圖2 基于小世界網(wǎng)絡性質(zhì)的自適應k-近鄰選擇算法Fig.2 Adaptive k-nearest neighbor selection algorithm based on small-world network properties
根據(jù)小世界網(wǎng)絡生成的過程,提出基于小世界網(wǎng)絡的鄰接矩陣生成算法,如算法1 所示.具體步驟如下:首先,根據(jù)多變量時序數(shù)據(jù)X計算任意兩個變量間的相似性S=X·XT,并進行歸一化,得到相似性矩陣S.隨后,將鄰近數(shù)k設為0,得到一個全斷開的圖結構;最后,逐漸增大鄰近數(shù)k至N,在此過程中,圖結構會逐漸變得稠密,此時ACC 逐漸變大,h逐漸變小,分別計算對應的h(A)和ACC(A),最終形成如圖2 右側所示的h(A)和ACC(A)曲線。選擇h(A)和ACC(A)曲線的交(ratio,k)作為鄰近數(shù)k,根據(jù)選擇到的鄰近數(shù)k,進行圖結構A的構建,具體定義公式如下:
其中,Neighk(vi)為距離節(jié)點vi最近的k個節(jié)點的集合.最后針對每一個節(jié)點,隨機選擇兩個未與其相連接的節(jié)點,以概率p進行連接.
由于多變量時序數(shù)據(jù)具有強耦合和大時滯的特點,變量之間的時空關系是復雜且時變的,如圖3 所示.因此我們提出一種新的ST-GCM 針對多變量時序數(shù)據(jù)的時空特性進行處理.
圖3 多變量時序數(shù)據(jù)的時空特性Fig.3 The spatiotemporal characteristics of multivariate temporal data
1.3.1 時間卷積層
GDCCN 的架構如圖4 所示,包含一個擴張因果卷積網(wǎng) 絡(Dilated Causal Convolution Network,DCCN)[16]、一個門控線性單元(Gated linear units,GLU)[17]和一個 殘差模 塊[18],GDCCN 層的計算公式為:
圖4 GDCCN的架構Fig.4 Network structure of GDCNN
其中,X和XGDCNN為GDCCN 的輸入和輸出,WG、VG、cG和bG為GDCCN 層的可學習參數(shù),*G和*D為門控卷積和擴展卷積核,σ為ReLU函數(shù),? 為哈達馬積.
1)擴張因果卷積網(wǎng)絡
不同于傳統(tǒng)非線性動態(tài)過程系統(tǒng)建模包含較多的歷史數(shù)據(jù),本文使用DCCN 解決了長期預測結果精度降低的問題.在使用CNN(卷積神經(jīng)網(wǎng)絡)或者RNN 進行長距離時間序列預測時,不可避免地需要增加CNN 的層數(shù)或RNN 的卷積核大小,此時網(wǎng)絡參數(shù)和計算量將大大增加.DCCN 使用具有空洞的CNN,可以在不增加網(wǎng)絡參數(shù)的情況下擴大卷積核的視野,如圖5 所示.擴張卷積的核心思想是將原本緊密相連的卷積核參數(shù)按照設定的比值進行擴張.擴張卷積的計算公式為
圖5 擴張因果卷積Fig.5 Dilated causal convolution network
其中,dr 為膨脹比,k為卷積核的大小,xt-dr·i為歷史數(shù)據(jù).
2)門控線性單元
GLU 是一種簡化的門控機制,可以減少梯度分散問題,保持層的非線性,加速收斂,其結構如圖6所示.
圖6 GLU架構Fig.6 Structure of GLU
GLU利用CNN和并行處理時序數(shù)據(jù)的門控機制來實現(xiàn)RNN的功能.GLU在處理時序數(shù)據(jù)時,嚴格按照時序位置保存信息,以提高性能,并通過并行處理結構加快運算速度.GLU的公式如下:
其中,XDCCN和XGDCCN是GLU 的輸入和輸出矩陣,是可學習的參數(shù),σ為ReLU函數(shù),? 為哈達馬積.
1.3.2 空間卷積層
1)節(jié)點注意力層
NA 包含一個DCGA 和一個SENet[19].NA 層的計算公式為:
其中,XNA為NA 層的輸出數(shù)據(jù),WSENet為SENet 模塊的可學習參數(shù),F(xiàn)scale,F(xiàn)ex和Fsq為SENet 的縮放、激勵和壓縮操作,AttDC∈?N×N是根據(jù)節(jié)點嵌入計算出的度中心性引導的注意力:
其中,DC(·)為度中心性計算函數(shù),矩陣E1和E2為隨機初始化的節(jié)點嵌入,在模型訓練期間可以學習,為可訓練的模型參數(shù).
作為軟注意力機制的一種應用,SENet不同于傳統(tǒng)的通過添加特征卷積層來細化特征提取任務的方法,而是根據(jù)特征響應顯式,建模特征圖通道之間的相互依賴性,自適應地重新校準通道.由于多變量時序數(shù)據(jù)是典型的時空數(shù)據(jù),因此變量之間的耦合關系會隨著時間而改變.因此,本文將使用SENet 自動學習不同通道特征的相對重要性,然后可以通過賦予不同的權重來增強或抑制相應的特征,從而提高網(wǎng)絡模型的識別精度.SENet的結構如圖7所示.
圖7 SENet的架構Fig.7 Structure of SENet
SENet 分為擠壓和激勵兩步操作.首先,SENet對輸入節(jié)點變量執(zhí)行擠壓操作,將特征形狀從N×1×TS壓縮為N×1×1,得到該層輸入節(jié)點變量的分布,其數(shù)學描述如下:
其中,x(1,t)∈?N×1是t時刻N個節(jié)點的數(shù)據(jù),TS 為網(wǎng)絡輸入數(shù)據(jù)的時間長度.壓縮操作通常采用全局最大池化或全局平均池化兩種算法,最后將全局空間信息壓縮成一個通道維度描述符xq,本文選擇全局平均池化.
激勵操作定義如下:
其 中,W1SENet∈?(TS/β×TS)和W2SENet∈?TS×(TS/β),σ是ReLU 函數(shù),β是維度變換率.
最后將得到的縮放矩陣sc的元素與圖數(shù)據(jù)的通道一一相乘,SENet的輸出定義為:
其中,sci是第i個節(jié)點向量xi的縮放系數(shù).SENet 的運行充分利用了注意力機制,使模型在訓練過程中會關注更重要的節(jié)點,從而提高模型的整體性能.
2)圖卷積層
使用Chebyshev 多項式改進的GCN 提取空間特征[20],其結構如圖8 所 示.GCN 的卷積核為gθ=是i階多項式,Λ為鄰接矩陣A的特征值.Chebyshev 多項式通過遞歸計算得到,其計算公式如下:
圖8 GCN的架構Fig.8 Structure of GCN
圖卷積核的卷積操作的計算式如下:
其中,XNA和XGCN是GCN 層的輸入和輸出矩陣,WGCN是可學習的參數(shù),*G為Chebyshev 多項式構造出的卷積核.
1.4.1 時間跨度估計
時間跨度TS 是時間卷積層GDCCN 的卷積核的大小.在前期研究準備過程中,我們發(fā)現(xiàn)現(xiàn)有文獻中對TS 的選擇是基于經(jīng)驗的.例如,交通流量預測中一般選擇24(一天24 小時)×7(一周7 天),并且這種經(jīng)驗選擇仍然用于文獻[21]中的所有多變量時序數(shù)據(jù)集.但是對于不同領域內(nèi)的數(shù)據(jù)集,例如工業(yè)或金融數(shù)據(jù)集,使用這個經(jīng)驗值是不合適的.為了解決這個問題,提出了一個時間跨度估計算子以估計GDCCN的卷積核的大小.
考慮到更有效地利用時間序列中包含的信息,使用信息論中的經(jīng)典指標:CD 和LS,估計能夠等效包含原始動態(tài)信息的時間維數(shù)的最小值[22],將其作為時間跨度TS.CD 反映了動態(tài)系統(tǒng)中不規(guī)則變化的程度.系統(tǒng)變化越復雜,CD 越大,表示系統(tǒng)演化所需的數(shù)據(jù)維數(shù)也越高.此外,任何耗散系統(tǒng)的LS 中至少有一個維度應小于0,并且所有維度之和應小于0.因此,當選擇的TS 不能覆蓋時間序列數(shù)據(jù)的時間動態(tài)時,LS 各項之和大于零.基于此,本文提出了一種基于動態(tài)系統(tǒng)分析的時間跨度估計算法.偽代碼如算法2所示.
1.4.2 擴張率估計
時間序列中的每一組收集到的多變量時序數(shù)據(jù)都是各種影響因素的綜合結果,這些影響因素大致可以分為三種:趨勢性、周期性和隨機性.每一時刻多變量的實際變化通常是由若干影響因素的疊加或組合引起的.因為工業(yè)領域的變量具有不同的物理意義,所以每個變量的趨勢和周期變化很可能是不同的.本節(jié)將變量的趨勢和周期變化定義為時間節(jié)律.
基于此,本文采用基于動態(tài)系統(tǒng)分析的方法對節(jié)律時鐘進行估計,以指導擴張率的選擇.選擇互信息(Mutual information,MI)來估計每個變量xi的時間節(jié)律T(i,i).T(i,i)的計算公式如下:
T(i,i)是I(xi)的第一個局部最小值,表示系統(tǒng)獲取信息的時間尺度.同時,我們計算T(i,j)得到變量xi和變量xj之間的延遲時間,并進行數(shù)據(jù)對齊.擴張卷積數(shù)據(jù)對齊流程圖如圖9 所示,右上角的子圖是變量之間的對齊過程.xi是要預測的變量.xj的t+T(xi,xj)時刻和xk的t+T(xi,xk)時刻與xi的t時刻對齊.右下角的子圖顯示了不同擴張率的擴張卷積對不同變量的處理.
均方誤差損失函數(shù)用于模型訓練優(yōu)化,損失函數(shù)的定義式為:
其中,n是時間序列中訓練數(shù)據(jù)的總數(shù),Y是真實值,是預測值.
根據(jù)上述SWST-GAT框架,利用Adam優(yōu)化算法在反向傳播中對每個權重參數(shù)求網(wǎng)絡誤差的梯度,通過參數(shù)更新過程得到新的權重.迭代計算模型權重,直到達到預定的小損失,并獲得最佳預測值。選擇Adam 作為優(yōu)化算法的原因是它可以為不同的參數(shù)設計獨立的自適應學習率,計算效率較高.訓練算法具體細節(jié)在算法3中給出.
本節(jié)將在電力負荷數(shù)據(jù)EL上驗證所提出的網(wǎng)絡SWST-GAT 的預測性能,EL 數(shù)據(jù)集是新加坡某電站2012~2014 年間321 個客戶的用電量(kWh),采樣頻率為15 min.數(shù)據(jù)集存放有26 304個變量數(shù)為321的樣本,采樣率為1 h.數(shù)據(jù)對應Lyapunov譜如圖10(a)所示,根據(jù)基于小世界網(wǎng)絡性質(zhì)的自適應k-近鄰選擇算法,計算得到的h和ACC(G)曲線如圖10(b)所示,因此,選定數(shù)據(jù)集時間跨度TS=4、近鄰數(shù)k=83.本節(jié)所有實驗均在Windows 系統(tǒng)上編譯和測試(CPU:Intel(R)Core(TM)i9-10900K CPU @ 3.70 GHz,GPU:NVIDIA GeForce RTX 3 090).
圖10 新加坡某電站2012~2014年間電力負荷情況Fig.10 The power load of a power station in Singapore from 2012 to 2014
針對模型的預測精度,本文使用五個評價指標對預測性能進行評價,包括平均絕對誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error,RMSE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)和相關系數(shù)(Correlation Coefficient,CC).MAE,RMSE,MAPE的值越小,CC的值越大,所評價模型的預測精度越高.
為了證明SWST-GAT 的有效性,將SWST-GAT與五個多變量時序預測模型進行比較,模型的簡要描述在表1 中列出.五個對比模型分別為TPALSTM[23]、LSTNet[24]、DCGNet[25]、Graph WaveNet[26]和MTGNN[21].TPA-LSTM 使用一組濾波器來提取時不變的時間模式.在此基礎上,提出了一種新的注意機制來選擇相關的時間序列,進行預測;LSTNet 使用CNN 來提取變量之間的短期局部依賴模式,并使用RNN發(fā)現(xiàn)時間序列趨的長期模式.同時,利用傳統(tǒng)的自回歸模型來解決神經(jīng)網(wǎng)絡模型的尺度不敏感問題;DCGNet使用深度CNN提取多變量的局部耦合特征和門控循環(huán)單元網(wǎng)絡提取時間維度的非線性動態(tài)特征;Graph WaveNet 通過建立一個新的自適應依賴矩陣,對節(jié)點嵌入進行學習,捕獲數(shù)據(jù)中隱藏的空間依賴,同時使用一維的CNN進行長序列的特征提??;MTGNN 提出一個單向圖結構生成算法,并結合DCCN和GCN對多變量數(shù)據(jù)進行預測.
表1 對比模型的簡要描述Tab.1 Brief description of the comparative model
所有比較的方法都使用滑動窗口輸入,表2 總結了六種模型的評估結果,最優(yōu)結果用紅色字體加粗顯示,次優(yōu)結果用加粗顯示.六種預測方法的真實值與預測值對比如圖11 所示,對應的預測誤差曲線如圖12 所示.從評估結果可以看出本節(jié)提出的SWST-GAT 模型預測精度最好,RMSE 和MAE 最小,CC 最大,表明真實值和預測值之間變化趨勢基本一致.
表2 模型評估結果Tab.2 Model evaluation results
圖11 不同模型的預測值與真實值Fig.11 Predicted and true values of different models
圖12 不同模型的預測值與真實值的誤差Fig.12 Error between predicted and true values of different models
基 于LSTM 的TPA-LSTM 和LSTNet 模型的MAE、RMSE 和MAPE 明顯高于其他模型,預測精度最低,表明這類模型不能輕易地適應實際值的局部趨勢.與上述兩種模型相比,結合動態(tài)RNN 的DCGNet模型的預測精度有了顯著提高,在部分數(shù)據(jù)集上取得了次優(yōu)結果,如表2 所示,在混合模型DCGNet模型的短程預測中,預測曲線符合實際趨勢.基于GCN 的Graph WaveNet 和MTGNN 與表2 中的靜態(tài)和動態(tài)循環(huán)網(wǎng)絡相比,進一步驗證了GNN 在考慮變量間耦合關系的后處理多變量時間序列方面的有效性,尤其在長程預測方面.與所提出模型的預測性能相比,這些網(wǎng)絡的預測性可以進一步提高.
此外,為了進一步評價不同預測模型的性能,引入了誤差概率分布曲線.圖13 為六種不同預測模型下預測殘差的概率分布.與其他模型相比,本文模型得到的預測值的誤差分布更接近于0,變化更小,進一步說明了本文方法的可靠性.
圖13 不同模型的預測值與真實值的誤差Fig.13 Error between predicted and true values of different models
為了證明鄰接矩陣構建的近鄰數(shù)k選擇和GDCCN 的時間跨度選擴張率的選擇的有效性,進行了消融實驗.首先定義不同的模型如下.
1)our-0.1:選擇連接最近的0.1N個鄰居.
2)our-0.8:選擇連接最近的0.8N個鄰居.
3)our-nTS:不使用時間跨度估計模塊.
4)our-nDCGA:不使用基于DCGA.
5)our-nSENet:不使用SENet模塊.
6)our-ndr:不使用擴張率估計模塊.
對于上述模型,評價指標測得的測試結果如表3所示.
表3 消融實驗結果Tab.3 Results of ablation experiments
從這些實驗結果得出的幾個結論總結如下.
1)本文提出的基于小世界網(wǎng)絡的鄰接矩陣生成算法確實可以在保證預測精度的同時減少計算量.通過與our-0.1和our-0.8的結果相對比,可以看出當近鄰數(shù)k足夠大時,即使增大k,也不會提高整體算法的性能,有時反而會造成性能的衰退.造成這種情況的原因可能是大量無關的邊相連后導致的圖結構的扭曲,與真實的多變量間的耦合情況相去甚遠,造成后續(xù)利用耦合關系進行預測的GCN 的性能的下降.若選擇的近鄰數(shù)k較小,則無法通過圖結構詳細的表示出多變量間的耦合關系,導致GCN 提取的網(wǎng)絡耦合關系不足以完成高精度的預測.
2)SENet 和NA 確實可以增加對預測影響較大的變量的權重,抑制對預測影響較小的變量的權重,提高預測精度;
3)GDCCN 的超參數(shù)選擇十分重要,當沿用經(jīng)驗設定值時,模型的效果大打折扣.造成這種情況的原因可能是時間序列中的每一組收集到的多變量時序數(shù)據(jù)都是各種影響因素的綜合結果.每一時刻多變量的實際變化通常是由若干影響因素的疊加或組合引起的.因為來自不同系統(tǒng)的變量具有不同的物理意義,所以每個變量的趨勢和周期變化很可能是不同的.
本文針對電力負荷預測中多變量間的非線性耦合特性難建模問題,提出了一種基于小世界理論的模型SWST-GAT,用于多變量時間序列的動態(tài)長程預測.針對多變量時序數(shù)據(jù)沒有清晰圖結構的問題,設計了權衡網(wǎng)絡全局效率和冗余度的圖基本結構構建算法;針對多變量時序變量間存在時滯的問題,構建了一個全新的時間卷積層以捕捉較長歷史數(shù)據(jù)內(nèi)的非線性關聯(lián)關系;針對網(wǎng)絡超參數(shù)選取憑經(jīng)驗的問題,提出了一種基于復雜動態(tài)系統(tǒng)的超參數(shù)估計方法,避免經(jīng)驗值導致長程預測效果的減弱.得到結論如下:
1)相比于使用CNN 捕獲多變量間關系的方法,多變量時序預測方法的精度更高;
2)使用GDCCN 能捕捉更加長的歷史數(shù)據(jù)的非線性特征,一定程度上緩解了長程預測精度的下降;
3)GDCCN 的超參數(shù)選擇十分重要,當沿用經(jīng)典設置值時,模型的效果大打折扣;
4)使用DCGA 與SENet 相結合,從圖數(shù)據(jù)的結構和屬性兩個層面進行動態(tài)擬合的效果要比單純使用GCN的效果好.