顧 潔,孟 璐,鄭睿程,金之儉
(上海交通大學電子信息與電氣工程學院,上海市200240)
智能電網(wǎng)高級計量體系(advanced metering infrastructure,AMI)的廣泛應用[1],為用戶行為特性分析等提供了海量、精細化的負荷數(shù)據(jù),有助于供電企業(yè)和綜合能源服務商等制定個性化的售電服務策略[2]。人工智能技術的蓬勃發(fā)展以及電力行業(yè)海量數(shù)據(jù)的累積,促進了用電數(shù)據(jù)分析與預測中數(shù)據(jù)驅動技術的研究,產(chǎn)生了豐富的理論研究與實際應用成果[3]。
目前,國內(nèi)外學者對用戶用電模式的相關研究工作主要圍繞聚類特征提取及聚類算法的改進開展。按輸入特征不同,聚類算法可分為直接聚類法和間接聚類法。文獻[4-5]直接以時間序列作為聚類算法的輸入特征,使用k-means聚類算法對用戶用電模式進行直接聚類,具有收斂速度快等優(yōu)勢;文獻[6]使用主成分分析法、文獻[7]使用自編碼器對用電時間序列進行降維處理,以實現(xiàn)間接聚類,改善聚類效果。在聚類算法改進方面,文獻[8]針對智能用電行為最佳聚類數(shù)的選擇問題,提出聚類數(shù)優(yōu)選策略;文獻[9]對k-means聚類算法進行了改進,遍歷所有可能聚類數(shù),可以有效提取出用戶用電模式,但計算效率低。上述聚類方法因缺少分布式與并行化的改良,應用于海量用戶分析時存在計算效率較低和適應性不高的問題。
單一用戶或小規(guī)模區(qū)域用戶的負荷變化具有較強的不確定性,為量化負荷預測結果的不確定性、降低預測風險,近年來,負荷預測概率建模的方法成為研究熱點[10],預測結果一般以概率密度、分位點和置信區(qū)間等形式呈現(xiàn)[11-12]。文獻[13]使用極值預測法預測日最高負荷與日最低負荷,從而實現(xiàn)區(qū)間預測,但所反映的信息較為單薄;文獻[14]基于小時的電力負荷數(shù)據(jù)建立線性回歸模型,并結合歷史溫度數(shù)據(jù)與未來生產(chǎn)總值規(guī)劃數(shù)據(jù),對美國某地區(qū)的系統(tǒng)負荷進行分位數(shù)概率預測。針對用戶側負荷預測,基于長短期記憶(long short-term memory,LSTM)具有對歷史行為的記憶特性,文獻[15-16]使用LSTM進行居民用戶負荷的超短期預測,但文獻[16]未考慮海量用戶的計算開銷問題。目前,針對用戶側短期負荷概率預測的研究主要是從用戶集合總體進行概率建模,根據(jù)用戶個體用電特性的分析進行分層預測研究成果較少,較為粗放式的預測策略在海量用戶場景下可能會導致預測精度降低。
目前,針對用戶側的負荷預測的研究主要集中在居民負荷預測,而工商業(yè)用戶一直是中國電力消費的主力軍,且需求響應潛力較大[17]。隨著中國電力市場改革的不斷推進,無論是售電企業(yè)還是電網(wǎng)調度運營機構等都需要對工商業(yè)負荷進行高效且準確的預測[18]。對于工商業(yè)負荷,一方面,由于用戶數(shù)據(jù)保密等原因,單個工商業(yè)用戶歷史負荷數(shù)據(jù)可能存在較多缺失,影響了完全基于歷史數(shù)據(jù)外推的預測模式的有效性;另一方面,不同種類工商業(yè)負荷變化存在相似性,發(fā)展規(guī)律可以參考借鑒[19]。因此,嘗試對工商業(yè)用戶進行集群識別,同一集群統(tǒng)一建模,在相似用戶之間進行數(shù)據(jù)互補,從而提高工商業(yè)用戶的負荷預測精度。
針對上述研究現(xiàn)狀,本文對基本聚類模型進行改進,使用用電模式分層聚類算法,并基于用電模式與畫像特征對海量用戶進行了用戶集群辨識,進一步將用電模式分析與集群辨識融合建立了條件殘差模擬概率預測模型,對海量用戶進行分層概率預測,并采用中國南方某地區(qū)的工商業(yè)用戶實際用電數(shù)據(jù)[20]進行算例分析。
用電模式分析時可使用的用戶相關信息包括智能電表量測數(shù)據(jù)和對用戶的問卷調查結果,其中智能電表量測數(shù)據(jù)詳實地記錄了用戶每個固定時間間隔內(nèi)的用電情況,而用戶問卷調查結果則是對用戶特征信息的有力補充??紤]到實際應用場景中對所有用戶都開展用戶調查問卷難以實施,因此,本文算例部分將以基于智能電表量測數(shù)據(jù)進行用戶模式分析為例進行驗證討論。
對海量用戶進行用電模式提取時,將所有用戶的數(shù)據(jù)統(tǒng)一進行全局聚類易產(chǎn)生巨大的計算時間開銷?;诜謱泳垲惖挠秒娔J椒治瞿芫C合全局聚類和局部聚類的優(yōu)勢[21],具有動態(tài)改變聚類數(shù)目、收斂速度較快和大幅度降低計算時間開銷等優(yōu)點,達到聚類質量和計算復雜度的平衡。用電模式分層聚類算法流程圖如附錄A圖A1所示。
本文采用以下步驟實現(xiàn)海量用戶用電模式的分層聚類分析。
步驟1:為保障聚類的特征具有典型性,首先對所有用戶用電數(shù)據(jù)的總數(shù)據(jù)集進行k-means聚類,將用戶分為L組,將各組的用戶用電數(shù)據(jù)作為局部數(shù)據(jù)集,并分別使用局部聚類模型對子數(shù)據(jù)集進行局部聚類。當聚類中心不再改變時,輸出局部聚類結果。
步驟2:將L個局部聚類子模塊得到的局部聚類中心集合后使用全局聚類模型進行全局的二次聚類。當聚類中心不再改變時,輸出全局聚類結果。
步驟3:根據(jù)全局聚類得到的聚類標簽隸屬關系,更新局部數(shù)據(jù)模塊的局部聚類標簽,即為用戶的用電模式標簽。
構建單用戶負荷與聚合負荷之間的層次結構,即辨識用戶集群需要綜合用戶典型用電模式和用戶用電模式行為信息熵這2類指標,構成用戶特征向量,對用戶進行綜合特征建模。其中,典型用電模式可以提取到具有代表性的用戶用電模式;用戶用電模式信息熵可以刻畫用戶用電的不確定性。
1)用戶典型用電模式
假設一段時間內(nèi)用戶共有d個歷史用電模式,其序列為mi,i=1,2,…,d,定義典型用電模式mcls為歷史用電模式序列中最大比例的用電模式標簽,用戶典型用電模式是用戶特征向量的一部分。
2)用戶用電模式行為信息熵
基于每個用戶一段時間內(nèi)的歷史用電模式序列mi,以該序列的信息熵來表示用戶用電行為的不確定性。定義第n個用戶用電模式行為信息熵En為:
式中:S為用戶數(shù);pi,n為行為狀態(tài)i在第n個用戶中出現(xiàn)的概率,其表達式為
式中:I(x)為指示函數(shù),滿足條件x時,值為1,否則為0;sj,n為第n個用戶的第j個用電模式。
行為信息熵能夠描述用戶用電行為的不確定性:若用戶的行為標簽出現(xiàn)概率都等于1/d,用戶的用電行為多變,En最大;反之,當某種行為標簽一直出現(xiàn)時,此時pi,n=1,剩余的行為標簽出現(xiàn)概率為0,表示用戶用電行為最穩(wěn)定,En=0。
將用戶典型用電模式和用戶用電模式行為信息熵這2類指標拼接形成用戶特征向量后,基于用戶特征向量對用戶進行集群辨識,以確定其所屬的用戶集群,為分層預測設計提供依據(jù)。用戶聚類與可視化模型的過程如圖1所示。
圖1 用戶集群辨識模型過程Fig.1 Process of identification model for user cluster
由于不同用戶的用電習慣和負荷特性存在差別,直接對聚合負荷進行預測無法捕捉負荷的具體特征,而對每個用戶進行逐一建模則會導致計算量過大,海量用戶的負荷預測需要實現(xiàn)預測準確度與復雜度的平衡。
傳統(tǒng)的輸出側殘差模擬負荷概率預測模型一般基于歷史殘差構建經(jīng)驗分布,并依據(jù)經(jīng)驗分布生成殘差的模擬結果。由于殘差并不一定滿足特定的分布形式,導致這種預測方法存在較強的主觀性,影響預測結果有效性。因此,可以考慮將模型側概率建模與輸出側概率建模進行結合,建立條件殘差模擬負荷概率預測模型,提升模型對殘差的表達能力。
2.1.1 條件殘差模擬負荷概率預測的基本思路
用戶行為特性變化復雜,不確定性高,殘差與多種不同特征相關且形式復雜,條件殘差模擬預測模型計及天氣、日期和歷史負荷的影響,使用表達能力更強的機器學習模型對殘差進行模擬,具有更強的預測能力。同時,為了計及殘差模擬的不確定性,引入模型側概率預測中的分位數(shù)回歸模型。
2.1.2 條件殘差模擬負荷概率預測流程
條件殘差模擬負荷概率預測步驟如附錄A圖A2所示,包括訓練階段和測試階段。訓練階段又分為點預測訓練和條件殘差概率預測訓練,為避免“過擬合”,在按經(jīng)典的8∶2原則劃分訓練集與測試集的基礎上,再將訓練集數(shù)據(jù)平分,分別用于點預測與概率預測階段的模型訓練,故總數(shù)據(jù)集按照4∶4∶2的比例被分割為訓練數(shù)據(jù)集T1、訓練數(shù)據(jù)集T2和測試數(shù)據(jù)集T3這3個部分。在點預測模型訓練階段,考慮到工商業(yè)用戶用電與天氣、日期等因素密切相關[22],輸入特征包括氣溫等天氣情況、日歷變量和歷史負荷變量等,將數(shù)據(jù)集T1輸入到點預測函數(shù)f(?)進行訓練。點預測模型訓練完畢后,計算出T2的點預測結果為:
式中:W和Xt分別為點預測函數(shù)的參數(shù)和時刻t的輸入特征;y′t為時刻t的點預測值。
時刻t的點預測殘差εt為:
式中:yt為時刻t的點實際值。
在條件殘差模擬概率預測訓練階段,輸入特征包括點預測結果、天氣變量、日歷變量和歷史負荷變量等,將數(shù)據(jù)集T2輸入分位數(shù)回歸函數(shù)gq(?)進行訓練。待訓練完畢后,可得在時刻t殘差的q分位數(shù)εq,t為:
式中:Wq為分位數(shù)回歸模型函數(shù)的參數(shù)。
點預測模型與殘差概率預測模型訓練完成后,在測試階段基于測試數(shù)據(jù)集T3求得點預測結果與殘差預測結果,并將點預測結果減去殘差預測結果得到最終的概率預測結果。
實際系統(tǒng)中,負荷預測對象包括全部用戶形成的聚合負荷和單個用戶的負荷。由于用戶的用電習慣和負荷特性存在差別,若直接對所有用戶使用同樣的模型進行訓練與預測,即直接對聚合負荷總體進行預測,將會導致無法捕捉負荷的具體特征,從而降低預測精度;反之,若對每個用戶都進行單獨的模型訓練與預測,則會導致計算量過大且模型泛化能力差,還可能因單個用戶的數(shù)據(jù)量過少而難以確保模型得到充分訓練。
用戶集群辨識能夠將特性相似的用戶聚類生成用戶子集,建立基于用戶集群劃分的用戶側分層預測模型。對各子集內(nèi)用戶采用統(tǒng)一模型進行預測,實現(xiàn)子集間差異化和子集內(nèi)統(tǒng)一的預測模型,達到預測準確性與預測復雜性的協(xié)調。
用戶負荷的層次結構如圖2所示。第1層為聚合負荷,即全部用戶的負荷之和;第2層的子聚合負荷為基于用戶集群劃分的結果,假設共有V個子聚合負荷,每個子聚合負荷代表該集群所對應的用戶的負荷之和;第3層為各個單一用戶的負荷。
圖2 聚合負荷的結構Fig.2 Structure of aggregated load
為了避免上述直接對聚合負荷進行預測和對單用戶負荷逐一進行預測的弊端,對第2層即子聚合負荷進行模型訓練,即對每個用戶集群由該集群下的用戶的數(shù)據(jù)訓練得到負荷預測模型。對單用戶負荷使用其所屬的用戶集群的模型進行預測。
基于用戶集群Ak數(shù)據(jù)訓練得到條件殘差模擬概率預測函數(shù)hk(?)。假設用戶u屬于用戶集群Ak,則用戶u負荷lu,k的預測結果為:
式中:Fu為用戶u的輸入特征。
聚合負荷ltotal的預測結果為:
這種分層預測方式,將具有相似特征的用戶聚合后進行統(tǒng)一建模,既避免了對所有用戶采用統(tǒng)一模型導致的欠擬合問題,又避免了對每個用戶進行精細化建模時由于數(shù)據(jù)量較小導致的過擬合問題。
基于用戶集群辨識的分層負荷概率預測步驟如下。
步驟1:對天氣、日歷等輸入特征以及負荷的原始數(shù)據(jù)進行預處理。其中,天氣變量為溫度;日歷變量包括小時、日期類型、月份和節(jié)假日。同時,考慮到工商業(yè)用戶自身生產(chǎn)習慣引起的用電行為較為規(guī)律,因此,輸入變量也包括用戶自身的歷史負荷數(shù)據(jù)。
步驟2:通過用電模式分層聚類算法提取用戶的用電模式標簽,將用戶典型用電模式和用戶用電模式行為信息熵組成用戶特征向量,對用戶進行集群識別。
步驟3:分別基于各集群負荷數(shù)據(jù)、天氣和日歷等數(shù)據(jù)進行離線訓練,建立該集群基于條件殘差模擬的概率預測模型。
步驟4:基于實時數(shù)據(jù)和已訓練好的模型對聚合用戶或者單個用戶的負荷進行預測。
基于用戶集群辨識的分層負荷概率預測流程圖如附錄A圖A3所示。
基于中國南方某地區(qū)的工商業(yè)用戶實測數(shù)據(jù),對所提出的用戶用電分析模型、用戶集群辨識和概率預測模型進行計算分析,與對比預測模型進行比較,驗證本文模型的有效性。
該數(shù)據(jù)集是中國南方某地區(qū)共計約30 000個工商業(yè)用戶的實測數(shù)據(jù),屬于私有數(shù)據(jù)集。數(shù)據(jù)集時間范圍為2010年1月到2011年7月共計577 d,工商業(yè)用戶負荷數(shù)據(jù)的采樣周期為15 min,工商業(yè)用戶涵蓋了科研機構、商業(yè)、輕工業(yè)及重工業(yè)等行業(yè),沒有用戶的問卷調查數(shù)據(jù)。
本文使用平均絕對百分比誤差(mean absolute percentage error,MAPE)對點預測精度進行評價,具體表達式為:
式中:εMAPE為MAPE的值;N為樣本數(shù)。
綜合評價概率預測的精度,需同時考慮概率預測的分辨率、銳度和可靠性,采用2014年全球能源預 測 競 賽(2014 Global Energy Forecasting Competition,GEFCom2014)[23]和GEFCom2017[24]提出的概率預測評估方法:分位數(shù)得分(quantile score,QS)作為衡量概率預測精度高低的指標。QS的計算基于Pinball損失函數(shù)fpinball(?)實現(xiàn),具體為:
式中:q為分位點;y′t,q為在時刻t分位點q的分位數(shù)回歸值。
QS的計算公式為:
式中:εQS為QS的值;M為分位點數(shù)。
利用前述中國南方某地區(qū)工商業(yè)用戶為期一年的訓練集數(shù)據(jù),應用用電模式分層聚類算法,提取出典型用電模式共20種,如附錄A圖A4所示。
由工商業(yè)用戶日用電模式聚類結果可看出,提取出的用電模式特征和不同用電模式間差異均較為明顯,具體如下。
1)大多數(shù)負荷曲線呈現(xiàn)單高峰的形態(tài)。其中一部分(例如用電模式2)高峰時間主要分布在工作時間(09:00—21:00),對應一般商業(yè)、科研機構和一部分工業(yè)用戶;另一部分負荷曲線(例如用電模式1)高峰時間分布在夜間,主要對應金屬冶煉等重工業(yè)用戶,考慮到較大的用電成本,這些用戶往往選擇錯峰用電。
2)部分負荷曲線(例如用電模式13)整體呈現(xiàn)出較好的連續(xù)性,負載率不高,白天的整體負荷高于夜間,對應用電量不大的輕工業(yè)用戶。其中,在04:00和18:00,該類負荷曲線出現(xiàn)較大程度下降,可能是由于工人換班造成。
3)部分負荷曲線(例如用電模式17)呈現(xiàn)出很強的波動性,且沒有在特定時間出現(xiàn)峰值,對應工藝流程復雜、各設備用電差異較大的工業(yè)用戶,此類用戶進行不同工序時,負荷需求變化較大。
對用戶構造基于用電模式與畫像特征的用戶特征向量,采用T分布隨機鄰域嵌入(T-stochastic neighbor embedding,T-SNE)算法[25]進行用戶集群辨識結果可視化,結果如圖3所示。
由圖3可知,本文所建立的用戶集群辨識算法能較好地將用電模式相似的用戶聚集。
基于用戶集群辨識結果,工商業(yè)用戶各集群的用戶數(shù)量與部分特征平均值的標幺值如表1所示。
由表1可知,用戶集群3的行為信息熵更小,這些用戶的負荷波動性更弱,主要為科研機構用戶。用戶集群2的典型用電模式均值最大,這些用戶的負荷需求平均水平較高,主要為重工業(yè)/建筑行業(yè)。用戶集群1、4和5具有較大的行為信息熵,同時,負荷的需求水平一般,主要為商業(yè)用戶,由于溫度、季節(jié)等因素對商業(yè)用戶用電行為影響顯著,其負荷會呈現(xiàn)出較強的波動性。
圖3 工商業(yè)用戶集群辨識可視化結果Fig.3 Visualized identification results of industrial and commercial user cluster
表1 工商業(yè)用戶各集群的用戶數(shù)量與部分特征均值Table 1 N umber of users in each industrial and commercial user cluster and average values of some features
3.4.1 條件殘差模擬負荷概率預測
以對聚合負荷的預測為例,對比本文提出的概率預測模型與其他概率預測生成方法的結果,對比模型如下。
1)對比模型1:單純使用本文提出的條件殘差模擬概率預測模型,不使用組合預測與變量選擇等進行優(yōu)化。
2)對比模型2:不使用本文概率預測模型,使用基礎的基于分位數(shù)回歸的模型側負荷概率預測生成方法。
3)對比模型3:不使用本文概率預測模型,使用基礎的基于殘差模擬的輸出側負荷概率預測生成方法。
4)對比模型4:隨機森林分位數(shù)回歸模型。
5)對比模型5:梯度提升樹分位數(shù)回歸模型。
6)對比模型6:神經(jīng)網(wǎng)絡分位數(shù)回歸模型。
將數(shù)據(jù)集的順序隨機打亂后,取前80%的數(shù)據(jù)作為訓練集,后20%的數(shù)據(jù)作為測試集。本文所提方法則將訓練集分為同樣數(shù)據(jù)量的2個部分:一部分用于訓練負荷預測模型;另一部分用于訓練殘差預測模型。
本文模型與6個對比模型的預測精度與預測負荷曲線圖如表2、圖4和附錄A圖A5所示,主要結論如下。
1)本文模型的點預測精度與概率預測精度均為最優(yōu)。
2)對比模型1由于不使用組合預測或變量選擇等方法對點預測模型進行優(yōu)化,使得點預測精度有所降低,但是由于概率預測時使用了本文提出的條件殘差模擬模型,概率預測精度相對于其他對比模型仍有一定優(yōu)勢。
3)對比模型2的點預測精度較本文模型有所降低,與對比模型1的點預測精度相近,但對比模型2使用分位數(shù)回歸模型造成概率預測精度不甚理想,從負荷曲線圖可看出,模型側概率預測模型的概率預測結果范圍較寬,可靠性較高但銳度不足。
4)對比模型3的點預測模型與對比模型1一樣,有著相同的點預測精度,但對比模型3的輸出側殘差分布概率預測生成方法的概率預測精度十分不理想。根據(jù)負荷曲線圖可看出,殘差分布趨向于負向,這是由于訓練集與測試集的真實殘差分布不一致導致的。
5)對比模型4和5的點預測及概率預測精度都劣于本文模型。附錄A圖A5表明,對比模型5在不同分位點的預測結果較為均勻地分布在真實值兩側,與對比模型3中不同分位點預測結果主要分布在真實值下方相比,對比模型5在概率預測方面有一定優(yōu)勢。
6)對比模型6在點預測方面優(yōu)勢顯著,預測精度明顯高于其他對比模型,接近本文模型的預測精度。但基于神經(jīng)網(wǎng)絡的預測模型結果受參數(shù)影響非常大,模型訓練需要不斷嘗試,找到層數(shù)和神經(jīng)元數(shù)的最優(yōu)參數(shù),整個建模過程比較復雜。對比模型6的概率預測效果較差,雖然銳度較高,但可靠性不足,不能提供足夠的預測信息。
總體上,本文模型在點預測和概率預測方面均取得了更好的預測效果,通過組合預測、變量選擇和分層預測有效提升了精度。從概率預測評價指標QS來看,本文模型通過分位數(shù)回歸有效提升了對殘差的表達能力,改進了概率預測結果。
3.4.2 不同用戶分層策略的單用戶負荷預測結果分析
使用某地區(qū)實際負荷數(shù)據(jù)對比本文提出的基于用戶集群的用戶側分層概率預測模型與其他用戶分層策略對單用戶負荷預測的效果,對比模型如下。
1)對比模型A:統(tǒng)一使用一個模型對全部用戶進行預測,“一視同仁”地進行單用戶負荷預測。
表2 不同概率預測模型的預測精度Table 2 F orecasting accuracy with different probability forecasting models
圖4 本文模型的概率預測負荷曲線Fig.4 Probability forecasting load curve of proposed model
2)對比模型B:對每個用戶訓練不同的模型進行預測,“千人千面”進行單用戶負荷預測。
隨機抽取集群5中的3個用戶(用戶176、用戶397和用戶811)進行預測,并分析本文所提模型與2個對比模型對這3個用戶的點預測精度與概率預測精度,如表3所示。
表3 不同用戶分層策略的單用戶負荷預測精度Table 3 F orecasting accuracy of single user load with different user stratification strategies
由結果可以看出,本文所提方法的點預測精度和概率預測精度均為最高,而對比模型A與對比模型B的預測精度較低,其原因如下。
使用同一個模型對全部用戶進行預測存在如下問題:①當用戶數(shù)量較多時,訓練樣本數(shù)量過大,導致訓練時間過長;②各個用戶的用電模式與特性各有不同,使用同一個模型訓練將導致對單用戶的預測精度降低。對每個用戶訓練不同的模型進行預測存在訓練樣本量過小和泛化能力不足等問題。本文所提方法將相同用戶集群的用戶數(shù)據(jù)進行統(tǒng)一訓練,這種分層策略能夠取得泛化能力與相關性的平衡。
此外,從點預測精度和概率預測精度的關系可看出,點預測精度和概率預測精度存在一定的正相關關系。這是由于概率預測的建模是基于點預測結果進行的,其精度與點預測結果的準確性密切相關。
海量用戶場景下的用戶用電特性分析與分層概率預測對用戶側用電精細化分析有重要意義,本文提出了一套針對海量用戶場景的用電數(shù)據(jù)分析與短期負荷預測的方案。
1)由用戶典型用電模式、用戶用電模式行為信息熵等組成的用戶特征向量充分考慮用戶負荷的用電特征,并通過可視化直觀清晰地傳達用戶特征信息。
2)基于集群辨識的用戶負荷分層概率預測方法,在模型方面,使用分位數(shù)回歸模型對殘差進行模擬,建立的輸出側與模型側結合的概率預測模型有效提升了對殘差的表達能力;在預測結構方面,本文提出的用戶側分層預測結構達到預測準確性與預測復雜性的協(xié)調,提高了模型的泛化能力。
3)算例實驗中,無論是聚合負荷還是單用戶負荷,考慮集群識別的海量用戶分層概率模型相對于其他方法在點預測和概率預測方面均有更高的預測精度。同時,對于單用戶負荷預測,本文模型的將相同集群的用戶數(shù)據(jù)進行統(tǒng)一訓練的分層策略實現(xiàn)了泛化能力與計算效率的平衡。
4)與負荷預測領域常用的隨機森林、梯度提升決策樹和神經(jīng)網(wǎng)絡等模型相比,基于集群辨識的用戶負荷分層概率預測模型參數(shù)更易確定,建模過程簡單,通過分層策略兼顧了預測準確度與復雜性,具有更高的實用價值。
海量用戶的用電數(shù)據(jù)分析與預測仍處于起步階段,未來仍可從以下2個方面進行深入研究。
1)未來可應用分布式并行計算、大數(shù)據(jù)存儲與運算等技術,不斷加快運算效率,建立用戶側的電力大數(shù)據(jù)存儲與運算平臺。
2)在有一定量級的數(shù)據(jù)量支撐的情況下,可以引入深度學習、遷移學習等人工智能技術。