亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于K-Means和CNN的用戶短期電力負荷預(yù)測①

        2020-03-18 07:55:06呂志星王沈征程思瑾秦承龍
        計算機系統(tǒng)應(yīng)用 2020年3期
        關(guān)鍵詞:用戶方法模型

        呂志星,張 虓,王沈征,王 一,程思瑾,秦承龍

        (國網(wǎng)山東省電力公司 泰安供電公司,泰安 271000)

        1 引言

        智能電網(wǎng)的發(fā)展推動了用戶側(cè)智能電表的普及,同時各種監(jiān)控系統(tǒng)的大規(guī)模部署使得電網(wǎng)公司能夠獲得多尺度、全方位的用戶用電信息[1],這些大量、高分辨率的用戶負荷數(shù)據(jù)不但可以用于刻畫用戶用電習慣,還可以對用戶的用電負荷進行預(yù)測,因此,挖掘用戶負荷數(shù)據(jù)對于電網(wǎng)系統(tǒng)的調(diào)度優(yōu)化、精細化經(jīng)營管理以及服務(wù)于市場用戶等方面具有重要價值[2].

        長期以來,負荷預(yù)測是電力系統(tǒng)的研究熱點之一.按照時間期限分類,電力負荷預(yù)測可以劃分為長期負荷預(yù)測(10 年及以上)、中期負荷預(yù)測(5 年左右)和短期負荷預(yù)測.其中,長期負荷預(yù)測主要用于電力系統(tǒng)未來規(guī)劃,短期負荷預(yù)測主要是為了合理安排發(fā)電機組的啟停、減少旋轉(zhuǎn)備用容量,從而降低發(fā)電成本、保障電網(wǎng)的安全穩(wěn)定性.根據(jù)電力負荷數(shù)據(jù)時序性和非線性的特點,短期負荷預(yù)測模型一般可以分為兩類,一類是時間序列方法,通常是將電力負荷看成一種時間序列的集合,根據(jù)電力負荷的歷史數(shù)據(jù)、相關(guān)影響因素構(gòu)建預(yù)測模型,從而實現(xiàn)預(yù)測未來負荷值.常用的方法包括:傅里葉展開法[3],指數(shù)平滑模型[4],自回歸積分滑動平均模型[5].這些傳統(tǒng)的時間序列方法對歷史數(shù)據(jù)隨時間的平穩(wěn)性要求比較高,在一定程度上過于強調(diào)對歷史數(shù)據(jù)的擬合,導(dǎo)致預(yù)測精度不高.另一類是以機器學習為代表的人工智能方法,主要包括:統(tǒng)計機器學習方法中的隨機森林算法(Random Forest,RF),支持向量機,以及深度學習方法中的長短期記憶網(wǎng)絡(luò)(Long Short Term Memory,LSTM)等.鄒云峰等[6]將數(shù)據(jù)類進行K-means 聚類后分別進行線性回歸,在線損率預(yù)測上取得較好結(jié)果,但由于其采用線性回歸,對非線性數(shù)據(jù)建模能力有限.黃晗等[7]提出了基于隨機森林的方法,針對歷史負荷數(shù)據(jù)和天氣信息對某地區(qū)進行預(yù)測.文獻[8]將小波變化與極限學習機組合,提出了一種集成學習預(yù)測模型.以上方法相較于傳統(tǒng)的預(yù)測方法有了很大的提升,但難以兼顧到時序數(shù)據(jù)時間相關(guān)性.文獻[9,10]利用了LSTM 的時間序列性,可以更好地預(yù)測非穩(wěn)定狀態(tài)的負荷數(shù)據(jù).雖然這些方法可以在系統(tǒng)級負荷預(yù)測上取得很好的效果,但由于單個用戶用電的波動性和隨機性較大,系統(tǒng)級負荷預(yù)測方法在單個用戶的負荷預(yù)測上的預(yù)測性能較差,無法滿足電網(wǎng)精益化管理的需求.

        當前短期負荷預(yù)測多以電網(wǎng)系統(tǒng)級負荷為研究對象,而對于用戶級對象的研究工作較少.文獻[11]研究了不同內(nèi)核的支持向量回歸(Support Vactor Regerssion,SVR)模型對單個家庭用電負荷的預(yù)測效果.文獻[12]針對呈指數(shù)級增長的電力用戶數(shù)據(jù)提出一種改進的并行化的基于隨機森林的負荷預(yù)測方法.文獻[13]考慮到了用戶用電行為的變化,提出了擴展卡爾曼濾波及核函數(shù)極限學習機相結(jié)合的方法對用戶側(cè)短期負荷進行預(yù)測.文獻[14]提出了一種基于決策樹和小波去噪相結(jié)合的預(yù)測方法,對不同用電模式的用戶進行個性化負荷預(yù)測.這些模型考慮了用戶用電負荷影響因素,對不同用戶的用電特性進行分析,但忽略了時間序列相關(guān)性對單個用戶負荷預(yù)測的影響.

        從相關(guān)工作來看,對于用戶電力負荷預(yù)測而言,需解決兩方面問題:一是如何有效提取與預(yù)測目標相關(guān)的抽象特征,以便預(yù)測模型學習其中規(guī)律;二是不同用戶負荷特點差異較大,單一預(yù)測模型不能對特征差別較大的用戶進行負荷預(yù)測,建立組合預(yù)測模型以提升預(yù)測精度是很有必要的.因此,本文從用戶負荷數(shù)據(jù)特性出發(fā),利用K-means 聚類得到不同用戶類別,針對每類用戶的負荷數(shù)據(jù)時間相關(guān)性,搭建不同的負荷預(yù)測模型.為了能夠提取與負荷相關(guān)的抽象特征,本文利用不同時間序列信息構(gòu)建不同張量作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,構(gòu)建出深層卷積網(wǎng)絡(luò)來預(yù)測單個用戶的負荷.最后,本文結(jié)合某地23 個用戶一年的真實用電負荷數(shù)據(jù)對本文提出的方法進行驗證.

        2 基于K-means 聚類算法的用戶分類

        圖1 為隨機選擇的5 個用戶的某周負荷曲線圖,不同顏色的曲線表示不同用戶的周負荷變化情況.其中,橫軸表示時刻點,每15 分鐘采樣一次負荷數(shù)據(jù),縱軸表示負荷數(shù)據(jù).通過觀察曲線發(fā)現(xiàn),對于單個用戶而言,由于生產(chǎn)和經(jīng)營一般具有較強的周期性和規(guī)律性,其日負荷數(shù)據(jù)也具有規(guī)律性,具體可以表現(xiàn)為以下2 個方面:如無重大突發(fā)情況,其短時間內(nèi)負荷曲線波動較小(相鄰時刻相關(guān));不同日的相同時刻的負荷波動差異不大(日相關(guān)).為此,首先我們利用K-means 聚類算法來研究用戶用電行為模式.

        K-means 算法是一種無監(jiān)督學習方法,算法通過設(shè)定好的中心點對靠近它們的點進行歸類,通過迭代的方式,逐次更新各聚類中心的值,直到得到最好的聚類結(jié)果.對處理大數(shù)據(jù)集而言,K-means 聚類算法保持了較高的可伸縮性和高效性.算法描述如下:

        (1)選擇合適的k值作為聚類的初始中心點.

        (2)計算其他的點到這k個中心點的距離,離哪個中心點的距離最小就被劃分到哪個類.距離的具體計算公式如下:

        (3)通過求平均值的方法更新該類的中心.

        (4)按步驟(2)、(3)迭代更新后,直至各類中心點的值均不再變化,迭代結(jié)束.

        圖1 某5 個用戶一周的負荷曲線圖

        本文采用K-means 算法對真實數(shù)據(jù)集中的23 個用戶的歷史數(shù)據(jù)進行聚類分析,然后按照其時間序列的不同的相關(guān)性,將不同類別的用戶負荷序列轉(zhuǎn)換為張量后輸入至不同的卷積神經(jīng)網(wǎng)絡(luò)進行抽象特征提取.聚類得到的結(jié)果如表1 所示.其中,A 類表示日相關(guān)性和相鄰時刻相關(guān)性均較為明顯的用戶,B 類表示僅相鄰時刻相關(guān)性較強的用戶.

        表1 用戶聚類結(jié)果

        3 基于CNN 特征提取的負荷預(yù)測模型

        3.1 卷積神經(jīng)網(wǎng)絡(luò)

        在深度學習的諸多算法中,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)因其特殊的網(wǎng)絡(luò)結(jié)構(gòu),在計算機視覺領(lǐng)域應(yīng)用廣泛.然而,在電力負荷預(yù)測方面的應(yīng)用較少.CNN 的典型網(wǎng)絡(luò)結(jié)構(gòu)由輸入層、卷積層、池化層、全連接層和輸出層組成[15].其中,卷積層是CNN 的核心,包括卷積核、卷積層參數(shù)和激勵函數(shù)3 個重要部分.卷積層內(nèi)部包含多個卷積核,組成卷積核的每個元素都對應(yīng)一個權(quán)重系數(shù)和一個偏差量,類似于前饋神經(jīng)網(wǎng)絡(luò)的一個神經(jīng)元.CNN 的優(yōu)勢在于能夠通過較少的權(quán)重參數(shù)訓(xùn)練提取得到特征[16].

        本文采用CNN 網(wǎng)絡(luò)來提取用戶歷史負荷的特征.對于A 類用戶,CNN 模型用相鄰的前16 個負荷數(shù)據(jù)點和待預(yù)測點前16 天的相同時刻的數(shù)據(jù)點分別構(gòu)造成 4×4的矩陣形式,將這兩個矩陣組成的張量作為CNN 模型的輸入,如圖2 所示.

        圖2 A 類用戶卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖

        對于B 類用戶,模型僅以相鄰的前16 個負荷數(shù)據(jù)點構(gòu)建為 4 ×4×1的網(wǎng)絡(luò)輸入,如圖3 所示.CNN 模型有兩個卷積層,卷積核分別為2 ×2×32和 2 ×2×64.

        圖3 B 類用戶卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖

        考慮到輸入數(shù)據(jù)的維度不高,因此本文在卷積層后直接接了兩個全連接層,而未使用池化層進行下采樣,保證了數(shù)據(jù)的完整性.模型使用ReLU 作為激活函數(shù),選擇均方誤差(Mean Square Error,MSE)作為損失函數(shù).

        3.2 算法流程

        將歷史負荷數(shù)據(jù)經(jīng)過數(shù)據(jù)預(yù)處理得到用戶用電負荷曲線,通過K-means 聚類將用戶分為日相關(guān)性強和相鄰時刻相關(guān)性強的兩類用戶.針對不同用戶負荷特性,構(gòu)建不同張量輸入的CNN 模型,具體處理流程如圖4 所示.

        圖4 基于K-means 和CNN 的用戶短期電力負荷預(yù)測流程

        4 實驗及結(jié)果分析

        4.1 數(shù)據(jù)說明與數(shù)據(jù)預(yù)處理

        本文所用數(shù)據(jù)集為某市23 個用戶2015 年全年的負荷數(shù)據(jù),每15 分鐘采集一個樣本點,每天可獲得96 個負荷點數(shù)據(jù).通過觀察數(shù)據(jù),發(fā)現(xiàn)原始采集數(shù)據(jù)存在缺失、數(shù)據(jù)為負或遠大于該用戶其他時刻點的負荷數(shù)據(jù)等失真情況.因此在用于模型訓(xùn)練和測試前,本文首先對采集到的負荷數(shù)據(jù)進行異常處理.對于缺失或失真的數(shù)據(jù),本文利用該數(shù)據(jù)的前15 個相鄰數(shù)據(jù)點的平均值對其進行填充或修正,得到完整的負荷數(shù)據(jù)序列.同時,將所有的負荷數(shù)據(jù)通過歸一化映射到[0,1]之間,公式如下:

        其中,xi為原始負荷數(shù)據(jù),為歸一化后的負荷數(shù)據(jù),xmax為數(shù)據(jù)集樣本中的最大負荷,xmin為數(shù)據(jù)集樣本中的最小負荷.

        4.2 評價指標

        為了有效評價模型的準確度以及與其他方法進行對比,本文選取平均絕對誤差(Mean Absolute Percentage Error,MAPE)作為評價指標,計算公式如下:

        其中,n表示預(yù)測點的個數(shù),yi表示第i個預(yù)測點的負荷真實值,表示第i個預(yù)測點的負荷預(yù)測值,即MAPE值越小,預(yù)測準確率越高.

        4.3 預(yù)測結(jié)果分析

        采用本文提出的CNN 算法對經(jīng)過K-means 算法分類的電力用戶進行負荷預(yù)測,訓(xùn)練集與測試集劃分比例為8:2.訓(xùn)練集采用的是2015 年1 月1 日至2015 年10 月15 日的數(shù)據(jù),共有28 128 條記錄;測試集采用的是2015 年10 月15 日至2015 年12 月31 日的數(shù)據(jù),共有7007 條記錄.

        (1)將本文模型與隨機森林和支持向量回歸機進行比較,結(jié)果見表2.

        表2 不同電力負荷預(yù)測方法MAPE 比較(%)

        本文模型對絕大多數(shù)用戶的預(yù)測效果都優(yōu)于現(xiàn)有算法,平均MAPE為30.91%,相對于現(xiàn)有最好的RF 方法MAPE降低了20%,說明本文模型可有效提高短期負荷的預(yù)測準確度.其中user5 的準確度相較其他模型提高得最多,因為user5 的數(shù)據(jù)波動很大,通過歸一化可以增加數(shù)據(jù)的穩(wěn)定性,提高預(yù)測的準確度.由表2 可見,不同用戶的MAPE差距很大,這是因為不同用戶的用電行為習慣差異很大.

        圖5 為user1 和user8 在2015 年1 月1 日至2015 年2 月28 日的負荷曲線.圖5 中,user1 歷史負荷曲線較平穩(wěn),其用電模式較規(guī)律,因此可得到較準確的預(yù)測結(jié)果,而user8 在同段時間的用電行為模式難以捕捉,無法達到較好的預(yù)測效果.這說明了針對不同用戶采用不同預(yù)測模型的有效性和重要性.

        (2)為了驗證聚類方法的有效性,將本文模型與僅輸入相鄰時刻相關(guān)的CNN 模型、輸入相鄰時刻序列和日相關(guān)特征序列的CNN 模型進行比較,結(jié)果如表3所示.

        圖5 user1 和user8 2015 年1 月1 日至2015 年2 月28 日負荷曲線

        表3 聚類效果MAPE 分析(%)

        從表3 不難看出,本文模型的MAPE比簡單將數(shù)據(jù)放入CNN 模型的MAPE降低了5%,證明了應(yīng)用聚類算法可更好區(qū)別不同用戶的特性,有助于提高預(yù)測性能.

        5 結(jié)論

        針對用戶負荷差異明顯、波動性大的問題,本文利用K-means 算法將用戶用電歷史負荷曲線進行聚類,針對不同類別的用戶利用CNN 構(gòu)造不同的特征提取網(wǎng)絡(luò)結(jié)構(gòu),訓(xùn)練建立預(yù)測模型.實驗結(jié)果表明本文模型均比RF、SVR 及未經(jīng)聚類的CNN 模型的預(yù)測效果優(yōu)秀,預(yù)測MAPE降低了21.22%.由于當前預(yù)測模型僅參考了用戶的歷史負荷作為模型輸入,實際上用戶負荷與溫度、濕度及用戶所在行業(yè)經(jīng)濟形勢等多種因素相關(guān),后續(xù)將考慮篩選更多的相關(guān)因素輸入模型中,進一步提高模型的預(yù)測準確度.

        猜你喜歡
        用戶方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        可能是方法不對
        3D打印中的模型分割與打包
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        av在线免费观看网站,| 99视频一区二区日本| 亚洲中文高清乱码av中文| 中文字幕亚洲乱码熟女1区| 亚洲熟女www一区二区三区| 国产高潮国产高潮久久久| 久久久久国产亚洲AV麻豆 | 青青草原综合久久大伊人精品| 精品久久久无码中字| 北条麻妃在线视频观看| 免费福利视频二区三区| 国产精品亚洲av高清二区| 专干老熟女视频在线观看| 亚洲va在线∨a天堂va欧美va| 久久精品成人亚洲另类欧美| 国产一级黄色片一区二区| 成人欧美一区二区三区在线| 久久久精品人妻一区二区三区四| 日韩偷拍一区二区三区视频| 亚洲av天堂在线免费观看| 亚洲成a人v欧美综合天堂| 无套内谢的新婚少妇国语播放| 99久久精品一区二区三区蜜臀 | 亚洲av专区一区二区| 亚洲熟妇av一区| 婷婷四房色播| 亚洲成AV人国产毛片| 国产性虐视频在线观看| 精品无码久久久久久国产| 456亚洲老头视频| 日本女优中文字幕有码| 亚洲精品国产精品乱码在线观看| 日本丰满熟妇bbxbbxhd| 国产aⅴ天堂亚洲国产av| 少妇一区二区三区精选| 丝袜美腿福利一区二区| 蜜臀色欲av在线播放国产日韩| 久久青青热| 国模一区二区三区白浆| 亚洲精品一品区二品区三区| 亚洲av无码一区二区乱孑伦as|