王炳鑫,侯巖,方紅旺,陳雨澤,劉建
?
面向“削峰填谷”的電力客戶用電行為分析
王炳鑫1,侯巖2,方紅旺2,陳雨澤2,劉建2
(1. 國網(wǎng)福建省電力有限公司泉州供電公司,福建泉州 362000; 2. 北京中電普華信息技術(shù)有限公司,北京 100085)
為對海量電力客戶實施有針對性的“削峰填谷”措施,提出了一種面向“削峰填谷”的海量電力客戶用電行為分析方法。首先,利用聚類算法對國網(wǎng)某省公司主網(wǎng)一年的日負荷曲線數(shù)據(jù)進行聚類分析,得到不同時期主網(wǎng)的負荷特征。然后,分別對每個時期下所有電力客戶的日負荷曲線數(shù)據(jù)進行聚類分析,得到不同主網(wǎng)特征下用戶群體的負荷特征,對比主網(wǎng)和用戶的負荷特征得到用戶群體的“削峰填谷”模式。最后,利用動態(tài)時間規(guī)整算法將未來日期與歷史日期進行匹配,得到未來日期用戶群體的“削峰填谷”模式。實證研究表明,分析結(jié)果可以為有序用電、峰谷電價等公司決策提供更有針對性的參考依據(jù),以更進一步實現(xiàn)配電網(wǎng)負荷的“削峰填谷”和平穩(wěn)運行。
用電行為分析;削峰填谷;聚類分析;動態(tài)時間規(guī)整
隨著電力信息化的深化應(yīng)用,電力信息數(shù)據(jù)呈現(xiàn)爆炸式增長趨勢,電力行業(yè)的大數(shù)據(jù)時代已經(jīng)到來。傳統(tǒng)的在小規(guī)模數(shù)據(jù)量下對客戶用電行為進行統(tǒng)計分析,具備一定的指導(dǎo)價值,但在海量數(shù)據(jù)情況下的應(yīng)用效果不是很理想。與傳統(tǒng)的客戶用電行為分析相比,基于大數(shù)據(jù)的客戶用電行為分析更注重對客戶用電價值的挖掘,可以實現(xiàn)對海量客戶用電行為的定量分析,提高客戶行為定位的準(zhǔn)確度,為更有效地開展客戶服務(wù)、提高客戶滿意度、降低運營風(fēng)險提供決策參考。
近年來,已有學(xué)者對電力客戶的用電行為進行了研究,主要的研究思路有以下幾種。
(1)基于專家經(jīng)驗的方法
根據(jù)業(yè)務(wù)專家經(jīng)驗進行用電行為分析。何永秀等人[1]通過對居民智能用電情況進行問卷調(diào)查,采用模糊綜合評價對居民智能用電的態(tài)度進行量化分析,該方法采用的算法簡單易理解、數(shù)據(jù)采集容易,但需要憑經(jīng)驗設(shè)定權(quán)重,主觀性強。黃瀚[2]根據(jù)業(yè)務(wù)經(jīng)驗探討了智能電網(wǎng)下典型用電客戶的用電行為,該方法結(jié)合了大量的行業(yè)經(jīng)驗,但沒有相應(yīng)的數(shù)據(jù)支撐。
(2)基于統(tǒng)計分析的方法
利用單個指標(biāo)或組合指標(biāo)分析用電行為。如Chuan L等人[3]研究了新加坡不同居民住宅電器的用電量分布,利用不同居民住宅中的電器設(shè)備信息和用電信息,構(gòu)建了月度用電量計算式,得到了不同居民住宅類型電器的用電量。Abreua J M等人[4]基于實驗中獲取的智能家電數(shù)據(jù),發(fā)現(xiàn)和識別了家庭用電的行為模式。這些方法相對簡單,考慮了各種用電設(shè)備的用電信息,缺點是用電設(shè)備信息采集較為困難,不適用于國內(nèi)智能家電數(shù)據(jù)難以獲取的情況。
(3)基于無監(jiān)督學(xué)習(xí)的方法
主要是指通過聚類算法實現(xiàn)對用電數(shù)據(jù)的劃分,從而得到不同的用電特征。宗柳等人[5]利用聚類對用戶的用電特征進行了精細化挖掘,但聚類方法的計算復(fù)雜度較高。瞿海妮等人[6]從居民的絕對用電量入手,將居民按日均用電量分為異常用電、低耗電、普通和高耗電用戶4類,分析了用戶行為的特征。張素香等人[7]基于云計算平臺和并行-means聚類算法,建立了峰時耗電率、負荷率、谷電系數(shù)等用電特征,分析了智能小區(qū)的居民用電行為。該方法采取了并行算法,適用于海量數(shù)據(jù)下的用電行為分析,但聚類維度存在冗余且不完備。
本文在研究電力業(yè)務(wù)的基礎(chǔ)上,提出了一種面向“削峰填谷”的海量電力客戶用電行為分析方法,對福建省公司的主網(wǎng)和客戶負荷數(shù)據(jù)進行的分析結(jié)果表明,該方法能夠為有序用電、峰谷電價等公司決策提供更有針對性的參考依據(jù),以更進一步實現(xiàn)配電網(wǎng)負荷的“削峰填谷”和平穩(wěn)運行。
2.1 EM聚類算法
最大期望算法(expectation maximization algorithm)[8,9]是一種迭代算法,用于含有隱變量的概率參數(shù)模型的最大似然估計或極大后驗概率估計。EM算法主要有兩個步驟。
(1)E步驟
根據(jù)式(1)計算每個樣本屬于不同分布的概率,選擇概率最大的分布作為樣本類別。
(1)
(2)M步驟
根據(jù)式(2)估計每個類別分布函數(shù)的概率參數(shù)。
其中,y為第個樣本數(shù)據(jù),μ、σ分別為第個分布的均值、標(biāo)準(zhǔn)差,為第個樣本隸屬于第個分布的概率。通過迭代使用這兩個步驟,EM算法逐步改進模型的參數(shù),使參數(shù)和訓(xùn)練樣本的似然概率逐漸增大,最后終止于一個極大點。EM算法在依賴于不可觀察的隱變量的概率模型中被用于尋找概率模型參數(shù)的最大似然估計,在EM聚類算法中,隱變量就是數(shù)據(jù)項所屬的類。
2.2-means聚類
-means算法[10,11]是一種被廣泛應(yīng)用于科學(xué)研究和工業(yè)應(yīng)用的經(jīng)典聚類算法,核心思想是把數(shù)據(jù)點劃分為不同類別,使得每個類別中的數(shù)據(jù)點到該聚類中心距離的平方和最小。傳統(tǒng)-means算法只適用于集中式數(shù)據(jù)的聚類。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,大量的數(shù)據(jù)是分布式存儲的,為對分布式存儲的數(shù)據(jù)進行聚類,李小武等人[12]在分布式環(huán)境下對傳統(tǒng)聚類算法進行了擴展和改進,提出了分布式-means聚類方法,其基本思想是:首先每個節(jié)點對本節(jié)點的數(shù)據(jù)集進行局部聚類分析,然后匯總各節(jié)點聚類結(jié)果得到全局聚類結(jié)果。
2.3 動態(tài)時間規(guī)整
動態(tài)時間規(guī)整(dynamic time warping,DTW)是由日本學(xué)者Itakura[13,14]提出的,是一種衡量兩個長度不同的時間序列=(1,…x,…x)和=(1,…y,…y)相似度的方法。通過把時間序列進行延伸和縮短,計算兩個時間序列之間的相似性。DTW是一個典型的優(yōu)化問題,求解兩模板匹配時累計距離最小所對應(yīng)的規(guī)整函數(shù)(,),它表示序列上點和上的點之間的規(guī)整路徑距離:
()=(,)+min{(-1,),(,-1),(-1,-1)} (3)
其中,(,)為上點和上的點之間的歐式距離。
本文提出的用電行為分析方法是為了解決海量電力客戶的“削峰填谷”問題,因此需要分析電力客戶的用電行為特征與主網(wǎng)負荷特征的匹配關(guān)系。首先基于EM算法對主網(wǎng)歷史1年的日負荷曲線數(shù)據(jù)進行聚類分析,得到不同時期主網(wǎng)的負荷特征。再分別利用分布式-means算法對每一時期的海量電力客戶的日負荷曲線數(shù)據(jù)進行聚類分析,得到不同主網(wǎng)特征對應(yīng)電力客戶的負荷特征。對比主網(wǎng)負荷特征曲線與客戶負荷特征曲線可以得到電力客戶的用電行為類型,如迎峰型(用戶負荷特征曲線與主網(wǎng)負荷特征曲線走勢相同,應(yīng)該采取“削峰填谷”措施)、逆峰型(用戶負荷特征曲線與主網(wǎng)負荷特征曲線走勢相反,應(yīng)該鼓勵客戶保持用電習(xí)慣)等,從而建立主網(wǎng)和電力客戶群體的“削峰填谷”匹配模式。最后利用DTW對未來目標(biāo)日和歷史日進行日期匹配,分析未來目標(biāo)日主網(wǎng)與用電客戶的“削峰填谷”匹配關(guān)系,以確定電力客戶群體在目標(biāo)日的“削峰填谷”模式,進而對不同模式的客戶群體采取不同的“削峰填谷”措施。
EM、-means等劃分型聚類算法初始化時存在聚類個數(shù)需要人為確定的問題,一般而言可以通過業(yè)務(wù)經(jīng)驗對聚類個數(shù)進行設(shè)定。本文根據(jù)聚類結(jié)果類內(nèi)距離最小化和類間距離最大化兩個準(zhǔn)則,提出了最優(yōu)聚類評價式,實現(xiàn)了最佳聚類個數(shù)的自動識別:
=(4)
其中,表示聚類個數(shù),V、V分別為第類和第類的類中心,n表示第類的樣本數(shù)量,x表示第類的第個樣本,||*||為歐式距離。指定的最大值和最小值(如∈[1,5]),對數(shù)據(jù)集進行聚類,然后根據(jù)式(4)計算POC值,POC值最大的為最優(yōu)聚類。
(1)主網(wǎng)負荷特征分析
某區(qū)域歷史1年的主網(wǎng)負荷曲線數(shù)據(jù)見表1,利用EM聚類算法將主網(wǎng)的日負荷曲線數(shù)據(jù)分成不同群體,并利用最優(yōu)聚類評價公式自動選擇最佳聚類結(jié)果。通過聚類分析得到主網(wǎng)在不同日期群體的負荷特征,每個群體內(nèi)的日期具備相似的負荷曲線特征,而不同群體之間的日期的負荷曲線存在比較大的差異。
表1 某區(qū)域主網(wǎng)的日負荷曲線數(shù)據(jù)
(2)電力客戶群體用電行為分析
針對每一類主網(wǎng)的日期群體,利用并行-means聚類算法對該日期群體下所有日期的所有電力客戶的日負荷曲線數(shù)據(jù)進行聚類分析,電力客戶的日負荷曲線數(shù)據(jù)與表1所示數(shù)據(jù)格式相同,得到不同主網(wǎng)類別下不同電力客戶群體的負荷特征。通過比較主網(wǎng)負荷特征曲線和電力客戶群體的負荷特征曲線,得到具有不同“削峰填谷”模式的電力客戶群體,如迎峰型、逆峰型等。
(3)日期匹配
上述主網(wǎng)及客戶負荷的聚類分析是對電力客戶群體的歷史用電行為進行分析,如果要得到未來某一天客戶群體的“削峰填谷”模式,還需要進行未來目標(biāo)日期與歷史日期的匹配,然后將歷史日期電力客戶群體的“削峰填谷”模式作為未來目標(biāo)日期的模式,進而得到目標(biāo)日期需要進行“削峰填谷”的客戶群體。
本文利用動態(tài)時間規(guī)整算法,根據(jù)天氣、假日等特征將目標(biāo)日與歷史日期進行匹配,得到與目標(biāo)日最相似的歷史日期。將歷史和未來日期劃分為3個日期集合:節(jié)假日、周末以及工作日。當(dāng)目標(biāo)日為節(jié)假日時,直接用歷史相同節(jié)假日作為目標(biāo)日的歷史匹配日期。當(dāng)目標(biāo)日為周末或者工作日時,利用動態(tài)時間規(guī)整算法根據(jù)溫度分別在去年同期前后兩個月的周末集合和工作日集合中尋找歷史相似日,得到目標(biāo)日的歷史匹配日期?;谌掌谄ヅ浞椒?,每個目標(biāo)日都可以找到與之相似的歷史日期,進而得到不同客戶群體在目標(biāo)日期的“削峰填谷”模式。若客戶群體在目標(biāo)日的“削峰填谷”模式為逆峰型,此類客戶有利于主網(wǎng)安全運行,不是開展“削峰填谷”措施的客戶;若客戶群體在目標(biāo)日的模式為迎峰型,則此類客戶是開展“削峰填谷”措施的重點客戶。
本文采用福建省電力公司主網(wǎng)和福建全部用電客戶2014年1月1日至12月31日的負荷數(shù)據(jù),采樣間隔為15 min,每條日負荷曲線有96個采樣點。按本文提出的用電行為分析方法,首先對2014年福建省電力公司主網(wǎng)的日負荷曲線數(shù)據(jù)利用EM算法進行聚類分析,本文將主網(wǎng)的日負荷數(shù)據(jù)劃分為3類,3個類別的負荷特征曲線如圖1所示,從特征曲線可以看出,每個類別的特征曲線都呈現(xiàn)白天負荷高、晚上負荷低的特征,但峰值大小有所差異。按季節(jié)和節(jié)假日對聚類結(jié)果進行統(tǒng)計分析的結(jié)果見表2,可以看出負荷特征曲線峰值最高的第1類包括58.7%的夏季日期和52.22%的冬季日期,這些日期由于夏季高溫和冬季低溫導(dǎo)致負荷較高,因此該類可以稱為夏冬高峰型。而對于峰值最低的第3類,從表2看出該類包括了大部分的節(jié)假日、春季日期和51.65%的秋季日期,該類日期的負荷由于放假及溫度較溫和等原因較低,因此該類可以稱為假日低谷型。
表2 主網(wǎng)聚類結(jié)果節(jié)假日和季節(jié)特征
針對每一類主網(wǎng)日負荷類別,利用并行-means聚類算法對該類對應(yīng)日期的所有客戶負荷曲線數(shù)據(jù)進行聚類分析。本文將3類主網(wǎng)類別對應(yīng)的電力客戶分別劃分為4類、3類和5類。圖2、圖3和圖4分別顯示了每類主網(wǎng)對應(yīng)電力客戶類別的負荷特征曲線,可以看出,3個主網(wǎng)類別下的第1類客戶的負荷特征曲線都分別與對應(yīng)的主網(wǎng)負荷特征曲線非常相似,即這3類電力客戶的用電行為類型為迎峰型,這3個客戶群體為需要進行“削峰填谷”的群體。
通過對電力客戶用電行為的分析,得到了客戶在不同歷史時期的“削峰填谷”模式。為了得到未來日期電力客戶的“削峰填谷”模式,利用本文提出的日期匹配方法得到未來日期的歷史相似日。圖5給出了2015年5月1?10日的日期匹配結(jié)果,可以看出勞動節(jié)、工作日、周末分別對應(yīng)2014年的勞動節(jié)、工作日和周末。
從圖5可以看出,2015年5月10日的歷史匹配日期為2014年5月25日,即可利用2014年5月25日客戶群體的“削峰填谷”模式作為目標(biāo)日期的2015年5月10日的模式。圖6和圖7分別為2014年5月25日兩類客戶群體和主網(wǎng)的特征曲線對比。從圖6可以看出,該類電力客戶的特征曲線與主網(wǎng)特征曲線的走勢相反,因此預(yù)計該類客戶在2015年5月10日為逆峰用電模式,對該類客戶不需采取“削峰填谷”措施,鼓勵其保持用電習(xí)慣即可。而對于圖7,該類電力客戶的特征曲線與主網(wǎng)特征曲線的走勢幾乎相同,因此預(yù)計該類客戶在2015年5月10日為迎峰用電模式,為“削峰填谷”的目標(biāo)客戶,可采取有序用電、峰谷電價等措施進行“削峰填谷”。
本文提出了一種面向“削峰填谷”的海量電力客戶用電行為分析方法。首先,對歷史主網(wǎng)負荷曲線數(shù)據(jù)進行聚類分析。然后,在考慮不同時期主網(wǎng)負荷特征的基礎(chǔ)上,利用并行聚類算法對不同時期海量電力客戶的用電行為進行分析,并通過比較主網(wǎng)及客戶群體的負荷特征得到不同客戶群體的“削峰填谷”模式。最后,利用日期匹配方法找到未來目標(biāo)日期的歷史相似日,將客戶群體在歷史相似日的“削峰填谷”模式作為目標(biāo)日期的模式,得到了目標(biāo)日不同客戶群體的“削峰填谷”模式。對福建省電力公司的主網(wǎng)和海量客戶的負荷數(shù)據(jù)分析結(jié)果表明,該方法能夠得到目標(biāo)日期不同客戶群體的“削峰填谷”模式,并識別需要進行“削峰填谷”的客戶群體。本文提出的用電行為分析方法利用聚類分析、并行計算框架實現(xiàn)了對海量客戶的用電行為分析,分析結(jié)果可以為電網(wǎng)企業(yè)開展有序用電、峰谷電價等“削峰填谷”措施提供有針對性的依據(jù),對提高電網(wǎng)需求側(cè)能效管理水平具有建設(shè)性意義。
[1] 何永秀, 王冰, 熊威,等. 基于模糊綜合評價的居民智能用電行為分析與互動機制設(shè)計[J].電網(wǎng)技術(shù), 2012, 36(10): 247-252.
HE Y X, WANG B, XIONG W, et al. Analysis of residents’ smart electricity consumption behavior based on fuzzy synthetic evaluation and the design of interactive mechanism [J]. Power System Technology, 2012, 36(10): 247-252.
[2] 黃瀚. 智能用電中的客戶行為分析[J].電氣時代, 2014(14): 28-32.
HUANG H. Analysis of smart electricity consumption behavior[J]. Electric Age, 2014(14): 28-32.
[3] CHUAN L, UKIL A. Modeling and validation of electrical load profiling in residential buildings in Singapore [J]. IEEE Transactions on Power Systems, 2015, 30(5):2800-2809.
[4] ABREUA J M, PEREIRAB F C, FRRAO P. Using pattern recognition to identify habitual behavior in residential electricity consumption[J]. Energy and Buildings, 2012, 49(2):479-487.
[5] 宗柳, 李揚, 王蓓蓓. 計及需求響應(yīng)的多維度用電特征精細挖掘[J].電力系統(tǒng)自動化, 2012, 36(20):54-58.
ZONG L, LI Y, WANG B B. Fine-mining of multi-dimension electrical characteristics considering demand response [J]. Automation of Electric Power Systems, 2012, 36(20):54-58.
[6] 瞿海妮, 張鵬飛, 凌平, 等. 基于海量數(shù)據(jù)的電網(wǎng)需求側(cè)用戶行為分析研究[J].華東電力, 2014, 42(12):2922-2925.
QU H N, ZHANG P F, LING P, et al. Analysis of consumption behavior in power demand side based on massive data[J]. East China Electric Power, 2014, 42(12):2922-2925.
[7] 張素香, 劉建明, 趙丙鎮(zhèn), 等.基于云計算的居民用電行為分析模型研究[J].電網(wǎng)技術(shù), 2013, 37(6):1542-1546.
ZHANG S X, LIU J M, ZHAO B Z, et al. Cloud computing-based analysis on residential electricity consumption behavior [J]. Power System Technology, 2013, 37(6):1542-1546.
[8] HIDOT S, SAINT-JEAN C. An expectation-maximization algorithm for the wishart mixture model: application to movement clustering [J]. Pattern Recognition Letters, 2010, 31(14): 2318-2324.
[9] JOLLOIS F X, NADIF M. Speed-up for the expectation-maximization algorithm for clustering categorical data [J]. Global Optimization, 2007, 37(4): 513-525.
[10] HOFMANS J, CEULEMANS E, STEINLEY D, et al. On the added value of bootstrap analysis for-means clustering [J]. Classification, 2015, 32(2): 268-284.
[11] GARCIA M L L, GARCIA-RODENAS R, GOMEZ A G.-means algorithms for functional data [J]. Neurocomputing, 2015(151):231-245.
[12] 李小武, 邵劍飛, 廖秀玲. 一種基于-means的分布式聚類算法[J]. 桂林電子科技大學(xué)學(xué)報,2011,31(6): 460-463.
LI X W, SHAO J F, LIAO X L. A distributed clustering algotithm based on-means algorithm[J]. Journal of Guilin University of Electronic Technology, 2017, 31(6): 460-463.
[13] ARRIBAS-GIL A, HANS-GEORM. Pairwise dynamic time warping for event data [J]. Computational Statistics & Data Analysis, 2014(69): 255-268.
[14] RASHIDI S, FALLAH A, TOWHIDKHAH F. Similarity evaluation of online signatures based on modified dynamic time warping[J].Applied Artificial Intelligence, 2013, 27(7): 599-617.
Analysis of customers’ electricity consumption behavior for peak load shifting
WANG Bingxin1, HOU Yan2, FANG Hongwang2, CHEN Yuze2, LIU Jian2
1. State Grid Fujian Electric Power Company, Quanzhou Electric Power Supply Company, Quanzhou 362000, China 2. Beijing China-Power Information Technology Co., Ltd., Beijing 100085, China
In order to implement well-directed peak load shifting for massive customers, a method for analyzing massive customers’ electricity consumption behavior for peak load shifting was proposed. Firstly, clustering algorithm was used to cluster daily load curves of the main power grid in the previous year and get load characteristics in different dates. Then the load curves of all customers under every date cluster were clustered, the peak load shifting method was derived by comparing the load characteristics of the main power grid and customers. Finally, the peak load shifting method in a future day was given by date matching between the future day with a historical day using dynamic time warping (DTW). Empirical study shows that the method is conductive to peak-valley electricity pricing and orderly electricity consumption and can further achieve peak load shifting and stable operation of the main power grid.
electricity consumption behavior analysis, peak load shifting, clustering analysis, dynamic time warping
TM732
A
10.11959/j.issn.1000?0801.2017067
2017?01?25;
2017?03?06
國網(wǎng)信息通信產(chǎn)業(yè)集團科技項目“支持售電云業(yè)務(wù)的大數(shù)據(jù)應(yīng)用”(No.52680016007G)
Science & Technology Project of State Grid Information and Telecommunication Group “Big Data Applications for Supporting Electricity Sales Business over Grid” (No.52680016007G)
王炳鑫(1982?),男,國網(wǎng)福建省電力有限公司泉州供電公司工程師,主要研究方向為電力企業(yè)優(yōu)質(zhì)服務(wù)、電力營銷數(shù)據(jù)處理、營銷電力大數(shù)據(jù)分析、數(shù)據(jù)挖掘、決策支持。
侯巖(1982?),女,北京中電普華信息技術(shù)有限公司助理經(jīng)濟師,主要研究方向為電力營銷數(shù)據(jù)挖掘。
方紅旺(1974?),男,北京中電普華信息技術(shù)有限公司電力營銷客服事業(yè)部副總經(jīng)理,主要研究方向為電力營銷大數(shù)據(jù)分析。
陳雨澤(1988?),男,北京中電普華信息技術(shù)有限公司工程師,主要研究方向為電力營銷大數(shù)據(jù)分析。
劉建(1989?),男,北京中電普華信息技術(shù)有限公司中級工程師,主要研究方向為電力營銷大數(shù)據(jù)分析。