許長清, 趙華東, 宋曉輝
(1.國網(wǎng)河南省電力公司 經(jīng)濟(jì)技術(shù)研究院 河南 鄭州 450052; 2.鄭州大學(xué) 機(jī)械工程學(xué)院河南 鄭州450001; 3.河南省科學(xué)院 應(yīng)用物理研究所 河南 鄭州 450008)
?
基于大數(shù)據(jù)的電力用戶群體識(shí)別與分析方法研究
許長清1,趙華東2,宋曉輝3
(1.國網(wǎng)河南省電力公司 經(jīng)濟(jì)技術(shù)研究院河南 鄭州 450052; 2.鄭州大學(xué) 機(jī)械工程學(xué)院河南 鄭州450001; 3.河南省科學(xué)院 應(yīng)用物理研究所河南 鄭州 450008)
隨著能源互聯(lián)網(wǎng)及智能用電技術(shù)的發(fā)展,深入了解電力用戶群體特征,并提供精準(zhǔn)電力服務(wù),成為“互聯(lián)網(wǎng)+”智慧能源的重要研究內(nèi)容.通過對售電體積累的用戶社會(huì)屬性、用電行為等大數(shù)據(jù)進(jìn)行分析,構(gòu)建用戶間相似度權(quán)重模型,提出基于“用戶-標(biāo)簽”二元網(wǎng)絡(luò)的相似群體識(shí)別方法,并通過群體分析獲取群屬性和典型負(fù)荷特征,預(yù)測新入網(wǎng)用戶的用電行為.該方法通過對標(biāo)簽數(shù)據(jù)的分析,便于發(fā)現(xiàn)群體中的重要用戶,為互聯(lián)網(wǎng)售電體實(shí)施個(gè)性化用電服務(wù)和增值服務(wù)推薦提供支撐,進(jìn)而提升電力服務(wù)質(zhì)量.
大數(shù)據(jù); 電力用戶; 相似群體; 用戶標(biāo)簽
在能源互聯(lián)網(wǎng)和智能電網(wǎng)背景下[1-3],準(zhǔn)確地對用戶用電行為特征分析和用電量短期、長期預(yù)測對電網(wǎng)需求側(cè)管理和基于互聯(lián)網(wǎng)的售電體精準(zhǔn)營銷具有重要的指導(dǎo)意義[4-5].基于用戶社會(huì)屬性、用電行為特征、互聯(lián)網(wǎng)行為將電力用戶進(jìn)行分類,進(jìn)而實(shí)現(xiàn)群體用電行為預(yù)測,可以幫助售電體更深入地了解用戶群體特征,為電力精準(zhǔn)營銷和制定電力需求側(cè)響應(yīng)策略提供數(shù)據(jù)支撐.
隨著我國電力體制改革和能源互聯(lián)網(wǎng)戰(zhàn)略的不斷推進(jìn),電力用戶在互聯(lián)網(wǎng)售電平臺(tái)上購電和用電增值服務(wù),形成種類豐富的用戶數(shù)據(jù)[6],包括用戶屬性數(shù)據(jù)、用電行為數(shù)據(jù)、上網(wǎng)行為數(shù)據(jù)等.基于這些用電大數(shù)據(jù)將用戶用電行為特性進(jìn)行多維度分解,建立用戶分類模型,深刻認(rèn)識(shí)電力用戶群體效應(yīng),能夠形成基于群體的用電模式差異化預(yù)測模型.
目前,對電力用戶群體分析方法多是基于歷史負(fù)荷數(shù)據(jù),建立基于人工智能方法的負(fù)荷識(shí)別和預(yù)測模型[7-9],再利用聚類的方法實(shí)現(xiàn)基于用電行為的用戶群體分析[10-11],或是基于行業(yè)或領(lǐng)域等用戶屬性將電力用戶進(jìn)行細(xì)分[12-13],進(jìn)而形成群體-屬性的關(guān)系.這些分類方法往往一個(gè)群體中的用戶只包含了個(gè)別共同屬性,難以真正形成包含個(gè)體屬性、用電行為和互聯(lián)網(wǎng)行為等多種屬性的相似用戶群體,進(jìn)而影響基于群體特征的用戶用電行為分析預(yù)測模型的構(gòu)建[14-18].
標(biāo)簽作為一種用戶行為的標(biāo)識(shí)方法,蘊(yùn)含了很多反映用戶屬性、用電偏好的信息[19].本文通過對標(biāo)簽數(shù)據(jù)的分析,結(jié)合相同標(biāo)簽數(shù)量和負(fù)荷相似度形成用戶關(guān)聯(lián)度網(wǎng)絡(luò)模型,得到相似電力用戶群體,提取群體的主要特征以及發(fā)現(xiàn)群體中的重要用戶,便于互聯(lián)網(wǎng)售電體實(shí)施個(gè)性化增值服務(wù)產(chǎn)品和用電套餐推薦,進(jìn)而提升電力服務(wù)質(zhì)量.
1.1電力用戶行為關(guān)系模型
如圖1所示, 對于電力用戶的個(gè)體行為刻畫分為兩類,一是電力用戶的社會(huì)屬性,包括家庭人口、住房面積、房屋均價(jià)、戶內(nèi)熱源類型等,反映了電力用戶對電力的消費(fèi)能力和潛力,該類描述可以幫助售電體刻畫用戶的形象,進(jìn)而對用戶進(jìn)行分類或歸納;二是電力用戶的用電行為,包括歷史負(fù)荷曲線、互聯(lián)網(wǎng)購電行為、用戶信用等級等,反映了電力用戶的實(shí)際電能消費(fèi)量、購電渠道等用電行為特征,動(dòng)態(tài)展示了用戶的用電行為特點(diǎn),可以幫助售電體了解用戶的用電模式和消費(fèi)習(xí)慣.對于電力用戶群體的分類和行為刻畫,體現(xiàn)在基于用戶個(gè)體行為,形成對群體典型負(fù)荷和群體標(biāo)簽的描述,其中群體標(biāo)簽包含了群體中用戶共同的社會(huì)屬性和用電行為.
圖1 電力用戶行為關(guān)系模型Fig.1 Model of power users’ relation
1.2相似用戶群體識(shí)別方法
如圖2所示,基于大數(shù)據(jù)的電力用戶群體分析方法主要包括:
1) 構(gòu)建電力用戶及其標(biāo)簽二元關(guān)系網(wǎng)絡(luò).
標(biāo)簽是對用戶屬性、行為等一系列特征的一個(gè)或多個(gè)定性描述.一個(gè)標(biāo)簽通常是人為規(guī)定的高度精煉的特征標(biāo)識(shí),如電力用戶的房屋面積標(biāo)簽:70~90 m2,人口標(biāo)簽:3人,信用等級標(biāo)簽:2級,等等.標(biāo)簽呈現(xiàn)出兩個(gè)重要特征:語義化,能方便地理解每個(gè)標(biāo)簽含義,這也使得個(gè)體用戶刻畫模型具備實(shí)際意義;短文本,每個(gè)標(biāo)簽通常只表示一種含義,標(biāo)簽本身無需再做過多文本分析等預(yù)處理工作,這為利用機(jī)器提取標(biāo)準(zhǔn)化信息提供了便利.
圖2 電力用戶群體分析方法Fig.2 Method of power user group analysis
如圖3所示,對電力用戶全體分析的第一步是定義電力用戶社會(huì)屬性及用電行為標(biāo)簽,將用戶與其所屬的標(biāo)簽進(jìn)行連接,形成相互關(guān)系二元網(wǎng)絡(luò),其中a、b、c、d代表用戶節(jié)點(diǎn),L1、L2、L3、L4代表用戶標(biāo)簽.
2) 建立用戶節(jié)點(diǎn)間相互關(guān)系權(quán)重模型.
用戶節(jié)點(diǎn)間的相互關(guān)系權(quán)重是用戶相似度的表現(xiàn),包括圖1所示的用戶社會(huì)屬性相似度和用電行為相似度,其中用戶社會(huì)屬性、用戶信用和購電渠道等可以定義為靜態(tài)標(biāo)簽,用相同標(biāo)簽數(shù)量表征其相似性,但用電行為中的歷史負(fù)荷為動(dòng)態(tài)數(shù)據(jù),難以用標(biāo)簽描述,該指標(biāo)卻是用戶相似性和群體刻畫的關(guān)鍵內(nèi)容.基于上述因素,本文以標(biāo)簽相同個(gè)數(shù)為權(quán)重模型的基礎(chǔ),將負(fù)荷相似度作為權(quán)重因子,使得權(quán)重模型既包含靜態(tài)標(biāo)簽相似性,又包含動(dòng)態(tài)負(fù)荷相似性.
將用戶節(jié)點(diǎn)網(wǎng)絡(luò)中任意兩節(jié)點(diǎn)之間相同標(biāo)簽的個(gè)數(shù)表示為Nij,用電行為相似度Sij,兩節(jié)點(diǎn)相互關(guān)系權(quán)重表示為
α=Nij×Sij,
(1)
其中:用電行為相似度Sij的計(jì)算方法為:分別利用用戶i和j日均負(fù)荷曲線中各小時(shí)的平均負(fù)荷組成用戶日負(fù)荷量Li和Lj,基于余弦相似度計(jì)算方法計(jì)算用電行為相似度
(2)
3) 識(shí)別與構(gòu)建相似用戶群體.
如圖4所示,相似用戶群體的形成過程包括:基于用戶節(jié)點(diǎn)間相互關(guān)系權(quán)重模型,計(jì)算二元網(wǎng)絡(luò)中任意兩節(jié)點(diǎn)的權(quán)重,將權(quán)重最大的兩個(gè)節(jié)點(diǎn)合并為一個(gè)群,并視其為網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn),再與其他節(jié)點(diǎn)進(jìn)行關(guān)系權(quán)重計(jì)算,將權(quán)重最大的節(jié)點(diǎn)合并至群中,形成新的用戶群.如果群中的用戶超過售電體設(shè)定的用戶數(shù),則完成相似用戶群體的識(shí)別和構(gòu)建,反之則繼續(xù)計(jì)算更新的群與其他節(jié)點(diǎn)的關(guān)系權(quán)重,不斷更新群組成.在計(jì)算群與節(jié)點(diǎn)關(guān)系權(quán)重過程中,標(biāo)簽只取群中用戶共有特征,負(fù)荷量取群中所有用戶的平均值,由于相似用戶的識(shí)別過程是對網(wǎng)絡(luò)中所有用戶節(jié)點(diǎn)進(jìn)行遍歷計(jì)算,再進(jìn)行權(quán)重排序,計(jì)算順序?qū)⒉挥绊懩P徒Y(jié)果.
圖3 “用戶-標(biāo)簽”二元關(guān)系網(wǎng)絡(luò)Fig.3 “User-label” two-unit network
圖4 相似用戶群網(wǎng)絡(luò)Fig.4 Similar user group network
1.3相似用戶群體特征分析
在識(shí)別和構(gòu)建相似用戶群體后,一方面可以如圖1所示,分析和獲得群標(biāo)簽屬性和用電行為特征,用以表征電力用戶群體行為,實(shí)現(xiàn)售電體面向群體的銷售決策;另一方面,相似用戶群體的屬性包含了個(gè)體用戶的行為刻畫,能夠幫助售電體預(yù)測用戶個(gè)體的用電行為,實(shí)現(xiàn)面向用戶的電力精準(zhǔn)營銷.其中,群體標(biāo)簽為群用戶共同擁有的標(biāo)簽類型,從群識(shí)別過程可以獲得;群典型負(fù)荷量L反映了群體共同的用電行為特征,計(jì)算方法為
(3)
其中:Li為相似用戶群中用戶i的日負(fù)荷量,N為群中用戶的數(shù)量.
通過群分析預(yù)測個(gè)體用戶的用電行為,主要體現(xiàn)在對其負(fù)荷量的預(yù)測,對于新入網(wǎng)用戶j,為了預(yù)測其用電行為特征,需要先識(shí)別該用戶屬于的群體,方法為分別計(jì)算用戶j與所有群的相同標(biāo)簽個(gè)數(shù),數(shù)值最大的群則為j的歸屬群,其負(fù)荷量
(4)
其中:Li為所屬群中與j相同標(biāo)簽個(gè)數(shù)最多的K個(gè)用戶的負(fù)荷量,K為售電體設(shè)定值,小于N.
本算例利用河南省某地區(qū)抽樣1 000戶居民的用電行為刻畫數(shù)據(jù),進(jìn)行相似識(shí)別,分析群體特征,驗(yàn)證本文提出的方法.
2.1電力用戶標(biāo)簽體系和二元網(wǎng)絡(luò)
如表1所示,用戶標(biāo)簽體系主要包含家庭人口、住房面積、房屋均價(jià)、熱源類型、用戶信用、購電渠道等內(nèi)容.如圖2所示,為每個(gè)用戶賦予相應(yīng)的標(biāo)簽,形成“用戶-標(biāo)簽”二元網(wǎng)絡(luò),構(gòu)建大數(shù)據(jù)分析系統(tǒng).
2.2相似用戶群體識(shí)別與分析
利用1.2所述的相似用戶群體分析方法,設(shè)定群用戶數(shù)量N=50,識(shí)別出相似用戶群體的共同標(biāo)簽特征包括:2~3人、60~90 m2、7 000~12 000元/m2、燃?xì)?、市政熱?利用式(3)計(jì)算出群體的典型日負(fù)荷量,與50戶個(gè)體負(fù)荷量各個(gè)小時(shí)的均方根誤差均值見圖5,各時(shí)刻平均為3.2%,表明群體典型日負(fù)荷量與個(gè)體負(fù)荷量誤差較小,較為準(zhǔn)確地體現(xiàn)了群體中個(gè)體普遍的用電行為特征.本文提出的群體識(shí)別方法能夠有效識(shí)別出具有相似用電行為的用戶群體.
表1 電力用戶標(biāo)簽體系Tab.1 Power user label system
為了進(jìn)一步驗(yàn)證通過對相似用戶群體的分析可以用于預(yù)測新入網(wǎng)用戶的用電行為特征,隨機(jī)取實(shí)驗(yàn)樣本以外的一個(gè)用戶樣本,提取樣本用戶標(biāo)簽后,尋找與該用戶相同標(biāo)簽數(shù)量最多的用戶群作為該用戶的歸屬群,再分別計(jì)算該用戶與歸屬群中其他用戶的相同標(biāo)簽個(gè)數(shù),取數(shù)值最大的前10個(gè)用戶,計(jì)算其平均日負(fù)荷量,作為該用戶的負(fù)荷量預(yù)測值.如圖6所示,預(yù)測負(fù)荷值的曲線與實(shí)際值的曲線趨勢相似,其均方根誤差平均值為5.3%.結(jié)果表明,基于相似群體分類結(jié)果,利用新入網(wǎng)用戶的屬性標(biāo)簽,可以有效預(yù)測用戶的用電行為趨勢特征,對于售電體以用戶為中心實(shí)施基于互聯(lián)網(wǎng)的精準(zhǔn)營銷、制定需求響應(yīng)策略、優(yōu)化用戶能效等具有支撐作用.
圖5 群體典型負(fù)荷與個(gè)體負(fù)荷均方根誤差Fig.5 Mean square error curve of group typical load and individual load
圖6 負(fù)荷預(yù)測對比圖Fig.6 Load forecasting contrast curve
本文研究了電力用戶相似群體識(shí)別與特征分析方法.針對電力用戶用電行為和社會(huì)屬性特征,建立用戶標(biāo)簽體系及“用戶-標(biāo)簽”二元網(wǎng)絡(luò),并以標(biāo)簽對比結(jié)果為基礎(chǔ),將用戶歷史負(fù)荷相似度作為動(dòng)態(tài)系數(shù)修成標(biāo)簽對比結(jié)果,構(gòu)建用戶相互關(guān)系權(quán)重模型,作為衡量用戶相似度識(shí)別的標(biāo)準(zhǔn),在二元網(wǎng)絡(luò)中聚合用戶形成相似群體,進(jìn)而獲得群屬性標(biāo)簽和典型負(fù)荷特征,最后以相似群體為基礎(chǔ),基于新入網(wǎng)用戶屬性標(biāo)簽將其歸入相似群,并進(jìn)一步預(yù)測新用戶的用電行為特征.仿真算例表明,該方法通過對標(biāo)簽數(shù)據(jù)的分析,可以得到相似用戶群體,準(zhǔn)確提取相似用戶群用電行為特征以及發(fā)現(xiàn)群體中的重要用戶,并預(yù)測新入網(wǎng)用戶的負(fù)荷曲線趨勢,便于售電體為電力用戶提供個(gè)性化用電服務(wù)、精準(zhǔn)實(shí)施需求響應(yīng)策略、提升電網(wǎng)能效.
[1]嚴(yán)太山,程浩忠,曾平良,等.能源互聯(lián)網(wǎng)體系架構(gòu)及關(guān)鍵技術(shù)[J].電網(wǎng)技術(shù),2016,40(1):105-113.
[2]周海明,劉廣一,劉超群.能源互聯(lián)網(wǎng)技術(shù)框架研究[J].中國電力,2014,47(11):140-144.
[3]曾鳴,楊雍琦,劉敦楠,等.能源互聯(lián)網(wǎng)“源-網(wǎng)-荷-儲(chǔ)”協(xié)調(diào)優(yōu)化運(yùn)營模式及關(guān)鍵技術(shù)[J].電網(wǎng)技術(shù),2016,40(1):114-124.
[4]何哲,王瑞峰,郝溪. 含分布式電源配電網(wǎng)單相接地故障測距研究[J]. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版),2016,48(1): 85-90.
[5]馬瑞,周謝,彭舟,等.考慮氣溫因素的負(fù)荷特性統(tǒng)計(jì)指標(biāo)關(guān)聯(lián)特征數(shù)據(jù)挖掘[J].中國電機(jī)工程學(xué)報(bào),2015,35(1):43-51.
[6]王繼業(yè),季知祥,史夢潔,等.智能配用電大數(shù)據(jù)需求分析與應(yīng)用研究[J].中國電機(jī)工程學(xué)報(bào),2015,35(8):1829-1836.
[7]CHICCO G, NAPOLI R, PIGLIONE F. Comparisons among clustering techniques for electricity customer classification[J]. IEEE Trans on Power Systems, 2006, 21(2): 933-940.
[8]王德文,孫志偉.電力用戶側(cè)大數(shù)據(jù)分析與并行負(fù)荷預(yù)測[J].中國電機(jī)工程學(xué)報(bào),2015,35(3):527-537.
[9]薛承榮,顧潔,趙建平,等.基于用戶用電特性及供電成本分?jǐn)偟匿N售側(cè)電價(jià)機(jī)制研究[J].華東電力,2014,42(1):168-173.
[10]黎祚,周步祥,林楠.基于模糊聚類與改進(jìn)BP算法的日負(fù)荷特性曲線分類與短期負(fù)荷預(yù)測[J].電力系統(tǒng)保護(hù)與控制,2012,40(3):56-60.
[11]彭夸, 楊超.基于用戶實(shí)際日負(fù)荷曲線的負(fù)荷分類策略研究[J].貴州電力技術(shù), 2014,(2):48-49.
[12]蔡政權(quán),劉至鋒,管霖,等.基于可靠性需求的電力客戶細(xì)分和可靠性價(jià)值評估方法[J].廣東電力,2015,28(5):44-50.
[13]張曉春,倪紅芳,李娜.基于數(shù)據(jù)挖掘的供電企業(yè)客戶細(xì)分方法及模型研究[J].科技與管理,2013,15(6):104-109.
[14]廖志芳,王超群,李小慶,等.張量分解的標(biāo)簽推薦及新用戶標(biāo)簽推薦算法[J].小型微型計(jì)算機(jī)系統(tǒng),2013,34(11):2472-2476.
[15]羅勇, 李芳. 基于負(fù)荷預(yù)測的電力市場寡頭競爭分析[J]. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版),2013,45(3):110-114.
[16]黃碩, 樓樹美. 基于XML路徑表達(dá)式優(yōu)化及其查詢和過濾計(jì)算方法研究[J]. 信陽師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2015,28(4):608-611.
[17]張曉煜, 林曉, 王志杰. 面向大數(shù)據(jù)庫正則表達(dá)式查詢的有效算法[J]. 河南科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2015, 36(4):56-61.
[18]張素香,劉建明,趙丙鎮(zhèn),等.基于云計(jì)算的居民用電行為分析模型研究[J].電網(wǎng)技術(shù),2013,37(6):1542-1546.
[19]王海雷,俞學(xué)寧.基于隨機(jī)游走算法的社會(huì)化標(biāo)簽的用戶推薦[J].計(jì)算機(jī)工程與設(shè)計(jì),2013,34(7):2388-2391.
(責(zé)任編輯:王浩毅)
Research on Method of Power User Group Identification and Analysis Based on Large Data
XU Changqing1, ZHAO Huadong2, SONG Xiaohui3
(1.EconomicResearchInstitute,HenanElectricPowerCompany,Zhengzhou450002,China;2.SchoolofMechanicalEngineering,ZhengzhouUniversity,Zhengzhou450001,China;3.HenanAcademyofSciencesInstituteofAppliedPhysics,Zhengzhou450008,China)
With the rapid development of Energy Internet and smart grid, it is an important part of “Internet plus” smart energy to have a good understanding of the power users group behaviors and providing accurate power service. Based on large data analysis of the power users, the user similarity weight model was built and the “user-label” two-unit network was put forward to identify similar groups. In addition, the group attributes and typical electricity consumption characteristics were obtained. This method could help to identify the important user groups, who might need customized electricity services and value-added services, for power suppliers. So the quality of power service could be greatly enhanced.
big data; power users; similar group; user label
2016-06-15
國家自然科學(xué)基金民航聯(lián)合研究重點(diǎn)支持項(xiàng)目(U1333201),河南省基礎(chǔ)與前沿技術(shù)研究計(jì)劃項(xiàng)目(112300410090).
許長清(1973—),男,河南鄭州人,高級工程師,主要從事能源互聯(lián)網(wǎng)技術(shù)研究,E-mail: zzplus@163.com;通訊作者:趙華東(1978—),男,河南開封人,副教授,主要從事智能工業(yè)技術(shù)研究,E-mail: huadong@zzu.edu.cn.
TM71
A
1671-6841(2016)03-0113-05
10.13705/j.issn.1671-6841.2016090
引用本文:許長清,趙華東,宋曉輝.基于大數(shù)據(jù)的電力用戶群體識(shí)別與分析方法研究[J]. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版),2016,48(3):113-117.