龔鋼軍, 陳志敏, 陸 俊, 王朝亮, 祁 兵, 崔高穎
(1. 北京市能源電力信息安全工程技術(shù)研究中心(華北電力大學(xué)), 北京市 102206; 2. 國(guó)網(wǎng)浙江省電力公司電力科學(xué)研究院, 浙江省杭州市 310014; 3. 國(guó)網(wǎng)江蘇省電力公司電力科學(xué)研究院, 江蘇省南京市 211103)
近年來(lái)中國(guó)一直在大力推進(jìn)智能配用電網(wǎng)絡(luò)的建設(shè)[1],力求構(gòu)建以雙向數(shù)據(jù)互動(dòng)為基礎(chǔ)、精細(xì)化智能管理為目標(biāo)的“智能營(yíng)銷管理體系”和“智能配電監(jiān)測(cè)管理體系”,實(shí)現(xiàn)配用電的雙向互動(dòng)、信息采集、信息交換、信息處理等環(huán)節(jié)的智能化管理與控制[2]。智能配用電是智能電網(wǎng)發(fā)展的重要部分,對(duì)用戶用電行為進(jìn)行智能優(yōu)化,可提高供電側(cè)的可靠性、改善供電質(zhì)量,使得供用電雙方利益最大化[3]。由于配用電是智能電網(wǎng)的神經(jīng)末梢,直接面向用戶,網(wǎng)絡(luò)架構(gòu)復(fù)雜且業(yè)務(wù)類型多[4],業(yè)務(wù)需按照不同聚類方法加以細(xì)化區(qū)分,用戶行為分析難度大。伴隨著大數(shù)據(jù)分析技術(shù)的興起,使得深度分析用戶行為、提取用戶的潛在用電習(xí)慣和用電趨勢(shì)成為一種技術(shù)可能[5-8]。同時(shí),智能小區(qū)的出現(xiàn)使得智能電網(wǎng)用戶側(cè)管理也成為可能,雖然智能小區(qū)居民中的家用電器類別繁多,但由于不同用電設(shè)備具有不同的用電特性,可采取不同的負(fù)荷設(shè)備控制方法,使得用戶能積極地參與到智能用電環(huán)節(jié)中來(lái)[9-12]。一方面對(duì)于用戶,合理、有效地控制和指導(dǎo)家庭用電設(shè)備的使用,可以幫助用戶節(jié)約用電,同時(shí)還能降低能源的消耗,提高能源的利用率,實(shí)現(xiàn)智能用電;另一方面對(duì)于電網(wǎng)企業(yè),通過(guò)分析用戶的用電行為,從負(fù)荷曲線變化規(guī)律、用電量等著手為其制定合理的用電策略,對(duì)提高電網(wǎng)側(cè)的經(jīng)濟(jì)性具有重大意義[13]。
因此,需要對(duì)用戶用電行為進(jìn)行合理聚類。文獻(xiàn)[14]提出從當(dāng)前市場(chǎng)價(jià)值、潛在市場(chǎng)價(jià)值、區(qū)域貢獻(xiàn)價(jià)值等方面對(duì)用戶進(jìn)行聚類研究,但該聚類方式過(guò)于宏觀,不能實(shí)現(xiàn)電力負(fù)荷的精細(xì)化管理。文獻(xiàn)[15]提出了一種根據(jù)電力用戶日負(fù)荷曲線進(jìn)行用戶用電行業(yè)歸屬聚類的方法,可以制定相對(duì)公平的電價(jià),對(duì)用戶用電行為的聚類提供了依據(jù),但未對(duì)聚類結(jié)果的合理性作出判斷。文獻(xiàn)[16]提出了一種用戶負(fù)荷形態(tài)分析方法。將不同用戶按照其典型負(fù)荷形態(tài)的余弦相似性進(jìn)行聚類。與傳統(tǒng)用歐式距離來(lái)量度負(fù)荷形態(tài)之間的相似性相比,取得了較好的用戶聚類效果。文獻(xiàn)[17]針對(duì)海量、分散的用電數(shù)據(jù),提出了一種兩階段的面向海量用戶用電態(tài)勢(shì)感知的分布式聚類算法,能夠高效監(jiān)測(cè)用戶用電行為。文獻(xiàn)[18]提出從信息熵角度用決策樹(shù)聚類算法來(lái)評(píng)價(jià)聚類算法結(jié)果的有效性,從而確定最佳的聚類個(gè)數(shù)。
本文在文獻(xiàn)[19]研究的基礎(chǔ)上,采用特征優(yōu)選策略提取負(fù)荷曲線的最佳特征集,獲取適用于用戶數(shù)據(jù)集的特征集。在實(shí)現(xiàn)用戶用電行為聚類時(shí),引入準(zhǔn)確度評(píng)價(jià)指標(biāo)和有效度評(píng)價(jià)指標(biāo),通過(guò)聚類優(yōu)選策略評(píng)價(jià)準(zhǔn)則,實(shí)現(xiàn)用戶用電行為的聚類優(yōu)選。最后,本文通過(guò)國(guó)內(nèi)小規(guī)模數(shù)據(jù)和國(guó)外愛(ài)爾蘭大規(guī)模用戶用電數(shù)據(jù)對(duì)策略進(jìn)行了驗(yàn)證與分析。在對(duì)智能電網(wǎng)的需求側(cè)管理時(shí),需要掌握用戶用電負(fù)荷形態(tài),以此來(lái)消減電力高峰負(fù)荷,平衡電力供需,通過(guò)本文提出的用電用戶行為分析的聚類優(yōu)選策略,能夠更為準(zhǔn)確、合理地分析用戶用電負(fù)荷狀態(tài),以此來(lái)制定適宜的需求側(cè)措施。
準(zhǔn)確度是衡量聚類結(jié)果優(yōu)劣指標(biāo)之一,常用的方法有保持法、隨機(jī)子抽樣法和k-fold交叉檢驗(yàn)法[20]。在準(zhǔn)確度定義基礎(chǔ)上,本文引入同一用戶的典型和次典型數(shù)據(jù),將聚類結(jié)果中同一用戶典型數(shù)據(jù)和次典型數(shù)據(jù)分為同一類的概率作為評(píng)價(jià)聚類性能的準(zhǔn)確度。
本文數(shù)據(jù)源之一是愛(ài)爾蘭用戶用電數(shù)據(jù)[17],數(shù)據(jù)量大且在測(cè)試前無(wú)法確定數(shù)據(jù)所屬類別。需要選取合適的樣本來(lái)判斷運(yùn)算結(jié)果的準(zhǔn)確度。因此,本文選取用戶負(fù)荷曲線中的典型和次典型曲線作為準(zhǔn)確度評(píng)價(jià)的樣本。本文根據(jù)用戶用電數(shù)據(jù)間的相關(guān)性來(lái)提取用戶典型和次典型負(fù)荷曲線。由于少數(shù)用戶6 d的用電數(shù)據(jù)存在較大差異,使得所求典型用電數(shù)據(jù)不能代表該用戶用電數(shù)據(jù),同時(shí)典型和次典型數(shù)據(jù)會(huì)存在較大差異,影響分類結(jié)果的準(zhǔn)確度,本文通過(guò)設(shè)定閾值來(lái)有效剔除異常數(shù)據(jù)。在典型和次典型負(fù)荷曲線的選取時(shí),既保證典型和次典型用戶用電曲線能更大程度地代表用戶,同時(shí)也要使得絕大多數(shù)的用戶滿足閾值條件。單一用戶典型負(fù)荷曲線選取策略如下。
1)本實(shí)驗(yàn)愛(ài)爾蘭數(shù)據(jù)中每一用戶記錄了電表的1,2,…,6 d的采樣數(shù)據(jù),先通過(guò)相關(guān)系數(shù)公式求出組內(nèi)相關(guān)系數(shù),即
(1)
式中:cov(x,y)為同一用戶任意兩日數(shù)據(jù)x和y的協(xié)方差;δx和δy分別為兩日數(shù)據(jù)x和y的標(biāo)準(zhǔn)差。
2)求出每?jī)扇罩g的相關(guān)系數(shù)后,每個(gè)用戶會(huì)得出一個(gè)6×6的對(duì)稱矩陣A,對(duì)矩陣A中每行求和得出Bi,i=1,2,…,6,將其作為這組數(shù)據(jù)是否為該用戶典型用電數(shù)據(jù)的量度值。同時(shí)設(shè)定閾值C:若Bi>C則將其最大相關(guān)系數(shù)所在行的數(shù)據(jù)作為該用戶的典型數(shù)據(jù);若Bi 上文已給出求取用戶典型用電曲線的方法,在此基礎(chǔ)上,對(duì)次典型數(shù)據(jù)的選取策略如下。 1)求出6 d的用戶用電數(shù)據(jù)與該用戶典型數(shù)據(jù)的相關(guān)系數(shù)D,選取相關(guān)性最大的那日數(shù)據(jù),若該日數(shù)據(jù)和典型用電曲線相關(guān)系數(shù)大于設(shè)定閾值,則將該日數(shù)據(jù)作為該組用戶的次典型數(shù)據(jù)。從附錄A表A2可以看出,為使得典型數(shù)據(jù)和次典型數(shù)據(jù)具有一定的相關(guān)性,并且可以在一定程度上代表該用戶的用電行為,設(shè)定閾值為0.7(閾值是通過(guò)對(duì)多個(gè)用戶數(shù)據(jù)進(jìn)行比較得出的觀察值),在20個(gè)用戶中有用戶4和17不滿足閾值要求。由此可見(jiàn),典型數(shù)據(jù)和次典型數(shù)據(jù)具有一定的相關(guān)性,并且可以在一定程度上代表該用戶的用電行為。 2)將典型數(shù)據(jù)作為本次實(shí)驗(yàn)的樣本1,將次典型數(shù)據(jù)作為本次實(shí)驗(yàn)的樣本2,根據(jù)典型數(shù)據(jù)和次典型數(shù)據(jù)聚類結(jié)果是否一致來(lái)判斷聚類的準(zhǔn)確度。 附錄A圖A2為某一用戶第3日和第6日用電量曲線,其相關(guān)系數(shù)為0.771 6,典型和次典型數(shù)據(jù)是通過(guò)相關(guān)系數(shù)的值進(jìn)行區(qū)分。由于第3日的相關(guān)系數(shù)值大于第6日,則第3日為典型數(shù)據(jù),第6日為次典型數(shù)據(jù)??梢钥闯?將典型用電曲線和次典型用電曲線兩個(gè)樣本進(jìn)行聚類比較,以此來(lái)判斷運(yùn)算結(jié)果的準(zhǔn)確度具有一定的合理性。本文定義第i個(gè)用戶的典型數(shù)據(jù)和次典型數(shù)據(jù)分為相同類的概率為pi:當(dāng)?shù)湫蛿?shù)據(jù)和次典型數(shù)據(jù)屬于同一類,則pi=1,否則pi=0。若nc為參與聚類的用戶數(shù),則可定義聚k類時(shí)的準(zhǔn)確度Ck為: (2) 本文采用Ck來(lái)量度準(zhǔn)確度,其值越大則聚類效果越好。 有效度是衡量聚類結(jié)果的優(yōu)劣指標(biāo)之一,常用的有效度有外部評(píng)價(jià)、內(nèi)部評(píng)價(jià)和相對(duì)評(píng)價(jià);有效度的主要原則是使得類內(nèi)緊密度高、類間距離大[21]。為選取合適、有效的聚類結(jié)果,需要綜合考慮聚類后的類內(nèi)散度和類間距離。文獻(xiàn)[16]表明在比較負(fù)荷曲線的相似波動(dòng)特性時(shí),采用余弦值較歐式距離作為相似度量度更為合適。本文將基于余弦的類內(nèi)相似性作為有效度的量度指標(biāo),具體如下。 設(shè)Xi和Xj分別為用戶i和j一日的負(fù)荷曲線,xi1,xi2,…,xim為用戶Xi一日內(nèi)m個(gè)采樣時(shí)刻的值,將負(fù)荷曲線Xi和負(fù)荷曲線Xj的夾角余弦值作為兩負(fù)荷曲線的相似度系數(shù),即 (3) 可見(jiàn),兩負(fù)荷曲線越相似則相似度系數(shù)越大。 通過(guò)改變K-means算法的聚類數(shù)目,相應(yīng)地實(shí)現(xiàn)了類內(nèi)數(shù)據(jù)的調(diào)整。通過(guò)量度聚類的類內(nèi)離散程度,定義聚k類時(shí)的有效度Ek為: (4) 式中:Cl表示第l類;k為聚類數(shù)目;nl為第l類的類內(nèi)負(fù)荷曲線個(gè)數(shù)。 通過(guò)上式可見(jiàn),隨著聚類數(shù)的增加,Ek會(huì)逐漸增大,當(dāng)聚類數(shù)達(dá)到最佳時(shí),Ek值會(huì)趨于穩(wěn)定。本文采用Ek量度有效度,其值越大則聚類效果越好。 為選出最優(yōu)聚類結(jié)果,需綜合考慮準(zhǔn)確度和有效度評(píng)價(jià)指標(biāo)Ck和Ek,設(shè)定聚類優(yōu)選準(zhǔn)則。本文提出的數(shù)據(jù)聚類結(jié)果的準(zhǔn)確度和有效度評(píng)價(jià)指標(biāo)具有凸性。由式(2)可知,隨著聚類數(shù)的增加,類內(nèi)離散程度會(huì)降低,當(dāng)類內(nèi)散度低于用戶典型和次典型數(shù)據(jù)間的散度時(shí),典型數(shù)據(jù)和次典型數(shù)據(jù)分為一類的概率會(huì)下降,使得準(zhǔn)確度下降。從有效度判定指標(biāo)可以看出,隨著聚類數(shù)的增加,類內(nèi)散度逐漸降低;由式(4)可知,類內(nèi)有效度會(huì)逐漸增加,當(dāng)達(dá)到最佳聚類數(shù)時(shí),類內(nèi)散度隨聚類數(shù)的增加變化趨于平緩。 為求出最佳聚類數(shù)目,采用尋找兩個(gè)指標(biāo)曲線的突變點(diǎn)實(shí)現(xiàn)最佳聚類數(shù)尋優(yōu),具體步驟如下。 步驟1:按照式(5)和式(6)計(jì)算準(zhǔn)確度和有效度的一階差值。 ΔCk=|Ck+1-Ck|k=1,2,…,n (5) ΔEk=|Ek+1-Ek|k=1,2,…,n (6) 式中:ΔCk為相鄰聚類數(shù)的準(zhǔn)確度一階差值;ΔEk為相鄰聚類數(shù)的有效度一階差值;n為聚類數(shù)。 步驟2:按照式(7)和式(8)計(jì)算準(zhǔn)確度和有效度的二階差值最大值。 (7) (8) 步驟3:按照式(9)確定最佳聚類數(shù)Nopt。 j+1≤Nopt≤i+1 (9) 用電行為分析的聚類優(yōu)選策略如圖1所示。 圖1 用戶用電行為聚類優(yōu)選策略Fig.1 Clustering optimization strategy for electricity consumption behavior analysis 聚類優(yōu)選策略原理如下:首先根據(jù)相關(guān)性求取單一用戶典型和次典型曲線,然后根據(jù)特征優(yōu)選算法找出負(fù)荷曲線優(yōu)選特征集,并將特征集內(nèi)的特征值進(jìn)行歸一化處理,將歸一化的特征值進(jìn)行K-means聚類。計(jì)算聚類后的準(zhǔn)確度,根據(jù)式(4)計(jì)算聚類后的有效度。通過(guò)不斷改變聚類數(shù)目,來(lái)比較不同聚類數(shù)目下的評(píng)價(jià)指標(biāo),直到評(píng)價(jià)指標(biāo)達(dá)到終止閾值時(shí)停止聚類,本策略的終止判別條件如式(10)所示。最后根據(jù)式(9)求出最佳聚類數(shù)目。 max(Ck)-min(Ck)≥T (10) 式中:T為終止閾值。由于準(zhǔn)確度和有效度的突變點(diǎn)位置鄰近,所以本文選取準(zhǔn)確度來(lái)確定終止閾值,所選閾值為0.1。 用戶用電行為聚類優(yōu)選的分析方法主要包含對(duì)用戶用電負(fù)荷曲線的特征優(yōu)選和用戶用電行為的聚類優(yōu)選。 由于使用負(fù)荷曲線聚類數(shù)據(jù)計(jì)算量大,不適合大量數(shù)據(jù)情況下的使用,本文采用文獻(xiàn)[19]中的特征優(yōu)選策略,來(lái)提取負(fù)荷曲線的最優(yōu)特征集。經(jīng)過(guò)對(duì)數(shù)據(jù)的特征優(yōu)選,本文將日平均負(fù)荷、谷電系數(shù)、平段的用電量百分比、峰時(shí)耗電率4個(gè)特征作為用戶用電數(shù)據(jù)的優(yōu)選特征。 根據(jù)上文優(yōu)選出的特征集,提取所有用戶用電負(fù)荷曲線的用電特征,并用這些特征進(jìn)行聚類分析。通過(guò)改變聚類數(shù)目,比較不同聚類數(shù)目下的準(zhǔn)確度和有效度,當(dāng)達(dá)到設(shè)定閾值時(shí)停止聚類,最后根據(jù)本文提出的聚類優(yōu)選策略選出最佳聚類數(shù)目。 本文通過(guò)采用聚類優(yōu)選策略來(lái)有效地彌補(bǔ)在用電行為分析中動(dòng)態(tài)聚類算法的不足,并通過(guò)實(shí)際示例來(lái)說(shuō)明如何通過(guò)構(gòu)造準(zhǔn)確度和有效度確定最佳聚類數(shù)的基本思路。 本文實(shí)驗(yàn)數(shù)據(jù)有兩個(gè)來(lái)源:①采用文獻(xiàn)[19]中某電網(wǎng)居民用戶日用電數(shù)據(jù);②選自文獻(xiàn)[17]中愛(ài)爾蘭居民用電數(shù)據(jù)中的1 000個(gè)用戶,每個(gè)用戶6條負(fù)荷曲線共6 000組數(shù)據(jù),數(shù)據(jù)集來(lái)自于SEAI發(fā)布的愛(ài)爾蘭智能電表實(shí)際量測(cè)數(shù)據(jù),每30 min采集一次,每個(gè)用戶每天共采集48個(gè)數(shù)據(jù)點(diǎn)。 本文首先選取某電網(wǎng)日用電數(shù)據(jù)進(jìn)行仿真驗(yàn)證,并用該組數(shù)據(jù)進(jìn)行算例分析,以驗(yàn)證算法的合理性和有效性,然后對(duì)大規(guī)模愛(ài)爾蘭數(shù)據(jù)進(jìn)行聚類優(yōu)選。算例在單臺(tái)CPU 2.5 GHz,內(nèi)存4 GB的個(gè)人計(jì)算機(jī)上完成,同時(shí)使用MATLAB進(jìn)行算法仿真,所有實(shí)驗(yàn)數(shù)據(jù)均經(jīng)過(guò)MATLAB處理。 由文獻(xiàn)[19]可以看出,國(guó)內(nèi)某電網(wǎng)居民用戶數(shù)據(jù)被分為6類,因此用該組數(shù)據(jù)進(jìn)行聚類優(yōu)選,對(duì)聚類優(yōu)選策略的合理性進(jìn)行驗(yàn)證。準(zhǔn)確度和有效度的變化趨勢(shì)如圖2所示,數(shù)據(jù)如表1所示。 圖2 國(guó)內(nèi)數(shù)據(jù)聚類優(yōu)選評(píng)價(jià)指標(biāo)變化趨勢(shì)Fig.2 Variation tendency for clustering optimization index of consumer power data in China 聚類數(shù)kCkEk30.97900.860440.97490.886850.98220.902660.98100.920070.92130.924380.85330.9218 從圖中可以看出當(dāng)聚類數(shù)為6時(shí),準(zhǔn)確度開(kāi)始下降,有效度開(kāi)始保持穩(wěn)定,增加聚類數(shù)對(duì)求取最佳聚類數(shù)目沒(méi)有意義,所以選取聚類數(shù)3~8進(jìn)行分析。由準(zhǔn)確度曲線可以看出當(dāng)進(jìn)行聚類時(shí),準(zhǔn)確度開(kāi)始時(shí)較為平緩且準(zhǔn)確度較高,但當(dāng)達(dá)到一定的聚類數(shù)時(shí),準(zhǔn)確度指標(biāo)會(huì)開(kāi)始下降。在聚類數(shù)3,4,5,6時(shí)準(zhǔn)確度都較高,在98%左右小幅度波動(dòng)。在聚類數(shù)為7和8時(shí),準(zhǔn)確度有明顯的下降。因?yàn)樵诰垲惾缇?類時(shí),會(huì)將其中兩類合并為一類,而該類內(nèi)的用戶仍然屬于同一類,其準(zhǔn)確度不會(huì)下降。但當(dāng)超出最佳聚類數(shù)后,本屬于同一類的用戶會(huì)被分別歸于不同的類,使得準(zhǔn)確度下降。如果加入有效度評(píng)價(jià)指標(biāo)進(jìn)行量度,也就是聚類的容忍度越低,類越多,類內(nèi)相似度會(huì)越高。 從圖2中有效度曲線可以看出,隨著聚類數(shù)目的增加,有效度不斷升高,當(dāng)聚類數(shù)目達(dá)到6,7,8時(shí),有效度曲線趨于平穩(wěn),因?yàn)楫?dāng)聚類數(shù)達(dá)到最佳時(shí),再對(duì)數(shù)據(jù)進(jìn)行聚類,其類內(nèi)相似度也不會(huì)有較大的波動(dòng)。根據(jù)聚類優(yōu)選策略對(duì)準(zhǔn)確度和有效度計(jì)算可得出,選擇最佳聚類數(shù)為6,與預(yù)期結(jié)果相同,證明了該聚類優(yōu)選策略的有效性。 本文對(duì)愛(ài)爾蘭1 000個(gè)居民用戶數(shù)據(jù)進(jìn)行算例分析。通過(guò)對(duì)用戶典型用電曲線和次典型用電曲線進(jìn)行聚類,比較聚類結(jié)果來(lái)判斷聚類的準(zhǔn)確度。并通過(guò)式(4)計(jì)算有效度,然后通過(guò)聚類優(yōu)選策略計(jì)算得出該組數(shù)據(jù)的最佳聚類數(shù)目為9或10。準(zhǔn)確度和有效度的變化趨勢(shì)如圖3所示,數(shù)據(jù)如表2所示。 圖3 愛(ài)爾蘭數(shù)據(jù)聚類優(yōu)選評(píng)價(jià)指標(biāo)變化趨勢(shì)Fig.3 Variation tendency for clustering optimization index of consumer power data in Ireland 聚類數(shù)kCkEk70.88500.723180.88710.800790.90600.8140100.89200.8281110.84400.8157120.81600.8164 在聚類數(shù)為9或10時(shí),準(zhǔn)確度開(kāi)始下降,有效度開(kāi)始保持穩(wěn)定,增加聚類數(shù)對(duì)求取最佳聚類數(shù)目沒(méi)有意義,所以選取聚類數(shù)7~12進(jìn)行分析。由準(zhǔn)確度曲線可以看出,在聚類數(shù)達(dá)到10之前,準(zhǔn)確度在89%附近平穩(wěn)波動(dòng),當(dāng)聚類數(shù)超出10時(shí)準(zhǔn)確度開(kāi)始有明顯下降,同時(shí)從圖中有效度曲線可以看出,在聚類數(shù)達(dá)到10之前有效度不斷上升,之后其有效度趨于平穩(wěn)波動(dòng)??梢钥闯鲞x擇最佳聚類數(shù)目為9或10較為合理,數(shù)據(jù)如表2所示。聚類結(jié)果與文獻(xiàn)[17]得到的聚類結(jié)果相符。 將文獻(xiàn)[17]中求取聚類數(shù)目的分析方法作為對(duì)比算法,其采用自適應(yīng)K-means算法,在一次聚類時(shí)引入歐式距離作為容忍度誤差的指標(biāo),通過(guò)觀察容忍度誤差閾值和聚類數(shù)目的關(guān)系確定最佳的聚類數(shù)目,然后將局部數(shù)據(jù)的聚類結(jié)果進(jìn)行全局聚類,得到最終的聚類結(jié)果。為證明本文算法的有效度,對(duì)判斷聚類是否最優(yōu)的準(zhǔn)確度(Ck)、有效度(Ek)、類內(nèi)距離及類間距離進(jìn)行比較分析[22]。通過(guò)本文算法對(duì)用戶數(shù)據(jù)進(jìn)行數(shù)據(jù)分析得出聚類數(shù)為9,通過(guò)基于自適應(yīng)K-means的分布式聚類算法得出的聚類數(shù)為10,比較結(jié)果如表3所示。 表3 算法性能對(duì)比Table 3 Algorithm performance comparison 由表3可見(jiàn),本文方法的有效度、準(zhǔn)確度、類內(nèi)距離和類間距離要優(yōu)于比較算法。同時(shí)采用本文方法可以快速找到最佳聚類數(shù),僅需對(duì)其附近聚類數(shù)進(jìn)行比較分析,有效節(jié)約了計(jì)算時(shí)間。 本文在前期用戶用電行為特征優(yōu)選研究的基礎(chǔ)上,提出了基于準(zhǔn)確度和有效度的聚類優(yōu)選策略,并對(duì)用戶用電數(shù)據(jù)的聚類優(yōu)選進(jìn)行了實(shí)驗(yàn)驗(yàn)證和分析。本文所述策略能夠提高用戶用電行為聚類的合理性,更有效地掌握用戶用電負(fù)荷形態(tài),同時(shí)能夠消減電力高峰負(fù)荷、平衡電力供需,對(duì)智能電網(wǎng)的需求側(cè)管理有重要意義。但本文提出的聚類優(yōu)選算法,其應(yīng)用場(chǎng)景并不局限于用戶用電行為分析,還可以對(duì)算法的應(yīng)用場(chǎng)景進(jìn)行延伸研究。同時(shí)本文僅提出一種有效的聚類優(yōu)選策略,而如何選取合理的聚類準(zhǔn)則函數(shù)是算法中非常重要的環(huán)節(jié),它直接影響到算法的正常運(yùn)行和是否能達(dá)到尋找真正的最優(yōu)聚類數(shù)的目的,這部分工作仍需進(jìn)一步開(kāi)展。 附錄見(jiàn)本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx)。 [1] 宋璇坤,韓柳,鞠黃培,等.中國(guó)智能電網(wǎng)技術(shù)發(fā)展實(shí)踐綜述[J].電力建設(shè),2016,37(7):1-11. SONG Xuankun, HAN Liu, JU Huangpei, et al. A review on development practice of smart grid technology in China[J]. Electric Power Construction, 2016, 37(7): 1-11. [2] 龔鋼軍,熊琛,許剛.基于層次分析判斷矩陣的配用電通信業(yè)務(wù)模型的研究[J].電力系統(tǒng)保護(hù)與控制,2011,41(21):19-23. GONG Gangjun, XIONG Chen, XU Gang. Research of communication business model of power distribution and utilization based on the analytic hierarchy judgment matrix[J]. Power System Protection and Control, 2011, 41(21): 19-23. [3] 魯文,杜紅衛(wèi),丁恰,等.智能配電網(wǎng)優(yōu)化調(diào)度設(shè)計(jì)及關(guān)鍵技術(shù)[J].電力系統(tǒng)自動(dòng)化,2017,41(3):1-6.DOI:10.7500/AEPS20160405009. LU Wen, DU Hongwei, DING Qia, et al. Design and key technologies of optimal dispatch for smart distribution network[J]. Automation of Electric Power Systems, 2017, 41(3): 1-6. DOI: 10.7500/AEPS20160405009. [4] 龔鋼軍.智能配電通信網(wǎng)關(guān)鍵技術(shù)研究[D].北京:華北電力大學(xué),2014. [5] 張根周.大數(shù)據(jù)在智能電網(wǎng)領(lǐng)域的應(yīng)用[J].電網(wǎng)與清潔能源,2016,32(6):114-117. ZHANG Genzhou. Applications of big data in the field of smart grid[J]. Power Grid and Clean Energy, 2016, 32(6): 114-117. [6] 占彤平.基于數(shù)據(jù)挖掘的客戶用電行為分析研究與實(shí)踐[J].電網(wǎng)技術(shù),2014,38(S2):149-152. ZHAN Tongping. Analysis and practice of customer power consumption based on data mining[J]. Power System Technology, 2014, 38(S2): 149-152. [7] BERTOLDI P, ATANASIU B. An in-depth analysis of the electricity end-use consumption and energy efficiency trends in the tertiary sector of the European Union[J]. International Journal of Green Energy, 2011, 8(3): 306-331. [8] 中國(guó)電機(jī)工程學(xué)會(huì)信息化專委會(huì).中國(guó)電力大數(shù)據(jù)發(fā)展白皮書[R].2013. [9] 閆華光,陳宋宋,鐘鳴,等.電力需求側(cè)能效管理與需求響應(yīng)系統(tǒng)的研究與設(shè)計(jì)[J].電網(wǎng)技術(shù),2015,39(1):42-47. YAN Huaguang, CHEN Songsong, ZHONG Ming, et al. Research and design of demand side energy efficiency management and demand response system[J]. Power System Technology, 2015, 39(1): 42-47. [10] 崔強(qiáng),王秀麗,王維洲.考慮風(fēng)電消納能力的高載能用戶錯(cuò)峰峰谷電價(jià)研究[J].電網(wǎng)技術(shù),2015,39(4):946-952. CUI Qiang, WANG Xiuli, WANG Weizhou. Stagger peak electricity price for heavy energy-consuming enterprises considering improvement of wind power accommodation[J]. Power System Technology, 2015, 39(4): 946-952. [11] 于娜,于樂(lè)征,李國(guó)慶.智能電網(wǎng)環(huán)境下基于多代理的商業(yè)用戶可控負(fù)荷管理策略[J].電力系統(tǒng)自動(dòng)化,2015,39(17):89-95.DOI:10.7500/AEPS20150331031. YU Na, YU Yuezheng, LI Guoqing. Controllable load management strategy for commercial users based on multi-agent in smart grid environment[J]. Automation of Electric Power Systems, 2015, 39(17): 89-95. DOI: 10.7500/AEPS20150331031. [12] 王守相,孫智卿,劉喆.面向智能用電的家庭能量協(xié)同調(diào)度策略[J].電力系統(tǒng)自動(dòng)化,2015,40(17):108-113.DOI:10.7500/AEPS20140625016. WANG Shouxiang, SUN Zhiqing, LIU Zhe. Co-scheduling strategy of home energy for smart power utilization[J]. Automation of Electric Power Systems, 2015, 40(17): 108-113. DOI: 10.7500/AEPS20140625016. [13] 李東東,崔龍龍,林順富,等.家庭智能用電系統(tǒng)研究及智能控制器開(kāi)發(fā)[J].電力系統(tǒng)保護(hù)與控制,2013,41(4):123-129. LI Dongdong, CUI Longlong, LIN Shunfu, et al. Study of smart power utilization system and development of smart controller for homes[J]. Power System Protection and Control, 2013, 41(4): 123-129. [14] 王璨,馮勤超.基于價(jià)值評(píng)價(jià)的電力用戶聚類研究[J].價(jià)值工程,2009,28(5):64-67. WANG Can, FENG Qinchao. The research of power customers classification based on value assessment[J]. Journal of Value Engineering, 2009, 28(5): 64-67. [15] 李欣然,姜學(xué)皎,錢軍,等.基于用戶日負(fù)荷曲線的用電行業(yè)聚類與綜合方法[J].電力系統(tǒng)自動(dòng)化,2010,34(10):56-61. LI Xinran, JIANG Xuejiao, QIAN Jun, et al. A classifying and synthesizing method of power consumer industry based on the daily load profile[J]. Automation of Electric Power Systems, 2010, 34(10): 56-61. [16] 黃宇騰,侯芳,周勤,等.一種面向需求側(cè)管理的用戶負(fù)荷形態(tài)組合分析方法[J].電力系統(tǒng)保護(hù)與控制,2013,41(13):20-25. HUANG Yuteng, HOU Fang, ZHOU Qin, et al. A new combinational electrical load analysis method for demand side management[J]. Power System Protection and Control, 2013, 41(13): 20-25. [17] 朱文俊,王毅,羅敏,等.面向海量用戶用電特性感知的分布式聚類算法[J].電力系統(tǒng)自動(dòng)化,2016,40(12):21-27.DOI:10.7500/AEPS20160316007. ZHU Wenjun, WANG Yi, LUO Min, et al. Distributed clustering algorithm for awareness of electricity consumption characteristics of massive consumers[J]. Automation of Electric Power Systems, 2016, 40(12): 21-27. DOI: 10.7500/AEPS20160316007. [18] 張敞,王園園,趙裕嘯,等.一種基于信息熵的聚類結(jié)果評(píng)價(jià)方法[J].合肥工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2011,34(8):1251-1256. ZHANG Chang, WANG Yuanyuan, ZHAO Yuxiao, et al. A clustering results evaluation method based on information entropy[J]. Journal of Hefei University of Technology: Natural Science Edition, 2011, 34(8): 1251-1256. [19] 陸俊,朱炎平,彭文昊,等.智能用電用戶行為分析特征優(yōu)選策略[J].電力系統(tǒng)自動(dòng)化,2017,41(5):58-63.DOI:10.7500/AEPS20160607002. LU Jun, ZHU Yanping, PENG Wenhao, et al. Feature selection strategy for electricity consumption behavior analysis in smart grid[J]. Automation of Electric Power Systems, 2017, 41(5): 58-63. DOI: 10.7500/AEPS20160607002. [20] 武亞昆,段富,尹雪梅.分類器準(zhǔn)確率評(píng)估的研究[J].電腦開(kāi)發(fā)與應(yīng)用,2011,24(4):10-12. WU Yakun, DUAN Fu, YIN Xuemei. Research on accuracy evaluation of classifier[J]. Computer Development and Application, 2011, 24(4): 10-12. [21] 張惟皎,劉春煌,李芳玉.聚類質(zhì)量的評(píng)價(jià)方法[J].計(jì)算機(jī)工程,2005,31(20):10-12. ZHANG Weijiao, LIU Chunhuang, LI Fangyu. Method of quality evaluation for clustering[J]. Computer Engineering, 2005, 31(20): 10-12. [22] 胡勇.聚類分析結(jié)果評(píng)價(jià)方法研究[D].包頭:內(nèi)蒙古科技大學(xué),2014.1.2 聚類優(yōu)選策略有效度評(píng)價(jià)指標(biāo)
1.3 聚類優(yōu)選策略的評(píng)價(jià)準(zhǔn)則
2 用戶用電行為的聚類優(yōu)選策略
2.1 基本流程
2.2 用戶用電行為聚類優(yōu)選的分析方法
3 仿真與性能分析
3.1 小規(guī)模數(shù)據(jù)算例驗(yàn)證
3.2 大規(guī)模數(shù)據(jù)算例驗(yàn)證
3.3 對(duì)比性實(shí)驗(yàn)
4 結(jié)語(yǔ)