吳麗珍, 張永年, 陳 偉, 郝曉弘
(1. 蘭州理工大學(xué) 電氣工程與信息工程學(xué)院, 甘肅 蘭州 730050; 2. 蘭州理工大學(xué) 甘肅省工業(yè)過程先進(jìn)控制重點(diǎn)實(shí)驗(yàn)室, 甘肅 蘭州 730050; 3. 蘭州理工大學(xué) 國(guó)家級(jí)電氣與控制工程實(shí)驗(yàn)教學(xué)中心, 甘肅 蘭州 730050)
隨著我國(guó)能源互聯(lián)網(wǎng)戰(zhàn)略的不斷推進(jìn),電網(wǎng)建設(shè)也趨向于智能化,用戶用電量和用電行為方式也呈現(xiàn)出多元化的特征[1].在我國(guó)電力體制改革的背景下,電力行業(yè)逐步進(jìn)入以市場(chǎng)為導(dǎo)向的新層面,同時(shí)因?yàn)轶w驗(yàn)型經(jīng)濟(jì)逐漸興起,傳統(tǒng)的對(duì)電力用戶無差化服務(wù)已無法滿足用戶多樣化需求,因此,準(zhǔn)確地對(duì)電力用戶用電行為分析,實(shí)現(xiàn)對(duì)電力用戶用電的精準(zhǔn)分類并提供差異性服務(wù)成為了供配電領(lǐng)域的發(fā)展關(guān)鍵[2-3].研究電力用戶的基本信息數(shù)據(jù)對(duì)用戶用電行為的影響對(duì)于用戶用電策略的制定有著重要意義.
近年來,國(guó)內(nèi)外學(xué)者通過用電大數(shù)據(jù)挖掘,在用戶用電行為分析方面做了相關(guān)研究.張斌等[4]針對(duì)單一聚類方法的不足,通過對(duì)不同聚類方法優(yōu)缺點(diǎn)的分析,提出一種層次聚類與劃分聚類相結(jié)合的聚類方法用于負(fù)荷聚類.朱文俊等[5]在利用自適應(yīng)K-means算法對(duì)電力用戶進(jìn)行局部聚類分析基礎(chǔ)上,提取局部負(fù)荷曲線并構(gòu)建局部模型,并利用傳統(tǒng)聚類算法對(duì)局部模型進(jìn)行分析,獲取全局負(fù)荷曲線模型,進(jìn)行用戶用電態(tài)勢(shì)感知.但是,上述方法由于算法需要處理的數(shù)據(jù)類型較多,且存在大量的無用數(shù)據(jù),因此數(shù)據(jù)處理所需時(shí)間較長(zhǎng).陸俊等[6]提出一種基于用電特征優(yōu)選策略的自適應(yīng)用戶用電行為分析方法,以減少計(jì)算復(fù)雜度和提高聚類準(zhǔn)確率,但其僅對(duì)用戶用電特征數(shù)據(jù)進(jìn)行處理分析,而對(duì)于用戶基本信息數(shù)據(jù)并未加以利用,降低了電力用戶分類的準(zhǔn)確性.目前大多數(shù)研究是利用用戶數(shù)據(jù)對(duì)用戶進(jìn)行分類,對(duì)于在利用有限的數(shù)據(jù)信息情況下,分析電力用戶的基本信息數(shù)據(jù)與用戶用電行為之間的關(guān)聯(lián)性方面的研究較少,而該方面研究對(duì)于電力公司用電策略的制定有著重要意義.隨機(jī)矩陣?yán)碚?random matrix theory,RMT)作為一種統(tǒng)計(jì)學(xué)工具,在分析數(shù)據(jù)之間關(guān)聯(lián)性方面有著較為突出的效果.
因此,本文提出一種基于K-means聚類和隨機(jī)矩陣?yán)碚摰碾娏τ脩粲秒娦袨榭坍嫹椒?首先,通過熵權(quán)法構(gòu)建用電特征評(píng)價(jià)體系,選取用戶優(yōu)選用電特征數(shù)據(jù),利用K-means聚類算法對(duì)電力用戶進(jìn)行分類.然后,利用隨機(jī)矩陣?yán)碚搶?duì)各用電群體構(gòu)建用電行為分析模型,分析基本信息數(shù)據(jù)對(duì)各類用戶用電行為的影響程度,刻畫不同用電模式用戶的用電行為,為供電公司制定營(yíng)銷策略提供理論支撐.
對(duì)于一個(gè)電力用戶個(gè)體,所采集的數(shù)據(jù)主要包括兩類,一類是電力用戶的基本屬性數(shù)據(jù),包括經(jīng)濟(jì)情況、氣候數(shù)據(jù)、用戶理想電價(jià)、節(jié)假日等數(shù)據(jù),通過對(duì)該屬性分析可以預(yù)估電力用戶對(duì)于電力的消費(fèi)能力[7].第二類是電力用戶的用電特征數(shù)據(jù),主要包括歷史電價(jià)、歷史負(fù)荷曲線、日負(fù)荷率、峰時(shí)耗電量等,從其中可以了解用戶的用電模式及用電習(xí)慣[8].由于供電結(jié)構(gòu)的改革,如何給用戶提供精準(zhǔn)化用電服務(wù)成為了很重要的一個(gè)研究部分.但是在實(shí)際情況中,供電公司為每一個(gè)用戶提供一個(gè)用電策略顯然是不可能的,因此,需要對(duì)具有同種用電行為模式的用戶進(jìn)行群體劃分,利用群體策略來替代個(gè)體策略,可以提高供電公司的服務(wù)效率.
由于用戶對(duì)不同用電特征的行為響應(yīng)不同,通過選取對(duì)該類用戶最有效的用電特征評(píng)價(jià)體系來刻畫用戶用電行為,能夠去除多余信息,減少數(shù)據(jù)量,提高分析速度.此外,用電特征與用戶用電行為之間關(guān)系緊密,各用電特征間存在較大的關(guān)聯(lián)性,分析中存在信息冗余以及重疊現(xiàn)象,會(huì)使得分析效果變差.因此,可以考慮利用熵權(quán)法求取權(quán)重值有效評(píng)價(jià)用戶用電特征.
設(shè)有m個(gè)用戶群體,n個(gè)用電特征,得到評(píng)價(jià)體系的初始數(shù)據(jù)矩陣:X={xij}m×n.其中,xij表示在第j個(gè)用電特征在第i個(gè)用戶下的特征數(shù)值.由于不同用電特征的量綱不同,為了使得不同量綱之間具有可比性,需要對(duì)原始數(shù)據(jù)標(biāo)準(zhǔn)化,其變換公式如下式所示[9]:
(1)
特征信息比重pij和信息熵值hj計(jì)算公式[10]為
利用信息熵值hj求解權(quán)重值wj,計(jì)算公式為
(4)
式中:0 根據(jù)評(píng)價(jià)方法對(duì)該類用戶的各用電特征進(jìn)行評(píng)價(jià),選取最優(yōu)用電特征,并建立優(yōu)選特征集.從每次搜索中選取權(quán)重值最大的用電特征放入已選特征集中,并利用已選特征集進(jìn)行特征分析,直到其性能達(dá)到目標(biāo)值為止.優(yōu)選特征集評(píng)價(jià)值與目標(biāo)值為 式中:Y(j)為已選特征優(yōu)選集評(píng)價(jià)值;wj為第j個(gè)用電特征的權(quán)重值;C為目標(biāo)閾值,一般取值為0.1~0.5;E為目標(biāo)值.當(dāng)E值小于C時(shí),優(yōu)選特征集選擇結(jié)束. 用電行為特征優(yōu)選方法流程圖如圖1所示. 圖1 用電行為特征優(yōu)選方法流程Fig.1 Flow chart of user behavior feature optimization 聚類分析是在不了解一批樣本中其類別或者其他特征歸屬的情況下,利用某種相似性度量方法,將特征極為相似的樣品歸為一類的方法.目前常用的聚類方法有K-means算法、K-medoi算法、Clarans算法、Pam算法等.由于K-means算法簡(jiǎn)單,易于實(shí)現(xiàn),算法放入可伸縮性較好,且適用各種數(shù)據(jù)類型,已經(jīng)在數(shù)理統(tǒng)計(jì)、模式識(shí)別和數(shù)據(jù)挖掘等領(lǐng)域適用[11-12].由于是利用優(yōu)選用電特征數(shù)據(jù)對(duì)電力用戶用電行為進(jìn)行刻畫,很大程度上減少了數(shù)據(jù)量.算法進(jìn)行聚類分析時(shí),每次的迭代過程所用時(shí)間更少,在總體時(shí)間復(fù)雜度上面會(huì)遠(yuǎn)小于傳統(tǒng)聚類算法.因此選用K-means算法進(jìn)行聚類分析.算法步驟為: 步驟1:根據(jù)優(yōu)選特征集,提取樣本用戶群體優(yōu)選用電特征數(shù)據(jù)集X={x11,…,x1i;x21,…,x2i;xn1,…,xni},其中n為用戶個(gè)數(shù),i為優(yōu)選特征個(gè)數(shù),xni表示第n個(gè)用戶的第i個(gè)用電特征值. 步驟2:數(shù)據(jù)處理.由于數(shù)據(jù)中存在不同特征量,因此數(shù)據(jù)具有不同的性質(zhì)屬性和度量單位,為使得數(shù)據(jù)具有同樣的標(biāo)準(zhǔn),需要對(duì)數(shù)據(jù)進(jìn)行中心化變換,如下式所示: (7) 式中:xmi是第m個(gè)數(shù)據(jù)所包含的第i個(gè)特征;m=1,2,…,n. 步驟3:令迭代次數(shù)I=1,選擇初始聚集點(diǎn)為C1,C2,…,Ck,記為Cj(I),j=1,2,…,k. 步驟4:計(jì)算每一個(gè)數(shù)據(jù)點(diǎn)與所選k個(gè)聚集點(diǎn)之間的歐式距離d(x′mi,Cj(I)),m=1,2,…,n;j=1,2,…,k.如果滿足下式,則x′mi∈Cj: (8) 步驟5:計(jì)算k個(gè)新的聚類中心: (9) 式中:N為Cj中聚類點(diǎn)個(gè)數(shù). 步驟6:判斷若Cj(I+1)≠Cj(I),j=1,2,…,k,則I=I+1,返回步驟3;否則算法結(jié)束. 步驟7:輸出聚類結(jié)果,算法結(jié)束. 聚類的效果用目標(biāo)函數(shù)U來表示: (10) U值越小,聚類效果越好.因此,算法通過對(duì)U值的不斷優(yōu)化來得到更好的聚類結(jié)果,當(dāng)U值為極小值時(shí),聚類結(jié)果最優(yōu). 利用K-means聚類法對(duì)電力用戶群體劃分后,為了對(duì)用戶用電行為進(jìn)行刻畫,需要分析用戶基本信息數(shù)據(jù)和用戶用電行為之間的關(guān)聯(lián)性.RMT能夠?qū)Π嗑S數(shù)據(jù)信息的矩陣進(jìn)行隨機(jī)性分析,挖掘數(shù)據(jù)間的信息與關(guān)聯(lián)性,得到用戶用電行為與基本用戶信息之間的相關(guān)性和聯(lián)系,從而實(shí)現(xiàn)對(duì)用戶用電行為的刻畫[13]. 協(xié)方差矩陣是數(shù)理統(tǒng)計(jì)以及其他領(lǐng)域分析系統(tǒng)狀態(tài)較為常用的一個(gè)統(tǒng)計(jì)量.M-P律是隨機(jī)矩陣?yán)碚撝锌捎糜诿枋龃缶S協(xié)方差矩陣的特征值分布情況,并通過其平均譜分布情況來反映數(shù)據(jù)間的相關(guān)性,且具有較強(qiáng)的實(shí)用性. (11) 平均譜半徑(mean spectral radius,MSR)是隨機(jī)矩陣?yán)碚撝谐S玫囊环N線性特征值統(tǒng)計(jì)量,利用特征值在復(fù)平面上與原點(diǎn)的距離來反映隨機(jī)矩陣特征值的分布情況,其定義如下式所示[16]: (12) 式中:LMSR為隨機(jī)矩陣的平均譜半徑;λi(i=1,2,…,p)為矩陣的第i個(gè)特征根. 為分析用戶基本信息對(duì)電力用戶用電模式的影響,將用戶基本信息數(shù)據(jù)和用戶用電特征數(shù)據(jù)建立增廣矩陣,利用增廣部分對(duì)于原用電特征數(shù)據(jù)的影響程度來表征兩者之間的相關(guān)性. (13) (14) (15) (16) 將所得特征數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后,按如下步驟建立增廣矩陣模型.假定所得到的用戶數(shù)據(jù)中,存在m個(gè)用戶,每個(gè)節(jié)點(diǎn)選取用電特征mc個(gè),用戶基本信息類型有mf個(gè).用戶用電特征數(shù)據(jù)構(gòu)成基本狀態(tài)矩陣為Bc∈C(m×mc),用戶基本信息數(shù)據(jù)構(gòu)成影響因素矩陣為Bf∈C(m×mf).將基本狀態(tài)數(shù)據(jù)矩陣與影響因素矩陣構(gòu)建為狀態(tài)增廣矩陣A: (17) (18) 采用隨機(jī)矩陣?yán)碚撝械钠骄V半徑作為矩陣數(shù)據(jù)間相關(guān)性分析的指標(biāo).為排除狀態(tài)數(shù)據(jù)與影響因素?cái)?shù)據(jù)中重復(fù)數(shù)據(jù)所帶來的干擾,定義增廣矩陣譜半徑之差作為指標(biāo),其公式[18]為 (19) 利用隨機(jī)矩陣?yán)碚撏ㄟ^數(shù)據(jù)間的相關(guān)性來刻畫用戶用電行為,為電力公司對(duì)用戶用電相關(guān)服務(wù)工作提供理論支持.用戶用電行為刻畫方法流程圖如圖2所示. 圖2 用戶用電行為刻畫方法流程Fig.2 Flow chart of user behavior description method 本文用于算例分析的數(shù)據(jù)為甘肅省武威市電網(wǎng)某區(qū)域的實(shí)際量測(cè)數(shù)據(jù).使用MATLAB軟件搭建仿真平臺(tái),分析所有用戶數(shù)據(jù),對(duì)用戶用電行為刻畫方法進(jìn)行驗(yàn)證. 利用用電行為特征優(yōu)選方法,計(jì)算各用電特征的評(píng)價(jià)值,求取最優(yōu)特征集.令目標(biāo)閾值C=0.2,仿真計(jì)算結(jié)果見表1. 表1 用電特征評(píng)價(jià)Tab.1 Evaluation of power consumption feature 利用表1中用電特征評(píng)價(jià)值求取目標(biāo)值E,所得結(jié)果為E=[1, 0.498 6, 0.332 2, 0.247 8,0.196 9,0.163 2,0.139 8],當(dāng)E≤C時(shí),共迭代了4次,此時(shí)最優(yōu)特征集中包含有評(píng)價(jià)值較高的5個(gè)優(yōu)選特征,即為峰谷差率、峰谷差量、日平均負(fù)荷、峰時(shí)耗電比以及日最大負(fù)荷.因此,選取這5個(gè)用電特征作為L(zhǎng)1的優(yōu)選特征,并將對(duì)應(yīng)的用電特征數(shù)據(jù)作為對(duì)群體L1進(jìn)行聚類分析所需的數(shù)據(jù). 采用K-means聚類算法,分別對(duì)使用優(yōu)選特征集和未使用優(yōu)選特征集兩種情況進(jìn)行聚類分析.計(jì)算結(jié)果為:當(dāng)使用優(yōu)選特征集時(shí),聚類迭代次數(shù)為9次,準(zhǔn)確率為95.6%,聚類所需時(shí)間為0.309 s.未使用優(yōu)選特征集時(shí),聚類迭代次數(shù)為26次,準(zhǔn)確率為97.2%,聚類所需時(shí)間為0.605 s.結(jié)果表明,選擇優(yōu)選特征集進(jìn)行聚類分析相比于未選用優(yōu)選特征集聚類分析的準(zhǔn)確率略微下降,但具有更少的迭代次數(shù)和更短的仿真時(shí)間. 各類用戶的典型用電行為規(guī)律曲線與用戶負(fù)荷曲線如圖3所示,圖中各類用戶的典型用電負(fù)荷規(guī)律曲線用黑色表示. 圖3 聚類結(jié)果及各類用戶用電負(fù)荷曲線Fig.3 Clustering results and load curves of various users 從圖3可以看出,第一類用戶整體負(fù)荷水平較高,在早晨及夜晚用電量較高,凌晨用電量較少,應(yīng)為一些小型原料指向性工業(yè),由于原料不能久貯,因此一天內(nèi)大多數(shù)時(shí)間處于生產(chǎn)時(shí)間,比如小型水果加工廠.第二類用戶整體負(fù)荷水平較低,用電主要集中在白天,午時(shí)以及夜晚用電相對(duì)較少,在6點(diǎn)左右有一次負(fù)荷峰值,可能為設(shè)備啟動(dòng)造成,而且負(fù)荷變化較快,應(yīng)該存在一些非線性設(shè)備,如一些熔焊、烘焙商鋪.第三類用戶白天用電量較低,下午18點(diǎn)至凌晨1點(diǎn)用電量較高,由于該類負(fù)荷高峰期主要集中在夜間,負(fù)荷水平比較低,應(yīng)為一些餐飲、娛樂類用戶,如夜市、KTV.分析結(jié)果與甘肅武威地區(qū)實(shí)際調(diào)查結(jié)果相符合.由此可見,基于優(yōu)選特征集的K-means聚類方法具有較高的準(zhǔn)確性,可用于刻畫電力用戶的用電行為. 選取各群體用戶的峰谷差率、峰谷差量、日平均負(fù)荷、峰時(shí)耗電比和日最大負(fù)荷數(shù)據(jù)作為基本狀態(tài)數(shù)據(jù),取各群體用戶的經(jīng)濟(jì)情況、溫度數(shù)據(jù)、用戶理想電價(jià)和節(jié)假日數(shù)據(jù)作為影響因素?cái)?shù)據(jù),建立狀態(tài)增廣矩陣,利用隨機(jī)矩陣?yán)碚撨M(jìn)行分析,其分析結(jié)果如圖4所示. 由圖4可以看出,不同的用戶對(duì)于不同的影響因素都具有不同的反映特征.第一類用戶主要受經(jīng)濟(jì)情況影響比較多,理想電價(jià)和節(jié)假日等方面影響較小,可以看出該類用戶主要受限于生產(chǎn)規(guī)模的大小.對(duì)于第二類用戶,溫度和經(jīng)濟(jì)情況的影響要遠(yuǎn)遠(yuǎn)高于其他幾個(gè)影響因素.第三類用戶對(duì)于節(jié)假日的敏感程度要高于其他兩類用戶,因此該類用戶在節(jié)假日期間會(huì)有更多的用戶.總體來說,經(jīng)濟(jì)情況和溫度對(duì)三類用戶的影響程度都較高,而理想電價(jià)相對(duì)影響程度比較低. 圖4 用戶行為刻畫分析結(jié)果Fig.4 Analysis results of user behavior description 綜上所述,電力公司在針對(duì)第一類電力用戶時(shí),要根據(jù)其經(jīng)濟(jì)情況來制定相應(yīng)的售電方案,其挖掘潛力受限于電力用戶的經(jīng)濟(jì)情況限制.對(duì)于第二類用戶,電力公司應(yīng)主要以經(jīng)濟(jì)情況和溫度作為主要方面制定售電方案,可以為電力用戶在不同季節(jié)提供不一樣的用電策略.針對(duì)第三類用戶,由于節(jié)假日對(duì)該用戶用電行為的影響程度較高,說明該類用戶用電量的大小與人流量大小有很大相關(guān)性,電力公司可以根據(jù)這方面對(duì)該類用戶不同節(jié)假日、日夜峰谷期間制定相應(yīng)的用電策略. 本文針對(duì)電力行業(yè)市場(chǎng)化改革背景下用戶用電行為刻畫的必要性,提出一種基于用戶基本信息數(shù)據(jù)和用電特征數(shù)據(jù)相結(jié)合的用電行為刻畫方法.所提方法利用隨機(jī)矩陣?yán)碚撛诖缶S數(shù)據(jù)分析和數(shù)據(jù)關(guān)聯(lián)性分析方面的優(yōu)勢(shì),無需將原始數(shù)據(jù)矩陣分解為多個(gè)向量進(jìn)行重復(fù)計(jì)算,具有較高的分析效率,分析效果較為直觀.最后,通過實(shí)際應(yīng)用數(shù)據(jù)算例驗(yàn)證結(jié)果表明,該方法能夠較好地分析用戶基本信息數(shù)據(jù)和用戶用電行為之間的關(guān)聯(lián)性,有助于售電公司對(duì)不同電力用戶采取不同的售電方案和電力需求側(cè)響應(yīng)策略,提升對(duì)電力用戶的服務(wù)質(zhì)量,促進(jìn)電力系統(tǒng)的高效運(yùn)行.1.2 K-means聚類法
2 用戶用電行為刻畫方法
2.1 隨機(jī)矩陣?yán)碚?/h3>
2.2 構(gòu)建用戶用電行為刻畫模型
3 算例驗(yàn)證及分析
3.1 特征優(yōu)選集的選取
3.2 用電行為聚類方法驗(yàn)證
3.3 用戶行為刻畫方法
4 結(jié)論