牟婷婷, 陸 微, 王蘭君, 辛潔晴
(1. 電力傳輸與功率變換控制教育部重點(diǎn)實(shí)驗(yàn)室(上海交通大學(xué)), 上海市 200240; 2. 國(guó)網(wǎng)上海市電力公司市北供電公司, 上海市 200072)
基于主成分分析的用電模式穩(wěn)定性分析
牟婷婷1, 陸 微2, 王蘭君2, 辛潔晴1
(1. 電力傳輸與功率變換控制教育部重點(diǎn)實(shí)驗(yàn)室(上海交通大學(xué)), 上海市 200240; 2. 國(guó)網(wǎng)上海市電力公司市北供電公司, 上海市 200072)
用電模式穩(wěn)定性分析是實(shí)施用戶用電量預(yù)測(cè)的前提,其本質(zhì)是考察不同歷史時(shí)間段用電模式的相似性。過長(zhǎng)的基礎(chǔ)數(shù)據(jù)時(shí)間跨度會(huì)降低用電模式穩(wěn)定性分析的可行性和準(zhǔn)確性,而在短期內(nèi)基于日用電量數(shù)據(jù)評(píng)估的用電特征指標(biāo)又受隨機(jī)因素干擾,難以準(zhǔn)確反映用電模式。為此,提出一種以過往幾周日用電系數(shù)和日用電波動(dòng)率為原始特征指標(biāo)提取用電模式主成分,進(jìn)而用兩個(gè)歷史時(shí)間段內(nèi)用電模式主成分因子載荷的歐氏距離衡量用電模式穩(wěn)定性的方法。針對(duì)某小區(qū)的算例結(jié)果表明,用所提方法判定為用電模式穩(wěn)定、不穩(wěn)定的用戶組的用電量預(yù)測(cè)精度存在明顯差異,且相似性距離與預(yù)測(cè)誤差存在正相關(guān)性。算例分析表明,合適的歷史數(shù)據(jù)時(shí)間跨度對(duì)提升方法的適用性和準(zhǔn)確性至關(guān)重要,所提方法采用16周歷史數(shù)據(jù)較為合理。
用電模式穩(wěn)定性; 主成分分析; 相似性判定; 負(fù)荷預(yù)測(cè)
長(zhǎng)期以來負(fù)荷預(yù)測(cè)主要關(guān)注于預(yù)測(cè)方法的準(zhǔn)確性,對(duì)預(yù)測(cè)的適用性鮮有分析。近年來,隨著集中抄表系統(tǒng)和智能家居的發(fā)展,針對(duì)單個(gè)用戶的負(fù)荷(或用電量)預(yù)測(cè)日益受到關(guān)注。在集抄領(lǐng)域,估計(jì)用戶月用電量合理范圍可為集抄數(shù)據(jù)異常分析提供更科學(xué)的判據(jù);而在智能家居領(lǐng)域,用戶用電量預(yù)測(cè)是優(yōu)化家居運(yùn)行方式、制定需求響應(yīng)措施的基礎(chǔ)[1-2]。各種預(yù)測(cè)方法本質(zhì)都是根據(jù)歷史用電規(guī)律推測(cè)未來用電趨勢(shì),僅對(duì)用電模式穩(wěn)定的用戶適用。因此,用電模式穩(wěn)定性分析構(gòu)成上述工作的基礎(chǔ)。
用電模式的變化可能因轉(zhuǎn)租、生活作息變化、更換大型用電設(shè)備等原因引起,不能單從是否更戶來加以判定,而需借助一定的數(shù)據(jù)分析方法。從數(shù)學(xué)上講,用電模式穩(wěn)定性分析本質(zhì)上是對(duì)兩個(gè)時(shí)間跨度的用電模式的相似性判定,其核心問題是用電模式,即序列特征的表示,相似性則可用一定的距離測(cè)度判定。
序列特征提取方法目前主要有分段聚合近似[3]、符號(hào)化算法[4]、分段線性表示[5]、奇異值分解[6]等。這些方法的目標(biāo)都是將復(fù)雜長(zhǎng)序列進(jìn)行降維,以降低相似性判定的難度。而在用電模式穩(wěn)定性分析中,由于房地產(chǎn)發(fā)展等因素,歷史數(shù)據(jù)時(shí)間跨度很長(zhǎng)(如將用戶過去兩年月用電量或月份系數(shù)進(jìn)行對(duì)比[7]),不僅會(huì)降低判定方法的適用性,也可能使近期用電模式穩(wěn)定的用戶被錯(cuò)判為不穩(wěn)定,因此序列特征降維不是關(guān)鍵性問題。
事實(shí)上,采用集抄之后,供電企業(yè)可掌握低壓用戶每日用電量數(shù)據(jù),可運(yùn)用日用電量信息提取用電模式,以縮短穩(wěn)定性判定問題對(duì)歷史數(shù)據(jù)時(shí)間跨度的依賴。不過,日用電量受隨機(jī)因素干擾大,且由于氣溫或用戶特殊用電行為的延續(xù)性,相鄰日用電量的相關(guān)性高。如何剔除隨機(jī)因素和日間用電量相關(guān)性的干擾,構(gòu)建反映用戶內(nèi)在用電習(xí)慣的用電模式是核心問題。
顯然,剔除隨機(jī)因素干擾、正確提取用電模式宜采用統(tǒng)計(jì)學(xué)方法,而主成分分析不僅是一種統(tǒng)計(jì)學(xué)方法,由于主成分提取時(shí)的正交性,在剔除樣本數(shù)據(jù)各維度相關(guān)性干擾方面也具有很強(qiáng)的優(yōu)勢(shì)[8-9]。鑒于此,本文對(duì)低壓用戶提出一種基于主成分分析(principal-component-analysis-based,PCAB)提取用電模式,進(jìn)而判定用電模式穩(wěn)定性的方法。該方法本質(zhì)上以主成分表征用電模式,但鑒于主成分本身缺乏可觀測(cè)性,用表征主成分因子與各原始特征指標(biāo)相關(guān)性的因子載荷(factor loading)來描述主成分因子,用兩個(gè)時(shí)期因子載荷的一致性判定主成分的一致性,進(jìn)而判定用電模式的相似性(穩(wěn)定性)。
值得指出的是,目前有較多文獻(xiàn)基于主成分構(gòu)建預(yù)測(cè)模型,起到降維、簡(jiǎn)化預(yù)測(cè)模型的目的[10-12]。本文思想有所不同,實(shí)施主成分分析的目的是獲取主成分的因子載荷,進(jìn)而實(shí)施用電模式穩(wěn)定性分析,并不是構(gòu)建負(fù)荷預(yù)測(cè)模型。本文算例部分涉及負(fù)荷預(yù)測(cè),但負(fù)荷預(yù)測(cè)采用了其他方法,目的是檢驗(yàn)用電模式穩(wěn)定性分析結(jié)果的合理性。
1.1 用電模式穩(wěn)定性的定義
用電模式穩(wěn)定性分析是為了判斷能否依據(jù)歷史用電規(guī)律對(duì)當(dāng)前月的用電量進(jìn)行預(yù)測(cè)。若某用戶不存在如下情況,則稱該用戶是用電模式穩(wěn)定的。
1)因?qū)嶋H住戶變更、作息變化等原因?qū)е碌挠秒娏?xí)慣的變化。
2)因購(gòu)入或更換節(jié)能水平不同的大功率用電設(shè)備而導(dǎo)致用電量的顯著變化。
3)因?qū)嶋H用電性質(zhì)變更、設(shè)備構(gòu)成變化而導(dǎo)致的用電特性變化。
值得留意的是,用電模式不穩(wěn)定不包括氣象條件變化、用戶偶發(fā)性活動(dòng)等因素導(dǎo)致的用電行為變化。此類偶發(fā)性波動(dòng)視作隨機(jī)擾動(dòng)。
1.2 用電模式穩(wěn)定性的判定流程
用戶用電模式穩(wěn)定性判定流程包括以下4步。
1)數(shù)據(jù)預(yù)處理:對(duì)低壓用戶集抄所得的是每日零點(diǎn)的凍結(jié)電量數(shù)據(jù)。由于信道不佳、采集終端軟件故障等問題,個(gè)別日的集抄數(shù)據(jù)可能存在缺失或異常(突降/增),需采用插值法對(duì)此類缺陷進(jìn)行修正;其次,通過相鄰兩日凍結(jié)電量相減得到日用電量序列;最后,鑒于節(jié)日與非節(jié)日用電往往有很大區(qū)別,對(duì)節(jié)日用電進(jìn)行非節(jié)日等值處理,方法是用節(jié)日前、后周的用電量均值和日用電系數(shù)均值(即日用電量與當(dāng)周日均用電量的比值)對(duì)節(jié)日期間每日用電量做出估計(jì)。經(jīng)上述處理后,所考慮的歷史時(shí)間跨度內(nèi)的每周日用電量具有可比性。
2)用電模式提取:選擇用電特征指標(biāo),將歷史時(shí)間跨度劃分為兩個(gè)時(shí)期,對(duì)每一時(shí)期的用電特征指標(biāo)實(shí)施主成分分析,并根據(jù)累計(jì)方差貢獻(xiàn)率選取主成分。用主成分的因子載荷描述各時(shí)期的用電模式,以剔除隨機(jī)因素和日間用電相關(guān)性對(duì)用電模式的干擾。
3)用電模式穩(wěn)定性判定:每一主成分與原用電特征指標(biāo)的相關(guān)系數(shù)(即因子載荷)的相似性可表征主成分一致性。因此,通過量度兩個(gè)時(shí)期主成分因子載荷的歐氏距離考察兩個(gè)時(shí)期用電模式的穩(wěn)定性。
4)模式判定結(jié)果的檢驗(yàn):對(duì)所有用戶采用多種負(fù)荷預(yù)測(cè)方法實(shí)施月用電量預(yù)測(cè),評(píng)估用電模式穩(wěn)定、不穩(wěn)定用戶組月用電量預(yù)測(cè)結(jié)果的平均絕對(duì)百分誤差(mean absolute percentage error,MAPE)δMAPE,考察MAPE與相似性距離之間的關(guān)系來檢驗(yàn)用電模式穩(wěn)定性評(píng)估結(jié)果的合理性。其中,MAPE定義為:
(1)
為縮短用電模式提取對(duì)歷史數(shù)據(jù)時(shí)間跨度的依賴,考慮基礎(chǔ)數(shù)據(jù)時(shí)間跨度為前nw周(為偶數(shù))并將其等分為兩期(用上標(biāo)k?、窈蚹?、虮碚?,基于日用電數(shù)據(jù),而非月用電數(shù)據(jù),評(píng)估兩期的用電特征指標(biāo)。鑒于日用電量受偶發(fā)性事件的影響較大且用電量日間關(guān)聯(lián)性高,以用電特征指標(biāo)的主成分,而非用電特征指標(biāo)本身來描述兩期用電模式。具體步驟如下。
1)用電特征指標(biāo)的選取和指標(biāo)矩陣的定義
對(duì)每一用戶,根據(jù)其前第w周(w=1,2,…,nw)的日用電量數(shù)據(jù),評(píng)估每日用電系數(shù)和一周的日用電量波動(dòng)率作為8個(gè)用電特征指標(biāo)。其表達(dá)式為:
(2)
(3)
本文未選用日用電量或氣溫靈敏度是因?yàn)楫?dāng)基礎(chǔ)數(shù)據(jù)跨越不同季節(jié)時(shí),即便同一用戶的此類指標(biāo)差異也很大,這種差異并不意味著對(duì)該用戶利用歷史數(shù)據(jù)預(yù)測(cè)用電量沒有意義。與此相比,選用的日用電系數(shù)和用電量波動(dòng)率反映的是用戶一周內(nèi)日間用電量的相對(duì)變化關(guān)系,受氣溫影響小,故可在不同季節(jié)間比對(duì),以判定用電模式的穩(wěn)定性和用電量預(yù)測(cè)的意義。
這樣,對(duì)于每一時(shí)期k(k?、?Ⅱ),可由所包含的各周的用電特征指標(biāo)組成如下指標(biāo)矩陣:
(4)
式中:下標(biāo)8表示式(2)和式(3)定義的用電特征指標(biāo)的個(gè)數(shù);n=nw/2為每一時(shí)期內(nèi)包含的周數(shù)。
2)標(biāo)準(zhǔn)化處理
用電特征指標(biāo)若量度單位不同或取值范圍差異非常大,會(huì)使數(shù)據(jù)較大的指標(biāo)起到明顯的支配作用。為避免該現(xiàn)象,將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,具體公式為:
(5)
(6)
(7)
由此,對(duì)每一時(shí)期k(k取Ⅰ,Ⅱ)得到用電特征指標(biāo)的標(biāo)準(zhǔn)化陣,即
(8)
3)對(duì)標(biāo)準(zhǔn)化陣Zk求相關(guān)系數(shù)陣
對(duì)每一時(shí)期k,利用用電特征指標(biāo)標(biāo)準(zhǔn)化陣的數(shù)據(jù),求每?jī)蓚€(gè)用電特征指標(biāo)之間的相關(guān)系數(shù)。第k時(shí)期第i和第j個(gè)用電特征指標(biāo)的相關(guān)系數(shù)計(jì)算為:
(9)
進(jìn)而構(gòu)成相關(guān)系數(shù)矩陣:
(10)
4)選取主成分
(11)
(12)
定義前p個(gè)主成分的累計(jì)方差貢獻(xiàn)率為:
(13)
主成分分析中,通常保留累計(jì)方差貢獻(xiàn)率達(dá)到85%以上的前p個(gè)主成分,舍去其余主成分,由此可在不顯著丟失信息量的條件下達(dá)到降維和剔除隨機(jī)因素的效果[9]。這前p個(gè)主成分可以式(11)中的特征向量為系數(shù),表示為原用電特征指標(biāo)標(biāo)幺值的如下線性組合。
(14)
在對(duì)第Ⅰ和第Ⅱ期數(shù)據(jù)求取主成分時(shí),以同時(shí)滿足兩期主成分的累計(jì)方差貢獻(xiàn)率均達(dá)到85%以上為標(biāo)準(zhǔn)確定主成分個(gè)數(shù)p。
5)計(jì)算主成分因子載荷
(15)
6)得到用電模式矩陣
每一時(shí)期的主成分表征了用戶在該時(shí)期的用電模式,但主成分本身難以觀測(cè),故用表達(dá)主成分與各原始用電特征指標(biāo)之間相關(guān)性的因子載荷描述各主成分。用戶在第k個(gè)時(shí)期的p個(gè)主成分的因子載荷構(gòu)成如下p×8階用電模式矩陣:
(16)
與k取Ⅰ,Ⅱ?qū)?yīng)的因子載荷矩陣的相似性,反映了這兩段時(shí)間用電模式的相似性。為此,先求兩段時(shí)間內(nèi)每個(gè)主成分的因子載荷的歐氏距離:
(17)
式中:i=1,2,…,p。
進(jìn)而,以兩段時(shí)期所有主成分因子載荷歐氏距離的均值(如式(18)所示)定義該用戶兩段時(shí)間內(nèi)用電模式的相似性距離。D越大,則該用戶在兩段時(shí)間內(nèi)的用電模式越不相似,即用電模式越不穩(wěn)定。
(18)
以上海某小區(qū)728戶低壓用戶為例,開展用電模式穩(wěn)定性分析。搜集的集抄數(shù)據(jù)的時(shí)間跨度為2013年1月至2015年7月。
4.1 用戶用電模式判定結(jié)果
以2015年7月1日前的16周為基礎(chǔ)數(shù)據(jù)時(shí)間跨度(即nw=16),運(yùn)用所提方法對(duì)728戶進(jìn)行用電模式穩(wěn)定性分析。該16周跨越了氣象條件迥異的3~6月,是提取用電模式難度較大的時(shí)期。進(jìn)而,采用有源自回歸(auto-regressive with extra inputs,ARX)模型[14](代表趨勢(shì)分析類方法)、反向傳播神經(jīng)網(wǎng)絡(luò)(back-propagation neural network,BPNN)[15](代表非趨勢(shì)分析類)兩種方法,對(duì)用戶實(shí)施2015年7月用電量預(yù)測(cè),考察預(yù)測(cè)誤差與D之間的關(guān)聯(lián)性,以檢驗(yàn)用電模式穩(wěn)定性分析方法所得結(jié)果的合理性。
附錄A中列舉了對(duì)一個(gè)用戶按第2節(jié)和第3節(jié)方法實(shí)施用電模式穩(wěn)定性分析的過程。對(duì)所有用戶實(shí)施該分析過程,所得D散點(diǎn)圖如圖1所示。若以D=2.15為閾值(對(duì)應(yīng)90%用戶為用電模式穩(wěn)定的情況),判定為用電模式穩(wěn)定的用戶有655家,這些用戶2015年7月用電量預(yù)測(cè)結(jié)果的MAPE為2.94%;而判定為用電模式不穩(wěn)定的73家用戶的同月MAPE為6.92%,明顯高于用電模式穩(wěn)定組。附錄B列舉了兩個(gè)用戶在16周所包含的兩個(gè)時(shí)期中的日用電量曲線??梢?被判定為模式不穩(wěn)定(D=2.353)的用戶在兩個(gè)時(shí)期的日用電量曲線差異顯著,而模式穩(wěn)定用戶(D=1.789)在兩個(gè)時(shí)期的日用電量波動(dòng)規(guī)律具有一定的相似性。上述結(jié)果一定程度上表明了用電模式穩(wěn)定性判定結(jié)果的合理性。在實(shí)際應(yīng)用時(shí),判定用電模式穩(wěn)定性的D閾值與一個(gè)地區(qū)用戶的生活內(nèi)容和作息習(xí)慣有關(guān),可根據(jù)歷史數(shù)據(jù)進(jìn)行多月的用電模式相似性判定、月用電量預(yù)測(cè)和相應(yīng)的預(yù)測(cè)精度檢驗(yàn),根據(jù)預(yù)測(cè)效果確定合適的閾值,以保證判定為穩(wěn)定的用戶組具有足夠高的預(yù)測(cè)精度。
圖1 PCAB法下所有用戶的D散點(diǎn)圖Fig.1 Scatter diagram of D with PCAB method for all customers
進(jìn)一步,考慮逐步增大不穩(wěn)定組用戶的比例(unstable user proportion,UUP)TUUP,此時(shí)有更多的用戶從穩(wěn)定組轉(zhuǎn)移到不穩(wěn)定組(轉(zhuǎn)移順序按D由大到小,D大的先轉(zhuǎn)移),重新統(tǒng)計(jì)穩(wěn)定組、不穩(wěn)定組2015年7月用電量預(yù)測(cè)結(jié)果的δMAPE,由此得到δMAPE-TUUP關(guān)系圖。PCAB方法下用ARX與BPNN預(yù)測(cè)時(shí)用電模式穩(wěn)定、不穩(wěn)定用戶組月用電量預(yù)測(cè)δMAPE與TUUP的關(guān)系如圖2所示。
圖2 PCAB方法下兩組用戶月電量δMAPE與TUUP的關(guān)系Fig.2 Relationship between δMAPE and TUUP of monthly consumption for two customer groups judged by PCAB method
由圖2可以得出以下結(jié)論。
1)在所采用的兩種預(yù)測(cè)方法中,由于ARX模型中帶有白噪聲序列,考慮了隨機(jī)因素對(duì)日用電量序列的干擾,所以預(yù)測(cè)精度比BNPP法高。
2) 無論ARX預(yù)測(cè)方法還是BNPP預(yù)測(cè)方法,δMAPE-TUUP的變化規(guī)律相似——當(dāng)TUUP增大時(shí),穩(wěn)定組的δMAPE變化不大,而不穩(wěn)定用戶組的δMAPE呈下降趨勢(shì),這說明穩(wěn)定用戶組里絕大多數(shù)用戶的D相近且很小,同時(shí)這部分用戶的δMAPE較低;當(dāng)TUUP增大時(shí),穩(wěn)定組中D較大的用戶會(huì)優(yōu)先轉(zhuǎn)移到不穩(wěn)定組,且先轉(zhuǎn)移的用戶的預(yù)測(cè)誤差比后轉(zhuǎn)移用戶的大,即D與預(yù)測(cè)誤差之間存在正向關(guān)聯(lián)性。該現(xiàn)象進(jìn)一步驗(yàn)證了本文所提用電模式穩(wěn)定性分析方法的合理性。
4.2 最佳歷史數(shù)據(jù)時(shí)間跨度分析
本節(jié)在nw=8~88周的范圍內(nèi)調(diào)節(jié)歷史數(shù)據(jù)時(shí)間跨度(每次增加2個(gè)月),考察時(shí)間跨度對(duì)用電模式穩(wěn)定性分析結(jié)果的影響。值得注意的是,增大nw時(shí),歷史月集抄數(shù)據(jù)齊全,而可以實(shí)施分析的用戶數(shù)逐漸減少(例如:nw=88周時(shí)可分析用戶僅為372戶),下文中的結(jié)果是對(duì)可分析的用戶實(shí)施分析的結(jié)果。
各種時(shí)間跨度時(shí)PCAB方法下穩(wěn)定、不穩(wěn)定用戶組2015年7月用電量預(yù)測(cè)的δMAPE與TUUP的三維關(guān)系如圖3所示(兩種預(yù)測(cè)方法下趨勢(shì)規(guī)律相仿,故只選用精度較高的ARX法預(yù)測(cè)的δMAPE值)。
圖3 不同時(shí)間跨度時(shí)兩組用戶月電量δMAPE與TUUP關(guān)系Fig.3 Relationship between δMAPE and TUUP of monthly consumption for two customer groups with different time spans
附錄C將該三維圖旋轉(zhuǎn)到TUUP軸垂直于紙面的位置,以更直接地觀察兩組用戶的δMAPE與時(shí)間跨度之間的關(guān)系。從這些圖可得出以下結(jié)論。
1)無論哪個(gè)歷史數(shù)據(jù)時(shí)間跨度下,隨著TUUP的增大,穩(wěn)定組用戶的δMAPE變化不大,而不穩(wěn)定組用戶的δMAPE均呈下降趨勢(shì)。這說明D與預(yù)測(cè)誤差間的正向關(guān)聯(lián)性不依賴于歷史數(shù)據(jù)時(shí)間跨度。
2)在一定的TUUP下,隨著nw的加大,不穩(wěn)定組與穩(wěn)定組的δMAPE差值整體呈先增大、后縮小的趨勢(shì)。在過小的nw下穩(wěn)定組、不穩(wěn)定組δMAPE差距較小,這可能是因?yàn)闅v史數(shù)據(jù)時(shí)間跨度過短且日用電量受隨機(jī)因素干擾大,主成分分析結(jié)果沒有準(zhǔn)確反映用電模式。而當(dāng)nw>24周時(shí),兩組用戶的δMAPE又難以區(qū)分,這是因?yàn)楫?dāng)歷史數(shù)據(jù)跨越兩個(gè)不同性質(zhì)的氣溫靈敏季節(jié)(一冬、一夏)時(shí),即便是同一用戶在兩個(gè)時(shí)期的日用電系數(shù)和日用電波動(dòng)率也有較大差異,這就使得基于上述指標(biāo)評(píng)估所得的D喪失了反映用電模式穩(wěn)定性的意義。
3)隨著閾值增大和TUUP的相應(yīng)增大,兩組用戶預(yù)測(cè)精度差異在縮小,但與nw取其他周數(shù)相比,nw=16周時(shí)穩(wěn)定、不穩(wěn)定用戶組δMAPE的差值最大,意味著此時(shí)所提方法可最好地區(qū)分兩組用戶。附錄D對(duì)負(fù)荷預(yù)測(cè)目標(biāo)月取2015年6月、5月、4月等多種情況做了類似的分析,所得δMAPE-nw-TUUP三維圖均表明,nw=16周時(shí)兩組用戶δMAPE值區(qū)分最明顯??梢?對(duì)于本文所提用電模式穩(wěn)定性分析方法而言,16周是歷史數(shù)據(jù)時(shí)間跨度的最佳選擇。
4.3 與其他方法的對(duì)比
4.3.1 與直接用用電特征指標(biāo)進(jìn)行相似性判定的對(duì)比
為揭示提取用電模式主成分的必要性,本節(jié)嘗試直接用用電特征指標(biāo)進(jìn)行相似性距離分析。具體做法是:仍取2015年7月為預(yù)測(cè)目標(biāo)月,將該月前16周分為兩期,將每期8周的日用電系數(shù)和日用電波動(dòng)率8個(gè)指標(biāo)分別求取均值,得到兩個(gè)特征指標(biāo)向量;按90%用戶為穩(wěn)定組設(shè)定距離閾值,據(jù)兩個(gè)特征指標(biāo)向量的歐氏距離判定出用電模式穩(wěn)定、不穩(wěn)定組。
圖4為基于日用電特征指標(biāo)直接做相似性分析所判定的用電模式穩(wěn)定、不穩(wěn)定用戶組的月用電量預(yù)測(cè)δMAPE值與TUUP的關(guān)系圖。從中可見,兩種預(yù)測(cè)方法下,隨著TUUP的增大,不穩(wěn)定用戶組的δMAPE均呈先升后降的態(tài)勢(shì),甚至出現(xiàn)穩(wěn)定用戶組的δMAPE高于不穩(wěn)定用戶組,說明日用電特征指標(biāo)的相似性未能很好地反映用電模式穩(wěn)定性。這是因?yàn)槿沼秒娞卣髦笜?biāo)源于日用電量數(shù)據(jù),而后者受偶發(fā)因素的干擾大,直接對(duì)日用電特征指標(biāo)取均值并不能很好地刻畫用戶實(shí)際的用電特征。
圖4 基于日用電指標(biāo)兩組用戶月電量δMAPE與TUUP關(guān)系Fig.4 Relationship between δMAPE and TUUP of monthly consumption for two customer groups based on daily consumption factor
4.3.2 與現(xiàn)有用電模式穩(wěn)定性判定方法的對(duì)比
相關(guān)文獻(xiàn)很少,文獻(xiàn)[7]中提出了一種基于月份系數(shù)判定用戶用電模式穩(wěn)定性的方法,即以每年12個(gè)月的月份系數(shù)(月用電量占全年用電量的比重)表示用電模式,計(jì)算過去兩年月份系數(shù)的歐氏距離,以此判定用電模式的穩(wěn)定性。
將上述方法應(yīng)用于本例時(shí),具有兩年集抄數(shù)據(jù)的用戶僅81戶。判定為穩(wěn)定、不穩(wěn)定用戶組2015年7月用電量預(yù)測(cè)結(jié)果的δMAPE值(采用精度較高的ARX法)與TUUP之間的關(guān)系如圖5所示。從中可見:TUUP較小時(shí)不穩(wěn)定用戶的δMAPE反而比穩(wěn)定用戶小,TUUP較大時(shí)兩組用戶的δMAPE也很相近。這說明相似性距離與負(fù)荷預(yù)測(cè)適用性之間失去了正關(guān)聯(lián)性。導(dǎo)致該現(xiàn)象的本質(zhì)原因是由于拉大時(shí)間跨度會(huì)弱化近期用電模式的變化對(duì)整個(gè)時(shí)間跨度內(nèi)用電模式相似性判定結(jié)果的影響,從而將一些近期用電模式發(fā)生變化的用戶錯(cuò)判為穩(wěn)定。
圖5 基于月份系數(shù)法兩組用戶月電量δMAPE與TUUP關(guān)系Fig.5 Relationship between δMAPE and TUUP of monthly consumption for two customer groups based on monthly coefficient method
用電模式穩(wěn)定性分析是對(duì)用戶實(shí)施負(fù)荷(用電量)預(yù)測(cè)的前提,其本質(zhì)是對(duì)不同歷史時(shí)間段內(nèi)用戶用電模式相似性的判定。基于短期(幾周)歷史數(shù)據(jù)的分析可提高方法的適用性,但日用電量受隨機(jī)因素干擾,準(zhǔn)確提取用電模式較為困難。針對(duì)上述問題,本文提出一種以日用電系數(shù)、日用電波動(dòng)率為原始用電特征指標(biāo)提取用電模式主成分的方法,以不同歷史時(shí)間段內(nèi)用電模式主成分的因子載荷的歐氏距離D來判定用電模式的穩(wěn)定性。針對(duì)實(shí)際小區(qū)的算例分析,可以得出以下結(jié)論。
1)所提方法可顯著區(qū)分用電模式穩(wěn)定、不穩(wěn)定的用戶組,兩組用戶的月用電量預(yù)測(cè)誤差有明顯偏差,且D與用電量預(yù)測(cè)誤差呈正向關(guān)聯(lián)性。
2)選取適當(dāng)?shù)臍v史數(shù)據(jù)時(shí)間跨度對(duì)用電模式穩(wěn)定性分析至關(guān)重要。過大的時(shí)間跨度會(huì)限制穩(wěn)定性分析的適用范圍并降低分析結(jié)果的準(zhǔn)確性;而過小的時(shí)間跨度也會(huì)降低用電模式提取的準(zhǔn)確性。本文所提方法采用16周的歷史數(shù)據(jù)時(shí)間跨度較為適宜。
值得一提的是,目前對(duì)負(fù)荷預(yù)測(cè)問題多關(guān)注預(yù)測(cè)算法和預(yù)測(cè)精度,而本文的研究結(jié)果如下:當(dāng)負(fù)荷預(yù)測(cè)針對(duì)單個(gè)用戶時(shí),用電模式穩(wěn)定性分析是負(fù)荷預(yù)測(cè)有無價(jià)值的前提;另一方面,目前對(duì)主成分分析在負(fù)荷預(yù)測(cè)中的應(yīng)用主要局限于降維的目的,而本文的研究表明,主成分分析也具有剔除隨機(jī)因素干擾、提取用電模式的應(yīng)用價(jià)值。不過,本文主要提出了用電模式穩(wěn)定性分析的思想和方法,對(duì)判定用電模式穩(wěn)定的D閾值的設(shè)定方法還有待后續(xù)研究。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx)。
[1] BARBATO A, CAPONE A, RODOLFI M, et al. Forecasting the usage of household appliances through power meter sensors for demand management in the smart grid[C]// Proceedings of the 2011 IEEE International Conference on Smart Grid Communications (SmartGridComm), October 17-20, 2011, Brussels, Belgium: 404-409.
[2] LOGENTHIRAN T, SRINIVASAN D, PHYU E. Particle swarm optimization for demand side management in smart grid[C]// Proceedings of the 2015 IEEE Innovative Smart Grid Technologies-Asia, November 3-6, 2015, Bangkok, Thailand: 1-6.
[3] 李海林,郭崇慧.基于云模型的時(shí)間序列分段聚合近似方法[J].控制與決策,2011,26(10):1525-1529.
LI Hailin, GUO Chonghui. Piecewise aggregate approximation method based on cloud model for time series[J]. Control and Decision, 2011, 26(10): 1525-1529.
[4] STYLIOS C D, KREINOVICH V. Symbolic aggregate approximation (SAX) under interval uncertainty[C]// Proceedings of the Annual Conference of the North American Fuzzy Information Processing Society, August 17-19, 2015, Redmond, WA, USA: 1-7.
[5] 李海林.時(shí)間序列數(shù)據(jù)挖掘中的特征表示與相似性度量方法研究[D].遼寧:大連理工大學(xué),2012.
[6] 唐昆明,蔡明,羅建,等.基于奇異值分解的非線性負(fù)荷諧波源定位方法[J].電力系統(tǒng)自動(dòng)化,2012,36(1):96-100.
TANG Kunming, CAI Ming, LUO Jian, et al. Harmonic source location based on singular value decomposition method[J]. Automation of Electric Power Systems, 2012, 36(1): 96-100.
[7] 王衛(wèi)公,牟婷婷,王蘭君,等.基于灰色分析的集抄數(shù)據(jù)異常判定[J].電網(wǎng)與清潔能源,2016,32(4):6-11.
WANG Weigong, MOU Tingting, WANG Lanjun, et al. Data anomaly determination for centralized metering systems based on the grey analysis methods[J]. Power System and Clean Energy, 2016, 32(4): 6-11.
[8] 李磊,嚴(yán)正,馮冬涵,等.結(jié)合主成分分析及生產(chǎn)函數(shù)的電網(wǎng)智能技術(shù)評(píng)價(jià)探討[J].電力系統(tǒng)自動(dòng)化,2014,38(11):56-61.DOI:10.7500/AEPS20130327014.
LI Lei, YAN Zheng, FENG Donghan, et al. Discussion on intelligent technology evaluation of electrical power grid based on principal component analysis and production function[J]. Automation of Electric Power Systems, 2014, 38(11): 56-61. DOI: 10.7500/AEPS20130327014.
[9] 何曉群,多元統(tǒng)計(jì)分析[M].北京:中國(guó)人民大學(xué)出版社,2015:113-141.
[10] 周松林,茆美琴,蘇建徽.基于主成分分析與人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測(cè)[J].電網(wǎng)技術(shù),2011,35(9):128-132.
ZHOU Songlin, MAO Meiqin, SU Jianhui. Prediction of wind power based on principal component analysis and artificial neural network[J]. Power System Technology, 2011, 35(9): 128-132.
[11] HE Dong, LIU Ruiye. Ultra-short-term wind power prediction using ANN ensemble based on PCA[C]// Proceedings of the 7th International Power Electronics and Motion Control Conference, June 2-5, 2012, Harbin, China: 2108-2112.
[12] LIU Baoying, YANG Rengang. A novel method based on PCA and LS-SVM for power load forecasting[C]// Proceedings of the Third International Conference on Electric Utility Deregulation and Restructuring and Power Technologies, April 6-9, 2008, Nanjing, China: 759-763.
[13] 李慶揚(yáng),王能超,易大義.數(shù)值分析[M].北京:清華大學(xué)出版社,2013:138-142.
[14] BAI Feifei, BHATT N, ROSSO A D, et al. Input signals selection for measurement-based power system ARX dynamic model response estimation[C]// Proceedings of the 2014 IEEE PES T&D Conference and Exposition, April 14-17, 2014, Chicago, IL, USA: 1-7.
[15] 張大海,畢研秋,畢研霞,等.基于串聯(lián)灰色神經(jīng)網(wǎng)絡(luò)的電力負(fù)荷預(yù)測(cè)方法[J].系統(tǒng)工程理論與實(shí)踐,2004,12:128-132.
ZHANG Dahai, BI Yanqiu, BI Yanxia, et al. Power load forecasting method base on serial grey neural nework[J]. System Engineering Theory and Practice, 2004, 12:128-132.
Stability Analysis of Consumption Mode Based on Principal Component Analysis
MOUTingting1,LUWei2,WANGLanjun2,XINJieqing1
(1. Key Laboratory of Control of Power Transmission and Conversion (Shanghai Jiao Tong University), Ministry of Education, Shanghai 200240, China; 2. Shibei Electricity Supply Company, State Grid Shanghai Municipal Electric Power Company, Shanghai 200072, China)
Consumption mode stability analysis (CMSA) is the precondition of load forecasting, the essence of which is to judge the similarity of a customer’s consumption features in different historical time periods. Extracting consumption features from data of a long time period reduces the feasibility and accuracy of CMSA, using the short-time data might also be of low accuracy because daily consumption data are influenced by random factors. A method is therefore proposed to extract the customers’ consumption modes by principal component analysis and taking daily consumption coefficients and daily consumption volatility as original consumption features. The stability of consumption mode is further judged by the Euclidean distance between the factor loading vectors of the principal components in two historical periods. A numerical example is provided by a residential community. Results show that the monthly consumption forecast accuracy is apparently different from the consumers in stable and unstable consumption modes judged by the proposed method and there is significant positive correlation between the similarity distance and the forecast error. It's also concluded that proper data period is of utmost importance to the feasibility and accuracy of CMSA. It seems 16 weeks will be appropriate for the CMSA problem.
This work is supported by National Natural Science Foundation of China (No. 51337005) and State Grid Corporation of China (No. 5209141500QW).
stability of consumption mode; principal component analysis; similarity judgment; load forecasting
2016-12-22;
2017-03-30。
上網(wǎng)日期: 2017-06-14。
國(guó)家自然科學(xué)基金資助項(xiàng)目(51337005);國(guó)家電網(wǎng)公司科技項(xiàng)目(5209141500QW)。
牟婷婷(1992—),女,碩士研究生,主要研究方向:數(shù)據(jù)挖掘技術(shù)在集抄數(shù)據(jù)分析中的應(yīng)用。E-mail: fallen_mtt@sjtu.edu.cn
陸 微(1982—),男,經(jīng)濟(jì)師,主要研究方向:電力營(yíng)銷和電量電費(fèi)。E-mail: 13917109982@139.com
王蘭君(1983—),女,經(jīng)濟(jì)師,主要研究方向:電力營(yíng)銷和營(yíng)業(yè)管理。E-mail: lanlanwang_@163.com
辛潔晴(1973—),女,通信作者,副教授,主要研究方向:電力營(yíng)銷與電力市場(chǎng)。E-mail: jqxin@sjtu.edu.cn
(編輯 孔麗蓓)