祁夢(mèng)雪,梅林玨昊,李知藝,辛煥海
(浙江大學(xué)電氣工程學(xué)院,浙江省 杭州市 310027)
精細(xì)化的負(fù)荷劃分結(jié)果將為精準(zhǔn)負(fù)荷調(diào)控奠定基礎(chǔ),而負(fù)荷曲線聚類是主流的負(fù)荷劃分思路[1-3]。按照工、商、民、農(nóng)等行業(yè)性質(zhì)對(duì)配電網(wǎng)末梢負(fù)荷進(jìn)行的傳統(tǒng)類別劃分,往往忽略電力用戶負(fù)荷波動(dòng)態(tài)勢(shì)的復(fù)雜性,缺乏對(duì)電力用戶用電行為的個(gè)性化分析,難以滿足負(fù)荷調(diào)控的多樣化、靈活性需求[4-6]。事實(shí)上,負(fù)荷特性受到氣候、經(jīng)濟(jì)、節(jié)假日等多個(gè)維度的因素影響,呈現(xiàn)出短期波動(dòng)性大的特點(diǎn)。即使是同一個(gè)用戶,其電力消費(fèi)模式也可能在連續(xù)幾日內(nèi)發(fā)生很大變化。因此,增加負(fù)荷分析對(duì)象的時(shí)間尺度,可避免負(fù)荷波動(dòng)規(guī)律分析的偶然性。
主流的聚類研究大致可以分為基于距離的方法[7-12]、自組織映射方法[13]以及概率生成模型[14]三類,但這些方法在實(shí)現(xiàn)上均存在參數(shù)調(diào)節(jié)問(wèn)題。少量文獻(xiàn)也考慮了負(fù)荷波動(dòng)的影響。文獻(xiàn)[15]提出基于移動(dòng)形狀的魯棒模糊K 模態(tài)(MS-RFKM)聚類方法,但難以平衡選取的符號(hào)化區(qū)間長(zhǎng)度與聚類效果的關(guān)系;文獻(xiàn)[16]采用動(dòng)態(tài)時(shí)間規(guī)整方法識(shí)別電力曲線的變化趨勢(shì),文獻(xiàn)[17]提出兩階段負(fù)荷聚類方法,降低了聚類算法的特征空間維度,但聚類效果都受到數(shù)據(jù)維度的限制。以上問(wèn)題出現(xiàn)的根本原因在于,在高維數(shù)據(jù)情況下,數(shù)據(jù)點(diǎn)間的距離傾向于彼此接近,造成數(shù)據(jù)點(diǎn)之間的距離關(guān)系弱化[18]。因此,負(fù)荷曲線聚類研究經(jīng)常局限于單日負(fù)荷曲線的分析,導(dǎo)致聚類結(jié)果的準(zhǔn)確度和魯棒性不足,難以準(zhǔn)確把握用戶的周期性電力消費(fèi)特征。
網(wǎng)絡(luò)科學(xué)為非線性時(shí)間序列的分析提供了全新的視角[19]。通過(guò)一定的映射方法[20],將初始時(shí)間序列轉(zhuǎn)換為一個(gè)或多個(gè)網(wǎng)絡(luò),借助網(wǎng)絡(luò)理論描述時(shí)間序列的動(dòng)態(tài)行為,有益于深化對(duì)系統(tǒng)狀態(tài)的理解[21]??梢晥D(visibility graph,VG)[22-23]及水平可視圖(horizontal visibility graph,HVG)[24]方法是將非線性時(shí)間序列轉(zhuǎn)換為網(wǎng)絡(luò)的重要手段之一,在描述金融市場(chǎng)的長(zhǎng)期價(jià)格動(dòng)態(tài)特性、不確定性、復(fù)雜性等方面有著廣泛的應(yīng)用,所分析的對(duì)象也不受限于時(shí)間序列的維度。這種映射方法也為從網(wǎng)絡(luò)科學(xué)的角度研究多日負(fù)荷曲線架設(shè)了橋梁。文獻(xiàn)[25]引入網(wǎng)絡(luò)中的“模體”工具實(shí)現(xiàn)不同行業(yè)負(fù)荷曲線特性的挖掘,是網(wǎng)絡(luò)方法在分析電力負(fù)荷曲線中應(yīng)用的一次嘗試。在面對(duì)多個(gè)分析對(duì)象時(shí),文獻(xiàn)[26]構(gòu)建了多層網(wǎng)絡(luò),并從量子理論的角度,對(duì)多層網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行約簡(jiǎn)。由上述分析可知,網(wǎng)絡(luò)分析方法克服了傳統(tǒng)時(shí)間序列分析方法難以應(yīng)對(duì)的高維數(shù)據(jù)分析問(wèn)題,可實(shí)現(xiàn)時(shí)間序列的動(dòng)態(tài)行為分析,這對(duì)分析電力用戶的用電行為具有很好的借鑒意義。
針對(duì)當(dāng)前聚類方法存在的參數(shù)調(diào)節(jié)、難以分析高維度數(shù)據(jù)、可解釋性不強(qiáng)等問(wèn)題,本文提出一種基于網(wǎng)絡(luò)結(jié)構(gòu)約簡(jiǎn)理念的多日負(fù)荷曲線聚類新思路。通過(guò)將配電網(wǎng)末梢負(fù)荷曲線從時(shí)間域映射到網(wǎng)絡(luò)域,實(shí)現(xiàn)了多日曲線聚類向多層網(wǎng)絡(luò)冗余結(jié)構(gòu)約簡(jiǎn)的等價(jià)轉(zhuǎn)化。相關(guān)分析過(guò)程既能避免繁多的參數(shù)調(diào)節(jié)問(wèn)題,又能增強(qiáng)聚類結(jié)果的可解釋性,為后續(xù)負(fù)荷高效調(diào)控研究提供了理論與方法支撐。
HVG 方法[27]根據(jù)特定的幾何標(biāo)準(zhǔn)將時(shí)間序列映射到圖形中,以便利用網(wǎng)絡(luò)理論來(lái)挖掘時(shí)間序列的隱含信息。已有研究表明,通過(guò)HVG 方法轉(zhuǎn)換成的網(wǎng)絡(luò),仍能保持時(shí)間序列的固有特征,且可以捕獲 生 成 序 列 過(guò) 程 的 動(dòng) 態(tài) 特 征[28]。HVG 是 對(duì)VG 方法的幾何簡(jiǎn)化,它將時(shí)間序列中的每個(gè)點(diǎn)看作網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn),節(jié)點(diǎn)間是否存在連邊則是由時(shí)間序列中對(duì)應(yīng)的采樣點(diǎn)能否在幅值水平上無(wú)阻礙地互相看見(jiàn)決定。圖1 展示了負(fù)荷時(shí)間序列通過(guò)HVG 方法從時(shí)間域轉(zhuǎn)換到網(wǎng)絡(luò)域的過(guò)程。具體的映射方法過(guò)程參見(jiàn)附錄A。所形成的網(wǎng)絡(luò)可以表示為G=(V,E,A),其中V為網(wǎng)絡(luò)中的節(jié)點(diǎn),E為連邊,A為網(wǎng)絡(luò)的鄰接矩陣。另外,負(fù)荷曲線是由有限個(gè)負(fù)荷數(shù)據(jù)采樣點(diǎn)構(gòu)成的,故本文中的負(fù)荷曲線與負(fù)荷時(shí)間序列是同一種概念。典型周負(fù)荷曲線如附錄A圖A1 所示,可以發(fā)現(xiàn)連續(xù)多日內(nèi)負(fù)荷存在著波動(dòng)幅度、波動(dòng)頻次、波峰出現(xiàn)位置以及波動(dòng)周期上的明顯差異,而周間負(fù)荷波動(dòng)則在整體上差異較小。因此,本文以周作為負(fù)荷分析的時(shí)間尺度。在多日負(fù)荷曲線聚類分析中,為了不使HVG 方法在應(yīng)用的過(guò)程中放大局部的微小波動(dòng),本文在時(shí)間序列向網(wǎng)絡(luò)映射時(shí)忽略跨過(guò)采樣間隔不足整體采樣數(shù)據(jù)量1%(本文為4)的連邊。附錄A 圖A2 展示了典型周居民負(fù)荷曲線(每天48 個(gè)采樣點(diǎn),共336 個(gè)采樣點(diǎn))轉(zhuǎn)化為網(wǎng)絡(luò)的示意圖。在這個(gè)過(guò)程中,不會(huì)出現(xiàn)傳統(tǒng)HVG 下相鄰采樣點(diǎn)天然有連邊的結(jié)果,所形成的網(wǎng)絡(luò)也可能是非連通圖。
圖1 HVG 方法示意圖Fig.1 Schematic diagram of HVG method
多層網(wǎng)絡(luò)[29]在反映網(wǎng)絡(luò)層間節(jié)點(diǎn)關(guān)系的同時(shí)也能反映網(wǎng)絡(luò)層內(nèi)節(jié)點(diǎn)的關(guān)系。由于負(fù)荷曲線分析對(duì)象的數(shù)據(jù)采樣時(shí)間段和采樣頻率一致,本文將時(shí)間作為網(wǎng)絡(luò)之間的關(guān)聯(lián)點(diǎn),建立網(wǎng)絡(luò)相鄰層之間的聯(lián)系。在應(yīng)用HVG 方法將M個(gè)電力用戶一周的負(fù)荷時(shí)間序列轉(zhuǎn)換成網(wǎng)絡(luò)后,對(duì)時(shí)刻點(diǎn)相同的層間節(jié)點(diǎn)進(jìn)行連接,形成M維多層負(fù)荷網(wǎng)絡(luò)模型Λ={A(1),A(2),…,A(M)}。
在負(fù)荷曲線聚類問(wèn)題中,若時(shí)間序列過(guò)短,就會(huì)因電力消費(fèi)行為在宏觀消費(fèi)周期內(nèi)的隨機(jī)性而降低聚類結(jié)果的魯棒性與可解釋性;若時(shí)間序列長(zhǎng)度變大,將面臨高維時(shí)間序列帶來(lái)的聚類效率問(wèn)題,依賴參數(shù)調(diào)節(jié)的聚類方法難以確保結(jié)果的準(zhǔn)確性。
目前已出現(xiàn)大量將負(fù)荷時(shí)間序列轉(zhuǎn)換為伴生網(wǎng)絡(luò)的研究[27-30],在拓寬網(wǎng)絡(luò)理論適用范圍的同時(shí),也為負(fù)荷時(shí)間序列分析提供了全新的視角和工具。負(fù)荷曲線聚類問(wèn)題實(shí)質(zhì)上是一種多維信息的去冗余過(guò)程,即在最大程度上保留系統(tǒng)原有信息的基礎(chǔ)上,最小化聚類內(nèi)部差異性,最大化聚類外部的區(qū)別度。與這個(gè)過(guò)程相對(duì)應(yīng)的是多層網(wǎng)絡(luò)結(jié)構(gòu)約簡(jiǎn)的過(guò)程。具體來(lái)說(shuō),在負(fù)荷時(shí)間序列轉(zhuǎn)換為網(wǎng)絡(luò)后,根據(jù)不同電力用戶之間的時(shí)間關(guān)聯(lián)性,可建立與之相關(guān)的多層伴生網(wǎng)絡(luò)。因某些用戶的用電行為存在相似性,反映在網(wǎng)絡(luò)中即為結(jié)構(gòu)冗余。將結(jié)構(gòu)相似的網(wǎng)絡(luò)層進(jìn)行聚合,簡(jiǎn)化多層伴生網(wǎng)絡(luò)的各層網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)層數(shù),即得到緊湊的聚合層內(nèi)部結(jié)構(gòu)以及各個(gè)極具區(qū)分度的聚合后的網(wǎng)絡(luò)層。由于多層伴生網(wǎng)絡(luò)中的各層網(wǎng)絡(luò)代表的是各個(gè)用戶的周負(fù)荷時(shí)間序列的波動(dòng)情況,簡(jiǎn)化后的多層伴生網(wǎng)絡(luò)中的聚合層表征了有著相似負(fù)荷波動(dòng)特性的用戶集合,聚合層個(gè)數(shù)則表征負(fù)荷曲線聚類的類別數(shù)。由此,得到負(fù)荷曲線聚類結(jié)果。多層伴生網(wǎng)絡(luò)約簡(jiǎn)與負(fù)荷曲線聚類對(duì)應(yīng)過(guò)程演示圖見(jiàn)附錄A 圖A3。針對(duì)聚類結(jié)果,從負(fù)荷波動(dòng)相對(duì)大小、波動(dòng)頻次、波動(dòng)周期等方面實(shí)現(xiàn)多日負(fù)荷曲線的波動(dòng)態(tài)勢(shì)分析,進(jìn)而實(shí)現(xiàn)不同電力用戶的調(diào)度潛力挖掘。
圖2 為基于網(wǎng)絡(luò)結(jié)構(gòu)約簡(jiǎn)理念的多日負(fù)荷曲線聚類分析框架,旨在從多層伴生網(wǎng)絡(luò)結(jié)構(gòu)的角度出發(fā),挖掘連續(xù)多日負(fù)荷波動(dòng)態(tài)勢(shì),并在此基礎(chǔ)上實(shí)現(xiàn)電力用戶的集群劃分。具體來(lái)說(shuō),該分析框架主要包括3 個(gè)部分:
圖2 基于網(wǎng)絡(luò)結(jié)構(gòu)約簡(jiǎn)的多日負(fù)荷曲線聚類分析框架Fig.2 Analysis framework for multi-day load curve clustering based on structural reducibility of networks
1)生成負(fù)荷時(shí)間序列多層伴生網(wǎng)絡(luò):采用HVG方法,建立多個(gè)用戶的負(fù)荷時(shí)間序列多層伴生網(wǎng)絡(luò);
2)多層網(wǎng)絡(luò)結(jié)構(gòu)約簡(jiǎn):應(yīng)用信息熵理論,量化多層伴生網(wǎng)絡(luò)中網(wǎng)絡(luò)層間的差異,對(duì)相似的網(wǎng)絡(luò)進(jìn)行聚合直到多層網(wǎng)絡(luò)聚合為一層,并評(píng)估歷次聚合后的多層伴生網(wǎng)絡(luò)的結(jié)構(gòu)冗余度;
3)多日負(fù)荷曲線聚類結(jié)果解讀:選擇最優(yōu)層聚合結(jié)果作為最終的負(fù)荷分類結(jié)果,對(duì)聚類結(jié)果進(jìn)行波動(dòng)態(tài)勢(shì)以及社會(huì)屬性分析。
將多日負(fù)荷曲線作為對(duì)象,采用多層伴生網(wǎng)絡(luò)結(jié)構(gòu)約簡(jiǎn)的方法進(jìn)行電力用戶負(fù)荷波動(dòng)態(tài)勢(shì)研究。一方面,可以在依據(jù)行業(yè)性質(zhì)的宏觀分類下,進(jìn)一步細(xì)化,針對(duì)性分析具體用戶的負(fù)荷波動(dòng)情況,將其波動(dòng)特性與社會(huì)屬性結(jié)合起來(lái),實(shí)現(xiàn)更為全面的分析;另一方面,多日負(fù)荷曲線聚類分析的結(jié)果可以為電網(wǎng)的需求側(cè)響應(yīng)、電網(wǎng)規(guī)劃和電力市場(chǎng)商業(yè)報(bào)價(jià)等方面提供參考。
馮諾依曼熵[26]是香農(nóng)熵在量子力學(xué)領(lǐng)域的擴(kuò)展,也可用于表征圖,作為描述負(fù)荷時(shí)間序列對(duì)應(yīng)的伴生網(wǎng)絡(luò)的狀態(tài)參數(shù)。單層伴生網(wǎng)絡(luò)的狀態(tài)具體表現(xiàn)為網(wǎng)絡(luò)中邊的數(shù)量,而多層伴生網(wǎng)絡(luò)的狀態(tài)則體現(xiàn)為網(wǎng)絡(luò)的層數(shù)。一般而言,馮諾依曼熵值越大,狀態(tài)就越復(fù)雜。
對(duì)給定的單層負(fù)荷時(shí)間序列的伴生網(wǎng)絡(luò)G=(V,E,A),其中,節(jié)點(diǎn)個(gè)數(shù)N=|V|,連邊數(shù)K=|E|,鄰接矩陣A=(aij),G的馮諾依曼熵定義如下:
式中:Tr(·)表示矩陣的跡;LG=c×(D-A)為與圖關(guān)聯(lián)的組合拉普拉斯矩陣,其中c=為節(jié)點(diǎn)度的對(duì)角矩陣。形式上,LG具有密度矩陣的所有性質(zhì),根據(jù)LG的特征值集合{λ1,λ2,…,λN},hA可以寫成如下形式:
負(fù)荷時(shí)間序列的多層伴生網(wǎng)絡(luò)馮諾依曼熵H(Λ)定義為其M層網(wǎng)絡(luò)的馮諾依曼熵之和,即
式中:上標(biāo)(α)表示α層對(duì)應(yīng)的變量。
多層伴生網(wǎng)絡(luò)Λ={A(1),A(2),…,A(M)}的馮諾依曼熵值由網(wǎng)絡(luò)層數(shù)M和每層的具體結(jié)構(gòu)決定。而在多層伴生網(wǎng)絡(luò)結(jié)構(gòu)約簡(jiǎn)的過(guò)程中,存在網(wǎng)絡(luò)聚合這一過(guò)程,必然會(huì)導(dǎo)致馮諾依曼熵值的變化。為了衡量層間聚合后的多層伴生網(wǎng)絡(luò)的結(jié)構(gòu)冗余度,應(yīng)用相對(duì)熵的概念進(jìn)行網(wǎng)絡(luò)聚合效果的量化分析。
若M層網(wǎng)絡(luò)Λ的所有層聚合為一層,將此時(shí)的全層聚合網(wǎng)絡(luò)記為A,則其鄰接矩陣為A=A(1)+A(2)+…+A(M),記hA為A的馮諾依曼熵。更一般地,對(duì)多層伴生網(wǎng)絡(luò)Λ的某些層聚合后,得到一個(gè)層數(shù)約簡(jiǎn)后的X層網(wǎng)絡(luò)Φ:
式中:鄰接矩陣C(α)(α=1,2,…,X)為多層伴生網(wǎng)絡(luò)Λ的一個(gè)鄰接矩陣或者是多個(gè)鄰接矩陣之和,簡(jiǎn)化后多層網(wǎng)絡(luò)Φ的層均熵如式(5)所示。
q(Φ)越大,簡(jiǎn)化后的多層網(wǎng)絡(luò)Φ與全聚合網(wǎng)絡(luò)A的差異越大。一個(gè)極端的例子就是當(dāng)Φ的所有層都相同時(shí),q(Φ)=0,這意味著簡(jiǎn)化后的網(wǎng)絡(luò)Φ與A是完全等效的。此時(shí),需要放棄具有多層結(jié)構(gòu)的簡(jiǎn)化網(wǎng)絡(luò)Φ而考慮結(jié)構(gòu)更為精簡(jiǎn)的全聚合網(wǎng)絡(luò)A。
有了相對(duì)熵對(duì)負(fù)荷時(shí)間序列的多層伴生網(wǎng)絡(luò)結(jié)構(gòu)冗余度的量化,多層伴生網(wǎng)絡(luò)約簡(jiǎn)問(wèn)題就轉(zhuǎn)換為尋找最佳相對(duì)熵值,這是一個(gè)典型的多項(xiàng)式復(fù)雜程度的非確定性(NP)難題。為解決這個(gè)問(wèn)題,采用詹森-香農(nóng)(Jensen-Shannon,J-S)距離來(lái)量化多層伴生網(wǎng)絡(luò)所有層對(duì)之間的相似性,選擇距離最小的兩層作為該次迭代時(shí)的最佳聚合層對(duì)。
J-S 距離[31]是為解決K-L 距離的非負(fù)、非對(duì)稱性且不滿足三角不等式等問(wèn)題而被提出的,是K-L 距離的對(duì)稱和平滑版本。給定兩個(gè)密度矩陣ρ和σ,K-L 距離定義如下:
將μ=1/2(ρ+σ)作為這兩個(gè)密度矩陣的結(jié)合物,則密度矩陣ρ和σ之間的J-S 距離DJS(ρ||σ)可以表示為:
式中:h(·)表示求馮諾依曼熵。
附錄A 圖A4 展示了負(fù)荷時(shí)間序列多層伴生網(wǎng)絡(luò)結(jié)構(gòu)約簡(jiǎn)的主要過(guò)程。M維負(fù)荷時(shí)間序列通過(guò)HVG 方法映射得到多層伴生網(wǎng)絡(luò)Λ={A(1),A(2),…,A(M)}后,基于分層聚類的思想,利用圖的馮諾依曼熵的概念,使用J-S 距離來(lái)量化多層伴生網(wǎng)絡(luò)所有層對(duì)之間的相似性,形成多層伴生網(wǎng)絡(luò)層對(duì)間的J-S 距離矩陣。將距離最小的層對(duì)進(jìn)行聚合,得到一個(gè)新的多層網(wǎng)絡(luò)Φ,計(jì)算并記錄多層網(wǎng)絡(luò)Φ的相對(duì)熵。如果此時(shí)多層網(wǎng)絡(luò)Φ的層數(shù)不為1,即多層網(wǎng)絡(luò)Λ還未聚合成一層網(wǎng)絡(luò),則重復(fù)上述操作,直到多層網(wǎng)絡(luò)Λ聚合成一個(gè)網(wǎng)絡(luò)。一般選擇各次迭代中相對(duì)熵值為全局最大的情況作為最佳層網(wǎng)絡(luò)聚合結(jié)果。
需要說(shuō)明的是,在層間具有特定度相關(guān)性的情況下,多層伴生網(wǎng)絡(luò)的各層會(huì)有等譜特性,使得各次迭代得到的相對(duì)熵的最大值出現(xiàn)在多層網(wǎng)絡(luò)尚未進(jìn)行層聚合的初始狀態(tài)時(shí)。這意味著,如果將網(wǎng)絡(luò)層進(jìn)行聚合會(huì)損失部分信息。但通常情況是,在聚合一定數(shù)量的層網(wǎng)絡(luò)之前,相對(duì)熵的大小非常接近初始狀態(tài)時(shí)相對(duì)熵的大小,即聚合這些層網(wǎng)絡(luò)損失的信息量不大。在進(jìn)一步網(wǎng)絡(luò)層聚合時(shí),才會(huì)出現(xiàn)相對(duì)熵值的大幅度降低。因此,在考慮損失較少信息的同時(shí),獲得歷次相對(duì)熵值斜率絕對(duì)值最大的聚合情況,能在可接受的誤差范圍內(nèi)獲得最合理的網(wǎng)絡(luò)聚合結(jié)果。
為了更好地量化和比較本文方法與其他方法的聚類效果,這里提出了簇內(nèi)波動(dòng)相似性指數(shù)和簇間波動(dòng)差異性指數(shù)分別用以衡量聚類后負(fù)荷曲線簇內(nèi)波動(dòng)相似度以及簇間波動(dòng)差異度。
對(duì)于一個(gè)具有M條用戶負(fù)荷曲線且每條負(fù)荷曲 線 有N個(gè) 數(shù) 據(jù) 采 樣 點(diǎn) 的 樣 本l={xi}i=1,2,…,N,在負(fù)荷曲線聚類后得到ξ組負(fù)荷曲線簇,{αs}s=1,2,…,ξ為簇s中所含的 負(fù) 荷曲線集 合,{βs}s=1,2,…,ξ為簇s中所含的負(fù)荷曲線數(shù)量。 負(fù)荷曲線m記作lm={}i=1,2,…,N,其 波 動(dòng) 序 列Γm定 義 為 每 兩 個(gè) 數(shù) 據(jù) 采樣 點(diǎn) 間 的 波 動(dòng) 趨 勢(shì),記 作Γm={}i=1,2,…,N-1,其中的表達(dá)式如式(9)所示。簇s的簇內(nèi)負(fù)荷曲線平均波動(dòng)序列為{}i=1,2,…,N-1,其中的表達(dá)式如式(10)所示。
負(fù)荷曲線簇內(nèi)平均波動(dòng)序列中元素的絕對(duì)值越大,反映該時(shí)刻下簇內(nèi)曲線趨勢(shì)的相似性越大。為了綜合衡量各個(gè)負(fù)荷曲線簇內(nèi)部的曲線相似程度,以簇內(nèi)負(fù)荷曲線數(shù)量占樣本數(shù)量的比例作為權(quán)重,以平均波動(dòng)絕對(duì)值大于0.5 時(shí)刻數(shù)量衡量簇內(nèi)曲線的相似程度,將這兩項(xiàng)相乘,對(duì)每個(gè)簇的此項(xiàng)結(jié)果進(jìn)行加和,得到簇內(nèi)波動(dòng)相似性指數(shù)αSI為:
式中:
αSI越大,簇內(nèi)波動(dòng)相似性越高。簇間波動(dòng)差異性指數(shù)通過(guò)與簇內(nèi)波動(dòng)相似指數(shù)相類似的思路得到。首先,根據(jù)聚類后得到的ξ組負(fù)荷曲線簇構(gòu)建ξ×ξ簇間差異度矩陣B:
式中:
簇間差異度矩陣B中的元素反映了不同簇間的波動(dòng)性差異。簇間波動(dòng)差異性指數(shù)αDI可定義為不同簇間差異度的平均值,即
αDI越大,表明不同負(fù)荷曲線簇之間的差異性越大,負(fù)荷聚類效果越好。
在開(kāi)始真實(shí)數(shù)據(jù)集的算例分析前,為了說(shuō)明本文方法所用到的距離量度方式與其他方法在多日負(fù)荷曲線量度效果上的差異,本節(jié)設(shè)計(jì)了4 種波動(dòng)類型的測(cè)試曲線。每種波動(dòng)類型中隨機(jī)生成10 條加入高斯噪聲的曲線樣本,其中,高斯噪聲分布均滿足期望為0,方差為1,噪聲大小為各采樣點(diǎn)數(shù)據(jù)幅值的30%與噪聲幅度的乘積,共得到40 條測(cè)試曲線樣本,曲線樣本編號(hào)i∈[0,39]。為了與3.2 節(jié)真實(shí)算例中的數(shù)據(jù)采樣頻率和數(shù)據(jù)長(zhǎng)度相對(duì)應(yīng),這里每條曲線的采樣點(diǎn)數(shù)量均為336,48 個(gè)采樣點(diǎn)為一天的負(fù)荷數(shù)據(jù)采集量。4 種類型的測(cè)試曲線、曲線所對(duì)應(yīng)的編號(hào)及特征如附錄A 表A1 所示。
針對(duì)本文方法所用到的J-S 距離、MS-RFKM聚類算法所用到的漢明距離、K-means 算法及近鄰傳播(AP)聚類算法所用到的歐氏距離,分別計(jì)算這3 種距離度量方式下40 條測(cè)試曲線之間的距離,得到歸一化距離分布熱力圖如圖3 所示。
圖3 3 種距離量度方式下測(cè)試曲線的歸一化距離分布熱力圖Fig.3 Normalized distance distribution heat map of test curves under three distance measurement methods
由測(cè)試曲線的歸一化距離分布熱力圖可以看出,沿著對(duì)角線的方向,本文方法所用到的J-S 距離將測(cè)試曲線分成了明顯的4 類,對(duì)應(yīng)的恰好分別是4 種類別下測(cè)試曲線所屬的曲線編號(hào),同類別測(cè)試曲線內(nèi)部之間的J-S 距離很小,體現(xiàn)了同類別內(nèi)的曲線之間的相似性;第1、2、3 類測(cè)試曲線之間的J-S距離稍大些,而第4 類測(cè)試曲線則與其他3 類測(cè)試曲線之間的距離最大,這與測(cè)試曲線特征中的“谷-峰-谷”波動(dòng)模式頻次是相對(duì)應(yīng)的,而尖峰間的相隔距離與尖峰數(shù)則造成了測(cè)試曲線類別之間的差異。MSRFKM 聚類算法所用到的漢明距離雖然同樣反映了第4 類測(cè)試曲線與第1、2、3 類測(cè)試曲線之間的差異,但是卻忽略了第1、2、3 類曲線之間的差異性,不能反映尖峰數(shù)目以及尖峰間距離的差異性。K-means 算法及AP 聚類算法所用到的歐氏距離則完全不能對(duì)測(cè)試曲線進(jìn)行正確分類。
本節(jié)在愛(ài)爾蘭電力和天然氣行業(yè)的監(jiān)管機(jī)構(gòu)——能源監(jiān)管委員會(huì)(CER)數(shù)據(jù)集中隨機(jī)選擇100 個(gè)家庭住宅用戶的8 月第1 周的負(fù)荷曲線數(shù)據(jù),日采樣頻率為半小時(shí),一周共計(jì)336 個(gè)采樣點(diǎn)。將100 個(gè)家庭住宅的周負(fù)荷時(shí)間序列通過(guò)HVG 方法映射成層數(shù)為100 的多層伴生網(wǎng)絡(luò)。在此基礎(chǔ)上,計(jì)算各層對(duì)間的J-S 距離矩陣(部分迭代過(guò)程中的JS 距離熱力圖如圖4(a)所示)。對(duì)J-S 距離最小的層對(duì)進(jìn)行聚合,更新層間聚合所形成的新網(wǎng)絡(luò)層的鄰接矩陣,記錄層聚合后的相對(duì)熵(歷次迭代相對(duì)熵值如圖4(b)所示),并重復(fù)上述過(guò)程直到整個(gè)多層網(wǎng)絡(luò)完全聚合為一層。
圖4 家庭住宅用戶的J-S 距離熱力圖及相對(duì)熵折線圖Fig.4 J-S distance heat maps and relative entropy line chart of residential users
第97 次迭代的相對(duì)熵值(黑色標(biāo)記位置)未達(dá)到全局最大值,即多層伴生網(wǎng)絡(luò)層間存在較強(qiáng)的度相關(guān)性而存在等光譜特性。而在第89 次層對(duì)聚合時(shí)折線的斜率絕對(duì)值達(dá)到最大(紅色標(biāo)記位置),故選擇第89 次迭代結(jié)果作為最優(yōu)層聚合方案。該種層聚合方式將100 個(gè)家庭住宅的周負(fù)荷曲線分成8 類,具體的歸一化負(fù)荷波動(dòng)圖見(jiàn)附錄A 圖A5。此外,采用2.5 節(jié)的方法將本文方法、MS-RFKM 聚類算法、K-means 算法、AP 聚類算法對(duì)同一數(shù)據(jù)集的聚類結(jié)果進(jìn)行分析和比較,結(jié)果見(jiàn)附錄A 圖A6??梢钥闯觯疚姆椒▽?duì)家庭住宅用戶的負(fù)荷曲線聚類結(jié)果無(wú)論是在簇內(nèi)波動(dòng)相似性方面還是在簇間波動(dòng)差異性方面的表現(xiàn)都優(yōu)于其他方法。
從負(fù)荷波動(dòng)態(tài)勢(shì)上來(lái)看,第0 組和第4 組用戶的工作日負(fù)荷波動(dòng)較為規(guī)律,用電低谷時(shí)段均較長(zhǎng),但第4 組用戶在工作日內(nèi)的負(fù)荷波動(dòng)伴有明顯的雙峰波動(dòng)特性,周末負(fù)荷波動(dòng)頻次較高,相較于工作日差別較大,而第0 組用戶的工作日和周末用電相似度較高,且有固定的波峰時(shí)段。第1 組和第3 組用戶均表現(xiàn)為周末用電雜亂、工作日負(fù)荷波動(dòng)規(guī)律且伴有規(guī)律的波峰時(shí)段,用電低谷時(shí)段較長(zhǎng),但第3 組用戶用電時(shí)段的負(fù)荷波動(dòng)頻次更高。第2 組和第5 組用戶的日內(nèi)負(fù)荷波動(dòng)伴有較為明顯的雙峰波動(dòng)特征,用電低谷時(shí)段較短,但第2 組的雙峰出現(xiàn)的時(shí)段較為隨機(jī),負(fù)荷波動(dòng)的規(guī)律性較差,而第5 組工作日的負(fù)荷規(guī)律性較強(qiáng),工作日和周末的負(fù)荷波動(dòng)存在一定的差別。第6 組和第7 組用戶的用電低谷時(shí)段長(zhǎng),第6 組用戶雖整體用電規(guī)律性較差,但偶爾會(huì)出現(xiàn)規(guī)律的雙峰時(shí)段,用電低谷時(shí)段長(zhǎng),第7 組用電整體規(guī)律性很差,負(fù)荷波動(dòng)頻次不高,且出現(xiàn)的用電時(shí)段較為隨機(jī)。
從社會(huì)調(diào)查信息上看,采用本文方法的聚類結(jié)果呈現(xiàn)了承擔(dān)主要收入來(lái)源的家庭成員的職業(yè)分布差異化。其中,80%的雇員的電力消費(fèi)情況大多分布在第1、2、3、4、5 組用戶中,而雇主在同樣的分布中的比例僅為40%左右;在采取節(jié)電措施的意愿調(diào)查中,第3 組用戶中約有79%的用戶表達(dá)出較強(qiáng)的節(jié)電意識(shí),并在不同程度上已經(jīng)采取了相應(yīng)的節(jié)電措施,從該類別的歸一化用戶負(fù)荷折線圖中也可以發(fā)現(xiàn),在較長(zhǎng)周期內(nèi),該類別的大多數(shù)用戶用電規(guī)律,用電低谷時(shí)間相對(duì)較長(zhǎng),用電期間的用電量水平也較為平均。第7 組用戶則僅有25%的用戶表達(dá)出較強(qiáng)的節(jié)電意識(shí),而在該類別的歸一化用戶負(fù)荷折線圖中可以看到,在較長(zhǎng)周期內(nèi),該用戶類別的用電低谷表現(xiàn)較為雜亂,聚類結(jié)果與調(diào)查情況總體表現(xiàn)一致。
根據(jù)負(fù)荷波動(dòng)態(tài)勢(shì)和社會(huì)屬性的分析,第0 組和第5 組負(fù)荷曲線出現(xiàn)波峰的時(shí)段都有一定的規(guī)律性,出現(xiàn)的時(shí)段相較于常規(guī)的波峰時(shí)段或超前或滯后,可以將其視作錯(cuò)峰調(diào)節(jié)的輔助資源。第1 組用戶一周用電的規(guī)律性都較為統(tǒng)一,用電時(shí)間上的調(diào)控空間有限,但存在電價(jià)引導(dǎo)降低用電量的可能。第2 組用戶用電曲線雙峰出現(xiàn)的時(shí)間較為隨機(jī),可通過(guò)價(jià)格引導(dǎo)實(shí)現(xiàn)錯(cuò)峰調(diào)節(jié)資源。第3 組的多數(shù)用戶的節(jié)電意識(shí)較強(qiáng),其用電波動(dòng)頻繁可能是由于重復(fù)的開(kāi)斷電器,可引導(dǎo)其在用電低谷時(shí)段的用電增加。第4 組在工作日用電規(guī)律性較強(qiáng),可通過(guò)價(jià)格對(duì)其周末用電進(jìn)行調(diào)節(jié)。第6 組用電規(guī)律性較差,一般不可調(diào)節(jié)。第7 組多數(shù)用戶節(jié)電意識(shí)弱,可調(diào)節(jié)空間有限。
本節(jié)同樣在CER 數(shù)據(jù)集中隨機(jī)選擇了100 個(gè)中小企業(yè)用戶的8 月第1 周的負(fù)荷曲線數(shù)據(jù)作為分析對(duì)象,圖5(a)為迭代過(guò)程中的部分J-S 距離矩陣熱力圖。圖5(b)相對(duì)熵折線圖中紅色標(biāo)記所示的第94 次聚合相對(duì)熵值為全局最大值,因此將該次聚合情況作為最優(yōu)結(jié)果。本文方法將100 個(gè)中小企業(yè)用戶一周負(fù)荷曲線聚類分為4 個(gè)類別,其歸一化負(fù)荷波動(dòng)圖見(jiàn)附錄A 圖A7。4 種方法下中小企業(yè)用戶的負(fù)荷波動(dòng)聚類效果圖如附錄A 圖A8 所示。
圖5 中小企業(yè)用戶的J-S 距離熱力圖及相對(duì)熵折線圖Fig.5 J-S distance heat maps and relative entropy line chart of small- and medium-size enterprises
由于中小企業(yè)用戶的負(fù)荷曲線自身用電規(guī)律性很強(qiáng),波動(dòng)也比較頻繁,在保證一定的簇內(nèi)相似性情況下,簇間波動(dòng)差異性指數(shù)越大,更易說(shuō)明聚類效果的優(yōu)劣。除此之外,本文方法更加側(cè)重于對(duì)負(fù)荷波動(dòng)特性的刻畫,可解釋性強(qiáng)的同時(shí),在實(shí)現(xiàn)過(guò)程中無(wú)需調(diào)參,其他聚類方法不具備此種特征。因此,本文方法相較于其他聚類方法依然具有較強(qiáng)的優(yōu)勢(shì)。
從負(fù)荷波動(dòng)態(tài)勢(shì)上來(lái)看,第0、1、2、3 組用戶的波動(dòng)周期性都比較明顯,第1 組用戶的用電低谷時(shí)段較短,用電波動(dòng)頻次大;第0 組和第3 組用戶的波動(dòng)頻次較大,且用電峰谷差大,但是第3 組用戶的用電時(shí)間更長(zhǎng);第2 組的用電峰谷差最大,但是整體波動(dòng)頻次不高。
從社會(huì)調(diào)查信息來(lái)看,第0 組用戶中有82%的用戶具有強(qiáng)烈的節(jié)電意識(shí)且均有自備的發(fā)電裝置,企業(yè)性質(zhì)大多為技術(shù)服務(wù)開(kāi)發(fā)和咨詢公司;第1 組用戶中89%均來(lái)自服務(wù)行業(yè),其中,企業(yè)運(yùn)營(yíng)時(shí)間低于5 年的均為零售商或者無(wú)雇員的自營(yíng)店,而在用電相關(guān)的意愿調(diào)查部分,該類別中有92%的用戶有較強(qiáng)的意愿想要了解企業(yè)在不同時(shí)段的電費(fèi)情況;第2 組用戶的電費(fèi)在整個(gè)企業(yè)的預(yù)算中具有較高水平,大都超過(guò)10%,企業(yè)性質(zhì)主要為工業(yè)、電力交通行業(yè)等,用電需求量較大;第3 組用戶營(yíng)業(yè)額均為中等及以下,對(duì)企業(yè)自身的電力消費(fèi)情況的關(guān)注度不高,均來(lái)自服務(wù)業(yè)。
根據(jù)負(fù)荷波動(dòng)態(tài)勢(shì)和社會(huì)屬性的分析,第0 組可通過(guò)簽訂用戶用電時(shí)段協(xié)議等措施將其視為一種可中斷負(fù)荷。第1 組用戶的日用電規(guī)律性較強(qiáng),但是鑒于其中的多數(shù)用戶對(duì)電費(fèi)的關(guān)注度較高,可通過(guò)電價(jià)引導(dǎo)其有序用電。第2 組用戶用電規(guī)律性強(qiáng)且大多為高耗能企業(yè),可調(diào)度性不強(qiáng)。第3 組用戶用電高峰時(shí)段較為超前,可作為一種錯(cuò)峰調(diào)節(jié)資源。
本文通過(guò)分析配電網(wǎng)末梢負(fù)荷曲線聚類與網(wǎng)絡(luò)結(jié)構(gòu)冗余問(wèn)題在科學(xué)內(nèi)涵上的一致性,借鑒網(wǎng)絡(luò)結(jié)構(gòu)約簡(jiǎn)理念,提出了一種多日負(fù)荷曲線高效、精準(zhǔn)聚類的新思路。同時(shí),在依據(jù)行業(yè)性質(zhì)的宏觀分類基礎(chǔ)上,考慮配電網(wǎng)末梢負(fù)荷日間波動(dòng)的差異性,對(duì)多日負(fù)荷曲線進(jìn)行聚類,實(shí)現(xiàn)負(fù)荷波動(dòng)相似性的挖掘。算例結(jié)果表明,本文所采用的HVG 方法能根據(jù)負(fù)荷曲線本身的波動(dòng)特性自動(dòng)建立網(wǎng)絡(luò)中節(jié)點(diǎn)間的聯(lián)系,進(jìn)而保留時(shí)間序列的固有波動(dòng)特征;基于網(wǎng)絡(luò)信息熵的結(jié)構(gòu)冗余度評(píng)估,能自適應(yīng)實(shí)現(xiàn)多層網(wǎng)絡(luò)結(jié)構(gòu)約簡(jiǎn)過(guò)程且避免復(fù)雜的參數(shù)設(shè)置;所得到的多日負(fù)荷曲線聚類結(jié)果能有效反映用戶電力消費(fèi)特征與社會(huì)標(biāo)簽,具有可解釋性。在未來(lái)的研究中,將考慮分層分區(qū)聚類以進(jìn)一步提升聚類效率,同時(shí)擴(kuò)展負(fù)荷時(shí)序特征的分析維度以進(jìn)一步剖析負(fù)荷波動(dòng)態(tài)勢(shì)與需求側(cè)響應(yīng)潛力的關(guān)聯(lián)機(jī)理。
附錄見(jiàn)本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。