國(guó)網(wǎng)上海長(zhǎng)興供電公司 張佳杰 王嵐青 張小芳 中國(guó)電建集團(tuán)裝備研究院有限公司 李鵬輝 上海電力大學(xué) 李 崢
近年來,隨著國(guó)家開展整縣光伏政策的推進(jìn),農(nóng)村地區(qū)光伏占比逐漸增大,導(dǎo)致其配電網(wǎng)臺(tái)區(qū)內(nèi)負(fù)荷類型出現(xiàn)了新特點(diǎn)。隨著分布式光伏的不斷加入,開始出現(xiàn)低壓電網(wǎng)功率倒送問題,使電網(wǎng)的運(yùn)行產(chǎn)生一些負(fù)面影響。因此,有必要研究含分布式光伏接入配電網(wǎng)臺(tái)區(qū)負(fù)荷的特性分類問題,從而對(duì)變壓器選型、錯(cuò)峰調(diào)度管理、電網(wǎng)規(guī)劃提供有力支持。光伏發(fā)電系統(tǒng)的容量和接入配電網(wǎng)位置等因素均對(duì)配電網(wǎng)的電壓分布有影響,光伏滲透率較高的配電網(wǎng)可能出現(xiàn)電壓越限的情況,影響了供電電壓的穩(wěn)定性。
目前,配電網(wǎng)臺(tái)區(qū)負(fù)荷分類方面展開已有一定的研究。負(fù)荷分類方法主要以用電負(fù)荷曲線作為研究數(shù)據(jù),通過統(tǒng)計(jì)學(xué)習(xí)方法,如聚類分析,挖掘單一或不同用戶的典型用電特征[1]。聚類分析作為數(shù)據(jù)挖掘方法之一,有著廣泛的應(yīng)用,相較于數(shù)據(jù)挖掘方法中有監(jiān)督的分類,不需要提前劃分類別的無(wú)監(jiān)督式聚類方法更加適用于對(duì)用電行為進(jìn)行分析,其可以以較高的效率獲得數(shù)據(jù)在全局范圍內(nèi)的分布特征,并且有較好的應(yīng)用前景。因此,如何區(qū)分光伏臺(tái)的光伏特性和傳統(tǒng)單純用戶的負(fù)荷特性,已經(jīng)成為業(yè)務(wù)和技術(shù)部門關(guān)注并急切需要處理的問題。
本文通過對(duì)農(nóng)村配電網(wǎng)臺(tái)區(qū)負(fù)荷數(shù)據(jù)進(jìn)行聚類分析,通過數(shù)據(jù)清洗、歸一化和K-Shape聚類分析方法[2],挖掘出配電網(wǎng)臺(tái)區(qū)分布式光伏發(fā)電規(guī)律,在農(nóng)村居民用戶負(fù)荷的背景下,分析農(nóng)村臺(tái)區(qū)的負(fù)荷規(guī)律以及用電的高峰低谷等情況,為進(jìn)一步的負(fù)荷預(yù)測(cè)、改變發(fā)輸電計(jì)劃或是調(diào)整電價(jià)等措施提供。
農(nóng)村配電網(wǎng)負(fù)荷分析是從負(fù)荷數(shù)據(jù)中挖掘負(fù)荷特性信息,數(shù)據(jù)的準(zhǔn)確性直接影響所挖掘信息的有效性與可靠性。由于負(fù)荷數(shù)據(jù)的采集、傳輸和存儲(chǔ)過程中存在一定數(shù)據(jù)缺失,因此需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。
針對(duì)負(fù)荷數(shù)據(jù)存在的數(shù)據(jù)缺失和數(shù)據(jù)噪聲等問題,本文首先剔除整體缺失10%以上的負(fù)荷數(shù)據(jù),其次對(duì)部分缺失數(shù)據(jù)的樣本進(jìn)行滑動(dòng)平均插值處理,最后通過高斯滑動(dòng)平均剔除異常數(shù)據(jù)。
為了方便比較不同量綱特征數(shù)據(jù),同時(shí)考慮到功率倒送,本文采用零均值歸一化。
目前,針對(duì)負(fù)荷分析問題,研究人員提出了多種聚類方法,其中聚類方法的選擇需要根據(jù)數(shù)據(jù)的性質(zhì)和分析目的而選擇。臺(tái)區(qū)負(fù)荷數(shù)據(jù)是一種典型的時(shí)間序列數(shù)據(jù),因此本文選擇一種針對(duì)時(shí)間序列數(shù)據(jù)聚類的K-Shape算法進(jìn)行聚類分析[3]。該方法在許多聚類算法已被用于負(fù)載預(yù)測(cè)問題。確定最佳算法在一定程度上取決于數(shù)據(jù)集的性質(zhì)、目的和挖掘目標(biāo)。在本文中,使用K-Shape聚類算法,有效保存數(shù)據(jù)特征的時(shí)間序列形狀。該方法通過一個(gè)基于形狀的距離度量,實(shí)現(xiàn)高效地分析和比較時(shí)間序列,并根據(jù)形狀的距離度量屬性,計(jì)算聚類質(zhì)心,從而實(shí)現(xiàn)挖掘數(shù)據(jù)體征,實(shí)現(xiàn)對(duì)時(shí)間序列的聚類。
K形聚類算法由三個(gè)主要組件組成:一是基于形狀的距離測(cè)量;二是時(shí)間序列形狀提取和;三是基于形狀的時(shí)間序列聚類。具體如下。
首先計(jì)算形狀距離,該算法針對(duì)時(shí)間序列使用高效計(jì)算方法導(dǎo)出比例、位移均不發(fā)生變化的距離度量。并且,序列和序列的相似性由公式(1)確定。
其產(chǎn)生的值介于0到2之間,0表示時(shí)間序列的完全相似性。
為了準(zhǔn)確提取形狀,該算法將質(zhì)心計(jì)算最優(yōu)設(shè)為函數(shù)目標(biāo),函數(shù)最μ*k優(yōu)定義為序列的平方相似性最大時(shí)對(duì)應(yīng)的聚類中心。優(yōu)化問題形式如下:
其中,Pk是第k個(gè)分區(qū),是第k個(gè)分區(qū)的初始質(zhì)心。為了將序列與參考序列對(duì)齊,該算法使用SBD度量,該度量為每個(gè)序列識(shí)別一個(gè)理想的移位。
該序列聚類操作需要通過SBD距離度量、形狀提取的方式。將序列集X、聚類數(shù)K作為K形聚類算法輸入,并將相關(guān)時(shí)間序列隨機(jī)分給聚類中心。然后,通過算法計(jì)算出質(zhì)心并進(jìn)一步細(xì)化簇的成員關(guān)系。重復(fù)上述操作直到算法收斂或達(dá)到最大迭代次數(shù)。
本文選擇以華東地區(qū)某縣農(nóng)村配電網(wǎng)臺(tái)區(qū)為例進(jìn)行分析。其中,某臺(tái)區(qū)已知含分布式光伏,且分布式光伏占負(fù)荷率大約20%以上,因此本文以此作為含分布式光伏系統(tǒng)的典型臺(tái)區(qū)。該臺(tái)區(qū)在晴空條件下工作日和節(jié)假日負(fù)荷曲線如圖1所示。
通過圖1可知,工作日從早上7點(diǎn)到下午4點(diǎn)之間,功率為負(fù)值,存在倒送現(xiàn)象,最大倒送電流出現(xiàn)在上午12點(diǎn)至下午1點(diǎn)之間,最大倒送負(fù)荷為9.926kW。節(jié)假日最大倒送負(fù)荷出現(xiàn)在上午11點(diǎn)至12點(diǎn)之間,最大倒送負(fù)荷為19.14kW。由于農(nóng)村電網(wǎng)臺(tái)區(qū)負(fù)荷較輕,當(dāng)處于輕負(fù)荷階段,由于光伏發(fā)電的并網(wǎng)接入,負(fù)荷低谷點(diǎn)從正常的凌晨轉(zhuǎn)移到了白天,甚至出現(xiàn)低壓電網(wǎng)倒送功率現(xiàn)象。總體來說,分布式光伏的接入使得農(nóng)村配電網(wǎng)臺(tái)區(qū)出現(xiàn)了負(fù)荷低谷點(diǎn)轉(zhuǎn)移的現(xiàn)象,因此有必要通過聚類分析的方法找出類似的臺(tái)區(qū),從而實(shí)現(xiàn)更有效的配電網(wǎng)管理。
由于分布式光伏接入后臺(tái)區(qū)負(fù)荷出現(xiàn)負(fù)荷低谷轉(zhuǎn)移現(xiàn)象,因此為了對(duì)含分布式光伏臺(tái)區(qū)負(fù)荷數(shù)據(jù)的聚類結(jié)果進(jìn)行類別確定時(shí),本文主要以負(fù)荷特征指標(biāo)分類中的曲線類指標(biāo)為主,對(duì)配電網(wǎng)臺(tái)區(qū)的單日負(fù)荷曲線進(jìn)行分析與分類,對(duì)不同類型單日負(fù)荷曲線所表現(xiàn)的用電行為特征加以分析[4]。
本文針對(duì)收集到的華東地區(qū)某縣農(nóng)村配電網(wǎng)824個(gè)臺(tái)區(qū)為例進(jìn)行典型日分析,每天共96個(gè)采樣點(diǎn)(采樣頻率15min)進(jìn)行試驗(yàn)分析。本文首先采用了K-Shape聚類方法進(jìn)行聚類,此時(shí)的相似性度量函數(shù)選用歐氏距離函數(shù)。通過聚類可以得到五種負(fù)荷模式,如圖2所示。本文參考文獻(xiàn)[5]的分類,對(duì)分布式光伏接入臺(tái)區(qū)負(fù)荷進(jìn)一步劃分。
雙峰雙谷型負(fù)荷曲線,用電時(shí)間多集中于白天,但與單峰型曲線的不同在于出現(xiàn)兩個(gè)用電時(shí)段高峰。圖2所示雙峰型曲線的負(fù)荷主要集中在兩個(gè)時(shí)間段:第一個(gè)時(shí)間段是上午7點(diǎn)開始,另一個(gè)時(shí)間段是晚上5點(diǎn)到6點(diǎn),如圖3所示,此類型的單峰型曲線多出現(xiàn)于第三產(chǎn)業(yè)的餐飲業(yè)和生活服務(wù)類。
雙峰日間單谷型負(fù)荷曲線,由于日間光伏發(fā)電功率較大,因此負(fù)荷出現(xiàn)了典型的低谷轉(zhuǎn)移,從原有的夜間,轉(zhuǎn)移到了白天。
如圖3所示,雙峰型曲線的負(fù)荷主要集中在兩個(gè)時(shí)間段:第一個(gè)時(shí)間段是上午5點(diǎn)到7點(diǎn),另一個(gè)時(shí)間段是晚上6點(diǎn)到8點(diǎn)。此類單峰型曲線多出現(xiàn)于分布式光伏接入的生活居民負(fù)荷,且光伏接入量較大。
雙峰夜間單谷型負(fù)荷曲線,用電時(shí)間多集中于白天,但與單峰型曲線不同在于出現(xiàn)兩個(gè)用電時(shí)段高峰。
如圖4所示,雙峰型曲線的負(fù)荷主要集中在兩個(gè)時(shí)間段:第一個(gè)時(shí)間段是上午10點(diǎn)開始,另一個(gè)時(shí)間段是晚上5點(diǎn)到7點(diǎn),此類型的單峰型曲線多出現(xiàn)于第三產(chǎn)業(yè)的餐飲業(yè)和生活服務(wù)類。
如圖5所示,單峰雙谷型負(fù)荷曲線用電時(shí)間主要集中在白天,晚上后半夜負(fù)荷非常小,同時(shí)由于分布式光伏的接入,在原有單峰型負(fù)荷曲線的基礎(chǔ)上在下午1點(diǎn)至3點(diǎn)出現(xiàn)了第二個(gè)負(fù)荷低谷,負(fù)荷日峰谷差大,負(fù)荷率較低。這類用戶一般是生活居民負(fù)荷,其用電特性體現(xiàn)在白天人們出去上班晚上回家,用電量主要集中在夜晚,晚高峰一般在晚上6點(diǎn)到8點(diǎn)時(shí)間段。
如圖6所示,避峰型曲線的負(fù)荷主要集中在晚上,白天負(fù)荷用電量很低,日最值差比較大,負(fù)荷率較高。這是農(nóng)村灌溉類用電設(shè)備產(chǎn)生的避峰型曲線。
本文提出了一種基于K-Shape聚類的含分布式光伏接入的農(nóng)村配電網(wǎng)臺(tái)區(qū)負(fù)荷分類方法。在對(duì)典型含分布式光伏接入的臺(tái)區(qū)負(fù)荷分析的基礎(chǔ)上,根據(jù)負(fù)荷低谷轉(zhuǎn)移特性,利用K-Shape方法對(duì)臺(tái)區(qū)負(fù)荷進(jìn)行了分類。通過上述方法,可以得到居民用戶接入分布式光伏的臺(tái)區(qū)用電規(guī)律以及負(fù)荷高峰低谷信息,從而為農(nóng)村配電網(wǎng)臺(tái)區(qū)負(fù)荷預(yù)測(cè),分布式光伏管理等提供了數(shù)據(jù)支持。