楊方圓 ,包 丹,張明理,鄧鑫陽(yáng),張 娜
(1.國(guó)網(wǎng)遼寧省電力有限公司經(jīng)濟(jì)技術(shù)研究院,遼寧 沈陽(yáng) 110010;2.國(guó)家電網(wǎng)公司東北分部,遼寧 沈陽(yáng) 110180)
日負(fù)荷曲線是電力公司調(diào)度部門制訂調(diào)度計(jì)劃,安排發(fā)電機(jī)組開(kāi)停機(jī)組合、經(jīng)濟(jì)分配發(fā)電機(jī)組的有功出力及決定系統(tǒng)調(diào)峰容量的基礎(chǔ)。因此,研究如何實(shí)現(xiàn)日負(fù)荷曲線的精準(zhǔn)預(yù)測(cè)對(duì)提高電力系統(tǒng)經(jīng)濟(jì)效益有著重要的意義。
目前,傳統(tǒng)的短期負(fù)荷預(yù)測(cè)分析方法已不能滿足電力供需[1-10]精準(zhǔn)預(yù)測(cè)的要求,急需提高電力需求方法的預(yù)測(cè)精度。文獻(xiàn)[11]提出基于負(fù)荷混沌特性和最小二乘向量機(jī)的短期負(fù)荷預(yù)測(cè)模型,通過(guò)相空間重構(gòu)與訓(xùn)練決策函數(shù),避免了傳統(tǒng)人工網(wǎng)絡(luò)法容易陷入局部極值的問(wèn)題。文獻(xiàn)[12]提出了基于聯(lián)合灰色模型和最小支持向量機(jī)回歸的電力短期負(fù)荷智能組合方法,通過(guò)機(jī)器學(xué)習(xí)確定所選單一模型的權(quán)重因子,克服了傳統(tǒng)組合模型中設(shè)定權(quán)重因子的困難。文獻(xiàn)[13]通過(guò)對(duì)模型關(guān)鍵參數(shù)的自適應(yīng)動(dòng)態(tài)尋優(yōu),避免了最小支持向量機(jī)對(duì)設(shè)計(jì)者經(jīng)驗(yàn)的過(guò)度依賴以及選擇模型參數(shù)時(shí)缺少科學(xué)依據(jù)的局限性。
本文建立基于K-means聚類算法與支持向量機(jī)的短期負(fù)荷預(yù)測(cè)模型。支持向量機(jī)的計(jì)算結(jié)果通常取決于少數(shù)的幾個(gè)關(guān)鍵樣本,采用聚類算法篩選出與待測(cè)日最相似的樣本訓(xùn)練集,在不影響支持向量機(jī)泛化能力的先決條件下有效地降低算法的復(fù)雜程度,預(yù)測(cè)結(jié)果具有較高的精度。采用以上方法對(duì)遼寧電網(wǎng)迎峰度夏期間的日負(fù)荷曲線進(jìn)行預(yù)測(cè),算例結(jié)果證明了該方法的有效性。
Κ-means聚類算法的基本原理:首先選取聚類數(shù)目k以及任意確定k個(gè)初始類簇中心點(diǎn),計(jì)算每一個(gè)樣本點(diǎn)與k個(gè)初始類簇中心點(diǎn)之間的歐式距離,按最小歐氏距離的原則對(duì)所有樣本類型進(jìn)行分類。反復(fù)計(jì)算類簇中心點(diǎn),不斷調(diào)整樣本的分類,直至各樣本到所屬類簇中心點(diǎn)之間的距離平方和達(dá)到最小。
Κ-means聚類算法具有化繁為簡(jiǎn)、快速高效的優(yōu)點(diǎn),適合于巨量數(shù)據(jù)的聚類分析。該算法的缺陷是聚類數(shù)目k具有不確定性,如果聚類的數(shù)目設(shè)定不合理,將難以獲得優(yōu)良的聚類效果。
聚類的目標(biāo)是通過(guò)選取最優(yōu)的聚類數(shù)目k,使得所有樣本的聚類生成簇實(shí)現(xiàn)最優(yōu)良的效果。通常情況下,希望獲得類內(nèi)成員緊密、類間成員遠(yuǎn)離的最佳聚類結(jié)構(gòu)。為了獲得最優(yōu)的聚類數(shù)目k,通常采用聚類有效性指標(biāo)來(lái)度量聚類算法生成簇的結(jié)果。目前,已有文獻(xiàn)中的聚類有效性指標(biāo)難以獲得準(zhǔn)確的最優(yōu)聚類數(shù),本文針對(duì)該問(wèn)題設(shè)計(jì)了一種基于調(diào)整余弦相似度的新的Κ-means聚類算法有效性指標(biāo),該指標(biāo)可以對(duì)聚類算法劃分結(jié)果的質(zhì)量進(jìn)行評(píng)價(jià),從而獲得最優(yōu)聚類的數(shù)目k。
定義1:令待聚類的樣本數(shù)據(jù)空間為X={x1,x2,…,xn},假設(shè)n個(gè)樣本對(duì)象聚類為m類,定義第j類的第i個(gè)樣本與類間樣本的最小調(diào)整余弦相似度平均值為ic(j,i),即:
(1)
定義2:令待聚類的樣本數(shù)據(jù)空間為X={x1,x2,…,xn},假設(shè)n個(gè)樣本對(duì)象聚類為m類,定義第j類的第i個(gè)樣本與類內(nèi)樣本的調(diào)整余弦相似度平均值為為ac(j,i),即:
(2)
定義3:令待聚類的樣本數(shù)據(jù)空間為X={x1,x2,…,xn},假設(shè)n個(gè)樣本對(duì)象聚類為m類,定義第j類的第i個(gè)樣本的聚類有效性指標(biāo)為最小類間調(diào)整余弦相似度平均值與類內(nèi)夾角調(diào)整余弦相似度平均值之和、最小類間調(diào)整余弦相似度平均值與類內(nèi)調(diào)整余弦相似度平均值之差的比值IACR(j,i),見(jiàn)式(3)。
(3)
IACR指標(biāo)可以反映出數(shù)據(jù)集內(nèi)某個(gè)樣本的聚類效果。本文通過(guò)計(jì)算聚類空間內(nèi)所有樣本的IACR(j,i)指標(biāo)的平均值來(lái)研究數(shù)據(jù)集的聚類質(zhì)量,計(jì)算方法如式(4)所示。希望聚類生成簇后獲得類內(nèi)成員盡可能緊密、類間成員盡可能分散的最優(yōu)聚類結(jié)構(gòu),如式(5)所示,當(dāng)IACR取最大值時(shí)對(duì)應(yīng)的聚類數(shù)目為最優(yōu)聚類數(shù)目。
(4)
(5)
該算法是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的通用學(xué)習(xí)方法[14],適合于解決非線性空間的小樣本問(wèn)題。支持向量機(jī)通常通過(guò)目標(biāo)極小值優(yōu)化模型來(lái)確定回歸函數(shù):
(6)
(7)
通過(guò)求解式(7)可以得到回歸函數(shù):
(8)
選取日負(fù)荷曲線相似日的流程如圖1所示。
短期負(fù)荷預(yù)測(cè)存在一定規(guī)律,即相同日類型的負(fù)荷具有相似性??紤]到工作日與節(jié)假日的負(fù)荷特性存在差異,將日類型分為工作日與節(jié)假日兩類。為準(zhǔn)確反映出氣象因素對(duì)負(fù)荷的影響,選取每天的整點(diǎn)氣溫、濕度、風(fēng)速作為日特征向量。本文對(duì)日類型進(jìn)行初步篩選后,將日特征向量作為聚類分析的樣本。
結(jié)合遼寧電網(wǎng)的日負(fù)荷曲線歷史數(shù)據(jù)及氣象局提供的氣象特征參數(shù)歷史數(shù)據(jù),采用聚類分析與支持向量機(jī)結(jié)合的算法對(duì)日負(fù)荷曲線進(jìn)行預(yù)測(cè)。通過(guò)聚類算法選取相似日,充分考慮溫度、濕度、風(fēng)速和日類型等參數(shù)的影響,利用支持向量機(jī)對(duì)遼寧電網(wǎng)的日負(fù)荷曲線進(jìn)行預(yù)測(cè)。
以遼寧省的氣象數(shù)據(jù)為自變量,遼寧電網(wǎng)24 h負(fù)荷值為因變量,對(duì)2017年6月1日—8月17日的氣象歷史數(shù)據(jù)及預(yù)測(cè)日的氣象特征參數(shù)值進(jìn)行聚類分析,確定最佳聚類數(shù)目,相似聚類效果如圖2所示。利用本文所介紹的方法對(duì)遼寧電網(wǎng)2017年8月18日負(fù)荷曲線進(jìn)行預(yù)測(cè),預(yù)測(cè)值與真實(shí)值的比較結(jié)果如圖3所示。
圖2 相似日聚類結(jié)果
圖3 預(yù)測(cè)日負(fù)荷的真實(shí)值與預(yù)測(cè)值比較
為了驗(yàn)證本文方法的適用性與有效性,將傳統(tǒng)支持向量機(jī)與本文方法的預(yù)測(cè)效果進(jìn)行比較,計(jì)算得到遼寧電網(wǎng)迎峰度夏期間的負(fù)荷預(yù)測(cè)結(jié)果如表1所示。采用本文方法計(jì)算得到2017年8月18—27日的負(fù)荷預(yù)測(cè)值,預(yù)測(cè)結(jié)果的平均相對(duì)誤差均低于3%,均方根誤差均低于3.5%。根據(jù)表2可知,采用本文的算法訓(xùn)練樣本的數(shù)目明顯減少,當(dāng)聚類數(shù)目為6,篩選后的支持向量機(jī)訓(xùn)練樣本為384個(gè),所需的訓(xùn)練時(shí)間為傳統(tǒng)支持向量機(jī)算法的1/5。與傳統(tǒng)的支持向量機(jī)算法相比,本文提出的方法復(fù)雜程度明顯減弱,在迎峰度夏期間日負(fù)荷曲線的預(yù)測(cè)精度平均提高1.6%,實(shí)現(xiàn)良好的預(yù)測(cè)效果。
表1 負(fù)荷預(yù)測(cè)誤差比較
表2 本文算法與傳統(tǒng)支持向量機(jī)算法訓(xùn)練速度的對(duì)比
本文提出一種相似日聚類算法與支持向量機(jī)算法結(jié)合的迎峰度夏期間負(fù)荷預(yù)測(cè)方法。此方法融合聚類算法與支持向量機(jī)兩者的優(yōu)勢(shì),實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ)。利用遼寧電網(wǎng)迎峰度夏期間的日負(fù)荷曲線進(jìn)行建模驗(yàn)證,采用本文方法得到的日負(fù)荷曲線預(yù)測(cè)值,平均相對(duì)誤差在3%以內(nèi),樣本訓(xùn)練的時(shí)間也大幅減少。該算例證明了本文預(yù)測(cè)方法的適用性與有效性。