湯小華
(廣東電網(wǎng)公司肇慶供電局,廣東 肇慶 526060)
傳統(tǒng)的時間序列法發(fā)展較早、應(yīng)用廣、相對成熟,其主要原理是利用了電力負(fù)荷的慣性特征及時間上的延續(xù)性,通過對歷史數(shù)據(jù)時間序列的處理,確定其基本的特征和變化規(guī)律,以對未來的負(fù)荷進行預(yù)報,該預(yù)測方法的模型主要包括自回歸模型、動平均模型、自回歸動平均模型和非平穩(wěn)序列模型。傳統(tǒng)的時間序列預(yù)測方法圍繞電力負(fù)荷這一隨機變量建立數(shù)學(xué)模型,未能考慮其他方面的綜合影響,存在預(yù)測誤差較大的缺陷,隨著電力系統(tǒng)對負(fù)荷預(yù)測要求的越來越高,該方法的不足也越來越明顯。
聚類分析是一種能有效地發(fā)現(xiàn)具有價值的離群序列的數(shù)據(jù)挖掘技術(shù),聚類分析一般由兩個過程組成:相似性度量及選擇聚類算法,故聚類可看成是時間序列法負(fù)荷預(yù)測讀取數(shù)據(jù)的預(yù)處理過程,對負(fù)荷序列進行聚類,一方面可發(fā)現(xiàn)感興趣的聚類結(jié)構(gòu),進行相關(guān)分析,另一方面,可為深入研究提供更有針對性的數(shù)據(jù)集,該方法已在多個領(lǐng)域被廣泛應(yīng)用。
在電力領(lǐng)域內(nèi),節(jié)假日、高溫等樣本量很小的特殊情況不適合混合在所有的負(fù)荷模式中分析,否則易被當(dāng)作噪聲或壞數(shù)據(jù)而影響預(yù)測精度。而若將這些相似的離群序列作為樣本,進行聚類分析,發(fā)掘它們的共性,得到相對應(yīng)的負(fù)荷模式,即可對特殊情況下的電力負(fù)荷趨勢進行預(yù)測,提高預(yù)測精度。
基于聚類分析的時間序列預(yù)測方法存在兩個數(shù)據(jù)分析形式:分類和預(yù)測。分類是指把電力負(fù)荷劃分到不同的類中,不同的類提供精簡的數(shù)據(jù)集,以該數(shù)據(jù)集研究樣本的特征,減少預(yù)測使用的數(shù)據(jù)量,從而提高了計算效率。預(yù)測則是指從不同數(shù)據(jù)集中提取重要數(shù)據(jù)類模型并進行未來的數(shù)據(jù)趨勢的預(yù)測。分類為預(yù)測提供數(shù)據(jù)基礎(chǔ)及分類規(guī)則;而預(yù)測則是對時間序列歷史的和當(dāng)前的數(shù)據(jù)建立函數(shù)模型,去推測未來的發(fā)展趨勢?;诰垲惡蜁r間序列的電力負(fù)荷預(yù)測可以分為兩種。
表1 部分時間序列法預(yù)測值和聚類時間序列法預(yù)測值及其誤差對比
(1)簡單電力負(fù)荷預(yù)測
根據(jù)過去的負(fù)荷統(tǒng)計數(shù)據(jù),找到其隨時間變化的規(guī)律,建立時序模型,以推斷未來負(fù)荷數(shù)值的方法。首先把時間序列通過分段、相似性度量、矢量形態(tài)聚類后用一系列符號表示,即時間序列轉(zhuǎn)化為靜態(tài)的模式組合,然后使用普通的數(shù)據(jù)挖掘工具進行知識發(fā)現(xiàn),該預(yù)測形式類似于傳統(tǒng)的時間序列的電力負(fù)荷預(yù)測模型。
(2)多因素電力負(fù)荷預(yù)測
時間序列的變化不僅和歷史數(shù)據(jù)有關(guān),還受眾多其它因素的影響。多因素預(yù)測方法根據(jù)對歷史數(shù)據(jù)的分類,尋找影響因素與時間序列之間的因果關(guān)系,建立相關(guān)分析模型,然后通過對歷史數(shù)據(jù)及最新數(shù)據(jù)的統(tǒng)計分析,確定其合理性后,進 行趨勢預(yù)測。
以下對電力負(fù)荷預(yù)測算法流程進行說明,如上圖1所示。預(yù)測算法首先進行電力負(fù)荷的聚類分析,該階段是本算法的重點和難點,它決定了整個系統(tǒng)中最重要的知識獲取和知識支持主體;然后采用自回歸動平均模型的時間序列法,利用AIC準(zhǔn)則確定其模型的階數(shù),該部分需結(jié)合聚類分析的數(shù)據(jù)集及分類規(guī)則進行建模;最后通過相應(yīng)的誤差判斷準(zhǔn)則進行結(jié)果的預(yù)測。如果聚類分析及建立的模型不合理,則需要重新對數(shù)據(jù)進行聚類分析,再進行結(jié)果的預(yù)測。該算法可以針對電力負(fù)荷數(shù)據(jù)常受氣溫、節(jié)假日等因素影響這一特點進行聚類分析,再應(yīng)用時間序列對未來電力負(fù)荷進行預(yù)測,具有較高的準(zhǔn)確性。
本文采用某市2010年7月5日至7月25日的電力實際負(fù)荷數(shù)據(jù),該數(shù)據(jù)為每十五分鐘采樣一點,一天共96個采樣點。選取7月5日至25日連續(xù)21天的實際負(fù)荷數(shù)據(jù),利用聚類后的電力負(fù)荷預(yù)測時間序列法,采用Matlab軟件工具,對接下來24個小時(即7月26日)的負(fù)荷進行預(yù)測。下表列舉了傳統(tǒng)時間序列法預(yù)測值、聚類時間序列法預(yù)測值及其誤差值(表中僅為部分點數(shù)的數(shù)據(jù))。
傳統(tǒng)時間序列法預(yù)測結(jié)果、聚類時間序列法預(yù)測結(jié)果與真實負(fù)荷數(shù)據(jù)對比曲線如下圖2所示。
圖2紅線代表了聚類時間序列法的預(yù)測值,棕色線代表傳統(tǒng)時間序列法的預(yù)測值,藍線代表了負(fù)荷的實際值。從傳統(tǒng)時間序列法預(yù)測結(jié)果與聚類時間序列法預(yù)測結(jié)果兩者與真實負(fù)荷數(shù)據(jù)的曲線圖可以看出,聚類時間序列法的預(yù)測曲線與真實負(fù)荷曲線具有較高重合率。經(jīng)過計算,傳統(tǒng)時間序列負(fù)荷預(yù)測的誤差絕對值的平均值為6.069%,聚類時間序列負(fù)荷預(yù)測的誤差絕對值的平均值為2.48%,聚類時間序列法預(yù)測的負(fù)荷誤差明顯比傳統(tǒng)時間序列法預(yù)測的負(fù)荷的誤差較小,即聚類時間序列法預(yù)測精度較高。
本文指出了傳統(tǒng)時間序列預(yù)測方法的缺陷,闡述了時間序列法及聚類分析的預(yù)測原理,提出了基于聚類時間序列的電力負(fù)荷預(yù)測方法,即先通過聚類后,再進行時間序列法的預(yù)測。針對某市的電力負(fù)荷情況,在Matlab中進行仿真,求得聚類時間序列法的預(yù)測結(jié)果,并與真實數(shù)據(jù)進行對比。結(jié)果表明,基于聚類時間序列的電力負(fù)荷預(yù)測方法,能考慮其他因素對電力的影響,有效提高電力負(fù)荷預(yù)測的精度。
[1]劉晨暉.電力系統(tǒng)負(fù)荷預(yù)報理論與方法[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,1987,23-56.
[2]李艷紅,雷金輝.電力負(fù)荷時間序列預(yù)測的應(yīng)用與研究[J].科學(xué)技術(shù)與工程,2011,11(04):860-864.
[3]王秋梅.時間序列法負(fù)荷預(yù)測的原理和應(yīng)用[J].華東電力,1993(04):37-39.
[4]鄒森.時間序列自適應(yīng)短期負(fù)荷預(yù)測[J].山東工業(yè)大學(xué)學(xué)報,1988,18(02):43-49.
[5]王駿,王士同,鄧趙紅.聚類分析研究中的若干問題[J].控制與決策,2012,27(03):322-327.
[6]鞠平,馬大強.電力系統(tǒng)負(fù)荷建模[M].北京:中國電力出版社,2008:53-69.
[7]張穎,高中文.基于時間序列和神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)負(fù)荷預(yù)測[J].哈爾濱理工大學(xué)學(xué)報,2003,08(01). 30-36.
[8]張德豐.MATLAB程序設(shè)計與典型應(yīng)用[M].北京:電子工業(yè)出版社,2009:135-204.