王寶成
(永城職業(yè)學(xué)院,河南 永城 476600)
鑒于支持向量機(jī)比其他預(yù)測(cè)方法的優(yōu)越性,目前越來(lái)越多的研究人員把支持向量機(jī)應(yīng)用到電力負(fù)荷預(yù)測(cè)當(dāng)中。而實(shí)際上電力負(fù)荷預(yù)測(cè)就是從以往的歷史負(fù)荷數(shù)據(jù)中得出一定的規(guī)律得到一個(gè)模型(數(shù)學(xué)表達(dá)式)利用這個(gè)模型對(duì)未來(lái)數(shù)據(jù)進(jìn)行預(yù)測(cè)。
(1)缺失負(fù)荷數(shù)據(jù)的修補(bǔ)。如果某一天的數(shù)據(jù)出現(xiàn)大量缺失或不良數(shù)據(jù),這一天就可以認(rèn)為是數(shù)據(jù)缺失,對(duì)于缺失數(shù)據(jù)的處理通??梢岳孟噜弾滋斓恼?shù)據(jù)進(jìn)行補(bǔ)遺。由于不同日類型的負(fù)荷數(shù)據(jù)差距較大,因此修補(bǔ)數(shù)據(jù)時(shí)一定要采用相同日期類型的數(shù)據(jù),并采取近大遠(yuǎn)小的權(quán)值進(jìn)行加權(quán)處理:
式中是第d天第t小時(shí)的負(fù)荷值,x(d,t)為與第d天具有相同日期類型且距離該天最近的兩個(gè)t時(shí)刻的負(fù)荷值,wi{i=1,2}為權(quán)值,有w1>w2,w1+w2=1。這里取得是距離該天最近的兩個(gè)相似日的對(duì)應(yīng)負(fù)荷。
(2)數(shù)據(jù)的垂直處理。在歷史負(fù)荷序列中,由于隨機(jī)因素的影響,負(fù)荷會(huì)在一天內(nèi)某段時(shí)間產(chǎn)生同于以往運(yùn)行方式的異常負(fù)荷點(diǎn),我們稱之為異點(diǎn)。這些異點(diǎn)摻入到正常的負(fù)荷序列中,會(huì)使負(fù)荷序列的整體噪聲很大,降低了負(fù)荷曲線的相似性,增加了其不可預(yù)測(cè)性。因此,必須進(jìn)行異點(diǎn)數(shù)據(jù)剔除與負(fù)荷曲線的平滑處理。
(3)數(shù)據(jù)的水平處理。在對(duì)歷史負(fù)荷數(shù)據(jù)進(jìn)行了縱向的垂直過(guò)濾處理過(guò)之后,突變量很大的負(fù)荷點(diǎn)得到了一定的平滑處理。在進(jìn)行分析數(shù)據(jù)時(shí),將前后兩個(gè)小時(shí)的負(fù)荷數(shù)據(jù)作為基準(zhǔn),設(shè)定待處理數(shù)據(jù)的最大變動(dòng)范圍為閥值θ(t),當(dāng)待處理數(shù)據(jù)超過(guò)這個(gè)范圍就視為不良數(shù)據(jù),采用平均值的方法平穩(wěn)其變化。
(4)樣本的特征選擇。對(duì)于樣本集{(x1,y1)},輸出y1為d天t時(shí)刻的負(fù)荷值L(d,t),輸入向量x1應(yīng)包含對(duì)該負(fù)荷值有較大影響的因素,也就是輸入特征。我們就是要從大量特征中選擇影響負(fù)荷值較大的特征。本文做了以下特征的選?。?/p>
日期信息:從前面的電力負(fù)荷特點(diǎn)分析看到負(fù)荷具有按月、周、日周期變化的特點(diǎn)。故在輸入特征中包含這些日期信息能比較好的體現(xiàn)影響負(fù)荷變化的部分因素。
歷史負(fù)荷數(shù)據(jù):比如說(shuō)L為要預(yù)測(cè)的某日某時(shí)的負(fù)荷值,則預(yù)測(cè)日前幾天同一時(shí)刻、前一時(shí)刻和后一時(shí)刻的負(fù)荷,預(yù)測(cè)日前一個(gè)星期同一時(shí)刻、前一時(shí)刻和后一時(shí)刻的負(fù)荷都與預(yù)測(cè)日的負(fù)荷值有很密切的關(guān)系,所以也做為特征輸入。
通過(guò)使用了Chang Chichung和Lin Chihjen在2001年提出了LIBSVM算法,該算法借鑒了其他方法的優(yōu)點(diǎn),給出了一個(gè)工作集的確定方法,相對(duì)普通的優(yōu)化問(wèn)題數(shù)值求解方法占用更少的內(nèi)存,而且在精度和速度上有更大的優(yōu)越性。其主要思想如下:式(3-17)是一個(gè)求解最大值問(wèn)題,對(duì)目標(biāo)函數(shù)求相反數(shù)而保留約束條件,可再次將其轉(zhuǎn)化為求解最小值問(wèn)題,為了簡(jiǎn)便起見(jiàn),將此最小值問(wèn)題歸納為如下形式:
求解問(wèn)題的難點(diǎn)在于本數(shù)較多時(shí),Q陣規(guī)模較大且不是稀疏矩陣,LIBSVM分解算法的主要步驟如下:
(1)用q≤l作為工作集的維數(shù),α1作為問(wèn)題的初值k=1。
(2)如果 αk是(4-21)的最優(yōu)解,停止計(jì)算;否則,確定一個(gè)維數(shù)為q的工作集B ∩{1,...l),定義N={1,...l}B,并定義和分別為αk中對(duì)應(yīng)B和N的子向量。
(3)解變量為αB的下述優(yōu)化問(wèn)題
定義
并選取工作集B={i,j},取B中的元素個(gè)數(shù)為2而不是其它數(shù)值,是因?yàn)檫@樣使之成為典型的二次優(yōu)化問(wèn)題。
SVR具有解析解,相對(duì)普通的優(yōu)化問(wèn)題數(shù)值求解方法有更少的內(nèi)存占用,且在精度和速度上有更大的優(yōu)越性。Chang Chichung和Lin Chihjen在LIBSVM算法的基礎(chǔ)上用C++實(shí)現(xiàn)了一個(gè)LIBSVM庫(kù),可以在MATLAB界面上實(shí)現(xiàn)負(fù)荷預(yù)測(cè)的訓(xùn)練,預(yù)測(cè),是很方便的SVM負(fù)荷預(yù)測(cè)的工。
[1] 方瑞明.支持向量機(jī)理論及其應(yīng)用分析[TP].北京:中國(guó)電力出版社,2007.
[2] 牛東曉.電力負(fù)荷預(yù)測(cè)技術(shù)及其應(yīng)用[M].北京:中國(guó)電力出版社,1998.
[3] 肖國(guó)泉,王春,張福偉.電力負(fù)荷預(yù)測(cè)[M].北京:中國(guó)電力出版社,2001.