戴 蕊
(國網(wǎng)江蘇省電力有限公司揚(yáng)州供電分公司,江蘇 揚(yáng)州 225009)
在電力行業(yè)中,電價(jià)分類數(shù)據(jù)挖掘是一個(gè)重要的研究方向。電價(jià)分類是指將電力市場(chǎng)中的電價(jià)按照一定的規(guī)則劃分為不同的類別或階段,以便對(duì)不同的電價(jià)行為進(jìn)行分析和管理[1-3]。本文研究了數(shù)據(jù)挖掘方法在電價(jià)分類和閾值處理中的應(yīng)用和有效性,并設(shè)計(jì)價(jià)格分類流程。本文提前24 h對(duì)未來電價(jià)進(jìn)行分類,提出了一種新的數(shù)據(jù)模型來形成初始特征集,提出的模型允許遞歸分類實(shí)現(xiàn),包含最新的價(jià)格信息,反過來又提高了分類性能,實(shí)現(xiàn)價(jià)格分類在需求側(cè)管理中的應(yīng)用。
本文中的電價(jià)分類流程如圖1所示。該過程在輸入塊中選擇一組價(jià)格變化的潛在特征。本文的重點(diǎn)是提前24 h對(duì)未來電價(jià)進(jìn)行分類,提出了一個(gè)輸入數(shù)據(jù)模型。該模型允許遞歸多步前分類,并考慮到最新的價(jià)格信息。雖然從大量數(shù)據(jù)初始集開始可以在理論上提高模型捕捉隱藏模式的能力,但在實(shí)踐中,計(jì)算負(fù)擔(dān)和潛在特征之間的冗余會(huì)降低模型的準(zhǔn)確性。因此,本流程采用了特征選擇器模塊,通過該模塊,從初始特征中選擇一組精簡(jiǎn)的特征值。
圖1 采用的電價(jià)分類流程
所選擇的特征值以合理的計(jì)算次數(shù)、最小的冗余合理地捕捉數(shù)據(jù)中的隱藏模式。選擇的特征值,即特征選擇器模塊的輸出被饋送到分類器模塊,在分類器模塊中訓(xùn)練分類,以確定未來電力價(jià)格的“類別”。分類器在無估計(jì)確切電力價(jià)格的情況下確定未來值將在多大范圍內(nèi)下跌。在實(shí)踐中,價(jià)格范圍由用戶根據(jù)其操作需求指定。
考慮到電力市場(chǎng)價(jià)格的高度自相關(guān)性,電力系統(tǒng)的各個(gè)變量,如負(fù)荷、備用裕度、網(wǎng)絡(luò)約束和發(fā)電機(jī)可用性,均可以提供有關(guān)電價(jià)的信息。然而,除了系統(tǒng)負(fù)載之外,其他變量的準(zhǔn)確預(yù)測(cè)通常在實(shí)時(shí)價(jià)格之前不可用。因此,在大多數(shù)點(diǎn)預(yù)測(cè)文獻(xiàn)中,系統(tǒng)負(fù)荷是價(jià)格預(yù)測(cè)模型的唯一外生變量。然而,支持向量機(jī)(Support Vector Machine,SVM)模型中表明,在價(jià)格分類的情況下,需求不如在點(diǎn)價(jià)格預(yù)測(cè)中有用[4-5]。本文將初始特征(輸入)集限制為滯后價(jià)格。
(1)
(2)
因此,在K天的m小時(shí)之前的一整套歷史小時(shí)價(jià)格是:
P=PK,m∪PN
(3)
對(duì)于提前1 h的預(yù)測(cè),所有元素在預(yù)測(cè)起點(diǎn)都可用。
因此,P包括用于預(yù)測(cè)未來價(jià)格的所有有用的價(jià)格信息,并且直接適用于提前1 h的分類問題。然而,在多步預(yù)測(cè)中,如日前預(yù)測(cè),PK,m包括目標(biāo)日內(nèi)選定小時(shí)的價(jià)格,這些價(jià)格在預(yù)測(cè)起點(diǎn)是未知的,因此它無法適用于24 h前的價(jià)格分類。為了進(jìn)一步解釋此點(diǎn),假設(shè)m小時(shí)的價(jià)格取決于m-3小時(shí)的價(jià)格,此外,假設(shè)目標(biāo)是預(yù)測(cè)明天所有小時(shí)的價(jià)格等級(jí)。因此,對(duì)于明天給定的一個(gè)小時(shí),比如10:00,需要7:00的價(jià)格。在數(shù)值預(yù)測(cè)中,模型中使用7:00時(shí)的價(jià)格預(yù)測(cè),并確定10:00時(shí)的價(jià)格預(yù)報(bào)。然而,在本申請(qǐng)中,關(guān)于7:00時(shí)價(jià)格的唯一可用信息是類別預(yù)測(cè),而不是數(shù)值。
(4)
考慮3個(gè)價(jià)格類別,即低于500元/MW·h的價(jià)格,將被標(biāo)記為e1,價(jià)格在500元/MW·h到700元/MW·h之間,標(biāo)記為e2,價(jià)格在700元/MW·h以上的標(biāo)記為e3。
將本文模型獲得的結(jié)果與基于神經(jīng)網(wǎng)絡(luò)的點(diǎn)位價(jià)格預(yù)測(cè)模型獲得的效果進(jìn)行了比較。本節(jié)的神經(jīng)網(wǎng)絡(luò)模型是一個(gè)回歸模型,并生成數(shù)值價(jià)格預(yù)測(cè)。然而,目前較多使用的多層感知器(Multi-Layer Perceptron,MLP)模型是一個(gè)只生成價(jià)格類的分類器。為了進(jìn)行精確的比較,在點(diǎn)預(yù)測(cè)方法中采用了與本文方法相同的特征選擇程序,采用前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Network,FFNN)來獲得相同測(cè)試周期的積分價(jià)格預(yù)測(cè)。完全公平調(diào)度(Completely Fair Schedule,CFS)算法最初設(shè)計(jì)用于查找一組輸入特征和離散輸出(即類)之間的相關(guān)性。在本節(jié)中,為了精確地進(jìn)行比較,本節(jié)向FFNN提供了每個(gè)特征選擇方法尋找對(duì)預(yù)測(cè)未來價(jià)格類別有用的特征。本節(jié)使用選定特征的數(shù)值,而非離散值,然后通過對(duì)預(yù)測(cè)數(shù)據(jù)取閾值來獲得相應(yīng)的分類精度。神經(jīng)網(wǎng)絡(luò)有包含10個(gè)神經(jīng)元的隱藏層,其傳遞函數(shù)被選為雙曲正切S形傳遞函數(shù),此外,應(yīng)用萊文伯格反向傳播訓(xùn)練方法來迅速地找到解。
表1顯示了基于神經(jīng)網(wǎng)絡(luò)的點(diǎn)預(yù)測(cè)模型的混淆矩陣,將這些結(jié)果與傳統(tǒng)模型算法結(jié)果比較,可得本文所提模型比其單一點(diǎn)預(yù)測(cè)模型要準(zhǔn)確得多。本文所提出的方法顯著地降低了預(yù)測(cè)的類的誤差,尤其對(duì)于較高的價(jià)格和較高經(jīng)濟(jì)影響的價(jià)格飆升現(xiàn)象,作用明顯。
表1 基于神經(jīng)網(wǎng)絡(luò)的點(diǎn)預(yù)測(cè)方法的混淆矩陣
將本文模型的精度與前人研究中提出的基于SVM的模型準(zhǔn)確性進(jìn)行了比較。SVM中的數(shù)值結(jié)果是2個(gè)區(qū)域市場(chǎng)的價(jià)格得出的,為了進(jìn)行準(zhǔn)確的比較,生成了與SVM中相同時(shí)間段的結(jié)果。對(duì)于這組模擬,在形成輸入數(shù)據(jù)集時(shí)使用了20個(gè)歷史日。表2給出了基于本文算法的2個(gè)市場(chǎng)的最佳結(jié)果。SVM的最準(zhǔn)確結(jié)果也報(bào)告在表2中,以供參考。從該表中可以看出,對(duì)于2個(gè)地區(qū)市場(chǎng),本文所提出的模型平均分別優(yōu)于SVM的模型3.02個(gè)和2.73個(gè)百分點(diǎn)。按月計(jì)算,在12個(gè)月中的10~11個(gè)月內(nèi),本文所提出的模型在2個(gè)區(qū)域的價(jià)格方面優(yōu)于SVM中的模型。本文還使用標(biāo)準(zhǔn)方差分析對(duì)表2的結(jié)果進(jìn)行了假設(shè)檢驗(yàn),測(cè)試結(jié)果證實(shí),使用本文所提方法獲得的月平均精度明顯高于SVM獲得的精度。
表2 2個(gè)測(cè)試區(qū)MPCE(%)比較
與SVM法相比,本文模型實(shí)現(xiàn)的精度提高可歸因于所提出的數(shù)據(jù)模型。SVM的模型利用了前幾天的可用信息,即它只考慮將PN作為輸入數(shù)據(jù),然而,在本工作中,當(dāng)天信息,即PK,m,也被添加到數(shù)據(jù)中。
當(dāng)在(4)中對(duì)數(shù)據(jù)進(jìn)行離散化以適應(yīng)價(jià)格分類離散性質(zhì)時(shí),價(jià)格輸入已被證明在提高分類準(zhǔn)確性方面有益。與SVM的模型相比,本文研究了所提模型執(zhí)行不足的月份,在這幾個(gè)月里,都有幾天的每日價(jià)格極不穩(wěn)定,高波動(dòng)性使當(dāng)前信息對(duì)所提模型的價(jià)值降低,從而導(dǎo)致更高的誤差。對(duì)于這2個(gè)市場(chǎng),CFS特征選擇方法與貝葉斯(By)分類器相結(jié)合產(chǎn)生了最準(zhǔn)確的結(jié)果,這與表2中報(bào)告的結(jié)果一致。
不同的電力市場(chǎng)價(jià)格的每日、每周和季節(jié)性波動(dòng)會(huì)有所不同。然而,隱藏在不同價(jià)格時(shí)間序列中的內(nèi)在一般模式被認(rèn)為是相似的,主要是因?yàn)閮r(jià)格是由類似的電力需求模式驅(qū)動(dòng)的。實(shí)驗(yàn)數(shù)值結(jié)果表明,本文提出的算法提高了分類準(zhǔn)確性?;谀J阶R(shí)別的分類流程的性能明顯優(yōu)于基于函數(shù)逼近的方法,研究結(jié)果亦適用于需求管理的個(gè)案研究。電價(jià)分類數(shù)據(jù)挖掘在需求側(cè)管理中具有重要的應(yīng)用價(jià)值。通過對(duì)電價(jià)行為進(jìn)行分類、預(yù)測(cè)和關(guān)聯(lián)分析,人們可以更好地管理電力市場(chǎng)。