肖 峻,耿 芳,杜柏均,于 波
(1. 天津大學(xué)電力系統(tǒng)仿真控制教育部重點實驗室,天津 300072;2. 天津市電力公司城西供電分公司,天津 300072)
基于關(guān)聯(lián)規(guī)則的城市電力負(fù)荷預(yù)測模型智能推薦
肖 峻1,耿 芳2,杜柏均1,于 波1
(1. 天津大學(xué)電力系統(tǒng)仿真控制教育部重點實驗室,天津 300072;2. 天津市電力公司城西供電分公司,天津 300072)
提出了一種基于關(guān)聯(lián)規(guī)則的電力負(fù)荷預(yù)測模型智能推薦方法,解決了面對眾多預(yù)測模型使決策者難以選擇的問題.該方法首先建立預(yù)測模型與相關(guān)因素歷史數(shù)據(jù)庫,在此基礎(chǔ)上進行關(guān)聯(lián)規(guī)則挖掘,然后結(jié)合給定預(yù)測地區(qū)的相關(guān)因素條件,利用案例推理技術(shù)在挖掘出的規(guī)則中進行條件匹配,最終得出給定條件下各負(fù)荷預(yù)測模型對預(yù)測地區(qū)的適應(yīng)情況并完成模型自動推薦.該方法充分利用國內(nèi)42個城市預(yù)測案例積累的數(shù)據(jù),通過數(shù)據(jù)挖掘并分析結(jié)果可以看出特定預(yù)測模型適用度與哪些相關(guān)因素有關(guān),運用這些規(guī)則,得到合理的模型推薦結(jié)果.基于關(guān)聯(lián)規(guī)則的適合模型推薦方法,不僅能自動分析模型適用度與各相關(guān)因素的內(nèi)在聯(lián)系,也能在一定程度上體現(xiàn)預(yù)測者對模型的偏好.通過我國某地區(qū)的負(fù)荷預(yù)測為例,說明了算法的正確性和可行性.
關(guān)聯(lián)規(guī)則;負(fù)荷預(yù)測;模型;智能推薦
負(fù)荷預(yù)測是電網(wǎng)規(guī)劃的基礎(chǔ)工作,負(fù)荷預(yù)測的準(zhǔn)確性直接影響電網(wǎng)規(guī)劃質(zhì)量.當(dāng)前負(fù)荷預(yù)測更多采用計算機輔助決策系統(tǒng),其核心就是利用一系列的負(fù)荷預(yù)測模型,根據(jù)已知數(shù)據(jù)進行中長期電力負(fù)荷預(yù)測[1].這些模型不僅包括各種單一模型[1],還有為提高預(yù)測精度的多種綜合模型[2].當(dāng)前國內(nèi)開發(fā)的中長期負(fù)荷預(yù)測軟件[3-5]中已經(jīng)集成了大量負(fù)荷預(yù)測模型,常用的方式是盡量多地采用不同的模型預(yù)測,然后將各模型計算進行比較,最后經(jīng)專家干預(yù)得到最終結(jié)果.隨著模型的增多,預(yù)測者面臨的問題是模型選擇的困難,哪種模型更適合當(dāng)前地區(qū)的負(fù)荷發(fā)展?fàn)顩r,實際工作中應(yīng)選擇哪些模型進行預(yù)測很難抉擇.因此,研究負(fù)荷預(yù)測適合模型自動推薦的方法非常必要.
現(xiàn)有的適合模型推薦主要利用擬合精度的方法[6-7],即比較預(yù)測數(shù)據(jù)與歷史數(shù)據(jù)的擬合精度,選擇精度滿足一定條件的模型.這種單純依靠與歷史數(shù)據(jù)的擬合精度來選擇模型的方式是遠遠不夠的.實際上,負(fù)荷發(fā)展規(guī)律是與本地區(qū)負(fù)荷特點與發(fā)展水平、產(chǎn)業(yè)結(jié)構(gòu)、經(jīng)濟水平、氣候條件等因素[8]密切相關(guān)的,而模型的選擇與這些因素也密不可分.例如,已經(jīng)趨向飽和的市中心負(fù)荷預(yù)測不適合采取那些快速增長的模型,而適合采用具有飽和特點的模型.此外,預(yù)測模型的選擇還與預(yù)測者的偏好及本地習(xí)慣有關(guān).因此,本文提出一種基于關(guān)聯(lián)規(guī)則的城市負(fù)荷預(yù)測適合模型自動推薦方法.首先,積累大量城市的負(fù)荷歷史數(shù)據(jù)(如電量、負(fù)荷、分類電量和分類負(fù)荷等)和相關(guān)因素歷史數(shù)據(jù)(如氣候、城市類型、產(chǎn)業(yè)比重等)以及以往規(guī)劃中采用負(fù)荷預(yù)測模型的情況.其次,對各模型在各城市的預(yù)測結(jié)果進行適用性評估.然后,在此基礎(chǔ)上建立城市負(fù)荷發(fā)展數(shù)據(jù)庫,并通過數(shù)據(jù)挖掘分析相關(guān)因素與模型適用性之間關(guān)系,這些關(guān)系也能包含實際預(yù)測人員的偏好與習(xí)慣.最后,當(dāng)有新的預(yù)測任務(wù)時,采用規(guī)則推理(rule-based reasoning,RBR)或案例推理(case-based reasoning,CBR)進行匹配,推薦出適合的模型.
關(guān)聯(lián)規(guī)則分析的數(shù)據(jù)挖掘在電力市場營銷、故障分析等研究中已有不少應(yīng)用[9-10],在電力負(fù)荷預(yù)測與分析中也有應(yīng)用[8],但用于負(fù)荷預(yù)測適合模型推薦方面還鮮見報道.本文首先介紹關(guān)聯(lián)規(guī)則分析基本原理,再將其應(yīng)用到對由城市負(fù)荷關(guān)聯(lián)因素建立的數(shù)據(jù)庫分析中,從而得到影響負(fù)荷的關(guān)聯(lián)因素與負(fù)荷模型之間的關(guān)聯(lián)關(guān)系.
在關(guān)聯(lián)規(guī)則系統(tǒng)中,規(guī)則本身是“如果條件怎么樣,那么結(jié)果或情況就如何”的簡單形式,可以表示為“AB?”關(guān)聯(lián)規(guī)則.
對于規(guī)則“A?B”,一般用支持度、可信度、期望可信度和作用度4個參數(shù)來描述一個關(guān)聯(lián)規(guī)則屬性.
設(shè)I={I1,I2,…,Im}是一組屬性的全集,D是數(shù)據(jù)庫.D中的每條記錄T是一組屬性,T∈I.關(guān)聯(lián)規(guī)則是如下形式的一種蘊含:
1)支持度
支持度描述了A和B這2個屬性集的并集C在所有事務(wù)中出現(xiàn)的概率有多大.
2)可信度
可信度就是指在出現(xiàn)了屬性集A的事務(wù)T中,屬性集B也同時出現(xiàn)的概率有多大.
3)期望可信度
期望可信度描述了在沒有任何條件影響時,屬性集B在所有事務(wù)中出現(xiàn)的概率有多大.
4)作用度
可信度與期望可信度的比值為作用度.
為了發(fā)現(xiàn)有意義的關(guān)聯(lián)規(guī)則,需要給定2個閾值:最小支持度和最小可信度.前者用來描述關(guān)聯(lián)規(guī)則的頻繁性,如果規(guī)則的支持度大于最小支持度則認(rèn)為此規(guī)則是頻繁項集,否則為非頻繁項集.同時滿足最小支持度與最小可信度且作用度大于1的規(guī)則稱為強關(guān)聯(lián)規(guī)則.關(guān)聯(lián)規(guī)則挖掘的目的就是從數(shù)據(jù)庫中挖掘出滿足用戶要求的最小支持度與最小可信度的強關(guān)聯(lián)規(guī)則.
2.1 關(guān)聯(lián)因素選取
影響城市電力負(fù)荷的相關(guān)因素有很多,目前得到的一些相關(guān)因素如表1所示.通過實際規(guī)劃數(shù)據(jù)獲得相關(guān)因素信息,通常有地區(qū)歷史負(fù)荷數(shù)據(jù)、人口、產(chǎn)業(yè)比重、GDP發(fā)展水平、氣候因素、預(yù)測年限、城市中心性以及城市職能等.選取相關(guān)因素時,要保證相關(guān)因素的連續(xù)性,不能出現(xiàn)間斷,必要時要對相關(guān)因素進行補充.對于不同已有方案給定相關(guān)因素有所不同,但作為規(guī)劃資料總有一些共性.為便于分析,在實際相關(guān)因素分析時通常采取的相關(guān)因素為人口數(shù)量、GDP發(fā)展水平、產(chǎn)業(yè)比重、溫度、預(yù)測年限.
表1 城市負(fù)荷關(guān)聯(lián)因素Tab.1 Correlative factors in urban power load
2.2 模型適用性評價
除上述選取的關(guān)聯(lián)因素數(shù)據(jù)之外,建立預(yù)測模型數(shù)據(jù)庫的另一部分?jǐn)?shù)據(jù)是各模型使用情況.規(guī)劃中實際使用的模型是專家根據(jù)當(dāng)時預(yù)測地區(qū)特點選擇的結(jié)果,并已反映了專家的偏好,這些選擇結(jié)果可以作為適合模型選擇的候選項.但是并非所有過去用過的模型在新的預(yù)測任務(wù)中都具有很好的預(yù)測效果,并且不能排除當(dāng)時未采用過的模型.因此,在構(gòu)建預(yù)測模型數(shù)據(jù)庫時有必要進行模型適用性評價.
模型適用性評價首先從模型本身的要求出發(fā),如某些模型必須要依靠相關(guān)因素才能進行預(yù)測,某些模型只適用于地區(qū)負(fù)荷已發(fā)生飽和的情況,這是模型的要求,根據(jù)預(yù)測地區(qū)現(xiàn)有條件能夠直觀地進行判斷.其次,進一步采用傳統(tǒng)的擬合精度方法.利用各模型對預(yù)測地區(qū)歷史數(shù)據(jù)進行負(fù)荷預(yù)測,得到的各模型預(yù)測結(jié)果與已經(jīng)發(fā)生的負(fù)荷變化趨勢進行擬合,用實際發(fā)生的負(fù)荷對預(yù)測結(jié)果進行校驗.再篩選出擬合精度較高的模型作為選用的預(yù)測模型,綜合以上過程即完成了模型的適用性評價,得到更為準(zhǔn)確的模型應(yīng)用結(jié)論.本文中,將各模型對預(yù)測地區(qū)的適用程度進行定量劃分,作為一種相關(guān)因素進行考慮.根據(jù)前述預(yù)測精度和專家干預(yù)結(jié)果,設(shè)置模型適用程度取值為0~1之間,其中0表示模型不適用于給定條件下的預(yù)測,1表示給定條件下模型適用,而設(shè)置大于0小于1的數(shù)字表示模型對該地區(qū)的適用度,可參考實際的擬合精度和經(jīng)驗進行設(shè)置.
綜上,建立關(guān)聯(lián)因素預(yù)測模型原始數(shù)據(jù)庫,部分庫模式見表2,表2中的橫向記錄和縱向記錄均可以擴充.在此基礎(chǔ)上進行相關(guān)因素與模型使用情況的關(guān)聯(lián)規(guī)則挖掘,從而得到目標(biāo)規(guī)則庫.
表2 城市負(fù)荷關(guān)聯(lián)因素預(yù)測模型歷史數(shù)據(jù)庫Tab.2 History database for forecasting models of urban power load using correlative factors
3.1 總體流程
進行適合模型推薦,首先要建立歷史數(shù)據(jù)庫,其中包含各相關(guān)因素數(shù)據(jù)和經(jīng)過模型適用性評價后的模型適用情況,以一個模型為目標(biāo)結(jié)合所有歷史相關(guān)因素進行數(shù)據(jù)概化;然后進行相關(guān)因素與模型適用情況的關(guān)聯(lián)規(guī)則挖掘,得到符合條件的關(guān)聯(lián)規(guī)則;最終針對目標(biāo)模型進行規(guī)則匹配,將給定的條件放于歷史數(shù)據(jù)庫中,在與歷史數(shù)據(jù)相同的參考標(biāo)準(zhǔn)下進行給定條件數(shù)據(jù)概化,將已知分級數(shù)據(jù)與挖掘出的規(guī)則進行規(guī)則匹配,能夠得到目標(biāo)模型的適用結(jié)論.其中數(shù)據(jù)概化、規(guī)則挖掘和規(guī)則匹配在實際中均是以一種模型為目標(biāo)進行研究,根據(jù)歷史數(shù)據(jù)庫對于其他模型進行相同的研究過程即可得到各個模型在給定條件下的適用情況.總體流程如圖1所示.
圖1 總體流程Fig.1 Flow chart of the whole process
3.2 數(shù)據(jù)分析和概化
通過查閱資料,不需量化的相關(guān)因素已經(jīng)有一定的劃分依據(jù);定量數(shù)據(jù)分析和數(shù)據(jù)概化主要采用kmeans聚類算法,不需要外界設(shè)定聚類中心,但需要設(shè)定聚類中心個數(shù).本文算法設(shè)定聚類中心個數(shù)為5,根據(jù)歷史數(shù)據(jù)動態(tài)計算各聚類中心,從而可將已有數(shù)據(jù)進行等級劃分,得到概化后的數(shù)據(jù)庫,即關(guān)聯(lián)規(guī)則挖掘算法直接作用的數(shù)據(jù)庫.庫中各相關(guān)因素都采用不同字母表示,如表3所示.
3.3 關(guān)聯(lián)規(guī)則挖掘
關(guān)聯(lián)規(guī)則挖掘是針對概化后的數(shù)據(jù),實質(zhì)上是找出負(fù)荷預(yù)測模型與城市相關(guān)因素數(shù)據(jù)適用程度的關(guān)系,并形成滿足最小支持度和最小可信度且其作用度大于1的關(guān)聯(lián)規(guī)則庫.其核心計算采用的是FPGrowth算法,基本思想是將歷史數(shù)據(jù)庫中的數(shù)據(jù)高度壓縮到一棵樹中,被壓縮的數(shù)據(jù)仍然保存著原有的信息,然后用模式增長的方法生成頻繁項集,進而產(chǎn)生關(guān)聯(lián)規(guī)則.FP-Growth算法可以分為2個階段:第1個階段是搜索所有的頻繁項集,并形成一棵樹;第2個階段是根據(jù)設(shè)定的最小支持度和最小可信度生成需要的關(guān)聯(lián)規(guī)則.目前閾值設(shè)定有2種方法:一種是在規(guī)則形成的每一層設(shè)定不同閾值,另一種是整個算法設(shè)定唯一值.此處為簡便起見,設(shè)定唯一的閾值標(biāo)準(zhǔn).由于所有規(guī)則本身都存在支持度、可信度的上限和下限,這是用戶進行設(shè)定的直接依據(jù).若想得到較多的規(guī)則,則主要參考規(guī)則中支持度和可信度的下限,反之則參考上限.其中第1階段是算法的核心.
最終得到的關(guān)聯(lián)規(guī)則形如R0_E2:T4,表示對應(yīng)相關(guān)因素為R0和E2的條件時,目標(biāo)模型適用情況為T4.相關(guān)因素用符號“_”連接,并用冒號與模型是否應(yīng)用的結(jié)論相隔,這為后續(xù)的模型匹配挖掘出最終模型使用情況奠定了基礎(chǔ).
表3 城市負(fù)荷關(guān)聯(lián)因素預(yù)測模型數(shù)據(jù)庫Tab.3 History database after data staging for forecasting models of urban load using correlative factors
3.4 規(guī)則匹配
對于新的預(yù)測任務(wù),將其已知數(shù)據(jù)按照歷史數(shù)據(jù)庫中各聚類中心進行數(shù)據(jù)概化,得到各相關(guān)因素劃分等級后的結(jié)論.如分別為R1和P4時表示為R1_P4,這樣該地區(qū)的相關(guān)因素現(xiàn)狀水平能夠獲得,并將此作為已知條件與上述數(shù)據(jù)挖掘得到的關(guān)聯(lián)規(guī)則庫中規(guī)則進行匹配.利用CBR原理,得出模型使用情況的結(jié)論.CBR是一種相似或類比的推理方法,它是通過訪問知識庫中過去同類問題的求解從而獲得當(dāng)前問題解決方案的一種推理模式,即利用舊的事例或經(jīng)驗來解決新問題,評價新問題,解釋異常情況或理解新情況.本文的適合模型推薦有效地利用了這一方法.
規(guī)則匹配有以下3種情況.
(1)若規(guī)則庫中只有一條相匹配的結(jié)論,則將此匹配條件對應(yīng)的模型應(yīng)用情況推薦出來.
(2)若規(guī)則庫中含有多條與已知條件相同的匹配條件,則按照支持度和關(guān)聯(lián)度由高至低排序,直接將支持度最高的規(guī)則作為最終結(jié)論.
(3)若規(guī)則庫中未含有與已知條件相匹配的相關(guān)條件,則直接給出提示“當(dāng)前歷史方案庫中無此匹配條件”.此時可以嘗試用其他機制來獲取推薦模型,如擬合機制等.匹配流程如圖2所示.
圖2 CBR規(guī)則匹配流程Fig.2 Flow chart of rules matching with CBR
選用中國多個城市電網(wǎng)規(guī)劃文本數(shù)據(jù)作為案例,應(yīng)用本文方法對我國某地區(qū)的負(fù)荷預(yù)測進行適合模型推薦.以多項式模型的關(guān)聯(lián)規(guī)則分析為例,其他模型的分析可采用相同步驟得到.
4.1 歷史案例數(shù)據(jù)庫建立
本文選取的城市具有一定的代表性,有的城市位于沿海,有的位于內(nèi)陸;有的城市是經(jīng)濟發(fā)展中心,有的城市以農(nóng)業(yè)生產(chǎn)為主;有的城市是省會級,有的是地縣級.?dāng)?shù)據(jù)庫中總的歷史數(shù)據(jù)來自國內(nèi)42個城市地區(qū),為簡化算例,選取相關(guān)因素為城市人口數(shù)量、GDP發(fā)展水平、第二產(chǎn)業(yè)比重,并將預(yù)測模型應(yīng)用程度也作為相關(guān)因素考慮.進行模型適用性評價后,初步形成歷史數(shù)據(jù)庫如表4所示.
由表4可以看出,對于研究的目標(biāo)模型(多項式模型)在給定的已知條件下,只有方案9所對應(yīng)地區(qū)未采用目標(biāo)模型,適用度為0,其余方案對應(yīng)地區(qū)都采用了目標(biāo)模型,但對多項式模型的依賴程度不同,方案6~8是完全應(yīng)用目標(biāo)模型,設(shè)置定量數(shù)據(jù)為1,方案1~3對模型的依賴程度為0.75,其余方案的依賴程度設(shè)定為0.25.這些原始數(shù)據(jù)用來作為后續(xù)關(guān)聯(lián)規(guī)則挖掘的基礎(chǔ).
4.2 數(shù)據(jù)聚類分析和概化
對原始數(shù)據(jù)進行數(shù)據(jù)概化之后即將原始數(shù)據(jù)劃分為一定的等級,并用不同的字母表示,對于表4中的數(shù)據(jù)進行數(shù)據(jù)概化之后得到關(guān)聯(lián)規(guī)則挖掘直接作用的數(shù)據(jù)庫,部分?jǐn)?shù)據(jù)如表5所示.
表4 城市負(fù)荷關(guān)聯(lián)因素模型推薦歷史數(shù)據(jù)庫Tab.4 History database for demonstration for models of Tab.4 urban load using correlative factors
表5 數(shù)據(jù)概化后的原始數(shù)據(jù)庫Tab.5 Original database after data staging for demonstra-Tab.5 tion
4.3 關(guān)聯(lián)規(guī)則庫建立
以數(shù)據(jù)概化后數(shù)據(jù)為目標(biāo)進行關(guān)聯(lián)規(guī)則挖掘.此時設(shè)最小可信度為0.1,最小支持度為0.02,加之滿足作用度大于1的條件下,可以得到132條有效的強關(guān)聯(lián)規(guī)則,如表6所示.
表6 關(guān)聯(lián)規(guī)則庫Tab.6 Database for correlation rules
4.3.1 單因素規(guī)則分析
通過對得到的132條強關(guān)聯(lián)規(guī)則進行分析,可以得到第二產(chǎn)業(yè)比重、人口、GDP與多項式模型適用程度的關(guān)系.下面以GDP生產(chǎn)水平與多項式模型應(yīng)用情況的關(guān)系為例進行說明.
經(jīng)過挖掘分析,得到GDP生產(chǎn)水平與多項式模型關(guān)聯(lián)規(guī)則.
(1)規(guī)則1——R0∶T3.
(2)規(guī)則2——R1∶T2.
(3)規(guī)則3——R2∶T0,支持度0.009 9,可信度1.000 0.
(4)規(guī)則4——R3∶T0,支持度0.009 9,可信度1.000 0.
(5)規(guī)則5—— R4∶T0,支持度0.003 3,可信度1.000 0.
由規(guī)則1和規(guī)則2可知當(dāng)GDP生產(chǎn)水平較低時,多項式模型適用.為了進一步驗證,規(guī)則3、4、5是降低支持度后得到的潛在規(guī)則,隨著GDP水平增高,多項式模型總是處于最低的適用程度,即多項式模型更適于在GDP較低的城市進行預(yù)測.
綜合各單因素分析結(jié)果可以初步看出,GDP和模型的應(yīng)用有著強相關(guān)關(guān)系,在不需要濾除一些規(guī)則的情況下就有明顯的規(guī)律.而第二產(chǎn)業(yè)比重、人口與多項式模型之間的相關(guān)關(guān)系,由于原始數(shù)據(jù)中的人口和第二產(chǎn)業(yè)比重數(shù)據(jù),或多或少的有根據(jù)外來資料補充,必然會導(dǎo)致規(guī)則的細微偏差,需要濾除個別規(guī)則才能得到.
4.3.2 多因素規(guī)則分析
以人口和GDP與多項式模型應(yīng)用情況的關(guān)系為例,經(jīng)過挖掘分析,得到人口和GDP與多項式模型關(guān)聯(lián)規(guī)則.
(1)規(guī)則1——R0_P0∶T3,支持度0.132 0,可信度0.263 2.
(2)規(guī)則2——R1_P0∶T2,支持度0.036 3,可信度0.611 1.
(3)規(guī)則3——R1_P3∶T2,支持度0.023 1,可信度1.000 0.
綜上所述,由規(guī)則1、2可知人口不變的情況下,GDP的變化使多項式模型的適用度改變;由規(guī)則2、3可知,在GDP水平一定的條件下,人口的變化不會導(dǎo)致多項式模型適用程度的變化.GDP和人口2個相關(guān)因素中,GDP對多模型的適用度起主導(dǎo)作用,其中也暗含了單一因素的規(guī)則,GDP水平越高,多項式模型的適用程度越低.
綜上分析第二產(chǎn)業(yè)比重、人口、GDP與多項式模型適用程度的關(guān)系可以得到,第二產(chǎn)業(yè)比重在決定多項式模型是否適用的過程中起關(guān)鍵作用,GDP次之,人口的決定作用最?。囗検侥P瓦m用于GDP較低、人口較少、第二產(chǎn)業(yè)比例較大的城市.
4.4 關(guān)聯(lián)規(guī)則匹配與模型推薦結(jié)果
以上僅是對多項式模型的分析,當(dāng)前負(fù)荷預(yù)測算法達30余種,對每種預(yù)測模型,改變數(shù)據(jù)庫中模型適用度,重復(fù)上述數(shù)據(jù)概化和關(guān)聯(lián)規(guī)則挖掘過程,可以得到每種模型對應(yīng)的關(guān)聯(lián)規(guī)則.對多項式模型,得到關(guān)聯(lián)規(guī)則為E2_P1_R1∶T0.
將本算例中該地區(qū)的已知相關(guān)因素放于歷史數(shù)據(jù)庫中參與數(shù)據(jù)概化,得到概化條件為E2_P1_R1.用該條件在各模型關(guān)聯(lián)規(guī)則結(jié)果中進行匹配,得到該地區(qū)各模型的適用度.本算例部分結(jié)果如表7所示.
表7 算例模型推薦結(jié)果Tab.7 Results of case models for demonstration
結(jié)合電力行業(yè)的特殊性,將關(guān)聯(lián)規(guī)則應(yīng)用于負(fù)荷預(yù)測模型的選取分析中,提出了運用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則對電力負(fù)荷預(yù)測模型進行分析的基本思路和具體的解決方案.在實際預(yù)測工作中,人工可以大致判斷是否采用某模型.本文方法優(yōu)點在于不依賴于單個專家,能夠綜合大量專家的經(jīng)驗,并且通過大量預(yù)測數(shù)據(jù)的積累和數(shù)據(jù)挖掘,發(fā)現(xiàn)人直觀不易發(fā)現(xiàn)的規(guī)則.
構(gòu)造了以城市電力負(fù)荷模型適應(yīng)情況及影響電力負(fù)荷相關(guān)因素為主題的歷史方案庫;通過分析大量城市的實際規(guī)劃數(shù)據(jù),得出具有啟發(fā)性的關(guān)聯(lián)規(guī)則,減少了人工工作量;構(gòu)建理想數(shù)據(jù)進行預(yù)埋規(guī)則挖掘,驗證本文方法的有效性和正確性.
[1] 劉晨暉. 電力系統(tǒng)負(fù)荷預(yù)報理論與方法[M]. 哈爾濱:哈爾濱工業(yè)大學(xué)出版社,1987. Liu Chenhui. Theory and Method of Power System Load Forecasting[M]. Harbin:Harbin Institute of TechnologyPress,1987 (in Chinese).
[2] 謝敬東,唐國慶,徐高飛,等. 組合預(yù)測方法在電力負(fù)荷預(yù)測中的應(yīng)用[J]. 中國電力,1998,31(6):3-5. Xie Jingdong,Tang Guoqing,Xu Gaofei,et al. The application of the combined forecasting method in the power load forecast[J]. Electric Power,1998,31(6):3-5 (in Chinese).
[3] 黃 偉,費維剛,王炳革,等. 電力系統(tǒng)中長期負(fù)荷預(yù)測軟件包的實現(xiàn)[J]. 現(xiàn)代電力,1999,16(1):52-56. Huang Wei,F(xiàn)ei Weigang,Wang Bingge,et al. Implement of power system mid-long term load forecasting software package[J]. Modern Electric Power,1999,16(1):52-56 (in Chinese).
[4] 虞 瑄,程浩忠,游仕洪,等. 中長期電力負(fù)荷預(yù)測軟件包的開發(fā)與應(yīng)用[J]. 電力系統(tǒng)及其自動化學(xué)報,2004,16(2):9-12,57. Yu Xuan,Cheng Haozhong,You Shihong,et al. Development and application of power system mid-long term load forecasting software package[J]. Proceedings of the EPSA,2004,16(2):9-12,57(in Chinese) .
[5] 余貽鑫,王成山,肖 峻,等. 城網(wǎng)規(guī)劃計算機輔助決策系統(tǒng)[J].電力系統(tǒng)自動化,2000,24(15):59-62. Yu Yixin,Wang Chengshan,Xiao Jun,et al. Computer decision-making support system for urban power distribution network planning[J]. Automation of Electric Power Systems,2000,24(15):59-62(in Chinese).
[6] 朱成騏,孫宏斌,張伯明. 基于最大信息熵原理的短期負(fù)荷預(yù)測綜合模型[J]. 中國電機工程學(xué)報,2005,25(19):1-6. Zhu Chengqi,Sun Hongbin,Zhang Boming. A combined model for short term load forecasting based on maximum entropy principle[J]. Proceedings of the CSEE,2005,25(19):1-6(in Chinese).
[7] 高 峰,康重慶,夏 清,等. 負(fù)荷預(yù)測中多模型的自動篩選方法[J]. 電力系統(tǒng)自動化,2004,28(6):11-13. Gao Feng,Kang Chongqing,Xia Qing,et al. Multi-model automatic sifting methodology in load forecasting[J]. Automation of Electric Power Systems,2004,28(6):11-13(in Chinese).
[8] 肖 峻,張 晶. 基于關(guān)聯(lián)分析的城市用電負(fù)荷研究[J]. 電力系統(tǒng)自動化,2007,31(17):103-107. Xiao Jun,Zhang Jing. Analysis of urban power load based on association rules[J]. Automation of Electric Power Systems,2007,31(17):103-107(in Chinese).
[9] 鮑 文,于達仁,王 偉,等.基于關(guān)聯(lián)規(guī)則的火電廠傳感器故障檢測[J]. 中國電機工程學(xué)報,2003,23(12):170-174. Bao Wen,Yu Daren,Wang Wei,et al. Sensor fault detection in thermal power plants based on association rule[J]. Proceedings of the CSEE,2003,23(12):170-174(in Chinese).
[10] 侯雪波,田 斌,葛少云,等. 關(guān)聯(lián)規(guī)則技術(shù)在電力市場營銷分析中的應(yīng)用[J]. 電力系統(tǒng)及其自動化學(xué)報,2005,17(2):67-72. Hou Xuebo,Tian Bin,Ge Shaoyun,et al. Application of association rules techniques in electric marketing analysis[J]. Proceedings of the EPSA,2005,17(2):67-72(in Chinese).
Intelligent Recommendation of Urban Power Load Forecasting Models Based on Association Rules
XIAO Jun1,GENG Fang2,DU Bo-jun1,YU Bo1
(1. Key Laboratory of Power System Simulation and Control of Ministry of Education,Tianjin University,Tianjin 300072,China;2. Chengxi Power Supply Company,Tianjin Electric Power Corporation,Tianjin 300072,China)
A method based on association rules for intelligent recommendation of power load forecasting models is presented in this paper,which helps decision-makers in the choice of a forecasting model among many. In this method,a history database which included the forecasting models and correlative factors was first built,with which the association rules mining was conducted. Then according to the relevant factors in the designated area,factors matching of the rules mined was carried out with CBR technique and automatic recommendation of the models was achieved with the matching results of various load forecasting models with the area under the given conditions. The proposed method has taken full advantage of the abundant data accumulated of 42 cities in China,and through data mining and analysis,determines the relevant factors to suitability of certain forecasting models,on which basis rational model recommendation result can be obtained. The recommendation method of suitable models based on association rules can not only automatically analyze the suitability of models and the intrinsic relationship between relevant factors but also show,to some extent,the forecaster′s preferences on the model. Load forecasting case of a certain area in China has verified the proposed algorithm′s validity and feasibility.
association rule;power load forecasting;model;intelligent recommendation
TM715
A
0493-2137(2010)12-1079-07
2009-09-17;
2010-05-06.
國家重點基礎(chǔ)研究發(fā)展計劃(973計劃)資助項目(2009CB219700).
肖 峻(1971— ),男,博士,副教授,xiaojun@tju.edu.cn.
杜柏均,duduniao4604@sina.com.