彭勇,黃夢蘭,姜祖明,魏華勇,劉煜
(國網(wǎng)河南省電力公司信陽供電公司,河南信陽 464000)
功率斜坡的準(zhǔn)確估算對風(fēng)力發(fā)電站極其重要。由于風(fēng)速的間歇性變化,風(fēng)力發(fā)電站的功率水平也會隨之產(chǎn)生隨機(jī)性變化。功率水平的即時波動性變化被定義為斜坡事件,即功率斜坡率(變化率)(PRR)是指功率水平的瞬時變化,由電力產(chǎn)生的一階導(dǎo)數(shù)異常識別的功率生產(chǎn)梯度表示。電力上漲和下降分別稱為正負(fù)斜坡問題,負(fù)斜坡影響電力系統(tǒng)的安全性,其會造成意外事故。同時,影響儲備電力市場的財務(wù)后果[1-2]。發(fā)電站發(fā)電量總是正值或是零值,但由于電力方向的改變,PRR可能是負(fù)值和正值。PRR的絕對值越高,功率激增(下降)越快。
功率斜坡率相關(guān)的應(yīng)用程序通過使用可用的歷史數(shù)據(jù),如SCADA和氣象桅桿數(shù)據(jù)來創(chuàng)建預(yù)測模型。在這些海量數(shù)據(jù)中,可通過數(shù)據(jù)挖掘方法來發(fā)現(xiàn)并解決問題。網(wǎng)格服務(wù)基礎(chǔ)設(shè)施,始終是數(shù)據(jù)挖掘方法的實現(xiàn)之一[3]。在功率斜坡事件的分析中,存在具有物理參數(shù),空間參數(shù)和時間參數(shù)的數(shù)據(jù)。本文將重點研究采用其中高頻率出現(xiàn)的大數(shù)據(jù)集來幫助數(shù)據(jù)挖掘形成相關(guān)預(yù)測規(guī)則,進(jìn)而為操作室的決策制定提供參考。為了理解產(chǎn)生功率斜坡間的關(guān)系,文獻(xiàn)[4~5]根據(jù)空間和時間效應(yīng)研究了每個渦輪機(jī)的位置,這將在本文中進(jìn)一步擴(kuò)展為具有物理和時間參數(shù)的相關(guān)預(yù)測規(guī)則,這些規(guī)則將被應(yīng)用到電力系統(tǒng)運行室的決策過程中。
文獻(xiàn)[6]針對時間物理參數(shù)空間研究,證明了從歷史SCADA數(shù)據(jù)中獲取的一些大氣物理參數(shù)對于產(chǎn)生電力斜坡比其他大氣物理參數(shù)更重要。在該文中,作者為控制室操作員推導(dǎo)出輔助關(guān)鍵集??刂剖也僮鲉T面臨與功率斜坡相關(guān)的2個主要問題,首先是當(dāng)風(fēng)電出現(xiàn)意外沖擊時,由于風(fēng)速呈現(xiàn)正的上升趨勢,在短時間內(nèi)出現(xiàn)意外沖擊,可能導(dǎo)致電網(wǎng)不平衡,操作員必須平衡負(fù)荷,降低其他發(fā)電站的風(fēng)電產(chǎn)量;其次是,對于負(fù)斜坡情況,操作員應(yīng)有足夠的備用電力。在文獻(xiàn)[7]的研究中,采用Apriori算法對中國河西走廊地區(qū)風(fēng)速預(yù)測值提出相應(yīng)的修正方案。在這項研究中,影響風(fēng)速預(yù)測的氣象變量,如溫度、壓力和濕度,按照這些參數(shù)之間的規(guī)則進(jìn)行聚類。進(jìn)而發(fā)現(xiàn)每個小組的聚類方法,以減少其預(yù)測誤差。
聚類算法旨在優(yōu)化目標(biāo)函數(shù)F函數(shù)值隨C1,C2,C3,...,Ck定義的聚類數(shù)k的分割而變化
式中:Qk(Ω)是K非空聚類中數(shù)據(jù)Ω=ω1,ω2,ω3,...,ωm的所有分區(qū)的集合。
K-均值算法通過聚類準(zhǔn)則F創(chuàng)建一個求解局部最優(yōu)值的解決方案,該聚類準(zhǔn)則取決于每個元素與其最近的聚類中心(質(zhì)心)之間的距離之和[8-9]??梢杂靡韵鹿奖硎?,式中:K是聚類數(shù)量;Ki是聚類i的對象數(shù)量國;ωij是第i個聚類的第j個對象;-ωi是每個聚類的質(zhì)心。聚類算法優(yōu)化目標(biāo)函數(shù)F函數(shù)值隨C1,C2,C3,...,Ck定義的聚類數(shù)k的分割而變化
Qk(Ω)是K-非空聚類中所有數(shù)據(jù)分區(qū)Ω=ω1,ω2,ω3,...,ωm的集合。F的目標(biāo)函數(shù)可擴(kuò)展為[10]
傳統(tǒng)的K-均值算法偽碼[11]可以概括如下:
1)聚類方法需要實現(xiàn)最佳聚類大小的決策。聚類大小代表有意義的分區(qū),不會丟失大聚類中的信息或創(chuàng)建過多的小聚類。當(dāng)下已有多種方法來解決這一問題,其中之一是熵計算[12];第二種方法是在文獻(xiàn)[12]中討論的指標(biāo)計算和優(yōu)化。在該研究中,采用R程序中的nbclust包,基于文獻(xiàn)[12]中所提的幾個指標(biāo)來執(zhí)行該優(yōu)化任務(wù);
2)通過Forgy算法[11]執(zhí)行數(shù)據(jù)庫的初始化分區(qū)(C1,C2,...,Ck);
3)計算每個聚類的質(zhì)心;
4)重新分配ωi到最近的聚類質(zhì)心;
6)重新進(jìn)行一次完整的迭代,直到?jīng)]有進(jìn)一步的聚類成員變化則停止。
下面介紹Apriori算法,其將對每個渦輪機(jī)的聚類數(shù)結(jié)果的輸出進(jìn)行處理,以生成用于運營決策的關(guān)聯(lián)規(guī)則。
為了說明Apriori算法的3層過程,定義一個數(shù)組表示下面的矩陣。其中,矩陣每一行的單個條目是一組二進(jìn)制特征,t表示時間步長,l表示渦輪機(jī)編號,k表示聚類標(biāo)簽。因此,在本例中總是有15個項目,式中項目集合15由I表示。
Pt,1...15的每一行條目均是一個轉(zhuǎn)換,表明轉(zhuǎn)換個數(shù)和時間步驟一樣多。每行轉(zhuǎn)換包含渦輪機(jī)在每個時間步驟的每個二進(jìn)制形式的斜坡K均值聚類標(biāo)簽的分析。每一行條目表示新的轉(zhuǎn)換將具有諸如X和Y的項目的子集,2個項目子集的大小均<15,且X,Y?I,X?Y=?。因此,可定義具有定向規(guī)則的關(guān)聯(lián)規(guī)則,即X→Y。關(guān)聯(lián)規(guī)則是根據(jù)每個原始行條目在每個轉(zhuǎn)換中定義的,每個原始行條目將定義一個新的關(guān)聯(lián)規(guī)則。但這將會創(chuàng)建多個關(guān)聯(lián)規(guī)則,因此需要對關(guān)聯(lián)進(jìn)行更多的過濾。
支持是一種用戶定義的限制,用于過濾那些候選關(guān)聯(lián)規(guī)則的不相關(guān)事件,這些事件對于決策的重要性相對較小。這個功能將由函數(shù)supp(·)來定義,該函數(shù)統(tǒng)計了關(guān)聯(lián)規(guī)則發(fā)生的頻率。在關(guān)聯(lián)規(guī)則中,表示該關(guān)聯(lián)規(guī)則在所有行中發(fā)生的次數(shù)或大小。在數(shù)學(xué)上,項目集X規(guī)則的支持?jǐn)?shù)σ(X→Y)可表示為[13-14]
式中:符號|·|表示一個集合中元素的個數(shù)。若將轉(zhuǎn)換總數(shù)或時間步長定義為N,則X→Y的支持可以定義為
置信度用來定義一個候選的關(guān)聯(lián)規(guī)則的支持比例,即用supp(X→Y)除以一個子集的支持supp(X),其表達(dá)為
置信度和支持之間的區(qū)別是,置信度是衡量關(guān)聯(lián)規(guī)則的強(qiáng)度,而支持則象征其統(tǒng)計意義。
升力是由函數(shù)lift(·)所表示的另一個標(biāo)準(zhǔn)。當(dāng)有多個關(guān)聯(lián)規(guī)則時,這用于加強(qiáng)過濾器
生成項目組后,計數(shù)階段將識別每個項目組類別中項目組的頻率。對于理想的X和Y之間的關(guān)系,支持必須較大,且置信度必須高,更大的升力值則意味著項目之間具有更強(qiáng)的關(guān)聯(lián)。根據(jù)候選規(guī)則在計數(shù)中出現(xiàn)的次數(shù),其支持值是通過候選規(guī)則的重復(fù)次數(shù)與觀察組之間的比率來計算的。在最后一步,每個候選規(guī)則將與其自身的支持值進(jìn)行比較,然后與預(yù)先定義的支持值閾值進(jìn)行比較,若超過這個門檻的候選規(guī)則將被選中。
這里討論的數(shù)據(jù)挖掘和發(fā)現(xiàn)規(guī)則查找方法,依賴于輸入轉(zhuǎn)換數(shù)據(jù)類型的性質(zhì)。轉(zhuǎn)換是以下行為的數(shù)據(jù)形式:即不能將其分解為代表數(shù)據(jù)庫(DB)中所顯示的任何更改的較小部分,且每個轉(zhuǎn)換均是一組二進(jìn)制值項目。在關(guān)聯(lián)規(guī)則處理中,輸入數(shù)據(jù)是具有時間維度的轉(zhuǎn)換數(shù)據(jù),該時間維度是該數(shù)據(jù)的轉(zhuǎn)換計數(shù)。也可以使用不同的對象,例如物理變量、空間或時間維度?;谵D(zhuǎn)換數(shù)據(jù),關(guān)聯(lián)規(guī)則處理,尤其是采用Apriori算法,通過多次迭代計算數(shù)據(jù)庫中轉(zhuǎn)換的頻繁對象組。
本文研究福建平潭的是一座風(fēng)力發(fā)電場,在80m處有5臺VESTASV90-3.0MW風(fēng)機(jī)。如圖2所示,該風(fēng)電場的主要風(fēng)向是從北到南,該風(fēng)電場5臺風(fēng)機(jī)的發(fā)電量每10 min記錄一次。文中采用其2013年電力生產(chǎn)值來進(jìn)行PRR分析,而數(shù)據(jù)按需要進(jìn)行單位換算。
根據(jù)該風(fēng)電場功率記錄計算得出的功率爬坡率(PRR)值,是文獻(xiàn)[15]中離散功率導(dǎo)數(shù)的比率
該PRR值作為K-均值算法的輸入。
圖1 平潭風(fēng)力發(fā)電廠細(xì)節(jié)信息Fig.1 Detailed information of Pingtan Wind Power Plant
采用R程序的NbClust包來分析優(yōu)化的聚類數(shù)[12]。通過分析,將最大聚類大小定義為3,聚類結(jié)果如圖2所示。圖2(a)顯示了,數(shù)據(jù)協(xié)方差矩陣的2個主要主成分軸上時間尺度的聚類結(jié)果。這里主成分分析(PCA)結(jié)果僅用于定義聚類數(shù)據(jù)二維可視化的2個主要方向,聚類分析通過理論部分定義的K-均值算法來執(zhí)行。在PCA和K-均值之間的關(guān)系與相似性也已在算法層面被利用,同時使用PCA進(jìn)行K-均值模型的優(yōu)化[16]。在圖2(a)中使用了PCA的主要方向,即dc1和dc2,可視化結(jié)果清楚地顯示了聚類PRR的時間數(shù)據(jù)圍繞3個聚類。
圖2 聚類結(jié)果Fig.2 Clustering results
圖3給出了Apriori算法關(guān)聯(lián)規(guī)則的結(jié)果。
圖3 一些關(guān)聯(lián)規(guī)則Fig.3 Some of the association rules
圖3(b)總結(jié)了X→Y之間的某些規(guī)則。根據(jù)圖3(b)中定義的置信度,最有力的規(guī)則是規(guī)則1:X→Y:{PRR2=2,PRR4=2}→{PRR5=2}。這種關(guān)系也在圖3(a)中的視覺輔助中被證明。例如X={PRR2=2,PRR4=2},其是左上角的第一個條目,從左到右的索引2(PRR2=2+2)表示在第一個條目2中。這表明對于LHS的不同關(guān)聯(lián)規(guī)則而言,出現(xiàn)次數(shù)是2次。括號中的第一項是PRR2=2,表示第二個渦輪斜坡是PRR2,聚類標(biāo)號等于PRR2=2,最后一項表示還有一個類似于第一個的項目。在表示RHS的行是Y的情況下,可看到對于X→Y,Y={PRR5=2}。將圖 3(b)關(guān)聯(lián)到圖 3(a),其他規(guī)則也可以觀察到同樣的關(guān)系。
本文基于數(shù)據(jù)挖掘的聚類和關(guān)聯(lián)規(guī)則算法,生成了一套針對電力斜坡的運行規(guī)則。首先,根據(jù)風(fēng)電場數(shù)據(jù)的功率斜坡率將風(fēng)力渦輪機(jī)分組,這是通過使用K-均值聚類規(guī)則來實現(xiàn)的。再將Apriori算法引入這些聚類關(guān)聯(lián)規(guī)則后,發(fā)電場運營商可以實施新的運營決策規(guī)則,本文所提出的方法可以應(yīng)用于一般情況。未來的研究中,還可通過聚類算法與機(jī)器學(xué)習(xí)應(yīng)用的結(jié)合,發(fā)現(xiàn)這些風(fēng)電場大數(shù)據(jù)的復(fù)雜數(shù)據(jù)參數(shù)之間的隱藏規(guī)則,從而用于風(fēng)電場的運營決策。
參考文獻(xiàn)
[1]姜晨,高亮.基于負(fù)序功率方向比較與聚類算法的改進(jìn)繼電保護(hù)算法研究[J].電力系統(tǒng)保護(hù)與控制,2016,44(8):92-98.JIANG Chen,GAO Liang.Research on improved relay protection algorithm based on negative sequence power direction comparison and clustering algorithm[J].Power System Protection and Control,2016,44(8):92-98.
[2]楊甲甲,趙俊華,文福拴,等.智能電網(wǎng)環(huán)境下基于大數(shù)據(jù)挖掘的居民負(fù)荷設(shè)備識別與負(fù)荷建模[J].電力建設(shè),2016,37(12):11-23.YANG Jiajia,ZHAO Junhua,WEN Fushuan,et al.Data mining residents load equipment identification and load modeling under smart grid environment[J].Electric Power Construction,2016,37(12):11-23.
[3]陸惠斌,徐勇,伍宇翔,等.基于換相技術(shù)的三相不平衡治理裝置研究[J].電力電容器與無功補(bǔ)償,2016,37(6):64-69.LU Huibin,XU Yong,WU Yuxiang,et al.Three phase unbalanced control device based on commutation technolo?gy research[J].Power Capacitor and Reactive Power Com?pensation,2016,37(6):64-69.
[4]盧偉國,方慧敏,楊異迪,等.Boost PFC變換器的動態(tài)斜坡補(bǔ)償策略分析與設(shè)計[J].電力自動化設(shè)備,2017,37(5):1-6.LU Weiguo,F(xiàn)ANG Huimin,YANG Yidi,et al.Analysis and design of Boost PFC converter dynamic slope compen?sation strategy[J].Power Automation Equipment,2017,37(5):1-6.
[5]蘇舟,李燦,姚李孝,等.電力負(fù)荷數(shù)據(jù)預(yù)處理研究及應(yīng)用[J].電網(wǎng)與清潔能源,2017,33(5):40-43.SU Zhou,LI Can,YAO Lixiao,et al.Research and appli?cation of power load data preprocessing and research and application[J].Power System and Clean Energy,2017,33(5):40-43.
[6]楊飛,朱志祥.基于特征和空間信息的核模糊C-均值聚類算法[J].電子科技,2016,29(2):16-19.YANG Fei,ZHU Zhixiang.Kernel fuzzy C-mean cluster?ing algorithm based on feature and spatial information[J].Electronic Science and Technology,2016,29(2):16-19.
[7]馬小慧,陽育德,龔利武.基于Kohonen聚類和SVM組合算法的電網(wǎng)日最大負(fù)荷預(yù)測[J].電網(wǎng)與清潔能源,2014,30(2):7-11.MA Xiaohui,YANG Yude,GONG Liwu.Based on koho?nen clustering and SVM combination algorithm for daily maximum load of power grid[J].Power System and Clean Energy,2014,30(2):7-11.
[8]賈璦瑋.基于劃分的聚類算法研究綜述[J].電子設(shè)計工程,2014(23):38-41.JIA Aiwei.Partition clustering algorithm research based on divide[J].ElectronicDesignEngineering,2014(23):38-41.
[9]張宇獻(xiàn),劉通,董曉,等.基于改進(jìn)劃分系數(shù)的模糊聚類有效性函數(shù)[J].沈陽工業(yè)大學(xué)學(xué)報,2014,36(4):431-435.ZHANG Yuxian,LIU Tong,DONG Xiao,et al.Fuzzy clustering effectiveness function based on improved parti?tion coefficient[J].Journal of Shenyang University of Tech?nology,2014,36(4):431-435.
[10]劉飛,唐雅娟,劉瑤.K-means聚類算法中聚類個數(shù)的方法研究[J].電子設(shè)計工程,2017,25(15):9-13.LIU Fei,TANG Yajuan,LIU Yao.Study of the K-means clustering algorithm to cluster the number of methods[J].Electronic Design Engineering,2017,25(15):9-13.
[11]OHBA M,KADOKURA S,NOHARA D.Impacts of synoptic circulation patterns on wind power ramp events in East Japan[J].Renewable Energy,2016,96(3):591-602.
[12]CORNEJO BUENO L,AYBAR RUIZ A,CAMACHO GóMEZ C,et al.A hybrid neuro-evolutionary algorithm for wind power ramp events detection[J].2017.
[13]FAN Yaju,KAMATH Chandrika.Detecting ramp events in wind energy generation using affinity evaluation on weather data[J].Statistical Analysis and Data Mining,2016,9(3):155-173.
[14]LI Y,DAI C,WANG T,et al.Separate wind power and ramp predictions based on meteorological variables and clustering method[C].Morben:IEEE International Confer?ence on Power Systems,IEEE,2016.
[15]ZHANG J,CUI MINGJIAN,BRI MATHIAS HODGE,et al.Ramp forecasting performance from improved shortterm wind power forecasting over multiple spatial and tem?poral scales[J].Energy,2017,122(8):528-541.
[16]YILDIRIM N,UZUNOGLU B.Data mining via association rules for power ramps detected by clustering or optimiza?tion[M].Berlin Heidelberg:Springer,2016.