尹星露,肖先勇,孫曉璐
(四川大學(xué) 電氣信息學(xué)院,四川 成都 610065)
異常數(shù)據(jù)檢測(cè)與修正是進(jìn)行母線負(fù)荷預(yù)測(cè)的重要基礎(chǔ),已受到國內(nèi)外重視[1]。導(dǎo)致母線負(fù)荷異常的原因很多,數(shù)據(jù)異常現(xiàn)象具有復(fù)雜不確定性,尤其是低壓母線負(fù)荷的分散性進(jìn)一步增加了復(fù)雜不確定性,異常數(shù)據(jù)檢測(cè)困難。通常認(rèn)為,改善測(cè)量、通信等硬件條件可提高數(shù)據(jù)可靠性[2],但無法揭示母線負(fù)荷異常數(shù)據(jù)的固有規(guī)律,因此,研究母線負(fù)荷異常數(shù)據(jù)的檢測(cè)與修正方法,仍是當(dāng)前需要研究的重要課題。
國內(nèi)外對(duì)異常數(shù)據(jù)檢測(cè)與修正已開展了大量研究[1-10]。 文獻(xiàn)[1,4]提出了基于變化率的判別方法,但對(duì)連續(xù)異??赡苷`判或漏判。文獻(xiàn)[5-6]利用連續(xù)多日同時(shí)刻負(fù)荷的均值和方差進(jìn)行檢測(cè),但對(duì)異常波動(dòng)的檢測(cè)效果不佳。文獻(xiàn)[7]從負(fù)荷的橫、縱向連續(xù)性出發(fā),提出了基于數(shù)據(jù)密度的檢測(cè)方法,但種子吸附閾值確定困難。對(duì)于異常數(shù)據(jù)修正,文獻(xiàn)[1,7]提出了相似日同時(shí)刻負(fù)荷線性組合修正法;文獻(xiàn)[8-10]提出了特征曲線調(diào)整法。這些方法遵循了負(fù)荷連續(xù)性原則,但對(duì)負(fù)荷變化的不確定性考慮不足。事實(shí)上,母線負(fù)荷變化同時(shí)具有連續(xù)性和不確定性,數(shù)據(jù)異常具有復(fù)雜不確定性,需針對(duì)復(fù)雜不確定性提出異常數(shù)據(jù)檢測(cè)方法,并可用期望、熵、超熵等數(shù)學(xué)特征刻畫母線負(fù)荷的復(fù)雜不確定性,采用李德毅院士提出的云模型進(jìn)行修正。
本文基于聚類分析法,對(duì)母線負(fù)荷進(jìn)行相似集劃分;從母線負(fù)荷的縱向不確定性分布規(guī)律和橫向連續(xù)性出發(fā),研究異常數(shù)據(jù)的不確定特征,根據(jù)多日同時(shí)段負(fù)荷隨機(jī)分布規(guī)律估算待測(cè)負(fù)荷在不同時(shí)刻的取值區(qū)間,檢測(cè)異常數(shù)據(jù),為避免疏漏,以相似日在不同時(shí)刻的負(fù)荷變化率的正常范圍為判據(jù),對(duì)剩余待測(cè)數(shù)據(jù)進(jìn)行檢測(cè),從而提出異常數(shù)據(jù)復(fù)雜不確定性檢測(cè)方法;研究母線負(fù)荷的期望、熵、超熵等數(shù)學(xué)特征,綜合利用負(fù)荷準(zhǔn)周期變化規(guī)律和當(dāng)前趨勢(shì),提出基于綜合云模型的修正方法,并對(duì)算法進(jìn)行了詳細(xì)研究。以某實(shí)際電網(wǎng)110 kV母線負(fù)荷為例,驗(yàn)證了方法的可行性和正確性,并將該方法用于某母線負(fù)荷預(yù)測(cè)系統(tǒng),證明了其工程適用性。
合理的聚類可避免由于母線負(fù)荷的類別不同而帶來的異常數(shù)據(jù)檢測(cè)的誤判、漏判等問題,也為異常數(shù)據(jù)修正奠定了良好基礎(chǔ)。每15 min采樣一次,以96個(gè)負(fù)荷點(diǎn)構(gòu)成的日負(fù)荷曲線總樣本集進(jìn)行有效聚類,本文采用改進(jìn)的模糊C均值FCM(Fuzzy C-Means)聚類方法[9-11]:利用減法聚類算法得到聚類數(shù)目和聚類中心,作為FCM算法的初始值,按最小距離原則對(duì)總樣本進(jìn)行劃分,形成母線負(fù)荷不同類別的相似集。
a.設(shè) N 天總樣本集為 X={X1,X2,…,Xi,…,Xj,…,XN},Xi=(X(i,1),X(i,2),…,X(i,96)),計(jì)算各樣本Xi的密度指標(biāo)Di:
其中,ra為一正數(shù),定義為樣本Xi的一個(gè)鄰域。
將式(1)中密度指標(biāo)最高的樣本Xi作為第一個(gè)初始聚類中心c1,對(duì)應(yīng)的密度指標(biāo)為
b.根據(jù)式(3)進(jìn)行修正,從剩余樣本中選取計(jì)算結(jié)果最大的樣本作為下一個(gè)聚類中心。對(duì)應(yīng)密度指標(biāo)為
通常rb=1.5ra,可避免出現(xiàn)距離過近的聚類中心。
d.記g=1,將減法聚類得到的聚類中心c1(g)、c2(g)、…、ck(g)作為 FCM 算法的初始聚類中心。e.計(jì)算所有樣本與各聚類中心的距離:
其中,μij為樣本 Xi屬于第 j類的隸屬度,定義為式(5)。
其中,dij為樣本Xi與第j類的距離;dil為樣本Xi與每一類的距離;m一般取2。按最小距離原則將總樣本X進(jìn)行聚類。
f.重新計(jì)算聚類中心:
若存在 j?{1,2,…,k},有 cj(g+1)≠cj(g),則 g=g+1,轉(zhuǎn)至步驟e,否則聚類結(jié)束。最終形成母線負(fù)荷不同類別的聚類中心 c1、c2、…、ck和相似集 G1、G2、…、Gk。
基于母線負(fù)荷縱向分布規(guī)律和橫向連續(xù)性特點(diǎn),提出異常數(shù)據(jù)復(fù)雜不確定性檢測(cè)方法?;舅悸窞椋喊醋钚【嚯x原則判別待測(cè)日曲線屬于哪一個(gè)相似集,選取該相似集的n天樣本作為待測(cè)日的相似日,并提取該相似集的聚類中心作為特征曲線。根據(jù)多日同時(shí)段負(fù)荷隨機(jī)分布規(guī)律估算待測(cè)負(fù)荷在不同時(shí)刻的取值區(qū)間,檢測(cè)得到r個(gè)異常數(shù)據(jù),為避免疏漏,以相似日在不同時(shí)刻的負(fù)荷變化率的正常范圍為判據(jù),對(duì)剩余待測(cè)數(shù)據(jù)進(jìn)行檢測(cè)。
根據(jù)D檢驗(yàn)法[13]可證明多日同一時(shí)刻的負(fù)荷樣本近似服從正態(tài)分布,以此為本文異常數(shù)據(jù)檢測(cè)方法提供依據(jù)。假設(shè)檢驗(yàn)問題為:H0樣本服從正態(tài)分布,H1樣本不服從正態(tài)分布。
檢驗(yàn)統(tǒng)計(jì)量C(Y)為:
當(dāng) C(Y)>C(α,n)(可查統(tǒng)計(jì)量分布表[13],α 為顯著性水平)時(shí),接受H0;反之,接受H1。由此刻畫母線負(fù)荷的隨機(jī)不確定性。
按最小距離原則判別待測(cè)日曲線屬于母線負(fù)荷哪一個(gè)相似集,選取該相似集的n天樣本數(shù)據(jù)作為待測(cè)日的相似日,并提取該相似集的聚類中心作為特征曲線,算法如下。
其中,s為標(biāo)準(zhǔn)方差;tα/2(n-1)可通過 t值表查詢。
若Y0(t)不在對(duì)應(yīng)時(shí)刻可能的取值區(qū)間,則判定該時(shí)刻的負(fù)荷為異常數(shù)據(jù)。步驟a—c基于母線負(fù)荷縱向分布規(guī)律,主要針對(duì)異常明顯的缺失數(shù)據(jù)和極大、極小值進(jìn)行檢測(cè),為避免其他異常數(shù)據(jù)疏漏,利用母線負(fù)荷橫向連續(xù)性特點(diǎn),對(duì)余下的96-r(r為步驟c已檢測(cè)出的異常數(shù)據(jù)個(gè)數(shù))個(gè)待測(cè)數(shù)據(jù)進(jìn)行檢測(cè)。
d.統(tǒng)計(jì)n天相似日在余下數(shù)據(jù)所對(duì)應(yīng)時(shí)刻的負(fù)荷變化率的正常范圍:
其中,i=1,2,…,n;t=2,…,96-r。
對(duì)于計(jì)算t=1時(shí)刻的負(fù)荷變化率時(shí),可利用前一天最后一時(shí)刻的負(fù)荷值Y(i-1,96)進(jìn)行負(fù)荷變化率運(yùn)算。
e.計(jì)算待測(cè)負(fù)荷值Y0(t)與特征曲線所對(duì)應(yīng)的Yc(t-1)的負(fù)荷變化率 δ(t):
用 Yc(t-1)代替 Y0(t-1)的目的是避免 Y0(t-1)是異常數(shù)據(jù)而帶來的誤檢。
f.判斷 δ(t)是否在式(10)的正常范圍,若不在,則說明該時(shí)刻的數(shù)據(jù)為異常數(shù)據(jù)。
基于母線負(fù)荷變化的不確定性,本文采用云模型進(jìn)行異常數(shù)據(jù)修正。云模型是用語言值表示某定性概念與其定量表示之間的不確定性轉(zhuǎn)換模型。其數(shù)學(xué)特征為:期望Ex、熵En、超熵He。期望Ex刻畫云的重心,熵En反映分布不確定性和可接受范圍,超熵He刻畫云滴的凝聚度,反映離散程度和云的厚度。
由D驗(yàn)證法確定多日同時(shí)段負(fù)荷的近似正態(tài)分布后,可利用普適性最強(qiáng)的正態(tài)云模型[14]刻畫負(fù)荷變化規(guī)律,由此確定期望曲線方程:
母線負(fù)荷曲線以96個(gè)負(fù)荷點(diǎn)為準(zhǔn)周期,將n天相似日的負(fù)荷{L(at,bt)}(其中 at為時(shí)刻,bt為對(duì)應(yīng)負(fù)荷)作為歷史數(shù)據(jù)集DH,從整體反映負(fù)荷準(zhǔn)周期性規(guī)律,依據(jù)DH中的數(shù)據(jù)可挖掘得到修正規(guī)則集{A1如表1所示。 其中 Ai、Bi分別為at、bt論域上的定性概念,可由其數(shù)學(xué)特征(Ex,En,He)來表征。
表1 修正規(guī)則集Table 1 Set of correction rules
修正規(guī)則集中的Ai和Bi分別表示規(guī)則前件和后件語言變量的原子概念,通過判定待修正負(fù)荷的時(shí)刻at屬于前件語言變量中的哪個(gè)原子來激活相應(yīng)規(guī)則,令 μ=at,方法如下。
由參數(shù) A1(Ex1,En1,He1)、…、Al(Exl、Enl、Hel)分別構(gòu)造 μ- 條件下正態(tài)云發(fā)生器 CG1、CG2、…、CGl,將μ 分別輸入云發(fā)生器得一系列輸出 μ1、μ2、…、 μl,分別反映了μ對(duì)A1、A2、…、Al的隸屬程度。從中找出最大值說明規(guī)則最能反映時(shí)刻 at的準(zhǔn)周期規(guī)律,其后件 Bi相應(yīng)(ExB,EnB,HeB)作為修正信息,可稱為歷史修正云Bi。歷史修正云推理器的原理如圖1所示。
圖1 歷史修正云推理器Fig.1 Reasoning engine of historic data correction cloud
以待修正數(shù)據(jù)的n天相似日同時(shí)刻at的負(fù)荷作為當(dāng)前時(shí)刻數(shù)據(jù)集 DC,根據(jù)DC中的數(shù)據(jù)分布,用無需確定度信息的逆向云算法[16]得到當(dāng)前時(shí)刻趨勢(shì)——當(dāng)前修正云Ii,該信息既有不確定性又遵循當(dāng)前時(shí)刻數(shù)據(jù)的分布規(guī)律,其算法如下:
結(jié)合歷史修正云Bi和當(dāng)前修正云Ii,形成綜合云修正模型 S(Ex,En,He):
基于修正綜合云模型S所得的修正數(shù)據(jù)L(at),同時(shí)包含了負(fù)荷整體特性和當(dāng)前時(shí)刻數(shù)據(jù)分布規(guī)律,具體算法如下。
a.產(chǎn)生一個(gè)期望為En、方差為He的正態(tài)隨機(jī)數(shù)E′n=NORM(En,He)。
b.以Ex為期望、E′n為方差得到一個(gè)正態(tài)隨機(jī)修正數(shù)據(jù) L(at)=NORM(Ex,E′n)。
c.檢驗(yàn)所得修正值L(at)是否能滿足橫向連續(xù)性和縱向分布規(guī)律,計(jì)算公式如下:若不滿足,轉(zhuǎn)步驟b;若滿足,將所得修正值L(at)作為最終的修正結(jié)果。
異常數(shù)據(jù)檢測(cè)與修正流程如圖2所示。
圖2 異常數(shù)據(jù)檢測(cè)與修正流程Fig.2 Flowchart of abnormal data detection and correction
以某地區(qū)電網(wǎng)某110 kV母線為例,以2012年7月到9月的日負(fù)荷為數(shù)據(jù)源,人為丟失多個(gè)數(shù)據(jù),并加入連續(xù)突變量。用本文方法進(jìn)行異常數(shù)據(jù)檢測(cè)與修正。上述算法均由MATLAB程序?qū)崿F(xiàn)。
表2 為隨機(jī)抽取負(fù)荷數(shù)據(jù)的檢測(cè)結(jié)果,可見,本文方法的平均檢測(cè)正確率為87.63%,高于改進(jìn)橫向法[1]的平均正確率 83.28%。
表2 隨機(jī)抽取負(fù)荷數(shù)據(jù)的檢測(cè)結(jié)果Table 2 Results of detection for randomly extracted load data
分別用加權(quán)平均法、特征曲線調(diào)整法[11]、綜合云修正模型對(duì)異常數(shù)據(jù)進(jìn)行修正。
加權(quán)平均法:選取待修正日的相似日的同一時(shí)刻的歷史負(fù)荷數(shù)據(jù)作為參考數(shù)據(jù),則修正值如式(15)所示。
其中,λj表征第d-j天t時(shí)刻負(fù)荷對(duì)待修正值的影響程度,本文取 λ1=λ2=…=λ5=0.2。
特征曲線調(diào)整法:若檢測(cè)出t1到t2為壞數(shù)據(jù),則修正值如式(16)所示。
其中,t=t1,t1+1,…,t2;Lc(d,t)、Lc(d,t1-1)、Lc(d,t2+1)為特征曲線上對(duì)應(yīng)的負(fù)荷值;L(d,t1-1),L(d,t2+1)為待修正日曲線對(duì)應(yīng)的負(fù)荷值。
以2012年9月3日的負(fù)荷曲線為例,修正結(jié)果和相對(duì)誤差分別如表3、表4所示。
表3 異常負(fù)荷數(shù)據(jù)修正結(jié)果Table 3 Results of abnormal load data correction
表4 各方法相對(duì)誤差Table 4 Relative errors of different methods
從表3可知,本文方法所得修正值更接近實(shí)際。由表4可見,由于母線負(fù)荷的基數(shù)相對(duì)于系統(tǒng)負(fù)荷小,某些點(diǎn)相對(duì)誤差偏大,用綜合云模型修正后的相對(duì)誤差基本在10%以內(nèi),平均相對(duì)誤差比其他2種方法分別低3.82%和2.29%,明顯好于其他方法。
為進(jìn)一步比較,將以上3種修正方法處理后的樣本和未經(jīng)處理的樣本用于某母線負(fù)荷預(yù)測(cè)系統(tǒng),并以改進(jìn)灰色模型預(yù)測(cè)法[18]為例,預(yù)測(cè)2012年9月10日到9月14日的負(fù)荷曲線。依據(jù)國網(wǎng)公司下達(dá)的《電網(wǎng)母線負(fù)荷預(yù)測(cè)工作考核管理辦法》中的相關(guān)考核指標(biāo),母線負(fù)荷在t時(shí)刻的預(yù)測(cè)誤差定義為:
其中,y′(t)為實(shí)際值;y(t)為預(yù)測(cè)值;yB為負(fù)荷基準(zhǔn)值,對(duì)應(yīng)110 kV電壓等級(jí)的yB=114 MW。日母線負(fù)荷預(yù)測(cè)準(zhǔn)確率為:
如表5所示,用本文方法處理后的樣本進(jìn)行預(yù)測(cè),平均預(yù)測(cè)準(zhǔn)確率較其他2種方法處理后的平均準(zhǔn)確率分別提高了0.23%和0.13%,較未處理時(shí)平均準(zhǔn)確率提高了0.83%。
表5 母線負(fù)荷預(yù)測(cè)準(zhǔn)確率對(duì)比Table 5 Comparison of bus load forecasting accuracy
a.考慮母線負(fù)荷的縱向不確定性分布規(guī)律和橫向連續(xù)性,采用異常數(shù)據(jù)復(fù)雜不確定性檢測(cè)方法,其結(jié)果正確率高,可滿足工程應(yīng)用需要。
b.基于歷史修正云和當(dāng)前修正云的母線負(fù)荷異常數(shù)據(jù)綜合云修正模型,同時(shí)考慮了不同時(shí)間粒度的變化規(guī)律,所得修正結(jié)果更符合實(shí)際。
c.本文方法在某地區(qū)電網(wǎng)母線負(fù)荷預(yù)測(cè)系統(tǒng)中的應(yīng)用表明,采用本文方法后,母線負(fù)荷預(yù)測(cè)的準(zhǔn)確率得到了明顯提高,能更好地滿足實(shí)際需要。
結(jié)合實(shí)際系統(tǒng)中母線負(fù)荷影響因素和變化規(guī)律,進(jìn)一步考慮氣象因素、計(jì)劃檢修、負(fù)荷計(jì)劃性轉(zhuǎn)移等的影響,是值得研究的課題。