常鮮戎,孫景文(華北電力大學(xué)電氣與電子工程學(xué)院,保定071003)
粒子群優(yōu)化的模糊聚類在負(fù)荷預(yù)處理的應(yīng)用
常鮮戎,孫景文
(華北電力大學(xué)電氣與電子工程學(xué)院,保定071003)
負(fù)荷預(yù)處理對(duì)于準(zhǔn)確的負(fù)荷預(yù)測(cè)來(lái)說(shuō)是至關(guān)重要的。為了提高負(fù)荷預(yù)處理的準(zhǔn)確性,提出了將傳統(tǒng)的橫向縱向比較法與改進(jìn)模糊聚類算法結(jié)合的新型方法。該方法首先采用傳統(tǒng)的橫向縱向比較法處理突變量較大的負(fù)荷和缺失負(fù)荷;然后對(duì)模糊C均值算法的目標(biāo)函數(shù)進(jìn)行改進(jìn),將粒子群算法引入,得到改進(jìn)的模糊聚類算法,進(jìn)行曲線聚類,得到特征曲線;最后,利用特征曲線對(duì)壞數(shù)據(jù)進(jìn)行辨識(shí)和修正。實(shí)例分析表明,通過(guò)將粒子群優(yōu)化的模糊聚類與傳統(tǒng)處理方法進(jìn)行結(jié)合,取得了良好的效果,驗(yàn)證了該方法有效性。
負(fù)荷預(yù)處理;壞數(shù)據(jù);模糊C均值;粒子群算法
在電力系統(tǒng)負(fù)荷預(yù)測(cè)實(shí)際工作中,由于SCADA(supervisory control and dataacquisition)系統(tǒng)中的量測(cè)、記錄、轉(zhuǎn)換、傳輸?shù)热我猸h(huán)節(jié)故障都有可能導(dǎo)致觀測(cè)數(shù)據(jù)出現(xiàn)反常態(tài)勢(shì),以致與大多數(shù)觀測(cè)值不一致;另外,由于突發(fā)事件或者某些原因線路檢修停電、切負(fù)荷停電、大事件沖擊等而引起負(fù)荷的異常變化。這些數(shù)據(jù)統(tǒng)稱為壞數(shù)據(jù),其存在使得預(yù)測(cè)結(jié)果的準(zhǔn)確度無(wú)法保證。因此,在進(jìn)行負(fù)荷預(yù)測(cè)之前,有必要對(duì)原始負(fù)荷數(shù)據(jù)進(jìn)行預(yù)處理[1]。
有關(guān)壞數(shù)據(jù)的處理已經(jīng)有很多方法,比如傳統(tǒng)的橫向縱向比較法、負(fù)荷變化率檢測(cè)法、基于統(tǒng)計(jì)的檢測(cè)法、灰色預(yù)測(cè)法、小波分析法和聚類算法等。文獻(xiàn)[2]通過(guò)分析歷史上各日相鄰時(shí)刻負(fù)荷變化率來(lái)確定負(fù)荷變化率閾值,以相鄰時(shí)刻負(fù)荷變化率是否滿足來(lái)判斷該點(diǎn)負(fù)荷是否異常,這對(duì)于單點(diǎn)出現(xiàn)壞數(shù)據(jù)很有效;文獻(xiàn)[3]采用灰色理論和參數(shù)估計(jì)結(jié)合的方法進(jìn)行壞數(shù)據(jù)的檢測(cè)和修正,但是參數(shù)估計(jì)效率比較低,灰色理論估計(jì)解決成片出現(xiàn)壞數(shù)據(jù)效果也不好;文獻(xiàn)[4]采用二維小波去噪原理,將日期排列成二維矩陣,利用橫向和縱向數(shù)據(jù)連續(xù)性進(jìn)行去噪處理,但是去噪并不能有效去除奇異點(diǎn),且去噪的效果與小波的選擇關(guān)系很大,并且問題變得復(fù)雜化;文獻(xiàn)[5-7]嘗試著將模糊聚類的思想引入到負(fù)荷預(yù)處理中,取得了不錯(cuò)的效果,但是,模糊聚類方法有其固有的缺點(diǎn),盡管文獻(xiàn)中也有提到,但是并沒有很好地解決。
本文首先利用傳統(tǒng)的橫向縱向比較法,將比較明顯的壞數(shù)據(jù)如連續(xù)缺失數(shù)據(jù)和突變量很大數(shù)據(jù),進(jìn)行修正,這樣可以為下一步有效地聚類做好基礎(chǔ);然后將模糊C均值聚類引入到預(yù)處理過(guò)程中,并針對(duì)其存在的對(duì)噪聲敏感、初始聚類中心難以確定的問題進(jìn)行解決,提出了基于粒子群優(yōu)化的可能性模糊C均值算法,即PSO-PFCM(possibility fuzzy C-meansbased on particle swar Moptimization);最后,利用聚類產(chǎn)生的特征曲線進(jìn)行壞數(shù)據(jù)的辨識(shí)和修正。
數(shù)據(jù)橫向比較法是一種利用日負(fù)荷曲線中連續(xù)2個(gè)點(diǎn)負(fù)荷不突變的特性來(lái)判別異常點(diǎn)的數(shù)據(jù)處理方法;數(shù)據(jù)縱向比較法也是如此,利用連續(xù)兩天同時(shí)刻負(fù)荷不突變的特性來(lái)判別異常點(diǎn)。
數(shù)據(jù)橫向比較法描述如下。
如果
式中:L(d,t)為第d天第t時(shí)刻負(fù)荷;α(t)、β(t)分別為不同的閾值。
數(shù)據(jù)縱向比較法描述如下。如果
式中,γ(t)和δ(t)分別為不同的閾值。
該方法的最大難點(diǎn)就是閾值的確定,同時(shí)也決定著處理效果的好壞。由于這里僅僅是針對(duì)缺失數(shù)據(jù)和大突變量數(shù)據(jù)進(jìn)行處理,因此閾值很容易確定,可以設(shè)置為一個(gè)比較大的數(shù)值,就能夠滿足要求。還有一點(diǎn)需要說(shuō)明,傳統(tǒng)的橫向縱向處理方法會(huì)考慮該點(diǎn)的下一時(shí)刻值或者第二天同一時(shí)刻值,如果正好下一個(gè)數(shù)據(jù)為壞數(shù)據(jù),則處理效果會(huì)大受影響。因此,這里僅僅采用該點(diǎn)之前的數(shù)據(jù)。處理過(guò)程簡(jiǎn)述如下。
步驟1設(shè)置橫向比較、縱向比較的閾值;
步驟2前5 d的數(shù)據(jù)人為修正,以此為基準(zhǔn),從第6 d開始,每天每個(gè)時(shí)刻數(shù)據(jù)進(jìn)行橫向比較和縱向比較,若兩次比較都滿足閾值要求,則轉(zhuǎn)到步驟4;若有任何一次比較超出閾值要求,則轉(zhuǎn)到步驟3;
步驟3利用前一時(shí)刻數(shù)據(jù)以及同時(shí)刻前5 d數(shù)據(jù)加權(quán)修正,則加權(quán)公式為
2.1 模糊C均值聚類(FCM)
模糊C均值FCM(fuzzy C-means)聚類算法[8-9]是基于劃分的聚類算法,其通過(guò)對(duì)目標(biāo)函數(shù)逐步迭代優(yōu)化來(lái)實(shí)現(xiàn)數(shù)據(jù)聚類,使得類內(nèi)對(duì)象之間相似度最大,不同類對(duì)象間相似度最小。FCM聚類算法能夠自動(dòng)對(duì)樣本點(diǎn)進(jìn)行分類,其通過(guò)準(zhǔn)則函數(shù)的優(yōu)化來(lái)得到樣本點(diǎn)對(duì)聚類中心的隸屬度,從而確定樣本所隸屬的類別。FCM算法原理實(shí)現(xiàn)如下。
設(shè)樣本集X={x1,x2,…,xi,…,xn}中元素xi有s個(gè)特征,即xi={xi1,xi2,…,xis},要把X分為c類(2≤c≤n)。
設(shè)有c個(gè)聚類中心V={v1,v2,…,vc},取dik為聚類中心vi與樣本xk與的歐氏距離,記作
聚類準(zhǔn)則是其目標(biāo)函數(shù)達(dá)到最小值,即
式中:uik為樣本k在第i類的隸屬度;m為模糊因子,表示聚類結(jié)果模糊度的權(quán)重指數(shù),m∈[1,∞),取經(jīng)驗(yàn)值范圍為1.5≤m≤2.5;U為模糊劃分矩陣;V為聚類原型。
結(jié)合式(8)的約束條件與Lagrange乘數(shù)法對(duì)式(7)求解,可求得U和V的更新公式為
FCM算法理論在眾多的模糊聚類算法中是最完善的,其擁有深厚的數(shù)學(xué)基礎(chǔ),并且在眾多領(lǐng)域獲得了成功的應(yīng)用。但是FCM算法依然存在一些問題,其中比較棘手并且關(guān)鍵的就是對(duì)噪聲的敏感性和初始聚類中心無(wú)法確定的問題。
2.2 可能性模糊C均值聚類(PFCM)
2.2.1可能性C均值聚類(PCM)
在FCM算法中,分析約束條件(8)可以知道,聚類中所有數(shù)據(jù)點(diǎn)的影響力是相同的,噪聲也不例外。這就導(dǎo)致樣本的隸屬度不僅與該類的中心有關(guān),而且也受其他類中心的影響,因?yàn)槊總€(gè)樣本點(diǎn)隸屬度之和均為1。然而噪聲往往既不屬于這個(gè)類也不屬于其他類,由于隸屬度和為1這個(gè)條件的限制,聚類結(jié)果會(huì)受較大的影響。
為了解決該問題,Keller和Krishnapuram放寬了隸屬度的約束條件,解決了FCM對(duì)噪聲的敏感性問題[10]。其目標(biāo)函數(shù)定義為
式中:U為可能性劃分矩陣,U=[uik]c×n,其元素uik為第k個(gè)數(shù)據(jù)隸屬于第i類的可能值;ηi為自己定義的參數(shù),建議取值為
式中,K一般取1。由式(11)可以看出可能性C均值PCM(possibility C-means)目標(biāo)函數(shù)的第1項(xiàng)正是FCM目標(biāo)函數(shù)的第1項(xiàng),體現(xiàn)著不同數(shù)據(jù)點(diǎn)到聚類中心的加權(quán)距離;PCM目標(biāo)函數(shù)的第2項(xiàng)是懲罰因子,以防出現(xiàn)U為0的情況。因?yàn)榇颂庪`屬度的含義是數(shù)據(jù)樣本屬于類別的可能性,因此稱其為可能性聚類。
2.2.2可能性模糊C均值聚類(PFCM)
盡管PCM算法能更真實(shí)地反映數(shù)據(jù)點(diǎn)對(duì)聚類中心的距離,擺脫了FCM算法中隸屬度之和為1的約束,對(duì)噪聲的魯棒性好,但是,PCM算法依然存在一定的問題,即目標(biāo)函數(shù)的最小化等價(jià)于最小化c個(gè)子目標(biāo)函數(shù),也即
由式(13)可以看出,其值只跟一個(gè)聚類中心有關(guān)。因此,只有當(dāng)所有的聚類中心一樣時(shí)才能得到全局最優(yōu)解,從而引起了聚類一致性問題。
針對(duì)FCM和PCM存在的問題,提出了可能性模糊C均值PFCM(possibility fuzzy C-means)聚類算法,其目標(biāo)函數(shù)為
式中:T為可能性劃分矩陣,T=[tik]c×n;γi的取值為
式中:a〉0;b〉0;m〉1;η〉1。uik與FCM中模糊隸屬度一樣,tik與PCM中可能性劃分矩陣一樣。由以上分析可知,PFCM算法兼具FCM和PCM的優(yōu)點(diǎn),既有很好的噪聲魯棒性,又避免了聚類一致性問題。
2.3 粒子群優(yōu)化算法(PSO)
粒子群優(yōu)化PSO(particleswar Moptimization)[11]算法是由Eberhart博士和Kennedy博士于1995年提出的一種全局優(yōu)化計(jì)算技術(shù)。PSO算法中,首先初始化一群隨機(jī)粒子,然后每個(gè)粒子在搜索空間不斷調(diào)整其位置來(lái)搜索新解。每個(gè)粒子都能記憶其搜索到的最優(yōu)解Pid,以及整個(gè)粒子群的最優(yōu)解Pgd,每個(gè)粒子都有一個(gè)搜索速度vid。每個(gè)粒子更新自身速度為
式中:vid為粒子i的第d維速度;ω為慣性權(quán)重;c1和c2分別為個(gè)體和全局的加速系數(shù),調(diào)節(jié)每個(gè)粒子向個(gè)體最優(yōu)粒子和全局最優(yōu)粒子方向搜索的最大步長(zhǎng),通常c1,c2∈[0,4],一般均取為2;r1和r2為0到1之間的隨機(jī)變量。則粒子的位置更新公式為
PSO算法沒有太多的參數(shù)需要調(diào)整,能夠記憶個(gè)體最優(yōu)和全局最優(yōu)的信息,收斂快速,編程簡(jiǎn)單,易于實(shí)現(xiàn),且搜索不需要依賴梯度信息。
2.4 PSO-PFCM實(shí)現(xiàn)
2.4.1 PFCM的實(shí)用處理
如前所述,PFCM兼具FCM和PCM的優(yōu)點(diǎn)。但是,由式(13)可以看出,其目標(biāo)函數(shù)需要設(shè)定的參數(shù)太多,并且其懲罰因子的計(jì)算依賴FCM和PCM算法,計(jì)算復(fù)雜。實(shí)際應(yīng)用時(shí),以協(xié)方差矩陣優(yōu)化懲罰因子,得到改進(jìn)的目標(biāo)函數(shù)[12]為
式中,J的第1項(xiàng)是FCM和PCM兩種算法的結(jié)合,第2項(xiàng)是對(duì)目標(biāo)函數(shù)的懲罰項(xiàng),以防目標(biāo)函數(shù)出現(xiàn)無(wú)意義的平凡解。通過(guò)推導(dǎo)可得U、T、V的更新公式為
2.4.2 PSO的實(shí)用改進(jìn)
PSO算法中,每個(gè)粒子在搜索空間中不斷進(jìn)化搜索直到滿足終止條件。粒子進(jìn)化過(guò)程的評(píng)價(jià)指標(biāo)是適應(yīng)度函數(shù),即目標(biāo)函數(shù)J。由式(15)可知,r1和r2是0到1之間的隨機(jī)變量,即粒子每次的迭代學(xué)習(xí)能力是隨機(jī)的,然而為了使粒子更好地向優(yōu)秀粒子學(xué)習(xí),提高收斂速度,可以進(jìn)行改進(jìn),即
PSO算法中,慣性權(quán)重ω的大小表征著全局搜索與局部搜索能力的大小。其值大,則算法有較強(qiáng)的全局搜索能力;反之,算法有較強(qiáng)的局部搜索能力。通常采用線性遞減權(quán)值策略,將ω設(shè)置為0.9~0.4,即
2.4.3 PSO-PFCM的實(shí)現(xiàn)
對(duì)s維的樣本空間X={x1,x2,…,xn}進(jìn)行聚類,就是要尋找所有的聚類中心,然后根據(jù)聚類中心來(lái)計(jì)算每個(gè)樣本的隸屬度,決定樣本的歸屬。粒子群中每一個(gè)粒子都是c×s維向量,其中c代表聚類類別數(shù)。采用粒子群算法進(jìn)行聚類,就是使粒子通過(guò)每一次迭代來(lái)改變聚類中心,從而產(chǎn)生不同的聚類結(jié)果,直到聚類結(jié)果達(dá)到最優(yōu),有效解決了由于初始聚類中心難以確定而導(dǎo)致的算法陷入局部最優(yōu),聚類效果差的問題。流程如下。
(1)初始化參數(shù),包括聚類中心,聚類數(shù)目c,加權(quán)指數(shù)m和q(m,q〉1);根據(jù)式(20)、式(21)初始學(xué)習(xí)因子ω1、ω2和權(quán)重ω,設(shè)定最大迭代次數(shù)itertotal和閾值ε;
(3)由式(19)來(lái)計(jì)算或更新U、T、V;
(4)由式(16)進(jìn)行粒子適應(yīng)度值的計(jì)算,與之前的適應(yīng)度值進(jìn)行比較。若當(dāng)前的適應(yīng)度值小,則用取代取代否則保持;
(5)由式(16)、式(17)進(jìn)行粒子速度和位置的更新;
(6)如果達(dá)到最大迭代次數(shù)或者粒子搜索到足夠好位置,即滿足閾值條件ε,則聚類結(jié)束;否則,轉(zhuǎn)至第(3)步。
以四川省某電網(wǎng)2012-03—2012-05的實(shí)際負(fù)荷為例,用上述所提出方法進(jìn)行實(shí)際驗(yàn)證。該電網(wǎng)的負(fù)荷采樣數(shù)據(jù)間隔為5min,即日負(fù)荷數(shù)據(jù)為288點(diǎn)。由于采樣點(diǎn)數(shù)較多,會(huì)造成聚類特征曲線求取之后與實(shí)際負(fù)荷曲線整體特征差異較大。因此,本文將288點(diǎn)分為3部分,即96點(diǎn)作為一部分,分別進(jìn)行同樣的處理過(guò)程。這樣使得每一段聚類特征曲線更能反映日負(fù)荷曲線,有利于壞數(shù)據(jù)辨識(shí)。
3.1 橫向縱向法處理
圖1是2012-03—2012-05未處理前負(fù)荷曲線以及經(jīng)過(guò)橫向縱向比較法處理后的負(fù)荷曲線。從圖中可以看出,由于一些原因,該段時(shí)間的負(fù)荷有一部分出現(xiàn)了大段的負(fù)荷數(shù)值為負(fù)數(shù)的情況;并且該段時(shí)間負(fù)荷還有幾處出現(xiàn)了大的毛刺,很明顯這些都是壞數(shù)據(jù)。如前所述,由于閾值選擇比較困難,本文選擇一個(gè)較大的閾值,只對(duì)這些突變比較大的負(fù)荷數(shù)據(jù)進(jìn)行修正,修正效果如圖1所示,效果很明顯。做了這些基本的處理之后,負(fù)荷曲線的聚類就會(huì)更加有效和準(zhǔn)確。
圖1 處理前與處理后負(fù)荷曲線對(duì)比Fig.1 Co Mparison of load curve before and after processing
3.2 PSO-PFCM聚類
聚類負(fù)荷曲線主要是考慮負(fù)荷曲線的平滑性和相似性,為了消除負(fù)荷增長(zhǎng)可能帶來(lái)的影響,文中對(duì)負(fù)荷進(jìn)行歸一化處理,即將每日每點(diǎn)負(fù)荷值除以當(dāng)日最大負(fù)荷。歸一化之后,消除負(fù)荷增長(zhǎng)對(duì)聚類的影響。
由于初始聚類中心已經(jīng)由PSO算法確定,聚類過(guò)程中,除了事先給定一些參數(shù)外,還有一點(diǎn)比較重要的就是聚類數(shù)目的確定。聚類數(shù)目如果太多,那么聚類復(fù)雜性就會(huì)增加,并且也沒有什么意義;聚類如果太少,很多不相似的曲線就會(huì)變?yōu)橐活悾Y(jié)果比較粗糙。本文采用計(jì)算比較簡(jiǎn)單的k均值聚類算法[13],并結(jié)合電力負(fù)荷曲線的特點(diǎn),首先確定聚類數(shù)目。
如前所述,本文將288點(diǎn)分為3部分進(jìn)行處理,這里以其中1~96點(diǎn)為例進(jìn)行分析。該段負(fù)荷曲線共聚類為5類,本文取其中一個(gè)聚類分析,如圖2所示。容易看出,前20個(gè)時(shí)刻點(diǎn),有幾條曲線不滿足整體曲線的特征,即為壞數(shù)據(jù);在第60個(gè)采樣點(diǎn)至第70個(gè)采樣點(diǎn)之間有一小段突起,偏離曲線整體特征,即為壞數(shù)據(jù)。這些點(diǎn)均可以由聚類得到的特征曲線進(jìn)行辨識(shí)并且加以修正,具體方法見第3.3節(jié)。
圖2 隸屬于某條特征曲線的一簇歸一化負(fù)荷曲線Fig.2 Normalized load curvesbelonging to one of the characteristic curves
3.3 壞數(shù)據(jù)辨識(shí)與修正
根據(jù)第3.2節(jié)中的聚類,可以得到特征曲線,以及隸屬于每條特征曲線的負(fù)荷曲線,據(jù)此可以計(jì)算出每個(gè)采樣點(diǎn)的方差值。根據(jù)概率上的原理,可以利用每條負(fù)荷曲線上各點(diǎn)與特征曲線上對(duì)應(yīng)點(diǎn)的差值來(lái)判斷是否為壞數(shù)據(jù),并進(jìn)行修正。設(shè)檢出某曲線xi的t1點(diǎn)至t2點(diǎn)為壞數(shù)據(jù),修正后為xi′,修正公式為
式中:t=t1,t1+1,…,t2-1,t2;vk為xi隸屬的特征曲線。
圖3為修正后的日負(fù)荷曲線。從圖中可以看出,對(duì)于偏離整體特征的負(fù)荷數(shù)據(jù),本文提出方法給予了很好的修正,為精確地負(fù)荷預(yù)測(cè)做了準(zhǔn)備工作。
圖3 對(duì)含有壞數(shù)據(jù)負(fù)荷曲線檢測(cè)效果Fig.3 Detection effectofthe load curvecontainingbad data
為了說(shuō)明檢測(cè)壞數(shù)據(jù)的效果,表1給出了2012-03—2012-05壞數(shù)據(jù)檢測(cè)的準(zhǔn)確率,結(jié)果表明該方法是很有效的。
表1 壞數(shù)據(jù)檢測(cè)正確率Tab.1 Correct rate ofbad data detection
通過(guò)SCADA系統(tǒng)得到的負(fù)荷數(shù)據(jù),由于各種原因,會(huì)存在壞數(shù)據(jù);一些偶然性事件也會(huì)導(dǎo)致產(chǎn)生壞數(shù)據(jù);壞數(shù)據(jù)的存在會(huì)對(duì)負(fù)荷預(yù)測(cè)的精度產(chǎn)生很大的影響。本文首先采用傳統(tǒng)的橫向縱向比較法,并加以改進(jìn),來(lái)處理突變量比較大的壞數(shù)據(jù),為進(jìn)一步地精處理做好基礎(chǔ);模糊聚類算法是數(shù)據(jù)處理中常用的方法,但是存在對(duì)噪聲敏感、初始聚類中心難以確定等固有問題,本文通過(guò)改造模糊聚類的目標(biāo)函數(shù),得到具有良好噪聲魯棒性和良好聚類一致性的PFCM算法,并且引入粒子群算法解決初始聚類中心難以確定的問題,對(duì)負(fù)荷數(shù)據(jù)進(jìn)行很好的聚類;最后利用特征曲線對(duì)壞數(shù)據(jù)進(jìn)行辨識(shí)和修正。實(shí)例分析證明了該方法具有良好的特性和實(shí)用性。
[1]康重慶,夏清,劉梅.電力系統(tǒng)負(fù)荷預(yù)測(cè)[M].北京:中國(guó)電力出版社,2007.
[2]莫維仁,張伯明,孫宏斌,等(MoWeiren,Zhang Boming,Sun Hongbin,et al).?dāng)U展短期負(fù)荷預(yù)測(cè)方法的應(yīng)用(Application of extended short-ter Mload forecasting)[J].電網(wǎng)技術(shù)(Power Syste MTechnology),2003,27(5):6-9.
[3]康重慶,夏清,相年德(Kang Chongqing,Xia Qing,Xiang Niande).灰色系統(tǒng)參數(shù)估計(jì)與不良數(shù)據(jù)辨識(shí)(Parameterestimation and bad data identification ofgrey systems)[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版(Journalof Tsinghua U-niversity:Sci&Tech),1997,37(4):72-75.
[4]童述林,文福拴,陳亮(Tong Shulin,Wen Fushuan,Chen Liang).電力負(fù)荷數(shù)據(jù)預(yù)處理的二維小波閾值去噪方法(A two-dimension wavelet threshold de-noisingmethod forelectric load data pre-processing)[J].電力系統(tǒng)自動(dòng)化(Automation of Electric Power Systems),2012,36(2):101-104.
[5]蔣雯倩,李欣然,錢軍(JiangWenqian,Li Xinran,Qian Jun).改進(jìn)FCM算法及其在電力負(fù)荷壞數(shù)據(jù)處理的應(yīng)用(Application of improved FC Malgorith Min outlier processing of power load)[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào)(Proceedingsof the CSU-EPSA),2011,23(5):1-5.
[6]陳柔伊,張堯,武志剛,等(Chen Rouyi,Zhang Yao,Wu Zhigang,etal).改進(jìn)的模糊聚類算法在負(fù)荷預(yù)測(cè)中的應(yīng)用(Application of improving fuzzy clustering algorith Mto power load forecasting)[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào)(Proceedingsof the CSU-EPSA),2005,17(3):73-77.
[7]李培強(qiáng),李欣然,陳輝華,等(Li Peiqiang,Li Xinran,Chen Huihua,etal).基于模糊聚類的電力負(fù)荷特性的分類與綜合(The characteristics classification and synthesisof power load based on fuzzy clustering)[J].中國(guó)電機(jī)工程學(xué)報(bào)(Proceedings of the CSEE),2005,25(24):73-78.
[8]陳東輝(Chen Donghui).基于目標(biāo)函數(shù)的模糊聚類算法關(guān)鍵技術(shù)研究(Research on the Key Technology of Fuzzy Clustering Algorith MBased on Objective Function)[D].西安:西安電子科技大學(xué)計(jì)算機(jī)學(xué)院(Xian:SchoolofComputer,Xidian University),2012.
[9]范九倫(Fan Jiulun).模糊聚類新算法與聚類有效性問題研究(Study on New Fuzzy Clustering Algorith Mand Clustering Validity Problems)[D].西安:西安電子科技大學(xué)計(jì)算機(jī)學(xué)院(Xian:Schoolof Computer,Xidian University),1998.
[10]Krishnapura MR,Keller JM.A possibilistic approach to clustering[J].IEEE Trans on Fuzzy Systems,1993,1(2):98-110.
[11]劉玲,嚴(yán)登俊,龔燈才,等(Liu Ling,Yan Dengjun,Gong Dengcai,etal).基于粒子群模糊神經(jīng)網(wǎng)絡(luò)的短期電力負(fù)荷預(yù)測(cè)(Newmethod for short ter Mload forecasting based on particle swar Moptimization and fuzzy neural network)[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào)(Proceedings of the CSUEPSA),2006,18(3):47-50.
[12]Yang Miinshen,Wu Kuolung.Unsupervised possibilistic clustering[J].Pattern Recognition,2006,39(1):5-21.
[13]朱明.?dāng)?shù)據(jù)挖掘[M].合肥:中國(guó)科技大學(xué)出版社,2002.
[14]Cao Yan,Zhang Zhongjun,Zhou Chi.Data Processing Strategies in Short Ter MElectric Load Forecasting[C]//International Conference on Computer Science and Service System.Nanjing,China,2012:174-177.
[15]梁健武,陳祖權(quán),譚龍海(Liang Jianwu,Chen Zuquan,Tan Longhai).短期負(fù)荷預(yù)測(cè)的聚類組合和支持向量機(jī)方法(Application of clustering combination and support vectormachine in short-ter Mload forecasting)[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào)(ProceedingsoftheCSU-EPSA),2011,23(1):34-38.
[16]楊明海,劉洪,王成山,等(Yang Minghai,Liu Hong,Wang Chengshan,etal).基于粒子群文化算法的變電站選址與定容(Optimalsubstation locating and sizing based on culturalalgorith Mofparticle swarm)[J].天津大學(xué)學(xué)報(bào)(Journalof Tianjin University),2012,45(9):785-790.
Application of Fuzzy Clustering Based on Particle Swar MOpti Mization in Data Processing
CHANGXianrong,SUN Jingwen
(Schoolof Electricaland Electronic Engineering,North China Electric Power University,Baoding071003,China)
Load pre-processing is crucial to accurate load forecasting.In order to improve the accuracy of load processing,a newmethod by combining the traditional transverse and longitudinal comparisonmethod with the improved fuzzy clustering algorith Mis presented.Themethod uses traditional transverse and longitudinal comparison to process largevariables load and themissing load firstly.Secondly,the objective function of fuzzy C-meansmethod is improved and the particle swar Moptimization algorith Mis introduced to get the improved fuzzy clustering algorithm.The characteristic curve is gained by curve clustering.Finally the bad data are corrected by using the characteristic curve.Example analysis indicates that the newmethod achievesa good resultand verifies the effectivenessof the newmethod.
data processing;bad data;fuzzy C-meansclustering;particle swar Malgorithm
TM715
A
1003-8930(2015)07-0078-06
10.3969/j.issn.1003-8930.2015.07.14
常鮮戎(1956—),男,博士,教授,研究方向?yàn)殡娏ο到y(tǒng)分析與控制。Email:changxr1@sina.com
2013-12-24;
2014-03-26
孫景文(1991—),男,碩士研究生,研究方向?yàn)殡娏ο到y(tǒng)分析與控制。Email:championsun1@163.com