曹 晶,謝文浩,周志飛,劉旭陽(yáng)
(1.國(guó)網(wǎng)湖南省電力公司,長(zhǎng)沙 410004;2.國(guó)網(wǎng)湖南供電服務(wù)中心(計(jì)量中心),長(zhǎng)沙 410004)
配電網(wǎng)結(jié)構(gòu)相對(duì)復(fù)雜,存在拓?fù)涠嘧?、監(jiān)測(cè)難度大以及整定難度大的問(wèn)題。隨著配電網(wǎng)應(yīng)用范圍和用戶數(shù)量不斷上升,配網(wǎng)線損問(wèn)題也越來(lái)越嚴(yán)重。配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)缺失不僅會(huì)影響配電網(wǎng)的運(yùn)行、調(diào)度、分析等工作,還對(duì)線路運(yùn)行質(zhì)量造成了一定程度的損害,導(dǎo)致配電網(wǎng)工作效率和質(zhì)量有所下降。
在配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)累積量較多的現(xiàn)狀下,文獻(xiàn)[1]提出基于次序依賴的配電網(wǎng)數(shù)據(jù)自動(dòng)填補(bǔ)修復(fù)模型構(gòu)建方法,但方法逐步查找計(jì)算的工作量較大,應(yīng)用在實(shí)際電網(wǎng)線損檢測(cè)中不易實(shí)現(xiàn);文獻(xiàn)[2]提出基于DBSCAN 二次聚類的配電網(wǎng)缺失數(shù)據(jù)填補(bǔ)方法,由于配電網(wǎng)中不只存在一種屬性數(shù)據(jù),是多種數(shù)據(jù)疊加,特征規(guī)律難以查找和捕捉,運(yùn)用該方法進(jìn)行數(shù)據(jù)缺失填補(bǔ)的誤差較大。
結(jié)合上述分析,本文以配網(wǎng)線損的數(shù)據(jù)損失函數(shù)為基礎(chǔ),提出基于加權(quán)類平均的配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)缺失自適應(yīng)填補(bǔ)方法,并通過(guò)實(shí)驗(yàn)驗(yàn)證了該方法的有效性。
本文采用聚類算法對(duì)配網(wǎng)線損全部數(shù)據(jù)進(jìn)行聚類處理,具體操作步驟如下:
(1)將配電線路中特征表現(xiàn)最為明顯的線損點(diǎn)作為數(shù)據(jù)樣本X={x1,x2,…,xn}(n 為樣本數(shù)量),將樣本數(shù)據(jù)的線損特征作為無(wú)量綱指標(biāo)[3],選用極值法對(duì)全部數(shù)據(jù)進(jìn)行無(wú)量綱化處理。
(2)以步驟(1)預(yù)處理后的線損數(shù)據(jù)特征作為初始輸入值,將樣本集X 劃分為c(c>1)個(gè)類別,以此實(shí)現(xiàn)數(shù)據(jù)聚類。根據(jù)求得的每個(gè)樣本的隸屬度[4]uij值,計(jì)算其與聚類中心vi的距離,通過(guò)距離判定數(shù)據(jù)的所屬類別范圍。聚類目標(biāo)函數(shù)JFCM為
(3)結(jié)合上述分析輸出最終配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)聚類結(jié)果。按照上述過(guò)程,通過(guò)初始數(shù)據(jù)輸入求得配電線路中目標(biāo)點(diǎn)距線損點(diǎn)的距離值,根據(jù)該距離值設(shè)定線損影響范圍,可以為后續(xù)的數(shù)據(jù)缺失自適應(yīng)調(diào)補(bǔ)奠定堅(jiān)實(shí)的基礎(chǔ)。
本文通過(guò)分析配網(wǎng)線損數(shù)據(jù)特征,建立損失函數(shù)[7],通過(guò)損失函數(shù)盡可能找到缺失數(shù)據(jù)的真實(shí)區(qū)域,提高填補(bǔ)精準(zhǔn)性。損失函數(shù)f(x)定義為
為了提升數(shù)據(jù)質(zhì)量,需要保證配網(wǎng)線損缺失數(shù)據(jù)損失函數(shù)最小化,結(jié)果如下:
對(duì)于真實(shí)樣本y 而言,要想提高配網(wǎng)線損計(jì)算的準(zhǔn)確性,需要確保輸出結(jié)果D(G(z))與期望結(jié)果之間的貼合度足夠大,此時(shí),線損計(jì)算結(jié)果才能不斷逼近真實(shí)值。
將損失函數(shù)f(x)逼近問(wèn)題轉(zhuǎn)換為min-max 可得到:
由于配電網(wǎng)數(shù)據(jù)具有實(shí)時(shí)變化特性[10],需要不斷更新并輸入特征計(jì)算,這樣求得的損失結(jié)果才更貼近真實(shí)值,結(jié)合該結(jié)果進(jìn)行缺失數(shù)據(jù)區(qū)域定位。
在定位配網(wǎng)線損數(shù)據(jù)缺失數(shù)據(jù)區(qū)域后,計(jì)算不同數(shù)據(jù)之間的相似度[11]。通過(guò)相似度判定可大大降低多次查找效率,即可根據(jù)一組缺失數(shù)據(jù)的屬性分析,查找與其存在正向關(guān)聯(lián)的數(shù)據(jù),提高配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)缺失自適應(yīng)填補(bǔ)效率[12]。
設(shè)An、Bn為同一聚類簇中的2 條缺失數(shù)據(jù)記錄,其中αi、βi為數(shù)據(jù)i 的不同的屬性值,將二者之間的損失量定義為
αi、βi的相似度定義為
式中:lmax表示數(shù)據(jù)i 屬性相似性最大差異。通過(guò)式(8)可得到配網(wǎng)線損缺失數(shù)據(jù)的基本取值范圍Si(αi,βi)為0~1 之間,查找損失量最大且與該樣本相似性最高的數(shù)據(jù)點(diǎn)即可判定缺失點(diǎn)位置。
本文以缺失數(shù)據(jù)的屬性特征、采樣點(diǎn)數(shù)量以及缺失連續(xù)性為參照基礎(chǔ),采取針對(duì)性的填補(bǔ)策略。缺失數(shù)據(jù)采樣點(diǎn)和連續(xù)性對(duì)配電網(wǎng)的影響如圖1所示。
圖1 缺失數(shù)據(jù)采樣點(diǎn)和連續(xù)性對(duì)配電網(wǎng)的影響Fig.1 Impact of missing data sampling points and continuity on distribution networks
由圖1 可知,當(dāng)缺失數(shù)據(jù)數(shù)量出現(xiàn)大范圍變化時(shí),會(huì)造成電網(wǎng)其他區(qū)域的數(shù)據(jù)缺失,其中采樣點(diǎn)連續(xù)性的整體影響面較大。根據(jù)不同狀態(tài)下的配電區(qū)域缺失數(shù)據(jù)變化,結(jié)合上述過(guò)程的相似性數(shù)據(jù)判定分析,將缺失數(shù)據(jù)集狀態(tài)矩陣表示為
若狀態(tài)矩陣參數(shù)xij(i=1,2,…,n;j=1,2,…,m)為配網(wǎng)線損缺失數(shù)據(jù)項(xiàng),配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)缺失自適應(yīng)填補(bǔ)的實(shí)現(xiàn)過(guò)程如下:將第j 個(gè)配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)與其他相關(guān)聯(lián)屬性數(shù)據(jù)組成K 個(gè)組,假設(shè)缺失數(shù)據(jù)xij在第k(k=1,2,…,K)組中,此時(shí),對(duì)缺失數(shù)據(jù)xij的填補(bǔ)數(shù)據(jù)方差為
式中:E 表示期望變量;Y2表示自適應(yīng)填補(bǔ)參數(shù)。通常情況下,在配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)缺失進(jìn)行自適應(yīng)填補(bǔ)時(shí),由于缺失屬性判定不一致導(dǎo)致的填補(bǔ)誤差較大,且過(guò)于粗糙。針對(duì)該問(wèn)題,采用加權(quán)類平均填補(bǔ)法,賦予每組缺失數(shù)據(jù)不同的損失函數(shù)權(quán)重,按照權(quán)重匹配實(shí)現(xiàn)配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)缺失精確化填補(bǔ),表達(dá)公式為
式中:ωk表示該組數(shù)據(jù)的填補(bǔ)權(quán)重;μk表示修正系數(shù)。通過(guò)上述過(guò)程,可以實(shí)現(xiàn)配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)缺失自適應(yīng)填補(bǔ),且所需運(yùn)算較少,通過(guò)賦予每組缺失數(shù)據(jù)不同的權(quán)重確保了填補(bǔ)的精準(zhǔn)性,整體實(shí)用價(jià)值較高。
為驗(yàn)證文中提出配網(wǎng)線損在線監(jiān)測(cè)缺失數(shù)據(jù)自適應(yīng)填補(bǔ)方法的有效性,選取2022 年5 月1 日~6 月1 日間某地區(qū)的配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)。為提高缺失數(shù)據(jù)填補(bǔ)效果的對(duì)比性,在原本不存在缺失數(shù)據(jù)的原始數(shù)據(jù)集中設(shè)置有25%的監(jiān)測(cè)數(shù)據(jù)缺失,缺失區(qū)域有5 個(gè)。實(shí)驗(yàn)數(shù)據(jù)相關(guān)參數(shù)如表1 所示。
表1 實(shí)驗(yàn)數(shù)據(jù)相關(guān)參數(shù)Tab.1 Experimental data related parameters
以上文數(shù)據(jù)集為基礎(chǔ),運(yùn)用本文聚類方法進(jìn)行缺失區(qū)域定位,缺失區(qū)域定位結(jié)果如圖2 所示。
圖2 缺失區(qū)域的定位Fig.2 Location of missing areas
通過(guò)圖2 可以看出,本文方法很好地定位出5個(gè)數(shù)據(jù)缺失區(qū)域,定位效果較好。
將基于次序依賴的配電網(wǎng)損壞數(shù)據(jù)自動(dòng)填補(bǔ)算法、基于DBSCAN 二次聚類的配電網(wǎng)缺失數(shù)據(jù)修補(bǔ)法作為實(shí)驗(yàn)對(duì)比方法,并將未填補(bǔ)前配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)作為參照,實(shí)現(xiàn)精準(zhǔn)比對(duì),實(shí)驗(yàn)結(jié)果如圖3~圖6 所示。
圖3 未填補(bǔ)前配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)變化Fig.3 Changes in online monitoring data of distribution line loss before filling
圖4 次序依賴法填補(bǔ)后的數(shù)據(jù)變化Fig.4 Data changes after filling in the order dependency method
圖5 DBSCAN 二次聚類法填補(bǔ)后數(shù)據(jù)變化Fig.5 Data changes after filling in DBSCAN secondary clustering method
圖6 本文方法填補(bǔ)后數(shù)據(jù)變化Fig.6 Data changes after filling in the method in this article
分析未進(jìn)行自適應(yīng)填補(bǔ)前配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)變化情況可知,整體呈現(xiàn)較為混亂的變動(dòng)趨勢(shì),線損電量曲線存在較大空缺和留白,不存在規(guī)律變化,說(shuō)明受缺失數(shù)據(jù)影響,電網(wǎng)運(yùn)行不穩(wěn)定。經(jīng)過(guò)3 種方法的自適應(yīng)填補(bǔ)后,線損電量曲線得到明顯的改善,但從細(xì)節(jié)對(duì)比可發(fā)現(xiàn),本文的填補(bǔ)效果表現(xiàn)最佳,填補(bǔ)節(jié)點(diǎn)位置與原始數(shù)據(jù)缺失位置一致,填補(bǔ)后線損電量分布更為規(guī)律,更加穩(wěn)定;而另外2 種方法填補(bǔ)效果明顯不佳,填補(bǔ)位置與實(shí)際缺失位置不匹配,存在一定的填補(bǔ)誤差,精準(zhǔn)度較低,實(shí)用效果不佳,應(yīng)用價(jià)值較低。
3 種方法填補(bǔ)結(jié)果的絕對(duì)誤差值與相對(duì)誤差值對(duì)比結(jié)果如表2 與表3 所示。
表2 3 種方法的絕對(duì)誤差值比較Tab.2 Comparison of absolute error values of three methods
表3 3 種方法的相對(duì)誤差值比較Tab.3 Comparison of relative error values of three methods
分析表2 與表3 中的數(shù)據(jù)可知,與次序依賴法、DBSCAN 二次聚類法這2 種方法相比,本文方法的配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)缺失自適應(yīng)填補(bǔ)結(jié)果的絕對(duì)誤差值與相對(duì)誤差值均保持在較低的水平,說(shuō)明本文方法的填補(bǔ)效果更好。
本文以配網(wǎng)線損在線監(jiān)測(cè)數(shù)據(jù)缺失情況為基礎(chǔ),采用加權(quán)類平均算法進(jìn)行自適應(yīng)填補(bǔ)研究,得出以下幾點(diǎn)結(jié)論:①本文考慮到電網(wǎng)在線監(jiān)測(cè)數(shù)據(jù)量較大,基數(shù)較高,缺失數(shù)據(jù)種類較多的問(wèn)題,在進(jìn)行填補(bǔ)前,采用聚類算法對(duì)數(shù)據(jù)進(jìn)行聚類處理,形成包含同種屬性的聚類簇,通過(guò)查找損失量最大且與該樣本相似性最高的數(shù)據(jù)點(diǎn)確定缺失點(diǎn)位置;②采用加權(quán)類平均填補(bǔ)法賦予每組缺失數(shù)據(jù)不同的權(quán)重,通過(guò)權(quán)重匹配實(shí)現(xiàn)數(shù)據(jù)缺失自適應(yīng)填補(bǔ)。實(shí)驗(yàn)數(shù)據(jù)證明,本文方法對(duì)自適應(yīng)填補(bǔ)效果較好,填補(bǔ)后電網(wǎng)運(yùn)行更穩(wěn)定,且填補(bǔ)結(jié)果的絕對(duì)誤差值與相對(duì)誤差值均保持在較低的水平,實(shí)際應(yīng)用效果好。