耿俊成,張小斐,郭志民,孫玉寶
(1.國網(wǎng)河南省電力公司電力科學(xué)研究院,鄭州450052;
2.南京信息工程大學(xué)江蘇省大數(shù)據(jù)分析技術(shù)重點(diǎn)實(shí)驗(yàn)室,南京210044)
電網(wǎng)公司通常使用電網(wǎng)GIS平臺(tái)維護(hù)配電網(wǎng)拓?fù)浣Y(jié)構(gòu),主要包括電力用戶與臺(tái)區(qū)變壓器的拓?fù)溥B接關(guān)系,配變與饋線的拓?fù)溥B接關(guān)系[1]。配電網(wǎng)拓?fù)浣Y(jié)構(gòu)對(duì)95598報(bào)修定位、配電網(wǎng)故障研判、停電計(jì)劃優(yōu)化管理等業(yè)務(wù)都有著重要意義,但由于GIS平臺(tái)的配電網(wǎng)拓?fù)浣Y(jié)構(gòu)數(shù)據(jù)缺失或存在很多錯(cuò)誤,嚴(yán)重影響了上述業(yè)務(wù)正常開展。為了校驗(yàn)和修改這些錯(cuò)誤,電網(wǎng)公司的通常做法是:當(dāng)配電網(wǎng)實(shí)際拓?fù)浣Y(jié)構(gòu)發(fā)生變化時(shí),需要人工記錄這些變化并更新GIS平臺(tái)相關(guān)數(shù)據(jù),或者專門組織人力實(shí)地巡測修正這些錯(cuò)誤。這些方法既耗費(fèi)大量的人力、時(shí)間,準(zhǔn)確性又不夠。
針對(duì)配電網(wǎng)拓?fù)浣Y(jié)構(gòu)校驗(yàn),很多專家學(xué)者已經(jīng)提出了較好的研究思路。在配電網(wǎng)中,由于各處負(fù)荷的不確定性,電壓經(jīng)常在波動(dòng)。電氣距離比較近的負(fù)荷,其電壓波動(dòng)曲線比較相似(相關(guān)度高),而電氣距離比較遠(yuǎn)的負(fù)荷,其電壓波動(dòng)曲線相似度比較低(相關(guān)度低)[2]。文獻(xiàn)[3-5]提出通過比較不同電力用戶智能電能表電壓曲線之間的相關(guān)系數(shù),檢驗(yàn)兩個(gè)用戶是否屬于同一個(gè)臺(tái)區(qū)。采用相關(guān)系數(shù)比較電壓曲線相似性對(duì)電壓數(shù)據(jù)質(zhì)量要求高,同時(shí)又很難確定一個(gè)相關(guān)系數(shù)的閥值判斷兩個(gè)用戶是否屬于同一個(gè)臺(tái)區(qū)。本文提出使用一種基于離散Fréchet距離和剪輯近鄰算法的配電網(wǎng)拓?fù)浣Y(jié)構(gòu)校驗(yàn)方法,通過離散Fréchet距離計(jì)算不同用戶智能電表電壓曲線的相似性,進(jìn)而運(yùn)用剪輯近鄰法快速檢驗(yàn)配電網(wǎng)的拓?fù)浣Y(jié)構(gòu),并以某電網(wǎng)公司的實(shí)際數(shù)據(jù)對(duì)算法進(jìn)行驗(yàn)證,取得了良好的應(yīng)用效果。
電網(wǎng)GIS平臺(tái)里配電網(wǎng)拓?fù)潢P(guān)系存在問題主要有以下2種:(1)未記錄用戶所屬的臺(tái)區(qū)或未記錄配變所屬的饋線;(2)用戶所屬的臺(tái)區(qū)或配變所屬的饋線記錄錯(cuò)誤,而且通常是把某個(gè)臺(tái)區(qū)用戶錯(cuò)誤地掛接到相鄰臺(tái)區(qū),或者把某個(gè)饋線變壓器錯(cuò)誤掛接到相鄰饋線。近年來隨著智能電能表和用電信息采集系統(tǒng)的全面推廣,電網(wǎng)公司獲取了史無前例的超大量數(shù)據(jù)[6]。某臺(tái)區(qū)智能電能表電壓序列數(shù)據(jù)如圖1所示,其中電能表m03所屬臺(tái)區(qū)關(guān)系標(biāo)識(shí)錯(cuò)誤。從圖中可以看出,電能表m01與m02電壓曲線相似性較高,m03與m01,m02電壓曲線之間相似性較低。通過智能電能表電壓曲線相似性可以對(duì)電力用戶與臺(tái)區(qū)的拓?fù)溥B接關(guān)系進(jìn)行校驗(yàn)。
某臺(tái)區(qū)及其相鄰臺(tái)區(qū)用戶智能電能表電壓曲線相似性分布如圖2所示,其中各對(duì)象之間距離代表它們電壓曲線相似性的大小,距離越大兩條曲線的相似性越低。TG1,TG2,TG3是TG0地理位置上相鄰的臺(tái)區(qū),U1和U2用戶是TG0臺(tái)區(qū)的兩個(gè)用戶,其中U1的所屬臺(tái)區(qū)未記錄,屬于上述問題的第一種情況;U2所屬的臺(tái)區(qū)關(guān)系可能錯(cuò)誤,屬于上述問題的第二種情況。
圖1 某臺(tái)區(qū)智能電能表電壓曲線Fig.1 Distribution of smartmeter voltage curve in a certain area
圖2 某地區(qū)智能電能表電壓曲線相似性分布圖Fig.2 Voltage curves similarity distribution of smartmeters in a certain area
第一種情況,需要對(duì)未記錄其臺(tái)區(qū)關(guān)系的用戶進(jìn)行正確分類,標(biāo)記該用戶所屬的臺(tái)區(qū);或者是對(duì)未記錄其饋線關(guān)系的配變進(jìn)行正確分類,標(biāo)記該用戶所屬的饋線。第二種情況,需要識(shí)別、修正用戶所屬的臺(tái)區(qū)錯(cuò)誤或者配變所屬的饋線錯(cuò)誤。本質(zhì)上,上述兩種情況都可以歸納為校驗(yàn)對(duì)象的分類問題。數(shù)據(jù)挖掘領(lǐng)域中基于距離(相似性)度量的分類技術(shù)可以很好解決配電網(wǎng)用戶、臺(tái)區(qū)之間拓?fù)溥B接關(guān)系的校驗(yàn)問題(配電變壓器與饋線之間拓?fù)溥B接關(guān)系校驗(yàn)相類似,不再重點(diǎn)論述)。
曲線相似性判別在電力行業(yè)有著廣泛的應(yīng)用前景,例如使用曲線相似性判別進(jìn)行負(fù)荷分類[7];使用曲線相似性進(jìn)行電動(dòng)汽車電池健康狀態(tài)診斷[8];使用某地區(qū)電網(wǎng)負(fù)荷曲線相似性判別進(jìn)行負(fù)荷預(yù)測“相似日”的選?。?]。當(dāng)前曲線相似性判別分析方法主要有相似性函數(shù)定義法和特征值法。相似性函數(shù)定義法在判別分析過程需要將曲線表示為相似性函數(shù)。由于曲線通常是由一些無規(guī)律性的離散點(diǎn)組成,將曲線表示為函數(shù)比較困難。特征值法選取曲線的特征參數(shù)進(jìn)行比較分析,簡單易行,效果通常也比較好。本文選取智能電能表電壓曲線關(guān)鍵特征參數(shù)來研究各條曲線之間相似性。
離散Fréchet距離是目前采用特征值法研究曲線相似性判別的主流方法之一,例如文獻(xiàn)[10]將其應(yīng)用到在線手寫簽名的認(rèn)證,文獻(xiàn)[11]將其運(yùn)用在電力用戶用電軌跡的異常識(shí)別,文獻(xiàn)[12]將其應(yīng)用在門極電壓響應(yīng)曲線的相似性度量。本文提出將離散Fréchet距離作為智能電能表電壓曲線之間的相似性度量,進(jìn)而校驗(yàn)配電網(wǎng)拓?fù)溥B接關(guān)系。離散 Fréchet距離具體定義如下:
定義 1[10]:(1)給定一個(gè)有 n個(gè)至高點(diǎn)的多邊形鏈 p=
(2)給定兩個(gè)多邊形鏈 A=
(3)一個(gè)沿著鏈A和 B的組合步W={(Ai,Bi}的花費(fèi)(cost)就是:
則鏈 A和 B間的離散 Fréchet距離為:dF(A,B)=
這個(gè)組合步稱為鏈A和B之間的Fréchet排列。在兩條曲線上的離散點(diǎn)是固定的情況下,可以有很多種不同的Fréchet排列,且每種Fréchet排列都對(duì)應(yīng)一個(gè)相應(yīng)的離散Fréchet距離,然后再根據(jù)實(shí)際應(yīng)用選取最好的 Fréchet排列以及對(duì)應(yīng)的離散 Fréchet距離。
但是上述離散Fréchet距離只是表示出兩條曲線至高點(diǎn)間的距離,對(duì)判別智能電能表電壓曲線的相似性還不夠全面,還需要考慮它們的至低點(diǎn)間的離散 Fréchet距離。
dF(A,B)為兩條智能電能表電壓曲線之間離散Fréchet距離。
KNN是數(shù)據(jù)分析挖掘領(lǐng)域基于距離度量的分類技術(shù),由于其實(shí)現(xiàn)的簡單性,在很多領(lǐng)域得到了廣泛的應(yīng)用。然而由于電網(wǎng)中用戶數(shù)量眾多,在整個(gè)樣本集中搜索K個(gè)近鄰需要耗費(fèi)時(shí)間,效率低下。為此,本文提出基于剪輯最近鄰的用戶與臺(tái)區(qū)拓?fù)溥B接關(guān)系校驗(yàn)方法,首先生成由較少樣本構(gòu)成的剪輯樣本集,進(jìn)而在此樣本集上運(yùn)用KNN算法進(jìn)行快速分類,可以很好地解決配電網(wǎng)用戶、臺(tái)區(qū)之間拓?fù)溥B接關(guān)系的校驗(yàn)問題。
剪輯近鄰法是基于類比學(xué)習(xí),通過將給定的檢驗(yàn)元組和它相似的訓(xùn)練元組進(jìn)行比較來學(xué)習(xí)。設(shè)將已知類別的樣本集 X(N)分為參照集 X(NR)和測試集X(NT))兩部分,這兩部分沒有公共元素,它們的樣本數(shù)各為NR和NT,NR+NT=N。利用參照集 X(NR)中的樣本y1,y2,…,yNR采用K近鄰規(guī)則對(duì)已知類別的測試集 X(NT)中的每個(gè)樣本 x1,x2,…,xNR進(jìn)行分類,并執(zhí)行剪輯操作,若 y0,y1,…,yk是 x∈X(NT)的,剪輯掉不與K個(gè)近鄰中多最多類別同類的x,余下的判別正確的樣本集組成剪輯樣本集X(NTE),之后利用剪輯后的樣本集X(NTE)對(duì)待識(shí)別模式x采用K近鄰規(guī)則進(jìn)行分類[13]。
在配電網(wǎng)拓?fù)潢P(guān)系校驗(yàn)中,電力用戶對(duì)象使用其智能電能表電壓曲線描述,“鄰近性”使用電壓曲線相似性度量;通過比較校驗(yàn)用戶與所屬臺(tái)區(qū)及鄰近臺(tái)區(qū)所有其它用戶的智能電能表電壓曲線相似性,找出該用戶k個(gè)“最近鄰”,進(jìn)而確定該用戶臺(tái)區(qū)類別或檢驗(yàn)該用戶臺(tái)區(qū)類別關(guān)系是否正確。具體工作流程如圖3所示。
使用剪輯近鄰法進(jìn)行配電網(wǎng)拓?fù)溥B接關(guān)系校驗(yàn)時(shí),如果訓(xùn)練對(duì)象的數(shù)目很大,那么計(jì)算的開銷會(huì)很大。電網(wǎng)GIS平臺(tái)里配電網(wǎng)拓?fù)潢P(guān)系存在問題通常是把某個(gè)臺(tái)區(qū)用戶錯(cuò)誤地掛接到相鄰臺(tái)區(qū),所以校驗(yàn)?zāi)撑_(tái)區(qū)用戶的臺(tái)區(qū)類別是否正確時(shí),只需要將該臺(tái)區(qū)及其物理位置上鄰近臺(tái)區(qū)的用戶作為訓(xùn)練樣本集合。
國家電網(wǎng)公司企業(yè)標(biāo)準(zhǔn)《配電網(wǎng)規(guī)劃設(shè)計(jì)技術(shù)導(dǎo)則》明確,220/380 V線路應(yīng)該有明確的供電范圍,A類區(qū)域供電半徑不宜超過150米,B類不宜超過250米,C類不宜超過400米,D類不宜超過500米[14]。兩個(gè)物理位置上鄰近臺(tái)區(qū)如圖4所示,兩臺(tái)配變與它所供電用戶之間距離應(yīng)小于500米,若配變A與配變B之間物理距離小于1 000米,則本文認(rèn)為這兩臺(tái)變壓器是相鄰的,否則不相鄰。
圖3 配電網(wǎng)拓?fù)浣Y(jié)構(gòu)校驗(yàn)工作流程Fig.3 Workflow of distribution network topology verification
圖4 兩個(gè)物理位置上相鄰近的臺(tái)區(qū)Fig.4 Two positioned adjacent transformer areas
目前各省市電網(wǎng)公司都基本完成了配網(wǎng)設(shè)備GIS坐標(biāo)數(shù)據(jù)的采錄工作。根據(jù)兩臺(tái)配電變壓器的經(jīng)緯度坐標(biāo),可計(jì)算出兩者之間的物理距離,具體公式如下:
其中配變 A、B的經(jīng)緯度分別為(jA,wA)(jB,wB),地球半徑為R。
2014年,國家電網(wǎng)公司組織開展了營配貫通工作,希望通過“變電站-線路-配變-用戶”數(shù)據(jù)的采錄和治理,建立準(zhǔn)確的配電網(wǎng)拓?fù)溥B接關(guān)系。目前大部分省市電網(wǎng)公司已基本完成數(shù)據(jù)采錄工作。本文提出的基于離散Fréchet距離和剪輯近鄰法的低壓配電網(wǎng)拓?fù)浣Y(jié)構(gòu)校驗(yàn)方法,在某地市供電公司的營配貫通數(shù)據(jù)核查工作進(jìn)行了試用驗(yàn)證。
(1)根據(jù)電網(wǎng)GIS平臺(tái)配電變壓器的經(jīng)緯度坐標(biāo),利用公式3計(jì)算校驗(yàn)用戶臺(tái)區(qū)變壓器與其它配電變壓器之間的物理距離,根據(jù)合適的距離閥值(根據(jù)經(jīng)驗(yàn)確定為1 000米)搜索校驗(yàn)用戶臺(tái)區(qū)的鄰近臺(tái)區(qū)。
(2)從用電信息采集系統(tǒng)提取校驗(yàn)用戶、所在臺(tái)區(qū)其它用戶、鄰近臺(tái)區(qū)用戶智能電能表最近一天的電壓序列數(shù)據(jù)。例如,某校驗(yàn)用戶智能電能表m01及其訓(xùn)練樣本集合中部分用戶智能電表電壓曲線如圖5所示。
圖5 智能電表電壓曲線Fig.5 Voltage curves of smartmeters
(3)計(jì)算校驗(yàn)用戶智能電能表電壓曲線與訓(xùn)練樣本集合中用戶電壓曲線之間的離散Fréchet距離。
首先將用戶電壓曲線表示成{(i,ui)}i=1…k,其中i是按提取電壓值的時(shí)間順序排列的序列號(hào),ui是采集的電壓值。智能電能表采集間隔一般為15分鐘,若提取一天的電壓數(shù)據(jù),則k=96。
接著,需要找出用戶電壓曲線的至高點(diǎn)與至低點(diǎn)。如果一個(gè)點(diǎn)比前兩個(gè)點(diǎn)電壓值大同時(shí)還比后兩個(gè)點(diǎn)大,就稱它為一個(gè)至高點(diǎn);如果一個(gè)點(diǎn)比前兩個(gè)點(diǎn)電壓值小同時(shí)還比后兩個(gè)點(diǎn)小,就稱它為一個(gè)至低點(diǎn);并將它們表示成 A=<(1,u1),…(m,um)>,其中,(1,u1)…(m,um)是用戶電壓曲線的 m個(gè)至高點(diǎn)(至低點(diǎn))。
然后,可以根據(jù)離散 Fréchet距離的公式(2)計(jì)算檢驗(yàn)用戶電壓曲線與訓(xùn)練樣本集合中用戶電壓曲線之間的離散Fréchet距離。
(4)依據(jù)剪輯近鄰法,剪輯掉不與 k個(gè)離散Fréchet距離最近的近鄰中多最多類別同類的x,余下的判別正確的樣本集組成剪輯樣本集x(NTE)。
(5)基于離散Fréchet距離在剪輯樣本集中選擇出該校驗(yàn)用戶的7個(gè)“最近鄰”(通過實(shí)驗(yàn)k=7效果最佳),具體情況如表1所示。
表1 校驗(yàn)用戶m01的k個(gè)最近鄰Tab.1 The k nearest neighbors of the verified userm01
(6)根據(jù)每個(gè)“最近鄰”與校驗(yàn)用戶之間的離散Fréchet距離值以及每個(gè)“最近鄰”所屬的臺(tái)區(qū)類別,判別出校驗(yàn)用戶的臺(tái)區(qū)類別,進(jìn)而判斷該用戶與臺(tái)區(qū)拓?fù)溥B接關(guān)系是否正確。例如,校驗(yàn)用戶m01的臺(tái)區(qū)類別判斷為XXXXXX5,該用戶與臺(tái)區(qū)拓?fù)溥B接關(guān)系是正確的。
根據(jù)本文提出的校驗(yàn)方法,對(duì)該公司200個(gè)臺(tái)區(qū)23 014用戶的拓?fù)溥B接關(guān)系進(jìn)行校驗(yàn),同時(shí)該公司配電運(yùn)檢人員也進(jìn)行了現(xiàn)場核查,統(tǒng)計(jì)結(jié)果如表2所示。
表2 校驗(yàn)結(jié)果及現(xiàn)場核實(shí)情況Tab.2 Test results and on-site verification
上述校驗(yàn)方法查準(zhǔn)率達(dá)到93.1%。查全率率達(dá)到90%,證明與僅僅依靠人工現(xiàn)場抽查相比,該方法是有效的。出現(xiàn)校驗(yàn)結(jié)果不正確的原因,主要包括:(1)該單位個(gè)別臺(tái)區(qū)拓?fù)溥B接關(guān)系錯(cuò)誤的用戶所占比例較大;(2)該單位用電信息采集系統(tǒng)中的電壓序列數(shù)據(jù)有缺失、不準(zhǔn)確情況。
針對(duì)當(dāng)前電網(wǎng)公司GIS平臺(tái)配電網(wǎng)拓?fù)溥B接關(guān)系缺失或存在錯(cuò)誤的問題,本文提出了一種基于離散Fréchet距離和剪輯近鄰法的低壓配電網(wǎng)拓?fù)浣Y(jié)構(gòu)校驗(yàn)方法?;陔娋W(wǎng)GIS平臺(tái)配變經(jīng)緯度坐標(biāo)數(shù)據(jù)計(jì)算校驗(yàn)用戶臺(tái)區(qū)變壓器與該地區(qū)其它變壓器之間的距離,搜索校驗(yàn)用戶的鄰近臺(tái)區(qū)。通過計(jì)算待校驗(yàn)用戶與所在臺(tái)區(qū)其它用戶、鄰近臺(tái)區(qū)所有用戶之間智能電能表電壓曲線離散Fréchet距離,計(jì)算不同用戶智能電表電壓曲線的相似性,進(jìn)而運(yùn)用剪輯近鄰法快速檢驗(yàn)配電網(wǎng)的拓?fù)浣Y(jié)構(gòu),并以某電網(wǎng)公司的實(shí)際數(shù)據(jù)對(duì)算法進(jìn)行驗(yàn)證,取得了良好的應(yīng)用效果。