楊菊芳,王 偉
(1.國網(wǎng)南昌市青山湖區(qū)供電公司,江西 南昌 330006;2.國網(wǎng)九江市桑柴區(qū)供電公司,江西 九江 332100)
降低線損是電網(wǎng)企業(yè)降低碳排放的重要途徑,準確識別用戶相別對線損管理至關重要。隨著高速電力線載波(High Speed Power Line Carrier,HPLC)在配網(wǎng)的高比例推廣應用,基于HPLC高頻采集的用戶相別識別愈發(fā)被重視。HPLC具備相位識別能力,但準確性待核實驗證。針對這問題,如何發(fā)揮HPLC優(yōu)勢,確保臺區(qū)用戶相別數(shù)據(jù)準確,是國內(nèi)外學者研究的重點之一。
國內(nèi)外學者對該主題做了相關研究。文獻[1]提出基于HPLC通信模塊可實現(xiàn)臺區(qū)拓撲信息、臺區(qū)相位識別。不足是計算方法不清晰。文獻[2]基于電壓曲線相似度的電力相位識別技術,采用小波分析技術抑制電壓的噪聲信號,利用向量夾角余弦法來識別曲線相似度的電力相位。不足是對電壓波形幅值權(quán)重系數(shù)的選擇缺乏必要的論證。文獻[3]提出通過電壓數(shù)據(jù)相關性算法、灰色關聯(lián)分析算法獲得單相電能表的安裝相別。不足是對樣本量有要求,樣本量少不準確,而且缺乏假設檢驗。文獻[4]提出了一種新的數(shù)據(jù)驅(qū)動相位辨識算法,采用非線性降維算法從電壓時間矩陣中提取特征,采用基于密度的帶噪聲的應用程序空間聚類(DBSCAN)算法將客戶劃分成任意形狀的簇。在IEEE歐洲低壓測試Feeder對算法進行了測試準確度90%以上。不足是計算復雜,準確度需進一步提升。文獻[5]通過電壓相似性判斷和基于Hausdorff距離算法進行相位識別,準確率為78%。不足是準確度需進一步提升,而且Hausdorff距離對兩條曲線整體位置敏感,曲線間的最短距離不敏感[6],對異常點不敏感[7]。電壓曲線存在奇異點,此方法有一定局限性。
以上研究共性問題在于主要對電壓曲線進行相似度分析、相關性分析,準確率不太高,同時缺乏必要的業(yè)務邏輯驗證和假設檢驗分析。因此,文中結(jié)合技術及業(yè)務邏輯,計算電壓、電量曲線的余弦相似度、皮爾遜相關系數(shù),分析臺區(qū)用戶相別,采用K-S假設檢驗評估其準確性,使得用戶相別識別具備技術及業(yè)務分析的有效性。
基于3個維度的分析指標,2個維度的數(shù)據(jù)樣本,構(gòu)建含6個維度特征的用戶相別分析模型。
余弦相似度是通過計算兩個向量的夾角余弦值來評估兩者相似的程度。對向量幅值不敏感,對向量方向敏感。當兩個向量有相同的指向時,余弦相似度的值為1;兩個向量夾角為90°時,余弦相似度的值為0;兩個向量指向完全相反的方向時,余弦相似度的值為-1。余弦相似度計算公式為式(1)。
皮爾遜相關系數(shù)廣泛用于衡量兩個變量之間的相關程度,其值介于-1與1之間。絕對值越大,說明相關性越高,正值表示正相關,負值表示負相關。皮爾遜相關系數(shù)可分別計算電壓曲線、電量曲線相關性,具體見式(2)。
式中,r為皮爾遜相關系數(shù),無量綱分別為向量X、Y的均值。
由于某時間段內(nèi)的電壓、電量曲線分布特性及統(tǒng)計參數(shù)均未知,判斷其差異宜采用非參數(shù)檢驗。K-S檢驗(Kolmogorov-Smirnov test)是一種比較兩組數(shù)據(jù)分布是否存在顯著差異的非參數(shù)檢驗,且對樣本分布形狀差異靈敏[8-9]。文中利用K-S檢驗判斷兩條電壓、電量曲線是否存在顯著差異,驗證臺區(qū)用戶相別準確性。K-S檢驗方法如下:
對樣本F1(x)、F2(x),假設
這里的秦光儀是向孔尚任介紹弘光遺事之人,在《桃花扇》的創(chuàng)作過程中起到了至關重要的作用,但由于文獻闕如,他與孔尚任的關系不得而知。那么“舅翁”是什么意思呢?一般有以下三種說法。
H0:F1(x)、F2(x)分布無顯著差異;
H1:F1(x)、F2(x)分布有顯著差異。
假設D為樣本F1(x)、F2(x)差距最大值:
式中,D(n,α)是顯著水平為α且樣本容量為n時的拒絕臨界值。文中取α=0.05,n=n1=n2=15。當D<D(n,α),p>α則接受H0,否則接受H1。
分別從電壓、電量曲線進行余弦相似度、皮爾遜相關系數(shù)及K-S檢驗計算。
式中,U為電壓樣本;Q為電量樣本;f為余弦相似度函數(shù),同式(1);g為皮爾遜相關系數(shù),同式(2);為K-S檢驗函數(shù),方法為1.3章節(jié)。按照式(5)計算得到6組特征數(shù)據(jù),分析臺區(qū)用戶相別,如圖1所示。
圖1 多維特征分析
首先采集臺區(qū)關口及用戶的電壓、電量曲線數(shù)據(jù),構(gòu)建計算樣本矩陣,根據(jù)式(1)至式(4)開展皮爾遜相關系數(shù)、余弦相似度計算,并進行K-S假設檢驗,流程如圖2所示。
圖2 流程圖
皮爾遜相關系數(shù)對方向不敏感,作為相位識別初步參考;余弦相似度對方向敏感,作為相位識別重要依據(jù)。期望:當電壓曲線、電量曲線余弦相似度0.9以上,且K-S假設檢驗接受,則認為相位識別準確和有效。
文中采用臺區(qū)某日經(jīng)過脫敏的電壓數(shù)據(jù),關口電壓曲線如圖3所示,86個用戶電壓曲線如圖4所示。
圖3 臺區(qū)關口電壓
圖4 用戶電壓
圖3中,關口電壓曲線分布隨機,無明顯規(guī)律可循;圖4中,86個用戶電壓曲線呈現(xiàn)典型的聚集特征,輪廓與圖1關口電壓曲線具有趨同性。圖2部分電壓數(shù)據(jù)波動大,距離中心輪廓較遠。采用k-means聚類對用戶電壓曲線數(shù)據(jù)進行分類,如圖5所示。
圖5 用戶電壓數(shù)據(jù)聚類
圖5中,坐標軸均為電壓。發(fā)現(xiàn)存在部分電壓數(shù)據(jù)距離中心位置較遠,即奇異值,與圖4相適應。
臺區(qū)關口及用戶電量曲線如圖6、圖7所示。
圖6 關口電量
圖7 用戶電量
圖6、7中,關口各相電量在部分時間段呈現(xiàn)趨同性,偏差小;大部分用戶電量曲線波動小,個別用戶電量曲線波動大,少數(shù)用戶電量曲線平直或為0。
圖8中,用戶電量聚類發(fā)現(xiàn)多數(shù)用戶電量分布集中,距離中心位置近。少數(shù)用戶距離中心位置較遠,與圖7曲線分布特性吻合。
圖8 用戶電量聚類
根據(jù)式(1)-(5),在Matlab環(huán)境編程,對以上電壓、電量樣本數(shù)據(jù)進行余弦相似度、皮爾遜相關系數(shù)計算,開展K-S檢驗,如表1所示。
表1 相位識別結(jié)果
表1中,A相準確率偏低??偟臏蚀_率均值為90.56%,符合期望。工程實際中,由于用戶電能表存在時鐘不同步、0電量、恒定電量、電量小微波動等因素的干擾,表現(xiàn)為用戶電壓曲線平移、電量曲線平直或曲線波動不明顯。皮爾遜相關系數(shù)、余弦相似度對此狀態(tài)無法準確識別。
文中結(jié)合技術及業(yè)務邏輯,計算電壓曲線及電量曲線的余弦相似度、皮爾遜相關系數(shù),并采用K-S假設檢驗,分析臺區(qū)用戶相別,準確率符合預期,得出以下結(jié)論。
1)對電壓、電量曲線進行皮爾遜相關性、余弦相似度分析及K-S檢驗,可提高相別識別的準確度,在工程實際中有借鑒意義。
2)在時鐘不同步導致電壓曲線平移,以及在電量曲線平直的狀態(tài)下,對相關系數(shù)、余弦相似度的計算造成明顯干擾,導致結(jié)論錯誤。在以后研究中進一步拓延伸。