馬洲俊,黃 偉,牛軍偉,朱 紅,韋 磊,孫國(guó)強(qiáng),臧海祥
(1.國(guó)網(wǎng)江蘇省電力有限公司 南京供電分公司,江蘇 南京 210019;2.河海大學(xué) 能源與電氣學(xué)院,江蘇 南京 211100)
隨著社會(huì)經(jīng)濟(jì)的大力發(fā)展和人民生活水平的提高,用電量增大,低壓臺(tái)區(qū)線損治理變得日益復(fù)雜[1]。為了加快智能電網(wǎng)的建設(shè),充分挖掘配電側(cè)數(shù)據(jù)資源,提高供電服務(wù)質(zhì)量和客戶滿意度[2-3],傳統(tǒng)的管理方式已經(jīng)不再適用,精益化管理方式成了一種新趨勢(shì)[4];然而,臺(tái)區(qū)在經(jīng)過(guò)線路改造和市政工程時(shí)經(jīng)常出現(xiàn)配變的增換,導(dǎo)致臺(tái)區(qū)間線路交叉,系統(tǒng)中戶變檔案未及時(shí)更新而出錯(cuò),嚴(yán)重制約著精益化管理[5]。
為了解決上述臺(tái)區(qū)中存在的戶變關(guān)系檔案錯(cuò)誤問(wèn)題,電力公司主要通過(guò)人工排查,傳統(tǒng)的排查方法有現(xiàn)場(chǎng)停電校驗(yàn)[6]和載波通信校驗(yàn)[7]兩種?,F(xiàn)場(chǎng)停電校驗(yàn)是通過(guò)使各個(gè)變壓器在短時(shí)間內(nèi)停電,然后抄讀電表停電記錄,再通過(guò)電表的停電時(shí)間來(lái)判斷各個(gè)電表的戶變關(guān)系,不過(guò)這種方式需要拉閘驗(yàn)電,影響了人們正常的用電生活、用電體驗(yàn)和供電可靠性。載波通信校驗(yàn)方法是使用載波通信終端和用戶側(cè)接收端進(jìn)行載波通信,通過(guò)分析報(bào)文特性來(lái)判斷戶變關(guān)系[8],該方法魯棒性較差,易受干擾,識(shí)別的準(zhǔn)確率僅為70%~80%,不能夠在負(fù)荷波動(dòng)較大的臺(tái)區(qū)進(jìn)行。因此,研究一種可靠、自動(dòng)的戶變關(guān)系辨識(shí)方法十分重要[9-10]。
近年來(lái),我國(guó)全面建設(shè)堅(jiān)強(qiáng)智能電網(wǎng)[11],基本實(shí)現(xiàn)了臺(tái)區(qū)智能電表的全覆蓋,積累了大量的數(shù)據(jù)并且提升了采集數(shù)據(jù)的質(zhì)量[12],為臺(tái)區(qū)拓?fù)浣Y(jié)構(gòu)的分析提供了基礎(chǔ)[13-15]。目前,已有大量學(xué)者對(duì)臺(tái)區(qū)戶變關(guān)系的識(shí)別進(jìn)行研究,文獻(xiàn)[16]利用多個(gè)臺(tái)區(qū)的數(shù)據(jù),構(gòu)建知識(shí)配電臺(tái)區(qū)圖譜體系來(lái)判斷戶變關(guān)系;文獻(xiàn)[17]通過(guò)皮爾遜相關(guān)系數(shù)和K(特征空間數(shù)量)最近鄰方法判斷戶變之間的電壓曲線相似性,從而進(jìn)行戶變關(guān)系的辨識(shí);文獻(xiàn)[18]提出了一種結(jié)合主成分分析和圖論的方法,利用節(jié)點(diǎn)間的相關(guān)性進(jìn)行戶變關(guān)系識(shí)別。以上方法在戶變關(guān)系識(shí)別領(lǐng)域均取得一定的成績(jī),但上述研究沒(méi)能實(shí)現(xiàn)物聯(lián)配電網(wǎng)理念下的信息物理的深度融合,只針對(duì)單一的特征信息進(jìn)行戶變關(guān)系識(shí)別,缺少根據(jù)用戶多特征信息進(jìn)行綜合判斷,沒(méi)能充分發(fā)掘出用戶側(cè)采集的數(shù)據(jù)價(jià)值,且對(duì)于海量的低壓臺(tái)區(qū),無(wú)法兼顧每個(gè)臺(tái)區(qū)的特點(diǎn),適用性和有效性不高。
在此背景下,綜合考慮用電量和電壓兩種特征信息,提出了一種基于用電量和電壓信息融合的戶變關(guān)系辨識(shí)方法,首先,提出了熱重啟隨機(jī)梯度下降法(SGDR),并應(yīng)用于戶變關(guān)系識(shí)別,根據(jù)臺(tái)區(qū)總表用電量和用戶用電量守恒,構(gòu)建臺(tái)區(qū)用電量參數(shù)化模型,利用隨機(jī)梯度迭代和學(xué)習(xí)率自調(diào)整方法求全局最優(yōu)解進(jìn)行初步辨識(shí),并利用滑動(dòng)時(shí)間窗多次判斷得到初步戶變識(shí)別結(jié)果;然后,基于初步識(shí)別結(jié)果,使用戶變關(guān)系正常用戶的電壓數(shù)據(jù)構(gòu)成訓(xùn)練樣本,利用一類支持向量機(jī)(OC-SVM),學(xué)習(xí)臺(tái)區(qū)戶變關(guān)系正常用戶的電壓特征,構(gòu)建戶變關(guān)系識(shí)別模型,得到最終戶變關(guān)系檔案錯(cuò)誤的用戶,實(shí)現(xiàn)對(duì)低壓臺(tái)區(qū)戶變關(guān)系的正確辨識(shí);最后,通過(guò)對(duì)實(shí)際臺(tái)區(qū)數(shù)據(jù)進(jìn)行測(cè)試,結(jié)果表明所提方法可以對(duì)臺(tái)區(qū)戶變關(guān)系有效識(shí)別,驗(yàn)證了該方法的實(shí)用性和可靠性。
電力系統(tǒng)臺(tái)區(qū)之間的交叉線路十分復(fù)雜,由于線路改造等原因,未及時(shí)更新臺(tái)區(qū)戶變關(guān)系檔案,可能存在不屬于該臺(tái)區(qū)的用戶,即戶變關(guān)系檔案出現(xiàn)錯(cuò)誤[19],造成營(yíng)銷計(jì)量系統(tǒng)中臺(tái)區(qū)總表用電量和用戶用電量不一致,出現(xiàn)臺(tái)區(qū)線損異常,因此要對(duì)戶變關(guān)系進(jìn)行識(shí)別,重新調(diào)整檔案,有利于臺(tái)區(qū)線損的精益化管理。
臺(tái)區(qū)用電量數(shù)據(jù)為累積量,可以反映戶變的邏輯加和關(guān)系[20],因此根據(jù)能量守恒定律建立關(guān)口表用電量和各用戶用電量之間的關(guān)系模型,如式(1)所示。
(1)
在同一臺(tái)區(qū)里,總線損和關(guān)口表總用電量是正相關(guān)的,而總的用電量是由各用戶用電量相加而成,其總線損在計(jì)算時(shí)可以近似分?jǐn)偨o各用戶,總線損由n個(gè)用戶的分線損組成,各個(gè)用戶的分線損與其用電量相關(guān),如式(2)所示。
(2)
式中:bi為線損系數(shù),表示該用戶分線損在用電量中的占比,實(shí)際中bi近似為固定值。
而ai和bi均為用電量系數(shù),可用ci=ai+bi簡(jiǎn)化用電量系數(shù),式(1)可以簡(jiǎn)寫成式(3)。
(3)
在用電量守恒的條件下,如果能找到一組數(shù)據(jù)使得式(3)成立,那么此時(shí)的ci表示的就是這個(gè)臺(tái)區(qū)正確的戶變關(guān)系。由于待求解方程式(3)維度較大,沒(méi)有固定的求解方法,只能用迭代求解的方法逼近可行解,常用的方法是以最小化方程組誤差的平方為目標(biāo)函數(shù),使用梯度下降的方法逐漸逼近可行解。
因此,構(gòu)造目標(biāo)函數(shù)E,即每個(gè)時(shí)間段臺(tái)區(qū)用電總量減去用戶用電量的平方和,如式(4)所示,當(dāng)E最小時(shí),ci即為模型的最優(yōu)解。
(4)
式中:Xt為第t天n個(gè)用戶構(gòu)成的用電量矩陣;Cs為第s次迭代所對(duì)應(yīng)的用電量系數(shù)矩陣。
此時(shí),基于用電量的戶變關(guān)系識(shí)別問(wèn)題轉(zhuǎn)化為求解目標(biāo)函數(shù)E最小值的優(yōu)化問(wèn)題,使用熱重啟隨機(jī)梯度下降法[21]求解該問(wèn)題,將隨機(jī)梯度下降優(yōu)化算法與熱重啟機(jī)制、余弦退火相結(jié)合,在保證較快訓(xùn)練速度的前提下,反復(fù)重啟來(lái)促使模型快速收斂找到全局最優(yōu)解,從而在提高模型性能的同時(shí)也降低訓(xùn)練成本。
求解目標(biāo)函數(shù)E對(duì)用戶用電量系數(shù)的梯度,如式(5)所示。
(5)
式中:X′t為修正后的第t天n個(gè)用戶構(gòu)成的用電量矩陣。
根據(jù)當(dāng)前的步長(zhǎng)和梯度方向,更新用電量的系數(shù),如式(6)所示。
(6)
式中:η為學(xué)習(xí)率。
因?yàn)樵撃P偷哪繕?biāo)函數(shù)是多峰的,除了全局最優(yōu)解外還有多個(gè)局部最優(yōu)解,當(dāng)陷入局部最優(yōu)時(shí),通過(guò)熱重啟方式突然提高學(xué)習(xí)率η,離開(kāi)局部最優(yōu)處,繼續(xù)尋找全局最優(yōu)解。余弦退火方法使用余弦函數(shù)作為周期函數(shù),在每個(gè)周期最大值時(shí)重新開(kāi)始學(xué)習(xí),一開(kāi)始的學(xué)習(xí)率較大,模型不會(huì)陷入局部最優(yōu),而是快速尋找最優(yōu)解,隨著學(xué)習(xí)率變小,模型會(huì)最終收斂到最優(yōu)解處。熱重啟結(jié)合余弦退火的學(xué)習(xí)率調(diào)整公式如式(7)所示。
(7)
式中:j為迭代次數(shù);ηmax為學(xué)習(xí)率調(diào)整過(guò)程中的上限;ηmin為學(xué)習(xí)率調(diào)整過(guò)程中的下限;Tcur為每次重啟開(kāi)始到結(jié)束這一區(qū)間學(xué)習(xí)率的迭代次數(shù);Tj為重啟周期,其學(xué)習(xí)率隨迭代次數(shù)自適應(yīng)調(diào)整,如圖1所示[22]。
圖1 熱重啟機(jī)制結(jié)合余弦退火的學(xué)習(xí)率變化
綜上,即為基于用電量的熱重啟隨機(jī)梯度下降模型,迭代的終值Ci即為得出的戶變關(guān)系結(jié)果。
在第1.1節(jié)用電量模型的基礎(chǔ)上,每個(gè)用戶的用電量會(huì)受到隨機(jī)用電行為的影響,利用熱重啟隨機(jī)梯度下降法,若只在一個(gè)時(shí)間窗內(nèi)進(jìn)行計(jì)算會(huì)產(chǎn)生較大的誤差,會(huì)遺漏識(shí)別戶變關(guān)系錯(cuò)誤的用戶。因此,采用基于滑動(dòng)時(shí)間窗的多次判斷方法,將歷史數(shù)據(jù)劃分為多個(gè)時(shí)間窗,每次取不同的起始日期進(jìn)行多次求解,如圖2所示。
Di為第i天的用戶用電特性
為了避免因用戶用電特性差異導(dǎo)致的核查遺漏問(wèn)題,每個(gè)時(shí)間窗進(jìn)行優(yōu)化求解后得到一組戶變關(guān)系識(shí)別結(jié)果,然后將所有結(jié)果取并集,得到最終的戶變隸屬關(guān)系。
在識(shí)別臺(tái)區(qū)戶變關(guān)系檔案錯(cuò)誤的用戶時(shí),檔案錯(cuò)誤的用戶數(shù)量應(yīng)該相較于正常用戶占比非常少,這就屬于一個(gè)不均衡樣本數(shù)據(jù)。對(duì)不均衡樣本進(jìn)行異常數(shù)據(jù)的檢測(cè)時(shí),為了防止過(guò)擬合,不能采用二類的算法。因此,對(duì)臺(tái)區(qū)戶變關(guān)系的識(shí)別就屬于非均衡樣本數(shù)據(jù)分類或者是異常用戶的檢測(cè),應(yīng)采用一類的算法。
由于低壓臺(tái)區(qū)數(shù)量極多且每個(gè)臺(tái)區(qū)的用電信息特點(diǎn)不同,使用個(gè)別標(biāo)注有正確戶變關(guān)系的臺(tái)區(qū)數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練得到的模型,無(wú)法適應(yīng)所有臺(tái)區(qū)戶變關(guān)系檔案錯(cuò)誤用戶的識(shí)別。因此,用來(lái)測(cè)試的數(shù)據(jù)集是不提供標(biāo)簽的,識(shí)別的方法屬于無(wú)監(jiān)督學(xué)習(xí)方法。一類支持向量機(jī)(OC-SVM)是在傳統(tǒng)支持向量機(jī)基礎(chǔ)上,為解決一類問(wèn)題所設(shè)計(jì)出的一種無(wú)監(jiān)督學(xué)習(xí)方法。OC-SVM會(huì)自動(dòng)尋找能夠包含絕大多數(shù)原始數(shù)據(jù)的超平面,在超平面邊界外的數(shù)據(jù)會(huì)被判定為異常數(shù)據(jù)。
OC-SVM將輸入的數(shù)據(jù)通過(guò)核函數(shù)映射到對(duì)應(yīng)的特征空間中,利用特征空間的數(shù)據(jù)建立一個(gè)超平面,并最大限度將它們與原點(diǎn)分離,該算法利用決策函數(shù)f(x)評(píng)估測(cè)試樣本數(shù)據(jù)x落在特征空間中超平面的哪一側(cè)來(lái)確定其為正樣本或負(fù)樣本。為了從原點(diǎn)分離數(shù)據(jù)集,OC-SVM算法的實(shí)質(zhì)為求解式(8)的二次規(guī)劃問(wèn)題[23]。
s.t.ωφ(xi)-ρ≥-ξiξi≥0
(8)
式中:ω為法向量;ν和l分別為用來(lái)調(diào)整比例上限和數(shù)量下限的參數(shù);ρ為截距;φ為非線性映射函數(shù);ωφ(xi)-ρ=0為超平面;‖·‖ 為歐幾里得范數(shù);ξi為松弛變量。
由于ξi在目標(biāo)函數(shù)中受到懲罰,使用ω和ρ來(lái)處理,決策函數(shù)f(x)可以表示為式(9)。
f(x)=sgn(ωφ(x)-ρ)
(9)
f(x)對(duì)于訓(xùn)練集中的大多數(shù)數(shù)據(jù)來(lái)說(shuō)將是積極的,而支持向量類型的正則化項(xiàng)‖ω‖仍然很小。這兩個(gè)目標(biāo)之間的實(shí)際權(quán)衡由ν控制。引入拉格朗日乘子(αi,βi≥0),可得式(10)。
(10)
分別對(duì)ω、ξ與ρ求偏導(dǎo),并令其為0,可得式(11)。
(11)
{xi:i∈[l],αi>0}是支持向量,將其進(jìn)行核展開(kāi),決策函數(shù)變?yōu)槭?12)。
(12)
將式(11)以及核函數(shù)k代入式(10),可將式(8)轉(zhuǎn)化為對(duì)偶問(wèn)題,如式(13)所示。
(13)
決策函數(shù)中,ρ可由任何一個(gè)對(duì)應(yīng)拉格朗日乘子αi非零的樣本xj求得,如式(14)所示。
(14)
則決策函數(shù)為
f(x)=sgn(ωTφ(x)-ρ)=
(15)
對(duì)于決策函數(shù)f(x),當(dāng)樣本x被分類器識(shí)別為該臺(tái)區(qū)用戶時(shí),取值+1;被識(shí)別為異常用戶時(shí),取值-1[24]。
基于電壓信息判斷戶變關(guān)系的方法,使用的數(shù)據(jù)為用戶24 h(采集頻率為1 h/次)的電壓采樣數(shù)據(jù)Uij(j=1,2,…,24),根據(jù)不同臺(tái)區(qū)用戶電壓曲線之間的差異,利用OC-SVM方法,實(shí)現(xiàn)臺(tái)區(qū)戶變關(guān)系的識(shí)別。臺(tái)區(qū)用戶24 h的電壓曲線如圖3所示。
圖3 某臺(tái)區(qū)用戶24 h的電壓曲線
由圖3可以看出:臺(tái)區(qū)戶變關(guān)系正確用戶的電壓曲線具有相同的趨勢(shì),錯(cuò)誤用戶的電壓曲線則不同。選用用戶48 h的電壓采集數(shù)據(jù)作為算法的輸入數(shù)據(jù),既避免了用戶的隨機(jī)用電行為對(duì)戶變關(guān)系識(shí)別的影響,也會(huì)放大戶變關(guān)系正確用戶和錯(cuò)誤用戶電壓曲線之間的差異。臺(tái)區(qū)用戶48 h的電壓曲線如圖4所示。
圖4 某臺(tái)區(qū)用戶兩天的電壓曲線
考慮到OC-SVM法對(duì)異常值較為敏感,其訓(xùn)練集樣本應(yīng)盡可能不被異常值污染或含有較少比例的異常值數(shù)據(jù);然而,在無(wú)法準(zhǔn)確獲取原始數(shù)據(jù)分布假設(shè)的情況下,實(shí)現(xiàn)高維度異常值檢測(cè)極具挑戰(zhàn)。此外,基于用電量的SGDR法進(jìn)行戶變關(guān)系識(shí)別時(shí),需要利用滑動(dòng)時(shí)間窗進(jìn)行多個(gè)時(shí)間段綜合判斷,但是其最優(yōu)時(shí)間窗選取難以確定;隨著時(shí)間窗個(gè)數(shù)增多,查全率和查準(zhǔn)率無(wú)法兼顧,且計(jì)算時(shí)間成本增加。因此,提出了用電量和電壓信息融合的戶變關(guān)系識(shí)別方法,根據(jù)經(jīng)驗(yàn)選取固定個(gè)數(shù)的時(shí)間窗,基于用電量信息,利用SGDR法進(jìn)行戶變關(guān)系的初步識(shí)別,根據(jù)識(shí)別結(jié)果剔除異常用戶,以減少樣本中的異常值,提高OC-SVM法的識(shí)別率和準(zhǔn)確率。
基于用電量和電壓信息融合的戶變關(guān)系識(shí)別方法的流程如圖5所示。
圖5 算法流程
為了驗(yàn)證方法的準(zhǔn)確性,選取江蘇省南京市下轄臺(tái)區(qū)2020年4月份用采系統(tǒng)中的用電量和電壓數(shù)據(jù)作為數(shù)據(jù)集,分別在模擬和真實(shí)場(chǎng)景中進(jìn)行測(cè)試。
3.1.1 SGDR在模擬場(chǎng)景下的測(cè)試
在模擬場(chǎng)景中對(duì)熱重啟隨機(jī)梯度下降法進(jìn)行測(cè)試,模擬場(chǎng)景中所用的數(shù)據(jù)都來(lái)自江蘇省南京市臺(tái)區(qū)A和B。臺(tái)區(qū)A原有103個(gè)用戶,提前經(jīng)人工排查確認(rèn)不存在戶變關(guān)系錯(cuò)誤,現(xiàn)從臺(tái)區(qū)B的非零電量用戶中隨機(jī)挑選4個(gè)放到臺(tái)區(qū)A中作為檔案出錯(cuò)的用戶。使用查全率和查準(zhǔn)率兩個(gè)指標(biāo)來(lái)評(píng)價(jià)戶變關(guān)系識(shí)別方法的效果,兩個(gè)指標(biāo)的計(jì)算如式(16)和(17)所示。
(16)
(17)
基于SGDR的滑動(dòng)時(shí)間窗多次判斷方法,將歷史數(shù)據(jù)劃分成多個(gè)時(shí)間窗,每次取不同的起始日期進(jìn)行多次求解。而具體應(yīng)該使用幾個(gè)時(shí)間窗進(jìn)行綜合判斷,才能保證較高的查全率和查準(zhǔn)率,這在實(shí)際每個(gè)臺(tái)區(qū)的戶變關(guān)系識(shí)別中是不確定的。因此,在模擬場(chǎng)景中選用了不同時(shí)間窗數(shù)量做測(cè)試,選用4月1日—4月6日為一個(gè)時(shí)間窗,4月2日—4月7日為一個(gè)時(shí)間窗,以此類推,對(duì)比查全率和查準(zhǔn)率,測(cè)試結(jié)果如表1所示。
表1 SGDR選用不同時(shí)間窗數(shù)量的測(cè)試結(jié)果
由表1可以看出:選用5、6、7個(gè)時(shí)間窗測(cè)試的查全率都是100%,而選用3、4個(gè)時(shí)間窗的查全率不高,這是因?yàn)樵黾訒r(shí)間窗的個(gè)數(shù)進(jìn)行綜合判斷,會(huì)盡可能把戶變關(guān)系錯(cuò)誤的用戶識(shí)別出來(lái),從而保證了查全率;但是選用的時(shí)間窗個(gè)數(shù)越多,其查準(zhǔn)率也在逐漸下降,并且會(huì)造成戶變關(guān)系識(shí)別的時(shí)間成本增加。在實(shí)際應(yīng)用中,選用多少個(gè)時(shí)間窗進(jìn)行判斷得到效果最好是不確定的,所以只能根據(jù)經(jīng)驗(yàn)選擇。根據(jù)表1的結(jié)果,為了能夠保證較高的查全率和查準(zhǔn)率,之后測(cè)試選取的時(shí)間窗為6個(gè)。
在實(shí)際應(yīng)用中,戶變關(guān)系錯(cuò)誤的用戶個(gè)數(shù)是隨機(jī)的,為了更真實(shí)的模擬實(shí)際情況,得到更具信服力的測(cè)試結(jié)果。因此,在測(cè)試過(guò)程中,從臺(tái)區(qū)B的非零電量用戶中,分別隨機(jī)挑選3、4、5個(gè)放到臺(tái)區(qū)A中,作為檔案錯(cuò)誤的用戶,并且對(duì)檔案錯(cuò)誤戶數(shù)不同的各種情況分別進(jìn)行5次測(cè)試,最后取各自的平均查全率和平均查準(zhǔn)率。模擬場(chǎng)景下的測(cè)試結(jié)果如表2所示。
表2 模擬場(chǎng)景下5次測(cè)試的平均水平
由表2可知:在模擬場(chǎng)景中,本文提出的熱重啟隨機(jī)梯度下降法在基于用電量的情況下,模擬場(chǎng)景可以達(dá)到約96.40%的查全率和91.80%的查準(zhǔn)率。
3.1.2 SGDR在實(shí)際場(chǎng)景下的測(cè)試
在實(shí)際場(chǎng)景中,對(duì)基于熱重啟隨機(jī)梯度下降法進(jìn)行測(cè)試,真實(shí)場(chǎng)景中所用的數(shù)據(jù)來(lái)自江蘇省南京市的臺(tái)區(qū)C、D和E。臺(tái)區(qū)C為某農(nóng)網(wǎng)臺(tái)區(qū),實(shí)際共2戶,現(xiàn)因戶變關(guān)系錯(cuò)誤,有其他臺(tái)區(qū)的2個(gè)用戶。臺(tái)區(qū)D為某農(nóng)網(wǎng)臺(tái)區(qū),實(shí)際共6戶,現(xiàn)因戶變關(guān)系錯(cuò)誤,有其他臺(tái)區(qū)的1個(gè)用戶。臺(tái)區(qū)E為某城網(wǎng)臺(tái)區(qū),實(shí)際共103戶,無(wú)戶變關(guān)系錯(cuò)誤。下面利用SGDR算法進(jìn)行臺(tái)區(qū)戶變關(guān)系校驗(yàn),測(cè)試結(jié)果如表3所示。
表3 真實(shí)場(chǎng)景測(cè)試結(jié)果
上述兩個(gè)農(nóng)網(wǎng)臺(tái)區(qū)測(cè)試的查全率和查準(zhǔn)率都為100.0%,城網(wǎng)臺(tái)區(qū)的查全率為100.0%,查準(zhǔn)率為99.0%,表明該方法在真實(shí)場(chǎng)景中具有一定的可行性。
SGDR法在多次模擬場(chǎng)景中的測(cè)試結(jié)果表明:雖然會(huì)誤判致使查準(zhǔn)率不高,但平均能達(dá)到96%以上的查全率,基本可以找出不屬于該臺(tái)區(qū)的用戶。在真實(shí)場(chǎng)景中也表明該方法有較高的查準(zhǔn)率和查全率,可以配合人工糾正檔案關(guān)系,大大縮小人工排查范圍和提高工作效率。
在實(shí)際情況中,為了解決基于用電量的SGDR方法進(jìn)行多個(gè)時(shí)間窗綜合判斷時(shí),查全率和查準(zhǔn)率的矛盾以及時(shí)間成本增加等問(wèn)題,提出了基于用電量和電壓信息融合的戶變關(guān)系識(shí)別方法。為驗(yàn)證方法的可靠性,同樣在模擬場(chǎng)景下做測(cè)試,場(chǎng)景與第3.1節(jié)相同,由于選用時(shí)間段數(shù)為5、6、7個(gè)時(shí),使用SDGR方法得到的測(cè)試結(jié)果相同,因此,使用SDGR+OC-SVM方法做測(cè)試時(shí),僅選取時(shí)間段數(shù)為3、4、5個(gè),測(cè)試結(jié)果如表4所示。
表4 選用不同時(shí)間段數(shù)的SGDR+OC-SVM測(cè)試結(jié)果
由表4可知:使用SDGR+OC-SVM聯(lián)合判斷的方法,無(wú)論進(jìn)行幾個(gè)時(shí)間段的判斷,查全率總能達(dá)到100%,并且查準(zhǔn)率均在95%以上,平均查準(zhǔn)率為96.7%,在實(shí)際情況中,對(duì)于臺(tái)區(qū)戶變關(guān)系的識(shí)別具有很高的適應(yīng)性和可行性。
同時(shí),為了進(jìn)一步說(shuō)明提出的信息融合的戶變關(guān)系識(shí)別方法的有效性,將所提方法和其他方法進(jìn)行對(duì)比。將SGDR法、OC-SVM法、孤立森林、傳統(tǒng)隨機(jī)梯度下降法的測(cè)試結(jié)果分別與SGDR+OC-SVM方法的測(cè)試結(jié)果進(jìn)行比較,結(jié)果如表5所示。
表5 不同方法測(cè)試結(jié)果比較
由表5可以看出:基于SGDR+OC-SVM信息融合的戶變關(guān)系識(shí)別方法效果最好,不僅提高了查全率和查準(zhǔn)率,在臺(tái)區(qū)戶變關(guān)系識(shí)別的魯棒性和可靠性上也很好,可以較好地應(yīng)用于臺(tái)區(qū)戶變關(guān)系識(shí)別。
為了充分利用配電網(wǎng)用戶側(cè)的海量數(shù)據(jù)資源,提高低壓臺(tái)區(qū)的精益化管理?;诓杉呐_(tái)區(qū)用電量和電壓數(shù)據(jù),提出了一種用電量和電壓信息融合的臺(tái)區(qū)戶變關(guān)系識(shí)別糾錯(cuò)方法。對(duì)實(shí)際臺(tái)區(qū)數(shù)據(jù)進(jìn)行測(cè)試,得到以下結(jié)論:
1)對(duì)單個(gè)臺(tái)區(qū)進(jìn)行戶變關(guān)系辨識(shí),本文方法的查全率能達(dá)到100%,查準(zhǔn)率能達(dá)到96%以上,提高了戶變關(guān)系識(shí)別的有效性和效率。
2)基于用電量和電壓數(shù)據(jù)聯(lián)合進(jìn)行戶變關(guān)系識(shí)別,達(dá)到了信息融合和充分利用配電側(cè)數(shù)據(jù)資源的目的,提高了辨識(shí)結(jié)果的可靠性。
3)聯(lián)合SGDR和OC-SVM對(duì)戶變關(guān)系進(jìn)行辨識(shí)糾錯(cuò),既解決了基于SGDR方法求解戶變關(guān)系模型進(jìn)行多個(gè)時(shí)間段聯(lián)合判斷時(shí)查全率和查準(zhǔn)率的矛盾以及時(shí)間成本增加的問(wèn)題,又解決了訓(xùn)練樣本中異常數(shù)據(jù)的比例對(duì)OC-SVM模型識(shí)別準(zhǔn)確度的影響。