陳 未,潘 越,符煌瑩,沈華胄,岑穎蓓
(國網(wǎng)浙江象山縣供電有限公司,浙江 象山 315700)
隨著電力體制改革的持續(xù)推進以及經(jīng)濟下行壓力的進一步增大,企業(yè)提高自身運營效率、降低生產(chǎn)成本對其生存發(fā)展顯得尤為重要[1-3]。對供電企業(yè)而言,線損率是其生產(chǎn)經(jīng)營狀況的一項重要技術(shù)經(jīng)濟指標,直接關(guān)系到其經(jīng)營成果和經(jīng)濟效益[2,4-6]。當前,臺區(qū)變壓器增容或線路調(diào)整導致用戶數(shù)據(jù)遷移不及時、違約竊電、表計電量采集數(shù)據(jù)頻繁缺失的現(xiàn)象時有發(fā)生,不僅給供電企業(yè)造成了經(jīng)濟損失,也給廣大用戶的用電安全造成較大的隱患。在國網(wǎng)公司的統(tǒng)一部署下,目前已開展同期線損的計算,但由于監(jiān)測手段的不足,導致臺區(qū)線損異常仍頻繁發(fā)生[7-10]。
為此,本文以國家電網(wǎng)公司提出的線損精益化管理目標為指導要求,以臺區(qū)線損治理為著眼點,采用大數(shù)據(jù)挖掘技術(shù),構(gòu)建臺區(qū)線損綜合治理排查模型,設計出一套可以精準監(jiān)控臺區(qū)線損情況的線損精益化管理平臺,實現(xiàn)線損歸真和自動生成,實時監(jiān)測關(guān)口、表計、設備、電量等關(guān)鍵節(jié)點信息,掌握各層級、各環(huán)節(jié)、各元件的線損情況,強化供售電量的精細管理,杜絕跑冒滴漏,提升公司經(jīng)營效益。
本文所使用的研究數(shù)據(jù)主要來源于用電信息采集系統(tǒng)、營銷系統(tǒng)等數(shù)據(jù)庫。具體為某供電公司的280 603 個低壓用戶的基本信息和用電情況。其中,數(shù)據(jù)主要包括用戶基礎(chǔ)信息、臺區(qū)線損信息、臺區(qū)用戶用電量信息等,具體涵蓋用戶戶名、戶號、用電地址、用電類別、用電容量、用電量、臺區(qū)綜合線損、用戶電壓、用戶電壓等數(shù)據(jù)信息,具體如表1 所示。
表1 臺區(qū)線損綜合管理數(shù)據(jù)源表及分析字段
1.2.1 數(shù)據(jù)清洗
為了有效支撐模型的構(gòu)建工作,需要對獲取的數(shù)據(jù)做以下預處理:
(1)劃定所需數(shù)據(jù)范圍。為提高線損治理工作成效,主要對綜合線損率為負或線損率超過考核要求的紅線部分臺區(qū)所涉及用戶進行分析,即優(yōu)先分析線損不合格臺區(qū)相關(guān)用戶。
(2)確定清洗規(guī)則。對于所取數(shù)據(jù)字段不完整、為空或者偏差較大的用戶檔案信息進行清除,不作為后續(xù)分析的數(shù)據(jù)源;去掉數(shù)據(jù)部分為0、為空或者不完整的用戶用電數(shù)據(jù),為之后分析建模提供用戶數(shù)據(jù)支撐。
1.2.2 模型觸發(fā)機制
本文主要針對表計快走、表計慢走、用戶竊電和用戶竄臺區(qū)這4 類發(fā)生概率大、影響比重高的常見線損類問題進行研究。其具體實現(xiàn)流程如圖1 所示:輸入用戶的基礎(chǔ)信息后,首先判斷戶變一致率是否為100%,如為“否”則與損失電量進行對比看是否匹配,如為“是”則將用戶檔案進行輸出,不觸發(fā)模型。若戶變一致率為100%,則判斷公變終端、臺區(qū)低壓用戶采集成功率是否為100%,如為“否”則對比采集失敗用戶電量與臺區(qū)線損電量是否一致,如為“是”則輸出采集數(shù)據(jù),不觸發(fā)模型。
圖1 模型觸發(fā)流程
1.2.3 數(shù)據(jù)窗生成
當數(shù)據(jù)窗選擇時間過短時,電量單點突變對數(shù)據(jù)結(jié)果的影響存在偶然性;當數(shù)據(jù)窗選擇時間過長時,則會因數(shù)據(jù)量過大而對模型的運算應用形成負擔,同時其空間和時間復雜度上也會成倍增加。為提高數(shù)據(jù)模型分析的正確性,降低時間、空間復雜度,本文依據(jù)實踐情況確定數(shù)據(jù)窗,將時間序列定為發(fā)現(xiàn)線損不合格當天開始,向前逆推14~21 天。將該時間序列內(nèi)發(fā)生的用戶用電情況和臺區(qū)線損波動等作為主要分析對象。
本文主要以低壓用戶為研究對象,通過多種算法構(gòu)建適用于臺區(qū)線損綜合治理的問題排查模型。該模型主要分為3 個方面:
(1)對4 類常見線損問題的歷史案例進行分析,通過聚類分析法梳理每種問題的關(guān)鍵變量,確定其判別規(guī)則。
(2)對用戶用電變化趨勢和臺區(qū)線損變化曲線進行擬合,框定疑似用戶范圍。
(3)對比分析疑似用戶用電特征與4 類問題的辨別規(guī)則,確定疑似問題,找出疑似用戶。
2.1.1 SL 層次聚類分析法
本文應用SL 層次聚類分析法[11-16],收集歷年發(fā)現(xiàn)并已處置的各種典型案例,著重分析表計快走、表計慢走、用戶竊電、竄臺區(qū)4 類問題的基本用電特征,將相關(guān)數(shù)據(jù)進行類比。由于考察的是定性指標,且需自動建議選擇最佳類別,結(jié)合輸入的各項用戶基本信息數(shù)據(jù),本文采用SL 層次聚類分析法對4 類問題用戶的基本采樣數(shù)據(jù)特征進行分析。規(guī)定每個類間距離等于2 類對象之間的最小距離,即各類中的任一對象與另一類中任一對象的相似度取最大值。
使用用戶基礎(chǔ)信息、用電容量、用電類別、表計接線方式、電能表額定值、電壓等級、電流值、零線電流值、電量值、電能表事件值等十余種用戶基本信息和用電數(shù)據(jù)項作為聚類變量,使用上述確定的聚類方案得到聚類結(jié)果,確定與4類線損問題關(guān)聯(lián)性最強的幾個關(guān)鍵因素變量,具體如圖2 所示。
圖2 SL 層次聚類分析法邏輯
2.1.2 4 類問題關(guān)鍵變量確定
如圖3 所示,通過SL 層次聚類分析法,可得出4 類常見問題的關(guān)鍵影響因素:
圖3 影響綜合線損率的4 類問題及其關(guān)鍵影響因素聚類結(jié)果
表計慢走關(guān)鍵因素:用戶電量變化與線損率變化曲線是否正相關(guān);是否出現(xiàn)表計停走、倒走等計量異?,F(xiàn)象;用戶電量是否明顯不符合用電規(guī)律。
用戶竊電關(guān)鍵因素:用戶有無突發(fā)開蓋記錄、有無電流失流、有無電壓斷相、有無失壓、有無零線電流異常、有無反向電量異常等計量異常;臺區(qū)線損率是否突然變大;用戶電量變化與線損率變化曲線是否正相關(guān);是否存在三相電流不平衡;是否存在反向電流。
表計快走關(guān)鍵因素:用戶電量變化與線損率變化曲線是否負相關(guān);是否出現(xiàn)表計飛走、電量突變等計量異?,F(xiàn)象;用戶電量是否明顯不符合用電規(guī)律。
用戶竄臺區(qū)關(guān)鍵因素:用戶電量變化與線損率變化曲線是否成負相關(guān);用戶地址信息和臺區(qū)名稱是否一致;用戶的用電量與臺區(qū)線損的損失電量是否匹配;相鄰或附近臺區(qū)是否同時出現(xiàn)異常且線損異常方向與該臺區(qū)相反。
2.2.1 基礎(chǔ)曲線生成
為方便后續(xù)算法應用,疑似用戶研判模型主要通過臺區(qū)線損和用戶用電情況2 個維度進行分層構(gòu)建,針對所有已發(fā)生用電的用戶,根據(jù)其在數(shù)據(jù)窗內(nèi)的用電量波動情況形成用戶電量曲線;同時,針對臺區(qū)線損的變化形成臺區(qū)日均線損基礎(chǔ)曲線。
2.2.2 皮爾遜積距相關(guān)系數(shù)法
本文在疑似用戶研判環(huán)節(jié),主要應用皮爾遜積矩相關(guān)系數(shù)法[11,13,17-20],皮爾遜積矩相關(guān)系數(shù)是2個變量標準化后的協(xié)方差,主要適用于衡量2 個變量線性相關(guān)的程度,并且變量數(shù)據(jù)類型一般為連續(xù)型數(shù)據(jù)。其公式可表示如下:
式中:ρX,Y代表皮爾遜相關(guān)系數(shù);E(X)為變量X的均值;E(Y)為變量Y 的均值;E(XY)為變量X和變量Y 乘積的均值;E(X2)為變量X 平方的均值;E(Y2)為變量Y 平方的均值。
本文在規(guī)定數(shù)據(jù)窗內(nèi),將預生成的不同維度的2 條基礎(chǔ)曲線,即用戶電量波動曲線和臺區(qū)日均線損變化曲線,進行曲線擬合。利用皮爾遜相關(guān)系數(shù)算法,分析每個用戶的用電情況與臺區(qū)日均線損情況的線性相關(guān)程度(如圖4、圖5 所示),并將分析結(jié)果按相關(guān)程度大小從高到低排列。當用戶出現(xiàn)表計快走、表計慢走、用戶竊電、用戶竄臺區(qū)4 類疑似問題時,用戶用電量與臺區(qū)日均線損呈正相關(guān)時或者負相關(guān)(具體業(yè)務含義表2),因此用戶用電量與臺區(qū)日均線損呈正相關(guān)或者負相關(guān)時,用戶出現(xiàn)表計快走、表計慢走、用戶竊電、用戶竄臺區(qū)4 類疑似問題的概率越大。
圖4 正相關(guān)曲線擬合案例展示
圖5 負相關(guān)曲線擬合案例展示
表2 各類疑似問題下用戶用電量與臺區(qū)線損
一般的,當皮爾遜相關(guān)系數(shù)絕對值大于或等于0.8 時[20],說明該用戶的電量與線損的變化呈強相關(guān)性,則可將該用戶劃入疑似用戶清單,用戶疑似度為用戶用電量與臺區(qū)線損的相關(guān)系數(shù)的絕對值(如表3、表4 所示),用于后續(xù)分析排查。
表3 皮爾遜相關(guān)系數(shù)系數(shù)具體含義[20]
表4 正相關(guān)曲線疑似用戶清單
本文疑似問題辨別模型主要應用神經(jīng)網(wǎng)絡算法[18-24],將經(jīng)過模型篩選所得的疑似用戶用電特征,與已知的問題辨別規(guī)則進行匹配,最終確定疑似問題類型。所選擇神經(jīng)網(wǎng)絡的結(jié)構(gòu)分為輸入層F0、隱藏層F1、輸出層F2。如圖6 所示,臺區(qū)用戶經(jīng)過研判模型后得出疑似用戶清單,將清單上用戶的用電特征(包括用電類別、電壓等級、電流值等)作為Fuzzy ART(模糊自適應諧振原理)輸入神經(jīng)元,以向量I=(I1,…,In)表示;導入聚類分析后得出的四類疑似問題關(guān)鍵因素,到類別表示層F1,以向量y=(y1,y2,y3,y4)表示;結(jié)合權(quán)重W=(W1,…,Wn),輸出結(jié)論,即辨別疑似問題類別結(jié)果為輸出層F2。
表5 負相關(guān)曲線疑似用戶清單
圖6 神經(jīng)網(wǎng)絡算法邏輯
基于上述得到的臺區(qū)線損綜合治理排查模型,依托移動作業(yè)終端開展相關(guān)應用探索實踐,進行線損精益化管控平臺的設計,其功能架構(gòu)如圖7 所示。該平臺基于模型計算得到線損異常用戶名單,以臺區(qū)線損作為采集質(zhì)量、營配基礎(chǔ)檔案質(zhì)量、現(xiàn)場用電情況、線損異常波動的指標,持續(xù)提高臺區(qū)線損日監(jiān)測達標率;以線損作為打擊竊電及違約用電的專項行動依據(jù),開展現(xiàn)場核查工作。
圖7 線損精益化管控平臺功能架構(gòu)
運用大數(shù)據(jù)挖掘技術(shù),跨系統(tǒng)關(guān)聯(lián)用電信息采集系統(tǒng)、營配貫通平臺、營銷業(yè)務應用系統(tǒng)等相關(guān)業(yè)務數(shù)據(jù),通過應用所構(gòu)建的數(shù)據(jù)模型,實現(xiàn)對線損異常用戶的篩選排查?;谂挪榻Y(jié)果,對線損異常的臺區(qū)用戶從電量、營配關(guān)系、采集異常、地理位置等維度進行自動分析,在符合國網(wǎng)安全接入要求的前提下利用移動作業(yè)終端對線損異常臺區(qū)進行現(xiàn)場核對,并對違約竊電行為進行拍照留存,固化證據(jù),提高臺區(qū)線損日監(jiān)測達標率。
如圖7 所示,該平臺包括PC 端應用和移動端功能應用。在PC 端,包括線損異常臺區(qū)線損篩選、采集電量數(shù)據(jù)缺失用戶預警、異常用電用戶分析、現(xiàn)場核查工作查看等功能。在移動端,有基于模型計算得到的線損異常用戶名單、異常用電用戶核查、用戶軌跡定位等功能。
本文采用大數(shù)據(jù)分析方法,以國網(wǎng)公司的線損精益化管理要求為指導,以臺區(qū)線損治理為目標,針對當前線損治理的難題,通過梳理營配關(guān)系、整改檔案信息,創(chuàng)新數(shù)據(jù)挖掘方法,研究構(gòu)建適用于臺區(qū)線損綜合治理的問題排查模型,并應用該模型快速定位疑似用戶、框定疑似問題并指導現(xiàn)場排查。
基于該模型,依托移動作業(yè)終端,設計并研發(fā)出一套可以精準監(jiān)控臺區(qū)線損情況的線損精益化管理平臺,實現(xiàn)線損歸真和自動生成,實時監(jiān)測關(guān)口、表計、設備、電量等關(guān)鍵節(jié)點信息,掌握各層級、各環(huán)節(jié)、各元件的線損情況,強化供售電量的精細管理,提升公司經(jīng)營效益。