朱少維,戚穎怡,陳豪,王馬才
(廣州供電局有限公司,廣東廣州,510000)
數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。數(shù)據(jù)挖掘通常與計算機科學(xué)有關(guān),并通過統(tǒng)計、在線分析處理、情報檢索、機器學(xué)習(xí)、專家系統(tǒng)(依靠過去的經(jīng)驗法則)和模式識別等諸多方法來實現(xiàn)上述目標(biāo)。底層數(shù)據(jù)源來自營銷系統(tǒng)、計量自動化系統(tǒng)、配網(wǎng)調(diào)度系統(tǒng)等。
采用k-means聚類算法,聚類出行業(yè)典型用戶用電軌跡,通過軌跡相關(guān)系數(shù)和軌跡交叉面積辨別出用戶是否用電軌跡異常。行業(yè)用電與用戶用電對比曲線分析可以查看用戶與行業(yè)之間月、日、小時點功率曲線關(guān)系,也可以查看用戶與對應(yīng)用電類別之間軌跡對比關(guān)系,最終通過辨別模型,判定出用戶用電軌跡是否異常,用戶用電軌跡對比分析是從用戶用電行為的角度去分析用戶的用電情況。
用戶違約用電、竊電或計量故障必定會導(dǎo)致用戶用電行為特征異常為依據(jù),建立用戶用電行為特征曲線,通過用戶用電曲線和正常用電曲線對別,并設(shè)置判定異常的臨界值,從而找出用戶用電行為特征異常的用戶。如圖1所示。
圖1 客戶用電行為特征曲線分析
企業(yè)或者居民用戶用電負(fù)荷特性主要通過計算合同容量比進行分析。即分析用戶申請的合同容量與用戶的月用電量間存在數(shù)值上的對應(yīng)關(guān)系,其計算公式為:
式(1)中,合同容量與用戶的月用電量間的對應(yīng)關(guān)系因每個用戶所在地區(qū)的不同而有所不同,因此需要對合同容量比進行聚類分析。
用電負(fù)荷異常的分析與判定主要在于分析用戶負(fù)荷超出運行容量的統(tǒng)計量,統(tǒng)計一天內(nèi)有功功率與運行容量的比率是超出限定閥值的次數(shù)。如果一個計費周期內(nèi)日用電負(fù)荷異常的天數(shù)較大,則存在異常的概率很大,反之很小。
用戶用電規(guī)律特征分析主要對月電量小時分布偏離度進行系統(tǒng)分析和數(shù)據(jù)挖潛:根據(jù)一個自然月內(nèi)用戶的小時用電統(tǒng)計量按照自然日的24小時進行分別統(tǒng)計求和以獲得月用電總量在自然日24小時內(nèi)的月電量小時分布向量,并計算該向量與正常用戶的月電量小時分布向量之間的歐氏距離,即為月電量小時分布偏離度,計算公式為:
式(2)中,kC 為用戶月用電總量在自然日24小時內(nèi)的月電量小時分布向量,kU 為正常用戶的月電量小時分布向量。所述正常用戶的月電量小時分布向量,是利用數(shù)據(jù)挖掘技術(shù)獲得。月電量小時分布偏離度數(shù)值越小,表明異常的概率越低,反之異常的概率越高。日用電量波動情況:即近30天日用電量的標(biāo)準(zhǔn)差,其計算公式為:
上式中,N表示所取周期,若以月為周期,則N=30。ix 表示第i天日用電量,μ表示周期內(nèi)日用電量平均值。正常用戶的日用電量應(yīng)保持平穩(wěn),具有較小的標(biāo)準(zhǔn)差,反之則具有較大的標(biāo)準(zhǔn)差。同時通過分析月用電量離散系數(shù),即用戶近12個月的月電量標(biāo)準(zhǔn)差與月電量平均值的比值,來找出用戶月電量波動太大或太小的用戶。正常用戶的月用電量離散系數(shù)計算公式為:
與此同時,對用戶/行業(yè)月電量離散系數(shù)比值進行分析,判斷出正常用戶離散系數(shù)與行業(yè)離散系數(shù)是在同一范圍波動。即分析用戶月用電量離散系數(shù)與行業(yè)月電量離散系數(shù)的比值。行業(yè)電量離散系數(shù)是近12個月行業(yè)用戶月電量標(biāo)準(zhǔn)差與行業(yè)月平均電量的比值,計算公式為:
式(5)中,系統(tǒng)內(nèi)行業(yè)用電總量和系統(tǒng)內(nèi)行業(yè)用戶數(shù)分別指計量系統(tǒng)、配網(wǎng)系統(tǒng)等管理系統(tǒng)內(nèi)能夠統(tǒng)計到的行業(yè)用電之和與用戶數(shù)。
廣州供電局有限公司在開展稽查工作時,發(fā)現(xiàn)某用電客戶現(xiàn)場用電性質(zhì)與系統(tǒng)用電性質(zhì)不一致。經(jīng)初步調(diào)查,營銷系統(tǒng)檔案顯示,該客戶為專變用戶,計量方式采用高供高計,變壓器容量500kVA,共有兩只表計,為子母表關(guān)系,母表用電類別是居民,月均用電量約為15000kWh,子表用電類別是非工業(yè),月均用電量約為600kWh。
經(jīng)用電異常分析系統(tǒng)篩選,可知該客戶工作日負(fù)荷使用情況如圖3中的藍線,負(fù)荷增長從早上七點開始,工作時間保持高負(fù)荷運作,而到晚上七點后負(fù)荷開始下降,與居民生活用電類別的負(fù)荷曲線(圖2中的綠線)不匹配。
圖2 某用電客戶工作日用電負(fù)荷曲線
經(jīng)現(xiàn)場檢查發(fā)現(xiàn),正處于工作時間的該客戶辦公樓對應(yīng)的非工業(yè)電表計量三相電流值分別為:A相0.036A、B相0.018A、C相0.004A,用電負(fù)荷接近零,與現(xiàn)場實際情況不符。同時,因該客戶職工宿舍進行一戶一表改造,轉(zhuǎn)由公變進行供電,并非由該臺專用變壓器供電,該情況與計量電表計數(shù)的用電情況吻合。經(jīng)對線路進行排查,原居民生活電表錯誤接至8層的辦公樓用電,而非工業(yè)電表錯誤接至宿舍樓用電,由于宿舍樓已進行一戶一表改造,該電表現(xiàn)只對宿舍樓照明用電進行計量。
分析出問題后,對該客戶兩表計分別辦理了改類,修正用電類別,并對少收的電量,按相關(guān)規(guī)定進行追補。該案例反映出通過用電異常分析系統(tǒng)對客戶用電負(fù)荷情況進行詳細(xì)分析,有助于配合營銷系統(tǒng),精準(zhǔn)定位,找到高價低接的客戶并及時處理,避免企業(yè)損失,降低企業(yè)面臨的法律風(fēng)險。
為檢驗系統(tǒng)用電負(fù)荷異常曲線在實際工作中的應(yīng)用有效性,自2018年3月至8月共六個月內(nèi),從系統(tǒng)中共抽取70個曲線異常的有效樣本(剔除重復(fù)抽取樣本及負(fù)荷曲線為零的異常樣本),結(jié)合系統(tǒng)檔案進行分析后,至客戶開展現(xiàn)場檢查,現(xiàn)場檢查結(jié)果如下表1所示。
表1 曲線異常的有效樣本分析(n=70)
通過對數(shù)據(jù)挖潛分析,第一類宿舍或飯?zhí)?、養(yǎng)老院、居民樓及公共設(shè)施(照明、風(fēng)機、水泵、消防等)與系統(tǒng)檔案一致,未存在高接低行為,共計45戶,占樣本總量64%。
第二類現(xiàn)場檢查結(jié)果為學(xué)校的客戶,用電類別為非工業(yè)(學(xué)校),執(zhí)行合表(非居民)電價,與合表(居民)電價價格一致,不屬于高接低行為,共計9戶。但該類學(xué)??蛻魬?yīng)辦理改類業(yè)務(wù),把用電類別從居民生活更正為非工業(yè)(學(xué)校),同時須把原執(zhí)行錯誤的合表(居民)電價更正為合表(非居民)電價。
第三類是住宅表為母表,其他用電類別表計為子表的客戶,該類客戶現(xiàn)場檢查時未發(fā)現(xiàn)高低接行為,且不同類別的用電有相應(yīng)表計計費,共計7戶。
最后一類為存在高接低行為的客戶,共計9戶。該部分使用居民電價的客戶,1戶實際為大宗工業(yè)客戶,2戶為非工業(yè)客戶,1戶為商業(yè)客戶,還有5戶屬于混合用電的客戶(即既有部分居民生活用電,也有部分非工業(yè)、商業(yè)等用電)。該部分存在高接低行為的客戶,均須根據(jù)《供電營業(yè)規(guī)則》等相關(guān)規(guī)定,在營銷系統(tǒng)發(fā)起改類及違約用電查處流程,依法追回?fù)p失。
第二類學(xué)??蛻粢约白詈笠活悓嶋H存在高接低行為的客戶,屬于問題樣本,問題率約占樣本總數(shù)的26%??芍ㄟ^對客戶用電負(fù)荷異常曲線進行篩查及分析,能極大程度地縮小問題客戶的選擇范圍,高效排查問題樣本。
利用用電負(fù)荷異常曲線排查高接低用戶的應(yīng)用方法,結(jié)合聚類分析、多元線性回歸、辨別分析等數(shù)據(jù)挖掘的分析方法,對用戶用電行為進行多維度分析,建立用電異常評價體系。對客戶用電異常曲線開展對比分析,剔除因數(shù)據(jù)提取不準(zhǔn)確造成的誤差,靈活運用數(shù)據(jù)結(jié)果,對負(fù)荷異常曲線進行改善,快速鎖定問題樣本,現(xiàn)場進行排查,對用電異常分析系統(tǒng)進行持續(xù)優(yōu)化與改造,從而更有效的提升異常行為客戶的篩查率,使用電行為異常分析工作趨于信息化、智能化。