宋樹宏,王煒,王偉恒,于雷,王超,潘子毅,付博
(國(guó)網(wǎng)沈陽(yáng)供電公司,遼寧 沈陽(yáng) 110003)
目前我國(guó)電力供應(yīng)過程中,各種竊電手段層出不窮,部分竊電分子采用欠壓法、擴(kuò)差法、欠流法等手段實(shí)施電能偷竊,影響到供電企業(yè)的正常運(yùn)行。為實(shí)現(xiàn)對(duì)反竊電工作的優(yōu)化,供電企業(yè)需正視大數(shù)據(jù)技術(shù)應(yīng)用的重要性,在原有電力信息系統(tǒng)中進(jìn)行大數(shù)據(jù)技術(shù)的融合,進(jìn)一步優(yōu)化反竊電技術(shù),實(shí)現(xiàn)對(duì)竊電行為的有效打擊與抑制。
盡管現(xiàn)階段供電企業(yè)對(duì)反竊電管理工作的開展逐漸加大力度,但是仍尚存些許不足之處,具體表現(xiàn)為:(1)難以做到對(duì)竊電量的精準(zhǔn)統(tǒng)計(jì)。不同于現(xiàn)實(shí)產(chǎn)品,虛擬化的電能商品管理難度相對(duì)較大。常規(guī)統(tǒng)計(jì)記錄手段的應(yīng)用無法滿足電能統(tǒng)計(jì)的實(shí)際需求,再加上基礎(chǔ)監(jiān)測(cè)設(shè)備技術(shù)陳舊,無法做到在供電監(jiān)測(cè)過程中進(jìn)行竊電量的精準(zhǔn)統(tǒng)計(jì),為竊電分子提供可乘之機(jī)。此外,因供電企業(yè)無法做到對(duì)線損情況的全面掌握,部分用戶會(huì)以線損過大為理由進(jìn)行竊電,對(duì)供電企業(yè)造成嚴(yán)重經(jīng)濟(jì)損失。(2)在反竊電工作的實(shí)施過程中,存在工作人員難以準(zhǔn)確把握竊電問題的情況,尤其是針對(duì)臨時(shí)性竊電而言,即使工作人員發(fā)現(xiàn)用戶的竊電行為,但是因證據(jù)不足無法開展工作。(3)隨著我國(guó)科學(xué)技術(shù)的發(fā)展,部分竊電分子采用的手段更為先進(jìn),導(dǎo)致反竊電工作開展難度增大。(4)供電企業(yè)用戶廣泛,涉及商業(yè)、工業(yè)以及居民用電等多種性質(zhì)類別,再加上竊電手段的隱秘性,導(dǎo)致反竊電難上加難。正因此,借助大數(shù)據(jù)技術(shù)進(jìn)行反竊電的優(yōu)化,已然成為供電企業(yè)的主要研究課題。
借助大數(shù)據(jù)技術(shù)可以幫助工作人員進(jìn)行用電數(shù)據(jù)信息的搜集與挖掘,通過深度挖掘與分析,進(jìn)行線路線損實(shí)際情況的分析與判斷,實(shí)現(xiàn)對(duì)線損基本規(guī)律的掌握與明確。同時(shí),依托于大數(shù)據(jù)技術(shù)強(qiáng)大的分析功能,能夠幫助工作人員掌握不同時(shí)段線損情況。以不同季節(jié)為例,冬季、夏季為線損率最高的季節(jié),依托于對(duì)供電區(qū)用電信息、天氣與季節(jié)數(shù)據(jù)的采集和分析,生成不同季節(jié)線損動(dòng)態(tài)圖,實(shí)現(xiàn)通過大數(shù)據(jù)分析來保證線損分析的準(zhǔn)確性。
供電企業(yè)通過在用電信息系統(tǒng)中融合大數(shù)據(jù)技術(shù),可實(shí)現(xiàn)對(duì)用戶信息的實(shí)時(shí)采集,并以平臺(tái)為基礎(chǔ)進(jìn)行海量數(shù)據(jù)的傳輸,而終端可依托于數(shù)據(jù)分析來判斷用戶用電情況。在智能信息采集系統(tǒng)運(yùn)行過程中,若用戶用電數(shù)據(jù)存在異常,平臺(tái)會(huì)自主進(jìn)行智能診斷與分析,判斷其是否為竊電行為并第一時(shí)間提示預(yù)警。如在白天時(shí)段監(jiān)控圖顯示三相電流數(shù)值呈現(xiàn)為均衡態(tài)勢(shì),但是在夜間時(shí)段出現(xiàn)一相電流值異常,系統(tǒng)可自行診斷并預(yù)警。當(dāng)然,為確保相關(guān)工作人員能夠直觀掌握數(shù)據(jù)信息,平臺(tái)可以以圖形化、圖表化的形式呈現(xiàn)數(shù)據(jù),進(jìn)而實(shí)現(xiàn)對(duì)反竊電工作的智能化開展。
此數(shù)據(jù)處理平臺(tái)采用三層架構(gòu),用戶數(shù)據(jù)信息通過現(xiàn)場(chǎng)終端完成采集,數(shù)據(jù)采集單元通過專網(wǎng)或公網(wǎng)信道進(jìn)行數(shù)據(jù)信息接收,而終端采集命令與任務(wù)的下達(dá),由采集單元負(fù)責(zé)。數(shù)據(jù)處理平臺(tái)分別由內(nèi)層、中層、外層組成,其中外層囊括預(yù)處理模塊,中層則集成Map Rdeuce、Eclipse、融合引擎、監(jiān)控等模塊,內(nèi)層則是云計(jì)算服務(wù)集群與數(shù)據(jù)庫(kù),該平臺(tái)的構(gòu)建實(shí)現(xiàn)指令下達(dá)、數(shù)據(jù)采集以及數(shù)據(jù)共享等。
本系統(tǒng)中的數(shù)據(jù)計(jì)算服務(wù)集群主要以Hadoop框架為載體,起到主節(jié)點(diǎn)活躍、備用主節(jié)點(diǎn)預(yù)熱的作用,功能體現(xiàn)為信息系統(tǒng)數(shù)據(jù)計(jì)算,以分布式文件系統(tǒng)為載體進(jìn)行數(shù)據(jù)庫(kù)中相關(guān)數(shù)據(jù)的存放,針對(duì)數(shù)據(jù)計(jì)算主要采用Map Reduce作業(yè),完成計(jì)算后數(shù)據(jù)錄入數(shù)據(jù)庫(kù)。
本系統(tǒng)中涉及對(duì)云實(shí)時(shí)數(shù)據(jù)庫(kù)的構(gòu)建,調(diào)度層囊括主節(jié)點(diǎn)與從節(jié)點(diǎn),數(shù)據(jù)庫(kù)中實(shí)時(shí)數(shù)據(jù)庫(kù)數(shù)量依據(jù)需求合理設(shè)定。利用高速交換機(jī)連接數(shù)據(jù)庫(kù)中主節(jié)點(diǎn)與從節(jié)點(diǎn)服務(wù)器,并以集群架構(gòu)Hadoop構(gòu)成軟件層面,數(shù)據(jù)庫(kù)的構(gòu)建有助于提升系統(tǒng)中實(shí)時(shí)、歷史數(shù)據(jù)的存儲(chǔ)、利用效率。
3.4.1 二階聚類
二階聚類算法應(yīng)用較為常見,作為BIRCH算法的改進(jìn),其步驟具體分為預(yù)聚類、正式聚類。預(yù)聚類過程涉及到對(duì)聚類特征樹的構(gòu)建,囊括諸多子類;正式聚類過程則是輸入預(yù)聚類結(jié)果,依托于分層聚類達(dá)到再聚類的目的。聚類期間以集群距離為依據(jù)進(jìn)行小集群合并,直至所有集群合并完成后方可結(jié)束。
3.4.2 深度學(xué)習(xí)
深度學(xué)習(xí)主要是以非線性模塊來進(jìn)行多層描述學(xué)習(xí),其中各模塊的描述,均含有三個(gè)轉(zhuǎn)化過程,體現(xiàn)為簡(jiǎn)單描述→高層描述→抽象描述。通過對(duì)上述轉(zhuǎn)化過程的大量積累,實(shí)現(xiàn)對(duì)復(fù)雜函數(shù)的深度學(xué)習(xí)。針對(duì)深度學(xué)習(xí)算法而言,是對(duì)建模數(shù)據(jù)的隱含分布進(jìn)行自動(dòng)學(xué)習(xí),本系統(tǒng)采用以GRBM-DBN為框架的深度學(xué)習(xí)算法。首先,RBM訓(xùn)練采用相關(guān)對(duì)比發(fā)散數(shù)據(jù)。其次,進(jìn)行RBM數(shù)據(jù)生成隱藏值的模擬,在此基礎(chǔ)上開展其他RBM的訓(xùn)練。最后,進(jìn)行分類操作。依據(jù)喚醒-休眠算法,結(jié)合對(duì)分類標(biāo)志與隱藏單元的設(shè)置來達(dá)到權(quán)重變化的目的。針對(duì)喚醒-休眠算法而言,可以將喚醒體現(xiàn)為認(rèn)知過程,以向上權(quán)重為根據(jù),結(jié)合對(duì)外界特征的描述來進(jìn)行各層抽象表示,針對(duì)下行權(quán)重,則需利用梯度下降來實(shí)現(xiàn)有效轉(zhuǎn)變;休眠則可以以生成過程來體現(xiàn),運(yùn)行期間底層狀態(tài)依托于向下權(quán)重與頂層表示來生成,可作用于層間向上權(quán)重的轉(zhuǎn)變與調(diào)整。
3.4.3 CHAID決策樹
本系統(tǒng)建模除采用聚類建模之外,還涉及對(duì)決策樹建模的應(yīng)用,其原理為在分類自變量時(shí),以根結(jié)點(diǎn)來體現(xiàn)因變量,從而得到分類卡方值。若變量分類程度存在顯著差異,則需進(jìn)行分類P值大小的比對(duì)。然后在子節(jié)點(diǎn)設(shè)置過程選擇存在顯著差異的分類,達(dá)到最優(yōu)分割的目的。
3.4.4 異常值檢測(cè)
本系統(tǒng)針對(duì)異常值的檢測(cè)采用箱線圖,分別通過5個(gè)統(tǒng)計(jì)量來描述數(shù)據(jù)。該方法的應(yīng)用,不僅可以應(yīng)用于離散數(shù)據(jù)的粗略估量,亦可以進(jìn)行異常值的精準(zhǔn)判斷。在實(shí)際應(yīng)用過程中,無須借助假定數(shù)據(jù)形式進(jìn)行分析,可以利用實(shí)際數(shù)據(jù)特征判斷異常值。本系統(tǒng)中異常值判斷標(biāo)準(zhǔn)定位為:QR(四分位距)、Q3(下四分位數(shù))、Q1(上四分位數(shù))。
國(guó)網(wǎng)沈陽(yáng)供電公司根據(jù)用電信息系統(tǒng)大數(shù)據(jù)分析發(fā)現(xiàn),XX公司存在疑似竊電的情況,利用大數(shù)據(jù)平臺(tái)進(jìn)行竊電用戶特征分析,借助二階聚類進(jìn)行客戶類別的形成,從指標(biāo)、樣例等維度分類用戶,并采納用戶基本屬性構(gòu)建聚類模型,由此確定該企業(yè)用電特點(diǎn)。在確定懷疑對(duì)象后,進(jìn)行用戶鎖定。采用深度學(xué)習(xí)和決策樹,將該企業(yè)當(dāng)月用電量、功率因數(shù)等關(guān)鍵性指標(biāo)輸入,結(jié)果發(fā)現(xiàn)該企業(yè)滿足決策樹規(guī)則模型,利用以DBN模型的深度學(xué)習(xí)方法進(jìn)行準(zhǔn)確率預(yù)測(cè),依托于系統(tǒng)數(shù)據(jù)分析與采集,發(fā)現(xiàn)該公司進(jìn)線電纜電流最高為50A左右,最低為30A,其結(jié)果與采集系統(tǒng)中顯示的電流存在較大差異,確定該企業(yè)存在竊電行為。隨后國(guó)網(wǎng)沈陽(yáng)供電公司組織隊(duì)伍開展現(xiàn)場(chǎng)檢查。發(fā)現(xiàn)廠區(qū)內(nèi)計(jì)量柜處于無封印狀態(tài),電表尾封有人為破壞痕跡。通過深入稽核發(fā)現(xiàn),該企業(yè)用電性質(zhì)不同于檔案統(tǒng)計(jì),表示該企業(yè)存在私自竊電、躲避電費(fèi)的情況。最后,進(jìn)行竊電行為取證。借助箱線圖方法進(jìn)行用戶用電量和負(fù)荷的分析,得出精準(zhǔn)的離群值和異常值。國(guó)網(wǎng)沈陽(yáng)供電企業(yè)通過合理應(yīng)用大數(shù)據(jù)反竊電平臺(tái),成功挽回該企業(yè)竊電造成的經(jīng)濟(jì)損失,同樣論證了在實(shí)際反竊電工作中應(yīng)用該平臺(tái)的可行性。
上述案例證明,基于大數(shù)據(jù)的反竊電平臺(tái)設(shè)計(jì),一方面可以為供電企業(yè)用電違約行為的查處提供參考依據(jù),另一方面則可以幫助供電企業(yè)維持電網(wǎng)的正常運(yùn)行。
綜上,隨著竊電手段的愈發(fā)復(fù)雜和多元化,供電企業(yè)要想提高反竊電工作成效,應(yīng)結(jié)合自身實(shí)際情況,構(gòu)建完善的智能反竊電系統(tǒng),精準(zhǔn)定位用戶竊電行為,采集充分的竊電行為證據(jù),在進(jìn)一步規(guī)范企業(yè)反竊電工作開展的同時(shí),幫助供電企業(yè)減少損失、控制成本。