盤律,何忠文,王錦昌,楊巖順,楊國璞
(云南電網(wǎng)有限責(zé)任公司德宏供電局,云南 德宏 678400)
目前電網(wǎng)公司仍采用傳統(tǒng)電能表輪換方式[1],根據(jù)電能表使用壽命無針對(duì)性地進(jìn)行輪換,實(shí)驗(yàn)室檢定證明了大量按照檢定周期拆回的智能電表其性能仍然完好。近年來,隨著電網(wǎng)公司省集中計(jì)量自動(dòng)化系統(tǒng)的建成,目前擁有的供用電數(shù)據(jù)、電表運(yùn)行數(shù)據(jù)等數(shù)據(jù)量已滿足支撐以用電大數(shù)據(jù)為基礎(chǔ)的智能電能表故障分析和管控的前提條件。
文獻(xiàn)[2]利用樸素貝葉斯模型、決策樹模型和softmax 神經(jīng)網(wǎng)絡(luò)對(duì)入庫電表以及已用電表故障實(shí)現(xiàn)了故障預(yù)測(cè)。文獻(xiàn)[3]利用基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)對(duì)故障電能表數(shù)據(jù)進(jìn)行訓(xùn)練分析,實(shí)現(xiàn)對(duì)電能表的運(yùn)行情況進(jìn)行了準(zhǔn)確預(yù)測(cè)。文獻(xiàn)[4]基于隨機(jī)森林算法對(duì)智能電表進(jìn)行故障及壽命預(yù)測(cè),預(yù)測(cè)準(zhǔn)確度分別達(dá)到了86%和89%,實(shí)現(xiàn)了智能電表故障預(yù)測(cè)的可能。
電網(wǎng)公司在現(xiàn)有的用電大數(shù)據(jù)下,如何利用此數(shù)據(jù)庫成為研究的重點(diǎn),因此,本文基于用電大數(shù)據(jù)和機(jī)器學(xué)習(xí)[5]技術(shù),設(shè)計(jì)構(gòu)建一種智能電能表異常評(píng)估系統(tǒng)。從智能電能表所計(jì)的用電量、運(yùn)行的電壓、運(yùn)行的電流、電表記錄的異常事件和檔案信息等多方面進(jìn)行異常分析,對(duì)運(yùn)行的智能電能表進(jìn)行運(yùn)行正常、計(jì)量異常和非計(jì)量異常進(jìn)行分類并對(duì)智能電能表進(jìn)行評(píng)估預(yù)測(cè)[6]。
本系統(tǒng)通過與計(jì)量自動(dòng)化系統(tǒng)、營銷管理系統(tǒng)進(jìn)行數(shù)據(jù)接口對(duì)接,獲取到用戶電能表真實(shí)的原始記錄,在智能電能表異常分析模型對(duì)數(shù)據(jù)進(jìn)行分析處理進(jìn)行異常分類,同時(shí)通過機(jī)器學(xué)習(xí)的方法對(duì)原始數(shù)據(jù)進(jìn)行訓(xùn)練,獲取到每塊電能表的評(píng)估值進(jìn)行故障預(yù)測(cè)。該系統(tǒng)在項(xiàng)目投資、計(jì)量裝置管理、計(jì)量裝置運(yùn)維等方面具有重要意義。
從功能上進(jìn)行劃分,系統(tǒng)分為數(shù)據(jù)采集區(qū)、接口區(qū)、數(shù)據(jù)處理區(qū)、展示區(qū)三大功能項(xiàng)。
數(shù)據(jù)采集區(qū)包含了用電數(shù)據(jù)采集系統(tǒng)和數(shù)據(jù)中間庫或用電大數(shù)據(jù)平臺(tái)等系統(tǒng)。
接口區(qū)主要是通過接口程序從計(jì)量自動(dòng)化系統(tǒng)、營銷管理系統(tǒng)數(shù)據(jù)推送到的中間庫中獲取原始數(shù)據(jù)并將數(shù)據(jù)發(fā)送至數(shù)據(jù)處理區(qū)。
數(shù)據(jù)處理區(qū)通過數(shù)據(jù)處理模塊接收到接口同步的采集系統(tǒng)的原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理后結(jié)合智能電能異常分析模型對(duì)電能表進(jìn)行評(píng)估,得出電能表異常分類以及異常評(píng)估值,并將數(shù)據(jù)進(jìn)行入庫操作。
展示區(qū)是Web 應(yīng)用,通過Web 面向系統(tǒng)用戶將系統(tǒng)分析處理的數(shù)據(jù)結(jié)果進(jìn)行展示。
智能電能表異常評(píng)估系統(tǒng)采用Oracle 數(shù)據(jù)庫和實(shí)時(shí)庫技術(shù),實(shí)現(xiàn)電能表數(shù)據(jù)分析功能。其結(jié)構(gòu)圖如圖1所示。
圖1 系統(tǒng)總體構(gòu)架圖
系統(tǒng)總體構(gòu)架主要是由基礎(chǔ)設(shè)施、應(yīng)用支撐平臺(tái)以及功能應(yīng)用組成,系統(tǒng)整體安全遵循一定的安全技術(shù)要求搭建,其中包括數(shù)據(jù)安全、運(yùn)行環(huán)境安全和功能應(yīng)用安全等方面,系統(tǒng)數(shù)據(jù)輸入和輸出遵循一定的原則規(guī)范。
1)基礎(chǔ)設(shè)施:基礎(chǔ)設(shè)施主要是由系統(tǒng)所需的基礎(chǔ)設(shè)備構(gòu)成,包括功能數(shù)據(jù)庫服務(wù)器、應(yīng)用服務(wù)器、操作系統(tǒng)、網(wǎng)絡(luò)以及系統(tǒng)運(yùn)行的環(huán)境設(shè)施。
2)應(yīng)用支撐平臺(tái):主要是系統(tǒng)開發(fā)所需的軟件。
3)功能應(yīng)用:智能電能表在線監(jiān)測(cè)評(píng)估、異常分析、異常數(shù)據(jù)管理以及Web 應(yīng)用展示等。
系統(tǒng)在設(shè)計(jì)、開發(fā)和完善各個(gè)階段,需要重視相關(guān)文檔和程序的注釋,對(duì)于每一個(gè)細(xì)小的改動(dòng)都需要在文檔中進(jìn)行詳細(xì)的描述,對(duì)于代碼的修改需要做到每一個(gè)代碼的刪減、增加或修改都務(wù)必注釋。確保每一個(gè)接觸到系統(tǒng)的人都能夠從文檔描述中理解系統(tǒng)的設(shè)計(jì)思路,從每行代碼注釋中了解系統(tǒng)是如何實(shí)現(xiàn)各個(gè)功能應(yīng)用。
數(shù)據(jù)庫設(shè)計(jì)的原則主要包括:
1)數(shù)據(jù)存儲(chǔ)采用先進(jìn)先出[7]的原則。數(shù)據(jù)庫中按照分析結(jié)束時(shí)間順序?qū)Σ槐匾臄?shù)據(jù)進(jìn)行刪除,只保留系統(tǒng)評(píng)估結(jié)果,如:正常電能表評(píng)估、異常電能表評(píng)估等。對(duì)于原始數(shù)據(jù),只保留異常電能表的原始數(shù)據(jù),不會(huì)存儲(chǔ)全部原始數(shù)據(jù)。數(shù)據(jù)刪除采用先進(jìn)先出滾動(dòng)刪除的方式,間接減輕數(shù)據(jù)庫存儲(chǔ)壓力。
2)采用模塊化設(shè)計(jì)。按照系統(tǒng)開發(fā)、應(yīng)用需求,將系統(tǒng)劃分為不同的相互獨(dú)立的系統(tǒng)模塊,并通過一定的規(guī)范定義各個(gè)模塊間的數(shù)據(jù)交互方式。通過模塊化設(shè)計(jì),在完善系統(tǒng)功能的時(shí)候只需按需求塊進(jìn)行修改完善,不破壞數(shù)據(jù)交互關(guān)系的情況,不影響其他模塊之間的運(yùn)行。
3)程序代碼采用面向?qū)ο蠓庋b,通過將定義方法的程序進(jìn)行封裝,將各個(gè)功能邏輯進(jìn)行封裝,通過相關(guān)接口可以直接調(diào)用程序,不必關(guān)心封裝程序內(nèi)部原理,極大提高系統(tǒng)可維護(hù)性。
4)完善文檔描述、代碼注釋。每一個(gè)細(xì)小的修改都務(wù)必進(jìn)行描述和注釋,確保注釋覆蓋達(dá)100%。
隨著數(shù)字化建設(shè)不斷發(fā)展,大數(shù)據(jù)處理、分析、應(yīng)用在統(tǒng)計(jì)分析中的地位越來越至關(guān)重要。通過大數(shù)據(jù)獲取到用戶的用電信息進(jìn)行實(shí)時(shí)數(shù)據(jù)和歷史數(shù)據(jù)進(jìn)行存儲(chǔ)分析,運(yùn)用聚類算法對(duì)存儲(chǔ)的數(shù)據(jù)進(jìn)行分類,根據(jù)數(shù)據(jù)偏離聚類中心的程度按一定的原則進(jìn)行歸類,通過構(gòu)建的智能電能表狀態(tài)評(píng)估決策樹[8],對(duì)不同信息系統(tǒng)中獲取的數(shù)據(jù)進(jìn)行提煉處理,從而達(dá)到自動(dòng)提取電能表關(guān)鍵狀態(tài)量和一定的評(píng)價(jià)規(guī)則。針對(duì)運(yùn)行電能表評(píng)估后的結(jié)果,進(jìn)行數(shù)據(jù)追蹤以供運(yùn)維人員獲取基本運(yùn)行數(shù)據(jù)并有針對(duì)性的進(jìn)行現(xiàn)場(chǎng)處理。
從電網(wǎng)公司的營銷管理系統(tǒng)和計(jì)量自動(dòng)化系統(tǒng)中獲取到具有利用價(jià)值的用電大數(shù)據(jù),通過一定的技術(shù)手段[9]實(shí)現(xiàn)對(duì)用電數(shù)據(jù)進(jìn)行分析處理以達(dá)到智能電能表異常分類的目的。大數(shù)據(jù)技術(shù)主要包括大數(shù)據(jù)輸入、大數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘、共享和交換等。
通過獲取到用電實(shí)時(shí)數(shù)據(jù)和歷史數(shù)據(jù),針對(duì)判斷原則特征對(duì)數(shù)據(jù)進(jìn)行分析,確定正常數(shù)據(jù)并對(duì)異常數(shù)據(jù)進(jìn)行分析。采集到的用電大數(shù)據(jù)樣本為X={x1,x2,…,xn},其中每個(gè)樣本Xi均有n個(gè)特征指標(biāo),即Xi={xi1,xi2,…,xin},將樣本劃分為C 類(2 ≤C≤n)。模糊聚類的算法思路就是從用電大數(shù)據(jù)樣本中找到一個(gè)隸屬度矩陣和聚類中心使得目標(biāo)函數(shù)最小,公式表示如下:
式中,V表示為聚類中心。
式中,U表示為采集到的用電大數(shù)據(jù)樣本Xi的隸屬度矩陣。
式中,uji表示的是第i類數(shù)據(jù)隸屬于第j類聚類中心的程度,且約束條件為P表示為加權(quán)指數(shù),P∈[1,∞],當(dāng)P=1 時(shí),模糊聚類方法就變換為C 均值聚類,通常情況下我們將P=2 時(shí)分類效果較為明顯;dji表示的是樣本Xi與第j類聚類中心之間的距離,用歐氏距離[10]函數(shù)表達(dá),如公式(4)表示:
使minJ(U,V) 達(dá)到極小點(diǎn),U'和V'應(yīng)該滿足以下條件:
得出U'和V',按照以下判定準(zhǔn)則對(duì)樣本進(jìn)行分來:
1)按樣本與聚類中心距離判定: 若dji=min(dji)(1 ≤j≤m),則將樣本Xi歸屬于第j類;
2)按樣本對(duì)聚類中心隸屬度最大判定:若uji=max(uji)(1 ≤j≤m),則將樣本Xi歸屬于第j類。
在機(jī)器學(xué)習(xí)算法中比較常見的有樸素貝葉斯算法、支持向量機(jī)算法和決策樹算法(ID3、CART、C4.5)[11-15]。首先樸素貝葉斯算法準(zhǔn)確率不高,其次是支持向量機(jī)算法運(yùn)算時(shí)間較長,經(jīng)過分析比較3 種算法中決策樹算法最為適合基于用電大數(shù)據(jù)的應(yīng)用。
在決策樹算法中,CART 算法無法進(jìn)行多類別分類,只能形成局限于“是非”分類的二叉樹;在ID3 算法中無法處理數(shù)據(jù)樣本的連續(xù)特征,而且ID3 算法不能滿足假如某個(gè)屬性存在數(shù)據(jù)缺失的情況,同時(shí)在ID3 算法中未考慮到“過擬合”,針對(duì)用電數(shù)據(jù)特性和數(shù)據(jù)采集情況,ID3 算法無法滿足要求,所以本文考慮采用C4.5 決策樹算法進(jìn)行闡述。
1)計(jì)算整個(gè)樣本集的信息熵[16]。
式中,H(X) 表示為樣本集X的信息熵;pi表示為樣本集X中第i類樣本所占比列,i=1,2,…,n。
2)若離散型的屬性A數(shù)據(jù)存在于m個(gè)數(shù)據(jù)值,記為A1,A2,…,Am,假設(shè)使用屬性A數(shù)據(jù)對(duì)樣本集X進(jìn)行劃分,會(huì)產(chǎn)生m個(gè)分支樹節(jié)點(diǎn),其中Xm為在第m個(gè)節(jié)點(diǎn)上取值為Am的樣本,每一個(gè)分支樹節(jié)點(diǎn)的權(quán)重記為|X|,引入信息增益率,則為:
公式(7)中,I(X,A) 表示為屬性A數(shù)據(jù)對(duì)樣本集合X劃分所得的信息增益;IR(X,A)表示為信息增益率;HA(X)表示為屬性A數(shù)據(jù)對(duì)樣本集合X的特征熵。
利用信息增益率,對(duì)屬性數(shù)據(jù)進(jìn)行決策樹建立,選擇信息增益率最大的屬性作為決策樹節(jié)點(diǎn),進(jìn)而豐富決策樹通過對(duì)樣本集進(jìn)行訓(xùn)練,最終實(shí)現(xiàn)對(duì)數(shù)據(jù)的分類評(píng)估。如圖2所示,以電能表負(fù)荷曲線為例,對(duì)電能表進(jìn)行評(píng)估分類。
圖2 電壓事件決策樹示意圖
智能電能表異常診斷方法分為采集異常、裝置異常和運(yùn)行異常三個(gè)方面,每項(xiàng)異常之間存在一定的關(guān)聯(lián)度并賦予相應(yīng)的權(quán)重,如表1所示。
表1 智能電能表部分異常分析關(guān)聯(lián)表
智能電能表異常評(píng)估系統(tǒng)基于用電大數(shù)據(jù)分析,實(shí)現(xiàn)異常檔案分析、事件記錄分析、數(shù)據(jù)異常分析、接線異常分析、計(jì)量異常分析、異常告警、高風(fēng)險(xiǎn)裝置數(shù)據(jù)跟蹤、電能表綜合評(píng)估等功能應(yīng)用,如圖3所示。
圖3 功能結(jié)構(gòu)示意圖
1)異常檔案分析:針對(duì)總表變比異常、臺(tái)區(qū)無總表、臺(tái)區(qū)多總表、無戶表、歷史檔案異常、戶變檔案異常進(jìn)行分析。
2)事件記錄分析:結(jié)合電能表內(nèi)存儲(chǔ)的事件記錄信息,分析電能表運(yùn)行情況。
3)數(shù)據(jù)異常分析:包括示數(shù)上跳、示數(shù)下跳、表底翻轉(zhuǎn)、電量突增等分析,針對(duì)換表和追補(bǔ)電量的情況,進(jìn)行異常白名單自動(dòng)過濾。如圖4所示,通過系統(tǒng)統(tǒng)計(jì)分析出電能表異常數(shù)量并能夠?qū)崿F(xiàn)準(zhǔn)確定位。圖5是電能表異常明細(xì)表。
圖4 電能表異常統(tǒng)計(jì)界面
圖5 電能表異常告警界面
4)接線異常分析:利用電能表接入的相序、電壓、電流等情況,結(jié)合接線異常典型模型分析接線是否異常。
5)計(jì)量異常分析:針對(duì)疑似表底停走、總表計(jì)量問題、用戶表超量程、互感器過載、臺(tái)區(qū)輕載和重載等可能影響計(jì)量誤差的情況進(jìn)行分析,判斷出異常裝置并形成異常明細(xì)清單。
6)異常告警:對(duì)異常計(jì)量裝置主動(dòng)發(fā)出告警信息。如圖6所示,按照電能表異常模型診斷出異常對(duì)其主動(dòng)發(fā)起告警信息并生成相應(yīng)處理工作單。
圖6 電能表異常告警工單查詢界面
7)高風(fēng)險(xiǎn)裝置數(shù)據(jù)跟蹤:按照《用電計(jì)量設(shè)備缺陷標(biāo)準(zhǔn)庫》等級(jí)對(duì)重大及以上的異常裝置進(jìn)行數(shù)據(jù)跟蹤至恢復(fù)正常。
8)電能表綜合評(píng)估:結(jié)合批次電能表、運(yùn)行情況進(jìn)行分析,對(duì)電能表進(jìn)行綜合評(píng)估,制定合理的評(píng)分細(xì)則,將電能表按輕重緩急的原則進(jìn)行分類,提供輪換依據(jù)。
智能電表在運(yùn)行過程中由于環(huán)境、人為以及產(chǎn)品質(zhì)量等原因?qū)е鲁霈F(xiàn)異常,針對(duì)用電數(shù)據(jù)、接線情況、計(jì)量問題等方面進(jìn)行分析,對(duì)電能表提出相應(yīng)的輪換(處理)意見,并對(duì)電能表做出異常評(píng)估,使目前批次電表統(tǒng)一輪換的傳統(tǒng)方式向有針對(duì)性的輪換方式轉(zhuǎn)變。本文提出了一種智能電能表異常評(píng)估的系統(tǒng),主要作用如下:
1)基于用電大數(shù)據(jù)技術(shù)實(shí)現(xiàn)對(duì)檔案信息、事件記錄、用電數(shù)據(jù)、接線情況、計(jì)量問題等方面進(jìn)行分析,并自動(dòng)進(jìn)行異常分類。
2)利用決策樹算法的機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)對(duì)智能電能表異常的評(píng)估,按照等級(jí)劃分針對(duì)高風(fēng)險(xiǎn)電能表進(jìn)行異常跟蹤。