劉寶云,崔 文,張曉華,生西奎,呂 曈
(國(guó)網(wǎng)延邊供電公司,吉林 延吉 133000)
隨著我國(guó)經(jīng)濟(jì)的快速發(fā)展,工業(yè)生產(chǎn)和居民用電需求不斷增大,用電數(shù)量逐年攀升,有部分用戶通過(guò)各種的手段竊取電能。傳統(tǒng)的竊電檢查一方面由于用戶數(shù)量多,現(xiàn)場(chǎng)逐戶排查工作量大,效率低;另一方面由于竊電手段多樣,用電檢查人員現(xiàn)場(chǎng)檢查有時(shí)難以發(fā)現(xiàn),造成電量持續(xù)丟失。
近年來(lái),竊電手段新穎多變,一般有以下幾種常見的竊電方式:欠壓法、欠流法、移相法、擴(kuò)差法等[1-3],現(xiàn)階段關(guān)于竊電檢測(cè)方法主要有統(tǒng)計(jì)學(xué)方法、支持向量機(jī)、聚類分析等[4-5],如文獻(xiàn)[6]基于離群點(diǎn)算法對(duì)竊電方法進(jìn)行研究。隨著云計(jì)算、物聯(lián)網(wǎng)、人工智能等信息化技術(shù)的快速發(fā)展,以海量數(shù)據(jù)挖掘?yàn)榇淼拇髷?shù)據(jù)技術(shù)得到了空前的發(fā)展,在很多行業(yè)得到了廣泛的應(yīng)用[7-9]。近年來(lái),電網(wǎng)企業(yè)在信息化建設(shè)和應(yīng)用方面較為突出,在多個(gè)專業(yè)領(lǐng)域建成并應(yīng)用了多套業(yè)務(wù)系統(tǒng),包括用電信息采集系統(tǒng)和SG186系統(tǒng)等[10],這些信息化系統(tǒng)在應(yīng)用過(guò)程中產(chǎn)生了海量的電網(wǎng)運(yùn)行數(shù)據(jù),具有大數(shù)據(jù)應(yīng)用的典型特征:數(shù)據(jù)量大、數(shù)據(jù)類型多、價(jià)值密度低等特點(diǎn)[11-12]。將大數(shù)據(jù)技術(shù)應(yīng)用到智能電網(wǎng)領(lǐng)域,是泛在電力物聯(lián)網(wǎng)的具體應(yīng)用,也是國(guó)家“一帶一路”戰(zhàn)略的重要組成部分[13]。
本文采用人工智能和大數(shù)據(jù)技術(shù),基于智能電表數(shù)據(jù)遠(yuǎn)程采集技術(shù)和用電信息采集系統(tǒng)海量的多元數(shù)據(jù),從用電信息采集系統(tǒng)和SG186系統(tǒng)中的海量數(shù)據(jù)中提取出竊電用戶的關(guān)鍵特征,依據(jù)關(guān)鍵特征構(gòu)建用戶竊電的關(guān)聯(lián)性多維度分析模型,實(shí)現(xiàn)自動(dòng)判斷用戶是否存在竊電行為。
數(shù)據(jù)驅(qū)動(dòng)下的竊電數(shù)據(jù)分析系統(tǒng)主要包括三個(gè)模塊:數(shù)據(jù)預(yù)處理模塊、竊電評(píng)價(jià)指標(biāo)體系模塊、竊電識(shí)別檢測(cè)模塊。數(shù)據(jù)預(yù)處理模塊將用電信息采集系統(tǒng)中多元化的數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析、降維處理、歸一化處理以及數(shù)據(jù)填充等,得到量化的電氣特征參量作為竊電評(píng)價(jià)指標(biāo)模塊的輸入;竊電評(píng)價(jià)指標(biāo)模塊將量化的電氣特征參量通過(guò)算法確定參數(shù)和量化權(quán)重,從而使評(píng)價(jià)指標(biāo)集能夠準(zhǔn)確表征竊電行為所具有的規(guī)律,建立竊電數(shù)據(jù)分析所需要的專家樣本數(shù)據(jù);竊電識(shí)別檢測(cè)模塊基于樣本數(shù)據(jù)采用神經(jīng)網(wǎng)絡(luò)算法建立竊電分類預(yù)測(cè)模型,得到竊電檢測(cè)結(jié)果。整個(gè)流程見圖1 。
隨著智能電表的推廣,實(shí)現(xiàn)了分鐘級(jí)(15 min)的數(shù)據(jù)采集,用電信息采集系統(tǒng)中采集到的用電負(fù)荷數(shù)據(jù)(各相電流、電壓、功率因數(shù)、臺(tái)區(qū)線損等)以及用電異常(終端報(bào)警及違約竊電處罰信息等)等數(shù)據(jù)信息能夠反映用戶的用電情況,同時(shí),用戶每日、每月的用電量及用電異常情況也反映了用戶的用電行為。
用電信息采集系統(tǒng)中能夠采集到各相電流、電壓、功率因數(shù)等用電負(fù)荷數(shù)據(jù)以及用電異常數(shù)據(jù),系統(tǒng)中包含了各類用電用戶的實(shí)時(shí)及歷史電能信息(如計(jì)量在線監(jiān)測(cè)、線損分析等),計(jì)量在線監(jiān)測(cè)采集用戶電能信息進(jìn)行對(duì)比分析,對(duì)各類異常事件進(jìn)行告警提示,并與營(yíng)銷系統(tǒng)進(jìn)行閉環(huán)處理,因此,通過(guò)分析用電信息采集系統(tǒng)的電氣特征參量,建立電氣特征參量與竊電模型特征的關(guān)聯(lián)性關(guān)系,為甄選竊電模型的多維度特征值提供分析依據(jù)。
通過(guò)調(diào)研發(fā)現(xiàn),用電行業(yè)類別與竊電有著一定的關(guān)系,對(duì)計(jì)量數(shù)據(jù)根據(jù)用電行業(yè)采用決策樹算法進(jìn)行驗(yàn)證,證實(shí)了用戶用電行業(yè)、用電量、用電時(shí)間與竊電有著密切的關(guān)系,因此按行業(yè)類別如非工業(yè)用戶、居民用戶、供熱用戶、酒店餐飲用戶、普通工業(yè)用電用戶等進(jìn)行有針對(duì)性的構(gòu)建竊電預(yù)測(cè)模型,將大大提高預(yù)測(cè)的準(zhǔn)確性。
將采集系統(tǒng)中的電氣參量與竊電模型特征參量按類別進(jìn)行分類和對(duì)應(yīng),共分為三類:I類為物理電能數(shù)據(jù)(如相電壓、相電流、日用電量、有功功率等),II類為越限和線損率(如功率因數(shù)、線損及線損值變換率、電壓/電流不平衡度越限等),III類為異常事件記錄(如電流回路異常、電壓回路異常、電能表開蓋記錄、電壓斷相等)。
通過(guò)海量數(shù)據(jù),建立用電信息采集系統(tǒng)中各類數(shù)據(jù)、異常事件與竊電有關(guān)的關(guān)聯(lián)性關(guān)系,從中提取竊電用戶的關(guān)鍵特征,根據(jù)竊電多維度特征值,構(gòu)建竊電關(guān)聯(lián)性多維度評(píng)價(jià)指標(biāo)(見圖2),為供電企業(yè)反竊電稽查提供竊電預(yù)警模型的數(shù)據(jù)支撐。
三相電流不平衡率和三相電壓不平衡率表征的是用電過(guò)程中電壓和電流的波動(dòng)情況。用戶改變計(jì)量電流是竊電中常用的一種方式,在三相供電系統(tǒng)中,正常用戶的電流和電壓基本保持平衡,若存在三相電流(電壓)不平衡率較大,則表明該用戶存在竊電嫌疑,其計(jì)算方式為三相電流(壓)的最大值與最小值之差比上最小值。
線損率作為衡量供電線路的損失比例,通過(guò)臺(tái)區(qū)線損結(jié)合局部線路拓?fù)潢P(guān)系,可計(jì)算出用戶所屬線路在某天的線損率。鑒于用戶每天所用電量存在一定的波動(dòng),采用統(tǒng)計(jì)該用戶t天的線損平均值,根據(jù)前后t天的線損增長(zhǎng)率是否大于1%,從而判斷該用戶是否存在竊電行為。
功率因數(shù)異常是一個(gè)相對(duì)穩(wěn)定值,而且與用戶電量使用時(shí)間無(wú)關(guān),因此,可將功率因數(shù)作為竊電的一個(gè)主要的參考評(píng)價(jià)依據(jù)?!豆β室驍?shù)調(diào)整電費(fèi)辦法》中規(guī)定,工業(yè)用戶功率因數(shù)應(yīng)大于0.8,考慮到系統(tǒng)其他行業(yè)用戶,可將功率因數(shù)異常的閾值進(jìn)行調(diào)整,比如0.6,統(tǒng)計(jì)功率因數(shù)異常大于閾值的次數(shù)作為模型評(píng)價(jià)指標(biāo)。
異常次數(shù)是用電異常事件的總和,異常事件主要包括電流回路異常、電壓回路異常、電能表開蓋事件記錄等,統(tǒng)計(jì)與竊電相關(guān)的異常事件的次數(shù),作為竊電模型評(píng)價(jià)指標(biāo)。
用戶日用電量是表征電量使用最具代表性的指標(biāo)特征,用戶竊電最終表現(xiàn)在用電量下降這一表象上,正常用戶的用電量相對(duì)平穩(wěn),竊電用戶的用電量則會(huì)出現(xiàn)陡降趨勢(shì),因此,電量降幅應(yīng)作為竊電評(píng)價(jià)指標(biāo)中一個(gè)重要的特征指標(biāo)。因節(jié)假日的關(guān)系,用戶電量降幅采用統(tǒng)計(jì)連續(xù)5天的日用電平均值的斜率作為衡量指標(biāo)。
數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、缺失數(shù)據(jù)值處理、數(shù)據(jù)歸一化處理等。
數(shù)據(jù)清洗是將樣本數(shù)據(jù)中特別離譜的數(shù)據(jù)、標(biāo)注不明確的無(wú)效數(shù)據(jù)等進(jìn)行剔除,將贅余的數(shù)據(jù)過(guò)濾掉。
原始數(shù)據(jù)中不可避免的出現(xiàn)缺失值的現(xiàn)象,尤其是用戶電量、功率等參數(shù)的缺失將直接影響竊電分析和預(yù)測(cè)的準(zhǔn)確性,常用的數(shù)據(jù)插補(bǔ)算法有K近鄰填充(KNNI)算法、拉格朗日插值算法等。本文采用最小二乘法的擬合算法對(duì)用戶日用電量進(jìn)行缺失數(shù)據(jù)插補(bǔ)。
數(shù)據(jù)歸一化處理是根據(jù)竊電評(píng)價(jià)指標(biāo)將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,一般將樣本數(shù)據(jù)處理為0~1的數(shù),數(shù)據(jù)歸一化的公式如為:
(1)
式中:xi為樣本數(shù)據(jù)中任意第i個(gè)樣本值;xmin為樣本數(shù)據(jù)中的最小值;xmax為樣本數(shù)據(jù)中的最大值。
神經(jīng)網(wǎng)絡(luò)作為人工智能中經(jīng)典的算法,具有自適應(yīng)能力和很強(qiáng)的魯棒性、容錯(cuò)能力,本文利用神經(jīng)網(wǎng)絡(luò)結(jié)合數(shù)據(jù)技術(shù)構(gòu)建基于海量數(shù)據(jù)的竊電識(shí)別檢測(cè)模型,預(yù)測(cè)用電竊電嫌疑。
BP神經(jīng)網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò)(輸入層、隱含層、輸出層),通過(guò)反向傳播不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小。
算法實(shí)現(xiàn)過(guò)程如下:有k個(gè)輸入樣本x(k);期望輸出值為d(k);實(shí)際輸出值為y(k);設(shè)定誤差函數(shù)e為:
(2)
計(jì)算隱含層各神經(jīng)元的激活函值sj:
(3)
式中:wji為輸入層到隱含層的連接權(quán)值;θj為隱含層各單元的閾值。
激活函數(shù)采用S型函數(shù):
(4)
計(jì)算隱含層j單元的輸出值bj:
(5)
計(jì)算輸出層第k個(gè)單元的激活值sk:
(6)
式中:vkj為輸出層到隱含層的連接權(quán)值;θk為輸出層各單元的閾值。
修正輸出層和隱含層的權(quán)值和閾值,輸出層的校正誤差為:
dk=(ok-yk)yk(1-yk)
(7)
式中:yk為實(shí)際輸出,ok為希望輸出。
最終得到神經(jīng)網(wǎng)絡(luò)的全局誤差E:
(8)
設(shè)定BP神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn)數(shù)為3,輸出節(jié)點(diǎn)數(shù)為1,隱層節(jié)點(diǎn)數(shù)為10,將表征用戶歷史用電數(shù)據(jù)的評(píng)價(jià)指標(biāo)數(shù)據(jù)作為輸入,將竊電結(jié)果(是否竊電0或1)作為期望目標(biāo)輸出,對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,當(dāng)模型訓(xùn)練達(dá)到精度要求時(shí),將待檢測(cè)的用戶數(shù)據(jù)輸入到訓(xùn)練好的模型中,進(jìn)行竊電嫌疑預(yù)測(cè)。
因用戶行業(yè)類別與用電量、電費(fèi)、用電時(shí)間密切相關(guān),根據(jù)模型測(cè)試,發(fā)現(xiàn)用電行業(yè)與竊電行為有著一定的關(guān)聯(lián),所以本文根據(jù)模型特征,將數(shù)據(jù)分為供熱用戶、餐飲用戶、居民用戶、工業(yè)用戶進(jìn)行模型檢測(cè),提高模型預(yù)測(cè)的精確度。
以某供電局2014年1月至2018年12月的用電信息采集系統(tǒng)中的數(shù)據(jù)作為測(cè)試對(duì)象,經(jīng)現(xiàn)場(chǎng)勘查取證,確認(rèn)竊電用戶數(shù)8個(gè),系統(tǒng)模型預(yù)測(cè)結(jié)果見表1 。
表1 系統(tǒng)模型預(yù)測(cè)結(jié)果
從表1也可知預(yù)測(cè)竊電的預(yù)測(cè)值與實(shí)際竊電有很高的吻合度,在一定程度上反映了模型預(yù)測(cè)的準(zhǔn)確性,為大數(shù)據(jù)背景下開展竊電偵查工作提供了技術(shù)依據(jù)。
隨著智能電表的推廣及用電信息采集系統(tǒng)建設(shè)的逐步完善,電網(wǎng)公司積累了海量用戶用電數(shù)據(jù),為大數(shù)據(jù)技術(shù)在電力領(lǐng)域的應(yīng)用提供了基礎(chǔ)。本文提出一種基于神經(jīng)網(wǎng)絡(luò)和決策樹算法的竊電預(yù)測(cè)模型,從試驗(yàn)比對(duì)和驗(yàn)證結(jié)果看,基于優(yōu)化的神經(jīng)網(wǎng)絡(luò)能更快的收斂并且準(zhǔn)確性也相對(duì)提高。