亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于AMI數(shù)據(jù)驅(qū)動的竊電用戶識別研究

        2022-12-11 02:37:06劉文浩馮玥姜東良
        制造業(yè)自動化 2022年11期
        關(guān)鍵詞:頻域用電負荷

        劉文浩,馮玥,姜東良

        (1.遼寧工程技術(shù)大學 電氣與控制工程學院,葫蘆島 125105;2.國網(wǎng)冀北電力有限公司遷西縣供電分公司,唐山 064300;3.遼寧工程技術(shù)大學 軟件學院,葫蘆島 125105)

        0 引言

        電已經(jīng)成為我們生活中的必需品。電能損失可分為技術(shù)損失和非技術(shù)損失[1],通常發(fā)生在發(fā)電、輸電和配電過程中。主要的非技術(shù)損失之一是竊電。這種不當行為通常包括繞過電表、篡改電表讀數(shù)或破壞電表等[2]。在發(fā)達國家,如美國每年因竊電損失約60億美元[3]。對于發(fā)展中經(jīng)濟體來說,損失的后果要糟糕得多。印度每年因竊電損失170億美元[4]。其他發(fā)展中國家損失了近50%的電力收入[5]。除了會給電力公司造成巨額收入損失外,竊電也會導致電力需求激增、電力系統(tǒng)負荷過重、以及對公共安全的危害(如火災和電擊)。

        目前,有大量關(guān)于檢測竊電的研究。傳統(tǒng)的竊電檢測方法包括[6]:人工檢查有問題的電表安裝或錯誤配置,將異常電表讀數(shù)與正常電表讀數(shù)進行比較,以及檢查旁路輸電線路等。然而,這些方法極其耗時、昂貴且效率低下。智能電網(wǎng)的出現(xiàn)為解決竊電帶來了機遇。隨著高級計量設施(AMI)的大量安裝,用戶的用電大數(shù)據(jù)的收集變成了可能。相比于傳統(tǒng)的竊電檢測方法,數(shù)據(jù)驅(qū)動方法是更具吸引力的,因為智能電表提供了豐富的能耗數(shù)據(jù),成本低并且能提供良好的檢測率。

        文獻[5~10]使用開源的愛爾蘭能源數(shù)據(jù)集[11]對用戶竊電檢測問題進行了大量研究。但愛爾蘭數(shù)據(jù)集中所有的用戶都被認為是誠實用戶,需自定義生成竊電用戶的數(shù)據(jù)。自定義竊電用戶數(shù)據(jù)與真實竊電用戶數(shù)據(jù)之間相似性不能保證完全。文獻[12]公布出帶真實竊電標簽的用戶用電數(shù)據(jù)集,針對竊電用戶和誠實用戶每周和每月用電規(guī)律的差異性,從周用電消費趨勢和月用電消費趨勢兩個維度提取特征,搭建卷積神經(jīng)網(wǎng)絡模型進行竊電檢測,給出了80%的AUC值。但此方法中數(shù)據(jù)預處理不夠充分,對連續(xù)缺失值的插補過多,并且僅考慮不同類型用戶自身的用電規(guī)律,缺乏不同用戶用電數(shù)據(jù)的直接對比。

        考慮到誠實用戶與竊電用戶用電數(shù)據(jù)的差異是多樣的。我們對數(shù)據(jù)集中的數(shù)據(jù)進行嚴格預處理。通過分析不同類型用戶用電數(shù)據(jù)數(shù)值和消費趨勢方面的差異性,尋找其它可用于有效分類的特征,并搭配監(jiān)督學習方法進行試驗。

        由于時頻域參數(shù)在故障分類方面有非常多成功的經(jīng)驗[13,14]。為此,我們對用戶時頻域參數(shù)在竊電分類中的研究也做了初步探索,并給出分類結(jié)果。試驗流程圖如圖1所示。

        圖1 竊電檢測流程圖

        1 數(shù)據(jù)處理與分析

        1.1 數(shù)據(jù)預處理

        源數(shù)據(jù)集[15]由中國國家電網(wǎng)公司提供,包括42372個用戶2014年1月1日至2016年10月31日連續(xù)1034天的日用電負荷。其中,有3615個用戶被標記為竊電用戶,其余則為誠實用戶,且數(shù)據(jù)中包含大量的缺失值。為此,使用Python語言軟件的msno模塊繪制數(shù)據(jù)分布矩陣,發(fā)現(xiàn)2016年1月1日之前的數(shù)據(jù)情況存在嚴重缺失。為保證數(shù)據(jù)可靠性,我們截取2016年1月1日至2016年10月31日連續(xù)304天的的數(shù)據(jù),并將其中連續(xù)缺失數(shù)據(jù)超過6天的用戶刪除,少量缺失值我們對其進行前向插補,最后預處理后的數(shù)據(jù)情況如表1所示。

        表1 預處理后數(shù)據(jù)信息表

        1.2 用戶用電行為分析

        為證明所提模型的合理性,在建立模型之前,我們對表1中用戶進行用電行為分析,繪制負荷圖如下。為保證分析數(shù)據(jù)的有效性,我們對誠實用戶和異常用戶進行隨機抽取。

        如圖2所示,我們隨機抽取誠實用戶與竊電用戶各三名,繪制出它們連續(xù)304天的用電數(shù)據(jù)曲線,從中我們可以看出總體上,大部分竊電用戶的日用電量是低于誠實用戶的,并且誠實用戶相比竊電用戶用電規(guī)律具有更強的波動性。此外,我們隨機挑選部分用戶繪制節(jié)假日和休息日的用電數(shù)據(jù)曲線,如圖3、圖4所示。從中我們可以觀測到節(jié)假日和休息日不同類型用戶的電量差是變化的,誠實用戶的用電波動性更強。除此之外,隨機抽取竊電用戶與誠實用戶各500名,繪制出時頻域參數(shù)中的無量綱值峭度與偏斜度對比圖,如圖5所示。

        圖2 竊電用戶與誠實用戶用電負荷對比圖

        圖3 節(jié)假日用電負荷對比圖

        圖4 休息日用電負荷對比圖

        圖5 部分時頻域特征對比圖

        基于對比圖,利用經(jīng)驗和直觀負荷圖從數(shù)據(jù)中提取特征是困難的。在對竊電用戶和誠實用戶的數(shù)據(jù)分析中,我們無法看出竊電用戶與誠實用戶之間用電規(guī)律明顯的不同。但考慮用電規(guī)律的波動性,我們將用戶每天的日用電總量作為特征,利用主成分分析(PCA)保留特征中絕大部分信息,進行特征重構(gòu)繼而分類。此外,針對峭度等時頻域參數(shù)對比圖,我們也挑選了部分時頻域參數(shù)作為特征進行分類。

        1.3 數(shù)據(jù)集的平衡

        如表1中竊電用戶與誠實用戶的數(shù)量分布情況。為解決數(shù)據(jù)類別嚴重不平衡的問題,在本文中,我們引入合成少數(shù)類過采樣技術(shù)(SMOTE)。SMOTE根據(jù)少數(shù)類樣本人工合成新樣本添加到數(shù)據(jù)集中[16]。原理如下,SMOTE對少數(shù)類中每一個樣本(x1,x2),以歐式距離為標準計算它與少數(shù)類樣本集中所有樣本的距離,得其k近鄰。根據(jù)不平衡比例設置采樣倍率N,由N從其k近鄰中隨機選擇若干樣本,假設選擇的近鄰為(x'1,x'2)。樣本點合成公式如式(1)所示:

        其中Δ={(x'1-x1),(x'2-x2)},random(0,1)為0,1之間的隨機數(shù)。使用SMOTE后,正常用戶和盜竊用戶的數(shù)量幾乎相等。

        2 特征提取與用戶分類

        對竊電識別效果最好的PCA-RandomForest模型給出搭建原理和詳細過程,其他則在第3節(jié)中簡要介紹。

        2.1 利用PCA進行特征提取

        在探索提議的檢測方法之前,簡要介紹主成分分析的基本原理[17]。主成分分析是一種統(tǒng)計分析方法,在空間上可以理解為保持源數(shù)據(jù)集中各樣本空間位置不變的情況下,構(gòu)建新坐標系,使得各樣本在這個新的坐標系上的投影具有最大的方差。這樣可以在盡可能保留源數(shù)據(jù)集信息的同時,降低給定高維數(shù)據(jù)的維數(shù)。

        在我們的模型中,我們定義每個用戶為一個獨立的樣本,用戶每天的用電數(shù)據(jù)量為其用電特征。我們提取處理后的用戶用電數(shù)據(jù)(細節(jié)如表1所示)構(gòu)建特征矩陣。矩陣的每一行是一個樣本的特征向量,即矩陣中有m個樣本,每個樣本有n個特征值。降維之前我們對數(shù)據(jù)X進行白化處理,保證數(shù)據(jù)各維度的方差為1,之后對數(shù)據(jù)集X應用主成分分析進行降維。

        第一主成分如下所示:

        同理,第二主成分被給出為:

        同樣,我們計算出其他主成分,各主成分所保留信息占比如圖6所示,我們選擇前7個主成分,重新構(gòu)建特征矩陣p=[p1,p2,...,p7],這保存了源數(shù)據(jù)集99%的信息。

        圖6 各主成分信息占比圖

        2.2 利用隨機森林進行分類

        根據(jù)PCA重建數(shù)據(jù)的特點,隨機森林算法用于分類。隨機森林算法由多個CART決策樹組成。構(gòu)建每棵決策樹前,首先對全部m個樣本進行有放回的自助采樣,獲得與源數(shù)據(jù)集大小相同,但部分數(shù)據(jù)點會缺失(大約三分之一)的數(shù)據(jù)集。接下來,基于新創(chuàng)建的數(shù)據(jù)集建立決策樹。與普通決策樹構(gòu)建不同,隨機森林中決策樹的構(gòu)建選擇在每個節(jié)點處,隨機選擇特征的一個子集,并對其中一個特征尋找最佳測試。特征子集中特征個數(shù)由最大特征數(shù)(max_features)參數(shù)來控制。由于使用了自助采樣,隨機森林中構(gòu)建每顆決策樹的數(shù)據(jù)集都略有不同。由于每個節(jié)點的特征選擇,每棵樹的劃分都是基于特征的不同子集。這共同保證隨機森林中所有樹都不相同。在分類過程中,采取軟投票(soft voting)策略。即每個算法做出“軟”預測,給出每個可能的輸出標簽的概率。對所有樹的預測概率取平均值,然后將概率最大的類別作為預測結(jié)果。

        隨機森林算法通過Python語言軟件平臺實現(xiàn),在實現(xiàn)過程中的一個關(guān)鍵參數(shù)是max_features,較小的max_features可以降低過擬合。我們對不同max_features進行試驗,默認的max_features=sqrt(n_features)給出了比較好的結(jié)果。

        3 實驗結(jié)果與討論

        以(均值,方差,最小值,最大值,峭度,偏斜度,標準差)等七個時頻域參數(shù)為特征進行分類的結(jié)果如表2所示。除此之外,PCA搭配監(jiān)督學習方法的分類結(jié)果也在表2中顯示作為對比。

        表2 各方法準確率對比表

        為證明所提模型的穩(wěn)定性,隨機抽取源數(shù)據(jù)集不同比例樣本進行分類。PCA-RandomForest(R%)指隨機抽取源數(shù)據(jù)集中R%的樣本,利用PCA-RandomForest模型進行分類。結(jié)果如表3所示。

        表3 不同比例源數(shù)據(jù)集準確率對比表

        PCA-RandomForest(100%)竊電檢測模型的混淆矩陣如圖7所示。從中可以看出該模型非常均衡,對竊電用戶的識別率達到84%左右,同時對誠實用戶的誤診率小于15%。由此證明不同類型用戶每天的日用電量也為竊電用戶和和誠實用戶的不同特征之一,對此特征進行降維后進行竊電用戶的識別是有效的。

        圖7 混淆矩陣圖

        4 結(jié)語

        本文基于由中國國家電網(wǎng)公司(SGCC)提供的帶竊電用戶標簽的真實數(shù)據(jù)集,對不同類型用戶用電數(shù)據(jù)進行分析,建立以用戶所有日負荷總量為特征的PCARandomForest竊電檢測模型。該模型非常均衡。利用該模型超過84%的竊電用戶被識別,而誠實用戶的誤檢率小于15%,這表明日負荷值的差異性同樣是識別不同類型用戶的有效手段之一。占比源數(shù)據(jù)集60%~90%的對比實驗證明了該模型的穩(wěn)定性。事實上,由PCA-RandomForest的原理,該模型可適用于很多場景,尤其是工業(yè)應用。同時也可與其它模型共同作用,進行異常對象的識別。除此之外,我們對峭度等時頻域參數(shù)在竊電檢測領(lǐng)域中的效果進行了初步探索,給出對比結(jié)果,這也是我們正在嘗試的方向之一。

        猜你喜歡
        頻域用電負荷
        用電安全
        用煤用電用氣保障工作的通知
        安全用電知識多
        用電安全要注意
        頻域稀疏毫米波人體安檢成像處理和快速成像稀疏陣列設計
        雷達學報(2018年3期)2018-07-18 02:41:34
        防止過負荷時距離保護誤動新判據(jù)
        主動降負荷才是正經(jīng)事
        基于改進Radon-Wigner變換的目標和拖曳式誘餌頻域分離
        一種基于頻域的QPSK窄帶干擾抑制算法
        負荷跟蹤運行下反應堆一回路控制系統(tǒng)仿真與驗證
        国产精品一区二区黑丝| 91精品91| 一区二区三区四区日韩亚洲| 亚洲第一黄色免费网站| 日韩人妻ol丝袜av一二区| 国产精品久久婷婷六月丁香| www.91久久| 亚洲av少妇一区二区在线观看| 18禁止看的免费污网站| 亚洲精品中文字幕无码蜜桃| 91成人午夜性a一级毛片| 国产亚洲一区二区毛片| 成 人色 网 站 欧美大片在线观看| 国产va在线观看免费| 在线观看国产一区亚洲bd| 久久久国产精品三级av| 久久精品成人一区二区三区| 国产在线不卡一区二区三区| 国产午夜亚洲精品一级在线| 男女深夜视频网站入口| 午夜爽爽爽男女污污污网站| 欧美情侣性视频| 亚洲中文字幕无线乱码va| 日本免费在线一区二区三区| 粗大猛烈进出高潮视频| 久久综合给日咪咪精品欧一区二区三| 女优视频一区二区三区在线观看 | 高潮社区51视频在线观看| 日本久久精品福利视频| 色爱无码av综合区| 久久免费区一区二区三波多野在| 少妇人妻偷人中文字幕| 国产特级毛片aaaaaa高潮流水| 国产久热精品无码激情| 色综合999| 精品国产一区二区三区av免费| 亚洲av不卡一区二区三区| 亚洲国产夜色在线观看| 亚洲国产综合一区二区| 色综合久久中文娱乐网| 久久AⅤ无码精品为人妻系列|