亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于半監(jiān)督三訓(xùn)方法的竊電用戶識(shí)別的研究及應(yīng)用

        2020-05-11 11:43:41馮歆堯黃劍文孟禹
        微型電腦應(yīng)用 2020年1期

        馮歆堯 黃劍文 孟禹

        摘 要: 針對(duì)傳統(tǒng)竊電行為的識(shí)別方法難以有效解決竊電技術(shù)提升帶來的高頻竊電問題,研究了電力企業(yè)已有數(shù)據(jù)現(xiàn)狀,提出半監(jiān)督分類模型識(shí)別竊電用戶。通過深入分析業(yè)務(wù)并設(shè)計(jì)特征指標(biāo),圍繞廣東電網(wǎng)高壓用戶的海量用電行為數(shù)據(jù),開展半監(jiān)督三訓(xùn)方法的竊電用戶識(shí)別研究與應(yīng)用。研究結(jié)果發(fā)現(xiàn),半監(jiān)督分類模型預(yù)測(cè)提升度超過1.5,對(duì)比最優(yōu)的有監(jiān)督學(xué)習(xí)模型,效率提升7.3%,有效提升竊電用戶識(shí)別效率為電網(wǎng)企業(yè)的反竊電工作提供有力的支撐。

        關(guān)鍵詞: 竊電用戶; 半監(jiān)督學(xué)習(xí); 三訓(xùn)方法; 竊電識(shí)別; 識(shí)別效率

        中圖分類號(hào): TM ? ? ?文獻(xiàn)標(biāo)志碼: A

        Research and Applcaton of dentfcaton Stealng Users

        Based on Sem-supervsed Three Tranng Methods

        FENG Xnyao1, HUANG Janwen1, MENG Yu2

        (1.Guangdong Power Grd Co. Ltd., Guangzhou 510000;

        2.Guangzhou Brllant Data Analytcs nc. Ltd., Guangzhou 510000)

        Abstract: Amng at the dffculty n effectvely solvng the problem of hgh frequency power larceny caused by the mprovement of electrc larceny technology by usng the tradtonal method of dentfyng electrc larceny behavor, ths paper explores the exstng data status of electrc power enterprses, and proposes sem-supervsed classfcaton model to dentfy electrc larceny users. Through n-depth analyss of busness and desgn of characterstc ndcators, ths paper conducts research and applcaton on dentfcaton of electrc stealng users by sem-supervsed tr-tranng based on massve electrcty behavor data of hgh voltage users of Guangdong Power Grd. The results show that the forecast mprovement degree of sem-supervsed classfcaton model s more than 1.5, the effcency s mproved by 7.3% compared wth the optmal supervsed learnng model, and the dentfcaton effcency of power-stealng users s effectvely mproved, provdng strong support for the ant-power-stealng work of power grd enterprses.

        Key words: Power-stealng users; Sem-supervsed learnng; Three tranng methods; dentfcaton of electrc larceny; dentfyng effcency

        0 引言

        隨著經(jīng)濟(jì)與技術(shù)的發(fā)展,在電力行業(yè)中,竊電主體逐漸團(tuán)隊(duì)化,竊電技術(shù)逐漸科技化,竊電行為逐漸隱秘化,使供電企業(yè)的反竊電難度不斷變大。電力企業(yè)的信息化發(fā)展為供電企業(yè)的數(shù)據(jù)挖掘提供了基礎(chǔ)支撐,通過深入挖掘計(jì)量系統(tǒng)的海量監(jiān)測(cè)數(shù)據(jù),對(duì)竊電用戶的類型及規(guī)律進(jìn)行特征刻畫與分析,建立數(shù)據(jù)分析模型,實(shí)時(shí)監(jiān)測(cè)竊漏電情況,篩選風(fēng)險(xiǎn)用戶、確定檢查方向并制定檢查計(jì)劃。

        針對(duì)反竊電的數(shù)據(jù)挖掘問題,王穎琛等利用隨機(jī)矩陣分析法構(gòu)建竊電風(fēng)險(xiǎn)識(shí)別模型篩選竊電風(fēng)險(xiǎn)用戶[1],喬亮等根據(jù)報(bào)警事件發(fā)生前后客戶計(jì)量點(diǎn)有關(guān)的電流、電壓、負(fù)荷數(shù)據(jù)情況等,構(gòu)建基于指標(biāo)加權(quán)的用電異常分析模型檢查竊電行為 [2],曹崢等使用有監(jiān)督方法,構(gòu)建大量業(yè)務(wù)指標(biāo)并轉(zhuǎn)換為數(shù)據(jù)指標(biāo),構(gòu)建竊電風(fēng)險(xiǎn)模型[3],這些研究應(yīng)用一定程度上提高了反竊電的工作效率。大部分電力業(yè)務(wù)系統(tǒng)的竊電標(biāo)識(shí)較少,常規(guī)分析挖掘方法對(duì)竊電風(fēng)險(xiǎn)用戶的識(shí)別效率有限,但電力業(yè)務(wù)系統(tǒng)累積了海量的竊電未標(biāo)識(shí)數(shù)據(jù),所以,應(yīng)用效果與實(shí)際需求還有一定的提升空間。

        本文以有效識(shí)別竊電風(fēng)險(xiǎn)用戶為研究目的,基于營(yíng)銷系統(tǒng)、生產(chǎn)系統(tǒng)及計(jì)量系統(tǒng)等信息化系統(tǒng)的數(shù)據(jù),借助半監(jiān)督分類方法,使用Oracle 11g與R-3.3.0等工具進(jìn)行數(shù)據(jù)挖掘,充分利用海量竊電未標(biāo)識(shí)數(shù)據(jù),有效識(shí)別竊電風(fēng)險(xiǎn)用戶。

        1 半監(jiān)督分類模型

        許多實(shí)際應(yīng)用中,樣本的有類標(biāo)識(shí)的判定成本較高,由此,許多情況下,樣本中包含極少量的有類標(biāo)識(shí)的樣本和過剩的無類標(biāo)簽的樣例[4-6]。半監(jiān)督分類為了彌補(bǔ)有類標(biāo)識(shí)的樣本L不足的缺陷,在有限的有類標(biāo)識(shí)的樣本中加入大量的無類標(biāo)簽的樣例U,期望訓(xùn)練得到分類性能更優(yōu)的分類器,從而識(shí)別無類標(biāo)簽的樣例T的類標(biāo)簽[7, 8]。

        協(xié)同訓(xùn)練方法的是最初提出的基于差異的半監(jiān)督分類方法[9],這個(gè)方法需要滿足兩個(gè)假設(shè)條件:(1)視角充分冗余假設(shè),即有類標(biāo)簽的樣本數(shù)量足夠;(2)條件獨(dú)立假設(shè),即每個(gè)視角的特征描述都條件獨(dú)立于另一視角的特征描述。

        在有類標(biāo)簽的樣本Y={y1,…,yl}中,從兩個(gè)不同視角出發(fā),根據(jù)已知標(biāo)識(shí)及特征,每個(gè)視角獲得樣本Lj={(x1,y1),…,(xl,yl)},學(xué)習(xí)特征到標(biāo)識(shí)的映射f為式(1)。f:X→Y

        (1) ?得到學(xué)習(xí)機(jī)兩個(gè)不同的學(xué)習(xí)機(jī)Hj=f(x),j∈{1,2},其中,樣本x∈Rm,類標(biāo)識(shí)y{c1,c2,…,cC},cm∈N,=1,…,l。

        然后用這兩個(gè)學(xué)習(xí)機(jī)Hj=f(x),j∈{1,2}預(yù)測(cè)無類標(biāo)簽樣例U={xl+1,…,xl+n}的類標(biāo)簽,每個(gè)學(xué)習(xí)機(jī)選擇標(biāo)記結(jié)果置信度最高的預(yù)測(cè)類標(biāo)簽V1={(xl+1,yl+1),…,(xl+k,yl+k)},k≤n,加入另一個(gè)學(xué)習(xí)機(jī)的有類標(biāo)簽的樣本集中L2。

        這個(gè)過程反復(fù)迭代進(jìn)行,直到滿足停止條件,獲得最終的識(shí)別模型H,用于預(yù)測(cè)樣本T={xtest1,…,xtestt}的分類標(biāo)識(shí)為式(2)。H(t)≈y, y∈{c1,c2,…,cC}

        (2)2 半監(jiān)督分類的三訓(xùn)算法

        在竊電風(fēng)險(xiǎn)識(shí)別的實(shí)際問題中,訓(xùn)練數(shù)據(jù)往往不滿足視角充分冗余假設(shè),三訓(xùn)算法是由Zhou提出的一種協(xié)同機(jī)制的半監(jiān)督分類算法[10],算法通過構(gòu)造三個(gè)不同的分類器進(jìn)行協(xié)同訓(xùn)練,最后通過Baggng算法進(jìn)行集成[11-13],對(duì)于數(shù)據(jù)集不需要兩個(gè)冗余角度。

        假設(shè)初始的少量有標(biāo)記樣本集為L(zhǎng)={(x1,y1),…,(xl,yl)},未標(biāo)記樣本集為U={x,x∈U};首先對(duì)有標(biāo)記樣本集進(jìn)行可重復(fù)采樣 [14]以獲得三個(gè)有標(biāo)記訓(xùn)練集L1,L2,L3;對(duì)三個(gè)不同的訓(xùn)練集進(jìn)行訓(xùn)練為式(3)。L1={(x11,y11),…,(x1l,y1l)};f1:X1→Y1

        L2={(x21,y21),…,(x2l,y2l)};f2:X2→Y2

        L3={(x31,y31),…,(x3l,y3l)};f3:X3→Y3

        (3) ?得到三個(gè)初始分類器H1={H1,H1∈H1},1≤≤3;在三訓(xùn)算法的迭代過程中,每個(gè)分類器新增的訓(xùn)練樣本由另外兩個(gè)分類器協(xié)作提供。對(duì)于分類器H11,如果H12和H13對(duì)同一個(gè)未標(biāo)記樣本x(x∈U)有相同的標(biāo)記,那么將x標(biāo)記為H12(x),并將x加入到H11的訓(xùn)練集L11,可得到新的H11訓(xùn)練集為式(4)。L11=L1∪{x∈U,H12(x)=H13(x)}

        (4) ?同理,H12和H13的訓(xùn)練集分別擴(kuò)充為L(zhǎng)12、L13。

        用新擴(kuò)充的訓(xùn)練集分別重新訓(xùn)練為式(5)。L11={(x11,y11),…,(x1l1,y1l1)};f11:X11→Y11

        L12={(x21,y21),…,(x2l1,y2l1)};f12:X12→Y12

        L13={(x31,y31),…,(x3l1,y3l1)};f13:X13→Y13

        (5) ?獲得三個(gè)分類器H2={H2,H2∈H2},1≤≤3。

        如此重復(fù)迭代,每次迭代獲得三個(gè)分類器為式(6)。Hj={Hj,Hj∈Hj}, 1≤≤3, j>1

        (6) ?直到三個(gè)分類器不再變化為式(7)。Hn-1≈Hn, n>1

        (7) ?訓(xùn)練過程結(jié)束。

        3 建模及仿真研究

        3.1 特征設(shè)計(jì)

        本文分析竊電相關(guān)業(yè)務(wù)整體流程,從業(yè)務(wù)角度刻畫業(yè)務(wù)特征,并設(shè)計(jì)業(yè)務(wù)指標(biāo),共設(shè)計(jì)出14個(gè)業(yè)務(wù)指標(biāo),有關(guān)業(yè)務(wù)指標(biāo)的含義如表1所示。

        3.2 算例數(shù)據(jù)

        本文選取廣東電網(wǎng)的高壓用戶相關(guān)數(shù)據(jù)進(jìn)行研究與應(yīng)用,將業(yè)務(wù)指標(biāo)映射到業(yè)務(wù)系統(tǒng)的數(shù)據(jù)字段,包括“用電客戶表”、“運(yùn)行變壓器”、“應(yīng)收電費(fèi)記錄”等九張?jiān)磾?shù)據(jù)表,選取各個(gè)源數(shù)據(jù)表的時(shí)間范圍為2017年7月-2018年6月。利用數(shù)據(jù)量化業(yè)務(wù)指標(biāo),獲得業(yè)務(wù)指標(biāo)的數(shù)據(jù)計(jì)算規(guī)則。

        基于數(shù)據(jù)計(jì)算規(guī)則對(duì)多個(gè)數(shù)據(jù)源進(jìn)行聚合匯總,提取檢查項(xiàng)目結(jié)果表中高壓用戶的特征數(shù)據(jù)與標(biāo)識(shí)數(shù)據(jù),以2018年6月的竊電標(biāo)識(shí)結(jié)果及其前1年的行為特征數(shù)據(jù)構(gòu)建訓(xùn)練集,其中,訓(xùn)練數(shù)據(jù)集包括322 768條樣本記錄。同時(shí),對(duì)源數(shù)據(jù)進(jìn)行質(zhì)量檢查,包括檢查原始數(shù)據(jù)的完整性、取數(shù)范圍、異常情況等。

        本文對(duì)數(shù)據(jù)集中大量缺失值、異常值等臟數(shù)據(jù)進(jìn)行相應(yīng)預(yù)處理,獲得含有類別標(biāo)識(shí)的數(shù)據(jù)集6 747條樣本及218 473條未知標(biāo)識(shí)樣本,其中有類標(biāo)識(shí)樣本包括446條竊電用戶標(biāo)識(shí)樣本及6 301條非竊電用戶標(biāo)識(shí)樣本。

        3.3 評(píng)估方案

        針對(duì)二分類問題,普遍采用混淆矩陣對(duì)分類模型的預(yù)測(cè)結(jié)果進(jìn)行效果評(píng)估。如圖1所示。

        其中,針對(duì)竊電風(fēng)險(xiǎn)用戶的識(shí)別問題,供電企業(yè)實(shí)際業(yè)務(wù)人員更為關(guān)注竊電用戶識(shí)別的正確率,因此,研究人員通常采用反映模型預(yù)測(cè)全面性的覆蓋率、反映模型預(yù)測(cè)準(zhǔn)確性的命中率及反映模型識(shí)別效率的提升度刻畫識(shí)別正確率為式(8)-式(10)。TPC=TPTP+FN

        (8)

        TPH=TPTP+FP

        (9)

        lft=TPH(TP+FN)/(TP+FP+FN+TN)

        (10) ?本文將獲取的數(shù)據(jù)集按照7∶3的比例進(jìn)行劃分,70%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,30%的數(shù)據(jù)作為測(cè)試數(shù)據(jù)集。

        3.4 研究結(jié)果

        針對(duì)當(dāng)前常用的有監(jiān)督算法,選擇logstc模型、隨機(jī)森林、支持向量機(jī)作為三訓(xùn)方法的3個(gè)分類器,通過擬合本文準(zhǔn)備的數(shù)據(jù),三訓(xùn)算法的最大迭代次數(shù)為16。

        利用測(cè)試數(shù)據(jù)集測(cè)試不同算法的竊電用戶識(shí)別率,獲得竊電用戶識(shí)別的命中率、覆蓋率及提升度,有監(jiān)督分類模型的命中率最高46.4%,半監(jiān)督分類模型的命中率可以48.3%,有監(jiān)督分類模型的覆蓋率最高達(dá)到59.8%,半監(jiān)督分類模型的覆蓋率則達(dá)到64.1%,半監(jiān)督分類模型對(duì)比空模型可提升53%的識(shí)別效率,如圖2、圖3所示。

        4 總結(jié)

        對(duì)比傳統(tǒng)地利用有監(jiān)督學(xué)習(xí)模型進(jìn)行竊電排查,本文通過半監(jiān)督學(xué)習(xí)模型,基于已知竊電標(biāo)識(shí)數(shù)量少的實(shí)際情況,利用廣東電網(wǎng)海量的無類標(biāo)識(shí)數(shù)據(jù),有效提升竊電用戶識(shí)別效率。本文的研究與實(shí)踐過程中,根據(jù)半監(jiān)督學(xué)習(xí)模型識(shí)別的用戶,向?qū)嶋H業(yè)務(wù)人員提供竊電高風(fēng)險(xiǎn)用戶清單,并分析竊電用戶的用電行為,探索竊電行為規(guī)律,幫助業(yè)務(wù)人員更高效地進(jìn)行反竊電排查工作。實(shí)踐證明,模型可以為電網(wǎng)企業(yè)的反竊電工作提供有力的支撐。

        參考文獻(xiàn)

        [1] 王穎琛,顧潔,金之儉. 基于高維隨機(jī)矩陣分析的竊電識(shí)別方法[J]. 現(xiàn)代電力2017,34(6):71-78.

        [2] 喬亮,楊麗.地區(qū)電網(wǎng)在線安全穩(wěn)定預(yù)警與輔助決策系統(tǒng).電力系統(tǒng)保護(hù)與控制.2016,44(24):164-169.

        [3] 曹崢,楊鏡非,劉曉娜.BP神經(jīng)網(wǎng)絡(luò)在反竊電系統(tǒng)中的研究與應(yīng)用[J].水電能源科學(xué),2011,29(9):199-202.

        [4] 劉建偉,劉媛,羅雄麟.半監(jiān)督學(xué)習(xí)方法[J].計(jì)算機(jī)學(xué)報(bào),2015,38(8):1592-1617.

        [5] 崔宇童,牛強(qiáng),王志曉.基于信號(hào)傳遞的半監(jiān)督譜聚類社區(qū)發(fā)現(xiàn)算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2018(5):1201-1205.

        [6] 蔡毅,朱秀芳,孫章麗, 等.半監(jiān)督集成學(xué)習(xí)綜述[J].計(jì)算機(jī)科學(xué),2017(S1):7-13.

        [7] 孟巖,汪云云. 典型半監(jiān)督分類算法的研究分析[J].計(jì)算機(jī)技術(shù)與發(fā)展,2017(10):43-48.

        [8] 許勐璠,李興華,劉海.基于半監(jiān)督學(xué)習(xí)和信息增益率的入侵檢測(cè)方案[J].計(jì)算機(jī)研究與發(fā)展,2017(10):2255-2267.

        [9] Blum A, Mtchell T. Combnng labeled and unlabeled data wth co-tranng[C]//Proceedngs of the 11th Annual Conference on Computatonal Learnng Theory. Madson, USA, 1998:92-100.

        [10] Zhou Z H, L M. Tr-tranng: explotng unlabeled data usng three classfers[J]. EEE Transactons on Knowledge & Data Engneerng,2005,17(11):1529-1541.

        [11] Blum A. Combnng labeled and unlabeled data wth co-tranng[C]//Proceedngs of the eleventh annual conference on Computatonal learnng theory(地點(diǎn)), 2000:92-100.

        [12] 高玉微.CBR 系統(tǒng)中基于半監(jiān)督 ELM 的相關(guān)反饋研究[D].保定:河北大學(xué),2014.

        [13] 夏陸岳,王海寧,朱鵬飛,等. KPCA-baggng集成神經(jīng)網(wǎng)絡(luò)軟測(cè)量建模方法[J].信息與控制,2015,44(5):519-524.

        [14] 王焱,汪震,黃民翔,等.基于OS-ELM和Bootstrap方法的超短期風(fēng)電功率預(yù)測(cè)[J].電力系統(tǒng)自動(dòng)化,2014,38(6):14-19.

        (收稿日期: 2018.09.07)

        作者簡(jiǎn)介:馮歆堯(1991-),男,天津市人,大數(shù)據(jù)工程師,研究方向:大數(shù)據(jù)研究及數(shù)據(jù)挖掘技術(shù)。

        黃劍文(1962-),男,廣東梅州人,教授級(jí)高級(jí)工程師,研究方向:電力信息系統(tǒng)建設(shè)與技術(shù)管理。

        孟禹(1982-),男,廣東廣州人,大數(shù)據(jù)項(xiàng)目經(jīng)理,研究方向:電力系統(tǒng)的大數(shù)據(jù)挖掘項(xiàng)目建設(shè)與管理工作。文章編號(hào):1007-757X(2020)01-0154-03

        97久久国产精品成人观看| 中国妇女做爰视频| 天堂8在线天堂资源bt| 色婷婷五月综合亚洲小说| 国产av色| 好爽要高潮了在线观看| av天堂手机免费在线| 国产一区二区三区免费观看在线 | 国产尤物AV尤物在线看| 日本精品极品视频在线| 偷拍一区二区三区四区视频| 成年女人黄小视频| 国产福利午夜波多野结衣| 国产清品夜色一区二区三区不卡 | 日本真人边吃奶边做爽动态图 | 久久伊人精品一区二区三区| 国产精品亚洲成在人线| 1234.com麻豆性爰爱影| 国产视频激情视频在线观看| 国产在线精品一区二区中文| 男人扒开女人双腿猛进女人机机里| 国产亚洲欧洲AⅤ综合一区| 亚洲二区精品婷婷久久精品| 蜜臀av在线观看| 性欧美大战久久久久久久久| 亚洲精品乱码久久久久99| 国产精品一区二区久久久av| 十八禁在线观看视频播放免费 | 久久综合网天天 | 久久99国产亚洲高清观看首页| 中文国产乱码在线人妻一区二区| 亚洲加勒比久久88色综合 | 久久久久久亚洲AV成人无码国产| 三级黄片一区二区三区| 国产香港明星裸体xxxx视频| 内射精品无码中文字幕| 麻豆变态另类视频在线观看| 久久国产精品精品国产色| 中国美女a级毛片| 国产精品久久久久久久免费看| 亚洲精品日本|