亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于DBSCAN聚類的電力工程數(shù)據(jù)完整性分析*

        2019-05-31 01:22:14袁兆祥余春生
        沈陽工業(yè)大學學報 2019年3期
        關鍵詞:電能表電力工程聚類

        袁兆祥, 余春生

        (1. 國網(wǎng)經(jīng)濟技術研究院有限公司, 北京 102209; 2. 德信東源智能科技(北京)有限公司 科技研發(fā)中心, 北京 100088)

        隨著我國電力營銷管理系統(tǒng)、營配系統(tǒng)、生產(chǎn)管理系統(tǒng)和計量自動化系統(tǒng)建設的不斷加快,企業(yè)逐漸積累了豐富的信息系統(tǒng)應用經(jīng)驗及電能數(shù)據(jù)資源[1].但國內(nèi)對電能數(shù)據(jù)的分析與應用尚處于較為落后的狀態(tài),對于宏觀電能數(shù)據(jù)分析缺少預見性、精益性和實時性[2].

        結算抄表在電力工程數(shù)據(jù)管理中起著重要的作用,傳統(tǒng)的抄表方式需要工作人員手工錄制數(shù)據(jù),存在著漏抄、錯抄和估抄的問題,這對線損、預測及計費等后續(xù)分析工作帶來了較大的困難[3-4].而計量自動化系統(tǒng)的投入使用,不僅能有效改善傳統(tǒng)抄表方式所帶來的困難,且能搜集電網(wǎng)各區(qū)域的能耗信息,確保電力供給和電力資源質(zhì)量的平穩(wěn)安全[5].大數(shù)據(jù)采集與監(jiān)視系統(tǒng)、地理信息系統(tǒng)和高級策略系統(tǒng)的投入使用在提升電力工程建設效率的同時,系統(tǒng)中積累的大量電能數(shù)據(jù)仍面臨著以下挑戰(zhàn):1)數(shù)據(jù)規(guī)范性、準確性和完整性;2)數(shù)據(jù)搜索與數(shù)據(jù)聚合;3)系統(tǒng)與數(shù)據(jù)采集間的數(shù)據(jù)共享;4)數(shù)據(jù)計算與大規(guī)模數(shù)據(jù)存儲.電力工程數(shù)據(jù)完整性是電力系統(tǒng)正常運行的基本條件[6-7],是后期高級應用分析的基礎.

        本文主要研究電力工程數(shù)據(jù)的完整性,提出了一種基于DBSCAN聚類算法[8-9]的電力工程數(shù)據(jù)完整性分析方法,從大規(guī)模電力工程數(shù)據(jù)中快速找出所缺失的數(shù)據(jù),并對其進行形態(tài)分析.

        1 DBSCAN聚類算法

        DBSCAN(density based spatial clustering of applications with noise)是一種基于密度的聚類算法,該算法根據(jù)所設置的半徑Eps和樣本數(shù)目MinPts將待聚類數(shù)據(jù)分為核心點、邊界點和噪聲點3類,其中,在半徑為Eps的圓內(nèi)至少包含MinPts個樣本的點稱為核心點;在半徑為Eps的圓內(nèi),樣本數(shù)量少于MinPts個樣本且落在核心點鄰域內(nèi)的點稱為邊界點;而既不是邊界點又不是核心點的則被稱為噪聲點.相比于K-means聚類算法,該算法無需事先確定聚類中心的數(shù)量,并可以識別出任意形狀的簇類,且具有較強的抗噪聲能力.

        該算法通過定義直接密度可達和密度相連的概念,來確定每一個樣本所屬的聚類中心.直接密度可達即對于給定的半徑Eps和樣本數(shù)目MinPts,從樣本p直接到達樣本q需要滿足

        (1)

        式中,NEps(q)為樣本q的樣本范圍.密度相連即存在樣本滿足p和q關于半徑Eps與MinPts均是密度可達的.具體的DBSCAN聚類算法如下:

        1) 設置數(shù)據(jù)集D、半徑Eps和樣本數(shù)目MinPts;

        2) 判斷輸入樣本點是否為核心點;

        3) 若輸入樣本為核心點,找出其鄰域內(nèi)所有直接密度可達點;

        4) 重復步驟2)、3),直至所有樣本判斷完成;

        5) 合并一些密度可達對象,并根據(jù)所有核心點鄰域內(nèi)的直接密度可達點找到最大密度相連點的集合;

        6) 重復執(zhí)行步驟5),直至遍歷完所有核心點鄰域.

        2 基于DBSCAN的數(shù)據(jù)完整性分析

        傳統(tǒng)的數(shù)據(jù)完整性分析方法取決于一個或多個數(shù)據(jù)分析師對數(shù)據(jù)的分析,其性能受分析師對數(shù)據(jù)熟悉程度的影響.而基于DBSCAN的數(shù)據(jù)完整性分析方法是基于數(shù)據(jù)挖掘理論,從電力工程數(shù)據(jù)中發(fā)現(xiàn)潛在的數(shù)據(jù)缺失風險,該方法能有效應對數(shù)據(jù)急劇增加的情況,并能實現(xiàn)對數(shù)據(jù)的高級描述.其主要過程包括:

        1) 數(shù)據(jù)獲取.使用電力工程計量自動化系統(tǒng)獲取發(fā)電場、配電網(wǎng)、變電站和用電數(shù)據(jù),并構造數(shù)據(jù)集.

        2) 數(shù)據(jù)預處理.對采集到的各種數(shù)據(jù)進行數(shù)據(jù)清洗、格式統(tǒng)一和歸一化處理,得到健康有效的數(shù)據(jù).

        3) 特征構造.使用預處理后的數(shù)據(jù)構造有效特征來表征所采集的數(shù)據(jù)集.

        4) 聚類分析.使用DBSCAN算法對數(shù)據(jù)集各特征進行聚類分析,分析缺失數(shù)據(jù)的數(shù)量分布及同步性特征,為電力工程系統(tǒng)進一步整改提供參考.

        2.1 數(shù)據(jù)獲取

        電力工程中的數(shù)據(jù)包括實時電力運行數(shù)據(jù)、用戶檔案數(shù)據(jù)和系統(tǒng)報警數(shù)據(jù)等.其中,電力運行數(shù)據(jù)主要包括各類計量終端的通信流量數(shù)據(jù)、瞬時量數(shù)據(jù)及表碼數(shù)據(jù).通信流量數(shù)據(jù)可以用于判斷計量終端的運行狀態(tài);瞬時量數(shù)據(jù)為用戶實時用電功率、電壓與電流等信息;表碼數(shù)據(jù)為用戶累計用電有功表碼和無功表碼信息.本文使用電能表計量終端每15 min采集一次表碼數(shù)據(jù),并每隔1 h向智能終端發(fā)送一次數(shù)據(jù).各數(shù)據(jù)具體說明如下:

        1) 瞬時量數(shù)據(jù).包括用戶的總有功功率、三相有功功率、三相電流值及三相電壓值等用電信息,其部分數(shù)據(jù)如表1所示.

        2) 表碼數(shù)據(jù).表碼數(shù)據(jù)主要為用戶的累計用電信息,其包含的內(nèi)容如表2所示,其中,費率類型包括總電量、正常情況、高峰、低谷和超高峰等不同時段的計費標準.

        表1 瞬時量數(shù)據(jù)示例Tab.1 Examples of instantaneous data

        表2 表碼數(shù)據(jù)示例Tab.2 Examples of table code data

        2.2 數(shù)據(jù)預處理

        使用上文采集的瞬時量數(shù)據(jù)和表碼數(shù)據(jù)進行數(shù)據(jù)完整性分析.考慮到數(shù)據(jù)每間隔1 h采集一次,本文主要選取瞬時數(shù)據(jù)的計量點、時間與功率3類數(shù)據(jù),選取表碼數(shù)據(jù)的計量點、時間及正向有功表碼3類數(shù)據(jù)進行后續(xù)分析.考慮到智能計量終端可能存在記錄時間不齊和通訊故障等問題,導致相應時間上的計量數(shù)據(jù)整條缺失,本文主要通過分析缺失數(shù)據(jù)的形態(tài)來判斷數(shù)據(jù)缺失的類型.

        本文將具體的數(shù)值信息進行去值化,使用‘1’表示某一時刻存在瞬時數(shù)據(jù)和表碼數(shù)據(jù),使用‘0’表示某一時刻缺失瞬時數(shù)據(jù)及表碼數(shù)據(jù).數(shù)據(jù)預處理過程如下:

        1) 掃描采集的數(shù)據(jù),獲取計量點編碼POINTID;

        2) 將每一個計量點按照月份和時刻設定為31×24的數(shù)組,并初始化為0;

        3) 使用數(shù)值判斷程序判斷每個計量點在響應數(shù)組位上是否存在數(shù)據(jù)及其是否為NULL,若存在數(shù)據(jù)且不為NULL,則給數(shù)組的相應位賦值1;

        4) 統(tǒng)計每個計量點的數(shù)據(jù)缺失數(shù)量,并記為ERRORNUM.

        本文預處理后的部分瞬時量數(shù)據(jù)和表碼數(shù)據(jù)分別如表3、4所示.表3、4中分別用Pi和BMi(i=0,1,…,23)表示24個時刻的數(shù)據(jù)值.

        表3 預處理后的瞬時數(shù)據(jù)Tab.3 Instantaneous data after preprocessing

        表4 預處理后的表碼數(shù)據(jù)Tab.4 Table code data after preprocessing

        2.3 特征構造與特征分析

        使用DBSCAN聚類算法分析所采集的電力工程數(shù)據(jù)前,需針對不同的問題對預處理后的數(shù)據(jù)進行特征構造和特征分析,以適應相應的問題與模式.本文根據(jù)電能表與智能終端數(shù)據(jù)缺失數(shù)量及數(shù)據(jù)缺失同步性的特點,分別構造了不同的特征組合并進行了有效性分析.

        2.3.1 電能表與智能終端數(shù)據(jù)缺失數(shù)量分析

        本文分別使用電能表的表碼、終端的表碼以及電能表的瞬時量、終端的瞬時量分析所采集的電力工程數(shù)據(jù)的缺失數(shù)量.

        數(shù)據(jù)缺失量特征格式如表5所示,表5中顯示了所采集數(shù)據(jù)的全部特征數(shù)據(jù)缺失數(shù)量,其中,M_POINTID和F_POINTID分別為電能表與終端的計量點;電能表的表碼和終端的表碼缺失數(shù)量分別為MBM、FBM;電能表的瞬時量和終端的瞬時量缺失數(shù)量分別為MSSL、FSSL;4種特征缺失數(shù)量的總和為MISSNUM.

        表5 數(shù)據(jù)缺失量分析特征格式Tab.5 Feature format of data missing amount analysis

        為保證聚類分析的有效型,本文排除了運行正常的計量終端及拆除、損壞或無信號的計量終端,即4個特征量均為0和均為24的樣本,共統(tǒng)計了53 903個計量終端采集的313 346條有效數(shù)據(jù).各特征具體統(tǒng)計結果如表6所示.

        表6 各特征缺失數(shù)據(jù)統(tǒng)計結果Tab.6 Statistical results of missing data with respective feature

        從表6的統(tǒng)計結果可以看出,電能表的瞬時量和表碼數(shù)據(jù)的缺失值明顯少于終端上的缺失值,由此表明,終端數(shù)據(jù)的不完整性更嚴重.分別分析終端和電能表的數(shù)據(jù)可知,電能表上表碼數(shù)據(jù)的缺失數(shù)量比瞬時量的缺失數(shù)量少24.7%;而終端上瞬時量的缺失數(shù)量比表碼的缺失數(shù)量少13.2%.分析結果表明,終端上數(shù)據(jù)的波動情況更為穩(wěn)定.

        2.3.2 電能表與智能終端數(shù)據(jù)缺失同步性分析

        本文將終端和電能表上的表碼數(shù)據(jù)按異或的方式編碼,以判斷終端與電能表數(shù)據(jù)缺失的同步性,特征數(shù)據(jù)構造如表7所示,其中,DIFNUM表示差異值的數(shù)量.

        表7 數(shù)據(jù)缺失同步性的特征數(shù)據(jù)格式Tab.7 Feature data format of data missing synchronization

        表7中,XOR0~XOR23分別表示24個時刻終端的表碼數(shù)據(jù)和電能表數(shù)據(jù)在對應時刻的異或值,用于表示電能表與智能終端數(shù)據(jù)缺失形態(tài)上的差異.其中,表碼數(shù)據(jù)和電能表數(shù)據(jù)同時存在用0表示,表碼數(shù)據(jù)與電能表數(shù)據(jù)中有一個缺失時則用1表示.同時,本文刪除電能表與智能終端數(shù)據(jù)缺失同步的情況,即異或數(shù)據(jù)全為0的數(shù)據(jù)樣本.

        3 實驗與結果分析

        使用本文介紹的DBSCAN聚類算法對提取的電力工程數(shù)據(jù)進行聚類分析,并分析不同半徑Eps時所得到的不同聚類結果.

        本文分析了聚類半徑分別為5和10的電能表與智能終端的聚類結果,分別如圖1、2所示.用不同的顏色表示不同的聚類中心,每個聚類中心顯示了類簇樣本的數(shù)量.圖1共有8個聚類中心,圖2共有4個聚類中心,兩圖均表明終端數(shù)據(jù)的缺失值(FBM、FSSL)要多于電能表數(shù)據(jù)的缺失值(MBM、MSSL),且大部分數(shù)據(jù)點的缺失量較少,而缺失值大的數(shù)據(jù)點只占少部分.

        圖1 半徑為5時的聚類結果Fig.1 Cluster results with a radius of 5

        上述實驗結果表明,使用DBSCAN聚類算法可以有效地分析電力工程數(shù)據(jù)的完整性及其缺失的形態(tài)分布,且可設置不同的聚類參數(shù),從多角度分析數(shù)據(jù)缺失的狀態(tài).

        4 結 論

        本文提出了一種基于DBSCAN聚類算法的電力工程完整性分析方法,從電力工程數(shù)據(jù)獲取、數(shù)據(jù)預處理、特征提取和聚類分析4個層面介紹了具體的分析方法,并使用該方法分析了電能表與智能終端數(shù)據(jù)缺失數(shù)量與數(shù)據(jù)缺失同步性.對采集的數(shù)據(jù)進行多角度分析的結果表明,提出的方法可以有效地分析電力工程數(shù)據(jù)的完整性及其缺失的形態(tài)分布,這對于提高電力工程數(shù)據(jù)的完整性和分析用戶的用電情況均具有較好的參考價值.

        猜你喜歡
        電能表電力工程聚類
        試論電力工程管理模式的創(chuàng)新與應用
        消費電子(2022年7期)2022-10-31 06:18:16
        巧數(shù)電能表
        BIM系統(tǒng)在電力工程中的應用
        認識電能表
        電力工程中電氣自動化技術的應用
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        淺析電力工程管理模式的創(chuàng)新與應用
        基于改進的遺傳算法的模糊聚類算法
        一種層次初始的聚類個數(shù)自適應的聚類方法研究
        電能表自動化檢定機器人可靠掛卸表方案設計與實現(xiàn)
        国产成人亚洲精品91专区高清| 亚洲av无码资源在线观看| 国产精品亚洲A∨天堂不卡| 亚洲国产精品成人无码区| 男女一级毛片免费视频看| 在线视频一区二区三区中文字幕| 亚洲男人综合久久综合天堂| 亚洲a∨无码男人的天堂| 亚洲色偷偷色噜噜狠狠99| 人人妻人人澡av| 91精品久久久中文字幕| 久久久www成人免费毛片| 国产成人精品三级麻豆| 蜜桃av观看亚洲一区二区 | 一区二区黄色在线观看| 亚洲va无码va在线va天堂| 91手机视频在线| 亚洲性码不卡视频在线| 日韩熟女系列中文字幕| 国产午夜无码片在线观看影院| 日韩AV无码一区二区三| 日本一二三区在线视频观看| 亚洲gay片在线gv网站| 少妇无码一区二区三区| 高清一级淫片a级中文字幕| 国产精品一区二区三区av在线 | 大肉大捧一进一出好爽视色大师| 亚洲V无码一区二区三区四区观看| 亚洲中文字幕综合网站| 精品久久久久久无码中文野结衣| 亚洲精品无码国模| 国产在线一区二区视频免费观看| 少妇人妻字幕精品毛片专区| 国产免国产免费| 免费国产99久久久香蕉| 日本国产一区二区在线| 久久只精品99品免费久23| 亚洲成人免费网址| 久久99久久久精品人妻一区二区| 18禁止看的免费污网站| 国农村精品国产自线拍|