唐取 畢圣靈
摘要:電力工程數(shù)據(jù)分析與應(yīng)用,是實現(xiàn)大規(guī)模電力工程缺失數(shù)據(jù)篩選、進行形態(tài)分析的基礎(chǔ)。文章針對電力工程缺失數(shù)據(jù)篩選困難的問題,提出了一種基于密度聚類算法的分析方法,該方法通過電力工程數(shù)據(jù)收集、預(yù)處理、提取數(shù)據(jù)個性化特征以及進行密度聚類算法分析等步驟,實現(xiàn)了電力工程缺失數(shù)據(jù)的高速篩查和形態(tài)分析。文章通過智能儀表、智能終端數(shù)據(jù)同步性驗證,認為所提出的基于密度聚類算法的電力工程數(shù)據(jù)完整性分析方法能夠有效實現(xiàn)缺失數(shù)據(jù)篩查和形態(tài)分布解讀,對于全面提升電力我國電力工程數(shù)據(jù)完整性和用電情況分析具有較好的指導(dǎo)意義。
關(guān)鍵詞:密度聚類算法;電力工程;缺失數(shù)據(jù)篩查;特征提取
中圖分類號:TM7;TP311.13
文獻標識碼:A
文章編號:1001-5922(2020)12-0074-04
0 引言
電力工程事業(yè)的飛速發(fā)展,使我國電力事業(yè)領(lǐng)域逐漸積累了豐富的信息技術(shù)應(yīng)用經(jīng)驗、信息化系統(tǒng)構(gòu)建和使用經(jīng)驗以及電能數(shù)據(jù)資源。然而,由于我國幅員遼闊、各地區(qū)經(jīng)濟發(fā)展水平參差不齊,尚存在部分電能數(shù)據(jù)收集、分析與應(yīng)用水平較低、對區(qū)域性宏觀數(shù)據(jù)分析缺少智能化、精益性和實時性等問題。電能數(shù)據(jù)收集過程中的數(shù)據(jù)缺失問題,對線損、預(yù)測以及電能計費、調(diào)控等后續(xù)工作帶來了較多不變。
電力工程計量智能化系統(tǒng)的應(yīng)用,不僅能夠有效改善我國部分地區(qū)傳統(tǒng)電力數(shù)據(jù)收集過程中的諸多弊端,且能夠大幅提升區(qū)域電網(wǎng)能耗信息獲取效率、精度,確保電力供給過程中的平穩(wěn)安全。當前電力工程計量智能化技術(shù)主要面臨的挑戰(zhàn)有:電力工程數(shù)據(jù)完整性、數(shù)據(jù)聚合分析、電力數(shù)據(jù)不同體系間共享、海量數(shù)據(jù)存儲等[1-3]。其中電力工程數(shù)據(jù)的完整性是電力工程計量、分析與智能化應(yīng)用的基礎(chǔ)?;诖?,本文提出了一種基于密度聚類算法的電力工程數(shù)據(jù)完整性分析體系,可以從海量數(shù)據(jù)中迅速篩查電力工程系統(tǒng)中的數(shù)據(jù)缺失現(xiàn)象并進行形態(tài)分析。
1 密度聚類算法
密度聚類算法(DBSCAN)能夠根據(jù)所設(shè)置的Eps(半徑)和MinPts(樣本數(shù))等[4],將待聚類的電力工程數(shù)據(jù)分為3類:①核心點,以該點為圓心的待聚類數(shù)據(jù)半徑為Eps的圓內(nèi)至少包含MinPts個樣本點;②邊界點,以該點為圓心的待聚類數(shù)據(jù)半徑為Eps的圓內(nèi)包含少于MinPts個樣本點;③噪聲點,不屬于核心點或邊界點的其他待聚類數(shù)據(jù)點。與一般聚類算法相比,密度聚類算法無需對電力工程數(shù)據(jù)聚類中心量進行事先確定,可直接判定任意形狀的簇?zé)鬧5,6]。同時,該方法可以通過密度直接判定中心點與邊界點,抗噪聲能力極強。對于某樣本1)所屬的直接密度可達與相連進行定義,到達樣本q所需要滿足的條件為:
其中,NEps (q)表示樣本p直接達到樣本q后的樣本范圍;樣本p、q之間密度相連即存在樣本滿足樣本Eps(半徑)和MinPts(樣本數(shù))等均為密度可達[7]。
2 基于密度聚類算法電力工程數(shù)據(jù)完整性分析
2.1 數(shù)據(jù)收集
電力工程領(lǐng)域所產(chǎn)生的信息數(shù)據(jù)主要包括電力運行過程中所產(chǎn)生的實時海量數(shù)據(jù)、用戶檔案數(shù)據(jù)以及電力系統(tǒng)運行/非運行狀態(tài)下的系統(tǒng)報警數(shù)據(jù)等[8]。其中,電力運行過程中產(chǎn)生的實時數(shù)據(jù)主要包括:通信流量數(shù)據(jù),由各類型計量終端獲取可用于判斷電力工程網(wǎng)絡(luò)中各計量設(shè)備的運行狀態(tài);瞬時量數(shù)據(jù),為電網(wǎng)中不同用戶提供實施電力信息;表碼數(shù)據(jù),為電網(wǎng)用戶提供直觀的累積用電有/無功表碼信息。
本文利用智能終端對表碼信息數(shù)據(jù)進行收集并傳遞,數(shù)據(jù)收集間隔為t= 15min,數(shù)據(jù)傳遞間隔為t=1h。得到了表1、2所示的電力工程瞬時量數(shù)據(jù)以及表碼數(shù)據(jù)實例。
表1中瞬時量數(shù)據(jù)包括用戶的總有功功率,IⅡⅢ相有功功率、電流值以及電壓值等數(shù)據(jù);表2中表碼數(shù)據(jù)包括用戶的累計用電信息如費率類型、正反向有功表碼、正反向無功表碼等數(shù)據(jù),其中費率類型包含了用戶總電量、正常情況電力計費標準以及其他不同時段電力計費標準等。
2.2 預(yù)處理
對表1、2中所獲取數(shù)據(jù)進行完整性分析。對數(shù)據(jù)采集周期t=15min及傳遞周期t=1h進行充分考量后,本研究主要選擇智能終端所獲取的電力工程計量點、時間與功率等作為電力工程瞬時數(shù)據(jù)完整性分析的主要指標;選擇智能計量終端所獲取的計量點、時間及正向有功表碼等作為電力工程表碼數(shù)據(jù)完整性分析的主要指標??紤]到智能計量終端數(shù)據(jù)缺失主要來源于記錄時間不齊以及部分設(shè)備出現(xiàn)的網(wǎng)絡(luò)通信中斷等問題,本文擬主要通過分析電力工程缺失數(shù)據(jù)的形態(tài)來判定電力工程數(shù)據(jù)的完整性及出現(xiàn)的問題[9,10]。
本文采用二進制將智能計量終端收集數(shù)據(jù)進行去值化處理,分別用0、1表示電力工程網(wǎng)絡(luò)某用戶在某一時刻缺失及存在的瞬時數(shù)據(jù)及表碼數(shù)據(jù)。利用該思路進行電力工程網(wǎng)絡(luò)數(shù)據(jù)預(yù)處理的流程如下:
1)對獲取數(shù)據(jù)進行掃描后表碼。
2)將不同計量點按照月份(31)和時刻(24)設(shè)定為31x24組,并進行初始化處理。
3)利用程序?qū)Τ跏蓟癁?后的計量點在相應(yīng)數(shù)組位上的數(shù)據(jù)存在情況進行判斷,若判斷結(jié)果為“存在”且不為NULL,則給數(shù)組的相應(yīng)位賦值為1,若判斷結(jié)果為“不存在”或/且為,不為NULL,則給數(shù)組的相應(yīng)位賦值為0。
4)對所有缺失數(shù)據(jù)數(shù)量進行統(tǒng)計并記錄,代碼以ERRORNUM表示。
利用以上方法對表1、2數(shù)據(jù)進行預(yù)處理,得到表3、4所示的瞬時數(shù)據(jù)、表碼數(shù)據(jù)預(yù)處理結(jié)果,分別以SSi和BM,表示,其中i=0,1,…,23。
2.3 提取數(shù)據(jù)個性化特征
基于密度聚類算法的電力工程數(shù)據(jù)完整性分析,需要針對不同問題對表3、4中的數(shù)據(jù)進行個性化特征提取和分析,從而適應(yīng)聚類算法中相應(yīng)的問題與模式。本研究根據(jù)我國當前電力工程智能終端設(shè)備普遍存在的數(shù)據(jù)缺失特征,構(gòu)造了不同的組合以便于對預(yù)處理后的瞬時數(shù)據(jù)和表碼數(shù)據(jù)進行有效性分析。