楊鳳生,曾 惜,王元峰,劉 暢,董飛軍,蔡廣林
(1.貴陽供電局,貴州 貴陽 550004;2.廣州思泰信息技術(shù)有限公司,廣東 廣州 511493)
鑒于大數(shù)據(jù)在電力系統(tǒng)的應用場景越來越多,本文對大數(shù)據(jù)在城市配電網(wǎng)運行狀態(tài)評估中的應用進行分析,提出了基于大數(shù)據(jù)技術(shù)的城市配電網(wǎng)運行狀態(tài)評估分析方法,利用配電大數(shù)據(jù)采集、存儲、分析、關(guān)聯(lián)、預測技術(shù),從海量數(shù)據(jù)中挖掘、提煉關(guān)鍵信息,預測未來一定時刻的運行狀態(tài)指標參數(shù),判斷運行可靠性和經(jīng)濟性水平。
隨著城市化進程的加快,配電網(wǎng)自動化程度越來越高,包括配電自動化系統(tǒng)、調(diào)度自動化系統(tǒng)、電網(wǎng)氣象信息系統(tǒng)、電能質(zhì)量監(jiān)測管理系統(tǒng)、生產(chǎn)管理系統(tǒng)、地理信息系統(tǒng)、用電信息采集系統(tǒng)、配變負荷監(jiān)測系統(tǒng)、負荷控制系統(tǒng)、營銷業(yè)務管理系統(tǒng)、ERP系統(tǒng)[6]、95598客服系統(tǒng)和經(jīng)濟社會類數(shù)據(jù)等數(shù)據(jù)源,這些數(shù)據(jù)源的總體狀況如表1所示。
對于配電網(wǎng)安全運行而言,大數(shù)據(jù)技術(shù)的意義不在于海量的數(shù)據(jù),而是海量數(shù)據(jù)中對于配電網(wǎng)安全運行有效的數(shù)據(jù),以及這部分數(shù)據(jù)被持續(xù)挖掘所付出的代價能否被電力企業(yè)后續(xù)發(fā)展所承受。
表1 典型配電網(wǎng)數(shù)據(jù)源特點
基于大數(shù)據(jù)技術(shù)的城市配電網(wǎng)運行狀態(tài)評估指標[7]主要包括以下幾個:①安全性評價指標,比如配電系統(tǒng)的頻率、節(jié)點電壓水平、主變和線路負載率等指標;②供電能力評價指標,比如容載比、線路間轉(zhuǎn)供能力等;③可靠性和供電質(zhì)量[8]評價指標,比如負荷點故障率、系統(tǒng)平均停電頻率、系統(tǒng)平均停電時間、電壓合格率、電壓波動與閃變、三相不平衡度、波形畸變率、電壓偏移和頻率偏差等;④經(jīng)濟性評價指標,比如線損率和設(shè)備利用效率等。
在運行狀態(tài)評估指標體系中,指標變量個數(shù)多,建模與計算復雜,各指標之間又存在一些冗余信息,逐個分析將增加大量冗余工作。在實際工作中,運用主成分分析法[9],采用離差平方和或方差計算各指標的信息量,將重復或相關(guān)性強的指標刪去,從而提取相關(guān)性小且能包含絕大部分原信息的少數(shù)幾個評估運行可靠性指標,篩選影響系統(tǒng)運行狀態(tài)的關(guān)鍵元件、重要區(qū)域和薄弱環(huán)節(jié),縮小評估范圍。
3.2.1 評估指標標準化
運行狀態(tài)各指標的量綱不同,需要對各指標參數(shù)進行標準化處理。基于配電大數(shù)據(jù)得到各指標的分布函數(shù),并按式(1)對各指標變量X進行正態(tài)分布標準化處理,轉(zhuǎn)換為對應的正態(tài)分布變量Z:
本文以TMS320DM642處理器為核心芯片,攝像頭為前端,農(nóng)產(chǎn)品服務器為總存儲器,PC機與智能手機為終端設(shè)計了農(nóng)產(chǎn)品生產(chǎn)全過程監(jiān)控系統(tǒng)。該系統(tǒng)使用視頻/圖像定點數(shù)字信號處理器TMS320DM642對視頻信號進行壓縮,使用H.264編碼算法且進行優(yōu)化,壓縮比能達到200∶1,滿足3G傳輸?shù)睦碚撘?,視頻信號處理系統(tǒng)流程如圖1所示。
3.2.2 建立相關(guān)矩陣并計算其特征值
在統(tǒng)計學中,通常用Pearson相關(guān)系數(shù)σXY[10]來度量2個隨機變量X,Y之間線性相關(guān)性的強弱。
n個指標變量Z1,Z2,…,Zn的自相關(guān)矩陣R為:
根據(jù)各指標變量的自相關(guān)矩陣R求得其特征值λ1≥λ2≥…≥λm(m≤n)及特征向量u1,u2,…,um.
3.2.3 確定主成分
按照式(3)(4)求得第i指標變量的方差貢獻率ωi和累計方差貢獻率ρ,即:
根據(jù)實際需求,選取累計方差貢獻率最小值。累計方差貢獻率大于所選取的最小值的,就選為主成分fi,主成分的個數(shù)p取決于累計方差貢獻率最小值和累計方差貢獻率,前p個主成分F={f1,f2,…,fp}包含了m個原始指標變量所含有的絕大部分信息。
3.2.4 確定主要評估指標
U=[σ(fi,zj)]為主成分因子載荷矩陣,U中的不同數(shù)值σ(fi,zj)分別對應第i個主成分fi與原第j個評價指標zj間的相關(guān)性系數(shù),其取值為[-1,1],正負號分別代表正相關(guān)和負相關(guān),絕對值越大,表明相關(guān)性越強。在評估運行狀態(tài)時,不需要全部指標的全部信息,只需選取代表主要信息的部分指標即可。因此,可根據(jù)載荷矩陣,對p個主成分分別選取|σ(fi,zj)|最大值對應的1個指標zj作為主要評估指標,所得的q個(q≤p)主指標即運行狀態(tài)評估的主要指標。
數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或挖掘出知識或所需要信息的一種技術(shù)方法。本文采用關(guān)聯(lián)分析挖掘方法,從配電網(wǎng)的異構(gòu)多源數(shù)據(jù)中挖掘出主要影響因素,用于預測模型的輸入,以減少輸入的維度,加快預測速度。
關(guān)聯(lián)分析是發(fā)現(xiàn)數(shù)據(jù)間關(guān)聯(lián)規(guī)則的一種數(shù)據(jù)挖掘模式。關(guān)聯(lián)規(guī)則存在的概率用置信度或可信性來描述,置信度或可信性越高,關(guān)聯(lián)規(guī)則存在的可能性就越大[11]。最小支持度閾值和最小置信度閾值是由用戶按需求定義的,支持度與置信度均大于或等于最小閾值的規(guī)則被稱為“強規(guī)則”。通過尋找“影響因素-運行可靠性指標”的“強規(guī)則”,可以得到影響運行狀態(tài)的主要影響因素。
“強規(guī)則”挖掘最重要的步驟是從事務數(shù)據(jù)庫中尋找頻繁項集。Apriori算法是一種常用的挖掘關(guān)聯(lián)規(guī)則的頻繁項集的方法[12]。在Hadoop框架上,將Apriori算法在MapReduce中分布實現(xiàn),從原始數(shù)據(jù)中挖掘出全局頻繁項集,再從頻繁項集中生成關(guān)聯(lián)規(guī)則,計算其支持度和置信度,從而挖掘出強規(guī)則,實現(xiàn)大數(shù)據(jù)條件下的并行關(guān)聯(lián)規(guī)則挖掘。
配電網(wǎng)運行狀態(tài)預測,是指根據(jù)歷史和實時大數(shù)據(jù),推測未來一段時間內(nèi)可行性指標參數(shù)的過程。配電系統(tǒng)的運行狀態(tài)指標值從現(xiàn)場長期運行記錄的大量統(tǒng)計數(shù)據(jù)中得出,預測復雜,難以建立影響因素與運行狀態(tài)指標值之間的精確解析模型。本文采用人工神經(jīng)網(wǎng)絡法[13]對運行狀態(tài)進行預測,預測流程如圖1所示,具體方法如下。
圖1 基于人工神經(jīng)網(wǎng)絡的預測流程
基于歷史數(shù)據(jù),將3.3節(jié)中采用關(guān)聯(lián)分析挖掘所得的主要影響因素作為人工神經(jīng)網(wǎng)絡模型的輸入I(T),根據(jù)需求選取評估尺度t;基于3.2節(jié)中經(jīng)主成分分析提取的主要評估指標,選取(T+t)時刻的指標值O(T+t)作為輸出,對人工神經(jīng)網(wǎng)絡進行訓練,得到人工神經(jīng)網(wǎng)絡預測模型。將實時數(shù)據(jù)的主要影響因素數(shù)據(jù)作為人工神經(jīng)網(wǎng)絡的輸入,即可預測t時間后的運行狀態(tài)指標值。
基于不同的預測時間進行指標計算,可得到相應的時限類指標用于不同的場合。時間尺度選為分鐘、小時級,可評估未來幾分鐘或幾小時元件、節(jié)點、區(qū)域、系統(tǒng)的電壓、潮流是否越限,可用于實時運行控制和風險管控;時間尺度選為天、月或年,可預測區(qū)域、系統(tǒng)的切負荷概率與期望、供電可用率等指標,用于檢修、調(diào)度等控制與決策或電網(wǎng)規(guī)劃。
隨著大數(shù)據(jù)應用技術(shù)的發(fā)展,利用現(xiàn)有電網(wǎng)運行數(shù)據(jù)和氣象環(huán)境數(shù)據(jù)進行設(shè)備故障預測成為可能。通過集成各分散系統(tǒng)的信息,規(guī)范數(shù)據(jù)類型,形成豐富的、同質(zhì)的大數(shù)據(jù)樣本,對不同類型、不同型號、不同狀態(tài)的設(shè)備進行故障發(fā)生可能性預測,可為電網(wǎng)運檢采取針對性的防護措施提供支持,為電網(wǎng)安全運行、智能電網(wǎng)自愈提供保障。
精準的用電預測結(jié)果對于智能配電網(wǎng)的規(guī)劃和運行有積極意義。通過對用戶用電行為特征的分析,建立基于大數(shù)據(jù)的自適應用電預測模型,有可能得到更高精度、更細粒度的預測結(jié)果,這有利于電源與負荷協(xié)同調(diào)度的實現(xiàn)。
在傳統(tǒng)的配電網(wǎng)網(wǎng)架規(guī)劃中,由于數(shù)據(jù)源或數(shù)據(jù)分析不足,網(wǎng)架優(yōu)化面臨較大的不確定性,理論上的優(yōu)化結(jié)果往往與實際結(jié)果之間存在較大差異。在大數(shù)據(jù)環(huán)境下,海量、多類型、時變基礎(chǔ)數(shù)據(jù)的引入,可以降低網(wǎng)架優(yōu)化的不確定性。
不同用戶的負荷特性、用電理念和節(jié)電策略之間存在較大差異,導致用戶用電行為模式的多樣性,而分布式電源以及電動汽車等新型設(shè)備的接入也將加速這種多樣性的發(fā)展。了解用電行為模式的多樣性,有助于從用戶的角度為其量身訂制經(jīng)濟、合理的用電方案。
電力信息化建設(shè)是利用大數(shù)據(jù)技術(shù),在企業(yè)數(shù)據(jù)共享的平臺下獲取電力企業(yè)生產(chǎn)數(shù)據(jù)、管理數(shù)據(jù)等有效數(shù)據(jù),提煉準確的、有價值的數(shù)據(jù),為管理效益、決策能力的提升提供有效幫助。特別是在運行檢修基礎(chǔ)數(shù)據(jù)不斷積累的前提下,利用大數(shù)據(jù)分析技術(shù),能對檢修工作進行有效預測,并提供數(shù)據(jù)支持,從而進一步提升設(shè)備的運行管理水平,為運行檢修科學決策提供可靠的數(shù)據(jù)支持。