亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于時(shí)間序列提取和維諾圖的電力數(shù)據(jù)異常檢測(cè)方法

        2017-05-11 01:08:10裴湉齊冬蓮
        電力建設(shè) 2017年5期
        關(guān)鍵詞:分段樣本算法

        裴湉, 齊冬蓮

        (浙江大學(xué)電氣工程學(xué)院,杭州市 310027)

        基于時(shí)間序列提取和維諾圖的電力數(shù)據(jù)異常檢測(cè)方法

        裴湉, 齊冬蓮

        (浙江大學(xué)電氣工程學(xué)院,杭州市 310027)

        電力網(wǎng)絡(luò)中信息系統(tǒng)與物理系統(tǒng)的深度融合,導(dǎo)致現(xiàn)代電力系統(tǒng)易受異常數(shù)據(jù)的影響?,F(xiàn)有的電力數(shù)據(jù)異常檢測(cè)方法未能充分挖掘數(shù)據(jù)特征,存在計(jì)算復(fù)雜、靈活性差、精度較低等缺點(diǎn)。提出一種基于時(shí)間序列提取和維諾圖的異常數(shù)據(jù)檢測(cè)方法,利用重要點(diǎn)分段的時(shí)間序列提取方法,將高維數(shù)據(jù)進(jìn)行降維處理,并將其映射到二維平面上,構(gòu)造維諾圖分區(qū),進(jìn)而檢測(cè)出異常數(shù)據(jù)。該方法可降低數(shù)據(jù)維度和算法復(fù)雜度,能根據(jù)序列特征靈活設(shè)定異常閾值,實(shí)現(xiàn)異常數(shù)據(jù)的準(zhǔn)確檢測(cè),仿真實(shí)驗(yàn)證明所提方法的有效性。

        時(shí)間序列;維諾圖;異常檢測(cè);電力數(shù)據(jù)

        0 引 言

        智能電網(wǎng)的提出、深化及推廣應(yīng)用,正在以驚人的速度改變著現(xiàn)代電力系統(tǒng),使其逐步向高度信息化、物理信息耦合化的方向發(fā)展[1]。電力信息物理系統(tǒng)[2]、能源互聯(lián)網(wǎng)[3]、區(qū)域鏈[4]等新概念的相繼提出,無(wú)不顯示著信息通信技術(shù)在現(xiàn)在和未來(lái)電力系統(tǒng)中的重要地位。隨著電力系統(tǒng)信息化程度的快速提升,反映各類(lèi)分布式電源、負(fù)荷、監(jiān)控保護(hù)終端和傳感器的海量實(shí)時(shí)數(shù)據(jù)不僅大大增加了管理、分析和處理的難度,而且這些設(shè)備一旦遭受外部惡意攻擊,因物理與信息的強(qiáng)耦合而導(dǎo)致的連鎖故障將嚴(yán)重威脅電力系統(tǒng)的正常運(yùn)轉(zhuǎn)[5]。例如,2010年9月伊朗核電站的損毀事故,2015年12月烏克蘭國(guó)家電網(wǎng)的突發(fā)停電事故等,均是由于數(shù)據(jù)異?;驉阂夤舳鴮?dǎo)致的嚴(yán)重電力事故,對(duì)當(dāng)?shù)氐纳鐣?huì)、經(jīng)濟(jì)產(chǎn)生了巨大的影響。因此,如何在呈指數(shù)增長(zhǎng)的海量數(shù)據(jù)中,實(shí)現(xiàn)異常數(shù)據(jù)的快速、準(zhǔn)確檢測(cè),是保證電力系統(tǒng)安全運(yùn)行亟待解決的問(wèn)題。

        針對(duì)電力數(shù)據(jù)的分析方法,目前國(guó)內(nèi)大多數(shù)電力部門(mén)仍然采用簡(jiǎn)單的基于統(tǒng)計(jì)分析的處理手段,難以對(duì)數(shù)據(jù)隱藏的深層次特征加以利用[6-7],無(wú)法滿(mǎn)足實(shí)際需求。此外,電力數(shù)據(jù)是典型的與時(shí)間強(qiáng)耦合的高維復(fù)雜數(shù)據(jù),如果直接通過(guò)計(jì)算來(lái)實(shí)現(xiàn)異常數(shù)據(jù)的檢測(cè),將會(huì)產(chǎn)生龐大的計(jì)算量,大大降低電力系統(tǒng)故障分析的實(shí)時(shí)性,而依賴(lài)于大容量、高精度數(shù)字計(jì)算機(jī)的異常檢測(cè)方法也會(huì)對(duì)檢測(cè)算法的靈活性產(chǎn)生不利影響。

        國(guó)內(nèi)外學(xué)者針對(duì)異常數(shù)據(jù)檢測(cè)進(jìn)行了不同程度的研究。文獻(xiàn)[8]事先構(gòu)建參數(shù)數(shù)據(jù)庫(kù),通過(guò)檢測(cè)數(shù)據(jù)間是否滿(mǎn)足預(yù)先約束關(guān)系自動(dòng)識(shí)別異常數(shù)據(jù)。文獻(xiàn)[9]利用狀態(tài)估計(jì)殘差進(jìn)行不良數(shù)據(jù)辨識(shí)。文獻(xiàn)[10]則是利用數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(supervisory control and data acquisition, SCADA)狀態(tài)估計(jì)結(jié)果和原始數(shù)據(jù)的殘差,結(jié)合BACON算法檢測(cè)異常數(shù)據(jù)。文獻(xiàn)[11]利用基于規(guī)則的算法和能源管理系統(tǒng)(energy management system,EMS)的開(kāi)關(guān)信息,提出了一種電網(wǎng)在線(xiàn)拓?fù)浔孀R(shí)與檢測(cè)方法。文獻(xiàn)[12]針對(duì)SCADA系統(tǒng)遭受的APT攻擊,基于序列模式支持度建立正常日志行為輪廓,進(jìn)而提出了高持續(xù)性威脅(advanced persistent threat,APT)攻擊的檢測(cè)模型。這些算法雖然在一定程度上實(shí)現(xiàn)了電力數(shù)據(jù)的異常檢測(cè),但這些研究或是需要預(yù)先建立數(shù)據(jù)庫(kù),或是需要對(duì)大量數(shù)據(jù)進(jìn)行計(jì)算。由此會(huì)帶來(lái)一系列新的問(wèn)題,例如,當(dāng)系統(tǒng)內(nèi)出現(xiàn)設(shè)備或線(xiàn)路更替時(shí),需要更新數(shù)據(jù)庫(kù),工作量將大幅度增加。因此,如果能夠?qū)A繑?shù)據(jù)進(jìn)行降維處理,則可以增強(qiáng)數(shù)據(jù)處理的實(shí)時(shí)性,但目前尚未發(fā)現(xiàn)相關(guān)研究成果。

        由以上分析可知,設(shè)計(jì)一種靈活、實(shí)時(shí)、高效的電力數(shù)據(jù)異常檢測(cè)方法,對(duì)于提高電力系統(tǒng)的安全性和可靠性具有重要意義。

        本文針對(duì)電力數(shù)據(jù)異常檢測(cè)問(wèn)題,提出一種利用電力信息節(jié)點(diǎn)的歷史數(shù)據(jù)進(jìn)行異常檢測(cè)的方法。首先,利用基于重要點(diǎn)分段的時(shí)間序列提取方法,在保留數(shù)據(jù)特征的前提下,將信息節(jié)點(diǎn)采集到的高維數(shù)據(jù)進(jìn)行降維處理;其次,將經(jīng)過(guò)降維處理的數(shù)據(jù)映射到二維平面上,生成點(diǎn)集S,并構(gòu)造維諾圖分區(qū);最后,計(jì)算各數(shù)據(jù)點(diǎn)的離群指標(biāo),進(jìn)而檢測(cè)出時(shí)間序列中的異常數(shù)據(jù)點(diǎn)。本文以負(fù)荷終端遭受攻擊(負(fù)荷大幅波動(dòng))為例,通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了所提算法的有效性?;诰S諾圖的異常檢測(cè)方法已存在多年,在電力數(shù)據(jù)異常檢測(cè)方面卻尚未有過(guò)研究應(yīng)用,本文將基于維諾圖的異常檢測(cè)方法結(jié)合時(shí)間序列提取,更進(jìn)一步降低了數(shù)據(jù)維度和算法復(fù)雜度。

        1 電力數(shù)據(jù)異常檢測(cè)

        目前,異常點(diǎn)(也稱(chēng)孤立點(diǎn)、離群點(diǎn)、偏差點(diǎn)等)普遍采用的定義是:異常發(fā)生時(shí)在數(shù)據(jù)集內(nèi)偏離大部分?jǐn)?shù)據(jù)的數(shù)據(jù),使人懷疑這些數(shù)據(jù)是由不同的機(jī)制產(chǎn)生的,而非隨機(jī)偏差[13]。

        在電力系統(tǒng)運(yùn)行過(guò)程中,產(chǎn)生異常數(shù)據(jù)的原因有量測(cè)和傳送過(guò)程受到攻擊、干擾,或發(fā)生故障[14];各個(gè)測(cè)量點(diǎn)的測(cè)量數(shù)據(jù)不同步[15]。異常數(shù)據(jù)的產(chǎn)生不僅會(huì)影響到調(diào)度和決策的制定,還會(huì)對(duì)狀態(tài)估計(jì)的收斂性,以及其他依托于SCADA數(shù)據(jù)庫(kù)的系統(tǒng)(如EMS等)產(chǎn)生影響[16]。數(shù)據(jù)挖掘技術(shù)是電力系統(tǒng)中較為常用的異常檢測(cè)方法,目前應(yīng)用比較多的有序列提取[17]、聚類(lèi)分析[18]和關(guān)聯(lián)規(guī)則[19]。然而,對(duì)于海量的電力數(shù)據(jù)而言,同時(shí)間序列提取方法相比,聚類(lèi)算法及關(guān)聯(lián)規(guī)則方法均面臨著計(jì)算量巨大,計(jì)算負(fù)擔(dān)沉重等缺點(diǎn),極大降低了異常檢測(cè)的時(shí)效性。

        2 時(shí)間序列的特征表示

        電力數(shù)據(jù)是一種與時(shí)間緊密相關(guān)的數(shù)據(jù),具有維數(shù)高、規(guī)模大、結(jié)構(gòu)復(fù)雜等特點(diǎn)。如果直接對(duì)原始海量的電力數(shù)據(jù)進(jìn)行異常檢測(cè),需要面臨巨大的計(jì)算量,檢測(cè)效率低。此外,量測(cè)噪聲(或干擾)也會(huì)影響到直接檢測(cè)的準(zhǔn)確性和可靠性。因此,有必要對(duì)原始電力數(shù)據(jù)進(jìn)行處理,從而降低數(shù)據(jù)維度和量測(cè)噪聲的影響。本文采用時(shí)間序列特征表示方法,提取出電力數(shù)據(jù)的時(shí)間序列特征,從而將高維時(shí)間序列壓縮為低維特征序列,在降低計(jì)算量的同時(shí)提高異常檢測(cè)算法的執(zhí)行效率和準(zhǔn)確性。

        時(shí)間序列的提取方法包括:傅里葉變換法、小波變換法、符號(hào)映射和分段線(xiàn)性表示(piecewise linear representation,PLR)。由于傅里葉變換和小波變換都是基于點(diǎn)距離的方法,難以刻畫(huà)時(shí)間序列的動(dòng)態(tài)屬性[20],而PLR具有高數(shù)據(jù)壓縮度、時(shí)間多解析性和距離度量靈活等特點(diǎn),因此本文采用該方法進(jìn)行數(shù)據(jù)壓縮,下面給出相關(guān)定義。

        定義1 時(shí)間序列

        對(duì)于給定的有限時(shí)間集T、非空狀態(tài)屬性集A={A1,A2, … ,Am}、Aj對(duì)應(yīng)的值域DAj,時(shí)間序列X表示為有序項(xiàng)隊(duì)列{X1,2,… ,Xn},其中Xi= {ti,a1, … ,am},ti∈T,aj∈DAj,j=1, 2, …,m[21]。

        電力數(shù)據(jù)是典型的一維時(shí)間序列,即m=1,此時(shí)時(shí)間序列可以表示為X={xi=(ti,vi)}ni=1,其中xi= (ti,vi)表示xi在ti時(shí)刻對(duì)應(yīng)的值是vi。

        定義2 分段線(xiàn)性表示

        時(shí)間序列X={xi=(ti,vi)}ni=1分為K段后表示為

        XPLR= {(x1L,x1R), ... ,
        (xiL,xiR), ... ,(xKL,xKR)}

        (1)

        式中:xiL和xiR分別為第i段直線(xiàn)的左端值和右端值;K為時(shí)間序列的劃分段數(shù)。通過(guò)將分段后所得到的直線(xiàn)進(jìn)行連接,則可以得到時(shí)間序列的分段線(xiàn)性表示形式[22]。

        直觀地說(shuō),PLR將時(shí)間序列轉(zhuǎn)換為若干相互連接的線(xiàn)性分段,并可以進(jìn)一步對(duì)這些線(xiàn)性分段進(jìn)行矢量特征提取(斜率反映時(shí)間序列的變化程度;長(zhǎng)度反映時(shí)間序列的持續(xù)時(shí)間),從而將線(xiàn)性分段轉(zhuǎn)化為二維平面上的點(diǎn)。

        時(shí)間序列的線(xiàn)性分段示意圖如圖1所示。

        圖1 時(shí)間序列以及PLR示意圖Fig.1 Time series and PLR Method

        Pratt和Fink提出了一種高效的時(shí)間序列提取和編號(hào)的方法,并在股價(jià)、風(fēng)速、腦電圖等復(fù)雜數(shù)據(jù)的分析中取得了很好的測(cè)試結(jié)果[23],其基本原理為:首先,從某段時(shí)間序列中抓取序列特征,提取出重要特征點(diǎn),摒棄其他非重要點(diǎn),從而獲得新序列;其次,對(duì)新序列進(jìn)行重新編號(hào),利用特征將原序列分段線(xiàn)性表示;最后,通過(guò)PLR方法將時(shí)間序列進(jìn)行線(xiàn)性分段。這些線(xiàn)性分段可以被轉(zhuǎn)換為二維平面上的點(diǎn),從而為異常數(shù)據(jù)檢測(cè)算法提供簡(jiǎn)化、精確的數(shù)據(jù)源。

        時(shí)間序列提取過(guò)程中的重要點(diǎn)定義為局部范圍內(nèi)與端點(diǎn)的比值超過(guò)參數(shù)R的極值點(diǎn)。

        (1)若?am∈(a1,…,an),且滿(mǎn)足:

        1)am=min(a1,…,an),其中i

        2)ai/am≥R且aj/am≥R;

        則am為局部重要最小值點(diǎn)。

        (2)若?am∈(a1,…,an),且滿(mǎn)足:

        1)am=max(a1,…,an),其中i

        2)ai/am≥R且aj/am≥R;

        則am為局部重要最大值點(diǎn)。其中:a代表數(shù)據(jù)點(diǎn);角標(biāo)i、m、j分別代表相鄰的第i、m、j個(gè)數(shù)據(jù);R>1為序列的壓縮率。重要點(diǎn)的選取和線(xiàn)性分段的精細(xì)程度依賴(lài)于參數(shù)R,R越大,序列壓縮程度越高。R的取值與序列提取效果如圖2所示。

        3 基于維諾圖的異常檢測(cè)方法

        圖2 重要點(diǎn)壓縮示意圖Fig.2 Important points after compressed

        在對(duì)原始的電力數(shù)據(jù)進(jìn)行降維處理后,需要設(shè)計(jì)一種高性能的異常檢測(cè)算法。目前,常見(jiàn)的異常檢測(cè)方法包括[18]:統(tǒng)計(jì)法、距離法、密度法、聚類(lèi)法和偏差法等。文獻(xiàn)[24]提出了一種基于維諾圖的異常檢測(cè)算法(Voronoi outlier detection,VOD),并證明了VOD方法可以避免參數(shù)選擇對(duì)結(jié)果的影響,同時(shí)將算法復(fù)雜度降低到O(NlgN),且具有較好的檢測(cè)準(zhǔn)確性。基于維諾圖的異常檢測(cè)方法在計(jì)算機(jī)領(lǐng)域已有較多成熟應(yīng)用,而在電力領(lǐng)域的應(yīng)用尚未引起關(guān)注。

        本文首先采用前述時(shí)間序列提取方法對(duì)電網(wǎng)樣本數(shù)據(jù)進(jìn)行降維處理,而后利用VOD方法對(duì)降維后的數(shù)據(jù)進(jìn)行異常檢測(cè)。以下給出VOD法中的基本定義[24-25]。

        定義3 Voronoi多邊形

        對(duì)具有n個(gè)點(diǎn)的點(diǎn)集S={p1,p2, … ,pn}中的任意點(diǎn)pi,V(pi)是比S中的其他點(diǎn)更接近或同樣接近pi的所有點(diǎn)q的集合,該集合劃分出來(lái)的區(qū)域稱(chēng)為點(diǎn)Voronoi多邊形,記作V(pi)。

        V(pi)={q|d(pi,q)≤d(pj,q),?i≠j}

        (2)

        式中d(·)表示歐氏距離。

        定義4 Voronoi圖

        給定n個(gè)點(diǎn)的點(diǎn)集S={p1,p2, … ,pn},其所有點(diǎn)對(duì)應(yīng)的V(pi)將平面劃分為n個(gè)區(qū)域,稱(chēng)為點(diǎn)集S的Voronoi圖,記作Gv(S)。其中,i∈(1, 2, … ,n)。

        定義5 V-近鄰點(diǎn)

        ?pi∈S,V(pi)的每一條邊確定pi的一個(gè)近鄰點(diǎn),pi的所有近鄰點(diǎn)的集合記作Vn(pi)。

        定義6 V-近鄰密度

        ?pi∈S,VN(pi)中所有的點(diǎn)到pi的平均距離的倒數(shù)稱(chēng)為pi的V-近鄰密度,記作Vd(pi),即

        Vd(pi)=1∑o∈VN(P)d(pi,o)/VN(pi)

        (3)

        式中:|VN(pi)|為pi的近鄰點(diǎn)個(gè)數(shù);Vd(pi)反映了pi周?chē)c(diǎn)的分布密度。

        定義7 V-近鄰異常因子(voronoi neighbor outlier factor,VNOF)

        點(diǎn)pi的近鄰分布密度與該點(diǎn)分布密度的比值,稱(chēng)為V-近鄰異常因子,記作Fv(pi),即

        Fv(pi)=1VN(pi)∑o∈VN(p)Vd(o)Vd(pi)

        (4)

        本文提出的基于序列提取與VOD的電力數(shù)據(jù)異常檢測(cè)算法流程如圖3所示。

        圖3 算法流程Fig.3 Algorithmic framework

        4 算例分析

        在各類(lèi)電力數(shù)據(jù)中,負(fù)荷數(shù)據(jù)是一類(lèi)典型的終端數(shù)據(jù),且對(duì)電力調(diào)度決策的制定、需求側(cè)響應(yīng)等具有較大的影響。電力日負(fù)荷曲線(xiàn)的特征明顯,隨時(shí)間連續(xù)變化,但存在若干個(gè)明顯的高峰段和低谷段。這樣的連續(xù)時(shí)間序列數(shù)據(jù),出現(xiàn)異常變化波動(dòng)時(shí),并非簡(jiǎn)單的上下限越限,而需根據(jù)數(shù)據(jù)之間的相互關(guān)系,采用聚類(lèi)方法進(jìn)行檢測(cè)。

        本文選取某地實(shí)際日負(fù)荷的連續(xù)200個(gè)數(shù)據(jù)樣點(diǎn),作為正常序列組;通過(guò)修改負(fù)荷數(shù)據(jù)樣本60~73、170~174數(shù)據(jù)段,使得負(fù)荷曲線(xiàn)出現(xiàn)異常程度波動(dòng),作為異常序列組,模擬異常情形,如電力設(shè)備故障,遠(yuǎn)端數(shù)據(jù)讀取錯(cuò)誤或受攻擊篡改。為模擬實(shí)際情況,在正常樣本和異常樣本中引入μ=0,σ=2的相同正態(tài)分布誤差,作為實(shí)際測(cè)量噪聲,仿真步驟如下所述。

        (1)基于時(shí)間序列提取的降維預(yù)處理。

        運(yùn)用Pratt和Fink提出的時(shí)間序列提取方法,對(duì)負(fù)荷數(shù)據(jù)進(jìn)行降維預(yù)處理。如圖4所示,原樣本數(shù)據(jù)共200個(gè)樣本點(diǎn);提取后的重要點(diǎn)用空心圓標(biāo)記,壓縮參數(shù)R=1.02。

        圖4 樣本序列及提取結(jié)果Fig.4 Time series and compressed series

        時(shí)間序列提取效果如表1所示,經(jīng)過(guò)時(shí)間序列提取的新樣本數(shù)據(jù),不僅保留了原樣本中關(guān)鍵極值點(diǎn),反映了原樣本時(shí)間序列的變化走勢(shì),同時(shí)大大減小了數(shù)據(jù)量,減輕了后續(xù)異常檢測(cè)算法的計(jì)算負(fù)擔(dān)。

        表1 提取效果
        Table 1 Compression performance

        (2)基于維諾圖的異常檢測(cè)。

        原樣本經(jīng)提取生成新的時(shí)間序列,新序列保留了原序列的數(shù)據(jù)特征。將新序列的第i個(gè)線(xiàn)性分段按以下規(guī)則映射到維諾圖二維平面:

        (xi,yi)=(mAi,nBi)

        (5)

        式中:權(quán)重系數(shù)m,n∈(0, 1];A,B分別是序列中線(xiàn)性分段的兩類(lèi)特征參數(shù)。在此,Ai是第i個(gè)分段的長(zhǎng)度,反映持續(xù)時(shí)間,Bi是第i個(gè)分段的斜率,反映變化速率,m=n=1表示兩個(gè)特征重要性相當(dāng)。若m=0.8,n=1,則表明該情形下的變化速率比持續(xù)時(shí)間更重要。根據(jù)不同場(chǎng)景的檢測(cè)需求,調(diào)整權(quán)重系數(shù)改變映射,可獲得理想的檢測(cè)效果。

        將正常樣本經(jīng)提取后的新序列按上述規(guī)則映射到二維平面,并按維諾圖定義劃分區(qū)域,計(jì)算出點(diǎn)i的V-近鄰密度,取其倒數(shù)作為離群值Oi,反映該點(diǎn)與毗鄰其他點(diǎn)的偏離程度。經(jīng)計(jì)算,正常樣本的離群值最大的5個(gè)點(diǎn)如表2所示。表中,i是點(diǎn)的序號(hào),Oi是該點(diǎn)的離群值,xi、yi分別是該點(diǎn)在維諾圖平面內(nèi)的x坐標(biāo)和y坐標(biāo),。

        表2 正常樣本的離群值最大的5個(gè)點(diǎn)
        Table 2 Most five outlier points in normal series

        通過(guò)多次對(duì)原始正常樣本引入隨機(jī)正態(tài)分布誤差,并計(jì)算離群值后,發(fā)現(xiàn)正常樣本離群值最大值均不大于50,故設(shè)定正常與異常的離群閾值為50。

        同樣地,對(duì)加入檢測(cè)誤差的異常樣本進(jìn)行異常檢測(cè)計(jì)算,離群值最大的5個(gè)點(diǎn)如表3所示。表3中大于閾值50的點(diǎn)有2個(gè),分別為第19點(diǎn)和第6點(diǎn),視為異常點(diǎn),在圖4(b)中用實(shí)心點(diǎn)標(biāo)出。

        表3 異常樣本的離群值最大的5個(gè)點(diǎn)
        Table 3 Most five outlier points in abnormal series

        正常樣本和異常樣本的異常檢測(cè)結(jié)果如圖5所示。2個(gè)異常點(diǎn)在圖5(b)中用實(shí)心點(diǎn)標(biāo)出,可從圖中明顯看出,異常點(diǎn)與正常點(diǎn)存在明顯偏離;第19點(diǎn)和第6點(diǎn)對(duì)應(yīng)的樣本序列段則為異常段,在異常樣本序列中對(duì)應(yīng)60~84、156~172數(shù)據(jù)段,而正常樣本被修改的數(shù)據(jù)段是60~73、170~174數(shù)據(jù)段,可印證異常檢測(cè)有效。

        圖5 維諾圖及異常檢測(cè)結(jié)果Fig.5 Voronoi diagram and outlier detection results

        在圖4(b)中可以觀察到,其較大的變化率、較長(zhǎng)的變化持續(xù)時(shí)間,使得相應(yīng)異常數(shù)據(jù)的離群值偏大,且遠(yuǎn)大于其他離群值,不符合該段電力負(fù)荷樣本數(shù)據(jù)中其他大部分?jǐn)?shù)據(jù)的變化特征,異常檢測(cè)的結(jié)果可作為系統(tǒng)異常的輔助判據(jù),對(duì)此可予以系統(tǒng)告警,或進(jìn)一步詳細(xì)排查處理。

        5 結(jié) 論

        針對(duì)高維度、時(shí)間強(qiáng)耦合的電力數(shù)據(jù)異常檢測(cè)問(wèn)題,采用計(jì)算機(jī)領(lǐng)域中成熟的數(shù)據(jù)挖掘技術(shù)和維諾圖算法,提出一種基于時(shí)間序列提取和維諾圖的異常檢測(cè)方法,應(yīng)用于電力數(shù)據(jù)的檢測(cè)分析。本方法在降低計(jì)算復(fù)雜度、提高算法靈活性方面成效顯著,實(shí)現(xiàn)了電力異常數(shù)據(jù)的準(zhǔn)確檢測(cè)。仿真實(shí)驗(yàn)證明了所提方法的有效性。下一步將研究時(shí)間序列提取的壓縮率自適應(yīng)問(wèn)題,并引入機(jī)器學(xué)習(xí)方法,實(shí)現(xiàn)不同場(chǎng)景電力數(shù)據(jù)異常判別指標(biāo)的自設(shè)定。

        [1]邱承武, 宓群超. 利用電力數(shù)據(jù)四級(jí)網(wǎng)實(shí)現(xiàn)小電廠數(shù)據(jù)的采集[J]. 電力系統(tǒng)自動(dòng)化, 2006, 30(3): 105-106. QIU Chengwu, MI Qunchao. Using electric power IV network to collect power data in small power plant[J]. Automation of Electric Power Systems, 2006, 30(3): 105-106.

        [2]金肇光, 梁奇峰, 黃少先. 計(jì)算機(jī)與網(wǎng)絡(luò)儀表構(gòu)成的電力數(shù)據(jù)實(shí)時(shí)測(cè)量系統(tǒng)[J]. 電力系統(tǒng)及其自動(dòng)化學(xué)報(bào), 2004, 16(1): 89-91. JIN Zhaoguang, LIAN Qifeng, HUANG Shaoxian. The electric data real-time measurement system comprising computer and network instrument[J]. Proceedings of the Automation of Electric Power Systems, 2004, 16(1): 89-91.

        [3]王興志, 嚴(yán)正, 沈沉, 等. 基于在線(xiàn)核學(xué)習(xí)的電網(wǎng)不良數(shù)據(jù)檢測(cè)與辨識(shí)方法[J]. 電力系統(tǒng)保護(hù)與控制, 2012, 40(1): 50-55. WANG Xingzhi, YAN Zheng, SHEN Chen, et al. Power grid bad-data and identification based on online kernel learning method[J]. Power System Protection and Control, 2012, 40(1): 50-55.

        [4]秦璇. 電力統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量評(píng)估及其異常檢測(cè)方法研究[D]. 長(zhǎng)沙:長(zhǎng)沙理工大學(xué), 2013. QIN Xuan. Data quality evaluation and anomaly detection research based on the statistical data of power system[D]. Changsha:Changsha University of Science & Technology, 2013.

        [5]TEN C W, LIU C C, MANIMARAN G. Vulnerability assessment of cybersecurity for SCADA systems[J]. IEEE Transactions on Power Systems, 2008, 23(4): 1836-1846.

        [6]董朝陽(yáng), 趙俊華, 文福拴, 等. 從智能電網(wǎng)到能源互聯(lián)網(wǎng): 基本概念與研究框架[J]. 電力系統(tǒng)自動(dòng)化, 2014, 38(15): 1-11. DONG Zhaoyang, ZHAO Junhua, WEN Fushuan, et al. From smart grid to energy internet: Basic-concept and research framework[J]. Automation of Electric Power Systems, 2014, 38(15): 1-11.

        [7]MO Y, KIM H H, BRANCIK K, et al. Cyber-physical security of a smart grid infrastructure[J]. Proceedings of the IEEE, 2012, 100(1): 195-209.

        [8]唐新安, 胡鐵斌. SCADA系統(tǒng)中壞數(shù)據(jù)的自動(dòng)檢測(cè)[J]. 電力自動(dòng)化設(shè)備, 2002, 22(10): 81-82. TANG Xinan, HU Tiebin. Automation detection of bad data in SCADA system[J]. Electric Power Automation Equipment, 2002, 22(10): 81-82.

        [9]SINGH N, GLAVITSCH H. Detection and identification of topological errors in online power system analysis[J]. IEEE Transactions on Power Systems, 1991, 6(1): 324-331.

        [10]MA J, CHEN Y, HUANG Z, et al. Detect abnormal SCADA data using state estimation residuals[C]// Proceedings of IEEE Power & Energy Society General Meeting. IEEE, 2010: 1-8.

        [11]王增平,張晉芳, 錢(qián)誠(chéng). 基于同步測(cè)量信息的電網(wǎng)拓?fù)溴e(cuò)誤辨識(shí)方法[J]. 電力自動(dòng)化設(shè)備, 2012, 32(1):1-8. WANG Zengping, ZHANG Jinfang, QIAN Cheng. Topology error identification based on synchronized measurements for power network[J]. Electric Power |Automation Equipment, 2012, 32(1): 1-8.

        [12]王傳安, 張?zhí)鞎?huì), 趙海燕,等. SCADA系統(tǒng)通信網(wǎng)中的高級(jí)持續(xù)性攻擊檢測(cè)方法[J]. 計(jì)算機(jī)科學(xué)與探索, 2015, 9(3): 352-359. WANG Chuanan, ZHANG Tianhui, ZHAO Haiyan, et al. Detection of advanced persistent threats in SCADA communication network[J]. Journal of Frontiers of Computer Science and Technology, 2015, 9(3): 352-359.

        [13]HAWKINS D M. Identification of Outliers[M]. Berlin: Springer Netherlands, 1980: 13-26.

        [14]劉瑞葉, 李衛(wèi)星, 李峰,等. 電網(wǎng)運(yùn)行異常的狀態(tài)特征與趨勢(shì)指標(biāo)[J]. 電力系統(tǒng)自動(dòng)化, 2013, 37(20):47-53. LIU Ruiye, LI Weixing, LI Feng, et al. State features and tendency indices embodying abnormal operation of power systems[J]. Automation of Electric Power Systems, 2013, 37(20):47-53.

        [15]葉鋒, 何樺, 顧全, 等. EMS中負(fù)荷預(yù)測(cè)不良數(shù)據(jù)的辨識(shí)與修正[J]. 電力系統(tǒng)自動(dòng)化, 2006, 30(15):85-88. YE Feng, HE Hua, GU Quan, et al. Bad data identification and correction for load forecasting in energy management system[J]. Automation of Electric Power Systems, 2006, 30(15):85-88.

        [16]嚴(yán)英杰, 盛戈皞, 陳玉峰,等. 基于時(shí)間序列分析的輸變電設(shè)備狀態(tài)大數(shù)據(jù)清洗方法[J]. 電力系統(tǒng)自動(dòng)化, 2015(7):138-144. YAN Yingjie, SHENG Gehao, CHEN Yufeng, et al. Cleaning method for big data of power transmission and transformation equipment state based on time sequence analysis[J]. Automation of Electric Power Systems, 2015(7):138-144.

        [17]BREUNIG M M, KRIEGEl H P, NG R, et al. LOF: Identifying density based local outliers[C]// Proceedings of the ACM SIGMOD International Conference on Management of Data. Dallas, 2000: 93-104.

        [18]JIN W, TUNG A K H, HAN J, et al. Ranking outliers using symmetric neighborhood relationship.[C]// Proceedings of the 10th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining. Singapore: DBLP, 2006: 577-593.

        [19]廖俊, 于雷, 羅寰, 等. 基于趨勢(shì)轉(zhuǎn)折點(diǎn)的時(shí)間序列分段線(xiàn)性表示[J]. 計(jì)算機(jī)工程與應(yīng)用, 2010, 46(30): 50-53. LIAO Jun, YU Lei, LUO Huan, et al. Time series piecewise linear representation based on trend transition point[J]. Computer Engineering and Applications, 2010, 46(30): 50-53.

        [20]KEOGH E, CHAKRABARTI K, PAZZANI M, et al. Dimensionality reduction for fast similarity search in large time series databases[J]. Knowledge & Information Systems, 2002, 3(3): 263-286.

        [21]YI B K, FALOUTSOS C. Fast time sequence indexing for arbitrary lp norms[C]// Proceedings of the 26th International Conference on Very Large Data Bases. Morgan Kaufmann Publishers Inc. 2000: 385-394.

        [22]PRATT K B, FINK E. Search for patterns in compressed time series [J]. International Journal of Image & Graphics, 2011,2(1):89-106.

        [23]曲吉林, 寇紀(jì)淞, 李敏強(qiáng), 等. 基于Voronoi圖的異常檢測(cè)算法[J]. 計(jì)算機(jī)工程, 2007, 33(23): 35-36. QU Jilin, KOU Jisong, LI Minqiang, et al. Outlier detection algorithm based on Voronoi diagram[J]. Computer Engineering, 2007, 33(23): 35-36.

        [24]PREPARATA F P, SHAMOS M I. Computational geometry- an introduction[M]. New York: Springer-Verlay, 1985:56-82.

        [25]楊莉, 李鵬舉. 基于數(shù)據(jù)挖掘的日負(fù)荷曲線(xiàn)預(yù)測(cè)與修正[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2014, 23(12): 182-186. YANG Li, LI Pengju. Forecasting and modification of daily load curve based on data mining[J]. Computer Systems & Applications, 2014, 23(12): 182-186.

        裴湉 (1993),女,碩士,主要從事電力信息物理系統(tǒng)、電力信息安全和新能源方面的研究工作;

        齊冬蓮(1973),女,博士,教授,博士生導(dǎo)師,本文通信作者,主要研究方向?yàn)榉植际侥茉纯刂?、電力信息物理系統(tǒng)及非線(xiàn)性系統(tǒng)研究工作。

        (編輯 劉文瑩)

        Outlier Detection Method Based on Compressed Time Series and Voronoi Diagram for Power Data

        PEI Tian, QI Donglian

        (Department of Electrical Engineering, Zhejiang University, Hangzhou 310027, China)

        The deep integration of information system and physical system made power system easily affected by outlier data, while the existing outlier detection methods for power system didn’t take the advantages of data features, and had problems such as heavy computation, bad flexibility and low precision, etc. This paper proposes an outlier detection method based on compressed time series and Voronoi diagram, which adopts the time series extraction method of important points section to reduce the dimension of data in power system, map it to a two-dimensional plane, construct the Voronoi diagram partition, and then detect the abnormal data. This method can reduce the data dimension and algorithm complexity, set anomaly threshold according to the sequence features flexible, and realize the accurate detection of abnormal data. The simulation results have verified the effectiveness of the proposed method.

        time series; Voronoi diagram; outlier detection; power data

        國(guó)家高技術(shù)研究發(fā)展計(jì)劃項(xiàng)目(2015AA050202);國(guó)家自然科學(xué)基金項(xiàng)目(U1509218)

        TM 73

        A

        1000-7229(2017)05-0105-06

        10.3969/j.issn.1000-7229.2017.05.014

        2017-01-20

        Project supported by the National High Technology Research and Development of China (2015AA050202);National Natural Science Foundation of China(U1509218)

        猜你喜歡
        分段樣本算法
        一類(lèi)連續(xù)和不連續(xù)分段線(xiàn)性系統(tǒng)的周期解研究
        用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
        基于MapReduce的改進(jìn)Eclat算法
        Travellng thg World Full—time for Rree
        進(jìn)位加法的兩種算法
        分段計(jì)算時(shí)間
        推動(dòng)醫(yī)改的“直銷(xiāo)樣本”
        隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
        3米2分段大力士“大”在哪兒?
        太空探索(2016年9期)2016-07-12 10:00:04
        一種改進(jìn)的整周模糊度去相關(guān)算法
        国产目拍亚洲精品二区| 大地资源在线播放观看mv| 一本大道香蕉最新在线视频| 超清无码AV丝袜片在线观看| 国产av精选一区二区| 国产freesexvideos中国麻豆| 午夜三级a三级三点| 久久婷婷色香五月综合激情| 国产女主播福利一区二区| 成人片黄网站a毛片免费| 久久久久久久久久久国产| 人妻精品久久中文字幕| 国产福利一区二区三区在线观看| 婷婷四虎东京热无码群交双飞视频| 国产免费丝袜调教视频| 岛国精品一区二区三区| 美利坚合众国亚洲视频| 亚洲精品国精品久久99热| √天堂中文官网8在线| 国产盗摄XXXX视频XXXX| 日本女优激情四射中文字幕| 亚洲色成人www永久在线观看| 久久国产自偷自免费一区100| 国产乱老熟视频乱老熟女1| 国产99一区二区三区四区| 国产真实老熟女无套内射| 欧洲一区在线观看| 午夜少妇高潮在线观看视频| 精品国产青草久久久久福利| 亚洲AV日韩AV永久无码电影| 男女性搞视频网站免费| 美腿丝袜诱惑一区二区| 免费无码又爽又刺激聊天app| 午夜亚洲国产精品福利| 日本一区二区三区熟女俱乐部 | 亚洲国产精品尤物yw在线观看 | 韩国三级黄色一区二区| 极品白嫩的小少妇| av中文字幕综合在线| 亚洲一区二区三区码精品色| 久久午夜福利无码1000合集|