亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于k-means聚類方法的曲線按比伸縮置換缺失數(shù)據(jù)補(bǔ)全法

        2021-05-13 05:44:30楊亞洲錢秋明梁鴨紅
        電氣自動(dòng)化 2021年2期
        關(guān)鍵詞:歷史數(shù)據(jù)準(zhǔn)確度聚類

        楊亞洲,錢秋明,梁鴨紅

        (云南電網(wǎng)有限責(zé)任公司普洱供電局,云南 普洱 665000)

        0 引 言

        對(duì)于電力負(fù)荷的預(yù)測(cè),很大程度上依靠對(duì)大量歷史用電負(fù)荷的歷史數(shù)據(jù)進(jìn)行分析處理。因此,電力負(fù)荷預(yù)測(cè)結(jié)果的準(zhǔn)確性,往往跟所提供的以往用電負(fù)荷歷史數(shù)據(jù)的可靠性以及有相關(guān)因素的資料的準(zhǔn)確性等因素緊密相關(guān)。目前,我國(guó)各級(jí)電力調(diào)度中心對(duì)歷史數(shù)據(jù)進(jìn)行采集的系統(tǒng)多為SCADA(數(shù)據(jù)采集與監(jiān)控)系統(tǒng)[1]。由于采集設(shè)備故障、通信網(wǎng)絡(luò)故障和程序錯(cuò)誤等原因,在數(shù)據(jù)庫(kù)存儲(chǔ)的電力負(fù)荷歷史數(shù)據(jù)會(huì)出現(xiàn)空值,即發(fā)生數(shù)據(jù)缺失現(xiàn)象。數(shù)據(jù)缺失現(xiàn)象會(huì)對(duì)負(fù)荷預(yù)測(cè)的準(zhǔn)確性產(chǎn)生不良影響。研究缺失數(shù)據(jù)的補(bǔ)全方法具有重要的意義。

        用于補(bǔ)全數(shù)據(jù)的方法主要分為統(tǒng)計(jì)法和分類法兩種。統(tǒng)計(jì)法包括傳統(tǒng)的數(shù)學(xué)方法和新興的機(jī)器學(xué)習(xí)算法。傳統(tǒng)的數(shù)學(xué)方法包括線性插值法補(bǔ)全法[2]和樣條插值擬合補(bǔ)全法等。王雁平直接將負(fù)荷按照前N天的平均負(fù)荷曲線對(duì)缺失數(shù)據(jù)進(jìn)行補(bǔ)全,該方法沒(méi)有充分考慮負(fù)荷變化規(guī)律[3]。傳統(tǒng)的統(tǒng)計(jì)算法補(bǔ)全數(shù)據(jù)計(jì)算量小,易于實(shí)現(xiàn),但是補(bǔ)全的準(zhǔn)確度低。機(jī)器學(xué)習(xí)算法通過(guò)復(fù)雜的數(shù)據(jù)挖掘處理,能夠大幅提高數(shù)據(jù)補(bǔ)全的準(zhǔn)確度如神經(jīng)網(wǎng)絡(luò)[4]、貝葉斯神經(jīng)網(wǎng)絡(luò)[5]、k-鄰近算法[6],但是這些算法計(jì)算成本高,實(shí)際應(yīng)用困難。已有研究表明,分類法相比于統(tǒng)計(jì)法在缺失數(shù)據(jù)補(bǔ)全上具有明顯優(yōu)勢(shì)。李曉飛提出了基于k-means算法的缺失數(shù)據(jù)填充方法,通過(guò)將數(shù)據(jù)聚類尋找特征數(shù)據(jù),選擇出現(xiàn)最多的離散性數(shù)據(jù)進(jìn)行填補(bǔ)[7]。趙天輝基于統(tǒng)計(jì)模糊矩陣分析用電模式找到符合水平相似日,根據(jù)相似程度選擇權(quán)重,對(duì)異常數(shù)據(jù)利用加權(quán)平均值進(jìn)行修復(fù)[8]。林順富通過(guò)灰色關(guān)聯(lián)分析和模糊聚類找出與帶補(bǔ)全日負(fù)荷向量隸屬值最大的兩條特征負(fù)荷曲線,以隸屬度為權(quán)重進(jìn)行加權(quán)平均修復(fù)[9]。

        針對(duì)現(xiàn)有數(shù)據(jù)補(bǔ)全法的不足,本文提出了一種基于k-means聚類方法的曲線按比伸縮置換法,通過(guò)把其日負(fù)荷向量所屬類的質(zhì)心向量的相應(yīng)數(shù)據(jù)按照一定的比例伸縮變換,替換到空缺數(shù)據(jù)部分,完成數(shù)據(jù)補(bǔ)全。該方法補(bǔ)全精度較高,受缺失數(shù)據(jù)量、缺失數(shù)據(jù)位置的影響小,而且計(jì)算成本相對(duì)較低。

        1 基于k-means 聚類方法的曲線按比伸縮置換法數(shù)據(jù)補(bǔ)全原理

        1.1 數(shù)據(jù)補(bǔ)全的目的與應(yīng)用

        數(shù)據(jù)補(bǔ)全,即探尋數(shù)據(jù)內(nèi)部的規(guī)律,補(bǔ)全數(shù)據(jù)中缺失的數(shù)據(jù)。在電力系統(tǒng)中,數(shù)據(jù)補(bǔ)全是負(fù)荷預(yù)測(cè)中不可缺少的一步。目前,我國(guó)各級(jí)電力調(diào)度中心對(duì)歷史數(shù)據(jù)進(jìn)行采集的系統(tǒng)多為SCADA(數(shù)據(jù)采集與監(jiān)控)系統(tǒng)。由于采集設(shè)備故障、通信網(wǎng)絡(luò)故障和程序錯(cuò)誤等原因,在數(shù)據(jù)庫(kù)存儲(chǔ)的電力負(fù)荷歷史數(shù)據(jù)會(huì)出現(xiàn)數(shù)據(jù)缺失現(xiàn)象。一方面,負(fù)荷預(yù)測(cè)的準(zhǔn)確度很大程度依賴于歷史數(shù)據(jù)的準(zhǔn)確度,缺失數(shù)據(jù)明顯會(huì)降低歷史數(shù)據(jù)的準(zhǔn)確度;另一方面,空置(不正常零值)比有誤差的歷史數(shù)據(jù)對(duì)預(yù)測(cè)算法準(zhǔn)確度的影響更大。因此,研究數(shù)據(jù)補(bǔ)全方法具有重要意義。

        1.2 曲線按比伸縮置換原理

        曲線按比伸縮置換的原理是:用和含有缺失數(shù)據(jù)曲線趨勢(shì)相似的曲線的相應(yīng)部分,根據(jù)其與原缺失數(shù)據(jù)的首尾差值按比例伸縮,置換原曲線的缺失部分,從而達(dá)到補(bǔ)全效果。

        圖1(a)為待補(bǔ)全的數(shù)據(jù)向量,其中點(diǎn)a到點(diǎn)b的數(shù)據(jù)為缺失數(shù)據(jù)。圖1(b)為與圖1(a)趨勢(shì)相似的曲線,圖中c、d分別與a、b相對(duì)應(yīng)。補(bǔ)全數(shù)據(jù)的方法為將圖1(b)cd段曲線經(jīng)過(guò)伸縮變換,連接到ab段曲線補(bǔ)全數(shù)據(jù)。

        假設(shè)待補(bǔ)全數(shù)據(jù)的個(gè)數(shù)為n,即ab之間有n個(gè)采樣點(diǎn)發(fā)生數(shù)據(jù)缺失,為填補(bǔ)待填補(bǔ)數(shù)據(jù)兩段的差值,cd曲線中的每一個(gè)點(diǎn)都要按比例伸縮一定步長(zhǎng),如式(1)所示:

        (1)

        那么,第i(i

        y(i)=yb+(ya-yc)-step×i

        (2)

        填補(bǔ)結(jié)果如圖1(a)中虛線所示。

        圖1 數(shù)據(jù)補(bǔ)全算法示意圖

        1.3 基于k-means聚類方法的曲線按比伸縮置換法補(bǔ)全數(shù)據(jù)具體實(shí)施步驟

        由于考慮到同一負(fù)荷在時(shí)間上具有一定的規(guī)律特性,即負(fù)荷在客觀條件如溫度和節(jié)假日屬性等相似的日期具有相似的負(fù)荷曲線,采用基于k-means聚類方法的曲線按比伸縮置換法,達(dá)到提高數(shù)據(jù)補(bǔ)全精度,減小數(shù)據(jù)補(bǔ)全精度受缺失數(shù)據(jù)位置、缺失數(shù)據(jù)數(shù)量影響的目的。

        本文提出的基于k-means聚類方法的曲線按比伸縮置換法的具體步驟如下:

        步驟一:以日負(fù)荷向量的形式輸入負(fù)荷數(shù)據(jù)。

        步驟二:把日負(fù)荷向量分為完整向量和含有缺失數(shù)據(jù)的向量。含有缺失數(shù)據(jù)的向量為待補(bǔ)全向量。

        步驟三:把完整的日負(fù)荷向量進(jìn)行聚類,并求出每一類的質(zhì)心向量。

        步驟四:將待補(bǔ)全向量根據(jù)與各類質(zhì)心向量歐式距離最小進(jìn)行分類。

        步驟五:將待補(bǔ)全向量所屬類的質(zhì)心向量作為與待補(bǔ)全向量具有相似負(fù)荷曲線的向量,根據(jù)本文2.2小節(jié)中給出的數(shù)據(jù)補(bǔ)全方法,將缺失數(shù)據(jù)補(bǔ)全。

        2 算例分析

        本文算例中電力負(fù)荷歷史數(shù)據(jù)采用某省某地產(chǎn)發(fā)展公司的用電功率數(shù)據(jù)。該數(shù)據(jù)共225天,每天采集96次,每隔15 min進(jìn)行一次采集。

        同時(shí),本文還收集了與電力負(fù)荷數(shù)據(jù)匹配的天氣數(shù)據(jù)——日平均氣溫和對(duì)應(yīng)日期的節(jié)假日屬性。

        為了測(cè)試本文提出的數(shù)據(jù)補(bǔ)全方法的效果,本文構(gòu)造了20段缺失數(shù)據(jù)。具體做法如下:在已有數(shù)據(jù)中隨機(jī)選擇20天數(shù)據(jù)作為含有缺失數(shù)據(jù)的日負(fù)荷向量,缺失數(shù)據(jù)起始位置隨機(jī),長(zhǎng)度隨機(jī)1到30不等。

        2.1 缺失數(shù)據(jù)補(bǔ)全

        本文中每天96點(diǎn)數(shù)據(jù)構(gòu)成一個(gè)向量,共225個(gè)向量,其中完整的向量為205個(gè)。將這205個(gè)向量以不同分類類數(shù)到進(jìn)行試驗(yàn),聚類結(jié)果如圖2所示。

        圖2 k不同取值的聚類誤差和

        圖2中:橫坐標(biāo)為類數(shù)k的取值,范圍為1到25;縱坐標(biāo)為依據(jù)該k值進(jìn)行分類,所有向量到其相應(yīng)分類的質(zhì)心向量的歐式距離之和。當(dāng)k從1增加到5,聚類效果明顯提升;當(dāng)k≥6,聚類效果提升效果趨于平緩。因此針對(duì)本文所使用的數(shù)據(jù)集,選擇k= 6。根據(jù)式(1)~式(4)分別對(duì)缺失數(shù)據(jù)進(jìn)行補(bǔ)全,補(bǔ)全誤差如表1所示。

        表1 缺失數(shù)據(jù)補(bǔ)全誤差

        圖3為某日數(shù)據(jù)補(bǔ)全結(jié)果,該日從第47個(gè)采集點(diǎn)到第62個(gè)采集點(diǎn),共模擬丟失16個(gè)采集點(diǎn)的數(shù)據(jù)??梢?jiàn),基于k-means聚類的曲線按比伸縮置換補(bǔ)全法補(bǔ)全的數(shù)據(jù)值更接近數(shù)據(jù)的實(shí)測(cè)值,比線性插值補(bǔ)全數(shù)據(jù)和日平均負(fù)荷曲線補(bǔ)全數(shù)據(jù)的效果好。

        圖3 某日缺失數(shù)據(jù)補(bǔ)全結(jié)果

        2.2 數(shù)據(jù)補(bǔ)全精度對(duì)基于支持向量機(jī)回歸算法的負(fù)荷預(yù)測(cè)的影響

        利用網(wǎng)格尋優(yōu)算法對(duì)誤差懲罰系數(shù)C和核函數(shù)參數(shù)g進(jìn)行優(yōu)化,結(jié)果為C=10.2,ε=0.01,g=2.7。

        分別利用線性插值法和基于k-means聚類置換法補(bǔ)全的數(shù)據(jù)進(jìn)行支持向量機(jī)負(fù)荷預(yù)測(cè),計(jì)算預(yù)測(cè)誤差,結(jié)果如表2所示。

        表2 支持向量機(jī)預(yù)測(cè)結(jié)果對(duì)比

        從表2結(jié)果可以看出,數(shù)據(jù)補(bǔ)全的準(zhǔn)確度對(duì)支持向量機(jī)預(yù)測(cè)結(jié)果有一定的影響。由于基于k-means聚類置換法補(bǔ)全的數(shù)據(jù)要比線性插值法補(bǔ)全準(zhǔn)確度高,因此應(yīng)用其數(shù)據(jù)的預(yù)測(cè)準(zhǔn)確都會(huì)提升。

        3 結(jié)束語(yǔ)

        本文提出的基于k-means聚類的曲線按比伸縮置換法,由于其應(yīng)用了電力系統(tǒng)輻射數(shù)據(jù)具有時(shí)間周期相似性的特點(diǎn),明顯地提高了數(shù)據(jù)補(bǔ)全的準(zhǔn)確度。并且,該種方法具有受缺失數(shù)據(jù)長(zhǎng)度、缺失數(shù)據(jù)位置影響較小的優(yōu)點(diǎn)。在一定程度上,提高數(shù)據(jù)補(bǔ)全準(zhǔn)確度可以提高預(yù)測(cè)的準(zhǔn)確度。數(shù)據(jù)補(bǔ)全對(duì)于負(fù)荷預(yù)測(cè),乃至光伏發(fā)電和風(fēng)力發(fā)電等發(fā)電功率預(yù)測(cè)都起到至關(guān)重要的作用。

        本文進(jìn)一步研究方向:一方面要優(yōu)化數(shù)據(jù)采集存儲(chǔ)系統(tǒng),減少數(shù)據(jù)的丟失;另一方面,需進(jìn)一步研究電力負(fù)荷曲線的特征提取與利用,更好地完成缺失數(shù)據(jù)補(bǔ)全的任務(wù)。

        猜你喜歡
        歷史數(shù)據(jù)準(zhǔn)確度聚類
        基于充電策略估算動(dòng)力電池容量的方法
        汽車電器(2025年1期)2025-02-03 00:00:00
        基于設(shè)備PF性能曲線和設(shè)備歷史數(shù)據(jù)實(shí)現(xiàn)CBM的一個(gè)應(yīng)用模型探討
        智能制造(2021年4期)2021-11-04 08:54:36
        基于故障歷史數(shù)據(jù)和BP神經(jīng)網(wǎng)絡(luò)的接地選線方案研究
        幕墻用掛件安裝準(zhǔn)確度控制技術(shù)
        建筑科技(2018年6期)2018-08-30 03:40:54
        基于DBSACN聚類算法的XML文檔聚類
        基于Hadoop技術(shù)實(shí)現(xiàn)銀行歷史數(shù)據(jù)線上化研究
        動(dòng)態(tài)汽車衡準(zhǔn)確度等級(jí)的現(xiàn)實(shí)意義
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        高爐重量布料準(zhǔn)確度的提高
        天津冶金(2014年4期)2014-02-28 16:52:58
        久久精品国产亚洲综合色| 色偷偷亚洲第一成人综合网址| 国产乱人伦偷精品视频还看的| 久久无码潮喷a片无码高潮| 久精品国产欧美亚洲色aⅴ大片| 亚洲欧美日韩国产一区| 国产一区二区三区视频了| 亚洲97成人在线视频| 最近2019年好看中文字幕视频 | 精品人妻一区二区三区久久| 久久精品麻豆日日躁夜夜躁| 久久精品无码一区二区三区不| 中文字幕丰满人妻有码专区| 麻豆精品国产专区在线观看| 国产精品ⅴ无码大片在线看| 亚洲AV成人无码国产一区二区| 女同同成片av免费观看| 久久精品国产亚洲av精东| 尤物视频在线观看| 91最新免费观看在线| 国产一区二区三区在线av| 国产精品久久久久一区二区三区 | 亚洲av人妖一区二区三区| 日本高清视频一区二区| 国产综合色在线视频区| 亚洲精品永久在线观看| 亚洲青涩在线不卡av| 中文字幕漂亮人妻在线| 国产精品久久久久影院| 久久久久国产亚洲AV麻豆| 久久少妇高潮免费观看| 中文字幕乱码高清完整版| 免费一区二区三区久久| 国产在线视频网站不卡| 老熟女的中文字幕欲望| 国产精品久久久| 中文亚洲AV片在线观看无码| 自由成熟女性性毛茸茸应用特色| 人妻久久久一区二区三区| 亚洲男人的天堂精品一区二区| 国产一区二区三区成人av|