亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于前趨勢(shì)相似度的細(xì)粒度用戶用電負(fù)荷預(yù)測(cè)

        2018-07-25 11:32:36劉寶成張春暉胡泉偉
        關(guān)鍵詞:用戶方法模型

        曹 夢(mèng) 劉寶成 何 金 張春暉 胡泉偉

        1(國(guó)網(wǎng)天津市電力科學(xué)研究院 天津 300384) 2(國(guó)網(wǎng)天津檢修公司 天津 300300)

        0 引 言

        隨著我國(guó)電力工業(yè)的高速發(fā)展,電力系統(tǒng)已經(jīng)成為日常生活中不可缺少的部分。截至2015年底,我國(guó)電網(wǎng)裝機(jī)容量、發(fā)電量躍居世界第一,保證電力系統(tǒng)的穩(wěn)定高效運(yùn)行已經(jīng)成為維持現(xiàn)代社會(huì)正常運(yùn)作,保障人類正常生活以及推動(dòng)社會(huì)經(jīng)濟(jì)高速發(fā)展的必要條件之一??傮w而言,電力系統(tǒng)的運(yùn)行質(zhì)量在一定程度上決定著基礎(chǔ)性產(chǎn)業(yè)的運(yùn)作情況,而對(duì)于居民生活來(lái)說(shuō),電力系統(tǒng)的穩(wěn)定性以及高效性又直接影響著人們的生活質(zhì)量。由于電力產(chǎn)品不能貯存的特殊性,要求生產(chǎn)的連續(xù)性,即生產(chǎn)、銷售、供應(yīng)同時(shí)完成。為了保證居民的正常生活,同時(shí)節(jié)約發(fā)電過(guò)程中的運(yùn)營(yíng)管理成本,在實(shí)際生產(chǎn)中對(duì)用電負(fù)荷進(jìn)行準(zhǔn)確地預(yù)測(cè)具有十分重要的意義。而家用智能電表的普及,使得電網(wǎng)系統(tǒng)中沉淀了大量用戶的用電記錄,用電量預(yù)測(cè)的數(shù)據(jù)獲取更加容易,成本更加低廉,而“互聯(lián)網(wǎng)+電力”的大數(shù)據(jù)挖掘也能為精準(zhǔn)用電提供基礎(chǔ)支撐[1]。

        在大數(shù)據(jù)背景下,由于電力企業(yè)信息化建設(shè)的不斷推進(jìn)及智能電力系統(tǒng)的不斷普及,電力數(shù)據(jù)的增長(zhǎng)速率將遠(yuǎn)遠(yuǎn)超出相關(guān)企業(yè)的預(yù)期,同時(shí)電力數(shù)據(jù)涉及多種類型的數(shù)據(jù),這極大增加了電力大數(shù)據(jù)的復(fù)雜度和關(guān)聯(lián)分析需求。另外對(duì)實(shí)時(shí)性要求較高,具有體量大、類型多、速度快等特征,也對(duì)電力大數(shù)據(jù)的分析帶來(lái)了極強(qiáng)的挑戰(zhàn)。在保持電力系統(tǒng)的持續(xù)穩(wěn)定與高效的同時(shí)避免社會(huì)資源的浪費(fèi)是居民用電系統(tǒng)規(guī)劃以及運(yùn)行管理的目標(biāo)。因此對(duì)于用電需求進(jìn)行有效的分析,并對(duì)居民用電量實(shí)現(xiàn)精準(zhǔn)的預(yù)測(cè)具有非常重要的意義。近年來(lái)有很多學(xué)者基于用電量預(yù)測(cè)問(wèn)題展開(kāi)深入研究并取得了很多研究成果。但是傳統(tǒng)的研究通常是基于宏觀的角度,對(duì)一定范圍內(nèi)用戶總體的用電情況展開(kāi)的,較少考慮到用戶個(gè)體用電行為差異。在模型中考慮用戶的個(gè)體行為差異,才能對(duì)用戶構(gòu)建細(xì)粒度的個(gè)性化預(yù)測(cè)模型,從而進(jìn)行準(zhǔn)確的用戶個(gè)體用電行為分析,這種基于用戶用電行為的細(xì)粒度分析對(duì)于電力大數(shù)據(jù)來(lái)說(shuō)是非常重要的。此外,基于一般的生活經(jīng)驗(yàn),很多研究會(huì)假設(shè)用戶的用電習(xí)慣在短時(shí)間內(nèi)是較為平穩(wěn)的,因此通常認(rèn)為預(yù)測(cè)日的用電量與最相鄰的歷史用電量信息相關(guān)性最大,但是這種假設(shè)忽略了居民的用電行為是具有周期性變化趨勢(shì)的,在模型中考慮用戶的這種行為特點(diǎn)有利于應(yīng)對(duì)用電量發(fā)生周期性突變的情況,從而進(jìn)行更加準(zhǔn)確的分析和預(yù)測(cè)。只有對(duì)用戶個(gè)體的各種用電行為特征進(jìn)行準(zhǔn)確的分析,才能更加深入地理解宏觀用電需求變化的內(nèi)因,從而制定合理的電力系統(tǒng)運(yùn)營(yíng)管理策略。

        針對(duì)以上問(wèn)題,本文基于真實(shí)家用智能電表數(shù)據(jù),根據(jù)用戶歷史電力消費(fèi)信息采用基于動(dòng)態(tài)時(shí)間規(guī)整的K-中心點(diǎn)聚類方法對(duì)用戶進(jìn)行細(xì)粒度劃分,并提出了基于前趨勢(shì)相似度的BP神經(jīng)網(wǎng)絡(luò)模型對(duì)各子類用戶用電行為進(jìn)行預(yù)測(cè),從而對(duì)用戶用電量周期性突變的情況進(jìn)行擬合,提高用電量預(yù)測(cè)的準(zhǔn)確性。

        1 用電量預(yù)測(cè)方法概述

        用電量預(yù)測(cè)是以用戶的歷史電量消費(fèi)信息為基礎(chǔ),綜合考慮經(jīng)濟(jì)、社會(huì)發(fā)展?fàn)顩r、氣候、氣溫、節(jié)假日、特殊事件等相關(guān)變量,對(duì)用戶的歷史用電數(shù)據(jù)進(jìn)行分析和挖掘,探索不同用戶用電量的內(nèi)在聯(lián)系及規(guī)律,對(duì)未來(lái)電力負(fù)荷做出一定的估計(jì)和預(yù)測(cè)。根據(jù)預(yù)測(cè)的時(shí)間跨度可將電力負(fù)荷預(yù)測(cè)分為超短期、短期、中期及長(zhǎng)期預(yù)測(cè)。而基于范圍尺度的劃分又可以將電力負(fù)荷預(yù)測(cè)劃分為民用、工業(yè)、商業(yè)、農(nóng)業(yè)等不同使用范圍。

        為了更好地適應(yīng)電力市場(chǎng)發(fā)展的需要,20世紀(jì)80年代至今,許多學(xué)者提出了相對(duì)準(zhǔn)確和適應(yīng)能力強(qiáng)的電荷預(yù)測(cè)方法。預(yù)測(cè)方法主要包括傳統(tǒng)預(yù)測(cè)法和人工智能預(yù)測(cè)法。傳統(tǒng)預(yù)測(cè)法主要是基于統(tǒng)計(jì)理論的時(shí)間序列分析方法。其主要思想是基于電力負(fù)荷形狀及函數(shù)形式對(duì)負(fù)荷進(jìn)行研究,此類方法認(rèn)為是隨機(jī)性導(dǎo)致了電力預(yù)測(cè)的不確定性,主要包括回歸分析法,時(shí)間序列分析法等。人工智能預(yù)測(cè)的方法是伴隨著人工智能技術(shù)的發(fā)展而興起的,主要包括灰色預(yù)測(cè)法、專家系統(tǒng)預(yù)測(cè)法、人工神經(jīng)網(wǎng)絡(luò)法等。

        在預(yù)測(cè)模型的選擇上,吳瀟玉等[2]采用灰色關(guān)聯(lián)度判斷與預(yù)測(cè)日的關(guān)聯(lián)關(guān)系,輸入預(yù)測(cè)日特征向量,建立基于隨機(jī)森林算法預(yù)測(cè)模型。肖瑞菊[3]利用最小二乘支持向量機(jī)算法,結(jié)合粒子群優(yōu)化算法,根據(jù)某地區(qū)的歷史流量數(shù)據(jù),總結(jié)流量變化的規(guī)律性,使得預(yù)測(cè)精度有所提高。熊盛華[4]利用BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建了三種混合預(yù)測(cè)模型,并應(yīng)用于中國(guó)海南省、澳大利亞新南威爾士州中等,并達(dá)到了較高精度。楊丹等[5]提出了一種支持向量回歸的預(yù)測(cè)方法對(duì)付在消耗進(jìn)行建模,同時(shí)提出一種基于遺傳算法的兩級(jí)改進(jìn)算法以調(diào)整支持向量回歸方法中的參數(shù)。Lou等[6]在神經(jīng)網(wǎng)絡(luò)算法的基礎(chǔ)上提出了一種模糊隨機(jī)變量模型來(lái)對(duì)含有不確定因素的用電量模型進(jìn)行建模,利用該模型可以對(duì)于不確定的因素通過(guò)一次集成進(jìn)行整體上的建模,而傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)或貝葉斯算法則是分開(kāi)進(jìn)行處理的,并且由于加入了不確定因素,其對(duì)輸入數(shù)據(jù)的噪聲的適應(yīng)性也大大加強(qiáng)。郭瑞等[7]為全面提高負(fù)荷預(yù)測(cè)模型的性能,提出一種新型的結(jié)合互補(bǔ)集成經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMD)和小波核函數(shù)極限學(xué)習(xí)機(jī)(WKELM)的短期電力負(fù)荷組合預(yù)測(cè)模型。首先通過(guò)CEEMD將歷史電力負(fù)荷數(shù)據(jù)自適應(yīng)地分解為一系列相對(duì)平穩(wěn)的子序列,對(duì)各分量建立小波核極限學(xué)習(xí)機(jī)的預(yù)測(cè)模型,預(yù)測(cè)各分量的負(fù)荷值并對(duì)其進(jìn)行求和得到最終預(yù)測(cè)結(jié)果。

        在預(yù)測(cè)模型的精度方面,F(xiàn)an等[8]利用差分經(jīng)驗(yàn)?zāi)P头纸馀c自回歸和支持向量回歸的結(jié)合算法對(duì)電力模型進(jìn)行預(yù)測(cè),并在新威爾士州和紐約的電力數(shù)據(jù)中證明其準(zhǔn)確性和可解釋性。Wang 等[9]比較了BP神經(jīng)網(wǎng)絡(luò)、ELMAN神經(jīng)網(wǎng)絡(luò)、Fuzzy神經(jīng)網(wǎng)絡(luò)及Wavelet神經(jīng)網(wǎng)絡(luò)短期用電負(fù)荷預(yù)測(cè)表現(xiàn)的預(yù)測(cè)精度,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)算法在短期電力負(fù)荷預(yù)測(cè)上明顯優(yōu)于其他三種算法。Omer Faruk Ertugrul將遞歸極限學(xué)習(xí)機(jī)引入電力預(yù)測(cè)的領(lǐng)域,并證明了這種單隱層的前饋神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法與其他采用機(jī)器學(xué)習(xí)的方法相比,其均方根誤差有著近兩倍的差異,同時(shí),其訓(xùn)練時(shí)間也快的多[10]。

        基于上述研究背景及前人的研究成果和經(jīng)驗(yàn),可以發(fā)現(xiàn)大多數(shù)的方法都是對(duì)用戶總體的用電量進(jìn)行分析和預(yù)測(cè),而較少考慮到用戶之間的個(gè)體用電行為差異,而這方面對(duì)于電力系統(tǒng)的生產(chǎn)調(diào)度和運(yùn)營(yíng)管理來(lái)說(shuō)是非常重要的??紤]到電力用戶群體龐大,且不同用戶用電的行為模式具有較大的差異,本文首先根據(jù)用戶的用電特征,采用基于動(dòng)態(tài)時(shí)間規(guī)整及K-中心點(diǎn)聚類方法對(duì)用戶進(jìn)行劃分;然后根據(jù)用戶所在的子類,及同一子類用戶用電信息,分別構(gòu)建基于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,用于該類用戶群體及個(gè)體的用電預(yù)測(cè);最后針對(duì)BP神經(jīng)網(wǎng)絡(luò)無(wú)法探知用戶用電行為中具有周期性突變點(diǎn)的問(wèn)題提出了基于前趨勢(shì)相似度的BP神經(jīng)網(wǎng)絡(luò)改進(jìn)模型,提高用電量預(yù)測(cè)的準(zhǔn)確性。

        2 基于用電行為劃分的用電預(yù)測(cè)模型

        基于樣本數(shù)據(jù)的時(shí)間跨度特點(diǎn),本文將進(jìn)行短期民用電力負(fù)荷預(yù)測(cè)。由于電力用戶群體龐大,且不同用戶用電的行為模式具有較大的差異,使用統(tǒng)一的預(yù)測(cè)模型無(wú)法捕獲用戶個(gè)體之間的差異性,導(dǎo)致對(duì)用戶個(gè)體用電行為的預(yù)測(cè)具有較大偏差,而為每個(gè)用戶建立一個(gè)預(yù)測(cè)模型所需的計(jì)算與儲(chǔ)存成本過(guò)大,因此也是不現(xiàn)實(shí)的?;谝陨显颍疚膶?duì)用戶按照歷史用電行為模式使用聚類方法進(jìn)行劃分,得到用電行為相似的用戶,同時(shí)將差異過(guò)大的用戶區(qū)別開(kāi)。在此基礎(chǔ)上再對(duì)每類用戶分別構(gòu)建基于BP神經(jīng)網(wǎng)絡(luò)的用電量預(yù)測(cè)模型,從而實(shí)現(xiàn)對(duì)具有不同用電行為的用戶群體未來(lái)時(shí)段用電量進(jìn)行準(zhǔn)確預(yù)測(cè)。

        2.1 基于動(dòng)態(tài)時(shí)間規(guī)劃的K-中心點(diǎn)聚類方法

        傳統(tǒng)的聚類方法是將用戶的一段時(shí)間的每日用電量進(jìn)行簡(jiǎn)單累加后,對(duì)用戶一段時(shí)間的用電總量為基礎(chǔ)進(jìn)行劃分,這樣的劃分方法忽略了用戶用電時(shí)間序列的相似性和差異性,導(dǎo)致劃分結(jié)果中總用電量相似而序列之間差異較大。而本文目的是進(jìn)行時(shí)間序列預(yù)測(cè),若子類序列差異較大將導(dǎo)致子類總體方差較大,這將直接影響時(shí)序預(yù)測(cè)的準(zhǔn)確性,因此本文采用基于動(dòng)態(tài)時(shí)間規(guī)整及K-中心點(diǎn)的用戶每日用電總量的時(shí)間序列聚類方法,更大程度地保留原始用戶的歷史信息。對(duì)用戶進(jìn)行聚類需要滿足如下條件:(1) 同一子類的用戶個(gè)體之間具有相似的用電行為;(2) 不同子類的用戶總體之間的用電行為有顯著差異;(3) 一個(gè)用戶僅能被劃分到一個(gè)子類中;(4) 所有子類的并集為全體用戶樣本。

        算法1K-中心點(diǎn)算法。

        輸入:N個(gè)樣本數(shù)據(jù)U={u1,u2,…,uN},簇?cái)?shù)目k

        Step1隨機(jī)選擇k個(gè)用戶對(duì)象作為初始中心點(diǎn);

        Step2計(jì)算每個(gè)對(duì)象到中心點(diǎn)的“距離”;

        Step3將剩余的每個(gè)對(duì)象指派給“距離”最近的中心點(diǎn)所代表的簇;

        Step4對(duì)每個(gè)簇計(jì)算每個(gè)點(diǎn)到該簇其他點(diǎn)的距離平方和,選擇使距離平方和最小的點(diǎn)為新的簇中心;

        Step5重復(fù)以上步驟,直至所有類簇的點(diǎn)不再發(fā)生變化。

        輸出:聚類結(jié)果,即樣本的簇標(biāo)簽c。

        按照上述算法對(duì)用戶總體進(jìn)行劃分后,輸出的結(jié)果中,同一子類的用戶個(gè)體之間具有相似的用電行為,而不同子類的用戶總體之間的用電行為有顯著差異。然而K-中心點(diǎn)算法的一個(gè)重要部分是如何定義每個(gè)對(duì)象到中心點(diǎn)的距離,通常的做法是使用歐式距離。為了更大程度地保留用戶的時(shí)間序列信息,本文采用動(dòng)態(tài)時(shí)間規(guī)整算法(DTW)定義對(duì)象至中心點(diǎn)的距離。

        DTW算法是以衡量?jī)蓚€(gè)不同長(zhǎng)度的時(shí)間序列的相似度為目的的算法[11],該算法廣泛地應(yīng)用于孤立語(yǔ)音識(shí)別、數(shù)據(jù)挖掘和信息檢索等諸多領(lǐng)域。

        (1)

        在Am×n中,定義彎曲路徑為一組相鄰矩陣相鄰元素的集合,記為W={w1,w2,…,wk},矩陣中第k個(gè)元素wk=(aij)k。該路徑滿足以下條件,即:

        (1) max{m,n}

        (2)w1=a11,wk=amn

        (3) 對(duì)于任意wk=aij,wk-1=ai′j′,0≤i-i′,0≤j-j′≤1,有:

        (2)

        簡(jiǎn)而言之,就是采用動(dòng)態(tài)規(guī)劃思想尋找滿足如下條件的最佳路徑,即:

        (3)

        通過(guò)上述方法定義各對(duì)象與中心點(diǎn)的距離,最終得到用戶總體的劃分。在此基礎(chǔ)上可以對(duì)用戶的用電行為進(jìn)行進(jìn)一步的分析和預(yù)測(cè)。

        2.2 基于前趨勢(shì)相似度的BP神經(jīng)網(wǎng)絡(luò)的用電量預(yù)測(cè)模型

        人工神經(jīng)網(wǎng)絡(luò)方法因其具有較高的預(yù)測(cè)精度,因此在用電量預(yù)測(cè)方面有著比較廣泛的應(yīng)用。人工神經(jīng)網(wǎng)絡(luò)是由大量的按照一定的規(guī)則連接人工神經(jīng)元組成的復(fù)雜的人工系統(tǒng)。基于前人的研究經(jīng)驗(yàn),本文選擇使用BP神經(jīng)網(wǎng)絡(luò)作為用電量預(yù)測(cè)模型。

        BP神經(jīng)網(wǎng)絡(luò)是一種單向傳播的多層前向神經(jīng)網(wǎng)絡(luò),通過(guò)梯度搜索沿反梯度方向?qū)Ω鲗拥纳窠?jīng)元從后往前逐層迭代修正其連接的權(quán)值,使得神經(jīng)網(wǎng)絡(luò)的實(shí)際輸出和期望輸出之間的誤差均方值最小。由于Hornik等[12]已證明輸入輸出層采用線性激勵(lì)函數(shù),隱含層采用Sigmoid激勵(lì)函數(shù)含有一個(gè)隱含層的人工神經(jīng)網(wǎng)絡(luò)可以以任意精度來(lái)逼近任何的有理函數(shù)。一般靠增加隱含層節(jié)點(diǎn)數(shù)來(lái)獲得較低的誤差比靠增加隱含層層數(shù)更容易實(shí)現(xiàn),基于對(duì)訓(xùn)練效果的考慮,因此本文在設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)時(shí)優(yōu)先考慮只含有一個(gè)隱含層的三層神經(jīng)網(wǎng)絡(luò)。

        與傳統(tǒng)使用BP神經(jīng)網(wǎng)絡(luò)等算法預(yù)測(cè)用電量行為不同,本文的方法是建立在用戶用電行為劃分基礎(chǔ)上的用電量預(yù)測(cè),同一子類中用戶電力消費(fèi)習(xí)慣相近而不同子類用戶的用電行為存在較大差異。因此本文根據(jù)各個(gè)子類,及該子類用戶的用電信息,分別構(gòu)建用電量預(yù)測(cè)模型。

        具體而言,設(shè)神經(jīng)網(wǎng)絡(luò)的輸入層的神經(jīng)元數(shù)量為M個(gè),故相應(yīng)的輸入向量Ii就是M維向量,輸入神經(jīng)元采用線性恒等激勵(lì)函數(shù),設(shè)隱含層包含的神經(jīng)元數(shù)量為L(zhǎng),設(shè)f1為隱含層激勵(lì)函數(shù)。輸出層所含神經(jīng)元數(shù)量為N個(gè),激勵(lì)函數(shù)記為f2,對(duì)應(yīng)的期望輸出為N維向量Oi。ωml為輸入層神經(jīng)元m到隱含層神經(jīng)元l的連接權(quán)值,ωln為隱含層神經(jīng)元l到輸出層神經(jīng)元n的連接權(quán)值。?l和θn是第l個(gè)隱含神經(jīng)元與第n個(gè)輸出神經(jīng)元的閾值。

        在信號(hào)的正向傳遞過(guò)程中,隱含層第i個(gè)神經(jīng)元的輸出為:

        (4)

        輸出層的第j個(gè)神經(jīng)元的輸出為:

        (5)

        對(duì)第i個(gè)樣本定義神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)誤差函數(shù)為:

        (6)

        推導(dǎo)各層之間的連接權(quán)值和閾值如下,從隱含層的第l個(gè)神經(jīng)元到輸出層的第n神經(jīng)元的連接閾值的增量計(jì)算公式為:

        (7)

        (8)

        進(jìn)一步推導(dǎo)輸入層的第m個(gè)神經(jīng)元至隱含層的第l個(gè)神經(jīng)元的連接權(quán)值和閾值?;谪?fù)梯度方向誤差修正的BP算法公式:

        (9)

        (10)

        根據(jù)已經(jīng)求得的各層之間的相互連接的權(quán)值和閾值的增量,更新神經(jīng)網(wǎng)絡(luò)中的各個(gè)參數(shù)的值。對(duì)于每個(gè)訓(xùn)練樣本,神經(jīng)網(wǎng)絡(luò)進(jìn)行相應(yīng)的修正可得:

        θn←θn+Δθjωln←ωln+Δωln

        (11)

        ?l←?l+Δ?lωml←ωml+Δωml

        (12)

        重復(fù)進(jìn)行以上的修正規(guī)則,直到誤差小于預(yù)先設(shè)定的值或者執(zhí)行次數(shù)達(dá)到設(shè)定次數(shù)時(shí)停止。

        在基于人工經(jīng)驗(yàn)的BP神經(jīng)網(wǎng)絡(luò)的參考向量選取模型中,假定在一段時(shí)期內(nèi)人的用電行為是穩(wěn)定的,因此預(yù)測(cè)日的用電量?jī)H與之前連續(xù)一段時(shí)間的歷史用電數(shù)據(jù)有關(guān)。但現(xiàn)實(shí)情況并非如此,基于經(jīng)驗(yàn)所得的BP神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)對(duì)于用電行為周期性突變的情況預(yù)測(cè)精度較差。在缺乏溫度、氣象、地理位置等信息的情況下,為了進(jìn)一步提高預(yù)測(cè)的準(zhǔn)確率,本文考慮對(duì)預(yù)測(cè)模型的樣本輸入進(jìn)行選擇,因此引入了基于前趨勢(shì)相似度的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。

        假設(shè)xi和xj為初始樣本空間的兩天,其附近若干天的平均每日用電量如圖1所示,若兩段曲線有相似的變化規(guī)律,則認(rèn)為xi和xj為為趨勢(shì)相似日。將xi和xj附近若干天的平均用電量曲線形狀的相似度定義為兩日的趨勢(shì)相似度。

        圖1 趨勢(shì)相似度曲線

        (13)

        由于在實(shí)際預(yù)測(cè)過(guò)程中,預(yù)測(cè)日的用電量均值不是已知的,因此本文根據(jù)預(yù)測(cè)日前k天的每日用電量均值尋找預(yù)測(cè)日的趨勢(shì)相似日。通常已知?dú)v史日前k日的平均用電量和預(yù)測(cè)日前k日的平均用電量值,通過(guò)計(jì)算歷史日前日的平均用電量序列和前k日的平均用電量序列得到預(yù)測(cè)日的前趨勢(shì)相似度。由于平均用電量序列趨勢(shì)相似度的絕大部分?jǐn)?shù)據(jù)包含于趨勢(shì)相似度數(shù)據(jù)中,故可以采用前趨勢(shì)相似度來(lái)代替趨勢(shì)相似度而決定預(yù)測(cè)日的趨勢(shì)相似日。

        算法基本思想如下:

        (1) 從預(yù)測(cè)日最相鄰的歷史日開(kāi)始至預(yù)測(cè)日前20日,逐日逆向計(jì)算預(yù)測(cè)日前k日序列及第N日前趨勢(shì)相似值τiN;

        (2) 選擇這20個(gè)前趨勢(shì)相似值排序,最大的前趨勢(shì)相似值輸出進(jìn)行排序,將最大值所對(duì)應(yīng)的日期作為預(yù)測(cè)日的最優(yōu)相似日。

        (3) 將原始的輸入?yún)⒖枷蛄刻鎿Q為經(jīng)過(guò)前趨勢(shì)相似度值改造的輸入向量,再經(jīng)過(guò)上述的模型構(gòu)建過(guò)程,得到最終的用電量預(yù)測(cè)模型。

        3 實(shí) 驗(yàn)

        3.1 數(shù)據(jù)概況與預(yù)處理

        本文所使用數(shù)據(jù)為某市部分居民2015年7月1日至2016年7月1日的用戶用電記錄。數(shù)據(jù)來(lái)自用戶家用智能電表的采樣,記錄了每個(gè)用戶一天的用電總量及尖峰平谷時(shí)段的用電數(shù)據(jù)。由于樣本數(shù)據(jù)均為實(shí)際生產(chǎn)中的真實(shí)數(shù)據(jù),數(shù)據(jù)采集過(guò)程中存在較多的干擾,部分用戶部分時(shí)段存在用電數(shù)據(jù)缺失的情況?;跀?shù)據(jù)質(zhì)量及算法性能的考慮,本文隨機(jī)選取記錄較為完整的200個(gè)用戶進(jìn)行實(shí)驗(yàn),選取原始數(shù)據(jù)中2015年7月1日至2015年11月30日的日節(jié)點(diǎn)作為訓(xùn)練樣本,選擇2015年12月1日至2015年12月20日的用戶樣本作為驗(yàn)證樣本。對(duì)于其中的缺失點(diǎn)或記錄異常點(diǎn),使用前三天的均值進(jìn)行填充替換。為了使不同類型的數(shù)據(jù)能夠更加平衡地作用于模型,需要對(duì)選取的樣本數(shù)據(jù)進(jìn)行歸一化,本文采用的方法為線性歸一化,將所有數(shù)據(jù)歸一化至[0.1,0.9]。

        3.2 實(shí)驗(yàn)設(shè)置

        基于驗(yàn)證數(shù)據(jù)集上的實(shí)驗(yàn)分析,本文將用戶劃分的數(shù)量設(shè)置為k=5。由于同一子類用戶用電習(xí)慣相似,因此本文以每個(gè)子類中的用戶在各個(gè)時(shí)間段內(nèi)的均值作為訓(xùn)練神經(jīng)網(wǎng)絡(luò)的輸入向量,最后用訓(xùn)練所得的模型分別對(duì)子類中的用戶群體及個(gè)體進(jìn)行預(yù)測(cè)。

        神經(jīng)網(wǎng)絡(luò)的輸入層與隱含層的激勵(lì)函數(shù)采用S形激勵(lì)函數(shù),隱含層與輸出層的激勵(lì)函數(shù)采用線性激勵(lì)函數(shù)。經(jīng)過(guò)反復(fù)試驗(yàn),最優(yōu)學(xué)習(xí)率設(shè)置為0.035,隱層節(jié)點(diǎn)設(shè)為9,最大訓(xùn)練次數(shù)設(shè)置為1 000。

        3.3 對(duì)比方法

        為了證明本文所述方法的預(yù)測(cè)性能,本文將該模型與其他幾種方法的實(shí)驗(yàn)效果進(jìn)行了對(duì)比,選擇的方法如下:

        自回歸模型(AR) 自回歸模型是利用前期若干時(shí)刻的隨機(jī)變量的線性組合來(lái)描述以后某時(shí)刻隨機(jī)變量的線性回歸模型[13],它是時(shí)間序列預(yù)測(cè)任務(wù)中使用最為廣泛的模型之一。本文選擇實(shí)驗(yàn)效果最好的4階自回歸模型作為基準(zhǔn)模型。

        基于經(jīng)驗(yàn)的BP神經(jīng)網(wǎng)絡(luò)(BP) 基于一般經(jīng)驗(yàn),用戶的用電習(xí)慣在短時(shí)間內(nèi)是較為平穩(wěn)的,因此通常認(rèn)為預(yù)測(cè)日的用電量與最相鄰的歷史用電量信息相關(guān)性最大。在基于經(jīng)驗(yàn)的BP神經(jīng)網(wǎng)絡(luò)中,其輸入變量為與預(yù)測(cè)日相鄰的連續(xù)歷史時(shí)段的用電記錄。

        基于前趨勢(shì)相似度的BP神經(jīng)網(wǎng)絡(luò)(TSBP) 本文所提出的改進(jìn)模型,即利用前趨勢(shì)相似度對(duì)輸入變量進(jìn)行選擇的BP神經(jīng)網(wǎng)絡(luò)模型。

        3.4 評(píng)價(jià)指標(biāo)

        為了分析本文所提出的模型的預(yù)測(cè)性能,本文擬采用如下三個(gè)誤差評(píng)估指標(biāo):

        (14)

        (15)

        (16)

        其中,前兩個(gè)衡量的是預(yù)測(cè)結(jié)果的絕對(duì)誤差,第三個(gè)衡量的是相對(duì)誤差,這三個(gè)評(píng)價(jià)指標(biāo)均是數(shù)值越小,表示模型的性能越好。

        3.5 實(shí)驗(yàn)結(jié)果

        本文所提出的方法首先將用戶總體進(jìn)行劃分,然后再以各個(gè)子類整體建立基于前趨勢(shì)相似度的用電預(yù)測(cè)模型,得到的模型可以用于用戶個(gè)體和用戶群體的用電量預(yù)測(cè)。

        首先展示本文所述的TSBP模型在基于用電行為劃分方法得到的用戶個(gè)體上的實(shí)驗(yàn)結(jié)果。從表1中可以看出,本文所述方法在對(duì)用戶個(gè)體的預(yù)測(cè)過(guò)程中可以保持相對(duì)較小的絕對(duì)誤差上和相對(duì)誤差。其中簇類1的MAPE值較大,這是由于用戶的真實(shí)用電量過(guò)小導(dǎo)致的,而從MAE的數(shù)值上可以看出預(yù)測(cè)在數(shù)值上絕對(duì)誤差是很小的,這說(shuō)明本文的預(yù)測(cè)方法是有效的。

        表1 TSBP模型實(shí)驗(yàn)結(jié)果

        為了直觀地展示本文模型對(duì)用戶個(gè)體的預(yù)測(cè)效果,本文從樣本數(shù)據(jù)中隨機(jī)抽取一組用戶個(gè)體的用電記錄進(jìn)行檢驗(yàn),得到對(duì)于用戶個(gè)體的用電量預(yù)測(cè)結(jié)果與實(shí)際用電量對(duì)比如圖2所示。從圖中可以看出本文模型對(duì)于用戶個(gè)體的用電行為也可以較好地進(jìn)行預(yù)測(cè)。該結(jié)果從側(cè)面顯示出本文的用戶劃分方法是有效的,因?yàn)槊總€(gè)用戶群體需要共享同一個(gè)預(yù)測(cè)模型,該模型能夠較好地?cái)M合該群體中用戶個(gè)體的用電行為,說(shuō)明本文的方法能夠較好地對(duì)用戶的用電行為特征進(jìn)行提取并充分利用。

        圖2 隨機(jī)抽取部分用戶預(yù)測(cè)結(jié)果與實(shí)際用電量對(duì)比

        為了展示本文提出的基于用電行為劃分以及預(yù)測(cè)方法的有效性,此處將本文模型的實(shí)驗(yàn)效果與基準(zhǔn)方法的實(shí)驗(yàn)效果進(jìn)行對(duì)比,其結(jié)果如表2和表3所示。表2顯示的是進(jìn)行用戶行為劃分和未進(jìn)行用戶行為劃分的對(duì)比結(jié)果,表3顯示的是自回歸模型以及基于經(jīng)驗(yàn)的BP神經(jīng)網(wǎng)絡(luò)與本文所提出的模型的對(duì)比結(jié)果。表2中的實(shí)驗(yàn)結(jié)果清晰地顯示基于用電行為劃分的預(yù)測(cè)模型在預(yù)測(cè)效果上優(yōu)于未進(jìn)行用電行為劃分的預(yù)測(cè)模型。這說(shuō)明本文所述的方法能夠準(zhǔn)確地提取用戶的用電特征并進(jìn)行區(qū)分,從而有助于對(duì)用戶用電行為進(jìn)行進(jìn)一步的細(xì)粒度的個(gè)性化分析。這種做法相對(duì)于傳統(tǒng)的不做區(qū)分的預(yù)測(cè)方法具有一定的優(yōu)越性。而從表3中可以看出BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果在整體上優(yōu)于自回歸模型,這說(shuō)明本文選取的預(yù)測(cè)模型具有較好的預(yù)測(cè)性能,能夠較為準(zhǔn)確地?cái)M合用戶的用電行為?;谇摆厔?shì)相似度的BP神經(jīng)網(wǎng)絡(luò)模型優(yōu)于基于經(jīng)驗(yàn)的BP神經(jīng)網(wǎng)絡(luò)模型,說(shuō)明了本文所提出的假設(shè)是具有合理性的,即未來(lái)時(shí)段的用戶用電行為不僅與其相鄰的歷史時(shí)段用電量有關(guān),而且與其他時(shí)段的歷史用電量也有較高的相關(guān)性,用戶的用電行為不僅具有連續(xù)性,還具有一定的周期性和趨勢(shì)性,利用這種周期性和趨勢(shì)性,對(duì)于用電量產(chǎn)生突變的時(shí)刻也能較好地?cái)M合用戶的用電行為。

        表2 是否使用用戶行為劃分方法的實(shí)驗(yàn)結(jié)果對(duì)比

        表3 基準(zhǔn)模型與TSBP模型預(yù)測(cè)效果對(duì)比

        為了方便實(shí)驗(yàn)效果的對(duì)比與展示,此處隨機(jī)選擇其中一個(gè)子類,對(duì)該用戶群體的用電量總體情況預(yù)測(cè)結(jié)果進(jìn)行對(duì)比與分析。圖3為該用戶群體在用電量突變點(diǎn)附近基于經(jīng)驗(yàn)的BP網(wǎng)絡(luò)與基于前趨勢(shì)相似度的BP網(wǎng)絡(luò)的預(yù)測(cè)效果對(duì)比圖。該圖直觀反映出對(duì)于第五天用電量產(chǎn)生突變時(shí),基于趨勢(shì)相似度的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型更加能夠捕捉到這種突變的發(fā)生,從而提升預(yù)測(cè)的準(zhǔn)確性,因此本文將原始的輸入向量經(jīng)過(guò)前趨勢(shì)相似度值進(jìn)行改造是合理的。

        (a) 基于趨勢(shì)相似度的模型預(yù)測(cè)結(jié)果

        (b) 基于經(jīng)驗(yàn)的模型預(yù)測(cè)結(jié)果 圖3 用電量突變點(diǎn)處的模型預(yù)測(cè)效果對(duì)比

        4 結(jié) 語(yǔ)

        在智能電網(wǎng)普及的大數(shù)據(jù)背景下,準(zhǔn)確地對(duì)未來(lái)時(shí)段的用電量進(jìn)行預(yù)測(cè)對(duì)于維持生產(chǎn)生活的穩(wěn)定有著十分重要的意義。本文為了降低根據(jù)居民用電的隨機(jī)行為對(duì)實(shí)驗(yàn)結(jié)果的影響,同時(shí)更大程度地保留居民歷史用電信息,采用基于DTW(動(dòng)態(tài)時(shí)間規(guī)整)距離的K-mediods聚類方法對(duì)總體用戶樣本進(jìn)行聚類,得到若干個(gè)子類;然后在各個(gè)子類分別建立BP神經(jīng)網(wǎng)絡(luò)模型對(duì)該類用戶總體用電量和用戶個(gè)體用電量進(jìn)行預(yù)測(cè);最后,利用前趨勢(shì)相似度改造模型的參考向量,對(duì)原始BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行改進(jìn),預(yù)測(cè)精度明顯上升。

        但是由于缺乏地理、氣溫、氣象等信息,本文所涉及的模型還具有一定的局限性,可能對(duì)模型預(yù)測(cè)準(zhǔn)確率有一定程度的影響,在后續(xù)的研究工作中將對(duì)模型進(jìn)行進(jìn)一步的改進(jìn),以期達(dá)到更好的預(yù)測(cè)效果。

        猜你喜歡
        用戶方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        可能是方法不對(duì)
        3D打印中的模型分割與打包
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        久久无码高潮喷水| 91在线视频在线视频| 亚洲人成网网址在线看| 99偷拍视频精品一区二区| 性做久久久久久久| 开心激情网,开心五月天| 激情五月婷婷一区二区| 免费a级毛片无码| 成人久久免费视频| 久久精品网站免费观看| 国产让女高潮的av毛片| 午夜视频在线在免费| 国产高级黄区18勿进一区二区| 青青草原亚洲在线视频| 最新日本人妻中文字幕| 久久精品国产亚洲av高清热| 国产精品福利影院| 日韩精品少妇专区人妻系列| 国产日本精品一二三四区| 成人综合网站| 热99精品| 俺来也三区四区高清视频在线观看| 国产精品久久久三级18| 无套内射无矿码免费看黄| 青青国产成人久久91| 按摩少妇高潮在线一区| 五月四房播播| 在线观看免费a∨网站| 久久熟女乱一区二区三区四区| 亚洲天堂av中文字幕在线观看 | 少妇被啪出水在线视频| 男女性杂交内射妇女bbwxz| 精品国精品国产自在久国产应用| 最近亚洲精品中文字幕| 亚洲av网站在线观看一页| 精精国产xxxx视频在线播放| 亚洲tv精品一区二区三区| 在线不卡精品免费视频| 无码人妻精品一区二区三| 伊人久久成人成综合网222| 国产大片在线观看三级|