亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于haar小波編碼和改進(jìn)K-medoids算法聚合的用戶負(fù)荷典型區(qū)間場(chǎng)景挖掘

        2022-06-15 07:19:18許良財(cái)邵振國(guó)陳飛雄
        電力自動(dòng)化設(shè)備 2022年6期
        關(guān)鍵詞:典型區(qū)間聚類

        許良財(cái),邵振國(guó),陳飛雄

        (1. 福州大學(xué) 電氣工程與自動(dòng)化學(xué)院,福建 福州 350108;2. 福建省電器智能化工程技術(shù)研究中心,福建 福州 350108)

        0 引言

        隨著電力市場(chǎng)運(yùn)行機(jī)制和輔助服務(wù)的快速發(fā)展,電力用戶逐漸參與電網(wǎng)公司的各項(xiàng)業(yè)務(wù)。負(fù)荷信息作為描述用戶用電行為的關(guān)鍵要素,在需求響應(yīng)的研究中愈發(fā)重要[1-2]。用戶負(fù)荷數(shù)據(jù)呈現(xiàn)海量、價(jià)值密度低的特征,有效挖掘負(fù)荷典型場(chǎng)景對(duì)于異常用電檢測(cè)[3]、非侵入式負(fù)荷分解[4]、用電套餐設(shè)計(jì)[5]等需求響應(yīng)業(yè)務(wù)均具有重要意義。

        負(fù)荷典型場(chǎng)景挖掘需要采用聚類技術(shù)將負(fù)荷樣本劃分至不同集群,并采用各類集群的特征來(lái)表征典型場(chǎng)景,相關(guān)研究通常涉及負(fù)荷特征提?。?-9]、負(fù)荷曲線相似性度量[10-11]、負(fù)荷曲線頻域分解[12-14]等。

        在負(fù)荷特征提取方面:文獻(xiàn)[6]采用負(fù)荷率、日峰谷差率等6 個(gè)日負(fù)荷物理特性指標(biāo)進(jìn)行聚類,并依據(jù)聚類有效性修正指標(biāo)權(quán)重;文獻(xiàn)[7]利用熵權(quán)法為指標(biāo)賦權(quán),增加負(fù)荷極值時(shí)間作為新的負(fù)荷特性指標(biāo),能更準(zhǔn)確反映負(fù)荷曲線形態(tài)特征,有效提升聚類質(zhì)量;此外,深度學(xué)習(xí)如長(zhǎng)短期記憶網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、自編碼器等,能夠自動(dòng)提取負(fù)荷數(shù)據(jù)的潛在特征,被廣泛應(yīng)用于負(fù)荷聚類[8-9]。

        在負(fù)荷曲線相似性度量方面:文獻(xiàn)[10]利用核函數(shù)衡量相似性,提高了負(fù)荷樣本的可分性;文獻(xiàn)[11]結(jié)合動(dòng)態(tài)彎曲距離和歐氏距離判斷負(fù)荷曲線相似性,并利用熵權(quán)法配置相似度權(quán)重,聚類結(jié)果具有較好的魯棒性。

        在負(fù)荷曲線頻域分解方面:文獻(xiàn)[12]利用變分模態(tài)分解將負(fù)荷樣本分解為低頻、中頻、高頻3 個(gè)分量,結(jié)合低頻和中頻分量實(shí)現(xiàn)負(fù)荷的分層聚類;此外,小波變換作為高效的頻域分解技術(shù),被廣泛應(yīng)用于提取負(fù)荷曲線的不同頻域特征,有效提高了負(fù)荷曲線的聚類效果[13-14]。

        然而,用戶不可避免地存在一些非顯著用電行為,這導(dǎo)致直接聚類得到的負(fù)荷場(chǎng)景典型性不高。同時(shí),目前采用的聚類均值曲線只能描述確定性行為[15],而無(wú)法描述負(fù)荷在各時(shí)段的不確定信息,難以滿足負(fù)荷不確定性分析需求。

        為此,本文提出一種粒度可調(diào)的用戶負(fù)荷典型區(qū)間場(chǎng)景挖掘方法。將原始負(fù)荷曲線經(jīng)haar小波變換濾除細(xì)節(jié)波動(dòng)分量,提取低維負(fù)荷近似序列;分別對(duì)負(fù)荷近似序列每個(gè)維度的特征集進(jìn)行聚類,提取類簇所包含特征的邊界值,將其作為數(shù)值區(qū)間并進(jìn)行編碼;根據(jù)特征占比剔除非顯著數(shù)值區(qū)間,并結(jié)合不同維度的顯著數(shù)值區(qū)間得到字符串表征的負(fù)荷區(qū)間序列;提出一種字符串差異度計(jì)算方法,采用改進(jìn)K-medoids 算法聚合得到負(fù)荷區(qū)間序列類簇,并提取類簇所包含的負(fù)荷近似序列的邊界值,從而得到典型區(qū)間場(chǎng)景;設(shè)置差異度閾值實(shí)現(xiàn)典型區(qū)間場(chǎng)景的粒度調(diào)節(jié),并以愛(ài)爾蘭某用戶實(shí)測(cè)負(fù)荷數(shù)據(jù)為樣本,驗(yàn)證本文所提方法的有效性。

        1 負(fù)荷區(qū)間序列的提取

        1.1 負(fù)荷歸一化

        對(duì)于某一用戶負(fù)荷序列P={P1,P2,…,PN},其歸一化公式如下:

        式中:N為用戶負(fù)荷序列的維度;Pn、Pu[n]分別為歸一化前、后第n維度的負(fù)荷值;Pmax、Pmin分別為原始負(fù)荷最大、最小值。

        1.2 基于haar小波變換的負(fù)荷近似序列提取

        小波變換[13]是一種時(shí)序數(shù)據(jù)分解方法,可以將時(shí)序數(shù)據(jù)分解為1 個(gè)反映時(shí)序曲線整體變化趨勢(shì)的近似分量和若干個(gè)反映時(shí)序曲線細(xì)節(jié)波動(dòng)特性的細(xì)節(jié)分量,小波變換分解示意圖如附錄A 圖A1 所示。圖中:A0為初始時(shí)序數(shù)據(jù);A1和D1分別為第1 層分解的近似分量和細(xì)節(jié)分量;其他依此類推,下一層分量由上一層近似分量分解得到。

        用戶負(fù)荷典型場(chǎng)景用于反映用戶顯著的用電行為,可以忽略負(fù)荷細(xì)節(jié)波動(dòng)特性,而只保留負(fù)荷整體變化趨勢(shì),因此,本文以小波變換分解得到的負(fù)荷曲線近似分量替代原始曲線用于后續(xù)聚類分析。本文選用的母小波為haar 小波,分解得到的近似分量為多段水平線,有利于數(shù)據(jù)降維處理,降低聚類分析的計(jì)算復(fù)雜度。

        采用haar小波變換獲取負(fù)荷曲線近似分量的公式如下:

        式中:φ(t)為haar 小波函數(shù);r為小波分解層數(shù);arf為第r層負(fù)荷曲線近似分量在第f維度的小波近似系數(shù);NR為日負(fù)荷序列維度;Ar[n]為第r層負(fù)荷曲線近似分量在第n維度的數(shù)值。

        haar小波變換分解得到的近似分量呈階梯狀變化,圖1 為某日負(fù)荷曲線及其在不同分解層數(shù)的負(fù)荷曲線近似分量。需要說(shuō)明的是,本文每30 min 采樣1 次,共得到48 個(gè)采樣點(diǎn),對(duì)應(yīng)采樣時(shí)刻00:30、01:00、…、24:00,后同。

        圖1 不同分解層數(shù)的負(fù)荷曲線近似分量Fig.1 Approximate components of load curve for different decomposition layers

        由圖1 可見(jiàn),日負(fù)荷曲線反映了用戶一天中的用電行為變化,在采樣頻率較高的情況下,日負(fù)荷曲線存在顯著的細(xì)節(jié)波動(dòng)。負(fù)荷曲線近似分量由若干段相鄰采樣時(shí)刻負(fù)荷數(shù)據(jù)的均值組成,反映了用戶在每一段相鄰采樣時(shí)刻的平均用電水平。當(dāng)分解層數(shù)較小時(shí),近似分量和原始曲線差異較??;當(dāng)分解層數(shù)較大時(shí),近似分量能跟蹤原始曲線在較大時(shí)間尺度上的變化趨勢(shì),但與原始負(fù)荷曲線的差異增大。

        分解層數(shù)為r的負(fù)荷曲線近似分量包含M=NR/(2r)段水平線,且每段水平線為對(duì)應(yīng)時(shí)段2r個(gè)原始負(fù)荷數(shù)據(jù)的均值,因此,可以從中提取M維負(fù)荷近似序列表示負(fù)荷曲線近似分量。為減少負(fù)荷曲線近似分量與原始負(fù)荷曲線的差異,同時(shí)兼顧聚類分析的計(jì)算復(fù)雜度,本文選用分解層數(shù)為2 的近似分量提取負(fù)荷近似序列。

        1.3 數(shù)值區(qū)間編碼

        本文采用K-means 算法分別對(duì)某用戶所有負(fù)荷近似序列每個(gè)維度的特征集進(jìn)行聚類,提取類簇所包含特征的邊界值,得到若干個(gè)數(shù)值區(qū)間,從而描述用戶在該維度對(duì)應(yīng)時(shí)段的功率分布范圍。聚類過(guò)程如下。

        1)選擇聚類數(shù)k[m]。不同維度特征集所包含特征的數(shù)值分布范圍不同,通常數(shù)值分布范圍越大,劃分的類簇越多,因此,以各維度特征的數(shù)值分布范圍確定聚類數(shù),計(jì)算公式如下:

        式中:round(·)為向上取整函數(shù);DS[m]max、DS[m]min(m=1,2,…,M)分別為第m維度特征的最大值和最小值,第m維度的所有特征構(gòu)成集合DS[m]={pm1,pm2,…,pmX},pmx(x=1,2,…,X)為在第m維度特征集中的第x個(gè)特征,X為特征集所包含特征數(shù);d為設(shè)定的基礎(chǔ)數(shù)值分布范圍值,本文設(shè)定為0.1,當(dāng)特征集的數(shù)值分布范圍小于2d時(shí),認(rèn)為所有特征屬于同一類。

        2)初始化聚類中心。初始聚類中心的選擇會(huì)影響聚類過(guò)程以及最終結(jié)果,理論上希望初始聚類中心分布差異越大越好。對(duì)于第m維度特征集,本文選取k[m]個(gè)特征作為初始聚類中心集C[m]={C1,C2,…,Ck[m]},其中,Ci(i=1,2,…,k[m])為第m維度特征集的第i個(gè)初始聚類中心。不同k[m]值的初始聚類中心如附錄A 圖A2 所示,圖中每條線段表示X個(gè)特征按照數(shù)值從小到大的順序依次排列。

        3)類簇劃分。將所有特征按距離最近原則劃分至各聚類中心對(duì)應(yīng)的類簇,pmx到Ci的距離dxi為:

        式中:abs(·)為絕對(duì)值函數(shù)。

        4)更新聚類中心。在各類簇中,將各特征的均值作為新的聚類中心,如式(7)所示。

        式中:C′i為更新后的第i個(gè)聚類中心;Ji為pmx所在類簇的特征數(shù)。

        5)重復(fù)步驟3)、4),直至聚類中心不再發(fā)生變化時(shí)終止,第m維度的特征集被劃分為k[m]個(gè)類簇,提取類簇邊界值得到k[m]個(gè)數(shù)值區(qū)間。

        為了區(qū)分不同數(shù)值區(qū)間,采用字符對(duì)數(shù)值區(qū)間進(jìn)行編碼,使得各時(shí)段功率分布范圍由若干個(gè)字符表征,編碼示意圖如附錄A 圖A3 所示,圖中負(fù)荷近似序列的維度M=12,在每個(gè)維度下均存在若干個(gè)數(shù)值區(qū)間,a、b、c表示不同的數(shù)值區(qū)間。

        1.4 非顯著數(shù)值區(qū)間辨識(shí)

        在附錄A 圖A3 中,矩形的高度表征數(shù)值區(qū)間的特征占比,某些特征占比特別低的數(shù)值區(qū)間可以認(rèn)為是非顯著數(shù)值區(qū)間并將其剔除。定義特征占比e判別非顯著數(shù)值區(qū)間,公式如下:

        式中:n[m]i為第m維度的第i個(gè)數(shù)值區(qū)間包含的特征數(shù);n[m]max為第m維度的數(shù)值區(qū)間包含的最大特征數(shù);eu為閾值,本文取為5%。式(8)表示當(dāng)e

        2 用戶負(fù)荷典型區(qū)間場(chǎng)景挖掘

        2.1 負(fù)荷區(qū)間序列的差異度

        將不同維度的顯著數(shù)值區(qū)間合并,可以得到包含負(fù)荷近似序列的負(fù)荷區(qū)間序列,且每個(gè)負(fù)荷區(qū)間序列由長(zhǎng)度為M的字符串表示,某負(fù)荷區(qū)間序列如附錄A圖A4所示,字符串表示為“aaaaaaabbbbb”,圖中包含了44 個(gè)負(fù)荷近似序列,如虛線部分所示。進(jìn)一步提取負(fù)荷近似序列的邊界值作為負(fù)荷區(qū)間場(chǎng)景,如附錄A 圖A5 所示。顯然,對(duì)于每個(gè)負(fù)荷區(qū)間序列都可以提取一個(gè)負(fù)荷區(qū)間場(chǎng)景,但某些負(fù)荷區(qū)間序列僅包含1 個(gè)負(fù)荷近似序列,提取的區(qū)間場(chǎng)景為1條曲線,難以涵蓋用戶多樣化的用電行為。

        通常字符串差異度采用漢明距離[16]來(lái)度量,表現(xiàn)為2 個(gè)字符串在對(duì)應(yīng)維度不同的字符數(shù)之和。由于本文分別對(duì)不同維度的負(fù)荷特征集進(jìn)行聚類,提取數(shù)值區(qū)間后進(jìn)行編碼,不同維度的字符數(shù)不同,且不同字符對(duì)應(yīng)負(fù)荷特征類簇的聚類中心也不同,因此,綜合考慮上述因素,本文定義一種字符串差異度來(lái)衡量不同負(fù)荷區(qū)間序列的相似性,計(jì)算步驟如下。

        1)計(jì)算各維度的差異度權(quán)重因子w1u[m],即:

        式中:lk[m]為第m維度的特征集被聚為k[m]個(gè)類簇的聚類損失值;l1為第m維度的特征集被聚為1個(gè)類簇的聚類損失值;w1[m]為第m維度的特征集由1個(gè)類簇聚為k[m]個(gè)類簇的聚類損失下降值,該值越大,表示第m維度的特征集被聚為k[m]個(gè)類簇時(shí)聚類中心與其他特征值的差異越大,理應(yīng)對(duì)應(yīng)更大的差異度權(quán)重因子;w1u[m]為差異度權(quán)重因子,是w1[m]的歸一化值。特別地,當(dāng)k[m]=1 時(shí),w1[m]=0,即該維度的特征集只被聚為1 個(gè)類簇,差異度權(quán)重因子為0。

        2)計(jì)算類間差異值序列w2u,即:

        3)假設(shè)w2u[m]h為第i個(gè)字符串和第j個(gè)字符串在第m維度字符所對(duì)應(yīng)的差異值,計(jì)算第i個(gè)字符串和第j個(gè)字符串的差異度g(yi,yj),即:

        式中:yi、yj分別為第i個(gè)和第j個(gè)字符串。在本文中,采用字符串表征負(fù)荷區(qū)間序列,因此,g(yi,yj)也表示第i個(gè)和第j個(gè)負(fù)荷區(qū)間序列之間的差異度。

        2.2 基于改進(jìn)K-medoids算法的負(fù)荷區(qū)間序列聚合

        以本文定義的字符串差異度來(lái)替代傳統(tǒng)K-medoids 算法的歐氏距離,對(duì)負(fù)荷區(qū)間序列進(jìn)行聚合,得到負(fù)荷區(qū)間序列類簇,過(guò)程如下。

        1)初始化聚類中心。負(fù)荷區(qū)間序列集DQ由q個(gè)負(fù)荷區(qū)間序列D1、D2、…、Dq組成,在DQ中隨機(jī)選取K個(gè)負(fù)荷區(qū)間序列V1、V2、…、VK作為初始聚類中心。

        2)類劃分。將所有負(fù)荷區(qū)間序列按照字符串差異度最小劃分至不同類簇中,字符串差異度由式(9)—(11)計(jì)算得到。

        3)更新聚類中心。在各類簇中,計(jì)算每個(gè)負(fù)荷區(qū)間序列與當(dāng)前類簇其他負(fù)荷區(qū)間序列的差異度之和,并選取差異度之和最小的負(fù)荷區(qū)間序列作為新的聚類中心,計(jì)算公式如下:

        式中:gsum為Di與當(dāng)前類簇其他負(fù)荷區(qū)間序列的差異度之和;gDij為負(fù)荷區(qū)間序列Di與Dj的差異度;Oi為Di所在類簇的負(fù)荷區(qū)間序列數(shù),對(duì)應(yīng)的聚類中心為Vi。

        4)重復(fù)步驟2)、3),直至聚類中心不再發(fā)生變化時(shí)終止。

        最終,各類簇包含數(shù)量不等的負(fù)荷區(qū)間序列,通過(guò)提取各類簇所包含的負(fù)荷近似序列的邊界值可以得到K個(gè)負(fù)荷典型區(qū)間場(chǎng)景。

        2.3 典型區(qū)間場(chǎng)景數(shù)的選取

        由2.2 節(jié)的分析可知,采用K-medoids 算法獲取典型區(qū)間場(chǎng)景需要預(yù)先確定聚類數(shù)K,為此,本文參照K-means 算法利用手肘法[17]確定聚類數(shù),并提出一種典型區(qū)間場(chǎng)景數(shù)選取方法,具體如下。

        在設(shè)置不同K值的條件下,可以計(jì)算每個(gè)類簇的負(fù)荷區(qū)間序列與聚類中心的差異度之和,進(jìn)而得到差異度總和,公式如下:

        式中:gCiDj為負(fù)荷區(qū)間序列Dj與聚類中心Ci的差異度;gall為所有負(fù)荷區(qū)間序列與對(duì)應(yīng)聚類中心的差異度總和。

        差異度總和與傳統(tǒng)K-means 算法的誤差平方和SSE(Sum of Squares of Errors)類似,其值越小越好,且隨著K值的增大,差異度總和呈下降趨勢(shì),可以找到差異度總和由急劇減少至平緩減少的拐點(diǎn)來(lái)確定合適的K值,在拐點(diǎn)之后,K值增大所導(dǎo)致的差異度總和的減小幅度將顯著變小。考慮到不同初始聚類中心會(huì)影響聚類結(jié)果,本文針對(duì)每個(gè)聚類數(shù)K分別運(yùn)行50 次并繪制差異度總和的箱線圖,如圖2所示。在每個(gè)箱線圖中,箱中橫線表示中位數(shù),箱子的上界和下界分別表示上四分位和下四分位。通過(guò)對(duì)比不同K值的箱中橫線可以發(fā)現(xiàn),K值取4是一個(gè)合適的拐點(diǎn),且箱子寬度相對(duì)較小,波動(dòng)程度小,因此,本文設(shè)置典型區(qū)間場(chǎng)景數(shù)為4。

        圖2 不同K值差異度總和的箱線圖Fig.2 Boxplot of sum of differences for different values of K

        2.4 典型區(qū)間場(chǎng)景的粒度調(diào)節(jié)

        每個(gè)典型區(qū)間場(chǎng)景對(duì)應(yīng)一個(gè)負(fù)荷區(qū)間序列類簇,且類簇中的每個(gè)負(fù)荷區(qū)間序列包含數(shù)量不等的負(fù)荷近似序列。一般而言:典型區(qū)間場(chǎng)景包含的負(fù)荷近似序列數(shù)越多,區(qū)間面積越大,越能涵蓋用戶多樣化用電行為,但描述的負(fù)荷不確定性也越大,即粒度更粗,不利于精細(xì)表征用戶用電行為;而典型區(qū)間場(chǎng)景包含的負(fù)荷近似序列數(shù)越少,區(qū)間面積越小,越能精細(xì)表征用戶用電行為,但描述的負(fù)荷不確定性也越小,即粒度更細(xì),難以涵蓋用戶多樣化用電行為。為此,在得到負(fù)荷區(qū)間序列類簇的基礎(chǔ)上,本文提出一種典型區(qū)間場(chǎng)景的粒度調(diào)節(jié)方法,步驟為:

        1)選取包含負(fù)荷近似序列數(shù)最多的負(fù)荷區(qū)間序列作為典型區(qū)間序列;

        2)根據(jù)式(11)計(jì)算其余負(fù)荷區(qū)間序列與典型區(qū)間序列的差異度;

        3)設(shè)置差異度閾值,并剔除與典型區(qū)間序列的差異度大于閾值的負(fù)荷區(qū)間序列;

        4)提取剩余負(fù)荷區(qū)間序列所包含的負(fù)荷近似序列的邊界值,得到新的典型區(qū)間場(chǎng)景。

        特別地,為保證挖掘的典型區(qū)間場(chǎng)景可以涵蓋用戶大部分用電行為,本文針對(duì)每個(gè)典型區(qū)間場(chǎng)景分別設(shè)置差異度閾值,并依據(jù)步驟3)剔除負(fù)荷區(qū)間序列,即剔除所包含的負(fù)荷近似序列,確保經(jīng)粒度調(diào)節(jié)后每個(gè)典型區(qū)間場(chǎng)景包含負(fù)荷近似序列的數(shù)量占原始數(shù)量的85%以上。

        3 算例驗(yàn)證與分析

        3.1 典型區(qū)間場(chǎng)景挖掘流程

        本文所提典型區(qū)間場(chǎng)景挖掘方法的流程見(jiàn)圖3。

        圖3 典型區(qū)間場(chǎng)景挖掘流程Fig.3 Flowchart of typical interval scene mining

        3.2 仿真環(huán)境設(shè)置及實(shí)驗(yàn)數(shù)據(jù)介紹

        為驗(yàn)證本文典型區(qū)間場(chǎng)景挖掘方法的有效性,算例分析采用PC機(jī),CPU為Intel(R)Core i7-9750H@2.60 GHz,顯卡為Nvidia GeForce GTX 1 650,操作系統(tǒng)為Win10,算法由Python 語(yǔ)言編寫(xiě),運(yùn)行平臺(tái)為Jupyter Notebook。實(shí)驗(yàn)數(shù)據(jù)為愛(ài)爾蘭地區(qū)智能電表實(shí)測(cè)用戶負(fù)荷數(shù)據(jù)[18],選取電表編號(hào)為6609的中小型企業(yè)用戶共536 d的日用電數(shù)據(jù)。

        3.3 典型性指標(biāo)

        區(qū)間場(chǎng)景的上界和下界分別等于對(duì)應(yīng)區(qū)間包含負(fù)荷近似序列的最大值和最小值。對(duì)于每個(gè)區(qū)間場(chǎng)景,希望大部分負(fù)荷近似序列聚集在區(qū)間中部,即序列與區(qū)間邊界的距離越小越好。此外,較窄的區(qū)間場(chǎng)景能更精細(xì)地表征用戶用電行為,即所有區(qū)間場(chǎng)景包含的區(qū)域越窄越好。為此,本文定義最大邊界距離dmax和典型區(qū)域面積Sd評(píng)估區(qū)間場(chǎng)景的典型性,具體表達(dá)式如下:

        式中:Bi為第i個(gè)典型區(qū)間場(chǎng)景包含的負(fù)荷近似序列數(shù);quim、qlim分別為第i個(gè)典型區(qū)間場(chǎng)景在第m維度對(duì)應(yīng)的區(qū)間上界和下界;pijm為第i個(gè)典型區(qū)間場(chǎng)景中所包含的第j個(gè)負(fù)荷近似序列在第m維度的特征值。

        3.4 用戶負(fù)荷典型區(qū)間場(chǎng)景挖掘算例

        基于3.2 節(jié)的用戶用電數(shù)據(jù),根據(jù)式(5)—(7)、(9)可得到各維度的k[m]值和差異度權(quán)重因子w1u[m]值,如附錄A 表A1所示。當(dāng)k[m]=1時(shí),該維度的特征樣本被歸為1 個(gè)類簇,對(duì)負(fù)荷區(qū)間序列差異度的貢獻(xiàn)度為0,差異值序列w2u為空集;當(dāng)k[m]=2 時(shí),該維度的特征樣本被歸為2 個(gè)類簇,差異值序列w2u={1};當(dāng)k[m]=3 時(shí),該維度的特征樣本被歸為3 個(gè)類簇,差異值序列w2u的維數(shù)為3,根據(jù)式(10)得到計(jì)算結(jié)果如附錄A表A2所示。各維度數(shù)值區(qū)間編碼及包含的特征數(shù)如附錄A表A3所示。進(jìn)一步利用式(8)篩選非顯著數(shù)值區(qū)間,如附錄A表A4所示。

        剔除非顯著數(shù)值區(qū)間后,結(jié)合不同維度的顯著數(shù)值區(qū)間得到用戶所有負(fù)荷區(qū)間序列數(shù)為278,負(fù)荷近似序列數(shù)為533,即剔除了3條非顯著負(fù)荷近似序列。采用改進(jìn)K-medoids 算法聚合得到4 個(gè)負(fù)荷區(qū)間序列類簇,并提取出4 個(gè)典型區(qū)間場(chǎng)景,如圖4所示,場(chǎng)景1—4 包含的負(fù)荷近似序列數(shù)分別為81、166、133、153。

        圖4 采用本文方法挖掘的典型區(qū)間場(chǎng)景Fig.4 Typical interval scenes mined by proposed method

        由圖4 可以看出,4 個(gè)典型區(qū)間場(chǎng)景的變化趨勢(shì)相似,在某些時(shí)段的功率分布范圍存在重疊現(xiàn)象,而在另外一些時(shí)段的功率分布范圍不同,如:在00:00—02:00 時(shí)段(對(duì)應(yīng)采樣點(diǎn)1—4),場(chǎng)景4 的功率分布范圍為(0.47,0.70)p.u.,明顯區(qū)別于其余3個(gè)場(chǎng)景的功率分布范圍;而場(chǎng)景2 的功率分布范圍基本包含了場(chǎng)景1 和場(chǎng)景3 的功率分布范圍,但在18:00—24:00 時(shí)段(對(duì)應(yīng)采樣點(diǎn)37—48),場(chǎng)景2 功率分布范圍的下限值相對(duì)更高,這說(shuō)明場(chǎng)景2 下該時(shí)段的用電水平相對(duì)更高;對(duì)比場(chǎng)景1 和場(chǎng)景3 可見(jiàn),在00:00—10:00時(shí)段(對(duì)應(yīng)采樣點(diǎn)1—20),兩者的功率分布范圍基本一致,而在10:00—24:00 時(shí)段(對(duì)應(yīng)采樣點(diǎn)21—48),兩者的功率分布范圍則存在較大的區(qū)別??梢?jiàn),相較于單一典型曲線描述確定性負(fù)荷,典型區(qū)間場(chǎng)景能夠描述不同時(shí)段的功率分布范圍,更有助于描述負(fù)荷的不確定性。

        為了驗(yàn)證本文方法的有效性,分別采用聚類數(shù)可選的K-means 算法和層次聚類算法將用戶負(fù)荷數(shù)據(jù)集聚為4 類,并提取每類的邊界值得到典型區(qū)間場(chǎng)景。K-means 算法挖掘得到的典型區(qū)間場(chǎng)景如附錄A 圖A6 所示。層次聚類算法挖掘得到的典型區(qū)間場(chǎng)景與K-means 算法挖掘得到的典型區(qū)間場(chǎng)景類似,本文不再展示。由圖A6可以看出,K-means算法挖掘的典型區(qū)間場(chǎng)景存在短暫尖峰現(xiàn)象,不能剔除非典型的細(xì)節(jié)波動(dòng),其中場(chǎng)景2 受非顯著負(fù)荷影響,區(qū)間寬度較大。

        為進(jìn)一步驗(yàn)證haar 小波變換、非顯著負(fù)荷近似序列剔除能提取更典型的區(qū)間場(chǎng)景,分別針對(duì)上述2 種聚類算法設(shè)計(jì)3 個(gè)對(duì)比算例:算例1,分別采用K-means 算法和層次聚類算法對(duì)原始負(fù)荷曲線進(jìn)行聚類得到4 個(gè)典型區(qū)間場(chǎng)景;算例2,分別采用K-means 算法和層次聚類算法對(duì)負(fù)荷近似序列進(jìn)行聚類得到4 個(gè)典型區(qū)間場(chǎng)景;算例3,首先剔除非顯著負(fù)荷近似序列,然后分別采用K-means 算法和層次聚類算法對(duì)剩余的負(fù)荷近似序列進(jìn)行聚類得到4個(gè)典型區(qū)間場(chǎng)景。為了便于和本文方法挖掘的區(qū)間場(chǎng)景進(jìn)行比較,算例1—3中均提取類簇包含的負(fù)荷近似序列邊界值來(lái)得到典型區(qū)間場(chǎng)景,而不再采用均值負(fù)荷曲線來(lái)表征用戶典型行為。

        根據(jù)式(14)、(15)計(jì)算各算例及本文方法挖掘得到的典型區(qū)間場(chǎng)景的最大邊界距離和典型區(qū)域面積,結(jié)果如表1所示。

        表1 區(qū)間場(chǎng)景的典型性指標(biāo)對(duì)比Table 1 Comparison of typical indicators for interval scenes

        由表1 可見(jiàn),算例1—3 的dmax和Sd逐漸減小,這說(shuō)明利用haar小波變換提取負(fù)荷近似序列以及剔除非顯著負(fù)荷近似序列可以提升區(qū)間場(chǎng)景的典型性。此外,利用本文方法挖掘得到的4 個(gè)典型區(qū)間場(chǎng)景的dmax和Sd與2 種算法的算例3 結(jié)果相當(dāng),這說(shuō)明本文方法通過(guò)改進(jìn)K-medoids 算法聚合得到負(fù)荷區(qū)間序列類簇,進(jìn)而提取得到的典型區(qū)間場(chǎng)景是有效的。但區(qū)別于算例1 對(duì)負(fù)荷曲線直接聚類以及算例2 和算例3 中頻域分解再聚類的方式,本文方法可以實(shí)現(xiàn)典型區(qū)間場(chǎng)景的粒度調(diào)節(jié),通過(guò)設(shè)置差異度閾值確保4 個(gè)典型區(qū)間場(chǎng)景包含的負(fù)荷近似序列比重都在85%以上,差異度閾值設(shè)置與調(diào)節(jié)結(jié)果如附錄A表A5 所示。調(diào)節(jié)后重新計(jì)算典型性指標(biāo),得到dmax和Sd分別為29.4 和43.2,而未進(jìn)行粒度調(diào)節(jié)的典型區(qū)間場(chǎng)景的dmax和Sd分別為30.3和44.6,這說(shuō)明經(jīng)粒度調(diào)節(jié)后區(qū)間場(chǎng)景典型性得到進(jìn)一步提升。

        4 結(jié)論

        針對(duì)單一典型曲線描述用戶用電行為的不足,本文提出一種基于haar 小波編碼和改進(jìn)K-medoids算法聚合的用戶負(fù)荷典型區(qū)間場(chǎng)景挖掘方法,通過(guò)區(qū)間形式反映用戶在不同時(shí)段的功率分布范圍,從而更好地描述負(fù)荷的不確定性。

        采用haar 小波變換提取負(fù)荷近似序列,可以忽略負(fù)荷細(xì)節(jié)波動(dòng),從而不會(huì)因負(fù)荷微小波動(dòng)而增加場(chǎng)景的區(qū)間寬度,能更精細(xì)地表征用戶用電行為。剔除非顯著負(fù)荷近似序列可以有效減小區(qū)間場(chǎng)景所包含的區(qū)域面積,提高區(qū)間場(chǎng)景的典型性。

        設(shè)置字符串差異度閾值可以實(shí)現(xiàn)典型區(qū)間場(chǎng)景的粒度調(diào)節(jié),有助于電網(wǎng)公司根據(jù)實(shí)際需求得到不同粒度的典型區(qū)間場(chǎng)景,提高了區(qū)間場(chǎng)景的適用性。

        通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方式挖掘負(fù)荷典型區(qū)間場(chǎng)景對(duì)數(shù)據(jù)集質(zhì)量有較高要求,如要求數(shù)據(jù)集覆蓋全部工況且各工況樣本基本均衡等。

        附錄見(jiàn)本刊網(wǎng)絡(luò)版(http://www.epae.cn)。

        猜你喜歡
        典型區(qū)間聚類
        解兩類含參數(shù)的復(fù)合不等式有解與恒成立問(wèn)題
        用最典型的事寫(xiě)最有特點(diǎn)的人
        你學(xué)會(huì)“區(qū)間測(cè)速”了嗎
        多項(xiàng)式求值題的典型解法
        典型胰島素瘤1例報(bào)道
        基于DBSACN聚類算法的XML文檔聚類
        區(qū)間對(duì)象族的可鎮(zhèn)定性分析
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
        精品人妻系列无码一区二区三区| 国产在线91精品观看| 成午夜福利人试看120秒| 国产成人精品a视频一区| 久久久精品久久日韩一区综合| 久久91精品国产91久| 精品熟女av中文字幕| 国产在线无码不卡影视影院| 国产激情内射在线影院| 久久综合亚洲色社区| 国内激情一区二区视频| 中文乱码字幕精品高清国产| 久久久www免费人成精品| 国产精品刺激好大好爽视频| 亚洲av粉嫩性色av| 91视色国内揄拍国内精品人妻| 成年女人免费视频播放体验区| 久久香蕉免费国产天天看| av毛片一区二区少妇颜射| 久久婷婷综合激情五月| 97精品久久久久中文字幕| 亚洲AV成人无码久久精品老人 | 色婷婷亚洲精品综合影院| 成人无码午夜在线观看| 亚洲日本人妻中文字幕| 久久久精品亚洲一区二区国产av| 成 人 免费 在线电影| 日韩爱爱网站| 亚洲人妻av在线播放| 欧美老妇牲交videos| 3d动漫精品一区二区三区| 久久与欧美视频| 一级一片内射视频网址| 国产精品99无码一区二区| 亚洲国产精品尤物yw在线观看| 日本av在线精品视频| 97精品一区二区三区| 国产精一品亚洲二区在线播放| 骚片av蜜桃精品一区| 一区二区三区四区黄色av网站| 一本大道无码人妻精品专区|