亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于自編碼器的電力負(fù)荷聚類分析

        2021-11-23 13:14:24趙忠啟常喜強(qiáng)樊艷芳
        科學(xué)技術(shù)與工程 2021年32期

        趙忠啟, 常喜強(qiáng),*, 樊艷芳, 徐 森, 樊 茂

        (1.新疆大學(xué)電氣工程學(xué)院, 烏魯木齊 830047; 2.國網(wǎng)新疆電力有限公司, 烏魯木齊 830011)

        近年來,隨著智能采集感知控制技術(shù)的廣泛應(yīng)用,積累了大量的電力負(fù)荷數(shù)據(jù)[1]。通過聚類技術(shù),在電力負(fù)荷數(shù)據(jù)中挖掘不同類型的用電負(fù)荷的典型負(fù)荷曲線,提取有效的特征,從而有助于電網(wǎng)進(jìn)行負(fù)荷建模、節(jié)能改造、需求響應(yīng)管理等工作[2]。因此,對(duì)負(fù)荷曲線聚類方法的研究,具有十分重要的應(yīng)用價(jià)值。

        聚類作為一種無監(jiān)督的機(jī)器學(xué)習(xí)算法,可以對(duì)數(shù)據(jù)集進(jìn)行分簇,簇內(nèi)數(shù)據(jù)之間存在高度的相似性,簇間數(shù)據(jù)之間有一定的差異性,在數(shù)據(jù)挖掘領(lǐng)域具有廣泛的應(yīng)用。對(duì)負(fù)荷曲線的聚類可以分為直接聚類和間接聚類,直接聚類是對(duì)電力負(fù)荷數(shù)據(jù)不做處理而直接運(yùn)用算法進(jìn)行聚類[3]。文獻(xiàn)[4]根據(jù)樣本密度和樣本集中的距離相對(duì)較遠(yuǎn)原則選取初始聚類中心,再采用誤差平方和得出最優(yōu)聚類數(shù)目K值,但存在時(shí)間復(fù)雜度較高的問題。文獻(xiàn)[5]通過數(shù)據(jù)點(diǎn)之間的緊密性進(jìn)行排除離群點(diǎn)影響,在數(shù)據(jù)集中高密度處選取初始聚類中心,但仍需要人工確定聚類數(shù)目。文獻(xiàn)[6-7]通過結(jié)合自適應(yīng)學(xué)習(xí)理論、聚類有效性函數(shù)評(píng)價(jià)計(jì)算,解決了傳統(tǒng)聚類算法中K值的人工確定問題,但聚類準(zhǔn)確率較低。

        然而,隨著負(fù)荷數(shù)據(jù)維度的不斷增加,直接聚類在處理高維數(shù)據(jù)時(shí)遇到了存儲(chǔ)量和計(jì)算量的雙重挑戰(zhàn)。間接聚類能夠解決這個(gè)問題。間接聚類是先提取電力負(fù)荷數(shù)據(jù)的特征,降低負(fù)荷數(shù)據(jù)維度,再對(duì)降維后的序列聚類分析。文獻(xiàn)[8]通過奇異值分解方法對(duì)數(shù)據(jù)進(jìn)行變換,即處于一種新的坐標(biāo)系中,各坐標(biāo)軸上的坐標(biāo)是降維指標(biāo),再運(yùn)用改進(jìn)的K-means算法對(duì)負(fù)荷曲線聚類。文獻(xiàn)[9]通過對(duì)負(fù)荷數(shù)據(jù)采用離散傅里葉變換進(jìn)行降維并提取特征,再對(duì)負(fù)荷曲線聚類。文獻(xiàn)[10-11]通過Sammon映射、主成分分析等降維算法對(duì)負(fù)荷數(shù)據(jù)降維,再通過不同的聚類方法進(jìn)行聚類,得到有效的聚類曲線結(jié)果。

        上述研究采用的降維算法對(duì)原本負(fù)荷數(shù)據(jù)之間存在的差異性造成破壞,丟失了原始負(fù)荷數(shù)據(jù)的信息,影響了負(fù)荷曲線聚類結(jié)果的準(zhǔn)確度。隨著基于數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)在電力行業(yè)的快速發(fā)展應(yīng)用,已有技術(shù)為降維聚類提供了一種新的解決方法。自編碼器作為新型的機(jī)器學(xué)習(xí)模型,可以對(duì)負(fù)荷數(shù)據(jù)進(jìn)行特征提取,通過多層神經(jīng)網(wǎng)絡(luò)從高維的原始負(fù)荷數(shù)據(jù)中獲取低維空間的特征信息,利用無損重構(gòu)得到原始負(fù)荷數(shù)據(jù)信息。

        現(xiàn)提出一種基于自編碼器降維的電力負(fù)荷聚類方法,通過自編碼器進(jìn)行負(fù)荷數(shù)據(jù)特征提取并降維,再采用密度權(quán)值Canopy算法對(duì)降維后的數(shù)據(jù)預(yù)聚類,獲取初始聚類中心和最優(yōu)聚類數(shù)目K值,預(yù)聚類結(jié)果結(jié)合K-means算法進(jìn)行聚類。為此,通過聚類有效性指標(biāo)與其他傳統(tǒng)方法對(duì)比分析,以期提升電力負(fù)荷聚類效率和聚類結(jié)果準(zhǔn)確度的效果。

        1 負(fù)荷降維理論

        自編碼器是一種用于無監(jiān)督學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò),包括輸入層、輸出層和隱藏層3層結(jié)構(gòu)[12],通過把輸入的數(shù)據(jù)集非線性映射至隱藏層,獲得數(shù)據(jù)集的壓縮編碼,即得到另一維度空間中原始數(shù)據(jù)的特征信息,其足以再現(xiàn)輸入層的信息,從而可以達(dá)到降低數(shù)據(jù)維度和提高計(jì)算效率的目的。自編碼器網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

        訓(xùn)練過程分為編碼部分和解碼部分,將均方誤差(mean square error, MSE)作為不斷進(jìn)行迭代訓(xùn)練調(diào)整自編碼器(auto-encoder, AE)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)的損失函數(shù),獲取精確的低維度特征信息。自編碼器的編碼、解碼過程為

        (1)

        (2)

        式中:fencoder和fdecoder分別為編碼部分和解碼部分;x、r為輸入數(shù)據(jù)、低維度特征向量;h為高維度數(shù)。

        2 基于密度權(quán)值Canopy的K-means聚類算法

        2.1 傳統(tǒng)K-means聚類算法

        K-means作為一種劃分式硬聚類算法[13],是大數(shù)據(jù)挖掘技術(shù)中最經(jīng)典的聚類算法,在工業(yè)、科研領(lǐng)域都得到廣泛的應(yīng)用和研究。K-means算法的基本原理為:在訓(xùn)練數(shù)據(jù)集D中,輸入所需的聚類數(shù)目K值之后,從D內(nèi)隨機(jī)選取與聚類數(shù)目相同的數(shù)據(jù)向量作為初始聚類中心,計(jì)算各個(gè)樣本和聚類中心之間的距離,按最小距離原則進(jìn)行分簇[14],再計(jì)算各簇的平均值并更新為新的聚類中心,不斷地迭代循環(huán),最終使簇內(nèi)緊湊、簇間疏遠(yuǎn),即誤差平方和函數(shù)值穩(wěn)定在最小值時(shí)停止迭代。

        在計(jì)算各樣本之間距離時(shí),K-means算法采用的是歐式距離。設(shè)給定數(shù)據(jù)集D={x1,x2, …,xn},則計(jì)算任意兩個(gè)樣本點(diǎn)之間的歐氏距離公式為

        (3)

        式(3)中:xp={xp1,xp2, …,xpm};xq={xq1,xq2, …,xqm};m為樣本元素的維度。

        誤差平方和函數(shù)為

        (4)

        式(4)中:K為聚類數(shù)目;ri為第i個(gè)簇集中樣本元素的數(shù)目;xj為第i個(gè)簇集中的樣本元素;vi為第i個(gè)簇集中全部樣本元素的數(shù)據(jù)均值。

        圖2 傳統(tǒng)K-means算法流程圖Fig.2 Flow chart of traditional K-means algorithm

        傳統(tǒng)K-means算法流程圖如圖2所示。在傳統(tǒng)K-means算法中,是隨機(jī)選取K值和初始聚類中心,這種隨機(jī)性可能導(dǎo)致收斂至局部最優(yōu)解,使得聚類的質(zhì)量及穩(wěn)定性變差[13]。

        2.2 改進(jìn)的K-means聚類算法

        為了解決傳統(tǒng)K-means算法無法有效處理高維數(shù)據(jù),且存在人工給定聚類數(shù)目K值及隨機(jī)選取初始聚類中心易收斂至局部最優(yōu)的問題,提出密度權(quán)值Canopy的改進(jìn)K-means算法對(duì)降維后的電力負(fù)荷數(shù)據(jù)進(jìn)行聚類。改進(jìn)算法通過密度權(quán)值Canopy算法對(duì)降維后的數(shù)據(jù)執(zhí)行預(yù)聚類,從而能夠獲取初始聚類中心和合適的聚類數(shù)目,將預(yù)聚類結(jié)果結(jié)合K-means算法進(jìn)行聚類。

        數(shù)據(jù)集D中第i個(gè)數(shù)據(jù)點(diǎn)xi的密度ρ(i)為

        (5)

        (6)

        由式(5)可知,ρ(i)表示的物理意義為:在數(shù)據(jù)集D中,樣本i與其余樣本之間的距離小于MeanDis(D)的樣本元素?cái)?shù)目。

        簇內(nèi)樣本平均距離a(i)可表示為

        (7)

        簇間距離s(i)可表示為

        (8)

        式中:I={ρ(j)>ρ(i)},其中ρ(j)為第j個(gè)數(shù)據(jù)點(diǎn)xj的密度;d(i,j)為樣本點(diǎn)i、j之間的歐氏距離。

        由式(8)可知,簇間距離s(i)表示的物理意義為:若樣本元素i的局部密度為最大,與距其最遠(yuǎn)的樣本元素之間的距離為s(i),即s(i)=max{d(i,j)};否則,與距其最近的樣本元素之間的距離為s(i),即s(i)=min{d(i,j)}。

        權(quán)值積w的計(jì)算公式為

        (9)

        由樣本密度ρ(i)、簇內(nèi)樣本平均距離a(i)、簇間距離s(i)以某種形式的乘積構(gòu)成了最大權(quán)值積法,能夠有效對(duì)中心特征進(jìn)行反映,從而為最大權(quán)值積的數(shù)據(jù)點(diǎn)是下一個(gè)初始聚類中心。改進(jìn)的K-means算法流程圖如圖3所示。

        圖3 改進(jìn)的K-means算法流程圖Fig.3 Flow chart of improved K-means algorithm

        改進(jìn)的K-means算法步驟如下。

        步驟1對(duì)于降維后的數(shù)據(jù)集D,利用公式(5)進(jìn)行計(jì)算D中全部樣本元素的密度值,第一個(gè)聚類中心c1選取其中的密度值最大點(diǎn),則聚類中心的集合C變化為C={c1},與此同時(shí),將D中距c1小于樣本元素平均距離MeanDis(D)的點(diǎn)去除。

        步驟2由式(5)、式(7)、式(8)計(jì)算D中剩余樣本數(shù)據(jù)的ρ(i)、a(i)、s(i),并將其代入式(9)中進(jìn)行計(jì)算權(quán)值積w,第二個(gè)聚類中心c2選取其中的權(quán)值積值最大點(diǎn),聚類中心的集合C變化為C={c1,c2},與此同時(shí),將D中距c2小于樣本元素平均距離MeanDis(D)的點(diǎn)去除。

        步驟3重復(fù)執(zhí)行步驟2,直至降維后的數(shù)據(jù)集D為空,由此可得C={c1,c2,…,ck}。

        步驟4將以上步驟得到的初始聚類中心和K值結(jié)合K-means算法,對(duì)D聚類并更新聚類中心。當(dāng)新的聚類中心和初始聚類中心之間無變化時(shí),輸出聚類結(jié)果。

        3 基于AE降維的電力負(fù)荷聚類分析

        3.1 數(shù)據(jù)預(yù)處理

        隨著能源互聯(lián)網(wǎng)的不斷發(fā)展,獲取海量基礎(chǔ)的電力負(fù)荷用電數(shù)據(jù)難度逐漸降低[15]。但在數(shù)據(jù)采集過程中,由于存在終端采集設(shè)備故障、數(shù)據(jù)傳輸通信錯(cuò)誤、人為因素丟失等問題[16],負(fù)荷數(shù)據(jù)中仍有缺失數(shù)據(jù)與異常數(shù)據(jù)的存在。

        在數(shù)據(jù)清洗時(shí),剔除存在較大數(shù)據(jù)量缺失的負(fù)荷曲線數(shù)據(jù),利用多階拉格朗日內(nèi)插法對(duì)缺失不嚴(yán)重的負(fù)荷數(shù)據(jù)進(jìn)行填充,如式(10)所示。若某條負(fù)荷曲線t時(shí)刻的負(fù)荷數(shù)據(jù)變化率與前一時(shí)刻的負(fù)荷數(shù)據(jù)變化率存在較大差異,或在預(yù)設(shè)閾值之外,稱其為異常數(shù)據(jù),可以通過高斯濾波方法消噪,也可采用多階拉格朗日內(nèi)插法對(duì)少量異常的負(fù)荷曲線數(shù)據(jù)進(jìn)行修正。

        (10)

        為了進(jìn)行AE神經(jīng)網(wǎng)絡(luò)訓(xùn)練,對(duì)負(fù)荷數(shù)據(jù)進(jìn)行StandardScaler標(biāo)準(zhǔn)化,消除負(fù)荷數(shù)據(jù)量綱對(duì)后續(xù)聚類的影響,保證數(shù)據(jù)之間的可比性,采用Z-Score標(biāo)準(zhǔn)化公式為

        (11)

        式(11)中:x為清洗后的負(fù)荷數(shù)據(jù);x′為標(biāo)準(zhǔn)化后的負(fù)荷數(shù)據(jù);μ、σ分別為樣本數(shù)據(jù)的均值、標(biāo)準(zhǔn)差。

        3.2 整體算法流程

        整體算法包括對(duì)負(fù)荷數(shù)據(jù)的預(yù)處理、負(fù)荷數(shù)據(jù)降維、初始聚類中心與K值的確定、數(shù)據(jù)集的聚類及性能評(píng)估。整體算法流程圖如圖4所示。具體的流程描述如下。

        圖4 整體算法流程圖Fig.4 Overall algorithm flow chart

        (1)通過數(shù)據(jù)校正和數(shù)據(jù)補(bǔ)全技術(shù)對(duì)負(fù)荷數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,進(jìn)行標(biāo)準(zhǔn)化,完成負(fù)荷數(shù)據(jù)的預(yù)處理。

        (2)利用自編碼器技術(shù)提取負(fù)荷數(shù)據(jù)的低維特征,降低負(fù)荷數(shù)據(jù)維度,實(shí)現(xiàn)原始數(shù)據(jù)的無損壓縮,可以提高后續(xù)聚類的速度與精度。

        (3)采用密度權(quán)值Canopy算法對(duì)降維后的負(fù)荷數(shù)據(jù)執(zhí)行預(yù)聚類,從而能夠獲取初始聚類中心和合適的聚類數(shù)目。

        (4)將預(yù)聚類結(jié)果結(jié)合K-means算法聚類,輸出聚類結(jié)果,并通過聚類有效性指標(biāo)與其他傳統(tǒng)方法對(duì)比分析。

        4 算例分析

        4.1 數(shù)據(jù)集來源

        實(shí)驗(yàn)數(shù)據(jù)選取新疆某地區(qū)2019年74條10 kV線路運(yùn)行數(shù)據(jù),每5 min采集一次負(fù)荷數(shù)據(jù),每條線路全年共采集17 520個(gè)數(shù)據(jù)點(diǎn),構(gòu)成17 520×74階矩陣。

        將采用3.1節(jié)所述方法進(jìn)行數(shù)據(jù)預(yù)處理后的負(fù)荷實(shí)測數(shù)據(jù)執(zhí)行自編碼器訓(xùn)練,學(xué)習(xí)率為0.5,批尺寸為256,通過1 000次的不斷迭代訓(xùn)練,其損失函數(shù)的迭代過程如圖5所示。

        MSE為均方誤差圖5 MSE損失函數(shù)訓(xùn)練曲線Fig.5 MSE loss function training curve

        輸入數(shù)據(jù)在編碼部分可以提取原始數(shù)據(jù)特征,獲取降維數(shù)據(jù),再經(jīng)過解碼部分重構(gòu)原始數(shù)據(jù)。隨著迭代次數(shù)的增加,原始數(shù)據(jù)與輸出數(shù)據(jù)之間的MSE損失函數(shù)不斷減少,損失值穩(wěn)定在0.001 4左右,表明該降維數(shù)據(jù)可以有效地對(duì)原始數(shù)據(jù)進(jìn)行表征。

        4.2 電網(wǎng)實(shí)際負(fù)荷曲線聚類

        采用自編碼器網(wǎng)絡(luò)模型提取負(fù)荷數(shù)據(jù)的低維特征,降低負(fù)荷數(shù)據(jù)維度,將降維數(shù)據(jù)輸入至改進(jìn)的K-means算法聚類,得到的負(fù)荷曲線聚類結(jié)果如圖6所示。

        根據(jù)新疆季節(jié)特點(diǎn),供暖季是11月15日—4月15日,圖6聚類結(jié)果可分為2種主要區(qū)域類型,即實(shí)施煤改電區(qū)域與未實(shí)施煤改電區(qū)域。圖6(a)、圖6(b)中,負(fù)荷曲線整體趨勢大致相似,考慮接入大量的電采暖設(shè)備取代傳統(tǒng)形式煤采暖,電采暖用戶供暖季用電量呈現(xiàn)快速上升,在4月15日、11月15日左右負(fù)荷曲線出現(xiàn)明顯的下降、上升,6—8月夏季負(fù)荷出現(xiàn)升高,但夏季負(fù)荷峰值小于供暖季負(fù)荷峰值,簇類負(fù)荷曲線供暖季負(fù)荷高于非供暖季負(fù)荷,為實(shí)施煤改電區(qū)域。圖6(c)、圖6(d)中,考慮用戶仍采用傳統(tǒng)形式煤采暖,簇類負(fù)荷曲線供暖季負(fù)荷明顯低于非供暖季負(fù)荷,為未實(shí)施煤改電區(qū)域。

        最終的負(fù)荷曲線聚類中心是4類,如圖7所示。為了方便進(jìn)行分析,將4類負(fù)荷曲線聚類中心作為每簇類曲線的代表負(fù)荷曲線。

        由圖7可知,代表負(fù)荷曲線數(shù)據(jù)之間的差異性比較大。雖代表負(fù)荷同屬于實(shí)施煤改電或未實(shí)施煤改電區(qū)域,但各區(qū)域變壓器的額定容量、型號(hào)卻存在著不同,可以承受的總負(fù)荷大小也是不一樣,從而負(fù)荷數(shù)據(jù)范圍存在一定的差異性。

        4.3 聚類性能分析

        聚類有效性指標(biāo)能夠?qū)垲惡蟮慕Y(jié)果進(jìn)行定量分析,將采用訓(xùn)練后的AE模型進(jìn)行負(fù)荷曲線聚類與改進(jìn)的K-means直接聚類、傳統(tǒng)K-means聚類得到的DBI(Davies-Bouldin index)指標(biāo)、CHI(Calinski-Harabasz index)指標(biāo)、運(yùn)行時(shí)間數(shù)值做對(duì)比[10,17],結(jié)果如表1所示。

        玫紅色曲線為該簇類負(fù)荷的聚類中心圖6 基于AE降維的負(fù)荷曲線聚類結(jié)果Fig.6 Load curve clustering results based on AE dimensionality reduction

        由表1可知,所提降維聚類算法的DBI指標(biāo)值均比改進(jìn)的K-means直接聚類、傳統(tǒng)K-means算法低,而CHI指標(biāo)值均比改進(jìn)的K-means直接聚類、傳統(tǒng)K-means算法高,表明所提降維聚類算法聚類準(zhǔn)確度優(yōu)于改進(jìn)的K-means直接聚類和傳統(tǒng)K-means聚類。此外,采用訓(xùn)練后的AE模型進(jìn)行負(fù)荷曲線聚類,運(yùn)行時(shí)間約為10.323 s,而改進(jìn)的K-means直接聚類、傳統(tǒng)K-means聚類運(yùn)行時(shí)間分別約為15.843、24.356 s,可見,由于AE對(duì)數(shù)據(jù)集進(jìn)行了壓縮,降低了數(shù)據(jù)集規(guī)模,從而可提高相應(yīng)的聚類速度。

        圖7 基于AE降維的負(fù)荷曲線聚類中心圖Fig.7 Load curve clustering center diagram based on AE dimensionality reduction

        表1 不同聚類算法之間結(jié)果對(duì)比Table 1 Comparison of results between different clustering algorithms

        5 結(jié)論

        (1)提出一種基于自編碼器的電力負(fù)荷聚類方法,通過自編碼器進(jìn)行負(fù)荷數(shù)據(jù)降維處理,再采用密度權(quán)值Canopy算法對(duì)降維后的負(fù)荷數(shù)據(jù)預(yù)聚類,得到初始聚類中心和最優(yōu)聚類數(shù)目K值,預(yù)聚類結(jié)果結(jié)合K-means算法進(jìn)行聚類。經(jīng)過算例分析,驗(yàn)證了該方法應(yīng)用于電力負(fù)荷聚類能夠減少聚類過程中的復(fù)雜度,提高了聚類效率和聚類結(jié)果的準(zhǔn)確度,分類出不同的區(qū)域類型,分析出不同區(qū)域中負(fù)荷的特點(diǎn),有助于電網(wǎng)進(jìn)行負(fù)荷建模、負(fù)荷特性模擬、需求響應(yīng)管理等工作。

        (2)通過本文方法也對(duì)智能樓宇空調(diào)、電動(dòng)汽車等領(lǐng)域的負(fù)荷數(shù)據(jù)進(jìn)行了分析,取得同樣的驗(yàn)證結(jié)果。隨著智能電網(wǎng)的快速發(fā)展,如何結(jié)合多源異構(gòu)大數(shù)據(jù)融合,構(gòu)建精細(xì)化程度更高的聚類方法是今后的研究方向。

        男女动态91白浆视频| 四虎成人精品无码永久在线| 国产又爽又黄又不遮挡视频| 一区二区三区在线观看视频精品| 亚洲成av人片天堂网无码| 日韩亚洲av无码一区二区三区| 亚洲aⅴ无码国精品中文字慕| 求网址日韩精品在线你懂的| 尤物在线观看一区蜜桃| 国产精品r级最新在线观看| chinese国产乱在线观看| 日本少妇爽的大叫高潮了| 国产精品精品国产色婷婷| 毛片无码国产| 国产午夜福利不卡在线观看视频| 日本福利视频免费久久久| 亚洲高清在线免费视频| 熟女精品视频一区二区三区| 国产成人乱色伦区小说| 日韩产的人妻av在线网| 精品日韩亚洲av无码| 人人妻人人澡人人爽曰本| 亚洲国产AⅤ精品一区二区不卡| 国产99re在线观看只有精品| 极品少妇被后入内射视| 一区二区三区精品少妇| 日本丰满熟妇bbxbbxhd| 久久国产精品99精品国产987| 国产护士一区二区三区| 国产精品毛片一区二区三区| 亚洲成av人最新无码| 中文在线最新版天堂av| 精品含羞草免费视频观看| 欧洲成人午夜精品无码区久久| 亚洲AV秘 无码一区二区三区| 黄色精品一区二区三区| 色欲av蜜桃一区二区三| 欧美成人在线A免费观看| 精品亚洲国产亚洲国产| 久久精品国产亚洲av香蕉| 97色伦图片97综合影院久久|