亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        子序列決策聚類下的光伏系統(tǒng)工況判別

        2022-06-08 03:59:18潘杰男劉光宇
        關(guān)鍵詞:均值聚類決策

        潘杰男,劉光宇,朱 凌

        (1.杭州電子科技大學(xué)自動(dòng)化學(xué)院,浙江 杭州 310018;2.浙江財(cái)經(jīng)大學(xué)信息管理與人工智能學(xué)院,浙江 杭州 310018)

        0 引 言

        近年來,光伏電站運(yùn)行工況的故障診斷一般采用無監(jiān)督學(xué)習(xí)方法[1],解決了光伏電站工況數(shù)據(jù)異常樣本篩選困難的問題。一天獲取的光伏發(fā)電數(shù)據(jù)可能存在多種運(yùn)行狀態(tài),對(duì)于高維時(shí)間序列數(shù)據(jù)運(yùn)行工況的判別,文獻(xiàn)[2]將獲取到的光伏發(fā)電數(shù)據(jù)作為靜態(tài)數(shù)據(jù),直接使用聚類算法進(jìn)行故障診斷,沒有考慮樣本點(diǎn)在時(shí)間維度上的分布特性;文獻(xiàn)[3]將時(shí)間序列數(shù)據(jù)的聚類分為全時(shí)間序列聚類和子序列時(shí)間序列聚類,后者又稱為子序列聚類,并利用固定的窗口對(duì)整段時(shí)間序列數(shù)據(jù)進(jìn)行逐個(gè)分析,不能解決時(shí)間間隔不規(guī)則的數(shù)據(jù);文獻(xiàn)[4]指出全時(shí)間序列聚類算法的難點(diǎn)在于線段長度的選取,提出一種針對(duì)光伏時(shí)間序列數(shù)據(jù)的在線故障診斷方法,避免了序列的分割問題;文獻(xiàn)[5]先將時(shí)間序列數(shù)據(jù)分割成多個(gè)相對(duì)較短的時(shí)間序列樣本集,每個(gè)樣本表示一天的發(fā)電數(shù)據(jù),然后進(jìn)行多種聚類算法,成功獲得光伏發(fā)電數(shù)據(jù)的中心序列,但在文獻(xiàn)[5]中,人為分割的依據(jù)是儀器的采樣時(shí)間,存在一定的先驗(yàn)知識(shí),而且將一天中所有數(shù)據(jù)點(diǎn)作為一個(gè)樣本,子序列可能存在多種運(yùn)行狀態(tài),無法進(jìn)一步得到多種具體工況的分類;文獻(xiàn)[6]指出,子序列聚類往往先采用滑動(dòng)窗口提取多個(gè)子序列,再對(duì)子序列進(jìn)行聚類,窗口的大小直接影響算法的性能。窗口太大,忽略了某些數(shù)據(jù)點(diǎn)的重要狀態(tài)信息;窗口太小,則耗費(fèi)大量時(shí)間。為了獲得每個(gè)數(shù)據(jù)元素的標(biāo)簽,文獻(xiàn)[7]將時(shí)間序列的每個(gè)元素都分配到包含它的子序列的多數(shù)標(biāo)簽上,但其描述的決策方式可能產(chǎn)生沖突,如果某樣本點(diǎn)同時(shí)屬于2段子序列,而這2段子序列被聚類判別為不同類別,需對(duì)該點(diǎn)的類別進(jìn)行計(jì)數(shù)決策,遇到計(jì)數(shù)相等時(shí),該點(diǎn)的類別將無法進(jìn)行合理判別。為了得到類簇信息與真實(shí)光伏發(fā)電系統(tǒng)工況相近的數(shù)據(jù),本文通過步長和大小均可變的滑動(dòng)窗口提取多條子序列,再對(duì)重疊子序列進(jìn)行決策,提出一種子序列決策聚類(Subsequence Decision Clustering, SDC)算法,對(duì)光伏系統(tǒng)的時(shí)間序列數(shù)據(jù)進(jìn)行工況判別。

        1 符號(hào)定義

        為了便于理解光伏發(fā)電系統(tǒng)運(yùn)行工況和本文聚類方法的描述,給出相關(guān)的符號(hào)、名詞與定義,如表1所示。

        表1 相關(guān)的符號(hào)說明

        2 子序列決策聚類算法

        針對(duì)一條多工況的光伏時(shí)間序列數(shù)據(jù),為了充分利用樣本點(diǎn)在時(shí)間上的關(guān)聯(lián)性,本文提出一種子序列決策聚類算法SDC,根據(jù)可變步長和大小的滑動(dòng)窗口提取多條子序列,對(duì)子序列進(jìn)行層次鏈接聚類,比較分析各子序列的多類別重疊區(qū)域的特征數(shù)據(jù)平均值,通過標(biāo)簽決策得到最終標(biāo)簽,算法流程如圖1所示。

        圖1 子序列決策聚類算法流程

        2.1 數(shù)據(jù)歸一化

        進(jìn)行聚類分析前,往往需要對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理,得到利于算法分析的特征數(shù)據(jù)。從光伏電站采集到的原始數(shù)據(jù)一般包括光伏電池板的輻照度、溫度、輸入輸出電壓、電流及其他內(nèi)外部數(shù)據(jù)等多維數(shù)據(jù),不同維度數(shù)據(jù)的單位不同,數(shù)值變化也不同,可采用數(shù)據(jù)變化的方式來消除這些差異。數(shù)據(jù)變化方式主要有min-max歸一化和z-score歸一化。對(duì)第i維,第j個(gè)樣本的min-max歸一化和z-score歸一化分別如下:

        (1)

        (2)

        2.2 聚類過程

        經(jīng)過歸一化處理得到的特征數(shù)據(jù)仍擁有時(shí)間維度上的信息,直接將其載入到聚類算法進(jìn)行模式判別時(shí),依然會(huì)丟失數(shù)據(jù)點(diǎn)之間時(shí)間上的關(guān)聯(lián)性。為此,本文使用SDC算法進(jìn)行數(shù)據(jù)的決策聚類,得到最后的聚類結(jié)果。算法的主要步驟如下。

        (1)提取新的子序列樣本集。設(shè)置一個(gè)長度為w,步長為s的可變滑動(dòng)窗口(w>s+1)對(duì)多元時(shí)間序列進(jìn)行提取,得到新的子序列樣本集

        (3)檢測(cè)重疊區(qū)域的類別。子序列包含多個(gè)樣本點(diǎn),相同樣本點(diǎn)存在多種類別,將子序列重疊的區(qū)域分為O(k)={Oc(k)|k=1,2,…,m}[8],其中k表示重疊區(qū)域的序號(hào),c表示重疊區(qū)域所屬子序列樣本集被劃分的所有類別。如果c的數(shù)量只有一類,則無需決策;如果大于一類,則需決策該重疊區(qū)域的所屬類別。

        (4)決策重疊區(qū)域的所屬類別。將重疊區(qū)域所屬的子序列樣本集分為多類,對(duì)每個(gè)樣本集進(jìn)行均勻采樣,采樣數(shù)量為當(dāng)前重疊區(qū)域所含原樣本點(diǎn)數(shù),如果重疊區(qū)域過長,則分段決策,每段長度為步長s。分別求采樣集合和待決策重疊區(qū)域的平均值,將重疊區(qū)域所含數(shù)據(jù)點(diǎn)的類別決策為均值與該重疊區(qū)域均值最相近的樣本的類別。

        2.3 最終結(jié)果及評(píng)價(jià)

        時(shí)間序列的每個(gè)時(shí)間樣本點(diǎn)都得到類別標(biāo)簽后,從2個(gè)方面來評(píng)估聚類算法的聚類質(zhì)量,一是通過對(duì)得到的結(jié)果進(jìn)行反歸一化,得到各維度的類簇信息,計(jì)算各個(gè)類簇信息的均值,并與真實(shí)工況下均值進(jìn)行比較,兩者的差異用相對(duì)誤差來表示;二是通過一系列外部評(píng)價(jià)指標(biāo)[9]來評(píng)價(jià)聚類質(zhì)量,本文選取3個(gè)較為常見的指標(biāo),分別為F-指標(biāo)(F)、純度(P)、調(diào)整蘭德系數(shù)(A)。

        3 仿真實(shí)驗(yàn)與分析

        首先,采用本文提出的SDC算法和文獻(xiàn)[10]采用的層次聚類算法對(duì)采集到的相同光伏發(fā)電時(shí)間序列數(shù)據(jù)進(jìn)行聚類仿真,并與真實(shí)工況進(jìn)行對(duì)比;然后,比較分析當(dāng)前常用的層次聚類[10]、密度峰值聚類[11]、k-均值聚類[12]及本文算法的聚類外部評(píng)價(jià)指標(biāo)。

        3.1 實(shí)驗(yàn)數(shù)據(jù)采集及歸一化

        將自制的微型光伏發(fā)電系統(tǒng)置于晴朗的室外,在不同時(shí)間段設(shè)置4種工況,分別為正常(C1)、開路故障(C2)、全部遮陽(C3)、部分遮陽(C4)。對(duì)系統(tǒng)依次設(shè)置6段真實(shí)工況,分別為C1,C2,C1,C3,C1,C4,具體數(shù)據(jù)采集情況如表2所示。采集到光伏系統(tǒng)的原始數(shù)據(jù)X(t)∈R8×1 791,8個(gè)維度的數(shù)據(jù)分別為環(huán)境溫度T、輻照度G、光伏輸出電壓Vout、輸出電流Iout、逆變電壓Vtemp、逆變電流Itemp、負(fù)載電壓Vload、負(fù)載電流Iload,各個(gè)維度數(shù)據(jù)在6段真實(shí)工況的呈現(xiàn)如圖2所示。

        表2 不同工況的數(shù)據(jù)采集說明

        圖2 不同工況下,各維度原始數(shù)據(jù)

        根據(jù)圖2的原始數(shù)據(jù),在不同聚類數(shù)目K下,分別采用max-min歸一化和z-score歸一化進(jìn)行數(shù)據(jù)轉(zhuǎn)換,得到的卡林斯基-哈拉巴斯指標(biāo)(Calinski Harabasz,CH)[13]如圖3所示。

        圖3 不同聚類數(shù)目下,數(shù)據(jù)歸一化的CH指標(biāo)

        圖3中,CH值越大表示聚類數(shù)目更優(yōu)[13],因此,本文選擇min-max歸一化進(jìn)行仿真實(shí)驗(yàn)。

        3.2 子序列決策聚類結(jié)果與分析

        采用w=400,s=200的滑動(dòng)窗口對(duì)歸一化后的數(shù)據(jù)進(jìn)行提取,得到新的子序列樣本集,由式(1)可以得到此對(duì)參數(shù)下子序列個(gè)數(shù)q=8,對(duì)8段子序列進(jìn)行層次聚類。實(shí)驗(yàn)中,序列之間的相似度計(jì)算采用文獻(xiàn)[14]的針對(duì)不等長序列之間的歐式距離,鏈接方式為文獻(xiàn)[15]的平均鏈接,得到聚類樹和對(duì)應(yīng)子序列所屬類簇的決策如圖4所示。

        圖4 聚類樹及標(biāo)簽決策過程

        由圖4(a)可以看出,當(dāng)子序列樣本集被分為4類時(shí),子序列2~6歸為一類,其他3個(gè)子序列各為一類。當(dāng)標(biāo)簽完成決策后,得到如圖4(b)所示的標(biāo)簽分布。通過計(jì)算得到不同工況下每個(gè)維度各類簇的均值與真實(shí)工況的均值如表3所示。

        表3 不同工況下,各維度類簇均值與真實(shí)工況的比較

        3.3 不同聚類算法的判別結(jié)果

        為了比較各個(gè)維度數(shù)據(jù)在各個(gè)工況下相對(duì)誤差的準(zhǔn)確性,分別采用本文算法、與文獻(xiàn)[13]相同歸一化處理后的層次聚類算法進(jìn)行工況判別,得到4個(gè)類簇各維度的均值與真實(shí)工況的相對(duì)誤差如表4所示,其中的誤差1,誤差2,誤差3,誤差4分別表示算法得到的4個(gè)類簇與4種真實(shí)工況的相對(duì)誤差。

        表4 不同工況下,不同聚類算法各維度數(shù)據(jù)與真實(shí)工況的相對(duì)誤差 單位:%

        從表4可以看出,SDC算法得到的誤差結(jié)果中,相對(duì)誤差最高的是輸出電流這一維度數(shù)據(jù)的誤差1為15.01%,其余31組均在15%以下;層次聚類算法得到的結(jié)果中,輻照度這一維度數(shù)據(jù)的誤差2高達(dá)81.49%,同時(shí)其他大部分相對(duì)誤差也高于SDC算法;在27組數(shù)據(jù)中,本文提出的SDC算法均小于層次聚類算法,得到的類簇更接近真實(shí)工況。

        聚類的質(zhì)量往往通過聚類的外部評(píng)價(jià)指標(biāo)進(jìn)行衡量,外部評(píng)價(jià)指標(biāo)和相對(duì)誤差在一定程度上呈正相關(guān)。將文獻(xiàn)[10]的層次聚類算法、文獻(xiàn)[11]的密度峰值聚類算法、文獻(xiàn)[12]的k-均值算法和SDC算法的外部評(píng)價(jià)指標(biāo)進(jìn)行比較,結(jié)果如表5所示。

        表5 不同算法的外部評(píng)價(jià)指標(biāo)

        由表5可以看出,SDC算法的3個(gè)外部評(píng)價(jià)指標(biāo)都要高于層次聚類算法和密度峰值聚類算法,說明SDC算法的聚類質(zhì)量要優(yōu)于這2種算法。在A指標(biāo)上,k-均值聚類算法要高于SDC算法,但在F和P指標(biāo)下,SDC算法優(yōu)于k-均值算法。

        實(shí)驗(yàn)中,SDC算法將樣本集的結(jié)果標(biāo)簽分成4段,雖然與真實(shí)工況的6段不一致,但在沒有先驗(yàn)知識(shí)的情況下,和層次聚類算法相比,SDC算法得到的相對(duì)誤差更小。在與層次聚類算法、密度峰值聚類算法、k-均值算法的外部評(píng)價(jià)指標(biāo)對(duì)比中,SDC算法除了A指標(biāo)小于k-均值算法外,F(xiàn)和P指標(biāo)均為最大。所以,SDC算法得到的類簇更趨近于真實(shí)工況,其聚類質(zhì)量指標(biāo)有較大優(yōu)勢(shì),在本次光伏時(shí)間序列數(shù)據(jù)的工況分析實(shí)驗(yàn)中取得更理想的結(jié)果。

        4 結(jié)束語

        本文主要研究光伏時(shí)間序列數(shù)據(jù)的工況分析,提出一種子序列決策聚類算法。既克服了普通層次聚類在時(shí)間序列聚類上的弱點(diǎn),又改進(jìn)了子序列聚類標(biāo)簽決策過程,得到的類簇信息與真實(shí)工況的差異不大,實(shí)現(xiàn)了對(duì)光伏發(fā)電時(shí)間序列數(shù)據(jù)的工況判別。但是,本文通過實(shí)驗(yàn)得到的聚類為4段,真實(shí)工況為6段,可能是選取的2個(gè)滑動(dòng)窗口參數(shù)引起的。后續(xù)將針對(duì)窗口大小以及窗口步長的選擇展開進(jìn)一步研究,選擇最優(yōu)參數(shù),從而得到更好的聚類結(jié)果。

        猜你喜歡
        均值聚類決策
        為可持續(xù)決策提供依據(jù)
        決策為什么失誤了
        基于DBSACN聚類算法的XML文檔聚類
        均值不等式失效時(shí)的解決方法
        均值與方差在生活中的應(yīng)用
        基于改進(jìn)的遺傳算法的模糊聚類算法
        關(guān)于均值有界變差函數(shù)的重要不等式
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        對(duì)偶均值積分的Marcus-Lopes不等式
        自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
        亚洲色图三级在线观看| 亚洲精品成人av观看| 国产人成在线成免费视频| 亚洲国产综合人成综合网站| 无码小电影在线观看网站免费| 台湾佬综合网| 国产国拍亚洲精品永久69| 亚洲av色香蕉一区二区三区潮| 噜噜综合亚洲av中文无码| 亚洲成av人片在线观看无码| AV人人操| 亚洲av熟女少妇一区二区三区| 精品国产综合区久久久久久| 日日噜噜夜夜狠狠久久无码区| 成人午夜免费福利| 日本一区二区三区高清视| 牛牛在线视频| 人人狠狠综合久久亚洲婷婷| 日韩精品免费在线视频| 9久久婷婷国产综合精品性色| 中文无码熟妇人妻av在线| 97视频在线观看免费| 国产麻豆成人精品av| 久久天天躁狠狠躁夜夜av浪潮| 国产xxxx99真实实拍| 在线观看av国产自拍| 中文字幕亚洲五月综合婷久狠狠| 日本成本人片免费网站| 精品乱码一区二区三区四区| 啪啪视频免费看一区二区| 精品少妇一区二区av免费观看| 性欧美牲交xxxxx视频欧美| 亚洲tv精品一区二区三区| 中文字幕文字幕一区二区 | 精品国产制服丝袜高跟| 久草视频华人在线观看| 日本一级特黄aa大片| 欧美两根一起进3p做受视频| 天堂69亚洲精品中文字幕| 久久中文字幕亚洲综合| 国产网红主播无码精品|