亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于K 均值聚類算法的電源運行狀態(tài)數(shù)據(jù)分析

        2022-04-01 11:33:48張鴻雁
        電聲技術(shù) 2022年1期
        關(guān)鍵詞:方法

        張鴻雁

        (晉中學(xué)院 信息技術(shù)與工程系,山西 晉中 030619)

        0 引言

        聚類是一個過程,就是把一個大的數(shù)據(jù)劃分成多個類簇,同一類別中的數(shù)據(jù)互相相似,而不同類別的數(shù)據(jù)會有較大的不同。K 均值聚類算法是當前數(shù)據(jù)分析最常使用的方法,特點是算法操作簡單,適用于大規(guī)模的數(shù)據(jù)采集和結(jié)果分析[1]。在如今大數(shù)據(jù)信息時代下,對電力信息的數(shù)據(jù)分析也越來越重要,它能夠?qū)υS多行業(yè)形成產(chǎn)業(yè)鏈結(jié)構(gòu),加速經(jīng)濟的發(fā)展[2]。基于聚類算法的優(yōu)勢,將其應(yīng)用于電源運行狀態(tài)數(shù)據(jù)分析中,通過對電源運行狀態(tài)數(shù)據(jù)的分類與分析,更有利于掌握電源運行狀態(tài)。

        1 電源運行狀態(tài)數(shù)據(jù)分析

        1.1 采集電源運行狀態(tài)數(shù)據(jù)樣本

        采集數(shù)據(jù)樣本是電源運行狀態(tài)分析的前提,采集的數(shù)據(jù)樣本質(zhì)量對分析結(jié)果有著至關(guān)重要的影響。電源運行狀態(tài)數(shù)據(jù)采集系統(tǒng)平均15 min 會采集一次數(shù)據(jù),根據(jù)系統(tǒng)內(nèi)采集到的數(shù)據(jù)信息,進行簡單的數(shù)據(jù)分析。但在電力信息系統(tǒng)里,不可能所有的信息都能在樣本里出現(xiàn),采集和運輸過程會受到多個因素的影響,可能造成異常數(shù)據(jù)。

        1.2 電源運行樣本數(shù)據(jù)清洗

        數(shù)據(jù)樣本采集完成后,需要對缺失的數(shù)據(jù)值進行處理。需要找到缺失值所對應(yīng)的時間,根據(jù)前后兩天同一時間內(nèi)的前后兩組數(shù)據(jù),在大數(shù)據(jù)庫里找到與缺失樣本最為相似的樣本,根據(jù)電源運行狀態(tài)樣本數(shù)據(jù)的平均值、中值或是眾數(shù),進行變量模擬,來預(yù)測缺失的數(shù)據(jù)。這樣能夠保證缺失的數(shù)據(jù)盡可能地接近真實的數(shù)據(jù)[3-5]。補充好缺失數(shù)值,調(diào)整好異常噪聲數(shù)據(jù)后,將所有采集的數(shù)據(jù)樣本做好統(tǒng)一,將不同時間段、不同數(shù)據(jù)庫源的數(shù)據(jù)進行整合,也就是歸一化處理[6-8]。

        1.3 電源運行狀態(tài)數(shù)據(jù)歸一化處理

        采集的電源運行狀態(tài)數(shù)據(jù)大多數(shù)來自不同的數(shù)據(jù)庫,文件和時間不盡相同,因此需要對數(shù)據(jù)進行集合。然而,由于同一屬性的數(shù)據(jù)在不同數(shù)據(jù)庫中會存在不同的名字,往往在數(shù)據(jù)集合時會存在差別數(shù)據(jù),會降低數(shù)據(jù)集合的準確率[9]。對于出現(xiàn)的問題通常使用歸一化進行處理,以防量綱的差異對數(shù)據(jù)分析結(jié)果造成影響。具體方法是,通過最小-最大法計算出標準化離差,將處理后的數(shù)據(jù)進行標準差計算,將數(shù)據(jù)標準差控制在1 即可。最小-最大法計算需要將數(shù)據(jù)中映射在[0,1]之間,具體的轉(zhuǎn)換公式如下:

        式中:樣本數(shù)據(jù)最小值用min 表示,樣本數(shù)據(jù)最大值用max 表示,樣本數(shù)據(jù)用y表示。計算出離差后,通過標準化標準差,使得處理后的數(shù)據(jù)的標準差為1,轉(zhuǎn)化的數(shù)據(jù)公式為:

        數(shù)據(jù)處理完成后,可以將樣本數(shù)據(jù)進行點對點連接,構(gòu)成數(shù)據(jù)曲面,來表示一段時間內(nèi)的運行數(shù)據(jù)情況走向,方便K均值聚類算法劃分數(shù)據(jù)[10]。根據(jù)某用戶24 小時之內(nèi)的部分時間用電量的變化情況,進行歸一化處理。

        1.4 基于K 均值聚類算法劃分電源運行狀態(tài)數(shù)據(jù)

        由于電源運行狀態(tài)數(shù)據(jù)樣本較大,數(shù)據(jù)分析過程耗時較久,準確性低,因此用K均值聚類算法對狀態(tài)數(shù)據(jù)進行分組,將具有同一特征的電源運行狀態(tài)數(shù)據(jù)聚集到一組內(nèi)。假設(shè)設(shè)定一個整數(shù)K點和一個具有n個數(shù)據(jù)的相關(guān)的樣本集G={g1,g2,g3,…,gn},該設(shè)定目標是選擇k個聚類中心Fi(i=1,2,…,k),直到所選數(shù)據(jù)不會發(fā)生任何變化,或者簇的中心點不會發(fā)生變化,使目標函數(shù)M達到最小,其中目標函數(shù)M的計算公式為:

        式中:M代表目標函數(shù);G代表樣本集;Fi代表每一個聚類中心。

        算法的基本思想是在n個數(shù)據(jù)樣本中,挑選一個隨機的K作為初始中心,將數(shù)據(jù)集中,其他的樣本向中心聚攏,劃分到選取的k個中心當中,距離中心的最近點所屬的類中,會形成k個初始的聚類簇。對每一個聚類簇加以計算,重新分布到新的類簇中,根據(jù)新獲得的聚類中心重新分配數(shù)據(jù),不斷地進行代換,直到數(shù)據(jù)不再變化,或者簇的中心點不再變化即可。具體步驟如下:

        (1)隨機選取K個數(shù)據(jù)點作為初始類簇中心;

        (2)計算每一個樣本和設(shè)定的這些k簇中心的距離s,公式為:

        式中:s表示每個樣本到k簇的距離,ga表示樣本集的每一個數(shù)據(jù),fb表示聚類中心的每一個數(shù)值。將樣本按照a=1,2,…,n,b=1,2,…,k的順序依次計算,計算公式為:

        式中:ga表示樣本集的每一個數(shù)據(jù),fb表示聚類中心的每一個數(shù)值。如果滿足式(5),則樣本集G∈F,如不滿足則重新計算,直到樣本數(shù)據(jù)與K值中心點數(shù)值達到最小。

        將選取的電源運行狀態(tài)數(shù)據(jù)樣本進行初始分類,計算樣本數(shù)量和以K值為中心的類簇距離,得出類簇中心點,迭代輸入。當?shù)竭_最小K值時,觀察中心位置是否有變化,如果沒有,輸出結(jié)果即可。若達到最小K值,但中心位置仍有變化,則重新計算,直到?jīng)]有變化為止,輸出結(jié)果,由此完成電源運行狀態(tài)數(shù)據(jù)分析。

        2 實驗論證結(jié)果

        為了驗證本文設(shè)計的分析方法能夠提高數(shù)據(jù)分析的準確率,通過對照實驗,檢驗新設(shè)計方法對電源運行狀態(tài)數(shù)據(jù)分析的有效性。在選取的樣本中,在第12 min、第33~36 min、第48 min、第63 min 和第65 min 時,樣本數(shù)據(jù)存在空白數(shù)據(jù),因此在對電源運行狀態(tài)數(shù)據(jù)分析時會存在相對誤差,影響分析結(jié)果。下面通過傳統(tǒng)方法和本文設(shè)計方法作比較,分析兩種方法的準確性,以此論證文中方法對電源運行狀態(tài)數(shù)據(jù)分析準確性的影響。

        在實驗前,先通過傳統(tǒng)方法和本文設(shè)計方法分別對數(shù)據(jù)樣本進行數(shù)據(jù)分散,在隨機給出橫縱坐標(x,y)(0 <x<10,0 <y<10)的情況下,生成樣本分布圖進行數(shù)據(jù)分析,測試兩種方法的準確率,分析結(jié)果如圖1 所示。

        圖1 電源運行狀態(tài)數(shù)據(jù)分析結(jié)果

        如圖1 所示,將所選取的數(shù)據(jù)樣本通過傳統(tǒng)方法和本文方法進行分析,傳統(tǒng)方法的樣本特別分散,且在空白數(shù)據(jù)的地方存在重疊,空白數(shù)據(jù)只能用鄰近數(shù)值代替,尋找不到中心數(shù)據(jù)。而本文設(shè)計方法的樣本數(shù)據(jù)分散基本在2 <x<8,2 <y<7中,中心K值為6,能夠通過鄰近數(shù)值模擬出空白數(shù)據(jù),完整表達樣本數(shù)據(jù)。結(jié)合樣本數(shù)據(jù)的分析結(jié)果,將數(shù)據(jù)樣本中的數(shù)據(jù)值進行10 次模擬實驗,測試結(jié)果的準確性。表2 是通過上述公式得到的10組測試結(jié)果。

        表2 兩種方法對分析電源運行狀態(tài)數(shù)據(jù)的準確率測試結(jié)果

        由表2 可以看出,新的設(shè)計方法對于分析電源運行狀態(tài)數(shù)據(jù)的結(jié)果準確率更高,分析結(jié)果更優(yōu)。

        3 結(jié)語

        本文運用K 均值聚類算法研究電源運行狀態(tài)數(shù)據(jù)的分析方法,對比傳統(tǒng)設(shè)計方法,通過K 均值聚類算法,研究電源運行狀態(tài)數(shù)據(jù)的分析方法,建立出一套新的數(shù)據(jù)分析方法,為電源運行狀態(tài)數(shù)據(jù)分析提供理論基礎(chǔ)。該設(shè)計方法能夠在電源運行狀態(tài)數(shù)據(jù)分析中提高數(shù)據(jù)準確率。

        猜你喜歡
        方法
        中醫(yī)特有的急救方法
        中老年保健(2021年9期)2021-08-24 03:52:04
        高中數(shù)學(xué)教學(xué)改革的方法
        河北畫報(2021年2期)2021-05-25 02:07:46
        化學(xué)反應(yīng)多變幻 “虛擬”方法幫大忙
        變快的方法
        兒童繪本(2020年5期)2020-04-07 17:46:30
        學(xué)習方法
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        最有效的簡單方法
        山東青年(2016年1期)2016-02-28 14:25:23
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        国产成人色污在线观看| 免费观看黄网站| 国产在线观看入口| 国产三级国产精品三级在专区 | 亚洲国产精品成人一区二区在线| 欧美性猛交xxxx乱大交极品| a级毛片免费观看网站| 免费无码又爽又刺激高潮的视频网站| 亚洲国产一区二区精品| 国产亚洲视频在线播放| 亚洲日韩精品无码专区网站| 综合色久七七综合尤物| 日本加勒比一区二区在线观看| 亚洲免费观看视频| 成人区人妻精品一熟女| 日韩欧美国产亚洲中文| 在线视频精品少白免费观看| 成人无码一区二区三区| 天躁夜夜躁狼狠躁| 免费无码又爽又刺激又高潮的视频| 亚洲一区免费视频看看| 无码专区亚洲综合另类| 小12箩利洗澡无码视频网站| 97碰碰碰人妻视频无码| 亚洲综合日韩一二三区| 波多野42部无码喷潮| 伊人久久亚洲综合影院首页 | 一区二区三区四区中文字幕av| 国产美女精品一区二区三区| 97欧美在线| 日本中文字幕人妻精品| 极品粉嫩嫩模大尺度无码视频 | 久久久人妻丰满熟妇av蜜臀| 亚洲2022国产成人精品无码区| 黄色视频免费在线观看| 午夜无码亚| 日本一区二区在线高清| 曰韩人妻无码一区二区三区综合部 | 丝袜人妻无码中文字幕综合网 | 精品丝袜国产在线播放| 91偷拍与自偷拍亚洲精品86|