亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于同期線損系統(tǒng)數(shù)據(jù)挖掘技術(shù)的低壓臺(tái)區(qū)線損診斷模型

        2018-03-12 10:00:32

        (國網(wǎng)重慶市電力公司 北碚供電分公司,重慶 400700)

        線損指的是以熱能形式散發(fā)的能量損失,是電網(wǎng)電能損耗的簡稱[1],是電能從發(fā)電廠傳輸?shù)诫娏τ脩暨^程中,在輸電、變電、配電和營銷各環(huán)節(jié)中所產(chǎn)生的電能損耗[2],包括有功損耗、無功損耗和電壓損失,一般指有功損耗。線損按照性質(zhì)分為技術(shù)線損(理論線損)和管理線損[3-8],技術(shù)線損是通過理論計(jì)算公式計(jì)算出來的線損,管理線損無法通過理論計(jì)算得到。隨著社會(huì)經(jīng)濟(jì)的發(fā)展,低壓臺(tái)區(qū)的線損成為一個(gè)突出的問題[9]。目前低壓臺(tái)區(qū)線損一般采用理論計(jì)算,經(jīng)典的低壓網(wǎng)線損理論計(jì)算方法主要有等值電阻法[10-13]、竹節(jié)法[10-14]、前推回代法[13]、電壓損失率法[13-14]、臺(tái)區(qū)損失率法[14]等。

        傳統(tǒng)的理論線損計(jì)算雖然方法簡單,但是需要網(wǎng)絡(luò)參數(shù),從低壓臺(tái)區(qū)中獲得所需要的全部參數(shù)比較困難,而且理論計(jì)算法本身的假設(shè)條件與實(shí)際情況不符,沒有考慮低壓網(wǎng)的特征,再加上低壓網(wǎng)供電方式多樣,所以理論線損計(jì)算出的線損值精度不高。另外,在低壓臺(tái)區(qū)中三相不平衡供電時(shí)[15],線損計(jì)算的誤差較大,不能反映實(shí)際的線損,因此傳統(tǒng)理論線損計(jì)算雖然在一定條件下具有一定實(shí)用性,但是沒有代表性,適用范圍不廣。

        現(xiàn)代智能算法的引入,提高了線損計(jì)算的準(zhǔn)確度,也在一定程度上提高了線損計(jì)算的可信度,但是在低壓臺(tái)區(qū)線損計(jì)算中的應(yīng)用還不夠成熟。此外,智能算法本身也有一定的缺點(diǎn),需要進(jìn)一步研究。近年來有許多新方法用于線損計(jì)算中:采用粒子群優(yōu)化支持向量回歸機(jī)[16]在提高線損計(jì)算精度的同時(shí)也提高了計(jì)算速度,但是該算法依賴于參數(shù)對(duì)的選取,實(shí)用性有待驗(yàn)證;遺傳算法和神經(jīng)網(wǎng)絡(luò)結(jié)合[17-19]用于線損計(jì)算,需要建立學(xué)習(xí)樣本不斷訓(xùn)練,容易陷入局部最優(yōu)點(diǎn),而且訓(xùn)練時(shí)間長,計(jì)算精度沒有較大提高,神經(jīng)網(wǎng)絡(luò)算法本身也會(huì)產(chǎn)生過擬合的問題,因而通用性不強(qiáng),在實(shí)際運(yùn)用中也存在困難。

        本文將數(shù)據(jù)挖掘的理念引入到臺(tái)區(qū)線損管理中,以大數(shù)據(jù)在電力系統(tǒng)中的應(yīng)用為背景,以用電信息采集系統(tǒng)采集到的用戶用電數(shù)據(jù)為對(duì)象,在篩選出穩(wěn)定臺(tái)區(qū)的前提下,針對(duì)穩(wěn)定臺(tái)區(qū),采用數(shù)據(jù)挖掘的方法研究臺(tái)區(qū)線損。首先將穩(wěn)定臺(tái)區(qū)用戶用電信息進(jìn)行預(yù)處理,按照樣本分布將樣本分區(qū);然后針對(duì)分區(qū)樣本進(jìn)行主成分分析(PCA),對(duì)分析后的各分區(qū)穩(wěn)定臺(tái)區(qū)進(jìn)行K-means聚類分析,分析傳統(tǒng)K-means算法的缺點(diǎn),并進(jìn)行改進(jìn),同時(shí)為了在大數(shù)據(jù)采集情況下,能夠快速給出最佳聚類數(shù),采用并行計(jì)算的方法計(jì)算輪廓系數(shù);完成聚類分析后,針對(duì)每一類樣本進(jìn)行多元線性回歸建模,不僅可以得到直觀簡潔的模型,而且可以分析影響因子對(duì)線損率的影響,預(yù)測臺(tái)區(qū)線損并給出臺(tái)區(qū)合理線損的范圍,定位線損不合理臺(tái)區(qū),實(shí)現(xiàn)臺(tái)區(qū)線損精細(xì)化管理的目標(biāo)。

        1 穩(wěn)定臺(tái)區(qū)

        為了減少非主要因素的干擾,提高分析臺(tái)區(qū)線損影響因素及其影響系數(shù)的精確度,便于整個(gè)研究工作的展開,首先對(duì)相關(guān)數(shù)據(jù)進(jìn)行預(yù)處理,建立穩(wěn)定臺(tái)區(qū)的概念。

        穩(wěn)定臺(tái)區(qū)指用電采集系統(tǒng)內(nèi)日、月線損數(shù)據(jù)趨于穩(wěn)定,能真實(shí)反映當(dāng)前實(shí)際線損情況的臺(tái)區(qū)?;跔I銷業(yè)務(wù)系統(tǒng)的臺(tái)區(qū)檔案信息,結(jié)合年度的日、月線損數(shù)據(jù),按照一定的規(guī)則進(jìn)行篩選。穩(wěn)定臺(tái)區(qū)的判定步驟如下。

        步驟1:以用電信息采集系統(tǒng)采集到的數(shù)據(jù)為基數(shù),剔除以下臺(tái)區(qū),如采集未全覆蓋;含光伏發(fā)電用戶、無表計(jì)量用戶等特殊用戶;當(dāng)月發(fā)生業(yè)務(wù)變更,如考核單元對(duì)象發(fā)生變化、戶變關(guān)系調(diào)整、用戶業(yè)務(wù)變更(換表除外);月均線損率超出(-1%~10%)范圍以及日線損率超出(-1%~10%)范圍的天數(shù)多于10天。

        步驟2:以步驟1中剩余單元為基數(shù),計(jì)算每個(gè)臺(tái)區(qū)的日線損波動(dòng)率σ,并且作出σ的分布圖,求取70%總臺(tái)區(qū)數(shù)時(shí)對(duì)應(yīng)的σ值設(shè)為φ,其中σ的計(jì)算公式為

        (1)

        式中:N是該臺(tái)區(qū)當(dāng)月線損的可用天數(shù),即除去日用戶計(jì)算參與率不為100%的天數(shù),除去日線損率超出(-1%~10%)范圍的天數(shù);θ為日線損率。

        步驟3:以步驟1中剩余單元為基數(shù),剔除日線損波動(dòng)率σ大于波動(dòng)閾值φ的臺(tái)區(qū),再剔除θ超出月均線損率±φ范圍的數(shù)據(jù),即為穩(wěn)定臺(tái)區(qū)數(shù)據(jù)。

        穩(wěn)定臺(tái)區(qū)分區(qū)后共分為14個(gè)子區(qū),分區(qū)過程如圖1所示。

        圖1穩(wěn)定臺(tái)區(qū)

        綜上,穩(wěn)定臺(tái)區(qū)分為14個(gè)分區(qū):城區(qū)居民低檔型、城區(qū)居民中檔型、城區(qū)居民高檔型、城區(qū)非居民臺(tái)區(qū)、城區(qū)混合低負(fù)荷型、城區(qū)混合中負(fù)荷型、城區(qū)混合高負(fù)荷型、農(nóng)網(wǎng)居民低檔型、農(nóng)網(wǎng)居民中檔型、農(nóng)網(wǎng)居民高檔型、農(nóng)網(wǎng)非居民臺(tái)區(qū)、農(nóng)網(wǎng)混合低負(fù)荷型、農(nóng)網(wǎng)混合中負(fù)荷型、農(nóng)網(wǎng)混合高負(fù)荷型。

        2 分區(qū)數(shù)據(jù)主成分分析(PCA)

        為解決分區(qū)數(shù)據(jù)各維度之間的相關(guān)性造成的相互影響和冗余,采用主成分分析(PCA)對(duì)分區(qū)后的數(shù)據(jù)進(jìn)行處理。

        PCA的主要步驟如下:

        1)樣本歸一化;

        2)計(jì)算協(xié)方差矩陣的特征根及與特征根對(duì)應(yīng)的正交化的單位特征向量;

        3)計(jì)算累計(jì)貢獻(xiàn)率,確定主成分;

        4)計(jì)算主成分得分。

        分區(qū)樣本完成主成分分析后,得到的各主元相互獨(dú)立,使得分析問題的維度減少,又能夠保持原有數(shù)據(jù)的絕大部分信息。

        3 分區(qū)數(shù)據(jù)聚類分析與線損預(yù)測模型

        3.1 K-means原理

        隨著用電信息采集系統(tǒng)的日益完善,可以采集到用戶大量的用電數(shù)據(jù),因此選擇的聚類方法,要求不僅在信息量不大時(shí)能夠快速準(zhǔn)確地聚類,更重要的是能夠適應(yīng)數(shù)據(jù)量增大的需求,能夠及時(shí)快速地輸出聚類結(jié)果。由于K-means算法可以處理大數(shù)據(jù)集[20],具有很好的可伸縮性和很高的效率,簡單快速[21],能夠適應(yīng)數(shù)據(jù)量增長的實(shí)時(shí)性處理的需求,廣泛地運(yùn)用在大規(guī)模數(shù)據(jù)聚類中,因此本文選取K-means算法對(duì)樣本進(jìn)行聚類。但是K-means算法依賴于初始聚類中心的選取[22],聚類質(zhì)量受噪聲的影響較大,初始聚類中心往往影響聚類結(jié)果的好壞;K-means算法是基于梯度下降的算法,具有貪心性;此外,K-means算法需要給定聚類數(shù)。這些缺點(diǎn)很大程度上限制了K-means算法的使用,因此,本文針對(duì)上述缺點(diǎn),對(duì)K-means算法進(jìn)行優(yōu)化,然后運(yùn)用改進(jìn)后的算法對(duì)主成分分析的結(jié)果進(jìn)行聚類分析。

        經(jīng)典的K-means算法步驟如下。

        1)確定聚類數(shù)目N和最大迭代次數(shù)M。

        2)在樣本中任選N個(gè)對(duì)象,作為初始聚類中心。

        3)計(jì)算樣本到N個(gè)對(duì)象之間的歐式距離,按照歐式距離的大小,將樣本歸類。歐式距離定義為

        (2)

        式中:xik表示第k個(gè)樣品的第i個(gè)變量的觀測值;p表示樣本數(shù);dij表示樣本j與樣本i之間的歐式距離。

        4)計(jì)算各類對(duì)象的平均值,更新聚類中心。

        5)計(jì)算平方誤差準(zhǔn)則函數(shù),判別是否滿足收斂條件,如果收斂,則算法結(jié)束;如果不收斂,判斷迭代次數(shù)是否大于M,如果小于M,則轉(zhuǎn)第三步,否則算法結(jié)束。平方誤差準(zhǔn)則函數(shù)為

        (3)

        式中:E表示所有對(duì)象的平方誤差和;xq表示聚類樣本;Ci表示第i個(gè)類;mi是Ci中對(duì)象的均值;nCi表示Ci中對(duì)象的數(shù)目。

        6)輸出聚類結(jié)果。

        3.2 聚類質(zhì)量評(píng)價(jià)指標(biāo)

        聚類的有效性可以從類間距離和類中距離兩個(gè)方面來衡量,類中距離意味著同類樣本的凝聚度,類間距離意味著不同類之間的分離度,因此一個(gè)好的聚類結(jié)果,應(yīng)該滿足類間距離大,類中距離小,這樣同一類中的相似性越大,不同類中樣本的差異性越大。輪廓系數(shù)是綜合反映類中相似性和類間差異性的指標(biāo)[23],因此可以用輪廓系數(shù)評(píng)價(jià)聚類質(zhì)量,確定合理的聚類數(shù)。輪廓系數(shù)S定義為

        (4)

        式中:n表示樣本總數(shù);si表示樣本i的輪廓系數(shù);其定義為

        (5)

        式中:xi表示類x中第i個(gè)樣本與類x中其他樣本的距離平均值,表征類中凝聚度;計(jì)算xi與除類x之外其余所有類中樣本距離的平均值,并記yi為該平均值的最小值。

        顯然si和S值都在[-1,1]之間,值越大,聚類質(zhì)量越高。本文將利用輪廓系數(shù)來衡量聚類質(zhì)量,根據(jù)輪廓系數(shù)的值,選取最優(yōu)的聚類數(shù)。

        3.3 K-means聚類算法優(yōu)化

        3.3.1 去噪聲點(diǎn)

        樣本點(diǎn)中噪聲點(diǎn)的數(shù)量遠(yuǎn)遠(yuǎn)少于非噪聲數(shù)據(jù)量,但是對(duì)于多維數(shù)據(jù)集,噪聲點(diǎn)到聚類中心的距離與誤差平方和(SSE)有95%的相關(guān)性[24],噪聲點(diǎn)遠(yuǎn)離正常樣本點(diǎn),影響算法迭代過程中的聚類中心,增加K-means算法收斂的迭代次數(shù),聚類結(jié)果會(huì)偏離實(shí)際,影響聚類結(jié)果穩(wěn)定性,因此運(yùn)用K-means算法前應(yīng)將噪聲點(diǎn)剔除,以提高聚類質(zhì)量。

        為了能夠快速簡潔地剔除噪聲點(diǎn),基于樣本實(shí)際特征,采用樣本均值歐式距離法剔除噪聲點(diǎn)。具體的方法如下,首先計(jì)算出樣本的均值,然后計(jì)算所有樣本與均值點(diǎn)的歐式距離,并按歐式距離從小到大對(duì)樣本點(diǎn)重新編號(hào),顯然,編號(hào)較大且距離值變化迅速的點(diǎn)就是噪聲點(diǎn)。

        3.3.2 并行計(jì)算

        近年來隨著計(jì)算機(jī)技術(shù)的發(fā)展,多核心CPU的普及為計(jì)算的快速性提供可能,利用并行計(jì)算[26]技術(shù)可以提高計(jì)算快速性和響應(yīng)實(shí)時(shí)性。并行計(jì)算的思想是將待求解的問題分為若干部分,每部分由一個(gè)獨(dú)立CPU核心來處理。

        在進(jìn)行輪廓系數(shù)計(jì)算時(shí),各個(gè)樣本個(gè)體輪廓系數(shù)的計(jì)算相互獨(dú)立,不需要順序執(zhí)行,此外計(jì)算每一個(gè)類樣本的個(gè)體輪廓系數(shù)也是相互獨(dú)立的。當(dāng)樣本聚為n類時(shí),采用并行計(jì)算技術(shù)計(jì)算每類的個(gè)體輪廓系數(shù),最后再計(jì)算所有類樣本個(gè)體輪廓系數(shù)均值,得到聚為n類時(shí)的聚類輪廓系數(shù)。

        3.4 線損預(yù)測模型

        現(xiàn)代人工智能算法已在許多方面得到了廣泛運(yùn)用,例如神經(jīng)網(wǎng)絡(luò)、遺傳算法、粒子群算法、蟻群算法等成功運(yùn)用在許多領(lǐng)域,并取得很好的效果。雖然這些算法建立的模型預(yù)測精度高,但是泛化能力不強(qiáng),而且模型的可解釋性也不強(qiáng)。為了能夠直觀得出線損與影響因子之間的關(guān)系,最簡單有效的方法是采用線性回歸,這樣能夠得出直接的回歸方程,確定線損與影響因子之間的關(guān)系,從而能夠?yàn)榻档途€損提供思路,簡單實(shí)用。

        多元線性回歸是多元統(tǒng)計(jì)分析中的一個(gè)重要方法,被廣泛應(yīng)用于社會(huì)、經(jīng)濟(jì)、技術(shù)以及眾多自然科學(xué)領(lǐng)域的研究中[27],其數(shù)學(xué)模型為

        y=β1x1+β2x2+…+βkxk+β0+ε

        (6)

        式中:β0為常數(shù)項(xiàng);β1,β2,…,βk為回歸系數(shù);ε為隨機(jī)誤差,且服從N(0,σ2)。最小二乘法在誤差平方和為

        (7)

        最小的情況下,求回歸系數(shù)的估計(jì)量,代入式(6)得回歸方程

        (8)

        3.5 算法基本流程

        根據(jù)特征類似的臺(tái)區(qū)擁有較為接近的線損率的原則,本文算法模型實(shí)際包含K-means聚類與線性回歸2個(gè)部分。通過K-means聚類按照與臺(tái)區(qū)線損率相關(guān)的基本特征屬性分為K類,然后將每一類數(shù)據(jù)分別建立各自的線性回歸模型,通過回歸模型代入對(duì)應(yīng)臺(tái)區(qū)特征數(shù)據(jù),得到預(yù)測的臺(tái)區(qū)線損率,定義為合理線損率。合理線損與實(shí)際線損之差即為預(yù)測誤差。算法的基本流程如圖2所示。

        圖2 基于K-means值聚類的流程圖

        4 結(jié)論

        為提高線損預(yù)測模型的預(yù)測準(zhǔn)確性和實(shí)用性,剔除不確定因素,篩選出穩(wěn)定臺(tái)區(qū),將穩(wěn)定臺(tái)區(qū)細(xì)分為14個(gè)分區(qū):城區(qū)低檔居民型、城區(qū)中檔居民型、城區(qū)高檔居民型、城區(qū)非居民臺(tái)區(qū)、城區(qū)低負(fù)荷混合型、城區(qū)中負(fù)荷混合型、城區(qū)高負(fù)荷混合型、農(nóng)網(wǎng)低檔居民型、農(nóng)網(wǎng)中檔居民型、農(nóng)網(wǎng)高檔居民型、農(nóng)網(wǎng)非居民臺(tái)區(qū)、農(nóng)網(wǎng)低負(fù)荷混合型、農(nóng)網(wǎng)中負(fù)荷混合型、農(nóng)網(wǎng)高負(fù)荷混合型。

        在穩(wěn)定臺(tái)區(qū)劃分的基礎(chǔ)上,針對(duì)各分區(qū)采用主元分析,降低穩(wěn)定臺(tái)區(qū)用電信息樣本維度并剔除冗余信息;各分區(qū)得到主元后,考慮計(jì)算的實(shí)時(shí)性,采用K-means算法對(duì)各分區(qū)主元信息聚類進(jìn)行分析??紤]到K-means算法聚類質(zhì)量受噪聲點(diǎn)影響較大,初始聚類中心的選取影響聚類結(jié)果,最佳聚類數(shù)無法確定,同時(shí)為滿足在大數(shù)據(jù)集情況下計(jì)算的實(shí)時(shí)性的要求,對(duì)K-means算法進(jìn)行了優(yōu)化。利用優(yōu)化后的K-means算法對(duì)各分區(qū)樣本進(jìn)行聚類分析,然后利用多元線性回歸方法建立各分區(qū)的線損預(yù)測模型,在得到線損直觀表達(dá)式的同時(shí),也可以為降低線損提供思路。

        国产一区二区三区激情视频| 中文岛国精品亚洲一区| 亚洲女同系列高清在线观看| 91精品人妻一区二区三区水蜜桃| 久久人人爽av亚洲精品| 无码粉嫩虎白一线天在线观看| 日韩国产成人精品视频| 成年女人18毛片观看| 性人久久久久| 大肉大捧一进一出好爽视色大师 | 成人aaa片一区国产精品| 中文幕无线码中文字蜜桃| 人妻熟女一区二区三区app下载 | 亚洲精品www久久久久久| 国产精品白浆一区二小说| 国产精品玖玖资源站大全| 一级黄色一区二区三区| 国产又色又爽又高潮免费视频麻豆 | 免费人成黄页网站在线一区二区| 男人和女人做爽爽视频| 天天影视色香欲综合久久| 黄片在线观看大全免费视频| 手机在线看片国产人妻| 亚洲国产精品ⅴa在线观看| 日本污视频| 一区二区三区黄色一级片| 成人无码一区二区三区| 亚洲人成网7777777国产| 欧美xxxxx精品| 白白色发布的在线视频| 久久久www成人免费精品| 精品国产一区二区三区AV小说| 亚洲精品中文字幕乱码三区99| 久久亚洲精品国产亚洲老地址| 欧美成a人片在线观看久| 国产精品女同久久久久久| 亚洲人成网站色在线入口口| 亚洲成av人在线观看天堂无码| 精品国产三级a| 亚洲精品一区二区网站| 亚欧美日韩香蕉在线播放视频|