亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        居民用戶用電的聚類分析

        2016-06-20 07:17:21徐苒茨黃珉皓
        電力與能源 2016年2期
        關(guān)鍵詞:數(shù)據(jù)挖掘

        張 進(jìn),徐苒茨,徐 健,黃珉皓

        (1.國網(wǎng)上海市電力公司浦東供電公司,上?!?00122;2.復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,上海 201203;3.網(wǎng)絡(luò)信息安全審計(jì)與監(jiān)控教育部工程研究中心,201203;4.上海東捷建設(shè)(集團(tuán))有限公司,上?!?01203)

        ?

        居民用戶用電的聚類分析

        張進(jìn)1,徐苒茨2,3,徐健4,黃珉皓4

        (1.國網(wǎng)上海市電力公司浦東供電公司,上海200122;2.復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,上海201203;3.網(wǎng)絡(luò)信息安全審計(jì)與監(jiān)控教育部工程研究中心,201203;4.上海東捷建設(shè)(集團(tuán))有限公司,上海201203)

        摘要:認(rèn)為新一輪的用電增長引發(fā)的問題和矛盾嚴(yán)重威脅到電力系統(tǒng)的安全運(yùn)營。電力部門必須加強(qiáng)對于用電情況的分析和預(yù)測,妥善地規(guī)劃電力系統(tǒng)的建設(shè)和發(fā)展。居民用戶是用電群體中最具代表性和規(guī)律性的一類,針對這些問題和矛盾,提出了對居民用電情況進(jìn)行分析。而在分析過程中,采用了聚類算法。實(shí)驗(yàn)結(jié)果表明居民用戶用電存在明細(xì)的規(guī)律,并總結(jié)出了規(guī)律性的結(jié)論。

        關(guān)鍵詞:負(fù)荷分析;用電分析;數(shù)據(jù)挖掘;聚類分析

        近年來,隨著改革開放的進(jìn)一步深化,企業(yè)數(shù)量大大增加,居民生活質(zhì)量得到了長足進(jìn)步,從而導(dǎo)致了新一輪的用電增長。與此同時(shí),國內(nèi)還長期面臨著電網(wǎng)最大負(fù)荷逐年快速增長,谷峰差增大,負(fù)荷率持續(xù)下降,高峰期電力供應(yīng)緊張等一系列問題,這給電網(wǎng)安全運(yùn)營造成了很大的威脅。為應(yīng)對這些情況帶來的挑戰(zhàn),首先,電力部門要保證電力出力足夠,盡量滿足最大負(fù)荷的需求;其次,電力部門必須要準(zhǔn)確地預(yù)測各地區(qū)各區(qū)域的用電峰谷,制定高效的發(fā)電、輸電計(jì)劃,合理地規(guī)劃電力系統(tǒng)的建設(shè)。當(dāng)然,這些工作的順利進(jìn)行離不開詳細(xì)、全面的負(fù)荷分析。本文沒有采用傳統(tǒng)的統(tǒng)計(jì)學(xué)分析方法,而是使用了更高效、更深入的數(shù)據(jù)挖掘分析方法。通過對居民用戶的用電數(shù)據(jù)進(jìn)行聚類,分析得出不同居民的用電習(xí)慣,從而總結(jié)出居民用電的規(guī)律以及用電的峰谷情況,以此來做出預(yù)測,改變發(fā)電、輸電計(jì)劃或者指導(dǎo)階梯電價(jià)的調(diào)整。

        1相關(guān)工作

        近些年來,由于用電高峰等電力問題帶來了巨大的壓力,促使相關(guān)部門、企業(yè)開始了對電力負(fù)荷更深入的研究和分析,以便于根據(jù)問題做出相應(yīng)的調(diào)整和改善[1]。但這樣的研究多集中于針對全局的數(shù)據(jù)或是針對少量的局部數(shù)據(jù),幾乎沒有涉及大規(guī)模且全面的局部數(shù)據(jù)(全局指電力總公司或者大的臺(tái)區(qū),局部則指每家每戶)。由于全面、細(xì)粒度地采集數(shù)據(jù)需要大量人力、時(shí)間,并且受限于隱私和設(shè)備。況且,各個(gè)地方的用電方式和習(xí)慣都不盡相同,所以抽樣分析也難以實(shí)現(xiàn)。電力部門需要自上而下地進(jìn)行變革:智能電網(wǎng)的普及為研究提供了良好的條件。每家每戶的電表都留有數(shù)據(jù)采集功能,能夠自動(dòng)地在每天的固定時(shí)段將數(shù)據(jù)上傳到臺(tái)區(qū),臺(tái)區(qū)負(fù)責(zé)收集數(shù)據(jù)并將數(shù)據(jù)發(fā)送到數(shù)據(jù)收集服務(wù)器。這樣的變化不僅帶來了人工成本的銳減,而且避免了抄表帶來的時(shí)間誤差、數(shù)據(jù)誤差、數(shù)據(jù)丟失等問題。

        就分析方法而言,可以采用不同于統(tǒng)計(jì)或者數(shù)學(xué)的方法,如文獻(xiàn)[2,3],而是采用了基于數(shù)據(jù)挖掘的知識(shí)獲取的模式。在通常情況下,知識(shí)發(fā)現(xiàn)是由以下步驟迭代組成[4]:

        (1) 數(shù)據(jù)清理(消除噪聲數(shù)據(jù));

        (2) 數(shù)據(jù)集成(組合各種數(shù)據(jù)源);

        (3) 數(shù)據(jù)選擇(從數(shù)據(jù)中提取用于分析工作相關(guān)的字段);

        (4) 數(shù)據(jù)變換(將數(shù)據(jù)歸一化處理,便于挖掘);

        (5) 數(shù)據(jù)挖掘(最重要步驟);

        (6) 模式評(píng)估(根據(jù)某種興趣度度量,對挖掘出的結(jié)果進(jìn)行評(píng)估);

        (7) 知識(shí)表示(通過知識(shí)表示技術(shù),表達(dá)挖掘到的知識(shí))。

        數(shù)據(jù)挖掘是知識(shí)發(fā)現(xiàn)的核心。運(yùn)用在電力系統(tǒng)可以幫助電力部門發(fā)掘更深層次的知識(shí)和規(guī)律。文獻(xiàn)[5-7]都運(yùn)用數(shù)據(jù)挖掘的方法來對負(fù)荷進(jìn)行分析。神經(jīng)網(wǎng)絡(luò)在負(fù)荷分析中占有了主導(dǎo)的地位,但在面對數(shù)量龐大并且雜亂無章的居民用戶用電數(shù)據(jù)時(shí),很難找到規(guī)律的、完備的數(shù)據(jù)集來學(xué)習(xí),從而導(dǎo)致整個(gè)神經(jīng)網(wǎng)絡(luò)分析過程受到嚴(yán)重的影響。所以本文采用了聚類這種無監(jiān)督學(xué)習(xí)的分析方法。由于聚類分析往往是針對大數(shù)據(jù)進(jìn)行的,所以在負(fù)荷分析領(lǐng)域采用較少。而本文主要是對居民用戶的用電數(shù)據(jù)進(jìn)行聚類分析,尚沒有針對這項(xiàng)工作的其他研究。

        在聚類算法的選擇上,選擇了K-means這種實(shí)用、高效的聚類算法,而在實(shí)驗(yàn)或者實(shí)際工作中可能面對更為龐大的數(shù)據(jù)時(shí),可以考慮采用基于K-means的模擬退火算法來增加效率[8];而在面對噪聲較多的數(shù)據(jù)時(shí),可以考慮使用k-δ-means算法來過濾盡可能多的噪聲點(diǎn)[9]。

        2準(zhǔn)備工作

        根據(jù)分析知道,分析工作是按照知識(shí)獲取的步驟進(jìn)行的。在真正地執(zhí)行聚類算法之前,必須要將數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇以及數(shù)據(jù)變換這幾個(gè)必要的步驟全部完成。

        2.1數(shù)據(jù)清理

        取得了某幾個(gè)臺(tái)區(qū)居民用電的真實(shí)數(shù)據(jù),稱之為原始數(shù)據(jù)。原始數(shù)據(jù)中記錄的是電表的讀數(shù),需要的則是用電量數(shù)據(jù)。通常情況下,電表讀數(shù)序列應(yīng)為非嚴(yán)格遞增序列,所以用電量序列就應(yīng)該非負(fù)。如果出現(xiàn)某一天的用電量為負(fù)值,則該數(shù)據(jù)發(fā)生異常。經(jīng)過仔細(xì)辨別后發(fā)現(xiàn),此類異常有兩種可能性。

        (1) 用戶換表會(huì)導(dǎo)致異常

        圖1所示即為換表異常,19日之前的電表讀數(shù)是正常的非嚴(yán)格遞增序列,而19日之后的讀數(shù)大幅度減少至接近于0,而且也呈現(xiàn)出遞增趨勢。當(dāng)出現(xiàn)該類情況時(shí),直接采用換表之后第一天的讀數(shù)作為換表前一天的用電量,而換表之后的用電量仍可以采用常規(guī)的計(jì)算方法。

        圖1 換表導(dǎo)致的電表讀數(shù)異常

        (2) 錯(cuò)誤的電表讀數(shù)也會(huì)導(dǎo)致用電量成負(fù)值

        圖2所示的情況可能是在6~8號(hào)期間電表出現(xiàn)故障,導(dǎo)致上傳的電表讀數(shù)異常。但跟換表異常不同的是,無法找到一個(gè)能夠直接替代該異常用電量的值,而只能通過發(fā)生異常前后正常的數(shù)據(jù)來計(jì)算得出異常點(diǎn)可能的讀數(shù)??梢杂冒l(fā)生異常后第一天的讀數(shù)減去異常發(fā)生前一天的讀數(shù)并除以連續(xù)異常的天數(shù)來近似作為用電量。

        圖2 電表故障導(dǎo)致的異常

        除了負(fù)值異常之外,數(shù)據(jù)還存在著一些噪聲數(shù)據(jù),這些多是因?yàn)殡姳砉收蠈?dǎo)致的。針對噪聲點(diǎn),通常都會(huì)將其舍棄,用噪聲點(diǎn)前后數(shù)據(jù)的平均值取而代之。

        2.2數(shù)據(jù)變換

        由于數(shù)據(jù)比較簡單,數(shù)據(jù)集成以及數(shù)據(jù)選擇的工作在這里就不做贅述。接下來需要對處理過的數(shù)據(jù)進(jìn)行變換。不同臺(tái)區(qū)讀取電表讀數(shù)的具體時(shí)間不同、記錄用電的方式不同、保存數(shù)據(jù)的字段不同,導(dǎo)致了很多表單的字段內(nèi)容大相徑庭,所以需要對數(shù)據(jù)進(jìn)行規(guī)整,使得用電數(shù)據(jù)的規(guī)格統(tǒng)一,包括負(fù)荷單位統(tǒng)一、時(shí)間單位統(tǒng)一以及用戶單位統(tǒng)一。由于K-means算法的輸入只能是向量集,所以還需要將電量數(shù)據(jù)變成可以聚類的向量。本次實(shí)驗(yàn)會(huì)用到以下向量變換的策略:首先將每個(gè)用戶某個(gè)月的用電數(shù)據(jù)按周一、周二到周日相加,然后除以累加的次數(shù)得到平均值并將這些平均值構(gòu)成七維向量(每周7天)。

        2.3準(zhǔn)備工作的必要性

        由于開展的是全新的工作,所以還沒有權(quán)威的數(shù)據(jù)集供實(shí)驗(yàn)使用,而收集到的數(shù)據(jù)也會(huì)面臨著數(shù)量和質(zhì)量的問題。為了保證實(shí)驗(yàn)的嚴(yán)謹(jǐn)性及正確性,必須對數(shù)據(jù)進(jìn)行嚴(yán)格地清理及修正。高質(zhì)量的數(shù)據(jù)集也為今后的研究奠定基礎(chǔ)。

        3實(shí)驗(yàn)過程

        實(shí)驗(yàn)選用R語言作為實(shí)驗(yàn)語言, 其內(nèi)建的各種統(tǒng)計(jì)學(xué)、數(shù)據(jù)挖掘及數(shù)字分析功能,包括了聚類分析需要的各種算法內(nèi)庫,很好地契合了本次的研究工作。

        3.1算法k值的選取

        K-means中的k值表示簇的數(shù)量,意味著會(huì)將數(shù)據(jù)劃分成k個(gè)具有相似特征的點(diǎn)集。但由于用電行為復(fù)雜多樣,用電的特征不夠明確,加之對于聚類結(jié)果也無法做出詳細(xì)地預(yù)測,所以必須經(jīng)過一定的實(shí)驗(yàn)才能確定k的取值。

        可以通過在某組固定數(shù)據(jù)下測試使用不同k值所得到結(jié)果的質(zhì)量來衡量。選取6月份的用電數(shù)據(jù),賦予其不同的k值,并按照以周為周期進(jìn)行聚類,得到的結(jié)果參數(shù)如表1所示。表1中,withSS表示聚類后的平方誤差,betSS表示聚類前后平方誤差的差值。

        表1 不同k值的結(jié)果參數(shù)

        由表1中可以明顯的看出,隨著k值的不斷增大,聚類的效果也會(huì)逐步提升,但考慮到k-means算法的效率跟k值成正比,而且當(dāng)k=3時(shí),聚類的效果有非常明顯的提升,所以選定k=3作為實(shí)驗(yàn)的參數(shù)。

        3.2以周為周期的聚類

        取定k=3后,分別對1~10月的用電數(shù)據(jù)進(jìn)行以周為周期的聚類分析(11、12月數(shù)據(jù)缺失)。下面列舉了3、7、10月的聚類結(jié)果圖(其中指μi簇i的中心點(diǎn)),如圖3~圖5所示。

        圖3 3月聚類結(jié)果折線圖

        圖4 7月聚類結(jié)果折線圖

        圖5 10月聚類結(jié)果折線圖

        根據(jù)圖3~圖5,發(fā)現(xiàn)對每個(gè)月數(shù)據(jù)聚類得到的3個(gè)簇的中心都呈現(xiàn)出明顯不同的3個(gè)層次:μ1各個(gè)維度上的數(shù)值基本都位置1.0~3.0之間,μ2各個(gè)維度上的數(shù)值都位于3.0~6.0之間,μ3各個(gè)維度上的數(shù)值都位于6.0以上。這說明了居民用戶用電存在著顯著的用電水平差異,而導(dǎo)致這種差異的原因可能在于每個(gè)家庭的組成不同以及家用電器使用情況的不同等。經(jīng)過仔細(xì)觀察,發(fā)現(xiàn)無論用戶的用電水平如何,其周末的用電量都會(huì)有不同程度的提升,這是完全符合邏輯的。

        接下來,將每個(gè)月聚類得到的所有維度上的值相加取平均數(shù);這樣每個(gè)月就會(huì)有3個(gè)值,以此來代表各個(gè)月3個(gè)層次用電水平的平均值,并將前10個(gè)月的平均值按類繪制成如圖6所示。

        圖6 均值折線圖

        根據(jù)圖6,發(fā)現(xiàn)以年為周期的用電情況呈現(xiàn)出顯著的規(guī)律:冬天氣溫低,需要用電取暖,所以1月和2月的用電量較高,第一類用戶對低氣溫并不敏感;夏天氣溫高,需要用電降溫,所以6月的用電量開始升高,到7月、8月達(dá)到極致,9月開始降低,第2、3類用戶對高溫天氣極其敏感,就連對低溫不敏感的第一類用戶的用電量也有一定幅度地提升。

        3.3聚類的必要性

        通過聚類分析得到了實(shí)驗(yàn)結(jié)果,可能部分的結(jié)果也能夠通過其他的分析方法來獲得,比如統(tǒng)計(jì)學(xué)方法。但這并不能取代聚類對于分析居民用戶用電的作用。通過聚類可以清晰地了解到用戶用電的行為模式,屬于不同模式的用戶擁有不同的用電習(xí)慣,而這種模式的識(shí)別是統(tǒng)計(jì)學(xué)方法難以做到的,因而聚類工作的重要性毋庸置疑。

        4結(jié)語

        根據(jù)實(shí)驗(yàn)結(jié)果,可以總結(jié)出以下規(guī)律:居民用戶用電情況會(huì)受到天氣尤其是氣溫的嚴(yán)重影響,在低溫情況下即在冬季時(shí)間段內(nèi),中高檔用電水平用戶的用電量會(huì)有顯著的增加,在高溫情況下即在夏季時(shí)間段內(nèi),所有用戶都會(huì)有很大的用電量提升。而在不考慮天氣的情況下,居民周末的用電量會(huì)高于平時(shí)。

        通過對居民用戶的用電數(shù)據(jù)進(jìn)行聚類分析,能夠劃分并得到居民用戶用電量位于的層次,這有助于了解用戶的用電模式,掌握用戶的用電水平。同時(shí),電力部門可以通過結(jié)論來預(yù)測用電的高峰時(shí)間,以此來調(diào)整階梯電價(jià),并指導(dǎo)用戶避開用電高峰,從而有效地抑制谷峰差的增大,緩解高峰期電力供應(yīng)緊張帶來的壓力。

        但在分析過程中,仍存在以下不足:噪聲數(shù)據(jù)的處理不夠精細(xì),導(dǎo)致了信息的部分流失;難以識(shí)別更多更細(xì)致的用電模式。根據(jù)出現(xiàn)的問題,今后的工作可以圍繞以下兩點(diǎn)進(jìn)行:制定更精確的噪聲識(shí)別模式并使用更科學(xué)的手段對噪聲數(shù)據(jù)進(jìn)行處理,如b樣條曲線等; 使用更小粒度的數(shù)據(jù),增加k值。

        參考文獻(xiàn):

        [1]趙希正. 中國電力負(fù)荷特性分析與預(yù)測[M]. 北京:中國電力出版社,2002.

        [2]陶莉,肖晶. 負(fù)荷特性分析方法的研究[J]. 電力需求側(cè)管理,2003,5(4): 30-21.

        TAO Li, XIAO Jing. Analysis research of load characteristic[J].Power Demand Side Management,2003,5(4):30-21.

        [3]徐東升、楊巍. 基于SPSS的短期負(fù)荷特性分析及其預(yù)測研究[J]. 電力系統(tǒng)保護(hù)與控制,2009,37(21):147-151.

        XU Dong-sheng, YANG Wei. Application of SPSS in characteristic of short load and its forecasting[J].Power System Protection and Control,2009,37(21):147-151.

        [4]MICHELINE KAMBER, JIAN Pei. 數(shù)據(jù)挖掘概念與技術(shù)[M]. 北京:機(jī)械工業(yè)出版社,2012.

        [5]高智. 數(shù)據(jù)挖掘技術(shù)在電力系統(tǒng)中的應(yīng)用[J]. 華東電力,2001,29(12): 4-7.

        GAO Zhi, XU Zheng. Data mining and its application in power system[J].East China Electric Power,2001,29(12):4-7.

        [6]李智勇,吳晶瑩. 基于自組織映射神經(jīng)網(wǎng)絡(luò)的用戶負(fù)荷曲線聚類[J]. 電力系統(tǒng)自動(dòng)化,2008,32(15): 66-70.

        LI Zhi-yong, WU Jing-ying, WU Wei-lin, et al. Power customers load profile clustering using the SOM neural network[J]. Automation of Electric Power Systems,2008,32(15):66-70.

        [7]耿亮,吳燕. 電力數(shù)據(jù)挖掘在電網(wǎng)各領(lǐng)域間的應(yīng)用[J]. 電信科學(xué),2013(11): 127-130.

        GENG Liang, WU Yan. The application of power data mining within and between the grid fields[J].Telecommunications Science,2013 (11):127-130.

        [8]陳慧萍. 基于模擬退火思想的優(yōu)化k-means算法[J]. 河海大學(xué)常州分校學(xué)報(bào),2006,20(4):29-33.

        CHEN Hui-ping, HE Hui-jing, CHEN Lan-feng, et al. Optimized k-means algorithm based on simulated annealing[J]. Journal of Hohai University Changzhou,2006,20(4):29-33.

        [9]SHAI Ben-David. Clustering in the Presence of Background Noise[C]. ICML2014.

        (本文編輯:嚴(yán)加)

        Clustering Analysis of Residential Electricity Utilization

        ZHANG Jin1,XU Ran-ci2,3,XU Jian4,HUANG Min-hao4

        (1. State Grid Shanghai Pudong Electric Power Supply Company, Shanghai 200112, China;2. School of Computer Science, Fudan University, Shanghai 201203, China;3. Engineering Research Center of Cyber Security Auditing and Monitoring,Ministry of Education, Shanghai 201203, China;4. Dongjie Construction (Group) Co., Ltd., Shanghai 201203, China)

        Abstract:With the further development of the reforms and open policy, the national economy, science and technology have been improved remarkably. However, the electricity consumption increase leads to a series of contradictions and problems, and poses threat to the safe operation of power syste. In order to cope with these problems and contradictions, the electricity sector must strengthen the analysis and forecasting of electricity, make the proper planning for the construction and development of power system. Because residential utilization is the most representative and regular part of electricity consumption, this paper mainly analyzes residential electricity, mainly by means of cluster algorithm. The results show that resident users consume electricity in detailed rules, and the regularity of the rules is summarized and the conclusions are drawn in this paper.

        Key words:load analysis; electricity analysis; data mining; cluster analysis

        DOI:10.11973/dlyny201602006

        作者簡介:張進(jìn)(1971),高級(jí)工程師,主要從事電力營銷管理工作。

        中圖分類號(hào):TM73

        文獻(xiàn)標(biāo)志碼:B

        文章編號(hào):2095-1256(2016)02-0180-05

        收稿日期:2015-04-11

        猜你喜歡
        數(shù)據(jù)挖掘
        基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識(shí)別方法
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
        在线免费毛片| 婷婷亚洲岛国热超碰中文字幕| 无套中出丰满人妻无码| 国产av精国产传媒| 亚洲阿v天堂2018在线观看| 饥渴少妇一区二区三区| 日出白浆视频在线播放| 成 人免费va视频| 国产精品亚洲А∨天堂免下载| 精品一区二区三区女同免费 | 中文乱码字字幕在线国语| 极品嫩模高潮叫床| 亚洲日本天堂| 日产精品一区二区在线| 日本视频一区二区三区一| 久久国产精品久久久久久| 亚洲婷婷丁香激情| 一区二区三区日本久久| 亚洲最大成人网站| 99精品免费久久久久久久久日本 | 国产熟女一区二区三区不卡| 免费网站看v片在线18禁无码| 亚洲综合伊人制服丝袜美腿| 国产一区二区三区免费小视频| 亚洲乱码中文字幕在线播放| 婷婷亚洲久悠悠色悠在线播放| 亚洲AV无码精品一区二区三区l | 国产精品国产三级国产专播下 | 亚洲中文字幕久久精品色老板| 中文字幕日韩一区二区不卡| 五月中文字幕| 视频一区视频二区亚洲| 欧美老肥婆牲交videos| 亚洲av无码成人黄网站在线观看| 成人国产乱对白在线观看| 亚洲成人av在线蜜桃| 亚洲第一se情网站| 久久精品国产亚洲黑森林| 黄片国产一区二区三区| 国产在线精品一区二区中文| 国产久视频国内精品999|