亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        電力數(shù)據(jù)中的冪律分布特性

        2013-09-29 04:48:12王冠男鄧春宇鄭亞芹
        電信科學(xué) 2013年11期
        關(guān)鍵詞:售電量冪律用電量

        王冠男,鄧春宇,趙 悅,鄭亞芹

        (北京國(guó)電通網(wǎng)絡(luò)技術(shù)有限公司大數(shù)據(jù)業(yè)務(wù)部 北京 100070)

        1 引言

        在自然界和社會(huì)生活中,經(jīng)常存在這樣的數(shù)據(jù),數(shù)值在某個(gè)特征附近變化,并且變化較小,這一類數(shù)據(jù)被稱為正態(tài)分布,具有很多優(yōu)秀的特性,如圖1(a)所示。比如人的身高、學(xué)生的考試成績(jī)、同質(zhì)群體的紅細(xì)胞數(shù)以及數(shù)理統(tǒng)計(jì)中隨機(jī)誤差等都符合正態(tài)分布。在傳統(tǒng)數(shù)據(jù)挖掘方法中,正態(tài)分布被譽(yù)為概率論里最重要的分布。

        然而,隨著大數(shù)據(jù)時(shí)代的到來(lái),人們有能力處理完全數(shù)據(jù)而不是樣本數(shù)據(jù),因此,現(xiàn)實(shí)中很多完全數(shù)據(jù)不再符合正態(tài)分布,比如個(gè)人收入的分布、變化尺度的范圍很寬,波動(dòng)可以跨越很多數(shù)量級(jí)。根據(jù)這類數(shù)據(jù)可以畫出一條向右偏斜并且拖著長(zhǎng)尾巴的累積分布曲線,顯然,它與正態(tài)分布曲線有顯著的不同,如圖1(b)所示。這種長(zhǎng)尾分布表明,絕大多數(shù)個(gè)體的值很小,只有少數(shù)個(gè)體的值相當(dāng)大。這種現(xiàn)象被稱為長(zhǎng)尾效應(yīng),或者重尾法則,本文研究的冪律分布是長(zhǎng)尾分布中重要的一種[3,4]。

        研究表明,90%的電力指標(biāo)數(shù)據(jù)都不符合正態(tài)分布。確定數(shù)據(jù)是否為正態(tài)分布在數(shù)據(jù)的探索性分析中具有舉足輕重的作用,因?yàn)檎龖B(tài)分布是很多統(tǒng)計(jì)方法和數(shù)據(jù)挖掘方法所必需的條件,比如線性和非線性回歸模型、因子分析、典型相關(guān)分析以及主成分分析等,甚至包括最基本的線性相關(guān)性系數(shù)的計(jì)算。若數(shù)據(jù)不符合正態(tài)分布,需要采取其他相應(yīng)的辦法,如數(shù)據(jù)轉(zhuǎn)換或者更換分析方法,否則輕者導(dǎo)致模型計(jì)算結(jié)果的不準(zhǔn)確性,嚴(yán)重者更會(huì)影響針對(duì)算法結(jié)果所做的決策。本文主要針對(duì)電力數(shù)據(jù)中的指標(biāo)進(jìn)行分析,研究其真正的分布規(guī)律,主要從3個(gè)方面展開(kāi),首先介紹數(shù)據(jù)源和相關(guān)指標(biāo),然后闡述電力指標(biāo)數(shù)據(jù)的冪律分布特性以及細(xì)分行業(yè)用電量的對(duì)數(shù)正態(tài)分布特性,最后結(jié)合業(yè)務(wù)背景解釋電力指標(biāo)符合冪律分布的原因。

        圖1 正態(tài)分布和冪律分布

        2 數(shù)據(jù)描述

        2.1 數(shù)據(jù)源

        本文選擇全國(guó)發(fā)電量、國(guó)家電網(wǎng)公司售電量以及全社會(huì)用電量3個(gè)指標(biāo)作為分析研究的目標(biāo),選擇原因如下。

        ·全社會(huì)用電量與國(guó)家經(jīng)濟(jì)密切相關(guān),研究表明,用電量的增長(zhǎng)影響GDP的增長(zhǎng),而GDP的增長(zhǎng)對(duì)用電量的增長(zhǎng)影響不大,即用電量增長(zhǎng)和GDP增長(zhǎng)的關(guān)系是從用電量到GDP增長(zhǎng)的單向因果關(guān)系。

        ·全國(guó)發(fā)電量是直接衡量一個(gè)國(guó)家經(jīng)濟(jì)狀況的重要指標(biāo)。國(guó)家電網(wǎng)公司是關(guān)系國(guó)家能源安全和國(guó)民經(jīng)濟(jì)命脈的重要骨干企業(yè),公司的售電量能夠反映公司甚至國(guó)家的供電能力。3個(gè)電力指標(biāo)具有較強(qiáng)的相關(guān)性。

        表1闡述了所選3個(gè)電力指標(biāo)的維度、時(shí)間和區(qū)域。本文所選取的時(shí)間為2011-2013年每年的2月和7月。

        2.2 電力指標(biāo)的非正態(tài)分布特性

        本文采取密度函數(shù)曲線檢驗(yàn)法和夏皮羅·威爾克提出的W統(tǒng)計(jì)量,將數(shù)據(jù)和圖形相結(jié)合,共同驗(yàn)證全社會(huì)發(fā)電量、國(guó)家電網(wǎng)售電量和全國(guó)用電量的非正態(tài)分布特性。

        圖2展示了3個(gè)指標(biāo)的密度函數(shù)曲線,由于空間限制,時(shí)間維度是2012年2月、2012年7月、2013年2月、2013年7月。由圖2可知,3個(gè)電力指標(biāo)大多集中在較小的數(shù)值上,只有少數(shù)分布在較大的數(shù)值上,在空間維度上不符合正態(tài)分布,并且都具有長(zhǎng)尾分布的特征。

        表2~表4分別展現(xiàn)了2008-2013年所有2月份和7月份中3個(gè)指標(biāo)的W統(tǒng)計(jì)量檢驗(yàn)結(jié)果,即P值。

        由表2~表4可知,全國(guó)發(fā)電量、國(guó)家電網(wǎng)公司售電量和全社會(huì)用電量的W統(tǒng)計(jì)檢驗(yàn)的結(jié)果都小于0.05,即有不到5%的信心認(rèn)為3個(gè)電力指標(biāo)符合正態(tài)分布,下文將進(jìn)一步分析3個(gè)指標(biāo)分別符合何種分布。

        3 電力指標(biāo)的冪律分布特征

        3.1 冪律分布特征

        長(zhǎng)尾和冪律的區(qū)別是:冪律分布需要數(shù)據(jù)必須在統(tǒng)計(jì)意義上可以被冪律曲線擬合,而對(duì)于長(zhǎng)尾分布而言,能否被冪律曲線精確地?cái)M合并不重要,重要的是有一個(gè)長(zhǎng)長(zhǎng)的尾巴。已知全國(guó)用電量、國(guó)家電網(wǎng)公司售電量和全社會(huì)發(fā)電量屬于長(zhǎng)尾分布,但是仍需要進(jìn)一步證明其為冪律分布。

        表1 全國(guó)發(fā)電量、國(guó)家電網(wǎng)公司售電量、全社會(huì)用電量的數(shù)據(jù)描述

        圖2 全國(guó)發(fā)電量、國(guó)家電網(wǎng)售電量和全社會(huì)用電量3個(gè)指標(biāo)的密度函數(shù)曲線

        表2 全國(guó)發(fā)電量的正態(tài)分布W統(tǒng)計(jì)量檢驗(yàn)結(jié)果

        表3 國(guó)家電網(wǎng)公司售電量的正態(tài)分布W統(tǒng)計(jì)量檢驗(yàn)結(jié)果

        表4 全社會(huì)用電量的正態(tài)分布W統(tǒng)計(jì)量檢驗(yàn)結(jié)果

        冪律分布的分布特征如圖1(b)所示,通用計(jì)算式為y=cx-r,x和 y是正的隨機(jī)變量,c、r為常數(shù),且大于 0。冪律分布的特點(diǎn)是絕大多數(shù)事件的值很小,只有少數(shù)事件的值相當(dāng)大。將冪律分布公式的兩邊分別取對(duì)數(shù),則ln x與ln y存在以下的線性關(guān)系:1n y=1n c-r1n x,冪律分布在雙對(duì)數(shù)坐標(biāo)下表現(xiàn)為一條斜率為冪指數(shù)的負(fù)數(shù)的直線,這一線性關(guān)系是判斷某個(gè)隨機(jī)變量是否滿足冪律的依據(jù),r為冪律指數(shù)。

        圖3展示了3個(gè)電力指標(biāo)的冪律分布特征,時(shí)間維度是2012-2013年每年的2月份和7月份。由圖3可知,除了特殊原因引起的較小數(shù)值外(西藏地區(qū)),其他數(shù)值基本符合線性關(guān)系,并且冪律指數(shù)為正數(shù),因此3個(gè)指標(biāo)符合冪律分布的特征,屬于冪律分布。

        表5~表7分別展示了3個(gè)電力指標(biāo)在雙對(duì)數(shù)坐標(biāo)下的參數(shù)擬合結(jié)果,其中,冪律指標(biāo)r都大于-2,驗(yàn)證了圖3的結(jié)論,全國(guó)發(fā)電量、國(guó)家電網(wǎng)公司售電量和全社會(huì)用電量符合冪律分布。

        3.2 用電量的對(duì)數(shù)正態(tài)分布特征

        圖3 全國(guó)發(fā)電量、國(guó)家電網(wǎng)公司售電量和全社會(huì)用電量的冪律分布特征

        表5 全國(guó)發(fā)電量的冪律分布檢驗(yàn)結(jié)果

        表6 國(guó)家電網(wǎng)公司售電量的冪律分布檢驗(yàn)結(jié)果

        表7 全社會(huì)用電量的冪律分布檢驗(yàn)結(jié)果

        由上文可知,全國(guó)發(fā)電量、國(guó)家電網(wǎng)公司售電量和全國(guó)用電量符合冪律分布的特性,與其他兩個(gè)指標(biāo)相比,用電量具有特殊的優(yōu)良特性。

        已知兩個(gè)變量X和Y無(wú)論獨(dú)立與否,X+Y的和仍然服從正態(tài)分布。若X和Y服從對(duì)數(shù)正態(tài)分布,則仍然服從對(duì)數(shù)正態(tài)分布,而X+Y卻不符合這一規(guī)律。通過(guò)分析,本文發(fā)現(xiàn)大部分細(xì)分行業(yè)的用電量服從對(duì)數(shù)正態(tài)分布,而細(xì)分行業(yè)用電量之和卻不符合這一規(guī)律,比如全國(guó)用電量、第一產(chǎn)業(yè)用電量、第二產(chǎn)業(yè)用電量、第三產(chǎn)業(yè)用電量等。在第4節(jié)中,將詳細(xì)闡述細(xì)分行業(yè)用電量服從對(duì)數(shù)正態(tài)分布的根本原因。

        本文選擇具有代表性的5個(gè)細(xì)分行業(yè)進(jìn)行詳細(xì)分析,分別是農(nóng)業(yè)、輕工業(yè)、重工業(yè)、信息傳輸業(yè)、房地產(chǎn)、計(jì)算服務(wù)業(yè)。圖4展示了5個(gè)行業(yè)用電量的經(jīng)驗(yàn)累積分布函數(shù)(ECDF),應(yīng)用極大似然估計(jì)的方法對(duì)分布參數(shù)進(jìn)行擬合,并且將用電量與5個(gè)冪律分布進(jìn)行對(duì)比,分別是指數(shù)分布、對(duì)數(shù)正態(tài)分布、逆高斯分布、帕累托分布和列維分布。由圖可知,對(duì)數(shù)正態(tài)分布是最合理的擬合分布。

        對(duì)數(shù)正態(tài)分布的概率密度函數(shù)為:

        其中:

        對(duì)數(shù)正態(tài)分布具有優(yōu)秀的特性,當(dāng)隨機(jī)變量log X符合正態(tài)分布時(shí),則X符合對(duì)數(shù)正態(tài)分布。即對(duì)用電量進(jìn)行對(duì)數(shù)轉(zhuǎn)換,就可以得到正態(tài)分布的數(shù)據(jù),因此證明用電量符合對(duì)數(shù)正態(tài)分布不僅大大減少了數(shù)據(jù)分析的工作量,還解決了用電量不是正態(tài)分布的難題。表8展示了對(duì)數(shù)轉(zhuǎn)換后細(xì)分行業(yè)用電量的正態(tài)分布檢驗(yàn)結(jié)果。

        由表8可知,所有W統(tǒng)計(jì)量的檢驗(yàn)結(jié)果大于0.05,即有95%的信心認(rèn)為,細(xì)分行業(yè)的用電量經(jīng)過(guò)對(duì)數(shù)轉(zhuǎn)換后服從正態(tài)分布,可以直接應(yīng)用以正態(tài)分布為必要條件的數(shù)據(jù)分析和挖掘方法。

        4 原因分析

        由上文已知,全國(guó)發(fā)電量、國(guó)家電網(wǎng)公司售電量和全國(guó)用電量符合冪律分布的特性,并且細(xì)分行業(yè)的用電量服從對(duì)數(shù)正態(tài)分布,本節(jié)主要結(jié)合業(yè)務(wù)背景闡述3個(gè)電力指標(biāo)符合冪律分布以及細(xì)分行業(yè)用電量服從對(duì)數(shù)正態(tài)分布的根本原因。

        3個(gè)電力指標(biāo)符合冪律分布特性的主要原因如下。

        ·由于政策、地理位置和自然環(huán)境等原因,全國(guó)經(jīng)濟(jì)發(fā)展嚴(yán)重不平衡,東部沿海地區(qū)較發(fā)達(dá),西部等地區(qū)經(jīng)濟(jì)較為落后。電力和經(jīng)濟(jì)密不可分,是強(qiáng)正相關(guān)的關(guān)系,某地區(qū)的用電情況可以反映此地的經(jīng)濟(jì)狀況,因此電力指標(biāo)數(shù)據(jù)在地域上也存在不平衡的現(xiàn)象。

        圖4 細(xì)分行業(yè)用電量的ECDF

        表8 細(xì)分行業(yè)用電量對(duì)數(shù)轉(zhuǎn)換后的正態(tài)分布W統(tǒng)計(jì)量檢驗(yàn)結(jié)果

        ·自然資源分布不平衡。全國(guó)的煤炭資源和水源分布不平衡,只有少數(shù)地區(qū)具有豐富的煤炭資源和水資源,這導(dǎo)致電力指標(biāo)數(shù)據(jù)的曲線向左傾斜,并且具有冪律分布的特征。

        因?yàn)殡娏χ笜?biāo)數(shù)據(jù)在地域上分布不平衡,所以隨著電力指標(biāo)數(shù)值的增加,P(Q>q)逐漸降低,并且降低速度減緩,呈現(xiàn)冪函數(shù)的規(guī)律,這正是冪律分布的特征。

        細(xì)分行業(yè)用電量服從對(duì)數(shù)正態(tài)分布,下面運(yùn)用數(shù)學(xué)理論闡述產(chǎn)生此種現(xiàn)象的根本原因。

        正態(tài)分布的變量和對(duì)數(shù)正態(tài)分布的變量存在著區(qū)別和聯(lián)系,就共同點(diǎn)來(lái)說(shuō),兩種變量都是獨(dú)立變量,即用戶每天的用電量是獨(dú)立的,符合正態(tài)分布。兩種分布最大的區(qū)別在于“加”和“乘”,這種細(xì)微的不同使得數(shù)據(jù)的分布規(guī)律也具有明顯差異。

        首先以布朗運(yùn)動(dòng)為例來(lái)解釋正態(tài)分布。假設(shè)某個(gè)行業(yè)在某一天的用電量為Q1,在下一天的用電量為Q2,在單位時(shí)間Δt內(nèi),行業(yè)用電量的差值為ΔQ,增加或者減少。令Qn為n天以后某行業(yè)的累積用電量,則:

        其中:

        Q(i)相互獨(dú)立,且 P=1)=P=-1)=1/2。Xn服從二項(xiàng)分布,參數(shù)為n和p=0.5,由中心極限定理可知,當(dāng)n→+∞時(shí),Qn近似服從正態(tài)分布。

        但是在現(xiàn)實(shí)中,由于溫度變化、某個(gè)月的假期時(shí)間長(zhǎng)短的變化以及政策變化等原因,行業(yè)用電量的增減不是隨機(jī)的,比如通過(guò)分析發(fā)現(xiàn)在2月和7月,細(xì)分行業(yè)的用電量更傾向于增加而不是減少,除非發(fā)生特殊情況。假設(shè)在單位時(shí)間Δt內(nèi),行業(yè)用電量以相同的概率增加ΔQ1,減少ΔQ2,ΔQ1和 ΔQ2為已知常數(shù),并且 ΔQ1>ΔQ2(在某些月份ΔQ1<ΔQ2,不影響最終結(jié)果)。

        求解如下方程:

        得到ΔQm=ΔQ1/ΔQ2。則n天以后,行業(yè)的累積用電量為:

        其中,Q(i)的含義保持不變,且 P(Q(i)=1)=P(Q(i)=-1)=1/2,Q(i)相互獨(dú)立,即行業(yè)在某一天用電時(shí)不會(huì)考慮下一天的用電情況。正如布朗運(yùn)動(dòng)中的分析,Qn仍然服從二項(xiàng)分布。由于 ΔQ1>ΔQ2(或者 ΔQ1<ΔQ2),則分布曲線必定會(huì)向左偏。當(dāng)n→+∞時(shí),Qn近似服從對(duì)數(shù)正態(tài)分布。這符合中心極限定理的多重乘法的規(guī)則,即多個(gè)獨(dú)立同分布變量的乘積符合對(duì)數(shù)正態(tài)分布。因此,在同一時(shí)間段內(nèi)(本文選取一個(gè)月),各個(gè)省的細(xì)分行業(yè)用電量服從對(duì)數(shù)正態(tài)分布,且如果將細(xì)分行業(yè)繼續(xù)劃分,仍然服從對(duì)數(shù)正態(tài)分布。

        5 結(jié)束語(yǔ)

        本文主要針對(duì)電力指標(biāo)的分布性規(guī)律進(jìn)行分析研究。經(jīng)過(guò)統(tǒng)計(jì)分析研究發(fā)現(xiàn),90%以上的電力指標(biāo)不符合正態(tài)分布。經(jīng)驗(yàn)證,全國(guó)發(fā)電量、國(guó)家電網(wǎng)公司售電量和全社會(huì)用電量3個(gè)電力核心指標(biāo)具有冪律分布的特性,其中細(xì)分行業(yè)的用電量符合對(duì)數(shù)正態(tài)分布,并且具體闡述了產(chǎn)生這種現(xiàn)象的業(yè)務(wù)原因和數(shù)學(xué)原因。

        本文對(duì)電力指標(biāo)的分布規(guī)律進(jìn)行了深入研究,為電力大數(shù)據(jù)的探索性分析做出了貢獻(xiàn),并且為數(shù)據(jù)分析和挖掘方法的選擇提供了理論支撐。所得的研究成果能夠?yàn)殡娏?shù)據(jù)分析同行提供更多的創(chuàng)新思路,方法和技術(shù)也可以應(yīng)用到其他電力方面的數(shù)據(jù),不僅豐富了電力數(shù)據(jù)分析領(lǐng)域的技術(shù),對(duì)很多業(yè)務(wù)問(wèn)題也具有理論指導(dǎo)意義。不符合正態(tài)分布的電力指標(biāo)數(shù)據(jù)看似毫無(wú)規(guī)律,冪律分布以簡(jiǎn)潔優(yōu)雅的形式,將毫不相干的事物聯(lián)系在了一起。以后也將是電力數(shù)據(jù)分析中研究的熱點(diǎn),未來(lái)也將對(duì)電力行業(yè)中冪律分布的產(chǎn)生機(jī)制進(jìn)行深入研究。

        1 Rhee I,Shin M,Hong S,et al.On the levy walk nature of human mobility.Networking,IEEE/ACM Transactions on,2011(3)

        2 Yang B,Duan W Q,Chen Z.New method to estimate scaling of power-law degree distribution and hierarchical networks.Applied Mathematics and Mechanics,2006,27(11):1475~1479

        3 葛玉偉,周戰(zhàn),陳萬(wàn)田.洪澤地區(qū)配電網(wǎng)故障冪律分布特性.現(xiàn)代電子技術(shù),2011,34(6):172~174

        4 Chris A.The Long Tail.CITIC Publishing House,2005

        猜你喜歡
        售電量冪律用電量
        基于LSTM深度網(wǎng)絡(luò)的售電量預(yù)測(cè)研究
        02 國(guó)家能源局:1~7月全社會(huì)用電量同比增長(zhǎng)3.4%
        01 國(guó)家能源局:3月份全社會(huì)用電量同比增長(zhǎng)3.5%
        1~10月全社會(huì)用電量累計(jì)56552億千瓦時(shí)同比增長(zhǎng)8.7%
        結(jié)合X12乘法模型和ARIMA模型的月售電量預(yù)測(cè)方法
        四川地區(qū)降水冪律指數(shù)研究
        冪律流底泥的質(zhì)量輸移和流場(chǎng)
        對(duì)抗冪律
        2014年全社會(huì)用電量
        電網(wǎng)月度統(tǒng)計(jì)線損率波動(dòng)的原因分析及對(duì)策
        浙江電力(2013年4期)2013-11-28 11:31:14
        精品国产97av一区二区三区| 麻豆高清免费国产一区| 一区一级三级在线观看| 女人扒开下面无遮挡| 国产乱人伦AV在线麻豆A| 激情乱码一区二区三区| 亚洲国产精品亚洲一区二区三区| 人妻丝袜av中文系列先锋影音| 欧美人妻日韩精品| 最新国产成人综合在线观看| 亚洲蜜臀av一区二区三区漫画| 亚洲码欧美码一区二区三区| 国产精品白丝喷水在线观看| 一区二区三区国产在线网站视频| 日韩激情视频一区在线观看| 麻豆国产精品va在线观看不卡| 欧美v亚洲v日韩v最新在线| 欧美破处在线观看| 麻豆国产av在线观看| 三年的高清电影免费看| 日韩AV不卡六区七区| 日本高清中文字幕二区在线| 国产亚洲av看码精品永久| 国产无夜激无码av毛片| 少妇高潮惨叫喷水在线观看| 熟女白浆精品一区二区| av网站在线观看亚洲国产| 免费无码一区二区三区蜜桃| 久久精品无码一区二区三区蜜费| 日本熟妇免费一区二区三区| 一区二区三区内射美女毛片 | 亚洲是图一区二区视频| 日产国产亚洲精品系列| 情人伊人久久综合亚洲| 少妇高潮喷水久久久影院| 人妻精品人妻一区二区三区四五| 亚洲夫妻性生活免费视频| 久久精品夜色国产亚洲av| 欧美中文在线观看| 91人妻人人做人人爽九色| 欧美老熟妇乱xxxxx|