潘焜 王鐵錚 張璇 李酈原
[摘 要]“煤改電”電力物資采購(gòu)數(shù)量在倉(cāng)儲(chǔ)過(guò)程中是一個(gè)重要問(wèn)題。存儲(chǔ)定額數(shù)量可以轉(zhuǎn)化為消耗數(shù)量的預(yù)測(cè)問(wèn)題。對(duì)“煤改電”電力物資數(shù)量的較為準(zhǔn)確的預(yù)測(cè)可以有效地增加倉(cāng)儲(chǔ)規(guī)劃的效率。而“煤改電”電力物資數(shù)量具有較大的不確定性,隨著項(xiàng)目的推進(jìn),子項(xiàng)目的數(shù)量減少,總的電力物資所需的數(shù)量也會(huì)相應(yīng)減少。因此,本文將影響電力物資采購(gòu)數(shù)量因素分為兩部分,一是項(xiàng)目數(shù)量,二是每個(gè)子項(xiàng)目中的物資采購(gòu)的數(shù)量,對(duì)于項(xiàng)目數(shù)量采用基于指數(shù)加權(quán)平均移動(dòng)的預(yù)測(cè)方法,對(duì)于采購(gòu)數(shù)量采用高斯概率模型進(jìn)行預(yù)測(cè)。
[關(guān)鍵詞]概率模型;“煤改電”;電力物資
[中圖分類號(hào)]R311 [文獻(xiàn)標(biāo)識(shí)碼]A
“煤改電”電力物資采購(gòu)與電力公司中的應(yīng)急物資采購(gòu)不同,“煤改電”工程中所使用的電力物資的規(guī)律性比較復(fù)雜。一般而言,一個(gè)“煤改電”工程會(huì)根據(jù)區(qū)域、時(shí)間、工程階段等因素被分解成多個(gè)子項(xiàng)目。隨著工程進(jìn)度的不斷推進(jìn),有待完成的子項(xiàng)目數(shù)量會(huì)逐漸減少。因此,子項(xiàng)目的數(shù)量是“煤改電”電力物資采購(gòu)數(shù)量的主要因素之一。為了能夠較為準(zhǔn)確地預(yù)測(cè)子項(xiàng)目的數(shù)量,本文采用了指數(shù)加權(quán)平均移動(dòng)的方式進(jìn)行預(yù)測(cè)。對(duì)于每一個(gè)子項(xiàng)目需要使用的電力物資的數(shù)量,本文采用了高斯概率模型進(jìn)行預(yù)測(cè)。預(yù)測(cè)“煤改電”電力物資的數(shù)量的意義在于能夠制訂更加可靠的采購(gòu)計(jì)劃,從而減少倉(cāng)儲(chǔ)成本和采購(gòu)成本。
1 高斯概率模型
高斯概率模型是基于高斯分布的預(yù)測(cè)模型,高斯分布又稱正態(tài)分布。正態(tài)分布是一種常見(jiàn)而普遍的分布,由于中心極限定理的存在,當(dāng)相關(guān)的影響因素很多的時(shí)候,所有影響因素的和近似符合正態(tài)分布,并且無(wú)論因素的本身的分布。
假設(shè)隨機(jī)變量X1,X2…Xn獨(dú)立同分布,均值E(Xi)=μ,方差D(Xi)=σ2,那么所有的隨機(jī)變量和滿足公式(1)
那么Yn近似符合標(biāo)準(zhǔn)正態(tài)分布。
由于真實(shí)情況下,n無(wú)法趨于正無(wú)窮,因此數(shù)據(jù)分布可能并不符合正態(tài)分布,所以在預(yù)測(cè)數(shù)據(jù)之前,需要對(duì)數(shù)據(jù)分布進(jìn)行檢驗(yàn)。偏度-峰度檢驗(yàn)是概率論中用來(lái)檢測(cè)分布是否是正態(tài)分布的常用方法。其根據(jù)樣本數(shù)據(jù)的矩來(lái)分析數(shù)據(jù)的分布和正態(tài)分布的相似程度。
假設(shè)用X表示隨機(jī)變量,樣本的來(lái)源為獨(dú)立同分布,v1和v2分別為的3階矩和4階矩的估計(jì)量,G1和G2分別為樣本的偏度和峰度分布。若樣本服從正態(tài)分布,則v1服從G1,v2服從G2。
公式(3)和公式(4)表示了G1和G2所服從的分布情況,其中n為數(shù)據(jù)的樣本數(shù)量。
當(dāng)樣本服從正態(tài)分布時(shí),|u1|和|u2|都應(yīng)該小于zα/4,其中α為顯著程度,一般取5%,對(duì)應(yīng)的值z(mì)1-α/4=2.2414。α顯著程度的意思是,假設(shè)成立時(shí),最多α的概率認(rèn)為它是假的,即事實(shí)為真時(shí)被誤認(rèn)為假的概率為α。當(dāng)α為0.05的時(shí)候,意味著結(jié)論有0.95的可信度,z1-α/4為1-α/4對(duì)應(yīng)的分位點(diǎn),當(dāng)結(jié)果大于z1-α/4意味著很可能出現(xiàn)了小概率事件。
當(dāng)認(rèn)為樣本是符合高斯分布時(shí),就可以使用高斯模型進(jìn)行分析。高斯模型一般指混合高斯模型,有多個(gè)輸入的隨機(jī)變量。
公式(5)是混合高斯模型的分布形式,其中k表示混合高斯模型中包含的正態(tài)分布的數(shù)量;wi表示第i個(gè)分布對(duì)于總分布的貢獻(xiàn)的權(quán)重,所有w的總和為1.0;N表示正態(tài)分布;μk表示每一個(gè)被包含的正態(tài)分布的均值;Σk表示協(xié)方差矩陣。
結(jié)合實(shí)際情況,在電力物資預(yù)測(cè)中,只有一個(gè)參數(shù),即月份,因此混合高斯模型退化成了單變量的高斯模型。
2 指數(shù)加權(quán)平均移動(dòng)預(yù)測(cè)模型
由于電力物資采購(gòu)的數(shù)量會(huì)隨著時(shí)間的推移而不斷變化。一般而言,隨著時(shí)間的推進(jìn),工程中子項(xiàng)目的數(shù)量變少,這種情況導(dǎo)致了電力物資采購(gòu)的總的數(shù)量會(huì)不斷變少,但其實(shí)每次采購(gòu)的數(shù)量變化不大。因此若要預(yù)測(cè)電力物資采購(gòu)的總數(shù)量,除了通過(guò)高斯模型預(yù)測(cè)每次采購(gòu)的數(shù)量外,還需要預(yù)測(cè)子項(xiàng)目的數(shù)量。
考慮到實(shí)際應(yīng)用中,以月為單位時(shí),能夠較好地保留采購(gòu)次數(shù)的季節(jié)和節(jié)假日等特征,因此本文采用了以月為劃分的方式,即選取約為30天的時(shí)間間隔作為分析子項(xiàng)目的時(shí)間區(qū)間,一年一共分為12個(gè)區(qū)間。由于子項(xiàng)目的數(shù)量除了隨機(jī)性的波動(dòng)外,還有時(shí)間上遞減的趨勢(shì)性的變化,無(wú)法通過(guò)高斯模型來(lái)預(yù)測(cè)子項(xiàng)目的數(shù)量。
指數(shù)加權(quán)平均移動(dòng),又稱指數(shù)平均移動(dòng)(EMA),是平滑有著趨勢(shì)性的不斷波動(dòng)的數(shù)據(jù)的一種方式。
公式(6)所描述的為指數(shù)加權(quán)平均移動(dòng)的一種定義(也有將ema初始值定義為0的情況),其中,xi為標(biāo)量輸入,下標(biāo)i表示第i個(gè)輸入;emai為輸出值,下標(biāo)i表示第i個(gè)輸出;decay表示移動(dòng)的幅度,在0與1之間,decay的值越大,對(duì)于過(guò)去數(shù)據(jù)的權(quán)重也就越大。
由于EMA只能做平滑,而EMA本身難以直接應(yīng)用到預(yù)測(cè),因此需要對(duì)其進(jìn)行改進(jìn)。本文采用了線性模型對(duì)子項(xiàng)目數(shù)量進(jìn)行預(yù)測(cè),并且通過(guò)EMA對(duì)線性系數(shù)進(jìn)行平滑。
具體而言,假設(shè)輸入的樣本數(shù)量為m,且m大于2,那么按照以下算法進(jìn)行預(yù)測(cè):
(1)令計(jì)數(shù)變量i=2;
(2)根據(jù)第一和第二個(gè)樣本,與y=kx+b直線公式,求得斜率為k0,并將ema0=k0。
(3)求得第i個(gè)樣本和第i+1個(gè)樣本之間的直線方程,然后將斜率ki-1當(dāng)作EMA算法的輸入,求得emai-1,緩存截距bi-1。
(4)令i=i+1,若i等于m,則退出算法,輸出最后的ema結(jié)果和緩存的截距;否則回到步驟3。
上述算法平滑了直線的斜率k,使得對(duì)于后續(xù)子項(xiàng)目數(shù)量的預(yù)測(cè)更加平穩(wěn),減少受波動(dòng)的影響。
3 實(shí)驗(yàn)結(jié)果
本文使用的數(shù)據(jù)為近三年(2015-2018),某省電力公司在“煤改電”項(xiàng)目中,電力物資采購(gòu)的數(shù)據(jù),數(shù)據(jù)格式見(jiàn)表 1。
其中,由于保密的原因,已經(jīng)對(duì)敏感數(shù)據(jù)做了處理。假設(shè)一共有相同物料k類,每類含有的數(shù)據(jù)nk條,對(duì)應(yīng)的數(shù)量為pi,下標(biāo)i為在1和nk之間的索引,則:
公式(7)中Ek為每類中的數(shù)量均值,Dk為每類中數(shù)量的方差,zp為歸一化后的新數(shù)量。
隨機(jī)選取其中的部分?jǐn)?shù)據(jù)進(jìn)行可視化。
其中,橫坐標(biāo)是月份,縱坐標(biāo)是歸一化后的數(shù)量??梢钥闯?,每月的數(shù)量分布有著明顯的不同。
經(jīng)過(guò)偏度-峰度測(cè)試,在顯著程度為0.0762的情況下,符合正態(tài)分布。通過(guò)將前2年的數(shù)據(jù)作為訓(xùn)練集,使用高斯模型,對(duì)第3年的數(shù)據(jù)進(jìn)行預(yù)測(cè),并對(duì)實(shí)際的值進(jìn)行比較。
表 2中,均值等于預(yù)測(cè)均值乘以預(yù)測(cè)子項(xiàng)目數(shù)量,標(biāo)準(zhǔn)差等于預(yù)測(cè)標(biāo)準(zhǔn)差,可以看出,根據(jù)3-sigma準(zhǔn)則,所有的實(shí)際值都包括在了2-sigma區(qū)間內(nèi),除了2月、11月和12月外,其他所有的月份都被包括在了1-sigma區(qū)間內(nèi)。而這3個(gè)月份的均值都較小。因此,在實(shí)際進(jìn)行預(yù)測(cè)時(shí),對(duì)于均值較小的月份,可以選擇2-sigma區(qū)間,對(duì)于均值較大的月份,可以選擇1-sigma區(qū)間。
4 總結(jié)
本文針對(duì)“煤改電”電力物資采購(gòu)數(shù)量進(jìn)行研究,將影響采購(gòu)數(shù)量的因素分為某月份中可能的子項(xiàng)目的數(shù)量和每個(gè)子項(xiàng)目中采購(gòu)物資數(shù)量。對(duì)于子項(xiàng)目的數(shù)量,本文采用了EMA平滑斜率的方式進(jìn)行預(yù)測(cè),減少了波動(dòng)對(duì)預(yù)測(cè)造成的影響。對(duì)于子項(xiàng)目中的采購(gòu)數(shù)量,本文使用了高斯概率模型進(jìn)行預(yù)測(cè)。因此,每個(gè)月份的總的預(yù)測(cè)結(jié)果等于每月預(yù)測(cè)均值乘以每月預(yù)測(cè)的子項(xiàng)目數(shù)量,每月預(yù)測(cè)的標(biāo)準(zhǔn)差表示預(yù)測(cè)的數(shù)量波動(dòng)的大小。最后,通過(guò)實(shí)際的數(shù)據(jù),給出了實(shí)驗(yàn)的結(jié)果。
[參考文獻(xiàn)]
[1] 盛驟,謝式千,潘承毅著.概率論與數(shù)理統(tǒng)計(jì)第4版[M].高等教育出版社,2010.
[2] 劉杰,肖紅,王波,等.基于逆高斯幾率模型的心率預(yù)測(cè)算法[J].電子學(xué)報(bào),2008(01).