呂丹丹,顧巧祥,邢 超
(中國計量大學 質(zhì)量與安全工程學院,浙江 杭州310018)
二次指數(shù)平滑法優(yōu)化馬爾科夫預測模型
呂丹丹,顧巧祥,邢 超
(中國計量大學 質(zhì)量與安全工程學院,浙江 杭州310018)
馬爾科夫預測模型具有“無后效性”,即預測未來的銷售情況只與當前的銷售數(shù)據(jù)有關(guān),而與過去的銷售數(shù)據(jù)無關(guān).事實上,過去不同的時間點對當前的銷售結(jié)果會有不同程度的影響.而指數(shù)平滑法恰好彌補了馬爾科夫預測模型的缺點,它認為最近的過去銷售數(shù)據(jù),在某種程度上會持續(xù)到未來.因此本文利用二次指數(shù)平滑系數(shù)法優(yōu)化馬爾科夫預測模型,并以某品牌電動車的銷售情況為例進行驗證,發(fā)現(xiàn)優(yōu)化后預測模型的絕對誤差均小于馬爾科夫模型的預測結(jié)果.由此得出結(jié)論,基于二次指數(shù)平滑法優(yōu)化的馬爾科夫預測模型具有可行性.
馬爾科夫鏈;狀態(tài)轉(zhuǎn)移概率;二次指數(shù)平滑法;銷售預測
Abstract: Markov has “no aftereffect”, which means that future sales will only be related to the current sales data, not to the past sales figures. In fact, different time points in the past have different degrees of impact on current sales results. The exponential smoothing, which makes up for the shortcomings of the Markov prediction model, suggests that recent past sales data, in some ways, will influence the future. In this paper, the quadratic exponential smoothing coefficient method is used to optimize the Markov prediction model, and is verified with some brand electric car sales. It was found that the absolute error of the optimized prediction model was less than the predicted results of Markov models. Therefore, it is concluded that the Markov prediction model based on the quadratic exponential smoothing method is feasible.
Keywords: Markov Chain; transition probability matrix; secondary exponential smoothing; sales forecast
馬爾科夫鏈,因安德烈·馬爾科夫(A.A.Markov,1856-1922)得名,是指數(shù)學中具有馬爾科夫性質(zhì)的離散時間隨機過程.該過程中,在給定當前知識或信息的情況下,過去(即當前以前的歷史狀態(tài))對于預測將來時無關(guān).因此,馬爾科夫鏈可用來對現(xiàn)實中的許多具有無后效性特點的事物進行預測.國內(nèi)外眾多學者應用馬爾科夫鏈進行了各種研究和預測,張浩[1],劉愛紅[2]等人在醫(yī)藥方面應用馬爾科夫鏈預測藥物轉(zhuǎn)運時間及評價藥物經(jīng)濟性;張家善[3]等人應用馬爾科夫鏈預測了港口的吞吐量情況;鐘國敏[4]等人應用馬爾科夫鏈分析研究了土地利用的動態(tài)演變情況.隨著馬爾科夫模型的不斷發(fā)展,更多的學者將其與其他數(shù)學理論結(jié)合應用,使馬爾科夫模型的預測結(jié)果更加精準.劉春月[5]在預測物流需求時,用灰色模型對馬爾科夫預測得到的結(jié)果進一步分析研究,發(fā)現(xiàn)最終的預測精度比單一的預測精度有很大的提高;文士發(fā)[6]提出了一種新的計算轉(zhuǎn)移概率的方法來改進馬爾科夫鏈預測模型,經(jīng)實例驗證表明改進的模型比原模型的預測精度更高.目前,馬爾科夫模型的發(fā)展雖趨于成熟,但仍存在不足.在預測過程中,其預測結(jié)果只與當前的數(shù)據(jù)及狀態(tài)轉(zhuǎn)移概率矩陣相關(guān),忽略了歷史數(shù)據(jù)的影響.因此,本文的研究目的是為了能夠得到更好的預測精度,引入二次指數(shù)平滑法優(yōu)化馬爾科夫鏈的預測模型,使得歷史數(shù)據(jù)對預測結(jié)果具有一定的影響.
1.1 馬爾科夫鏈的定義
假設(shè)馬爾科夫過程{Xn,n∈T}的參數(shù)集T是離散的時間集合,即T={0,1,2,…},其相應Xn可能取值的全體組成的狀態(tài)空間是離散的狀態(tài)集I={i0,i1i2…}.若隨機過程{Xn,n∈T}對于任意的非負整數(shù)n∈T和任意的i0,i1,i2…in+1∈I,其條件概率滿足:P={Xn+1=in+1|X0=io,X1=i1,…,Xn=in}=
{Xn+1=in+1|Xn=in}.
(1)
則稱{Xn,n∈T}為馬爾科夫鏈,簡稱馬氏鏈.
1.2 狀態(tài)轉(zhuǎn)移概率
條件概率P{Xn+1=j|Xn=i|}的直觀含義為系統(tǒng)在時刻處于狀態(tài)的條件下,在時刻n+1系統(tǒng)處于狀態(tài)的概率.記此條件概率
Pij(n)=P{Xn+1=j|Xn=i}
(2)
為馬爾科夫鏈{Xn,n∈T}在時刻n的一步轉(zhuǎn)移概率,簡稱轉(zhuǎn)移概率,其中i,j∈I.
一般地,計算轉(zhuǎn)移矩陣步驟如下:
(1)對原始數(shù)據(jù)分組,即數(shù)據(jù)離散化.
(2)計算初始概率.假設(shè)時間序列
X={x1,x2,…,xn}.
有n個觀測值,其中Xn未知.被劃分為r個狀態(tài).
E={e1,e2,…,er}.
若有ci數(shù)據(jù)落在ei中(∑ci=n-1),則狀態(tài)發(fā)生的概率為
(3)
(3)計算一步轉(zhuǎn)移概率.落在中的數(shù)據(jù)有ci個,下一時刻轉(zhuǎn)移到ei的數(shù)據(jù)有cij,所以ei一步轉(zhuǎn)移到ej的轉(zhuǎn)移概率為
(4)
1.3 馬爾科夫預測模型
已知初始狀態(tài)概率S(t)以及一步轉(zhuǎn)移狀態(tài)概率p,則下一狀態(tài)的馬爾科夫預測值為
S(t+1)=S(t)·P.
(5)
同理,后期的預測值為:
S(t+2)=S(t)·P2,
S(t+n)=S(t)·pn.
(6)
指數(shù)平滑法(exponential smoothing,ES)是布朗(Robert G.Brown)提出.布朗認為時間序列的態(tài)勢具有穩(wěn)定性或規(guī)則性,所以時間序列可被合理地順勢推延;他認為最近的過去態(tài)勢,在某種程度上會持續(xù)到未來,所以將較大的權(quán)數(shù)放在最近的資料.
根據(jù)平滑次數(shù)的不同,指數(shù)平滑法分為:一次指數(shù)平滑法、二次指數(shù)平滑法及三次指數(shù)平滑法,他們的區(qū)別如表1.
表1三種指數(shù)平滑法的區(qū)別
Table 1 Difference between three exponential smoothing methods
區(qū)別一次指數(shù)平滑法二次指數(shù)平滑法三次指數(shù)平滑法發(fā)展趨勢無明顯的趨勢變化具有線性趨勢變化二次曲線趨勢變化
本文主要針對的是對制造業(yè)產(chǎn)品進行預測,所以產(chǎn)品的發(fā)展趨勢是根據(jù)現(xiàn)有的科技手段呈線性趨勢在逐漸提高的,因此選擇二次指數(shù)平滑法進行后期的計算.
2.1 二次指數(shù)平滑法
當數(shù)據(jù)從某時期開始具有直線趨勢,且認為未來時期會按此直線趨勢變化的時候,用一次指數(shù)平滑法就不能得到較好的預測結(jié)果,會有滯后偏差.這時對依次平滑進行修正,即再做一次指數(shù)平滑,稱之為二次指數(shù)平滑.計算公式如下:
(7)
2.2 指數(shù)平滑系數(shù)α的確定
在指數(shù)平滑法預測中,α即指數(shù)平滑系數(shù)的確定對整個精度有著非常重要的影響.α越大,距離預測狀態(tài)越近的數(shù)據(jù)占有的成分越大.從理論角度看,α的取值范圍在0~1之間,選取原則是預測誤差越小,精度越高.
本文擬借助excel求解α(0<α<1)的值.在excel中有數(shù)據(jù)分析工具——指數(shù)平滑法確定這一選項,首先隨機選取不同的α值,并計算各值對應的絕對誤差,根據(jù)誤差越小α值越優(yōu)為原則縮小α值的選取范圍;隨后對在范圍內(nèi)隨機選取α值,再比較絕對誤差,以此類推(一般α值精確到百分位或十分位即可);最后絕對誤差值最小者即為最優(yōu)α值.
3.1 模型概述
在運用歷史數(shù)據(jù)預測下一狀態(tài)發(fā)展趨勢時,不考慮各時間段對預測結(jié)果的權(quán)重問題,可能會導致預測結(jié)果誤差偏大的現(xiàn)象.而二次指數(shù)平滑法,可以根據(jù)與當前時間的遠近進行加權(quán)運算,使得距離當前越近的數(shù)據(jù),對預測值的影響愈大;反之,距離當前時間越遠的數(shù)據(jù),對預測結(jié)果影響越小.所以,本文將二次指數(shù)平滑法與馬爾科夫鏈這兩種預測方法相結(jié)合,提出一種改進的馬爾科夫鏈模型.
在改進的馬爾科夫鏈模型中,使用當前狀態(tài)以及與當前狀態(tài)緊鄰的兩個歷史狀態(tài)的加權(quán)和來預測下一個狀態(tài).權(quán)重的分配采用二次指數(shù)平滑法,按其原則依時間從近到遠,權(quán)值呈指數(shù)遞減.具體公式如下:
α(1-α)2St-2P3.
(8)
對公式(8)進一步變換,可得
(9)
3.2 模型算法描述
綜上所述,采用改進后的馬爾科夫模型預測下一狀態(tài)的計算流程如圖1.
圖1 改進的馬爾科夫模型預測下一狀態(tài)的流程圖Figure 1 Improved Markov model predicts the flow chart of the next state
其中,數(shù)據(jù)離散化實際上就是根據(jù)某種相似性或者相異性對數(shù)據(jù)進行分類.
基于以上對模型的描述,本文將借助excel和matlab工具分別來確定α值以及求解最終的預測值.下面以預測某新藝電動車零售店的銷售情況為例,來驗證本文提出模型的有效性.
每個品牌的電動車通常會根據(jù)其性能或外觀等不同,生產(chǎn)不同系列的子產(chǎn)品以應對市場的不同的需求.例如華為手機,其旗下?lián)碛袠s耀系列、mate系列及P系列等不同的子產(chǎn)品,為應對不同的消費群體、不同的用戶需求.新藝電瓶車根據(jù)不同的用戶需求,生產(chǎn)不同的車型來供不同人群使用,主要有電動摩托車和電動三輪車,而電動摩托車又分為豪華款、簡約款、一度寬頻等系列,每個系列又會根據(jù)配置的不同進行細分.本文主要以新藝電動車旗下的豪華款系列中的戰(zhàn)威、戰(zhàn)影、戰(zhàn)迪、戰(zhàn)神等12種款式為依據(jù),在已知某零售店2016年1-11月份的實際銷售情況,來預測12月份該12種款式銷售的概率情況.
已知2016年1-11月份該零售店銷售12種電動摩托車共115輛,統(tǒng)計各月份的各狀態(tài)數(shù),建立狀態(tài)空間,如表2.
表2 2016年1-11月份的各狀態(tài)數(shù)統(tǒng)計
其次根據(jù)已有的狀態(tài)空間及式(3)可以計算各個狀態(tài)的初始概率S0:
然后,根據(jù)式(4)計算出各狀態(tài)一步轉(zhuǎn)移概率:
同時,在excel中運用指數(shù)平滑數(shù)據(jù)分析,通過選取不同的α值,來比較預測值與真值間的絕對誤差大小,誤差越小者,則其對應的α值為最優(yōu).通過最終結(jié)果比較,可以得到,當α=0.99時,絕對誤差最小,因此,選取此α值作為最終指數(shù)平滑系數(shù).
最后,根據(jù)公式(5)和(8)分別求解2016年9至11月份馬爾科夫模型預測值及基于二次指數(shù)平滑法優(yōu)化的馬爾科夫模型預測值(如表3、表4),并與真值作比較(表格中的誤差為絕對誤差),分析優(yōu)化后的模型精度是否更好.
表3 2016年9-11月份馬爾科夫模型預測值
由表3可求得9月、10月及11月的平均絕對誤差,分別為5.28%、5.60%、5.76%.
表42016年9~11月份基于二次指數(shù)平滑法的馬爾科夫預測值
Table 4 Markov forecast based on the second exponential smoothing method in September and November 2016
E1E2E3E4E5E6E7E8E9E10E11E12Y(9)0.106000.106000.10600.1590000.159000.31800.0530S(9)0.032700.11180.04910.06370.07340.04740.00100.10430.06690.12880.0351誤差0.073300.00580.04910.04230.08560.04740.00100.05470.06690.18920.0179Y(10)000.33600.05600.11200.1680000.168000.05600.1120S(10)0.043200.18060.08800.12690.10820.06130.02110.12710.07430.12620.0495誤差0.043200.15540.03200.01490.05980.06130.02110.04090.07430.07020.0625Y(11)0.09100000.18200.09100.091000.09100.18200.18200.0910S(11)0.049200.19700.05110.12090.11240.08710.00020.13820.00980.19450.0481誤差0.041800.19700.05110.06110.02140.00390.00020.04720.17220.01250.0429
由4可求得9月、10月及11月的平均絕對誤差,分別為5.27%、5.29%、5.43%.
綜上所述可以發(fā)現(xiàn),基于二次指數(shù)平滑法優(yōu)化的馬爾科夫預測模型的預測結(jié)果精度更高.因此,采用新模型預測新藝電動車旗下品牌各狀態(tài)12月份的分布情況,如表5.
表5 2016年12月份基于二次指數(shù)平滑法的馬爾科夫預測值
預測結(jié)果表明,12月份最暢銷的三款分別為E3、E6、E11,即戰(zhàn)迪、戰(zhàn)將和勁跑,所占比重分別為13.74%、10.65%及11.61%.因新模型的有效性,所以預測結(jié)果能夠為零售店提供一定的銷售依據(jù),使零售商提前應對市場,做好準備.
本研究將二次指數(shù)平滑法引入到馬爾科夫預測模型中,二次指數(shù)平滑法的核心理論是最近的過去態(tài)勢,在某種程度上會持續(xù)到未來,所以將較大的權(quán)數(shù)放在最近的資料;而馬爾科夫鏈最重要的性質(zhì)是在給定當前知識或信息的情況下,過去(即當前以前的歷史狀態(tài))對于預測將來時是無關(guān)的.因此,結(jié)合二者的優(yōu)點,使兩種方法在預測功能上得到互補,從而提高了預測的精度.本文提出的模型主要應用于制造業(yè)領(lǐng)域,不僅可預測其最終產(chǎn)品的銷售情況還可以預測在制造過程中零部件的使用情況.但不論是馬爾科夫預測模型還是二次指數(shù)平滑系數(shù)法,二者均適用于短期預測,因此該模型也主要適用于短期預測.文中最后以電動車為例的驗證結(jié)果表明,基于二次指數(shù)平滑法優(yōu)化馬爾科夫預測模型達到了預期結(jié)果,起到了優(yōu)化的作用,同時驗證了新預測模型的可行性,今后還可將其應用于其他領(lǐng)域預測,以更好地滿足用戶需求.
[1] 張浩,黃泰康.藥物經(jīng)濟學評價中馬爾可夫模型的優(yōu)化——馬爾可夫決策模型[J].藥物經(jīng)濟學,2008,19(17): 1284-1286.ZHANG H,HUANG T K.An optimization of Markov model in the evaluation of drug economics:Markov decision model [J].PharmaceuticalEconomics,2008,19(17) :1284-1286.
[2] 劉愛紅,楊光.應用馬爾科夫鏈計算藥物運轉(zhuǎn)時間和穩(wěn)態(tài)藥量[J].沈陽師范大學學報,2016,34(1):57-61. LIU A H,YANG G.Use Markov chain to calculate the operation time and steady state medicine [J].JournalofShenyangUniversity,2016,34(1):57-61.
[3] 張家善,林曉群.基于馬爾科夫鏈的港口吞吐量區(qū)間預測模型研究[J].數(shù)學的實踐與認識,2016,46(15):159-164. ZHANG J S,LIN X Q.Based on Markov chain's port throughput interval prediction model research [J].JournalofMathematicsinPracticeandTheory,2016,46(15):159-164.
[4] 鐘國敏,張學雷,段金龍.利用馬爾科夫過程預測鄭州市土地利用的動態(tài)演變[J].河南農(nóng)業(yè)大學學報,2011,45(6):696-701. ZHONG G M,ZHANG X L,DUAN J L.The use of Markov process to predict the dynamic evolution of land use in Zhengzhou [J].JournalofHenanAgriculturalUniversity,2011,45(6):696-701.
[5] 劉春月.物流需求量灰色——馬爾科夫鏈預測模型分析研究[J].物流科技,2016(10) :11-14. LIU C Y.Logistics demand gray : Markov chain prediction model analysis and research [J].LogisticsSCI-Tech,2016(10) :11-14.
[6] 文士發(fā),徐梅,王福林.一種估算馬爾科夫狀態(tài)轉(zhuǎn)移概率矩陣的新方法[J].數(shù)學的實踐與認識,2014,44(8):164-168. WEN S F,XU M,WANG F L.A new method of estimating Markov state transition probability matrix [J].JournalofMathematicsinPracticeandTheory,2014,44(8):164-168.
OptimizationonMarkovpredictionmodelswiththesecondexponentialsmoothingmethod
LYU Dandan, GU Qiaoxiang, XING Chao
(College of Quality and Safety Engineering, China Jiliang University, Hangzhou 310018, China)
2096-2835(2017)03-0334-06
10.3969/j.issn.2096-2835.2017.03.011
2017-06-29 《中國計量大學學報》網(wǎng)址zgjl.cbpt.cnki.net
浙江省自然科學基金資助項目(No.LY14E050024).
TP39
A