李志鵬 李 薇 劉志杰,3
(1.貴州師范大學(xué)貴州省信息與計(jì)算科學(xué)重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽(yáng) 550001;2.貴州省發(fā)展和改革委員會(huì),貴州 貴陽(yáng) 550001;3.貴州師范大學(xué)網(wǎng)絡(luò)與信息中心,貴州 貴陽(yáng) 550001)
基于組合預(yù)測(cè)模型的產(chǎn)業(yè)總產(chǎn)值的預(yù)測(cè)研究
李志鵬1李 薇2劉志杰1,3
(1.貴州師范大學(xué)貴州省信息與計(jì)算科學(xué)重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽(yáng) 550001;2.貴州省發(fā)展和改革委員會(huì),貴州 貴陽(yáng) 550001;3.貴州師范大學(xué)網(wǎng)絡(luò)與信息中心,貴州 貴陽(yáng) 550001)
對(duì)于預(yù)測(cè)復(fù)雜的經(jīng)濟(jì)數(shù)據(jù)來(lái)說(shuō),選取合適的預(yù)測(cè)模型將是提高預(yù)測(cè)精度的關(guān)鍵。本文采用灰色模型與回歸模型的組合預(yù)測(cè)模型對(duì)貴州省高技術(shù)產(chǎn)業(yè)總產(chǎn)值進(jìn)行預(yù)測(cè),利用了組合模型可以改善線性回歸模型中沒(méi)有考慮指數(shù)增長(zhǎng)以及灰色模型中沒(méi)有考慮線性因素的不足,從而達(dá)到提高預(yù)測(cè)精度的目的。并進(jìn)行了計(jì)算機(jī)數(shù)值仿真實(shí)驗(yàn)表明了組合預(yù)測(cè)模型的有效性。
經(jīng)濟(jì)數(shù)據(jù);預(yù)測(cè);組合預(yù)測(cè)模型
用數(shù)據(jù)挖掘的方法與模型對(duì)經(jīng)濟(jì)數(shù)據(jù)中有趣知識(shí)[1]的挖掘是一項(xiàng)非常復(fù)雜的工作,但它卻可以為我們的政府、企業(yè)及有關(guān)行業(yè)把握未來(lái)的經(jīng)濟(jì)發(fā)展趨勢(shì)、判斷各個(gè)行業(yè)的發(fā)展前景并制定發(fā)展目標(biāo)及發(fā)展戰(zhàn)略等提供具有科學(xué)依據(jù)的指導(dǎo)。在二十世紀(jì)六十年代以來(lái),世界經(jīng)濟(jì)的飛速發(fā)展致使了國(guó)內(nèi)外大量的學(xué)者對(duì)經(jīng)濟(jì)預(yù)測(cè)進(jìn)行了各方面的研究,提出了很多預(yù)測(cè)方法和模型[2],有定量和定性預(yù)測(cè)方法、線性和非線性的預(yù)測(cè)模型,以期達(dá)到預(yù)測(cè)經(jīng)濟(jì)動(dòng)態(tài)的目的。對(duì)于預(yù)測(cè)動(dòng)態(tài)的影響因子較多的經(jīng)濟(jì)數(shù)據(jù)來(lái)說(shuō),其預(yù)測(cè)的質(zhì)量和其所用的數(shù)據(jù)以及預(yù)測(cè)采用的方式是密不可分的。而經(jīng)濟(jì)數(shù)據(jù)具有很強(qiáng)的非線性性,各數(shù)據(jù)之間的相互影響關(guān)系沒(méi)有明確的表達(dá)式,且呈動(dòng)態(tài)波動(dòng)的發(fā)展趨勢(shì)。因此我們選擇什么樣的預(yù)測(cè)方法和模型來(lái)處理數(shù)據(jù)將是我們所要進(jìn)行的預(yù)測(cè)的關(guān)鍵。本文所采用的線性組合預(yù)測(cè)模型[3,4]就是將不同的預(yù)測(cè)模型通過(guò)一定的方法進(jìn)行組合,優(yōu)化兩種模型的不足[5],以期達(dá)到取長(zhǎng)補(bǔ)短的目的,從而提高預(yù)測(cè)結(jié)果的準(zhǔn)確性。并對(duì)貴州省高技術(shù)產(chǎn)業(yè)發(fā)展統(tǒng)計(jì)數(shù)據(jù)集進(jìn)行知識(shí)挖掘,最后對(duì)此模型做出分析和模擬評(píng)估。
2.1 灰色預(yù)測(cè)模型
若有一原始數(shù)據(jù)序列樣本為x(0)={x(0)(1),x(0)(2)…x(0)(n)},定義其累加生成序列公式為x(1)(k)=∑ki=1x(0)(i)(k=1,2…n),經(jīng)過(guò)累加生成的序列為{x(0)(1),x(0)(1)+x(0)(2)…x(0)(1)+x(0)(2)+…x(0)(n)},累加生成后的序列可以弱化原序列的隨機(jī)性。經(jīng)累加后的數(shù)據(jù)序列通過(guò)下述式(1)一階微分方程的演化即可得到灰色預(yù)測(cè)模型[6]:
其中a稱為發(fā)展灰數(shù),u稱為內(nèi)生控制灰數(shù)。
可以將式(1)轉(zhuǎn)化成為差分方程:
則有Y=Bb,根據(jù)微分方程的解的形式可以求得b=(BTB)-1BTY,將此值代入(1)式中得出灰色預(yù)測(cè)模型:
可求得還原值
其中k=0,1,2,…
2.2 線性回歸模型
對(duì)于一元的線性回歸模型其形式為y=β0+β1x+ε其中β0,β1是未知的真實(shí)回歸系數(shù),ε是誤差項(xiàng),多元回歸模型是對(duì)一元回歸模型的擴(kuò)展,其形式為:
將
(2)式簡(jiǎn)化為Y=XB+ε,其中Y=y,X=[1,x1,x2,…xn],B=[β0,β1,β2,…βn]T。
若考慮一個(gè)容量為m組的數(shù)據(jù)集X1,X2,…Xm,則令Xi= [1,x1i,x2i,…xni],i=1,2…m。則有Y=[y1y2… ym]T,X為有m組數(shù)據(jù)的矩陣,B=[β0,β1,β2,…βn]T,ε=[ε1,ε2,…εm]T。ε是誤差項(xiàng),對(duì)其做出如下假設(shè)[7]:ε是一個(gè)期望為零的隨機(jī)變量,ε的方差σ2是常數(shù)且與x1,x2,…xn的值無(wú)關(guān),ε是一個(gè)正態(tài)隨機(jī)變量且是相互獨(dú)立的。根據(jù)上述誤差項(xiàng)假設(shè)可以推導(dǎo)出目標(biāo)變量y的分布:
1)E(y)=E(β0+β1x1+β2x2+…+βnxn+ε)=E(β0)+E(β1x1)+ E(β2x2)+…+E(βnxn)+E(ε)=β0+β1x1+β2x2+…+βnxn即對(duì)于任意的x1,x2,…xn取值,擬合值y的均值落在擬合回歸線上。
2)對(duì)于任意的x1,x2,…xn取值,目標(biāo)變量y的方差不變。
3)對(duì)于任意的x1,x2,…xn取值,目標(biāo)變量y的值是相互獨(dú)立的且是一個(gè)正態(tài)隨機(jī)變量。
對(duì)于β0,β1,β2,…βn模型參數(shù),其真實(shí)值可通過(guò)最小二乘法來(lái)估計(jì)。設(shè)目標(biāo)變量的觀察值為yi,經(jīng)回歸模型求得的擬合值為y'i=xiB',令e=[ε1,ε2,…εm]T,殘差為觀察值與擬合值之差,記為ei=yi-y'i,則有e=Y-XB',可以求得eTe=(Y-XB')T(YXB')=YTY-2B'TXTY+B'TXTXB'。根據(jù)最小二乘法要求得一個(gè)使得YTY-2B'TXTY+B'TXTXB'最小的一個(gè)B',即求得一個(gè)使YTY-2B'TXTY+B'TXTXB'式中對(duì)B'求偏導(dǎo)為0時(shí)成立的一個(gè)B'的值,化簡(jiǎn)偏導(dǎo)方程可得參數(shù)為B'=(XTX)-1XTY。
2.3 組合預(yù)測(cè)模型
自上個(gè)世紀(jì)中葉,Schmitt第一次用組合預(yù)測(cè)的方法對(duì)人口數(shù)量進(jìn)行了預(yù)測(cè)以來(lái),世界各國(guó)的科學(xué)家、學(xué)者紛紛對(duì)各模型的組合進(jìn)行了大量的研究,提出了許多有效的組合方法和新的組合模型。組合預(yù)測(cè)模型的原理就是將不同的預(yù)測(cè)模型采用某種特定的方式將他們結(jié)合起來(lái),以達(dá)到取長(zhǎng)補(bǔ)短的目的,從而提高預(yù)測(cè)結(jié)果的準(zhǔn)確性的目的。本文所采用的灰色模型與線性回歸模型的組合模型正是利用了這兩個(gè)模型的組合可以改善線性回歸模型以及灰色模型中所存在的不足并可以提高預(yù)測(cè)精度。
組合預(yù)測(cè)模型一般可以分為兩種類型:線性組合和非線性組合。各界學(xué)者對(duì)于線性組合預(yù)測(cè)模型是研究很多,其應(yīng)用也較廣泛。建立線性組合預(yù)測(cè)模型的一個(gè)關(guān)鍵問(wèn)題是對(duì)組合權(quán)重進(jìn)行優(yōu)化,且組合預(yù)測(cè)模型的精度僅與組合權(quán)重有關(guān)[8],因此本文應(yīng)該根據(jù)回歸預(yù)測(cè)模型以及灰色預(yù)測(cè)模型各自的特點(diǎn),對(duì)組合權(quán)重進(jìn)行選取,以期達(dá)到充分結(jié)合兩種模型的優(yōu)勢(shì)的目的。本文采用加權(quán)算術(shù)平均組合將灰色模型和回歸模型兩種預(yù)測(cè)模型的預(yù)測(cè)結(jié)果進(jìn)行組合,從而得到新的組合預(yù)測(cè)模型。對(duì)兩種模型的線性組合預(yù)測(cè)模型的描述如下:
設(shè)某預(yù)測(cè)問(wèn)題的實(shí)際值序列為Y(tt=1,2,…n),灰色預(yù)測(cè)模型與回歸預(yù)測(cè)模型的預(yù)測(cè)值分別為Y'1t、Y'(2tt=1,2,…n),加權(quán)系數(shù)記為ω1、ω2且滿足條件ω1+ω2=1和ω1,ω2≥0,將組合預(yù)測(cè)值記為Y('tt=1,2,…n),即要使得Y't對(duì)于預(yù)測(cè)值Y'1t、Y'2t越逼近越好。設(shè)加權(quán)算術(shù)平均組合預(yù)測(cè)模型的性能指標(biāo)為:min Jt=∑2j=1ωj(Y't-Y'jt)2t=1,2,…n;令整理可得:Y't=ω1Y'1t+ω2Y'2tt=1,2,…n
模型中Y'1t、Y'2t都為預(yù)測(cè)之后的確定值,可以建立二次規(guī)劃模型來(lái)確定ω1、ω2,其中要符合以下幾條規(guī)則:min J't=∑2t=1(Yt-Y't)2、ω1+ω2=1、ω1,ω2≥0。
本文以貴州省高技術(shù)產(chǎn)業(yè)發(fā)展主要經(jīng)濟(jì)指標(biāo)發(fā)展數(shù)據(jù)來(lái)檢驗(yàn)通過(guò)上述步驟建立的組合預(yù)測(cè)模型,分別利用回歸預(yù)測(cè)模型、灰色預(yù)測(cè)模型以及線性組合模型優(yōu)化兩個(gè)單項(xiàng)預(yù)測(cè)模型來(lái)進(jìn)行預(yù)測(cè)。以2006-2010年的數(shù)據(jù)為基礎(chǔ)來(lái)預(yù)測(cè)2011-2013年的貴州省高技術(shù)產(chǎn)業(yè)總產(chǎn)值。貴州省高技術(shù)產(chǎn)業(yè)主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù)表(部分)見(jiàn)表1。
表1 貴州省高技術(shù)產(chǎn)業(yè)主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù)表(部分) 單位:萬(wàn)元
3.1 灰色預(yù)測(cè)模型的實(shí)例建模
3.2 回歸預(yù)測(cè)模型的實(shí)例建模
將表1中的數(shù)據(jù)化為億元單位,利用上述的B'=(XTX)-1XTY公式求得多元回歸預(yù)測(cè)模型的參數(shù)。得到預(yù)測(cè)模型為:y=-7.3791+0.1121x1+2.8659x2+1.2584x3
3.3 組合預(yù)測(cè)模型的實(shí)例建模
根據(jù)上述組合預(yù)測(cè)模型y=ω1y1+ω2y2以及權(quán)重系數(shù)的求解方法和約束條件求得權(quán)重系數(shù)ω1,ω2為(0.0637,0.9363)則可得到組合預(yù)測(cè)模型為y=0.5793 y1+0.4207y2
利用上述的三個(gè)模型進(jìn)行數(shù)據(jù)預(yù)測(cè),結(jié)果見(jiàn)下表2,本文采用相對(duì)誤差百分比絕對(duì)值來(lái)作為評(píng)價(jià)指標(biāo)。
表2 預(yù)測(cè)結(jié)果比較 單位:萬(wàn)元
從表2中的結(jié)果可以看出本文提出的線性組合模型對(duì)于優(yōu)化灰色模型與回歸模型的單項(xiàng)預(yù)測(cè)方法起到了積極的作用,組合預(yù)測(cè)模型的預(yù)測(cè)結(jié)果較任一單項(xiàng)模型的預(yù)測(cè)結(jié)果在精度上有了明顯改善。
任一單項(xiàng)的預(yù)測(cè)模型在某個(gè)特定的預(yù)測(cè)數(shù)據(jù)集上都有其優(yōu)勢(shì),也存在一定的局限性[9],灰色預(yù)測(cè)模型主要適用于單一的指數(shù)增長(zhǎng)數(shù)序列,對(duì)其中出現(xiàn)的數(shù)據(jù)突變及異常的情況并不能作出很好的處理;回歸模型是早期的發(fā)展的比較成熟的理論,它根據(jù)數(shù)據(jù)序列本身的連續(xù)性、相關(guān)性以及規(guī)律性等,在各影響因素相對(duì)平穩(wěn)的情況下進(jìn)行的預(yù)測(cè),卻考慮不到指數(shù)增長(zhǎng)趨勢(shì),對(duì)長(zhǎng)期的數(shù)據(jù)預(yù)測(cè)往往效果不理想。二者的組合模型綜合了二個(gè)單項(xiàng)預(yù)測(cè)的優(yōu)勢(shì),取長(zhǎng)補(bǔ)短改善了改善線性回歸模型中并不能顧及的指數(shù)增長(zhǎng)以及灰色模型中沒(méi)有線性因素的不足。本文采用灰色預(yù)測(cè)與回歸預(yù)測(cè)的組合模型對(duì)貴州省高技術(shù)產(chǎn)業(yè)的總產(chǎn)值進(jìn)行了預(yù)測(cè),實(shí)例預(yù)測(cè)數(shù)據(jù)表明:二者的組合預(yù)測(cè)明顯優(yōu)于單獨(dú)的預(yù)測(cè)模型的預(yù)測(cè)精度,在預(yù)測(cè)高技術(shù)產(chǎn)業(yè)發(fā)展總產(chǎn)值方面有實(shí)際的應(yīng)用意義。
[1]Jiawei Han,Micheline Kamber.?dāng)?shù)據(jù)挖掘:概念與技術(shù).范明,孟小峰譯[M].北京:機(jī)械工業(yè)出版社,2012.
[2]唐小我.預(yù)測(cè)理論及其應(yīng)用[M].成都:電子科技大學(xué)出版社,1992.
[3]Bates.J.M,Granger.C.W.J.The Combination of Forecasts.Operations Research Quarterly,1969, 20(4):451-468.
[4]甘健勝,陳國(guó)龍.線性組合預(yù)測(cè)模型及其應(yīng)用[J].計(jì)算機(jī)科學(xué),2006, 33(9):191-194.
[5]Bann.D.W.Forecasting with More than one Model.Journal of Forecasting.1989,8(3):161-166.
[6]鄧聚龍.灰色系統(tǒng)經(jīng)濟(jì)與社會(huì)[M].北京:國(guó)防工業(yè)出版社,1985.
[7]Daniel T.Larose.?dāng)?shù)據(jù)挖掘方法與模型.劉燕權(quán),胡塞全,馮新平等譯[M].北京:高等教育出版社,2011.
[8]馬永開(kāi),唐小我.線性組合預(yù)測(cè)模型優(yōu)化問(wèn)題研究[J].系統(tǒng)工程理論與實(shí)踐,1998,18(9):110-114.
[9]許秀莉,羅鍵.一種新的組合灰色神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型[J].廈門(mén)大學(xué)學(xué)報(bào),2002,41(2):164-167.
Industrial Output Prediction Research Based on Combination Forecasting Model
Li Zhipeng1Li Wei2Liu Zhijie1,3
(1.Key Laboratory of Information and Computing Science of Guizhou Province,Guizhou Normal University,Guiyang 550001,Guizhou; 2.Guizhou Province Development and Reform Commission,Guiyang 550001,Guizhou; 3.Network and Information Center of Guizhou Normal University,Guiyang 550001,Guizhou)
act】For predicting complex economic data,selecting suitable prediction model is the key to improve the prediction accuracy.This paper uses the combination of grey model and regression model to predict the high technology industry output in Guizhou. Taking the advantages of this combination model can improve the linear regression model by considering the exponential growth and improve the grey model by considering the linear factor,so as to achieve the goal of improving the prediction accuracy.And the computer numerical simulation results show the effectiveness of the combination forecasting model.
economic data;prediction;combination forecasting model
TP39
A
:1008-6609(2015)03-0062-03
李志鵬,男,湖南雙峰人,碩士研究生,研究方向:計(jì)算機(jī)應(yīng)用。
基于U-系列標(biāo)準(zhǔn)的電子政務(wù)應(yīng)用解決方案,項(xiàng)目編號(hào):2011BAH14B04。