李望晨,潘慶忠,王培承,安洪慶
(濰坊醫(yī)學(xué)院 數(shù)學(xué)教研室,山東 濰坊 261053)
預(yù)測(cè)是利用歷史統(tǒng)計(jì)資料探求事物變化規(guī)律推測(cè)未來(lái)狀況以指導(dǎo)計(jì)劃與決策。應(yīng)用中可通過(guò)資料采用數(shù)學(xué)和統(tǒng)計(jì)方法建立定量預(yù)測(cè)模型,借助于計(jì)算工具實(shí)現(xiàn)。根據(jù)以往數(shù)據(jù)發(fā)展趨勢(shì)來(lái)預(yù)測(cè)未來(lái)數(shù)據(jù)的方式稱為時(shí)間序列預(yù)測(cè),其特點(diǎn)是根據(jù)預(yù)測(cè)對(duì)象時(shí)序變化特征,研究自身的發(fā)展規(guī)律和探討未來(lái)趨勢(shì)。對(duì)象一般具備歷史數(shù)據(jù)漸近式發(fā)展且波動(dòng)較小;決定過(guò)去或近期事物發(fā)展的因素較穩(wěn)定,很大程度上仍決定其未來(lái)發(fā)展,多用于短期預(yù)測(cè)問(wèn)題?;疑ā⒔M合法[1]、ARIMA法、增長(zhǎng)型曲線法[2]和數(shù)據(jù)挖掘法等均可用于時(shí)間序列預(yù)測(cè),各有適用特點(diǎn)。如果時(shí)間序列數(shù)據(jù)帶有增長(zhǎng)趨勢(shì),可采用增長(zhǎng)型曲線模型進(jìn)行外推預(yù)測(cè),特點(diǎn)是運(yùn)用函數(shù)曲線擬合數(shù)據(jù)變化趨勢(shì)的時(shí)序規(guī)律,建立增長(zhǎng)型曲線預(yù)測(cè)模型。為提高應(yīng)用性能,可根據(jù)實(shí)測(cè)數(shù)據(jù)增長(zhǎng)變化特點(diǎn)與曲線理論增長(zhǎng)性質(zhì)相似程度進(jìn)一步優(yōu)選預(yù)測(cè)模型。
例如,生產(chǎn)總值、財(cái)政預(yù)算、稅收存款、能源消費(fèi)等多數(shù)經(jīng)濟(jì)數(shù)據(jù)的影響因素異常復(fù)雜,指標(biāo)體系難以優(yōu)選或確立,因果預(yù)測(cè)中的非線性建模確實(shí)困難。但是這些復(fù)雜因素短期內(nèi)變化具有慣性或穩(wěn)定性,從而引起經(jīng)濟(jì)數(shù)據(jù)規(guī)律變化,且變化又往往帶有時(shí)序增長(zhǎng)特性。此情況涉及許多領(lǐng)域,因此有必要探討此類預(yù)測(cè)模型的優(yōu)選識(shí)別方法并提高適用性。
常見(jiàn)的四種增長(zhǎng)型曲線模型以及增長(zhǎng)特征性質(zhì)推導(dǎo)結(jié)論,列入表1中。其中t為時(shí)間變量,yt為預(yù)測(cè)指標(biāo)值,ut為其一階差分,a,b,k為模型參數(shù)。
表1 幾種常見(jiàn)增長(zhǎng)型模型及增長(zhǎng)特征性質(zhì)
在應(yīng)用中,要根據(jù)實(shí)測(cè)時(shí)間序列y1,y2,…,yn選取合適的增長(zhǎng)曲線模型。若以殘差平方和最小為模型優(yōu)選準(zhǔn)則,會(huì)過(guò)度擬合歷史數(shù)據(jù),降低趨勢(shì)外推性能。可考慮增長(zhǎng)特征法,將動(dòng)態(tài)序列的差分變化特性與增長(zhǎng)曲線的相應(yīng)特征作比較來(lái)選擇模型,目標(biāo)是以增長(zhǎng)曲線理論變化規(guī)律與實(shí)測(cè)序列實(shí)際變化規(guī)律最接近為優(yōu)選準(zhǔn)則。
應(yīng)用中為消除隨機(jī)干擾,原始數(shù)據(jù)一般要先作平滑預(yù)處理,但滑動(dòng)段太大會(huì)過(guò)度平滑實(shí)測(cè)序列而削弱信息敏感性,處理時(shí)以滑動(dòng)平均值代替序列值yt,以平均差分代替ut差分,可按公式進(jìn)行計(jì)算。然后計(jì)算序列的各種增長(zhǎng)特征,并與曲線增長(zhǎng)特征性質(zhì)結(jié)合識(shí)別模型,見(jiàn)曲線增長(zhǎng)特征對(duì)比表2。
表2 增長(zhǎng)曲線識(shí)別表
增長(zhǎng)曲線模型參數(shù)識(shí)別可用三和法,基本思路是將整個(gè)實(shí)測(cè)序列數(shù)據(jù)分成時(shí)間間隔均相等的三段,由三段觀察值序列之和經(jīng)過(guò)推導(dǎo)運(yùn)算來(lái)估計(jì)模型參數(shù)。以修正指數(shù)曲線yt=k+abt為例,選擇近期實(shí)測(cè)時(shí)間序列數(shù)據(jù)y0,y1,…,yn-1;yn,…,y2n-1;y2n,…,y3n-1順序截取長(zhǎng)度為n的三段,三段求和,并推導(dǎo)得到數(shù)學(xué)性質(zhì):
繼續(xù)推導(dǎo),可得到修正指數(shù)曲線模型的參數(shù)公式:
根據(jù)三和法與曲線性質(zhì)可類似推導(dǎo)Gompertz曲線yt=kabt的參數(shù)公式:
表3 1998~2007年湖北省支出法生產(chǎn)總值時(shí)序表
表4 實(shí)測(cè)序列增長(zhǎng)特征計(jì)算表
支出法生產(chǎn)總值是從最終使用的角度反映一個(gè)地區(qū)一定時(shí)期內(nèi)生產(chǎn)活動(dòng)最終成果的一種方法,反映了本期的生產(chǎn)總值的使用及構(gòu)成。計(jì)算公式為:支出法生產(chǎn)總值=最終消費(fèi)+資本形成總額+貨物和服務(wù)凈出口。最終消費(fèi)包括居民消費(fèi)和政府消費(fèi),指該地區(qū)在一定時(shí)期內(nèi)對(duì)于貨物和服務(wù)全部最終消費(fèi)支出,即本地區(qū)內(nèi)外購(gòu)買(mǎi)的貨物和服務(wù)的支出。資本形成總額指該地區(qū)在一定時(shí)期內(nèi)獲得減去處置的固定資產(chǎn)和存貨的凈額。貨物和服務(wù)凈出口指貨物和服務(wù)出口減貨物和服務(wù)進(jìn)口的差額。
事實(shí)上,決定次年支出法生產(chǎn)總值的最終消費(fèi)、資本形成總額和凈出口等構(gòu)成指標(biāo)數(shù)據(jù)財(cái)會(huì)統(tǒng)計(jì)與核算匯總過(guò)程冗雜、具有時(shí)滯性,計(jì)算支出法生產(chǎn)總值難以實(shí)現(xiàn),間接預(yù)測(cè)困難。但是,可以假定該地區(qū)支出法生產(chǎn)總值構(gòu)成指標(biāo)和影響因素的時(shí)序變化規(guī)律比較穩(wěn)定,未來(lái)一年或兩年繼續(xù)慣性延續(xù)規(guī)律而不會(huì)發(fā)生較大波動(dòng),根據(jù)歷史數(shù)據(jù)資料進(jìn)行外推預(yù)測(cè),就轉(zhuǎn)化為時(shí)間序列預(yù)測(cè)問(wèn)題,因數(shù)據(jù)具有增長(zhǎng)特點(diǎn),可采用增長(zhǎng)型曲線模型,繼續(xù)分析序列實(shí)際增長(zhǎng)特性,優(yōu)選識(shí)別預(yù)測(cè)模型。
實(shí)測(cè)資料應(yīng)選取更能反映近期和未來(lái)發(fā)展變化趨勢(shì)的連續(xù)數(shù)據(jù)段,其規(guī)律越穩(wěn)定,越能反映后續(xù)變化趨勢(shì)則越適用;資料數(shù)據(jù)段選取不宜過(guò)長(zhǎng),太長(zhǎng)會(huì)過(guò)度反映過(guò)去規(guī)律降低外推效果;為消除數(shù)據(jù)波動(dòng)性而過(guò)分平滑序列又會(huì)削弱信息敏感性,應(yīng)注意把握。下面以湖北省為例,湖北省衛(wèi)生統(tǒng)計(jì)年鑒中1998~2006年支出法計(jì)算的地區(qū)生產(chǎn)總值作為參考,見(jiàn)表3,假設(shè)2007年數(shù)據(jù)未知并對(duì)其預(yù)測(cè)。
對(duì)照表2,首先排除簡(jiǎn)單指數(shù)曲線,再?gòu)暮笕N曲線選取,原則是以與t線性相關(guān)程度最明顯的增長(zhǎng)特征所對(duì)應(yīng)的曲線為最優(yōu)預(yù)測(cè)模型。方法如下:分別計(jì)算增長(zhǎng)特征x與時(shí)序t的相關(guān)系數(shù)其中為時(shí)序t的均值,為增長(zhǎng)特征x的均值。將取代x,由表4數(shù)據(jù)依次計(jì)算與t的相關(guān)系數(shù):r1=0.99536,r2=0.99405,r3=-0.99534。比較知實(shí)測(cè)序列的三種增長(zhǎng)特征線性相關(guān)程度都非常好,因此相應(yīng)的三種曲線均可用作預(yù)測(cè)。 又|r1|>|r3|>|r2|,說(shuō)明 lgut與 t線性關(guān)系更密切一些,故修正指數(shù)曲線為優(yōu)選預(yù)測(cè)模型,另從參數(shù)識(shí)別簡(jiǎn)便性角度也最好選修正指數(shù)曲線,而不選Logistic曲線。
下面利用三和法進(jìn)行模型參數(shù)識(shí)別,根據(jù)表3中湖北省1998~2006年共9年支出法生產(chǎn)總值實(shí)測(cè)數(shù)據(jù),令n=3,分別計(jì)算三段和為:Σ1yt=10608.94,Σ2yt=13429.49,Σ3yt=20125.77。代入已選修正指數(shù)曲線模型參數(shù)識(shí)別公式得b=1.334033086,a=498.9808342,k=2852.097947,得湖北省支出法生產(chǎn)總值修正指數(shù)曲線預(yù)測(cè)模型為yt=2852.097947+498.9808342×1.334033086t。 然后令 t=9,根據(jù)預(yù)測(cè)模型可外推得到2007年支出法生產(chǎn)總值預(yù)測(cè)值y9=9529.127101,已知2007年真實(shí)統(tǒng)計(jì)值為9550.04,預(yù)測(cè)誤差為0.22%,說(shuō)明該模型預(yù)測(cè)效果非常好;若再令t=10,可以外推得到2008年預(yù)測(cè)值y10=11759.48。以上采用Matlab軟件作圖演示,見(jiàn)圖2。注:因數(shù)據(jù)量綱大,圖2中實(shí)測(cè)點(diǎn)與擬合曲線偏差不很明顯。
時(shí)間序列預(yù)測(cè)方法通過(guò)擬合歷史數(shù)據(jù)資料規(guī)律建立模型來(lái)進(jìn)行短期外推預(yù)測(cè),長(zhǎng)時(shí)預(yù)測(cè)會(huì)變差。如果令t=11,長(zhǎng)時(shí)預(yù)測(cè)2009年支出法生產(chǎn)總值y11,誤差會(huì)變大。因此最好根據(jù)2000~2008年實(shí)測(cè)數(shù)據(jù)重新優(yōu)選識(shí)別預(yù)測(cè)模型,再作一步外推預(yù)測(cè)。
支出法生產(chǎn)總值數(shù)據(jù)對(duì)國(guó)家和地區(qū)指導(dǎo)經(jīng)濟(jì)決策具有重要意義,因其受各種構(gòu)成指標(biāo)制約,統(tǒng)計(jì)工作冗雜且具有時(shí)滯性,實(shí)時(shí)核算及準(zhǔn)確預(yù)測(cè)均比較困難??紤]到歷史數(shù)據(jù)資料有較好的時(shí)序增長(zhǎng)趨勢(shì)規(guī)律,可將其歸為增長(zhǎng)型時(shí)間序列預(yù)測(cè)問(wèn)題。模型優(yōu)選識(shí)別、改進(jìn)與適用性分析是良好預(yù)測(cè)的前提。本文通過(guò)探討增長(zhǎng)型曲線模型的數(shù)學(xué)性質(zhì)和實(shí)測(cè)序列增長(zhǎng)特性,采用增長(zhǎng)特征法優(yōu)選模型以及三和法識(shí)別參數(shù),以湖北省支出法生產(chǎn)總值為例建立預(yù)測(cè)模型,借助于Excel計(jì)算和Matlab軟件作圖,外推預(yù)測(cè)效果很好。該組合方法適合于具有較強(qiáng)規(guī)律性時(shí)序增長(zhǎng)特點(diǎn)的經(jīng)濟(jì)序列外推預(yù)測(cè)問(wèn)題。
[1]吳航,黃子昌,游斌.關(guān)于經(jīng)濟(jì)時(shí)間序列預(yù)測(cè)的準(zhǔn)確性探討[J].統(tǒng)計(jì)與決策,2009,(1).
[2]秦俠.衛(wèi)生管理運(yùn)籌學(xué)[M].北京:人民衛(wèi)生出版社,2005.