郭海艷, 李燕飛, 吳 濤,b
(安徽大學(xué)a.數(shù)學(xué)科學(xué)學(xué)院,b.計(jì)算機(jī)智能與信號(hào)處理教育部重點(diǎn)實(shí)驗(yàn)室,安徽 合肥 230039)
對(duì)安徽省GDP的精準(zhǔn)預(yù)測(cè)對(duì)于安徽省未來經(jīng)濟(jì)規(guī)劃和城市建設(shè)都具有重要指導(dǎo)意義。單一的單項(xiàng)預(yù)測(cè)模型容易造成部分有用信息丟失,1969年,Bates J.M 和Granger C.W.J[1]首次提出了組合預(yù)測(cè)的概念,組合預(yù)測(cè)模型具有信息互補(bǔ)性,提高了預(yù)測(cè)結(jié)果的精準(zhǔn)度和可靠度。唐小我[2]認(rèn)為不同的模型都能提供不同的有用信息,組合預(yù)測(cè)模型能夠綜合利用這些信息,并且闡述了加權(quán)系數(shù)對(duì)于組合預(yù)測(cè)的重要意義,證明了非負(fù)最優(yōu)加權(quán)系數(shù)向量的確定問題的解存在且唯一的問題[3]。張?zhí)柕萚4]指出了在數(shù)據(jù)量較小且僅部分信息已知時(shí),將GM(1,1)模型與其他模型結(jié)合起來的優(yōu)越性。本文首先在鄰近度[5]的概念指出其計(jì)算中的不足并對(duì)其進(jìn)行改進(jìn),提出了次鄰近度的概念,對(duì)樣本數(shù)據(jù)分別采用指數(shù)預(yù)測(cè)、一元線性回歸預(yù)測(cè)、GM(1,1)灰色預(yù)測(cè)模型三種單項(xiàng)預(yù)測(cè)模型,用線性規(guī)劃方法以次鄰近度最大為目標(biāo)計(jì)算出各單項(xiàng)預(yù)測(cè)權(quán)重,建立基于次鄰近度的線性平均組合預(yù)測(cè)模型,充分利用了三種單項(xiàng)預(yù)測(cè)結(jié)果的差異,有效提高了預(yù)測(cè)精度。
在上述的鄰近度定義中,若預(yù)測(cè)誤差εt過大,則會(huì)導(dǎo)致φ(εt)非常小,可能會(huì)使得出的結(jié)果超出計(jì)算機(jī)的計(jì)算能力且求得的鄰近度數(shù)值不便于比較。因此為了保證求解過程的可行性,需要對(duì)εt進(jìn)行標(biāo)準(zhǔn)化處理,使φ(εt)落入一個(gè)特定的區(qū)間?;诖藢?duì)鄰近度做出以下改進(jìn)。令a表示與最大誤差值有關(guān)的調(diào)節(jié)變量,若實(shí)際值與預(yù)測(cè)值的最大誤差數(shù)量級(jí)達(dá)到100,則令調(diào)節(jié)變量a=1002,若實(shí)際值與預(yù)測(cè)值的最大誤差數(shù)量級(jí)達(dá)到1000,則調(diào)節(jié)變量a=10003,基于標(biāo)準(zhǔn)化原始數(shù)據(jù)的思想提出次鄰近度的概念如下:
文獻(xiàn)[5]提出的鄰近度的3個(gè)性質(zhì)次鄰近度同樣滿足。
在上式中,t表示某一時(shí)刻,t=1,2,…N,xt表示第t時(shí)刻的實(shí)際值,xit表示第i種預(yù)測(cè)方法在第t時(shí)刻的預(yù)測(cè)值,bit表示第i中預(yù)測(cè)方法在第t時(shí)刻的預(yù)測(cè)精度,i=1,2,…m。
線性組合預(yù)測(cè)模型為
(1)
在上式中,ft為在t時(shí)刻集結(jié)了m種單項(xiàng)預(yù)測(cè)方法的線性組合預(yù)測(cè)的預(yù)測(cè)值,li為第i種單項(xiàng)預(yù)測(cè)方法的加權(quán)系數(shù)(i=1,2,…m),xit為第i種單項(xiàng)預(yù)測(cè)在第t時(shí)刻的預(yù)測(cè)值。由于基于次鄰近度的加權(quán)線性組合預(yù)測(cè)鄰近度越大,預(yù)測(cè)精度越高,所以用線性規(guī)劃方法求解最優(yōu)組合預(yù)測(cè)權(quán)系數(shù)。
采用以下四個(gè)常用評(píng)價(jià)指標(biāo)對(duì)三種單項(xiàng)預(yù)測(cè)以及建立的線性組合預(yù)測(cè)模型的預(yù)測(cè)結(jié)果在預(yù)測(cè)效果上進(jìn)行評(píng)價(jià),比較優(yōu)劣。誤差平方和:
(2)
平均絕對(duì)誤差:
(3)
平均絕對(duì)百分比誤差:
(4)
均方百分比誤差:
(5)
選取2001-2018年安徽省GDP數(shù)據(jù)作為研究樣本,數(shù)據(jù)來源于國家統(tǒng)計(jì)局,分別對(duì)樣本進(jìn)行指數(shù)預(yù)測(cè),一元線性回歸預(yù)測(cè),GM(1,1)灰色預(yù)測(cè),并且基于以上三種單項(xiàng)預(yù)測(cè)建立基于次鄰近度的線性組合預(yù)測(cè)模型,并比較分析各項(xiàng)評(píng)價(jià)指標(biāo)。
2.1.1 指數(shù)預(yù)測(cè)模型
將安徽省2001-2018年GDP作為因變量y(單位:億元),自變量為時(shí)間t,t∈(1,2,…,18)建立指數(shù)預(yù)測(cè)模型:
lny=0.1399×t+7.9350
將該模型應(yīng)用于安徽省2001-2018年GDP預(yù)測(cè)且預(yù)測(cè)結(jié)果和預(yù)測(cè)精度如表1所示。
由圖5可以看出,3種氧化劑都具有良好的除硫效果,隨著氧化劑濃度的增加,除硫率明顯增大,當(dāng)氧化劑濃度達(dá)到一定程度后除硫率不再變化,說明氧化劑氧化效果基本飽和。3種氧化劑的氧化效果為:Cl O2>NaClO>H 2 O2。因此,優(yōu)選ClO2作為水處理工藝的添加劑,使用質(zhì)量濃度為50 mg/L,在此質(zhì)量濃度下除硫率可達(dá)到95%。
2.1.2一元線性回歸預(yù)測(cè)模型
將安徽省2001-2018年GDP作為因變量y(單位:億元),將2001-2018年全國GDP作為自變量x(單位:萬億元)(數(shù)據(jù)來源于國家統(tǒng)計(jì)局),建立一元線性回歸模型:
y=0.0344×x-1051
將該模型應(yīng)用于安徽省2001-2018年GDP預(yù)測(cè)且預(yù)測(cè)結(jié)果和預(yù)測(cè)精度如表1所示。
2.1.3 GM(1,1)預(yù)測(cè)模型
將安徽省2001-2018年GDP作為原始時(shí)間序列,并對(duì)其作一次累加生成運(yùn)算,得到新的生成數(shù)列,且新的數(shù)列y1近似的服從指數(shù)規(guī)律,建立GM(1,1)微分預(yù)測(cè)模型,白化形式如下:
將該模型應(yīng)用于安徽省2001-2018年GDP預(yù)測(cè)且預(yù)測(cè)結(jié)果和預(yù)測(cè)精度如表1所示。
通過對(duì)比分析表1各項(xiàng)數(shù)據(jù),可以看出指數(shù)模型在后期對(duì)原始值擬合效果越來越差,GM(1,1)預(yù)測(cè)模型在前期數(shù)據(jù)擬合上精度較低,一元線性回歸預(yù)測(cè)模型相較于其他兩個(gè)單項(xiàng)預(yù)測(cè)擬合結(jié)果較好,但預(yù)測(cè)精度有波動(dòng),起伏較大。整體來看,三種預(yù)測(cè)模型對(duì)數(shù)據(jù)都不能進(jìn)行高精度預(yù)測(cè)。下面用線性組合預(yù)測(cè)模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),以得到預(yù)測(cè)精度更高的模型。
根據(jù)表1計(jì)算得出的三種單項(xiàng)預(yù)測(cè)結(jié)果,建立基于次鄰近度的線性組合預(yù)測(cè)模型,首先,用matlab求解線性規(guī)劃的最優(yōu)加權(quán)系數(shù),得到最優(yōu)解為l1=0.0220,l2=0.8299,l3=0.1480,將求得的最優(yōu)權(quán)重代入線性組合預(yù)測(cè)模型(1),并用該組合預(yù)測(cè)模型計(jì)算出預(yù)測(cè)值和預(yù)測(cè)精度,如表2所示。
由表1和表2對(duì)比分析可知,建立的線性組合預(yù)測(cè)模型提高了整體的預(yù)測(cè)精度,使得約半數(shù)的預(yù)測(cè)精度達(dá)到99%以上,且組合預(yù)測(cè)的最低預(yù)測(cè)精度也都高于三種單項(xiàng)預(yù)測(cè)模型的最低預(yù)測(cè)精度,所以,通過對(duì)比分析可知,組合預(yù)測(cè)模型明顯優(yōu)于三種單項(xiàng)預(yù)測(cè)模型,因?yàn)樗沟妙A(yù)測(cè)更穩(wěn)定,預(yù)測(cè)精度更高,預(yù)測(cè)結(jié)果更有效。
表2 基于鄰近度的組合預(yù)測(cè)值及預(yù)測(cè)精度
表3 模型誤差評(píng)價(jià)
對(duì)三種單項(xiàng)預(yù)測(cè)及建立的線性組合預(yù)測(cè)這四種模型的預(yù)測(cè)效果和精度進(jìn)行比較之后,再采用誤差平方和(SSE)(2),平均絕對(duì)誤差(MAE)(3),平均絕對(duì)百分比誤差(MAPE)(4)和均方百分比誤差(MSPE)(5)這四種評(píng)價(jià)指標(biāo)對(duì)各模型進(jìn)行進(jìn)一步評(píng)價(jià),評(píng)價(jià)結(jié)果如表3所示。
采用的線性組合預(yù)測(cè)模型是最基本的組合預(yù)測(cè)模型,但其預(yù)測(cè)效果卻往往很好。由表3可看出,基于次鄰近度的線性組合預(yù)測(cè)模型在四個(gè)評(píng)價(jià)指標(biāo)上的評(píng)價(jià)結(jié)果都優(yōu)于各單項(xiàng)預(yù)測(cè)模型,預(yù)測(cè)精度較各單項(xiàng)預(yù)測(cè)模型也得到了較大提高,說明了本文的組合預(yù)測(cè)模型的預(yù)測(cè)效果的準(zhǔn)確性和有效性。準(zhǔn)確預(yù)測(cè)GDP,準(zhǔn)確計(jì)算GDP增速對(duì)安徽省經(jīng)濟(jì)發(fā)展趨勢(shì)、經(jīng)濟(jì)運(yùn)行總體分析,安徽省經(jīng)濟(jì)健康穩(wěn)定發(fā)展具有重要意義。