[摘要] 本文利用自組織數(shù)據(jù)挖掘算法,探索使用Knowledge Miner 軟件對成都市宏觀經(jīng)濟主要指標建立預(yù)測模型,比較分析各模型的優(yōu)劣,并結(jié)合成都市經(jīng)濟數(shù)據(jù)深入分析。
[關(guān)鍵詞] 自組織數(shù)據(jù)挖掘算法 知識挖掘 主要指標
一、引言
經(jīng)過長期的發(fā)展, 宏觀經(jīng)濟預(yù)測研究在建立與使用定量預(yù)測模型和定性預(yù)測模型等諸多方面取得了長足的進步。由烏克蘭科學(xué)院A.G.Ivakhnenko首次提出的GMDH算法,兼具定性定量的研究特點,較好的剔除了個人主觀因素對指標的干擾,結(jié)合Knowledge Miner軟件能夠建立較優(yōu)的經(jīng)濟預(yù)測模型,
成都市的經(jīng)濟總量占全省的32%,人均年GDP名列中國西部省會第一,采用成都市的指標作為對象具有很強的說服力。
二、GMDH自回歸模型介紹
數(shù)據(jù)分組處理方法(簡稱 GMDH)是一種基于遺傳進化的演化方法,它依據(jù)給定的準則從一系列候選模型集合中挑選較優(yōu)模型。GMDH算法通過遺傳變異和篩選,產(chǎn)生很多具有不斷增長復(fù)雜度的候選模型,直至模型在觀測樣本數(shù)據(jù)上產(chǎn)生過擬合為止。該方法需要一定量的初始模型,這些初始模型(或稱神經(jīng)元)可以通過微分或差分方程組,或者是它們的解來描述。
GMDH自回歸模型基于黑箱方法,從輸入輸出數(shù)據(jù)的樣本來分析系統(tǒng),并通過基本函數(shù)網(wǎng)絡(luò)來描述復(fù)雜函數(shù),因此很適合對周期性比較強的數(shù)據(jù)進行預(yù)測,預(yù)測效果較好。
三、模型構(gòu)建與比較分析
假設(shè): X1—GDP,X2—財政收入,X3—財政支出,X4—社會消費品零售總額,X5—城市居民就業(yè)人口
為了增強可比性,均采用數(shù)據(jù)長度29,其中檢驗集為1978年~2000年23年的原始數(shù)據(jù),相關(guān)模型輸入變量個數(shù)34,訓(xùn)練集為2001年~2006年的數(shù)據(jù),最大時滯均為 6, 由Knowledge Miner軟件分別建立預(yù)測模型對比結(jié)果如表。數(shù)據(jù)來源于成都市2007年統(tǒng)計年鑒。
可見,以GDP(X1)為因變量的預(yù)測模型篩選出輸入變量財政收入(X2),社會消費品零售總額(X4),城市居民就業(yè)人口(X5),說明,財政收入、社會消費品零售總額、城市居民就業(yè)人口在某種程度上影響著GDP,而社會消費品零售總額、城市居民就業(yè)人口因為存在一定的線性關(guān)系導(dǎo)致X4、X5的系數(shù)為負。對于財政收入來說,受到社會消費品零售總額和財政支出的影響,同時,從財政支出的預(yù)測模型來看財政收入,社會消費品零售總額又是財政支出的影響因素,本次指標體系的城市居民就業(yè)人口指標沒有受到其它指標的影響。
結(jié)合成都市宏觀經(jīng)濟的經(jīng)濟現(xiàn)狀,特別是針對成都市GDP來說,GDP的計算包括了財政收入,社會消費品零售總額,而城市居民就業(yè)人口通過影響職工的工資收入同樣影響著GDP的數(shù)據(jù),可見通過Knowledge Miner可辨別指標之間某些內(nèi)在聯(lián)系,實際可行。
對比兩種建模結(jié)果的PESS(預(yù)測誤差的平方和),有,X1(GDP),X2(財政收入),X3(財政支出),X4(社會消費品零售總額)四個指標都或多或少的受到其他指標的影響,而X5(城市居民就業(yè)人口)模型的內(nèi)生變量不包含其他任何指標,針對相同的指標所建立的預(yù)測模型,對比可看出X1(GDP),X2(財政收入),X3(財政支出),X4(社會消費品零售總額)四個指標的單指標自回歸模型的PESS值明顯劣于相關(guān)自回歸模型,而對于不包含其他指標的X5(城市居民就業(yè)人口)則正好相反,由此可推出,使用knowledgeminer進行經(jīng)濟預(yù)測時,先分析各指標間的相關(guān)性,再選擇相應(yīng)的自組織數(shù)據(jù)挖掘算法效果更佳。
四、結(jié)術(shù)語
采用定性和定量分析相結(jié)合的方法對成都市宏觀經(jīng)濟主要指標建立預(yù)測模型后,本人發(fā)現(xiàn)使用knowledgeminer在進行經(jīng)濟預(yù)測建模時,首先進行相關(guān)自回歸建模,后再使用單指標自回歸模型,能夠有效的提高預(yù)測的準確度。
參考文獻:
賀昌政:自組織數(shù)據(jù)挖掘與經(jīng)濟預(yù)測[M].科學(xué)出版社,2005