王 安,楊 雨,謝麗華
(1.平頂山學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,河南 平頂山 467036;2.平頂山學(xué)院 計(jì)算機(jī)學(xué)院,河南 平頂山 467036;3.平頂山學(xué)院 化學(xué)與環(huán)境工程學(xué)院,河南 平頂山 467036)
對(duì)于少樣本貧信息的研究對(duì)象,GM(1,1)模型表現(xiàn)出優(yōu)越的預(yù)測(cè)效果,因此GM(1,1)模型成為學(xué)者們研究的熱點(diǎn)內(nèi)容.鄧聚龍教授首次建立灰色理論以來(lái),學(xué)者們改進(jìn)模型的結(jié)構(gòu)[1-3],智能方法優(yōu)化參數(shù)[4-5],研究GM(1,1)模型的應(yīng)用條件[6],以及數(shù)據(jù)規(guī)模對(duì)GM(1,1)模型預(yù)測(cè)效果的影響[7],這些研究都提高了模型的預(yù)測(cè)精度和拓展了模型的應(yīng)用范圍.這些方法都是從改進(jìn)模型結(jié)構(gòu)和優(yōu)化模型參數(shù)的角度出發(fā),并沒有在充分利用有限的數(shù)據(jù)方面改進(jìn).
GM(1,1)模型是利用最小二乘法原理,求解一階微分方程,對(duì)動(dòng)態(tài)數(shù)據(jù)的趨勢(shì)進(jìn)行預(yù)測(cè).為了充分利用有限的數(shù)據(jù),范國(guó)鋒等[8]構(gòu)建了基于遺傳算法的灰色組合模型,王安等[9]設(shè)計(jì)了基于最小二乘法的灰色預(yù)測(cè)模型,這些改進(jìn)方式都是通過(guò)整合多種模型的優(yōu)勢(shì),使組合模型的精度和適應(yīng)范圍得到提升.在大數(shù)據(jù)時(shí)代,如何高效地利用有限的數(shù)據(jù),設(shè)計(jì)適應(yīng)范圍更廣的數(shù)學(xué)模型已成為當(dāng)今研究的重要課題,筆者提出了一種新的灰色耦合模型,該方法是一種解決小樣本貧信息的灰色預(yù)測(cè)模型處理大數(shù)據(jù)的嘗試,通過(guò)算例驗(yàn)證了該模型的有效性.
灰色耦合模型是用少量的時(shí)間數(shù)據(jù)序列建立系統(tǒng)的動(dòng)態(tài)模型,先把原始數(shù)據(jù)序列分解成分解因子,然后對(duì)分解因子逐個(gè)累加生成生成規(guī)律性較強(qiáng)的序列.然后對(duì)分解因子累加生成序列建模,再進(jìn)行累減生成還原成分解因子預(yù)測(cè)值,最后對(duì)分解因子的預(yù)測(cè)值進(jìn)行累加,合理地構(gòu)建分解因子,使得對(duì)分解因子的預(yù)測(cè)值進(jìn)行累加過(guò)程誤差得到了相互抵消,使得灰色耦合模型精度得到提高,模型的適應(yīng)范圍更廣.具體的灰色耦合模型的建立過(guò)程如下:
i=1,2,…,m.
(1)
灰色耦合模型NGCM(1,1)的白化形式為:
(2)
其中ai為發(fā)展系數(shù),bi為灰色作用量.
則灰色耦合模型可表示為:
Yi=Biui.
(3)
使J(u)=(Yi-Biui)T(Yi-Biui)取得最小值,利用最小二乘法得到參數(shù)的估計(jì):
(4)
于是得到白化微分方程的解:
(5)
利用
(6)
得到第i個(gè)分解因子預(yù)測(cè)值序列:
(7)
最后得到灰色耦合模型對(duì)原始數(shù)據(jù)的模擬值和預(yù)測(cè)值:
(8)
k時(shí)段的相對(duì)誤差,其定義如下[10]:
(9)
平均相對(duì)誤差定義如下[9]:
(10)
利用平均絕對(duì)誤差檢驗(yàn)?zāi)P偷臏?zhǔn)確性,利用平均絕對(duì)誤差檢驗(yàn)?zāi)P偷哪P途?,常用的模型精度等?jí)檢驗(yàn)表[11]如表1所示.
表1 模型精度等級(jí)檢驗(yàn)表
根據(jù)灰色耦合模型的原理,灰色耦合模型算法流程圖見圖1,算法步驟可概括如下:
step4計(jì)算分解序列的模擬值和預(yù)測(cè)值,
step5利用灰色耦合模型,計(jì)算原始序列的模擬值和預(yù)測(cè)值,
根據(jù)2019中國(guó)統(tǒng)計(jì)年鑒中2000—2018年的人口數(shù)據(jù)(各省的人口數(shù)量見表2和表3),利用構(gòu)建的灰色耦合模型和經(jīng)典的GM(1,1)模型,得到中國(guó)人口預(yù)測(cè)值與真實(shí)值對(duì)比圖(圖2).
表2 各省的人口數(shù)(I) 萬(wàn)
表3 各省的人口數(shù)(Ⅱ) 萬(wàn)
對(duì)中國(guó)總?cè)丝诎凑帐『椭陛犑?,利用灰色耦合模型進(jìn)行預(yù)測(cè),結(jié)果與GM模型進(jìn)行對(duì)比,由圖3和表4可知,灰色耦合模型不僅預(yù)測(cè)值與真實(shí)值更接近,而且相對(duì)誤差和平均相對(duì)誤差更小.
表4 誤差分析表
由上述計(jì)算結(jié)果,GM(1,1)模型的平均相對(duì)誤差為0.276 5%,而灰色耦合模型NGCM(1,1)的平均相對(duì)誤差為0.261 4%,因此構(gòu)建的灰色耦合模型NGCM(1,1)是有效的,另外如果能夠更好地設(shè)計(jì)分解因子,精度還可以進(jìn)一步提升,模型的適應(yīng)范圍更廣.
構(gòu)建了灰色耦合模型NGCM(1,1),通過(guò)算例發(fā)現(xiàn),相對(duì)傳統(tǒng)的GM(1,1)模型,灰色耦合模型的預(yù)測(cè)結(jié)果精度更高,模型的適應(yīng)范圍更廣.
灰色耦合模型從一個(gè)全新的角度出發(fā),對(duì)原始數(shù)據(jù)分解建模,使得整合后的誤差相互抵消.筆者僅將中國(guó)人口按照地域分解整合,預(yù)測(cè)精度就得到了明顯提升,選擇合適的分解因子,模型的預(yù)測(cè)精度肯定可以進(jìn)一步提升.因此針對(duì)原始數(shù)據(jù)分解算子的構(gòu)造,以及分解后的誤差相消的比較和耦合效果等問(wèn)題,值得進(jìn)一步研究.