俞華鋒,陳鵬宇
(1.浙江大學(xué),杭州 310027;2.中國地質(zhì)大學(xué) 工程學(xué)院,武漢 430074)
灰色預(yù)測模型是灰色理論的重要組成部分,而GM(1,1)模型是灰色預(yù)測模型中最基本的模型,已經(jīng)在計算機、管理和圖像工程等領(lǐng)域得到了廣泛應(yīng)用[1]。GM(1,1)預(yù)測模型雖有許多成功的實例,但也存在預(yù)測誤差偏大等問題,因此找出影響 GM(1,1)預(yù)測模型精度的因素具有非常重要的理論和實際意義[2]。文獻[3-4]中分別指出了GM(1,1)模型背景值構(gòu)造存在缺陷,但都是以背景值面積不等為基礎(chǔ),而本文將以灰微分方程與其白化型的對應(yīng)關(guān)系為基礎(chǔ)分析背景值構(gòu)造的缺陷,并建立加權(quán)背景值構(gòu)造。文獻[5-6]中分別指出了初始值的選擇對模型預(yù)測精度存在影響,但未作理論上的分析,因此本文以最小二乘法理論為基礎(chǔ)分析了初始值確定的不足,并對初始值添加修正項。由于背景值構(gòu)造和初始值的確定對模型預(yù)測精度的影響是相互制約的,只有同時對背景值和初始值進行優(yōu)化,才能達到最佳的預(yù)測精度,為此,本文提出了利用模式搜索法在原始數(shù)據(jù)殘差平方和最小或平均相對誤差最小的目標(biāo)下求解最佳背景值權(quán)值和初始值修正項,實例結(jié)果表明優(yōu)化的GM(1,1)模型提高了預(yù)測精度。
令 x(0)為 GM(1,1)建模序列
則GM(1,1)的定義型,即GM(1,1)的灰微分方程模型為
其中a為發(fā)展系數(shù),b為灰作用量,是微分方程的參數(shù)。
灰微分方程白化型為
GM(1,1)白化型響應(yīng)式為
由最小二乘法,可以求得參數(shù)
1.2.1 背景值構(gòu)造分析
顯然模型參數(shù)是基于灰微分方程(2)利用最小二乘法求取的,而模型的最終預(yù)測式是基于灰微分方程白化型(3)求取的,而式(3)直接利用了基于式(2)所得的參數(shù),這就意味著式(3)和式(2)必須是等同的,也就是有下式
此時導(dǎo)數(shù) x(0)(k)對應(yīng)的點為(ξ,x(1)(ξ)),而 x(1)(ξ)=x(1)(λ)(k)+x(1)(k-1))并不一定成立,所以式(5)中兩等式并不一定同時成立,也就是式(2)與式(3)并不一定等同,為此本文建立了以下加權(quán)背景值形式
顯然存在 p 值使 x(1)(ξ)=x(1)(λ)=px(1)(k)+(1-p)x(1)(k-1)成立,只是由于原始數(shù)據(jù)并不可能是規(guī)則序列,因此每兩個數(shù)據(jù)之間的p值并不一定相同,但是我們可以尋找一個使每個k值下的式(6)最接近于成立的p值,或者說尋找一個使模型預(yù)測精度最高的p值,p值的具體求解方法將在下文給出。
1.2.2 初始值確定分析
觀察最小二乘法的計算式
x(0)(k)=-az(1)(k)+b,k=2,3,…,n
根據(jù)最小二乘法原理可知,其達到的最小為
而如果以原始數(shù)據(jù)殘差平方和最小作為預(yù)測精度最高的標(biāo)志,那我們所要達到的目標(biāo)是
GM(1,1)模型中為了得到式(3)的解,模型默認經(jīng)過初始值點,這從式(4)也可以看出,此時初始值殘差為零,但由最小二乘法原理可知,使原始數(shù)據(jù)殘差平方和最小的模擬曲線并不一定過其中一點,也包括初始值點,也就是說此時式(7)并不一定是最小的。同樣如果以平均相對誤差最小作為預(yù)測精度最高的標(biāo)志,模型默認經(jīng)過初始值點也達不到預(yù)測精度最高的目標(biāo)。因此,我們對初始值添加修正項,表示初始值與最佳初始值之間的差別,此時式(4)變形為
前面本文已經(jīng)分析得出了GM(1,1)模型的缺陷以及改進的方法,也就是將模型的背景值構(gòu)造改為
同時對初始值添加修正項
至于權(quán)值p和修正項β的求解,本文采用具有全局尋優(yōu)能力的非線性搜索算法—模式搜索法(pattern search),模式搜索法是Hooke和Jeeves于1961年提出的,這種方法的基本思想是先“探測性移動”尋找最佳點信息,然后用“模式性移動”沿著找到的最佳點信息前進,2種移動交替進行直到步長δ小于事先給定的某個小正數(shù)ε為止[7],其基本原理及搜索過程可參考文獻[8-9]。以模式搜索法在原始數(shù)據(jù)殘差平方和或平均相對誤差最小的目標(biāo)下搜索最佳權(quán)值和修正項,具體操作可利用Matlab模式搜索工具箱,以[0.5,0]點為初始點以式(8)為目標(biāo)函數(shù)進行搜索。
下面以某超市信息管理和決策支持系統(tǒng)中客戶流失預(yù)測(數(shù)據(jù)挖掘)中的相關(guān)數(shù)據(jù)資料建立優(yōu)化的GM(1,1)模型,原始數(shù)據(jù)及預(yù)測值見表1,其中經(jīng)模式搜索法求得p=0.479088,β=-1.61×10-4,其中優(yōu)化目標(biāo)為原始數(shù)據(jù)殘差平方和最小。
從表1可以看出,優(yōu)化后的GM(1,1)模型平均擬合相對誤差從0.915%降低到0.075%,平均預(yù)測相對誤差從1.348%降低到0.086%,無論是擬合精度還是預(yù)測精度,優(yōu)化的GM(1,1)模型都比原有GM(1,1)模型有了明顯地提高,顯然模型的改進是有效的。
表1 優(yōu)化的GM(1,1)模型與原模型預(yù)測結(jié)果
在信息技術(shù)快速發(fā)展的今天,人們面對的各種數(shù)據(jù)越來越復(fù)雜;將GM(1,1)模型應(yīng)用于計算機信息管理、決策支持和數(shù)據(jù)挖掘過程,對整體規(guī)律復(fù)雜而在某一時間或空間有很強規(guī)律性的數(shù)據(jù)系列進行挖掘,能取得很好的分析效果;為決策人員提供科學(xué)、準(zhǔn)確的數(shù)字依據(jù),對提高我們決策的準(zhǔn)確性、科學(xué)性具有重要意義。
本文背景值構(gòu)造和初始值確定兩個方面分析了GM(1,1)模型的缺陷,建立加權(quán)背景值和帶有修正項的初始值,而權(quán)值和修正項采用模式搜索法在原始數(shù)據(jù)殘差平方和或平均相對誤差最小的目標(biāo)下進行搜索,實例應(yīng)用結(jié)果顯示優(yōu)化后的GM(1,1)模型提高了預(yù)測精度,這對提高GM(1,1)模型的應(yīng)用價值具有一定的意義。
[1]劉思峰,黨耀國,方志耕.灰色系統(tǒng)理論及其應(yīng)用[M].北京:科學(xué)出版社,2004.
[2]陳永剛,楊定遠,戴文戰(zhàn).基于背景值改進的GM(1,1)預(yù)測模型的研究及其應(yīng)用[J].浙江理工大學(xué)學(xué)報,2007,24(4).
[3]譚冠軍.GM(1,1)模型的背景值構(gòu)造方法和應(yīng)用(Ⅰ)[J].系統(tǒng)工程理論與實踐,2000(4).
[4]李翠鳳,戴文戰(zhàn).非等間距GM(1,1)模型背景值構(gòu)造方法及應(yīng)用[J].清華大學(xué)學(xué)報(自然科學(xué)版),2007,47(S2).
[5]王忠桃,彭鑫,戴齊.基于初值修正的灰色預(yù)測模型的改進及其應(yīng)用[J].重慶工學(xué)院學(xué)報(自然科學(xué)版),2007,21(10).
[6]黨耀國,劉思峰,劉斌.以為初始條件的GM模型[J].中國管理科學(xué),2005,13(1).
[7]陳炳瑞,馮夏庭,丁秀麗等.基于模式搜索的巖石流變模型參數(shù)識別[J].巖石力學(xué)與工程學(xué)報,2005,24(2).
[8]Yosef S S,Bruce A B.Optimization by Pattern Search[J].European Journal of Operational Research,1994,78(13).
[9]陳寶林.最優(yōu)化理論與方法[M].北京:清華大學(xué)出版社,2000.