曾亮
(廣東理工學(xué)院基礎(chǔ)部,廣東肇慶526100)
灰色系統(tǒng)理論[1]是研究小樣本、貧信息和不確定問題的一種新方法,灰色預(yù)測理論是其核心體系之一,因其不要求序列具備典型的分布規(guī)律,且計算量較小,所以,在小樣本序列預(yù)測上具有一定優(yōu)勢。傳統(tǒng)的灰色預(yù)測模型通常對具有近似指數(shù)律的單調(diào)遞增或遞減序列模擬預(yù)測精度較高,在各領(lǐng)域已得到廣泛應(yīng)用[2],而對于振蕩序列的模擬預(yù)測往往難以達(dá)到預(yù)期的效果。因此,關(guān)于如何提高振蕩序列的模擬預(yù)測精度是值得深入研究的方向,近年來,已取得一些有價值的研究成果,集中體現(xiàn)在兩方面:一是對傳統(tǒng)GM(1,1)模型進行拓展以適應(yīng)振蕩序列的預(yù)測;二是對原始振蕩序列變換處理后建立傳統(tǒng)GM(1,1)模型。關(guān)于模型拓展方面,DENG[3]提出了擺動型灰色GM(1,1|tan(k-π)p,sin(k-π)p)模型,由于模型中參數(shù)取值缺乏嚴(yán)格的理論依據(jù),具有較強的隨意性,所以對該模型的后續(xù)研究極少;MAO等[4]借鑒文獻(xiàn)[3]中三角函數(shù)能反映振蕩性的思路,提出了GM(1,1|sin)模型,并將該模型應(yīng)用于交通流預(yù)測,取得了較高的模擬精度;ZHOU等[5]提出了一種改進的灰色GM(0,1|sin)振蕩序列模型,并運用灰色理論,引入變權(quán)強化緩沖算子,削弱擾動項對原始數(shù)據(jù)序列的干擾;許澤東等[6]在文獻(xiàn)[4]的基礎(chǔ)上,將一階累加生成拓展為分?jǐn)?shù)階累加,提出了分?jǐn)?shù)階累加GM(1,1|sin+cos)模型,并通過實例說明該模型具有較強的適用和擬合性能。由于GM(1,1)冪模型[7]是一類非線性灰色模型,通過冪指數(shù)取值的變化能適應(yīng)具有不同波動特性的原始序列,近年來,關(guān)于利用GM(1,1)冪模型對振蕩序列進行預(yù)測的研究成果較為豐富。比如,王正新等[8]在傳統(tǒng)GM(1,1)冪模型的基礎(chǔ)上通過優(yōu)化冪指數(shù)的方法提高模型對小樣本振蕩序列的預(yù)測精度;王正新等[9]對GM(1,1)冪模型的病態(tài)性進行了研究,指出部分情形下可能出現(xiàn)數(shù)據(jù)矩陣求逆的病態(tài)性;王正新[10]在GM(1,1)冪模型的定義型和白化型基礎(chǔ)上,推導(dǎo)了5種派生型GM(1,1)冪模型,構(gòu)建了GM(1,1)冪模型群,并將成果推廣到灰色多變量模型,提出了灰色多變量GM(1,N)冪模型及其派生GM(1,N,x(1))冪模型[11];王正新[12]提出了含有系統(tǒng)延遲和時變參數(shù)的振蕩GM(1,1)冪模型,并將該模型應(yīng)用于應(yīng)急資源需求預(yù)測,結(jié)果表明,其優(yōu)于傳統(tǒng)GM(1,1)冪模型和ARIMA方法;王正新[13]通過對原始序列建立GM(1,1)冪模型,并利用傅立葉級數(shù)提取模型殘差中的周期性振蕩規(guī)律,有效提高了對小樣本振蕩序列的預(yù)測精度;王俊芳等[14]借助分?jǐn)?shù)階累加算子,構(gòu)建了分?jǐn)?shù)階離散GM(1,1)冪模型,并提出了一種新的累加階數(shù)及冪參數(shù)的確定方法,提高了模型的預(yù)測精度;WANG等[15]利用傅立葉殘差修正的GM(1,1)冪模型對我國高新技術(shù)產(chǎn)品國際貿(mào)易量進行了預(yù)測;PEI等[16]提出了一種基于非線性最小二乘法求解GM(1,1)冪模型參數(shù)的新方法,并以我國高新技術(shù)企業(yè)員工需求預(yù)測為例,對該模型進行了驗證。關(guān)于對原始振蕩序列的變換處理,錢吳永等[17]提出了先通過加速平移變換將振蕩序列轉(zhuǎn)化為單調(diào)序列,然后再進行加權(quán)均值生成變換,對變換后的序列建立GM(1,1)模型。算例表明,該方法能提高GM(1,1)模型的預(yù)測精度;ZENG等[18]研究了一種可壓縮振蕩序列幅值的平滑算法,并在此基礎(chǔ)上推導(dǎo)出一種基于振蕩序列的灰色預(yù)測模型,通過改善振蕩序列的平滑性來提高灰色模型的模擬精度。
本文在以上研究的基礎(chǔ)上,進一步研究振蕩序列的模擬預(yù)測問題。為更好地描述由多個不同周期運動疊加下系統(tǒng)的振蕩特征,將文獻(xiàn)[4]中GM(1,1|sin)模型的灰作用量sinpk項更改為(sinpk)γ,構(gòu)建了GM(1,1|sin)冪模型。通過調(diào)整正弦函數(shù)項的冪指數(shù),使其更適應(yīng)振蕩序列的變化,從而達(dá)到提高模擬預(yù)測精度的目的。由于增加了冪指數(shù),模型的白化微分方程形式較為復(fù)雜,因此,難以得到模型的精確時間響應(yīng)函數(shù)。為此,本文利用高精度的復(fù)合3/8辛普森積分公式得到模型的近似時間響應(yīng)式。為得到最優(yōu)的模擬預(yù)測效果,以平均模擬相對誤差為適應(yīng)度函數(shù),利用粒子群優(yōu)化算法,求得函數(shù)值最小化下的模型參數(shù)。最后,分別以城市交通流和高新技術(shù)產(chǎn)品出口額的模擬預(yù)測為例,并與傳統(tǒng)GM(1,1)模型、GM(1,1)冪模型和GM(1,1|sin)模型進行了比較,以檢驗本文模型的有效性和實用性。
定義1設(shè)非負(fù)系統(tǒng)行為序列X={x(1),x(2),…,x(n)},若
(1)對?k=1,2,…,n-1,有x(k+1)-x(k)> 0,則稱X為單調(diào)遞增序列;
(2)對?k=1,2,…,n-1,有x(k+1)-x(k)<0,則稱X為單調(diào)遞減序列;
(3)若?k1,k2∈ {1,2,…,n-1},使得x(k1+1)-x(k1)> 0和x(k2+1)-x(k2)< 0同時成立,則稱X為振蕩序列。
針對振蕩序列的模擬預(yù)測,文獻(xiàn)[4]給出了一種灰作用量為bsinpk+c的GM(1,1|sin)模型。
定義2若X(0)={x(0)(1),x(0)(2),…,x(0)(n)}為非負(fù)原始數(shù)據(jù)序列,X(1)={x(1)(1),x(1)(2),…,x(1)(n)}為X(0)的一階累加生成序列,為X(1)的緊鄰均值生成序列,即z(1)(k)=0.5(x(1)(k-1)+x(1)(k)),則稱
為GM(1,1|sin)模型。微分方程
為GM(1,1|sin)模型的白化形式。
由最小二乘辨識方法可得GM(1,1|sin)模型參數(shù)=(a,b,c)T的估計值,若令
則=(a,b,c)T=(BTB)-1BTY。
定理1假設(shè)B、Y和如定義2所述,即=(a,b,c)T=(BTB)-1BTY,則GM(1,1|sin)模型的時間響應(yīng)序列為
還原式為
證明過程參見文獻(xiàn)[4],此略。
定義3若非負(fù)原始序列X(0)={x(0)(1),x(0)(2),…,x(0)(n)},X(1)為X(0)的一階累加生成序列,Z(1)為X(1)的緊鄰均值生成序列,則稱
為GM(1,1|sin)冪模型。微分方程
為GM(1,1|sin)冪模型的白化形式。
從GM(1,1|sin)冪模型的表達(dá)式中可看出,當(dāng)γ=0時,GM(1,1|sin)冪模型為傳統(tǒng) GM(1,1)模型;當(dāng)γ=1時,GM(1,1|sin)冪模型為文獻(xiàn)[4]中的GM(1,1|sin)模型。
在GM(1,1|sin)冪模型中,當(dāng)參數(shù)p和冪指數(shù)γ給定時,可利用最小二乘法估計模型的其他參數(shù)。
定理2若令
當(dāng)|BTB|≠0時,由最小二乘法可得模型參數(shù)=(a,b,c)T的辨識值為
證明由矩陣B的表達(dá)式可得
則BTB的行列式值為
BTB的伴隨矩陣為
當(dāng)|BTB|≠0時,可得BTB的逆矩陣為
又由于BTY=
則由最小二乘法可得模型參數(shù)=(a,b,c)T的辨識值為
定理3設(shè)B,Y,如定理2所述,m為正整數(shù),則步長為的復(fù)合3/8辛普森積分公式下的GM(1,1|sin)冪模型的近似時間響應(yīng)序列為
還原值為證明由微分方程
可解得
則
由初始條件(1)(1)=x(1)(1)=x(0)(1),得
將式(12)代入式(11),得
則近似時間響應(yīng)序列為
由一階累減還原公式可得還原值:
(0)(k)=(1)(k)-(1)(k-1),k=2,3,…。
平均模擬或預(yù)測相對誤差(ARPE)常被用來檢驗?zāi)P偷哪M預(yù)測效果,其公式為
其中n為模擬或預(yù)測數(shù)據(jù)的個數(shù)。
由模型(6)可知,參數(shù)p和γ為模型的非線性部分,確定其精確值比較困難。本文利用平均模擬相對誤差最小化方法確定p和γ的值,即建立以下優(yōu)化模型:
為求解該優(yōu)化模型,本文采用粒子群優(yōu)化算法(PSO)[19]確定最優(yōu)參數(shù)。粒子群優(yōu)化算法是一種智能進化計算技術(shù),首先對被優(yōu)化的函數(shù)初始化一組隨機解,每一個個體解稱為一個“粒子”。所有的粒子都有一個由被優(yōu)化的函數(shù)決定的適應(yīng)值,每個粒子還有一個決定其搜索距離和方向的速度,然后就追隨當(dāng)前的最優(yōu)粒子在解空間搜索,通過不斷迭代找到最優(yōu)解[20-22]。在迭代過程中,每個粒子都根據(jù)2個極值來更新自己的位置,一個是粒子本身目前搜索到的最優(yōu)解,稱為個體極值(pbest),另一個就是群中所有粒子目前搜索到的最優(yōu)解,稱為全局極值(gbest)。每個粒子按以下公式不斷更新自己的速度和位置:
其中,vk是粒子的速度向量;xk是粒子的當(dāng)前位置;pbestk是粒子本身搜索到的最優(yōu)解,即個體極值;gbestk是粒子群搜索到的最優(yōu)解,即全局極值;ω為慣性權(quán)重,用來保持全局搜索和局部搜索的平衡,其值取0.1~0.9;c1和c2是加速系數(shù),值為0~4,通常取2。
利用粒子群優(yōu)化算法計算GM(1,1|sin)冪模型參數(shù)的步驟如下:
步驟1在可行域內(nèi)初始化粒子種群和粒子速度;
步驟2以平均模擬相對誤差為適應(yīng)度函數(shù),計算每個粒子的適應(yīng)值,并選擇個體極值和全局極值;
步驟3若計算結(jié)果達(dá)到一定的精度或達(dá)到最大迭代次數(shù),轉(zhuǎn)步驟5,否則轉(zhuǎn)步驟4;
步驟4分別按照式(16)和(17)更新每個粒子的位置和速度,然后轉(zhuǎn)步驟2;
步驟5輸出全局極值及相應(yīng)的解,退出循環(huán),算法結(jié)束。
文獻(xiàn)[4]給出了某天6:00~18:00(紐約時間,以1 h為間隔)紐約市的道路交通流量數(shù)據(jù),見表1。
表1 某天6:00~18:00紐約市道路交通流量Table1 City traffic flow from 6 :00 to 18:00 in New York
以6:00~18:00的交通流量為原始數(shù)據(jù),分別建立 GM(1,1)模型、GM(1,1)冪模型[8]、GM(1,1|sin)模型[4]和本文提出的GM(1,1|sin)冪模型,4種模型的模擬值及相對誤差見圖1和表2。
圖1 4種模型對道路交通流的模擬比較圖Fig.1 Comparison of simulation results of four models for road traffic flow
從圖1中可看出,原始數(shù)據(jù)為振蕩序列,本文模型模擬序列的變化趨勢與原始序列的變化趨勢較為吻合,模擬效果要好于另外3種模型。從表2中可看出,本文模型的平均模擬相對誤差為2.140 2%,顯著低于GM(1,1)模型的10.565 2%、GM(1,1)冪模型的7.730 2%和GM(1,1|sin)模型的4.465 1%。綜合分析可知,本文提出的模型較3種經(jīng)典模型具有更高的模擬預(yù)測精度,更適合振蕩序列的模擬預(yù)測。
表2 4種模型對城市交通流的模擬效果比較Table2 Comparison of the simulation effects of four models for city traffic flow
表3為2007―2015年廣東省高新技術(shù)產(chǎn)品出口額數(shù)據(jù)(來源于廣東科技統(tǒng)計網(wǎng):http://www.sts.gd.cn/)。
以2007―2015年廣東省高新技術(shù)產(chǎn)品出口額為原始數(shù)據(jù),分別建立GM(1,1)模型、GM(1,1)冪模型、GM(1,1|sin)模型和GM(1,1|sin)冪模型,4種模型的模擬值及相對誤差結(jié)果見圖2和表4。
表3 2007―2015年廣東省高新技術(shù)產(chǎn)品出口額Table3 The gross of exports of high and new technology products in Guangdong province form 2007 to 2015
表4 4種模型對高新技術(shù)產(chǎn)品出口額的模擬效果比較Table4 Comparison of the simulation effects among four models for the gross of exports of high and new technology products
圖2 4種模型對高新技術(shù)產(chǎn)品出口額的模擬比較圖Fig.2 Comparison of the simulation results among four models for the gross of exports of high and new technology products
從圖2中可以看出,原始數(shù)據(jù)為振蕩序列時,本文模型的模擬效果要好于其他3種模型。從表4可中看出,GM(1,1)模型、GM(1,1)冪模型和GM(1,1|sin)模型的平均模擬相對誤差分別為6.601 0%,5.281 2%和4.960 9%,而本文模型的平均模擬相對誤差僅為2.114 6%,其精度顯著高于前三者。綜合分析可知,本文模型較3種經(jīng)典模型更適合對廣東省高新技術(shù)產(chǎn)品出口額的模擬預(yù)測,進一步證實了本文模型對振蕩序列的適應(yīng)性。
提出了一種針對振蕩序列模擬預(yù)測的灰色GM(1,1|sin)冪模型,可以根據(jù)原始序列的振蕩特征,靈活調(diào)整冪指數(shù)的取值,即調(diào)整預(yù)測曲線的形狀。由于無法給出模型的解析解,用精度較高的復(fù)合3/8辛普森積分公式代替模型的近似時間響應(yīng)式。為了得到較好的模擬預(yù)測效果,采用粒子群算法確定模型參數(shù)的最優(yōu)值。通過2個應(yīng)用實例證明了本文模型對振蕩序列具有較高的預(yù)測精度,拓展了灰色預(yù)測模型的應(yīng)用范圍。