周德強
(長江大學(xué) 信息與數(shù)學(xué)學(xué)院,湖北 荊州 434023)
直接離散GM(1,1)模型參數(shù)估計的最小一乘法
周德強
(長江大學(xué) 信息與數(shù)學(xué)學(xué)院,湖北 荊州 434023)
研究表明直接離散GM(1,1)模型對嚴(yán)格服從非齊次指數(shù)規(guī)律的原始數(shù)據(jù)進(jìn)行建模,所得到的模型具有完全相同的指數(shù)規(guī)律,而當(dāng)數(shù)據(jù)為近似非齊次指數(shù)規(guī)律時,直接離散GM(1,1)模型擬合效果較差。主要原因是直接離散GM(1,1)模型采用最小二乘法估計參數(shù),穩(wěn)健性不好造成的。針對這一情況,文章提出利用最小一乘法估計直接離散GM(1,1)模型參數(shù)改進(jìn)上述不足。對比實驗表明,采用最小一乘法估計參數(shù)得到的直接離散GM(1,1)模型具有很好的精度和穩(wěn)健性,使得直接離散GM(1,1)模型的適用范圍得到進(jìn)一步擴大。
直接離散GM(1,1)模型;參數(shù)估計;最小一乘法;最小二乘法;線性規(guī)劃
GM(1,1)模型是灰色系統(tǒng)預(yù)測模型及拓展模型中的基礎(chǔ)和核心方法[1,2],應(yīng)用它的前提是要求原始數(shù)據(jù)序列符合或基本符合指數(shù)規(guī)律變化[3]。但許多文獻(xiàn)[4,5]研究表明當(dāng)利用GM(1,1)模型對純指數(shù)序列進(jìn)行擬合時,在預(yù)測精度上有時仍不能取得滿意的擬合效果,對于傳統(tǒng)GM(1,1)中存在預(yù)測精度上的缺陷[6,7],文獻(xiàn)[2]分析了傳統(tǒng)灰色GM(1, 1)模型本身結(jié)構(gòu)上存在的問題,從離散到離散的觀點,提出了DGM(1,1)模型,對GM(1,1)模型做出了實質(zhì)性的改進(jìn),用DGM(1,1)對純指數(shù)增長序列進(jìn)行預(yù)測模擬,結(jié)果完全符合增長規(guī)律。
但是實際生活中完全具有純齊次指數(shù)特征的數(shù)據(jù)是極少的,相對而言,更多的原始序列是更符合近似非齊次指數(shù)規(guī)律的序列[8,9]。針對齊次或者近似非齊次灰色指數(shù)序列的灰色建模,眾多學(xué)者做了相應(yīng)研究,其中文獻(xiàn)[8]提出的DGM(1,1)模型的直接建模法(直接離散GM(1, 1),針對小樣本下具有近似非齊次指數(shù)特點的序列,構(gòu)建了一種簡單的預(yù)測模型,能較好模擬原始序列的非齊次指數(shù)特征。
在利用灰色模型進(jìn)行預(yù)測時,通常模型中參數(shù)估計的好壞會直接影響到模型的預(yù)測精度[10,11]。和傳統(tǒng)的GM(1, 1)模型類似,DDGM(1,1)模型仍采用的是最小二乘法進(jìn)行參數(shù)估計,盡管最小二乘方法參數(shù)估計存在許多優(yōu)點,但是其穩(wěn)健性較差,在模型求解中往往會造成嚴(yán)重的病態(tài)問題[12]。實驗表明當(dāng)原始數(shù)據(jù)嚴(yán)格服從非齊次指數(shù)規(guī)律,DDGM(1, 1)建模法所得到的模型具有完全相同的指數(shù)規(guī)律,然而當(dāng)非齊次指數(shù)規(guī)律的數(shù)據(jù)含有奇異數(shù)據(jù),褪變?yōu)榻品驱R次指數(shù)規(guī)律時,DDGM(1,1)模型擬合效果較差,這與DDGM (1,1)模型利用最小二乘法進(jìn)行參數(shù)估計的方法有很大關(guān)系。
因此,利用DDGM(1,1)模型對含有異常的數(shù)據(jù)進(jìn)行建模和參數(shù)估計時,應(yīng)該盡量選擇較為穩(wěn)健的準(zhǔn)則以減少奇異數(shù)據(jù)對模型預(yù)測的影響[13]。最小一乘準(zhǔn)則受異常點的影響較小,穩(wěn)健性比最小二乘準(zhǔn)則的穩(wěn)健性好[14-17]。其次,最小二乘準(zhǔn)則需要假定數(shù)據(jù)分布服從正態(tài)分布,并且該方法基于殘差平方和最小尋優(yōu),很容易陷入局部最小,對于非線性較強的序列,應(yīng)用最小二乘法得到的結(jié)果會產(chǎn)生很大的偏差[18]。而最小一乘準(zhǔn)則對數(shù)據(jù)分布沒有嚴(yán)格要求,理論證明:對于誤差不服從正態(tài)性的問題中,最小一乘估計的統(tǒng)計性能優(yōu)于最小二乘估計[14]。
在對實際生活中符合近似非齊次指數(shù)規(guī)律的具有貧信息的序列進(jìn)行建模時,由于所用數(shù)據(jù)不多,數(shù)據(jù)總體特征不夠明顯,往往還會含有異常數(shù)據(jù),針對傳統(tǒng)的DDGM( 1,1)模型參數(shù)估計方法上的缺陷,同時鑒于最小一乘法優(yōu)越的統(tǒng)計性能,本文將用最小一乘準(zhǔn)則對DGM(1,1)模型參數(shù)進(jìn)行估計,求解模型時,通過函數(shù)變換將優(yōu)化問題轉(zhuǎn)化為一個線性規(guī)劃問題[19],以克服最小二乘法容易陷入局部最小的問題。最后,用數(shù)據(jù)模擬仿真,通過對比分析證實了該方法的有效性。
1.1DDGM(1,1)建模法[8]
定義1:設(shè) X(0)=(x(0)(1),x(0)(2),···,x(0)(n))為一單調(diào)遞增序列,若對于:
①k=1,2…,n-1,x(0)(k)=ceak,c,a≠0,
則稱 X(0)為齊次指數(shù)序列。
②k=1,2…,n-1,x(0)(k)=ceak+b,c,a,b≠0,則稱X(0)為非齊次指數(shù)序列。
定義2:設(shè)序列X(0)=(x(0)(1),x(0)(2),···,x(0)(n)),稱:
為直接DGM(1,1),簡稱DDGM(1,1)模型。
則灰色微分方程(1)中參數(shù)的最小二乘估計為:
令:
則:
文獻(xiàn)[8]的研究表明,利用DDGM(1,1)建模法,對于原始數(shù)據(jù)序列嚴(yán)格服從非齊次指數(shù)規(guī)律時,所得到的模型具有完全相同的指數(shù)規(guī)律。
1.2DDGM(1,1)建模法參數(shù)估計缺陷分析
DDGM(1,1)模型本質(zhì)上是用自回歸模型方法建立修正指數(shù)模型[8],由式(3)知該自回歸模型采用的是基于大樣本數(shù)據(jù)的最小二乘法估計參數(shù),即:
當(dāng)原始數(shù)據(jù)存在奇異數(shù)據(jù)時,平方會放大奇異值對可信度的影響,導(dǎo)致DDGM(1,1)模型的預(yù)測效果不好[11]。雖然DDGM(1,1)建模法對嚴(yán)格服從非齊次指數(shù)規(guī)律的數(shù)據(jù)能夠完全擬合,但是,實際生活中完全具有純齊次指數(shù)特征的數(shù)據(jù)是極少的。同時,DDGM(1,1)模型是針對小樣本建模的方法,當(dāng)收集的數(shù)據(jù)較少,并且數(shù)據(jù)中夾雜有異常點時,用最小二乘準(zhǔn)則所得的結(jié)果就令人難以接受,在此情況下應(yīng)用所得到的回歸方程或模型進(jìn)行預(yù)測、擬合等,則預(yù)測或擬合的精度相當(dāng)?shù)?,甚至根本不能使用[15-17]。因此針對此種情況,利用DDGM(1,1)模型進(jìn)行預(yù)測時,不宜用最小二乘法估計模型參數(shù)。
相對于傳統(tǒng)DDGM(1,1)模型,優(yōu)化問題(6)的目標(biāo)函數(shù)含有絕對值,因此引入變換[19]:
其中
uk≥0,vk≥0,代入式(7)得:
從而,估計DDGM(1,1)模型的參數(shù)歸結(jié)為如下線性規(guī)劃問題:
可利用單純形法求解上述線性規(guī)劃問題,得到基于最小一乘法準(zhǔn)則的最優(yōu)參數(shù)β1,β2。
為了驗證基于最小一乘法估計DDGM(1,1)模型的可行性和有效性,以下模擬近似非齊次指數(shù)序列進(jìn)行驗證。取兩組數(shù)據(jù)[20]:
上述數(shù)據(jù)為完全的非齊次指數(shù)序列。
將第一組數(shù)據(jù)的第三和第四個數(shù)據(jù)交換位置得到第二組數(shù)據(jù):
第二組數(shù)據(jù)相對第一組數(shù)據(jù)為有異常的近似非齊次指數(shù)序列。
首先驗證兩種準(zhǔn)則下,DDGM(1,1)模型對完全的非齊次指數(shù)序列的擬合和預(yù)測情況。以前6個數(shù)據(jù)建模,最后一個數(shù)據(jù)作為預(yù)測值,利用DDGM(1,1)模型建模,分別采用最小二乘準(zhǔn)則和最小一乘準(zhǔn)則對模型參數(shù)進(jìn)行估計。對第一組數(shù)據(jù)有:
(1)最小二乘準(zhǔn)則
(2)最小一乘準(zhǔn)則
由于上述數(shù)據(jù)不存在異常,所以兩種準(zhǔn)則下估計的參數(shù)較為接近。根據(jù)兩個準(zhǔn)則得到模擬和預(yù)測結(jié)果見表1,表中結(jié)果表明,對于原始數(shù)據(jù)嚴(yán)格服從非齊次指數(shù)規(guī)律,建立DDGM(1,1)模型,使用兩種準(zhǔn)則估計參數(shù),排除計算誤差,所得到的模型均具有完全相同的指數(shù)規(guī)律。
表1 不同準(zhǔn)則下模擬計算結(jié)果比較
用第二組數(shù)據(jù)進(jìn)行最小一乘穩(wěn)健性的測試。仍然以前6個數(shù)據(jù)建模,最后一個數(shù)據(jù)作為預(yù)測值,利用DDGM (1,1)模型建模,分別采用最小二乘準(zhǔn)則和最小一乘準(zhǔn)則對模型參數(shù)進(jìn)行估計。
(1)最小二乘準(zhǔn)則
(2)最小一乘準(zhǔn)則
由以上結(jié)果可以看出,當(dāng)原始數(shù)據(jù)有異常時,對于DDGM(1,1)模型,應(yīng)用最小二乘準(zhǔn)則所得到的參數(shù)系數(shù)與無異常點時差異甚大,而對最小一乘準(zhǔn)則,異常點的有無對求得的參數(shù)影響很小。根據(jù)兩個準(zhǔn)則得到模擬和預(yù)測的結(jié)果見表2,從表中數(shù)據(jù)可見,用最小二乘準(zhǔn)則所得的DDGM(1,1)模型進(jìn)行擬合和預(yù)測精度相當(dāng)差,模型已根本不能使用。而用最小一乘準(zhǔn)則所得的DDGM(1,1)模型進(jìn)行擬合和預(yù)測,精度仍然很高,進(jìn)一步說明了最小一乘準(zhǔn)則能夠克服數(shù)據(jù)較少且存在異常點時最小二乘準(zhǔn)則出現(xiàn)的病態(tài)問題,穩(wěn)健性較好。
表2 不同準(zhǔn)則下模擬計算結(jié)果比較(含異常數(shù)據(jù))
圖1不同準(zhǔn)則下模擬結(jié)果
圖1顯示了對第二組數(shù)據(jù)利用DDGM(1,1)模型進(jìn)行建模,分別基于最小二乘法和最小一乘法估計DDGM(1,1)模型的參數(shù)得到的模型擬合和預(yù)測值。由圖像擬合情況可見,對于含有異常點的近似非齊次指數(shù)序列,基于最小一乘法估計DDGM(1,1)模型的參數(shù),效果遠(yuǎn)遠(yuǎn)好于最小二乘法。
兩組數(shù)據(jù)的實驗結(jié)果充分表明,基于最小一乘法估計DDGM(1,1)模型的參數(shù)具有可行性和有效性。
最小二乘法具有良好的解析性,易于求解,使得該方法在DDGM(1,1)模型中成為普遍采用的參數(shù)估計方法。本文從分析最小二乘法對DDGM(1,1)模型參數(shù)估計容易造成的缺陷入手,提出基于最小一乘法估計DDGM(1,1)模型的參數(shù),理論上可以克服最小二乘法估計模型參數(shù)的缺陷,利用給出的線性規(guī)劃法使得基于最小一乘法估計DDGM(1,1)模型的參數(shù)在應(yīng)用中成為可能,實例表明基于最小一乘準(zhǔn)則估計DDGM(1,1)模型的參數(shù),DDGM(1,1)模型能更好地擬合近似非齊次指數(shù)規(guī)律的數(shù)據(jù),有效擴充了DDGM(1,1)模型的適用范圍。
[1]鄧聚龍.灰色系統(tǒng)理論教程[M].武漢:華中理工大學(xué)出版社,1990.
[2]謝乃明,劉思峰.離散GM(1,1)模型與灰色預(yù)測模型建模機理[J].系統(tǒng)工程理論與實踐,2005,(1).
[3]穆勇.無偏灰色GM(1,1)模型的直接建模法[J].系統(tǒng)工程與電子技術(shù),2003,25(9).
[4]羅黨,劉思峰,黨耀國.灰色模型GM(1,1)優(yōu)化[J].中國工程科學(xué), 2003,5(8).
[5]劉斌,劉思峰,翟振杰,黨耀國等.GM(1,1)模型時間響應(yīng)函數(shù)的最優(yōu)化[J].中國管理科學(xué),2003,11(4).
[6]何文章,宋國鄉(xiāng).基于遺傳算法估計灰色模型中的參數(shù)[J].系統(tǒng)工程學(xué)報,2005,20(4).
[7]張大海,汪世芳,史開泉.灰色預(yù)測公式的理論缺陷及改進(jìn)[J].系統(tǒng)工程理論與實踐,2002,22(8).
[8]曾波.近似非齊次指數(shù)序列的DGM(1,1)直接建模法[J].系統(tǒng)工程理論與實踐,2011,31(2).
[9]崔杰,黨耀國,劉思峰.一種新的灰色預(yù)測模型及其建模機理[J].控制與決策,2009,24(11).
[10]鄭照寧,劉德順.基于遺傳算法的改進(jìn)GM(1,1)模型IGM(1,1)直接建模[J].系統(tǒng)工程理論與實踐,2003,23(5).
[11]何霞,劉衛(wèi)鋒.灰色GM(1,1)模型中參數(shù)估計的幾種方法比較[J].統(tǒng)計與決策,2011,(20).
[12]鄭照寧,武玉英,程小輝,包涵齡.灰色模型的病態(tài)性問題[J].系統(tǒng)工程理論方法應(yīng)用,2001,10(2).
[13]董建,謝開貴.基于最小一乘準(zhǔn)則的非線性回歸模型研究[J].重慶師范學(xué)院學(xué)報(自然科學(xué)版),2001,18(4).
[14]BATES D M.非線性回歸分析及其應(yīng)用[M].韋博成譯.北京:中國統(tǒng)計出版社,1997.
[15]謝開貴,何斌,楊萬年.組合預(yù)測權(quán)重系數(shù)的確定[J].預(yù)測,1998,7 (7).
[16]董祺.“殘差絕對值和最小”準(zhǔn)則的松馳算法[J].預(yù)測,1990,9(2).
[17]袁修貴.“殘差絕對值和最小”準(zhǔn)則的目標(biāo)規(guī)劃法[J].預(yù)測,1994, 13(1).
[18]安德洪,韓文秀,岳毅宏.組合預(yù)測法的改進(jìn)及其在負(fù)荷預(yù)測中的應(yīng)用[J].系統(tǒng)工程與電子技術(shù),2006,26(6).
[19]楊桂元.殘差絕對值之和最小準(zhǔn)則下回歸方程的求解[J].運籌與管理,2001,10(1).
[20]戰(zhàn)立青,施化吉.近似非齊次指數(shù)數(shù)據(jù)的灰色建模方法與模型[J].系統(tǒng)工程理論與實踐,2013,33(3).
(責(zé)任編輯/易永生)
O21
A
1002-6487(2016)22-0015-03
湖北省自然科學(xué)基金資助項目(2013CFA053);長江大學(xué)基礎(chǔ)學(xué)科研究發(fā)展基金資助項目(2014JCY002)
周德強(1974—),男,湖北襄陽人,碩士,副教授,研究方向:機器學(xué)習(xí)、模式識別、系統(tǒng)建模。