李 曄, 丁圓蘋
(河南農(nóng)業(yè)大學(xué)信息與管理科學(xué)學(xué)院,鄭州 450002)
灰色系統(tǒng)理論自20世紀(jì)80年代創(chuàng)立以來,因其適用于“小樣本、貧信息”特征的數(shù)據(jù)建模而受到學(xué)者們的廣泛關(guān)注. 灰色預(yù)測模型是灰色系統(tǒng)理論的重要分支之一[1],由于其只需要少量數(shù)據(jù)便可實(shí)現(xiàn)預(yù)測的特點(diǎn),已被廣泛運(yùn)用到工程、醫(yī)療、農(nóng)業(yè)等多個(gè)領(lǐng)域[2-4].
傳統(tǒng)灰色預(yù)測模型以實(shí)數(shù)作為研究對(duì)象,然而隨著科學(xué)技術(shù)的迅速發(fā)展,人們面臨的系統(tǒng)變得更加復(fù)雜,受認(rèn)知程度所限,越來越多的數(shù)據(jù)不能以確切的數(shù)值表達(dá),而區(qū)間灰數(shù)的表示方法則更符合人們對(duì)系統(tǒng)內(nèi)數(shù)據(jù)的把握和認(rèn)知[5]. 因此,建立面向區(qū)間灰數(shù)的預(yù)測模型已成為學(xué)者們的研究熱點(diǎn)之一. 現(xiàn)有文獻(xiàn)中,學(xué)者們利用“區(qū)間灰數(shù)白化”的思想,通過信息分解法[6-7]、幾何坐標(biāo)轉(zhuǎn)換法[8-9]、灰色屬性法[10-13]將區(qū)間灰數(shù)序列轉(zhuǎn)化為實(shí)數(shù)序列,然后對(duì)實(shí)數(shù)序列建立灰色預(yù)測模型,再反推得到區(qū)間灰數(shù)上下界的模擬值和預(yù)測值. 但是,上述研究均是在灰數(shù)取值分布信息未知的前提下進(jìn)行的.
在灰色系統(tǒng)理論中,作為描述一個(gè)灰數(shù)對(duì)其取值范圍內(nèi)不同數(shù)值“偏愛程度”的白化權(quán)函數(shù),在區(qū)間灰數(shù)預(yù)測中受到了學(xué)者們的深入研究. 文獻(xiàn)[14]定義了白化權(quán)函數(shù)已知的核與灰度,對(duì)已有研究中的核和灰度進(jìn)行了拓展;文獻(xiàn)[15]在典型白化權(quán)函數(shù)已知的前提下,將區(qū)間灰數(shù)序列所蘊(yùn)含的信息轉(zhuǎn)換為面積和中點(diǎn)坐標(biāo)等實(shí)數(shù)序列,然后對(duì)實(shí)數(shù)序列建立灰色預(yù)測模型,有效解決了白化權(quán)函數(shù)已知的區(qū)間灰數(shù)預(yù)測問題;文獻(xiàn)[16]在文獻(xiàn)[15]的基礎(chǔ)上對(duì)區(qū)間灰數(shù)的白化過程進(jìn)行了優(yōu)化,提出了含有遺傳算法的白化權(quán)函數(shù)已知的區(qū)間灰數(shù)預(yù)測模型;文獻(xiàn)[17]建立了三角白化權(quán)函數(shù)已知的區(qū)間灰數(shù)預(yù)測模型,并將其運(yùn)用到黃河寧蒙河段巴彥高勒站的凌期日均流量預(yù)測;文獻(xiàn)[18]以灰色異構(gòu)序列為建模對(duì)象,提出了白化權(quán)函數(shù)已知的灰色異構(gòu)數(shù)據(jù)預(yù)測模型,并將其運(yùn)用到災(zāi)害應(yīng)急物資需求預(yù)測. 前述文獻(xiàn)均是白化權(quán)函數(shù)已知的區(qū)間灰數(shù)預(yù)測模型,運(yùn)用白化權(quán)函數(shù)對(duì)區(qū)間灰數(shù)的分布信息進(jìn)行了補(bǔ)充,有效提高了模型的預(yù)測精度.
現(xiàn)實(shí)生活中大量的不確定性信息符合某種規(guī)律分布,而正態(tài)分布是存在最為廣泛的一種,具有普適性[19].由于其可以用來描述不確定信息的取值概率情況,可被視為一種特殊的白化權(quán)函數(shù),并運(yùn)用到區(qū)間灰數(shù)預(yù)測模型. 文獻(xiàn)[19]通過正態(tài)分布隨機(jī)函數(shù)實(shí)現(xiàn)區(qū)間灰數(shù)序列與實(shí)數(shù)序列的信息等效轉(zhuǎn)換,然后對(duì)正態(tài)分布隨機(jī)白化序列進(jìn)行建模;文獻(xiàn)[20]結(jié)合區(qū)間灰數(shù)上下界與正態(tài)分布參數(shù)之間的轉(zhuǎn)換關(guān)系以及實(shí)數(shù)序列之間存在相互影響和相互制約的特點(diǎn),建立區(qū)間灰數(shù)MGM(1,2)預(yù)測模型. 基于此,本文將以正態(tài)分布作為區(qū)間灰數(shù)的取值信息補(bǔ)充,構(gòu)建正態(tài)分布區(qū)間灰數(shù)預(yù)測模型.
模型精度是判別建模有效性的標(biāo)準(zhǔn)之一,為提升灰色預(yù)測模型的建模精度,眾多學(xué)者對(duì)模型初始條件的優(yōu)化進(jìn)行研究. 關(guān)于初始條件優(yōu)化主要有三種方法:①設(shè)置不同的初始值. 文獻(xiàn)[21]在傳統(tǒng)灰色預(yù)測模型求解初始條件的基礎(chǔ)上,增加修正項(xiàng)ε,對(duì)初始條件進(jìn)行優(yōu)化;文獻(xiàn)[22]結(jié)合“新信息優(yōu)先原理”,將x(1)(n)作為初始值從而求得優(yōu)化的初始條件;文獻(xiàn)[23]在文獻(xiàn)[22]的基礎(chǔ)上進(jìn)行改進(jìn),以x(1)(n)+ε 作為初始值求解初始條件. ②構(gòu)建目標(biāo)函數(shù). 文獻(xiàn)[24-25]結(jié)合模型的時(shí)間響應(yīng)式,構(gòu)建誤差平方和最小的目標(biāo)函數(shù),進(jìn)而求得最優(yōu)初始條件;為體現(xiàn)初始條件優(yōu)化與模型精度檢驗(yàn)的一致性原則,文獻(xiàn)[26]建立了相對(duì)誤差平方和最小的目標(biāo)函數(shù)對(duì)初始條件進(jìn)行優(yōu)化. ③構(gòu)建初始條件表達(dá)式. 文獻(xiàn)[27]根據(jù)模型的時(shí)間響應(yīng)式,結(jié)合“新信息優(yōu)先原理”,假設(shè)擬合序列經(jīng)過原始點(diǎn)x(1)(1)和x(1)(n),求得二者對(duì)應(yīng)的初始條件表達(dá)式,并取其均值作為優(yōu)化的初始條件. 前述文獻(xiàn)中的初始條件優(yōu)化方法在一定程度上提高了模型的預(yù)測精度,但均忽略了對(duì)系統(tǒng)數(shù)據(jù)的充分利用,對(duì)于已經(jīng)具有灰信息的區(qū)間灰數(shù)序列造成了信息浪費(fèi),影響建模精度.
綜上所述,本文基于不確定信息取值概率的正態(tài)分布,以非齊次指數(shù)形式變化的區(qū)間灰數(shù)序列為研究對(duì)象,建立正態(tài)分布區(qū)間灰數(shù)NGM(1,1)預(yù)測模型. 結(jié)合正態(tài)分布的參數(shù)特征,將區(qū)間灰數(shù)序列轉(zhuǎn)化為實(shí)數(shù)序列,并對(duì)實(shí)數(shù)序列建立NGM(1,1)模型. 鑒于初始條件對(duì)模型精度的影響,受文獻(xiàn)[27]中初始條件優(yōu)化方法的啟發(fā),在充分利用數(shù)據(jù)信息的前提下,結(jié)合新信息優(yōu)先原理對(duì)初始條件進(jìn)行優(yōu)化,最終反推區(qū)間灰數(shù)上下界的預(yù)測值.
定義1[19]只知道取值范圍而不知道確切取值的數(shù)稱為灰數(shù),既有下界xL又有上界xU的灰數(shù)稱為區(qū)間灰數(shù),記為?∈[xL,xU],xL<xU.
定義2[19]用來描述一個(gè)灰數(shù)?∈[xL,xU]在其取值范圍[xL,xU]內(nèi)對(duì)不同數(shù)值“偏愛”程度的函數(shù),稱為區(qū)間灰數(shù)的白化權(quán)函數(shù). 若“偏愛”程度呈現(xiàn)正態(tài)分布特征,則稱為正態(tài)分布白化權(quán)函數(shù),如圖1所示.
定義3[19]設(shè)連續(xù)型區(qū)間灰數(shù)?∈[xL,xU],若真實(shí)值d ∈[xL,xU]的取值概率服從正態(tài)分布,即d~N(μ,σ2),μ 為數(shù)學(xué)期望,σ2為方差,則稱?∈[xL,xU]為正態(tài)分布區(qū)間灰數(shù).
圖1 正態(tài)分布白化權(quán)函數(shù)Fig.1 Whitening weight function of normal distribution
為NGM(1,1)模型的白化方程.
其中:a 為發(fā)展系數(shù);b 為驅(qū)動(dòng)項(xiàng);c 為灰色作用量;D 為初始條件.
證明 根據(jù)式(2),在白化方程兩側(cè)同乘eat,并進(jìn)行不定積分,即
則白化方程的解為
則灰色微分方程的時(shí)間響應(yīng)式函數(shù)為
由x^(0)(k)=x(1)(k)-x(1)(k-1)得累減還原式為
以區(qū)間灰數(shù)在取值范圍內(nèi)的真實(shí)值取值概率呈正態(tài)分布作為信息補(bǔ)充,結(jié)合正態(tài)分布的參數(shù)特征,將區(qū)間灰數(shù)序列等效轉(zhuǎn)換為核序列和信息擴(kuò)散度序列,以NGM(1,1)模型作為基礎(chǔ)模型對(duì)實(shí)數(shù)序列進(jìn)行建模.由于模型精度受到初始條件的影響,在已有初始條件優(yōu)化方法的基礎(chǔ)上進(jìn)行改進(jìn),充分利用所有的數(shù)據(jù)信息,求得各點(diǎn)對(duì)應(yīng)的初始條件,并結(jié)合新信息優(yōu)先原理對(duì)初始條件賦權(quán),進(jìn)而構(gòu)建初始條件優(yōu)化的正態(tài)分布區(qū)間灰數(shù)NGM(1,1)模型.
為了充分利用數(shù)據(jù)序列信息,本文考慮1-AGO序列中各個(gè)分量對(duì)預(yù)測模型的影響,在假設(shè)擬合點(diǎn)與原始點(diǎn)重合的情況下,計(jì)算各點(diǎn)對(duì)應(yīng)的初始條件. 此外,基于新信息優(yōu)先原理,賦予新信息對(duì)應(yīng)的初始條件較大的權(quán)重,舊信息對(duì)應(yīng)的初始條件較小的權(quán)重,以初始條件的加權(quán)平均值作為預(yù)測序列優(yōu)化的初始條件,進(jìn)而提升模型的預(yù)測性能.
設(shè)第k 個(gè)初始條件對(duì)應(yīng)的權(quán)重為α(k),其中
α(k)的變化滿足α(1)<α(2)<…<α(n),與新信息優(yōu)先原理下的權(quán)重設(shè)置原則一致,具有有效性.
命題1 綜合考慮全部數(shù)據(jù)序列信息,可得優(yōu)化的初始條件為
證明 根據(jù)式(4),可得
即
結(jié)合式(6)及新信息優(yōu)先原理,優(yōu)化的初始條件為
定理3 設(shè)B、Y 如定理1所述,則NGM(1,1)模型的白化方程在初始條件優(yōu)化下的解為
則灰色微分方程的時(shí)間響應(yīng)式函數(shù)為
累減還原式為
由定義4可知,結(jié)合正態(tài)分布的參數(shù)特征,對(duì)正態(tài)分布區(qū)間灰數(shù)白化時(shí),可以實(shí)現(xiàn)區(qū)間灰數(shù)信息的等效轉(zhuǎn)換. 因此,可將正態(tài)分布區(qū)間灰數(shù)序列轉(zhuǎn)化為核序列和信息擴(kuò)散度序列.
結(jié)合定義5,對(duì)實(shí)數(shù)序列分別建立初始條件優(yōu)化的NGM(1,1)預(yù)測模型,可得其累減還原式分別為:
其中:Dopt、a 和b 為初始條件優(yōu)化的核序列的NGM(1,1)預(yù)測模型的參數(shù);D′opt、a′和b′為初始條件優(yōu)化的信息擴(kuò)散度序列的NGM(1,1)預(yù)測模型的參數(shù).
根據(jù)定義4,推導(dǎo)還原得到區(qū)間灰數(shù)的上下界,即
初始條件優(yōu)化的正態(tài)分布區(qū)間灰數(shù)NGM(1,1)模型建模步驟如下:
Step1根據(jù)定義4,將區(qū)間灰數(shù)序列轉(zhuǎn)化為核序列和信息擴(kuò)散度序列;
Step2根據(jù)定義5,分別建立核序列和信息擴(kuò)散度序列的NGM(1,1)模型;
Step3結(jié)合式(6)~(9),對(duì)所建立的兩個(gè)NGM(1,1)模型的初始條件進(jìn)行優(yōu)化;
Step4 根據(jù)式(13)~(14),求得核序列和信息擴(kuò)散度序列的模擬值并推導(dǎo)區(qū)間灰數(shù)上下界.
為證明本文模型的有效性和實(shí)用性,利用所建立的初始條件優(yōu)化的正態(tài)分布區(qū)間灰數(shù)NGM(1,1)模型對(duì)某航空公司2008—2018年的航空貨運(yùn)量進(jìn)行模擬和預(yù)測,數(shù)據(jù)源于文獻(xiàn)[29]. 為進(jìn)一步檢驗(yàn)?zāi)P偷慕PЧ瑫r(shí)利用文獻(xiàn)[30]中的模型進(jìn)行建模. 原始數(shù)據(jù)如表1所示.
表1 某航空公司2008—2018年航空貨運(yùn)量Tab.1 The Air cargo volumes of an airline from 2008 to 2018
以2008—2017年的數(shù)據(jù)進(jìn)行建模,對(duì)2018年的數(shù)據(jù)進(jìn)行預(yù)測,具體步驟如下:Step1根據(jù)定義4,將區(qū)間灰數(shù)序列轉(zhuǎn)化為核序列和信息擴(kuò)散度序列,得
Step2根據(jù)定義5,分別建立核序列和信息擴(kuò)散度序列的NGM(1,1)模型,并結(jié)合式(8)~(11)對(duì)初始條件進(jìn)行優(yōu)化,得
Step3再根據(jù)式(13)~(14)推導(dǎo)區(qū)間灰數(shù)上下界的模擬值. 具體數(shù)據(jù)見表2.
表2 航空貨運(yùn)量的模擬、預(yù)測值及誤差Tab.2 Simulated values,forecast values and errors of the air cargo volumes
觀察表2,本文模型的上、下界平均相對(duì)誤差分別為2.637%和3.091%,預(yù)測誤差分別為0.754%和0.946%,均明顯優(yōu)于文獻(xiàn)[30]中的模型. 這主要是由于在建模方法方面,文獻(xiàn)[30]在缺乏區(qū)間灰數(shù)取值分布信息的情況下將區(qū)間灰數(shù)白化為實(shí)數(shù)序列,而本文以“不確定信息廣泛存在正態(tài)分布規(guī)律”作為區(qū)間灰數(shù)的取值信息補(bǔ)充,將區(qū)間灰數(shù)序列等效轉(zhuǎn)化為實(shí)數(shù)序列,“正態(tài)分布”取值信息的補(bǔ)充降低了區(qū)間灰數(shù)的灰性,有利于模型精度的提升;在模型選擇方面,文獻(xiàn)[30]選用擬合齊次指數(shù)增長的DGM(1,1)模型,本文選用既適用于齊次指數(shù)增長,也適用于非齊次指數(shù)增長的NGM(1,1)模型,相比較而言,本文選用的模型具有普適性,有利于數(shù)據(jù)變化規(guī)律的挖掘和發(fā)展趨勢(shì)的預(yù)測;在模型優(yōu)化方面,文獻(xiàn)[30]未對(duì)影響建模精度的初始條件進(jìn)行優(yōu)化,而本文結(jié)合新信息優(yōu)先原理對(duì)初始條件進(jìn)行優(yōu)化,從理論上既能提高建模精度又遵循了灰色系統(tǒng)建模的新信息優(yōu)先原則. 綜上所述,本文的建模方法有利于提升模型預(yù)測性能.
區(qū)間灰數(shù)是一種具有灰信息的數(shù)據(jù),與實(shí)數(shù)建模相比,區(qū)間灰數(shù)建模更為復(fù)雜. 本文在不確定信息廣泛存在正態(tài)分布的背景下,結(jié)合正態(tài)分布的參數(shù)特征,實(shí)現(xiàn)了區(qū)間灰數(shù)序列到實(shí)數(shù)序列的等效轉(zhuǎn)換,并分別建立實(shí)數(shù)序列的NGM(1,1)預(yù)測模型. 鑒于初始條件對(duì)模型精度的影響,充分利用數(shù)據(jù)序列信息及新信息優(yōu)先原理對(duì)其進(jìn)行優(yōu)化. 最后,將模型應(yīng)用于某航空公司2008—2018年的航空貨運(yùn)量預(yù)測,結(jié)果表明本文所建立的初始條件優(yōu)化的正態(tài)分布區(qū)間灰數(shù)NGM(1,1)模型具有有效性和實(shí)用性.