宋 敏,柏 玉,劉士虎
(云南民族大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,云南 昆明 650504)
從統(tǒng)計(jì)意義上講,時(shí)間序列(time series,簡(jiǎn)記TS)是指將同一現(xiàn)象的某個(gè)或多個(gè)統(tǒng)計(jì)指標(biāo)在不同時(shí)間上的觀察數(shù)據(jù),按照時(shí)間的先后順序排列起來(lái)所形成的序列,也稱動(dòng)態(tài)序列[1]. 所謂的時(shí)間序列分析是指對(duì)時(shí)間序列數(shù)據(jù)展開的分析和研究,旨在挖掘出序列中的相互關(guān)系和變化趨勢(shì),以便于完成對(duì)未來(lái)數(shù)據(jù)的序列預(yù)測(cè)工作[1]. 截止目前,針對(duì)時(shí)間序列數(shù)據(jù)的預(yù)測(cè)工作,諸多研究人員提出了大量的預(yù)測(cè)模型,如自回歸模型[2]、滑動(dòng)平均模型[3]、自回歸滑動(dòng)平均模型[3]、線性回歸模型[4]等. 不難發(fā)現(xiàn),已有的這些預(yù)測(cè)模型在模糊數(shù)據(jù)、不確定數(shù)據(jù)或發(fā)展趨勢(shì)不明顯的數(shù)據(jù)展開預(yù)測(cè)時(shí)效果不太理想. 為此,Song 和 Chissom[5]于1993年首次提出了模糊時(shí)間序列預(yù)測(cè)(fuzzy time series forecasting,簡(jiǎn)記FTSF)模型并應(yīng)用于阿拉巴馬大學(xué)學(xué)生招生人數(shù)預(yù)測(cè). 由于FTSF模型借助于模糊邏輯理論,使其能夠在不確定環(huán)境下描述和處理模糊數(shù)據(jù). 該模型的研究一經(jīng)問(wèn)世,便引起了學(xué)術(shù)界、工程技術(shù)領(lǐng)域的廣泛關(guān)注,并迅速發(fā)展成為一個(gè)熱門的研究課題,取得了大量有價(jià)值的理論研究成果.該成果在醫(yī)療[6]、股票[7]和溫度[8]等眾多不同的領(lǐng)域得到了廣泛的應(yīng)用.
截止目前,針對(duì)FTSF問(wèn)題展開的一系列研究工作中,不難發(fā)現(xiàn)大部分研究工作主要集中在對(duì)論域劃分方法的改進(jìn)、模糊關(guān)系和預(yù)測(cè)規(guī)則的改進(jìn)、一元一階模型到多元和高階模型的改進(jìn)等三個(gè)方面.
對(duì)于論域劃分方法的改進(jìn),由研究初期的等分論域劃分方法向預(yù)測(cè)精度更高的非等分論域劃分方法進(jìn)行改進(jìn).根據(jù)歷史數(shù)據(jù)分布不均勻、模糊等特性,大量的學(xué)者采用基于概率的離散化方法[9]、基于神經(jīng)網(wǎng)絡(luò)的方法[10]、基于信息粒的方法[11]、基于模糊聚類的方法[12]對(duì)論域進(jìn)行非等分劃分.
對(duì)于模糊關(guān)系和預(yù)測(cè)規(guī)則的改進(jìn). 預(yù)測(cè)規(guī)則的建立以模糊邏輯關(guān)系為基礎(chǔ),它是模糊時(shí)間序列預(yù)測(cè)模型的核心部分. 由研究初期的“max-min”聚合運(yùn)算[13-14]進(jìn)入到支持向量機(jī)分類算法[15]、公理模糊集分類算法[16]和直覺(jué)模糊條件推理技術(shù)[17]等,使得預(yù)測(cè)模型具有較好的可解釋性,同時(shí)也提高了模型預(yù)測(cè)的精度.
對(duì)于一元一階模型到多元和高階模型的改進(jìn).由研究初期的一元一階模型向適應(yīng)性更高的多元和高階模型進(jìn)行改進(jìn).先后相繼出現(xiàn)了基于關(guān)系組算法[18]、基于模糊變換的高階模糊關(guān)系式方法[19]、基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)方法[20]、基于直覺(jué)模糊關(guān)系式方法[21]、基于禁忌搜索算法等的多元和高階模型[22]. 多元和高階模型的出現(xiàn)有效地解決了一元一階模型在實(shí)際應(yīng)用中的極限性,使模糊時(shí)間序列預(yù)測(cè)模型的適應(yīng)性大大增強(qiáng).
在FTSF模型中,對(duì)歷史數(shù)據(jù)模糊化時(shí)僅采用傳統(tǒng)的Zadeh 模糊集[23],即只用隸屬度來(lái)度量語(yǔ)言值的隸屬性質(zhì).遺憾的是,這些方法不能形象地反映信息的模糊性與不確定性,不能正確地反映歷史數(shù)據(jù)之間的隨機(jī)變化特性,從根本上限制了預(yù)測(cè)精度的提升. 鑒于直覺(jué)模糊集(intuitionistic fuzzy set,簡(jiǎn)記IFS)作為Zadeh 模糊集的重要擴(kuò)充和發(fā)展,對(duì)歷史數(shù)據(jù)的數(shù)學(xué)描述既客觀又細(xì)膩,為模糊性、不確定性信息的研究和處理指出了新的突破方向[24].Oscar等人[25]首次將IFS理論融入到FTSF模型中,建立了第一個(gè)直覺(jué)模糊時(shí)間序列預(yù)測(cè)(intuitionistic fuzzy time series forecasting,簡(jiǎn)記IFTSF)模型,其本質(zhì)是隸屬度、非隸屬度模糊推理系統(tǒng)的加權(quán)合成. 它的出現(xiàn)極大地?cái)U(kuò)展了時(shí)間序列對(duì)模糊性、不確定性等信息的處理能力.除此之外,文獻(xiàn)[26]提出了參數(shù)自適應(yīng)的直覺(jué)模糊C均值(fuzzy c-means,簡(jiǎn)記FCM)聚類的IFTSF模型. 文獻(xiàn)[27]將動(dòng)態(tài)時(shí)間彎曲距離與直覺(jué)模糊時(shí)間序列結(jié)合,進(jìn)一步優(yōu)化FTSF模型. 文獻(xiàn)[28]通過(guò)增加猶豫度因子對(duì)歷史數(shù)據(jù)進(jìn)行直覺(jué)模糊化,提出了基于直覺(jué)模糊化的廣義FTSF模型.近年來(lái),大量的研究學(xué)者[29-31]就由研究初期的FTSF模型進(jìn)入到預(yù)測(cè)精度更高的IFTSF模型.然而,隨著IFTSF理論日趨成熟,其局限性也逐漸凸現(xiàn): (1) 等分劃分論域所獲得的模糊子區(qū)間無(wú)法反映歷史數(shù)據(jù)內(nèi)部或局部形態(tài)的關(guān)聯(lián)特征;(2) 如何有效地對(duì)歷史數(shù)據(jù)進(jìn)行直覺(jué)模糊化,使其較好地反映歷史數(shù)據(jù)“非此非彼”的模糊狀態(tài)仍然是一個(gè)有待解決的難題.因此,IFTSF理論的拓展研究已成為亟待解決的重要問(wèn)題.
基于上述討論,本文從對(duì)論域的等分和非等分劃分,歷史數(shù)據(jù)直覺(jué)模糊化兩個(gè)角度,對(duì)原有問(wèn)題研究方法的局限性展開相應(yīng)的改進(jìn),進(jìn)而建立一個(gè)新的高階IFTSF模型.通過(guò)實(shí)驗(yàn)不難發(fā)現(xiàn),本文所提出的高階IFTSF模型取得較好的預(yù)測(cè)效果,在一定程度上能有效地克服FTSF模型的缺陷.
為了行文簡(jiǎn)潔及后文敘述的需要,該節(jié)給出與本文相關(guān)的一些基本概念,如直覺(jué)模糊集、猶豫模糊集、模糊時(shí)間序列等.詳細(xì)的敘述,請(qǐng)參閱文獻(xiàn)[11,13,17,29].
定義1 (直覺(jué)模糊集) 針對(duì)給定的論域U,其上的一個(gè)直覺(jué)模糊集A具有如下的表示形式
A={
(1)
其中μA(x):x→[0,1]代表A的隸屬度函數(shù);γA(x):x→[0,1]代表A的非隸屬度函數(shù);進(jìn)一步,用πA(x)=1-μA(x)-γA(x)來(lái)表示x關(guān)于A的直覺(jué)模糊指標(biāo),其反映了x對(duì)模糊概念A(yù)的一種猶豫程度.
定義2(猶豫模糊集) 針對(duì)給定的論域U,其上的一個(gè)猶豫模糊集H具有如下的表示形式
H={
(2)
其中μH(x)?[0,1]是元素x∈H的所有可能的隸屬度值,稱每一個(gè)η∈μH(x)為猶豫模糊元.
定義3(模糊時(shí)間序列) 設(shè)X(t)(t=1,2,…)為論域U上的一個(gè)時(shí)間序列,定義fi(t)(i=1,2,…)為X(t)上的一組模糊集.如果F(t)是由模糊集fi(t)(i=1,2,…)組成的集合,即
F(t)={f1(t),f2(t),…},
(3)
則稱F(t)為定義在X(t)(t=1,2,…)上的模糊時(shí)間序列.
定義4(直覺(jué)模糊時(shí)間序列) 設(shè)X(t)(t=1,2,…)為論域U上的一個(gè)時(shí)間序列,定義fi(t)=〈μi(X(t)),γi(X(t))〉(i=1,2,…)為X(t)上的一組直覺(jué)模糊集.若Y(t)={f1(t),f2(t),…},則稱Y(t)為定義在X(t)上的直覺(jué)模糊時(shí)間序列,表示為
(4)
其中“+”表示連接符.
定義5 (模糊關(guān)系) 設(shè)R(t,t-1)為從Y(t-1)到Y(jié)(t)之間的模糊關(guān)系,且滿足Y(t)=Y(t-1)°R(t,t-1),則稱Y(t)是由Y(t-1)通過(guò)模糊關(guān)系R(t,t-1)推導(dǎo)得到的,且可以用模糊邏輯關(guān)系Y(t-1)→Y(t)來(lái)表示.其中Y(t-1)為模糊邏輯關(guān)系的前件,Y(t)為模糊邏輯關(guān)系的后件.
定義6(高階直覺(jué)模糊時(shí)間序列) 如果一個(gè)直覺(jué)模糊時(shí)間序列Y(t)僅由Y(t-1)決定,即Y(t)=Y(t-1)°R(t,t-1),那么稱Y(t)為“一階直覺(jué)模糊時(shí)間序列”.如果Y(t)由Y(t-1),Y(t-2),…,Y(t-r)共同決定,那么稱Y(t)為“高階直覺(jué)模糊時(shí)間序列”,表示為
Y(t)=Y(t-1)×Y(t-2)×…×Y(t-r)°R(t,t-r),
(5)
其中R(t,t-r)=f(t)×f(t-1)∪f(wàn)(t-1)×f(t-2)∪…∪f(wàn)(t-r+1)×f(t-r)為高階模糊關(guān)系;“×”為笛卡爾積;“∪”為模糊并運(yùn)算符;“°”為模糊合成算子,取“max-min”合成運(yùn)算.
FCM是一種經(jīng)典的聚類算法,該算法把數(shù)據(jù)聚類問(wèn)題轉(zhuǎn)化為帶約束的目標(biāo)函數(shù)優(yōu)化問(wèn)題.它首先將數(shù)據(jù)點(diǎn)xi(i=1,2,…,n)劃分為c類,然后求出每個(gè)類的聚類中心vj(j=1,2,…,c),使得每個(gè)類中各數(shù)據(jù)點(diǎn)之間的相似度最高.其目標(biāo)函數(shù)為
(6)
約束條件為
(7)
其中目標(biāo)函數(shù)Jm(U,V)的值越小,聚類效果越好;m為模糊加權(quán)指數(shù),決定了聚類結(jié)果的模糊程度,一般情況下m=2最為合適;μij為數(shù)據(jù)點(diǎn)xi關(guān)于第j個(gè)類的隸屬度;‖*‖為數(shù)據(jù)點(diǎn)xi與第j個(gè)類中心vj之間的歐式距離.
目標(biāo)函數(shù)(6)的優(yōu)化過(guò)程具體是通過(guò)更新以下形式的隸屬度μij和聚類中心vj:
(8)
(9)
利用IFTSF模型進(jìn)行歷史數(shù)據(jù)預(yù)測(cè)時(shí),如何對(duì)論域做劃分是IFTSF模型的首要環(huán)節(jié),是模型預(yù)測(cè)質(zhì)量好壞的關(guān)鍵.在大多數(shù)的IFTSF模型中,作者為了簡(jiǎn)化所建模型的復(fù)雜度,均對(duì)歷史數(shù)據(jù)論域采取等分劃分的方法進(jìn)行處理. 這種方法雖然簡(jiǎn)單、方便,但這使得IFTSF的結(jié)果并不十分理想. 其主要原因是劃分后所獲得的模糊子區(qū)間無(wú)法反映歷史數(shù)據(jù)內(nèi)部或局部形態(tài)的關(guān)聯(lián)特征,同時(shí)劃分后所得到的每個(gè)模糊子區(qū)間可解釋性差. 為解決上述問(wèn)題存在的不足,該節(jié)我們利用等分論域劃分和基于FCM算法的非等分論域劃分兩種劃分方法來(lái)對(duì)歷史數(shù)據(jù)的論域做劃分,以此實(shí)現(xiàn)解決預(yù)測(cè)精度低和模糊子區(qū)間可解釋性差的問(wèn)題.
等分論域劃分方法是目前最為簡(jiǎn)單、方便的一種論域劃分方法.該方法具體通過(guò)以下三個(gè)步驟來(lái)實(shí)現(xiàn).
步驟1:確定論域U
假設(shè)U為歷史數(shù)據(jù)論域,xmax和xmin分別為歷史數(shù)據(jù)集D={x1,x2,···,xn}的最大值和最小值,則
U=[xmin-σ1,xmax+σ2],
(10)
其中σ1和σ2為合適的正整數(shù).
步驟2:確定模糊子區(qū)間的個(gè)數(shù)k
依據(jù)歷史數(shù)據(jù)的結(jié)構(gòu)特性以及人們處理實(shí)際問(wèn)題中存在的模糊性及不確定性,用自然語(yǔ)言能夠表達(dá)的方法對(duì)論域U進(jìn)行劃分.即劃分的模糊子區(qū)間個(gè)數(shù)k為
(11)
其中n為歷史數(shù)據(jù)集的個(gè)數(shù);P為距離參數(shù)調(diào)節(jié)因子;“[*]”表示不超過(guò)k的最大整數(shù).
步驟3:劃分論域U
在這一步中,我們采用等分論域劃分方法確定每個(gè)模糊子區(qū)間的上下界,具體通過(guò)以下兩個(gè)子步驟來(lái)實(shí)現(xiàn).
步驟3.1:確定每個(gè)模糊子區(qū)間的長(zhǎng)度l
(12)
步驟3.2:獲得k個(gè)等長(zhǎng)的模糊子區(qū)間u1,u2,…,uk
(13)
其中d2-d1=d3-d2=…=dk+1-dk=l,d1=xmin-σ1,dk+1=xmax+σ2.
FCM算法是目前比較流行的一種模糊劃分方法.若將其運(yùn)用于IFTSF模型中論域的非等分劃分,不僅能充分反映歷史數(shù)據(jù)內(nèi)部或局部形態(tài)的關(guān)聯(lián)特征,也能提高模型的預(yù)測(cè)精度.該方法具體通過(guò)以下四個(gè)步驟來(lái)實(shí)現(xiàn).
步驟1:確定聚類中心
步驟2:根據(jù)聚類中心建立相應(yīng)的數(shù)據(jù)子集Dj(j=1,2,…,c)
根據(jù)聚類中心v1 (14) 步驟3:計(jì)算子集Dj(j=1,2,…,c)的信息顆粒Ωj(j=1,2,…,c) 信息顆粒Ωj的重要作用是對(duì)初次劃分的數(shù)據(jù)子集Dj進(jìn)一步調(diào)節(jié),使其不僅考慮了歷史數(shù)據(jù)內(nèi)部或局部形態(tài)的關(guān)聯(lián)特征,還考慮了劃分后模糊子區(qū)間的可解釋性.令med(Dj)=vj,利用公式(15)至(18)計(jì)算Ωj的最優(yōu)上下界,記為bj,aj,也就是計(jì)算得到子集Dj的信息顆粒Ωj=[aj,bj]. V(a)=h1(card{xi∈D|a≤xi≤med(Dj)})·h2(|med(Dj)-a|), (15) V(b)=h1(card{xi∈D|med(Dj)≤xi≤b})·h2(|med(Dj)-b|), (16) 這里h1(x),h2(x)可分別設(shè)為下列具體的函數(shù) h1(x)=x, (17) h2(x)=exp(-εx), (18) 其中a,b是落入Dj范圍內(nèi)的歷史數(shù)據(jù);card{xi}是落入Dj范圍內(nèi)的數(shù)據(jù)量;ε∈[0,1]是參數(shù). 令V(aopt)=maxa≤med(Dj)V(a),則最優(yōu)下界aopt就是信息顆粒Ωj的下邊界aj.同樣的方法,可獲得信息顆粒Ωj的上邊界bj.下面舉例說(shuō)明,如何計(jì)算D上的信息顆粒Ω=[a,b]. 令D={x1,x2,x3,…,x9,x10,x11}={-4.0,-3.4,-2.2,-1.3,-1.0,0.0,0.8,1.4,2.5,2.9,4.3},如圖1所示,參數(shù)ε=0.5. 首先確定信息顆粒的最優(yōu)上邊界bopt.經(jīng)計(jì)算med(D)=0.0. 當(dāng)b=x6時(shí),V(b)=1·exp(-0.5·0.0)=1.00, 當(dāng)b=x7時(shí),V(b)=2·exp(-0.5·0.8)=1.35, ? 當(dāng)b=x11時(shí),V(b)=6·exp(-0.5·4.3)=0.70. 顯然,V(bopt=1.4)=maxb≥med(D)V(b),因而b=bopt=1.4.用類似的方法可以確定信息顆粒的最優(yōu)下邊界a=aopt,進(jìn)而得到Ω=[a,b]. 圖1 調(diào)整界限(a和b)確定最優(yōu)信息顆粒Ω 步驟4:獲得相應(yīng)的k個(gè)非等長(zhǎng)的模糊子區(qū)間u1,u2,…,uk. 這一步驟分兩種情況來(lái)實(shí)現(xiàn). 當(dāng)k為奇數(shù)時(shí),如果|med(D1)-xmin|≥|med(Dk)-xmax|,則 (19) 否則, (20) 當(dāng)k為偶數(shù)時(shí), (21) 為了能夠更加有效地提高IFTSF模型的預(yù)測(cè)性能,更真實(shí)、準(zhǔn)確地反映歷史數(shù)據(jù)內(nèi)部或局部形態(tài)的關(guān)聯(lián)特征及模糊波動(dòng)特性.本文繼續(xù)以文獻(xiàn)[5]模型的框架為基礎(chǔ),首先利用等分論域劃分和基于FCM算法的非等分論域劃分兩種劃分方法來(lái)對(duì)歷史數(shù)據(jù)的論域做劃分,具體劃分方法第2節(jié)已詳細(xì)給出.其次通過(guò)構(gòu)建直覺(jué)模糊集來(lái)對(duì)歷史數(shù)據(jù)進(jìn)行直覺(jué)模糊化處理.然后結(jié)合“max-min”聚合運(yùn)算,合理地選取要考慮的模糊狀態(tài),最后對(duì)預(yù)測(cè)結(jié)果去模糊化輸出. 在傳統(tǒng)的FTSF模型中,歷史數(shù)據(jù)模糊化大都是人為地用三角模糊隸屬度函數(shù)來(lái)定義.即歷史數(shù)據(jù)xi屬于模糊子區(qū)間ui,則ui(xi)=1.并且歷史數(shù)據(jù)xi對(duì)ui兩邊模糊子區(qū)間的隸屬度呈現(xiàn)遞減的趨勢(shì).xi對(duì)各個(gè)模糊子區(qū)間的隸屬度為 (22) 利用上式對(duì)歷史數(shù)據(jù)進(jìn)行模糊化處理,分析結(jié)果發(fā)現(xiàn),當(dāng)歷史數(shù)據(jù)之間的差別不是很大時(shí),不同的歷史數(shù)據(jù)可能就會(huì)落在相同的模糊子區(qū)間上.這樣不僅不能充分體現(xiàn)歷史數(shù)據(jù)的分布特性,使數(shù)據(jù)鈍化,也會(huì)降低模型對(duì)特定問(wèn)題的處理功效.因此合理有效地定義模糊子區(qū)間變量所對(duì)應(yīng)的IFS及歷史數(shù)據(jù)直覺(jué)模糊化方法,能很好地反映歷史數(shù)據(jù)“非此非彼”的模糊狀態(tài),對(duì)于提升直覺(jué)模糊時(shí)間序列預(yù)測(cè)精度顯得極其重要. 假設(shè)歷史數(shù)據(jù)對(duì)應(yīng)的論域U被劃分為k個(gè)模糊子區(qū)間,定義k個(gè)代表語(yǔ)言變量的直覺(jué)模糊集為 Ap={ (23) 確定Ap的隸屬度和非隸屬度函數(shù)是該步驟的關(guān)鍵所在.本節(jié)針對(duì)IFTSF模型的實(shí)際應(yīng)用情況以及區(qū)間劃分的特性,給出一種新的歷史數(shù)據(jù)模糊化方法.具體通過(guò)以下3條規(guī)則來(lái)實(shí)現(xiàn). (24) (25) 其中cμi,σμi和cγi,σγi是確定隸屬度函數(shù)值μAp(xi)和非隸屬度函數(shù)值γAp(xi)的參數(shù),借助公式(26)至(28)計(jì)算得到. (26) (27) (28) 由此可見(jiàn),通過(guò)(1)、(2)和(3)三條規(guī)則可以獲取數(shù)據(jù)集D中所有歷史數(shù)據(jù)對(duì)于直覺(jué)模糊集Ap的隸屬度值和非隸屬度值,并運(yùn)用公式(29)進(jìn)行歷史數(shù)據(jù)的直覺(jué)模糊化處理. (29) 其中L(Ap)是直覺(jué)模糊逼近因子,它綜合考慮直覺(jué)模糊集中支持、反對(duì)以及猶豫三者之間的關(guān)系,使評(píng)判結(jié)果更加合理. 假設(shè)H是論域U上的一個(gè)猶豫模糊集,猶豫模糊元由下列映射定義:hH:U[0,1],hH(x)?[0,1],那么HAp={ O({L(Ap)e,L(Ap)u})=1-(1-L(Ap)e)ωe* (1-L(Ap)u)ωu, (30) 其中L(Ap)i(i=e,u)是歷史數(shù)據(jù)xi直覺(jué)模糊化為Ap所獲得的直覺(jué)模糊趨勢(shì)逼近因子,ωi(i=e,u)是xi的權(quán)重. 公式(30)需滿足以下性質(zhì): (1) ?L(Ap)e,L(Ap)u∈[0,1]. (2)O(L(Ap)e,L(Ap)u)≥min{L(Ap)e,L(Ap)u}. (3)O(L(Ap)e,L(Ap)u)≤max{L(Ap)e,L(Ap)u}. 根據(jù)上面的定義,在應(yīng)用公式(30)對(duì)歷史數(shù)據(jù)直覺(jué)模糊化后得到的L(Ap)進(jìn)行聚合時(shí),需要確定每一個(gè)模糊子區(qū)間對(duì)應(yīng)的權(quán)重.權(quán)重的確定借助公式(31)和(32)計(jì)算得到. (31) (32) 其中de是等分論域劃分所得到的模糊子區(qū)間長(zhǎng)度;du是非等分論域劃分所得到的模糊子區(qū)間長(zhǎng)度. 具體的聚合過(guò)程由以下例子說(shuō)明. 令歷史數(shù)據(jù)集D={x1,x2,x3},并且H={ 應(yīng)用上述聚合方法我們可以得到一個(gè)模糊集HAp. h(x1)=1-((1-0.20)1/3*(1-0.30)1/3* (1-0.40)1/3)=0.305. 這里,min({0.20,0.30,0.40})<0.305 同理可得h(x2)=0.497,h(x3)=0.524. 模糊集HAp可以表示為:HAp={ 因?yàn)閙ax{0.305,0.497,0.524}=0.524,即x1模糊化為HAp. 根據(jù)聚合的模糊集HAp構(gòu)建模糊邏輯關(guān)系和模糊邏輯關(guān)系組,并對(duì)構(gòu)建的模糊邏輯關(guān)系和模糊邏輯關(guān)系組進(jìn)行“max-min”聚合運(yùn)算,從而得到一個(gè)模糊行向量. 采用下面的重心去模糊化方法對(duì)模糊行向量進(jìn)行去模糊化輸出,輸出結(jié)果就是屬于該模糊集對(duì)應(yīng)的數(shù)據(jù)對(duì)下一時(shí)刻數(shù)據(jù)值的預(yù)測(cè)結(jié)果.去模糊化輸出需要遵循以下規(guī)則. 如果模糊關(guān)系組中存在模糊邏輯關(guān)系HAp1,HAp2,…,HApk→HAp,那么t+1時(shí)刻的去模糊化輸出值為 (33) 其中fi是模糊行向量;li是歷史數(shù)據(jù)模糊化為Ap時(shí)所對(duì)應(yīng)的等長(zhǎng)模糊子區(qū)間和非等長(zhǎng)模糊子區(qū)間的組合中點(diǎn),通過(guò)公式(34)計(jì)算得到. (34) 其中Me是歷史數(shù)據(jù)xi模糊化為Ap時(shí)所對(duì)應(yīng)的等長(zhǎng)模糊子區(qū)間的中點(diǎn);Mu是歷史數(shù)據(jù)xi模糊化為Ap時(shí)所對(duì)應(yīng)的非等長(zhǎng)模糊子區(qū)間的中點(diǎn). 如果模糊關(guān)系組中不存在任何模糊邏輯關(guān)系,即HAp→φ沒(méi)有匹配規(guī)則,那么t+1時(shí)刻的去模糊化輸出值為 (35) 本文中,我們以阿拉巴馬大學(xué)的學(xué)生招生人數(shù)及2019年8月1日到2019年10月31 日這期間三個(gè)月總共67個(gè)交易日的黃金期貨收盤價(jià)格為實(shí)驗(yàn)數(shù)據(jù),結(jié)合第3節(jié)提出的基于FCM算法的高階IFTSF模型的建模過(guò)程,來(lái)驗(yàn)證所提新模型的可行性和有效性. 均方誤差(RMSE)和平均預(yù)測(cè)誤差(AFE)是檢驗(yàn)時(shí)間序列預(yù)測(cè)模型可行性和有效性的常用工具.除此之外,還有自相關(guān)系數(shù)(R),決定系數(shù)(R2),性能指標(biāo)(PP),平均絕對(duì)偏差(Mad)等也被用來(lái)評(píng)估模型的預(yù)測(cè)性能,每一個(gè)評(píng)估指標(biāo)的數(shù)學(xué)表達(dá)式如表1所示,同時(shí)這些評(píng)估指標(biāo)所表示的詳細(xì)含義見(jiàn)參考文獻(xiàn)[9]. 4.2.1 阿拉巴馬大學(xué)學(xué)生招生人數(shù)數(shù)據(jù)集 阿拉巴馬大學(xué)從1971年到1992年共22年的學(xué)生招生人數(shù)是Song和Chissom[5]提出的FTSF模型時(shí)用的一組數(shù)據(jù),如圖2所示.為便于比較,很多文獻(xiàn)都在這組數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),用以說(shuō)明所提新模型的可行性和有效性. 表1 評(píng)估指標(biāo) 圖2 阿拉巴馬大學(xué)學(xué)生招生人數(shù) 4.2.2 黃金期貨收盤價(jià)格數(shù)據(jù)集 黃金期貨收盤價(jià)格數(shù)據(jù)集是由上海黃金行情數(shù)據(jù)中心提供的以天為單位對(duì)黃金期貨收盤價(jià)格進(jìn)行的統(tǒng)計(jì).本文只選取從2019年8月1日至2019年10 月31 日的每日黃金期貨收盤價(jià)格,這期間三個(gè)月總共67個(gè)交易日的價(jià)格作為實(shí)驗(yàn)數(shù)據(jù),如圖3所示. 圖3 黃金期貨收盤價(jià)格 4.3.1 阿拉巴馬大學(xué)學(xué)生招生人數(shù)數(shù)據(jù)集實(shí)驗(yàn) 本節(jié)利用本文提出的基于FCM算法的高階IFTSF模型對(duì)阿拉巴馬大學(xué)學(xué)生招生人數(shù)進(jìn)行預(yù)測(cè),具體的預(yù)測(cè)步驟如下. 步驟1:確定并劃分論域 根據(jù)圖2不難發(fā)現(xiàn),阿拉巴馬大學(xué)從1971年到1992年共22年的學(xué)生招生人數(shù)在[13055,19337]范圍內(nèi).為了簡(jiǎn)便計(jì)算,根據(jù)公式(10)確定兩個(gè)合適的正整數(shù)分別為σ1= 55,σ2= 663,xmin-σ1=13000,xmax+σ2=20000, 即確定論域U=[13000,20000]. 由公式(11)計(jì)算得到k=14,ε=0.001,即采用第2節(jié)提出的論域劃分方法將論域U劃分為14個(gè)等長(zhǎng)和非等長(zhǎng)的模糊子區(qū)間,每一個(gè)模糊子區(qū)間的上下界見(jiàn)表2. 步驟 2:歷史數(shù)據(jù)直覺(jué)模糊化 在模糊子區(qū)間確定的基礎(chǔ)上,g取0.4,運(yùn)用公式(24)至(29)對(duì)歷史數(shù)據(jù)進(jìn)行直覺(jué)模糊化處理,得到22個(gè)歷史數(shù)據(jù)各自對(duì)應(yīng)的直覺(jué)模糊逼近因子L(Ap),如表3所示. 步驟3:建立模糊邏輯關(guān)系和模糊邏輯關(guān)系組 根據(jù)O({L(Ap)e,L(Ap)u})的大小建立模糊邏輯關(guān)系和模糊邏輯關(guān)系組.首先應(yīng)用公式(31)與(32)確定每一個(gè)模糊子區(qū)間對(duì)應(yīng)的權(quán)重, 表2 14個(gè)模糊子區(qū)間的上下界及對(duì)應(yīng)的權(quán)重 表3 歷史數(shù)據(jù)的直覺(jué)模糊逼近因子 如表2所示.其次應(yīng)用公式(30)對(duì)歷史數(shù)據(jù)直覺(jué)模糊化后得到的直覺(jué)模糊逼近因子L(Ap)進(jìn)行聚合運(yùn)算得到O({L(Ap)e,L(Ap)u}).然后根據(jù)O({L(Ap)e,L(Ap)u})的大小建立模糊邏輯關(guān)系和模糊邏輯關(guān)系組.最后對(duì)構(gòu)建的模糊邏輯關(guān)系和模糊邏輯關(guān)系組進(jìn)行“max-min”聚合運(yùn)算,從而得到一個(gè)模糊行向量. 例如,1992年對(duì)應(yīng)的模糊邏輯關(guān)系是HA13→HA13,應(yīng)用“max-min”聚合運(yùn)算可以獲得模糊行向量,即(0,0,…,0.095,0.1363,0.3632,0.4732,0.332). 步驟4:預(yù)測(cè)結(jié)果去模糊化輸出 根據(jù)建立好的模糊行向量進(jìn)行去模糊化輸出. 通過(guò)公式(33)與(34)計(jì)算出1992年的學(xué)生招生人數(shù)為18 829.48,同理可求得其他年份的學(xué)生招生人數(shù).在該數(shù)據(jù)集上,應(yīng)用其他文獻(xiàn)中所提出的預(yù)測(cè)模型及本文所提出的預(yù)測(cè)模型進(jìn)行預(yù)測(cè),預(yù)測(cè)值及真實(shí)值如表4所示. 4.3.2 黃金期貨收盤價(jià)格數(shù)據(jù)集實(shí)驗(yàn) 分析圖3不難發(fā)現(xiàn),黃金期貨收盤價(jià)格在[1432.40,1560.40]范圍內(nèi).同樣在這個(gè)例子中,為了簡(jiǎn)便計(jì)算,根據(jù)公式(10)確定兩個(gè)合適的正整數(shù)分別為σ1= 32.40,σ2=39.60,xmin-σ1=1400,xmax+σ2=1600,即確定論域U=[1400,1600].在該數(shù)據(jù)集上,應(yīng)用文獻(xiàn)[13]中所提出的預(yù)測(cè)模型、文獻(xiàn)[12]中所提出的兩種預(yù)測(cè)模型及本文所提出的預(yù)測(cè)模型進(jìn)行預(yù)測(cè),預(yù)測(cè)值及真實(shí)值如圖4所示. 得到去模糊化輸出結(jié)果之后,我們將利用表1所列出的評(píng)估指標(biāo)對(duì)本文所提新模型的預(yù)測(cè)結(jié)果進(jìn)行評(píng)估. 4.4.1 阿拉巴馬大學(xué)學(xué)生招生人數(shù)的預(yù)測(cè)結(jié)果評(píng)估 對(duì)于阿拉巴馬大學(xué)學(xué)生招生人數(shù)數(shù)據(jù)集實(shí)驗(yàn),圖5給出本文所提出的預(yù)測(cè)模型與其他一些具有代表性的預(yù)測(cè)模型的評(píng)估指標(biāo)進(jìn)行比較. 同時(shí)為了使實(shí)驗(yàn)更具有說(shuō)服力,在該數(shù)據(jù)集上,我們將本文所提的一階預(yù)測(cè)模型與已有的部分一階預(yù)測(cè)模型進(jìn)行比較,將本文所提的二階預(yù)測(cè)模型與已有的部分二階預(yù)測(cè)模型進(jìn)行比較. 其中,Bisht[13]、Krishna[9]和李慧君[12]提出的模型致力于研究論域的劃分和確定劃分區(qū)間的長(zhǎng)度來(lái)提高預(yù)測(cè)準(zhǔn)確率;Kumar[30]、Radha[15]提出的模型致力于研究如何更好的模糊化歷史數(shù)據(jù);Lee[19]、Gupta[14]提出的模型致力于研究如何從FTS中挖掘出更好的模糊邏輯關(guān)系和模糊邏輯關(guān)系組. 由圖5不難發(fā)現(xiàn),本文所提新模型取得了較好的預(yù)測(cè)效果(圖(a)、(b)),預(yù)測(cè)數(shù)據(jù)與真實(shí)數(shù)據(jù)的關(guān)聯(lián)性強(qiáng)(圖(c)、(d)),同時(shí)新模型不但具有很強(qiáng)的可行性和有效性(圖(e)),而且預(yù)測(cè)程度適當(dāng)(圖(f)). 比如本文所提一階預(yù)測(cè)模型的均方根誤差RMSE=140.32最小,說(shuō)明新模型的預(yù)測(cè)精度高于其他模型的預(yù)測(cè)精度,與文獻(xiàn)[21]所提的一階模型相比,RMSE降低了590.02,預(yù)測(cè)效果較現(xiàn)有模型有了較大程度的提升.值得注意的是,本文所提出的二階IFTSF模型的預(yù)測(cè)效果在這六個(gè)評(píng)估指標(biāo)上都比一階IFTSF模型好.由此可見(jiàn),新模型不僅充分發(fā)揮了IFS在處理不確定數(shù)據(jù)推理方面的優(yōu)勢(shì),也進(jìn)一步擴(kuò)展了IFTSF模型的應(yīng)用范圍. 表 4 不同模型對(duì)阿拉巴馬大學(xué)學(xué)生招生人數(shù)的預(yù)測(cè)結(jié)果 圖4 不同模型對(duì)黃金期貨收盤價(jià)格的預(yù)測(cè)結(jié)果 圖5 不同模型對(duì)阿拉巴馬大學(xué)學(xué)生招生人數(shù)的預(yù)測(cè)性能比較 4.4.2 黃金期貨收盤價(jià)格預(yù)測(cè)結(jié)果評(píng)估 對(duì)于黃金期貨收盤價(jià)格數(shù)據(jù)集實(shí)驗(yàn),各模型的預(yù)測(cè)性能對(duì)比如圖6所示. 圖6 不同模型對(duì)黃金期貨收盤價(jià)格的預(yù)測(cè)性能比較 由圖6可知,新模型在黃金期貨收盤價(jià)格數(shù)據(jù)集上也取得較好的預(yù)測(cè)效果,即本文所提新模型能有效預(yù)測(cè)通用數(shù)據(jù)集中的數(shù)據(jù).同時(shí)新模型能夠更加客觀地描述歷史數(shù)據(jù)“非此非彼”的模糊狀態(tài).不僅準(zhǔn)確地反映了不確定性歷史數(shù)據(jù)的模糊變化特性,而且充分考慮了歷史知識(shí)對(duì)預(yù)測(cè)向量的影響. 本文針對(duì)FTSF模型存在的不足,利用直覺(jué)模糊集在處理模糊性、不確定性歷史數(shù)據(jù)集上的優(yōu)勢(shì),提出一種新的基于FCM算法的高階直覺(jué)模糊時(shí)間序列預(yù)測(cè)模型.該模型采用等分論域劃分方法與基于FCM算法的非等分論域劃分方法實(shí)現(xiàn)論域的劃分,使論域劃分這一基礎(chǔ)步驟既充分考慮了數(shù)據(jù)點(diǎn)固有的模糊不確定性,又較好地反映了數(shù)據(jù)內(nèi)部或局部形態(tài)的關(guān)聯(lián)特征.在此基礎(chǔ)上,根據(jù)模糊劃分歷史數(shù)據(jù)的實(shí)際特性,給出一種更具客觀性的方法對(duì)歷史數(shù)據(jù)直覺(jué)模糊化處理,較好地反映了歷史數(shù)據(jù)“非此非彼”的模糊狀態(tài).在此基礎(chǔ)上,結(jié)合“max-min”聚合運(yùn)算,合理地選取要考慮的模糊狀態(tài),進(jìn)而對(duì)預(yù)測(cè)結(jié)果去模糊化輸出.最后通過(guò)實(shí)例驗(yàn)證和對(duì)比分析,證實(shí)了本文所提新模型在預(yù)測(cè)精度上相對(duì)于已有的預(yù)測(cè)模型有較大的提升.3 基于FCM算法的高階IFTSF模型
3.1 歷史數(shù)據(jù)直覺(jué)模糊化
3.2 建立模糊邏輯關(guān)系和模糊邏輯關(guān)系組
3.3 預(yù)測(cè)結(jié)果去模糊化輸出
4 實(shí)驗(yàn)分析
4.1 評(píng)估指標(biāo)
4.2 數(shù)據(jù)集介紹
4.3 實(shí)例預(yù)測(cè)步驟
4.4 結(jié)果評(píng)估
5 總 結(jié)
曲靖師范學(xué)院學(xué)報(bào)2022年6期
——以生物技術(shù)專業(yè)“植物生理生化”教學(xué)為例
——以云南某區(qū)為例
——基于云南省的實(shí)證分析