宋 敏,柏 玉,劉士虎
(云南民族大學 數(shù)學與計算機科學學院,云南 昆明 650504)
從統(tǒng)計意義上講,時間序列(time series,簡記TS)是指將同一現(xiàn)象的某個或多個統(tǒng)計指標在不同時間上的觀察數(shù)據(jù),按照時間的先后順序排列起來所形成的序列,也稱動態(tài)序列[1]. 所謂的時間序列分析是指對時間序列數(shù)據(jù)展開的分析和研究,旨在挖掘出序列中的相互關系和變化趨勢,以便于完成對未來數(shù)據(jù)的序列預測工作[1]. 截止目前,針對時間序列數(shù)據(jù)的預測工作,諸多研究人員提出了大量的預測模型,如自回歸模型[2]、滑動平均模型[3]、自回歸滑動平均模型[3]、線性回歸模型[4]等. 不難發(fā)現(xiàn),已有的這些預測模型在模糊數(shù)據(jù)、不確定數(shù)據(jù)或發(fā)展趨勢不明顯的數(shù)據(jù)展開預測時效果不太理想. 為此,Song 和 Chissom[5]于1993年首次提出了模糊時間序列預測(fuzzy time series forecasting,簡記FTSF)模型并應用于阿拉巴馬大學學生招生人數(shù)預測. 由于FTSF模型借助于模糊邏輯理論,使其能夠在不確定環(huán)境下描述和處理模糊數(shù)據(jù). 該模型的研究一經(jīng)問世,便引起了學術界、工程技術領域的廣泛關注,并迅速發(fā)展成為一個熱門的研究課題,取得了大量有價值的理論研究成果.該成果在醫(yī)療[6]、股票[7]和溫度[8]等眾多不同的領域得到了廣泛的應用.
截止目前,針對FTSF問題展開的一系列研究工作中,不難發(fā)現(xiàn)大部分研究工作主要集中在對論域劃分方法的改進、模糊關系和預測規(guī)則的改進、一元一階模型到多元和高階模型的改進等三個方面.
對于論域劃分方法的改進,由研究初期的等分論域劃分方法向預測精度更高的非等分論域劃分方法進行改進.根據(jù)歷史數(shù)據(jù)分布不均勻、模糊等特性,大量的學者采用基于概率的離散化方法[9]、基于神經(jīng)網(wǎng)絡的方法[10]、基于信息粒的方法[11]、基于模糊聚類的方法[12]對論域進行非等分劃分.
對于模糊關系和預測規(guī)則的改進. 預測規(guī)則的建立以模糊邏輯關系為基礎,它是模糊時間序列預測模型的核心部分. 由研究初期的“max-min”聚合運算[13-14]進入到支持向量機分類算法[15]、公理模糊集分類算法[16]和直覺模糊條件推理技術[17]等,使得預測模型具有較好的可解釋性,同時也提高了模型預測的精度.
對于一元一階模型到多元和高階模型的改進.由研究初期的一元一階模型向適應性更高的多元和高階模型進行改進.先后相繼出現(xiàn)了基于關系組算法[18]、基于模糊變換的高階模糊關系式方法[19]、基于長短期記憶神經(jīng)網(wǎng)絡方法[20]、基于直覺模糊關系式方法[21]、基于禁忌搜索算法等的多元和高階模型[22]. 多元和高階模型的出現(xiàn)有效地解決了一元一階模型在實際應用中的極限性,使模糊時間序列預測模型的適應性大大增強.
在FTSF模型中,對歷史數(shù)據(jù)模糊化時僅采用傳統(tǒng)的Zadeh 模糊集[23],即只用隸屬度來度量語言值的隸屬性質(zhì).遺憾的是,這些方法不能形象地反映信息的模糊性與不確定性,不能正確地反映歷史數(shù)據(jù)之間的隨機變化特性,從根本上限制了預測精度的提升. 鑒于直覺模糊集(intuitionistic fuzzy set,簡記IFS)作為Zadeh 模糊集的重要擴充和發(fā)展,對歷史數(shù)據(jù)的數(shù)學描述既客觀又細膩,為模糊性、不確定性信息的研究和處理指出了新的突破方向[24].Oscar等人[25]首次將IFS理論融入到FTSF模型中,建立了第一個直覺模糊時間序列預測(intuitionistic fuzzy time series forecasting,簡記IFTSF)模型,其本質(zhì)是隸屬度、非隸屬度模糊推理系統(tǒng)的加權合成. 它的出現(xiàn)極大地擴展了時間序列對模糊性、不確定性等信息的處理能力.除此之外,文獻[26]提出了參數(shù)自適應的直覺模糊C均值(fuzzy c-means,簡記FCM)聚類的IFTSF模型. 文獻[27]將動態(tài)時間彎曲距離與直覺模糊時間序列結(jié)合,進一步優(yōu)化FTSF模型. 文獻[28]通過增加猶豫度因子對歷史數(shù)據(jù)進行直覺模糊化,提出了基于直覺模糊化的廣義FTSF模型.近年來,大量的研究學者[29-31]就由研究初期的FTSF模型進入到預測精度更高的IFTSF模型.然而,隨著IFTSF理論日趨成熟,其局限性也逐漸凸現(xiàn): (1) 等分劃分論域所獲得的模糊子區(qū)間無法反映歷史數(shù)據(jù)內(nèi)部或局部形態(tài)的關聯(lián)特征;(2) 如何有效地對歷史數(shù)據(jù)進行直覺模糊化,使其較好地反映歷史數(shù)據(jù)“非此非彼”的模糊狀態(tài)仍然是一個有待解決的難題.因此,IFTSF理論的拓展研究已成為亟待解決的重要問題.
基于上述討論,本文從對論域的等分和非等分劃分,歷史數(shù)據(jù)直覺模糊化兩個角度,對原有問題研究方法的局限性展開相應的改進,進而建立一個新的高階IFTSF模型.通過實驗不難發(fā)現(xiàn),本文所提出的高階IFTSF模型取得較好的預測效果,在一定程度上能有效地克服FTSF模型的缺陷.
為了行文簡潔及后文敘述的需要,該節(jié)給出與本文相關的一些基本概念,如直覺模糊集、猶豫模糊集、模糊時間序列等.詳細的敘述,請參閱文獻[11,13,17,29].
定義1 (直覺模糊集) 針對給定的論域U,其上的一個直覺模糊集A具有如下的表示形式
A={
(1)
其中μA(x):x→[0,1]代表A的隸屬度函數(shù);γA(x):x→[0,1]代表A的非隸屬度函數(shù);進一步,用πA(x)=1-μA(x)-γA(x)來表示x關于A的直覺模糊指標,其反映了x對模糊概念A的一種猶豫程度.
定義2(猶豫模糊集) 針對給定的論域U,其上的一個猶豫模糊集H具有如下的表示形式
H={
(2)
其中μH(x)?[0,1]是元素x∈H的所有可能的隸屬度值,稱每一個η∈μH(x)為猶豫模糊元.
定義3(模糊時間序列) 設X(t)(t=1,2,…)為論域U上的一個時間序列,定義fi(t)(i=1,2,…)為X(t)上的一組模糊集.如果F(t)是由模糊集fi(t)(i=1,2,…)組成的集合,即
F(t)={f1(t),f2(t),…},
(3)
則稱F(t)為定義在X(t)(t=1,2,…)上的模糊時間序列.
定義4(直覺模糊時間序列) 設X(t)(t=1,2,…)為論域U上的一個時間序列,定義fi(t)=〈μi(X(t)),γi(X(t))〉(i=1,2,…)為X(t)上的一組直覺模糊集.若Y(t)={f1(t),f2(t),…},則稱Y(t)為定義在X(t)上的直覺模糊時間序列,表示為
(4)
其中“+”表示連接符.
定義5 (模糊關系) 設R(t,t-1)為從Y(t-1)到Y(jié)(t)之間的模糊關系,且滿足Y(t)=Y(t-1)°R(t,t-1),則稱Y(t)是由Y(t-1)通過模糊關系R(t,t-1)推導得到的,且可以用模糊邏輯關系Y(t-1)→Y(t)來表示.其中Y(t-1)為模糊邏輯關系的前件,Y(t)為模糊邏輯關系的后件.
定義6(高階直覺模糊時間序列) 如果一個直覺模糊時間序列Y(t)僅由Y(t-1)決定,即Y(t)=Y(t-1)°R(t,t-1),那么稱Y(t)為“一階直覺模糊時間序列”.如果Y(t)由Y(t-1),Y(t-2),…,Y(t-r)共同決定,那么稱Y(t)為“高階直覺模糊時間序列”,表示為
Y(t)=Y(t-1)×Y(t-2)×…×Y(t-r)°R(t,t-r),
(5)
其中R(t,t-r)=f(t)×f(t-1)∪f(t-1)×f(t-2)∪…∪f(t-r+1)×f(t-r)為高階模糊關系;“×”為笛卡爾積;“∪”為模糊并運算符;“°”為模糊合成算子,取“max-min”合成運算.
FCM是一種經(jīng)典的聚類算法,該算法把數(shù)據(jù)聚類問題轉(zhuǎn)化為帶約束的目標函數(shù)優(yōu)化問題.它首先將數(shù)據(jù)點xi(i=1,2,…,n)劃分為c類,然后求出每個類的聚類中心vj(j=1,2,…,c),使得每個類中各數(shù)據(jù)點之間的相似度最高.其目標函數(shù)為
(6)
約束條件為
(7)
其中目標函數(shù)Jm(U,V)的值越小,聚類效果越好;m為模糊加權指數(shù),決定了聚類結(jié)果的模糊程度,一般情況下m=2最為合適;μij為數(shù)據(jù)點xi關于第j個類的隸屬度;‖*‖為數(shù)據(jù)點xi與第j個類中心vj之間的歐式距離.
目標函數(shù)(6)的優(yōu)化過程具體是通過更新以下形式的隸屬度μij和聚類中心vj:
(8)
(9)
利用IFTSF模型進行歷史數(shù)據(jù)預測時,如何對論域做劃分是IFTSF模型的首要環(huán)節(jié),是模型預測質(zhì)量好壞的關鍵.在大多數(shù)的IFTSF模型中,作者為了簡化所建模型的復雜度,均對歷史數(shù)據(jù)論域采取等分劃分的方法進行處理. 這種方法雖然簡單、方便,但這使得IFTSF的結(jié)果并不十分理想. 其主要原因是劃分后所獲得的模糊子區(qū)間無法反映歷史數(shù)據(jù)內(nèi)部或局部形態(tài)的關聯(lián)特征,同時劃分后所得到的每個模糊子區(qū)間可解釋性差. 為解決上述問題存在的不足,該節(jié)我們利用等分論域劃分和基于FCM算法的非等分論域劃分兩種劃分方法來對歷史數(shù)據(jù)的論域做劃分,以此實現(xiàn)解決預測精度低和模糊子區(qū)間可解釋性差的問題.
等分論域劃分方法是目前最為簡單、方便的一種論域劃分方法.該方法具體通過以下三個步驟來實現(xiàn).
步驟1:確定論域U
假設U為歷史數(shù)據(jù)論域,xmax和xmin分別為歷史數(shù)據(jù)集D={x1,x2,···,xn}的最大值和最小值,則
U=[xmin-σ1,xmax+σ2],
(10)
其中σ1和σ2為合適的正整數(shù).
步驟2:確定模糊子區(qū)間的個數(shù)k
依據(jù)歷史數(shù)據(jù)的結(jié)構特性以及人們處理實際問題中存在的模糊性及不確定性,用自然語言能夠表達的方法對論域U進行劃分.即劃分的模糊子區(qū)間個數(shù)k為
(11)
其中n為歷史數(shù)據(jù)集的個數(shù);P為距離參數(shù)調(diào)節(jié)因子;“[*]”表示不超過k的最大整數(shù).
步驟3:劃分論域U
在這一步中,我們采用等分論域劃分方法確定每個模糊子區(qū)間的上下界,具體通過以下兩個子步驟來實現(xiàn).
步驟3.1:確定每個模糊子區(qū)間的長度l
(12)
步驟3.2:獲得k個等長的模糊子區(qū)間u1,u2,…,uk
(13)
其中d2-d1=d3-d2=…=dk+1-dk=l,d1=xmin-σ1,dk+1=xmax+σ2.
FCM算法是目前比較流行的一種模糊劃分方法.若將其運用于IFTSF模型中論域的非等分劃分,不僅能充分反映歷史數(shù)據(jù)內(nèi)部或局部形態(tài)的關聯(lián)特征,也能提高模型的預測精度.該方法具體通過以下四個步驟來實現(xiàn).
步驟1:確定聚類中心
步驟2:根據(jù)聚類中心建立相應的數(shù)據(jù)子集Dj(j=1,2,…,c)
根據(jù)聚類中心v1 (14) 步驟3:計算子集Dj(j=1,2,…,c)的信息顆粒Ωj(j=1,2,…,c) 信息顆粒Ωj的重要作用是對初次劃分的數(shù)據(jù)子集Dj進一步調(diào)節(jié),使其不僅考慮了歷史數(shù)據(jù)內(nèi)部或局部形態(tài)的關聯(lián)特征,還考慮了劃分后模糊子區(qū)間的可解釋性.令med(Dj)=vj,利用公式(15)至(18)計算Ωj的最優(yōu)上下界,記為bj,aj,也就是計算得到子集Dj的信息顆粒Ωj=[aj,bj]. V(a)=h1(card{xi∈D|a≤xi≤med(Dj)})·h2(|med(Dj)-a|), (15) V(b)=h1(card{xi∈D|med(Dj)≤xi≤b})·h2(|med(Dj)-b|), (16) 這里h1(x),h2(x)可分別設為下列具體的函數(shù) h1(x)=x, (17) h2(x)=exp(-εx), (18) 其中a,b是落入Dj范圍內(nèi)的歷史數(shù)據(jù);card{xi}是落入Dj范圍內(nèi)的數(shù)據(jù)量;ε∈[0,1]是參數(shù). 令V(aopt)=maxa≤med(Dj)V(a),則最優(yōu)下界aopt就是信息顆粒Ωj的下邊界aj.同樣的方法,可獲得信息顆粒Ωj的上邊界bj.下面舉例說明,如何計算D上的信息顆粒Ω=[a,b]. 令D={x1,x2,x3,…,x9,x10,x11}={-4.0,-3.4,-2.2,-1.3,-1.0,0.0,0.8,1.4,2.5,2.9,4.3},如圖1所示,參數(shù)ε=0.5. 首先確定信息顆粒的最優(yōu)上邊界bopt.經(jīng)計算med(D)=0.0. 當b=x6時,V(b)=1·exp(-0.5·0.0)=1.00, 當b=x7時,V(b)=2·exp(-0.5·0.8)=1.35, ? 當b=x11時,V(b)=6·exp(-0.5·4.3)=0.70. 顯然,V(bopt=1.4)=maxb≥med(D)V(b),因而b=bopt=1.4.用類似的方法可以確定信息顆粒的最優(yōu)下邊界a=aopt,進而得到Ω=[a,b]. 圖1 調(diào)整界限(a和b)確定最優(yōu)信息顆粒Ω 步驟4:獲得相應的k個非等長的模糊子區(qū)間u1,u2,…,uk. 這一步驟分兩種情況來實現(xiàn). 當k為奇數(shù)時,如果|med(D1)-xmin|≥|med(Dk)-xmax|,則 (19) 否則, (20) 當k為偶數(shù)時, (21) 為了能夠更加有效地提高IFTSF模型的預測性能,更真實、準確地反映歷史數(shù)據(jù)內(nèi)部或局部形態(tài)的關聯(lián)特征及模糊波動特性.本文繼續(xù)以文獻[5]模型的框架為基礎,首先利用等分論域劃分和基于FCM算法的非等分論域劃分兩種劃分方法來對歷史數(shù)據(jù)的論域做劃分,具體劃分方法第2節(jié)已詳細給出.其次通過構建直覺模糊集來對歷史數(shù)據(jù)進行直覺模糊化處理.然后結(jié)合“max-min”聚合運算,合理地選取要考慮的模糊狀態(tài),最后對預測結(jié)果去模糊化輸出. 在傳統(tǒng)的FTSF模型中,歷史數(shù)據(jù)模糊化大都是人為地用三角模糊隸屬度函數(shù)來定義.即歷史數(shù)據(jù)xi屬于模糊子區(qū)間ui,則ui(xi)=1.并且歷史數(shù)據(jù)xi對ui兩邊模糊子區(qū)間的隸屬度呈現(xiàn)遞減的趨勢.xi對各個模糊子區(qū)間的隸屬度為 (22) 利用上式對歷史數(shù)據(jù)進行模糊化處理,分析結(jié)果發(fā)現(xiàn),當歷史數(shù)據(jù)之間的差別不是很大時,不同的歷史數(shù)據(jù)可能就會落在相同的模糊子區(qū)間上.這樣不僅不能充分體現(xiàn)歷史數(shù)據(jù)的分布特性,使數(shù)據(jù)鈍化,也會降低模型對特定問題的處理功效.因此合理有效地定義模糊子區(qū)間變量所對應的IFS及歷史數(shù)據(jù)直覺模糊化方法,能很好地反映歷史數(shù)據(jù)“非此非彼”的模糊狀態(tài),對于提升直覺模糊時間序列預測精度顯得極其重要. 假設歷史數(shù)據(jù)對應的論域U被劃分為k個模糊子區(qū)間,定義k個代表語言變量的直覺模糊集為 Ap={ (23) 確定Ap的隸屬度和非隸屬度函數(shù)是該步驟的關鍵所在.本節(jié)針對IFTSF模型的實際應用情況以及區(qū)間劃分的特性,給出一種新的歷史數(shù)據(jù)模糊化方法.具體通過以下3條規(guī)則來實現(xiàn). (24) (25) 其中cμi,σμi和cγi,σγi是確定隸屬度函數(shù)值μAp(xi)和非隸屬度函數(shù)值γAp(xi)的參數(shù),借助公式(26)至(28)計算得到. (26) (27) (28) 由此可見,通過(1)、(2)和(3)三條規(guī)則可以獲取數(shù)據(jù)集D中所有歷史數(shù)據(jù)對于直覺模糊集Ap的隸屬度值和非隸屬度值,并運用公式(29)進行歷史數(shù)據(jù)的直覺模糊化處理. (29) 其中L(Ap)是直覺模糊逼近因子,它綜合考慮直覺模糊集中支持、反對以及猶豫三者之間的關系,使評判結(jié)果更加合理. 假設H是論域U上的一個猶豫模糊集,猶豫模糊元由下列映射定義:hH:U[0,1],hH(x)?[0,1],那么HAp={ O({L(Ap)e,L(Ap)u})=1-(1-L(Ap)e)ωe* (1-L(Ap)u)ωu, (30) 其中L(Ap)i(i=e,u)是歷史數(shù)據(jù)xi直覺模糊化為Ap所獲得的直覺模糊趨勢逼近因子,ωi(i=e,u)是xi的權重. 公式(30)需滿足以下性質(zhì): (1) ?L(Ap)e,L(Ap)u∈[0,1]. (2)O(L(Ap)e,L(Ap)u)≥min{L(Ap)e,L(Ap)u}. (3)O(L(Ap)e,L(Ap)u)≤max{L(Ap)e,L(Ap)u}. 根據(jù)上面的定義,在應用公式(30)對歷史數(shù)據(jù)直覺模糊化后得到的L(Ap)進行聚合時,需要確定每一個模糊子區(qū)間對應的權重.權重的確定借助公式(31)和(32)計算得到. (31) (32) 其中de是等分論域劃分所得到的模糊子區(qū)間長度;du是非等分論域劃分所得到的模糊子區(qū)間長度. 具體的聚合過程由以下例子說明. 令歷史數(shù)據(jù)集D={x1,x2,x3},并且H={ 應用上述聚合方法我們可以得到一個模糊集HAp. h(x1)=1-((1-0.20)1/3*(1-0.30)1/3* (1-0.40)1/3)=0.305. 這里,min({0.20,0.30,0.40})<0.305 同理可得h(x2)=0.497,h(x3)=0.524. 模糊集HAp可以表示為:HAp={ 因為max{0.305,0.497,0.524}=0.524,即x1模糊化為HAp. 根據(jù)聚合的模糊集HAp構建模糊邏輯關系和模糊邏輯關系組,并對構建的模糊邏輯關系和模糊邏輯關系組進行“max-min”聚合運算,從而得到一個模糊行向量. 采用下面的重心去模糊化方法對模糊行向量進行去模糊化輸出,輸出結(jié)果就是屬于該模糊集對應的數(shù)據(jù)對下一時刻數(shù)據(jù)值的預測結(jié)果.去模糊化輸出需要遵循以下規(guī)則. 如果模糊關系組中存在模糊邏輯關系HAp1,HAp2,…,HApk→HAp,那么t+1時刻的去模糊化輸出值為 (33) 其中fi是模糊行向量;li是歷史數(shù)據(jù)模糊化為Ap時所對應的等長模糊子區(qū)間和非等長模糊子區(qū)間的組合中點,通過公式(34)計算得到. (34) 其中Me是歷史數(shù)據(jù)xi模糊化為Ap時所對應的等長模糊子區(qū)間的中點;Mu是歷史數(shù)據(jù)xi模糊化為Ap時所對應的非等長模糊子區(qū)間的中點. 如果模糊關系組中不存在任何模糊邏輯關系,即HAp→φ沒有匹配規(guī)則,那么t+1時刻的去模糊化輸出值為 (35) 本文中,我們以阿拉巴馬大學的學生招生人數(shù)及2019年8月1日到2019年10月31 日這期間三個月總共67個交易日的黃金期貨收盤價格為實驗數(shù)據(jù),結(jié)合第3節(jié)提出的基于FCM算法的高階IFTSF模型的建模過程,來驗證所提新模型的可行性和有效性. 均方誤差(RMSE)和平均預測誤差(AFE)是檢驗時間序列預測模型可行性和有效性的常用工具.除此之外,還有自相關系數(shù)(R),決定系數(shù)(R2),性能指標(PP),平均絕對偏差(Mad)等也被用來評估模型的預測性能,每一個評估指標的數(shù)學表達式如表1所示,同時這些評估指標所表示的詳細含義見參考文獻[9]. 4.2.1 阿拉巴馬大學學生招生人數(shù)數(shù)據(jù)集 阿拉巴馬大學從1971年到1992年共22年的學生招生人數(shù)是Song和Chissom[5]提出的FTSF模型時用的一組數(shù)據(jù),如圖2所示.為便于比較,很多文獻都在這組數(shù)據(jù)集上進行實驗,用以說明所提新模型的可行性和有效性. 表1 評估指標 圖2 阿拉巴馬大學學生招生人數(shù) 4.2.2 黃金期貨收盤價格數(shù)據(jù)集 黃金期貨收盤價格數(shù)據(jù)集是由上海黃金行情數(shù)據(jù)中心提供的以天為單位對黃金期貨收盤價格進行的統(tǒng)計.本文只選取從2019年8月1日至2019年10 月31 日的每日黃金期貨收盤價格,這期間三個月總共67個交易日的價格作為實驗數(shù)據(jù),如圖3所示. 圖3 黃金期貨收盤價格 4.3.1 阿拉巴馬大學學生招生人數(shù)數(shù)據(jù)集實驗 本節(jié)利用本文提出的基于FCM算法的高階IFTSF模型對阿拉巴馬大學學生招生人數(shù)進行預測,具體的預測步驟如下. 步驟1:確定并劃分論域 根據(jù)圖2不難發(fā)現(xiàn),阿拉巴馬大學從1971年到1992年共22年的學生招生人數(shù)在[13055,19337]范圍內(nèi).為了簡便計算,根據(jù)公式(10)確定兩個合適的正整數(shù)分別為σ1= 55,σ2= 663,xmin-σ1=13000,xmax+σ2=20000, 即確定論域U=[13000,20000]. 由公式(11)計算得到k=14,ε=0.001,即采用第2節(jié)提出的論域劃分方法將論域U劃分為14個等長和非等長的模糊子區(qū)間,每一個模糊子區(qū)間的上下界見表2. 步驟 2:歷史數(shù)據(jù)直覺模糊化 在模糊子區(qū)間確定的基礎上,g取0.4,運用公式(24)至(29)對歷史數(shù)據(jù)進行直覺模糊化處理,得到22個歷史數(shù)據(jù)各自對應的直覺模糊逼近因子L(Ap),如表3所示. 步驟3:建立模糊邏輯關系和模糊邏輯關系組 根據(jù)O({L(Ap)e,L(Ap)u})的大小建立模糊邏輯關系和模糊邏輯關系組.首先應用公式(31)與(32)確定每一個模糊子區(qū)間對應的權重, 表2 14個模糊子區(qū)間的上下界及對應的權重 表3 歷史數(shù)據(jù)的直覺模糊逼近因子 如表2所示.其次應用公式(30)對歷史數(shù)據(jù)直覺模糊化后得到的直覺模糊逼近因子L(Ap)進行聚合運算得到O({L(Ap)e,L(Ap)u}).然后根據(jù)O({L(Ap)e,L(Ap)u})的大小建立模糊邏輯關系和模糊邏輯關系組.最后對構建的模糊邏輯關系和模糊邏輯關系組進行“max-min”聚合運算,從而得到一個模糊行向量. 例如,1992年對應的模糊邏輯關系是HA13→HA13,應用“max-min”聚合運算可以獲得模糊行向量,即(0,0,…,0.095,0.1363,0.3632,0.4732,0.332). 步驟4:預測結(jié)果去模糊化輸出 根據(jù)建立好的模糊行向量進行去模糊化輸出. 通過公式(33)與(34)計算出1992年的學生招生人數(shù)為18 829.48,同理可求得其他年份的學生招生人數(shù).在該數(shù)據(jù)集上,應用其他文獻中所提出的預測模型及本文所提出的預測模型進行預測,預測值及真實值如表4所示. 4.3.2 黃金期貨收盤價格數(shù)據(jù)集實驗 分析圖3不難發(fā)現(xiàn),黃金期貨收盤價格在[1432.40,1560.40]范圍內(nèi).同樣在這個例子中,為了簡便計算,根據(jù)公式(10)確定兩個合適的正整數(shù)分別為σ1= 32.40,σ2=39.60,xmin-σ1=1400,xmax+σ2=1600,即確定論域U=[1400,1600].在該數(shù)據(jù)集上,應用文獻[13]中所提出的預測模型、文獻[12]中所提出的兩種預測模型及本文所提出的預測模型進行預測,預測值及真實值如圖4所示. 得到去模糊化輸出結(jié)果之后,我們將利用表1所列出的評估指標對本文所提新模型的預測結(jié)果進行評估. 4.4.1 阿拉巴馬大學學生招生人數(shù)的預測結(jié)果評估 對于阿拉巴馬大學學生招生人數(shù)數(shù)據(jù)集實驗,圖5給出本文所提出的預測模型與其他一些具有代表性的預測模型的評估指標進行比較. 同時為了使實驗更具有說服力,在該數(shù)據(jù)集上,我們將本文所提的一階預測模型與已有的部分一階預測模型進行比較,將本文所提的二階預測模型與已有的部分二階預測模型進行比較. 其中,Bisht[13]、Krishna[9]和李慧君[12]提出的模型致力于研究論域的劃分和確定劃分區(qū)間的長度來提高預測準確率;Kumar[30]、Radha[15]提出的模型致力于研究如何更好的模糊化歷史數(shù)據(jù);Lee[19]、Gupta[14]提出的模型致力于研究如何從FTS中挖掘出更好的模糊邏輯關系和模糊邏輯關系組. 由圖5不難發(fā)現(xiàn),本文所提新模型取得了較好的預測效果(圖(a)、(b)),預測數(shù)據(jù)與真實數(shù)據(jù)的關聯(lián)性強(圖(c)、(d)),同時新模型不但具有很強的可行性和有效性(圖(e)),而且預測程度適當(圖(f)). 比如本文所提一階預測模型的均方根誤差RMSE=140.32最小,說明新模型的預測精度高于其他模型的預測精度,與文獻[21]所提的一階模型相比,RMSE降低了590.02,預測效果較現(xiàn)有模型有了較大程度的提升.值得注意的是,本文所提出的二階IFTSF模型的預測效果在這六個評估指標上都比一階IFTSF模型好.由此可見,新模型不僅充分發(fā)揮了IFS在處理不確定數(shù)據(jù)推理方面的優(yōu)勢,也進一步擴展了IFTSF模型的應用范圍. 表 4 不同模型對阿拉巴馬大學學生招生人數(shù)的預測結(jié)果 圖4 不同模型對黃金期貨收盤價格的預測結(jié)果 圖5 不同模型對阿拉巴馬大學學生招生人數(shù)的預測性能比較 4.4.2 黃金期貨收盤價格預測結(jié)果評估 對于黃金期貨收盤價格數(shù)據(jù)集實驗,各模型的預測性能對比如圖6所示. 圖6 不同模型對黃金期貨收盤價格的預測性能比較 由圖6可知,新模型在黃金期貨收盤價格數(shù)據(jù)集上也取得較好的預測效果,即本文所提新模型能有效預測通用數(shù)據(jù)集中的數(shù)據(jù).同時新模型能夠更加客觀地描述歷史數(shù)據(jù)“非此非彼”的模糊狀態(tài).不僅準確地反映了不確定性歷史數(shù)據(jù)的模糊變化特性,而且充分考慮了歷史知識對預測向量的影響. 本文針對FTSF模型存在的不足,利用直覺模糊集在處理模糊性、不確定性歷史數(shù)據(jù)集上的優(yōu)勢,提出一種新的基于FCM算法的高階直覺模糊時間序列預測模型.該模型采用等分論域劃分方法與基于FCM算法的非等分論域劃分方法實現(xiàn)論域的劃分,使論域劃分這一基礎步驟既充分考慮了數(shù)據(jù)點固有的模糊不確定性,又較好地反映了數(shù)據(jù)內(nèi)部或局部形態(tài)的關聯(lián)特征.在此基礎上,根據(jù)模糊劃分歷史數(shù)據(jù)的實際特性,給出一種更具客觀性的方法對歷史數(shù)據(jù)直覺模糊化處理,較好地反映了歷史數(shù)據(jù)“非此非彼”的模糊狀態(tài).在此基礎上,結(jié)合“max-min”聚合運算,合理地選取要考慮的模糊狀態(tài),進而對預測結(jié)果去模糊化輸出.最后通過實例驗證和對比分析,證實了本文所提新模型在預測精度上相對于已有的預測模型有較大的提升.3 基于FCM算法的高階IFTSF模型
3.1 歷史數(shù)據(jù)直覺模糊化
3.2 建立模糊邏輯關系和模糊邏輯關系組
3.3 預測結(jié)果去模糊化輸出
4 實驗分析
4.1 評估指標
4.2 數(shù)據(jù)集介紹
4.3 實例預測步驟
4.4 結(jié)果評估
5 總 結(jié)