[摘 要]針對(duì)目前銷售量預(yù)測不能很好地滿足商場管理需求的現(xiàn)狀,分析銷售量數(shù)據(jù)內(nèi)在混沌特性,主要包括時(shí)間延遲、嵌入維數(shù)、關(guān)聯(lián)維數(shù)及Lyapunov指數(shù)的計(jì)算,并將此分析耦合人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測,最后給出某商場銷售量預(yù)測的實(shí)例,結(jié)果顯示基于混沌時(shí)間序列分析的神經(jīng)網(wǎng)絡(luò)銷售量預(yù)測在數(shù)據(jù)動(dòng)力特征刻畫及誤差控制上有顯著優(yōu)勢。
[關(guān)鍵詞]混沌;神經(jīng)網(wǎng)絡(luò);銷售量;預(yù)測
實(shí)時(shí)、準(zhǔn)確的銷售量預(yù)測是實(shí)現(xiàn)商場利潤最大化的前提和基礎(chǔ),目前應(yīng)用廣泛的人工神經(jīng)網(wǎng)絡(luò)具有非線性描述、自學(xué)習(xí)與自適應(yīng)、擅長處理多變量系統(tǒng),以及具有一定的容錯(cuò)性等特點(diǎn),通過實(shí)測數(shù)據(jù)仿真實(shí)驗(yàn)顯示神經(jīng)網(wǎng)絡(luò)可獲得較好的數(shù)據(jù)預(yù)測效果。但BP網(wǎng)絡(luò)有很多固有缺陷,比如結(jié)構(gòu)難確定、初始權(quán)值選擇的盲目性導(dǎo)致訓(xùn)練速度慢等。針對(duì)上述缺陷,本文結(jié)合銷售量數(shù)據(jù)的混沌特征分析,并基于此計(jì)算關(guān)聯(lián)維數(shù),以及Lyapunov指數(shù)判別出銷售量時(shí)間序列具有混沌現(xiàn)象,進(jìn)一步計(jì)算重構(gòu)相空間的時(shí)間延遲、嵌入維數(shù),并將它們作為預(yù)測因子,以及設(shè)定已知的銷售量為被預(yù)測量,決定商場的進(jìn)貨和銷售,進(jìn)而決定神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。通過實(shí)際銷售量算例,基于混沌網(wǎng)絡(luò)銷售量時(shí)間序列的神經(jīng)網(wǎng)絡(luò)預(yù)測精度高于一般的神經(jīng)網(wǎng)絡(luò)預(yù)測方法,能更好地滿足智能商場管理的需求。
一、銷售量時(shí)間序列的混沌判別
商場管理系統(tǒng)是否存在混沌,作為商場管理系統(tǒng)中銷售量的觀測值,銷售量時(shí)間序列是否為混沌時(shí)間序列是研究混沌首先需要解決的問題。
Lyapunov指數(shù)用于量度在相空間中初始條件不同的兩條相鄰軌跡隨時(shí)間按指數(shù)律吸引或分離的程度,這種軌跡收斂或發(fā)散的比率稱Lyapunov指數(shù)。對(duì)于系統(tǒng),
其Lyapunov指數(shù)λ為
(1)
Lyapunov指數(shù)實(shí)際上就是系統(tǒng)在各次迭代點(diǎn)處導(dǎo)數(shù)絕對(duì)值的對(duì)數(shù)平均,在混沌的診斷中λ起著非常重要的作用:若λ<0,系統(tǒng)收斂于不動(dòng)點(diǎn);若λ>0且有限,系統(tǒng)既不會(huì)穩(wěn)定在不動(dòng)點(diǎn),也不存在穩(wěn)定的周期解,同時(shí)也不會(huì)發(fā)散,表明系統(tǒng)進(jìn)入混沌。按照A.Wolf等在文獻(xiàn)中提出的計(jì)算由觀測獲得的混沌時(shí)間序列的最大Lyapunov指數(shù)的一種方法。但是為了求得一個(gè)好的最大Lyapunov指數(shù)的估計(jì)值,必須要求觀測時(shí)間序列具有足夠的長度,而作為判斷存在混沌的鑒別方法,最大Lyapunov指數(shù)方法是適用的。
二、重構(gòu)相空間
混沌時(shí)間序列重構(gòu)相空間的工作始于Packard等人,Packard等人建議用原始系統(tǒng)中的某變量的延遲坐標(biāo)重構(gòu)相空間。坐標(biāo)延遲相空間重構(gòu)技術(shù)有2個(gè)關(guān)鍵的地方,即嵌入維數(shù)m和時(shí)間延遲τ的確定。關(guān)于時(shí)間延遲τ和嵌入維數(shù)m的選取,主要有兩種觀點(diǎn):一種認(rèn)為兩者是互不相關(guān)的,即τ和m的選取是獨(dú)立進(jìn)行的,包括序列相關(guān)法、相空間擴(kuò)展法、復(fù)自相關(guān)法和去偏復(fù)自相關(guān)法;另一種方法認(rèn)為兩者是相關(guān)的,即τ和m的選取是互相依賴的。如時(shí)間窗口法、C-C方法可同時(shí)計(jì)算時(shí)間延遲和時(shí)間窗口。
1. C-C方法求延遲。常用的方法是自相關(guān)函數(shù)法和互信息法,盡管前者計(jì)算簡便但是不適合非線性問題,后者雖然能有效地估計(jì)非線性問題重構(gòu)相空間的延遲,但是計(jì)算不方便,因此,針對(duì)上述判別為非線性的網(wǎng)絡(luò)流量時(shí)間序列,應(yīng)該采取能有效減少計(jì)算量的C-C算法。理論證明該方法得出的延遲τ相比其他方法能更好地估計(jì)維數(shù)。
則嵌入時(shí)間序列的關(guān)聯(lián)積分定義為
r>0 (2)
式中m是嵌入維數(shù);M=N-(m-1)τ;Yi為相空間中的相點(diǎn);r為給定的距離;H為heaviside函數(shù)。對(duì)于一般的時(shí)間序列t將其分成若干個(gè)不相交的子序列,然后定義每一個(gè)子序列的s(m,N,r,t)為:
m=2,3,… (3)
令,且選擇對(duì)應(yīng)值最大和最小兩個(gè)半徑r,定義差量為
m=2,3,… (4)
根據(jù)BDS的統(tǒng)計(jì)結(jié)論計(jì)算
(5)
依據(jù)上述計(jì)算結(jié)果作圖,其中的第一個(gè)極小值時(shí)間為該時(shí)間序列的延遲。
2. Cao方法求嵌入維數(shù)。該方法是改進(jìn)的虛假零點(diǎn)法,對(duì)于
,n=N0,N0+1,…,N定義
記所有的a(n,m)關(guān)于n的均值為
E(m)只依賴于嵌入維數(shù)m和延遲時(shí)間間隔τ,為了研究嵌入維數(shù)從m變?yōu)閙+1時(shí)相空間的變化情況,定義E1(m):
如果當(dāng)m大于某個(gè)m0時(shí),El(m)停止變化,則m0就是重構(gòu)相空間的最小嵌入維數(shù)。
三、神經(jīng)網(wǎng)絡(luò)法預(yù)測銷售量時(shí)間序列
神經(jīng)網(wǎng)絡(luò)是由并行的、高度相關(guān)的計(jì)算處理單元——神經(jīng)元按照某種方式聯(lián)結(jié)而成的自適應(yīng)的非線性系統(tǒng)。雖然單個(gè)神經(jīng)元的結(jié)構(gòu)十分簡單,但由大量神經(jīng)元相互連接構(gòu)成的神經(jīng)元系統(tǒng)所能實(shí)現(xiàn)的行為是十分豐富的。因此,神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的非線性映射能力,鑒于神經(jīng)網(wǎng)絡(luò)的并行處理及強(qiáng)大的非線性映射能力,即它可以把許多非線性信號(hào)的處理方法及工具集成起來,對(duì)于未知的動(dòng)力系統(tǒng),可以通過它來學(xué)習(xí)混沌時(shí)間序列,然后進(jìn)行預(yù)測。
四、預(yù)測實(shí)例
預(yù)測實(shí)例所采用的銷售量數(shù)據(jù)來自某商場1985年至2006年的銷售數(shù)據(jù),以旬為時(shí)間單位共792個(gè)數(shù)據(jù),下面用基于混沌時(shí)間序列的預(yù)測方法來對(duì)其進(jìn)行預(yù)測分析:
1.判別混沌的存在。經(jīng)過Matlab編程計(jì)算研究的銷售量時(shí)間序列最大Lyapunov指數(shù)A=O.0738>O,同時(shí)通過G-P算法計(jì)算出關(guān)聯(lián)維數(shù)為4>2;因此,判別該時(shí)間序列為混沌時(shí)間序列,以銷售量為狀態(tài)量的商場管理系統(tǒng)存在混沌。
2.重構(gòu)相空間。在應(yīng)用中,Brock等人所做的關(guān)于幾種重要的漸進(jìn)分布的數(shù)學(xué)統(tǒng)計(jì)結(jié)果表明:當(dāng)2≤m≤5,σ/2≤r≤2σ,N≥500時(shí),漸進(jìn)分布可以通過有限時(shí)間序列很好地近似,并且S(m,N,r,1)能代表序列的相關(guān)性,這里σ指時(shí)間序列的均方差或標(biāo)準(zhǔn)差。因此,在編程中令2≤m≤8,N=22×12×3=792>500,計(jì)算時(shí)間延遲:通過分析當(dāng)t=4可取到△s(t)的第一個(gè)極小值,加大t的取值范圍至[1,10],發(fā)現(xiàn)t=4時(shí)函數(shù)值近似為Scor(t)的最小值,因此,取t=4,延遲r=4×采樣間隔=4×10=40(天)。
1986年,Broomhead和King在實(shí)際計(jì)算中首先提出了先選定(m-1) r值,在增加m的同時(shí)減少r的值,使乘積為常數(shù)來選取最佳的m和r的方法。經(jīng)過Matlab編程計(jì)算在延遲選取40天時(shí),相應(yīng)嵌入維數(shù)優(yōu)應(yīng)取6,因?yàn)榇藭r(shí)El(m)停止變化。
3.混沌理論與神經(jīng)網(wǎng)絡(luò)耦合預(yù)測。首先建立網(wǎng)絡(luò),根據(jù)上述計(jì)算得出的嵌入維數(shù)m(本文中為6)作為網(wǎng)絡(luò)輸入個(gè)數(shù),并設(shè)定N為包含訓(xùn)練樣本和測試樣本的總個(gè)數(shù),n為預(yù)測的數(shù)據(jù)個(gè)數(shù),本文預(yù)測的銷售量個(gè)數(shù)為最后的12個(gè);然后將個(gè)數(shù)值序列順序輸入數(shù)據(jù)學(xué)習(xí)過程;最后將末尾的12個(gè)數(shù)值輸入神經(jīng)網(wǎng)絡(luò)中,此時(shí)的輸出就是該序列的預(yù)測值。為了評(píng)估預(yù)測值的精度,可以假設(shè)末尾n個(gè)銷售量缺失,用序列中作為訓(xùn)練樣本來預(yù)測,再將預(yù)測值與真實(shí)值對(duì)比可以計(jì)算絕對(duì)誤差、相對(duì)誤差等作為評(píng)價(jià)預(yù)測精度的指標(biāo),見下表:
由表可以看出,預(yù)測的最大誤差為0.96%,這一誤差完全能夠滿足商場管理需要,說明基于混沌理論和神經(jīng)網(wǎng)絡(luò)對(duì)銷售量進(jìn)行預(yù)測是可行的。
五、結(jié)論與展望
本文依托混沌理論研究銷售量關(guān)于時(shí)間的演變行為,并與啟發(fā)式的神經(jīng)網(wǎng)絡(luò)預(yù)測相耦合,統(tǒng)計(jì)指標(biāo)顯示了初步優(yōu)化的效果;而進(jìn)一步的研究將圍繞商場管理系統(tǒng)內(nèi)多變量的時(shí)間序列分析方法展開討論,并應(yīng)該深入探討包括神經(jīng)網(wǎng)絡(luò)方法在內(nèi)的多種預(yù)測方法與混沌動(dòng)力系統(tǒng)分析耦合的可行性和適用性,以期得到更精確的預(yù)測效果。
參考文獻(xiàn):
[1]張立明.人工神經(jīng)網(wǎng)絡(luò)的模型及其應(yīng)用[M].上海:復(fù)旦大學(xué)出版社,1993.
[2]王海燕,盧山.非線性時(shí)間序列分析及其應(yīng)用[M].北京:科學(xué)出版社,2006.
[3]Wolf,A.,Swift,J.B.,13.,Swinney,H.L. et a1.Determining Lyapunov exponents from a time series[J].Physical D,1985,16:285-317.
[4]Packard,N.H.,Crutchfield,J.P.,F(xiàn)armer,J.D.et a1.Geometry from a Time Series[J].Phys. Rev.Letter,1980,43(9):712-715.
[5]呂金虎,陸君安,陳士華.混沌時(shí)間序列分析及其應(yīng)用[M].武漢:武漢大學(xué)出版社,2002.
[6]丁士圻,郭麗華.人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)(研究生用教材)[M].哈爾濱:哈爾濱工程大學(xué)出版社,2008