,,,
(1.湖南大學(xué) 信息科學(xué)與工程學(xué)院,長(zhǎng)沙 410082; 2.快樂(lè)購(gòu)股份有限公司,長(zhǎng)沙 410003)
全球化經(jīng)濟(jì)時(shí)代企業(yè)競(jìng)爭(zhēng)日益強(qiáng)烈,需要利用有價(jià)值的商業(yè)數(shù)據(jù)在競(jìng)爭(zhēng)中取得優(yōu)勢(shì)地位。預(yù)測(cè)商品的銷(xiāo)量有利于提高零售企業(yè)自身的庫(kù)存周轉(zhuǎn)率和運(yùn)行效率[1]。為此,國(guó)內(nèi)外學(xué)者們提出了多種銷(xiāo)量預(yù)測(cè)模型并結(jié)合具體實(shí)例進(jìn)行了研究[2]。商品的銷(xiāo)量隨著時(shí)間不斷變化,將銷(xiāo)量看成是時(shí)序數(shù)據(jù),可以通過(guò)時(shí)序挖掘相關(guān)方法對(duì)其進(jìn)行預(yù)測(cè)研究。常用的時(shí)序分析模型有灰度模型[3]、馬爾可夫模型[4]、自回歸條件異方差模型[5]、貝葉斯向量自回歸模型等[6],其中ARMA模型應(yīng)用最廣泛[7]。ARMA模型通過(guò)抽取時(shí)序數(shù)據(jù)內(nèi)部的規(guī)律用于時(shí)序的周期預(yù)測(cè)和趨勢(shì)分析,現(xiàn)已廣泛應(yīng)用于市場(chǎng)銷(xiāo)售額預(yù)測(cè)、消費(fèi)模式變遷等長(zhǎng)期追蹤資料的研究[8]。傳統(tǒng)的ARMA模型是線性回歸模型,只能捕捉平穩(wěn)時(shí)序中的線性模式,但是商品銷(xiāo)量的變化是受多種因素影響的,在其變化過(guò)程中同時(shí)存在非平穩(wěn)非線性變化模式,因此,單一建立ARMA模型無(wú)法準(zhǔn)確描述商品銷(xiāo)量的變化趨勢(shì)。為了克服傳統(tǒng)時(shí)序線性模型預(yù)測(cè)精度低的問(wèn)題,多種非線性回歸預(yù)測(cè)方法被提出,其中表現(xiàn)較好的有SVR方法[9]以及ELM方法[10]。從理論上說(shuō),構(gòu)建非線性模型能以無(wú)限精度擬合原始序列,但是需要大量的訓(xùn)練樣本,并且容易陷入過(guò)擬合。因此,將傳統(tǒng)的線性模型與智能非線性方法整合預(yù)測(cè)商品銷(xiāo)量是有必要的,已有許多研究表明,通過(guò)整合不同的模型能顯著提升預(yù)測(cè)性能。Yan和 Ma認(rèn)為,ARIMA(Auto-Regressive Integrated Moving Average)與徑向基函數(shù)網(wǎng)絡(luò)(RBFN)的異構(gòu)組合模型性能要優(yōu)于ARIMA和RBFN自身,并在月降雨量預(yù)測(cè)中得到驗(yàn)證[11]。Babu和Reddy[12]使用ARIMA濾波器探索了自然種類(lèi)的波動(dòng)情況,并將人工神經(jīng)網(wǎng)絡(luò)(ANN)模型進(jìn)行了適當(dāng)?shù)膽?yīng)用。Bangzhuzhu[13]提出了一種新穎的異構(gòu)ARIMA和最小二乘支持向量機(jī)(LLSVM)方法,用于預(yù)測(cè)碳價(jià)格的波動(dòng)情況;Wang等人[14]提出一種異構(gòu)人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的模型用于地表PM10和SO2日濃度預(yù)測(cè)。
針對(duì)傳統(tǒng)的時(shí)序模型無(wú)法捕捉商品銷(xiāo)量中的非平穩(wěn)和非線性特征,論文提出一種將時(shí)序線性回歸模型與智能非線性回歸方法組合的預(yù)測(cè)模型。首先利用ARMA模型識(shí)別出商品銷(xiāo)量數(shù)據(jù)中的線性成分,再對(duì)其殘差中的非線性成分分別采用SVR和ELM方法進(jìn)行預(yù)測(cè),兩部分組合后得到最終預(yù)測(cè)結(jié)果。由于ARMA模型存在平穩(wěn)性假定且定階過(guò)程復(fù)雜、隨機(jī)性強(qiáng),論文提出一種選擇性集成多個(gè)差異ARMA模型的定階方法。經(jīng)過(guò)某電商平臺(tái)真實(shí)銷(xiāo)售數(shù)據(jù)驗(yàn)證,論文提出的選擇性集成ARMA定階方法定階更準(zhǔn)確,改善了ARMA模型在平穩(wěn)及非平穩(wěn)時(shí)序下的預(yù)測(cè)效果。組合方法得到的銷(xiāo)量預(yù)測(cè)結(jié)果相比僅采用線性平穩(wěn)時(shí)序模型更符合實(shí)際,穩(wěn)定性更好,因而驗(yàn)證了提出的組合模型具有一定的參考價(jià)值。
通過(guò)分析消費(fèi)者的購(gòu)買(mǎi)行為,發(fā)現(xiàn)諸多商品之間的銷(xiāo)量變化是相互影響的,不同商品之間存在著競(jìng)爭(zhēng)和合作關(guān)系[15]。某一商品的銷(xiāo)量受其同類(lèi)型商品銷(xiāo)量的影響、關(guān)聯(lián)商品銷(xiāo)量的影響以及商家營(yíng)銷(xiāo)推廣活動(dòng)的影響。從內(nèi)在影響因素映到外在表現(xiàn),銷(xiāo)量變化呈現(xiàn)出一定的發(fā)展模式和潛在規(guī)律。通過(guò)挖掘歷史銷(xiāo)量數(shù)據(jù)中潛在的規(guī)則和模式,建立數(shù)學(xué)模型對(duì)其進(jìn)行描述,可以達(dá)到預(yù)測(cè)銷(xiāo)量未來(lái)走勢(shì)的目的。
根據(jù)銷(xiāo)量數(shù)據(jù)的時(shí)序特征,論文采用ARMA模型對(duì)其中的線性因素、季節(jié)性周期性規(guī)律、隨機(jī)因素進(jìn)行預(yù)測(cè)。對(duì)除此之外的可能存在的突發(fā)因素及非線性變化部分,僅基于統(tǒng)計(jì)時(shí)序模型來(lái)擬合和預(yù)測(cè)會(huì)產(chǎn)生較大的非線性誤差,故將影響商品銷(xiāo)量變化過(guò)程看成是平穩(wěn)隨機(jī)過(guò)程以及非平穩(wěn)非線性噪音的疊加。先通過(guò)ARMA模型識(shí)別出銷(xiāo)量數(shù)據(jù)中的線性成分,然后采用不同的非線性回歸預(yù)測(cè)方法對(duì)殘差數(shù)據(jù)作出預(yù)測(cè)并將預(yù)測(cè)結(jié)果補(bǔ)償給ARMA模型。其誤差補(bǔ)償示意圖見(jiàn)圖1。
圖1 商品時(shí)序預(yù)測(cè)誤差補(bǔ)償示意圖
如圖1所示,本文先根據(jù)歷史銷(xiāo)量數(shù)據(jù)建立ARMA模型。假設(shè)觀測(cè)數(shù)據(jù)為一維,當(dāng)前時(shí)間為t,總采樣時(shí)間為N,則建模后依次得到Ut+1,Ut+2,……UN個(gè)初步預(yù)測(cè)值。將初步預(yù)測(cè)值與真實(shí)值相減得到ARMA模型的非線性殘差。通過(guò)滑動(dòng)窗口法獲得前d維銷(xiāo)量數(shù)據(jù)作為SVR和ELM方法的輸入,得到t+1,t+2,……,N時(shí)刻的誤差預(yù)測(cè)值Et+1,Et+2,……,EN,最后將初步預(yù)測(cè)值和誤差預(yù)測(cè)值疊加得到商品銷(xiāo)量的最終預(yù)測(cè)值。具體流程見(jiàn)圖2。
圖2 組合方法建模流程
ARMA模型是迄今最常用的擬合平穩(wěn)時(shí)間序列的線性回歸模型,它由自回歸模型AR(p)和移動(dòng)平均模型MA(q)組合而成,分別反映系統(tǒng)對(duì)歷史數(shù)據(jù)和隨機(jī)噪音的依賴(lài)關(guān)系。ARMA(p,q)的數(shù)學(xué)模型一般表示為:
(1)
其中:▽dxt=(1-B)d是差分運(yùn)算,用于把數(shù)據(jù)處理成平穩(wěn)時(shí)序,序列{εt}是白噪聲序列,B為滯后算子,Bnxt=xt-n。ARMA模型經(jīng)過(guò)多個(gè)參數(shù)的試算,以及反復(fù)模型評(píng)定,最終得到最優(yōu)階數(shù)p,q。
ARMA模型應(yīng)用的關(guān)鍵是確定模型的自回歸階數(shù)p和移動(dòng)平均階數(shù)q,而往往在實(shí)際應(yīng)用時(shí)無(wú)法準(zhǔn)確定階,造成模型的準(zhǔn)確率下降。本文提出了一個(gè)基于模型編碼的選擇性集成ARMA模型定階的新方法,該方法不直接對(duì)ARMA模型的階數(shù)求解,而是通過(guò)集成多個(gè)ARMA模型作為基學(xué)習(xí)器,對(duì)所有基學(xué)習(xí)器二進(jìn)制編碼,然后利用遺優(yōu)化算法[16]選擇出最優(yōu)學(xué)習(xí)器組合。選擇性集成方法通過(guò)選擇部分精度較高、多樣性大的個(gè)體學(xué)習(xí)器,能獲得比采用全部學(xué)習(xí)器更好的性能,周志華等人[17]最先從理論上證明了選擇性集成的有效性。
選擇性集成ARMA模型過(guò)程如下:
1)設(shè)定p,q初始解空間:階數(shù)p、q的解空間表示最優(yōu)階數(shù)可能存在的范圍,假設(shè)p的解空間為(0,n),q的解空間是(0,m),則一共有(n+1)*(m+1)個(gè)ARMA(p,q)模型參與集成。
2)集成編碼方法:采用二進(jìn)制模型權(quán)重編碼方法,即對(duì)每個(gè)模型的權(quán)重進(jìn)行二進(jìn)制編碼,權(quán)重為1表示選中該ARMA模型參與集成,權(quán)重為0表示未選擇該ARMA模型。
3)模型預(yù)剪枝:如果n與m的值過(guò)大,遺傳編碼長(zhǎng)度過(guò)長(zhǎng),變異的多樣性會(huì)受到抑制不利于產(chǎn)生最優(yōu)解。因此,在用遺傳算法尋優(yōu)之前,需要預(yù)先剔除模型無(wú)法收斂的p、q組合,以提高算法獲取最優(yōu)解的能力。
4)遺傳算法尋優(yōu)過(guò)程:遺傳算法解的構(gòu)成為:
W(t)={ω1(t),ω2(t),...,ωD(t)}
(2)
表示初始種群中某個(gè)染色體在t次迭代后的基因序列,D表示參與集成的ARMA個(gè)數(shù),ωj表示每個(gè)ARMA模型權(quán)重,初始種群權(quán)重的設(shè)置如下:
(3)
其中:rand( )是隨機(jī)函數(shù)。為了選出泛化能力強(qiáng)的ARMA模型組合,適應(yīng)度函數(shù)選擇均方根誤差函數(shù)的倒數(shù)。均方根誤差越小,適應(yīng)度越大,被遺傳的概率也就越大,這與遺傳算法的規(guī)律相符。故對(duì)于一個(gè)特定的ARMA集合i,適應(yīng)度函數(shù)可描述為:
(4)
為了產(chǎn)生驗(yàn)證集Lval用于集成選擇,采用滑動(dòng)窗口法對(duì)時(shí)序數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)預(yù)處理,每次滑動(dòng)一個(gè)窗口以產(chǎn)生一個(gè)驗(yàn)證樣本。ARMA模型的輸入輸出映射函數(shù)為:
(5)
其中:τ為延遲時(shí)間,論文設(shè)為1;d是滑動(dòng)窗口的維數(shù)。
組合模型ARMA-SVR、ARMA-ELM預(yù)測(cè)過(guò)程如下。
步驟一:數(shù)據(jù)準(zhǔn)備與ARMA建模。將商品的銷(xiāo)量數(shù)據(jù)以周為周期分布構(gòu)建時(shí)間序列,設(shè)定階數(shù)p,q解空間大小,根據(jù)解空間構(gòu)建多個(gè)不同階數(shù)的ARMA模型進(jìn)行集成,然后利用遺傳優(yōu)化算法選出最優(yōu)ARMA模型集。用該ARMA模型集對(duì)商品未來(lái)銷(xiāo)量進(jìn)行預(yù)測(cè),真實(shí)值和預(yù)測(cè)值在t時(shí)刻的殘差為:
(9)
(10)
收集某電商平臺(tái)2011年1月1日到2012年12月28日期間某品牌手機(jī)銷(xiāo)量數(shù)據(jù)、餅干銷(xiāo)量數(shù)據(jù)作為實(shí)例研究對(duì)象。通過(guò)分析商品的貨道設(shè)計(jì)等實(shí)際情況,商品的備貨通常不宜過(guò)于頻繁,因此本文旨在預(yù)測(cè)未來(lái)一周內(nèi)的商品總銷(xiāo)量。將數(shù)據(jù)以周為單位進(jìn)行預(yù)處理后,得到商品銷(xiāo)量曲線圖,如圖3所示。
圖3 商品銷(xiāo)量曲線圖
利用Eviews工具對(duì)兩個(gè)序列進(jìn)行單位根檢驗(yàn)以確定序列是否平穩(wěn),檢驗(yàn)結(jié)果見(jiàn)表1。通過(guò)檢驗(yàn)結(jié)果可知,手機(jī)銷(xiāo)量序列數(shù)據(jù)具有很好的平穩(wěn)性,餅干銷(xiāo)量序列數(shù)據(jù)非平穩(wěn)。
將非平穩(wěn)序列進(jìn)行差分運(yùn)算直至平穩(wěn)后,再根據(jù)AIC定階準(zhǔn)則對(duì)序列反復(fù)試算,最后得出手機(jī)序列最優(yōu)模型為ARMA(1,1),餅干序列最優(yōu)模型為ARMA(0,1)(此處統(tǒng)稱(chēng)為ARMA-1)。分別采用ARMA-1、選擇性集成ARMA模型(簡(jiǎn)稱(chēng)為ARMA-2)對(duì)兩組序列的后45周數(shù)據(jù)進(jìn)行預(yù)測(cè),得到殘差序列,如圖4所示。
表1 序列單位根檢驗(yàn)
圖4 兩類(lèi)商品的殘差序列
根據(jù)圖4可知,ARMA-2降低了ARMA模型的平穩(wěn)性假定條件,簡(jiǎn)化了模型的定階過(guò)程。選擇性集成方法通過(guò)集成了部分差異性大的ARMA模型作為組合學(xué)習(xí)器,在平穩(wěn)和非平穩(wěn)序列上的預(yù)測(cè)結(jié)果都更接近真實(shí)值。
圖5 三類(lèi)模型的銷(xiāo)量預(yù)測(cè)值
論文分別采用MAE(Mean Absolute Error,平均絕對(duì)誤差)、RMSE(Root Mean Squares Error,均方根誤差)和MAPE(Mean Absolute Percentage Error,平均絕對(duì)百分誤差)三個(gè)性能指標(biāo)來(lái)度量每個(gè)模型的預(yù)測(cè)誤差。由預(yù)測(cè)結(jié)果可以看出,ARMA-2的MAPE在平穩(wěn)時(shí)序上比ARMA-1模型提高了23.58%。在非平穩(wěn)時(shí)序上提高了41.28%。組合模型中ARMA-SVR的預(yù)測(cè)精度分別在ARMA-2的基礎(chǔ)上提高了68.86%(平穩(wěn))和45.18%(非平穩(wěn));ARMA-ELM的預(yù)測(cè)精度分別提高了64.47%(平穩(wěn))和14.90%(非平穩(wěn)),這也應(yīng)證了ARMA模型不能識(shí)別銷(xiāo)量數(shù)據(jù)中非線性影響因素的假設(shè)。對(duì)比兩種組合方法,ARMA-SVR在小樣本、非平穩(wěn)時(shí)序下預(yù)測(cè)準(zhǔn)確度達(dá)到92.62%,對(duì)比ARMA-ELM精度更高、穩(wěn)定性更好。
表2 模型預(yù)測(cè)效果比較
短期銷(xiāo)量預(yù)測(cè)對(duì)現(xiàn)代零售企業(yè)采購(gòu)和庫(kù)存具有很大戰(zhàn)略指導(dǎo)價(jià)值。通過(guò)分析零售商品銷(xiāo)售趨勢(shì),企業(yè)能更好地把握消費(fèi)者的未來(lái)消費(fèi)走向,有利于企業(yè)制定有效的市場(chǎng)營(yíng)銷(xiāo)策略。論文根據(jù)當(dāng)前ARMA模型定階準(zhǔn)則和方法的不足,提出了選擇性集成的定階方法,將定階過(guò)程自動(dòng)化,為線性平穩(wěn)時(shí)序數(shù)據(jù)的分析提供了一種新思路。針對(duì)ARMA模型只能捕捉商品銷(xiāo)量中的線性及平穩(wěn)因素的特點(diǎn),論文提出了將ARMA模型與智能非線性回歸模型組合的預(yù)測(cè)方法,引入非線性預(yù)測(cè)方法中表現(xiàn)較好的SVR方法和ELM方法對(duì)殘差當(dāng)中的非線性、非平穩(wěn)因素進(jìn)行預(yù)測(cè)并補(bǔ)償。實(shí)驗(yàn)證明,選擇性集成ARMA方法定階更準(zhǔn)確,有效改善ARMA模型在非平穩(wěn)時(shí)序上的預(yù)測(cè)效果,組合模型得到的銷(xiāo)量預(yù)測(cè)結(jié)果相比僅采用線性平穩(wěn)時(shí)序模型更符合實(shí)際,穩(wěn)定性更好。商品銷(xiāo)量受外界因素的影響較大,收集完整影響因素?cái)?shù)據(jù)存在一定困難,論文僅對(duì)銷(xiāo)量歷史數(shù)據(jù)進(jìn)行了分析,繼續(xù)研究中需進(jìn)一步整理較完整的銷(xiāo)售數(shù)據(jù),不斷完善預(yù)測(cè)模型,以期達(dá)到預(yù)期的效果。
參考文獻(xiàn):
[1] 何 偉,徐福緣. 需求依賴(lài)庫(kù)存且短缺量部分拖后的促銷(xiāo)商品庫(kù)存模型[J]. 計(jì)算機(jī)應(yīng)用,2013,33(10):2950-2953.
[2] Kanko Y, Yada K. A Deep Learning Approach for the Prediction of Retail Store Sales[A]. IEEE 16th International Conference on Data Mining Workshops (ICDMW)[C]. Barcelona, 2016, 531-537.
[3] 何 斌,蒙 清. 灰色預(yù)測(cè)模型擴(kuò)廣方法研究[J]. 系統(tǒng)工程理論與實(shí),2002(9):137-140.
[4] Schoof JT,Pryor SC. On the proper order of Markov chain model for daily precipitation occurence in the contiguous United States [J]. Journal of applied meteorology and climatology,2008, 47(9): 2477-2786.
[5] Engle R F. Autoregressive conditional heteroskedasticity with estimate of the variance of United Kingdom infation[J]. Econometrica, 1982(50):987-1007.
[6] 樊重俊. 貝葉斯向量自回歸分析方法及其應(yīng)用[J]. 數(shù)理統(tǒng)計(jì)與管理,2010,29(6):1060-1066.
[7] Box G E P, Jenkins G N, Reinsel G C著.時(shí)間序列分析預(yù)測(cè)與控制[M].顧嵐主譯.中國(guó)統(tǒng)計(jì)出版社,1997:51-58.
[8] Esling P,Agon C. Time-series Data Mining [J]. ACM Computional Survey,2012, 45(1):1-34.
[9] Chang C C, Lin C J. Training v-Support Vector Regression: Theory and Algorithms[J].Journal of Neural Computation,2002, 14(8):1959-1977.
[10] Huang GB,Zhu QY,Siew CK. Extreme learning machine: theory and applications[J]. Neurocomputing,2006,70(1-3):489-501.
[11] Qiao Yan. Application of integrated ARIMA and RBF network for groundwater level forecasting[J]. Forecasting Environmental Earth Sciences[J].2016,75(5):1-13.
[12] Babu CN, Reddy BE. A moving-average filter based hybrid ARIMA-ANN model for forecasting time series data[J]. Appl. Soft Comput ,2014,23:27-38.
[13] Bang Zhuzhu,Wei Yiming. Carbon price forecasting with a novel hybrid ARIMA and least squares support vector machines methodology[J].Omega,2013,41(3):517-524.
[14] Wang P,Liu Y,Qinz ET.A novel hybrid forecasting model for PM10and SO2daily concentrations[J].Total Environ Sci, 2015, 505, 1202-1212.
[15] 何周舟. 基于時(shí)序數(shù)據(jù)的結(jié)構(gòu)學(xué)習(xí)與模式預(yù)測(cè)聯(lián)合優(yōu)化算法研究[D].杭州:浙江大學(xué),2016.
[16] Piotr Faliszewski,Jakub Sawicki,Robert Schaefer, et al. Multiwinner Voting in Genetic Algorithms[J].IEEE Intelligent Systems,2017,32(1):40-48.
[17] Zhou ZH, Wu jx,Tang W. Emsembling neural networks:Many could be better than all[J]. Artificial Intelligence, 2002, 137 (1-2): 239-263.