陳德洪 李長云
摘? 要:為了獲得精度更高的服裝銷量預測結(jié)果,提出一種基于LSTM神經(jīng)網(wǎng)絡的服裝銷量預測方法。LSTM神經(jīng)網(wǎng)絡具有較好的非線性和自適應特性,可以更好地挖掘時序數(shù)據(jù)中的時序特征和非線性特征,從而獲得更加符合實際的預測結(jié)果值。使用某服裝企業(yè)的服裝銷量時間序列數(shù)據(jù)集訓練LSTM模型,設計與經(jīng)典時間序列預測模型ARIMA的對比實驗。實驗結(jié)果表明,該模型能夠有效提升服裝銷量預測任務的精度。
關(guān)鍵詞:服裝銷量預測;LSTM;ARIMA
中圖分類號:TP18? ? ? ? ? ? ? ? ?文獻標識碼:A文章編號:2096-4706(2021)20-0106-03
Short Term Clothing Sales Forecast Based on LSTM Neural Network
CHEN Dehong, LI Changyun
(School of Computer Science, Hunan University of Technology, Zhuzhou 412007, China)
Abstract: In order to obtain more accurate clothing sales forecast results, a clothing sales prediction method based on LSTM neural network is proposed. LSTM neural network has good nonlinear and adaptive characteristics. It can better mine the temporal and nonlinear characteristics in time series data, so as to obtain more realistic prediction results. Using the clothing sales time series data set of a clothing enterprise to train the LSTM model, a comparative experiment with the classical time series prediction model ARIMA is designed. The experimental results show that the model can effectively improve the accuracy of clothing sales forecast.
Keywords: clothing sales forecast; LSTM; ARIMA
0? 引? 言
服裝銷量對服裝生產(chǎn)企業(yè)進行科學生產(chǎn)、減輕庫存壓力[1]等具有重要的指導意義。隨著經(jīng)濟社會的快速發(fā)展,影響服裝物料需求的因素呈現(xiàn)出明顯的復雜性和多樣性,主要包括流行趨勢、經(jīng)濟發(fā)展水平、消費觀念、季節(jié)、節(jié)假日等。從而導致對服裝物料需求進行預測較為困難。如果能有一種對服裝銷量進行可靠預測的方法,將為企業(yè)減少貨物積壓,把握市場動向,提升企業(yè)利潤等具有重要的意義。
進行預測研究,常用的時間序列預測方法主要分為兩類,一類是時間序列統(tǒng)計模型,主要是把整個時間序列放入模型中進行訓練,如AR、MA、ARIMA[2]、Prophet[3]等;另一類時間序列監(jiān)督模型,需要把時間序列通過滾動的方式構(gòu)建對應的X和Y,如CNN[4]、RNN[5]、LSTM[6]、Attention Model[7]、Transformer[8]等。在眾多時序預測算法的應用中,LSTM神經(jīng)網(wǎng)絡被廣泛應用在眾多領(lǐng)域,高海翔等[6]使用LSTM神經(jīng)網(wǎng)絡模型對數(shù)據(jù)進行分量重構(gòu),有效提升了原油價格的預測精度。劉翀等[7]引入深度LSTM建模,解決金融數(shù)據(jù)間的長依賴問題,得到一個具有高準確性和穩(wěn)定性的金融領(lǐng)域預測模型。曹超凡等[9]使用LSTM模型進行關(guān)聯(lián)預測,在股價預測領(lǐng)域取得了較優(yōu)水準。LSTM神經(jīng)網(wǎng)絡在眾多領(lǐng)域均取得了良好效果,證明了該方法的優(yōu)越性和可行性。由此將該方法引入服裝銷量預測領(lǐng)域,提升預測精度。
針對上述問題,本文選用LSTM神經(jīng)網(wǎng)絡來完成服裝銷量預測任務,為企業(yè)提供的生產(chǎn)幾乎決策提供精度更好的理論依據(jù)。首先對獲取的企業(yè)服裝銷量數(shù)據(jù)進行數(shù)據(jù)處理得到時序數(shù)據(jù),然后對數(shù)據(jù)進行標準化,再輸入到LSTM模型中進行訓練,得到短期服裝銷量預測值。
1? 基礎(chǔ)理論
1.1? LSTM神經(jīng)網(wǎng)絡
LSTM[6]神經(jīng)網(wǎng)絡是一種特殊的RNN,主要是為了消除RNN在進行長序列訓練過程中的梯度消失和梯度爆炸問題,在處理序列數(shù)據(jù)方面表現(xiàn)優(yōu)異。LSTM主要由輸入門、遺忘門和輸出門組成。LSTM神經(jīng)網(wǎng)絡的重要之處在于它獨有的細胞狀態(tài)與三類功能各異的“門”結(jié)構(gòu)[6]。細胞狀態(tài)作為各類信息傳輸?shù)穆窂?,讓模塊內(nèi)的信息能在不用序列連中有序傳遞。可將其看作網(wǎng)絡的“記憶”部門。從基礎(chǔ)理論來說,細胞中存儲的狀態(tài)能夠?qū)⑾嚓P(guān)序列處理過程中的各類有效信息一直傳遞下去。所以即使是原始時間步長的有效信息也能攜帶到后續(xù)時間步長的細胞中來,這有效克服了短時記憶的影響,改進了原有RNN的局限性。因此LSTM是通過“門”結(jié)構(gòu)來實現(xiàn)信息的增添和減少,“門”結(jié)構(gòu)在大量訓練過程中可以自主得去學習保持或刪除各類相關(guān)數(shù)據(jù)[7]。
1.2? ARIMA模型
自回歸綜合移動平均(ARIMA)是時間序列預測中最常用的方法之一,它是將自回歸模型和移動平均模型相結(jié)合的一種方法,由于其能夠使序列平穩(wěn),通常應用于非平穩(wěn)時間序列。在識別步驟中,通常需要進行數(shù)據(jù)轉(zhuǎn)換,使時間序列平穩(wěn)。平穩(wěn)性是建立用于預測的ARIMA模型的必要條件。平穩(wěn)時間序列具有這樣的特性,即它的統(tǒng)計特征,如均值和自相關(guān)結(jié)構(gòu),隨時間的推移是恒定的。
1.3? 預測任務流程
針對時間序列模型,考慮服裝銷量受到季節(jié)、流行趨勢、社會經(jīng)濟狀況、消費觀念、傳統(tǒng)文化影響等多重因素的干擾,具有很強特殊性,同時提升預測精度又非常有必要,會給企業(yè)帶來可觀的效益,因此提出了一個基于LSTM神經(jīng)網(wǎng)絡的短期服裝銷量預測方法,步驟為:
(1)獲取服裝銷量原始數(shù)據(jù)數(shù)據(jù)。
(2)數(shù)據(jù)清洗。將銷量原始數(shù)據(jù)數(shù)據(jù)整理得到銷量時間序列數(shù)據(jù),由2列數(shù)據(jù)組成,第一列是日期,第二列是銷售數(shù)值。
(3)整理數(shù)據(jù)。為減少誤差,降低非線性因素對預測的影響,對已有數(shù)據(jù)已月為單位重新計算,得到新的時序數(shù)據(jù)。同時另外經(jīng)過序列處理,以時間為序號,銷量為值,對應得到一組序列數(shù)據(jù)。
(4)劃分訓練集和測試集。由于是短期預測,因此只劃分12個月即12條數(shù)據(jù)作為測試集。
(5)使用LSTM模型對訓練集進行訓練。
(6)預測評估。對預測結(jié)果進行綜合評價,包括評價指標和曲線擬合情況。
2? 實驗結(jié)果與分析
2.1? 數(shù)據(jù)集的選擇和預測評估
本實驗選用某服裝企業(yè)的服裝銷量時間序列數(shù)據(jù)集進行驗證實驗,該數(shù)據(jù)集記錄了企業(yè)從2008年1月到2015年12月的服裝銷售時間序列數(shù)據(jù)。首先進行數(shù)據(jù)預處理,由于銷售是以天為單位,而天為單位受到當天天氣、當天溫度等較多因素的影響,綜合考慮后認為以月為單位對數(shù)據(jù)集進行重新分配處理。以月為單位重新整理數(shù)據(jù)格式,對每個月度的各天銷售數(shù)據(jù)求和,集中到各月1號,形成一個新的數(shù)據(jù)集。新時間序列數(shù)據(jù)集中由2列組成,第一列是時間序列的時間戳,第二列是月銷售數(shù)據(jù)值。新的時間序列數(shù)據(jù)中得到96個樣本,本實驗將其中前84個樣本作為訓練集,后12個樣本作為測試集。
本實驗借助均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)來作為預測評估指標,對預測結(jié)果進行一個綜合的比較分析。RMSE和MAPE的數(shù)據(jù)越小,就表明預測的效果越好。同時還會繪制出預測數(shù)據(jù)與原始數(shù)據(jù)的對比圖,通過走勢和對重要節(jié)點的擬合精度來對整體的預測效果進行判斷。結(jié)合預測評估指標和走勢圖對比效果,才能得到最終的對預測效果的評價,得出是否提升了預測精度。
2.2? LSTM模型構(gòu)建
初始化LSTM模型,采用標準的三層結(jié)構(gòu),批處理個數(shù)為50,迭代次數(shù)設置為200,目標函數(shù)為均方差。為了防止梯度爆炸問題,在眾多的梯度優(yōu)化算法中選擇了自適應估計(Adaptive Moment Estimation, Adam)算法。激活函數(shù)選用ReLU函數(shù)。原始服裝銷量數(shù)據(jù)經(jīng)過標準化方法處理得到標準且變化平緩的數(shù)據(jù)集,數(shù)據(jù)LSTM模型中,得到的結(jié)果經(jīng)過反標準化處理,最終得到服裝銷量預測結(jié)果值。
2.3? 實驗結(jié)果
圖1是LSTM模型預測結(jié)果與ARIMA模型測結(jié)果與原始數(shù)據(jù)的走勢對比圖,由圖1可知,兩條預測曲線可以較為精確的預測數(shù)據(jù)走勢,部分月份的數(shù)據(jù)擬合效果好,但整體的預測值都普遍偏大,形成的視覺效果較差,但認真分析圖中3條曲線的走勢情況,可以看到LSTM模型曲線的走勢較為平穩(wěn),整體的預測效果更好,預測的12個數(shù)據(jù)點位與實際值的偏差較小,證明整體的預測效果較好。ARIMA模型的曲線的起伏和效果較為接近原曲線,在2015年1月全年銷售最高點和2015年6月全年銷售最低點的擬合效果較差,造成整體的預測效果偏差,同時整體數(shù)值偏高,因此造成誤差大。LSTM模型對實際曲線的擬合效果更好,預測值也更為接近實際值。以上從預測結(jié)果趨勢圖的走勢和對重要節(jié)點的擬合精度角度證明了LSTM模型整體的預測效果優(yōu)于ARIMA模型。
隨后使用預測評估計算公式對得到的LSTM模型的預測結(jié)果值與ARIMA的預測結(jié)果值進行對應的計算,分別計算兩者的RMSE和MAPE值,匯合得到表1。由于RMSE和MAPE值的計算只與數(shù)據(jù)本身有關(guān),因此與絕對大小無關(guān),只與相對大小的關(guān)聯(lián)性更強,幾組數(shù)據(jù)比較得到的評估指標數(shù)據(jù)更大的預測值,表明預測效果相對較差,預測精度較低;評估指標數(shù)據(jù)更小的預測值,表明預測效果相對較好,預測精度較高。其中,LSTM模型的RMSE值為14.80,對比ARIMA模型降低31.23%;同時,LSTM模型的MAPE值為5.40,對比ARIMA模型降低30.68%。從預測評估角度證明了LSTM模型整體的預測效果均好于ARIMA模型,且有著較大提升。
由實驗結(jié)果可知,LSTM模型自身對數(shù)據(jù)的擬合效果好,數(shù)據(jù)誤差小,且預測速度較快。對比ARIMA模型,對原始數(shù)據(jù)的趨勢擬合效果更好,預測評估指標也更佳。從預測評估指標和走勢圖對比效果兩個方面均可表明LSTM神經(jīng)網(wǎng)絡在服裝銷量預測任務有更高的精度,能夠很好地滿足企業(yè)的實際需求,幫助服裝企業(yè)制定精度更高的生產(chǎn)計劃。
3? 結(jié)? 論
服裝企業(yè)想進一步優(yōu)化庫存與提高生產(chǎn)效率,以此提高經(jīng)營利潤,提升行業(yè)活力。更加精準的銷售預測可以為企業(yè)制定生產(chǎn)計劃提供有效參考,為提升服裝需求預測任務的精度,更好擬合發(fā)展趨勢,消除誤差因素的影響,提出了一種基于LSTM神經(jīng)網(wǎng)絡的預測方法,引入高效的神經(jīng)網(wǎng)絡進行預測。通過與傳統(tǒng)方法ARIMA算法的對比實驗可知,該方法對服裝生產(chǎn)企業(yè)進行有效預測服裝銷量,合理安排生產(chǎn)計劃具有積極作用。本文中LSTM模型相對于傳統(tǒng)方法取得了一定的優(yōu)勢和進步,有效提升了預測精度,但整體的預測效果仍不是非常理想,后續(xù)在引入深度學習算法進行服裝銷量預測的基礎(chǔ)上,嘗試新的更加符合服裝銷量預測任務的神經(jīng)網(wǎng)絡,進一步提升服裝預測任務精度。
參考文獻:
[1] G?IZA J,LUQUE R,MURILLO J,et al. Integrating pricing and coordinated inventory decisions between one warehouse and multiple retailers[J].Journal of Industrial and Production Engineering,2021,38(7):536-546.
[2]王英偉,馬樹才.基于ARIMA和LSTM混合模型的時間序列預測[J].計算機應用與軟件,2021,38(2):291-298.
[3]張家晨,左興權(quán),黃海,等.Prophet混合模型應用于基站網(wǎng)絡流量長期預測[J/OL].計算機工程與應用:1-11.(2021-07-06).http://kns.cnki.net/kcms/detail/11.2127.TP.20210706.0941.002.html.
[4]魏健,趙紅濤,劉敦楠,等.基于注意力機制的CNN-LSTM短期電力負荷預測方法[J].華北電力大學學報(自然科學版),2021,48(1):42-47.
[5]陳聰,候磊,李樂樂,等.基于GRU改進RNN神經(jīng)網(wǎng)絡的飛機燃油流量預測[J].科學技術(shù)與工程,2021,21(27):11663-11673.
[6]高海翔,胡瑜,余樂安.基于分解集成的LSTM神經(jīng)網(wǎng)絡模型的油價預測[J].計算機應用與軟件,2021,38(10):78-83.
[7]劉翀,杜軍平.一種基于深度LSTM和注意力機制的金融數(shù)據(jù)預測方法[J].計算機科學,2020,47(12):125-130.
[8]周哲韜,劉路,宋曉,等.基于Transformer模型的滾動軸承剩余使用壽命預測方法[J/OL].北京航空航天大學學報:1-17.(2021-07-12).https://doi.org/10.13700/j.bh.1001-5965.2021.0247.
[9] 趙紅蕊,薛雷.基于LSTM-CNN-CBAM模型的股票預測研究 [J].計算機工程與應用,2021,57(3):203-207.
作者簡介:陳德洪(1995—),男,漢族,湖南永州人,碩士研究生在讀,研究方向:數(shù)據(jù)分析、智能信息處理;李長云(1971-),男,漢族,湖南衡陽人,教授,博士,研究方向:軟件理論、物聯(lián)網(wǎng)工程、人工智能。