周 楊,甘陸軍,金 龍
(1.圓通速遞有限公司,上海 201705;2.物流信息互通共享技術(shù)及應(yīng)用國(guó)家工程實(shí)驗(yàn)室,上海 201705)
隨著快遞行業(yè)的不斷變革以及中國(guó)電商行業(yè)的快速發(fā)展,人們對(duì)快遞需求量擴(kuò)大,快遞業(yè)務(wù)量持續(xù)增長(zhǎng),中國(guó)成為世界發(fā)展最快、最具活力的新興寄遞市場(chǎng)。2019年快遞服務(wù)企業(yè)業(yè)務(wù)量完成635.2億件,快遞業(yè)務(wù)收入完成7 497.8 億元,年人均快遞使用量為45.4件,年人均快遞支出535.5元。中國(guó)快遞業(yè)務(wù)量連續(xù)6年居全球第一,快遞業(yè)務(wù)量超越美、日、歐發(fā)達(dá)國(guó)家經(jīng)濟(jì)體總和。物流行業(yè)發(fā)展進(jìn)入量質(zhì)齊升階段,快遞業(yè)也從高速增長(zhǎng)階段轉(zhuǎn)向高質(zhì)量發(fā)展階段。隨著產(chǎn)業(yè)升級(jí)對(duì)物流快遞的服務(wù)提出了更高要求,在服務(wù)質(zhì)量上要求更富彈性、更加精準(zhǔn)、更多層次。
快遞行業(yè)業(yè)務(wù)總量是評(píng)價(jià)快遞業(yè)務(wù)的總體指標(biāo),快遞行業(yè)業(yè)務(wù)總量的預(yù)測(cè)對(duì)快遞行業(yè)的發(fā)展具有重大意義,而快遞業(yè)務(wù)規(guī)模預(yù)測(cè)中的日度業(yè)務(wù)量預(yù)測(cè)對(duì)快遞企業(yè)、政府、快遞產(chǎn)業(yè)鏈上下游企業(yè)的規(guī)劃和決策具有重大影響。對(duì)于快遞企業(yè)來(lái)說(shuō),快遞業(yè)務(wù)規(guī)模的預(yù)測(cè)對(duì)人員管理、車輛調(diào)配、路由規(guī)劃以及資金投入等方面產(chǎn)生重大影響,對(duì)其進(jìn)行科學(xué)合理的預(yù)測(cè)可以提高企業(yè)科學(xué)管理能力,合理分配資源,實(shí)現(xiàn)企業(yè)降本增效的目的,為企業(yè)的經(jīng)濟(jì)決策提供重要參考依據(jù)。精準(zhǔn)的預(yù)測(cè)可以為中央和地方政府編寫政策和規(guī)劃提供數(shù)據(jù)支撐和依據(jù),可以為快遞產(chǎn)業(yè)鏈上下游的電商、供應(yīng)鏈企業(yè)在生產(chǎn)經(jīng)營(yíng)決策、投資決策、風(fēng)險(xiǎn)評(píng)估等方面提供決策參考。
通過(guò)一些從研究時(shí)間、研究對(duì)象、研究方法三個(gè)方面分析快遞業(yè)務(wù)規(guī)模預(yù)測(cè)的文獻(xiàn)可以得出以下結(jié)論:國(guó)內(nèi)學(xué)術(shù)界對(duì)快遞業(yè)務(wù)規(guī)模的預(yù)測(cè)在時(shí)間維度上主要集中于年度業(yè)務(wù)規(guī)模預(yù)測(cè)和月度業(yè)務(wù)規(guī)模預(yù)測(cè),對(duì)于日度業(yè)務(wù)規(guī)模預(yù)測(cè)的研究不足;研究對(duì)象主要集中于快遞行業(yè)、區(qū)域快遞、高??爝f的業(yè)務(wù)規(guī)模預(yù)測(cè),對(duì)于快遞企業(yè)業(yè)務(wù)規(guī)模預(yù)測(cè)的研究不足;快遞業(yè)務(wù)規(guī)模預(yù)測(cè)常用的研究方法有組合預(yù)測(cè)、機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法、灰色預(yù)測(cè)以及時(shí)間序列預(yù)測(cè)等方法。
從時(shí)間維度上分析研究年度業(yè)務(wù)規(guī)模預(yù)測(cè)、月度業(yè)務(wù)規(guī)模預(yù)測(cè)兩方面。肖烯嵐、戴厚平[1]選取湖南省2010—2019 年的年度快遞業(yè)務(wù)量構(gòu)建灰色系統(tǒng)GM(1,1)預(yù)測(cè)模型,模型誤差維持在5%左右,運(yùn)用此模型進(jìn)行了為期三年的快遞業(yè)務(wù)量預(yù)測(cè)。李辰穎[2]運(yùn)用CEEMD-SVM 模型預(yù)測(cè)月度快遞業(yè)務(wù)量,首先用CEEMD 方法對(duì)歸一化后的快遞業(yè)務(wù)數(shù)據(jù)進(jìn)行分解;然后采用C-C 法對(duì)IMF 分量進(jìn)行相空間重構(gòu);再用相空間重構(gòu)后的數(shù)據(jù)訓(xùn)練SVM 模型;最后運(yùn)用訓(xùn)練后的SVM模型預(yù)測(cè)月度快遞業(yè)務(wù)量。
從研究對(duì)象維度上分析研究行業(yè)、行政區(qū)域、企業(yè)、高校等單位的快遞業(yè)務(wù)規(guī)模預(yù)測(cè)方面。朱志鋒、肖詩(shī)雨[3]通過(guò)Eviews8.0軟件采用時(shí)間序列分析方法,建立ARIMA 模型進(jìn)行參數(shù)估計(jì)及檢驗(yàn),對(duì)比Holt-Winters季節(jié)乘法模型預(yù)測(cè)結(jié)果和實(shí)際值進(jìn)行誤差分析,選擇ARIMA 季節(jié)乘積模型對(duì)未來(lái)我國(guó)快遞業(yè)務(wù)量進(jìn)行預(yù)測(cè)。伍平[4]分析北京區(qū)域快遞需求特征的基礎(chǔ)上,使用灰色系統(tǒng)GM模型、BP神經(jīng)網(wǎng)絡(luò)模型和多元回歸分析模型從不同角度對(duì)快遞需求進(jìn)行短期預(yù)測(cè),并綜合各模型優(yōu)勢(shì)最終建立權(quán)重組合預(yù)測(cè)模型。李貞貞[5]選取河南省月度快遞業(yè)務(wù)量,考慮到月度快遞業(yè)務(wù)量的趨勢(shì)性、季節(jié)效應(yīng),建立ARIMA簡(jiǎn)單季節(jié)模型對(duì)河南省快遞業(yè)務(wù)量進(jìn)行預(yù)測(cè)。
本文研究某快遞企業(yè)分部的日度業(yè)務(wù)規(guī)模預(yù)測(cè),通過(guò)R 語(yǔ)言軟件運(yùn)用時(shí)間序列分析方法建立SARIMA乘積模型,并建立為期三天的滑動(dòng)預(yù)測(cè)模型預(yù)測(cè)日度業(yè)務(wù)規(guī)模。建立SARIMA 模型時(shí)首先對(duì)數(shù)據(jù)進(jìn)行季節(jié)分解和檢驗(yàn)時(shí)間序列數(shù)據(jù)的平穩(wěn)性,若序列非平穩(wěn)則需差分處理使其平穩(wěn)化,其次觀察序列的自相關(guān)與偏自相關(guān)圖估計(jì)模型參數(shù),然后對(duì)模型擬合初步確定模型,再對(duì)模型殘差序列進(jìn)行白噪聲檢驗(yàn),通過(guò)白噪聲檢驗(yàn)確定模型,對(duì)模型進(jìn)行殘差分析研究從而優(yōu)化模型,最后根據(jù)模型預(yù)測(cè)值對(duì)模型進(jìn)行評(píng)估。其流程圖如圖1所示。
圖1 建立SARIMA模型的流程圖
在時(shí)間序列分析中,某些時(shí)間序列存在明顯的周期性變化,如季度、月度、周度或是其他一些固有因素引起的變化,這類序列稱為季節(jié)性序列。對(duì)季節(jié)性時(shí)間序列分析和建模通常采用SARIMA模型,即季節(jié)性差分自回歸滑動(dòng)平均模型,模型的一般表達(dá)式為:
該模型簡(jiǎn)記為SARIMA(p,d,q)(P,D,Q)S,參數(shù)p,q,P,Q分別表示非季節(jié)與季節(jié)AR、MA算子的最大滯后階數(shù),d,D 分別表示非季節(jié)與季節(jié)性差分次數(shù),εt為擾動(dòng)項(xiàng),S為序列周期。
本文獲取了某快遞企業(yè)分公司2016 年1 月1 日至2019 年2 月28 日的日度快遞業(yè)務(wù)量數(shù)據(jù),由于數(shù)據(jù)的保密性,本文將在原有數(shù)據(jù)的基礎(chǔ)上乘以基數(shù)k,得到本文研究樣本數(shù)據(jù),如圖2所示。為檢驗(yàn)?zāi)P偷男阅?,本文將樣本?shù)據(jù)分為訓(xùn)練樣本和測(cè)試樣本,訓(xùn)練樣本為2016年1月1日至2018年2月28日的日度業(yè)務(wù)量數(shù)據(jù),測(cè)試樣本為2018 年3 月1 日至2019年至2月28日的日度業(yè)務(wù)量數(shù)據(jù)。
圖2 原始序列時(shí)序圖
3.1.1 平穩(wěn)性檢驗(yàn)。時(shí)間序列的初步檢驗(yàn)是平穩(wěn)性檢驗(yàn),若時(shí)間序列是非平穩(wěn)的需將序列平穩(wěn)化處理。平穩(wěn)性檢驗(yàn)有兩種方法,一是通過(guò)觀察原始時(shí)間序列時(shí)序圖和自相關(guān)圖等圖檢驗(yàn),二是單位根檢驗(yàn)法。本文運(yùn)用單位根檢驗(yàn)法(如圖3所示)得出DF值為-3.602,是平穩(wěn)序列。對(duì)樣本進(jìn)行正態(tài)分布檢驗(yàn)和t檢驗(yàn),樣本通過(guò)t檢驗(yàn)但未通過(guò)正態(tài)分布檢驗(yàn),說(shuō)明原始序列具有白噪聲,為消除白噪聲影響,對(duì)原始序列進(jìn)行一階差分,然后進(jìn)行白噪聲檢驗(yàn),得到p 值為0.279 1,大于0.05,未通過(guò)檢驗(yàn),繼續(xù)進(jìn)行二階差分,白噪聲檢驗(yàn)的p 值約為0,小于0.05,通過(guò)白噪聲檢驗(yàn)。從圖4 也可以看出二階差分序列的噪聲比一階差分序列明顯減少。
圖3 原始序列的單位根檢驗(yàn)及樣本均數(shù)分布檢驗(yàn)(左)與白噪聲檢驗(yàn)圖(右)
圖4 原始序列(上)、一階差分序列(中)、二階差分序列(下)白噪聲檢驗(yàn)圖
3.1.2 季節(jié)性分解。從圖5的偏相關(guān)圖發(fā)現(xiàn)原始序列存在周期性的季節(jié)波動(dòng),當(dāng)滯后階數(shù)為8,15,22時(shí),偏自相關(guān)系數(shù)顯著不為0,所以判定季節(jié)性周期S=7,對(duì)原始時(shí)間序列數(shù)據(jù)進(jìn)行季節(jié)分解,分解為趨勢(shì)項(xiàng)、季節(jié)項(xiàng)、隨機(jī)擾動(dòng)項(xiàng),如圖6所示。從圖6可以看出趨勢(shì)項(xiàng)波動(dòng)最大,其次是季節(jié)項(xiàng)波動(dòng)較大。季節(jié)性波動(dòng)可以通過(guò)季節(jié)差分來(lái)消除季節(jié)影響,對(duì)季節(jié)序列進(jìn)行單位根檢驗(yàn)(如圖7所示),DF值為-3.341 1,小于3,即季節(jié)序列是平穩(wěn)的,但正態(tài)分布p值為0.21,大于0.05,即季節(jié)序列具有噪聲影響;所以將季節(jié)序列進(jìn)行一階差分處理,對(duì)一階差分的季節(jié)序列進(jìn)行白噪聲檢驗(yàn),p值為0.192 4,大于0.05,即一階差分季節(jié)序列仍具有噪聲影響;再對(duì)其進(jìn)行二階差分處理并對(duì)二階差分季節(jié)序列進(jìn)行白噪聲檢驗(yàn),p值約為0,小于0.05,即二階差分季節(jié)序列不存在白噪聲影響。
圖5 原始序列偏自相關(guān)圖
圖6 季節(jié)分解圖
圖7 季節(jié)序列單位根檢驗(yàn)(左)和季節(jié)差分序列白噪聲檢驗(yàn)(右)
由3.1.1中可知非季節(jié)二階差分序列是平穩(wěn)序列,所以對(duì)二階差分后的時(shí)間序列數(shù)據(jù)進(jìn)行自相關(guān)和偏相關(guān)分析,從圖8中ACF圖得出滑動(dòng)平均模型參數(shù)q估計(jì)為1、2,從PACF圖得出自回歸模型參數(shù)p估計(jì)為13,d=2;從圖9中的季節(jié)二階差分的ACF圖得出季節(jié)滑動(dòng)平均模型參數(shù)Q估計(jì)為1、2,從PACF圖中可知季節(jié)自回歸模型參數(shù)P 估計(jì)為6,D=2。經(jīng)過(guò)測(cè)試得出SARIMA(13,2,2)x(6,2,2)7是最佳模型(如圖10所示)。
圖8 二階差分序列的自相關(guān)圖(上)和偏相關(guān)圖(下)
圖9 季節(jié)二階差分序列自相關(guān)圖(上)和偏相關(guān)圖(下)
圖10 模型參數(shù)估計(jì)
模型檢驗(yàn)包括模型顯著性檢驗(yàn)和參數(shù)顯著性檢驗(yàn)。模型顯著性檢驗(yàn)是檢驗(yàn)?zāi)P蜌埐铐?xiàng)是否為白噪聲序列,從圖11 殘差自相關(guān)圖可知t=0 時(shí),acf=1,t 不為0 時(shí),acf 都趨近于0,且殘差白噪聲檢驗(yàn)的p 值顯著大于0.05,接受原假設(shè)該擬合模型的殘差序列是白噪聲序列。從圖11 可知模型參數(shù)通過(guò)參數(shù)顯著性檢驗(yàn)。
圖11 模型殘差白噪聲檢驗(yàn)圖
為提高模型的性能,本文分析研究SARIMA(13,2,2)(6,2,2)7模型中的殘差項(xiàng),對(duì)其進(jìn)行優(yōu)化,從圖12觀察得出模型殘差數(shù)據(jù)y與SARIMA模型擬合值x之間存在相關(guān)關(guān)系。由于SARIMA 模型擬合值數(shù)據(jù)較大,不便與殘差數(shù)據(jù)y 進(jìn)行分析研究,因此對(duì)數(shù)化處理SARIMA模型擬合值,然后畫出散點(diǎn)圖(如圖13所示),從散點(diǎn)圖中觀察到大多數(shù)點(diǎn)都聚集在一起,說(shuō)明兩者之間存在線性關(guān)系。對(duì)兩者進(jìn)行線性擬合,建立線性回歸方程,擬合結(jié)果如圖14所示,常數(shù)項(xiàng)系數(shù)為-1 222 843,一次項(xiàng)系數(shù)為90 179,系數(shù)對(duì)應(yīng)的p值都小于0.05,通過(guò)顯著性檢驗(yàn)。最終預(yù)測(cè)模型為:SARIMA(13,2,2)x(6,2,2)7+(90 179*log(x)-1 222 843)。
圖12 模型殘差與模型擬合值的分析圖
圖13 模型殘差與對(duì)數(shù)化處理擬合值的關(guān)系圖
圖14 線性擬合結(jié)果圖
時(shí)間序列模型適用于短期預(yù)測(cè),隨著預(yù)測(cè)時(shí)間推遲,模型預(yù)測(cè)精確度下降,因此本文基于SARIMA(13,2,2)x(6,2,2)7+(90 179*log(x)-1 222 843)模型建立滑動(dòng)窗口,滑動(dòng)預(yù)測(cè)未來(lái)的業(yè)務(wù)量數(shù)據(jù)。滑動(dòng)窗口模型是基于前n 天的樣本數(shù)據(jù)預(yù)測(cè)未來(lái)第n+1,n+2,n+3天的業(yè)務(wù)量數(shù)據(jù),當(dāng)統(tǒng)計(jì)出第n+1天的實(shí)際業(yè)務(wù)量數(shù)據(jù)時(shí),滑動(dòng)窗口模型又基于前n+1天的樣本數(shù)據(jù)預(yù)測(cè)未來(lái)第n+2,n+3,n+4天的業(yè)務(wù)量數(shù)據(jù),以此類推,得到滑動(dòng)窗口模型預(yù)測(cè)第一天的數(shù)據(jù)結(jié)果,如圖15所示。根據(jù)預(yù)測(cè)業(yè)務(wù)量數(shù)據(jù)與實(shí)際業(yè)務(wù)量數(shù)據(jù)比較分析,對(duì)模型進(jìn)行評(píng)估。本文采用平均絕對(duì)百分比誤差方法評(píng)估模型,計(jì)算方式如下:
根據(jù)上式計(jì)算出平均絕對(duì)百分比誤差為9.2%,但由于特殊節(jié)假日(如“618、雙十一、雙十二、中秋節(jié)、春節(jié)”等節(jié)日)時(shí)期電商平臺(tái)的大促活動(dòng)影響,特殊節(jié)假日的業(yè)務(wù)量預(yù)測(cè)誤差較大,若不包含特殊節(jié)假日的預(yù)測(cè)誤差,得出平均絕對(duì)百分比誤差為7.0%,結(jié)果表明,該模型的預(yù)測(cè)效果較好。
圖15 實(shí)際業(yè)務(wù)量和預(yù)測(cè)業(yè)務(wù)量對(duì)比分析圖
本文通過(guò)分析發(fā)現(xiàn),日度快遞業(yè)務(wù)量數(shù)據(jù)既有增長(zhǎng)趨勢(shì)又有季節(jié)周期性的特點(diǎn),運(yùn)用時(shí)間序列分析方法建立SARIMA乘積模型,為提高模型精度對(duì)模型殘差進(jìn)行優(yōu)化,又因SARIMA模型預(yù)測(cè)精確度隨時(shí)間增長(zhǎng)而降低,所以建立為期三天的滑動(dòng)窗口模型預(yù)測(cè)日度業(yè)務(wù)量數(shù)據(jù)。從預(yù)測(cè)結(jié)果分析,模型預(yù)測(cè)業(yè)務(wù)量數(shù)據(jù)與實(shí)際業(yè)務(wù)量數(shù)據(jù)的平均誤差為9.2%,若除去特殊節(jié)假日的預(yù)測(cè)誤差,模型的平均誤差為7.0%,預(yù)測(cè)誤差在可接受范圍內(nèi),所得結(jié)果對(duì)快遞企業(yè)具有一定的參考意義。
本文研究的不足包含以下三點(diǎn):第一,本文建立的時(shí)間序列模型雖然考慮了增長(zhǎng)趨勢(shì)影響和季節(jié)周期性影響,但未考慮特殊節(jié)假日時(shí)期電商平臺(tái)的大促活動(dòng)影響,若將此因素影響納入模型,模型性能將提高,預(yù)測(cè)精度也將提高。第二,本文運(yùn)用時(shí)間序列方法建立SARIMA模型,模型的預(yù)測(cè)精度隨預(yù)測(cè)時(shí)間推遲而降低,只適用于短期預(yù)測(cè)不適用于長(zhǎng)期預(yù)測(cè)。第三,本文對(duì)快遞業(yè)務(wù)量的預(yù)測(cè)僅采用了時(shí)間序列分析中的SARIMA模型,若同時(shí)采用多種研究方法建立多個(gè)模型進(jìn)行預(yù)測(cè),選取一個(gè)最優(yōu)模型,模型擬合效果更好,預(yù)測(cè)精度更高。