亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        電商企業(yè)商品銷量的預測方法

        2018-12-20 07:20:58王玉霞趙旭東
        統(tǒng)計與決策 2018年22期
        關鍵詞:影響模型

        李 杰,王玉霞,趙旭東

        (河北工業(yè)大學 經濟管理學院,天津 300401)

        0 引言

        目前,許多銷量預測研究是用歷史銷量來預測未來銷量,主要考慮銷量本身歷史數據的影響,較少考慮不同因素之間的相互影響。李俊等(2012)[1]將GM(1,1)模型、非線性三次指數平滑預測模型和二次回歸預測模型相結合組成了組合預測模型,依據某企業(yè)前10個月的銷量,預測后兩個月的銷量。Singh等(2014)[2]將人工神經網絡和模糊時間序列相結合,確定歷史時間序列的間隔期,將不同間隔期的時間序列分為不同組進行預測。Li等(2015)[3]建立了動態(tài)自適應的BP神經網絡學習算法來預測四川省消費產品的總銷售額,提高了預測的準確度。Chen等(2017)[4]基于徑向基函數神經網絡提出了一種進化算法,并利用該算法對電腦的銷量進行預測。盡管也有銷量預測研究考慮到了產品銷售的影響因素,但在進行銷量預測之前,并未對影響因素進行篩選,導致許多無關變量加入銷量預測模型,降低了模型的準確度。王大溪等(2015)[5]通過問卷調查方法,找到了可能影響孔塞銷售的主要影響因素,把所有可能的影響因素都帶入了基于混沌果蠅支持向量機回歸的產品銷量預測模型中,導致模型的預測精度較低。

        為此,本文提出一種基于Granger因果檢驗和XGBoost算法的電商企業(yè)商品銷量預測方法。首先對Granger因果檢驗和XGBoost算法的基本原理進行了介紹,而后給出了銷量預測算法的具體實現(xiàn)步驟,最后通過對2014年10月27日至2015年2月27日某電商企業(yè)一種生活用品的銷量及其影響因素歷史數據進行建模和預測,驗證了該方法的有效性。

        1 基于Granger因果檢驗與XGBoost算法的銷量預測模型

        1.1 Granger因果檢驗

        Granger因果檢驗是用于檢驗兩個變量之間因果關系的一種常用方法,該方法于1969年由Granger提出,70年代Hendry和Richard等加以發(fā)展。該方法的一個重要概念是Granger原因。存在兩個時間序列 Xt和Yt,若 Xt的滯后項在Yt的預測中有幫助,即利用Xt比不利用Xt可以更好的預測Yt,則稱 Xt是Yt的Granger原因。

        檢驗Xt是否為Yt的Granger原因,需構建不含滯后項X的受約束回歸模型和含有滯后項X的無約束回歸模型,分別如式(1)和式(2)所示:

        其中,Xt表示待檢驗的Granger原因(外生變量),Yt表示待檢驗的Granger結果(內生變量),αi和βi分別表示Yt和Xt各階滯后項的系數,α0表示常數項,εt表示殘差。

        對式(1)和式(2)進行估計,構建F統(tǒng)計量檢驗的聯(lián)合假設H0:

        如果在選定的顯著性水平α上計算的F值大于臨界Fα值,則拒絕零假設,即 Xt是Yt的Granger原因。

        從上述Granger因果關系檢驗方法分析中可以看出,Granger因果關系檢驗方法的前提假設是Xt和Yt都是平穩(wěn)(單整)序列,或者兩序列協(xié)整。因此,本文在進行Granger因果關系檢驗之前,先對各指標序列進行了ADF檢驗,驗證各序列的平穩(wěn)性。各序列通過平穩(wěn)性驗證之后,再進行Granger因果關系檢驗。

        1.2 XGBoost算法

        2015年Chen等提出了XGBoost算法,算法全名eX-treme Gradient Boosting,該算法是在Gradient Boosting Decision Tree(GBDT)基礎上發(fā)展起來的[6]。GBDT的算法流程與一般的Boosting算法類似,是一個迭代的過程,每一次迭代是為了減少上一次的殘差[7]。相比于GBDT算法只利用了一階導數的信息,XGBoost算法采用二階泰勒公式展開損失函數,求得模型最優(yōu)解的效率更高。

        1.2.1 XGBoost算法原理

        XGBoost算法是一種boosting算法,它的基分類器為CART決策樹,最后的預測結果為K棵決策樹的預測結果之和,反映在如式(4)所在的等式中。其中表示數據樣本,?(t)代表i樣本在模型t次迭代后的預測結果,ft(xi)代表i樣本在第t棵決策樹的預測值:

        利用二階泰勒展開式將式(5)中的損失函數展開得到式(6)。其中

        在第t次迭代后,得到一個不帶有常數項的簡單目標函數如式(7)所示:

        在第t棵決策樹中,存在一個映射函數Ij={i| q(xi)=j}能夠把一個樣本映射到某個葉子節(jié)點,所以目標函數可以從樣本求和轉化為葉子求和。通常正則化懲罰函數,T表示樹中包含T個葉子,γ和λ表示正則化懲罰函數的兩個系數。因此,可以將式(7)轉化為式(8)的形式,式中 ft(xi)=wj。

        在創(chuàng)建決策樹時,一棵樹的obj的值越小,該樹的結構越好。也就是說,一個葉子節(jié)點分裂后的信息增益Gain越大,該樹結構越好。Gain的計算如式(11)所示:

        1.2.2 XGBoost算法流程

        XGBoost算法流程如下:

        (1)對所有特征的特征值分別進行排序,依次掃描所有樣本,根據式(11)計算每個分裂點的信息增益。

        (2)選擇信息增益最大的分裂點進行分裂。

        (3)當達到預先設定樹的最大深度時停止分裂,轉到步驟(4);否則,轉到步驟(1)。

        (4)按照自底向上的順序進行剪枝,如果某個節(jié)點之后存在負的信息增益,則除去這個分裂。

        (5)當達到預先設定的迭代次數t時停止,否則,轉到步驟(1)。

        1.3 銷量預測算法的實現(xiàn)步驟

        在上述分析的基礎上,給出銷量預測算法的具體實現(xiàn)步驟:

        (1)商品銷量初始影響因素的選擇。通過調查和訪談發(fā)現(xiàn)電商企業(yè)產品銷量的可能影響因素包括:商品的瀏覽次數、流量、被加購次數、加購人次、收藏夾人次、拍下筆數、拍下金額、拍下件數、成交金額、成交筆數、成交件數、成交人次等24個影響因素。設n=24表示影響因素的個數,則初始影響因素集可表示為:

        (2)剔除與商品銷量無關的影響因素。對各影響因素和銷量序列分別做Granger因果關系檢驗,刪除無關影響因素,形成新的影響因素集:

        (3)數據的預處理。剔除與商品銷量無關的影響因素數據后,對數據進行預處理。在原始數據中,產品的銷量及各影響因素的數值均按天給出。對實驗數據分析中發(fā)現(xiàn),各影響因素距離預測時間越近對預測結果的準確性影響越大。本文以周為單位,采用滑窗采樣的方法,統(tǒng)計該窗口前1天、2天、3天、5天和7天各種影響因素數據的總值和均值,將得到的值作為新的特征加入到數據集。同時,考慮到產品銷量具有時序性的特點,統(tǒng)計該窗口前1天、2天、3天、5天和7天產品銷量的總值和均值以及該窗口前7天日銷量中的最大值、最小值和標準差也作為特征加入到數據集。

        (4)設置合適的XGBoost算法參數,訓練XGBoost模型。分析該模型對于測試集的擬合誤差,并和其他常用的算法模型相比較。

        2 電商企業(yè)商品銷量預測實例

        2.1 數據來源及說明

        選取某電商企業(yè)中生活用品2014年10月27日至2015年12月27日時間段內產品日銷量及24個可能影響因素的數據,如表1所示。由于篇幅所限,表1只展示了部分日期和影響因素的數據。需要特別說明的是,本文的銷量特指非聚劃算支付件數。

        表1 生活用品日銷量及可能影響因素數據

        2.2 Granger因果關系檢驗

        數據從2014年10月27日至2015年12月27日共包含427個樣本,從表1商品日銷量的走勢來看,“雙11”和“雙12”的銷量驟增,被認定為異常點,因此分別刪除2014年和2015年“雙11”和“雙12”的4個樣本點,剩余樣本總數為423個。

        本文使用EVIEWS6.0統(tǒng)計軟件,對24個可能影響因素和銷量的時間序列分別做ADF檢驗,以驗證各序列的平穩(wěn)性。在做ADF檢驗的過程中均采用修正的AIC準則判斷滯后期,所得結果如表2所示。

        通過上述ADF檢驗結果可知,在5%顯著性水平下,24個影響因素和銷量序列均通過了平穩(wěn)性檢驗,可以直接進行Granger因果關系檢驗。在進行Granger因果關系檢驗時,通過建立VAR模型找到最優(yōu)滯后階數。Granger因果關系檢驗結果如表3所示。

        從Granger因果關系檢驗結果可以看出,在5%的顯著性水平下,被加購次數、加購人次、收藏夾人次、淘寶客引導瀏覽次數、淘寶客引導瀏覽人次、直通車引導瀏覽次數、直通車引導瀏覽人次不是銷量的Granger原因,剩下的17個影響因素都是銷量的Granger原因。因此,在進行銷量預測時,剔除7個無關影響因素的數據。

        2.3 數據預處理

        在刪除了“雙11”“雙12”和7個無關影響因素的數據之后,以周為單位,利用滑窗采樣的方法對數據進行預處理。以周為單位滑窗采樣,是因為要預測的是該產品一周中的總銷量。統(tǒng)計該窗口前1天、2天、3天、5天和7天17種影響因素和產品銷量的總值和均值,同時統(tǒng)計該窗口前7天日銷量中的最大值、最小值和標準差,將這些統(tǒng)計數據作為銷量預測的特征變量。將該窗口在這一周的產品銷量總和作為標簽值。經過這樣的預處理后特征變量由最初的17個變?yōu)?83個,樣本數量由423變?yōu)?0個。在滑窗采樣過程中2015年12月21日至2015年12月27日產品銷量的滑動窗口為1,2015年12月14日至2015年12月20日產品銷量的滑動窗口為2,依此類推,2014年11月3日至2014年11月10日產品銷量的滑動窗口為60。因此,數據從2014年10月27日至2015年12月27日的423個日樣本數量變?yōu)榱?0個周樣本數量。表4給出了預處理后部分滑窗和特征變量的數據。

        表2 日銷量及24個可能影響因素時間序列ADF檢驗結果

        表3 Granger因果關系檢驗結果

        表4 預處理后部分滑窗和特征變量的數據

        表4中Watch指滑窗數,Label指標簽值,Pi指瀏覽次數,sn指銷量(非聚劃算支付件數)。Pi_avg_1指該窗口前1天瀏覽次數的均值,Pi_sum_1指該窗口前1天瀏覽次數的總值,Pi_avg_2指該窗口前2天瀏覽次數的均值,Std_sn指該窗口前7天日銷量的標準差。

        2.4 XGBoost算法擬合模型及模型精度檢驗

        本文選取2014年10月27日至2015年12月20日的數據作為訓練集,2015年12月21日至2015年12月27日的數據作為測試集,即預處理后滑窗2~60的數據作為訓練集,預處理后滑窗1的數據作為測試集。用訓練集來擬合XGBoost模型,對2015年12月21日至2015年12月27日產品周銷量進行預測,并將該模型的預測結果和常用GBDT、RF算法模型的預測結果進行比較,所得預測結果如表5所示。

        表5 各算法模型預測精度比較

        從表5的對比結果可以看出,無論是否進行Granger因果檢驗,XGBoost算法模型預測的相對誤差都小于GBDT和RF算法。當進行Granger因果檢驗剔除無關影響因素后,各算法的相對誤差都有所下降。在進行Granger因果檢驗,并用XGBoost算法模型擬合后,該預測的相對誤差最小為2.5%,充分說明了該銷量預測方法的有效性。

        3 結論

        本文對電商企業(yè)商品銷量預測問題進行了研究,在綜合分析了產品銷量時序特征和外部影響因素的基礎上,提出了基于Granger因果檢驗與XGBoost算法的電商企業(yè)商品銷量預測方法。該方法通過Granger因果分析剔除了無關的銷量影響因素,在數據預處理中充分考慮了影響因素距離預測時間越近對預測結果準確性影響越大的特點,并將產品銷量的時序特征也考慮在內。在數據預處理完成之后,用XGBoost模型進行擬合。該銷售預測方法的應用表明,所提方法能夠較好的解決電商企業(yè)商品銷量預測的問題。同時,也可以考慮將該種銷量預測方法推廣到實體企業(yè)商品銷量預測中去。

        猜你喜歡
        影響模型
        一半模型
        是什么影響了滑動摩擦力的大小
        哪些顧慮影響擔當?
        當代陜西(2021年2期)2021-03-29 07:41:24
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        沒錯,痛經有時也會影響懷孕
        媽媽寶寶(2017年3期)2017-02-21 01:22:28
        3D打印中的模型分割與打包
        擴鏈劑聯(lián)用對PETG擴鏈反應與流變性能的影響
        中國塑料(2016年3期)2016-06-15 20:30:00
        基于Simulink的跟蹤干擾對跳頻通信的影響
        FLUKA幾何模型到CAD幾何模型轉換方法初步研究
        久久中文字幕久久久久91| 性生交大全免费看| 双腿张开被9个黑人调教影片| 久久久久久岛国免费网站| av天堂中文亚洲官网| 欲香欲色天天天综合和网| 香港日本三级亚洲三级| 纯肉无遮挡H肉动漫在线观看国产 国产精品自产拍在线观看免费 | 日本一区二区不卡视频| 久久综合一本中文字幕| 中文字幕日韩有码国产| 人妻饥渴偷公乱中文字幕| 欧美精品偷自拍另类在线观看| 完整在线视频免费黄片| 人妻精品久久一区二区三区| 中文无码伦av中文字幕| 亚洲av无码资源在线观看| 天堂岛国精品在线观看一区二区| 中文字幕综合一区二区三区| 中国人妻与老外黑人| 国产成人精品日本亚洲18| 亚洲综合精品在线观看中文字幕 | 日本av不卡一区二区三区| 无码人妻一区二区三区在线| 国产第一页屁屁影院| 99久久精品国产片| 中文字幕亚洲在线第一页| 综合色区亚洲熟妇另类| 国产在线一91区免费国产91| 韩国美女主播国产三级| 亚洲天堂成人av影院| 精品无码一区在线观看| 亚洲免费一区二区三区视频| 射进去av一区二区三区| 女人高潮内射99精品| 推油少妇久久99久久99久久| 日本一区二区三区四区在线看| 男女射黄视频网站在线免费观看| 国产真人性做爰久久网站| 欧美色图50p| 国产老熟女伦老熟妇露脸 |