趙梓賀,徐慧智 (東北林業(yè)大學(xué) 交通學(xué)院,黑龍江 哈爾濱 150040)
在“互聯(lián)網(wǎng)+”的時(shí)代,電子商務(wù)已漸漸融入了人們的日常生活。隨著消費(fèi)者在網(wǎng)絡(luò)購物比例的提高,網(wǎng)絡(luò)銷售平臺(tái)的數(shù)量也越來越多。消費(fèi)者日益多樣化和個(gè)性化的需求,使企業(yè)間競爭更加激烈,電商進(jìn)入精細(xì)化運(yùn)營階段。為了及時(shí)地把握市場需求變化,合理地規(guī)劃有限的資源,基于網(wǎng)銷商品全平臺(tái)的銷量預(yù)測已成為研究的熱點(diǎn)。
國內(nèi)外學(xué)者對此開展了相關(guān)研究,王建偉[1]提出了利用產(chǎn)品銷售共性提取產(chǎn)品聚類簇的產(chǎn)品重分類預(yù)測模型,王雪蓉等[2]通過分析銷量的可控關(guān)聯(lián)性進(jìn)行大數(shù)據(jù)挖掘,進(jìn)行動(dòng)態(tài)預(yù)測,Juan R Trapero等[3]分析了促銷活動(dòng)中的銷量預(yù)測,劉治、謝天保和曹永立等[4-6]利用網(wǎng)絡(luò)爬蟲獲取評分、搜索數(shù)據(jù),對多種預(yù)測模型進(jìn)行比較分析,Jinlou Zhao等[7]提出了在線零售商之間的市場需求信息共享可以實(shí)現(xiàn)供應(yīng)鏈的增值,降低供應(yīng)商的庫存水平。Ching-Chin Chern、孟園等[8-9]從網(wǎng)絡(luò)口碑的角度促進(jìn)了銷售預(yù)測的研究,張鈉等[10]提出由于需求波動(dòng)較大,不同的訂貨周期應(yīng)采用不同的預(yù)測方法。Gro Kl?boe等[11]提出使用具有平衡狀態(tài)信息的模型進(jìn)行模擬預(yù)測。
綜上所述,商品銷量屬于商家內(nèi)部數(shù)據(jù),難以從網(wǎng)站上直接獲得,傳統(tǒng)的統(tǒng)計(jì)方法滯后于短時(shí)預(yù)測需求。區(qū)別于傳統(tǒng)銷售的銷量預(yù)測,網(wǎng)絡(luò)數(shù)據(jù)具有實(shí)時(shí)性。電商發(fā)售平臺(tái)逐漸增多,各平臺(tái)之間數(shù)據(jù)不能充分共享,根據(jù)各平臺(tái)的實(shí)時(shí)銷售數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘具有現(xiàn)實(shí)的應(yīng)用意義,能夠?qū)ι唐返娜脚_(tái)銷售量有總體把握。
本文統(tǒng)計(jì)了電商平臺(tái)產(chǎn)品評價(jià)數(shù)量,為解決評價(jià)與實(shí)際銷售量存在時(shí)間遲滯的現(xiàn)象,設(shè)計(jì)了用戶調(diào)查問卷,獲取用戶的評價(jià)延遲期,據(jù)此推算平臺(tái)銷售數(shù)據(jù)。采用時(shí)間序列分解法進(jìn)行短期預(yù)測,及時(shí)掌握商品的銷售動(dòng)態(tài)。
選取五款網(wǎng)絡(luò)熱銷手機(jī)商品,統(tǒng)計(jì)網(wǎng)絡(luò)銷售平臺(tái)每天的評價(jià)數(shù)量(實(shí)時(shí)獲取最近1 000條評價(jià),約為1周的銷售量數(shù)據(jù))。
為了增加數(shù)據(jù)樣本數(shù)量,對商品評價(jià)數(shù)量進(jìn)行了追蹤記錄,具體統(tǒng)計(jì)時(shí)段為2018年8月30日到11月1日。圖1為統(tǒng)計(jì)結(jié)果。
為統(tǒng)計(jì)顧客評價(jià)延遲期,設(shè)計(jì)了調(diào)查問卷。問卷采取網(wǎng)絡(luò)發(fā)放的形式,共獲得反饋問卷250份,經(jīng)過篩選,有效問卷218份,有效率為87.2%。調(diào)查問卷樣式見表1。
圖1 產(chǎn)品評價(jià)數(shù)量統(tǒng)計(jì)圖
為驗(yàn)證問卷調(diào)查獲取數(shù)據(jù)的可信度,對調(diào)查問卷進(jìn)行信度分析,相關(guān)系數(shù)計(jì)算見公式(1)。
其中,K為問題數(shù);為第i題得分方差;為總分的方差。
表2為信度系數(shù)的取值范圍。經(jīng)計(jì)算問卷信度系數(shù)0.71(信度系數(shù)在0.7<α≤0.9),認(rèn)為該問卷結(jié)果為“很可信”,測驗(yàn)結(jié)果穩(wěn)定可靠,詳見表3至表6。
表2 信度系數(shù)的取值范圍
表3 可靠性統(tǒng)計(jì)量
表4 摘要項(xiàng)統(tǒng)計(jì)量
表5 信度分析表
表6 項(xiàng)間相關(guān)性矩陣
根據(jù)調(diào)查問卷的問題7,獲得被調(diào)查者的評價(jià)延遲期,見表7。
表7 評價(jià)延遲期
根據(jù)調(diào)查問卷的結(jié)果對產(chǎn)品評價(jià)數(shù)量的數(shù)據(jù)進(jìn)行處理。默認(rèn)商品為次日達(dá),配送時(shí)間為一天。則每天的產(chǎn)品銷量等于經(jīng)過不同的評價(jià)延遲期后的評價(jià)數(shù)總和,見公式(2)。
其中,Vi為第i天的銷量,Mi為第i天的評價(jià)數(shù)。
根據(jù)公式(2) 得到商品8月29日到10月17日的銷售量(8月29日到10月10日用于構(gòu)建時(shí)間序列預(yù)測模型,10月11日至10月17日用于驗(yàn)證模型有效性)。圖2(a) 至圖2(e) 分別為P20 pro、nove3、nove3e、mate10、暢享8等5種商品評價(jià)數(shù)與銷量的對比圖。
圖2 產(chǎn)品銷售量統(tǒng)計(jì)結(jié)果
選用乘法模式的時(shí)間序列對圖2數(shù)據(jù)進(jìn)行分解,見公式(3)。
其中,Xt為商品銷量,Tt為長期趨勢因素,Ct為循環(huán)指數(shù),Zt為周期性指數(shù),It為隨機(jī)性因素。
采用移動(dòng)平均得到長期趨勢因素和循環(huán)變動(dòng)因素,見公式(4)。
采用標(biāo)準(zhǔn)差作為指標(biāo),確定合理移動(dòng)步長(比選N=3、N=4、N=5),分析結(jié)果見表8。
表8 移動(dòng)平均的標(biāo)準(zhǔn)差比
根據(jù)表5確定的合理步長獲取移動(dòng)平均數(shù)列,圖3(a) 至圖3(e) 為P20 pro、nove3、nove3e、mate10、暢享8等5種商品銷量與移動(dòng)平均值的對比。
圖3 商品銷量與移動(dòng)平均值的對比圖
將觀察值除以移動(dòng)平均得到數(shù)據(jù)的周期性和隨機(jī)性,見公式(5)。
圖4(a) 至圖4(e) 為P20 pro、nove3、nove3e、mate10、暢享8等5種商品周期性和隨機(jī)性。
圖4 周期性和隨機(jī)性
以1周為周期,通過累加平均消除隨機(jī)影響,得到周期性指數(shù),見公式(6)。
其中,ri為每周同一天的平均數(shù),為總平均數(shù)。
表9為計(jì)算得到的各產(chǎn)品周期指數(shù)。
表9 各產(chǎn)品的周期指數(shù)
利用趨勢外推法求出長期趨勢Tt,將循環(huán)變動(dòng)和長期趨勢分離開來,結(jié)果見圖5。
根據(jù)公式(7) 得到循環(huán)變動(dòng)因子Ct,P20 pro、nove3、nove3e、mate10、暢享8等5種商品的循環(huán)變動(dòng)因子變化圖如圖6(a) 至圖6(e) 所示。
圖5 長期趨勢圖
圖6 循環(huán)變動(dòng)因子
對第7周,即10月10日到10月17日1周的銷售量進(jìn)行預(yù)測。循環(huán)因子Ct變動(dòng)周期較長,隨機(jī)性It無法直接進(jìn)行預(yù)測,因此Ct與It忽略不計(jì),只考慮周期與趨勢Zt×Tt的影響,趨勢計(jì)算結(jié)果見表10。
表10 長期趨勢預(yù)測值
計(jì)算長期趨勢預(yù)測值與周期指數(shù)的乘積,得到最終的預(yù)測結(jié)果,計(jì)算結(jié)果見表11。
為了驗(yàn)證預(yù)測模型的可行性,將預(yù)測銷量與實(shí)際銷量進(jìn)行對比。見表12和圖7(a)至圖7(e)。
采用MAPE(平均絕對百分誤差) 來衡量預(yù)測是否可行,見公式(8) 至公式(9),MAPE評價(jià)參考表見表13,計(jì)算結(jié)果見表14。
表11 預(yù)測結(jié)果
表12 預(yù)測值與實(shí)際值的對比
圖7 預(yù)測值與實(shí)際銷量的對比圖
表13 MAPE評價(jià)參考表
表14 MAPE計(jì)算結(jié)果
其中,n為預(yù)測的項(xiàng)數(shù),Yi為第i項(xiàng)實(shí)際值,F(xiàn)i為第i項(xiàng)預(yù)測值。
結(jié)果表明5種商品的MAPE均小于10%認(rèn)為預(yù)測評價(jià)效果為“精確”,預(yù)測銷售量可以較好的擬合實(shí)際數(shù)據(jù)。
本文基于電商的網(wǎng)絡(luò)數(shù)據(jù)挖掘進(jìn)行商品銷售量的短期預(yù)測,提出了通過記錄商品評價(jià)數(shù)量得到商品銷售量數(shù)據(jù)的方法,設(shè)計(jì)調(diào)查問卷并進(jìn)行信度分析,提高了網(wǎng)絡(luò)數(shù)據(jù)的可信度?;谑占玫降木W(wǎng)絡(luò)數(shù)據(jù),運(yùn)用時(shí)間序列分解法分解出長期趨勢及周期性變動(dòng)因素,得到數(shù)據(jù)的分布規(guī)律,根據(jù)數(shù)據(jù)的發(fā)展趨勢預(yù)測下一個(gè)周期的銷量。
對預(yù)測結(jié)果進(jìn)行評價(jià),5種商品的MAPE(平均絕對百分誤差)均小于10%,短期預(yù)測值與實(shí)際銷量基本吻合,商品銷量的發(fā)展趨勢遵循長期趨勢與周期指數(shù)。本文中收集電商網(wǎng)絡(luò)數(shù)據(jù)以及用時(shí)間序列分解法進(jìn)行預(yù)測的方法適用于對電商網(wǎng)絡(luò)全平臺(tái)商品銷售數(shù)據(jù)的獲取及統(tǒng)計(jì)分析,且方便快捷,具有一定的可信度,可以及時(shí)掌握商品在網(wǎng)絡(luò)全平臺(tái)的銷售動(dòng)態(tài)。