亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于matplotlib的K-means-ARIMA模型對(duì)零售商品在傳統(tǒng)節(jié)假日的銷量預(yù)測(cè)

        2022-08-31 19:18:39田歌吳曠田紅蕊
        電腦知識(shí)與技術(shù) 2022年18期

        田歌 吳曠 田紅蕊

        摘要:現(xiàn)多數(shù)的商品銷量預(yù)測(cè)是以單個(gè)商品預(yù)測(cè)為主,而針對(duì)多類商品的銷量預(yù)測(cè)如綜合型商超或社區(qū)便利店來(lái)說(shuō)存在一定的需求;同時(shí)對(duì)于縣域或鄉(xiāng)鎮(zhèn)級(jí)商超,在傳統(tǒng)節(jié)假日如春節(jié)期間出現(xiàn)大量返鄉(xiāng)人員,由于人員數(shù)量激增,且春節(jié)具有走親訪友,互饋禮品的傳統(tǒng)習(xí)俗,因此對(duì)各類商品的消費(fèi)需求會(huì)在短時(shí)間內(nèi)劇增,故對(duì)春節(jié)期間商品種類及銷貨數(shù)量的預(yù)測(cè)是商家及廠家備貨的重要參考數(shù)據(jù)。本文基于以上兩種現(xiàn)實(shí)需求對(duì)商品的種類和銷量進(jìn)行預(yù)測(cè):由于不同類別商品銷售量的波動(dòng)會(huì)千差萬(wàn)別,如果使用所有的數(shù)據(jù)進(jìn)行訓(xùn)練會(huì)對(duì)引入很多不必要的噪聲,導(dǎo)致誤差的增大,因此設(shè)計(jì)使用k-means聚類方法及ARIMA模型對(duì)多種商品在傳統(tǒng)節(jié)假日期間的銷量進(jìn)行預(yù)測(cè),在真實(shí)的某一典型縣級(jí)商超銷量數(shù)據(jù)庫(kù)上進(jìn)行評(píng)估驗(yàn)證,最后將其與基準(zhǔn)的模型進(jìn)行數(shù)據(jù)對(duì)比,以驗(yàn)證本方法對(duì)精度提升的度量。

        關(guān)鍵詞 :多類商品;傳統(tǒng)節(jié)日;銷量預(yù)測(cè);K-means聚類;ARIMA模型

        中圖分類號(hào):TP311? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

        文章編號(hào):1009-3044(2022)18-0059-02

        開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

        1引言

        信息化的浪潮為商業(yè)帶來(lái)了巨大的發(fā)展機(jī)遇,依據(jù)數(shù)據(jù)來(lái)驅(qū)動(dòng)管理,指導(dǎo)決策極具商業(yè)價(jià)值,依靠智能運(yùn)算對(duì)零售產(chǎn)品的銷量預(yù)測(cè)估值已成為商家提高其競(jìng)爭(zhēng)力的重要方式。根據(jù)對(duì)以往客戶消費(fèi)商品類別、數(shù)量、時(shí)間節(jié)點(diǎn)等大量信息,從中高效及時(shí)地預(yù)測(cè)客戶需求,便于及時(shí)進(jìn)行貨品準(zhǔn)備、推送廣告及價(jià)格調(diào)整等后續(xù)準(zhǔn)備動(dòng)作的部署,為客戶提升滿意度,為商家創(chuàng)造更大的商業(yè)利潤(rùn),同時(shí)也為避免商家因預(yù)測(cè)不準(zhǔn)確導(dǎo)致的商業(yè)損失,幫助企業(yè)長(zhǎng)期保持競(jìng)爭(zhēng)優(yōu)勢(shì)。因此針對(duì)銷售量的預(yù)測(cè)具有一定的商業(yè)和學(xué)術(shù)價(jià)值。

        很多學(xué)者專注于該方向的研究突破以期得到更為準(zhǔn)確或代價(jià)更低的計(jì)算方法。銷量的預(yù)測(cè)大多數(shù)以時(shí)間序列進(jìn)行,且以高聚合預(yù)測(cè)值為最終目標(biāo),對(duì)于低聚合的相關(guān)探究涉及不多,低聚合因素所產(chǎn)生的影響維度較多,天氣、廣告效果、促銷等因素也是重要影響因素,如沒(méi)有針對(duì)性去噪操作,會(huì)使損失一定的數(shù)據(jù)精度。常見(jiàn)的基于銷售量的預(yù)測(cè)方法如ARIMA[1]和指數(shù)平滑法[2]等基于時(shí)間序列的預(yù)測(cè)已經(jīng)得到大范圍的使用。然單使用傳統(tǒng)預(yù)測(cè)方法僅僅只能使用內(nèi)部的變量進(jìn)行預(yù)測(cè),且一些非線性因素如上文提到的促銷、廣告等未能完全融合其綜合影響,部分文獻(xiàn)提出將線性因素使用ARIMA預(yù)測(cè),非線性因素使用反向傳播模型進(jìn)行預(yù)測(cè),結(jié)合二者優(yōu)點(diǎn),生成預(yù)測(cè)結(jié)果[3]。隨著機(jī)器學(xué)習(xí)在各個(gè)領(lǐng)域的廣泛應(yīng)用,相繼出現(xiàn)了多種結(jié)合機(jī)器學(xué)習(xí)的方法將時(shí)序預(yù)測(cè)模型轉(zhuǎn)換為數(shù)據(jù)驅(qū)動(dòng)及監(jiān)督學(xué)習(xí)的方式,如將ARIMA與BP神經(jīng)網(wǎng)絡(luò)結(jié)合[4],支持向量機(jī)與ARIMA結(jié)合[5],ARIMA和XGBoost組合[6]卷積網(wǎng)絡(luò)CNN與ARIMA結(jié)合,極限學(xué)習(xí)模型ELM與ARIMA結(jié)合等方式均能在不同層次不同行業(yè)領(lǐng)域內(nèi)得出較理想的預(yù)測(cè)結(jié)果。除此之外也有不少的學(xué)者認(rèn)為引入聚類模型可以大大的提升預(yù)測(cè)的精度效果,Venkatesh等使用聚類的方式預(yù)測(cè)ATM機(jī)的現(xiàn)金流量,根據(jù)其周季節(jié)特征進(jìn)行聚類,在每一類上做神經(jīng)網(wǎng)絡(luò)訓(xùn)練,其實(shí)驗(yàn)驗(yàn)證了基于聚類的預(yù)測(cè)效果明顯優(yōu)于未實(shí)行聚類的效果[7]。目前大多數(shù)的預(yù)測(cè)都是基于單個(gè)商品,對(duì)于多類商品的銷量預(yù)測(cè)相對(duì)不夠廣泛。本文以聚類模型將數(shù)據(jù)池中的數(shù)據(jù)分成一定的商品簇,通過(guò)ARIMA模型對(duì)每一商品簇進(jìn)行銷量預(yù)測(cè),以此構(gòu)建的多種類商品銷量預(yù)測(cè)模型,將此模型與一般的ARIMA模型在同一數(shù)據(jù)池上進(jìn)行測(cè)試,數(shù)據(jù)表明該模型具有較理想的預(yù)測(cè)效果。

        2 K-means聚類算法

        K-means即k均值算法的原理簡(jiǎn)單易且高效,因此在很多領(lǐng)域得到了廣泛的應(yīng)用[8],其主要思想是從數(shù)據(jù)樣本中隨機(jī)地選擇k個(gè)初始點(diǎn)作為聚類的中心,[a=a1,a2,...ak];計(jì)算每個(gè)樣本點(diǎn)[xi]到每個(gè)聚類中心[ai]的歐式距離,并將其分類到聚其最近的[ai]對(duì)應(yīng)的類中,對(duì)每個(gè)類別[ai],再次計(jì)算其聚類中心公式為:

        [ai=1Cx∈cix]? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)

        重復(fù)迭代以上步驟,直至聚心不再變動(dòng)為止。我們以此為出發(fā)點(diǎn),假設(shè)在商品銷售歷史數(shù)據(jù)中取時(shí)間點(diǎn)[Ti]為界,該界限前的銷售量為樣本訓(xùn)練數(shù)據(jù),其余為測(cè)試數(shù)據(jù)

        [d(s,Mj)=i=1T1(sj-Mij)](計(jì)算歐式距離)(2)

        3 ARIMA模型

        自回歸移動(dòng)平均模型(ARIMA也稱Box-Jenkins模型)在1970年被BOX首次提出,該模型在基于對(duì)時(shí)間序列的數(shù)據(jù)分析中被廣泛應(yīng)用,主要研究某一種現(xiàn)象根據(jù)時(shí)間的不同所呈現(xiàn)的變化情況,因此不僅可以展示過(guò)去與現(xiàn)在的變化情況,也可以根據(jù)之前的數(shù)據(jù)分析、建模并預(yù)測(cè)出未來(lái)的變化趨勢(shì)。

        該模型將自回歸、差分與移動(dòng)平均線三種方法相結(jié)合,按以下步驟進(jìn)行建模:

        1)數(shù)據(jù)的平穩(wěn)性檢驗(yàn)與處理。平穩(wěn)序列為某時(shí)間序列為一固定數(shù)值或在固定數(shù)值范圍內(nèi)波動(dòng),且延遲m期變量的自協(xié)方差與其自相關(guān)的系數(shù)ACF是基本相等的。平穩(wěn)性即要求由樣本的時(shí)間序列所生成的未來(lái)的擬合曲線依然可以按照現(xiàn)在的“慣性”往下延續(xù),其均值與方差變動(dòng)不明顯。其檢驗(yàn)方法大致分為主觀圖形檢驗(yàn)、單位級(jí)根檢驗(yàn)等。數(shù)據(jù)平穩(wěn)性的處理一般使用d階差分運(yùn)算:將兩個(gè)相鄰時(shí)間段的序列值相減即為差分運(yùn)算(一階差分),將所得數(shù)值再次相減即為二階差分,重復(fù)d次即為d階差分。

        2 )p和q定階、參數(shù)估計(jì)。即根據(jù)ACF(自相關(guān)系數(shù))和PACF(非自相關(guān)系數(shù))趨向于0的方法進(jìn)行定階,一般選擇部分時(shí)間序列進(jìn)行計(jì)算,根據(jù)網(wǎng)格法遍歷所有參數(shù),然后用python對(duì)時(shí)間序列進(jìn)行擬合,若預(yù)測(cè)序列圖與實(shí)際序列圖大致吻合,則對(duì)當(dāng)前模型進(jìn)行肯定。

        3)殘差檢驗(yàn)(白噪聲)。白噪聲檢驗(yàn)即檢查一個(gè)序列中是否存在一定的關(guān)系,若沒(méi)有任何關(guān)系,則稱該序列為純隨機(jī)序列。檢驗(yàn)方法為檢查ACF是否趨近于0。

        4)估算并預(yù)測(cè)。根據(jù)p、q、d等模型參數(shù)進(jìn)行對(duì)未來(lái)時(shí)間序列的預(yù)測(cè)。

        本文在jupyter平臺(tái)完成代碼的實(shí)現(xiàn)及數(shù)據(jù)處理與圖形制作。

        4使用jupyter平臺(tái)使用matplotlib基于K-means和ARIMA模型進(jìn)行預(yù)測(cè)

        4.1數(shù)據(jù)來(lái)源

        收集了一縣域級(jí)小型商超在2017~2021年春節(jié)期間的商品銷量記錄。

        4.2使用k-means進(jìn)行聚類

        聚類后將商品分為里三個(gè)商品簇:可概括為日用品、煙酒類及副食品等產(chǎn)品簇。

        4.3對(duì)每個(gè)商品簇進(jìn)行銷量預(yù)測(cè)

        4.3.1平穩(wěn)性檢驗(yàn)

        本文使用ADF檢驗(yàn),該方法是判斷一個(gè)序列中是否存在有單位根,如何一個(gè)序列是平穩(wěn)序列,則沒(méi)有單位根,在python中可通過(guò)模塊statsmotels進(jìn)行檢驗(yàn)實(shí)現(xiàn)。導(dǎo)入數(shù)據(jù)后進(jìn)行原始序列的ADF檢驗(yàn),結(jié)果為: (adf檢驗(yàn)的結(jié)果:-3.0303619167579696, 統(tǒng)計(jì)量的P值:0.03215462767083654, 計(jì)算過(guò)程中用到的延遲階數(shù):5, 用于ADF回歸和計(jì)算的觀測(cè)值的個(gè)數(shù):

        31,{'1%': -3.661428725118324,'5%': -2.960525341210433,'10%': -2.6193188033298647}, 426.8275356961312)是配合adf檢驗(yàn)的結(jié)果一起看的,是在0.99,0.95,0.90置信區(qū)間下的臨界ADF檢驗(yàn)值。

        一階差分序列的白噪聲檢驗(yàn)結(jié)果為: (array([8.41941052]), array([0.00371236]))。

        4.3.2 定階

        分別使用AIC和BIC方法得到最優(yōu)的p值和q值均是0和1。

        4.3.3 建模與預(yù)測(cè)

        5預(yù)測(cè)結(jié)果分析

        表1為使用K-means模型聚簇后的arima預(yù)測(cè)與不使用K-means方法的預(yù)測(cè)結(jié)果對(duì)比,使用該方式在商品銷量預(yù)測(cè)中具?有較高的準(zhǔn)確率。本文所設(shè)計(jì)的預(yù)測(cè)方法不僅對(duì)商超零售具有一定的指導(dǎo)意義,對(duì)相似的基于時(shí)間序列的、銷量預(yù)測(cè)也具有一定的參考價(jià)值,但由于K-means具有需要手動(dòng)設(shè)置聚類的數(shù)值,因此或可嘗試將更多的機(jī)器學(xué)習(xí)的方法融入其中,以期達(dá)到更優(yōu)的效果。

        參考文獻(xiàn):

        [1] 姜曉紅,曹慧敏.基于ARIMA模型的電商銷售預(yù)測(cè)及R語(yǔ)言實(shí)現(xiàn)[J].物流科技,2019,42(4):52-56,69.

        [2] 張蔚虹,劉立.指數(shù)平滑法在銷售預(yù)算中的應(yīng)用[J].中國(guó)管理信息化,2008,11(2):84-86.

        [3] 閆博,李國(guó)和,林仁杰.混合銷售預(yù)測(cè)模型[J].計(jì)算機(jī)工程與設(shè)計(jì),2015,36(3):814-818.

        [4] 朱家明,胡玲燕.基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)對(duì)人民幣匯率預(yù)測(cè)的比較分析——以美元人民幣匯率為例[J].重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)),2019,33(5):207-212.

        [5] 劉家學(xué),白明皓,郝磊.基于ARIMA-SVR組合方法的航班滑出時(shí)間預(yù)測(cè)[J].中國(guó)科技論文,2021,16(6):661-667.

        [6] 謝學(xué)斌,孔令燕.基于ARIMA和XGBoost組合模型的交通事故預(yù)測(cè)[J].安全與環(huán)境學(xué)報(bào),2021,21(1):277-284.

        [7] Venkatesh K,Ravi V,Prinzie A,et al.Cash demand forecasting in ATMs by clustering and neural networks[J].European Journal of Operational Research,2014,232(2):383-392.[8] 李秉晨,于惠鈞,劉靖宇.基于Kmeans和CEEMD-PE-LSTM的短期光伏發(fā)電功率預(yù)測(cè)[J].水電能源科學(xué),2021,39(4):204-208.

        【通聯(lián)編輯:聞翔軍】

        女女同恋一区二区在线观看| 国内视频偷拍一区,二区,三区| 精品国产又大又黄又粗av | 又爽又黄又无遮挡的视频| 日本无遮挡真人祼交视频| 日韩视频中文字幕精品偷拍| 免费一级毛片在线播放不收费| 国产极品喷水视频| 午夜视频一区二区三区四区| 久久精品国产精品亚洲| 小荡货奶真大水真多紧视频| 国产在线一区观看| 亚洲视频在线视频在线视频| 国产在线一区二区三精品乱码| 午夜无码伦费影视在线观看| 国产精品视频yuojizz| 精品在线视频免费在线观看视频| 人妻av有码中文字幕| 野狼第一精品社区| 91性视频| 人妻被公上司喝醉在线中文字幕 | 懂色av一区二区三区网久久| 久久人妻av一区二区软件 | 亚洲精品成人网久久久久久| 国产亚洲一区二区三区成人 | 大岛优香中文av在线字幕| 中文字幕亚洲综合久久天堂av | 日本一区二区精品88| 九色精品国产亚洲av麻豆一| 国产亚洲3p一区二区| 久久狠狠爱亚洲综合影院| 欧性猛交ⅹxxx乱大交| 国产精品性一区二区三区| 白浆国产精品一区二区| 黑人巨大跨种族video| 亚洲av不卡电影在线网址最新| 成人自拍偷拍视频在线观看| 国产内射爽爽大片视频社区在线| 国产精品亚洲综合久久婷婷| 国产免费99久久精品| 亚洲国产精品无码aaa片|