亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Stacking集成學(xué)習(xí)在銷售預(yù)測(cè)中的應(yīng)用

        2022-04-24 03:21:00尤璞劉星甫
        軟件導(dǎo)刊 2022年4期
        關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò)銷售預(yù)測(cè)

        尤璞,劉星甫

        (江南大學(xué)商學(xué)院,江蘇無(wú)錫 214122)

        0 引言

        需求預(yù)測(cè)在各行各業(yè)都有著重要作用,準(zhǔn)確的需求預(yù)測(cè)能讓管理者合理安排訂貨時(shí)間、生產(chǎn)計(jì)劃等環(huán)節(jié),減少庫(kù)存成本和缺貨損失,提升企業(yè)核心競(jìng)爭(zhēng)力。但由于需求變化多樣,掌握市場(chǎng)需求動(dòng)態(tài),作出準(zhǔn)確的銷售預(yù)測(cè),是一項(xiàng)巨大的挑戰(zhàn)。目前,國(guó)內(nèi)外的許多學(xué)者對(duì)銷量預(yù)測(cè)做了大量研究,采用的方法主要是時(shí)間序列預(yù)測(cè)技術(shù)和以大數(shù)據(jù)技術(shù)為支撐的機(jī)器學(xué)習(xí)預(yù)測(cè)技術(shù)。時(shí)間序列模型是比較常見的預(yù)測(cè)模型,許多學(xué)者對(duì)時(shí)間序列模型進(jìn)行改進(jìn)或者對(duì)不同模型進(jìn)行組合,取得了較好的預(yù)測(cè)效果。時(shí)間序列模型在假設(shè)需求是一種線性變化趨勢(shì)的基礎(chǔ)上對(duì)下一階段的需求進(jìn)行預(yù)測(cè),其操作簡(jiǎn)單、容易實(shí)現(xiàn),如果歷史銷售數(shù)據(jù)的趨勢(shì)性較強(qiáng),就能夠較好地?cái)M合數(shù)據(jù)。但是傳統(tǒng)時(shí)間序列模型的缺點(diǎn)也很明顯,它要求時(shí)序數(shù)據(jù)穩(wěn)定,無(wú)法對(duì)復(fù)雜的非線性系統(tǒng)進(jìn)行有效擬合,且容易發(fā)生多重共線性,導(dǎo)致預(yù)測(cè)不準(zhǔn)確。

        近年來(lái),得益于互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和物流服務(wù)水平的不斷提升,運(yùn)用數(shù)據(jù)挖掘技術(shù)和機(jī)器學(xué)習(xí)算法等解決銷量預(yù)測(cè)問(wèn)題也成為研究熱點(diǎn)。Loureiro等發(fā)現(xiàn)采用深度學(xué)習(xí)模型在預(yù)測(cè)時(shí)尚零售市場(chǎng)的銷售方面具有良好性能;吳娟娟等針對(duì)大數(shù)量級(jí)的序列預(yù)測(cè),提出基于記憶機(jī)理的LSTM模型并用銷售額數(shù)據(jù)進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明LSTM模型表現(xiàn)優(yōu)于傳統(tǒng)時(shí)間序列模型。相較于時(shí)間序列模型,機(jī)器學(xué)習(xí)模型可以更好地估計(jì)高維數(shù)據(jù)集,把握住需求變化中的非線性因素,作出更準(zhǔn)確的預(yù)測(cè)。為進(jìn)一步提升模型性能,一些機(jī)器學(xué)習(xí)技術(shù)的組合模型也應(yīng)用于銷售預(yù)測(cè)。通過(guò)組合多個(gè)模型,單個(gè)模型的預(yù)測(cè)誤差可以被其他模型所彌補(bǔ),因此可以獲得更好的預(yù)測(cè)效果。

        上述研究雖然嘗試通過(guò)多種方法預(yù)測(cè)銷量,但至今沒(méi)有主導(dǎo)的預(yù)測(cè)技術(shù)。對(duì)于企業(yè)管理者而言,如何從多種預(yù)測(cè)技術(shù)中作出選擇也是一個(gè)難題。傳統(tǒng)的時(shí)間序列方法需要掌握一定的統(tǒng)計(jì)學(xué)知識(shí)才能熟練運(yùn)用,且往往受限于固定的模型框架和較為嚴(yán)格的假設(shè)條件,對(duì)于需要快速響應(yīng)的商業(yè)環(huán)境并不適用。而許多機(jī)器學(xué)習(xí)方法應(yīng)用于銷售預(yù)測(cè)時(shí),過(guò)于依賴歷史數(shù)據(jù),需要預(yù)訓(xùn)練大量數(shù)據(jù)才能達(dá)到良好的預(yù)測(cè)效果。此外,對(duì)于時(shí)間序列數(shù)據(jù),在驗(yàn)證模型時(shí),常規(guī)的交叉驗(yàn)證可能會(huì)造成數(shù)據(jù)泄露問(wèn)題,影響模型在測(cè)試集上的表現(xiàn)。

        針對(duì)銷售預(yù)測(cè)研究現(xiàn)狀,本文提出一種基于Stacking集成策略的銷售預(yù)測(cè)方法,將Prophet算法和隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)作為基學(xué)習(xí)器構(gòu)建Stacking預(yù)測(cè)模型。該算法充分考慮了不同模型的差異性,使得不同算法的優(yōu)勢(shì)得以結(jié)合,利用時(shí)間序列預(yù)測(cè)算法,即Prophet算法對(duì)數(shù)據(jù)的周期性進(jìn)行擬合,再通過(guò)Stacking算法融合隨機(jī)森林和BP神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)的非線性進(jìn)行擬合,通過(guò)3種異質(zhì)算法的融合取長(zhǎng)補(bǔ)短。同時(shí),將歷史銷售數(shù)據(jù)作為新特征,給數(shù)據(jù)加入了時(shí)序性,并采用日向前鏈的交叉驗(yàn)證方法,避免了數(shù)據(jù)泄露,提升了預(yù)測(cè)效果,取得了比單個(gè)模型更好的預(yù)測(cè)性能。

        1 算法介紹

        1.1 Stacking算法

        Stacking算法是一種模型融合算法,通過(guò)融合不同的算法增強(qiáng)模型泛化性能,減少預(yù)測(cè)誤差。Stacking算法首先利用原始訓(xùn)練數(shù)據(jù)訓(xùn)練若干基學(xué)習(xí)器,再將其預(yù)測(cè)結(jié)果作為新的訓(xùn)練集,訓(xùn)練一個(gè)新的元學(xué)習(xí)器,最后由元學(xué)習(xí)器輸出最終結(jié)果。一個(gè)基本的兩層Stacking算法流程如圖1所示。

        Fig.1 Two-layer Stacking model圖1 兩層Stacking模型

        1.2 學(xué)習(xí)器選擇

        對(duì)于Stacking算法,學(xué)習(xí)器的選擇也是至關(guān)重要的一步,選擇合適的基學(xué)習(xí)器和元學(xué)習(xí)器才能最大程度地發(fā)揮取長(zhǎng)補(bǔ)短的效果。一般而言,學(xué)習(xí)器的選擇有以下幾點(diǎn)需要注意:①各學(xué)習(xí)器的預(yù)測(cè)效果要接近且較為優(yōu)秀;②各學(xué)習(xí)器要保持一定差異性;③元學(xué)習(xí)器一般選擇穩(wěn)定性較好的簡(jiǎn)單模型。

        對(duì)于銷售預(yù)測(cè)而言,往往要在較短的時(shí)間內(nèi)為商店的大量產(chǎn)品生成預(yù)測(cè)。傳統(tǒng)的時(shí)間序列模型往往需要掌握統(tǒng)計(jì)學(xué)知識(shí)才能應(yīng)用于實(shí)踐,而且同時(shí)對(duì)大量時(shí)間序列建模需要耗費(fèi)巨大精力,這對(duì)于中小企業(yè)的商業(yè)應(yīng)用是一個(gè)難點(diǎn)。因此,首先選擇Prophet時(shí)間序列算法作為基學(xué)習(xí)器進(jìn)行預(yù)測(cè),該算法無(wú)需構(gòu)造特征,就能夠?qū)r(shí)間序列作出較好的預(yù)測(cè),且可以通過(guò)編程實(shí)現(xiàn)大量商品的自動(dòng)化預(yù)測(cè)。但Prophet算法的缺點(diǎn)也很明顯,它無(wú)法對(duì)數(shù)據(jù)中的非線性特征進(jìn)行利用。因此,可以通過(guò)Stacking算法融合其他模型以克服Prophet算法的缺點(diǎn)。

        綜合考慮以上幾點(diǎn),選擇隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)、Prophet時(shí)間序列預(yù)測(cè)算法作為基學(xué)習(xí)器,其中隨機(jī)森林算法采用Bagging的集成學(xué)習(xí)方式,泛化能力較強(qiáng)、模型調(diào)參方便,在實(shí)際應(yīng)用中取得良好效果。BP神經(jīng)網(wǎng)絡(luò)算法能夠捕捉到時(shí)間序列中的非線性因素和趨勢(shì),預(yù)測(cè)準(zhǔn)確率高。3種異質(zhì)算法的差異性保障了元學(xué)習(xí)器的的改善空間,使得模型的整體預(yù)測(cè)性能更加優(yōu)異。第二層的元學(xué)習(xí)器選擇線性回歸Linear Regression,以確保穩(wěn)定性和泛化性能。

        1.3 PROPHET算法

        1.3.1 模型構(gòu)成及解釋

        Prophet模型將預(yù)測(cè)序列分解為3個(gè)主要組成部分:趨勢(shì)、季節(jié)性和節(jié)假日。它們按式(1)進(jìn)行組合。

        其中,

        g

        (

        t

        )為趨勢(shì)項(xiàng),用于擬合時(shí)間序列中的分段線性增長(zhǎng)或邏輯增長(zhǎng)等非周期性變化。其表達(dá)式如式(2)所示。

        其中,

        C

        代表容量,

        k

        代表模型的增長(zhǎng)率,

        b

        代表偏移量。

        s

        (

        t

        )表示周期項(xiàng),一般以周或者年為單位,具體表達(dá)式如式(3)所示。

        其中,

        T

        代表周期,

        N

        表示周期個(gè)數(shù),

        n

        表示周期,

        a

        b

        均為學(xué)習(xí)參數(shù)。h(

        t

        )表示時(shí)間序列中具有非固定周期的節(jié)假日或重大事件時(shí)間節(jié)點(diǎn)對(duì)預(yù)測(cè)值造成的影響,用戶可以手動(dòng)輸入。

        其中,

        D

        為節(jié)日集合,

        Z

        (

        t

        )為指示函數(shù),k表示節(jié)假日對(duì)預(yù)測(cè)的影響,

        ε

        為誤差項(xiàng),表示未在模型中體現(xiàn)的異常變動(dòng)。

        1.4 隨機(jī)森林算法

        隨機(jī)森林基于Bagging算法對(duì)多棵決策樹進(jìn)行集成,每一棵決策樹訓(xùn)練樣本都由隨機(jī)采樣獲得,且所選擇的特征也是隨機(jī)的,這使得隨機(jī)森林不容易陷入過(guò)擬合,最后組合大量決策樹的預(yù)測(cè)結(jié)果并將其作為一個(gè)整體輸出。隨機(jī)森林算法使用重采樣技術(shù),每棵決策樹的分類性能都是獨(dú)立的,可以采取并行學(xué)習(xí)方式,使得算法訓(xùn)練時(shí)間短,能夠有效地運(yùn)行在大數(shù)據(jù)集上。

        1.5 BP神經(jīng)網(wǎng)絡(luò)算法

        神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)中比較常用的模型,由于其強(qiáng)大的學(xué)習(xí)能力和非線性建模能力,而被廣泛應(yīng)用于時(shí)間序列預(yù)測(cè)中。而BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),一般由3部分組成:輸入層、隱含層、輸出層,每層神經(jīng)元與下一層神經(jīng)元全互連。在加入了激活函數(shù)之后,提高了神經(jīng)網(wǎng)絡(luò)對(duì)模型的表達(dá)能力,不再是輸入的線性組合,而是幾乎可以逼近任意函數(shù)。訓(xùn)練時(shí)首先由輸入變量進(jìn)行正向傳播計(jì)算,再通過(guò)誤差反向傳播對(duì)網(wǎng)絡(luò)的各連接權(quán)值進(jìn)行修正。一個(gè)簡(jiǎn)單的三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

        Fig.2 Three-layer BPneural network圖2 三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

        2 基于Stacking框架的銷售預(yù)測(cè)建模流程

        2.1 模型訓(xùn)練與調(diào)參

        機(jī)器學(xué)習(xí)模型除有許多需要在訓(xùn)練過(guò)程中優(yōu)化的參數(shù)外,還有大量在訓(xùn)練前需要人為調(diào)節(jié)的超參數(shù)。在實(shí)際應(yīng)用中,一般通過(guò)交叉驗(yàn)證和網(wǎng)格搜索調(diào)節(jié)超參數(shù)。對(duì)于時(shí)間序列預(yù)測(cè),傳統(tǒng)的交叉驗(yàn)證方法可能會(huì)造成用未來(lái)數(shù)據(jù)預(yù)測(cè)當(dāng)前數(shù)據(jù)的情況,不僅存在數(shù)據(jù)泄露問(wèn)題,而且這樣的預(yù)測(cè)也沒(méi)有現(xiàn)實(shí)意義。因此,本文采用日向前鏈(Day Forward Chaining)的交叉驗(yàn)證方式,用前面的數(shù)據(jù)進(jìn)行訓(xùn)練,后面的數(shù)據(jù)進(jìn)行驗(yàn)證,逐步推進(jìn)的方式避免了數(shù)據(jù)泄露問(wèn)題,真實(shí)模擬時(shí)間序列的前后關(guān)系。日向前鏈交叉驗(yàn)證如圖3所示。對(duì)于Prophet模型,不同商品的時(shí)間序列不同,需要為每一個(gè)商店—商品組合分別進(jìn)行建模預(yù)測(cè)。因此,將測(cè)試集中商店—商品組合的歷史銷售情況組成時(shí)間序列作為訓(xùn)練集訓(xùn)練Prophet模型,輸出預(yù)測(cè)結(jié)果。

        Fig.3 Day forward chaining cross validation圖3 日向前鏈交叉驗(yàn)證

        2.2 基于Stacking框架的銷售預(yù)測(cè)整體流程

        預(yù)測(cè)方法整體流程大致如下:①對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理后,利用特征工程構(gòu)成新的特征集合,利用相關(guān)性分析進(jìn)行特征選擇,刪除冗余特征;②劃分原始數(shù)據(jù)集,使用3次日向前鏈的交叉驗(yàn)證方式,對(duì)隨機(jī)森林模型和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練和超參數(shù)調(diào)優(yōu),對(duì)于Prophet模型,利用商品的歷史銷售額作為訓(xùn)練集直接進(jìn)行訓(xùn)練;③各基學(xué)習(xí)器分別在驗(yàn)證集和測(cè)試集上輸出預(yù)測(cè)結(jié)果,分別作為元學(xué)習(xí)器的訓(xùn)練集和測(cè)試集;④對(duì)新生成的數(shù)據(jù)集進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,對(duì)元學(xué)習(xí)器進(jìn)行訓(xùn)練,并在測(cè)試集上輸出預(yù)測(cè)結(jié)果。

        本文基于Stacking框架的銷售預(yù)測(cè)流程如圖4所示。

        3 實(shí)驗(yàn)與結(jié)果分析

        本文模型采用Python的scikit-learn包加以實(shí)現(xiàn)。實(shí)驗(yàn)在矩池云云平臺(tái)與Python3.7環(huán)境下完成,實(shí)驗(yàn)環(huán)境為Intel(R)Xeon(R)CPU E5-2678 v3@2.50GHz,8GB RAM設(shè)備。實(shí)驗(yàn)數(shù)據(jù)來(lái)源于kaggle數(shù)據(jù)科學(xué)平臺(tái)上公開的商店商品需求預(yù)測(cè)競(jìng)賽。實(shí)驗(yàn)數(shù)據(jù)包含10家店鋪在2013-2017年的商品銷售數(shù)據(jù),共計(jì)913 000條數(shù)據(jù),由于數(shù)據(jù)已經(jīng)過(guò)處理,并不存在缺失值和異常值,因此無(wú)需進(jìn)行數(shù)據(jù)清洗。預(yù)測(cè)目標(biāo)是2017年7月至12月10件商品的月銷售數(shù)據(jù)。為全面衡量預(yù)測(cè)模型的準(zhǔn)確性,同時(shí)考慮以下3個(gè)評(píng)價(jià)指標(biāo):

        (1)RMSE均方根誤差,如式(8)所示。

        (2)MAE平均絕對(duì)誤差,如式(9)所示。

        Fig.4 Flow of Stacking framework圖4 Stacking框架流程

        (3)MAPE平均絕對(duì)百分比誤差,如式(10)所示。

        其中,y為實(shí)際銷售額,

        y

        ^為預(yù)測(cè)值,預(yù)測(cè)指標(biāo)越小表示預(yù)測(cè)得越準(zhǔn)確。3個(gè)預(yù)測(cè)指標(biāo)越小,說(shuō)明模型性能越好。

        3.1 特征工程

        對(duì)于機(jī)器學(xué)習(xí)任務(wù)而言,特征工程是構(gòu)造有效預(yù)測(cè)模型的必經(jīng)之路。合理的特征工程能夠減少冗余特征,去除數(shù)據(jù)噪音,對(duì)模型效果的改善起重要作用,同時(shí)還能減少模型訓(xùn)練時(shí)間。

        3.1.1 特征構(gòu)造

        原始數(shù)據(jù)僅包含商品類別(item)、商店標(biāo)識(shí)(store),以及日期(data)和銷量(sales),涵蓋的信息量較少,要使模型預(yù)測(cè)性能達(dá)到最佳,必須從原始數(shù)據(jù)中挖掘出更多的有用信息。將日期分解為年、月、周,并且增加從0開始的月份數(shù),便于模型挖掘出更多的非線性趨勢(shì)。在銷售預(yù)測(cè)中,當(dāng)期銷售情況往往與歷史銷售額有緊密聯(lián)系,因此還構(gòu)造了商品的月平均銷售作為新特征,使各機(jī)器學(xué)習(xí)模型可以準(zhǔn)確地學(xué)習(xí)到銷售數(shù)據(jù)的時(shí)序特性,從而作出準(zhǔn)確預(yù)測(cè)。因?yàn)橐A(yù)測(cè)6個(gè)月的銷售額,為避免數(shù)據(jù)泄露,商品的月平均銷售采取前半年以及一年前的數(shù)據(jù)作為滯后值。

        3.2 特征分析

        機(jī)器學(xué)習(xí)的特征并不是越多越好,特征過(guò)多時(shí),可能包含了許多嘈雜的無(wú)關(guān)特征,影響模型性能發(fā)揮,并且增大了計(jì)算量。此時(shí)需要對(duì)特征進(jìn)行選擇,刪去冗余特征,主要目的是減少特征數(shù)量以提高模型性能,并且能夠減少模型計(jì)算量。采用Pearson相關(guān)系數(shù)查看各特征之間的相關(guān)性,其結(jié)果如圖5所示??梢园l(fā)現(xiàn),年份和月份數(shù)的相關(guān)性很高,相關(guān)性高的特征可能存在冗余信息,因此刪去其中一個(gè)。此外,月銷售額的滯后值與預(yù)測(cè)目標(biāo)存在較高的相關(guān)性,這說(shuō)明數(shù)據(jù)存在較強(qiáng)的線性特征,可能存在一定的周期性,這有利于基于時(shí)間序列模型進(jìn)行預(yù)測(cè)。預(yù)測(cè)目標(biāo)與其他特征之間的相關(guān)性不高,均未達(dá)到0.5,說(shuō)明各特征與銷量之間存在復(fù)雜的非線性關(guān)系,時(shí)間序列模型無(wú)法挖掘這部分信息,可以通過(guò)融合BP神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林算法提升預(yù)測(cè)性能。

        3.3 超參數(shù)優(yōu)化與模型訓(xùn)練

        在特征構(gòu)造與特征選擇的基礎(chǔ)上,為保證Stacking算法發(fā)揮最佳性能,需要對(duì)基學(xué)習(xí)器的超參數(shù)進(jìn)行調(diào)整優(yōu)化。

        首先采用日向前鏈的交叉驗(yàn)證方法與網(wǎng)格搜索對(duì)隨機(jī)森林和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行超參數(shù)優(yōu)化。完成數(shù)據(jù)集劃分后,利用訓(xùn)練集訓(xùn)練模型,在驗(yàn)證集上評(píng)估模型性能,以選取模型的超參數(shù)。同時(shí),考慮計(jì)算量和預(yù)測(cè)準(zhǔn)確率,僅對(duì)幾個(gè)核心參數(shù)進(jìn)行優(yōu)化調(diào)參。對(duì)于Prophet模型,需要輸入商品的歷史銷售數(shù)據(jù)作為時(shí)間序列,需要對(duì)每個(gè)商品分別進(jìn)行建模預(yù)測(cè),如果對(duì)每個(gè)預(yù)測(cè)模型都手動(dòng)調(diào)參,則需要耗費(fèi)巨大的時(shí)間和精力,因此只采用默認(rèn)參數(shù)進(jìn)行預(yù)測(cè),設(shè)置預(yù)測(cè)的頻率為月。模型超參數(shù)如表1所示。

        Table1 Corepara meters of models表1 模型核心參數(shù)

        Fig.5 Correlation of features圖5 特征相關(guān)性

        4 Stacking模型融合結(jié)果

        完成各模型的超參數(shù)調(diào)優(yōu)后,重新訓(xùn)練模型,分別在驗(yàn)證集和測(cè)試集上輸出預(yù)測(cè)結(jié)果,作為Stacking模型第二層元學(xué)習(xí)器的訓(xùn)練集和測(cè)試集。用新的數(shù)據(jù)集對(duì)元學(xué)習(xí)器進(jìn)行訓(xùn)練,輸出最后結(jié)果。根據(jù)預(yù)測(cè)的評(píng)價(jià)指標(biāo),各單模型和Stacking模型的最終預(yù)測(cè)效果如表2所示。

        Table 2 Index of prediction ability of model表2 各模型預(yù)測(cè)能力指標(biāo)

        為了更直觀地表現(xiàn)模型預(yù)測(cè)效果,隨機(jī)挑選其中一件商品將各單模型和Stacking模型的預(yù)測(cè)效果進(jìn)行比較,結(jié)果如圖6所示。

        從表2可以看出,隨機(jī)森林模型的預(yù)測(cè)效果最差,在單模型中各項(xiàng)指標(biāo)均存在較大誤差,一方面是由于隨機(jī)森林在解決回歸問(wèn)題上的表現(xiàn)沒(méi)有分類問(wèn)題上的優(yōu)秀,它無(wú)法給出連續(xù)的輸出;另一方面是實(shí)驗(yàn)數(shù)據(jù)維度較低,隨機(jī)森林無(wú)法挖掘出有效信息。Prophet算法表現(xiàn)良好,這是由于數(shù)據(jù)存在明顯的周期性,算法能夠有效擬合線性趨勢(shì),因此作出誤差較低的預(yù)測(cè)。BP神經(jīng)網(wǎng)絡(luò)在單模型中的表現(xiàn)最好,MAPE僅為3%,這表明商品銷售和特征的關(guān)系趨近于更復(fù)雜的非線性關(guān)系,也說(shuō)明本文構(gòu)造的歷史均值特征有助于模型作出更好的預(yù)測(cè)。Stacking模型的各項(xiàng)預(yù)測(cè)指標(biāo)都為最低值,相較于表現(xiàn)最差的隨機(jī)森林模型,預(yù)測(cè)誤差下降約1.42%,這表明該模型充分吸收了3個(gè)基學(xué)習(xí)器的優(yōu)點(diǎn),作出了更好的預(yù)測(cè)。結(jié)合圖6可知,雖然Stacking模型和各單模型的誤差相差并不大,但在單個(gè)商品預(yù)測(cè)上表現(xiàn)仍然更接近實(shí)際銷售額。在企業(yè)的實(shí)際生產(chǎn)運(yùn)作中,每提高1%的精度都能為企業(yè)降低大量安全庫(kù)存,減少生產(chǎn)成本,提高企業(yè)核心競(jìng)爭(zhēng)力。

        Fig.6 Comparison of prediction results of models圖6 各模型預(yù)測(cè)效果

        5 結(jié)語(yǔ)

        本文對(duì)機(jī)器學(xué)習(xí)算法在銷售預(yù)測(cè)中的應(yīng)用進(jìn)行了研究,在隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)等解決回歸問(wèn)題的經(jīng)典算法基礎(chǔ)上通過(guò)Stacking算法融合了先進(jìn)的Prophet時(shí)間序列預(yù)測(cè)算法,利用kaggle數(shù)據(jù)科學(xué)平臺(tái)上公開的銷售預(yù)測(cè)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),結(jié)果表明該模型在銷售預(yù)測(cè)中有一定應(yīng)用價(jià)值。

        本文引入的Stacking算法在銷售預(yù)測(cè)實(shí)驗(yàn)中表現(xiàn)出一定的有效性,但仍存在諸多不足,后續(xù)待進(jìn)一步探索和解決的問(wèn)題包括:①在學(xué)習(xí)器選擇上,并未考慮其他算法,元學(xué)習(xí)器選擇了較為簡(jiǎn)單穩(wěn)定的線性回歸,未來(lái)可考慮選擇更多的基學(xué)習(xí)器和更復(fù)雜先進(jìn)的元學(xué)習(xí)以實(shí)現(xiàn)模型更好的表現(xiàn);②商品銷售的影響因素有很多,例如點(diǎn)擊量、評(píng)論數(shù)、折扣等,本文并未考慮較多的影響因素,將來(lái)可以從這些方面考慮構(gòu)造特征,挖掘更多信息;③本文所用的數(shù)據(jù)集較小,并未采取并行化的策略,在現(xiàn)實(shí)商業(yè)場(chǎng)景中可能會(huì)遇到大數(shù)據(jù)情況。Stacking模型運(yùn)算量大、運(yùn)行時(shí)間久,未來(lái)研究中有必要通過(guò)采取分布式計(jì)算方法提高效率。

        猜你喜歡
        神經(jīng)網(wǎng)絡(luò)銷售預(yù)測(cè)
        無(wú)可預(yù)測(cè)
        黃河之聲(2022年10期)2022-09-27 13:59:46
        選修2-2期中考試預(yù)測(cè)卷(A卷)
        選修2-2期中考試預(yù)測(cè)卷(B卷)
        神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        這四個(gè)字決定銷售成敗
        給人帶來(lái)快樂(lè)的襪子,一年銷售1億美金
        流行色(2017年2期)2017-05-31 01:43:44
        不必預(yù)測(cè)未來(lái),只需把握現(xiàn)在
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
        人人爽久久久噜人人看| 本道无码一区二区久久激情| 亚洲欧洲一区二区三区波多野| 亚洲视频不卡免费在线| 白白色最新福利视频二| 少妇性俱乐部纵欲狂欢少妇| 欧美真人性野外做爰| 玩两个丰满老熟女| 99久久精品国产片| 亚洲精品中文字幕熟女| 婷婷色婷婷开心五月四| 国产成人综合亚洲看片| 丰满爆乳一区二区三区| 2022精品久久久久久中文字幕| 亚洲av毛片在线播放| 国产内射一级一片内射视频| 午夜福利一区二区三区在线观看| 国产精品美女久久久浪潮av| 亚洲国产不卡av一区二区三区 | 国产成人精品无码一区二区老年人| 日日干夜夜操高清视频| 无码国产精品一区二区免费式芒果| 美女丝袜诱惑在线播放蜜桃| 久久精品国产免费观看三人同眠| 亚洲中文字幕国产综合 | 尤物AV无码色AV无码麻豆| 国产精品国产三级农村妇女| 蜜桃av在线免费网站| 亚洲一卡2卡3卡4卡5卡精品| 中文字幕一区二区三区久久网站 | 欧美人与动牲交片免费| 一区二区三区观看视频在线| 亚洲乱码无人区卡1卡2卡3| 国产suv精品一区二区6| 人妻被猛烈进入中文字幕| 亚洲中文高清乱码av中文| 国产精品黑丝高跟在线粉嫩 | 亚洲av无码精品国产成人| 亚洲不卡中文字幕无码| 极品美女销魂一区二区三| 亚洲精品一区二区高清|