亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘的電商日常銷量預測研究

        2022-01-04 13:10:38
        時代經(jīng)貿 2021年12期
        關鍵詞:下單貝葉斯數(shù)據(jù)挖掘

        馮 明

        (中國社會科學院大學商學院 北京 102488)

        引言

        基于互聯(lián)網(wǎng)的交易平臺具有降低交易成本、提升交易效率等優(yōu)勢,為電子商務的發(fā)展提供了有利條件。近年來,隨著生產消費水平的提高,日常商品交易數(shù)量急劇上升,數(shù)據(jù)挖掘相關算法在該領域的應用顯得尤為重要。與此同時,在全民實現(xiàn)“彎道超車”的時代,大數(shù)據(jù)與人工智能等技術不斷記錄分析人們的消費生活習慣,能夠為用戶提供更加精確的營銷服務。作為電商企業(yè),如何利用電商平臺提供的有效數(shù)據(jù)資源,作出針對性的銷售調整,以期最大限度地提高利潤,是一個非常重要的技術手段。

        徐國虎、孫凌(2012)在電商發(fā)展的早期階段已開始著手將大數(shù)據(jù)技術應用于線上線下用戶數(shù)據(jù)挖掘。其研究基于線上線下用戶數(shù)據(jù)體量大、類型多、速率快、價值高的特點,運用大數(shù)據(jù)技術提出由數(shù)據(jù)來源層、收集層、存儲層、分析層到最后應用層構成的O2O用戶數(shù)據(jù)挖掘框架,并指出“最準確的商務決策來源于數(shù)據(jù)支持,大數(shù)據(jù)應用必將成為O2O電子商務深入發(fā)展的重中之重”。羅紅梅(2013)認為企業(yè)營銷領域應該從直覺、經(jīng)驗或情感化的決策過程走向數(shù)據(jù)挖掘和分析為主導的“理性”時代,網(wǎng)絡精準營銷的核心是數(shù)據(jù)營銷。在電商促銷活動方面,孫鈺(2017)指出活動期間的銷量會顯著大于日常銷量,而活動前后的銷量小于日常的銷量,且活動前后期的轉換率較低。尹勝燕(2017)研究了RFM、關聯(lián)規(guī)則、聚類分析等方法在數(shù)據(jù)發(fā)掘中的應用,指出應用數(shù)據(jù)挖掘技術可以在制定營銷策略時統(tǒng)籌兼顧,使得商家的運營決策具有一定的前瞻性?;谧匀徽Z言處理的文本情感分析,劉玉林、菅利榮(2018)通過分析電商平臺評價系統(tǒng)中的留言判斷情感傾向,并建立情感指數(shù),以此來評估顧客的情感傾向和商家的經(jīng)營管理狀況。周靜曦(2019)基于某商家的歷年銷量數(shù)據(jù),從模型假設、模型建立與求解等幾個方面對數(shù)據(jù)進行ARIMA模型的建立,并根據(jù)ARIMA模型對未來幾天的銷售量進行擬合和預測分析,然后用馬爾可夫模型進行結果檢驗,為商家的補單及存貨提供理論依據(jù)。葛娜、孫連英等(2019)在深入分析Prophet加法模型和長短時記憶神經(jīng)網(wǎng)絡的特性的基礎上,依據(jù)某企業(yè)產品銷量時間序列數(shù)據(jù)的趨勢規(guī)律,構建了一種用于預測銷售量的Prophet-LSTM神經(jīng)網(wǎng)絡組合模型,設計并實現(xiàn)了與組合前Prophet、LSTM單項模型及兩種典型時間序列預測模型的對比實驗。

        雖然相關學者已從多個角度和方法研究電商數(shù)據(jù)挖掘,但由于電商主營產品的多樣性及其與銷售數(shù)據(jù)復雜性之間的矛盾,使其很難用一種通用的決策算法來判斷銷售策略的合理性。本文擬從實際銷售數(shù)據(jù)入手,通過對多種影響因素進行數(shù)據(jù)降維,并利用降維后的數(shù)據(jù)進行銷量預測,從而為商家選擇合理的銷售策略提供指導。

        研究方法

        本文數(shù)據(jù)來源于某電商企業(yè)自2020年5月1日至2020年7月16日共計76天的真實歷史銷售數(shù)據(jù),每日數(shù)據(jù)中包括15項影響因素 (x1,...,x15分別對應商品訪客數(shù)、商品瀏覽量、商品平均停留時長、商品詳情頁跳出率、商品加購件數(shù)、商品收藏人數(shù)、下單買家數(shù)、下單金額、下單轉換率、支付買家數(shù)、支付轉換率、下單件數(shù)、支付件數(shù)、訪客平均價值、成功退款金額)和一項觀測因素(支付金額 ),構成76×16的數(shù)值矩陣表。

        (一)數(shù)據(jù)歸一化

        對于任意序列xi∈Rn,存在雙射f,使得x0=f(xi) 屬于標準正態(tài)分布,其中μ,σ 分別對應序列xi的均值和方差,如(1)所示。

        為了消除量綱,利用上述歸一化方法將數(shù)據(jù)放縮,作為初始的數(shù)據(jù)預處理。

        (二)相關性分析

        因數(shù)據(jù)記錄中影響因素較多,且有部分因素之間的相關性是比較直觀的,如下單件數(shù)與下單金額,因而我們首先做一個相關性分析,常用的反映兩變量之間變化趨勢的方向以及程度的系數(shù)包括pearson、spearman、kendall三種相關系數(shù),其值范圍為ρ=p[-1,1],其中0表示兩個變量不相關,正值表示正相關,負值表示負相關,值越大表示相關性越強。

        考慮到數(shù)據(jù)間有較強的線性相關性,我們直接采用pearson相關系數(shù),兩個變量x1,x2∈Rn之間的計算方式如(2)所示。

        顯然,該矩陣為對稱矩陣,且對角線元素全為1,因而我們僅顯示下三角,如圖1所示??梢钥吹剑哂嘧兞枯^多,因而下一步采取數(shù)據(jù)降維處理,考慮到數(shù)據(jù)降維的可解釋性,因而采用因子分析法來實現(xiàn)這一目標。

        圖1 相關矩陣

        (三)因子分析

        在進行因子分析之前,我們先進行Kaiser-Meyer-Olkin(KMO)和 Bartlett’s球檢驗。這兩個指標是衡量樣本是否適合進行因子分析的依據(jù),其中KMO表示變量之間的相關性,值越接近1表示相關性越強,一般0.9表示非常合適,0.8表示合適,0.6則表示效果很差或直接不合適;Bartlett’s球檢驗用于檢測相關矩陣是否為單位陣(變量間是否獨立),若概率值小于顯著水平α=0.05,則表示適合做因子分析。經(jīng)計算(見表1),結果顯示適合因子分析。

        表1 Bartlett's球檢驗和KMO檢驗分析表

        設有n個樣本,每個樣本有m個標準化后的待分析變量,則因子模型為:

        Xm×1=Am×pFp×1+εp×1

        其中,

        這里的系數(shù)A是我們關心的因子荷載矩陣。顯然,如果忽略特殊因子ε的影響,公因子F在系數(shù)A的作用下可線性表示所有的待分析變量X。

        設公因子F可由變量X線性表出,如(3)所示。

        其中,β為線性組合對應的加權系數(shù),依此來計算因子得分,顯然,每個公因子的得分分別對應影響變量對該因子的貢獻。因此,選取因子得分大的公因子來代表相應影響變量的貢獻信息。

        計算相關矩陣F的特征值λ[t],t=1,…,n,不失一般性,設它們滿足λ[t]≥λ[2]≥…≥λ[n] 則必然存在一個整數(shù)p≤n,使得 ∑Pt=1λ[t]≥0.9∑nt=1λ[t],且累計方差貢獻率大于0.75,記p為降維后的因子個數(shù)。經(jīng)計算,這里的因子個數(shù)p=3。

        對因子載荷矩陣進行旋轉計算得分,最終得到更有實際意義的公因子,如圖2所示。根據(jù)權重關系,可將公因子F1、F2、F3分別命名為直接因子、潛在因子、轉化率因子,然后我們利用這三個公因子來預測日下單金額。

        圖2 正交旋轉因子載荷矩陣

        (四)線性回歸模型

        線性回歸的一般形式可表示為公式(4)。

        m表示樣本個數(shù),p表示公因子個數(shù),那么觀測結果y與預測結果y′之間的誤差Rss可表示為:

        令誤差最小,計算Rss的導數(shù),有:

        進而θ=(XTX)-1XTy,即正規(guī)方程。計算得到θ后,直接代入原線性方程,即可得到預測結果。正規(guī)方程、嶺回歸和梯度下降所得擬合誤差百分比如圖3所示。

        圖3 擬合誤差百分比

        (五)樸素貝葉斯模型

        因本文研究的變量均為連續(xù)型,且在經(jīng)過因子分析后可以適當將三個公因子看做是相互獨立的變量,因而采用高斯樸素貝葉斯模型。在此之前,我們引入一些理論框架。設(Ω,F(xiàn),P) 為概率空間,如果,則稱Ai 為Ω 的有窮剖分。全概率公式指的是如果在有窮剖分基礎上,P(Ai)>0,則對任一事件B∈F,有

        相應的,如果對任一事件B∈F,P(B)>0,則:

        稱為貝葉斯公式,實際上貝葉斯公式可以看做條件概率公式在全概率公式下的適當變形。對于高斯樸素貝葉斯而言,我們需要將上述公式中的P表示為高斯函數(shù)即可:

        依此計算三種公因子的條件概率并完成模型訓練,然后代入預測參數(shù)即可推斷預測結果。如圖4所示。

        圖4 高斯樸素貝葉斯模型預測結果

        結果與討論

        由于特殊活動日期如雙11、618等數(shù)據(jù)的偶然性強且各因素的關聯(lián)性相對較弱,而且根據(jù)觀察,雖然雙11、618等活動當天銷售量會有爆發(fā)式增長,但是縱觀全年總銷量構成,非活動期間的日常交易額還是占據(jù)絕對比重,因此分析日常交易額的相關數(shù)據(jù)更具實際意義。

        從數(shù)據(jù)降維角度我們可以將大部分影響數(shù)據(jù)分成三類,一類直接轉化為交易額,如下單買家數(shù)、下單件數(shù)等;一類雖然沒有直接轉化為交易額,但可能在將來的一段時間變現(xiàn),如加購件數(shù)、收藏人數(shù)等;最后一部分就和轉化率等有關,用來表示總體訪客的變現(xiàn)價值。在制定銷售策略時,可以從這三個角度來分別研究。

        總體來講,在流量增加的情況下,轉化率因子可以衡量總體效益,但影響當日直接交易額的是直接因子,而對于潛在因子則需要一個滯后的時間來實現(xiàn)變現(xiàn),在做促銷活動時可著重考慮這部分數(shù)據(jù)。在預測方面,相比于樸素貝葉斯分類模型,本文使用的多變量線性回歸模型可以更準確地預測觀測變量。實際上為了選取合適的擬合方法,本文分別用正規(guī)方程、嶺回歸和梯度下降來進行模型擬合,得到的結果如圖3。針對本次研究,梯度下降的誤差最大,可能達到35%,嶺回歸次之,介于10%-15%,正規(guī)方程表現(xiàn)最好,基本低于5%。

        有相關文章的研究通過閾值將數(shù)據(jù)二值化,從而把研究目標轉化為一個二分類問題,與之不同的是,本文考慮到影響變量的連續(xù)性,引入高斯樸素貝葉斯模型來處理該問題,相較于前者的閾值分割處理,本文的影響因素具有更多的特征信息。關于最后的預測結果,鑒于貝葉斯網(wǎng)絡的分類本質,這里選取日交易額均值的1.5倍作為閾值,判定是否可以達成該目標,結果為“0”或“1”的布爾值,預測結果如圖4。圖中預測結果與實測值結果完全吻合,當然該模型在本質上是用分類模型來做一個擬合問題,對于預測結果只能給出布爾值,無法給出更多信息,也存在一定局限,但并不影響研究結論。在實際銷售中對于商家而言,高于1.5倍于日常均值的交易額僅僅是一個范圍,具體可能是2倍甚至10倍,其中的區(qū)別有時可能影響很大,這也是后續(xù)研究需要進一步挖掘的。

        結論

        本文根據(jù)電商企業(yè)每日交易的歷史數(shù)據(jù),將日下單金額作為觀測變量,其余變量作為影響變量,分析了影響觀測變量的主要因素并構建預測模型。首先利用因子分析將冗余的影響變量劃分為直接因子、潛在因子和轉化率因子,得到影響日下單金額的三種公因子,然后分別利用高斯樸素貝葉斯模型以及基于正規(guī)方程法做線性擬合模型,得到較為理想的結果。本文提供的預測模型可以通過適當調整主要影響因素來觀測結果變化,計算調整成本與收益率進而得到最優(yōu)策略,這對于電商企業(yè)分析銷售趨勢、調整營銷策略,具有直接的指導意義。

        猜你喜歡
        下單貝葉斯數(shù)據(jù)挖掘
        基于聯(lián)邦學習的自助取貨機遠程下單數(shù)據(jù)共享方法
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        歐洲最大罐車企業(yè)FFB:如果你現(xiàn)在下單2020年才能提車
        專用汽車(2018年10期)2018-11-02 05:32:30
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        貝葉斯公式及其應用
        基于貝葉斯估計的軌道占用識別方法
        一種基于貝葉斯壓縮感知的說話人識別方法
        電子器件(2015年5期)2015-12-29 08:43:15
        聯(lián)發(fā)科傳下單中芯不利臺積
        電子世界(2015年22期)2015-12-29 02:49:41
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        IIRCT下負二項分布參數(shù)多變點的貝葉斯估計
        日本黄网站三级三级三级| 国产三级黄色免费网站| 99久久久国产精品免费蜜臀| 日韩精品不卡一区二区三区| 国产精品自拍网站在线| 少妇性饥渴无码a区免费| 亚洲高清一区二区精品| 四房播播在线电影| 白嫩少妇高潮喷水av| 日韩精品无码av中文无码版| 国产亚洲精品一品二品| 成人不卡国产福利电影在线看| 人人人妻人人人妻人人人| 手机看片福利日韩国产| 亚洲码欧美码一区二区三区| 亚洲成AV人片无码不卡| 熟女人妇 成熟妇女系列视频| 手机免费日韩中文字幕| 色偷偷偷久久伊人大杳蕉| 青青草高中生在线视频| 日韩av二区三区一区| 久久狠狠色噜噜狠狠狠狠97| 日韩av一区二区三区在线观看| 一品二品三品中文字幕| 国产人妖视频一区二区| 久久亚洲国产中v天仙www| 亚洲国产精品无码久久一区二区| 亚洲精品无人区一区二区三区| 免费观看的av毛片的网站| 精品福利一区二区三区| 欧美—iGAO视频网| 少妇性荡欲视频| 男女av免费视频网站| 日本黑人人妻一区二区水多多| 一本之道高清无码视频| 亚洲第一最快av网站| 亚洲综合第一页中文字幕| 久草视频在线播放免费| 亚洲av无码片一区二区三区| 国产成人精品优优av| 久久婷婷夜色精品国产|