郭偉展
摘 要:電商行業(yè)中,有一類爆款電商的企業(yè),其商品在銷售中,供不應求,銷售量很高。這類電商的企業(yè)經常采用限時搶購的銷售模式。這樣的前提下,一個商品在固定時間內下單后的支付率在很大程度上影響著產品銷量,本文采用一元線性回歸模型,通過區(qū)分不同商品的銷售單價,依據商品上市時間來預測最終用戶下單后的支付率,用來指導商品在銷售時間內應該放多少量才能完成銷售指標,并保證不會超售。
關鍵詞:一元線性回歸;統(tǒng)計分析;電商產品;支付率;R語言
2016年,我國電子商務繼續(xù)保持平穩(wěn)發(fā)展態(tài)勢。國家統(tǒng)計局調查顯示,2016年全國電子商務交易額達26.1萬億元,同比增長19.8%;網上零售交易總額達5.16萬億元,同比增長26.2%,我國世界第一大網絡零售市場地位進一步穩(wěn)固;農村網絡零售交易額8945.4億元,已占全國網絡零售額的17.4%;移動購物在網絡購物交易規(guī)模中占比達到70.7%;電子商務及相關產業(yè)直接和間接帶動就業(yè)人數已達3700萬。經過20年的發(fā)展,我國網絡購物用戶規(guī)模、電子商務交易額、電子商務從業(yè)人員數量穩(wěn)步增長,網上零售交易額、農村網絡零售交易額、電子商務服務業(yè)營收規(guī)模等快速增長。一方面,我國電子商務交易規(guī)模持續(xù)增長,新模式、新業(yè)態(tài)發(fā)展迅猛,社會經濟影響不斷深入;另一方面,伴隨網民數量增長的趨緩,電子商務也面臨著總體增速趨緩、市場競爭加劇、線上成本攀升的發(fā)展環(huán)境。電商企業(yè)紛紛布局農村市場、大力發(fā)展跨境電商、加快走出去步伐,在積極拓展新市場、新空間的同時加大對線下實體資源的整合力度,但在融合發(fā)展過程中,我國電子商務也出現了線上與線下、城市與農村、國內與跨境發(fā)展不平衡,政策挑戰(zhàn)日趨明顯等問題。[1]
隨著電商的發(fā)展,爆款的商品也越來越多,大多爆款的商品會采取限時搶購的銷售模式。即某個熱銷的商品,供不應求,在某個時間點上采取先到先得的銷售模式。比較典型的案例如小米手機,每周二早上10點準點開啟搶購,銷售完了之后會把銷售接口關閉,避免出現超售的情況,即銷售出去的商品大于庫存,導致沒法準時發(fā)貨,會導致用戶投訴,最終影響口碑;也有可能接口關閉之后出現支付率過低,導致商品少賣了。
在搶購過程中,用戶搶到了某個商品,會要求在規(guī)定的時間內支付,各個平臺要求不一樣,有些平臺可能要求在2小時內必須支付,但是下單的時候會占用庫存,從下單到支付有一定的流失,這樣究竟要讓用戶下多少量才能完成銷售目標就成為電商運營銷售人員的一個挑戰(zhàn)。本文要解決就是預測商品在下單之后,會有多少最終付款。名詞解釋:下單數量:用戶在電子商務網站選擇完商品,生成了訂單的數量;支付數量:用戶通過支付寶網銀等接口對訂單完成支付,支付完成后的訂單的數量;支付轉化率:支付率=支付數量/下單數量,用來考察商品從下單到支付轉化率,下文簡稱支付率。
1 數據分析—以某電商商品A為例
某電商是國內知名的手機廠商的主要銷售渠道之一,其銷售特點是以限時搶購為主,在分析的過程中,按商品售價不同來建立模型,此列選擇商品A,其單價在2000以上,其每個月的支付率如下表,從表中可以看出,支付率隨著銷售時間增長而呈下降的趨勢,為了能夠讓數據更好的用模型進行預測,需把月份進行歸一化,本文把月份轉成一個序數,讓商品的支付率跟具體的月份沒有關系,采用規(guī)則:第一個月的序數為1,第二個月的序數為2。
2 基于數據建立線性回歸預測模型
回歸分析(Regression Analysis)是用來確定2個或2個以上變量間關系的一種統(tǒng)計分析方法。如果回歸分析中,只包括一個自變量X和一個因變量Y時,且它們的關系是線性的,那么這種回歸分析稱為一元線性回歸分析。[2]
在回歸分析中,變量有2類:因變量和自變量。因變量通常是指實際問題中所關心的指標,用Y表示。而自變量是影響因變量取值的一個變量,用X表示,如果有多個自變量則表示為X1, X2, …, Xn。
分析主要步驟:
1.確定因變量Y 與自變量X1, X2, …, Xn 之間的定量關系表達式,即回歸方程。
從表二的數據可以看出,銷售的月份跟支付率有一定的線性關系,所以應用一元回歸作為模型進行分析。其中Y為支付率,X為月份,模型可表達為:Y = aX + b + c。其中Y,為因變量;X,為自變量;b,為截距;a,為自變量系數;a*X+b, 表示Y隨X的變化而線性變化的部分;c, 為殘差或隨機誤差,是其他一切不確定因素影響的總和,其值不可觀測。假定c是符合均值為0方差為σ^2的正態(tài)分布,記作c~N(0,σ^2)。
在R語言中可表達為:
lm.r<-lm(y~x+1)
2.回歸參數估計[3]
對于上面的公式,回歸參數a,b是不知道的,需要用參數估計的方法來計算出a,b的值,而從得到數據集的X和Y的定量關系。目標是要計算出一條直線,使直接線上每個點的Y值和實際數據的Y值之差的平方和最小,即(Y1實際-Y1預測)^2+(Y2實際-Y2預測)^2+ …… +(Yn實際-Yn預測)^2 的值最小。一般通過最小二乘法進行參數估計時,只考慮Y隨X的線性變化的部分,而殘差c是不可觀測的,參數估計法并不需要考慮殘差。
在R語言中打印出估計的參數:
lm.ab<-lm(y ~x+1)
lm.ab
可得截距為:0.95857,自變量系數:-0.05571
3.回歸方程顯著性檢驗
從回歸參數的公式二可知,在計算過程中并不一定要知道Y和X是否有線性相關的關系。如果不存相關關系,那么回歸方程就沒有任何意義了,如果Y和X是有相關關系的,即Y會隨著X的變化而線性變化,這個時候一元線性回歸方程才有意義。所以,需要用假設檢驗的方法,來驗證相關性的有效性。endprint
通常會采用三種顯著性檢驗的方法。
T檢驗法:T檢驗是檢驗模型某個自變量Xi對于Y的顯著性,通常用P-value判斷顯著性,小于0.01更小時說明這個自變量Xi與Y相關關系顯著。
F檢驗法:F檢驗用于對所有的自變量X在整體上看對于Y的線性顯著性,也是用P-value判斷顯著性,小于0.01更小時說明整體上自變量與Y相關關系顯著。
R2相關系數檢驗法:用來判斷回歸方程的擬合程度,R2的取值在0,1之間,越接近1說明擬合程度越好。
在R語言中參數估計:
summary(lm.ab)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.958571 0.041157 23.291 2.72e-06 ***
x2 -0.055714 0.009203 -6.054 0.00177 **
---
Sig.codes: 0 ‘*** 0.001 ‘** 0.01 ‘* 0.05 ‘. 0.1 ‘ 1
Residual standard error: 0.0487 on 5 degrees of freedom
Multiple R-squared: 0.88, Adjusted R-squared: 0.8559
F-statistic: 36.65 on 1 and 5 DF, p-value: 0.001774
通過查看模型的結果數據,我們可以發(fā)現通過T檢驗的截距和自變量x都是非常顯著,通過F檢驗判斷出整個模型的自變量是非常顯著,同時R2的相關系數檢驗可以判斷自變量和因變量是高度相關的。
最后,我們通過的回歸參數的檢驗與回歸方程的檢驗,得到最后一元線性回歸方程為:
Y=-0.05571×X + 0.95857
模型預測
獲得了一元線性回歸方程的公式,就可以對數據進行預測了。比如,對給定X=x0時,計算出y0=b+a*x0的值,并計算出置信度為1-α的預測區(qū)間。當X=x0,Y=y0時,置信度為1-α的預測區(qū)間為
可得,該商品銷售的第二個月,在預測區(qū)間為0.95的概率時,支付率為84.7%,區(qū)間范圍在[0.795,0.99]之間。
3 模型應用及討論
本研究利用同價位的商品歷史數據,采用了科學的統(tǒng)計分析,避免運營人員在新品限時搶購中盲目的放量,指導每次搶購時允許下單的最大量,很大程度上減少超售的情況,讓購買的用戶能夠及時收到貨,提升了企業(yè)的口碑,同時也保證商品的庫存量與銷量匹配,完成銷售目標。使企業(yè)能夠對每次搶購的運營工作予以更加科學、合理地安排,幫助企業(yè)在銷售的過程中,對自身的形勢進行有效把握,使企業(yè)得到更好地成長和進步。
此模型在正常銷售情況下波動較小,但是要非常準確的預測支付率是一個難點,因為不僅僅商品的價格與銷售時間會影響支付率,還有其他方面會影響用戶最終支付,這些方面有:1.消費者因為自身原因臨時不便做出購買決定;2.信息填錯,如收貨地址,收貨人,收貨人電話,產品型號等信息填錯了,將會取消支付;3. 消費者在支付頁面時,心存顧慮,如果這種顧慮超出其購物欲望,就不會進行支付;4. 消費者只是瀏覽商品并體驗網站,并沒有立即的購買需求。他們只是想體驗一下購買的流程;5. 網站支付防欺詐系統(tǒng)主動拒絕用戶的支付等[4]。
本研究基于一元線性回歸預測支付率的模型,也存在著一定的局限性,主要有如下因素,1.針對支付率線性回歸的預測模型,本研究嘗試對月份數據進行預處理,并忽略天或周的短周期的影響;2.本研究按照單價把商品區(qū)分成不同的類別,并未考慮不同單價商品在同一個訂單的情況,這種情況下不同的單價會相互影響;3.本研究也未考慮促銷等對支付率的影響。希望以后在支付率的預測模型能夠進一步深入研究。
參考文獻
[1]中華人民共和國商務部.中國電子商務報告[M].北京:中國商務出版社,2016.
[2]師義民等.數理統(tǒng)計[M].北京:科學出版社,2015.
[3]查特吉,哈迪等.例解回歸分析(原書第5版)[M].北京:機械工業(yè)出版社,2013.
[4]趙天鵬,曲芳芳.謹防電商支付平臺風險[J].中國金融,2017(3)102-103.endprint