馮喆 王志剛
摘 要:隨著“大數(shù)據(jù)”時代的來臨,卷煙商業(yè)企業(yè)更加重視利用海量數(shù)據(jù)分析洞察消費者行為,以實現(xiàn)更為精準的營銷模式。以T城市A區(qū)實地調查數(shù)據(jù)為樣本數(shù)據(jù),基于消費者購買動機理論,引入支持向量機分類方法,利用支持向量機在解決非線性及高維度識別問題中的優(yōu)勢,提出了一種基于支持向量機的卷煙投放決策模型。
關鍵詞:支持向量機 煙草商業(yè) 購買動機 消費者行為
一、引言
卷煙消費者在選購卷煙時,往往會因循某種購買動機選擇自己需要的卷煙,即使對于同一種品牌卷煙,其價格完全一致,但因消費者的購買動機與消費水平不同,也會產生因不同購買動機驅動消費的情況。如此可見,以上情況便轉換成了一個分類問題,即將不同消費水平的消費者根據(jù)其購買動機匹配相應卷煙的問題。隨著市場經濟的繁榮發(fā)展,一名卷煙消費者往往伴隨著幾種購買動機進行消費,信息維度不斷升高,同時利用調查問卷獲取的可靠數(shù)據(jù)較少,傳統(tǒng)的分類方法已經漸漸不再適用當下的消費環(huán)境。
本次研究以T城市A區(qū)為調查地,首先通過實地調研獲取基于6種卷煙消費者購買動機的消費區(qū)間,并結合2017年度該城市預計投放新品卷煙的零售指導價位構建一個求購滿意度評價函數(shù),以此建立一個預投卷煙與消費者購買行為相匹配的數(shù)據(jù)庫。而后,采用支持向量機(SVM)的多分類方法,通過歸一化數(shù)據(jù)、訓練樣本、核函數(shù)選取、參數(shù)尋優(yōu)等步驟驗證其匹配的準確率。
二、卷煙消費者購買動機理論
購買動機是指為了滿足一定需要而引起人們購買行為的欲望或意念。在現(xiàn)實生活中,每個消費者的購買行為都是由其購買動機引發(fā)的,而動機又是由人的需要而產生的。卷煙消費者的需求與刺激因素的多樣性決定了消費者購買動機的復雜性。一般來說,卷煙消費者購買卷煙的動機包含求實動機、求名動機、求美動機、求新動機、求廉動機、從眾購買動機等。筆者根據(jù)其中主要6種動機進行歸納總結,具體內容如表1所示:
三、投放卷煙匹配數(shù)據(jù)庫的建立
(一)基于購買動機的卷煙消費者信息數(shù)據(jù)獲取
本次研究采取實地調查法,以T城市A區(qū)卷煙消費者為樣本總量,從A區(qū)選取日客流量較大的5個不同檔位卷煙零售店,制作并發(fā)放調查問卷。問卷內容包含被調查者的求實動機消費價格區(qū)間、求名動機消費價格區(qū)間、求美動機消費價格區(qū)間、求新動機消費價格區(qū)間、求廉動機消費價格區(qū)間、從眾購買動機消費價格區(qū)間等六個方面數(shù)據(jù)。截至調查結束,共發(fā)放問卷200份,回收有效問卷169份。由于數(shù)據(jù)量過大只選取了其中5名被調查者數(shù)據(jù)作為樣本數(shù)據(jù)參例。數(shù)據(jù)采集情況如表2所示:
對采集數(shù)據(jù)加以整理,分別將每個購買動機消費區(qū)間的最大、最小值取平均數(shù),數(shù)據(jù)整理情況如表3所示:
(二)新品卷煙銷售價格信息獲取
本次研究選取了2017年T城市A區(qū)煙草公司計劃首次向市場投放的22種新品卷煙,由于計算量較大,選取其中5種不同價位卷煙作為樣本數(shù)據(jù)參例。為方便后續(xù)運算,用標簽a,b,c,d,e逐一代替五種品牌卷煙,并整理其對應零售指導價格,如表4所示:
因此,由表5可知:αb<αc<αa<αe<αd,證明黃金葉(小目標)卷煙與消費者A的購買行為及心理需求更為相符,消費者A更愿意選擇接受并購買黃金葉(小目標)。
依照上述方法,依次對剩下的168名消費者數(shù)據(jù)進行運算,并最終形成5種新品卷煙零售指導價與169名消費者購買行為相互匹配的數(shù)據(jù)庫。由于數(shù)據(jù)量較大,選取5種新品卷煙與5名被調查者(A~E)對照匹配結果作為樣本參例。匹配結果如表6所示:
三、基于支持向量機(SVM)的卷煙投放決策模型
(一)歸一化數(shù)據(jù)
因樣本數(shù)據(jù)中的先驗信息會對優(yōu)化后分類器性能產生直接的影響。因此,在訓練樣本前需要對樣本數(shù)據(jù)進行預處理。其目的為解決因不同的輸入或輸出參數(shù)在數(shù)值上的數(shù)量級差別,或者出現(xiàn)在函數(shù)的飽和(不敏感)區(qū)域,造成的數(shù)值困難問題。另一方面,歸一化之后的數(shù)據(jù)矩陣可以提高模型運算的速率與準確率。綜上所述,本文采取了線性極差變換對樣本數(shù)據(jù)進行預處理。
(二)訓練樣本和測試樣本確定
數(shù)據(jù)預處理完成后,將歸一化后的新矩陣作為支持向量機(SVM)模型的維度數(shù)據(jù)(即,輸入數(shù)據(jù)),將準備投放的22種新品卷煙作為支持向量機(SVM)模型的輸出數(shù)據(jù),用標簽方法進行代替,即形成a,b,c,d,e…共計22個類別,本文采用一對一的分類方法,形成了一個二分類問題(即,如果存在n類,則需要訓練n*(n-1)/2個分類器,用每個分類器進行樣本驗證,得到n*(n-1)/2個預測結果)。最后根據(jù)結果進行投票,得到票數(shù)最多的即為驗證樣本所屬類別。
本次研究將數(shù)據(jù)庫樣本平均分為兩部分,分別作為訓練集和驗證集。選取新品卷煙標簽作為行向量,選取被調查者6種購買行為的數(shù)值作為列向量,從而形成一個訓練樣本矩陣,并以同樣方法將剩下的數(shù)據(jù)形成一個驗證樣本矩陣。
(三)核函數(shù)的選取
在解決卷煙消費者購買動機分析的案例中,對于核函數(shù)的選取變得尤為關鍵。由于消費者行為受到不同購買動機驅使,不同的購買動機又因循消費者個人習慣、社會階層、年齡等各個方面因素而產生,造成了整個系統(tǒng)呈現(xiàn)了高維度、高噪音以及不確定性。
一方面,選擇適用的核函數(shù)可實現(xiàn)樣例特征映射到高維空間,從而使線性不可分情況得以轉化;另一方面,核函數(shù)的價值更體現(xiàn)在首先在低維進行計算,將實質上的分類效果表現(xiàn)在了高維上,從而避免了直接在高維空間進行復雜計算導致維度過高的情況。常用核函數(shù)類型如表7所示:
最常見的核函數(shù)選取方法包括:根據(jù)特性進行選取、進行多次實驗進行對比尋優(yōu)或將多個核函數(shù)結合形成混合函數(shù)。本文采用libsvm軟件作為實驗工具,選取四種常用核函數(shù)分別進行對比試驗,將參數(shù)C(懲罰因子)設置為10,其他參數(shù)為默認值,選取分類準確率e最高的常用核函數(shù)作為本文SVM模型的核函數(shù)。
如表8所示,高斯(RBF)核函數(shù)分類準確率為84.58%,高于其他三個函數(shù)的準確率。此外,高斯(RBF)核函數(shù)還具有對于大、小樣本性能表現(xiàn)較強、參數(shù)調整迅速等特性。綜合考慮,最終選取高斯(RBF)核函數(shù)為本文SVM模型的核函數(shù)。
(四)參數(shù)尋優(yōu)
由于懲罰因子C和參數(shù)系數(shù)g對RBF核函數(shù)的性能產生較大影響,從而影響回歸精度。本文采取交叉檢驗(Cross Validation.CV)方法來驗證分類器性能,從而進行參數(shù)的尋優(yōu)。其基本思想是將原始數(shù)據(jù)進行分組,形成訓練集(Train set)和驗證集(Validation set),用訓練集進行分類器訓練,再用驗證集測試訓練得到的模型,以此作為評價分類器的性能指標。通過交叉檢驗,最終將最優(yōu)參數(shù)確定為C(懲罰因子)=10,g(參數(shù)系數(shù))=0.04。選擇此參數(shù)的情況下,分類準確率e達到了88.7%。為方便展示,圖1為訓練集84名消費者與A、B、C、D、E五種卷煙的匹配結果:
四、結語
本文以卷煙消費者購買行為理論為理論基礎,利用支持向量機(SVM)在分類統(tǒng)計上的優(yōu)勢,將不同價位品牌卷煙與不同消費者心理需求相匹配,主要解決在“大數(shù)據(jù)”市場環(huán)境下卷煙投放過程中“怎么投、投多少”的問題,為區(qū)域范圍內的煙草公司精準投放工作做出決策支持。本次研究在以下兩個方面仍需更深度的挖掘:
1.隨著大多數(shù)學者對消費者行為的研究深入,現(xiàn)代消費者行為理論不僅僅聚焦于購買行為,還應包含:需求獲取、購買動機、使用體驗、售后評價等多方面,進一步全面并完善的采集影響因素,從而更好地將影響消費者行為的因素定性化、定量化,是確保后續(xù)統(tǒng)計分析工作精準化的重要前提。
2.目前,用戶消費者行為分析的主要方法包含層次分析法、BP神經網(wǎng)絡、貝葉斯網(wǎng)絡等。部分研究學者在其他研究領域已完成以上部分分析法的試驗對比(徐晟皓,楊楠堃,易夢喬,2015),但在以消費者6種購買行為為基礎理論的研究方面仍屬空白,利用BP神經網(wǎng)絡、貝葉斯網(wǎng)絡、支持向量機等不同方法分別進行試驗,擇優(yōu)選取適合當下卷煙市場環(huán)境的分析方法,成為了需要進一步研究的方向。
參考文獻:
[1]毛連忠,郝礦榮,丁永生.基于支持向量機的服裝號推薦模型建立[J].微型電腦應用,2016(3):1—4.
[2]徐晟皓,楊楠堃,易夢喬.基于支持向量機的消費者行為分類方法[J].價值工程,2015(4):19—21.
[3]柯圣.基于樣本先驗信息的正則化型分類器設計研究[D].華東理工大學,2014.
[4]汪晨雪.消費者卷煙品牌選購動機因素研究[D].江西師范大學,2013.
[5]Solomon,MichaelR.Consumer Behavior[M].Pearson Education,2011:12—27.
[6]胡海青,張瑯,張道宏,陳亮.基于支持向量機的供應鏈金融信用風險評估研究[J].軟科學,2011(5):26—30.
[7]宋暉,薛云,張良均.基于SVM分類問題的核函數(shù)選擇仿真研究[J].計算機與現(xiàn)代化,2011(8):133—136.
[8]萬莉.基于支持向量機的非線性系統(tǒng)建模與預測控制[D].中國石油大學(華東),2006.
[9]Hsu C.W, Lin C J.A comparison of Methods for muti-class support vector machines[J].IEEE Transactions on Neural Networks,2002,13(2):415—425.
[10]Vladimir N,Vapnik.Statistical training Theory[M].Wiley—Inter Science,1998:9—16.
(馮喆、王志剛,天津市煙草專賣局。)