文/李東輝 舒煜 貴州師范大學 經(jīng)濟與管理學院
隨著互聯(lián)網(wǎng)的全國性普及,物流業(yè)的蓬勃發(fā)展,網(wǎng)絡購物以其更加低廉的價格、更多的商品選擇等優(yōu)勢漸漸代替了實體購物。作為網(wǎng)絡店鋪主體,揣測消費者對關聯(lián)產(chǎn)品的購買意向,在很大程度上能幫助網(wǎng)絡商家進行更好的網(wǎng)絡營銷。本文基于大數(shù)據(jù)背景,充分結合數(shù)據(jù)挖掘理論中的相關技術,利用對以往顧客進行網(wǎng)絡購物時的關聯(lián)產(chǎn)品購買數(shù)據(jù),進行數(shù)據(jù)信息挖掘,擬判斷顧客的相關產(chǎn)品購買意向。本文僅僅以示例的形式從數(shù)據(jù)挖掘角度進行顧客購買意向的預判,并未進行大量實體驗證,因此,文章所列內(nèi)容只作為供參考的理論基礎。
數(shù)據(jù)挖掘/關聯(lián)產(chǎn)品/購買意向
隨著信息技術的普及、互聯(lián)網(wǎng)的迅速發(fā)展、網(wǎng)絡覆蓋度的大幅提升,中國已經(jīng)進入了網(wǎng)絡時代。同時,中國實體營銷也向網(wǎng)絡營銷邁出了長遠的一步,網(wǎng)上宣傳、網(wǎng)上策劃以及網(wǎng)上促銷等等一些列商家活動,都獲得了很大的成功。網(wǎng)絡支付方便快捷,網(wǎng)上產(chǎn)品豐富多彩,網(wǎng)上價格更加優(yōu)惠,這些因素也成功吸引了購物者的眼球,使更多的人參與到網(wǎng)購行列中來。網(wǎng)上店鋪的風靡與大批量現(xiàn)存及潛在的網(wǎng)購顧客成功開辟了市場營銷的第二條路徑,并且發(fā)展迅猛。
但是,網(wǎng)絡商家間的競爭卻也日益激烈,除了以更好的品質、低廉的價格、優(yōu)質的服務來贏得更多的忠誠顧客外,還應對顧客的購買意向進行較為深入的感知與挖掘。在本文中,核心針對網(wǎng)絡商品的關聯(lián)產(chǎn)品網(wǎng)購意向進行舉例式數(shù)學模擬分析(即以手機配件、屏幕保護膜及耳機等作為手機的關聯(lián)商品,進行分析),并由此對一般性網(wǎng)絡商品的關聯(lián)產(chǎn)品的營銷提出相關策略。
數(shù)據(jù)挖掘(Data mining)是數(shù)據(jù)庫知識發(fā)現(xiàn)中的一個步驟,是一個逐漸演變的過程,通過這個過程,可以把商業(yè)經(jīng)驗以及生活中的知識與海量數(shù)據(jù)進行對應結合,使得人們將抽象復雜的問題通用簡單數(shù)字信息表現(xiàn)出來。利用數(shù)據(jù)挖掘技術,可以使人們更準確的認識問題,更深入的發(fā)現(xiàn)市場機遇,也可以做出更明智的決策。
商業(yè)活動中的數(shù)據(jù)挖掘可以這樣理解:數(shù)據(jù)挖掘作為一種商業(yè)信息的處理方法,通過數(shù)據(jù)挖掘中諸多方法中的可適用方法,來進行商業(yè)信息數(shù)據(jù)的深層次剖析,從而進行抽取、轉換、分析以及運用其他一些模型化處理方法,目的是獲取能輔助進行商業(yè)決策的重要關鍵數(shù)據(jù)和關鍵的依托關系等重要隱含信息。
數(shù)據(jù)挖掘中的關聯(lián)規(guī)則,也通??梢苑Q作關聯(lián)模式,它是單向的,是指某類項目或特征與另一類項目或特征間所存在的單向影響關系[1]。關聯(lián)規(guī)則挖掘技術用于發(fā)現(xiàn)數(shù)據(jù)庫中的屬性之間的隱含聯(lián)系,這和傳統(tǒng)的生產(chǎn)方式規(guī)則不同,關聯(lián)規(guī)則可以有一個或多個輸出屬性,同時,一個規(guī)則的輸出屬性可以同時是另一個規(guī)則的輸入屬性[2]。由關聯(lián)分析方法的性質可以看出,該方法非常適合類似于購物籃類問題的分析解決。
以關聯(lián)的角度來進行分析,能挖掘大量數(shù)據(jù)信息中隱藏起來的聯(lián)系,這種被挖掘出來的聯(lián)系就可以用關聯(lián)規(guī)則來表示。即通過對以往數(shù)據(jù)信息進行匯總,將其作為數(shù)據(jù)挖掘的數(shù)據(jù)倉庫,并利用數(shù)據(jù)挖掘類軟件進行操作,便可得出相應的關聯(lián)規(guī)則,再將挖掘出來的關聯(lián)規(guī)則經(jīng)過解釋和評估,驗證其可靠性,最后得出結果并應用。
鑒于網(wǎng)絡市場的獨有性質,對于客戶的訪問、消費、回饋等信息都能夠很好的進行統(tǒng)計和存儲,因此,網(wǎng)購顧客數(shù)據(jù)進行挖掘更加方便,應用更加高效。
當網(wǎng)購顧客訪問某一個購物網(wǎng)站的時候,網(wǎng)絡商家通過相應合理的數(shù)據(jù)統(tǒng)計工具對顧客的可統(tǒng)計信息進行數(shù)據(jù)類匯總,形成一個大型的顧客信息數(shù)據(jù)庫。其中,針對本文所研究涉及的領域與內(nèi)容,進行初步的數(shù)據(jù)篩選,獲得具有針對性的初級數(shù)據(jù)源,為接下來的數(shù)據(jù)挖掘做好準備。
由于數(shù)據(jù)挖掘需要標準的數(shù)據(jù)來進行操作,因此,還需要對已經(jīng)進行過初次篩選的數(shù)據(jù)整理,統(tǒng)一標準后才可以形成能進行數(shù)據(jù)挖掘操作的數(shù)據(jù)倉庫。然后,對數(shù)據(jù)倉庫運用數(shù)據(jù)挖掘技術進行深層次挖掘,獲得更為重要的信息或關聯(lián)規(guī)則。接下來對這些挖掘結果進行合理的解釋評估,得到數(shù)據(jù)挖掘結果。數(shù)據(jù)挖掘結果不能直接作為數(shù)據(jù)挖掘模型終端,在進行結果應用的同時,要進行應用效果反饋,以持續(xù)調整數(shù)據(jù)挖掘算法,爭取獲得更為優(yōu)化的數(shù)據(jù)挖掘算法,使挖掘成效最大化。鑒于以上描述,可以構建一個具體的據(jù)挖掘處理模型(如圖1),通過模型中的步驟逐步進行數(shù)據(jù)分析與處理,最后預判網(wǎng)購顧客對關聯(lián)產(chǎn)品的購買意向。
圖1 關聯(lián)產(chǎn)品購買意向的數(shù)據(jù)挖掘處理模型
關聯(lián)規(guī)則作為本文中的一項重要規(guī)則,與傳統(tǒng)的分類規(guī)則不同,關聯(lián)規(guī)則中的各個屬性可以重復出現(xiàn)在下一輪規(guī)則聯(lián)系中。因此,在網(wǎng)購顧客購買任意產(chǎn)品或產(chǎn)品組合時,可以利用這一規(guī)則推斷其關聯(lián)產(chǎn)品的購買可能性和意愿強度。
經(jīng)調研某專賣移動設備的網(wǎng)絡商家發(fā)現(xiàn),其產(chǎn)品主要可以分為手機和手機配件系列兩大模塊。其中,手機可以分為高端手機和普通手機,手機配件系列在本文中僅以手機護具和耳機作為主要案例資料。手機護具主要分為手機膜和手機防護外殼。以該商家的某月購物顧客訪問后具體購買數(shù)據(jù)為例,獲得其初步篩選后的數(shù)據(jù)表如下:
備注:為便于計算,以十位為最小單位,四舍五入保存數(shù)值
從上表中的數(shù)據(jù)及信息看起來比較混亂,因此,整理成較為直觀同時更容易理解的二維交叉表形式,見下表:
手機Y1 Y X單獨購買 合計高端手機Y11普通手機Y12耳機X1 440 300 120 860手機配件系列手機護具系列X2手機膜X21 510 260 300 1070手機防護外殼X22 310 210 80 600單獨購買 150 200 總交易數(shù):2410合計 1410 970
根據(jù)交叉表中的數(shù)據(jù),可以挖掘出很多關聯(lián)規(guī)則,例如:手機膜和高端手機之間的關系(X21——Y11)。關聯(lián)規(guī)則有著兩個重要的屬性:支持度和置信度。
1.3.2 學生對案例教學法的反饋 討論課全部結束后,教師集體討論并設計問卷調查表,要求實驗組從對教學方法滿意度以及是否促進自主學習、學習能力、學習興趣、與教師交流等方面,對病例討論教學法的效果進行評價。共發(fā)出問卷151份,收回問卷151份,問卷回收率、有效率為100.00%。
(1)支持度(support):某項目集的支持度就是指在所有事物集數(shù)據(jù)庫中,包含該項目集的所有事物占整體所有事物的比例。因此,手機膜與高端手機關聯(lián)規(guī)則的支持度可以按如下計算:
S u p(X 2 1——Y 1 1)=X 2 1、Y 1 1 同時出現(xiàn)次數(shù)/事件總數(shù)=P(X21Y11)=21.16%。
(2)置信度(confidence)是指在事物數(shù)據(jù)庫中,購買了一類商品,同時又購買了另一類商品的交易概率,可以按照概率統(tǒng)計中的條件概率進行計算:
Conf(X21——Y11)=P(Y11/X21)=P(X21Y11)/ P(X21)=X21、Y11出現(xiàn)次數(shù)/X21出現(xiàn)次數(shù)=47.66%。
根據(jù)以上關聯(lián)規(guī)則的計算方法,可以通過SAS Enterprise Miner等軟件獲得大量的關聯(lián)規(guī)則。以本例中高端手機對各類手機配件關聯(lián)規(guī)則的支持度和置信度數(shù)據(jù)表格,如下表:
組合 關聯(lián)規(guī)則 支持度% 置信度%高端手機—耳機 Y11—X1 18.25 51.16高端手機—手機膜 Y11—X21 21.16 36.17高端手機—手機防護外殼 Y11—X22 12.86 21.98
基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘方法,可以對網(wǎng)購顧客的關聯(lián)產(chǎn)品購買意向進行深層次的剖析,因此,可以將這一理論應用在具體的網(wǎng)絡營銷中,提出相應實用的網(wǎng)絡營銷策略。
通過關聯(lián)規(guī)則數(shù)據(jù)挖掘可知,一個購物組合支持度的高低,表明在所有購物搭配中,該組合被選中出現(xiàn)的概率高低。因此,通過進行大量的數(shù)據(jù)挖掘,可以在網(wǎng)絡店鋪所有購物數(shù)據(jù)中,將各種組合的支持度按照從高到低的次序排列。借助這個可以獲知的排序,來安排產(chǎn)品搭配促銷策略,一捆綁銷售的模式提高產(chǎn)品的銷售量。這樣做還可以大大縮減購物者單獨購買而產(chǎn)生的額外附加費用,如二次物流費、人工費、包裝費用等等。對于購買者而言,還可以享受獨有的購物組合優(yōu)惠??傊灾С侄葹楹诵牡木W(wǎng)絡營銷策略可以實現(xiàn)網(wǎng)絡店鋪與購物者之間的雙贏。
在網(wǎng)絡店鋪中,置信度表示的是購買店鋪內(nèi)任意產(chǎn)品后,購買另一產(chǎn)品的交易概率,也可以理解成為購物者對置信度高的關聯(lián)產(chǎn)品購買意向更加強烈。因為網(wǎng)絡店鋪往往都是一些相關產(chǎn)品或者是替代產(chǎn)品的集群,產(chǎn)品之間存在著或多或少的互補或搭配的關系,所以對于置信度較高的關聯(lián)產(chǎn)品組合來說,更容易受到消費者的青睞。
經(jīng)過數(shù)據(jù)挖掘分析,某關聯(lián)產(chǎn)品組合的置信度高,即當購物者購買某一種產(chǎn)品時,立即自動推送與其相關聯(lián)的高置信度產(chǎn)品。在對店鋪內(nèi)的所有產(chǎn)品銷售數(shù)據(jù)進行數(shù)據(jù)挖掘后,關聯(lián)規(guī)則中的置信度排序也呈現(xiàn)出來,那么消費者購買任意產(chǎn)品,都可以按照置信度從高到低排序,推送產(chǎn)品。這種信息推送方式就徹底顛覆了原有了同類替代產(chǎn)品信息推送模式,因為原有的替代品推送模式僅僅能在選擇的時候提供多一種選擇,究其根本對銷售量沒有提高,而以置信度為核心的網(wǎng)絡營銷策略卻能大大提高銷售量。
在沒有進行關聯(lián)產(chǎn)品銷售數(shù)據(jù)挖掘的網(wǎng)絡店鋪,對于店鋪內(nèi)的產(chǎn)品的融合度并不十分了解。對于某一產(chǎn)品,假如與任何產(chǎn)品關聯(lián)組合的支持度和置信度都較低(不同店鋪內(nèi)高低水平不同,需具體參照),且該產(chǎn)品獨自銷售的概率或者利潤偏低,那么該產(chǎn)品可以被視為該店鋪內(nèi)的不融合產(chǎn)品,在進行產(chǎn)品更新的時候,可以首選作為淘汰對象。
這種更新店鋪重塑銷售產(chǎn)品的方法也可以作為一種營銷策略,作用不在于擴大銷售,而在于提高店鋪整體的銷售效率和質量,是一種戰(zhàn)略型營銷策略。
以上三種營銷策略是基于數(shù)據(jù)挖掘理論對網(wǎng)購顧客關聯(lián)產(chǎn)品購買意向進行分析后,所得出的具有針對性的主要營銷策略。這些策略充分利用了網(wǎng)絡店鋪信息數(shù)據(jù)獲取易、產(chǎn)品信息推送方便、產(chǎn)品更新便捷等優(yōu)勢,同時結合數(shù)據(jù)挖掘關聯(lián)規(guī)則的可應用性。但對于這些策略的具體成效還待檢驗,暫時僅僅為可執(zhí)行的參考性營銷策略。
在本文中,利用數(shù)據(jù)挖掘技術在網(wǎng)絡銷售方面的應用空間,重點將關聯(lián)規(guī)則應用于網(wǎng)絡關聯(lián)產(chǎn)品是否購買的預判,進而有效幫助網(wǎng)絡商家采取針對性的銷售策略和產(chǎn)品推薦。
鑒于本文篇幅有限,雖然以一個具體案例進行驗證說明,但并沒有專門針對大型網(wǎng)絡店鋪數(shù)據(jù)庫進行數(shù)據(jù)挖掘,因此需要實踐者,應用所構建的關聯(lián)產(chǎn)品數(shù)據(jù)處理模型中的調整數(shù)據(jù)挖掘算法的循環(huán)步驟,不斷優(yōu)化數(shù)據(jù)挖掘算法以及逐步剔除數(shù)據(jù)庫中的雜質數(shù)據(jù),使得數(shù)據(jù)挖掘結果更加可靠。同時,也希望更多學者對本文理論及思想進行不斷的拓展和補充,獲得更多的研究價值。
[1]安建華.數(shù)據(jù)挖掘技術在零售業(yè)中的應用研究[D].東北財經(jīng)大學,2005年12 月.
[2]Richard J.Roiger,Michael W.Geatz 著. 翁 敬 農(nóng) 譯.Data Mining A Tutorial-Based Primer[M].北京:清華大學出版社,2003 年11 月.
[3]廖芹,郝志峰,陳志宏.數(shù)據(jù)挖掘與數(shù)學建模[M].北京:國防工業(yè)出版社,2012 年2 月.
[4]Xindong Wu,Vipin Kumar著.李文波,吳素研譯.數(shù)據(jù)挖掘十大算法[M].北京:清華大學出版社,2013 年5 月.
[5]歐陽圣,數(shù)據(jù)挖掘在消費行為分析中的應用[D],湖南大學,2011年4月.