潘 程 陳玉華
(大連海事大學(xué)信息科學(xué)技術(shù)學(xué)院,遼寧 大連 116026)
當(dāng)前,全球零售業(yè)發(fā)展勢(shì)頭迅猛。在信息流通先于商品流通的時(shí)代,零售企業(yè)必須依靠企業(yè)的全面信息化來(lái)可持續(xù)發(fā)展。很多零售企業(yè)已采用了一系列信息技術(shù)。在信息化進(jìn)程加快同時(shí),也帶來(lái)海量的、分布的、異構(gòu)的數(shù)據(jù)信息。如果數(shù)據(jù)不能及時(shí)的轉(zhuǎn)化為知識(shí),那么零售企業(yè)經(jīng)營(yíng)決策的正確性和時(shí)效性將大打折扣。于是,近幾年來(lái)數(shù)據(jù)挖掘技術(shù)在零售業(yè)得到了廣泛的應(yīng)用。利用數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)據(jù)進(jìn)行分析,可以幫助零售企業(yè)進(jìn)行科學(xué)的決策。
數(shù)據(jù)挖掘是從大量、不完全、有噪聲、模糊、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中抽取隱含在其中的、有意義、未知的但有潛在使用價(jià)值的知識(shí)和信息過(guò)程。從商業(yè)角度看,數(shù)據(jù)挖掘是新型的商業(yè)分析處理技術(shù)[1]。它是從大型數(shù)據(jù)庫(kù)中發(fā)現(xiàn)并提取隱藏在其中信息的一種新技術(shù),幫助決策者尋找數(shù)據(jù)間潛在的關(guān)聯(lián),發(fā)現(xiàn)被忽略的因素。
數(shù)據(jù)挖掘涉及的學(xué)科領(lǐng)域和方法很多,包括統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)、模式識(shí)別、可視化以及高性能計(jì)算等多個(gè)學(xué)科。根據(jù)任務(wù)可分為:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、分類或預(yù)測(cè)模型發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、數(shù)據(jù)總結(jié)、聚類、依賴關(guān)系或依賴模型發(fā)現(xiàn)、異常和趨勢(shì)發(fā)現(xiàn)等;根據(jù)挖掘方法可分為:統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法和數(shù)據(jù)庫(kù)方法。統(tǒng)計(jì)方法包括:回歸分析、判別分析、聚類分析、探索性分析等;機(jī)器學(xué)習(xí)方法包括:基于范例學(xué)習(xí)、歸納學(xué)習(xí)方法、遺傳算法等;神經(jīng)網(wǎng)絡(luò)方法包括:前向神經(jīng)網(wǎng)絡(luò)、自組織神經(jīng)網(wǎng)絡(luò)等;數(shù)據(jù)庫(kù)方法主要是多維數(shù)據(jù)分析[2]。
3.1 貨籃分析:關(guān)聯(lián)分析的一個(gè)典型應(yīng)用是購(gòu)物籃分析。設(shè)商場(chǎng)銷售的所有商品為一個(gè)集合,每個(gè)商品為一個(gè)取布爾值的變量,描述相應(yīng)商品是否被一個(gè)顧客購(gòu)買,那么每個(gè)顧客的購(gòu)物貨籃就可以用布爾向量來(lái)表示。分析布爾向量,由關(guān)聯(lián)規(guī)則得出商品在一起被購(gòu)買的信息。其意義為顧客在購(gòu)買某些商品的時(shí)候有多大傾向會(huì)購(gòu)買另外一些商品。例如:{黃油,牛奶}→{面包}(30%,2%),表明購(gòu)買黃油和牛奶的顧客還將購(gòu)買面包,30%和2%分別是該規(guī)則的置信度和支持度,2%表示分析的全部事務(wù)中有2%同時(shí)購(gòu)買了黃油、牛奶和面包,30%表示購(gòu)買黃油和牛奶的顧客中有30%的顧客也購(gòu)買了面包。貨籃分析有助于確定商店貨架的布局、商品定價(jià)和促銷。
3.2 客戶細(xì)分:客戶細(xì)分是指將一個(gè)大的消費(fèi)群體劃分為若干小的細(xì)分群體,同屬于一個(gè)細(xì)分群的客戶具有相似的消費(fèi)特征。通過(guò)對(duì)顧客分類可以提供個(gè)性化的服務(wù)。例如,購(gòu)買化妝品的客戶分為青年、中年和老年,分析發(fā)現(xiàn)購(gòu)買進(jìn)口化妝品的顧客中青年占50%,中年占30%,老年占20%。針對(duì)不同的客戶群,可以實(shí)施不同的營(yíng)銷和服務(wù)方式,提供有針對(duì)性的產(chǎn)品和服務(wù)來(lái)提高客戶的滿意度[3]。
3.3 促銷活動(dòng)的有效性分析:只有充分了解客戶,才能準(zhǔn)確定位促銷對(duì)象,提高針對(duì)性,降低活動(dòng)成本。零售業(yè)通過(guò)廣告、優(yōu)惠券、各種折扣和讓利的方式搞促銷活動(dòng),以達(dá)到促銷產(chǎn)品,吸引顧客的目的。用多維關(guān)聯(lián)分析方法,通過(guò)比較促銷期間的銷售量和交易數(shù)量與促銷活動(dòng)前后的有關(guān)情況,認(rèn)真分析促銷活動(dòng)的有效性,還可以分析出應(yīng)該在什么時(shí)間,什么地點(diǎn)、以什么種方式、什么商品和對(duì)什么樣的人進(jìn)行促銷活動(dòng),盡量避免企業(yè)資源的浪費(fèi),提高銷售額。
3.4 顧客忠誠(chéng)度分析:零售企業(yè)通過(guò)辦理會(huì)員卡、建立顧客會(huì)員制度的方式,來(lái)跟蹤顧客的消費(fèi)行為。通過(guò)對(duì)顧客會(huì)員卡信息進(jìn)行數(shù)據(jù)挖掘,可以記錄顧客的購(gòu)買序列,將同一顧客在不同時(shí)期購(gòu)買的商品分組,確定特定個(gè)體的興趣、消費(fèi)習(xí)慣、消費(fèi)傾向和消費(fèi)需求,由時(shí)間序列模式推斷出相應(yīng)消費(fèi)群體或個(gè)體下一步的消費(fèi)行為。序列模式挖掘用于分析顧客的購(gòu)買趨勢(shì)或忠誠(chéng)度的變化,據(jù)此對(duì)價(jià)格和商品的花樣加以調(diào)整和更新,以便留住老客戶,吸引新客戶[4]。
3.5 市場(chǎng)和趨勢(shì)分析:零售企業(yè)在決定開展哪一項(xiàng)營(yíng)銷活動(dòng)時(shí),通過(guò)從銷售數(shù)據(jù)記錄中挖掘關(guān)聯(lián)信息,能夠很容易地對(duì)不同的營(yíng)銷項(xiàng)目進(jìn)行比較和分析,這樣就能把資金投在最有價(jià)值的地方。例如有些顧客對(duì)某一品牌的香水情有獨(dú)鐘,那么他們很可能購(gòu)買同一品牌的化妝品。這些信息可用于形成一定的購(gòu)買推薦。通過(guò)向顧客郵寄商品目錄、信函等舉措,幫助顧客選擇商品,既能節(jié)省大量的市場(chǎng)開拓費(fèi)用,同時(shí)也有利于增加銷售額[5]。
某集團(tuán)是一家大型商業(yè)零售企業(yè)。已實(shí)現(xiàn)了企業(yè)管理信息化,引入了客戶關(guān)系管理系統(tǒng)。該系統(tǒng)可以向集團(tuán)的采購(gòu)、市場(chǎng)和服務(wù)部門提供全面的實(shí)時(shí)資料,并強(qiáng)化信息挖掘分析功能,隨時(shí)從資料庫(kù)中取出所需資料,配合資料分析方法,分析出客戶消費(fèi)行為模式和習(xí)慣,提供具有個(gè)性化和貼心的服務(wù)。
該系統(tǒng)的消費(fèi)者分析主要體現(xiàn)在:客戶保留度、客戶價(jià)值度、客戶滿意度、客戶忠誠(chéng)度和客戶群體分析等功能。在建立數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上,選取合適的模型對(duì)消費(fèi)者的保留度、群體分類等進(jìn)行分析和預(yù)測(cè)。
在消費(fèi)者管理分析中,采用關(guān)聯(lián)規(guī)則分析方法,將相似消費(fèi)者分類,研究客戶的消費(fèi)行為,分析客戶個(gè)人特征(年齡、性別、職業(yè)、月收入、教育程度等),客戶消費(fèi)行為(支付方式、消費(fèi)次數(shù)、累計(jì)消費(fèi)金額、持卡類型、貴賓卡積分、時(shí)間段、業(yè)種、消費(fèi)頻率等)和客戶態(tài)度,分辨出不同的零售業(yè)消費(fèi)群體在消費(fèi)習(xí)慣和消費(fèi)傾向上的不同特征。
例如該系統(tǒng)對(duì)貴賓卡客戶某一時(shí)間段的消費(fèi)行為進(jìn)行分析后發(fā)現(xiàn):
710個(gè)貴賓卡客戶在商場(chǎng)的52個(gè)商戶中有交易記錄,分析發(fā)現(xiàn)客戶的消費(fèi)習(xí)慣是有規(guī)律的,在80天的分析期內(nèi)有28天貴賓卡客戶在A商戶消費(fèi)后又有80%可能去B商戶消費(fèi),有25天貴賓卡客戶在A商戶消費(fèi)后又有73%可能會(huì)去B商戶和C商戶消費(fèi)。
4.2.1 銀卡客戶在年齡上較金卡客戶年輕,持卡年限短,但用卡頻率高,多為信用卡支付,刷卡消費(fèi)態(tài)度積極;
4.2.2 不同地區(qū)的貴賓卡客戶在人口特征、用卡行為和支付方式上存在差異,市場(chǎng)成熟度越高,客戶的平均教育程度和收入水平越高,持卡年限越長(zhǎng),消費(fèi)比重更大。
4.3.1 消費(fèi)者普遍對(duì)國(guó)內(nèi)液晶電視的認(rèn)知度較低,國(guó)外品牌的認(rèn)知度高于國(guó)內(nèi)品牌;
4.3.2 34%的消費(fèi)者以節(jié)省空間為主要?jiǎng)訖C(jī),其次才是畫質(zhì);
4.3.3 實(shí)際購(gòu)買液晶電視的消費(fèi)者中超過(guò)90%購(gòu)買了黑色或銀色產(chǎn)品;
4.3.4 連鎖店和量販店是消費(fèi)者購(gòu)買產(chǎn)品的主要渠道,6%的消費(fèi)者通過(guò)網(wǎng)絡(luò)購(gòu)物,成為第二購(gòu)買渠道。
通過(guò)以上分析,可以為企業(yè)采取有針對(duì)性的營(yíng)銷策略提供決策信息。
該系統(tǒng)應(yīng)用后,成效顯著。供應(yīng)商由三千家調(diào)整為兩千多家,引進(jìn)新商品近四百個(gè),新品種提升到一千多種。采購(gòu)和管理成本明顯降低。企業(yè)信譽(yù)度也大大提升。
[1]朱玉全.數(shù)據(jù)挖掘技術(shù).南京:東南大學(xué)出版社,2006.
[2]劉芳,王璐鑫.數(shù)據(jù)挖掘技術(shù)及其在零售業(yè)中應(yīng)用的初步研究.福建電腦,2009,(8):56-57.
[3]宣軍英.數(shù)據(jù)挖掘及其在零售業(yè)中的應(yīng)用.嘉興學(xué)院學(xué)報(bào),2007,7(4):76-79.
[4]胡錦美.數(shù)據(jù)挖掘在零售業(yè)中的應(yīng)用.閩江學(xué)院學(xué)報(bào),2003,10(5):45-47.
[5]李志亮,羅芳.數(shù)據(jù)挖掘在零售業(yè)中的應(yīng)用.寧德師專學(xué)報(bào)(自然科學(xué)版),2008,8(3):242-244.