【摘 要】介紹了大數(shù)據(jù)的基本概念,核心和大數(shù)據(jù)挖掘,并探討了大數(shù)據(jù)在零售業(yè)中的應(yīng)用。
【關(guān)鍵字】大數(shù)據(jù);數(shù)據(jù)挖掘;CRISP-DM;顧客價(jià)值主張
一、大數(shù)據(jù)
“大數(shù)據(jù)”由英文“Big Data”翻譯而來,指大小超出了傳統(tǒng)數(shù)據(jù)庫軟件工具的抓取、存儲(chǔ)、管理和分析能力的數(shù)據(jù)群。究竟多大才算大數(shù)據(jù),這個(gè)定義根據(jù)行業(yè)的不同會(huì)有所差異,目前眾多行業(yè)的大數(shù)據(jù)范圍可以從幾十TB到數(shù)千TB。
二、大數(shù)據(jù)的核心
大數(shù)據(jù)具有數(shù)據(jù)量大、查詢分析復(fù)雜等特點(diǎn)。在大數(shù)據(jù)時(shí)代,建立在人們的習(xí)慣思維基礎(chǔ)上的關(guān)聯(lián)分析已經(jīng)不適用了,因?yàn)閿?shù)據(jù)量太大而且需要考慮的因素眾多?,F(xiàn)在通過計(jì)算機(jī)就可以完成復(fù)雜的相關(guān)關(guān)系分析,建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)是大數(shù)據(jù)的核心。相關(guān)關(guān)系分析法更準(zhǔn)確、更快,而且不易受偏見影響,能夠得到準(zhǔn)確的預(yù)測(cè)結(jié)果。
美國(guó)折扣零售商塔吉特(Target)使用大數(shù)據(jù)的相關(guān)關(guān)系分析,找出了大概20多種關(guān)聯(lián)物,使用這些關(guān)聯(lián)物對(duì)顧客進(jìn)行“懷孕趨勢(shì)”評(píng)分,比較準(zhǔn)確地預(yù)測(cè)預(yù)產(chǎn)期,在孕期每個(gè)階段為客戶寄送相應(yīng)的優(yōu)惠券。大數(shù)據(jù)時(shí)代,找出相關(guān)的關(guān)聯(lián)物并監(jiān)控它,就能夠準(zhǔn)確的預(yù)測(cè)未來。
三、大數(shù)據(jù)挖掘
從看似平淡無奇的記錄資料中發(fā)現(xiàn)、歸納和獲取有價(jià)值信息的過程,就是數(shù)據(jù)挖掘(Data mining)。大數(shù)據(jù)不僅僅只有數(shù)字,還包含大量的文本、超鏈接、音頻和視頻等信息。大數(shù)據(jù)挖掘能夠幫助人們從繁雜的數(shù)據(jù)中找到最有價(jià)值的信息。
CRISP-DM是一套被廣泛應(yīng)用的跨行業(yè)標(biāo)準(zhǔn)流程,這個(gè)流程包含業(yè)務(wù)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、建立模型、模型評(píng)估和模型發(fā)布六個(gè)階段。
(一)業(yè)務(wù)理解:確定挖掘的內(nèi)容,了解相關(guān)對(duì)象的現(xiàn)狀,制定目標(biāo)和計(jì)劃。
(二)數(shù)據(jù)理解:當(dāng)確定了挖掘的內(nèi)容和計(jì)劃,就需要考慮數(shù)據(jù)了。包括原始數(shù)據(jù)搜集、數(shù)據(jù)描述、數(shù)據(jù)探索和質(zhì)量核查。通常和業(yè)務(wù)理解反復(fù)進(jìn)行,確定最終的對(duì)象和數(shù)據(jù)。
(三)數(shù)據(jù)準(zhǔn)備:顧名思義,就像裝修需要對(duì)建材進(jìn)行篩選、加工,原始數(shù)據(jù)中包含大量的錯(cuò)誤、重復(fù)和不符合要求的信息,需要?jiǎng)h除、整理和轉(zhuǎn)化。數(shù)據(jù)準(zhǔn)備相當(dāng)于數(shù)據(jù)探索,對(duì)數(shù)據(jù)進(jìn)行粗加工,為后續(xù)的模型建立做準(zhǔn)備。
(四)建立模型:本階段主要是描繪數(shù)據(jù)并建立關(guān)聯(lián),使用一定的分析方法借助數(shù)據(jù)挖掘工具進(jìn)行數(shù)據(jù)的基礎(chǔ)分析。
(五)模型評(píng)估:對(duì)于建立的模型結(jié)果,要對(duì)在第一步建立的工作目標(biāo)進(jìn)行評(píng)估,這將導(dǎo)致頻繁地返回到前面的步驟。這個(gè)過程需要緩慢推進(jìn),各種的可視化分析結(jié)果、統(tǒng)計(jì)和人工智能工具將展現(xiàn)更深層次地理解數(shù)據(jù)運(yùn)行的關(guān)系,幫助數(shù)據(jù)挖掘人員進(jìn)行評(píng)估。
(六)模型發(fā)布:通過評(píng)估后得到模型應(yīng)用于“假設(shè)檢驗(yàn)”方法和數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)(KDD)這兩種路徑中,借助CRISP-DM前期步驟中發(fā)現(xiàn)的知識(shí),可以獲得更加健全的模型。發(fā)布的模型可以用于預(yù)測(cè)或識(shí)別關(guān)鍵特征,需要通過實(shí)際情況檢測(cè)其變化。如果發(fā)生重大變化,模型就需要被重新制定。模型發(fā)布讓從實(shí)驗(yàn)數(shù)據(jù)庫中建立起來的模型在實(shí)踐中受到檢驗(yàn)。
四、大數(shù)據(jù)在零售業(yè)中的應(yīng)用
在零售業(yè)中如何有效的利用大數(shù)據(jù)處理技術(shù),以快速精確的支撐營(yíng)銷和市場(chǎng)決策,成為零售業(yè)尋找新的業(yè)務(wù)增長(zhǎng)點(diǎn)和突破點(diǎn)的關(guān)鍵。零售業(yè)的大數(shù)據(jù)應(yīng)用主要從以下幾個(gè)方面考慮:
(一)分析新老顧客在消費(fèi)行為方面存在的差異。通過大數(shù)據(jù)挖掘?qū)π吕项櫩偷南M(fèi)頻次、消費(fèi)品類的結(jié)構(gòu)變化、消費(fèi)價(jià)格帶的差異、價(jià)格敏感度的差異進(jìn)行分析。例如結(jié)合會(huì)員卡的卡齡和顧客的實(shí)際年齡,將顧客的消費(fèi)次數(shù)、頻次、消費(fèi)類別和消費(fèi)金額等信息展示,報(bào)表數(shù)據(jù)查詢,多維分析查詢等,運(yùn)用于促銷方案的制定,并提供給公司高層做戰(zhàn)略制定依據(jù)。通過新老顧客在商品上市后的消費(fèi)時(shí)間來看季節(jié)過程中的銷售側(cè)重點(diǎn)。
(二)銷售力和貨架資源利用分析。不同的商品的銷售周期長(zhǎng)短不一,但是決定商品銷量一般在剛剛上市的前幾周就能看出。例如各款式商品在第一周、第二周及第三周銷售力變化情況以及各款式貨架資源投入產(chǎn)出效率的分析,就能較好的把握銷售機(jī)會(huì)以及合理把握庫存規(guī)模。通過貨架資源利用分析,可以得到商品在貨架上陳列時(shí)間與它所得到的毛利,將兩者進(jìn)行比較,就能得到經(jīng)營(yíng)過程中的貨架資源利用效率。
(三)商品間的銷售關(guān)聯(lián)性分析。例如對(duì)顧客消費(fèi)行為進(jìn)行分析,能夠得到有多少用戶在購買了A商品后,又購買了B商品,從而得出兩款商品的關(guān)聯(lián)性,以幫助零售企業(yè)更好的調(diào)整貨架資源,方便顧客購買,提升商品的銷量。沃爾瑪通過數(shù)據(jù)挖掘分析,將紙尿片和啤酒、颶風(fēng)商品和蛋撻擺放在相鄰貨架上,實(shí)現(xiàn)了銷量的上升。通過關(guān)聯(lián)性分析反映現(xiàn)狀,為零售企業(yè)提供了經(jīng)營(yíng)決策。
上述都是通過挖掘龐大的業(yè)務(wù)數(shù)據(jù),圍繞顧客的價(jià)值主張進(jìn)行分析,預(yù)測(cè)顧客的消費(fèi)行為,調(diào)整經(jīng)營(yíng)決策,優(yōu)化貨架資源,根據(jù)不同顧客的銷售習(xí)慣,通過短信、微信和互聯(lián)網(wǎng)向顧客推送相關(guān)的新品和促銷等信息,打造個(gè)性化的服務(wù),從而實(shí)現(xiàn)零售業(yè)的銷量增長(zhǎng)。
五、結(jié)束語
隨著全球數(shù)據(jù)量的爆發(fā)式增長(zhǎng),大數(shù)據(jù)技術(shù)得到了飛快的發(fā)展,也為零售業(yè)從龐大的業(yè)務(wù)數(shù)據(jù)中獲取有用信息提供了強(qiáng)有力的支持。但是由于數(shù)據(jù)本身的局限性,即數(shù)據(jù)無法反映每一位顧客的消費(fèi)習(xí)慣。還有算法,計(jì)算效率和模型的合理性等因素的影響,如何快速的構(gòu)建適合的大數(shù)據(jù)平臺(tái),精確的分析大數(shù)據(jù)中的有用信息,預(yù)測(cè)顧客的消費(fèi)行為,從而支持企業(yè)的經(jīng)營(yíng)決策,牢牢占據(jù)市場(chǎng)先機(jī),將會(huì)是零售業(yè)在激烈的市場(chǎng)競(jìng)爭(zhēng)中獲得勝利的關(guān)鍵。
參考文獻(xiàn):
[1]《大數(shù)據(jù)》.清華大學(xué)出版社.
[2]《大數(shù)據(jù)時(shí)代》.浙江人民出版社.
作者簡(jiǎn)介:張敏(1986-),男,福建福州人,在讀碩士,主要研究方向:電子與通信。