亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)字化便利店的用戶畫像及其應(yīng)用研究

        2021-10-26 12:17:38朱振濤吳志輝陳星光
        關(guān)鍵詞:畫像便利店標(biāo)簽

        朱振濤,吳志輝,陳星光,劉 穎

        (1.南京工程學(xué)院經(jīng)濟(jì)與管理學(xué)院,江蘇 南京,211167;2.漢江大學(xué)商學(xué)院,湖北 武漢,430056)

        近幾年,隨著網(wǎng)絡(luò)用戶增長(zhǎng)減緩,電商平臺(tái)流量入口的競(jìng)爭(zhēng)日趨白熱化,電商行業(yè)進(jìn)入瓶頸期,越來(lái)越多的電商平臺(tái)正在嘗試一種線上線下相結(jié)合的新型零售模式,如阿里的“新零售”、蘇寧的“智慧零售”、京東的“無(wú)界零售”[1-2]。它們都紛紛選址建立線下實(shí)體店,希望通過(guò)利用線上渠道所積累的品牌優(yōu)勢(shì)與發(fā)達(dá)的物流系統(tǒng)降低線下渠道擴(kuò)張的難度,進(jìn)一步爭(zhēng)奪線下零售流量。這種方式在使電子商務(wù)平臺(tái)重新煥發(fā)生機(jī)的同時(shí),傳統(tǒng)便利店無(wú)可避免地被卷入到激烈、全面的市場(chǎng)競(jìng)爭(zhēng)當(dāng)中。畢馬威與中國(guó)連鎖經(jīng)營(yíng)協(xié)會(huì)聯(lián)合發(fā)布的《2021年中國(guó)便利店發(fā)展報(bào)告》顯示,全國(guó)品牌連鎖便利店銷售額從2015年的1 181億元逐年上升到2 961億元,而傳統(tǒng)便利店的銷售額增速自2016年的31%遞減到2020年的6.3%;傳統(tǒng)品牌便利店排前10名的占當(dāng)年便利店總量的比例從2018年的67.7%下降到2020年的47.15%[3]。因此,傳統(tǒng)便利店如何在新零售浪潮下根據(jù)自身情況補(bǔ)上在數(shù)據(jù)技術(shù)上的短板,搭建適合自身發(fā)展的高效的數(shù)字化營(yíng)銷系統(tǒng),無(wú)疑是傳統(tǒng)便利店亟須解決的業(yè)務(wù)問(wèn)題;另一方面,隨著“十四五”報(bào)告將數(shù)字經(jīng)濟(jì)單獨(dú)成章,重點(diǎn)提出點(diǎn)亮數(shù)字中國(guó)的發(fā)展方向[4],傳統(tǒng)便利店作為覆蓋面廣、便民利民的商業(yè)體,研究其數(shù)字化轉(zhuǎn)型的發(fā)展思路具有重要的社會(huì)價(jià)值。

        本文以問(wèn)題為導(dǎo)向,通過(guò)對(duì)傳統(tǒng)便利店發(fā)展現(xiàn)狀及其數(shù)字化障礙的分析,對(duì)比線下數(shù)據(jù)采集及業(yè)務(wù)問(wèn)題,針對(duì)傳統(tǒng)便利店特征提出其存在的不足,分析問(wèn)題后提出一套完整、可行的解決方案,并以實(shí)際獲得的一個(gè)便利店的交易流水?dāng)?shù)據(jù)集和生物碼數(shù)據(jù)為例,驗(yàn)證了該技術(shù)方案的可行性。

        一、研究設(shè)計(jì)

        (一)傳統(tǒng)便利店精準(zhǔn)營(yíng)銷的業(yè)務(wù)困境

        便利店(Convenience Store)是指為居民區(qū)、學(xué)校、客流量大地區(qū)開(kāi)設(shè)的方便客戶購(gòu)買消費(fèi)品和服務(wù)的零售店鋪。傳統(tǒng)便利店包括直營(yíng)便利店、加盟便利店、加油站型便利店、食雜店和部分的小型超市等[3]。傳統(tǒng)便利店不同于電商企業(yè)所推行的線上線下融合的新型零售模式,缺少對(duì)用戶特征的準(zhǔn)確把握,是其營(yíng)銷的主要困境,而造成這一困境的原因有以下3點(diǎn):

        (1)用戶個(gè)體信息缺失導(dǎo)致客戶行為數(shù)據(jù)匱乏。眾所周知,在電商平臺(tái)上購(gòu)物,用戶必須注冊(cè)并登錄平臺(tái),這樣電商平臺(tái)就可以獲取用戶注冊(cè)的基本信息以及用戶在平臺(tái)的瀏覽記錄和歷史購(gòu)買記錄。這些用戶信息對(duì)精準(zhǔn)營(yíng)銷非常關(guān)鍵。便利店則一般不要求用戶先注冊(cè),所以盡管在交易過(guò)程中形成交易小票數(shù)據(jù),卻無(wú)法識(shí)別出用戶的歷史購(gòu)買數(shù)據(jù)。此外,一個(gè)客戶多次踏入同一家便利店的占比很小,在本研究的數(shù)據(jù)集中這類路人客戶占比高達(dá)整個(gè)客戶群體的81.4%,這也給嚴(yán)重依賴用戶歷史購(gòu)買行為數(shù)據(jù)的個(gè)性化推薦算法的實(shí)施帶來(lái)了歷史數(shù)據(jù)不足的問(wèn)題。

        (2)數(shù)據(jù)技術(shù)成本高、難度大。傳統(tǒng)的非連鎖型便利店往往都是小作坊、夫妻店,因此較高的數(shù)據(jù)采集與數(shù)據(jù)分析成本都是難以支付的,加之?dāng)?shù)據(jù)應(yīng)用技術(shù)難度偏高,對(duì)店鋪經(jīng)營(yíng)者也有一定的要求,因此傳統(tǒng)便利店的精準(zhǔn)營(yíng)銷難以開(kāi)展。

        (3)傳統(tǒng)便利店的商品推薦主觀而低效。由于傳統(tǒng)便利店對(duì)顧客的營(yíng)銷活動(dòng)往往是出于店員對(duì)顧客特征的主觀認(rèn)識(shí)進(jìn)行的,因此其營(yíng)銷活動(dòng)的效果往往是依靠其經(jīng)驗(yàn)判斷,缺乏科學(xué)依據(jù),有較大主觀錯(cuò)誤的可能。

        (二)相關(guān)研究評(píng)述

        關(guān)于便利店數(shù)字化轉(zhuǎn)型的相關(guān)研究可以從新零售、精準(zhǔn)營(yíng)銷和用戶細(xì)分算法三個(gè)方面展開(kāi)。

        關(guān)于新零售,趙樹(shù)梅與徐曉紅(2017)認(rèn)為“新零售”區(qū)別于傳統(tǒng)零售,推動(dòng)線上線下以及多方跨界的融合,其基礎(chǔ)和前提是供應(yīng)鏈的重構(gòu)與物流方案的不斷升級(jí)[1]。韓彩珍與王寶義(2018)認(rèn)為不同的零售業(yè)態(tài)主導(dǎo)企業(yè)還在用不同的概念來(lái)定義當(dāng)下零售業(yè)態(tài)的變革,如京東集團(tuán)的“無(wú)界零售”、蘇寧與騰訊提出的“智慧零售”,盡管稱謂和側(cè)重點(diǎn)存在區(qū)別,但均是對(duì)當(dāng)前零售業(yè)“顛覆式”變革的描繪[2]。本文認(rèn)為可以將新零售理解為:一種強(qiáng)調(diào)線上線下融合,用數(shù)字化技術(shù)高效識(shí)別用戶需求,并據(jù)此對(duì)企業(yè)供應(yīng)鏈進(jìn)行系統(tǒng)重構(gòu)從而極大提升零售績(jī)效的先進(jìn)零售業(yè)態(tài)。

        關(guān)于精準(zhǔn)營(yíng)銷,劉征宇(2007)提出“精準(zhǔn)營(yíng)銷”是通過(guò)定量和定性相結(jié)合的方法對(duì)目標(biāo)市場(chǎng)的不同消費(fèi)者進(jìn)行細(xì)致分析,根據(jù)他們不同的消費(fèi)心理和行為特征,企業(yè)采用有針對(duì)性的現(xiàn)代技術(shù)、方法和指向明確的策略,實(shí)現(xiàn)對(duì)目標(biāo)市場(chǎng)不同消費(fèi)者群體強(qiáng)有效性、高投資回報(bào)的營(yíng)銷溝通[5]。李衛(wèi)華(2019)根據(jù)傳統(tǒng)零售企業(yè)所面臨的困境,從歷史背景、實(shí)施困境、對(duì)策建議等方面進(jìn)行深入分析,研究大數(shù)據(jù)在傳統(tǒng)零售企業(yè)精準(zhǔn)營(yíng)銷中的應(yīng)用,以此整合消費(fèi)者信息、洞察消費(fèi)者需求、實(shí)施精準(zhǔn)營(yíng)銷、打造新型零售模式[6]。孫洪池與林正杰(2016)以零售商品型企業(yè)為例,開(kāi)展基于大數(shù)據(jù)的B2C網(wǎng)絡(luò)精準(zhǔn)營(yíng)銷應(yīng)用研究[7]。

        在用戶細(xì)分算法方面,李冰等人(2016)利用K-means算法劃分不同的卷煙屬性與客戶屬性,提出向業(yè)態(tài)為食雜店的、市場(chǎng)類型為城市的、區(qū)域類型為學(xué)區(qū)的、經(jīng)營(yíng)規(guī)模為中的零售客戶推薦烤煙型卷煙[8]。雷兵等人(2019)依據(jù)淘寶網(wǎng)某“線上禮裙”企業(yè)店鋪的訂單數(shù)據(jù),提煉用戶畫像,通過(guò)對(duì)用戶屬性和購(gòu)物偏好的聚類劃分,發(fā)現(xiàn)企業(yè)店鋪的客戶大致可以分為3類[9]。為了改進(jìn)用戶細(xì)分算法,許多學(xué)者會(huì)結(jié)合不同的理論模型來(lái)實(shí)現(xiàn)用戶畫像。其中,較為常用的是RFM模型和ALC模型。Wu J等人(2020)基于在社區(qū)購(gòu)物時(shí)創(chuàng)建的購(gòu)買數(shù)據(jù)條目,運(yùn)用RFM模型結(jié)合K-Means聚類發(fā)現(xiàn)管理廣告宣傳活動(dòng)的客戶細(xì)分[10]。Hartini S等人(2020)在采用RFM時(shí)認(rèn)識(shí)到客戶簡(jiǎn)介的重要性,因此繼續(xù)添加ALC模型來(lái)挖掘客戶簡(jiǎn)介,幫助提高用戶細(xì)分的精確度[11]。

        綜合所述,在有關(guān)便利店零售的已有研究中多為規(guī)律的總結(jié)和理論框架的構(gòu)建,基于實(shí)際便利店交易數(shù)據(jù)的用戶畫像和個(gè)性化推薦較少,而基于機(jī)器學(xué)習(xí)算法的用戶畫像和個(gè)性化推薦在電商和特定商品的營(yíng)銷中已經(jīng)有了較多的研究,因此,用數(shù)據(jù)分析和機(jī)器學(xué)習(xí)對(duì)便利店的用戶數(shù)據(jù)進(jìn)行挖掘,發(fā)現(xiàn)便利店用戶的特征,對(duì)于推動(dòng)基于數(shù)字驅(qū)動(dòng)的便利店轉(zhuǎn)型是可行也是必要的。

        (三)本研究的技術(shù)路線

        本文通過(guò)對(duì)傳統(tǒng)便利店發(fā)展現(xiàn)狀及其數(shù)字化障礙的分析,對(duì)比線下數(shù)據(jù)采集及業(yè)務(wù)問(wèn)題,針對(duì)傳統(tǒng)便利店特征提出其存在的不足,繼問(wèn)題識(shí)別之后進(jìn)行問(wèn)題拆解和分析后提出解決方案;從要點(diǎn)、方法、成果三個(gè)層面,對(duì)數(shù)據(jù)增補(bǔ)、用戶畫像以及個(gè)性化推薦進(jìn)行分析研究,并形成一套完整、可行的解決方案。研究路線具體內(nèi)容如圖1;為驗(yàn)證技術(shù)設(shè)想的可行性,根據(jù)某市3個(gè)便利店一個(gè)月的用戶信息與購(gòu)買行為數(shù)據(jù),對(duì)為數(shù)字化便利店搭建精準(zhǔn)營(yíng)銷平臺(tái)所涉及的數(shù)據(jù)增補(bǔ)、用戶畫像和個(gè)性化推薦三個(gè)核心環(huán)節(jié)進(jìn)行數(shù)據(jù)分析和算法驗(yàn)證。

        圖1 數(shù)字化便利店的用戶畫像及其應(yīng)用的研究路線

        二、數(shù)字化便利店用戶畫像及其標(biāo)簽生成

        (一)數(shù)字化便利店的數(shù)據(jù)增補(bǔ)

        便利店的基礎(chǔ)數(shù)據(jù)包括產(chǎn)品數(shù)據(jù)、商品數(shù)據(jù)和訂單數(shù)據(jù)等。與電商平臺(tái)相比,便利店數(shù)據(jù)短板主要在客戶信息數(shù)據(jù)表。線上電商平臺(tái)依靠其登錄注冊(cè)信息方便獲取客戶的個(gè)人信息,而線下便利店卻很難獲取真實(shí)的客戶信息。然而,沒(méi)有用戶的身份識(shí)別信息,就無(wú)法將交易流水記錄聚合為用戶的特征標(biāo)簽。因此,需要運(yùn)用線下數(shù)據(jù)采集方案對(duì)用戶的身份數(shù)據(jù)進(jìn)行增補(bǔ)。

        表1是目前常見(jiàn)的店鋪用戶數(shù)據(jù)采集方案[12]。在傳統(tǒng)便利店這一場(chǎng)景中,實(shí)用價(jià)值較高的采集方法是基于移動(dòng)定位的行為數(shù)據(jù)采集方法與基于視覺(jué)檢測(cè)的行為數(shù)據(jù)采集方法。前者采集信息量適中、成本低,適用于個(gè)體便利店;后者采集信息量較大、成本高,適用于品牌連鎖店?;谝曈X(jué)檢測(cè)的行為數(shù)據(jù)采集方法可以對(duì)用戶性別、年齡及生物碼進(jìn)行識(shí)別,并推進(jìn)跟蹤監(jiān)測(cè)。其常見(jiàn)的人臉識(shí)別算法包括神經(jīng)網(wǎng)絡(luò)、隱馬爾可夫模型以及支持向量機(jī)算法等[13]?;谝苿?dòng)定位的行為數(shù)據(jù)采集方法無(wú)法對(duì)用戶基本個(gè)人信息進(jìn)行識(shí)別,但可形成獨(dú)特的用戶識(shí)別碼,用于簡(jiǎn)單的用戶識(shí)別及跟蹤監(jiān)測(cè)。常見(jiàn)算法包括三點(diǎn)定位和指紋圖譜定位 。便利店通過(guò)這些數(shù)據(jù)采集方法獲得用戶的識(shí)別碼后,就可以基于歷史行為對(duì)用戶進(jìn)行畫像了。

        (二)數(shù)字化便利店的用戶畫像體系設(shè)計(jì)

        針對(duì)傳統(tǒng)便利店的數(shù)據(jù)特征,通過(guò)采用基于視覺(jué)識(shí)別的數(shù)據(jù)采集方法豐富傳統(tǒng)便利店的數(shù)據(jù)源,可以從基本屬性、購(gòu)買力屬性、消費(fèi)行為3方面構(gòu)建便利店的用戶畫像標(biāo)簽。如圖2所示。

        表1 店鋪用戶數(shù)據(jù)采集方案比較

        圖2 便利店的用戶畫像標(biāo)簽體系

        (1)基本屬性。傳統(tǒng)便利店的用戶基本屬性數(shù)據(jù)主要包括用戶年齡、性別、PID等靜態(tài)數(shù)據(jù),是用來(lái)識(shí)別用戶身份的重要依據(jù),通過(guò)數(shù)據(jù)挖掘方式也可從中提煉出部分用戶標(biāo)簽屬性。

        (2)購(gòu)買力屬性。傳統(tǒng)便利店的用戶購(gòu)買力屬性數(shù)據(jù)主要包括用戶平均每單購(gòu)買金額、平均每單購(gòu)買量、偏好品牌等。這是便利店進(jìn)行用戶畫像搭建時(shí)的關(guān)鍵指標(biāo),能夠幫助便利店識(shí)別不同用戶的購(gòu)買力,并根據(jù)其購(gòu)買力不同對(duì)營(yíng)銷資源做出高效配置。

        (3)消費(fèi)行為。傳統(tǒng)便利店的用戶消費(fèi)行為數(shù)據(jù)主要包括交易時(shí)間、小票數(shù)、購(gòu)買產(chǎn)品類型、訪問(wèn)門店數(shù)、進(jìn)店次數(shù)等。這一維度的信息是最多且最復(fù)雜的,運(yùn)用數(shù)據(jù)技術(shù)手段可以從中挖掘出許多有效信息標(biāo)簽,使用戶畫像更加具體、精確。

        (三)基于聚類算法的用戶畫像標(biāo)簽實(shí)例

        本文所用的便利店數(shù)據(jù)來(lái)自于狗熊會(huì)數(shù)據(jù)庫(kù)提供的某城市某品牌便利店旗下3個(gè)門店2019年5月的交易流水?dāng)?shù)據(jù)和用戶身份識(shí)別數(shù)據(jù)(詳見(jiàn)表2)。該品牌便利店對(duì)用戶識(shí)別的解決方案為收銀臺(tái)攝像頭抓拍圖形進(jìn)行人臉識(shí)別計(jì)算獲得用戶的生物碼、性別和年齡數(shù)據(jù)。數(shù)據(jù)集中用戶數(shù)據(jù)包含6 013個(gè)用戶。交易小票數(shù)據(jù)包括7 992 張不同交易小票和1 731種商品共有12 952行交易記錄。這樣,將用戶識(shí)別數(shù)據(jù)集與交易小票數(shù)據(jù)集進(jìn)行數(shù)據(jù)融合,就可以獲得“人(用戶)貨(商品)關(guān)聯(lián)數(shù)據(jù)”。該數(shù)據(jù)集不僅可以幫助便利店追蹤到每一筆訂單的主人,還可以了解這名消費(fèi)者的購(gòu)物記錄與人口學(xué)特征,從而為用戶畫像奠定基礎(chǔ)。

        表2 便利店用戶和交易數(shù)據(jù)說(shuō)明表

        所謂用戶畫像,可以理解為根據(jù)用戶的人口特征和其行為產(chǎn)生的數(shù)據(jù),提煉出能反映該用戶人口學(xué)特征、興趣特征、社會(huì)特征、消費(fèi)特征的特征標(biāo)簽,也就是通俗所說(shuō)的給用戶打標(biāo)簽,然后用恰當(dāng)?shù)臄?shù)據(jù)可視化方法將之展示出來(lái)。根據(jù)標(biāo)簽的構(gòu)建流程和依存關(guān)系,可以分為事實(shí)標(biāo)簽、模型標(biāo)簽和高級(jí)標(biāo)簽。事實(shí)標(biāo)簽通過(guò)原始數(shù)據(jù)的簡(jiǎn)單統(tǒng)計(jì)得到,如進(jìn)店次數(shù)、最近來(lái)訪時(shí)間、訪問(wèn)門店數(shù)等;模型標(biāo)簽是對(duì)事實(shí)類標(biāo)簽的進(jìn)一步匯總和提煉而得到的特征標(biāo)簽,如根據(jù)進(jìn)店次數(shù)、最近來(lái)訪時(shí)間和訪問(wèn)門店數(shù)可以定義顧客的活躍度。高級(jí)標(biāo)簽是基于事實(shí)標(biāo)簽和模型標(biāo)簽進(jìn)行統(tǒng)計(jì)建模得出的用戶標(biāo)簽,它的構(gòu)造多與實(shí)際的業(yè)務(wù)指標(biāo)緊密聯(lián)系。例如,消費(fèi)能力、消費(fèi)群體的客群劃分標(biāo)簽等。事實(shí)類用戶標(biāo)簽是模型標(biāo)簽和高級(jí)業(yè)務(wù)標(biāo)簽的基礎(chǔ)。針對(duì)本數(shù)據(jù)集可以構(gòu)建人口屬性、進(jìn)店規(guī)律、消費(fèi)行為和購(gòu)物偏好四個(gè)方面的事實(shí)標(biāo)簽。在人口屬性中年齡可以離散化分段為年代標(biāo)簽,如40后、50后、60后……新世代10后等。進(jìn)店規(guī)律標(biāo)簽包括訪問(wèn)門店數(shù)、進(jìn)店次數(shù)、最近進(jìn)店時(shí)間間隔等;消費(fèi)行為標(biāo)簽包括每單購(gòu)買數(shù)量和金額;購(gòu)物偏好標(biāo)簽包括偏好品類和偏好品牌等。

        接下來(lái),進(jìn)行用戶群的畫像。先看該月用戶的購(gòu)買次數(shù)和平均買單購(gòu)買金額的直方圖(圖3)。購(gòu)買次數(shù)的中位數(shù)為1次,均值為1.33次,購(gòu)買超過(guò)1次的用戶只占比18.4%。這說(shuō)明這些便利店的用戶中重購(gòu)率很低,用戶的粘性有待加強(qiáng)。平均每單金額的中位數(shù)為8元,均值為12.3元,多數(shù)在50元以下,分布呈右偏形態(tài),少數(shù)極大值拉高了整體的均值。平均每單金額最大值為280元。與中國(guó)連鎖經(jīng)營(yíng)協(xié)會(huì)發(fā)布的便利店報(bào)告中2019年樣本企業(yè)的客單價(jià)16.3元/人/單相比,這三個(gè)便利店的客單價(jià)尚低于平均線。

        (a)

        從圖4可知,用戶最偏好的品類依次為硬殼香煙、包裝水、冰激凌、飲料和小食。用戶最偏好的品牌是七匹狼、康師傅、農(nóng)夫山泉、可口可樂(lè)等。偏好人數(shù)多意味著客戶進(jìn)行購(gòu)買的可能概率高,這一結(jié)果可以幫助便利店經(jīng)營(yíng)者與品牌商進(jìn)行溝通,增加渠道價(jià)值。

        客群劃分標(biāo)簽屬于高級(jí)標(biāo)簽,也是實(shí)現(xiàn)市場(chǎng)細(xì)分的基礎(chǔ)[14]。客群細(xì)分是精準(zhǔn)營(yíng)銷的核心環(huán)節(jié)。聚類方法是目前常用的客群劃分的算法。目前較為常見(jiàn)的聚類算法包括K-Means聚類、均值漂移聚類、基于密度的聚類方法(DBSCAN)、以高斯混合模型GMM的最大期望(EM)聚類[15]。這里選用K-Means聚類這種簡(jiǎn)單而且聚類效果好的方法[16]。K-Means算法是一種無(wú)監(jiān)督學(xué)習(xí),其采用歐式距離作為數(shù)據(jù)間衡量相似度的距離指標(biāo),相似度與數(shù)據(jù)對(duì)象間的距離呈反比。該算法需要首先設(shè)置好聚類簇群數(shù)與初始中心數(shù)k,然后根據(jù)數(shù)據(jù)對(duì)象與聚類中心的相似度來(lái)不斷調(diào)整新聚類中心的位置,不斷降低簇的誤差平方和(Sum of Squared Error,SSE),直到SSE不再變化時(shí)即可停止。本文先作碎石圖來(lái)確定客戶群體的最優(yōu)聚類個(gè)數(shù),發(fā)現(xiàn)碎石圖的肘點(diǎn)在橫坐標(biāo)取6時(shí),因此用戶最好的聚類類別為6類。

        (a)

        由于對(duì)于購(gòu)買次數(shù)僅1次的用戶,行為的隨機(jī)性較大,因此本文篩選有復(fù)購(gòu)行為的用戶,來(lái)分析其特征。K-Means算法的結(jié)果如表3所示。

        類別1是小票數(shù)少、平均每單金額低、多消費(fèi)衛(wèi)生用品的女性路人;類別2是小票數(shù)少、平均每單金額低且購(gòu)買商品沒(méi)有明顯偏好的男性路人;類別3是男性占比89%、年齡大、消費(fèi)能力強(qiáng)、偏愛(ài)香煙、啤酒的資深煙酒受眾;類別4是偏愛(ài)酸奶、牛奶、糕點(diǎn)的早餐上班族;類別5是小票數(shù)多、偏愛(ài)茶飲料、碳酸飲料、冰淇淋、功能性飲料、亞洲傳統(tǒng)飲料的飲料愛(ài)好者;類別6是年齡偏小、偏愛(ài)鮮食、包裝水、肉食小食、即食類主食、熟食肉制品等方便類速食,屬于附近居民。通過(guò)分析可以得到用戶簇群的畫像特征,如表4所示。這樣就可以給每個(gè)用戶打上其所屬客群的標(biāo)簽。

        表3 K-Means類中心取值表

        表4 用戶簇群畫像特征

        針對(duì)不同的客戶群體,應(yīng)當(dāng)采用不同的推介信息與營(yíng)銷方式。由表4可見(jiàn),男性路人與女性路人黏性小且難以維系,因此在營(yíng)銷資源上不需要過(guò)度傾斜;而資深煙酒民小票數(shù)多、消費(fèi)能力強(qiáng),且有明顯偏好,因此對(duì)該類客戶應(yīng)當(dāng)鞏固客戶關(guān)系,針對(duì)性地采取營(yíng)銷方式吸引這類用戶消費(fèi);早餐上班族和附近居民的典型特征在于長(zhǎng)時(shí)間在該店鋪附近,因此在平時(shí)的營(yíng)銷活動(dòng)以及商品陳列方面都需要考慮此類客戶的消費(fèi)偏好;飲料愛(ài)好者數(shù)量雖少但小票多,證明其對(duì)便利店有一定的依賴,因此便利店在營(yíng)銷活動(dòng)的選取上需要考慮到這部分用戶的消費(fèi)偏好,維系其在群體內(nèi)的口碑。

        三、基于用戶畫像特征的個(gè)性化推薦算法設(shè)計(jì)與實(shí)驗(yàn)

        (一)基于用戶細(xì)分的個(gè)性化推薦算法設(shè)計(jì)

        目前比較常用的個(gè)性化推薦算法包括關(guān)聯(lián)規(guī)則、協(xié)同過(guò)濾等[17-18],這兩種算法主要是基于大量的用戶購(gòu)買記錄,通過(guò)分析商品和商品之間的并買關(guān)系來(lái)進(jìn)行個(gè)性化推薦。從本質(zhì)上說(shuō),個(gè)性化推薦其實(shí)就是預(yù)測(cè)用戶對(duì)某品類的商品是選擇“買”還是“不買”的二分類問(wèn)題。這樣,用戶的特征和商品的特征都是影響因素,而是否購(gòu)買就是結(jié)果變量。我們也可以將其表示為:

        y=f(用戶特征向量,商品特征向量,…,)

        (1)

        式中:y=0,1;表示隨機(jī)變量,表示事務(wù)發(fā)展的不確定性和不可知性;省略號(hào)表示其他可能的對(duì)用戶購(gòu)買決策有影響的因素。

        因此,對(duì)個(gè)性化推薦這樣的二分類問(wèn)題就可以用新興的機(jī)器學(xué)習(xí)算法來(lái)建模[19]。

        1.數(shù)據(jù)準(zhǔn)備

        首先要解決這個(gè)二分類的y=0即不購(gòu)買的數(shù)據(jù)記錄問(wèn)題。針對(duì)顧客進(jìn)店消費(fèi)而沒(méi)有購(gòu)買的品類分別生成這些品類的沒(méi)購(gòu)買記錄。例如,便利店有65個(gè)二級(jí)品類,某用戶購(gòu)買了3個(gè)二級(jí)品類的商品,那么他就產(chǎn)生了3個(gè)購(gòu)買記錄和62個(gè)未購(gòu)買記錄。未購(gòu)買記錄可以用用戶的交易流水?dāng)?shù)據(jù)表和所有二級(jí)品類表的數(shù)據(jù)庫(kù)相連接而產(chǎn)生。在本例中得到了535 464條記錄。這時(shí)出現(xiàn)了嚴(yán)重的類失衡問(wèn)題。用戶未購(gòu)買的品類遠(yuǎn)少于購(gòu)買的品類。需要用數(shù)據(jù)重采樣技術(shù)(上采樣或下采樣)來(lái)平衡兩類的占比。

        2.構(gòu)建模型和選擇特征標(biāo)簽

        所有分類問(wèn)題的機(jī)器學(xué)習(xí)算法都可以用來(lái)建模,如支持向量機(jī)、隨機(jī)森林、樸素貝葉斯分類器、Xgboost等[20]。這里選擇logistic回歸和Xgboost模型來(lái)分別建模。前者是行業(yè)中廣泛應(yīng)用的模型,后者是決策樹(shù)類機(jī)器學(xué)習(xí)算法的杰出代表,在各類機(jī)器學(xué)習(xí)大賽中屢創(chuàng)佳績(jī)。Xgboost模型是在boosting集成學(xué)習(xí)的基礎(chǔ)上優(yōu)化產(chǎn)出的新型模型,同時(shí)繼承了boosting算法的造樹(shù)思想:通過(guò)由模型訓(xùn)練獲取得到的F(x),使得對(duì)于給定的輸入變量x,輸出的F(x)都能較好地近似y。換言之,就是希望損失函數(shù)l(y,F(x))盡可能小,在建新樹(shù)的基礎(chǔ)上爭(zhēng)取損失函數(shù)的最小化。

        在用戶特征標(biāo)簽的選擇上,本例采用了用戶畫像中的事實(shí)標(biāo)簽和模型標(biāo)簽。事實(shí)標(biāo)簽包括用戶的性別、年齡等;模型標(biāo)簽主要是RFM模型標(biāo)簽,刻畫用戶的購(gòu)買行為特征。近度(R)用用戶本次購(gòu)買和上次購(gòu)買的間隔表示;頻度(F)用用戶在一段時(shí)間內(nèi)進(jìn)店購(gòu)買商品的次數(shù)和購(gòu)買一級(jí)二級(jí)品類的次數(shù)表示;額度(M)用用戶一段時(shí)間內(nèi)消費(fèi)的金額和平均每單消費(fèi)金額。此外,自變量還包括交易時(shí)段和商品特征標(biāo)簽所屬二級(jí)分類。

        (二)算法結(jié)果的對(duì)比與評(píng)價(jià)

        對(duì)于二分類問(wèn)題,算法評(píng)價(jià)的常用標(biāo)準(zhǔn)是ROC(Receiver Operator Characteristic:受試者工作特征)曲線下的面積AUC(Area Under Curve:曲線下的面積)值。ROC曲線是靈敏度和特異度的關(guān)系曲線[21]。靈敏度在本問(wèn)題中為真實(shí)購(gòu)買者被準(zhǔn)備預(yù)測(cè)出的概率。特異度在本問(wèn)題中表示實(shí)際沒(méi)有購(gòu)買者被正確識(shí)別出來(lái)的概率。由于許多機(jī)器學(xué)習(xí)算法包括Xgboost算法也存在容易過(guò)擬合的問(wèn)題,對(duì)數(shù)據(jù)集進(jìn)行了訓(xùn)練集和測(cè)試集的劃分,用外樣本的AUC來(lái)評(píng)價(jià)兩種算法模型,結(jié)果見(jiàn)表5。Xgboost模型的外樣本ROC曲線和特征重要性見(jiàn)圖5。從表5可以看出,相比Logistic算法,Xgboost模型的預(yù)測(cè)精度略高0.6%。再看兩種算法模型發(fā)現(xiàn)的重要變量,logistic模型的重要變量是由變量的顯著性和標(biāo)準(zhǔn)化系數(shù)共同決定的。Xgboost的特征重要性采用增益重要性來(lái)度量,增益重要性表示有無(wú)該特征對(duì)預(yù)測(cè)精度的影響大小。兩個(gè)模型的結(jié)果有較高的一致性,都發(fā)現(xiàn)香煙、包裝水等7種二級(jí)品類的商品的購(gòu)買概率較大,這個(gè)結(jié)果對(duì)于優(yōu)化便利店品類有重要參考價(jià)值。在用戶特征方面,用戶的年齡以及購(gòu)買的頻度(之前購(gòu)買的小票數(shù)和購(gòu)買二級(jí)分類次數(shù))是重要的影響因素。這說(shuō)明不同年齡層的用戶分層是精準(zhǔn)營(yíng)銷必須考慮的維度之一。此外,提高用戶黏度也是便利店要考慮的改進(jìn)方向。

        表5 兩種算法的計(jì)算結(jié)果對(duì)比

        (a)

        四、結(jié)語(yǔ)

        本文針對(duì)傳統(tǒng)便利店所面臨的用戶信息匱乏、數(shù)據(jù)手段不足、商品推薦主觀低效的三方面困境,提出涵蓋問(wèn)題識(shí)別、數(shù)據(jù)增補(bǔ)、用戶畫像、個(gè)性化推薦的數(shù)據(jù)分析全鏈條框架,并對(duì)每個(gè)環(huán)節(jié)的技術(shù)實(shí)現(xiàn)和算法選擇進(jìn)行了設(shè)計(jì)和數(shù)據(jù)算法驗(yàn)證,提供了傳統(tǒng)便利店數(shù)字化轉(zhuǎn)型的解決方案。本文主要做了以下工作:

        (1)問(wèn)題識(shí)別及數(shù)據(jù)增補(bǔ)。通過(guò)文獻(xiàn)閱覽發(fā)現(xiàn),相較于新零售業(yè)態(tài),傳統(tǒng)便利店往往存在著數(shù)據(jù)匱乏、技術(shù)手段不足以及商品推薦主觀低效等問(wèn)題。在這些問(wèn)題中,數(shù)據(jù)匱乏嚴(yán)重影響傳統(tǒng)便利店實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型,因此本文建議根據(jù)便利店的資金能力選擇合適的物聯(lián)網(wǎng)技術(shù)(基于視覺(jué)檢測(cè)或基于移動(dòng)定位的行為數(shù)據(jù)采集技術(shù))進(jìn)行用戶信息的識(shí)別并整合原有的交易流水?dāng)?shù)據(jù),形成完整的用戶交易歷史行為信息,為用戶畫像奠定數(shù)據(jù)基礎(chǔ)。

        (2)在用戶的特征標(biāo)簽和用戶畫像方面,通過(guò)對(duì)可獲得的數(shù)據(jù)的分析,發(fā)現(xiàn)可以計(jì)算得到用戶的事實(shí)標(biāo)簽、模型標(biāo)簽和高級(jí)標(biāo)簽。用三個(gè)便利店一個(gè)月的交易和用戶數(shù)據(jù)對(duì)這三類特征標(biāo)簽進(jìn)行了設(shè)計(jì)。尤其是為了得到用戶的所屬客群這一高級(jí)標(biāo)簽,根據(jù)用戶消費(fèi)數(shù)據(jù)而非個(gè)體數(shù)據(jù),選擇簡(jiǎn)單且高效的K-means算法進(jìn)行聚類劃分,為便利店識(shí)別出6個(gè)主要的客群。

        (3)在用戶畫像的應(yīng)用方面著重探討了個(gè)性化推薦系統(tǒng),用便利店的交易小票數(shù)據(jù)與用戶識(shí)別數(shù)據(jù)進(jìn)行數(shù)據(jù)增補(bǔ),利用RFM模型標(biāo)簽和用戶事實(shí)標(biāo)簽以及商品特征標(biāo)簽等影響因素,選擇logistic模型和Xgboost模型實(shí)現(xiàn)了有較高預(yù)測(cè)精度的個(gè)性化推薦系統(tǒng)。兩個(gè)模型在重要特征挖掘上有相似的結(jié)論,可以根據(jù)部署成本,選擇其中之一作為個(gè)性化推薦的實(shí)現(xiàn)算法。

        本文的研究只考慮了利用視頻識(shí)別技術(shù)補(bǔ)全用戶身份信息,其他的物聯(lián)網(wǎng)技術(shù)如采用設(shè)備MESE熱力圖或RFID等物聯(lián)網(wǎng)判斷客戶的購(gòu)物時(shí)長(zhǎng)、停留位置及停留時(shí)間,可以為用戶畫像的構(gòu)建提供更加多元的數(shù)據(jù)支持[22],這些數(shù)據(jù)可以產(chǎn)生哪些新的用戶標(biāo)簽是未來(lái)可以研究的一個(gè)方向。另外,如何結(jié)合傳統(tǒng)個(gè)性化推薦算法的擴(kuò)展性與新興算法的預(yù)測(cè)能力更加準(zhǔn)確地挖掘用戶的消費(fèi)偏好,也是便利店精準(zhǔn)營(yíng)銷系統(tǒng)有待研究的問(wèn)題。

        猜你喜歡
        畫像便利店標(biāo)簽
        便利店
        幼兒畫刊(2023年7期)2023-07-17 03:38:28
        威猛的畫像
        一克拉便利店
        季付榮:肩上扛著便利店
        “00后”畫像
        畫像
        無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
        車迷(2018年11期)2018-08-30 03:20:32
        不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
        海峽姐妹(2018年3期)2018-05-09 08:21:02
        換湯不換藥的樽享便利店
        標(biāo)簽化傷害了誰(shuí)
        夜夜综合网| 日出白浆视频在线播放| 中文字幕乱码亚洲美女精品一区| 日韩在线不卡一区三区av| 国产乱子伦精品无码专区| 边啃奶头边躁狠狠躁| 午夜高清福利| 久久国产劲爆内射日本| av在线播放男人天堂| 亚洲国产成人精品无码一区二区| 一本久道久久综合婷婷五月| 蜜桃成人永久免费av大| 久久精品一区二区熟女| 日日摸天天摸97狠狠婷婷| 亚洲另类精品无码专区| 啪啪网站免费观看| 亚洲综合久久中文字幕专区一区| 色综合悠悠88久久久亚洲| 蜜桃一区二区三区| 日韩精品无码一区二区三区免费| Y111111国产精品久久久| 免费啪啪av人妻一区二区| 国产不卡在线视频观看| 国产精品久久久久影院| 中文字幕经典一区| 日本一区中文字幕在线播放| 伊人久久大香线蕉午夜av| 国产96在线 | 欧美| 亚洲av成人在线网站| 国产女人乱码一区二区三区| 国产强被迫伦姧在线观看无码| 天美麻花果冻视频大全英文版| 免费在线观看亚洲视频| 日韩精品在线视频一二三| 久久久国产精品黄毛片| 99久久精品国产一区二区蜜芽| 无码国产一区二区色欲| 国产草逼视频免费观看| 中文字幕乱码高清完整版| 欧美人与动人物牲交免费观看| 日韩人妻高清福利视频|