李勇 譚小玲 陳曉婷 管慧
[摘要]通過構(gòu)建安化黑茶產(chǎn)品的用戶畫像,分析其用戶群體的消費(fèi)行為特征,可為商家提供多維度的產(chǎn)品用戶信息,便于商家了解用戶,進(jìn)而改進(jìn)產(chǎn)品與服務(wù),為安化黑茶電商營銷策略提供決策依據(jù)。以京東、天貓、淘寶三大電商平臺(tái)為基礎(chǔ),使用python的scrapy第三方庫采集淘寶、京東電商平臺(tái)安華黑茶的評(píng)價(jià)數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行清洗、去空值、去停用詞等預(yù)處理,運(yùn)用jieba第三方庫對(duì)評(píng)論數(shù)據(jù)進(jìn)行分詞、詞頻分析,完成對(duì)安化黑茶用戶特征的完整刻畫。結(jié)合客戶評(píng)論數(shù)據(jù)分析,可知安化黑茶近3/4用戶為男性;山東省為安化黑茶網(wǎng)購大省;網(wǎng)購渠道依次為淘寶、京東、天貓;關(guān)注安化黑茶的人更喜歡教育、汽車服飾、綜藝等;消費(fèi)者對(duì)安化黑茶訴求如“減肥”、“抗衰老”、“降血脂”等比例升高。
[關(guān)鍵詞]用戶畫像;安化黑茶;電商營銷;數(shù)據(jù)分析;文本挖掘
[中圖分類號(hào)]F724.6;F323.7 [文獻(xiàn)標(biāo)識(shí)碼]A
1 引言
近年來,電子商務(wù)發(fā)展迅速。湖南安華黑茶借助電商平臺(tái)的便捷化優(yōu)勢(shì),拓展了線上營銷渠道,其線上電商平臺(tái)的商品評(píng)論區(qū)也逐漸成為消費(fèi)者發(fā)表商品訴求的交流平臺(tái)。因此可以通過獲取用戶的評(píng)論數(shù)據(jù),來挖掘用戶的需求,以此幫助湖南安化黑茶提升品牌價(jià)值、增強(qiáng)市場(chǎng)競(jìng)爭(zhēng)力。而大數(shù)據(jù)環(huán)境下的用戶畫像分析是近年來深度挖掘用戶需求的重要方法。國內(nèi)外學(xué)者不斷關(guān)注用戶畫像方面的研究,其中用戶畫像精準(zhǔn)營銷是當(dāng)前研究的熱點(diǎn)。
用戶畫像這一概念最早由交互設(shè)計(jì)之父Alan Cooper提出,其認(rèn)為用戶畫像是真實(shí)用戶的虛擬代表是建立在真實(shí)數(shù)據(jù)之上的目標(biāo)用戶模型。Teixeira C、Pinto J S、Martins J A等國外研究者認(rèn)為用戶畫像是一個(gè)獨(dú)立的描述用戶需求、偏好和興趣的模型,是從海量數(shù)據(jù)中提煉的個(gè)人信息的數(shù)據(jù)集合。中國科學(xué)技術(shù)信息研究所信息資源中心主任曾建勛認(rèn)為,用戶畫像是指獲取用戶的專業(yè)背景、文化程度、知識(shí)獲取習(xí)慣、興趣偏好、特長(zhǎng)任務(wù)等與用戶需求趨向相關(guān)的信息,以此為基礎(chǔ)進(jìn)行模型化表示,為用戶制定特定標(biāo)簽。雖然研究者對(duì)用戶畫像的概念表述存在一定差異,但研究者一致認(rèn)同用戶畫像是面向用戶展開的基于真實(shí)數(shù)據(jù)進(jìn)行的研究。ZorattiS等提出了如何利用數(shù)據(jù)挖掘事物間的關(guān)聯(lián)性并應(yīng)用到精準(zhǔn)營銷中;KennedyDS從移動(dòng)互聯(lián)網(wǎng)的角度提出精準(zhǔn)營銷的具體實(shí)施方法;ZhenY等提出了精準(zhǔn)營銷的決策框架,通過識(shí)別不同類別客戶之間的潛在特征,提出適當(dāng)?shù)木珳?zhǔn)營銷策略。用戶畫像技術(shù)還逐步涉及個(gè)性化搜索、城市計(jì)算、預(yù)測(cè)用戶年齡、興趣愛好、性別、地理位置等。用戶畫像有兩個(gè)層次的定義。第一種是從產(chǎn)品設(shè)計(jì)、運(yùn)營過程中從用戶群體中抽象出來的典型用戶,能夠表達(dá)用戶群體的主要需求和期望。第二種是基于特定使用情境下真實(shí)的用戶行為數(shù)據(jù)所形成的描述用戶屬性及其行為的標(biāo)簽集合。第二種層次的用戶畫像更具有真實(shí)性以及較強(qiáng)的時(shí)效性。
近幾年,關(guān)于用戶畫像精準(zhǔn)營銷的決策框架的研究越來越多,但涉及具體案例及具體應(yīng)用的研究較少,因此,本文構(gòu)建用戶畫像是針對(duì)第二層次,根據(jù)客戶的評(píng)價(jià)數(shù)據(jù),抓住其需求特征,進(jìn)行用戶畫像分析與可視化的構(gòu)建,為企業(yè)確定目標(biāo)客戶,制定精準(zhǔn)的營銷方式、迎合不同消費(fèi)者的需求提供依據(jù)。研究?jī)?nèi)容包括兩部分,第一部分是通過獲取用戶的評(píng)論數(shù)據(jù)來搜集用戶屬性信息,將屬性信息標(biāo)簽化以便對(duì)用戶進(jìn)行畫像。第二部分是基于用戶畫像挖掘消費(fèi)者對(duì)于安化黑茶的需求,實(shí)現(xiàn)對(duì)企業(yè)精準(zhǔn)營銷方式的進(jìn)一步完善。
2 客戶評(píng)價(jià)數(shù)據(jù)的采集與處理
構(gòu)建用戶畫像,應(yīng)從用戶留在網(wǎng)絡(luò)上的“數(shù)據(jù)足跡”的采集、整理與歸類開始。用戶發(fā)表評(píng)論的時(shí)間、內(nèi)容屬性、追加評(píng)論、評(píng)論圖片是用戶數(shù)據(jù)采集的主要來源,采集數(shù)據(jù)之后需要對(duì)用戶數(shù)據(jù)進(jìn)行有效過濾,去除無效、雜亂數(shù)據(jù),過濾之后對(duì)海量的用戶評(píng)論數(shù)據(jù)進(jìn)行清洗、分詞、詞頻分析等處理,發(fā)現(xiàn)其中隱含的有價(jià)值的信息,再通過文本處理工具與情感分析工具構(gòu)建用戶畫像,主要從用戶特征、購買渠道、地域分布、關(guān)聯(lián)產(chǎn)品這幾個(gè)方面進(jìn)行可視化呈現(xiàn),具體如圖1所示。
2.1 客戶評(píng)價(jià)數(shù)據(jù)采集
據(jù)公開資料顯示,中國網(wǎng)民已經(jīng)達(dá)6.88億,其中90.1%的通過手機(jī)上網(wǎng),手機(jī)網(wǎng)民達(dá)6.2億,超過70%網(wǎng)購消費(fèi)發(fā)生在移動(dòng)端,電商網(wǎng)絡(luò)逐漸成為主流。而在眾多電商平臺(tái)中,天貓、淘寶電商平臺(tái)年度活躍用戶達(dá)5.76億,天貓商家店鋪數(shù)量達(dá)23萬,淘寶商家店鋪數(shù)量達(dá)1000萬;京東電商平臺(tái)年度活躍用戶達(dá)4.18億,已注冊(cè)京東商城的商家超過20萬。
據(jù)此,本文以淘寶、京東為數(shù)據(jù)采集對(duì)象,使用python的scrapy第三方庫爬取對(duì)淘寶、天貓、京東有關(guān)安化黑茶的客戶評(píng)論數(shù)據(jù)。由于淘寶、京東平臺(tái)上的安化黑茶商家眾多且經(jīng)營商品復(fù)雜,不利于后期數(shù)據(jù)分析工作。因此本文根據(jù)店鋪的好評(píng)率、收藏人數(shù)、經(jīng)營年數(shù)將天貓、淘寶店鋪分成“金色皇冠”商家、“藍(lán)色皇冠”商家、“藍(lán)色鉆石”商家并從這三類商家中分別選取三個(gè)最有影響力的商家,從京東旗艦店、自營店、第三方賣家三類商家中分別選取三個(gè)最有影響力的商家,選取這六個(gè)店鋪的客戶評(píng)價(jià)作為數(shù)據(jù)樣本,具體店鋪選取情況如表1所示。
將以上三家天貓、淘寶店鋪的安化黑茶客戶評(píng)價(jià)作為關(guān)鍵詞,采集客戶評(píng)價(jià)數(shù)據(jù)并將數(shù)據(jù)采集結(jié)果保存至Excel表格中。本文共采集了10個(gè)字段,主要涉及電商消費(fèi)者發(fā)布的評(píng)價(jià)內(nèi)容及時(shí)間等,共采集到13571條數(shù)據(jù),數(shù)據(jù)采集結(jié)果如圖2所示。將采集的三家京東店鋪的安華黑茶客戶評(píng)價(jià)數(shù)據(jù)保存至Excel表中,共采集到12037條數(shù)據(jù),局部數(shù)據(jù)采集結(jié)果如圖2所示。
2.2 客戶評(píng)價(jià)數(shù)據(jù)預(yù)處理
通過本次研究的客戶對(duì)于安化黑茶的評(píng)價(jià),對(duì)應(yīng)的客戶對(duì)于安化黑茶的喜好程度與改善建議,從而對(duì)安化黑茶的客戶做用戶畫像,因此只有客戶評(píng)價(jià)內(nèi)容不為空才對(duì)本次研究有意義,所以將數(shù)據(jù)中空字段評(píng)論過濾掉。同時(shí),用戶的評(píng)論列表里可能存在部分過短的評(píng)論信息,經(jīng)過調(diào)查研究,發(fā)現(xiàn)8個(gè)字以上的評(píng)論信息為有效的評(píng)論信息,故以此清洗掉少于8個(gè)字的用戶評(píng)論,最終得到天貓、淘寶有效評(píng)論數(shù)據(jù)12065條,京東有效評(píng)論數(shù)據(jù)10087條數(shù)據(jù)。
5 結(jié)語
本文以大數(shù)據(jù)背景下安化黑茶的用戶畫像為研究對(duì)象,通過python對(duì)天貓、淘寶、京東三大電商平臺(tái)進(jìn)行數(shù)據(jù)采集,對(duì)三大電商平臺(tái)的不同等級(jí)安化黑茶店鋪的客戶評(píng)價(jià)進(jìn)行文本挖掘與分析,再通過構(gòu)建用戶畫像對(duì)不同的消費(fèi)者進(jìn)行消費(fèi)行為可視化,在此基礎(chǔ)上進(jìn)行用戶畫像分析。從多維度對(duì)用戶的潛在需求進(jìn)行精確畫像,不斷提升營銷與推廣的精準(zhǔn)性,不斷為發(fā)展安化黑茶業(yè)務(wù)和改善公司形象、為大數(shù)據(jù)時(shí)代安化黑茶企業(yè)的發(fā)展降本增收。
[參考文獻(xiàn)]
[1] 張小可,沈文明,杜翠鳳.貝葉斯網(wǎng)絡(luò)在用戶畫像構(gòu)建中的研究[J].移動(dòng)通信,2016(22):22-26.
[2] Teixeira C, Pinto J S, Martins J A. User Profiles in organizational Environment [c]. funchal, Madeira, Portugal: the Fourth International Conference on Web Information Systems and Technologis,2008:329-332.
[3] 曾建勛.精準(zhǔn)服務(wù)需要用戶畫像[J].數(shù)字圖書館論壇,2017(12):1.
[4] Zoratti S, Gallagher L. Precision Marketing: Maximizing Revenue Through Relevance[M]. Kogan Page,2012.
[5] Kennedy D S. The Ultimate Marketing Plan: Target Your Audience! Get Out Your Message! Build Your Brand! [M]. Adams Media,2014.
[6] Zhen Y, Si Y, Zhang D, et al. A decision-making framework for precision marketing[J]. Expert Systems with Applications,2015(7):3357-3367.
[7] Luo F, Wang J Z, Promislow E. Exploring local community structures in large net-works[J]. Web Intelligence and Agent Systems: An International Journal,2008(4):387-400.
[8] Yuan N J, Zhang F, Lian D, et al. We know how you live: exploring the spectrum of urban lifestyles[A]. Proceedings of the first ACM conference on Online social networks[C].ACM, 2013:3-14.
[9] Rosenthal S, McKeown K. Age prediction in blogs: A study of style, content, and online behavior in pre-and post-social media generations[A]. Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies[C]. Association for Computational Linguistics, 2011:763-772.
[10] Chaabane A, Acs G, Kaafar M A. You are what you like! information leakage through users interests[A]. Proceedings of the 19th Annual Network & Distributed System Security Symposium (NDSS) [C].Citeseer, 2012.
[11] Liu W, Ruths D. Whats in a name? using first names as features for gender inference in twitter[A]. AAAI spring Symposium: Analyzing Microtext[C].2013.
[12] Burger J D, Henderson J, Kim G, et al. Discriminating gender on twitter[A]. Proceedings of the Conference on Empirical Methods in Natural Language Processing[C].Association for Computational Linguistics, 2011:1301-1309.
[13] Chen J, Liu Y, Zou M. Home location profiling for users in social media[J]. Information & Management,2016(1):135-143.
[14] Jurgens D. Thats what friends are for: Inferring location in online social media platforms based on social relationships[A].? Proceedings of the 7th International Conference on Weblogs and Social Media [C].JCWSM, 2013:273-282.
[15] Li R, Wang S, Deng H, et al. Towards social user profiling: Unified and discriminative influence model for inferring home locations[A]. Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining[C]. ACM, 2012:1023-1031.
[16] 張海濤,崔陽,王丹,等.基于概念格的在線健康社區(qū)用戶畫像研究[J].情報(bào)學(xué)報(bào),2018,37(09):912-922.