摘 要:隨著互聯(lián)網(wǎng)發(fā)展,在線交易成為了一種新興的電子商務(wù)模式,在我國也有越來越多企業(yè)認(rèn)識到這一新型商業(yè)模式所帶來的巨大經(jīng)濟(jì)效益。在線交易行為產(chǎn)生了大量交易數(shù)據(jù),其中包括的一種比較典型的數(shù)據(jù)類型就是用戶購買行為數(shù)據(jù)。用戶購買行為數(shù)據(jù)中包含了眾多人在購物時的行為規(guī)模和購買偏好等信息,對相關(guān)研究乃至商業(yè)的個性化推薦等方面都具有一定的推動作用。本文基于阿里天池的淘寶用戶行為數(shù)據(jù),采用可視化分析的手段,從時間維度、用戶行為、商品分析方面對數(shù)據(jù)進(jìn)行了多維度的分析,從中發(fā)現(xiàn)了一些有價值的用戶消費行為模式和偏好,比如淘寶用戶在購物時的消費習(xí)慣、消費偏好習(xí)慣等,對行為研究、個性化推薦等方面的研究與應(yīng)用具有一定的意義。
關(guān)鍵詞:電商;行為數(shù)據(jù);可視分析
一、引言
人類在日常的行為和生產(chǎn)活動中產(chǎn)生了大量的行為數(shù)據(jù)。這類數(shù)據(jù)中包含了用戶在網(wǎng)絡(luò)平臺進(jìn)行各項操作的行為偏好和規(guī)律等。在行為數(shù)據(jù)中,一種很典型的數(shù)據(jù)就是用戶在電商平臺購買物品過程產(chǎn)生的行為數(shù)據(jù),也可以稱之為電商用戶行為數(shù)據(jù),它反映了網(wǎng)絡(luò)用戶的購物傾向,以及商品的銷售規(guī)律等信息,對電商用戶行為數(shù)據(jù)進(jìn)行分析有很大的價值。
對這種行為數(shù)據(jù)進(jìn)行分析與可視化,可以挖掘數(shù)據(jù)背后潛在的人類的行為模式,從而推動行為研究、行為分析等領(lǐng)域的研究與發(fā)展。目前針對于電商行為數(shù)據(jù)的可視分析研究中很多是針對銷售數(shù)據(jù)進(jìn)行研究和處理,如劉珊運(yùn)用B2B交易平臺的交易數(shù)據(jù)對商品進(jìn)行分析;ZorattiS在社會化媒體時代企業(yè)傳播實戰(zhàn)寶典中利用數(shù)據(jù)挖掘事物間的關(guān)聯(lián)性到精準(zhǔn)營銷中;陳燁等人運(yùn)用社會網(wǎng)絡(luò)分析構(gòu)建不同類型用戶社交網(wǎng)絡(luò)有效挖掘用戶行為特征;KennedyDS從移動互聯(lián)網(wǎng)的角度提出用戶行為畫像的具體實施方法;Mueller等人基于Twitter 會員的相關(guān)數(shù)據(jù)集,創(chuàng)立了NamChar名稱分類器,通過預(yù)測用戶性別構(gòu)建用戶畫像。但是,針對此類數(shù)據(jù)的分析研究中,大多數(shù)都是從單一的角度入手進(jìn)行分析,這就會導(dǎo)致分析結(jié)果存在一定的局限性。尤其針對行為數(shù)據(jù)時,從單一的視角很難觀察到人類復(fù)雜的行為特征。
基于上述研究現(xiàn)狀,在本文中采用阿里天池的淘寶用戶行為數(shù)據(jù),應(yīng)用可視分析的手段,從多維度對數(shù)據(jù)進(jìn)行分析,主要包括時間維度、用戶操作行為維度、商品分析。從而從多個視角了解用戶在不同維度下的各類操作的規(guī)模、模式,還能綜合多維度的分析結(jié)果,還原人類復(fù)雜的購物行為。經(jīng)過分析,本文提出的方法能夠挖掘時間段內(nèi)用戶的時間行為偏好、購買商品偏好、購買習(xí)慣偏好,有助于發(fā)掘行為規(guī)律,推動相關(guān)研究發(fā)展。
二、數(shù)據(jù)與可視分析任務(wù)描述
1.數(shù)據(jù)描述與預(yù)處理
本文的樣本數(shù)據(jù)來源于天池阿里云提供的淘寶用戶行為數(shù)據(jù)集。該數(shù)據(jù)集描述了淘寶用戶在2014年11月-2014年12月內(nèi)在淘寶App中的一系列操作行為數(shù)據(jù)。該數(shù)據(jù)集的原始規(guī)模有8.90MB,包含用戶編號、商品編號、行為類型、用戶地理位置、商品種類、行為發(fā)生時間六個字段。對數(shù)據(jù)進(jìn)行處理后,共包括1048575條記錄,時間跨度48天,涉及到8477位用戶和701610件商品,7095類商品。
2.可視分析任務(wù)
本文總結(jié)了在電商用戶行為中行為用戶操作類型與具體操作行為數(shù)據(jù)中應(yīng)當(dāng)核心關(guān)注的內(nèi)容,從而指導(dǎo)本文中可視分析任務(wù)的設(shè)計,主要有以下內(nèi)容。
T1:分析群體與個體操作行為的時間偏好規(guī)律。即不同時間粒度下不同用戶的操作行為。
T2:分析群體與個體進(jìn)行購買行為的數(shù)量偏好。即用戶短期內(nèi)購買商品的頻次分析。
T3:分析群體在線上購物的總體行為偏好。如各項操作的頻率與購買偏好。
T4:分析商品的瀏覽、銷售等規(guī)律。各操作與商品之間的分析。
三、電商數(shù)據(jù)的用戶行為可視分析
基于處理后的數(shù)據(jù)集以及分析任務(wù),本文設(shè)計用戶行為可視分析方法,從不同時間粒度進(jìn)行用戶活躍度分析、用戶操作行為分析、商品分析等。
1.不同時間粒度的用戶活躍度分析
本節(jié)分別選取了2014年11月-12月,一天中所有用戶的操作行為數(shù)量的總和,并按照天進(jìn)行統(tǒng)計與展示;選取了整個時間段中,一天內(nèi)所有用戶的操作行為數(shù)量的總和,并按照小時進(jìn)行統(tǒng)計與展示。本文將上述不同時間粒度下用戶的操作行為定義為“用戶活躍度”。
2014年11月-12月,用戶的總體活躍度如圖1(a)所示。基于圖可得,折線整體趨于平緩,且明顯存在兩個峰值,峰值一是每月11日-13日,峰值二是一月中的17日-19日,此二峰值均處于“雙十一”前后,故認(rèn)為由于“雙十一”優(yōu)惠活動使得用戶在該時間段操作頻繁。
一天中用戶活躍度如圖1(b)所示。在圖中可以發(fā)現(xiàn),從0點至24點,整體呈先減少后增加再減少的趨勢,并存在2個谷值和1個峰值。谷值一是每天凌晨2點-5點,谷值二為每天16點-18點,兩個時間段中,大部分用戶處于工作或睡眠狀態(tài),因而活躍度較低。峰值是21點-22點,該時間大部分用戶處于非工作時間,網(wǎng)購的活躍度普遍較高。這在一定程度上也反映了大部分用戶網(wǎng)購的時間規(guī)律。
2.用戶操作行為分析
(1) 用戶購買數(shù)量分析
本節(jié)對11月-12月之間,用戶購買商品的數(shù)量進(jìn)行了分析。據(jù)初步統(tǒng)計,大部分購買者購買物品都是在9件以內(nèi),為便于更深入的理解與分析,也為了解大多數(shù)用戶購買商品的差異性,本文將購買細(xì)分為購買1件、購買2-4件、購買5-8件、購買9-100件四個數(shù)量級。結(jié)果如圖2所示。
根據(jù)圖2(a)的漏斗圖可以發(fā)現(xiàn),用戶整體購買商品的數(shù)量呈現(xiàn)遞減的趨勢。其中,購買1件商品的人數(shù)極多,購買2-4件商品的人數(shù)與之類似,即大部分人屬于消費數(shù)量較少的少數(shù)需求,謹(jǐn)慎消費的狀態(tài)。在8477人中,只有82人購買了9件以上的商品,說明大量消費人數(shù)占極少比例,該類用戶可能存在大量需求,也可能為具有沖動。
把用戶購買商品的數(shù)量繪制成折線圖如圖2(b)所示。其中,橫軸代表購買商品的數(shù)量,縱軸代表購買該數(shù)量商品的用戶數(shù)量。從圖中可發(fā)現(xiàn),整體呈現(xiàn)遞增趨勢。在購買商品數(shù)量在9-82件時,整體呈現(xiàn)平緩狀態(tài),這從另一個角度反映了極大部分用戶在短時間內(nèi)均為單次小數(shù)目購買。
(2) 用戶操作行為分析
本節(jié)對用戶在11月-12月時間跨度下的付款、加購、瀏覽、支付四種操作行為進(jìn)行了可視化分析。用戶操作行為分析從用戶五種操作的結(jié)合、用戶的“收藏-加購-支付”行為和用戶的“瀏覽-支付”三個方面來做。
一方面結(jié)合了用戶的五種操作,并通過折線圖來展示用戶行為間的關(guān)系,并對用戶的付款、加購、瀏覽、支付的行為進(jìn)行數(shù)量大小比較。結(jié)果如圖3(a)所示。其中,用戶操作次數(shù)和用戶瀏覽次數(shù)整體呈現(xiàn)先減少再增長又減少趨勢,與人本身作息規(guī)律相符。而另外三種操作,即用戶付款、用戶收藏、用戶加購的次數(shù),整體呈現(xiàn)平緩趨勢,且與用戶瀏覽次數(shù)差距較大。綜上可得,用戶大部分操作都是瀏覽,支付的操作是遠(yuǎn)小于瀏覽。
二方面是結(jié)合了用于收藏-加購-付款三種操作間的關(guān)系。通過形成折線圖與柱狀圖對其進(jìn)行趨勢分析,如圖3(c)可以得到,收藏-加購-付款數(shù)額整體呈現(xiàn)相同趨勢,付款數(shù)額遠(yuǎn)小于收藏數(shù)額,用戶的消費沖動不足以支撐每件商品的購買,而收藏數(shù)額遠(yuǎn)小于加購數(shù)額,其原因為用戶更喜歡用加購習(xí)慣來對商品進(jìn)行標(biāo)記。局部來看,收藏數(shù)額波動更大,受個體差異習(xí)慣影響較大。
三方面是針對于瀏覽-支付分時轉(zhuǎn)化率間用戶分析。通過形成折線圖3(d)對其進(jìn)行趨勢分析??傮w來看,瀏覽-支付比率整體呈現(xiàn)平緩趨勢,即用戶消費習(xí)慣在一天中基本處于穩(wěn)定狀態(tài)。局部而言,在每天10時-15時情況下,轉(zhuǎn)化率突增,推測用戶此時購買為剛需產(chǎn)品,從而增高轉(zhuǎn)化率。
(3) 轉(zhuǎn)化率分析
本文對11月-12月時間跨度下,用戶購買商品的轉(zhuǎn)化率進(jìn)行了分析,即用戶進(jìn)行其他操作至最終支付的情況。本文將轉(zhuǎn)化率分為以下四個路徑。路徑一:從用戶瀏覽商品至收藏商品,再到加購商品,最終支付該商品。路徑二:從用戶瀏覽商品至加購商品到最終支付該商品。路徑三:從用戶瀏覽商品至收藏商品到最終支付該商品。路徑四:從用戶瀏覽商品后至直接支付該商品。在本節(jié)中,計算了上述四種路徑的支付轉(zhuǎn)化率,即并繪制了頻率分布直方圖展示各路徑下支付的轉(zhuǎn)化率,如圖4所示。
圖4(a)是路徑1的轉(zhuǎn)化率,圖中絕大部分轉(zhuǎn)化率集中在0-0.2區(qū)間,即處于一種低轉(zhuǎn)化率狀態(tài),這種路徑較復(fù)雜,涉及到較多的操作,故極少有用戶在購買物品時全部完成這些所有操作后最終支付商品。圖4(b)為路徑2的轉(zhuǎn)化率,其轉(zhuǎn)化率數(shù)值區(qū)間集中于0-0.45之間,其轉(zhuǎn)化率相較于其他類型轉(zhuǎn)化率較高,該操作步驟符合消費者一般操作習(xí)慣。圖4(c)是路徑3的轉(zhuǎn)化率,圖4(d)是路徑4的轉(zhuǎn)化率,均處于極低狀態(tài),轉(zhuǎn)化率集中于0-0.1之間,究其原因為用戶對收藏商品的偏好遠(yuǎn)低于加購商品,且用戶極少直接通過瀏覽對商品進(jìn)行支付。
3.商品分析
本節(jié)對11月-12月時間跨度下,對商品銷量、用戶瀏覽量、加購量、收藏量進(jìn)行分析,從而了解各個商品及商品類型對客戶瀏覽、加購、收藏等操作的影響。結(jié)果如圖5所示。
圖5(a)為商品加購量前20,圖5(b)為商品瀏覽量前20,圖5(c)為商品收藏量前20,圖5(d)為商品購買量前20,經(jīng)過對比,并不存在商品同時處于瀏覽、加購、收藏、購買前20中,瀏覽量第一與收藏量第一商品重合但該商品并未進(jìn)入銷量前20,加購量第一也未能進(jìn)入銷量前20商品中,局部而言,瀏覽商品前20中僅一件商品進(jìn)入銷量前20商品列表中,收藏圖中無商品進(jìn)入銷量前20商品列表中,加購商品共有五件商品進(jìn)入銷量前20。
122338823商品共計銷售出82件、123842164共計銷售出49件等可得,瀏覽會導(dǎo)致和收藏商品受用戶體驗感影響較強(qiáng),但用戶熱衷于瀏覽和收藏的并不能代表用戶更愿意加購或支付該商品,即瀏覽量的高低與銷量的高低并無直接的強(qiáng)關(guān)聯(lián)。用戶存在大量上商品的購買并未進(jìn)行大量操作,可見用戶直接購買商品占絕大多數(shù),多數(shù)用戶生活存在剛需,該類商品具有支付時間短、瀏覽次數(shù)少、支付時間多的特點。
四、總結(jié)
人類日常生活生產(chǎn)活動產(chǎn)生了大量行為數(shù)據(jù)。隨著信息化的發(fā)展與普及,越來越多的人在網(wǎng)上購物,產(chǎn)生了大量電商行為數(shù)據(jù)。這些數(shù)據(jù)中包含了人類在購物時的行為模式、購物規(guī)律等,在行為研究、模式挖掘等領(lǐng)域有很大的研究價值?;诎⒗镌铺斐氐奶詫氂脩粜袨閿?shù)據(jù)集,本文中通過三個維度分析數(shù)據(jù),分別通過時間維度分析發(fā)現(xiàn)用戶高活躍狀態(tài)時間,通過分析用戶行為發(fā)現(xiàn)用戶對偏好商品的標(biāo)記習(xí)慣與購買習(xí)慣間的關(guān)系,通過商品維度分析各操作下商品之間關(guān)系發(fā)現(xiàn)高銷產(chǎn)品特點,從而總結(jié)出了一系列淘寶用戶的行為模式與規(guī)律,對于相關(guān)研究具有一定的推動作用。然而,本文仍然存在一定的局限性,比如尚未對用戶購買商品間隔進(jìn)行分析,我們在未來的工作會解決這些問題。
參考文獻(xiàn):
[1]劉珊,蔡明月,劉興.淘寶文化產(chǎn)業(yè)數(shù)據(jù)的可視化研究[J].科教文匯,2018(19):183-185.DOI:10.16871/j.cnki.kjwha.2018.07.079.
[2]Zoratti S,Gallagher L.Precision Marketing:Maximizing Revenue Through Relevance[M].Kogan Page,2012.
[3]陳燁,王樂,陳天雨,等.基于社會網(wǎng)絡(luò)分析的社會化問答平臺用戶畫像研究[J].情報學(xué)報,2021,40(4):414-423.DOI:10.3772/j.issn.1000-0135.2021.04.008.
[4]Kennedy D S.The Ultimate Marketing Plan:Target Your Audience!Get Out Your Message!Build Your Brand![M].Adams Media,2014.
[5]MUELLER J,STUMME G.Gender inference using statistical name characteristics in twitter[EB/OL].(2016-6-17)[2018-3-01].https://arxiv.org/abs/1606.05467.
[6]阿里云天池-淘寶用戶行為數(shù)據(jù)集.https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1.
作者簡介:費千笑(2000.09- ),女,漢族,四川成都人,本科在讀,研究方向:金融數(shù)據(jù)分析