羅博煒
(五邑大學(xué)智能制造學(xué)部,江門 529020)
大數(shù)據(jù)領(lǐng)域涵蓋了數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理、數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)呈現(xiàn)等一系列的技術(shù)手段,隨著技術(shù)的不斷成熟,逐漸被更多富數(shù)據(jù)的行業(yè)和企業(yè)所應(yīng)用,各個(gè)行業(yè)在享受大數(shù)據(jù)帶來收益的同時(shí),也在推動(dòng)大數(shù)據(jù)技術(shù)的快速發(fā)展。從電商網(wǎng)站的“看了又看”“猜你喜歡”等個(gè)性化推薦、商家促銷活動(dòng)的精準(zhǔn)營(yíng)銷,到智慧城市建設(shè)的一站式服務(wù)等應(yīng)用場(chǎng)景,大數(shù)據(jù)已逐漸滲透、應(yīng)用到我們的生活中,成為提高我們生活、工作質(zhì)量的重要組成部分[1]。各行業(yè)產(chǎn)生的海量數(shù)據(jù)只有通過技術(shù)手段進(jìn)行存儲(chǔ)、分析、挖掘才能創(chuàng)造出價(jià)值。隨著近年來數(shù)據(jù)化運(yùn)營(yíng)與數(shù)據(jù)化管理的興起,作為數(shù)據(jù)分析的首選語(yǔ)言,Python 語(yǔ)言在商業(yè)數(shù)據(jù)分析領(lǐng)域的價(jià)值也日漸增長(zhǎng)。
一切能夠進(jìn)行產(chǎn)品推廣、促進(jìn)用戶使用、提高客戶認(rèn)知的方法與活動(dòng)都是運(yùn)營(yíng),運(yùn)營(yíng)的終極目標(biāo)是使產(chǎn)品能持續(xù)穩(wěn)定地、更好地生存下去[1]。好的運(yùn)營(yíng)是通過推廣、引導(dǎo)、活動(dòng)等一系列舉措讓產(chǎn)品的各個(gè)指標(biāo)得到提升。作為評(píng)價(jià)運(yùn)營(yíng)結(jié)果的常用方法,同期群分析的主要目的是分析相似群體隨時(shí)間的變化,它通過將用戶按初始行為的發(fā)生時(shí)間進(jìn)行群組的劃分(即同期群)。
常見的同期群分析表格式如表1,以客戶首次購(gòu)買月份后每月的留存率為例。
表1 同期分析樣例表
表1 中每一橫行表示一個(gè)同期群,代表當(dāng)月新增用戶,在接下來幾個(gè)月的留存情況。通過橫向?qū)Ρ?,能夠?qū)蛻袅舸婧蜕芷谟谐醪降恼J(rèn)識(shí)?;诳v向觀察,可以發(fā)現(xiàn)不同時(shí)期客戶的留存情況的差異,以反推該期引入的客戶是否精準(zhǔn)[2]。
本例的數(shù)據(jù)集為廣州某線上生活用品店2019 年9月~2020 年 2 月的銷售數(shù)據(jù)(53210 條),經(jīng)過清洗與處理后再使用Python 進(jìn)行同期群分析,最后得出客戶的同期群表,以實(shí)現(xiàn)評(píng)估每月促銷活動(dòng)的質(zhì)量并協(xié)助制定新的銷售策略。
案例數(shù)據(jù)集中的部分脫敏數(shù)據(jù)如表2。
表2 廣州某線上生活用品店的部分銷售數(shù)據(jù)
基于訂單數(shù)據(jù)計(jì)算出最終的留存表的核心Python代碼如下:
一步到位的實(shí)現(xiàn)代碼中的整個(gè)大循環(huán)并非易事,將其拆解成新增和留存兩個(gè)部分來進(jìn)行組合實(shí)現(xiàn)將會(huì)容易得多,思路也更加嚴(yán)謹(jǐn)。最終生成的同期分析表的每一行代表一個(gè)同期群,其本質(zhì)邏輯都是一樣的:首先計(jì)算出當(dāng)月新增的客戶數(shù),并記錄客戶昵稱,然后拿這部分客戶,分別去和后面每個(gè)月購(gòu)買的客戶做匹配,并統(tǒng)計(jì)有多少客戶出現(xiàn)復(fù)購(gòu)(留存),只要計(jì)算出每個(gè)月的新增客戶和對(duì)應(yīng)的留存情況,再將這些數(shù)據(jù)拼接在一起,便可實(shí)現(xiàn)最終的完整的同期群分析表。首先需要計(jì)算每個(gè)月的新增客戶數(shù),這個(gè)新增是需要和之前的月份遍歷匹配來驗(yàn)證的,以2019 年11 月為例,其之前的客戶就是2019 年9 月和10 月的數(shù)據(jù),與歷史數(shù)據(jù)做匹配可計(jì)算11 月新增的客戶數(shù),而與11 月之后每個(gè)月的數(shù)據(jù)進(jìn)行匹配可計(jì)算出11 月的留存情況。所以第一層循環(huán)中的每個(gè)月的數(shù)據(jù)與其歷史月份數(shù)據(jù)進(jìn)行客戶昵稱的匹配,不一致者便可視為新增數(shù)據(jù)。內(nèi)層嵌套的循環(huán)則負(fù)責(zé)匹配該月與之后的每個(gè)月的客戶昵稱進(jìn)行匹配,一致者可視為留存成功。
基于本案例脫敏數(shù)據(jù)計(jì)算出的客戶留存率如表3。
表3 案例留存率結(jié)果
對(duì)于相同生命周期階段的用戶進(jìn)行垂直分析(橫向比較),從而比較得出相似群體隨時(shí)間的變化,從表3可以看出:次月流失嚴(yán)重,表現(xiàn)最好的月份次月留存也只有月18%,隨后水平降低,穩(wěn)定在7%左右。
通過比較不同的同期群(縱向比較),可以從總體上看到,2020 年1 月的新增客戶雖然不是最多的,但人群相對(duì)精準(zhǔn),留存率表現(xiàn)優(yōu)于其他月份。從每月固定的促銷活動(dòng)的效果上看,2019 年10 月份的促銷效果帶來的新客最多,但有透支未來銷售的嫌疑,對(duì)口碑影響不利,隨后店鋪對(duì)促銷活動(dòng)的調(diào)整使得次月留存率逐漸升高[3]。
數(shù)據(jù)運(yùn)營(yíng)時(shí)代,促銷活動(dòng)逐漸常態(tài)化,作為零售業(yè)最常見的銷售模式,促銷分析和評(píng)估也變成了一種固定的工作。無(wú)論是分析線下還是線上的促銷活動(dòng)數(shù)據(jù)分析都容易出現(xiàn)一些誤區(qū):只和促銷目標(biāo)對(duì)比,一旦完成了銷售額目標(biāo)的促銷活動(dòng)就算成功;只進(jìn)行促銷期的數(shù)據(jù)同比,且誤差較大和只關(guān)注促銷前和促銷中的數(shù)據(jù),對(duì)促銷后的數(shù)據(jù)關(guān)注較少。這就容易出現(xiàn)虛假繁榮和透支未來消費(fèi)的情況。
同期分析能夠更好的,進(jìn)而為商家或企業(yè)探尋流量營(yíng)銷中出現(xiàn)的問題、調(diào)整產(chǎn)業(yè)結(jié)構(gòu)和流量運(yùn)算的分配提供強(qiáng)有力的參考,使后續(xù)的數(shù)據(jù)化運(yùn)營(yíng)更有的放矢,從而更好的提升客戶的黏性、留存率與延長(zhǎng)其生命周期并制定針對(duì)性的營(yíng)銷方案,最終為企業(yè)的利潤(rùn)最大化帶來幫助。