薛海濤 何浩宇 陳延展 包辛煜
摘 要:隨著汽車大數(shù)據(jù)產(chǎn)業(yè)時(shí)代的到來,傳統(tǒng)營銷方法已不能滿足市場的快速變化,基于大數(shù)據(jù)的精準(zhǔn)營銷具有相當(dāng)大的優(yōu)勢?;诖?,本文采取數(shù)據(jù)驅(qū)動(dòng)的手段研究汽車用戶畫像,首先基于上汽通用五菱汽車股份有限公司的用戶購買數(shù)據(jù)集,通過相關(guān)性分析進(jìn)行用戶分群,其次分析人群特征,從而總結(jié)篩選出對于體驗(yàn)用戶的建議,最后基于用戶的行車數(shù)據(jù)集,通過聚類算法提取出用戶出行的興趣點(diǎn),為汽車產(chǎn)品的精準(zhǔn)營銷策略分析提供了可靠的指導(dǎo)。
關(guān)鍵詞:數(shù)據(jù)驅(qū)動(dòng) 用戶畫像 精準(zhǔn)營銷 聚類分析
1 引言
隨著傳感器技術(shù)與數(shù)據(jù)傳輸技術(shù)的發(fā)展,各方面數(shù)據(jù)的獲取日益便利,基于大數(shù)據(jù)的用戶畫像研究能為企業(yè)提供精準(zhǔn)的特征知識。Wang等[1]提出了用戶日常駕駛模式模型,且為了實(shí)現(xiàn)低成本下的充電負(fù)荷波動(dòng)最小,構(gòu)建了雙級優(yōu)化模型確定最優(yōu)充電策略。Pearre等[2]為了獲取用戶需求,研究了全種類新能源汽車的平均行駛距離,從而設(shè)計(jì)出用戶喜愛的新能源汽車。胡海清等[3]利用客戶購買行為數(shù)據(jù)驗(yàn)證了理論模型,并提出了在不同電商模式下的網(wǎng)絡(luò)營銷策略。詹麗華[4]結(jié)合用戶行為情景和用戶素養(yǎng)分析了用戶行為特征。本文基于上汽通用五菱汽車股份有限公司提供的用戶相關(guān)數(shù)據(jù)集,分析總結(jié)篩選出對于體驗(yàn)用戶的建議,并且通過聚類算法獲取了用戶的出行興趣點(diǎn),從而準(zhǔn)確把握用戶需求,實(shí)現(xiàn)汽車產(chǎn)品的精準(zhǔn)營銷。
2 汽車產(chǎn)品用戶群體特征
汽車用戶產(chǎn)品群體特征是指從多源數(shù)據(jù)中獲取的對汽車產(chǎn)品用戶的消費(fèi)行為有所影響的群體屬性?;诖髷?shù)據(jù)情形下的汽車產(chǎn)品用戶群體特征分析,是對通過各種方法收集到的用戶數(shù)據(jù)信息的分析。在汽車這種高度復(fù)雜的產(chǎn)業(yè)中,將會產(chǎn)生結(jié)構(gòu)化和非結(jié)構(gòu)化的超大數(shù)據(jù)量,涉及場景和系統(tǒng)復(fù)雜,數(shù)據(jù)的清洗、轉(zhuǎn)化、融合是一項(xiàng)重要挑戰(zhàn)。
汽車用戶產(chǎn)品群體特征是指從多源數(shù)據(jù)中獲取的對汽車產(chǎn)品用戶的消費(fèi)行為有所影響的群體屬性。其中,多源數(shù)據(jù)是指某一品牌或某款特定車型投入市場后得到的大規(guī)模用戶數(shù)據(jù)。汽車產(chǎn)品用戶群體特征具體表現(xiàn)為用戶基本屬性、駕駛習(xí)慣屬性、充電習(xí)慣屬性、社交偏好屬性、用戶關(guān)注點(diǎn)屬性、消費(fèi)習(xí)慣屬性。
標(biāo)簽是對信息的抽象化表示,可以是任何文字或符號,體現(xiàn)一定的群體性和事物特性[5]。同時(shí),標(biāo)簽系統(tǒng)的構(gòu)建需遵循MECE(Mutually Exclusive Collective Exhaustive)原則[6]。本文將標(biāo)簽分為靜標(biāo)簽和動(dòng)標(biāo)簽。靜態(tài)屬性標(biāo)簽指用戶的基本屬性,可以通過靜態(tài)標(biāo)簽算法對數(shù)據(jù)列標(biāo)簽索引,獲取信息并生產(chǎn)新標(biāo)簽。動(dòng)態(tài)屬性標(biāo)簽根據(jù)數(shù)據(jù)類型:數(shù)字型信息、文本型信息、網(wǎng)頁信息等,采用不同算法進(jìn)行標(biāo)簽。然后構(gòu)建用戶畫像,并對數(shù)據(jù)進(jìn)行分析、挖掘,得到數(shù)據(jù)中隱藏的相關(guān)關(guān)系,是大數(shù)據(jù)時(shí)代數(shù)據(jù)分析的重要一步[7]。最后根據(jù)分析的結(jié)果,制定優(yōu)化方案、精準(zhǔn)營銷等,為汽車產(chǎn)業(yè)的各階段提供參考依據(jù)。
3 汽車用戶購買行為分析
利用“車輛+用戶”的大量行為數(shù)據(jù),提升數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)化的效率,取得系列購車用戶屬性,并對購買者與未購買者進(jìn)行分析,可以發(fā)現(xiàn)潛在用戶群體,制定合理的銷售策略。原始數(shù)據(jù)包括用戶的消費(fèi)習(xí)慣特征和駕駛習(xí)慣特征等。
以五菱新能源汽車用戶體驗(yàn)數(shù)據(jù)為例,進(jìn)行購買行為分析,數(shù)據(jù)集包括5070位五菱新能源汽車用戶的相關(guān)數(shù)據(jù),包含100178條用車數(shù)據(jù)和89102條問卷數(shù)據(jù)。具體分析流程如下。首先結(jié)合用車數(shù)據(jù)和問卷數(shù)據(jù),計(jì)算用戶標(biāo)簽;然后選擇相關(guān)性高或業(yè)務(wù)需求高的標(biāo)簽作為特征,進(jìn)行用戶分群;再分析人群特征,總結(jié)篩選體驗(yàn)用戶的建議。故提取和匹配13大用戶特征,首先進(jìn)行特征相關(guān)度分析[8],如圖1所示。相關(guān)系數(shù)絕對值越大表明相關(guān)度越高,取值范圍為[-1,1];正相關(guān)表示標(biāo)簽取值越大,用戶購買車輛的可能性越大。負(fù)相關(guān)表示標(biāo)簽取值越小,用戶購買車輛的可能性越小。對于數(shù)值型變量(如總里程),正相關(guān)表示總里程越大,用戶越可能購車;而對于類別型變量,正負(fù)值與賦值方法有關(guān)。
根據(jù)特征相關(guān)系分析可知,相關(guān)度高的標(biāo)簽包括總里程、每日最大單次里程、總充電次數(shù)、充電位置、燃油車價(jià)格、車系、共同居住人數(shù)等。相關(guān)度低的標(biāo)簽:燃油車數(shù)量、家庭年收入、用戶職業(yè)、車輛日啟動(dòng)次數(shù)。
然后利用上述的13大特征,對已購車和未購車人群分別進(jìn)行聚類,可以區(qū)分出5類特征差異明顯的人群:已購車用戶兩類:高學(xué)歷高收人群(15人,44%),經(jīng)濟(jì)適用年輕人(19人,56%);未購車用戶三類:高需求中等收入家庭(110人,23%)、低需求中等收入家庭(189人,40%)、低需求年輕人(174人,37%),聚類結(jié)果如圖2所示。
對已購和未購人群進(jìn)行聚類分析,從聚類結(jié)果中可以發(fā)現(xiàn)以下結(jié)論:對于已購車用戶群體:第一類用戶群體的主要特征是屬于中低年齡、高學(xué)歷、已婚一個(gè)孩子家庭。該用戶群體的用車需求不高,日均行駛里程35km左右,平均5天充一次電,對充電頻率要求不高,但是對充電便利性要求高,因此他們以單位充電為主,其中大約53%的用戶有多個(gè)充電點(diǎn)。對于第一類已購人群具體分析結(jié)果如圖3所示。
第二類已購車用戶群體是經(jīng)濟(jì)適用年輕人:畢業(yè)不久本科生,未婚居多。他們的經(jīng)濟(jì)基礎(chǔ)較低,但用車需求偏高,日均行駛里程42km左右,平均3天充一次電,他們對公共充電樁接受度高或單位可解決充電問題,以單位、城市公共充電樁為主,分析結(jié)果如圖4所示。
對于未購車人群,主要分為三類:高需求中等收入家庭(潛在用戶)類、低需求中等收入家庭類、低需求年輕人類。
第一類是高需求中等收入家庭(潛在用戶)類:30-40歲已婚人群,用車需求極高,要求充電方便,但學(xué)歷偏低,收入一般,家庭負(fù)擔(dān)重,消費(fèi)保守。分析結(jié)果如圖5所示。
第二類屬于低需求中等收入家庭類:未購車已婚人群與購車已婚人群(高學(xué)歷高收入)的主要差異集中在家庭經(jīng)濟(jì)基礎(chǔ),那些能負(fù)擔(dān)得起15萬以上的燃油車的用戶群體更易轉(zhuǎn)化成新能源用戶,主要是因?yàn)檫@個(gè)用戶群體經(jīng)濟(jì)基礎(chǔ)較好。這類用戶群體用車需求不高且買車的意愿較高,看重品質(zhì),對充電便利性要求高,但是也可能由于充電不夠方便而放棄購車。
第三類為低需求年輕群體類,這類用戶群體主要特征為出行需求不高,且主要出行路線為公司和居住地,收入普遍較低,同時(shí)可能會面臨停車難、充電難的問題,更加減弱了他們的出行需求意愿。
通過上述對五菱新能源汽車用戶的購買行為分析,可為精準(zhǔn)營銷提供以下幾條建議:第一,從學(xué)歷/收入、年齡/婚姻、出行需求等方面篩選體驗(yàn)用戶,本科以上學(xué)歷,家庭燃油車車價(jià)15萬以上,如果充電條件便利,容易轉(zhuǎn)化。第二,家庭燃油車車價(jià)在5-15萬左右,30-40歲的已婚人群,目前轉(zhuǎn)化率較低,但其用車需求高,有充電條件,后續(xù)可以考慮針對此類人群制定有效轉(zhuǎn)化方案。第三,家庭燃油車車價(jià)在15萬以下甚至無車的用戶,優(yōu)先給本科/??频?0-30歲人群發(fā)放體驗(yàn),當(dāng)單次出行距離大于16km時(shí)更容易轉(zhuǎn)化。
4 汽車用戶行為軌跡分析
用戶行為軌跡特征提取和預(yù)測是汽車用戶畫像出行特征模塊的核心技術(shù)。目前的網(wǎng)聯(lián)汽車車載信號傳輸設(shè)備通常采集每5s-10s的位置信號,在5G時(shí)代可以采集時(shí)間間隔更短、更精確、更詳實(shí)的(包含語義地址)位置信息,提供智能化、個(gè)性化的服務(wù)。某用戶出行軌跡示例如圖6所示:
提取五菱新能源汽車用戶的一個(gè)月行車數(shù)據(jù)為例,進(jìn)行用戶出行行為分析,興趣點(diǎn)位置聚類(7類)和時(shí)空聚類(8類)結(jié)果分別如圖7、圖8所示。并將時(shí)空聚類(8個(gè))在百度地圖上進(jìn)行可視化展示,如圖9所示。
將時(shí)空聚類后的興趣點(diǎn)進(jìn)行編號,構(gòu)建出時(shí)間序列,使用Prefix span算法進(jìn)行頻繁模式挖掘,設(shè)置支持度參數(shù)為0.2,即該月出現(xiàn)6次以上的出行模式,得到頻繁模式結(jié)果如表1所示,分析結(jié)果易知興趣點(diǎn)[0]和[6]分別為單位地址和家庭住址,1、2、3、5、7為用戶頻繁模式的頻繁節(jié)點(diǎn)。
Prefix span算法是一種基于前綴投影的序列模式挖掘算法,廣泛應(yīng)用于序列頻繁子模式研究,對于汽車用戶出行模式的挖掘具有良好的效果,該算法的主要步驟如下:
然而用戶出行軌跡當(dāng)前位置的轉(zhuǎn)移可能和此前多個(gè)興趣點(diǎn)有關(guān),因此將來的研究可以考慮使用長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)模型(LSTM)[9]。
通過上述提取用戶的出行數(shù)據(jù)進(jìn)行興趣點(diǎn)位置聚類和空間聚類并進(jìn)行可視化顯示,可以確定用戶出行的興趣點(diǎn)為單位地址和家庭地址,即表明五菱新能源汽車用戶購買該汽車主要用于居住地和工作地之間的往返。在確定用戶出行興趣點(diǎn)的基礎(chǔ)上為了進(jìn)一步挖掘用戶出行模式所提出的Prefix span算法具有良好的效果,為五菱新能源汽車的精準(zhǔn)營銷提供了更好的方案。
5 結(jié)論
本文主要采用大數(shù)據(jù)驅(qū)動(dòng)的手段研究了五菱新能源汽車用戶畫像,結(jié)合五菱新能源汽車用戶體驗(yàn)數(shù)據(jù)進(jìn)行相關(guān)性分析,總結(jié)篩選出了體驗(yàn)用戶的建議,再利用聚類算法對五菱新能源汽車用戶的行車數(shù)據(jù)進(jìn)行興趣點(diǎn)位置聚類、時(shí)空聚類以及可視化展示,確定了五菱新能源汽車用戶出行的興趣點(diǎn)位置。綜合對于體驗(yàn)用戶的建議和用戶興趣點(diǎn)位置這兩步可以準(zhǔn)確捕捉用戶行為特征以及用戶需求,從而可以為汽車產(chǎn)品的精準(zhǔn)營銷策略提供更加精準(zhǔn)的用戶情報(bào)。
參考文獻(xiàn):
[1]Dai W,Wang H,Jiang W,et al. Optimal aggregated charging analysis for PEVs based on driving pattern model[C]// Power and Energy Society General Meeting (PES),2013 IEEE. IEEE,2013.
[2]Pearre N S,Kempton W,Guensler R L,et al. Electric vehicles:How much range is required for a day's driving?[J]. Transportation Research Part C Emerging Technologies, 2011,19(6):1171-1184.
[3]胡海清,許壘.電子商務(wù)模式對消費(fèi)者線上購買行為的影響研究[J].軟科學(xué),2011,25(10):6.
[4]詹麗華.UGC用戶行為成因分析——用戶數(shù)據(jù)素養(yǎng)與用戶行為情景的雙重視角[J]. 情報(bào)理論與實(shí)踐,2018,041(004):28-32.
[5]李蕭瑋.大數(shù)據(jù)系統(tǒng)和分析技術(shù)[J].電子技術(shù)與軟件工程,2018(21):1.
[6]高聰,熊杰,劉彩云.淺談大數(shù)據(jù)分析技術(shù)及其應(yīng)用[J].電腦知識與技術(shù):學(xué)術(shù)版,2020,16(5):3.
[7]田立瑞.面向生產(chǎn)制造的大數(shù)據(jù)分析平臺技術(shù)研究[D].山東大學(xué),2017.
[8]陳偉麗,高東華.軟件行業(yè)質(zhì)量保證與MECE原則結(jié)合的實(shí)踐[J].信息技術(shù)與標(biāo)準(zhǔn)化,2012(6):3.
[9]Dua M,Yadav R,Mamgai D,et al. An Improved RNN-LSTM based Novel Approach for Sheet Music Generation[J]. Procedia Computer Science,2020,171:465-474.