楊明昕 王悅婷 簡悅
摘要:面對大數(shù)據(jù)時代下汽車市場強有力的競爭,各個企業(yè)如何吸引用戶人群,強化自身的競爭力,改善自己的營銷模式,是需要持續(xù)探究的重要問題。利用Python在數(shù)據(jù)處理與分析上的優(yōu)勢,運用常用的數(shù)據(jù)分析及可視化工具,從用戶基本信息、汽車基本信息等不同角度進行統(tǒng)計分析,發(fā)掘汽車銷售中的問題,總結(jié)出研究數(shù)據(jù)中的汽車銷售狀況及變化趨勢,并給出對應的精準營銷策略,從而滿足用戶的需求,為汽車銷售帶來利益,對汽車行業(yè)的積極發(fā)展提供思路。
關鍵詞:數(shù)據(jù)分析;汽車行業(yè);大數(shù)據(jù);可視化工具;精準營銷
中圖分類號:F274? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2020)32-0044-04
Abstract: In the face of the strong competition in the automobile market, how to attract users, strengthen their own competitiveness and improve their own marketing mode is an important issue that needs to be explored continuously. Using Python's advantages in data processing and analysis, using common data analysis and visualization tools, statistical analysis is carried out from different angles such as user's basic information and vehicle's basic information to explore the problems in vehicle sales, summarize the vehicle sales situation and change trend in the research data, and provide corresponding precise marketing strategies, so as to meet the needs of users and provide marketing services Sales bring benefits and provide ideas for the positive development of the automobile industry.
Key words: data analysis; automobile industry; big data; visualization tools; precision marketing
1 引言
在日趨數(shù)據(jù)化的市場環(huán)境下,雖然現(xiàn)在汽車市場的銷量仍持續(xù)上漲,但銷量增長的速度逐漸放緩,利潤中心開始轉(zhuǎn)移,消費者對產(chǎn)品和服務的要求也日趨個性化,各個汽車廠商的營銷方面面臨著諸多問題。傳統(tǒng)的汽車營銷模式已經(jīng)無法應對市場帶給汽車廠商的這些威脅,汽車經(jīng)銷商必須開始尋求新的營銷方式,所以利用互聯(lián)網(wǎng)信息技術明確地對用戶展開精準營銷已成為必然趨勢[1]。對研究數(shù)據(jù)中的用戶信息進行處理、分析、整合后為汽車經(jīng)銷商極致細化目標用戶,提供可以提升營銷精準化的新的視角,使各個經(jīng)銷商強化各自精準營銷的意識,制定更為精準的營銷方案;分析潛在用戶的大量數(shù)據(jù)信息,幫助各個汽車經(jīng)銷商了解用戶的潛在需求偏好、個性化追求等,確立目標市場需要。讓企業(yè)的未來發(fā)展更能重視大數(shù)據(jù)提供的理論依據(jù),幫助企業(yè)改善汽車行業(yè)在營銷和服務行業(yè)發(fā)展中遇到的困境,促進汽車行業(yè)的發(fā)展。
2 數(shù)據(jù)預處理及分析
本次研究數(shù)據(jù)來源于“國域無疆杯·大連第二屆大數(shù)據(jù)解決方案創(chuàng)新大賽”,數(shù)據(jù)包含用戶ID、用戶個人基本屬性以及消費基本信息等??紤]到原始數(shù)據(jù)中有大量缺失值,不能直接使用做數(shù)據(jù)分析,所以決定采用Python中的工具對數(shù)據(jù)先進行預處理,然后再進行可視化分析,本文預處理過程為:數(shù)據(jù)清洗、數(shù)據(jù)替換。
2.1 數(shù)據(jù)清洗
數(shù)據(jù)清洗是篩選清除缺失大的、重復、多余的數(shù)據(jù),補充完整缺失的數(shù)據(jù),將錯誤的數(shù)據(jù)糾正或者刪除,最后整理成為我們可以進一步加工、使用的數(shù)據(jù)。未經(jīng)過處理的原數(shù)據(jù)中,有大量用戶的消費信息缺失過多,有部分屬性列80%以上為空值,為了不影響后續(xù)的數(shù)據(jù)分析操作,需先進行數(shù)據(jù)清洗。
清洗過程大致分為:
1) 對缺失比例超過80%的特征屬性列進行刪除;
2) 對沒有相關車輛信息的用戶數(shù)據(jù)進行刪除;
3)將用戶的不具有代表性的特征屬性列進行刪除;
4)對用戶信息缺失導致無法進行數(shù)據(jù)分析的行進行刪除。
2.2 數(shù)據(jù)替換
為了使數(shù)據(jù)變得更直觀、有效,且有利于后期的數(shù)據(jù)分析工作,通過了解用戶所購買的車輛,了解汽車的等級情況,判斷用戶的消費能力,提出有效的營銷策略。利用Python中的Pandas庫的各種工具將‘報價這一屬性列中每個用戶的汽車報價區(qū)間進行分箱操作,按照汽車等級劃分標準,將價格區(qū)間轉(zhuǎn)化為文字形式。汽車等級劃分標準如表1所示。
2.3 用戶基本屬性分析
2.3.1 用戶性別、年齡段分布概況
從數(shù)據(jù)上看,男性車主占整體車主約2/3,女性車主占整體車主約1/3,可以看出男性車主占主導地位,從而得出,有車一族男性居多。因此目前汽車銷售市場的主要購買力為男性,商家可以男性作為重點銷售對象,女性作為潛在購買力。且從年齡分布上看,車主年齡大致分布在25至45歲之間,其中30至40歲的車主占比最多,年齡在32至38歲的車主數(shù)量占大多數(shù),并且男性車主和女性車主分布大致相同,且32歲之前的車主數(shù)量呈上升趨勢,38歲之后的車主數(shù)量越來越少呈下降趨勢,因此可以推斷,在銷售時期,可以將年齡縮小到25至38歲之間進行準確營銷。
2.3.2 不同性別、汽車品牌分布
隨著汽車的普及,汽車文化的影響,汽車的性別特征逐漸顯著,對于男性女性消費者,汽車品牌廠商應有不同的營銷側(cè)重點。于是分析了原數(shù)據(jù)中的男性和女性的品牌偏好,結(jié)果如圖1、圖2所示。
從原數(shù)據(jù)上看,男女對于不同的汽車品牌的喜好大致相同,其中大眾、日產(chǎn)、豐田、奧迪等汽車品牌最為受歡迎。但奔馳、寶馬(即德系汽車)相對男性車主而言更受女性車主的喜愛,可以看出女性選車時比較注重美觀,奔馳、寶馬的外觀設計非常符合女性的審美標準,且乘坐的時候舒適感很不錯,內(nèi)飾給人以豪華的感覺。而相對女性車主更受男性車主青睞的是別克、福特汽車(即美系汽車),除了性能、安全系數(shù)高以外,外觀和內(nèi)飾同樣重要,別克的商務風、福特的運動風符合男性的取向。當然“男女通吃”的是大眾品牌,不僅做工精細、高級、行駛質(zhì)感好,而且經(jīng)濟實惠。
簡而言之,對于男性消費者而言,品牌汽車的動力、性能等重視更多;而女性消費者偏好于易操控、外觀美、舒適性高的產(chǎn)品。但簡而言之,用戶對于汽車系別并不是很看重,想要贏得市場,產(chǎn)品本身才是關鍵,無關性別。
2.3.3 不同年齡段、汽車品牌分布
在我國汽車行業(yè)占有主導地位的有三種車,德系車、日系車和國產(chǎn)車。年齡的不同對汽車的品味自然也不相同。
不同年齡段的汽車品牌偏好如圖3所示,從左到右、從上到下的年齡段分別是:18歲至24歲,25歲至31歲,32歲至38歲,39歲至45歲,46歲至52歲,53歲至59歲,59歲以上。
由圖3可知,18至25歲的年輕人將近一半都選擇豐田汽車,而豐田走的正是年輕化的路線,從外形設計到內(nèi)飾處理都做了很多的運動化和年輕化的處理,且品質(zhì)追求也逐漸上升,這也是他們贏得年輕消費者信賴的資本。而25至45歲年齡段的取向基本一致,且主要購買力為男性,分別為大眾、豐田、日產(chǎn)、別克。青壯年時期正是男性事業(yè)的起步、上升階段,對于汽車的需求量較大,多半選擇經(jīng)濟實用型。而在45歲以后,經(jīng)濟能力提高,資產(chǎn)豐厚,因此奔馳、奧迪等高檔車開始成為眾多車主的首選。
2.3.4 不同性別、汽車等級分析
分析原數(shù)據(jù),繪制了男性、女性的汽車等級劃分圖,分別如圖4和圖5所示。
由圖4和圖5對比可知,女性的汽車等級總體高于男性,中等偏上,且高檔和豪華高檔汽車的占比都多于男性,但男性中選擇奢侈豪華高檔的人數(shù)始終多于女性,女性在一定經(jīng)濟能力范圍內(nèi)更偏向于選擇偏高檔和豪華汽車,可以給女性推薦合適的高檔汽車。
2.3.5 不同年齡段、汽車等級分析
車主年齡段與汽車等級關系如圖6所示,從數(shù)據(jù)上看,在各種年齡段,駕駛35萬汽車以下的人數(shù)在大部分,有一小部分汽車的價格在40萬至60萬之間,可以推斷大眾普遍能接受的汽車價格在15萬至35萬之內(nèi),可以將營銷重點放在小于35萬之內(nèi)的汽車型號品牌中。
3 模型設計
為了給廠商提供更為精準的營銷策略,需要進行特定的群體劃分,為了讓劃分后的群體特征更加鮮明,有必要建立模型來判斷特定群體劃分的標準。
3.1 模型算法與介紹
此處用到了機器學習中的監(jiān)督式學習,常見方法有:決策樹、樸素貝葉斯、SVM、線性回歸等等。不同的模型能適合不同的數(shù)據(jù),準確率越高的模型跟數(shù)據(jù)的匹配度也越高,數(shù)據(jù)分析效果就會更好。下面介紹常見的三種數(shù)據(jù)挖掘模型。
1) 決策樹:決策樹(Decision Tree)是一種在分類、預測、規(guī)則提取等領域有著廣泛應用的分類算法。決策樹是一種葉子節(jié)點互相一一對應著分類,在某個屬性上的劃分對應著非葉子節(jié)點,若想將其劃分成若干個子集就要根據(jù)樣本在該屬性上的不同取值來操作的樹狀結(jié)構(gòu)。在已知各種情況發(fā)生概率的基礎上,通過構(gòu)成決策樹來求取凈現(xiàn)值的期望值大于零的概率,評價項目風險。
2) 隨機森林:隨機森林(Random Forest,簡稱RF)被譽為“優(yōu)秀集成學習技術水平的方法”,是在以決策樹為基學習器構(gòu)建Bagging集成的基礎上,進一步在決策樹的訓練過程中引入了屬性隨機選擇的方法。不同于決策樹,隨機森林只需考察一個屬性子集即可。隨機森林的功能強大,不僅簡單且容易實現(xiàn),計算開銷也比較小[2-3]。
3) SVM:支持向量機(Support Vector Machine)模型,是由模式識別中廣義肖像算法發(fā)展而來的分類器,它擁有許多特性,例如在解決小樣本、非線性及高維模式識別中表現(xiàn)良好,并能夠推廣應用到其他機器學習問題中,如函數(shù)擬合等。由簡至繁SVM可分為三大類:線性可分得線性SVM、線性不可分的線性SVM、非線性SVM。SVM在各領域的模式識別問題中有廣泛應用,包括人像識別、文本分類、筆跡識別、生物信息學等[4-5]。
3.2 模型效果對比
通過原數(shù)據(jù)得知,用戶劃分的兩大標準可以分為年齡段與性別,所以使用六種分類模型對車輛基本信息和部分用戶消費信息進行測試。訓練模型:將數(shù)據(jù)以6:2:2比例分為訓練集、驗證集、測試集。采用分類算法,分別取年齡段、性別作為標簽,其他部分屬性列提取為特征,通過測試集得到的數(shù)據(jù)結(jié)果評估模型在訓練數(shù)據(jù)上的性能表現(xiàn),每個模型經(jīng)過五次隨機測試得平均值后結(jié)果分別如表2、表3所示。
表3的測試結(jié)果與表2相比準確度較高,但由于數(shù)據(jù)集中可用數(shù)據(jù)較少,模型訓練效果不佳。將性別作為標簽的情況下,SVM支持向量機模型在六種模型中表現(xiàn)效果最好,所以后續(xù)將采用性別作為劃分用戶畫像人群的標準。
4 汽車精準營銷策略
4.1 根據(jù)不同的用戶人群消費信息精準推薦
生活中男女的消費水準和消費偏好均有所不同,以性別作為劃分用戶人群的標準,制作了男性和女性用戶的詞云圖。詞云圖繪制過程主要是選取了原數(shù)據(jù)當中的用戶消費信息,并做了效果直觀文本化處理,生成結(jié)果如圖7和圖8所示。
結(jié)合圖7和圖8可知,男性和女性車主大多是80后、90后。男性車主的日常消費在學生繳費、大型家電、購買汽油、餐飲、教育、買保險等,而女性車主的日常消費在房地產(chǎn)、旅游、逛百貨商店、醫(yī)院看病等。廠商可根據(jù)用戶的消費信息來判斷用戶的消費水平及消費場所進行精準廣告投放,例如根據(jù)之前分析的重點用戶和潛在用戶的偏好,在較多重點用戶常去的商場舉辦相應汽車品牌、相應車型展覽會。針對喜愛旅游的車主,如果酷愛自駕游,可以根據(jù)汽車性能,例如耗油量、越野性能、排氣量、扭矩等指標推薦適合的車型。
4.2 根據(jù)車主個性化偏好推送相關信息
充分了解用戶的基本信息后,可以根據(jù)車主的偏好推送相關信息,例如汽車品牌、車型、報價等。從原數(shù)據(jù)中看出,車主男性女性的比例正在逐年接近,汽車廠商應給予同樣的重視,按照男女不同偏好來進行精準推送。
1)汽車品牌方面:男性偏好大眾、日產(chǎn)、豐田、別克、福特等品牌;女性更取向于奔馳、寶馬、奧迪、雷克薩斯、路虎等品牌。
2)汽車報價方面:結(jié)合車主的消費能力和接受價格,大多數(shù)人能接受的價格在30萬以內(nèi),從單筆消費最大值在50萬以內(nèi)的用戶能接受的汽車價格也在50萬以內(nèi),根據(jù)能接受的消費最大值推薦在此價格范圍內(nèi)的汽車,可以將營銷的重點放在30萬之內(nèi)的汽車品牌和型號中。
4.3 根據(jù)年齡段、使用年限確定潛在客戶
1)車主年齡段分布方面:在中國經(jīng)濟高速發(fā)展的今天,新青年已經(jīng)成為未來購車的主力軍,消費者主要集中在30歲以下。隨著消費者年齡的增長,潛在消費者年齡段已經(jīng)降到30歲以下,潛在消費者的比例正持續(xù)不斷下降,和已經(jīng)購車的30至49 歲年齡段相比,購車一族的趨勢逐漸年輕化,并且十分明顯。在原數(shù)據(jù)中,年齡在32至38歲之間的男性車主數(shù)量占大多數(shù),而在駕駛2008年之后出廠汽車的車主分布在32歲之前的呈急速上升趨勢。
2)汽車使用年限方面:汽車使用期限通常分為技術使用期限、經(jīng)濟使用期限和合理使用期限。汽車在正常使用的過程中,其性能就隨著使用年限的增加而有所下降,當使用到一定期限以后,就要做報廢處理。技術使用期限受汽車制造質(zhì)量、運行條件和保修方式等因素影響,而汽車經(jīng)濟使用期限涉及的因素很多,除汽車制造質(zhì)量和使用技術外,與經(jīng)營管理方面等因素也有密切關系。合理使用期限是以經(jīng)濟使用期限為基礎,并根據(jù)本國的汽車運輸政策、汽車工業(yè)技術的發(fā)展和燃料的供應情況等因素綜合確定的使用期限[6]。一般的車型大多數(shù)人在10年左右就會更換新車,從原數(shù)據(jù)看,雖然駕駛2009年以后出廠汽車的車主占大多數(shù),但2008年前出廠的汽車仍有一部分車主在使用。
可以針對汽車購買年份為2008年前的車主和年齡段在25至45歲之間的車主作為重點潛在跟進客戶,進行適當汽車推薦。
5 結(jié)論
本次研究探究了大數(shù)據(jù)對汽車經(jīng)銷商精準營銷的影響問題。利用得到的數(shù)據(jù)分析用戶的基本屬性信息,深入了解用戶的特點與共性,發(fā)掘他們的真實需求與心理。利用大數(shù)據(jù)時代信息收集便利的優(yōu)勢,發(fā)展數(shù)據(jù)分析技術,使客戶需求響應能力快速提升。汽車市場瞬息萬變,汽車營銷模式的探究仍在不斷進行中[7],同時也更加了解到機器學習在人工智能大數(shù)據(jù)時代下的潛在力量[8]。只有抓住市場人群的消費心理,滿足消費者多樣化及個性化需求,才能使我國汽車行業(yè)獲得更廣闊的發(fā)展空間。
參考文獻:
[1] 時迎健. 大數(shù)據(jù)對汽車經(jīng)銷商精準營銷影響研究[D].東北石油大學,2018.
[2] 劉龍飛. 基于卷積神經(jīng)網(wǎng)絡的在線商品評論情感傾向性研究[D].大連理工大學,2016.
[3] 周志華.機器學習[M].清華大學出版社,2016.
[4] 李道成. 集成支持向量機在民營信用債中的應用[D].山東大學,2019.
[5] 周永章.地球科學大數(shù)據(jù)挖掘與機器學習[M].中山大學出版社,2018.
[6] 戚金鳳.汽車維護保養(yǎng)[J].科技創(chuàng)新導報,2013(14):16-17.
[7] 劉杰.汽車4S店的市場營銷策略研究[J].內(nèi)蒙古教育(職教版),2013(7):72.
[8] Viktor Mayer-Sch?nberger.Big Data: A Revolution That Will Transform How We Live, Work,and Think[M].John Murray,2013.
【通聯(lián)編輯:王力】