李永輝
(中國移動(dòng)通信集團(tuán)河南有限公司 河南 鄭州 450008)
當(dāng)前社會(huì)已經(jīng)全面進(jìn)入到“互聯(lián)網(wǎng)+”時(shí)代,信息化技術(shù)與科學(xué)技術(shù)的快速發(fā)展,各種新興技術(shù)開始在各行各業(yè)進(jìn)行廣泛的推廣應(yīng)用,推動(dòng)了行業(yè)的改革創(chuàng)新。大數(shù)據(jù)作為當(dāng)前信息技術(shù)的重要代表之一,其能夠針對(duì)海量、復(fù)雜、異構(gòu)的信息數(shù)據(jù)進(jìn)行分析,以此來為決策提供有效地支持,開始源源不斷地應(yīng)用于各個(gè)領(lǐng)域。對(duì)于企業(yè)營銷來說,傳統(tǒng)營銷理念、營銷方式顯然已經(jīng)無法適應(yīng)當(dāng)前這個(gè)信息化時(shí)代,大數(shù)據(jù)所能夠提供的精準(zhǔn)服務(wù),無疑能夠?yàn)槠髽I(yè)提供更多的數(shù)據(jù)支持,利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營銷就成為各個(gè)企業(yè)獲取營銷競(jìng)爭優(yōu)勢(shì)的重要途徑[1]。鑒于此,本研究主要針對(duì)大數(shù)據(jù)應(yīng)用于精準(zhǔn)營銷的技術(shù)架構(gòu)進(jìn)行了全面的探討,在此基礎(chǔ)上提出幾點(diǎn)大數(shù)據(jù)應(yīng)用于精準(zhǔn)營銷的措施與建議,僅供參考與借鑒。
Hadoop大數(shù)據(jù)處理平臺(tái)作為一種開源的計(jì)算系統(tǒng)與分布式儲(chǔ)存系統(tǒng),主要是基于谷歌有關(guān)核心技術(shù)研發(fā)而成。M/R(Map/Reduce)與分布式文件系統(tǒng)(Hadoop Distributed File System)屬于該平臺(tái)的核心技術(shù),M/R(Map/ Reduce)作為計(jì)算框架,能夠?qū)⒏鞣N數(shù)據(jù)集進(jìn)行合理的劃分,使其轉(zhuǎn)變?yōu)闊o數(shù)個(gè)數(shù)據(jù)庫,且各個(gè)數(shù)據(jù)庫之間完全保持獨(dú)立,通過Map任務(wù)實(shí)施并行處理。分布式文件系統(tǒng)本身具有高容錯(cuò)性,能夠針對(duì)Map輸出實(shí)施排序處理,接著將結(jié)果錄入Reduce任務(wù),所有的操作均會(huì)在分布式文件系統(tǒng)進(jìn)行儲(chǔ)存,其負(fù)責(zé)整體任務(wù)的調(diào)度、監(jiān)控,同時(shí)重新執(zhí)行運(yùn)行失敗的任務(wù)。
大規(guī)模并行處理系統(tǒng)(Massively Parallel Processing)主要是通過多個(gè)對(duì)稱多處理系統(tǒng)服務(wù)器(Symmetric Multi Processing)構(gòu)成,諸多服務(wù)器通過特定節(jié)點(diǎn)互聯(lián)網(wǎng)進(jìn)行連接,相互之間能夠進(jìn)行高效的協(xié)同運(yùn)行。從運(yùn)行的特征來看,其主要是各個(gè)服務(wù)器利用節(jié)點(diǎn)互聯(lián)網(wǎng)進(jìn)行有效連接,各個(gè)節(jié)點(diǎn)僅僅負(fù)責(zé)本地資源,相互之間的信息交互主要利用網(wǎng)絡(luò)達(dá)成。現(xiàn)階段,大規(guī)模并行處理系統(tǒng)主要特征如下:首先,一般儲(chǔ)存均為結(jié)構(gòu)化的數(shù)據(jù)類型,表現(xiàn)為明顯的雪花型結(jié)構(gòu)或者星形結(jié)構(gòu),能夠直接引用大數(shù)據(jù)進(jìn)行分析;其次,各個(gè)服務(wù)器均存在完全獨(dú)立的處理器、內(nèi)存、硬盤,可以針對(duì)節(jié)點(diǎn)進(jìn)行動(dòng)態(tài)管理;最后,數(shù)據(jù)分區(qū)能夠分別劃分到各個(gè)不同的物理節(jié)點(diǎn),利用分布查詢,能夠針對(duì)系統(tǒng)整體性能進(jìn)行針對(duì)性地優(yōu)化調(diào)整。
所謂ETL,主要指的是源端數(shù)據(jù)歷經(jīng)抽取(Extract)、轉(zhuǎn)換(Transform)、加載(Load)流程,最后進(jìn)入到目的端的整個(gè)進(jìn)程。ETL系統(tǒng)主要特征如下:首先,ETL技術(shù)能夠針對(duì)錯(cuò)誤出具進(jìn)行清理,同時(shí)針對(duì)缺失數(shù)據(jù)進(jìn)行修正;其次,能夠針對(duì)信息數(shù)據(jù)開展可信度評(píng)估;第三,針對(duì)多方源數(shù)據(jù)進(jìn)行有效地整合;最后,針對(duì)數(shù)據(jù)實(shí)施結(jié)構(gòu)化處理,為大數(shù)據(jù)分析、用戶使用奠定基礎(chǔ)。
所謂語音引擎,指的是能夠從各類非結(jié)構(gòu)化數(shù)據(jù)提取信息的一種工具。非結(jié)構(gòu)化數(shù)據(jù)主要指的是不便使用數(shù)據(jù)庫二維邏輯表來展現(xiàn)的各類數(shù)據(jù)類型,如視頻信息、音頻信息、圖像、報(bào)表、HTML、XML等類型。
從數(shù)據(jù)挖掘算法的應(yīng)用流程來看,其主要指的是不斷驗(yàn)證、不斷匹配的流程,這個(gè)過程中依賴業(yè)務(wù)人員、分析人員之間進(jìn)行高效的互動(dòng)交流,才能夠保障挖掘的信息數(shù)據(jù)滿足精準(zhǔn)營銷需求。一般情況下,數(shù)據(jù)挖掘技術(shù)可以選擇單獨(dú)使用,也可以考慮實(shí)際需求聯(lián)合OLAP(在線聯(lián)機(jī)處理分析)。例如,對(duì)于處在不同生命周期的客戶來說,要想獲取其對(duì)應(yīng)的狀態(tài)信息,需要選擇回歸分析方式,對(duì)于預(yù)流失客戶進(jìn)行挽留,則需要分析其具體的特征,了解其流失的具體意向,主要適用于分類算法。
大數(shù)據(jù)可視化分析,指的是綜合利用圖像處理、圖形信息,向用戶群體推送需要的可視化信息內(nèi)容。從當(dāng)前大數(shù)據(jù)可視化技術(shù)的實(shí)際應(yīng)用情況來看,主要包含地圖、表格以及圖形等模式,通過多元化的圖形組合、圖像處理,能夠?qū)崿F(xiàn)地圖數(shù)據(jù)高亮、多目標(biāo)切換、表格下鉆、圖標(biāo)聯(lián)動(dòng)等可視化功能。
為有效滿足大數(shù)據(jù)精準(zhǔn)營銷需求,架構(gòu)的設(shè)計(jì)需要包含大數(shù)據(jù)uCloud D“三大體系、四大平臺(tái)”,涉及架構(gòu)功能全網(wǎng)手機(jī)終端信息、互聯(lián)網(wǎng)流量日志、企業(yè)核心數(shù)據(jù)信息、寬帶信息等[2]。由于大數(shù)據(jù)平臺(tái)對(duì)于各種數(shù)據(jù)的支撐能力較為突出,且還在傳統(tǒng)B域方面具備高價(jià)值密度數(shù)據(jù)方面的突出優(yōu)勢(shì),可以全面挖掘各種低價(jià)值數(shù)據(jù),并利用開放式平臺(tái)進(jìn)行轉(zhuǎn)化,使其能夠最終轉(zhuǎn)變?yōu)榫哂猩a(chǎn)力的信息數(shù)據(jù)[3]。
從當(dāng)前大數(shù)據(jù)儲(chǔ)存方面的研究來看,當(dāng)前主要包含兩個(gè)研究方向、技術(shù)陣營。其一,MPP(Massive Parallel Processing,大規(guī)模并行處理)數(shù)據(jù)庫;其二,以Hadoop+ MySQL為代表的分布式文件系統(tǒng)。兩個(gè)平臺(tái)各有優(yōu)勢(shì),且各自在不同領(lǐng)域的適用性也存在一定的差異性,通過全面推動(dòng)兩者的有效融合,可以全面提供數(shù)據(jù)加工、訪問方面的功能,且整體效果更為突出[4]。
當(dāng)大數(shù)據(jù)挖掘技術(shù)正式應(yīng)用于精準(zhǔn)營銷后,針對(duì)大數(shù)據(jù)平臺(tái)進(jìn)行數(shù)據(jù)采集、整合就成為精準(zhǔn)營銷的關(guān)鍵所在。利用大數(shù)據(jù)平臺(tái)進(jìn)行精準(zhǔn)營銷,相應(yīng)的采集整合數(shù)據(jù)、采集整合技術(shù)(圖1)設(shè)計(jì)下面4點(diǎn)功能:①結(jié)構(gòu)化數(shù)據(jù)。針對(duì)業(yè)務(wù)平臺(tái)與生產(chǎn)系統(tǒng)的各種信息數(shù)據(jù)進(jìn)行采集,利用DCN進(jìn)行承載傳輸。②非結(jié)構(gòu)化數(shù)據(jù)。針對(duì)互聯(lián)網(wǎng)當(dāng)中各種行為信息、內(nèi)容等進(jìn)行采集,利用IP網(wǎng)進(jìn)行承載傳輸。此外,可以利用網(wǎng)絡(luò)爬蟲引擎,針對(duì)靜態(tài)的各種信息資料進(jìn)行采集,同時(shí)可以利用頁面標(biāo)簽解析引擎,進(jìn)一步采集整理有關(guān)的行為信息、歷史數(shù)據(jù)。③流數(shù)據(jù)。對(duì)于流類型的各種數(shù)據(jù)來說,主要是通過互聯(lián)網(wǎng)、網(wǎng)絡(luò)信令、設(shè)備日志等完成采集工作,以此來進(jìn)行消息處理引擎、流處理引擎的構(gòu)建。④臨時(shí)數(shù)據(jù)。主要是針對(duì)各種一次性數(shù)據(jù)進(jìn)行采集,利用文件模式將其錄入數(shù)據(jù)集市,為大數(shù)據(jù)精準(zhǔn)營銷提供數(shù)據(jù)支持。
圖1 大數(shù)據(jù)平臺(tái)采集整合流程圖
企業(yè)大數(shù)據(jù)平臺(tái)建設(shè),可以根據(jù)企業(yè)實(shí)際情況選擇行業(yè)聯(lián)合建設(shè)、外包合作等,即將行業(yè)聯(lián)合建設(shè)的大數(shù)據(jù)平臺(tái)作為一級(jí)平臺(tái),其他各企業(yè)作為二級(jí)平臺(tái),兩級(jí)平臺(tái)之間進(jìn)行數(shù)據(jù)的共建共享,各二級(jí)平臺(tái)的企業(yè)又能夠根據(jù)自身實(shí)際情況,選擇對(duì)應(yīng)的大數(shù)據(jù)信息、大數(shù)據(jù)服務(wù)。對(duì)于企業(yè)來說,通過多級(jí)平臺(tái)的建設(shè),能夠?qū)⑵髽I(yè)信息數(shù)據(jù)與外部信息數(shù)據(jù)進(jìn)行高效的對(duì)接,進(jìn)一步掌握更多的數(shù)據(jù)資源,從而有效提升數(shù)據(jù)收集、數(shù)據(jù)分析、數(shù)據(jù)共享的效率,為精準(zhǔn)營銷奠定良好的基礎(chǔ)。
大數(shù)據(jù)技術(shù)的應(yīng)用,需要企業(yè)更改傳統(tǒng)粗放式的營銷廣告模式,致力于引入大數(shù)據(jù)技術(shù),致力于提升營銷廣告?zhèn)鞑サ木珳?zhǔn)性。企業(yè)可以通過大數(shù)據(jù)分析,先了解用戶的興趣愛好、消費(fèi)習(xí)慣,以此來制定針對(duì)性的營銷廣告推送策略,在此基礎(chǔ)上,綜合參考客戶所處的情境,選擇針對(duì)性的營銷廣告推送內(nèi)容,使得營銷廣告內(nèi)容符合用戶所處情境的需求[5]。
從企業(yè)大數(shù)據(jù)精準(zhǔn)營銷實(shí)際來看,差異化營銷通常需要選擇從客戶、渠道兩個(gè)領(lǐng)域來開展。基于客戶層面的差異化營銷來說,需要綜合利用大數(shù)據(jù)技術(shù)針對(duì)客戶群體的忠誠度、購買力、產(chǎn)品需求等進(jìn)行針對(duì)性地分析,注重規(guī)避當(dāng)前同質(zhì)化的營銷模式,以此來制定針對(duì)性的營銷方案、營銷內(nèi)容。比如,對(duì)于價(jià)格不敏感的客戶,差異化營銷應(yīng)當(dāng)從產(chǎn)品特性、產(chǎn)品品牌、產(chǎn)品服務(wù)等方面展開;而對(duì)于價(jià)格敏感的客戶,差異化營銷則需要從贈(zèng)送優(yōu)惠、折扣優(yōu)惠、產(chǎn)品活動(dòng)等方面展開[6]。
綜上所述,大數(shù)據(jù)技術(shù)所具有的諸多優(yōu)勢(shì),無疑為企業(yè)營銷服務(wù)提供了有效的支持。對(duì)企業(yè)來說,應(yīng)當(dāng)意識(shí)到大數(shù)據(jù)在營銷服務(wù)方面的優(yōu)勢(shì),致力于發(fā)揮大數(shù)據(jù)營銷優(yōu)勢(shì),利用大數(shù)據(jù)開展精準(zhǔn)營銷。具體來說,企業(yè)需要充分結(jié)合自身實(shí)際,通過構(gòu)建圍繞精準(zhǔn)營銷的大數(shù)據(jù)平臺(tái)、全面強(qiáng)化營銷廣告?zhèn)鞑サ木珳?zhǔn)性、基于大數(shù)據(jù)分析進(jìn)行差異化營銷以及提升精準(zhǔn)營銷服務(wù)的個(gè)性化程度,從而有效提升精準(zhǔn)營銷水平,為企業(yè)發(fā)展奠定良好的基礎(chǔ)。