摘 要:隨著經(jīng)濟(jì)的不斷發(fā)展,市場中的競爭激烈程度也在不斷加劇。對于電信營業(yè)商來說,其客戶資源十分的重要,因此,在此背景下我國的電信營業(yè)商逐漸的加強(qiáng)了對客戶的重視,建立了以客戶為中心的營銷推廣政策。電信企業(yè)必須要能夠樹立客戶戰(zhàn)略意識,正確的處理好客戶之間的關(guān)系,做好客戶的挖掘工作,才能贏得進(jìn)一步的發(fā)展。要想更好的處理好客戶之間的關(guān)系,必須要建立相應(yīng)的CRM客戶關(guān)系管理系統(tǒng),本文主要是針對電信運(yùn)營商在CRM系統(tǒng)中對數(shù)據(jù)的處理進(jìn)行了分析,并且闡述了相關(guān)的應(yīng)用前景。
關(guān)鍵詞:數(shù)據(jù)處理技術(shù);數(shù)據(jù)倉庫;CRM系統(tǒng);應(yīng)用
中圖分類號:TP311.13
CRM系統(tǒng)對電信營業(yè)商處理客戶關(guān)系具有很重要的作用,要想建立完善的CRM系統(tǒng),那么必須要能夠具有強(qiáng)大的數(shù)據(jù)倉庫技術(shù),利用數(shù)據(jù)倉庫對系統(tǒng)中的客戶信息以及營業(yè)信息成本利息等進(jìn)行相應(yīng)的處理,所以,在CRM系統(tǒng)的建立中,最為重要的便是數(shù)據(jù)庫倉庫技術(shù)。
1 數(shù)據(jù)倉庫技術(shù)
數(shù)據(jù)倉庫技術(shù)主要是指穩(wěn)定的、主題的、集合的并且包含歷史數(shù)據(jù)的集合,數(shù)據(jù)倉庫技術(shù)能夠?qū)ο鄳?yīng)的數(shù)據(jù)進(jìn)行集成化處理,而建立CRM系統(tǒng)主要是為了能夠?qū)⑦@種數(shù)據(jù)處理的方式與商務(wù)相互聯(lián)合,從而提升商業(yè)利潤[1]。對于傳統(tǒng)的數(shù)據(jù)庫技術(shù)主要是運(yùn)用與企業(yè)的日常數(shù)據(jù)的處理,而數(shù)據(jù)倉庫能夠在處理數(shù)據(jù)的同時也能夠?qū)?shù)據(jù)的運(yùn)用進(jìn)行分析處理。數(shù)據(jù)倉庫的建立不會影響到日常數(shù)據(jù)的管理,能夠在管理的基礎(chǔ)上對數(shù)據(jù)進(jìn)行分析,這樣能夠?yàn)槠髽I(yè)提供相應(yīng)的決策依據(jù),從而為企業(yè)的決策提供科學(xué)的依據(jù),數(shù)據(jù)倉庫是傳統(tǒng)的數(shù)據(jù)庫技術(shù)的升級與完善,在企業(yè)的數(shù)據(jù)處理分析方面有很重要的作用。在數(shù)據(jù)倉庫中的各項(xiàng)應(yīng)用中,有一項(xiàng)被稱為數(shù)據(jù)集市,其中的主要功能是將存儲的數(shù)據(jù)進(jìn)行收集整理,在CRM系統(tǒng)中獲取詳細(xì)的數(shù)據(jù)信息以及相應(yīng)的歷史數(shù)據(jù),其中數(shù)據(jù)集市與數(shù)據(jù)倉庫最終主要的區(qū)別就是范圍的不同,數(shù)據(jù)集市僅僅是企業(yè)的一個部門數(shù)據(jù),而數(shù)據(jù)倉庫則是包含了整個企業(yè)的數(shù)據(jù)。
數(shù)據(jù)倉庫的技術(shù)中主要是包括了:(1)ETL技術(shù),主要是指數(shù)據(jù)的提取、轉(zhuǎn)換以及裝載技術(shù),對數(shù)據(jù)內(nèi)進(jìn)行提取與處理,在處理之后加載到數(shù)據(jù)庫之中,并且將各種不同類型的數(shù)據(jù)進(jìn)行匯總,以便于后期對數(shù)據(jù)進(jìn)行分析。ETL技術(shù)是建立數(shù)據(jù)倉庫的主要的步驟,并且ETL的過程就是數(shù)據(jù)流動的過程,將不同類型的數(shù)據(jù)進(jìn)行統(tǒng)一的整理,將數(shù)據(jù)進(jìn)行轉(zhuǎn)化進(jìn)行輸入與輸出。ETL技術(shù)中的各個流程可以根據(jù)相應(yīng)需求進(jìn)行特殊的設(shè)計(jì),具有很大的靈活性;(2)OLAP技術(shù),主要指聯(lián)機(jī)分析處理技術(shù),在數(shù)據(jù)倉庫中,對數(shù)據(jù)的存儲主要是為了方便對數(shù)據(jù)的分析處理,并且很多用戶對于數(shù)據(jù)的需求具有臨時性以及未知性,所以通常會采取相應(yīng)的多維度分析方式。而OLAP技術(shù)則具備這種能力,主要是以數(shù)據(jù)倉庫中的集成數(shù)據(jù)為出發(fā)點(diǎn),來構(gòu)建面向分析的多維數(shù)據(jù)模型,這樣使得用戶能夠在不同的維度進(jìn)行數(shù)據(jù)分析處理,OLAP技術(shù)的主要特點(diǎn)是快速性、可分析性以及多維性,這些特性使其在數(shù)據(jù)處理方面具有很高的效率,同時在處理數(shù)據(jù)時也十分的深入;(3)數(shù)據(jù)集市,主要是對部門進(jìn)行數(shù)據(jù)的處理,原始數(shù)據(jù)會經(jīng)過數(shù)據(jù)倉庫流入不同的部門,并且能夠支持各個部門的定制化使用,每一個部門的數(shù)據(jù)集合都能成為一個數(shù)據(jù)的集合,數(shù)據(jù)集市主要是概括性數(shù)據(jù),數(shù)據(jù)的來源都是數(shù)據(jù)倉庫,能夠滿足各個部門的需要。
2 數(shù)據(jù)倉庫的系統(tǒng)架構(gòu)
從源數(shù)據(jù)開始輸出,到將輸出結(jié)果傳至用戶終端這一個過程中所處理的數(shù)據(jù)集合在一起構(gòu)成了數(shù)據(jù)倉庫系統(tǒng),數(shù)據(jù)倉庫系統(tǒng)主要負(fù)責(zé)的是對數(shù)據(jù)進(jìn)行提取、轉(zhuǎn)換以及加載分析,在數(shù)據(jù)倉庫中主要分為五個部分,分別是源數(shù)據(jù)庫層、提取轉(zhuǎn)換裝載層、數(shù)據(jù)倉庫層以及處理層[2]。(1)源數(shù)據(jù)層,主要是指整個數(shù)據(jù)庫的來源,以及對數(shù)據(jù)的經(jīng)營,在日常的生產(chǎn)中會產(chǎn)生海量的數(shù)據(jù),這些都是數(shù)據(jù)庫數(shù)據(jù)的來源,其中有歷史數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及外部數(shù)據(jù)等;(2)提取轉(zhuǎn)換并且裝載數(shù)據(jù),在數(shù)據(jù)倉庫中,數(shù)據(jù)倉庫的源數(shù)據(jù)僅僅是來自于不同的平臺,因此其存儲的格式也不相同,在數(shù)據(jù)采集區(qū),能夠?qū)?shù)據(jù)的格式進(jìn)行統(tǒng)一的轉(zhuǎn)換,將轉(zhuǎn)換的數(shù)據(jù)在處理之后存儲在緩沖區(qū),僅僅是保留窗口內(nèi)部的數(shù)據(jù),在ETL的模塊中,主要是對數(shù)據(jù)進(jìn)行提取轉(zhuǎn)換處理。對用戶所需要的數(shù)據(jù)進(jìn)行處理,以此來輔助企業(yè)進(jìn)行相應(yīng)的運(yùn)營分析,并且其抽取的數(shù)據(jù)都是一些比較的有用的數(shù)據(jù)。另外它還能夠?qū)?shù)據(jù)庫中的一些錯誤的數(shù)據(jù)進(jìn)行清洗刪除。在數(shù)據(jù)庫中由于數(shù)據(jù)的種類很多,并且格式不同,因此會通過ETL對數(shù)據(jù)進(jìn)行處理,進(jìn)行統(tǒng)一格式的轉(zhuǎn)換,從而來方便數(shù)據(jù)的存儲,最后是對數(shù)據(jù)的裝載,將不同的數(shù)據(jù)按照各個模塊將其裝入到數(shù)據(jù)倉庫中;(3)數(shù)據(jù)倉庫層,利用多維度模型對數(shù)據(jù)進(jìn)行存儲;(4)處理層,主要是對源數(shù)據(jù)進(jìn)行分析處理以及備份恢復(fù),主要是針對數(shù)據(jù)倉庫的安全以及穩(wěn)定高效建立的;(5)表示層,主要是為了方便用戶的使用,對數(shù)據(jù)進(jìn)行挖掘,利用OLAP系統(tǒng)能夠?yàn)橛脩籼峁?qiáng)大的統(tǒng)計(jì)、分析以及報表功能,這樣能夠在相應(yīng)的數(shù)據(jù)中找到用戶需要的信息,從而根據(jù)信息建立相應(yīng)的預(yù)測模型,將最終的結(jié)果進(jìn)行客戶分析,這些對電信運(yùn)營商的后續(xù)有很大的意義。
3 基于Haddoop的數(shù)據(jù)處理能力
隨著客戶數(shù)量的不斷增加,相關(guān)運(yùn)營商的CRM系統(tǒng)內(nèi)的數(shù)據(jù)量也在日益增多,因此對于大量數(shù)據(jù)的處理,是目前研究的重點(diǎn)。Haddoop開發(fā)的開源技術(shù)HDFS分布式文件處理系統(tǒng)對于大量數(shù)據(jù)的處理能力很強(qiáng),并且該技術(shù)也得到了廣泛的應(yīng)用。在HDFS的集群中,由一個主要的節(jié)點(diǎn)與多個節(jié)點(diǎn)組成,并且主節(jié)點(diǎn)主要是負(fù)責(zé)在系統(tǒng)中對文件的訪問,而數(shù)據(jù)節(jié)點(diǎn)則是對各個節(jié)點(diǎn)上的數(shù)據(jù)進(jìn)行存儲。在系統(tǒng)內(nèi)部進(jìn)行運(yùn)行時,一個文件被分成了很多各數(shù)據(jù)塊,并且將數(shù)據(jù)存儲在各個數(shù)據(jù)節(jié)點(diǎn)上,同時主節(jié)點(diǎn)發(fā)出相應(yīng)的命令,規(guī)劃不同的數(shù)據(jù)快到各自的數(shù)據(jù)節(jié)點(diǎn)上,各個數(shù)據(jù)節(jié)點(diǎn)對根據(jù)相應(yīng)的命令進(jìn)行數(shù)據(jù)的處理。
還有一種技術(shù)是MapReduce編程方式,這是一種新型編程模型,主要是對海量的數(shù)據(jù)進(jìn)行運(yùn)算,這樣使相關(guān)的編程人員不用使用分布式編程方式,利用映射與化簡的方式就能夠?qū)⒃械某绦蜻\(yùn)行在相應(yīng)的分布式系統(tǒng)上[3]。其中主要先確定某一個函數(shù),并且將其映射在另外一組新的鍵值,然后用戶要對自身的Map操作進(jìn)行定義,之后再對REDUCE函數(shù)值進(jìn)行定位合并所有中間值。MapReduce主要是有兩個部分組成,MAP是一個部分,主要功能是將一個任務(wù)進(jìn)行相應(yīng)的拆分,將其拆分成多個任務(wù),而另一個部分Reduce則是將拆分的任務(wù)進(jìn)行匯總,以此來得出最終的結(jié)果。MapReduce對于數(shù)據(jù)集群進(jìn)行大規(guī)模的處理,主要是在利用各個節(jié)點(diǎn)將數(shù)據(jù)輸送至網(wǎng)絡(luò)上的各個數(shù)據(jù)節(jié)點(diǎn),從而進(jìn)行運(yùn)算,并且每一個節(jié)點(diǎn)都會定期對工作的狀態(tài)進(jìn)行報告。
4 結(jié)束語
CRM的建立能夠有效的對數(shù)據(jù)進(jìn)行處理,還可以對客戶資料進(jìn)行分析,與此同時還能夠形成完整的檔案以及客戶數(shù)據(jù)倉庫,利用CRM系統(tǒng)能夠?qū)蛻暨M(jìn)行全面的分析以及應(yīng)用,以此來對客戶的信息進(jìn)行更好的管理,從而來收集更多具有價值的信息,并且能夠促進(jìn)市場營銷的進(jìn)行,帶動運(yùn)營商長遠(yuǎn)的發(fā)展。
參考文獻(xiàn):
[1]高翔.基于J2EE架構(gòu)的知識發(fā)現(xiàn)技術(shù)在CRM系統(tǒng)中的應(yīng)用研究[J].西北工業(yè)大學(xué),2011(01):20-21.
[2]劉峰.基于統(tǒng)計(jì)的數(shù)據(jù)挖掘技術(shù)在CRM系統(tǒng)中的應(yīng)用研究[J].大連理工大學(xué),2012(02):20-24.
[3]單友成.CRM中模糊數(shù)據(jù)挖掘及客戶生命周期價值與客戶滿意度研究[J].天津大學(xué),2010(01):30-31.
作者單位:北京大學(xué),北京 100080