陳浩, 孫瑜
(云南師范大學 信息學院,云南 昆明650500)
隨著企業(yè)信息化建設的發(fā)展,巨大的投資為企業(yè)建立了眾多的信息系統(tǒng),以幫助企業(yè)進行內外部業(yè)務的處理和管理工作.但是,隨著信息系統(tǒng)的增加,各自孤立工作的信息系統(tǒng)將會造成大量的冗余數據和業(yè)務人員的重復勞動[1].目前,電信應用的信息系統(tǒng)如圖1所示,有業(yè)務應用部門、應用系統(tǒng)以及數據源三個層次.由于相關業(yè)務應用部門需要操作多個應用系統(tǒng),這些不同的應用系統(tǒng)需要不同的數據源,因此這種處理方式會造成編碼口徑不一致,數據統(tǒng)計口徑不一致,從而很難對已有的海量業(yè)務數據進行共享.除此之外,這種煙囪式的應用系統(tǒng)會造成數據全面性不足,數據系統(tǒng)負載較大,處理效率較低及數據質量較差,從而很難為商業(yè)決策提供準確的數據[2].基于上述原因,需要使用數據倉庫來打破信息孤島,充分利用現有的歷史數據,為企業(yè)戰(zhàn)略決策提供數據支持.
圖1 電信應用信息系統(tǒng)模型Fig.1 Model of telecom application system
根據 William H.Inmon 在 《Building the Data Warehouse》中的定義,數據倉庫是一個面向主題的、集成的、隨時間變化的、不容易丟失的數據集合,支持管理部門的決策過程[3].數據倉庫具有以下優(yōu)點:
(1)數據倉庫的數據是面向主題的.數據倉庫里的數據是面向主題域進行組織的,而這些主題通常是用戶使用數據倉庫進行決策時所關心的重點內容.在電信的數據倉庫中典型的主題有客戶、產品、交易、賬目等.
(2)數據倉庫的數據是集成的.數據倉庫里的數據可以來自多個分散的操作性數據,數據倉庫的建立正是將數據進行提取、凈化、轉換、裝載、編碼統(tǒng)一的過程.
(3)數據倉庫的數據是隨時間變化的.一般而言,企業(yè)數據倉庫中數據的時間期限通常為3~5年,要遠遠長于操作型系統(tǒng)中數據的時間期限.
(4)數據倉庫的數據是不可更新的.由于數據倉庫中的數據是一系列某一時刻生成的復雜快照,因此為決策提供數據時涉及的操作主要是數據的查詢.
電信企業(yè)的數據倉庫系統(tǒng)需要采集企業(yè)內部生產管理系統(tǒng)所有與市場經營相關的數據源,包括客戶背景資料、產品或套餐購買行為、消費資料、客服交互行為、繳費行為等方面的信息,對其進行規(guī)范和整合,然后按業(yè)務、客戶、競爭、營銷活動及數據挖掘等主題,將數據按照數據集市的形式存放,并提供多維報表和挖掘工具,為分析人員提供數據倉庫系統(tǒng)和分析平臺,解決此前分析人員所面對的數據分散、口徑不統(tǒng)一、分析工作缺乏延續(xù)性等問題.
電信數據倉庫系統(tǒng)將各業(yè)務系統(tǒng)、非業(yè)務系統(tǒng)中的數據按照不同的主題進行融合,并在數據倉庫的基礎上對相關主題的數據進行分類、分析和管理,最后建立統(tǒng)一的業(yè)務數據視圖,為企業(yè)的決策提供數據支持,電信數據倉庫的架構如圖2所示:
圖2 電信數據倉庫體系架構Fig.2 Architecture of telecom data warehouse
數據獲取層是針對電信現有各個業(yè)務系統(tǒng)及不同網點的分散數據,充分理解數據定義后,規(guī)劃所需要的數據源,對可操作的數據源進行數據抽取.數據獲取層通過指定的接口從相關的數據源獲取企業(yè)所需的業(yè)務數據.通常,這些數據源的數據為CRM系統(tǒng)、計費系統(tǒng)、結算系統(tǒng)、資源系統(tǒng)等系統(tǒng)數據,并且這些數據包括客戶背景資料、產品或套餐購買行為、消費資料、客服交互行為、繳費行為等方面的信息.然而,值得注意的是,數據獲取層從相關數據源獲取的業(yè)務數據并沒有進行數據融合,只是將其按照不同的數據源進行分類,這樣做便于數據的校驗、異常的返回處理以及保證決策所涉及數據的數據質量.
數據存儲層是整個數據倉庫的核心部分,它將數據獲取層中的數據進行匯集、清洗、轉換以及分類存儲操作.這些業(yè)務數據按照產品、賬務、地域、營銷活動等主題進行分類存放,并為數據應用層提供有效的數據支撐.
數據存儲層分為細節(jié)數據層、業(yè)務視圖層以及應用視圖層三個層次.
(1)細節(jié)數據層
細節(jié)數據層主要是面向技術角度的,是將數據獲取層中的數據按照一定的規(guī)則進行統(tǒng)一處理的層面.這些數據主要進行匯集、清洗、轉換(Extract-Transform-Load,ETL)以及編碼等操作,然后按照產品、賬務、地域、營銷活動等主題進行分類存放.
(2)業(yè)務視圖層
業(yè)務視圖層主要是面向業(yè)務角度的,是將數據從技術角度向業(yè)務角度進行過渡的層面.業(yè)務視圖層的作用是使用統(tǒng)一的數據處理口徑處理數據從而提高數據生成效率,使得數據更加有效的支持用戶決策.
(3)應用視圖層
應用視圖層也是面向業(yè)務角度的,是將業(yè)務視圖層處理好的數據按照用戶的需求進行數據分離的層面.應用視圖層主要根據用戶的不同需求將不同的應用數據進行分離,從而便于用戶使用這些數據.
由于不同用戶對數據倉庫系統(tǒng)有著不同的需求、觀察角度和觀察方式,數據倉庫系統(tǒng)應該能夠提供多種數據展現方式來滿足不同用戶的需求.電信數據倉庫系統(tǒng)除了展現移動業(yè)務、固定電話業(yè)務、聚焦客戶信息等日常固定的數據應用外,還可以通過不同的角色進行個性化的定制,結合不同用戶的操作以及數據的分類方式使得數據展現更加符合用戶的個人習慣.
數據應用層是根據用戶提出的需求,建立相應的主題.由于數據應用面向不同用戶從不同角度提出的需求,因此在數據應用層涉及時必須充分地考慮到數據的響應效果以及數據的響應效率.同時,為了滿足數據分析人員、業(yè)務分析人員、管理人員的需求,電信數據倉庫的數據應用層通常有多維分析、客戶管理、專題分析、決策分析等主題.
從數據倉庫的角度來看,在外部數據源中的數據還存在二義性、重復、不完整、違反業(yè)務規(guī)則等問題,因此需要根據定義的清洗規(guī)則對這些數據進行數據轉換.由于數據轉換后的數據還存在數據結構和數據庫平臺的差異性以及數據不一致等問題,須將這些不同的數據格式轉換成相同的數據格式,從而解決各個不同數據源不同統(tǒng)計口徑以及難以共享的問題[4].
由引言可知,各個業(yè)務部門擁有自己的業(yè)務系統(tǒng),這些業(yè)務系統(tǒng)之間沒有標準的接口,從而導致數據定義不同,形成數據冗余、數據值不一致等問題.與此同時,這些業(yè)務系統(tǒng)缺乏集中的管理系統(tǒng),形成了各自的數據孤島,無法做到數據的完全共享.結合上述提出的電信數據倉庫體系,按照不同的主題對各類生產系統(tǒng)(如:CRM系統(tǒng)、計費系統(tǒng)、結算系統(tǒng)、資源系統(tǒng)等)的數據進行抽取、轉換、裝載(Extract-Transform-Load,ETL),從而實現對業(yè)務數據的匯聚和整合.這樣,數據倉庫可以全方位管理各個業(yè)務系統(tǒng)中的數據,實現不同數據展現的準確性、及時性和一致性,從而解決業(yè)務系統(tǒng)之間數據口徑不一致以及大數據量難以完全共享的問題[5].
數據倉庫里的主題通常是用戶使用數據倉庫進行決策時所關心的重點內容.從電信企業(yè)的實際運作情況看,可以大致分為客戶、產品、賬務收入、欠費等主題.隨著這些主題的完善和發(fā)展,相應主題下的數據表也隨之不斷擴充,最終覆蓋整個電信的業(yè)務系統(tǒng)[6].表1是電信企業(yè)數據倉庫的主要主題.
表1 電信企業(yè)數據倉庫主題Table 1 Subjects of telecom data warehouse
由于傳統(tǒng)粗放式營銷缺乏客戶消費數據和數據分析,制定出的營銷策略往往只依靠決策者的主觀判斷和直覺.而數據倉庫系統(tǒng)可以利用數據挖掘等方法分析數據倉庫里的數據,并有效地分析出用戶的消費特征和行為偏好,從而為企業(yè)決策者提供針對性營銷的決策支撐.營銷管理是從客戶、產品、收入等不同的主題分析跟蹤電信企業(yè)的各種營銷方案和市場行為,準確地識別目標客戶,評估存在的營銷方案,從而保證營銷策略的成功率.市場針對性營銷清晰的反映了營銷成功率、反饋準確度、執(zhí)行效果、營銷收益以及投資收益率[7].圖3列出了針對性營銷基于流失預測模型,發(fā)現客戶流失傾向,實現客戶維系挽留的模型.
圖3 針對性營銷中客戶挽留模型Fig.3 Model of customer retention system on targeted marketing
(1)數據準備
針對性營銷是在充分了解顧客信息的基礎上,針對顧客的偏好,有針對性地進行一對一的營銷.下面主要分析消費行為特征所涉及的客戶信息,如表2所示:
通過對表2中所涉及的各類客戶消費行為的數據進行分析作為數據準備,這些信息包括活動名稱、產品名稱、活動方案、活動時間、賬目情況等.
(2)流失預測
流失預測是在分析客戶消費行為的基礎上,對流失客戶進行預測,并將流失客戶進行分類,對有價值的流失客戶選擇最佳的匹配挽留方案,然后根據用戶價值對營銷效果進行評估,將營銷效果評估后的結果納入知識庫.圖4所示是客戶預測模型,通過這個模型可以預測即將流失的客戶.
表2 用戶消費行為特征信息Table 2 Characteristic of customer consumption behavior
圖4 客戶預測模型Fig.4 Customer forecasting model
(3)客戶挽留
在這個階段,將利用優(yōu)惠短信推送或電信回訪的方式訪問流失客戶并了解客戶流失的具體原因.然后根據客戶流失的原因及時調整營銷政策來盡力挽留可能流失的客戶.
(4)評估優(yōu)化
這個階段將對整個營銷政策的效果進行合理的評估.營銷政策的執(zhí)行效果的衡量來自數據倉庫中的反饋信息,我們通過對客戶在營銷前后價值行為進行評估從而可以對營銷政策的效果進行準確的分析.最后,將評估的結果加入到知識庫中,從而可以及時地調整營銷策略和營銷事件的閾值,提高流失客戶預測的命中率.
基于上述的客戶挽留模型,從某省選擇50萬用戶,以2013年6月份為預測點,選取前三個月的客戶行為主題數據以及賬務主題數據,來預測未來一個月的客戶流失情況.具體實驗數據如表3所示.
表3 客戶流失預測模型實驗Table 3 The experiment of customer churn prediction model
通過以上實驗驗證,發(fā)現預測模型在預測流失客戶數和成功預測流失客戶數上都有較高的命中率和查準率,表明通過正確的預測流失客戶數,可以進一步調整營銷策略從而對有價值的客戶進行挽留.
目前,很多企業(yè)都已經著手構建其產業(yè)領域的數據倉庫,這些企業(yè)將不同業(yè)務系統(tǒng)中的數據按照不同的主題整合在數據倉庫中,從源頭上解決了數據孤島及大數據難以共享等問題,使得這些大數據便于共享、存取、查詢、分析及應用.數據倉庫為企業(yè)帶來了一些“以數據為基礎的知識”,并為企業(yè)的運作帶來新的視角.與此同時,這些企業(yè)利用數據挖掘等相關技術對數據倉庫中數據進行充分的分析和挖掘,從而為企業(yè)市場決策和企業(yè)發(fā)展戰(zhàn)略提供有力的決策支持[8].
[1]于紅雷,華慶一,劉燕玲,等.數據倉庫在電信統(tǒng)計分析中的應用[J].計算機技術與發(fā)展,2007,17(8):201-204.
[2]周亮.電子政務決策支持系統(tǒng)中數據倉庫的研究與設計[J].武漢理工大學學報,2005,27(1):31-34.
[3]WILLIAM H.Inmon著,王志海譯.建立數據倉庫[M].4版.北京:機械出版社,2006.
[4]張軍玲.數據倉庫在電信綜合運營支撐系統(tǒng)中的應用[D].西安:西安電子科技大學,2009.
[5]雷海艷.電信企業(yè)針對性營銷管理系統(tǒng)的設計與實現[D].成都:電子科技大學,2011.
[6]劉英姿,崔南方,馬士華,等.基于電信業(yè)務的數據倉庫系統(tǒng)設計[J].華中科技大學學報,2002,30(9):42-44.
[7]唐九洲.電信行業(yè)經營分析系統(tǒng)數據倉庫建模研究[D].長沙:中南大學,2004.
[8]楚麗桃.論數據倉庫在電信統(tǒng)計分析中的應用[J].工業(yè)設計,2011(07):130-132.