文/吳敏
隨著移動通信技術的不斷演進,中國移動已從話音經(jīng)營時代進入流量經(jīng)營時代,大數(shù)據(jù)時代下運營商確立了以智能管道(物理網(wǎng)絡)和聚合平臺(商業(yè)網(wǎng)絡)為基礎,以擴大流量規(guī)模、提升流量層次、豐富流量內(nèi)涵為經(jīng)營方向,以釋放流量價值為目的的一系列理念、策略和行動的集合。流量經(jīng)營的最終目的是順應移動互聯(lián)網(wǎng)的發(fā)展,轉(zhuǎn)變運營商的收入結(jié)構(gòu),達到利潤最大化。為了避免“被管道化”,流量運營分析系統(tǒng)當之無愧地成為了運營商大數(shù)據(jù)時代的煉金術。
中國移動在2012年流量經(jīng)營工作上的主要方向上提出:要把握移動互聯(lián)網(wǎng)時代特征,努力加強流量經(jīng)營。提出了五點要求:
(1)要提供好用易用的管道,不斷提高核心網(wǎng)質(zhì)量;
(2)要將終端補貼重點向中低端智能手機傾斜;
(3)要做好手機上網(wǎng)客戶培訓和主動關懷工作;
(4)要提升手機上網(wǎng)使用感知;
(5)要加強流量的精細化經(jīng)營。
如何通過業(yè)務支撐系統(tǒng)更好的助力互聯(lián)網(wǎng)時代的電信運營商的流量經(jīng)營,實現(xiàn)加強流量經(jīng)營的工作要求是本項目課題主要研究的方向。
1.2.1 把握流量特點
存在問題:用戶上網(wǎng)行為千差萬別,特征差異大,有待深度掌握。
工作方向:建設流量經(jīng)營分析支撐系統(tǒng),精準把握用戶互聯(lián)網(wǎng)行為特點,實現(xiàn)移動互聯(lián)網(wǎng)領域的精準營銷,提升流量經(jīng)營工作效果和效率。
1.2.2 落實四網(wǎng)協(xié)同
存在問題:流量結(jié)構(gòu)不合理,2G承載過高,訪問感知差。
工作方向:加強TD網(wǎng)絡建設,加大TD智能終端、MIFI的營銷力度,加快WLAN熱點補盲,有效分流2G網(wǎng)絡壓力。
1.2.3 釋放流量價值
存在問題:套餐內(nèi)外差價大,用戶需求受到抑制。
工作方向:做好流量定價策略,豐富流量套餐資費,通過GPRS疊加包、閑時流量優(yōu)惠包等資費手段,釋放用戶流量需求。
1.2.4 擴大流量規(guī)模
存在問題:普及率和人均流量有待進一步提升。
工作方向:降低用戶上網(wǎng)門檻,創(chuàng)造便利上網(wǎng)條件,培養(yǎng)用戶流量使用習慣,擴大流量用戶規(guī)模。
建設流量運營平臺,支撐解決流量供給、提升流量價值、個性化流量營銷等流量經(jīng)營工作建設流量運營平臺,支撐解決流量供給、提升流量價值、個性化流量營銷等流量經(jīng)營工作上海公司緊跟流量運營四大工作方向,核心解決流量供給、提升流量價值、個性化流量營銷三方面問題,建設省級流量運營平臺,整合用戶級流量信息數(shù)據(jù),強化平臺與各網(wǎng)絡條線資源的融合互通,實現(xiàn)全能力流量運營工作。
目標一:提升引流能力,用更低的成本獲得更多的有效流量,獲得更多的客戶接觸機會。
目標二:提升流量轉(zhuǎn)化成收入的能力,提升向客戶成功推銷產(chǎn)品的概率。
面對海量的和非結(jié)構(gòu)化的互聯(lián)網(wǎng)流量信息數(shù)據(jù),我們該如何“烹飪”它?
面對高實時性要求的應用功能,我們該如何“滿足”它?
網(wǎng)絡側(cè)數(shù)據(jù)和計費側(cè)數(shù)據(jù)都接入了,怎么“呵護我們的系統(tǒng)生命線”?
對于互聯(lián)網(wǎng)流量信息中含有大量的敏感信息數(shù)據(jù),在項目實施中,如何保證信息安全無差錯?
系統(tǒng)功能的方向,最全面的?最需要的?
系統(tǒng)能力的互通,需要?不需要?
上海日均網(wǎng)絡流量達4萬G(2012年數(shù)據(jù)),日均流量信息接口數(shù)據(jù)為1T。隨著移動互聯(lián)網(wǎng)的發(fā)展,此數(shù)據(jù)量還會逐步增長,預計到2013年底,日均流量信息接口數(shù)據(jù)量至少在1.5T以上?;ヂ?lián)網(wǎng)信息數(shù)據(jù)中包含了大量的非結(jié)構(gòu)化信息數(shù)據(jù):如內(nèi)容文本數(shù)據(jù)、XML和HTML網(wǎng)頁數(shù)據(jù)等。面對海量的和非結(jié)構(gòu)化的互聯(lián)網(wǎng)流量信息數(shù)據(jù),引入多項創(chuàng)新技術進行精準處理。
2.2.1 引入新技術-“分布式處理”
搭建Hadoop分布式環(huán)境:利用低成本的PC服務器和存儲,構(gòu)建Hadoop分布式環(huán)境。
使用MapReduce模型進行編程:基于MapReduce 編程模型,開發(fā)數(shù)據(jù)處理程序。最終消化掉互聯(lián)網(wǎng)的海量數(shù)據(jù)。
2.2.2 精進老技術-“數(shù)據(jù)倉庫”
數(shù)據(jù)的處理必須依賴數(shù)據(jù)倉庫,因此必須充分運用。
壓縮大數(shù)據(jù)量表,提供訪問速度:對大數(shù)據(jù)量表,進行壓縮處理,以提高該表的訪問速度。
分區(qū)表和多維集群的應用:按照業(yè)務創(chuàng)建分區(qū)表,更加均勻分布大數(shù)量表;按照常用維度,創(chuàng)建多維集群應用層表,提供查詢性能。
2.2.3 流量報文數(shù)據(jù)處理利器-“協(xié)議分析”
原始流量信息數(shù)據(jù)解析:利用“協(xié)議分析”技術,深度檢查和解析互聯(lián)網(wǎng)數(shù)據(jù)報文,從中獲取原始的流量信息數(shù)據(jù):例如“應用協(xié)議”信息、URL信息、UA信息。最終為后續(xù)流量的分析運營,提供海量、精準信息。
2.2.4 “爬蟲、分詞”-非結(jié)構(gòu)化內(nèi)容文本數(shù)據(jù)處理
爬蟲技術:通過URL自動的抓取互聯(lián)網(wǎng)上信息數(shù)據(jù),包括用戶訪問的原始內(nèi)容文本數(shù)據(jù)。
分詞技術:將獲取的內(nèi)容文本,進行合理、正確的切割,使文本計算機化,為后續(xù)內(nèi)容分析和挖掘提供輸入。
2.3.1 智能感、智能知分析功能
智能感:主要包含應用分析、終端分析、內(nèi)容分析以及位置分析。精確定位終端用戶需求,全面分析終端用戶上網(wǎng)偏好,通過對數(shù)據(jù)的深度分析和結(jié)果固化、沉淀,掌握客戶習慣偏好、行為等信息,識別個性化需求。
智能知:支持實時營銷、快速挖掘用戶的行為偏好,并及時將數(shù)據(jù)傳輸?shù)綘I銷平臺,為用戶進行快速準確的營銷提供及時的數(shù)據(jù)。
2.3.2 實時營銷平臺功能
實時營銷引入了多種大數(shù)據(jù)接口,能處理傳統(tǒng)數(shù)據(jù)庫和應用無法分析的數(shù)據(jù):從C3智能感知平臺的大數(shù)據(jù)流;從小區(qū)短信輸出的A口信令數(shù)據(jù)、互聯(lián)互通信令數(shù)據(jù);IVR的12580按鍵數(shù)據(jù)。
(1)實時營銷使用的是NoSql技術的數(shù)據(jù)內(nèi)存數(shù)據(jù)庫,能應對大量的事物頻繁的更新等實時性較高的操作
(2)結(jié)合了經(jīng)分的常規(guī)數(shù)據(jù),對用戶做更細致的分群,過濾,提高營銷的效率
(3)多渠道統(tǒng)一管控,設置優(yōu)先策略,各營銷之間的并行關系,依賴關系等配置
(1)消除單點故障保障方式,通過多進程部署,增加管理進程控制,在進程異常時保證數(shù)據(jù)不丟失。
1)增加管理模塊實時監(jiān)控各個進程的活動狀態(tài)、控制數(shù)據(jù)流、收集進程狀態(tài)。
2)所有模塊與管理模塊定時心跳。
3)當進程異常,管理模塊主動檢測,將數(shù)據(jù)分流到其他進程。
(2)文件方式保障方式,在系統(tǒng)異?;蛑鲃舆\維時,可以以保存文件的方式,保障數(shù)據(jù)完整性。
系統(tǒng)異常情況如下:
1)增加管理模塊實時監(jiān)控各個進程的活動狀態(tài)、控制數(shù)據(jù)流、收集進程狀態(tài)。
2)所有模塊與管理模塊定時心跳。
3)當進程異常,管理模塊主動檢測,將流數(shù)據(jù)先保存成文件,再由其他進程補充處理文件。
(3)互聯(lián)網(wǎng)全量分析應用平臺采用“DFI+DPI”兩種技術相結(jié)合分析數(shù)據(jù)業(yè)務。
監(jiān)測會話連接或數(shù)據(jù)流的狀態(tài)等流量行為初步分析判斷數(shù)據(jù)應用并監(jiān)測應用層協(xié)議特征、業(yè)務流和控制流關聯(lián),協(xié)議行為判斷具體數(shù)據(jù)應用。新增近50款應用:如http 下載、http 瀏覽、微信、微博、BT、迅雷、PPStream、QQ、飛信、魔獸、PPLive、Skype…等。
通過算法進行基站和熱點匹配,預先配置區(qū)域規(guī)則。通過基站實時捕獲用戶GPRS上網(wǎng)行為,實時匹配目標用戶屬性字段,實時推送目標用戶到營銷管理平臺。
實時捕獲、實時匹配、實時推送基于實時消息接口:與網(wǎng)絡側(cè)的處理模塊銜接,采用MQ消息接口;與營銷管理平臺處理模塊的銜接采用WebService接口;內(nèi)部處理模塊銜接采用Socket接口。
對于用戶GPRS上網(wǎng)行為的實時捕獲,與網(wǎng)絡側(cè)協(xié)同,則直接復用了網(wǎng)絡側(cè)實時捕獲GPRS上網(wǎng)的能力,并實現(xiàn)實時對接到流量運營平臺。
采用內(nèi)存實時匹配。業(yè)務應用場景實時性要求高,且基本都是小批量用戶匹配。因此無法采用傳統(tǒng)的手段,即在數(shù)據(jù)庫中匹配、判斷用戶屬性字段,而采用在內(nèi)存中完成了這些處理,以保證處理的實時性。
信息安全永遠的高壓線。復雜的項目實施和大量的敏感信息,使得信息安全有很多隱患。流量數(shù)據(jù)敏感信息較多,如用戶賬號信息、用戶位置信息、終端信息、訪問內(nèi)容信息、使用應用信息。同時,項目實施過程復雜,項目實施人員多、廠商非PSO的人員參與多、實施工期長、涉及多個服務器環(huán)境。項目實施又繞不開數(shù)據(jù),如何保障信息安全?
首先,從項目實施環(huán)境上物理分離。項目實施環(huán)境:分別搭建正式環(huán)境、測試環(huán)境、開發(fā)環(huán)境,三境分離。其中正式環(huán)境存放正式數(shù)據(jù),測試環(huán)境的數(shù)據(jù)由正式環(huán)境分發(fā)生成,開發(fā)環(huán)境的數(shù)據(jù)由測試環(huán)境抽樣生成。
其次,從項目人員角色上明確權限。明確項目實施人員的角色,嚴格區(qū)分測試人員、開發(fā)人員。測試人員有人數(shù)限定。開發(fā)人員只能訪問開發(fā)環(huán)境,測試人員只能訪問測試環(huán)境。
第三,數(shù)據(jù)加密、歷史數(shù)據(jù)加強保障。測試環(huán)境中的敏感信息數(shù)據(jù),事先準備好加密程序或者算法,在數(shù)據(jù)分發(fā)時,進行統(tǒng)一加密;測試環(huán)境的數(shù)據(jù)周期只能存在歷史數(shù)據(jù),比如上個月或上個星期的。
如果建設全體系的監(jiān)控指標、全方位的分析維度、全流程的系統(tǒng)功能?面對著系統(tǒng)提供的各式各樣的全面的系統(tǒng)功能,不僅增加了使用上的不便,也讓很多功能出現(xiàn)了局部重復,并失去了針對性。為了支撐系統(tǒng)大而全的應用功能,系統(tǒng)處理的數(shù)據(jù)量往往增大了很多,這將直接增加系統(tǒng)運行負荷,影響系統(tǒng)性能。建設大而全的系統(tǒng),系統(tǒng)的建設周期會加長。這將可能會影響系統(tǒng)支撐業(yè)務發(fā)展的時效性。
流量運營,目前尚處于剛起步階段,因此無法實現(xiàn)最全面的功能。且系統(tǒng)隨著業(yè)務的發(fā)展不斷有新需求,業(yè)務一直在發(fā)展,探索階段無法做最全面的系統(tǒng)。指標是無窮盡的,換個單位,也許就變成另外一個指標了。因此需要聚焦業(yè)務人員最為關心的指標,然后努力實現(xiàn)它們。維度只是分析的角度,并非所有的角度都是正確的,因此需要聚焦業(yè)務人員最為需要的分析視角。系統(tǒng)功能是為業(yè)務發(fā)展服務的。而業(yè)務發(fā)展是有時間要求的。我們需要盡可能快的完成業(yè)務人員最為需要的系統(tǒng)功能支撐,這樣才是對業(yè)務最有效的支撐。
綜上,我們確定了系統(tǒng)的定位:不是純分析型系統(tǒng),必須是支撐業(yè)務發(fā)展的系統(tǒng)。
裝備“長矛”-營銷能力互通:實現(xiàn)流量運營平臺和營銷管理平臺對接,可以直接將流量運營平臺的分析成果,如用戶群、熱門內(nèi)容和應用等,直接作為營銷資源,用于營銷。例如:新入網(wǎng)用戶推薦功能,就是在流量運營平臺監(jiān)控新入網(wǎng)用戶的終端型號和流量情況,捕捉適合推薦流量套餐的用戶后,推送至營銷平臺進行營銷推薦。
裝備“盾牌”-服務能力互通:對于流量運營平臺中生成的、可用于服務維系支撐的分析結(jié)果和資源,形成管理功能,在系統(tǒng)具備與外圍服務維系類系統(tǒng)能力互通后,即可使用。例如:終端配置指導功能,就是定期分析GPRS上網(wǎng)失敗和彩信發(fā)送失敗的清單數(shù)據(jù),獲取失敗用戶終端型號。在與OTA平臺對接后,自動化向用戶推送終端彩信上網(wǎng)配置信息。
開展基于流量運營平臺開展自動化換機用戶營銷活動,實時發(fā)現(xiàn)用戶換機行為,通過服務新機用戶的關懷行動挖掘二次營銷機會。
根據(jù)終端換機應用模型,平臺根據(jù)不同的用戶情況進行分析,推送不同的換機服務營銷場景。可以查詢每款機型每天用戶數(shù)的變動情況,為設置具體的終端換機營銷場景提供支撐;
(1)可以根據(jù)操作系統(tǒng)、屏幕、雙卡等參數(shù)設置場景,進行靈活配置;
(2)可通過“終端換機場景管理”新增所需的換機場景,從而實時抓取符合條件的換機用戶;
(3)可查看已設置的換機場景及具體配置信息;
(4)可直接點擊“營銷”按鈕,實現(xiàn)營銷方案的配置和生成,針對換機用戶發(fā)起實時營銷。
將有換機行為的,在活動中有套餐升級的用戶與未升級用戶進行對比,觀察其流量變化。
(5)從數(shù)據(jù)中可以看出,有套餐升級的用戶5月提升量明顯高于未升級的用戶,提升比例大于未升級用戶的2倍以上。
(6)5元升10元的用戶提升比例最高,達205%;10元升20元相對較低,提升比例為88%。
(7)5元升20元的用戶人均流量低于10元升20元的用戶,但提升比例高于10元升20元用戶。
(8)觀察換機用戶在換機前后,套餐升級前后的流量變化,以期找出最合適的換機營銷時間。
作為運營商流量經(jīng)營時代的主要分析平臺,上海移動流量運營分析系統(tǒng)自2012年建設以來,逐步實現(xiàn)了流量偏好分析、沉默與低使用量客戶促進、流量促進提升、網(wǎng)絡協(xié)同分析、終端運營應用、高價值用戶流失預警、新業(yè)務營銷、運營效果評估這八大類流量分析模型,以及四大類關鍵時刻場景運營、八類屬地化深度分析報表,并在實際生產(chǎn)中取得了較好應用效果,有力的支撐了大數(shù)據(jù)時代的流量經(jīng)營戰(zhàn)略落地。
此外,對于互聯(lián)網(wǎng)流量信息數(shù)據(jù)的研究結(jié)果,如用戶偏好模型、終端信息庫、應用特征庫、內(nèi)容分詞分類等,我們該如何“共享”?這也是項目組不斷思考的,對于共性化結(jié)果,建議建立共享信息庫;個性化結(jié)果,建立交流平臺。對于共性化的的研究結(jié)果,建立共享信息庫:如終端信息庫:終端信息,全國通用;應用特征庫:互聯(lián)網(wǎng)應用特征,無地域差別。對于個性化的的研究結(jié)果,則可建立交流平臺,便于借鑒好的算法、模型,交流研究經(jīng)驗。如用戶偏好模型:通過交流平臺借鑒思路、算法,交流建模經(jīng)驗;內(nèi)容分詞分類:通過交流平臺借鑒分類體系,交流內(nèi)容分類標簽經(jīng)驗。
高速的4G時代下,流量運營也將不斷的支撐新業(yè)務新技術的發(fā)展,結(jié)合營銷和服務不斷為用戶提供更便利的服務感知,順應移動互聯(lián)網(wǎng)的發(fā)展,向擴大流量規(guī)模、提升流量層次、豐富流量內(nèi)涵為經(jīng)營方向發(fā)展,助力轉(zhuǎn)變運營商的收入結(jié)構(gòu),實現(xiàn)和用戶的雙贏。