亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于Hadoop的大數(shù)據(jù)流量經(jīng)營系統(tǒng)解決方案*

        2016-01-04 11:21:44
        電信工程技術與標準化 2015年2期
        關鍵詞:云計算分布式大數(shù)據(jù)

        ?

        一種基于Hadoop的大數(shù)據(jù)流量經(jīng)營系統(tǒng)解決方案*

        肖露1,2,王晶1,2

        (1 北京郵電大學網(wǎng)絡與交換國家重點實驗室,北京 100876;2 東信北郵信息技術有限公司,北京 100191)

        摘 要隨著工信部宣布發(fā)放4G牌照,各大運營商大力推動3G/4G網(wǎng)絡建設,網(wǎng)絡覆蓋的不斷完善和4G時代的來臨,大大推動了移動互聯(lián)網(wǎng)的快速發(fā)展和智能終端的普及。在移動端,用戶的流量必將不斷增長。結合當前的大數(shù)據(jù)模式,提出一個基于Hadoop分布式計算平臺的大數(shù)據(jù)解決方案,為培養(yǎng)用戶的流量體驗,挖掘和發(fā)展適合用戶的互聯(lián)網(wǎng)應用,以及推動流量經(jīng)營提供數(shù)據(jù)支持。

        關鍵詞分布式;大數(shù)據(jù);云計算

        隨著電信業(yè)的重塑及電信運營商的轉型,業(yè)務重心幾經(jīng)變遷,“流量”在不同語境下含義不同,但也有脈絡可循。大致說來,從話音通信業(yè)務、寬帶接入業(yè)務到移動互聯(lián)網(wǎng)業(yè)務,流量內(nèi)涵的演進脈絡一是從同質流量到異質流量,即所謂流量內(nèi)涵的豐富;一是從底層流量到表層流量,即所謂流量層次的提升。與顯而易見的擴大流量規(guī)模相比,豐富流量內(nèi)涵和提升流量層次是流量經(jīng)營更為重要卻易被忽視的兩大方向。

        當運營商進入全業(yè)務運營時代,需要轉變?yōu)橐杂脩魹楹诵牡倪\營模式。從客戶需求出發(fā),一方面評估互聯(lián)網(wǎng)業(yè)務流量價值,另一方面深入洞察客戶個性化上網(wǎng)需求,通過產(chǎn)品、終端、內(nèi)容和客戶需求的精確匹配,精準定位客戶,并采取合適的方式推薦業(yè)務及流量產(chǎn)品,最終實現(xiàn)業(yè)務及流量價值提升。

        1 研究目標

        本系統(tǒng)依托于現(xiàn)有的大量流量,采用ETL工具及數(shù)據(jù)倉庫hive完成系統(tǒng)建設,做好流量經(jīng)營分析支撐,助力流量市場運營。

        2 系統(tǒng)架構

        2.1 系統(tǒng)總體架構

        系統(tǒng)總體架構如圖1所示,采用分層建設思路,各層功能職責明確,相互獨立,通過內(nèi)部接口交互信息。各層功能采用模塊化開發(fā),各模塊改變不影響整體結構。該架構在解決當前業(yè)務需求和管理的前提下充分考慮未來的業(yè)務需求變化,為后續(xù)系統(tǒng)升級、擴展以及與其它應用系統(tǒng)的互通接口提供了快速響應和良好的擴展能力。整個體系架構包括如下。

        2.1.1 接口層

        提供了用戶接入平臺部署業(yè)務、外部系統(tǒng)獲取分析結果數(shù)據(jù)的管理功能,將不同用戶以不同權限采用不同方式使用不同功能的差異化需求封裝起來,向底層功能實現(xiàn)進行屏蔽,不僅有利于系統(tǒng)底層統(tǒng)一建設而且便于靈活調(diào)整擴展。接口層具備豐富的規(guī)范化接口形式和管理能力,滿足各類數(shù)據(jù)產(chǎn)品向用戶展現(xiàn)推送與其它系統(tǒng)交互的需要。

        2.1.2 應用層

        實現(xiàn)了流量經(jīng)營分析支撐平臺上運行的業(yè)務功能和管理功能,應用層是平臺對數(shù)據(jù)智能化、系統(tǒng)化、流程化、自動化處理的具體體現(xiàn),各功能模塊在應用上相互獨立,結合訪問層的展現(xiàn)界面和下面能力層、數(shù)據(jù)管理層、計算支撐層的基礎支撐,能夠滿足系統(tǒng)當前和持續(xù)發(fā)展的需要。

        2.1.3 能力服務層

        通過分析需求,在平臺建設和應用中沉淀積累總結的一些基礎的、通用的數(shù)據(jù)加工(ETL、數(shù)據(jù)可視化)、分析挖掘(數(shù)據(jù)挖掘算法、數(shù)據(jù)分析模型)、應用支撐(分析界面、推薦引擎、營銷引擎、數(shù)據(jù)開放引擎)等能力工具、組件,為上層數(shù)據(jù)產(chǎn)品開發(fā)和應用提供支撐。

        2.1.4 數(shù)據(jù)管理層

        負責平臺統(tǒng)計分析源數(shù)據(jù)的采集和加工。通過自助開發(fā)的ETL工具PDM(Parallel Data Miner)實時和非實時地采集、清洗和轉換原始數(shù)據(jù),形成便于統(tǒng)計分析的用戶上網(wǎng)信息等數(shù)據(jù)。數(shù)據(jù)層同時還負責數(shù)據(jù)的存儲和備份,支持按時間備份、按使用冷熱程度備份,定期將過期數(shù)據(jù)清除。

        圖1 系統(tǒng)總體架構

        數(shù)據(jù)服務層通過構建數(shù)據(jù)集市、數(shù)據(jù)立方體、知識庫等來支撐上層應用對數(shù)據(jù)的需求。

        (1)主題域:將數(shù)據(jù)層入庫數(shù)據(jù)進行主題劃分,如用戶的行為主題、業(yè)務發(fā)展主題、內(nèi)容及產(chǎn)品分析主題、營收主題、合作伙伴分析主題等,根據(jù)各主題的業(yè)務屬性、關鍵分析維度、度量進行分層聚合存儲。

        (2)知識庫:將各主題域中的信息進行歸并、整理,將用戶行為、消費、特征等各方面信息集中,形成各種知識庫:如客戶統(tǒng)一視圖、產(chǎn)品統(tǒng)一視圖。

        (3)數(shù)據(jù)集市:根據(jù)業(yè)務特征和不同用戶需求,關聯(lián)不同維表,建立不同的數(shù)據(jù)集市,包括用戶數(shù)據(jù)集市、產(chǎn)品數(shù)據(jù)集市、營收數(shù)據(jù)集市,并建立報表指標庫,支撐各類指標的數(shù)據(jù)輸出。

        2.1.5 計算支撐層

        是一個混合型的數(shù)據(jù)計算和管理環(huán)境,“分布式計算+關系型數(shù)據(jù)庫+領域相關的NoSQL數(shù)據(jù)庫”構成的。涵蓋從批處理到交互式,從業(yè)務系統(tǒng)到分析系統(tǒng),從結構化數(shù)據(jù)到非結構化數(shù)據(jù)的應用場景支撐。

        傳統(tǒng)采用數(shù)據(jù)庫作為單一存儲和計算的機制已經(jīng)無法滿足海量數(shù)據(jù)處理要求了(分析型應用、無法橫向擴容、非結構化數(shù)據(jù)處理、IT成本),因此當前推崇的是分布式無共享計算方式,比較流行的是MapReduce、流式計算模型,對應具體的產(chǎn)品就是Hadoop、Storm、Hbase。

        2.1.6 系統(tǒng)管理層

        從系統(tǒng)整體層面上進行基礎設施和運維的管理,為系統(tǒng)平穩(wěn)運行保駕護航。主要包括如下。

        (1)流程調(diào)度管理:把系統(tǒng)中的一些應用邏輯看成是可復用組件組成的工作流,提供工作流的并行、串行、依賴調(diào)度執(zhí)行,實現(xiàn)應用邏輯的快速支撐和分布式并行計算能力;并提供可視化的流程設計界面。

        (2)元數(shù)據(jù)管理:將數(shù)據(jù)倉庫中的數(shù)據(jù)信息、數(shù)據(jù)處理規(guī)則等采用元數(shù)據(jù)來描述,建立動態(tài)和靜態(tài)數(shù)據(jù)索引,便于平臺維護、分析、消費各種數(shù)據(jù),幫助平臺內(nèi)各數(shù)據(jù)使用者了解存在哪些數(shù)據(jù)、數(shù)據(jù)存儲位置及其含義,形成統(tǒng)一的平臺信息地圖,平臺各層都基于元數(shù)據(jù)驅動開發(fā)。

        (3)數(shù)據(jù)質量管理:分析性平臺賴以生存的是數(shù)據(jù),而數(shù)據(jù)賴以生存的是數(shù)據(jù)質量,只有保證數(shù)據(jù)質量,才能提高數(shù)據(jù)的可用性。數(shù)據(jù)質量管理提供了文件級、記錄級、表級和業(yè)務級等4個級別的質量監(jiān)控,提供最大力度的異常數(shù)據(jù)修復能力,并對異常行為進行告警。

        (4)系統(tǒng)運維管理:青海移動流量經(jīng)營分析支撐平臺具備良好的系統(tǒng)配置和運行維護管理能力,通過自主開發(fā)的EB-OMS(OperatingManager System),以Web界面形式提供用戶管理、日志管理、安全管理、系統(tǒng)監(jiān)控功能。

        2.2 系統(tǒng)架構特點

        應用快速支撐能力:具備豐富的、通用的、開放的數(shù)據(jù)處理加工、分析挖掘能力池,快速構建上層應用專題;并可以支撐定制化的開發(fā)。

        可擴展能力:分層模塊化架構,各層職責明確,相互獨立,基于業(yè)務規(guī)則、基于能力調(diào)用、基于數(shù)據(jù)來相互協(xié)作,讓系統(tǒng)提供充分的擴展彈性能力。

        大數(shù)據(jù)處理能力:采用分布式多樣化計算和存儲技術,滿足大數(shù)據(jù)時代的處理效率。

        技術應用優(yōu)勢:產(chǎn)品架構和技術已經(jīng)在中國移動手機閱讀基地BI、某省流量經(jīng)營、彩鈴深度運營系統(tǒng)中應用驗證,積累了大量的可復用經(jīng)驗。

        2.3 系統(tǒng)硬件架構

        系統(tǒng)硬件架構如圖2所示,包括數(shù)據(jù)采集服務器、數(shù)據(jù)倉庫服務器和數(shù)據(jù)挖掘服務器等。

        數(shù)據(jù)采集服務器:負責從數(shù)據(jù)源系統(tǒng)上實時和非實時地采集用戶業(yè)務使用行為數(shù)據(jù),對這些數(shù)據(jù)進行清洗轉換和加工,然后加存入到關系數(shù)據(jù)庫中。

        數(shù)據(jù)倉庫服務器:一部分基于商業(yè)數(shù)據(jù)庫如Oracle RAC來構建,支持用戶的數(shù)據(jù)查詢、交互式分析需求;另一部分大量復雜的數(shù)據(jù)處理和綜合分析功能基于分布式計算框架Hadoop構建,具有很高的I/O處理能力,對原始數(shù)據(jù)進行ETL處理、各維度、層次的統(tǒng)計和運算,構建主題域和集市,為OLAP、數(shù)據(jù)挖掘提供數(shù)據(jù)和運算的基礎。

        數(shù)據(jù)挖掘服務器:基于Hadoop部署在多主機分布式集群上,能夠根據(jù)數(shù)據(jù)容量和處理效率要求進行橫向平滑擴展,保證系統(tǒng)的穩(wěn)定性。

        2.4 系統(tǒng)關鍵技術方案

        2.4.1 數(shù)據(jù)可視化技術

        系統(tǒng)提供可視化設計組件庫,包括地圖引擎、儀表盤、常用圖表、流程設計引擎等,基于可視化組件庫,用戶可以實現(xiàn)所見即所得的在線設計頁面。數(shù)據(jù)可視化展現(xiàn)形式:地圖、網(wǎng)絡圖、矩陣圖、折線圖、柱狀圖(如圖3所示)、餅圖(如圖4所示)、數(shù)據(jù)表等??梢暬夹g展現(xiàn)示例如圖5所示。

        2.4.2 OLAP分析技術

        平臺提供OLAP多維分析工具,可以對數(shù)據(jù)進行不同角度、不同深度的分析,最終形成多維業(yè)務報表,并根據(jù)報表中數(shù)據(jù)的客觀規(guī)律,發(fā)現(xiàn)數(shù)據(jù)中的趨勢和異常。通過OLAP工具能實現(xiàn)鉆取、旋轉、切片、切塊等多維數(shù)據(jù)分析功能;可自動分解時間維,支持圖表輸出與操作等。平臺提供的OLAP分析具備如下特點。

        Web查詢:支持同時具有客戶端隨機查詢分析前端工具和Web上的隨即查詢前端分析工具。

        拖拽查詢:在Web上的隨即查詢分析能夠直接將維度、度量等直接拖放到顯示的數(shù)據(jù)表格中,表格中則能夠實時刷新數(shù)據(jù)。

        報表操作:在Web上的隨即查詢分析工具,在數(shù)據(jù)展現(xiàn)區(qū)域支持鼠標右鍵快捷菜單,實現(xiàn)過濾、分組、計算等功能。

        服務支持:有自主OLAP服務,支持MS OLAP等主流OLAP Server。

        3 系統(tǒng)功能

        3.1 傳統(tǒng)流量經(jīng)營與大數(shù)據(jù)流量經(jīng)營的區(qū)別

        隨著話音業(yè)務趨于飽和,各大運營商都希望通過為用戶提供更多的增值業(yè)務來尋找新的業(yè)務收入增長點,因此各運營商不斷地開發(fā)新的增值業(yè)務。2009年,中國3G牌照的發(fā)放和3G無線網(wǎng)絡的建成,為用戶提供了一條無線數(shù)據(jù)業(yè)務的“高速公路”,為3G用戶隨時、隨地高速訪問無線數(shù)據(jù)業(yè)務提供了可能。電信運營商都抓住了這個契機,為3G用戶提供了豐富多彩的互聯(lián)網(wǎng)數(shù)據(jù)業(yè)務,如手機音樂、手機電視、微博等,數(shù)據(jù)流量也隨之與日俱增,成為增值業(yè)務收入提高的重要來源。如今隨著4G網(wǎng)絡的普及,面對大數(shù)據(jù)時代的流量挑戰(zhàn),運營商再采取提供眾多的增值業(yè)務,對流量價值提升的效果微弱。

        圖2 系統(tǒng)硬件架構圖

        圖3 流量結構查詢頁面1

        在大數(shù)據(jù)時代,流量增值業(yè)務種類已經(jīng)可以滿足用戶的多種需求,業(yè)務種類不再是流量經(jīng)營的重點。運營商需要改變傳統(tǒng)的流量經(jīng)營思維,圍繞用戶展開流量經(jīng)營策略。用戶面對如此眾多的增值業(yè)務,如何快速找到自己感興趣的業(yè)務,運營商又如何去對用戶進行分類,根據(jù)用戶的興趣愛好有效地向用戶推薦業(yè)務,這是一個必須解決的問題。

        本系統(tǒng)根據(jù)已有的用戶流量數(shù)據(jù),采用多維度分析,對用戶的流量提取后進一步分類,了解用戶在什么地方、什么時間、喜歡做什么。要做到這一點,需要知道用戶的生活軌跡、業(yè)務使用愛好以及消費行為等用戶基本數(shù)據(jù)。通過對這些用戶基本數(shù)據(jù)的分析,對用戶進行有效的分類,并能夠知道用戶業(yè)務的喜好后,再通過有針對性的營銷手段,快速將業(yè)務信息有效地通知用戶,促使用戶去使用他感興趣的業(yè)務,同時避免對用戶的重復打擾,這樣真正實現(xiàn)流量提升的營銷目標。

        3.2 業(yè)務應用功能

        3.2.1 流量發(fā)展KPI監(jiān)控

        通過對流量套餐、終端、產(chǎn)品、網(wǎng)絡、互聯(lián)網(wǎng)業(yè)務等KPI指標、重點指標監(jiān)控預警,總體監(jiān)控流量套餐的效益、終端銷售對流量的影響、流量產(chǎn)品的發(fā)展、網(wǎng)絡的協(xié)同和分流效果、互聯(lián)網(wǎng)業(yè)務發(fā)展情況等,并利用Web、短信、彩信、媒體等通道,向決策層、管理層及時提供關鍵業(yè)務指標數(shù)據(jù),為其全面掌握流量整體運營情況提供支撐。

        3.2.2 流量套餐監(jiān)控分析和價值評估

        從地域、套餐類型等維度,全面分析用戶、流量等指標信息,展現(xiàn)各類套餐用戶消費情況。

        (1)套餐使用分析:建立綜合價值評估模型,從不

        圖4 流量結構查詢頁面2

        圖5 營銷平臺頁面

        Design and implementation of a large data solution based on Hadoop distributed computing platform

        XIAO Lu1,2, WANG Jing1,2

        (1 State Key Laboratory of Networking and Switching Technology, Beijing University of Posts and Telecommunications, Beijing 100876, China; 2 EBUPT Information Technology Co., Ltd., Beijing, 100191)

        Abstract With the issuance of 4G licenses, the major operators began to vigorously promote the construction of 3G/4G network. The coming of the 4G era, which greatly promoted the spread of mobile Internet and intelligent terminal. In the mobile terminal, user flows will continue to increase. Combined with the large data model at present, this article puts forward a large data solutions based on Hadoop distributed computing platform, which training for the user flow experience, Internet application of mining and development suitable for the user, and to promote the fl ow of business to provide data support.

        Keywords distributed; large data; cloud computing同類型流量套餐的使用率、戶均流量、流量單價、套餐等級、套餐補貼相關指標,定期價值評估結果,為業(yè)務人員進行流量套餐優(yōu)化及套餐用戶流量提升提供數(shù)據(jù)支撐。

        (2)套餐遷移分析:通過對套餐遷移用戶的業(yè)務使用進行跟蹤監(jiān)控,掌握用戶在套餐遷移前后收入和業(yè)務量的變化情況,為業(yè)務人員評估客戶套餐遷移效果提供支撐。分析包括遷移前后流量、ARPU、流量收入、業(yè)務偏好等變化對比分析。

        (3)套餐效益分析:通過對流量套餐的使用、成本和收益情況進行監(jiān)控,評估流量套餐的效益,為業(yè)務人員進行套餐資費設計提供依據(jù)。

        3.2.3 終端流量監(jiān)控及分析

        終端流量監(jiān)控及分析主要通過掌握用戶終端更換帶來的流量變化商機、各種終端數(shù)據(jù)流量使用情況及差異,服務于終端精確營銷及流量使用引導活動。

        (1)終端類型分析:根據(jù)終端對流量耗用的情況進行分類,輸出重點明星終端、大眾終端、中等終端、低等終端等。

        (2)終端用戶行為分析:終端流量監(jiān)控及分析主要通過掌握用戶終端更換帶來的流量變化商機、各種終端數(shù)據(jù)流量使用情況及差異,服務于終端精確營銷及流量使用引導活動,并及時監(jiān)控終端分析對流量的拉動效應。

        (3)換機行為分析:通過分析客戶換機行為的前后消費行為變化,了解換機對業(yè)務和流量的影響,為業(yè)務人員進行終端選項、業(yè)務捆綁設計提供支撐。

        (4)智能終端影響分析:對用戶更換TD智能終端前后ARPU、移動數(shù)據(jù)流量以及相關增值業(yè)務的使用情況進行跟蹤分析,為業(yè)務人員進行TD智能終端選型、功能優(yōu)化、業(yè)務捆綁設計提供支撐。從時間、地域、品牌、終端型號、銷售價格、操作系統(tǒng)等維度,展現(xiàn)客戶更換智能終端前后的ARPU變化、流量使用變化、訂購業(yè)務變化等指標。

        4 結語

        * 基金項目:國家973計劃項目(編號:2013CB329102);國家自然科學基金資助項目(No. 61471063, 61471063, 61372120, 61271019, 61101119, 61121001);教育部科學技術研究重點(重大)項目資助(編號:MCM20130310);北京高等學校青年英才計劃項目(編號:YETP0473)。

        收稿日期:2015-01-06

        文章編號1008-5599(2015)02-0087-06

        文獻標識碼A

        中圖分類號TN915

        猜你喜歡
        云計算分布式大數(shù)據(jù)
        分布式光伏熱錢洶涌
        能源(2017年10期)2017-12-20 05:54:07
        分布式光伏:爆發(fā)還是徘徊
        能源(2017年5期)2017-07-06 09:25:54
        基于云計算的移動學習平臺的設計
        實驗云:理論教學與實驗教學深度融合的助推器
        大學教育(2016年9期)2016-10-09 08:54:03
        云計算中的存儲虛擬化技術應用
        科技視界(2016年20期)2016-09-29 13:34:06
        基于大數(shù)據(jù)背景下的智慧城市建設研究
        科技視界(2016年20期)2016-09-29 10:53:22
        基于DDS的分布式三維協(xié)同仿真研究
        雷達與對抗(2015年3期)2015-12-09 02:38:50
        西門子 分布式I/O Simatic ET 200AL
        久久午夜伦鲁鲁片免费| 男受被做哭激烈娇喘gv视频| 男女男在线精品网站免费观看| 亚洲欧美国产成人综合不卡| 亚洲无人区乱码中文字幕动画| 久久国产劲爆∧v内射-百度| 摸进她的内裤里疯狂揉她动视频| 国产成人一区二区三区免费观看| 国产精品女同二区五区九区| 亚洲免费观看视频| 少妇性l交大片| 无码一区二区三区不卡AV| 我也色自拍俺也色自拍| 亚洲一区二区女搞男| 欧美天欧美天堂aⅴ在线| 国产老妇伦国产熟女老妇高清 | 国产精品一区二区韩国av| 一区二区三区日本在线| 中文乱码字幕精品高清国产| 亚洲一卡2卡3卡4卡5卡精品| 亚洲无码一二专区| 91国语对白在线观看| 久久久久人妻精品一区二区三区| 公粗挺进了我的密道在线播放贝壳| 一区二区免费电影| 中文字幕乱码一区在线观看 | 精品亚洲国产探花在线播放| 中文字幕一区二区三区亚洲| 欧美大胆性生话| 亚洲欧洲中文日韩久久av乱码 | 成人无码av免费网站| 欧美性性性性性色大片免费的| AV在线中出| 自拍视频在线观看首页国产| 国产成人久久精品一区二区三区| 亚洲天堂成人在线| 永久免费看黄在线观看| 艳妇臀荡乳欲伦交换h在线观看| 国产精品视频一区二区三区四| 日本av一区二区播放| 日本女优在线一区二区三区 |