張小暉 郝潔
摘要:本文聚焦和分析了當前河北聯(lián)通大數(shù)據(jù)平臺的信令數(shù)據(jù)挖掘分析模型,為應對日益增多的位置需求,構建了一種基于信令數(shù)據(jù)挖掘分析移動用戶粗定位的模型,該模型對所采集的運營商核心移動網(wǎng)絡中移動用戶的信令數(shù)據(jù)進行處理后,再分別對經(jīng)緯度以及特征數(shù)據(jù)進行提取、分析和挖掘,并將需求數(shù)據(jù)進行篩選分析,進而實現(xiàn)粗定位的分析。本模型基于粗定位信令數(shù)據(jù),為通訊運營商創(chuàng)造新的社會效益和經(jīng)濟價值。
關鍵詞:信令;大數(shù)據(jù);模型;粗定位;ETL
中圖分類號:TP311 文獻標識碼:A 文章編號:1007-9416(2020)03-0097-01
1 方案的主要目標
在移動互聯(lián)網(wǎng)高速普及,大數(shù)據(jù)體系快速發(fā)展的背景下,數(shù)據(jù)資源極速增長。海量級數(shù)據(jù)的積累對通訊運營商提出了巨大的挑戰(zhàn),如何利用大數(shù)據(jù)深挖數(shù)據(jù)價值,如何支撐企業(yè)精細化運營,如何釋放數(shù)據(jù)紅利,已經(jīng)成為運營商的當務之急。在這其中,傳統(tǒng)的數(shù)據(jù)需求已經(jīng)無法滿足當前的業(yè)務需要。同時傳統(tǒng)的分析模型面臨很多問題,如:簡單粗暴沒有實際意義的統(tǒng)計分析數(shù)據(jù),數(shù)據(jù)紅利未能展現(xiàn);數(shù)據(jù)未能支撐精細化運營的條件,粗曠的分析方式無法滿足需求;對數(shù)據(jù)處理過于單一,未能多元化分析,使得數(shù)據(jù)過于片面等等。
本著以數(shù)據(jù)深度挖掘、過程可視化、界面化流程監(jiān)控為建設的宗旨,通過對數(shù)據(jù)管理現(xiàn)狀的調研與問題需求分析,制定合理的數(shù)據(jù)分析方案,主要實現(xiàn)以下改進:首先,全面詳細以實現(xiàn)實際意義的分析挖掘數(shù)據(jù),盡可能展現(xiàn)數(shù)據(jù)紅利;第二實現(xiàn)數(shù)據(jù)的精細細分分析,實現(xiàn)數(shù)據(jù)分析滿足精細化運營需求;第三,通過多元化、特征化等分析方式,使數(shù)據(jù)全面展現(xiàn)實際價值。
2 方案的實踐過程
為解決以上問題,將信令系統(tǒng)與計費系統(tǒng)、客戶資料等B域系統(tǒng)進行關聯(lián),多方位的對數(shù)據(jù)本身進行了多元化的數(shù)據(jù)分析與統(tǒng)計。形成了如旅游大數(shù)據(jù)、職住地數(shù)據(jù)分析等數(shù)據(jù)分析系統(tǒng)。
面對當前新型旅游業(yè)勢下,數(shù)據(jù)存儲能力和觸電采集設備的提升,使得信令數(shù)據(jù)越發(fā)的精細且準確,數(shù)據(jù)量飛躍式增長,大數(shù)據(jù)處理技術的日新月異的改革,使得大數(shù)據(jù)不再只停留在想象和理論的階段了,更成為各行業(yè)產業(yè)結構優(yōu)化提升以及數(shù)據(jù)紅利盡可能展現(xiàn)的催化劑。大數(shù)據(jù)技術基礎的提升和優(yōu)化,使得數(shù)據(jù)應用百花齊放,大數(shù)據(jù)進入加速發(fā)展、飛速提升的時期。以下以旅游大數(shù)據(jù)為例,簡要介述了如何利用當前大數(shù)據(jù)體系,盡可能的展現(xiàn)數(shù)據(jù)紅利的案例。
基于旅游業(yè)始終迫切需要一套相對準確、實時且全面的旅游信息分析系統(tǒng),可以精準把控游客需求,實時掌控旅游業(yè)態(tài)信息。旅游大數(shù)據(jù)應運而生,為旅游業(yè)分析決策、政策規(guī)劃、警示提示、提前避災等提供幫助,為全省旅游景點提供客流量、駐留分析等數(shù)據(jù)分析,為旅游局、酒店、景點等提供來源數(shù)據(jù)與旅游規(guī)劃協(xié)助。系統(tǒng)功能包括全省游客數(shù)據(jù)分析、客源地分析、游客特征分析、駐留時長分析等。
全省游客數(shù)據(jù)分析模塊:主要以信令數(shù)據(jù)為基準,用戶軌跡為輔助,全省基站與信令數(shù)據(jù)匹配所得結果,再經(jīng)過去重、挖掘、分析等,對數(shù)據(jù)圖形化、可視化,對全省實時的游客數(shù)據(jù)與區(qū)域分布等進行直觀的呈現(xiàn)與展示,方便旅游管理部門直觀準確的掌握全省的游客分布與趨勢。
游客客源地分析模塊:主要對游客的來源地進行統(tǒng)計分析,通過信令、基站以及游客資料數(shù)據(jù)匹配所得結果,詳細獲得來自各省的游客數(shù)量、占比等數(shù)據(jù),以便精確掌握來源情況,為旅游管理決策提供依據(jù)。
游客特征分析模塊:主要以游客數(shù)據(jù)、信令數(shù)據(jù)、特定地點、特征數(shù)據(jù)等數(shù)據(jù)為基礎,分析游客的消費能力、交通情況、使用習慣、使用設備、駐留情況、基本信息等,以方便旅游業(yè)進行針對性營銷,方便旅游管理部門進行實時、有效、準確的管理與把控。
游客駐留時長分析模塊:主要以信令數(shù)據(jù)為基礎,分析游客到達以及離開的數(shù)據(jù),通過游客駐留時長以及游客來源等其他數(shù)據(jù),可以充分反映出各地游客相應的旅游習慣等,為旅游管理部門提供決策依據(jù),同時對本地的旅游資源可以提供針對性營銷的方案。
旅游大數(shù)據(jù)系統(tǒng)主要分為數(shù)據(jù)采集層、挖掘分析層、接口層等級別,其中數(shù)據(jù)采集為最底層,主要采集包括B域相關的客戶資料數(shù)據(jù)、消費數(shù)據(jù)等,重點包括如信令數(shù)據(jù)、移網(wǎng)上網(wǎng)行為等數(shù)據(jù)。
數(shù)據(jù)采集存儲層:主要負責架構的數(shù)據(jù)采集以及數(shù)據(jù)交互,通過設備,將信令等數(shù)據(jù)采集過來進行存儲。
數(shù)據(jù)挖掘分析層:本層主要對數(shù)據(jù)進行統(tǒng)一的處理或預處理。對采集到的信令等數(shù)據(jù)進行清洗、入庫、統(tǒng)計、分析。
數(shù)據(jù)接口層:統(tǒng)計分析后的數(shù)據(jù)通過接口層對外提供,可分為小時、日、月、實時等接口,方便數(shù)據(jù)即時按種類的提供。
同時按需求出具旅游大數(shù)據(jù)報告以游客為主要研究對象,以游客需求為主要研究方向,以針對性發(fā)展為主要研究目標,對游客行為偏好、游客畫像、游客消費能力、游客路徑選擇、游客停留天數(shù)、游客交通工具、游客來源地、游客常用APP等進行多維度的分析。以大數(shù)據(jù)的分析反映特點和問題,以此推動整個產業(yè)的良性循環(huán),實現(xiàn)數(shù)據(jù)紅利。旅游大數(shù)據(jù)報告分為年季月度報告、節(jié)假日報告和競品分析報告、特定報告等幾種形式。其中年季月度報告:按年、季、月統(tǒng)計,以統(tǒng)計周期為準,按需分析。節(jié)假日報告:按天統(tǒng)計,以特定的節(jié)假日為統(tǒng)計周期,按需進行分析,包含節(jié)假日和平時的客流量比對等,以及路線偏好等。競品分析報告:按需求,對特殊的需求如城市、區(qū)域和景區(qū)進行對比分析,從客流量、輿情、游客特點等進行比對,幫助實行應對辦法以及變革,促進業(yè)態(tài)的發(fā)展。
3 結語
本系統(tǒng)通過對信令數(shù)據(jù)的分析,為旅游局以及相應景點、管理部門等提供了有效的數(shù)據(jù)支撐。通過數(shù)據(jù),有效的對省內乃至國內市場提供了實時、準確的針對性營銷數(shù)據(jù)基礎。根據(jù)不同的來源、不同的目的地、不同的人群、不同的消費能力等,景區(qū)或者管理部門等可以針對的提供營銷、服務、管理以及宣傳,幫助景區(qū)提升收入,幫助管理者實現(xiàn)有效、方便、快捷的管理。不僅如此,同時在實踐中,我方還實現(xiàn)了如全國數(shù)據(jù)一點集中、信令數(shù)據(jù)清洗、游客模型構建、質心點校驗、柵格化等,以保證數(shù)據(jù)即時、全面、準確、有效。綜上所述,基于信令所做的數(shù)據(jù)分析模型,具有推廣以及實用價值。
Abstract:This paper focuses on and analyzes the current signaling data mining analysis model of Hebei Unicom's big data platform. In order to meet the increasing location demand, a rough location analysis model for mobile users based on signaling data mining is constructed, after processing the signaling data of mobile users in the core mobile network of the operator, the model extracts, analyzes and mines the longitude and latitude data and the characteristic data respectively, and sifts and analyzes the demand data, then the analysis of coarse positioning is realized. This model is based on rough location signaling data to create new social benefits and economic value for communication operators.
Key words:signaling; big data; model; coarse positioning; ETL