【摘要】 隨著信息時代的到來與發(fā)展,特別是互聯(lián)網(wǎng)通訊技術(shù)的發(fā)展,人們從3G時代逐漸向著4G時代發(fā)展。大數(shù)據(jù)就是互聯(lián)網(wǎng)產(chǎn)業(yè)與信息技術(shù)發(fā)展的必然產(chǎn)物,本文就對4G時代數(shù)據(jù)的產(chǎn)生、采集、存儲、分析各個方面進行闡述分析。
【關(guān)鍵詞】 4G時代 大數(shù)據(jù) 分析
一、4G時代數(shù)據(jù)的產(chǎn)生
電信運營商數(shù)據(jù)來源主要包括設(shè)備層、運維層以及用戶層三方面,其中設(shè)備層面向維護,運維層面向管理,而用戶層面向市場。
其中設(shè)備層數(shù)據(jù)具有很強的結(jié)構(gòu)化,包括天線增益、CI、LAC、發(fā)射功率等配置參數(shù),還包括鄰區(qū)電平、主服電平、KPI等網(wǎng)絡(luò)測量信息。運維層數(shù)據(jù)中既有結(jié)構(gòu)化數(shù)據(jù),也有非結(jié)構(gòu)化數(shù)據(jù),以結(jié)構(gòu)化為主。主要包括用戶數(shù)、附著成功率、數(shù)據(jù)堵塞率等性能指標(biāo),以及話務(wù)、流量、網(wǎng)元日志等業(yè)務(wù)統(tǒng)計。用戶層數(shù)據(jù)較為復(fù)雜,包括了結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及半結(jié)構(gòu)數(shù)據(jù)。數(shù)據(jù)內(nèi)容包括用戶職業(yè)、年齡、資費、入網(wǎng)渠道等基本信息;用戶操作系統(tǒng)、品牌、屏幕尺寸等終端信息,以及詳單記錄、上網(wǎng)日志、社交網(wǎng)絡(luò)圈、行為足跡等業(yè)務(wù)使用行為。
二、4G時代數(shù)據(jù)采集
隨著移動互聯(lián)網(wǎng)的普及,傳感器得到了極大的拓展。4G時代背景下,任何物體在理論上都可以作為采集數(shù)據(jù)的載體,并且一個載體還可以具有不同種功能。如在4G時代,人們可以利用手機等攝像設(shè)備完成數(shù)據(jù)信息的收集等等。電信運營商進行數(shù)據(jù)采集的方式主要是DPI數(shù)據(jù)采集器,對指定IP網(wǎng)絡(luò)數(shù)據(jù)進行采集與拆包,提取有用的信息。隨著互聯(lián)網(wǎng)用戶數(shù)量的增多,數(shù)據(jù)采集的方式也不斷增多,還包括了網(wǎng)絡(luò)爬蟲以及日志文件。
在4G時代,數(shù)據(jù)的采集變得越來越方便,數(shù)據(jù)采集的成本也越來越低。大數(shù)據(jù)采集在現(xiàn)代社會無處不在,與人們的生活息息相關(guān),現(xiàn)在很多設(shè)備都可以通過4G網(wǎng)絡(luò)上網(wǎng)或進行信息通信。
從網(wǎng)絡(luò)中采集到的數(shù)據(jù)一般具有異構(gòu)多源的性質(zhì),具有冗余、噪聲、不一致性等特點。對于采集到的數(shù)據(jù),需要進行預(yù)處理,包括數(shù)據(jù)集成、清洗以及冗余消除。其中數(shù)據(jù)清洗主要是為了將重復(fù)、錯誤、不完整的數(shù)據(jù)消除;數(shù)據(jù)集成就是將不同源的數(shù)據(jù)碎片整合成一個統(tǒng)一格式;冗余消除主要是采用數(shù)據(jù)壓縮、冗余檢測、去重等過程,降低數(shù)據(jù)量,節(jié)約數(shù)據(jù)存儲的空間。
三、4G時代大數(shù)據(jù)存儲
電信運營商擁有豐富的數(shù)據(jù)資源,但是也只有將這些數(shù)據(jù)完善的保存,才能真正發(fā)揮其長期運營的優(yōu)勢,同時還能夠挖掘到其他有價值的信息。
4G時代的到來,使得網(wǎng)絡(luò)數(shù)據(jù)量越來越龐大,采用傳統(tǒng)的數(shù)據(jù)倉庫存儲形式很難滿足具體要求。大數(shù)據(jù)的產(chǎn)生不僅增加了數(shù)據(jù)存儲的難度,也增加了數(shù)據(jù)存儲的成本。采用分布式文件保存的方式能夠?qū)崿F(xiàn)對大量數(shù)據(jù)的存儲,但在數(shù)據(jù)實時性處理方面還有一定的局限性,所以需要對系統(tǒng)中大數(shù)據(jù)性能進行分析并實行分類存儲。
隨著科技進步,數(shù)據(jù)存儲技術(shù)不斷更新,源于云計算的虛擬存儲為大數(shù)據(jù)存儲提供了寶貴的意見,中國移動、聯(lián)通、電信相繼推出云計劃、互聯(lián)云以及天翼云,大大緩解了數(shù)據(jù)中心存儲壓力。
四、4G時代大數(shù)據(jù)分析
數(shù)據(jù)分析是大數(shù)據(jù)價值體現(xiàn)的最后一個環(huán)節(jié),同時也是最重要的核心環(huán)節(jié)。電信網(wǎng)絡(luò)運營商利用自身平臺優(yōu)勢,實現(xiàn)了大數(shù)據(jù)分析,對個人用戶以及運營企業(yè)具有較大的影響。
進行大數(shù)據(jù)分析一般分為數(shù)據(jù)可視化、統(tǒng)計、挖掘這三個步驟。其中數(shù)據(jù)可視化指的是借助圖形化技術(shù),將龐大的數(shù)據(jù)表現(xiàn)出來,直觀的看出數(shù)據(jù)的屬性相關(guān)性以及分布特點;統(tǒng)計分析指的是將數(shù)據(jù)按照定量或定性的方式分析,包括推斷統(tǒng)計以及描述統(tǒng)計兩種;數(shù)據(jù)挖掘較為復(fù)雜,是一門復(fù)雜的學(xué)科,涉及到人工智能、統(tǒng)計學(xué)、數(shù)據(jù)庫、機器學(xué)等等,目的在于挖掘數(shù)據(jù)中隱藏的價值。
電信運營商通過將龐大數(shù)據(jù)資源的封裝,將其封裝為服務(wù)提供給用戶,完成了向信息服務(wù)提供商的轉(zhuǎn)變。在進行數(shù)據(jù)分析過程中,不可盲目,應(yīng)該逐層深入。電信級大數(shù)據(jù)應(yīng)用主要體現(xiàn)在客戶價值研究以及區(qū)域價值研究兩個方面。其中區(qū)域價值研究的根本目的是增強運營管理的能力,為企業(yè)戰(zhàn)略管理提供依據(jù);客戶價值研究的主要目的在提高服務(wù)營銷效率,增大客戶的占有率,是客戶獲得更好的體驗。
五、總結(jié)
4G時代的到來,標(biāo)志著人們進入了信息快速發(fā)達的時代,同時這也是信息時代發(fā)展的必然產(chǎn)物。在這一背景下,網(wǎng)絡(luò)互聯(lián)網(wǎng)技術(shù)與信息技術(shù)得到了廣泛的應(yīng)用,產(chǎn)生的數(shù)據(jù)量也不斷的擴大,大數(shù)據(jù)成為了現(xiàn)階段熱門的研究話題之一。對于4G時代的大數(shù)據(jù),只有完善大數(shù)據(jù)體系,做好數(shù)據(jù)采集、運輸、存儲、分析等各個環(huán)節(jié)的工作,才能為電信業(yè)務(wù)創(chuàng)新以及規(guī)模的拓展提供有力條件。
參 考 文 獻
[1]薛文倩,彭木根,梁棟.移動通信網(wǎng)絡(luò)中大數(shù)據(jù)的發(fā)展策略研究[J].通訊技術(shù).2012,15(5):225-226.
[2]楚落.4G時代的到來與大數(shù)據(jù)革命[J].通訊網(wǎng)絡(luò).2012,23(5):78-79.
[3]劉家輝,張鵬遠.4G大數(shù)據(jù)時代對網(wǎng)優(yōu)的挑戰(zhàn)及智慧化平臺研究[J].經(jīng)營管理者.2014,31(15):138-139.