亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Hadoop平臺(tái)的結(jié)算數(shù)據(jù)切片方法及實(shí)現(xiàn)

        2021-11-30 09:36:58梁偉晟
        現(xiàn)代計(jì)算機(jī) 2021年29期
        關(guān)鍵詞:系統(tǒng)

        梁偉晟

        (中國移動(dòng)通信集團(tuán)廣東有限公司,廣州510623)

        0 引言

        渠道費(fèi)用結(jié)算系統(tǒng)實(shí)現(xiàn)對(duì)社會(huì)渠道費(fèi)用的計(jì)算。系統(tǒng)定期從外圍系統(tǒng)(CRM系統(tǒng)、計(jì)費(fèi)賬務(wù)系統(tǒng)、BI、ESOP、物聯(lián)網(wǎng)IOT、和商匯等)采集業(yè)務(wù)辦理及狀態(tài)數(shù)據(jù),對(duì)采集的數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換等操作,然后根據(jù)結(jié)算規(guī)則對(duì)預(yù)處理完成的數(shù)據(jù)進(jìn)行費(fèi)用計(jì)算,生成費(fèi)用結(jié)算報(bào)表。Hadoop是用于海量數(shù)據(jù)存儲(chǔ)和計(jì)算的分布式系統(tǒng)基礎(chǔ)架構(gòu)。Hadoop具有可擴(kuò)展、可伸縮等特性,適用于海量業(yè)務(wù)數(shù)據(jù)預(yù)處理和計(jì)算。渠道費(fèi)用結(jié)算系統(tǒng)引入Hadoop框架,充分利用Hadoop的分布式存儲(chǔ)和計(jì)算能力,實(shí)現(xiàn)彈性伸縮,提高數(shù)據(jù)預(yù)處理的性能。在預(yù)處理過程中,由于海量數(shù)據(jù)以離散數(shù)據(jù)表的形式流轉(zhuǎn),依賴于平臺(tái)數(shù)據(jù)處理性能,對(duì)資源消耗較大,影響預(yù)處理效率。為此,采用一種結(jié)算數(shù)據(jù)切片處理技術(shù)將無狀態(tài)的離散數(shù)據(jù)按照一定數(shù)據(jù)特征規(guī)則進(jìn)行結(jié)構(gòu)化解析處理,以提高數(shù)據(jù)運(yùn)算的效率。

        1 系統(tǒng)設(shè)計(jì)

        渠道費(fèi)用結(jié)算系統(tǒng)基于Hadoop平臺(tái)采集數(shù)據(jù)源,并做初步過濾預(yù)處理,再將初步預(yù)處理的數(shù)據(jù)按照結(jié)算規(guī)則生成計(jì)算所需的結(jié)構(gòu)化數(shù)據(jù)。

        圖1 數(shù)據(jù)預(yù)處理

        在預(yù)處理過程中,大量的數(shù)據(jù)是以離散數(shù)據(jù)表的形式被處理,沒有根據(jù)數(shù)據(jù)特征歸類處理,對(duì)資源消耗較大,處理性能依賴于平臺(tái)處理能力。同時(shí)也無法進(jìn)行動(dòng)態(tài)擴(kuò)展集群化數(shù)據(jù)處理,可能導(dǎo)致負(fù)載不均衡。

        圖2 離散數(shù)據(jù)流轉(zhuǎn)

        為解決處理性能和負(fù)載均衡問題,采用一種將結(jié)算數(shù)據(jù)切片處理的方法將無狀態(tài)的離散數(shù)據(jù)按照一定數(shù)據(jù)特征規(guī)則進(jìn)行結(jié)構(gòu)化解析處理,將數(shù)據(jù)分割至各個(gè)redis內(nèi)存數(shù)據(jù)庫進(jìn)行計(jì)算,提高數(shù)據(jù)運(yùn)算的效率,實(shí)現(xiàn)資源負(fù)載的均衡。

        1.1 功能流程圖

        (1)源數(shù)據(jù)采集。通過Hadoop平臺(tái)采集用戶訂單、產(chǎn)品、計(jì)費(fèi)等信息。

        (2)數(shù)據(jù)歸類處理。針對(duì)采集的數(shù)據(jù)按照業(yè)務(wù)數(shù)據(jù)對(duì)象特征進(jìn)行歸類,歸類后得到結(jié)構(gòu)化的數(shù)據(jù)用于切片。

        (3)數(shù)據(jù)切片。提供數(shù)據(jù)切片模型設(shè)置,根據(jù)數(shù)據(jù)對(duì)象歸類信息進(jìn)行數(shù)據(jù)分割,將數(shù)據(jù)均衡分類分割至redis預(yù)處理邏輯集群。

        (4)數(shù)據(jù)處理集群。數(shù)據(jù)邏輯處理單元,集群可根據(jù)數(shù)據(jù)切片模型切片結(jié)果并行處理以及集群數(shù)量自動(dòng)伸縮。

        1.2 數(shù)據(jù)切片方法

        (1)數(shù)據(jù)歸類。費(fèi)用結(jié)算涉及的業(yè)務(wù)數(shù)據(jù)主要以用戶資料、產(chǎn)品數(shù)據(jù)、訂單數(shù)據(jù)為主。數(shù)據(jù)歸類模塊提供通用配置能力,將結(jié)算政策碼以及所需的數(shù)據(jù)對(duì)象進(jìn)行配置。根據(jù)配置信息,業(yè)務(wù)數(shù)據(jù)以結(jié)算政策碼為特征進(jìn)行聚合歸類,生成包含結(jié)算政策碼、用戶資料、產(chǎn)品數(shù)據(jù)、訂單數(shù)據(jù)等信息的數(shù)據(jù)對(duì)象,得到結(jié)構(gòu)化的數(shù)據(jù)(U1,U2,U3,U4…Ut)T。對(duì)結(jié)構(gòu)化的數(shù)據(jù)打上標(biāo)簽Y,封裝形成n個(gè)切片標(biāo)簽(U1,U2,U3,U4…Ut|Y)T。

        (2)業(yè)務(wù)數(shù)據(jù)切片。依照結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)記錄數(shù)維度,對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行排序,并標(biāo)記切片標(biāo)簽(U)的邊緣切片標(biāo)簽,即標(biāo)簽最大值和最小值(Ymax,Ymin)。按照切片標(biāo)簽值Y進(jìn)行分類得到切片數(shù)據(jù):

        (3)切片數(shù)據(jù)隊(duì)列生成。以切片標(biāo)簽匹配所有業(yè)務(wù)數(shù)據(jù),按照redis節(jié)點(diǎn)數(shù)量m和切片標(biāo)簽數(shù)量n進(jìn)行數(shù)據(jù)拼接,然后通過邊緣標(biāo)簽最大值(Ymax)和最小值(Ymin)作為一組隊(duì)列進(jìn)行切分,總計(jì)可得到個(gè)隊(duì)列。具體如下:

        將分割好的數(shù)據(jù)量均衡的隊(duì)列根據(jù)redis實(shí)時(shí)負(fù)載情況分配至各redis節(jié)點(diǎn)進(jìn)行業(yè)務(wù)邏輯處理。每一個(gè)的結(jié)算數(shù)據(jù)對(duì)象經(jīng)過切片可分配至單獨(dú)的業(yè)務(wù)邏輯處理單元集群。

        1.3 實(shí)施效果

        通過在預(yù)J處理過程中將結(jié)算數(shù)據(jù)切片處理,所有離散數(shù)據(jù)與渠道費(fèi)用政策在預(yù)處理階段就關(guān)聯(lián)起來,生成結(jié)構(gòu)化對(duì)象數(shù)據(jù)。同時(shí)通過對(duì)數(shù)據(jù)對(duì)象進(jìn)行切片,實(shí)現(xiàn)數(shù)據(jù)的集群化處理,有效利用集群自動(dòng)彈性伸縮。通過此方案的實(shí)施,渠道費(fèi)用結(jié)算數(shù)據(jù)預(yù)處理效率提升87%以上。

        2 結(jié)語

        本文給出了基于Hadoop框架的結(jié)算數(shù)據(jù)切片方法和實(shí)現(xiàn),以此解決海量離散數(shù)據(jù)的預(yù)處理對(duì)資源消耗較大,影響了預(yù)處理效率。在Hadoop處理大數(shù)據(jù)優(yōu)勢(shì)的基礎(chǔ)上,將源數(shù)據(jù)采集得到的離散數(shù)據(jù)結(jié)構(gòu)化,通過數(shù)據(jù)切片方案適配具備一定關(guān)聯(lián)性的離散數(shù)據(jù),數(shù)據(jù)分割切片后再分配到redis集群化均衡負(fù)載處理。實(shí)際系統(tǒng)建設(shè)表明,經(jīng)過改造后,數(shù)據(jù)預(yù)處理效率得到較大提升。

        猜你喜歡
        系統(tǒng)
        Smartflower POP 一體式光伏系統(tǒng)
        WJ-700無人機(jī)系統(tǒng)
        ZC系列無人機(jī)遙感系統(tǒng)
        基于PowerPC+FPGA顯示系統(tǒng)
        基于UG的發(fā)射箱自動(dòng)化虛擬裝配系統(tǒng)開發(fā)
        半沸制皂系統(tǒng)(下)
        FAO系統(tǒng)特有功能分析及互聯(lián)互通探討
        連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
        一德系統(tǒng) 德行天下
        PLC在多段調(diào)速系統(tǒng)中的應(yīng)用
        亚洲欧美日韩国产一区二区精品 | 欧美性受xxxx白人性爽| 女人与牲口性恔配视频免费| 国产一区二区三区免费在线视频 | 亚洲成人观看| 国产美女主播福利一区| 亚洲一区二区在线观看免费视频| 免费a级毛片无码免费视频120软件 | 无套内射在线无码播放| 欧美精品videossex少妇| 囯产精品无码va一区二区| 一区二区三区少妇熟女高潮| 亚洲国产精品亚洲一区二区三区 | 精品亚洲一区二区99| 强开小婷嫩苞又嫩又紧视频| 亚洲小说区图片区另类春色| 无夜精品久久久久久| av一区二区三区有码| 久久天堂av综合合色| 亚洲综合精品成人| 囯产精品无码一区二区三区AV| 高清国产亚洲精品自在久久| 97精品人人妻人人| 初尝黑人嗷嗷叫中文字幕| 亚洲色图在线视频免费观看 | 日本女优中文字幕在线观看| 国产香蕉一区二区三区在线视频| 亚洲熟女乱色综合亚洲av| 国产精品亚洲А∨天堂免下载| 淫秽在线中国国产视频| 伦伦影院午夜理论片| 亚洲欧洲无码av不卡在线 | 亚洲av自偷自拍亚洲一区| 色偷偷色噜噜狠狠网站30根| 猫咪免费人成网站在线观看| 曰本亚洲欧洲色a在线| 美女主播福利一区二区| 欧美成人免费全部| 国产目拍亚洲精品一区二区| 国产中文色婷婷久久久精品| 国内精品人妻无码久久久影院|