亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)生命周期的DW大數(shù)據(jù)量處理方式

        2014-07-03 10:54:43張明治
        電腦知識(shí)與技術(shù) 2014年4期
        關(guān)鍵詞:分區(qū)

        張明治

        摘要:通過數(shù)據(jù)生命周期、數(shù)據(jù)分段處理的方式以低成本的方式解決數(shù)據(jù)倉庫中大數(shù)據(jù)量的性能優(yōu)化和存儲(chǔ)優(yōu)化的問題。

        關(guān)鍵詞:DW;數(shù)據(jù)生命周期;分區(qū);數(shù)據(jù)抽取;存儲(chǔ)架構(gòu)

        中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)04-0685-02

        1 背景描述

        伴隨隨著DW系統(tǒng)的持續(xù)運(yùn)行,業(yè)務(wù)數(shù)據(jù)量不斷的增長。其中大表數(shù)據(jù)以億數(shù)據(jù)量級(jí)別為存儲(chǔ),并且每天以百萬的速度增長,歷史數(shù)據(jù)隨之也不斷的積壓。隨著數(shù)據(jù)的不斷增長,數(shù)據(jù)量不斷增多的同時(shí)導(dǎo)致了DW抽取、查詢、分析等應(yīng)用性能下降。

        1.1 對(duì)數(shù)據(jù)抽取的影響

        在ETL抽取過程中,基本絕大多數(shù)情況我們都會(huì)使用時(shí)間戳增量抽取的方式,通過update/insert的方式對(duì)目標(biāo)數(shù)據(jù)進(jìn)行加載。但這個(gè)過程中如果目標(biāo)數(shù)據(jù)不斷地增多時(shí)會(huì)嚴(yán)重的影響效率。隨著單次執(zhí)行時(shí)間的提高,對(duì)數(shù)據(jù)抽取的頻率也會(huì)發(fā)生影響。數(shù)據(jù)的整合效率和時(shí)效性的降低,對(duì)最終DW中數(shù)據(jù)的時(shí)效性產(chǎn)生嚴(yán)重的影響。

        1.2 對(duì)數(shù)據(jù)使用的影響

        如果目標(biāo)數(shù)據(jù)在抽取過程中,隨著數(shù)據(jù)庫中鎖的產(chǎn)生和內(nèi)存的消耗,對(duì)查詢的效率也存在影響。隨著數(shù)據(jù)量的增多,對(duì)數(shù)據(jù)的全表掃描時(shí)也會(huì)產(chǎn)生效率的降低和時(shí)間的增長。

        2 方案設(shè)計(jì)

        2.1 需求分析

        根據(jù)以上對(duì)數(shù)據(jù)抽取和數(shù)據(jù)使用的分析,我們要從兩方面著手,一方面解決數(shù)據(jù)加載時(shí)目標(biāo)表過大的問題。另一方面解決數(shù)據(jù)使用時(shí)全表掃描的問題。

        1)數(shù)據(jù)加載

        在數(shù)據(jù)加載時(shí),通過二次抽取的方式來減小數(shù)據(jù)目標(biāo)表匯集的過程,來實(shí)現(xiàn)增量數(shù)據(jù)業(yè)務(wù)的實(shí)時(shí)性要求。

        2)全表掃描

        通過數(shù)據(jù)的生命周期確認(rèn),將數(shù)據(jù)按照生命周期方式進(jìn)行存儲(chǔ)。將生命周期內(nèi)的數(shù)據(jù)存放在快捷的存儲(chǔ)中,使其的使用效率得到大幅的提升,其實(shí)我們發(fā)現(xiàn)業(yè)務(wù)操作中的80%都只會(huì)用到生命周期內(nèi)的數(shù)據(jù)。

        經(jīng)過數(shù)據(jù)的有效分析,根據(jù)數(shù)據(jù)生命周期理論,很多數(shù)據(jù)都不在數(shù)據(jù)生命周期范圍內(nèi),這些數(shù)據(jù)通過靈活的處理完全可達(dá)到全覆蓋和對(duì)性能影響最小的程度。我們結(jié)合數(shù)據(jù)生命周期的理論、數(shù)據(jù)抽取技術(shù)和分區(qū)技術(shù)的整合將數(shù)據(jù)生命周期以外的數(shù)據(jù)對(duì)性能的影響降到最低。

        2.2處理流程

        2.2.1 存儲(chǔ)架構(gòu)

        基于業(yè)務(wù)需求,將通過當(dāng)日數(shù)據(jù)表、近三個(gè)月熱點(diǎn)表、歷史數(shù)據(jù)表共計(jì)12張表來存放生命周期內(nèi)的業(yè)務(wù)數(shù)據(jù)。具體設(shè)計(jì)如圖1。

        數(shù)據(jù)在DW中的存儲(chǔ)流向主要分為以下幾個(gè)步驟:

        1)增量抽取的時(shí)候使用兩張實(shí)體表交替存儲(chǔ)當(dāng)天數(shù)據(jù)

        2)每天結(jié)束后根據(jù)不同的業(yè)務(wù)時(shí)間將日表數(shù)據(jù)分別插入到相應(yīng)的分區(qū)表中。當(dāng)插入結(jié)束后,清除上一日保存記錄的數(shù)據(jù)表

        3)每月初根據(jù)業(yè)務(wù)時(shí)間范圍將三個(gè)月前熱點(diǎn)表數(shù)據(jù)記錄遷移至歷史記錄表中,同時(shí)刪除三個(gè)月前的分區(qū)表。

        2.2.2 分區(qū)規(guī)則

        為了快速的定位到數(shù)據(jù)的存儲(chǔ),不同的分區(qū)表按照不同的分區(qū)標(biāo)準(zhǔn)。分別如下:

        1)歷史表:按照業(yè)務(wù)發(fā)生時(shí)間的年月(YYYYMM)列表分區(qū)。

        2)熱點(diǎn)表:按照業(yè)務(wù)發(fā)生時(shí)間的日期(DD)列表分區(qū)。

        3)日 表:僅存當(dāng)日數(shù)據(jù)不做分區(qū)處理。

        4)全局視圖:存放所有數(shù)據(jù)的全局視圖,將所有數(shù)據(jù)通過視圖的方式將其串聯(lián)在一起。

        3 總結(jié)

        本文通過這種存儲(chǔ)方式的改變,我們?cè)谑褂脮r(shí)訪問特定生命周期內(nèi)的數(shù)據(jù)可以指定特定的表和特定的區(qū)域這樣大大的增加訪問的效率。通過二次的抽取整合和分段的存儲(chǔ)可以大大增加數(shù)據(jù)抽取的性能和數(shù)據(jù)訪問的性能。通過數(shù)據(jù)生命周期的方式過濾掉冗余性能的消耗來增加數(shù)據(jù)的實(shí)時(shí)可用性,是DW中大數(shù)據(jù)量處理的一個(gè)低成本和便捷的方式。

        參考文獻(xiàn):

        [1] 王艷云,邊根慶,王瑞龍.數(shù)據(jù)遷移算法研究[J].電腦知識(shí)與技術(shù),2012(5).

        [2] 盛憲鋒,孫健英,焦文彬.基于數(shù)據(jù)生命周期管理的ARP系統(tǒng)優(yōu)化設(shè)計(jì)[J].計(jì)算機(jī)工程與科學(xué),2011(11).

        [3] 吳品才.論信息生命周期與信息管理周期——兼論信息運(yùn)動(dòng)階段與信息管理階段[J].檔案學(xué)通訊,2004(4).

        猜你喜歡
        分區(qū)
        上海實(shí)施“分區(qū)封控”
        “三線一單”生態(tài)環(huán)境分區(qū)管控體系建設(shè)回顧與展望
        浪莎 分區(qū)而治
        大空間建筑防火分區(qū)設(shè)計(jì)的探討
        人間(2015年11期)2016-01-09 13:13:00
        AP1000核島廠房防火分區(qū)設(shè)計(jì)
        基于SAGA聚類分析的無功電壓控制分區(qū)
        基于多種群遺傳改進(jìn)FCM的無功/電壓控制分區(qū)
        VTS“分區(qū)-分時(shí)-分類-定責(zé)”管理模式分析
        分區(qū)魔術(shù)師PartitionMagic的妙用
        電子世界(2012年8期)2012-07-12 07:05:54
        天津市控制地面沉降分區(qū)管理模式研究
        亚洲五月天综合| 成年人干逼视频水好多| 日韩欧美在线综合网另类| 黑人巨大av在线播放无码| 99久久久精品免费香蕉| 人妻风韵犹存av中文字幕| 国产亚洲成年网址在线观看| 亚洲av资源网站手机在线| 内射人妻无套中出无码| 97伦伦午夜电影理伦片| 日本少妇被爽到高潮的免费| 亚洲成在人网站天堂日本| 亚洲综合国产成人丁香五月激情| 免费a级毛片永久免费| 婷婷第四色| 亚洲av色精品国产一区二区三区| 亚洲国产精品无码久久一区二区| 欧美jizzhd精品欧美| 在线看片国产免费不卡| 国产黄片一区二区三区| 国产欧美精品一区二区三区四区| 精品国产乱码久久久久久口爆网站| 亚州五十路伊人网| 国产精品亚洲一区二区麻豆| 久久久久国产综合av天堂| 亚洲地址一地址二地址三| 国产精品一区二区久久精品蜜臀| 黄片小视频免费观看完整版| 熟女无套内射线观56| 无码av在线a∨天堂毛片| 国产av三级精品车模| 亚洲av永久无码天堂网| 亚洲av色先锋资源电影网站| 亚洲国产精品免费一区| 日本精品视频二区三区| 欧美怡红院免费全部视频| 尤物无码一区| 日本一区二区高清精品| 狠狠躁天天躁中文字幕| 精品无码AⅤ片| 伊人久久大香线蕉av色婷婷|