亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)生命周期的DW大數(shù)據(jù)量處理方式

        2014-07-03 10:54:43張明治
        電腦知識(shí)與技術(shù) 2014年4期
        關(guān)鍵詞:分區(qū)

        張明治

        摘要:通過數(shù)據(jù)生命周期、數(shù)據(jù)分段處理的方式以低成本的方式解決數(shù)據(jù)倉庫中大數(shù)據(jù)量的性能優(yōu)化和存儲(chǔ)優(yōu)化的問題。

        關(guān)鍵詞:DW;數(shù)據(jù)生命周期;分區(qū);數(shù)據(jù)抽取;存儲(chǔ)架構(gòu)

        中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)04-0685-02

        1 背景描述

        伴隨隨著DW系統(tǒng)的持續(xù)運(yùn)行,業(yè)務(wù)數(shù)據(jù)量不斷的增長。其中大表數(shù)據(jù)以億數(shù)據(jù)量級(jí)別為存儲(chǔ),并且每天以百萬的速度增長,歷史數(shù)據(jù)隨之也不斷的積壓。隨著數(shù)據(jù)的不斷增長,數(shù)據(jù)量不斷增多的同時(shí)導(dǎo)致了DW抽取、查詢、分析等應(yīng)用性能下降。

        1.1 對(duì)數(shù)據(jù)抽取的影響

        在ETL抽取過程中,基本絕大多數(shù)情況我們都會(huì)使用時(shí)間戳增量抽取的方式,通過update/insert的方式對(duì)目標(biāo)數(shù)據(jù)進(jìn)行加載。但這個(gè)過程中如果目標(biāo)數(shù)據(jù)不斷地增多時(shí)會(huì)嚴(yán)重的影響效率。隨著單次執(zhí)行時(shí)間的提高,對(duì)數(shù)據(jù)抽取的頻率也會(huì)發(fā)生影響。數(shù)據(jù)的整合效率和時(shí)效性的降低,對(duì)最終DW中數(shù)據(jù)的時(shí)效性產(chǎn)生嚴(yán)重的影響。

        1.2 對(duì)數(shù)據(jù)使用的影響

        如果目標(biāo)數(shù)據(jù)在抽取過程中,隨著數(shù)據(jù)庫中鎖的產(chǎn)生和內(nèi)存的消耗,對(duì)查詢的效率也存在影響。隨著數(shù)據(jù)量的增多,對(duì)數(shù)據(jù)的全表掃描時(shí)也會(huì)產(chǎn)生效率的降低和時(shí)間的增長。

        2 方案設(shè)計(jì)

        2.1 需求分析

        根據(jù)以上對(duì)數(shù)據(jù)抽取和數(shù)據(jù)使用的分析,我們要從兩方面著手,一方面解決數(shù)據(jù)加載時(shí)目標(biāo)表過大的問題。另一方面解決數(shù)據(jù)使用時(shí)全表掃描的問題。

        1)數(shù)據(jù)加載

        在數(shù)據(jù)加載時(shí),通過二次抽取的方式來減小數(shù)據(jù)目標(biāo)表匯集的過程,來實(shí)現(xiàn)增量數(shù)據(jù)業(yè)務(wù)的實(shí)時(shí)性要求。

        2)全表掃描

        通過數(shù)據(jù)的生命周期確認(rèn),將數(shù)據(jù)按照生命周期方式進(jìn)行存儲(chǔ)。將生命周期內(nèi)的數(shù)據(jù)存放在快捷的存儲(chǔ)中,使其的使用效率得到大幅的提升,其實(shí)我們發(fā)現(xiàn)業(yè)務(wù)操作中的80%都只會(huì)用到生命周期內(nèi)的數(shù)據(jù)。

        經(jīng)過數(shù)據(jù)的有效分析,根據(jù)數(shù)據(jù)生命周期理論,很多數(shù)據(jù)都不在數(shù)據(jù)生命周期范圍內(nèi),這些數(shù)據(jù)通過靈活的處理完全可達(dá)到全覆蓋和對(duì)性能影響最小的程度。我們結(jié)合數(shù)據(jù)生命周期的理論、數(shù)據(jù)抽取技術(shù)和分區(qū)技術(shù)的整合將數(shù)據(jù)生命周期以外的數(shù)據(jù)對(duì)性能的影響降到最低。

        2.2處理流程

        2.2.1 存儲(chǔ)架構(gòu)

        基于業(yè)務(wù)需求,將通過當(dāng)日數(shù)據(jù)表、近三個(gè)月熱點(diǎn)表、歷史數(shù)據(jù)表共計(jì)12張表來存放生命周期內(nèi)的業(yè)務(wù)數(shù)據(jù)。具體設(shè)計(jì)如圖1。

        數(shù)據(jù)在DW中的存儲(chǔ)流向主要分為以下幾個(gè)步驟:

        1)增量抽取的時(shí)候使用兩張實(shí)體表交替存儲(chǔ)當(dāng)天數(shù)據(jù)

        2)每天結(jié)束后根據(jù)不同的業(yè)務(wù)時(shí)間將日表數(shù)據(jù)分別插入到相應(yīng)的分區(qū)表中。當(dāng)插入結(jié)束后,清除上一日保存記錄的數(shù)據(jù)表

        3)每月初根據(jù)業(yè)務(wù)時(shí)間范圍將三個(gè)月前熱點(diǎn)表數(shù)據(jù)記錄遷移至歷史記錄表中,同時(shí)刪除三個(gè)月前的分區(qū)表。

        2.2.2 分區(qū)規(guī)則

        為了快速的定位到數(shù)據(jù)的存儲(chǔ),不同的分區(qū)表按照不同的分區(qū)標(biāo)準(zhǔn)。分別如下:

        1)歷史表:按照業(yè)務(wù)發(fā)生時(shí)間的年月(YYYYMM)列表分區(qū)。

        2)熱點(diǎn)表:按照業(yè)務(wù)發(fā)生時(shí)間的日期(DD)列表分區(qū)。

        3)日 表:僅存當(dāng)日數(shù)據(jù)不做分區(qū)處理。

        4)全局視圖:存放所有數(shù)據(jù)的全局視圖,將所有數(shù)據(jù)通過視圖的方式將其串聯(lián)在一起。

        3 總結(jié)

        本文通過這種存儲(chǔ)方式的改變,我們?cè)谑褂脮r(shí)訪問特定生命周期內(nèi)的數(shù)據(jù)可以指定特定的表和特定的區(qū)域這樣大大的增加訪問的效率。通過二次的抽取整合和分段的存儲(chǔ)可以大大增加數(shù)據(jù)抽取的性能和數(shù)據(jù)訪問的性能。通過數(shù)據(jù)生命周期的方式過濾掉冗余性能的消耗來增加數(shù)據(jù)的實(shí)時(shí)可用性,是DW中大數(shù)據(jù)量處理的一個(gè)低成本和便捷的方式。

        參考文獻(xiàn):

        [1] 王艷云,邊根慶,王瑞龍.數(shù)據(jù)遷移算法研究[J].電腦知識(shí)與技術(shù),2012(5).

        [2] 盛憲鋒,孫健英,焦文彬.基于數(shù)據(jù)生命周期管理的ARP系統(tǒng)優(yōu)化設(shè)計(jì)[J].計(jì)算機(jī)工程與科學(xué),2011(11).

        [3] 吳品才.論信息生命周期與信息管理周期——兼論信息運(yùn)動(dòng)階段與信息管理階段[J].檔案學(xué)通訊,2004(4).

        猜你喜歡
        分區(qū)
        上海實(shí)施“分區(qū)封控”
        “三線一單”生態(tài)環(huán)境分區(qū)管控體系建設(shè)回顧與展望
        浪莎 分區(qū)而治
        大空間建筑防火分區(qū)設(shè)計(jì)的探討
        人間(2015年11期)2016-01-09 13:13:00
        AP1000核島廠房防火分區(qū)設(shè)計(jì)
        基于SAGA聚類分析的無功電壓控制分區(qū)
        基于多種群遺傳改進(jìn)FCM的無功/電壓控制分區(qū)
        VTS“分區(qū)-分時(shí)-分類-定責(zé)”管理模式分析
        分區(qū)魔術(shù)師PartitionMagic的妙用
        電子世界(2012年8期)2012-07-12 07:05:54
        天津市控制地面沉降分區(qū)管理模式研究
        色播在线永久免费视频网站| 国产丝袜美腿在线视频| 在线视频色系中文字幕| 少妇内射兰兰久久| 性色av浪潮av色欲av| 日韩A∨精品久久久久| 91精品久久久久含羞草| 一区二区三区在线观看视频免费 | 日本按摩偷拍在线观看| 国产a√无码专区亚洲av| 欧美日韩一区二区三区在线观看视频| 国产精品毛片完整版视频| 日本丰满人妻xxxxxhd| 色综合久久加勒比高清88| 99久久免费中文字幕精品| 亚洲国产精品久久又爽av| 免费观看成人欧美www色| 久久精品无码av| 无码少妇一区二区三区 | 婷婷五月婷婷五月| 日本一区二区不卡视频| 国产资源在线视频| 五月激情狠狠开心五月| 亚洲人妻御姐中文字幕| 精品亚洲成a人在线观看| 无码人妻一区二区三区在线| 黄桃av无码免费一区二区三区| 久久久久久人妻毛片a片| h国产视频| 国产一区二区高清不卡在线| 美丽小蜜桃1一3在线观看| 日韩av午夜在线观看| 欧美国产日韩a在线视频| 国产一区二区精品网站看黄| 国产成人精品日本亚洲i8| 国产无套粉嫩白浆在线| 久热在线播放中文字幕| 亚洲国产成人精品激情| 国产高潮迭起久久av| 亚洲精品v欧洲精品v日韩精品| 亚洲欧洲日产国码高潮αv|