亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種改進(jìn)的文件級(jí)持續(xù)數(shù)據(jù)保護(hù)機(jī)制

        2014-07-27 06:20:00馮美祿胡樂(lè)燕
        創(chuàng)新科技 2014年20期
        關(guān)鍵詞:機(jī)制

        馮美祿 胡樂(lè)燕

        (1.河南省教育技術(shù)裝備管理中心,河南 鄭州 450004;2.河南省財(cái)政廳干部教育中心,河南,鄭州 450004)

        一種改進(jìn)的文件級(jí)持續(xù)數(shù)據(jù)保護(hù)機(jī)制

        馮美祿1胡樂(lè)燕2

        (1.河南省教育技術(shù)裝備管理中心,河南 鄭州 450004;2.河南省財(cái)政廳干部教育中心,河南,鄭州 450004)

        信息技術(shù)的廣泛應(yīng)用使得數(shù)據(jù)在信息系統(tǒng)中發(fā)揮的作用日益顯現(xiàn),數(shù)據(jù)的丟失或損壞對(duì)整個(gè)系統(tǒng)造成的損失難以估量。本文充分分析了當(dāng)前持續(xù)數(shù)據(jù)保護(hù)技術(shù)的現(xiàn)狀,立足現(xiàn)有的TRAP-4持續(xù)數(shù)據(jù)保護(hù)思想,提出了一種改進(jìn)的文件級(jí)持續(xù)數(shù)據(jù)保護(hù)機(jī)制。在虛擬層改進(jìn)了日志生成方式,減輕了系統(tǒng)工作負(fù)載,縮短了數(shù)據(jù)備份與恢復(fù)時(shí)間,增強(qiáng)了系統(tǒng)對(duì)于核心數(shù)據(jù)的持續(xù)全備份能力。

        持續(xù)數(shù)據(jù)保護(hù);F-CDP;日志;TRAP

        隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展和網(wǎng)絡(luò)的廣泛普及,社會(huì)信息數(shù)據(jù)進(jìn)入了快速膨脹的時(shí)代,人類(lèi)的學(xué)習(xí)、工作和生活對(duì)數(shù)據(jù)的依賴(lài)程度越來(lái)越高,數(shù)據(jù)丟失或損壞將會(huì)嚴(yán)重影響企事業(yè)單位的生存和發(fā)展。持續(xù)數(shù)據(jù)保護(hù)(CDP)通過(guò)實(shí)時(shí)記錄數(shù)據(jù)的改變,使得災(zāi)難發(fā)生后能夠?qū)?shù)據(jù)恢復(fù)到任意時(shí)間點(diǎn)。對(duì)于一些特殊的部門(mén)如銀行、證券、電信等,由于其特殊的數(shù)據(jù)存在形式(以個(gè)人賬戶為基本單位),單個(gè)賬戶數(shù)據(jù)的備份可能涉及多個(gè)數(shù)據(jù)塊,單個(gè)數(shù)據(jù)塊中也可能含有多個(gè)賬戶數(shù)據(jù)。眾所周知,賬戶數(shù)據(jù)中的信息有相當(dāng)一部分是固定的,進(jìn)行持續(xù)數(shù)據(jù)備份時(shí),無(wú)論是以文件為單位還是以塊為單位,都會(huì)存在大量的重復(fù)數(shù)據(jù),極大的浪費(fèi)了存儲(chǔ)空間,本文立足于TRAP-4機(jī)制的數(shù)據(jù)保護(hù)思想,以賬戶數(shù)據(jù)為基本的數(shù)據(jù)保護(hù)單位,在邏輯層進(jìn)行增量數(shù)據(jù)的備份,提出了改進(jìn)的文件級(jí)持續(xù)數(shù)據(jù)保護(hù)技術(shù)(F-CDP)。

        1 研究現(xiàn)狀

        1.1 TRAP-4機(jī)制

        美國(guó)羅德島大學(xué)楊慶教授提出的TRAP-4技術(shù)的工作原理[1]如下:設(shè)某數(shù)據(jù)塊B(x)的原始數(shù)據(jù)為D(0),應(yīng)用程序在時(shí)刻T(m)對(duì)數(shù)據(jù)D(m-1)有一次寫(xiě)操作,得到的新數(shù)據(jù)為D(m),則該時(shí)刻前后數(shù)據(jù)的異或校驗(yàn)值為P(m)= D(m-1)⊕D(m),并記錄時(shí)間戳為T(mén)(m)。TRAP-4按時(shí)間戳順序保存這些寫(xiě)操作時(shí)間點(diǎn)的校驗(yàn)值,形成一個(gè)日志鏈{B(x),P(m)、P(m-1)、……、P(0),D(0)}。當(dāng)數(shù)據(jù)塊B(x)需要將數(shù)據(jù)恢復(fù)到T(m)以前的某個(gè)時(shí)間節(jié)點(diǎn)T(k)時(shí),只需在日志鏈中讀取相應(yīng)的校驗(yàn)值,依次執(zhí)行下面的公式[3]計(jì)算就可完成數(shù)據(jù)恢復(fù):

        通過(guò)T(k)時(shí)刻的數(shù)據(jù)恢復(fù)到T(m)時(shí)刻計(jì)算公式類(lèi)似,如下:

        TRAP-4的優(yōu)點(diǎn)是通過(guò)數(shù)據(jù)的異或值來(lái)記錄寫(xiě)操作,根據(jù)日志鏈可以將數(shù)據(jù)恢復(fù)到任意寫(xiě)操作時(shí)間點(diǎn),實(shí)現(xiàn)方式比較簡(jiǎn)便;改進(jìn)的TRAP-4機(jī)制[2]定期在日志鏈中插入對(duì)應(yīng)時(shí)間點(diǎn)的快照數(shù)據(jù),{B(x),P(m)、P(m-1)、……P(n+1)、D(n)、P(n-1)、……、P(1)、P(0),D(0)},有效解決了日志鏈的長(zhǎng)時(shí)間失效風(fēng)險(xiǎn),提高了機(jī)制的安全性,但是還存在以下幾個(gè)方面的問(wèn)題:

        1.1.1 寫(xiě)操作經(jīng)常是針對(duì)某個(gè)文件或者某項(xiàng)數(shù)據(jù),而文件或數(shù)據(jù)往往存放在許多物理上各自分離的磁盤(pán)或數(shù)據(jù)塊上,大量數(shù)據(jù)塊的調(diào)度增加了系統(tǒng)的工作負(fù)擔(dān),多處數(shù)據(jù)塊改動(dòng)在數(shù)據(jù)恢復(fù)時(shí)效率低下。

        1.1.2 數(shù)據(jù)備份與恢復(fù)時(shí)的異或運(yùn)算占用了大量的系統(tǒng)資源,降低了系統(tǒng)的服務(wù)效能。

        1.1.3 改進(jìn)的TRAP-4機(jī)制雖然解決了日志鏈的失效問(wèn)題,但是,定期進(jìn)行數(shù)據(jù)全備份數(shù)據(jù)需要大量的存儲(chǔ)空間,并且缺少針對(duì)重要文件或者核心數(shù)據(jù)進(jìn)行保護(hù)的策略。

        1.2文件級(jí)CDP思想

        基于文件的CDP機(jī)制是針對(duì)特定的重要文件或數(shù)據(jù)提出的,如銀行賬戶信息、公安部人口資料、軍事作戰(zhàn)地圖、導(dǎo)航數(shù)據(jù)等,這類(lèi)文件的共同特點(diǎn):數(shù)據(jù)價(jià)值高、數(shù)據(jù)更改范圍有限、每次改變都要求進(jìn)行數(shù)據(jù)全備份、實(shí)時(shí)性要求高。文件數(shù)據(jù)由一個(gè)或多個(gè)數(shù)據(jù)塊組成,由于應(yīng)用需求,文件中的部分?jǐn)?shù)據(jù)會(huì)經(jīng)常變動(dòng)。僅僅對(duì)其改變的數(shù)據(jù)塊進(jìn)行備份,恢復(fù)數(shù)據(jù)時(shí)首先通過(guò)塊恢復(fù),然后進(jìn)一步構(gòu)成文件,恢復(fù)速度勢(shì)必會(huì)影響文件數(shù)據(jù)的實(shí)時(shí)性;而每次寫(xiě)操作均對(duì)文件進(jìn)行全備份,文件中大量未改變的數(shù)據(jù)勢(shì)必會(huì)占用相對(duì)較大的存儲(chǔ)空間,造成存儲(chǔ)資源的極大浪費(fèi)。

        圖 1 信用卡賬戶信息組成

        圖1展示了信用卡賬戶的組成要素,賬戶中除了賬戶金額經(jīng)常變動(dòng)以外,大部分信息數(shù)據(jù)是未改變或很少變化的,對(duì)文件數(shù)據(jù)進(jìn)行全備份過(guò)程中,未改變的數(shù)據(jù)被反復(fù)備份,浪費(fèi)了較大的存儲(chǔ)空間,而重要的賬戶數(shù)據(jù)占用的存儲(chǔ)資源相對(duì)有限,需要對(duì)這種特殊的需求提出新的應(yīng)對(duì)方法。因此,本文提出了改進(jìn)的文件級(jí)持續(xù)數(shù)據(jù)保護(hù)技術(shù)(F-CDP)。

        F-CDP技術(shù)是在ULVM層設(shè)計(jì)與實(shí)現(xiàn)的,是塊級(jí)CDP技術(shù)的一種演化,組成文件的所有數(shù)據(jù)塊在ULVM層是連續(xù)的,由于文件數(shù)據(jù)在備份過(guò)程中大部分?jǐn)?shù)值保持不變,Pn值中大量的“0”是長(zhǎng)期存在且位置不變的,如圖2所示,賬戶中的個(gè)人信息長(zhǎng)期未發(fā)生變化,只有賬戶金額部分發(fā)生改變。

        圖 2 個(gè)人賬戶數(shù)據(jù)的異或值

        2 F-CDP的設(shè)計(jì)與實(shí)現(xiàn)

        2.1 系統(tǒng)架構(gòu)

        根據(jù)第二節(jié)中提到的問(wèn)題,我們的解決方案是通過(guò)虛擬技術(shù)在邏輯層實(shí)施數(shù)據(jù)保護(hù),利用虛擬技術(shù)將物理上分散存儲(chǔ)的文件數(shù)據(jù)邏輯鏈接成一個(gè)整體,從而更有利于數(shù)據(jù)保護(hù)的實(shí)現(xiàn),如圖3所示。在文件系統(tǒng)驅(qū)動(dòng)與邏輯卷管理層(LVM)之間,增加了上層邏輯卷管理驅(qū)動(dòng)(ULVM),ULVM由指針記錄模塊、數(shù)據(jù)轉(zhuǎn)換模塊和編碼模塊三部分組成,指針記錄模塊設(shè)置了數(shù)據(jù)增加指針Pa(Point addition)、數(shù)據(jù)刪除指針Pd(Point delete)和數(shù)據(jù)更改指針Pc(Point change),分別記錄數(shù)據(jù)增加、刪除、更改時(shí)的起始位置;數(shù)據(jù)轉(zhuǎn)換模塊負(fù)責(zé)按照預(yù)定機(jī)制對(duì)相關(guān)的數(shù)據(jù)進(jìn)行“0”“1”轉(zhuǎn)換,編碼模塊用于對(duì)增量數(shù)據(jù)進(jìn)行編碼壓縮。ULVM對(duì)上提供數(shù)據(jù)訪問(wèn)接口和統(tǒng)一的邏輯視圖,對(duì)下維護(hù)下級(jí)各節(jié)點(diǎn)的邏輯映射關(guān)系。尋址模塊進(jìn)行數(shù)據(jù)物理地址的定向與訪問(wèn),實(shí)現(xiàn)邏輯塊與物理塊的一一映射。

        圖3 系統(tǒng)架構(gòu)

        2.2 機(jī)制實(shí)現(xiàn)

        2.2.1 指針記錄模塊

        數(shù)據(jù)增加:當(dāng)有新的文件建立或文件中增加新的數(shù)據(jù)時(shí)使用Pa,Pa包含起始位Pab(beginning)和結(jié)束位Pae(end)兩部分,分別標(biāo)明數(shù)據(jù)增加的起始位與結(jié)束位,Pab與Pae是一一對(duì)應(yīng)的。對(duì)于數(shù)據(jù)增加的情況,新增的數(shù)據(jù)保持原有狀態(tài)不變,原有數(shù)據(jù)異或后得到的值全部為“0”,本文設(shè)定Pab為“110”,Pae為“011”,ULVM首先通過(guò)數(shù)據(jù)轉(zhuǎn)換模塊將原來(lái)的數(shù)據(jù)全部轉(zhuǎn)換為“0”,在數(shù)據(jù)的后面插入指針“110”,用于區(qū)分原有數(shù)據(jù)與新增數(shù)據(jù),然后將新數(shù)據(jù)寫(xiě)到起始指針后面,最后插入結(jié)束位“011”,數(shù)據(jù)壓縮解壓時(shí)只需讀取指針便可對(duì)指定的數(shù)據(jù)形態(tài)進(jìn)行逐一恢復(fù)。如圖4所示。

        圖4 數(shù)據(jù)增加

        數(shù)據(jù)更改:文件中部分?jǐn)?shù)據(jù)發(fā)生改變時(shí)使用Pc,如賬戶中的金額變動(dòng)、地圖坐標(biāo)的更改、導(dǎo)航定位信息的修正等等,在改變的數(shù)據(jù)中插入相應(yīng)的指針起始位Pcb和結(jié)束位Pce,分別標(biāo)明數(shù)據(jù)改變的起始位與結(jié)束位,Pcb與Pce是一一對(duì)應(yīng)的,當(dāng)數(shù)據(jù)中有多個(gè)部分更改時(shí),在Pcb與Pce后面加n分別標(biāo)明即可。對(duì)于數(shù)據(jù)更改的情況,數(shù)據(jù)異或后改變的部分全部為“1”,未改變的部分全部為“0”,由于同一數(shù)據(jù)的一次寫(xiě)操作可能會(huì)涉及多個(gè)部分,本文設(shè)定Pcb為“10‘000’01”P(pán)ce為“01‘000’10”,中間三個(gè)比特位代表“000-111”八個(gè)數(shù)字,逐一累加,若一次寫(xiě)所涉及的修改不超過(guò)八處,則通過(guò)指針進(jìn)行一一標(biāo)記;若一次寫(xiě)操作涉及的改變超過(guò)九處以上,則對(duì)數(shù)據(jù)進(jìn)行一次全備份。F-CDP通過(guò)數(shù)據(jù)轉(zhuǎn)換模塊將對(duì)應(yīng)的數(shù)據(jù)進(jìn)行轉(zhuǎn)換,在改變的數(shù)據(jù)部分前后各插入相應(yīng)的起始位與結(jié)束位指針,并記錄時(shí)間戳,得到的結(jié)果如圖5所示。

        圖5 數(shù)據(jù)更改

        數(shù)據(jù)刪除:文件中部分?jǐn)?shù)據(jù)刪除時(shí)使用該指針Pd,用來(lái)標(biāo)明數(shù)據(jù)中刪除的部分,該指針的作用是為了防止由病毒、誤操作、人為破壞等造成的數(shù)據(jù)丟失,將刪除的數(shù)據(jù)保存下來(lái)以便需要時(shí)恢復(fù),該指針也包括Pdb與Pde兩部分,分別標(biāo)明數(shù)據(jù)刪除部分的起始位與結(jié)束位。數(shù)據(jù)刪除的情況較為簡(jiǎn)單,為了有效記錄已刪除的數(shù)據(jù),防止誤操作發(fā)生,本文設(shè)定數(shù)據(jù)刪除指針Pdb與Pde均為“111”,F(xiàn)-CDP通過(guò)數(shù)據(jù)轉(zhuǎn)換模塊將未改變的數(shù)據(jù)轉(zhuǎn)換為“0”,在刪除的數(shù)據(jù)部分前后各插入相應(yīng)的起始位與結(jié)束位指針,并記錄時(shí)間戳,得到的結(jié)果如圖6所示。

        圖6 數(shù)據(jù)刪除

        2.2.2 數(shù)據(jù)轉(zhuǎn)換模塊

        針對(duì)標(biāo)記指針的文件或者數(shù)據(jù)塊,若指針為數(shù)據(jù)增加或刪除,則將指針之外的全部數(shù)據(jù)轉(zhuǎn)換為“0”,指針間的數(shù)據(jù)保持不變;若指針為數(shù)據(jù)更改,則將指針之間的數(shù)據(jù)全部轉(zhuǎn)換為“1”,將指針之外的數(shù)據(jù)轉(zhuǎn)換為“0”。

        當(dāng)應(yīng)用對(duì)某數(shù)據(jù)進(jìn)行一次數(shù)據(jù)更改寫(xiě)操作時(shí),數(shù)據(jù)轉(zhuǎn)換算法如下所示:

        Algorithm DataTransition 1 Lp=getlenth(P); //獲取指針長(zhǎng)度2 Ld=getlenth(data); //獲取數(shù)據(jù)長(zhǎng)度3 Lw=getlenth(write); //寫(xiě)操作涉及的數(shù)據(jù)長(zhǎng)度4 k=*Pb; //指針的起始位置5 for(i=1;i<Pb-1;i++)6 mi=0; //遍歷指針前的所有數(shù)據(jù),將其全部置為“0”7 for(i=Pb+LP; i<Pb+Lp+Lw-1; i++)8 mi=1; //遍歷指針之間改變的數(shù)據(jù),將其全部置為“1”9 for(i=Pb+Lp*2+Lw; i<Ld-1; i++)10 mi=0; //遍歷指針之后的所有數(shù)據(jù),將其全部置為“0”11 return mi

        數(shù)據(jù)轉(zhuǎn)換模塊的核心思想是將指針之外的數(shù)據(jù)全部轉(zhuǎn)換為“0”,指針之間的數(shù)據(jù)根據(jù)指針的不同,區(qū)別對(duì)待,對(duì)于數(shù)據(jù)更改的情況,指針之間的數(shù)據(jù)全部轉(zhuǎn)換為“1”,對(duì)于其他兩種情況,指針之間的數(shù)據(jù)保持不變。當(dāng)同一數(shù)據(jù)的更改涉及多個(gè)部分時(shí),可依次類(lèi)推。

        2.2.3 編碼模塊

        由于P(n)中包含了大量連續(xù)的“0”和“1”,在進(jìn)行數(shù)據(jù)保存時(shí),只需記錄指針之間有多少位“1”,指針之外有多少位“0”就能完整保存數(shù)據(jù)的詳細(xì)信息,而對(duì)于類(lèi)似的數(shù)據(jù)形態(tài),本文提出了一種新的數(shù)據(jù)編碼方式“表程編碼”。

        設(shè)計(jì)思想:假設(shè)在Pcb與Pce之間有Xbit的“1”,定義壓縮比特流1所用的數(shù)據(jù)位為L(zhǎng),壓縮后得到的值為C,根據(jù)二進(jìn)制算法計(jì)算出L=|log2X|+1,其中||為取整運(yùn)算。利用L位的0、1組合便可壓縮保存Xbit的數(shù)據(jù)信息。例如X=1048573,即Pcb與Pce之間有1048573個(gè)連續(xù)排列的“1”,利用公式得出L=|log21048573|+1=19+1=20,即用 20位的“0”“1”數(shù)字“11111111111111111101”表示了1048573個(gè)連續(xù)的“1”,即C= 11111111111111111101。同樣的原理應(yīng)用在未改變的部分,其值全部為“0”,編碼結(jié)果與改變的部分相同。由于每次編碼過(guò)程中X的長(zhǎng)度不同,在獲取壓縮值C的過(guò)程中,系統(tǒng)每次都要進(jìn)行二進(jìn)制樹(shù)的遍歷,遍歷過(guò)程耗費(fèi)了大量的系統(tǒng)資源,針對(duì)這種情況,本文提出了“表程編碼”算法。

        表程編碼:針對(duì)大小為4KB的數(shù)據(jù)塊,其數(shù)據(jù)改變量是有限的,也就是指X的范圍相對(duì)可控:1≤X≤4×8×1024,如果系統(tǒng)事先計(jì)算出X的所有取值對(duì)應(yīng)的編碼值,記錄在數(shù)據(jù)表中,通過(guò)讀取數(shù)據(jù)轉(zhuǎn)換模塊得到的X長(zhǎng)度,然后查找表中對(duì)應(yīng)的編碼值,就能節(jié)省系統(tǒng)對(duì)每個(gè)X進(jìn)行計(jì)算所占用的資源,編碼表如表1所示。

        表 1 編碼值遍歷表

        編碼值遍歷表計(jì)算出每個(gè)X值對(duì)應(yīng)的壓縮值C,每20組數(shù)據(jù)為一張子表,壓縮解壓模塊從數(shù)據(jù)轉(zhuǎn)換模塊獲取到X的值后,首先通過(guò)公式Table=|X÷20|+1計(jì)算出C值在哪張子表中,然后取X÷20的余數(shù)找到C的具體數(shù)值。

        若文件數(shù)據(jù)大于4KB對(duì)于數(shù)據(jù)長(zhǎng)期未改變的部分,通過(guò)公式L=|log2X|+1將記錄數(shù)據(jù)信息所需全部“0”的比特位計(jì)算出來(lái),通過(guò)“0”“1”組合得到表示數(shù)據(jù)“0”位數(shù)的信息,該組合是固定值,一次計(jì)算可以應(yīng)用在文件數(shù)據(jù)日后所有的記錄中,在賬戶金額部分插入指針后,鏈接在該固定值之后,生成新的日志信息,為該文件維護(hù)一個(gè)日志鏈,并定期進(jìn)行文件的全備份。

        2.3 ULVM工作流程

        客戶端的I/O命令先傳送到ULVM,ULVM判別該命令是讀或者是寫(xiě)。若是讀,ULVM直接返回相應(yīng)的數(shù)據(jù),直接授權(quán)客戶端通過(guò)網(wǎng)絡(luò)訪問(wèn)存儲(chǔ)池的相關(guān)數(shù)據(jù);若是寫(xiě),則由ULVM統(tǒng)一處理,首先將相應(yīng)的數(shù)據(jù)調(diào)入內(nèi)存,由指針模塊記錄數(shù)據(jù)改變部分的位置,然后通過(guò)數(shù)據(jù)轉(zhuǎn)換模塊,將未改變的部分設(shè)為“0”,改變的部分設(shè)為“1”,經(jīng)過(guò)壓縮解壓模塊對(duì)數(shù)據(jù)進(jìn)行壓縮生成Pn值,然后把Pn值寫(xiě)到相應(yīng)的日志鏈中,具體過(guò)程如圖7所示。

        圖7 ULVM命令解析流程

        2.4 F-CDP的性能分析

        無(wú)論持續(xù)數(shù)據(jù)保護(hù)機(jī)制在哪個(gè)層次實(shí)現(xiàn)或者是應(yīng)用技術(shù)有多大提高,對(duì)于新增加和已刪除的數(shù)據(jù),任何數(shù)據(jù)保護(hù)機(jī)制都要完成最基礎(chǔ)的工作:備份增量數(shù)據(jù)或待刪除數(shù)據(jù),這部分?jǐn)?shù)據(jù)的備份工作占用的系統(tǒng)資源是無(wú)法減少的,性能提升的空間相對(duì)有限。本文針對(duì)數(shù)據(jù)的改變部分,將F-CDP與TRAP-4的性能進(jìn)行比較,設(shè)定原型系統(tǒng)的數(shù)據(jù)塊大小為4Kb,系統(tǒng)中有10TB的工作數(shù)據(jù),每天數(shù)據(jù)的改變量約20%,每周做一次全備份。

        若1M的文件每天同樣有20%的改變,對(duì)于理想情況而言,也就是近52個(gè)數(shù)據(jù)塊發(fā)生了改變,采用TRAP-4機(jī)制,系統(tǒng)最少保留52個(gè)數(shù)據(jù)塊的P(m)值,利用游程編碼進(jìn)行數(shù)據(jù)壓縮,系統(tǒng)要占用52×log212bit的空間,而F-CDP機(jī)制最多占用52×log220bit的空間,最少僅占用log220bit的空間,顯然,F(xiàn)-CDP并沒(méi)有明顯增加系統(tǒng)的工作負(fù)載,但是該機(jī)制能夠?qū)χ匾募蚝诵臄?shù)據(jù)做持續(xù)的全備份,極大地保證了核心數(shù)據(jù)的安全性與可用性,提高了系統(tǒng)數(shù)據(jù)的可靠性。而對(duì)于特殊情況,256個(gè)數(shù)據(jù)塊各改變了20%,且改變僅為一次寫(xiě)操作,F(xiàn)-CDP不但節(jié)省了備份空間,而且極大提高了數(shù)據(jù)的備份效率,尤其適合銀行、證券等以小文件、實(shí)時(shí)性為特點(diǎn)的數(shù)據(jù)系統(tǒng)。

        3 實(shí)驗(yàn)驗(yàn)證

        為了檢驗(yàn)F-CDP的數(shù)據(jù)備份與恢復(fù)效率,對(duì)F-CDP進(jìn)行實(shí)驗(yàn),并與TRAP-4機(jī)制得出的結(jié)果進(jìn)行比較。

        實(shí)驗(yàn)環(huán)境:主機(jī)CPU為2.50GHz,RAM為1G,Ethernet adapt?ers為RTL8139,Operating System為L(zhǎng)inux Fedora 15,內(nèi)核為2.6.40版,數(shù)據(jù)庫(kù)為Demon 5.0。采用TPC-C Benchmark模擬在線事務(wù)處理,運(yùn)行半個(gè)小時(shí)。借鑒參考文獻(xiàn)[1]中的實(shí)驗(yàn)方法及實(shí)現(xiàn)參考程序,做了相應(yīng)的模擬實(shí)驗(yàn)。

        3.1 數(shù)據(jù)壓縮效率實(shí)驗(yàn)

        分別取大小為1、10、100、1000、10000(M)的文件數(shù)據(jù)(對(duì)以上數(shù)據(jù)進(jìn)行一次寫(xiě)操作,數(shù)據(jù)改變量小于1%),分別采用COW、TRAP-4、F-CDP的三種數(shù)據(jù)備份方式將更新的數(shù)據(jù)復(fù)制到備份中心,得到的網(wǎng)絡(luò)數(shù)據(jù)流量如圖8所示。

        圖 8 數(shù)據(jù)壓縮效率對(duì)比

        對(duì)于大小不同的文件數(shù)據(jù),分別采用COW、TRAP-4和F-CDP技術(shù)對(duì)其進(jìn)行數(shù)據(jù)備份,COW技術(shù)直接將數(shù)據(jù)復(fù)制到備份中心,數(shù)據(jù)大小不變,占用的網(wǎng)絡(luò)帶寬與數(shù)據(jù)量相關(guān);TRAP-4技術(shù)通過(guò)異或器將數(shù)據(jù)進(jìn)行了異或并且壓縮,數(shù)據(jù)壓縮后數(shù)據(jù)量明顯變小,約為原數(shù)據(jù)的10%~30%;F-CDP技術(shù)采用表程編碼進(jìn)行數(shù)據(jù)壓縮,數(shù)據(jù)壓縮后大小一般在KB范圍,網(wǎng)絡(luò)傳輸過(guò)程中,數(shù)據(jù)量明顯較小。

        3.2 備份還原實(shí)驗(yàn)

        分別取大小為0.1、0.2、0.4、0.8、1.6、3.2、6.4、12.8(M)的文件數(shù)據(jù)(區(qū)域地圖數(shù)據(jù)),對(duì)以上數(shù)據(jù)進(jìn)行一次寫(xiě)操作,數(shù)據(jù)改變量小于1%,實(shí)驗(yàn)分別采用COW、TRAP-4、F-CDP的三種數(shù)據(jù)備份方式,對(duì)文件數(shù)據(jù)進(jìn)行寫(xiě)操作增量數(shù)據(jù)備份實(shí)驗(yàn),實(shí)驗(yàn)得到的備份時(shí)間數(shù)據(jù)如圖9所示:

        圖 9 數(shù)據(jù)備份對(duì)比

        在100KB平均速率的網(wǎng)絡(luò)中,數(shù)據(jù)較小時(shí)(小于1MB),COW由于直接將數(shù)據(jù)復(fù)制到異地備份中心,沒(méi)有經(jīng)歷TRAP-4的數(shù)據(jù)異或和壓縮及F-CDP的查表壓縮過(guò)程,備份時(shí)間相對(duì)較短,TRAP-4與F-CDP的備份時(shí)間相差不大。而數(shù)據(jù)較大時(shí)(1MB以上),隨著數(shù)據(jù)的增大,網(wǎng)絡(luò)中傳輸數(shù)據(jù)所用的時(shí)間明顯占據(jù)了備份時(shí)長(zhǎng)的主體,COW技術(shù)的備份時(shí)間呈線性增長(zhǎng),TRAP-4機(jī)制相比COW來(lái)講,提高了一定的傳輸效率和備份效率,而F-CDP技術(shù)中,查表壓縮的時(shí)間沒(méi)有明顯增加,但是數(shù)據(jù)壓縮的效率明顯提高,網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)量增長(zhǎng)不大,明顯提高了數(shù)據(jù)的備份效率。

        實(shí)驗(yàn)結(jié)果表明,基于虛擬存儲(chǔ)的異地CDP技術(shù)具有生成增量數(shù)據(jù)快、壓縮效率高、占用網(wǎng)絡(luò)帶寬小、存儲(chǔ)空間利用率高的優(yōu)點(diǎn),雖然數(shù)據(jù)還原時(shí)要占用較長(zhǎng)的時(shí)間進(jìn)行數(shù)據(jù)解壓,且數(shù)據(jù)壓縮后無(wú)法對(duì)外提供訪問(wèn)工作,但是該機(jī)制的設(shè)計(jì)理念就是能夠最大限度地保存數(shù)據(jù)版本、容忍重大災(zāi)難,面對(duì)重大災(zāi)難造成的損失,數(shù)據(jù)恢復(fù)期間所造成的損失幾乎可以忽略不計(jì)。總而言之,F(xiàn)-CDP技術(shù)較好地解決了數(shù)據(jù)異地容災(zāi)的問(wèn)題。

        F-CDP機(jī)制是針對(duì)特定工作場(chǎng)景應(yīng)運(yùn)而生的,既對(duì)重要文件數(shù)據(jù)進(jìn)行了實(shí)時(shí)數(shù)據(jù)全備份,又沒(méi)有顯著增加信息系統(tǒng)的計(jì)算和存儲(chǔ)資源,能夠?qū)?shù)據(jù)恢復(fù)到任意時(shí)刻,較好地解決了金融、證券、軍事數(shù)據(jù)等核心信息的備份存檔問(wèn)題,提升了信息系統(tǒng)的容災(zāi)能力,該機(jī)制特別適合于文件數(shù)據(jù)較大、改動(dòng)部分較少且改變位置相對(duì)固定的應(yīng)用場(chǎng)景。

        4 結(jié)語(yǔ)

        持續(xù)數(shù)據(jù)保護(hù)與系統(tǒng)負(fù)載是一對(duì)矛盾的平衡體,如何最大限度地保護(hù)數(shù)據(jù)、最低程度的增加系統(tǒng)負(fù)載是持續(xù)數(shù)據(jù)保護(hù)技術(shù)的發(fā)展方向,本文在TRAP-4的基礎(chǔ)上,針對(duì)銀行、證券等特定的文件數(shù)據(jù)格式,提出了改進(jìn)的文件級(jí)的持續(xù)數(shù)據(jù)保護(hù)技術(shù)研究,一定程度上增強(qiáng)了系統(tǒng)的工作效能,提高了數(shù)據(jù)保護(hù)能力。

        [1]Yang Q,Xiao W,Ren J.TRAP-Array:A disk array architecture providing timely recovery to any point-in-time[C]// Proc of the Int Sytnp on Computer Architecture.New York:ACM,2006.

        [2]李旭,謝長(zhǎng)生,楊靖等.一種改進(jìn)的塊級(jí)連續(xù)數(shù)據(jù)保護(hù)機(jī)制[J].計(jì)算機(jī)研究與發(fā)展,2009(5).

        [3]Kimberly Keeton,Cipriano Santos,Dirk Beyer,etc. Designing for Disasters[C].Proceedings of the 3th USENIX Conference on File and Storage Technologies,San Francisco,CA,USA.USENIX Association.2004.03.

        [4]王晶.強(qiáng)隔離操作系統(tǒng)的設(shè)備虛擬化[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2009.

        [5]Yonghong Sheng,Dongsheng Wang,JinYang He et al. TH-CDP:An Efficient Block Level Continuous Data Protection System[C].In:2009 IEEE International Conference on Networking,Architecture,and Storage.2009:395-404.

        [6]Deng Yibing,Chen Shanguang,Hu Wei,Gao Feng,Liu Chuanyi.A Novel Block-level Continuous Data Protection System [C].IEEEComputer Society.2010:242-247.

        TP309

        A

        1671-0037(2014)10-70-4

        馮美祿(1976.8-),本科,工程師,研究方向:電子產(chǎn)品。

        猜你喜歡
        機(jī)制
        構(gòu)建“不敢腐、不能腐、不想腐”機(jī)制的思考
        自制力是一種很好的篩選機(jī)制
        文苑(2018年21期)2018-11-09 01:23:06
        “三項(xiàng)機(jī)制”為追趕超越蓄力
        丹鳳“四個(gè)強(qiáng)化”從嚴(yán)落實(shí)“三項(xiàng)機(jī)制”
        保留和突破:TPP協(xié)定ISDS機(jī)制中的平衡
        定向培養(yǎng) 還需完善安置機(jī)制
        破除舊機(jī)制要分步推進(jìn)
        氫氣對(duì)缺血再灌注損傷保護(hù)的可能機(jī)制
        注重機(jī)制的相互配合
        打基礎(chǔ) 抓機(jī)制 顯成效
        亚洲天堂av在线一区| 国产呦精品系列在线播放| 国产妇女乱一性一交| 日本大片在线一区二区三区| 草逼短视频免费看m3u8| 国产乱人激情h在线观看| 亚洲av无码成人精品区天堂| 国产精品女同久久久久久| 内射爆草少妇精品视频| 国产精品9999久久久久仙踪林| 无遮高潮国产免费观看| 日韩人妻无码精品系列专区无遮| 精品人妻av一区二区三区四区| 国产午夜精品av一区二区麻豆| 亚洲欧美日韩中文无线码| 久久久久久免费播放一级毛片| 久久精品国产黄片一区| 99久久精品免费看国产| 亚洲av无码专区国产乱码不卡| 久久久久久岛国免费网站| 国产免费操美女逼视频| 亚洲中文字幕无码中文字| 亚洲色欲在线播放一区| 激情五月天俺也去综合网| 最好看的亚洲中文字幕| 亚洲av蜜桃永久无码精品| 国产精品无码久久久一区蜜臀 | 一本大道av伊人久久综合| 四房播播在线电影| 国产三级视频在线观看视主播| 东风日产车是不是国产的| 中国老熟女重囗味hdxx| 香蕉成人啪国产精品视频综合网| 中文字幕你懂的一区二区| 日本真人添下面视频免费| 国产在线无码制服丝袜无码| 亚洲成AV人在线观看网址| 91精品久久久中文字幕| 国产精品无码久久久久成人影院| 国产精品高潮无码毛片| 粉色蜜桃视频完整版免费观看在线 |