亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種P2P分布式系統(tǒng)高可靠數(shù)據(jù)恢復模型

        2012-06-23 07:45:18姜春茂張國印曲明成
        哈爾濱工程大學學報 2012年3期
        關(guān)鍵詞:副本數(shù)據(jù)量數(shù)據(jù)中心

        姜春茂,張國印,曲明成

        (1.哈爾濱工程大學計算機科學與技術(shù)學院,黑龍江哈爾濱150001;2.哈爾濱師范大學計算機科學技術(shù)與信息工程學院,黑龍江哈爾濱150025;3.哈爾濱工業(yè)大學計算機科學與技術(shù)學院,黑龍江哈爾濱150001)

        在基于P2P的分布式系統(tǒng)中,數(shù)據(jù)的可靠存儲與恢復一直是熱點問題[1].確保分布式系統(tǒng)中存儲的海量數(shù)據(jù)的完整性、可用性是亟待解決的關(guān)鍵問題.由于P2P分布式系統(tǒng)節(jié)點的具有很高的動態(tài)性,導致不可靠,在節(jié)點發(fā)生失效時,必須確保數(shù)據(jù)的完整可用,因此必須盡快地選出新節(jié)點并進行災難節(jié)點的數(shù)據(jù)備份恢復[2].

        通過維護高可靠性的部分節(jié)點集合,針對其中某些節(jié)點對其在集合中的異地建立和維護冗余數(shù)據(jù),利用地理分散性來保證數(shù)據(jù)對災難事件的抵御能力[3].根據(jù)容災的概念可知,容災的核心就是增加數(shù)據(jù)冗余度,當災難發(fā)生時,讓數(shù)據(jù)的副本被同時毀壞的概率降到可以接受的程度,降低數(shù)據(jù)副本被同時毀壞的概率,提升數(shù)據(jù)的恢復速度,保證整體數(shù)據(jù)具有較高的可用性、較低的失效概率[4].

        目前基于P2P的分布式系統(tǒng)中對抗數(shù)據(jù)失效技術(shù)實現(xiàn)方法雖然各不相同,多副本是一項主要手段,較多的是基于雙副本[2-3,5].使用雙副本容災,當發(fā)生災難時(節(jié)點損壞或短期內(nèi)不可用),從一個副本節(jié)點進行數(shù)據(jù)恢復,由于受到傳輸鏈路和節(jié)點網(wǎng)絡(luò)帶寬限制,其恢復速度明顯較慢,由于數(shù)據(jù)恢復期較長,在恢復期內(nèi)備份節(jié)點發(fā)生失效的概率隨之增大.如何在節(jié)點發(fā)生災難后對數(shù)據(jù)進行快速恢復以降低整體數(shù)據(jù)失效概率是目前亟待解決的關(guān)鍵問題.

        GridFTP是為快速傳輸而設(shè)計的傳輸協(xié)議,針對GridFTP協(xié)議,很多學者分別基于Linux、Unix和Windows操作系統(tǒng)進行實現(xiàn)方法研究,取得了良好的應用效果[6-8].GridFTP提供了條狀數(shù)據(jù)傳輸方式,即GridFTP客戶端可以并行的從多個GridFTP服務(wù)器端下載不同數(shù)據(jù)塊.基于GridFTP協(xié)議出現(xiàn)了很多的并行傳輸算法,這大幅度提高了中數(shù)據(jù)的傳輸速度[2,4,9-11].

        基于P2P的分布式存儲模型和并行傳輸?shù)乃惴╗12]基本達到了與基于全副本進行并行傳輸?shù)男阅?,而且存儲空間使用較少.基于存儲模型和并行傳輸給出的數(shù)據(jù)失效模型雖然達到了可靠存儲、快速數(shù)據(jù)恢復的目標,但是其假定了下載速度隨著并行傳輸數(shù)的增加呈線性增加,其約束過于理想[12].

        由于以往的研究假定Sk-Sk-1為常數(shù),而從實際角度來看Sk-Sk-1為變值,本文從實際應用的角度提出分布式模型和對各個參數(shù)進行詳細的分析.

        1 分布式模型

        定義1 ω等分.令總數(shù)據(jù)量為M,對整個數(shù)據(jù)進行等分,令分割的份數(shù)等于k(k-1)ω,k為副本節(jié)點的個數(shù).分割方式為:先將數(shù)據(jù)等分成k(k-1)份,再將每一份等分成ω份,這里ω是一個可變參數(shù).則每一份的數(shù)據(jù)量m為

        定義2 本地數(shù)據(jù).將定義1中分割的k(k-1)ω份數(shù)據(jù)平均分配到k個節(jié)點上,則每個節(jié)點存儲(k-1)ω份數(shù)據(jù).稱這些數(shù)據(jù)為節(jié)點Ni的本地數(shù)據(jù)Li.其中:L表示本地數(shù)據(jù),Li表示節(jié)點i的本地數(shù)據(jù).

        定義3 本地數(shù)據(jù)虛擬組.將節(jié)點Ni存儲的本地數(shù)據(jù)塊進行虛擬組劃分,即將ω個數(shù)據(jù)劃為一組,將劃分后的組進行節(jié)點內(nèi)編號.由定義2知,一個節(jié)點本地數(shù)據(jù)可以劃分的虛擬組數(shù)為(k-1)個,令虛擬組為Gji(0≤i≤k-1,0≤j≤k-2).令 Gi表示節(jié)點Ni的所有虛擬組,G表示當前虛擬組.

        定義4 剩余節(jié)點集合.令刨除節(jié)點Ni后的所有參與存儲的節(jié)點集合為剩余節(jié)點集合,即

        定義5 交叉存儲.將節(jié)點Ni的數(shù)據(jù)Gi存儲到刨除Ni的其他k-1個節(jié)點上,即,并滿足如下規(guī)則1))modk,p≤k-1},p為指定的常數(shù),“→”表示存儲到,稱這種存儲方式為交叉存儲.

        分布式存儲模型:節(jié)點Ni存儲的所有數(shù)據(jù)Ai包括本地數(shù)據(jù)Li,和其他節(jié)點的交叉存儲數(shù)據(jù)Oi,有

        式中:p為指定的常數(shù),稱其為分布式存儲模型.其中:O表示本地數(shù)據(jù),Oi表示節(jié)點i的本地數(shù)據(jù).

        定理1 P完整性.如數(shù)據(jù)滿足存儲模型,則當有任意p個節(jié)點不可用時,其余k-p個節(jié)點中數(shù)據(jù)的并集仍然等于整體數(shù)據(jù)量M,即完整的數(shù)據(jù),稱這種性質(zhì)為P完整性.(證明略)

        引理1 滿足數(shù)據(jù)存儲模型的數(shù)據(jù),其整體存儲數(shù)據(jù)量可以表示為:k(1+p)(k-1)ω.

        定義6 存儲空間使用量率U.采用存儲模型總體數(shù)據(jù)存儲量與采用x個完整副本存儲的總數(shù)據(jù)量比值定義為存儲空間使用量率U.由定義1和引理1可得U如下:

        2 數(shù)據(jù)恢復模型

        2.1 基本定義

        引理2 為了使分布式存儲模型占用的存儲空間與雙副本存儲相同,p必須等于1.

        證明:首先必須滿足定義6中的存儲空間使用量率S等于1,由于采用雙副本,則式(2)中的x等于2,則有

        定義7 數(shù)據(jù)失效概率f.將當前可用的存儲了同一數(shù)據(jù)的所有節(jié)點的數(shù)據(jù)作并集處理,如果得到的數(shù)據(jù)是不完整的,則稱發(fā)生了數(shù)據(jù)失效,發(fā)生的概率為 f.

        定義8 節(jié)點失效概率F.當節(jié)點發(fā)生異常時,節(jié)點不再可用或短期不再可用,稱節(jié)點在單位時間(tr)發(fā)生異常的概率為節(jié)點失效概率,記為F.

        約束1:為了方便后續(xù)模型的推導,給定約束中一個節(jié)點從另一個節(jié)點傳送數(shù)據(jù)所能達到的平均速度為V.

        定義9 非線性速度和Sk.當從備份節(jié)點向新節(jié)點恢復速度時,從k個節(jié)點同時傳送數(shù)據(jù),令所能夠達到的平均傳輸速度為Lk,令Sk=Lk/V,稱Sk為非線性速度和.由約束1可知,S1=1.

        從定義7、8可知,當發(fā)生節(jié)點失效時未必會發(fā)生數(shù)據(jù)失效.比如在雙副本存儲中,如果一個節(jié)點發(fā)生了失效,另一個可用節(jié)點存儲的數(shù)據(jù)仍然是完整的,此時沒有發(fā)生數(shù)據(jù)失效.在模型中,由引理2可知,在發(fā)生了1個節(jié)點失效時,剩余節(jié)點存儲的數(shù)據(jù)仍然是完整的,也沒有發(fā)生數(shù)據(jù)失效.

        如果只是靜態(tài)地考慮節(jié)點失效對數(shù)據(jù)失效造成的影響,而不考慮數(shù)據(jù)恢復,顯然,由于分布式存儲模型中的k值(采用的節(jié)點數(shù))大于等于2,在相同的時間內(nèi),存儲模型的數(shù)據(jù)失效概率更大.

        2.2 數(shù)據(jù)恢復模型

        約束2 在進行基于分布式存儲模型的數(shù)據(jù)恢復模型推導時,令分布式存儲模型中的p=1,參見引理2.

        只考慮靜態(tài)節(jié)點失效是不完備的,當有節(jié)點失效時為了保證數(shù)據(jù)的完整性,應該立即選取新的節(jié)點,將失效節(jié)點的數(shù)據(jù)恢復到新節(jié)點,以此提升數(shù)據(jù)存儲的可靠性.如圖1(a)所示,雙副本存儲,當副本2的存儲節(jié)點失效時,從副本1向新節(jié)點恢復數(shù)據(jù),這里M為數(shù)據(jù)量,V為速度(約束1),恢復時間為T.

        圖1 雙副本存儲數(shù)據(jù)恢復與數(shù)據(jù)失效Fig.1 Double replica storage retrieved and data failure

        數(shù)據(jù)交換中心:在向新節(jié)點備份時,數(shù)據(jù)首先要經(jīng)過一個帶寬和可靠性較高的數(shù)據(jù)交換中心,數(shù)據(jù)在交換中臨時緩存,以此來保證向新節(jié)點的數(shù)據(jù)恢復更可靠,當再備份期新節(jié)點發(fā)生故障時,由數(shù)據(jù)中心選取新的節(jié)點并繼續(xù)備份.一旦數(shù)據(jù)被完全傳送到數(shù)據(jù)中心則認為備份完成,當數(shù)據(jù)從數(shù)據(jù)中心完全成功的備份到一個新節(jié)點時,數(shù)據(jù)中心刪除臨時存儲的數(shù)據(jù).這樣的結(jié)構(gòu)使備份更可靠,速度更快.如果沒有數(shù)據(jù)交換中心,在數(shù)據(jù)恢復期新節(jié)點也有可能失效,需要重新選擇新節(jié)點來重新傳送,使數(shù)據(jù)恢復時間過長,導致僅存的副本節(jié)點失效概率增大,致使數(shù)據(jù)失效概率增大.

        雙副本存儲數(shù)據(jù)失效概率:在數(shù)據(jù)中心存在的情況下,對于雙副本存儲,如果有1個節(jié)點失效,則立即進行數(shù)據(jù)恢復,那么當在恢復期內(nèi)[t0,t1],時間長度為T,如果另1個副本節(jié)點發(fā)生失效,則會造成數(shù)據(jù)失效,如圖1(b)所示.顯然如果引入數(shù)據(jù)恢復動態(tài)行為,那么對于雙副本發(fā)生數(shù)據(jù)失效的概率如下:

        式中:α為失效概率,θ為數(shù)據(jù)恢復時間長度T與失效單位時間tr(定義8)的比值,由于單位時間的節(jié)點失效概率為F,那么

        表示θ個單位時間發(fā)生節(jié)點失效的概率,即在T內(nèi)發(fā)生數(shù)據(jù)失效的概率.

        基于存儲模型的數(shù)據(jù)失效概率 由約束2,本部分令p=1,因此與雙副本類似,當有1個節(jié)點失效時,根據(jù)定理1,剩余節(jié)點存儲數(shù)據(jù)的并集為完整數(shù)據(jù),此時選取新節(jié)點進行數(shù)據(jù)恢復,恢復時需要從其他k-1個節(jié)點并行傳輸,如圖2(a)所示.

        由分布式存儲模型可知采用k個節(jié)點存儲,總數(shù)據(jù)量為2倍副本2M,則每個節(jié)點存儲數(shù)據(jù)為2M/k,從k個節(jié)點并行傳輸?shù)乃俣葹長k-1,則恢復時間:

        顯然如果分布式存儲模型存儲,在任意區(qū)間[t0,t1],時間長度為 T'內(nèi),當有 0或 1個節(jié)點失效時,不會出現(xiàn)數(shù)據(jù)失效,如圖2(b).那么在[t0,t1]內(nèi),任意1個節(jié)點發(fā)生失效的概率f如下

        由分布式存儲模型、泊松分布、并行恢復策略可以推出數(shù)據(jù)恢復模型:

        式中:β表示數(shù)據(jù)失效概率,k為節(jié)點數(shù).

        圖2 模型存儲數(shù)據(jù)恢復與數(shù)據(jù)失效Fig.2 The model of data retrieved and data failure

        證畢.

        3 數(shù)據(jù)恢復模型特性分析

        從數(shù)據(jù)恢復模型的構(gòu)建過程可以看出,模型是動態(tài)的,在動態(tài)基礎(chǔ)上給出了數(shù)據(jù)失效概率,并且其性能受到Sk的影響.在互聯(lián)網(wǎng)上同一個節(jié)點在從多個節(jié)點進行并行數(shù)據(jù)傳輸時,所能得到的帶寬與并行數(shù)不成正比,如果客戶端帶寬較高,一般情況下在合理的并行數(shù)內(nèi),帶寬會隨著并行數(shù)呈現(xiàn)出一定的上升趨勢.

        那么數(shù)據(jù)恢復模型與雙副本存儲2種方式帶來的數(shù)據(jù)失效概率之間的理論關(guān)系,以及數(shù)據(jù)恢復模型與Sk之間的理論關(guān)系需要仔細分析.

        3.1 β與α的比較

        定理2 對于數(shù)據(jù)恢復模型公式(7),當θ,F(xiàn),k一定時,β為Sk-1的單調(diào)減函數(shù).

        證明:令常數(shù)e為自然對數(shù)函數(shù)的底數(shù),由泊松分布可知,β可以進行如下變換:

        β的一階導數(shù)小于0,所以β為Sk-1的單調(diào)減函,證畢.

        對定理2 進行檢測,令 θ=550,f=0.000 5,k=4,Sk-1∈(1.2,1.3,1.4,1.5,1.6,1.7)逐漸增加,這里應該保證θf<1,否則由式(2)可知,α大于1,則數(shù)據(jù)失效必然發(fā)生,失去實際意義.

        結(jié)論:從圖3中可以看出,β隨著Sk-1的增加呈現(xiàn)下降趨勢,為Sk-1的減函數(shù),與定理2的一致.

        圖3 β與S的關(guān)系Fig.3 Relation of β and S

        在保證β<α的前提下,數(shù)據(jù)恢復模型才具有實際意義,那么當k取不同值時,Sk-1必須滿足什么條件才能保證β<α,基于此前提條件由式(2)、(8)可以得出

        根據(jù)定理2,當 θ,F(xiàn),k一定時,β 為 Sk-1的單調(diào)減函數(shù),因此可以先令不等式(9)為1個等式,求出邊界值,只要不等式的Sk-1大于根據(jù)等式求解出的Sk-1' ,就可以滿足β<α.

        由于根據(jù)不等式(9)得出的等式方程為高次方程,可以采用 matlab求解,令 θ=550,F(xiàn)={0.000 1,0.000 2,…,0.000 5},逐漸增加 k 值,求出Sk-1,由定義9可知S1=1,所得數(shù)據(jù)如表1所示.

        表1 β=α時S的取值Table 1 The value when β=α

        圖4 β=α時S的取值Fig.4 S value when the β = α

        從表1和圖4可以看出,當β=α時,相應的S取值都較小,事實上這么小的S是在實際應用中是很容易達到.在k=3時,最小的Sk-1僅為1.087 8,若 V 等于 100,k=3,并行數(shù)為 2,則 S2=1.087 8,L2=108.8;k=8 時最大的 S7=1.295,L7=129.5.

        結(jié)論:在保證β<α情況下,數(shù)據(jù)恢復模型隨著k的增加對傳輸速度增加的依賴很低.

        3.2 β 與 S、k、θF 的關(guān)系

        用戶在從多節(jié)點進行并行傳輸時,隨著并行數(shù)的增加,速度增加呈現(xiàn)緩降趨勢.而數(shù)據(jù)恢復模型需要從k-1個節(jié)點進行數(shù)據(jù)恢復,在這種情況失效概率呈現(xiàn)出怎樣的趨勢.

        采用公比小于1的等比數(shù)列來模擬Sk-1,即隨著并行數(shù)的增加,下載速度和的增加逐漸減緩,以此來檢測β與S、k的關(guān)系.Sk-1與k的關(guān)系如下:

        將式(10)代入式(8)可以得到

        令 θF=0.23,取不同的 q={0.2,0.3,0.4,0.5,0.6,0.7},逐漸增加 k,觀測 β 的變化情況(如表2).

        表2 Sk-1增速減緩對β的影響Table 2 The influence of Sk-1slowing growth on β

        從該測試中可以看出在q逐漸增加,即速度的增幅Sk-Sk-1=qk-1(k≥1)逐漸增大時,β曲線的變化過程是:始終上升→先下降后上升(最低點逐漸右移,且曲線增幅逐漸減緩)→始終下降(下降趨勢逐漸增大).

        結(jié)論:很顯然在實際的應用中根據(jù)各種網(wǎng)絡(luò)情況,選擇β曲線最低點出現(xiàn)時k的取值作為數(shù)據(jù)恢復模型的參數(shù)效果最為理想,同時還必須保證β<α.

        在進行上述分析時,θF都為定值,因此需要改變θF的取值,觀測其對 β曲線的影響.令q=0,θF∈(0.20,0.23,0.26,0.29,0.32,0.35),計算 β取值.通過實驗,發(fā)現(xiàn)在θF取不同值時,隨著k的增加,β曲線的形狀基本沒有變化.

        結(jié)論:由于θF對曲線的形狀沒有影響,因此β曲線的最低點(在k-1個并行數(shù)存在時,數(shù)據(jù)失效概率最小)可以根據(jù)k與Sk-1值確定.

        3.3 網(wǎng)絡(luò)流量分析

        定理3 在保證數(shù)據(jù)不失效的前提下,雙副本數(shù)據(jù)恢復與數(shù)據(jù)恢復模型2個動態(tài)系統(tǒng)對網(wǎng)絡(luò)流量的影響是相同的.

        證明:令時間跨度為T,節(jié)點在單位時間ts內(nèi)的失效概率為F,數(shù)據(jù)副本大小為M,模型采用k存儲.

        1)對于雙副本,一個節(jié)點在時間T內(nèi)的期望失效次數(shù)為c1=T/ts,每次恢復傳輸數(shù)據(jù)量為M,則2個節(jié)點在T內(nèi)帶來的網(wǎng)絡(luò)流量為c1=2TM/ts.

        2)對于恢復模型,由于采用雙副本,則總存儲數(shù)據(jù)量由定義6、引理2、約束2可知為2M,則每個節(jié)點存儲數(shù)據(jù)量為2M/k,則k個節(jié)點在T內(nèi)帶來的網(wǎng)絡(luò)流量可以表示為,證畢.

        結(jié)論:數(shù)據(jù)恢復模型并沒有節(jié)省網(wǎng)絡(luò)流量,但是其使得數(shù)據(jù)失效概率明顯降低.

        4 實驗

        在數(shù)據(jù)恢復模型中引入了基于數(shù)據(jù)交換中心的結(jié)構(gòu),交互中心具有較大的帶寬和較高的可靠性.實驗主要開展以不同節(jié)點作為數(shù)據(jù)交換中心,并行傳輸數(shù)變化時,交換中心所能夠達到的平均下載帶寬(Sk-1).根據(jù)并行數(shù)k-1,和Sk-1給出實際的β和α取值,并對二者進行對比分析.

        4.1 數(shù)據(jù)觀測

        1)數(shù)據(jù)交換中心為教育網(wǎng)內(nèi)普通PC節(jié)點,數(shù)據(jù)存儲節(jié)點分別位于如下主機.采用網(wǎng)絡(luò)探測工具探測本地速度最大為157 kB,實測數(shù)據(jù)如表3.

        表3 普通PC機作為數(shù)據(jù)交換中心獲得的單節(jié)點傳輸實測數(shù)據(jù)Table 3 Single node transmission measurement data by using PC as data excharge center

        取上述各平均速度的平均值作為從一個節(jié)點傳輸數(shù)據(jù)的速度,為117 kB,即V=L1=117.

        2)采用上述類似的觀測方法,設(shè)置交換中心為3G無線網(wǎng)絡(luò)內(nèi)的普通筆記本,觀測主機如表4,平均V(L1)=163.采用網(wǎng)絡(luò)探測工具探測本地速度為最大246 kB.

        表4 普通PC機作為數(shù)據(jù)交換中心獲得的多節(jié)點并行傳輸實測數(shù)據(jù)Table 4 Multi node parallel transmission measurement data by using PC as data exchange center

        表5 3G無線網(wǎng)絡(luò)的筆記本作為數(shù)據(jù)交換中心獲得的單節(jié)點傳輸實測數(shù)據(jù)Table 5 Single node transmission measurement data by using 3G wireless network notebook as data exchange center

        表6 企業(yè)內(nèi)部服務(wù)器作為數(shù)據(jù)交換中心獲得的單節(jié)點傳輸實測數(shù)據(jù)Table 6 Single node transmission measurment data by using enterprise internal server as data exchange center

        3)上述的數(shù)據(jù)存儲節(jié)點本身帶寬較大,而數(shù)據(jù)交換中本身帶寬較小(尤其在教育網(wǎng)內(nèi)時).

        采用普通PC節(jié)點,分別位于校園網(wǎng)學生宿舍(2臺式PC,2臺筆記本)、聯(lián)通寬帶(3臺)電腦安裝IIS服務(wù)器,由于這些主機都具有獨立IP地址,因此可以作為臨時服務(wù)其,在其上發(fā)布32M相同數(shù)據(jù).數(shù)據(jù)中心設(shè)置于黑龍江聯(lián)通公司,探測數(shù)據(jù)中心的最大下載速度為423 kB.取表5各平均速度的平均值作為從一個節(jié)點傳輸數(shù)據(jù)的速度,為104 kB,即V=L1=104,實測數(shù)據(jù)如表6.

        4.2 數(shù)據(jù)分析

        由于非線性速度和函數(shù)是影響數(shù)據(jù)恢復模型的關(guān)鍵,其對β有較大的影響.令各節(jié)點的失效概率與數(shù)據(jù)恢復時間θF=0.23,則由式(2)可以得出α=(θF)2=0.052 9.根據(jù)式(7)以及4.1 節(jié)中觀測到的Si值計算出相應的β值,如表7.

        表7 β數(shù)值Table 7 The value of β

        根據(jù)3.2節(jié)的分析,β值受Sk-1的影響很大,對于上述觀測的β取值,必須滿足下式,以此來確定最佳的k值:

        當數(shù)據(jù)交換中心為一個教育網(wǎng)內(nèi)普通PC,由于帶寬較小,測試時最大速度為157 kB,因此隨著k的增加(并行數(shù)增加),Lk和Sk的增幅較小,導致β只是略低于α,比值均在1~1.5之間.而在實驗(2)中,測試時的帶寬稍高一些,達到了246 kB,因此的α/β 最大值達到了3.19.

        從前2個實驗可以看出,數(shù)據(jù)中心的本身帶寬較小,導致了數(shù)據(jù)恢復模型的性能只是略好于雙副本數(shù)據(jù)恢復策略.而在實驗3中,由于數(shù)據(jù)交換中心的節(jié)點位于帶寬較高的聯(lián)通公司內(nèi)部,而數(shù)據(jù)節(jié)點為普通用戶PC和普通寬帶網(wǎng)絡(luò),所以可以看出隨著k的增加α/β一直升高,相應的β一直降低.

        實驗(3)充分說明了,2.2節(jié)中提出的以可靠性較高、帶寬較大的節(jié)點作為數(shù)據(jù)交換中心策略的實用性和正確性.

        在圖5中,可以看出,拐點預示β數(shù)值將增大,因此選取第一個拐點出現(xiàn)處的k值作為恢復模型的參數(shù)較為適宜,在3個試驗中,拐點處k取值分別為4、5,此時的并行數(shù)為 3、4,此時 α/β 分別為 1.38、3.19、7.15,效果較好.

        4.3 實驗小結(jié)

        圖5 3種β的第一個拐點分析Fig.5 Three β analysis of the first inflection point

        如果數(shù)據(jù)中心帶寬較大,則可以將數(shù)據(jù)恢復模型中的k值適當放大,但是也要考慮到數(shù)據(jù)中心網(wǎng)絡(luò)擁塞使帶寬極度降低的情況,這樣將導致并行恢復速度較慢,使數(shù)據(jù)失效概率增大.從實驗結(jié)果看,在一般情況下數(shù)據(jù)恢復模型均能使數(shù)據(jù)的失效概率小于雙副本存儲恢復機制.

        5結(jié)論

        本文基于分布式存儲模型提出的數(shù)據(jù)恢復模型,基于數(shù)據(jù)交換中心、并行傳輸和非線性速度和函數(shù),較以往研究具有更強的實用價值.對模型的理論分析顯示出對于數(shù)據(jù)恢復模型,當模型的并行數(shù)增加時,在保證β不小于α的前提下,模型對速度和的增加值要求較小;模型中β的形狀受到Sk的影響,而θF只是影響到了起到平移曲線的作用并不改變其形狀;模型使用與雙副本一樣的存儲空間,達到了降低數(shù)據(jù)失效概率的目標,但是兩種策略對網(wǎng)絡(luò)流量的影響是一樣的.實驗顯示,在一般情況下數(shù)據(jù)恢復模型都具有較好的性能,而基于數(shù)據(jù)交換中策略使模型性能進一步提升,使數(shù)據(jù)失效概率均小于雙副本機制.由于本文提出的數(shù)據(jù)恢復模型中不假定下載速度隨著并行數(shù)呈線性增長,因此這較先前研究有質(zhì)的區(qū)別,取得的成果具有更實際的意義,將為分布式數(shù)據(jù)存儲和恢復提供有意的參考.

        [1]陳貴海,吳帆,李宏興.基于DHT的P2P系統(tǒng)中高可用數(shù)據(jù)冗余機制[J].計算機學報,2008,31(10):1695-1704.CHEN Guihai, WU Fan, LIHongxing. Redundancy schemes for high availability in DHTs[J].Chinese Journal of Computers,2008,31(10):1695-1704.

        [2]YU Xiangzhan,WU Guanjun,WANG Dong.An disaster tolerance model based on dataflow replication[C]//Proceedings of the 2008 IEEE International Conference on Information Automation. Zhangjiajie:IEEE Computer Society,2008:1590-1594.

        [3]PITKANEN M,MOUSSA R,SWANY M,et al.Erasure codes for increasing the availability of grid data storage[C]//International Conference on Internet and Web Applications and Services,AICT/ICIW '06.Guadeloupe:IEEE Computer Society,2006:1-10.

        [4]WILKINS R S,DU X,COCHRAN R A,et al.Disaster tolerant Wolfpack geo-clusters[C]//Proceedings of the 2002 IEEE International Conference on Cluster Computing.Chicago:IEEE Computer Society 2002:1-6.

        [5]WANG Y,LI Z,LIN W.Rwar:a resilient window-consistent asynchronous replication protocol[C]//Proceedings of the TheSecO International Conference Availability,Reliability and Security.Vienna:IEEE Computer Society,2007:499-505.

        [6]FENG J,CUI L,WASSON G,et al.Toward seamless grid data access:design and implementation of gridftp on.net[C]//The 6th IEEE/ACM International Workshop.Vienna:IEEE Computer Society,2005:1-8.

        [7]VAZHKUDAI S.Enabling the co-allocation of grid data transfers[C]//Proceedings of the Fourth International Workshop on Grid Computing.Phoenix:IEEE Computer Society,2003:1-8.

        [8]BHUVANESWARAN R S,KATAYAMA Y,TAKAHASHI N.Dynamic co-allocation scheme for parallel data transfer in grid environment[C]//Proceedings of the First International Conference on Semantics,Knowledge,and Grid.Beijing:IEEE Computer Society,2006:1-6.

        [9]ALLCOCK W,BRESNAHAN J.The globus striped Grid-FTP framework and server[C]//Proceedings of the 2005 ACM/IEEE SC|05 Conference.Seattle:IEEE Computer Society,2005:1-11.

        [10]VAZHKUDAI S.Distributed downloads of bulk,replicated grid data[J].Journal of Grid Computing,2004,2(1):31-42.

        [11]KHANNA G,CATALYUREK U,KURC T,et al.A dynamic scheduling approach for coordinated wide-area data transfers using Grid TP[C]//Proceedings of the 22nd IEEE International Parallel and Distributed Processing Symposium.Miami:IEEE Computer Society,2008:1-12.

        [12]曲明成,吳翔虎,廖明宏,等.一種數(shù)據(jù)網(wǎng)格容災存儲模型及其數(shù)據(jù)失效模型[J].電子學報,2010,38(2):315-320.QU Mingcheng,WU Xianghu,LIAO Minghong,et al.A disaster-tolerant storage model and a low data failure model for data grid[J].Acta Electronica Sinica,2010,38(2):315-320.

        猜你喜歡
        副本數(shù)據(jù)量數(shù)據(jù)中心
        酒泉云計算大數(shù)據(jù)中心
        基于大數(shù)據(jù)量的初至層析成像算法優(yōu)化
        計算Lyapunov指數(shù)的模糊C均值聚類小數(shù)據(jù)量法
        高刷新率不容易顯示器需求與接口標準帶寬
        寬帶信號采集與大數(shù)據(jù)量傳輸系統(tǒng)設(shè)計與研究
        電子制作(2019年13期)2020-01-14 03:15:18
        面向流媒體基于蟻群的副本選擇算法①
        民航綠色云數(shù)據(jù)中心PUE控制
        電子測試(2018年11期)2018-06-26 05:56:24
        副本放置中的更新策略及算法*
        基于云計算的交通運輸數(shù)據(jù)中心實現(xiàn)與應用
        樹形網(wǎng)絡(luò)中的副本更新策略及算法*
        西西人体大胆视频无码| 高潮抽搐潮喷毛片在线播放| 成人毛片无码一区二区三区| 末发育娇小性色xxxxx视频| 亚洲阿v天堂网2021| 国产av乳头久久一区| 国产无套一区二区三区久久| 狠狠的干性视频| 毛茸茸性xxxx毛茸茸毛茸茸| 国产成品精品午夜视频| 精品熟女av中文字幕| 精品香蕉99久久久久网站| 国产精品三级在线观看无码| 不卡高清av手机在线观看| 日本草逼视频免费观看| 在线播放草猛免费视频| 精品丰满人妻无套内射| 四虎影视亚洲精品| 都市激情亚洲综合一区| 精品国产一区二区三区三| 国产麻豆md传媒视频| 国产在线视欧美亚综合| 中文字幕亚洲中文第一| 中文字幕亚洲欧美在线不卡| 婷婷五月综合缴情在线视频| 在线观看av片永久免费| 国产成人丝袜网站在线看| 国产不卡av一区二区三区| 无码人妻精品一区二区三区东京热| 欧美亚洲日韩国产人成在线播放 | 亚洲成a人片77777kkkkk| 国产三级精品三级男人的天堂| 国产av无码专区亚洲av蜜芽| 成人区视频| 日韩精品一区二区在线视| 欧美性猛交99久久久久99按摩| 全免费a级毛片| 亚洲免费无毛av一区二区三区| 亚洲国产av一区二区三区精品| 免费人成在线观看视频播放| 国产精品白浆视频免费观看|