田冠博
(邳州市人民醫(yī)院, 邳州 221300)
電子文件遷移由于巨大狀態(tài)空間,計(jì)算復(fù)雜性高,對服務(wù)器、磁盤、CPU等資源的要求高,需要借助兼容性強(qiáng)的模型來調(diào)節(jié)動態(tài)負(fù)載平衡,減少遷移代價,提高執(zhí)行率。云計(jì)算下電子文件遷移,綜合文件、資源方面的因素,平衡存儲單元負(fù)載,保證計(jì)算性能的重復(fù)發(fā)揮[1]。
負(fù)載平衡調(diào)整電子文件訪問的負(fù)載差異,訪問頻率、大小敏感的遷徙模型,采用占用量概念對云端資源的負(fù)載壓力進(jìn)行描述,其受以下因素影響:
(1) 訪問次數(shù)與占用量值成正比;
(2) 并發(fā)數(shù),特別是平均并發(fā)數(shù)的增加,遷移文件的占用量值隨之增加;
(3) 電子文件越大,遷移占用量值越高。
(1) 在第i次訪問前,云端存儲文件fk未被訪問,則e(fk,i)=0
(2) 在第i次訪問時,云端存儲文件fk占用量為式(1)。
(1)
其中,i—代表第i次訪問前,屬于極限值;λk代表云端系統(tǒng)第i次訪問時,文件fk的并發(fā)訪問數(shù);λ表示云端系統(tǒng)第i次訪問時,平均并發(fā)數(shù);lk表示遷移文件fk的長度。
(3) 云端系統(tǒng)在in、im時間內(nèi),為對文件fk訪問,那么e(fk,in)=e(fk,im)?im-in;
(4) 云端系統(tǒng)在發(fā)生第im訪問時,對文件fk訪問,且上一次訪問時間為in,說明如式(2)。
(2)
云端存儲單元依據(jù)文件大小,或者分塊方式占用不同存儲空間,但由于云端存儲單元異構(gòu),各單元存儲空間、訪問帶寬不同,占用量高低不能全面反映云端資源負(fù)載。為了準(zhǔn)確、清楚描述文件遷移,引入相對占用量概念[3]。
假設(shè)e(nk,i)表示相對占用量,那么i時刻云端資源存儲單元nk的相對占用量如式(3)。
(3)
其中,χj=∑φ是云端存儲單元nk上存儲的電子文件和,或者文件塊的占有量和;Lj是j存儲單元擁有的存儲空間;L是云端平均存儲空間;Sj是j存儲單元的云傳輸帶寬。
電子文件超過閾值,就會激發(fā)遷移操作。但,閾值設(shè)定存在不足,對文件訪問請求的傾斜性大。遷移觸發(fā)函數(shù)激發(fā)后,后續(xù)文件訪問請求增加,云端存儲資源快速占用,存儲單元負(fù)載增加,云計(jì)算性能驟降。REM函數(shù)基于概率計(jì)算,適用于云端存儲系統(tǒng),依據(jù)條件限制電子文件訪問。設(shè)置最大、最低負(fù)載,即Lmax、Lmin,依據(jù)兩者關(guān)系,衡量云端存儲單元的負(fù)載情況,如式(4)。
(4)
其中,p遷代表電子文件遷移概率,S下為云端存儲單元的下行帶寬,S存為云端第i個存儲單元的負(fù)載情況。
遷移對象要基于文件訪問請求,結(jié)合云端資源情況,實(shí)現(xiàn)負(fù)載平衡,否則將加重云端設(shè)備負(fù)載。文件遷移需要兼顧幾方面:
(1) 以數(shù)據(jù)塊為單元遷移。數(shù)據(jù)塊劃分有效避免大文件、大數(shù)據(jù)遷移耗時長問題,節(jié)約帶寬資源,突破云端存儲單元性能限制,對固定大小數(shù)據(jù)塊進(jìn)行遷移[4]。
(2) 遷移文件選擇與用戶請求結(jié)合,假設(shè)正在被訪問,且占用量高的文件fk,用ξi表示,那么文件占用量密度為式(5)
ξi=ei/li
(5)
其中,文件i的長度為li,第i的文件具有的占用量為ei。
假設(shè)定義云端存儲單元為遷移單元,接受遷出數(shù)據(jù)塊的存儲單元為接受單元,在接受單元的云端下行帶寬許可情況下,則有:
(1) 所有訪問數(shù)據(jù)塊bi的用戶請求為d合,則∪d合,d合?bi被發(fā)送到接收云端。
(2) 充分利用閑置帶寬,讀入bi的尾部數(shù)據(jù)bi-∪d合發(fā)送至接受單元;
(3) 出現(xiàn)新訪問文件fk的請求d新,或者未訪問數(shù)據(jù)塊bi的用戶,已經(jīng)完成一個數(shù)據(jù)塊的訪問,則用戶請求將轉(zhuǎn)到bj,以此類推,相繼訪問其他數(shù)據(jù)塊,實(shí)現(xiàn)文件遷移的用戶請求復(fù)合。
(4) 遷移過程中,無論是否出現(xiàn)新用戶訪問,或者用戶請求超過bj,都要對數(shù)據(jù)塊bj遷移,原則為閑置帶寬分配固定帶寬S固,保證文件順利遷移。
其中,v是云端為用戶請求訪問fk分配帶寬,li為云端數(shù)據(jù)的單位長度。現(xiàn)有帶寬不能滿足實(shí)際需求,遷移單元附近用戶請求撤銷,釋放帶寬滿足遷徙需求。
(5) 文件遷移擁有充足帶寬,則要保持帶寬到遷移工作完成,或者新的數(shù)據(jù)塊用戶訪問文件。
復(fù)合用戶范圍可以對云端資源負(fù)載進(jìn)行優(yōu)化,并行用戶請求,又提高閑置帶寬利用率,減少文件遷移對資源的占用量。
在消除存儲單元負(fù)載閑置的情況下,文件遷移給云端存儲帶來附加荷載,形成新的資源瓶頸,陷入“迭代”循環(huán),導(dǎo)致云端資源占用量持續(xù)增加。為避免上述問題,要求目的存儲單元i具有低占用量Q低,并實(shí)現(xiàn)在接收數(shù)據(jù)塊bj后的相對占用量最小,如式(6)。
(6)
輸入:云端存儲單元數(shù)為m,遷移文件數(shù)量為n;
云端系統(tǒng):D={D1,D2…,D3},Dj=(Lj,Sj,Qj);其中,Qj為第j個存儲單元具有的相對占用量,
存儲文件:F={F1,F(xiàn)2…,F(xiàn)3},F(xiàn)i=(li,Qi);
訪問文件:fk為第k次訪問時所訪問文件;
輸出:云端負(fù)載平衡的所有操作;
步驟1:依據(jù)存儲單元(Dj,Sj),判斷第j個存儲單元是否達(dá)到閾值,并觸發(fā)文件遷移操作;
步驟2:所有已觸發(fā)云端文件遷移的操作Dj,遷移訪問占有量密度最高的數(shù)據(jù)塊文件;
步驟3:選擇占有量適合的接受單元,進(jìn)行文件遷移操作。
通過仿真實(shí)驗(yàn)驗(yàn)證基于云計(jì)算環(huán)境的電子文件遷移模型的時間優(yōu)化下過,訪問請求為合成負(fù)載方式。以傳統(tǒng)磁盤冷卻法為比較對象,驗(yàn)證試驗(yàn)效果。
表1 初始值設(shè)置
訪問量對模型分析非常重要,但不能全面反映訪問有效率,所以采用x/y分布方式產(chǎn)生訪問序列,實(shí)現(xiàn)x%請求訪問y%文件[6]。假設(shè)文件ID為1-50,對于任意x/y參數(shù)請求,可以依據(jù)公式3,計(jì)算每個文件的訪問概率。本文通過改變文獻(xiàn)ID實(shí)現(xiàn)負(fù)載動態(tài)分析,以每100次訪問為周期ζ,對i文件訪問,則其動態(tài)負(fù)載為i=(i+ζ)/50%。
連續(xù)對云端存儲進(jìn)行10組模擬試驗(yàn),每組試驗(yàn)符合3.1節(jié)的測試環(huán)境,隨機(jī)生成存儲單元和文件,按照3.2節(jié)的負(fù)載計(jì)算,生成文件訪問序列。對比傳統(tǒng)磁盤冷卻算法和無負(fù)載情況下的云端電子文件遷移,按照1 s、3 s、6 s、9 s的時間間隔的100次云端文件訪問請求,計(jì)算出平均處理時間和吞吐量。相對于冷卻算法的相對負(fù)載說,無平衡策略以初始云端存儲單元的5個文件為依托,云端存儲單元在任何條件下均不進(jìn)行負(fù)載平衡。平均請求處理時間=請求運(yùn)行總時間/訪問請求總數(shù),比值越大云端處理能力越弱。平均吞吐量=單位時間內(nèi)處理訪問次數(shù)/處理時間,比值越大云端占用量越低。不同時間間隔下的平均處理時間、平均等待時間的比值,如圖1所示。
圖1 不同模型下文件遷移處理時間
在不同負(fù)載情況下,云計(jì)算下的電子遷移模型優(yōu)于傳統(tǒng)磁盤冷卻模型效果,不會增加云端負(fù)載量,節(jié)省資源占用量。
本文提出體現(xiàn)文件訪問對云計(jì)算負(fù)載的文件遷移模型,給出適合云端存儲結(jié)構(gòu)的遷移觸發(fā)函數(shù),復(fù)合用戶訪問的遷移文件選擇、遷移過程實(shí)現(xiàn)。最后,構(gòu)建符合上述要求模型,并進(jìn)行模擬仿真實(shí)驗(yàn)。相對于磁盤冷卻模型來說,云計(jì)算環(huán)境下負(fù)載平衡文件遷移模型,在處理時間、吞吐量、資源占用量方面更優(yōu),提高云端系統(tǒng)的相應(yīng)性能。然而,在云計(jì)算處理速度、云端資源優(yōu)化方面研究尚存在不足,有待于進(jìn)一步研究和分析。