周益帆 吳詠
摘要:檢查點(diǎn)機(jī)制是高性能計(jì)算平臺(tái)的一項(xiàng)重要特性。它能夠在程序運(yùn)行的某一時(shí)刻保存程序的運(yùn)行狀態(tài),并在系統(tǒng)故障后恢復(fù)程序狀態(tài)繼續(xù)執(zhí)行。由于文件操作在應(yīng)用程序中的普遍性,支持文件回卷對(duì)于檢查點(diǎn)技術(shù)來(lái)說(shuō)是十分必要的。文件數(shù)據(jù)備份可以使文件在回卷后恢復(fù)到正常狀態(tài),但是開(kāi)銷太大。本文提出了一種基于行為特征的文件檢查點(diǎn)優(yōu)化策略(BBFC),能夠提供文件數(shù)據(jù)的正確恢復(fù),有效保證了程序回卷恢復(fù)到上一個(gè)檢查點(diǎn)時(shí)文件狀態(tài)與進(jìn)程其它狀態(tài)保持一致。BBFC對(duì)文件行為特征進(jìn)行分類,并根據(jù)這些行為特征采取相應(yīng)的保存恢復(fù)策略,從而在很大概率上減少了檢查點(diǎn)間隔需要保存的文件內(nèi)容,降低了文件檢查點(diǎn)的時(shí)間、空間開(kāi)銷。它對(duì)用戶透明,簡(jiǎn)單易用。
關(guān)鍵詞:計(jì)算機(jī)軟件;文件檢查點(diǎn);行為特征;回卷恢復(fù);一致性;檢查點(diǎn)間隔
0引言
隨著信息技術(shù)的發(fā)展,人們對(duì)計(jì)算機(jī)的依賴性日益增強(qiáng)??茖W(xué)計(jì)算、數(shù)據(jù)分析、信息處理等各種問(wèn)題的解決都離不開(kāi)計(jì)算機(jī),計(jì)算機(jī)系統(tǒng)的可靠性也越來(lái)越受到廣泛關(guān)注。檢查點(diǎn)機(jī)制作為系統(tǒng)容錯(cuò)的一項(xiàng)重要手段,能夠在進(jìn)程運(yùn)行的某一時(shí)刻保存當(dāng)時(shí)進(jìn)程的運(yùn)行狀態(tài)到磁盤文件,并在需要的時(shí)候從保存的磁盤文件中恢復(fù)進(jìn)程狀態(tài)繼續(xù)執(zhí)行下去。檢查點(diǎn)機(jī)制能夠避免在系統(tǒng)故障后程序從頭開(kāi)始執(zhí)行帶來(lái)的計(jì)算損失,也給無(wú)法滿足長(zhǎng)時(shí)間占用計(jì)算資源的應(yīng)用場(chǎng)景提供了便利的解決方案。
文件讀寫是應(yīng)用程序的一個(gè)普遍行為。很多程序在正常運(yùn)行時(shí)離不開(kāi)對(duì)數(shù)據(jù)的處理和對(duì)文件的訪問(wèn),因此在檢查點(diǎn)中實(shí)現(xiàn)文件的可恢復(fù)性是至關(guān)重要的。文件檢查點(diǎn)能夠提供文件數(shù)據(jù)內(nèi)容的正確恢復(fù),使得程序回卷到上一個(gè)檢查點(diǎn)時(shí),文件內(nèi)容與進(jìn)程的其它狀態(tài)保持一致。在檢查點(diǎn)中包含文件數(shù)據(jù)內(nèi)容能夠解決這一問(wèn)題,但是由于實(shí)際應(yīng)用中大文件越來(lái)越多,保存文件內(nèi)容所帶來(lái)的開(kāi)銷不容忽視。
本文提出了一種基于行為特征的文件檢查點(diǎn)優(yōu)化策略,可以在很大概率上減少檢查點(diǎn)間隔需要保存的文件內(nèi)容,從而大大減小了因文件檢查點(diǎn)給系統(tǒng)正常運(yùn)行帶來(lái)的額外開(kāi)銷,讓檢查點(diǎn)技術(shù)更為實(shí)用。endprint