摘 要: 當(dāng)前計(jì)算機(jī)數(shù)據(jù)存儲備份面臨著較大壓力,加強(qiáng)存儲備份技術(shù)研究可有效防止數(shù)據(jù)的破壞與丟失。對計(jì)算機(jī)數(shù)據(jù)存儲系統(tǒng)進(jìn)行了分類和技術(shù)對比,并對數(shù)據(jù)備份技術(shù)做了分類與介紹,明確了各種技術(shù)的優(yōu)缺點(diǎn)與應(yīng)用范圍,為計(jì)算機(jī)數(shù)據(jù)的存儲災(zāi)備提供幫助與參考。
關(guān)鍵詞: 計(jì)算機(jī)數(shù)據(jù)存儲備份; 災(zāi)備; 數(shù)據(jù)備份技術(shù); 數(shù)據(jù)分類
中圖分類號: TN710?34 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2015)03?0149?03
Classification and comparative analysis of computer data storage backup
LI Ning
(Xi’an Railway Vocational Technical Institute, Xi’an 710014, China)
Abstract: In recent years, computer data storage backup is faced with high pressure. The research of computer data storage backup technology can effectively prevent data destruction and loss. In this paper, the classification and technology comparison of the computer data storage systems are carried on. The technologies of computer data storage backups are classified and introduced. The advantages, disadvantages and application scopes of various data backup technologies are defined, by which some help and reference are supposed to be provided for disaster recovery of computer data.
Keywords: computer data storage backup; disaster recovery; data backup technology; data classification
0 引 言
現(xiàn)代科學(xué)技術(shù)的快速發(fā)展使得網(wǎng)絡(luò)與計(jì)算機(jī)進(jìn)入了相對繁榮的時期.計(jì)算機(jī)的大量增加使得數(shù)據(jù)開始向TB、PB、EB級別進(jìn)展,無論是存儲備份還是災(zāi)備都面臨著巨大壓力與挑戰(zhàn),尤其是云計(jì)算、物聯(lián)網(wǎng)等新潮流的到來,更是進(jìn)一步加重了對計(jì)算機(jī)數(shù)據(jù)存儲備份的威脅。為防止計(jì)算機(jī)數(shù)據(jù)的破壞與丟失,研究數(shù)據(jù)存儲備份技術(shù)顯得必要且迫切,其不僅能夠?yàn)榧夹g(shù)的開發(fā)、應(yīng)用提供充足的理論基礎(chǔ),還可為提升技術(shù)的可行性、方便未來的推廣做出重要貢獻(xiàn),提供極高的參考應(yīng)用價值。
1 計(jì)算機(jī)數(shù)據(jù)存儲系統(tǒng)的分類與對比
計(jì)算機(jī)數(shù)據(jù)存儲技術(shù)經(jīng)歷了從DAS(基于服務(wù)器的存儲)、SCSI(基于磁盤陣列的存儲)到NAS、SAN(基于網(wǎng)絡(luò)的存儲)的發(fā)展歷史,無論是數(shù)據(jù)讀/寫速度還是存儲容量都有了質(zhì)的飛躍。目前衡量數(shù)據(jù)存儲設(shè)備性能的兩大主要參數(shù)分別是秒傳輸量與秒輸入/輸出量。
1.1 數(shù)據(jù)存儲系統(tǒng)分類
DAS(直接依附)、NAS(網(wǎng)絡(luò)依附存儲系統(tǒng))與SAN(存儲區(qū)域網(wǎng)絡(luò))三者是目前普遍應(yīng)用的數(shù)據(jù)存儲技術(shù)。
DAS技術(shù)以服務(wù)器為中心,其存儲設(shè)備直接與服務(wù)器或者客戶器后端相連接,存儲備份也依靠服務(wù)器與客戶機(jī)控制完成,其本身只是單純的存儲備份載體,并沒有專門操作系統(tǒng),需要在服務(wù)器或者客戶機(jī)上由第三方軟件進(jìn)行專門操控,在服務(wù)器提供其他服務(wù)或者用戶數(shù)量增加時,運(yùn)行響應(yīng)速度不可避免會變慢,因此隨著千兆以太網(wǎng)的普及應(yīng)用,制約其發(fā)展的瓶頸越來越典型,在應(yīng)用與推廣方面變得困難重重,應(yīng)用范圍不斷縮小。DAS拓?fù)浣Y(jié)構(gòu)示意圖如圖1所示。
NAS技術(shù)以網(wǎng)絡(luò)為中心面向文件提供存儲服務(wù),其存儲設(shè)備是單獨(dú)作為文件服務(wù)器與網(wǎng)絡(luò)相連,數(shù)據(jù)的存儲應(yīng)用部分并不在同一服務(wù)器,所以設(shè)備數(shù)據(jù)其實(shí)都存儲在NAS設(shè)備中,通過網(wǎng)絡(luò)LAN接口與文件系統(tǒng)服務(wù)器相連接。這種性質(zhì)決定了NAS的網(wǎng)絡(luò)獨(dú)立性,即使遇到用戶數(shù)量增加或者運(yùn)行服務(wù)過多等情況也不至于像DAS技術(shù)一樣導(dǎo)致服務(wù)器過載,影響運(yùn)行響應(yīng)速度,所以NAS存儲備份模式下網(wǎng)絡(luò)運(yùn)行性能還是較為可靠的[1]。NAS拓?fù)浣Y(jié)構(gòu)示意圖如圖2所示。
SAN簡單來說是依靠光纖通道的高傳輸速度與大容量實(shí)現(xiàn)服務(wù)器與存儲設(shè)備之間聯(lián)系的網(wǎng)絡(luò)結(jié)構(gòu)。二者通過高帶寬FC交換機(jī)連接,可隨時完成應(yīng)用工作站到局域網(wǎng)的訪問,存儲設(shè)備之間的存儲數(shù)據(jù)交換也可以直接越過服務(wù)器,減少了數(shù)據(jù)交換與傳輸帶來的網(wǎng)絡(luò)沖突與堵塞,減少了服務(wù)器運(yùn)行荷載的壓力,可顯著提升系統(tǒng)整體運(yùn)行的靈活性與伸縮性,這也是現(xiàn)今SAN技術(shù)備受關(guān)注的原因所在,其是目前計(jì)算機(jī)存儲備份領(lǐng)域最引人注目的技術(shù)之一[2]。SAN技術(shù)的優(yōu)勢在于不僅可以更加快捷、簡便地完成數(shù)據(jù)資源的存儲應(yīng)用,還可對這些龐大的數(shù)據(jù)資源實(shí)施集中管理,直接提升了應(yīng)用與管理的便利性,因而具有較好的應(yīng)用與發(fā)展前景。SAN技術(shù)以光纖為接口決定了其擁有其他技術(shù)不可比擬的高傳輸速度。高性能、高擴(kuò)展性的光纖網(wǎng)絡(luò)、光纖交換機(jī)與存儲陣列可提供更大的服務(wù)器擴(kuò)展空間與吞吐量。在存儲管理方面,SAN技術(shù)直接提供了存儲、備份系統(tǒng)與系統(tǒng)相連接的架構(gòu),數(shù)據(jù)在以太網(wǎng)絡(luò)上流通直接提升了網(wǎng)絡(luò)運(yùn)行性能,用戶可以獲得一個與服務(wù)器分開的存儲管理理念,文件的存儲、備份、恢復(fù)與安全管理都將變得更加可靠與簡便,依靠網(wǎng)絡(luò)方式連接的不同存儲池在數(shù)據(jù)交換、共享方面具有更多優(yōu)勢,用戶訪問數(shù)據(jù)的安全性與完全性得到了保障[3]。SAN技術(shù)的另一優(yōu)勢在于簡易擴(kuò)容與高效容錯性能,只需要加入新的SAN設(shè)備做簡單設(shè)置即可實(shí)現(xiàn)在線擴(kuò)容配置,即使存儲設(shè)備有損壞丟失情況也不會影響整體數(shù)據(jù)的完整性與安全性,通過更換損壞硬盤即可做數(shù)據(jù)容災(zāi)與備份,而無需重啟磁盤陣列,在數(shù)據(jù)災(zāi)備方面具有天然優(yōu)勢。SAN拓?fù)浣Y(jié)構(gòu)示意圖如圖3所示。
1.2 數(shù)據(jù)存儲系統(tǒng)的對比
與傳統(tǒng)的磁盤陣列相比,NAS技術(shù)已經(jīng)突破單純存儲介質(zhì)的限制,是一臺具有自己核心、操作系統(tǒng)與磁盤系統(tǒng)的服務(wù)器。傳統(tǒng)磁盤陣列需要通過服務(wù)器與第三方軟件完成控制管理,缺乏自我管理核心,操作算法效率低,尤其是在處理大流量數(shù)據(jù)時會直接造成服務(wù)器運(yùn)行負(fù)荷超載,導(dǎo)致響應(yīng)速度變慢,與之相對的是,NAS有著自己完整的文件管理系統(tǒng),磁盤操作算法得到了優(yōu)化與提高,多個磁頭臂的同時讀/寫大大提升了運(yùn)行響應(yīng)速度和處理速度,提升了讀/寫效率,減少了文件管理失誤,有益于提升網(wǎng)絡(luò)和服務(wù)器運(yùn)行性能。與SAN相比,NAS管理的文件,只是在RAID的基礎(chǔ)上增加了存儲操作系統(tǒng)和TCP/IP訪問協(xié)議,但是SAN作為獨(dú)立的數(shù)據(jù)管理網(wǎng)絡(luò),其通過光纖通道和交換機(jī)訪問數(shù)據(jù),存儲設(shè)備之間數(shù)據(jù)交換不需要通過服務(wù)器,管理的對象是磁盤空間,追求的是更高的存儲性能與處理速度,比起NAS具有更多的應(yīng)用優(yōu)勢,當(dāng)然數(shù)據(jù)存儲備份成本也會相應(yīng)增加。
2 計(jì)算機(jī)數(shù)據(jù)備份系統(tǒng)的分類與對比
計(jì)算機(jī)數(shù)據(jù)備份效果與多種因素有關(guān),比如用戶備份需求、資金投入程度等,如果想要效果較好的災(zāi)備方案則需要較大投入,因此,災(zāi)備方案的選擇要根據(jù)自身情況選擇一些性價比較高的專業(yè)方案。目前廣泛應(yīng)用的數(shù)據(jù)備份方式主要以數(shù)據(jù)冷備份、暖備份和熱備份為主。
2.1 冷備份
冷備份是一種技術(shù)結(jié)構(gòu)簡單、成本較低的災(zāi)備方式,主要以打孔器、磁帶機(jī)等進(jìn)行定期存數(shù)備份,處理后的數(shù)據(jù)被分別備份以實(shí)現(xiàn)災(zāi)備。從這種描述就可看出冷備份技術(shù)含量低、易于實(shí)現(xiàn)且應(yīng)用成本低,但是其也存在著巨大的不足,一是備份數(shù)據(jù)轉(zhuǎn)移較為麻煩,且一旦被破壞,恢復(fù)時間慢,一旦備份介質(zhì)出現(xiàn)問題很有可能永遠(yuǎn)無法恢復(fù),因此主要適用于經(jīng)費(fèi)或者周期緊張時段的數(shù)據(jù)備份,適合一些中小企業(yè)和個人系統(tǒng)應(yīng)用。
2.2 熱備份
熱備份是目前所有備份技術(shù)中效果最好、恢復(fù)最快的一種備份方式,這種備份技術(shù)需要設(shè)置專門的災(zāi)備設(shè)備與技術(shù)中心,通過光纖通道與需備份服務(wù)器之間實(shí)現(xiàn)連接,在專門軟件輔助下實(shí)時對備份服務(wù)器進(jìn)行監(jiān)控與自動探測,在災(zāi)備系統(tǒng)安裝完成后不需要人工操作即可完成災(zāi)備工作,在監(jiān)控服務(wù)器出現(xiàn)故障與問題時自動進(jìn)行備份,完成數(shù)據(jù)轉(zhuǎn)移操作。但是暖備份技術(shù)目前還有較多不足,比如專用災(zāi)備設(shè)備價格昂貴、安裝復(fù)雜,需要配備專門的管理設(shè)備與軟件,且只能實(shí)現(xiàn)點(diǎn)對點(diǎn)傳輸,擴(kuò)容性、容錯性與擴(kuò)展性交叉,初期安裝技術(shù)難度和施工難度較高,且對設(shè)備廠商依賴程度較高,因此適用范圍較窄[4]。目前熱備份技術(shù)主要在一些對數(shù)據(jù)存儲高安全性、高可靠性、實(shí)時性要求較多的時候才予以使用,或者超大規(guī)模的應(yīng)用系統(tǒng)與企業(yè)計(jì)算機(jī)數(shù)據(jù)服務(wù)中心才予以采用。
2.3 暖備份
暖備份是一種成本與技術(shù)難度介于冷備份與熱備份之間的技術(shù),是二者的折衷方案,也是目前應(yīng)用最為普遍的一種備份技術(shù)方案。它主要是通過設(shè)置硬盤遠(yuǎn)程鏡像、數(shù)據(jù)庫復(fù)制、災(zāi)備中心等以實(shí)現(xiàn)對存儲數(shù)據(jù)的完全備份。
硬盤遠(yuǎn)程鏡像是通過設(shè)置與主服務(wù)器相對較差的另一服務(wù)器和眾多磁盤陣列硬盤完成數(shù)據(jù)存儲,通過光纖通道與RAID技術(shù)完成數(shù)據(jù)的傳輸與備份,作為一種成本與技術(shù)難度相對較低的方案,雖然實(shí)現(xiàn)難度不大,但是光纖鋪設(shè)需耗費(fèi)不少的費(fèi)用,且有一定距離限制,尤其是它采用的不是同步復(fù)制技術(shù),所以數(shù)據(jù)的同步存儲方面不免存在問題,但是在較大范圍內(nèi)并不會嚴(yán)重干擾使用。數(shù)據(jù)庫復(fù)制技術(shù)的實(shí)現(xiàn)與硬盤鏡像技術(shù)較為類似,二者的主要差別在于具體存儲方式,但是數(shù)據(jù)庫復(fù)制技術(shù)可很好地解決存儲不同步問題,可利用數(shù)據(jù)庫軟件的強(qiáng)大恢復(fù)功能實(shí)現(xiàn)備份,比RAID技術(shù)更加科學(xué)、可靠[5]。所以,數(shù)據(jù)庫復(fù)制技術(shù)的優(yōu)勢在于數(shù)據(jù)同步存儲問題得到了解決,盡管因數(shù)據(jù)庫差異只能進(jìn)行同廠商之間的數(shù)據(jù)傳輸,無法與其他廠商數(shù)據(jù)庫做跨庫操作,兼容性較差,但是不失為解決災(zāi)備問題的一種有效方式。暖備份的災(zāi)備中心的概念與熱備份中所提到的災(zāi)備中心有一定差別。暖備份的災(zāi)備中心主要是在企業(yè)公司或者機(jī)關(guān)所在地設(shè)置一個較大的數(shù)據(jù)備份中心,以該中心為核心完成對整體結(jié)構(gòu)內(nèi)全部數(shù)據(jù)的存儲和災(zāi)備管理。比如跨國跨區(qū)域的企業(yè)數(shù)據(jù)備份,數(shù)據(jù)暖備份應(yīng)用如圖4所示。這種災(zāi)備方式相對來說對距離限制較小,可實(shí)現(xiàn)對遠(yuǎn)程分支結(jié)構(gòu)數(shù)據(jù)存儲和備份的管理,并且可適用于各種網(wǎng)絡(luò)架構(gòu),如FDDI,PSTN,DDN等,投資相對熱備份較低,且擴(kuò)容性、容錯性都較好,技術(shù)難度相對較低,系統(tǒng)擴(kuò)展只需要增加接駁分支機(jī)構(gòu)的接口即可。這種備份技術(shù)方案的缺點(diǎn)在于實(shí)現(xiàn)需要較為詳細(xì)的計(jì)劃作為指導(dǎo),比如數(shù)據(jù)備份間隔設(shè)置、備份數(shù)據(jù)包格式等,需要謹(jǐn)慎仔細(xì)的計(jì)劃才能夠確保其順利完成災(zāi)備。
3 結(jié) 語
綜上所述,計(jì)算機(jī)數(shù)據(jù)存儲備份技術(shù)的研究對于應(yīng)對當(dāng)前龐大的數(shù)據(jù)管理壓力有積極意義,明確各種技術(shù)的優(yōu)缺點(diǎn)與適用范圍可更好地推進(jìn)技術(shù)升級應(yīng)用,從而有效防范數(shù)據(jù)的破壞與丟失,在隨后的存儲災(zāi)備技術(shù)研究中,可有助于提升技術(shù)安全性與可靠性,方便技術(shù)大范圍的推廣與應(yīng)用。
參考文獻(xiàn)
[1] 于洋.計(jì)算機(jī)數(shù)據(jù)存儲備份探討[J].制造業(yè)自動化,2011(16):134?136.
[2] 李偉.基于SAN架構(gòu)的數(shù)據(jù)存儲和備份系統(tǒng)[J].電腦知識與技術(shù),2010,6(20):5406?5407.
[3] 呂廣平.計(jì)算機(jī)磁盤陣列及異地容災(zāi)備份系統(tǒng)分析[J].科技傳播,2012(7):161?162.
[4] 王帆飛.國土資源空間數(shù)據(jù)存儲備份系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)與現(xiàn)代化,2012(3):190?193.
[5] 呂小婷,施艷,張振芳.存儲局域網(wǎng)(SAN)在地質(zhì)調(diào)查數(shù)據(jù)存儲中的應(yīng)用[J].地質(zhì)通報(bào),2012(9):1531?1536.
[6] 申新鵬,曾雷杰,趙曉.磁盤陣列上虛擬磁盤的管理[J].現(xiàn)代電子技術(shù),2010,33(20):144?146.