徐 俠
(中國三峽集團(tuán)信息中心)
現(xiàn)在集團(tuán)公司的許多管理工作都需要通過網(wǎng)絡(luò)來完成。同時(shí)也有許多重要的企業(yè)經(jīng)營、管理、個(gè)人資料以數(shù)據(jù)的形式集中保存信息系統(tǒng)中,數(shù)據(jù)的積累和增長速度很快。目前集團(tuán)公司信息系統(tǒng)管理面臨的最大挑戰(zhàn)之一是如何處理對大量數(shù)據(jù)的透明存取和備份工作,同時(shí)網(wǎng)絡(luò)的規(guī)模越大、系統(tǒng)應(yīng)用的越深入、數(shù)據(jù)量越多,數(shù)據(jù)的安全對于企業(yè)的運(yùn)轉(zhuǎn)也越來越顯得重要,這就提出了數(shù)據(jù)存儲(chǔ)備份/恢復(fù)管理方面的要求。
為保證集團(tuán)公司重要信息系統(tǒng)的數(shù)據(jù)安全,應(yīng)對可能出現(xiàn)的信息系統(tǒng)災(zāi)難事故,集團(tuán)公司信息中心于2005年組織實(shí)施了集團(tuán)公司信息系統(tǒng)集中存儲(chǔ)備份項(xiàng)目(主要架構(gòu)見下圖一),隨后又每年組織開展信息系統(tǒng)災(zāi)難恢復(fù)應(yīng)急測試演練,收到了很好的成效,也使集團(tuán)公司信息安全水平上升到一個(gè)新的臺(tái)階。
但隨著集團(tuán)公司信息化建設(shè)的不斷發(fā)展,信息系統(tǒng)規(guī)模和數(shù)據(jù)量越來越大、系統(tǒng)架構(gòu)日趨復(fù)雜,原有的信息系統(tǒng)數(shù)據(jù)備份系統(tǒng)逐漸不能滿足新形式下的需要,主要表現(xiàn)在以下方面:
圖 一
1)原來采用磁帶庫備份方式,磁帶介質(zhì)長期使用后,數(shù)據(jù)保存穩(wěn)定性下降,有可能出現(xiàn)恢復(fù)不了的情況。
2)集團(tuán)公司信息系統(tǒng)用戶迅速增加,海量數(shù)據(jù)使正常的備份專業(yè)耗時(shí)很長,過長的備份時(shí)間嚴(yán)重?cái)D壓了重要業(yè)務(wù)系統(tǒng)的備份窗口。為保證整個(gè)系統(tǒng)的正常運(yùn)行,只能將當(dāng)初執(zhí)行的部分重要業(yè)務(wù)系統(tǒng)的每日備份策略調(diào)整為每周備份。
3)由于數(shù)據(jù)量較大,原來磁帶庫設(shè)備陳舊,老型號(hào)單盤磁帶容量小,磁帶介質(zhì)數(shù)量有限,已不能保留較長周期的備份數(shù)據(jù)。
4)物理磁帶無重復(fù)數(shù)據(jù)刪除功能,多次備份后,一個(gè)數(shù)據(jù)備份集可能存放到了多盒磁帶上,磁帶恢復(fù)的線性尋址機(jī)制決定了數(shù)據(jù)恢復(fù)時(shí)間延長若干倍,大大增加了系統(tǒng)的恢復(fù)時(shí)間。
5)原系統(tǒng)使用TSM備份軟件版本為5.3及5.4,已不能完全支持新采購的磁帶庫設(shè)備;若更換備份軟件,需要重新采購軟件并重新部署,資金成本和人員掌握新技術(shù)的成本較大。
磁帶技術(shù)一直都是數(shù)據(jù)備份/恢復(fù)系統(tǒng)的主力軍,但伴隨著新一代ATA磁盤技術(shù)的出現(xiàn),使更便捷、更高效的備份/恢復(fù)解決方案成為可能。本文在對兩種新備份技術(shù)——基于主機(jī)的磁盤到磁盤(Disk-to-Disk,簡稱D2D)技術(shù)和虛擬磁帶庫(Virtual Tape Library, 簡稱VTL)技術(shù)研究后,提出一套新的基于虛擬化技術(shù)——即多個(gè)VTL應(yīng)用技術(shù)的信息系統(tǒng)備份架構(gòu),作為三峽集團(tuán)信息系統(tǒng)數(shù)據(jù)備份方式,用于解決信息系統(tǒng)數(shù)據(jù)量不斷增大的備份問題。
D2D技術(shù)是把磁盤直接作為備份介質(zhì)來使用的,本質(zhì)是通過軟件備份后的系統(tǒng)數(shù)據(jù)文件直接寫入其它的文件系統(tǒng)進(jìn)行存放,并不是用原文件的格式和普通的寫方法,把備份文件以大塊為單位放在一個(gè)大文件中。通過對D2D技術(shù)的實(shí)現(xiàn)方式進(jìn)行分析,其優(yōu)勢和存在的問題如下:
D2D的優(yōu)勢:
1)充分利用了磁盤的隨機(jī)讀寫性能,效率比傳統(tǒng)的磁帶備份方式高很多,也高于進(jìn)行順序讀寫的虛擬磁帶庫(VTL)方式。
2)充分利用了文件系統(tǒng)的多線程技術(shù),在多個(gè)備份任務(wù)并發(fā)的情況下,不象VTL要受虛擬驅(qū)動(dòng)器數(shù)量的限制。
3)D2D備份的數(shù)據(jù)讀取訪問方便,可以靈活的把數(shù)據(jù)遷移到不同的OS文件卷下。
D2D存在的問題:
1)需要重新調(diào)整部署系統(tǒng),不能與現(xiàn)有備份環(huán)境無縫整合,需改變硬件架構(gòu)、備份策略及管理策略。
2)結(jié)合內(nèi)置或外接RAID存儲(chǔ)陣列的備份/恢復(fù)軟件的D2D性能依賴類似NTFS或NFS的文件系統(tǒng),它們是為了在服務(wù)器系統(tǒng)中使用生產(chǎn)運(yùn)行環(huán)境而生成的。這些文件系統(tǒng)設(shè)計(jì)用來為多個(gè)用戶管理多個(gè)文件,當(dāng)用于以磁帶方式的備份會(huì)出現(xiàn)的問題是,在磁帶備份應(yīng)用軟件與文件系統(tǒng)文件分配表結(jié)合來決定具體的文件位置時(shí),存儲(chǔ)系統(tǒng)處理器會(huì)發(fā)生附加的、不必要的性能沖突。
3)D2D在UNIX SAN環(huán)境下的LAN Free備份,如要把數(shù)據(jù)集中存放在統(tǒng)一卷下,需要共享卷軟件來支持,會(huì)提高使用成本。
4)類似FAT、NFS和NTFS的通用文件系統(tǒng)受到文件系統(tǒng)、分區(qū)和單個(gè)文件大小的限制。此外,一個(gè)文件系統(tǒng)上文件的數(shù)目也有限制。這些限制會(huì)約束基于主機(jī)的D2D應(yīng)用軟件所使用的備份卷的擴(kuò)容性,當(dāng)達(dá)到限制時(shí),企業(yè)將投入額外的開銷,還必須轉(zhuǎn)移數(shù)據(jù),創(chuàng)建新卷,重新配置備份應(yīng)用軟件。
5)大多數(shù)D2D文件系統(tǒng)的另一個(gè)主要問題是系統(tǒng)中數(shù)據(jù)的安全性,懷有不良動(dòng)機(jī)的黑客、病毒會(huì)威脅通用的文件系統(tǒng)。任何D2D系統(tǒng)都會(huì)遇到同樣的安全問題,可能導(dǎo)致數(shù)據(jù)保護(hù)方案的失敗。
6)對于現(xiàn)有的任何規(guī)模的IT環(huán)境,完全放棄原有的磁帶架構(gòu)備份方式,全部轉(zhuǎn)變到基于磁盤的策略并不很容易實(shí)現(xiàn)。大多數(shù)企業(yè)組織已經(jīng)大筆投資建立了已有的備份結(jié)構(gòu),并運(yùn)用現(xiàn)有的磁帶技術(shù),形成了較完善的管理制度和流程,培養(yǎng)了一批熟悉磁帶架構(gòu)備份方式的技術(shù)人員,要完全轉(zhuǎn)型,難度很大。
VTL是基于磁盤的備份系統(tǒng),其仿真一種或多種磁帶庫和/或磁帶格式,具備帶庫的接口、驅(qū)動(dòng)器和磁帶槽位等有大外部特征,同時(shí)內(nèi)部也是采用進(jìn)行順序讀寫的指令集作。VTL是一個(gè)完全集成的解決方案,它包括磁帶仿真服務(wù)器、ATA RAID陣列和為磁帶備份優(yōu)化的文件系統(tǒng)。多數(shù)情況下,VTL還提供給以往管理員所熟悉的相同的介質(zhì)管理功能(如磁帶編目、介質(zhì)是否有效等),完全模仿了一個(gè)真實(shí)的帶庫,能被所有的備份軟件來調(diào)用。
VTL的優(yōu)點(diǎn):
1)與以往的磁帶庫方式相比較,其采用高速的磁盤取代磁帶,加快了讀寫的速度,縮短了備份窗口。
2)由于其仿真一種或多種磁帶庫,對其它的應(yīng)用系統(tǒng)而言,系統(tǒng)部署的變化完全透明,能與現(xiàn)有備份環(huán)境無縫整合,無需改變硬件架構(gòu)、備份策略及管理策略。
3)基于VTL,可以擴(kuò)展為D2D2T的多級(jí)方式,數(shù)據(jù)實(shí)現(xiàn)備份至虛擬磁帶庫,再備份到傳統(tǒng)的物理磁帶庫,虛擬磁帶庫支持物理磁帶直接出庫功能,這對于需要進(jìn)行以磁帶方式進(jìn)行歸檔和異地存放的用戶非常重要。
4)虛擬磁帶無需經(jīng)過備份服務(wù)器,就能配合與系統(tǒng)直接相連的磁帶庫導(dǎo)出到物理磁帶,導(dǎo)出過程對備份服務(wù)器的性能完全沒有影響,用戶可以選擇在生產(chǎn)時(shí)間內(nèi)將虛擬磁帶轉(zhuǎn)換成物理磁帶,大幅提升了磁帶備份的品質(zhì)與效率。
5)虛擬磁帶能應(yīng)用重復(fù)數(shù)據(jù)刪除后再壓縮,節(jié)省大量存儲(chǔ)空間,且重復(fù)數(shù)據(jù)刪除和壓縮等操作,都是在備份完成后進(jìn)行的,其過程完全不影響備份速度和應(yīng)用服務(wù)器的性能,備份窗口可以獲得最完整的保護(hù)。
6)可以擴(kuò)展遠(yuǎn)程復(fù)制功能,用戶可以利用WAN廣域網(wǎng)絡(luò)將備份數(shù)據(jù)復(fù)制到遠(yuǎn)程,實(shí)現(xiàn)異地災(zāi)備,并可通過加密功能防止數(shù)據(jù)在網(wǎng)絡(luò)傳輸過程中被惡意竊取。在執(zhí)行遠(yuǎn)程復(fù)制時(shí),本地和遠(yuǎn)程的VTL會(huì)自動(dòng)比對單一存儲(chǔ)區(qū)內(nèi)有無相同數(shù)據(jù),僅有不重復(fù)的數(shù)據(jù)才會(huì)被復(fù)制并傳送到遠(yuǎn)程。相對于傳統(tǒng)的以人力運(yùn)送磁帶的異地備份方式,VTL的遠(yuǎn)程備份不僅沒有數(shù)據(jù)遺失的風(fēng)險(xiǎn),還能同時(shí)節(jié)省存儲(chǔ)空間、寬帶網(wǎng)絡(luò)占用、磁帶運(yùn)輸及保管費(fèi)用等多項(xiàng)支出,大幅節(jié)省了IT投資成本。
VTL的缺點(diǎn):
1)VTL模擬磁帶順序讀寫方式,不能充分發(fā)揮磁盤的效率。
2)VTL的效率要受到虛擬驅(qū)動(dòng)個(gè)數(shù)的限制。
3)VTL的備份策略設(shè)置與磁帶庫完全一樣,比較復(fù)雜。
通過上面的分析,純粹要提升備份、還原速度的話,磁盤對磁盤(Disk to Disk,D2D)的備份就可以作得到,但企業(yè)級(jí)的備份系統(tǒng)架構(gòu)不能只關(guān)注在效能,更應(yīng)該關(guān)注成本與管理兩個(gè)層面。
磁盤備份通常是在備份軟件里的一個(gè)功能,因此不具備虛擬磁帶庫的許多功能,在介質(zhì)管理及空間回收方面會(huì)帶來很大不便,用戶很可能會(huì)由于磁盤空間的管理不善而導(dǎo)致備份數(shù)據(jù)的損壞。
磁盤備份是基于操作系統(tǒng)上的文件系統(tǒng)來進(jìn)行,文件系統(tǒng)是I/O性能的一大瓶頸;而虛擬磁帶庫的數(shù)據(jù)是通常是寫在由VTL軟件管理的裸設(shè)備上的,避免了文件系統(tǒng)帶來的性能瓶頸。
磁盤備份方式產(chǎn)生的數(shù)據(jù)均是暴露在操作系統(tǒng)之上的,很容易受到包括黑客、病毒、人為因素造成的數(shù)據(jù)丟失問題,從而降低了備份系統(tǒng)安全可靠性;另外,磁盤備份不具備數(shù)據(jù)壓縮功能,這也帶來了磁盤空間的浪費(fèi)。
虛擬磁帶庫(Virtual Tape Library, VTL)技術(shù)兼具了傳統(tǒng)磁帶庫技術(shù)方案和磁盤備份速度快、使用方便的優(yōu)點(diǎn),且繼承了傳統(tǒng)數(shù)據(jù)的管理方式,技術(shù)實(shí)施難度不大,且新舊系統(tǒng)能平滑過渡,有效的保護(hù)的以前的設(shè)備投資和技術(shù)實(shí)現(xiàn),應(yīng)作為新的集團(tuán)公司信息系統(tǒng)備份架構(gòu)的主選技術(shù)。
圖 二
V T L是把磁盤虛擬成帶庫,在磁盤介質(zhì)上模擬出機(jī)械臂、磁帶機(jī)和磁帶來進(jìn)行工作。市場上的虛擬磁帶庫依照架構(gòu)不同,有三種形式的VTL,備份軟件型(Backup Software)、磁盤陣列型(Disk Array Based)、應(yīng)用服務(wù)器型(VTL Appliance)。
直接將虛擬磁帶功能整合至備份軟件內(nèi)。由于純粹是依靠軟件來達(dá)成仿真磁帶的目的,這類方案的限制是無法和其它廠牌備份軟件搭配使用。這種VTL只能被該備份軟件調(diào)用,并且不具有標(biāo)準(zhǔn)磁帶庫的訪問和管理方式。
嵌入式結(jié)構(gòu)VTL采用專業(yè)的硬件平臺(tái),模塊化的結(jié)構(gòu),采用專用的操作系統(tǒng)將VTL軟件安裝在專用系統(tǒng)內(nèi)。它是以磁盤陣列為基礎(chǔ)發(fā)展的虛擬磁帶柜,透過內(nèi)建于磁盤陣列控制器(RAID Controller)內(nèi)的虛擬軟件,將儲(chǔ)存空間仿真成磁帶柜具備的所有特征。
透過安裝在服務(wù)器上的虛擬磁帶軟件,將服務(wù)器內(nèi)的硬盤,或是可被服務(wù)器控制的外接磁盤陣列,做為存放備份數(shù)據(jù)的虛擬磁帶空間。由于軟件架構(gòu)在標(biāo)準(zhǔn)的x86平臺(tái)和Linux操作系統(tǒng)上,成本相對較便宜,而且儲(chǔ)存裝置的限制較低,只要服務(wù)器支持,可以采用任何SCSI或光纖信道接口的磁盤陣列,與備份服務(wù)器端可以藉由SCSI、iSCSI或光纖信道等傳輸接口相連,部署應(yīng)用上較有彈性。
從以上的對比分析看,嵌入式結(jié)構(gòu)VTL磁盤陣列型和應(yīng)用服務(wù)器型可作為集團(tuán)公司選用的兩個(gè)主要實(shí)施方式。
VTL系統(tǒng)架構(gòu)從連接VTL前端的備份服務(wù)器,到后端的磁盤陣列與磁帶庫,都必須支持速度在4Gb以上的光纖通道協(xié)議,以保證備份數(shù)據(jù)在整個(gè)傳輸過程中都能享有最充裕的帶寬。
同時(shí)新VTL系統(tǒng)架構(gòu)具備多進(jìn)程數(shù)據(jù)流并行備份的能力,可以同時(shí)連接多臺(tái)備份服務(wù)器,并同時(shí)執(zhí)行多組備份程序,以大幅縮短備份時(shí)間。
具備智能的I/O負(fù)載均衡技術(shù),可以自動(dòng)分配備份數(shù)據(jù)流寫入到磁盤陣列的位置,避免多個(gè)備份數(shù)據(jù)流同時(shí)寫入VTL時(shí),集中在少數(shù)的RAID控制器和LUN上,造成負(fù)載不均衡的情況。
部署了VTL后,不能對物理磁帶的產(chǎn)出速度和備份服務(wù)器的運(yùn)行性能造成影響,應(yīng)該支持Server-less磁帶備份。
采用VTL備份系統(tǒng)架構(gòu) 對數(shù)據(jù)中心的意義在于“提升備份操作的品質(zhì)”,而不是“取代物理磁帶設(shè)備”。磁帶不僅是單位成本最低的存儲(chǔ)介質(zhì),可以離線的長期保存數(shù)據(jù),對于集團(tuán)公司這樣的大型企業(yè)用戶而言,更是不可或缺。因此,集團(tuán)公司的VTL不僅要提升備份性能,更可以與現(xiàn)有的磁帶設(shè)備無縫整合,具備與磁帶設(shè)備協(xié)同工作的能力。選用的VTL應(yīng)該具備以下磁帶管理能力:
1)支持集團(tuán)公司目前使用的TSM備份軟件和以后可能使用的所有主流備份軟件。
2)具備仿真所有主流的物理磁帶庫、磁帶格式的能力。
3)支持完整的磁帶入庫/出庫,確保所有主流的物理磁帶庫都能直接與VTL連接,且不能限制導(dǎo)入/導(dǎo)出的磁帶格式。
4)具備多磁帶輸出功能??梢园凑諅浞莶呗缘囊?,在同一時(shí)間輸出多組相同內(nèi)容的磁帶,節(jié)省了磁帶復(fù)制的時(shí)間及過程。
5)支持磁帶整合功能??梢詫⒍嗑頂?shù)據(jù)量少的磁帶導(dǎo)入VTL后,再統(tǒng)一導(dǎo)出到單卷大容量的磁帶,節(jié)省介質(zhì)和管理成本。
6)支持磁帶緩沖功能。允許備份數(shù)據(jù)在轉(zhuǎn)成虛擬磁帶格式后,直接從VTL出庫到物理磁帶,以大幅降低備份磁帶器的性能負(fù)載,簡化管理程序。
7)具備完善的報(bào)表生成功能。
8)可以通過單一介面同時(shí)設(shè)定管理多臺(tái)VTL。
VTL本身應(yīng)該支持高可用性、多節(jié)點(diǎn)架構(gòu)及雙工的故障切換機(jī)制,以避免單點(diǎn)故障造成停機(jī),確保備份操作持續(xù)運(yùn)行。
集團(tuán)公司數(shù)據(jù)中心內(nèi)有各種操作平臺(tái)的服務(wù)器和不同品牌的存儲(chǔ)設(shè)備,只有具備高度兼容性和擴(kuò)展性的VTL,才能在不更改架構(gòu)的前提下,無縫的部署于數(shù)據(jù)中心,才不會(huì)造成資源浪費(fèi)和管理上的困擾。
系統(tǒng)應(yīng)該完全支持開放系統(tǒng)的存儲(chǔ)架構(gòu),可以支持FC、SCSI、iSCSI,甚至是InfiniBand等多種傳輸協(xié)議,并與各種品牌的磁盤陣列及存儲(chǔ)系統(tǒng)相兼容,企業(yè)用戶可以靈活的選擇并配置存儲(chǔ)資源。
集團(tuán)公司發(fā)展至今,已逐步形成北京、宜昌、成都的三總部架構(gòu),信息系統(tǒng)也逐步形成三地三中心的格局,今后將逐漸由一點(diǎn)擴(kuò)展至多節(jié)點(diǎn)的虛擬磁帶庫(VTL)備份系統(tǒng)架構(gòu)。
現(xiàn)在的虛擬磁帶庫(VTL)解決方案已具備遠(yuǎn)程復(fù)制的功能,虛擬磁帶可以從數(shù)據(jù)中心復(fù)制到遠(yuǎn)程的災(zāi)備中心,將本地端數(shù)據(jù)保護(hù)直接延伸到異地災(zāi)備。同時(shí),逐漸完善的高級(jí)重復(fù)數(shù)據(jù)刪除功能,使通過廣域網(wǎng)方式進(jìn)行遠(yuǎn)程數(shù)據(jù)備份成為可能。數(shù)據(jù)中心級(jí)VTL的重復(fù)數(shù)據(jù)刪除功能可以刪除兩個(gè)備份時(shí)間點(diǎn)相近的全備份間重復(fù)率往往高達(dá)90%以上的數(shù)據(jù),同時(shí)支持壓縮功能,并實(shí)現(xiàn)支持多對一遠(yuǎn)程復(fù)制的全域重復(fù)數(shù)據(jù)刪除。最后附上集團(tuán)公司北京、宜昌雙中心虛擬備份架構(gòu)應(yīng)用的規(guī)劃部署圖。
圖 三