林偉勝,許卓偉
(廣東電網(wǎng)有限責任公司汕頭供電局,廣東汕頭 515000)
在現(xiàn)今的大數(shù)據(jù)時代,數(shù)據(jù)是一個企業(yè)最寶貴的資源。但是數(shù)據(jù)安全問題卻難以得到保證,軟件自身缺陷、人為操作失誤、電腦病毒破壞、硬件損毀、黑客攻擊、自然災難等諸多不確定因素都有可能造成計算機中數(shù)據(jù)的丟失的原因。因此,各個行業(yè)領(lǐng)域?qū)?shù)據(jù)的保護尤為關(guān)心[1-6]。
汕頭供電局經(jīng)過多年的建設(shè)形成多套主營業(yè)務系統(tǒng)、有幾十臺套的服務器主機、需要備份的數(shù)據(jù)有操作系統(tǒng)、數(shù)據(jù)庫、中間件、郵件數(shù)據(jù)、虛擬機等各類數(shù)據(jù),數(shù)據(jù)分布在不同類型的設(shè)備上,有小型機、微機服務器。隨著系統(tǒng)的建設(shè)復雜化和數(shù)據(jù)量增多,數(shù)據(jù)的安全對于企業(yè)的運轉(zhuǎn)也越來越顯得重要,對數(shù)據(jù)備份系統(tǒng)的架構(gòu)設(shè)計和管理提出了復雜的要求。
汕頭供電局隨著信息系統(tǒng)逐步完善,業(yè)務數(shù)據(jù)量成倍增加,應用數(shù)據(jù)的存儲變得越來越重要,整個企業(yè)信息化建設(shè)對存儲系統(tǒng)有更高的建設(shè)需求,對數(shù)據(jù)中心可靠性要求也日漸提高,備份需求隨之突顯出來,需要應對數(shù)據(jù)丟失、誤操作、存儲損壞、自然災害等造成重要數(shù)據(jù)損壞時的恢復問題。
備份系統(tǒng)需要解決的難題主要有以下幾點[7]。
(1)備份節(jié)點多,要連接備份的服務器節(jié)點數(shù)量眾多,涉及的有幾十臺套的多類型服務器主機。
(2)備份數(shù)據(jù)量大,類型多。例如主營業(yè)務系統(tǒng)要保留多個用于追溯恢復的版本,頻率高。類型覆蓋了IBM小型機操作系統(tǒng)備份、數(shù)據(jù)庫、中間件、虛擬化服務器數(shù)據(jù)等。
(3)要求備份任務管理自動化并合理地安排調(diào)度策略,設(shè)備高效利用,要求快速備份,必要時能夠短時間恢復到指定設(shè)備;需要對核心系統(tǒng)的數(shù)據(jù)提供遠程保護數(shù)據(jù),提供系統(tǒng)容災數(shù)據(jù)備份、異地災備恢復環(huán)境[8]。
解決這些問題急需要設(shè)計軟件兼容性好、硬件擴展性強的備份系統(tǒng)解決方案,合理的備份方式與策略等等,將零散的備份資源集中,節(jié)約資源,提高管理效率。
備份系統(tǒng)的建設(shè)從軟件建設(shè)方面、硬件方面,還有備份管理配置方面進行考慮。
軟件平臺方面由于供電局已建設(shè)的應用系統(tǒng)有多品牌的基礎(chǔ)環(huán)境,備份軟件在客戶端要兼容已有的Windows、Linux、AIX、HP-UX,OS/400等操作系統(tǒng),在數(shù)據(jù)庫方面考慮兼容Oracle、SQLserver等數(shù)據(jù)庫系統(tǒng)。核心備份系統(tǒng)選用了IBM的TSM備份軟件,它具有高性能,靈活高效的解決方案。
硬件方面的設(shè)計,使用的設(shè)備兼容已建設(shè)的IP網(wǎng)絡與存儲網(wǎng)絡環(huán)境,數(shù)據(jù)備份盡量不影響業(yè)務系統(tǒng),重要系統(tǒng)使用了LANfree的備份方式。在數(shù)據(jù)備份存儲這塊使用高效率硬件,VTL虛擬磁帶庫作為數(shù)據(jù)備份的一級存儲池,而慢速的磁帶庫設(shè)備作為二級存儲池,在有限資源條件下發(fā)揮前者速度快、后者容量大、經(jīng)濟的優(yōu)點。
備份的策略方面,統(tǒng)一進行策略規(guī)劃和調(diào)度規(guī)劃,根據(jù)不同業(yè)務系統(tǒng)的使用高峰期、數(shù)據(jù)備份量和時長,錯開各策略的啟動時間,盡量將業(yè)務分散在全天各系統(tǒng)空閑的時候。比如營銷系統(tǒng)晚上的實時訪問量不大,備份策略即安排在該時間段執(zhí)行,而計量系統(tǒng)前置數(shù)據(jù)庫在白天有空閑時間段,則在該時間段安排日志備份,另外也要考慮一二級數(shù)據(jù)備份池的遷移調(diào)度,設(shè)置合理的磁帶回收水位線,及時回收資源。
部署后的系統(tǒng)拓樸結(jié)構(gòu)如圖1所示。
IDC機房內(nèi)的服務器通過備份系統(tǒng)管理,業(yè)務系統(tǒng)服務器使用LANfree方式實現(xiàn)快速備份與恢復,備份數(shù)據(jù)存儲使用了VTL虛擬磁帶庫技術(shù),另外核心系統(tǒng)還直接通過存儲復制技術(shù)在遠程數(shù)據(jù)備份機房實現(xiàn)容災備份。
IBM TSM(Tivoli Storage Manager)數(shù)據(jù)備份系統(tǒng),是企業(yè)級跨平臺網(wǎng)絡備份、恢復及存儲管理軟件。TSM客戶端軟件負責向TSM服務器提供需要備份的數(shù)據(jù),或向TSM服務器索取已備份數(shù)據(jù)及歸檔數(shù)據(jù)以便恢復數(shù)據(jù)。TSM服務器負責管理備份數(shù)據(jù)、備份策略及管理連接在其上的存儲系統(tǒng)。
小型機操作系統(tǒng)備份,IBM小型機操作系統(tǒng)備份和恢復可以通過網(wǎng)絡來進行,由于主營業(yè)務系統(tǒng)基本都是安裝AIX系統(tǒng)的IBM小型機,即可以通過其NIM功能進行操作系統(tǒng)的備份,由一臺IBM工作站定期將各小型機的操作系統(tǒng)做mksysb鏡象集中存放,再使用備份客戶端進行壓縮備份。實現(xiàn)操作系統(tǒng)的定期備份,系統(tǒng)的恢復也實現(xiàn)集中管理。
VTL(Virtual Tape Library),虛擬磁帶庫技術(shù)仿真物理磁帶庫的驅(qū)動器并且在磁盤上存儲備份映像。VTL支持使用現(xiàn)有的磁帶備份軟件識別為磁帶庫類型并進行連接操作,管理方便。虛擬磁帶庫使用物理磁盤驅(qū)動器,它的讀寫速度比磁帶庫快得多,同時還具有數(shù)據(jù)壓縮功能。虛擬磁帶庫上的數(shù)據(jù)可以快速恢復到系統(tǒng)中,因此選用其作為備份系統(tǒng)的一級存儲池,超過一定水位數(shù)據(jù)再遷移到二級池,即磁帶庫中。
圖1 數(shù)據(jù)備份架構(gòu)拓樸
LANfree備份是指通過光纖通道備份,通常的備份可以通過IP網(wǎng)絡進行備份數(shù)據(jù)傳送,這樣在業(yè)務高峰的時候有可能會影響系統(tǒng)性能,而TSM備份系統(tǒng)允許使用SAN網(wǎng)絡進行調(diào)度備份,即客戶端通過其本機的存儲光纖接口直接向備份設(shè)備復制數(shù)據(jù),由于光纖存儲接口速度高,而且備份數(shù)據(jù)不再經(jīng)由備份系統(tǒng)主機轉(zhuǎn)存到帶庫,所以LANfree備份效率更高,供電局各主營業(yè)務系統(tǒng)備份采用光纖存儲網(wǎng)絡備份,部分沒有光纖存儲接口的系統(tǒng)采取LAN網(wǎng)絡備份方式。
其他備份設(shè)置方面,核心業(yè)務系統(tǒng)的Oracle數(shù)據(jù)庫均開啟日志歸檔模式,即對數(shù)據(jù)庫的每筆變更都在存儲在日志中,通過執(zhí)行RMAN工具經(jīng)由數(shù)據(jù)庫客戶端轉(zhuǎn)存,且多套數(shù)據(jù)庫的備份與恢復管理集中使用同一個備份管理Catalog數(shù)據(jù)庫。另外,還通過虛擬化服務器平臺的TSM備份組件,實現(xiàn)了服務器虛擬機的整機備份。對于營銷系統(tǒng),還使用了存儲級別的數(shù)據(jù)鏡像,如在IBM DS5100存儲系統(tǒng)啟用了遠程異步數(shù)據(jù)復制ERM(Enhanced Remote Mirror)功能,將多個主營業(yè)務系統(tǒng)數(shù)據(jù)遠程實時地復制到20 km外的數(shù)據(jù)備份機房,一旦發(fā)生災害事件,企業(yè)的核心數(shù)據(jù)將得以保全。
汕頭供電局備份系統(tǒng)每天要應對近40個客戶端節(jié)點,發(fā)起近30個大數(shù)據(jù)量的備份任務,每天接近1.5 T的數(shù)據(jù)備份,備份存儲的數(shù)據(jù)總量近45 T。由于使用了LANfree技術(shù),性能較在LAN環(huán)境下速度提高多倍,比如電力營銷系統(tǒng)的異機恢復,從IBMp570小型機數(shù)據(jù)庫備份出來的數(shù)據(jù)全庫恢復到另外的p570小型機上,近1.2 T整數(shù)據(jù)庫數(shù)據(jù)網(wǎng)絡恢復需要近20個小時,而LANfree的恢復只需要5個小時。而使用ERM的數(shù)據(jù)遠程復制,也解決了數(shù)據(jù)容災備份的問題,異地災備系統(tǒng)的快速啟用3個小時內(nèi)就可以完成。
數(shù)據(jù)備份系統(tǒng)的建設(shè)不僅僅需只是軟硬件設(shè)備的構(gòu)建,對數(shù)據(jù)系統(tǒng)的管理也十分重要。因此制定科學、系統(tǒng)和合理的管理方法以及備份策略對備份系統(tǒng)實現(xiàn)備份功能,恢復數(shù)據(jù)有著重要的意義。
(1)統(tǒng)一策略規(guī)劃與日常檢查
系統(tǒng)管理人員應從數(shù)據(jù)量的大小,數(shù)據(jù)的重要性和恢復的角度考慮,結(jié)合實際資源使用狀況,制訂數(shù)據(jù)分組備份策略和存儲介質(zhì)池對應策略,任務應錯開業(yè)務高峰,并定期開展策略清理和資源調(diào)整,定期開展運行狀態(tài)檢查,保證備份系統(tǒng)高效穩(wěn)定運行。
(2)定期開展數(shù)據(jù)恢復與系統(tǒng)災備演練
數(shù)據(jù)備份都是為發(fā)生系統(tǒng)災難做準備的,備份系統(tǒng)架構(gòu)的優(yōu)劣不僅在于它的備份速度,更重要的是通過數(shù)據(jù)恢復測試備份系統(tǒng)里面的數(shù)據(jù)的有效性。汕頭局定期開展主營業(yè)務系統(tǒng)數(shù)據(jù)恢復和啟用備用應用系統(tǒng)進行測試,檢驗數(shù)據(jù)備份是否安全可靠,另外也定期開展遠程災備數(shù)據(jù)的恢復演練,模擬核心業(yè)務系統(tǒng)硬件整體損壞情況下的災備數(shù)據(jù)的啟用,通過實踐驗證災備數(shù)據(jù)的有效性。
汕頭供電局數(shù)據(jù)備份架構(gòu)基于統(tǒng)一的存儲區(qū)域網(wǎng)絡,采用當前流行的備份軟硬件平臺,集成多品牌存儲產(chǎn)品,覆蓋從操作系統(tǒng)到數(shù)據(jù)庫的各類型數(shù)據(jù)備份,利用存儲設(shè)備鏡像技術(shù)實現(xiàn)了遠程的數(shù)據(jù)備份,實現(xiàn)了高效且安全的數(shù)據(jù)備份系統(tǒng)架構(gòu),簡化管理。同時通過加強維護管理,定期開展數(shù)據(jù)恢復以驗證系統(tǒng)有障性,從而保障了企業(yè)信息系統(tǒng)的數(shù)據(jù)安全。
[1]于洋.計算機數(shù)據(jù)存儲備份探討[J].制造業(yè)自動化,2011(16):134-136.
[2]李偉.基于SAN架構(gòu)的數(shù)據(jù)存儲和備份系統(tǒng)[J].電腦知識與技術(shù),2010,6(20):5406-5407.
[3]呂廣平.計算機磁盤陣列及異地容災備份系統(tǒng)分析[J].科技傳播,2012(7):161-162.
[4]王帆飛.國土資源空間數(shù)據(jù)存儲備份系統(tǒng)的設(shè)計與實現(xiàn)[J].計算機與現(xiàn)代化,2012(3):190-193.
[5]呂小婷,施艷,張振芳.存儲局域網(wǎng)(SAN)在地質(zhì)調(diào)查數(shù)據(jù)存儲中的應用[J].地質(zhì)通報,2012(9):1531-1536.
[6]申新鵬,曾雷杰,趙曉.磁盤陣列上虛擬磁盤的管理[J].現(xiàn)代電子技術(shù),2010,33(20):144-146.
[7]孫曉南,余婕.網(wǎng)絡存儲與數(shù)據(jù)備份[M].北京:清華大學出版社,2010.
[8]劉洪發(fā),唐宏,賈卓生.網(wǎng)絡存儲與災難恢復技術(shù)[M].北京:電子工業(yè)出版社,2008.