摘要:本文對操作系統(tǒng)的備份恢復現(xiàn)狀中遇到的問題進行了分析,對相關軟件的功能、優(yōu)勢、備份所需要的環(huán)境、備份的模式、實施流程進行了介紹。
關鍵詞:操作系統(tǒng)備份;CSM
中圖分類號:TP309.3 文獻標識碼:A 文章編號:1674-7712 (2012) 10-0103-01
一、操作系統(tǒng)備份恢復現(xiàn)狀
在日常維護過程中,根據(jù)內(nèi)控的要求,對于主機的操作系統(tǒng)要三個月備份一次,除此之外在操作系統(tǒng)發(fā)生重大變化的前后都要進行備份,整個信息支撐系統(tǒng)的需要備份的主機多在達200多臺,而且還在不斷地增加,利用現(xiàn)在傳統(tǒng)的磁帶備份模式,重復的工作量是非常巨大的。而且磁帶的備份模式本身就存在很大的不穩(wěn)定性,能否可恢復都是不可預知的。其中以IBM的設備為例,涉及到的系統(tǒng)多,機型多,包含P4、P5、P6等,有的有內(nèi)置磁帶機,有的沒有。這么多的主機,為保險起見,每臺至少需要兩盤小磁帶做備份,操作系統(tǒng)大的需要的更多,導致了磁帶數(shù)量多,而且磁帶本身存在不易保存、安全性差等問題,關鍵有的時候可能無法恢復。
如何解決目前操作系統(tǒng)存在的問題呢,我們對操作系統(tǒng)集中備份恢復的技術進行了研究,下面以IBM的操作系統(tǒng)為例進行說明和測試。
二、CSM(Cluster Systems Management)軟件
(一)CSM軟件介紹
CSM是AIX自身的軟件包,客戶端/服務器模式,客戶端(Managed Node)安裝csm.client軟件包,服務器(Management Server)安裝csm.server軟件包??梢酝ㄟ^Management Server單點控制所有節(jié)點,包括IBM p5,power4,power3機型運行AIX5L的節(jié)點。CSM和AIX緊密結(jié)合,系統(tǒng)開銷很小,和其它第三方的管理軟件比,更安全穩(wěn)定。AIX5L缺省安裝中已經(jīng)包含 csm.client 軟件包,要使用CSM功能,需購買CSM軟件許可證,配置CSM服務器,然后通過CSM服務器單點控制所有節(jié)點,實現(xiàn)各種功能。CSM服務器的宕機對所管理的節(jié)點不會造成任何影響。通過單一控制臺控制進行硬件控制,通過CSM服務器進行硬件開關機操作查看節(jié)點開關機過程中LED的代碼顯示。
(二)CSM軟件功能
系統(tǒng)安裝:配置好CSM服務器后,在4小時內(nèi)可以完成可以50臺節(jié)點的安裝所有節(jié)點配置參數(shù)相同,便于管理增加新機器時,不僅安裝迅速,而且不用擔心配置和原來機器有所不同。
系統(tǒng)管理:CSM提供的dsh功能可以在所有機器上執(zhí)行同一條命令并可對返回結(jié)果格式化,方便高效通過單點維護各節(jié)點補丁版本,配置參數(shù)CSM提供CFM(Cluster File Manger)功能,能夠保證用戶所需要的文件在所有節(jié)點上的一致。用此功能可以實現(xiàn)統(tǒng)一的用戶管理。
系統(tǒng)備份:將各節(jié)點的操作系統(tǒng)備份保存到CSM服務器上,恢復時通過網(wǎng)絡安裝,安全快速高效。
系統(tǒng)監(jiān)控:結(jié)合AIX的RSCT組件的功能,CSM能夠?qū)崿F(xiàn)通過單點監(jiān)控所有節(jié)點的運行狀況,并可定義動作對錯誤自動進行糾正
其中一個非常實用的就是通過網(wǎng)絡來完成操作系統(tǒng)的備份和恢復。只要是主機和HMC控制臺網(wǎng)絡可達都可以實現(xiàn)。
在使用了這個軟件之后,可以分擔備份系統(tǒng)的工作,實現(xiàn)系統(tǒng)管理方面的技術更新,減輕管理員的日常工作量,建立集中的,統(tǒng)一的,標準的現(xiàn)代化系統(tǒng)備份管理方式,提高安裝大量新系統(tǒng)的效率。
三、CSM集中備份
(一)CSM集中備份介紹
CSM通過網(wǎng)絡提供AIX軟件的安裝,升級,恢復等管理服務,CSM提供一種簡單高效的軟件安裝和維護方式。
舉例:當有兩個以上的IBM P系列主機時,我們可以找到一種安裝和升級AIX系統(tǒng)而且不需要光驅(qū)和磁帶機的方式,我們需要一種對AIX系統(tǒng)遠程管理的方式(不用到達機房,在辦公室或家中就可以實現(xiàn)),我們需要一種標準模式來維護多個AIX版本的主機。
(二)CSM集中備份功能
統(tǒng)一備份client的rootvg
恢復client的rootvg
維護client(升級系統(tǒng)補丁,硬件診斷)
定制SOE后快速安裝新系統(tǒng)
系統(tǒng)遷移(rootvg從舊機器遷移到新機器)
(三)CSM集中備份的優(yōu)勢
實現(xiàn)真正意義上的遠程管理系統(tǒng),系統(tǒng)安裝,升級,備份和恢復等操作,無須到達現(xiàn)場。
并發(fā)性好:同時給多個系統(tǒng)做安裝,升級和備份。
管理范圍廣:同時管理AIX5.1,AIX5.2,AIX5.3,AIX6.1及各個小版本的客戶端
災難恢復:CSM服務器可以在最短的時間內(nèi)恢復多個操作系統(tǒng)(無須光盤和磁帶)。
定制rootvg后,方便多系統(tǒng)的安裝和管理。
恢復mksysb速度快(平均比磁帶速度快15-30分鐘)。
使用簡單,方便。
支持openSSL(更加安全的網(wǎng)絡通訊)。
可以實現(xiàn)系統(tǒng)定時自動備份,減輕管理員的工作量。
(四)CSM集中備份環(huán)境
一個基本的CSM集中備份環(huán)境包含TCP/IP網(wǎng)絡和多個p系列小型機。
TCP/IP網(wǎng)絡可能會橫跨多個網(wǎng)段,在多個網(wǎng)段中可以建立一個或多個CSM集中備份環(huán)境。
CSM集中備份環(huán)境中至少要有一個服務器和一個客戶端。
CSM集中備份的術語:
Master:建立和維護CSM集中備份環(huán)境的主機
Client:CSM服務器進行操作的主機,比如:安裝,升級等
Resource server:擁有某種軟件資源的主機,一般把CSM master當作resource server
(五)CSM集中備份的工作流程
為了保證CSM集中備份能夠正常使用,有兩個資源是必須的:LPP resource和SPOT(Shared Product Object Tree),SPOT:是存放系統(tǒng)引導啟動的文件,它的作用是引導客戶端啟動,如果SPOT比mksysb的版本低,則不能正?;謴拖到y(tǒng)
LPP_source:與AIX的安裝光盤相似,包含AIX的安裝文件。
四、集中備份系統(tǒng)的測試
我們利用測試機器,安裝了CSM的服務器軟件和客戶端軟件進行了測試,取得了很好的效果:
1.操作系統(tǒng)的備份僅需要3分鐘的時間,恢復也只用了10分鐘。相對于磁帶的備份恢復過程要簡短得多。
2.備份和恢復的操作都是通過網(wǎng)絡傳輸?shù)?,由于是?jīng)過壓縮,數(shù)據(jù)量很小,不會對網(wǎng)絡的流量造成較大影響。
3.所有的操作都可以定時自動完成,不需要人為的干預,大大減少了維護人員的工作量。
4.備份的數(shù)據(jù)是存放在硬盤上的,相比磁帶來說數(shù)據(jù)的安全性是有了很大的提高。