莫 偉
(民航山東空中交通管理分局 山東 250014)
雙機(jī)熱備指的是基于高可用系統(tǒng)中的兩臺(tái)服務(wù)器的熱備(或高可用)。服務(wù)器的故障可能由各種原因引起,如設(shè)備故障、操作系統(tǒng)故障、軟件系統(tǒng)故障等等。一般地講,在技術(shù)人員在現(xiàn)場(chǎng)的情況下,恢復(fù)服務(wù)器正??赡苄枰?0分鐘、幾小時(shí)甚至幾天。從實(shí)際經(jīng)驗(yàn)上看,除非是簡(jiǎn)單地重啟服務(wù)器,否則往往需要幾個(gè)小時(shí)以上。而如果技術(shù)人員不在場(chǎng),則恢復(fù)服務(wù)的時(shí)間就更長(zhǎng)了。
(1)民航山東空管分局辦公由兩臺(tái)服務(wù)器,一臺(tái)作為ORACLE數(shù)據(jù)庫(kù)服務(wù)器,一臺(tái)作為WEB服務(wù)器。多年來(lái),對(duì)于數(shù)據(jù)庫(kù)的備份一直為冷備份操作,即使用GHOST軟件,在晚間非工作時(shí)間進(jìn)行備份,待服務(wù)器異常后,需手動(dòng)還原。這種方式有很多缺點(diǎn),首先在工作期間出現(xiàn)故障需要還原時(shí),會(huì)連接不上服務(wù)器,從而影響分局辦公,其次備份及還原時(shí)間長(zhǎng),往往恢復(fù)的時(shí)間長(zhǎng)達(dá)1天,且工作量大。
(2)組成雙機(jī)熱備的方案主要的兩種方式基于共享存儲(chǔ)(磁盤陣列)的方式和利用數(shù)據(jù)的同步方式,保證主備服務(wù)器的數(shù)據(jù)一致性。第一種是集群,集群可能包括多臺(tái)服務(wù)器。第二種是通過(guò)軟件方式實(shí)現(xiàn)雙機(jī)熱備。即不采用共享的存儲(chǔ)設(shè)備,而是數(shù)據(jù)不再單點(diǎn)存儲(chǔ),本機(jī)數(shù)據(jù)可以向多臺(tái)主機(jī)做實(shí)時(shí)的數(shù)據(jù)復(fù)制。就本單位來(lái)說(shuō),問(wèn)題在于如果使用WINDOWS集群服務(wù)進(jìn)行雙機(jī)熱備,則必須使用磁盤陣列,如果使用純軟件進(jìn)行雙機(jī)熱備,則需要大量資金購(gòu)買熱備軟件,從而導(dǎo)致雙機(jī)熱備方案成本很高。
(1)將主服務(wù)器(雙網(wǎng)卡)與備服務(wù)器(雙網(wǎng)卡)使用交叉線連接起來(lái)作為心跳線。設(shè):主機(jī)IP:10.14.128.27主機(jī)心跳:192.168.1.11備機(jī)IP:10.14.128.24備機(jī)心跳:192.168.1.12;
(2)使用互聯(lián)網(wǎng)上免費(fèi)提供的文件同步備份軟件進(jìn)行文件的同步;
(3)編寫程序,放置在備份機(jī)上,程序的目的是實(shí)現(xiàn)純軟件下雙服務(wù)器的熱備份功能,通過(guò)心跳線通訊,探查主服務(wù)器狀態(tài),一旦主服務(wù)器故障,備機(jī)會(huì)根據(jù)心跳線通訊返回的狀態(tài)自動(dòng)接管主服務(wù)器應(yīng)用。程序關(guān)鍵內(nèi)容大致如下:
由于需要雙機(jī)熱備的是ORACLE數(shù)據(jù)庫(kù),所以拷貝正在使用中的數(shù)據(jù)庫(kù)文件是個(gè)難題,正在使用中的數(shù)據(jù)庫(kù)文件是無(wú)法被復(fù)制傳輸?shù)?,針?duì)此問(wèn)題解決方法是:據(jù)庫(kù)文件.dbf等的備份,解決文件占用問(wèn)題)//停用oraclehome92agent服務(wù)
(4)在計(jì)劃任務(wù)中添加新任務(wù),啟動(dòng)程序,日程安排選“每天”,進(jìn)入高級(jí),選中“重復(fù)任務(wù)”,每一分鐘執(zhí)行一次,時(shí)限9999小時(shí)59分鐘。
(5)在備服務(wù)器上安裝免費(fèi)的同步軟件,按需求設(shè)置好同步的間隔時(shí)間和執(zhí)行任務(wù)的頻率。
在方案完成以后,基本實(shí)現(xiàn)了服務(wù)器在純軟件方式下的雙機(jī)熱備份,將以前出現(xiàn)故障時(shí),影響分局辦公的平均時(shí)間1天左右降至10分鐘以內(nèi),并且該方案由于不使用任何外部設(shè)備,因此成本也幾乎為零,為分局節(jié)省了大量的資金,同時(shí)還將網(wǎng)管員從繁復(fù)的備份工作中解放出來(lái),達(dá)到了預(yù)期的效果。
[1]劉志丹,彭建華.一種基于商用電信網(wǎng)絡(luò)的容錯(cuò)技術(shù)[J].電訊技術(shù),2009,(1):20-25.
[2]盧燕寧,耿國(guó)華.基于Cmster的多服務(wù)器容錯(cuò)與切換技術(shù)的研究[J].微機(jī)發(fā)展,2004,(6):28-31
[3]謝希仁.計(jì)算機(jī)網(wǎng)絡(luò)[M].2008.01