李 峰 曹 中 劉正偉
摘 要:隨著現(xiàn)代化信息技術的發(fā)展和企業(yè)信息化進程的推進,信息應用系統(tǒng)已經推廣到企業(yè)日常辦公的各個領域。應用系統(tǒng)的高度自動化為以往的工作帶來很大的方便,同時也提高了工作效率,企業(yè)的運轉已經離不開應用系統(tǒng)的支持。所以對于企業(yè)重要的應用系統(tǒng)而言,保證系統(tǒng)持續(xù)、可靠地提供服務是非常重要的。財務系統(tǒng)作為企業(yè)中最核心業(yè)務應用之一,對于穩(wěn)定性、安全性和高可用性有著極高的要求,尤其是在財務部門月底做報表的時候,財務服務器是絕對不允許出故障的。
關鍵詞:雙機備份;安全性;節(jié)點;財務系統(tǒng)
中圖分類號:TP309文獻標識碼:B
文章編號:1004-373X(2009)03-097-03
Application of Information Technology to Build Digital Enterprise
LI Feng CAO Zhong2,LIU Zhengwei1
(1.Science & Technology Agency,Dagang Petrochemistry Company,Tianjin,300280,China;
2.Information Conter,Dagang Petrochemistry Company,Tianjin,300280,China)
Abstract:With the development of modern information technology,information technology and business process forward,Application of information systems has been extended to enterprises in all areas of day-to-day office.Application of a high degree of automation in the past for the work of a great convenience,but also improved the efficiency of business operation has involved the application of the system.For important business applications,to ensure continuous,reliable delivery of services is very important.The financial system as a business in one of the most core business applications,for stability,security,high availability and has very high requirements,especially in the financial sector to do at the end of statements,the financial server is not allowed out of trouble.
Keywords:two machine back-up;security;node;financial system
1 服務器容錯技術簡介
目前主流應用的服務器容錯技術有三類,它們分別是:服務器群集技術、雙機熱備份技術和單機容錯技術。它們各自所對應的容錯級別是從低到高的,也就是說服務器群集技術容錯級別最低,而單機容錯技術級別最高。決定使用哪種服務器容錯技術,正確的方法是要分析一下系統(tǒng)的重要性以及用戶對服務中斷的容忍程度,即系統(tǒng)用戶能容忍多長時間的服務中斷,如果服務器不能盡快恢復會造成多大的影響。
1.1 集群技術
所謂集群就是共同為客戶機提供網絡資源的一組計算機系統(tǒng)。而其中的每一臺提供服務的計算機,稱之為節(jié)點。當一個節(jié)點不可用或者不能處理客戶的請求時,該請求將會轉到另外的可用節(jié)點來處理,而這些對于客戶端來說,它根本不必關心這些要使用資源的具體位置,集群系統(tǒng)會自動完成。集群中節(jié)點可以以不同的方式來運行,這要看它們是如何設置的。在一個理想的兩個節(jié)點的集群中,兩個服務器都同時處于活動狀態(tài),也就是在兩個節(jié)點上同時運行相同的應用程序,當一個節(jié)點出現(xiàn)故障時,運行在出故障的節(jié)點上的應用程序就會轉移到另外的沒有出現(xiàn)故障的節(jié)點上,這樣一來,由于兩個節(jié)點的工作現(xiàn)在由一臺服務器來承擔,自然會影響服務器的性能。針對這種情況的解決方案是,在正常操作時,另一個節(jié)點處于備用狀態(tài),只有當前活動的節(jié)點出現(xiàn)故障時該備用節(jié)點才會接管工作,但這并不是一個經濟的方案,因為你不得不買兩臺服務器來做一臺服務器的工作。雖然當出現(xiàn)故障時不會對性能產生任何影響,但是在正常運行時的性能價格比并不太高。
1.2 雙機備份技術
雙機熱備份技術:是一種軟硬件結合的較高容錯應用方案。該方案是由兩臺服務器系統(tǒng)和一個外接共享磁盤陣列柜(也可沒有,而是在各自的服務器中采取RAID卡)及相應的雙機熱備份軟件組成。原理如圖1所示。在這個容錯方案中,操作系統(tǒng)和應用程序安裝在兩臺服務器的本地硬盤上,整個應用系統(tǒng)的數(shù)據是通過磁盤陣列集中管理的。數(shù)據集中管理是通過雙機熱備份軟件,將所有站點的數(shù)據直接從中央存儲設備讀取和存儲,并由專業(yè)人員進行管理,極大地保護了數(shù)據的安全性和保密性。用戶的數(shù)據存放在外接共享磁盤陣列中,在一臺服務器出現(xiàn)故障時,備機主動替代主機工作,保證網絡服務不間斷。
雙機熱備份的工作模式即目前通常所說的active/standby方式,active服務器處于工作狀態(tài);standby服務器處于監(jiān)控準備狀態(tài),服務器工作時將數(shù)據寫入共享磁盤陣列(或同時向兩臺或多臺服務器寫入,通常各服務器采用RAID磁盤陣列卡),保證數(shù)據的即時同步。當active服務器出現(xiàn)故障的時候,通過軟件診測或手工方式將standby機器激活,保證應用服務在短時間內完全恢復正常使用。雙機熱備典技術型應用在證券資金服務器或行情服務器,這是目前采用較多的一種模式。
雙機互備模式:是兩個相對獨立的應用在兩臺機器同時運行,但彼此均設為備機,當某一臺服務器出現(xiàn)故障時,另一臺服務器可以在短時間內將故障服務器的應用接管過來,從而保證了應用的持續(xù)性,但對服務器的性能要求比較高。
雙機雙工模式:是目前cluster(群集)的一種形式,兩臺服務器均為活動,同時運行相同的應用,保證整體的性能,也實現(xiàn)了負載均衡和互為備份,需要利用磁盤柜存儲技術(最好采用San方式)。WEB服務器或FTP服務器等用此種方式比較多。
1.3 單機容錯技術
單機容錯技術則是在一臺服務器上實現(xiàn)高性能容錯的,它的容錯能力要遠比服務器群集和雙機熱備份中容錯能力要高。容錯服務器是通過CPU時鐘鎖頻,通過對系統(tǒng)中所有硬件的備份,包括CPU、內存和I/O總線等的冗余備份,通過系統(tǒng)內所有冗余部件的同步運行,實現(xiàn)真正意義上的容錯。系統(tǒng)任何部件的故障都不會造成系統(tǒng)停頓和數(shù)據丟失。
以往的集群系統(tǒng)在出現(xiàn)故障的情況下,需要中斷服務器的運行,然后用一定的時間切換至備用的服務器才能進行維修和恢復,這在實時響應要求非常高的應用領域是不可容忍的。具有容錯技術的容錯服務器,最大的優(yōu)勢就在于它能夠自動分離故障模塊,在不中斷運行的情況下,進行模塊調換,對損壞的部件進行維護,并且在一切物理故障消除后,系統(tǒng)會自動重新同步運行,從而有效的解決了客戶的后顧之憂。
雙機熱備份和容錯服務器的定位稍微有些不同,這是由兩者實現(xiàn)的可用性差別決定的。雙機熱備份一般可以實現(xiàn)99.9%的可用性,容錯服務器卻可以實現(xiàn)99.999%的可用性。雙機熱備份大多應用在業(yè)務連續(xù)性不是很嚴格的行業(yè),比如說公安系統(tǒng)、部隊系統(tǒng)或者個別的制造企業(yè),這些行業(yè)的應用允許數(shù)據有一小段時間的中斷。而如電信、金融、證券和醫(yī)療等要求高的行業(yè)則是容錯服務器的天下。
2 雙機熱備技術在大港石化公司財務系統(tǒng)中的應用
結合石化公司財務處的需求及高可用性方面的考慮,按照財務系統(tǒng)的架構,對原有進行系統(tǒng)的全面升級改造,使用共享存儲的雙機熱備形式來提高整個系統(tǒng)的可用性。應用服務器和數(shù)據庫服務器分別采用雙機技術,使用共享的光存儲設備。兩組服務器采用光纖通道同磁盤陣列相連接,SYBASE數(shù)據庫文件及應用服務器數(shù)據文件保存在共享磁盤陣列中。兩臺服務器采用active/standby方式,在工作過程中,兩臺服務器以一個虛擬的IP地址對外提供服務,雙機熱備軟件控制服務器的響應,將服務請求發(fā)送給active服務器處理。同時standby服務器通過心跳線(目前往往采用建立私有網絡的方式)偵測另一臺服務器的工作狀況。當active服務器出現(xiàn)故障時,standby服務器根據心跳偵測的情況做出判斷,并進行切換,接管服務。對于用戶而言,這一過程是全自動的,在很短時間內完成,從而對業(yè)務不會造成影響。
2.1 硬件配置
本系統(tǒng)由4臺IBMx3560服務器作為系統(tǒng)的硬件業(yè)務平臺,其中2臺為應用服務器業(yè)務平臺,組成雙機熱備組,另外2臺作為數(shù)據庫服務器硬件平臺,組成雙機熱備組;1臺EMC AX4-5存儲盤陣作為共享存儲平臺,數(shù)據庫服務器及應用服務器的相關數(shù)據以共享的形式保存在盤陣上;2臺Cisco 9124光纖通道交換機,同磁盤陣列、服務器一起組成SAN存儲網絡。
2.2 軟件配置
在本項目中由于存在多條冗余路徑,所以對多路徑如何進行管理就成為了提高系統(tǒng)運行效率和系統(tǒng)穩(wěn)定性的重要因素,基于穩(wěn)定性和效率方面的考慮,采用了EMC的PwoerPath軟件來管理多條I/O通路間的負載均衡。
EMC PowerPathTM軟件用于增強存儲環(huán)境中開放系統(tǒng)的運行性能,使服務器可以在較少的時間內完成更多的工作,并消除I/O通路中的單點故障。PowerPath工作原理如圖2所示。
在PowerPath體系結構中使用的設備:PowerPath在邏輯設備和物理設備的可用通路之間提供一對多映射。如果不使用PowerPath,映射關系是一對一映射的,一個設備只存在一個有效通路。原理如圖3所示。
PowerPath軟件體系結構:PowerPath軟件具有一個“強大的驅動器”,它放置在主機上,位于主機總線適配器(HBA)設備層之上。這個透明的部件使得PowerPath可以創(chuàng)建虛擬的“強力設備”,為EMC存儲系統(tǒng)提供防止故障和負載均衡的通路。
雙機熱備的核心軟件選擇的是EMC AutoStart雙機熱備軟件。在服務器上安裝Autostart集群管理軟件,通過策略腳本對熱備組服務器之間的切換進行控制。
EMC AutoStart支持無限制主機數(shù)量的群集組合,EMC AutoStart能按客戶發(fā)展需求增加EMC AutoStart群集服務器及所載應用程序數(shù)量;提供故障監(jiān)察、修復、重新啟動及排除故障功能;能單獨修復個別故障應用,縮短系統(tǒng)復原時間;動態(tài)負載調節(jié),確保故障出現(xiàn)時,應用程序能平均地分布在不同服務器上;靈活、可靠、可調的群集構造,為日后擴展作好充分的準備;模塊構造和開放式APIs與現(xiàn)在系統(tǒng)的各個環(huán)節(jié)配合,確保端對端可靠性;協(xié)同數(shù)據庫及RDBMS數(shù)據備份服務器;提供中央管理,監(jiān)察群集組內不同的UNIX平臺。EMC AutoStart的這些關鍵技術可以為系統(tǒng)提供高可用性,可管理性和擴展性。
2.3 系統(tǒng)實施
在這套雙機系統(tǒng)中,為每臺服務器配置2塊千兆以太網卡,其中1塊Ethernet作為HeartBeat(心跳)線接口,HeartBeat線通過交叉線相連。Heartbeat接口配置雙機熱備組的私用IP地址,用于相互監(jiān)視對方的健康狀況。另外1個Ethernet網口用于配置服務器實際IP地址,把服務器接入到財務專用網絡上,原有的防火墻等安全設備配置不變。
在存儲共享的實現(xiàn)上,為每臺服務器安裝2塊FC HBA卡,2塊HBA卡互為備份,通過兩臺光纖交換機同磁盤陣列進行連接,這樣就可以組合出多條訪問存儲設備的通路。
在解決雙機監(jiān)控方面,在每臺服務器上安裝EMC AutoStar雙機管理軟件。通檢測服務器的網絡連接狀態(tài)、服務器關鍵服務進程狀態(tài)及雙機與共享盤陣的連接狀態(tài)控制雙機的切換。EMC AutoStar雙機軟件支持虛擬IP技術,將active主機和standby的IP虛擬為對外工作IP。一旦active服務器的檢測狀態(tài)發(fā)現(xiàn)異常,AutoStar會立刻激活standby服務器,接管故障服務器上所有的服務,整個切換過程對用戶不會造成大的影響,而且是對用戶透明的。
3 結 語
整個系統(tǒng)在實施完成之后實現(xiàn)了以下功能:實現(xiàn)數(shù)據及應用的分離存儲,整個系統(tǒng)的數(shù)據都保存在外部存儲盤陣上,避免了由于服務器硬件損壞而導致的數(shù)據丟失;關鍵性部件和SAN存儲通道均實現(xiàn)了冗余配置,基本消除了單點故障的可能性;服務器之間進行雙機熱備份,即應用服務器和數(shù)據庫服務器都是有兩臺一樣的機器組成的熱備組,熱備組中的一臺機器發(fā)生問題(軟件或硬件方面)服務后,另外一臺機器會迅速接管故障機器的應用,整個切換過程是由AutoStart雙機軟件根據策略自動進行的,無需管理員手動干預,系統(tǒng)切換的速度快,簡化了系統(tǒng)維護工作量。
參考文獻
[1]馬紀穎,朱力軍,張顏.Web信息檢索中信息分類計數(shù)研究[J].現(xiàn)代電子技術,2008,31(10):76-78.
[2]格巴斯.Sybase ASE12.5性能優(yōu)化.張崇文,譯.北京:電子工業(yè)出版社,2005.
[3]袁科萍,岑崗,攀慶紅.Unix Shell編程.3版.北京:中國鐵道出版社,2004.
[4]馮海軍.雙機熱備技術的應用[J].科技信息,2008(14):27-28.
[5]楊銳,冷祥.三層交換技術在局域網中的應用[J].電腦知識與技術,2008,1(3):441-442.
[6]杜永春,張喜柱,陸長福.財務管理.北京:新華出版社,1996.
[7]郭永基.可靠性工程原理[M].北京:清華大學出版社,2002.
[8]黎邵平,李錫文.雙機熱冗余控制系統(tǒng)的可靠性分析[J].自動化技術與應用,2006(12):18-20.
[9]鄭建立,路林吉.雙機熱冗余可修復容錯控制系統(tǒng)的可靠性分析[J].中國紡織大學學報,1999,25(1):67-69.
作者簡介 李 峰 男,1973年出生,天津大港人,信息工程師。主要從事網絡信息通訊管理研究工作。
曹 中 女,天津大港人,主要從事油田網絡信息化系統(tǒng)研究工作。
劉正偉 男,天津大港人,主要從事油田網絡信息化系統(tǒng)研究工作。