江定山
(南車長江車輛有限公司株洲分公司信息檔案處,湖南株洲412000)
針對企業(yè)實際應(yīng)用談DataGuard技術(shù)和HACMP技術(shù)
江定山
(南車長江車輛有限公司株洲分公司信息檔案處,湖南株洲412000)
本文對比了兩種高可用平臺的特點,并根據(jù)自身企業(yè)信息系統(tǒng)應(yīng)用的實際情況,選擇了DataGuard技術(shù)作為數(shù)據(jù)庫的高可用平臺。
高可用平臺;DataGuard;HACMP
隨著公司的信息化程度和管理水品的提高,以ERP①ERP(Enterprise Resource Planning,企業(yè)資源計劃),是一個建立在信息技術(shù)基礎(chǔ)上的系統(tǒng)化管理思想,為企業(yè)決策層及員工提供決策運行手段的管理平臺。它把企業(yè)的物流、人流、資金流、信息流統(tǒng)一起來進(jìn)行管理,以求最大限度地利用企業(yè)現(xiàn)有資源,實現(xiàn)企業(yè)經(jīng)濟(jì)效益的最大化。系統(tǒng)為代表的信息化管理技術(shù)已經(jīng)深入到了公司經(jīng)營管理的每一個角落。而保證信息化管理軟硬件平臺的安全和高可用性也成了公司信息技術(shù)部門工作的重中之重。
我們公司的ERP系統(tǒng)主要是由兩部分組成:一個是前臺Web應(yīng)用程序,一個是后臺數(shù)據(jù)庫。其中后臺數(shù)據(jù)庫部分是ERP系統(tǒng)的核心部分,后臺數(shù)據(jù)庫能夠24小時不間斷正常運作是保障ERP系統(tǒng)能正常應(yīng)用的關(guān)鍵。在公司ERP系統(tǒng)早期上線應(yīng)用的時候就曾出現(xiàn)過因為硬件原因?qū)е路?wù)器宕機(jī),Oracle數(shù)據(jù)無法正常運行的情況。經(jīng)過硬件供應(yīng)商和Oracle技術(shù)服務(wù)商派出的工程師合力搶救,花了兩天的時間,才使服務(wù)器恢復(fù)正常,Oracle數(shù)據(jù)庫重新運行。此次事故中,Oracle數(shù)據(jù)庫中的數(shù)據(jù)能夠完整恢復(fù)可以說是非常僥幸,而且系統(tǒng)恢復(fù)的過程長達(dá)兩天,嚴(yán)重影響了公司正常的生產(chǎn)經(jīng)營活動,給公司造成了一定的損失。數(shù)據(jù)庫服務(wù)器的安全問題成為了信息技術(shù)部門急需解決的問題。
為解決這個數(shù)據(jù)庫服務(wù)器的安全問題,保證數(shù)據(jù)庫長時間不間斷正常運行,并在軟硬件出現(xiàn)故障的時候能夠有有效的備用系統(tǒng)及時代替,公司投入了資金,針對數(shù)據(jù)庫建立了一個高可用平臺。
在技術(shù)選擇上,根據(jù)我們分公司軟硬件的實際情況,有兩個選擇:一是Oracle數(shù)據(jù)庫自身的DataGuard技術(shù),二是IBM小型機(jī)特有的HACMP技術(shù)。
Dataguard是由Oracle公司為了實現(xiàn)數(shù)據(jù)庫的安全而推出的一種高可用性數(shù)據(jù)庫方案,是生產(chǎn)數(shù)據(jù)庫的“事務(wù)一致性copy”,創(chuàng)建時,使用生產(chǎn)庫的物理copy。創(chuàng)建完成后,備庫會通過生產(chǎn)庫傳輸過來的歸檔日志②歸檔日志:是Oracle數(shù)據(jù)庫的非活動的重做日志備份。通過使用歸檔日志,可以保留所有重做歷史記錄。自動維護(hù)備用數(shù)據(jù)庫。最主要功能是容災(zāi)、數(shù)據(jù)保護(hù)、故障恢復(fù)等。實現(xiàn)原理是在主節(jié)點與備用節(jié)點間通過日志同步來保證數(shù)據(jù)的同步,可以實現(xiàn)數(shù)據(jù)庫快速切換與災(zāi)難性恢復(fù)。優(yōu)點是只要在軟件上對數(shù)據(jù)庫進(jìn)行設(shè)置,并不需要額外購買任何組件。用戶能夠在對主數(shù)據(jù)庫影響很小的情況下,實現(xiàn)主備數(shù)據(jù)庫的同步。而主備機(jī)之間的數(shù)據(jù)差異只限于在線日志部分。缺點是備機(jī)的硬件利用率比較低,平時只有較少的硬件消耗。
HACMP技術(shù)是IBM公司基于小型機(jī)硬件提出來的一個高可用平臺方案,它在使用高效群集內(nèi)置的增強(qiáng)擴(kuò)展性特征時可以鏈接多個服務(wù)器。群集服務(wù)器或節(jié)點允許對數(shù)據(jù)進(jìn)行并行訪問,可以提供關(guān)鍵商業(yè)應(yīng)用所要求的冗余性和容錯性。
經(jīng)過各方面考慮,筆者所在的公司最終采用了DataGuard技術(shù)來實現(xiàn)數(shù)據(jù)庫的高可用平臺。具體原因如下:①技術(shù)上,公司的信息技術(shù)人員對Oracle數(shù)據(jù)庫更為熟悉了解,其中的Data-Guard技術(shù)相對于HACMP來說更容易掌握,其搭建和維護(hù)可由分公司信息技術(shù)人員獨立承擔(dān),無需再增加額外的維護(hù)費用。②硬件上,分公司現(xiàn)有的服務(wù)器和網(wǎng)絡(luò)環(huán)境完全可以支持基于DataGuard技術(shù)的高可用平臺的搭建。③DataGuard最大的缺點“硬件利用率低”,公司也通過在備機(jī)上使用虛擬機(jī)技術(shù),將其多余的硬件性能應(yīng)用在其他方面,而不影響其備機(jī)功能。
如果公司選擇了HACMP技術(shù),會出現(xiàn)如下問題:①HACMP技術(shù)上實現(xiàn)較為復(fù)雜,需要對IBM小型機(jī)、存儲、AIX操作系統(tǒng)要有較為深入的了解,對HACMP技術(shù)要有較好的掌握,目前公司還沒有技術(shù)人員在這些方面能達(dá)到這些要求,無法承擔(dān)相關(guān)的日常維護(hù)、監(jiān)控工作,只能委托專門的技術(shù)服務(wù)公司提供服務(wù),會增加額外的維護(hù)成本;②在硬件上,HACMP技術(shù)對于相關(guān)服務(wù)器、存儲和網(wǎng)絡(luò)環(huán)境有較高的要求,如果要實現(xiàn)該技術(shù),還需要投入較多的資金,補充相關(guān)的硬件才能實現(xiàn)基于HACMP技術(shù)的高可用平臺。
具體的DataGuard配置情況如下:
首先在硬件方面,公司采用雙小型機(jī)帶雙存儲的模式。具體的架構(gòu)如圖1如示。
兩臺機(jī)器通過局域網(wǎng)互聯(lián),將一臺作為Oracle主機(jī),另外一臺作為備機(jī),配置Oracle數(shù)據(jù)庫的DataGuard平臺。
圖1 硬件架構(gòu)
其中,考慮到小型機(jī)到存儲之間的光纖線路的安全,特別配置了兩臺光纖交換機(jī),實現(xiàn)了光纖線路的冗余。
另外,考慮到小型機(jī)備機(jī)在未做切換的時候,性能有過剩的情況,我們對小型機(jī)做了LPAR配置③LPAR:邏輯分區(qū)(LPAR)就是將單臺服務(wù)器劃分成多個邏輯服務(wù)器,彼此運行獨立的應(yīng)用程序。。充分利用了小型機(jī)備機(jī)的資源,只是用部分硬件資源作為DataGuard的備機(jī)使用,另外劃分出的部分硬件資源作為他用。
10.3969/j.issn.1673-0194.2015.03.038
F407.471
A
1673-0194(2015)03-0072-02
2014-12-23