郭德瑞
[摘 ? ?要] 結(jié)合企業(yè)信息化建設(shè)實(shí)際,撤銷子公司服務(wù)器機(jī)房,整合在用服務(wù)資源,應(yīng)用云計(jì)算技術(shù)部署了統(tǒng)一的服務(wù)平臺(tái),建立了云化遠(yuǎn)程管理體系。通過(guò)兩地雙中心云化建設(shè),對(duì)提高服務(wù)資源管理水平,降低生產(chǎn)經(jīng)營(yíng)成本效果十分明顯。
[關(guān)鍵詞] 兩地雙中心;整合;遷移;云計(jì)算
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 07. 077
[中圖分類號(hào)] TP311 ? ?[文獻(xiàn)標(biāo)識(shí)碼] ?A ? ? ?[文章編號(hào)] ?1673 - 0194(2020)07- 0186- 03
1 ? ? ?實(shí)施背景
信息化已經(jīng)成為國(guó)際石油石化行業(yè)和石油企業(yè)調(diào)整優(yōu)化結(jié)構(gòu)、提高管理水平、提升核心競(jìng)爭(zhēng)力的重要方式和途徑。然而,隨著油田信息化助力管理提升實(shí)現(xiàn)高質(zhì)量發(fā)展以及生產(chǎn)經(jīng)營(yíng)環(huán)境的變化,原有的服務(wù)資源分散管理帶來(lái)的問(wèn)題日益突出。
本文通過(guò)開展信息服務(wù)資源整合,并應(yīng)用云計(jì)算技術(shù)對(duì)服務(wù)資源實(shí)行遠(yuǎn)程統(tǒng)一管理,以確保服務(wù)器資源穩(wěn)定運(yùn)行,數(shù)據(jù)資源格式統(tǒng)一、數(shù)據(jù)源唯一,讀取數(shù)據(jù)便捷,保證應(yīng)用系統(tǒng)安全可靠運(yùn)行。
2 ? ? ?系統(tǒng)設(shè)計(jì)
2.1 ? 兩地雙中心框架設(shè)計(jì)
“兩地雙中心”是指同城加異地災(zāi)備中心的災(zāi)備模式,具高可用性和數(shù)據(jù)備份的能力。
異地災(zāi)備中心是指在異地的城市建立一個(gè)備份的災(zāi)備中心,用于主數(shù)據(jù)中心的數(shù)據(jù)備份,當(dāng)主數(shù)據(jù)中心由于遭受自然災(zāi)害等原因而發(fā)生故障時(shí),異地災(zāi)備中心可以用備份數(shù)據(jù)進(jìn)行業(yè)務(wù)的恢復(fù)。
在網(wǎng)絡(luò)層,兩中心采用萬(wàn)兆專網(wǎng)互連,保證雙中心之間較大的帶寬,響應(yīng)實(shí)時(shí)的業(yè)務(wù)數(shù)據(jù)需求,為所有不同的業(yè)務(wù)提供支持和連接。
在數(shù)據(jù)存儲(chǔ)層,部署存儲(chǔ)陣列,通過(guò)流復(fù)制技術(shù)將數(shù)據(jù)實(shí)時(shí)同步到災(zāi)備中心,保證數(shù)據(jù)的完整性和可用性。確保生產(chǎn)中心和災(zāi)備中心的數(shù)據(jù)完全一致。異地站點(diǎn)的作用主要是在遭受自然災(zāi)難,主數(shù)據(jù)中心網(wǎng)絡(luò)故障時(shí)可以確保在異地有一份完整的數(shù)據(jù)拷貝,用于后續(xù)業(yè)務(wù)的恢復(fù)。
2.2 ? 災(zāi)難恢復(fù)能力等級(jí)需求
根據(jù)國(guó)家標(biāo)準(zhǔn)《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》(GB/T 20988-2007) 的定義:災(zāi)難是指由于人為或自然的原因,造成信息系統(tǒng)嚴(yán)重故障或癱瘓,使信息系統(tǒng)支持的業(yè)務(wù)功能停頓或服務(wù)水平不可接受、達(dá)到特定的時(shí)間的突發(fā)性事件。
災(zāi)難備份是指為了災(zāi)難恢復(fù)而對(duì)數(shù)據(jù)、數(shù)據(jù)處理系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、基礎(chǔ)設(shè)施、專業(yè)技術(shù)支持能力和運(yùn)行管理能力進(jìn)行備份的過(guò)程;而災(zāi)難恢復(fù)是指為了將信息系統(tǒng)從災(zāi)難造成的故障或癱瘓狀態(tài)恢復(fù)到可正常運(yùn)行狀態(tài)、并將其支持的業(yè)務(wù)功能從災(zāi)難造成的不正常狀態(tài)恢復(fù)到可接受狀態(tài),而設(shè)計(jì)的活動(dòng)和流程。災(zāi)備系統(tǒng)的建設(shè)包含七要素:數(shù)據(jù)備份系統(tǒng)、備用數(shù)據(jù)處理系統(tǒng)、備用網(wǎng)絡(luò)系統(tǒng)、備用基礎(chǔ)設(shè)施、專業(yè)技術(shù)支持能力、運(yùn)行維護(hù)管理能力、災(zāi)難恢復(fù)預(yù)案。
《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》將災(zāi)難恢復(fù)能力劃分為6級(jí),災(zāi)難恢復(fù)能力等級(jí)越高,對(duì)信息系統(tǒng)的保護(hù)效果越好,但同時(shí)成本也會(huì)迅速上升。災(zāi)備等級(jí)主要從RTO(恢復(fù)時(shí)間目標(biāo)) 和RPO(恢復(fù)點(diǎn)目標(biāo)) 來(lái)考慮。RPO(恢復(fù)時(shí)間目標(biāo)) 是指發(fā)生災(zāi)難前最后一次備份的時(shí)間點(diǎn)距離當(dāng)前時(shí)間差(數(shù)據(jù)丟失時(shí)間);RTO(恢復(fù)時(shí)間目標(biāo)) 是指發(fā)生災(zāi)難后恢復(fù)物理系統(tǒng)環(huán)境的時(shí)間。大部分的用戶關(guān)注的是數(shù)據(jù)安全性,即RPO值(RPO越小,數(shù)據(jù)丟失越少),但是用戶往往談的更多的是RTO(RTO越小,恢復(fù)生產(chǎn)越快)。
RTO/RPO災(zāi)難恢復(fù)能力等級(jí)的關(guān)系見(jiàn)表1。
結(jié)合油田信息生產(chǎn)的實(shí)際需求和信息系統(tǒng)災(zāi)難恢復(fù)目標(biāo)的最低要求,以及《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》將災(zāi)難恢復(fù)能力劃分為6級(jí)的要求,將兩地雙中心恢復(fù)能力定為5級(jí)。
2.3 ? 兩地雙中心建設(shè)策略
依照中國(guó)石油行業(yè)IT戰(zhàn)略規(guī)劃和架構(gòu)的要求,筆者認(rèn)為“兩地雙中心”的建設(shè)應(yīng)按照如下策略進(jìn)行:
兩地雙中心建設(shè)要滿足業(yè)務(wù)的需求。建設(shè)資金投入、功能、處理能力、管理方式等必須滿足目前的業(yè)務(wù)需求,同時(shí)還要兼顧未來(lái)發(fā)展的要求。
兩地雙中心需要建立高可用性的架構(gòu)。其中災(zāi)備中心啟用后,就開始為生產(chǎn)中心提供服務(wù)。因此災(zāi)備中心也應(yīng)該與生產(chǎn)中心一樣,對(duì)關(guān)鍵業(yè)務(wù)應(yīng)用采用高可用性架構(gòu),以防止由于單點(diǎn)故障而引起宕機(jī)。
兩地雙中心設(shè)備應(yīng)該得到充分利用。系統(tǒng)建設(shè)不僅要考慮到緊急情況下的使用情況,還要考慮日常如何利用。例如,為了在平時(shí)提供災(zāi)備中心設(shè)備的利用率,可以利用災(zāi)備中心的設(shè)備進(jìn)行應(yīng)用的開發(fā)和測(cè)試。
兩地雙中心建設(shè)以用先進(jìn)、成熟的方法論作為指導(dǎo),分階段進(jìn)行。成熟的方法論為災(zāi)備中心建設(shè)的成功提供了保障。
災(zāi)備中心與生產(chǎn)中心使用結(jié)構(gòu)相同的基礎(chǔ)架構(gòu)和管理流程。這樣可以大大降低管理與運(yùn)行維護(hù)的復(fù)雜度。災(zāi)備中心的處理能力可以與生產(chǎn)中心不同,但是要滿足業(yè)務(wù)需要。建設(shè)的內(nèi)容包括面向數(shù)據(jù)中心提供網(wǎng)絡(luò)通訊設(shè)備、通訊線路、存儲(chǔ)網(wǎng)絡(luò)設(shè)備的全面容錯(cuò)和異地容災(zāi);面向數(shù)據(jù)中心提供部分關(guān)鍵業(yè)務(wù)系統(tǒng)的容錯(cuò)和異地容。
3 ? ? ?兩地雙中心方案的實(shí)現(xiàn)
3.1 ? 實(shí)施應(yīng)用系統(tǒng)和數(shù)據(jù)資源遷移
一是統(tǒng)計(jì)可遷移應(yīng)用系統(tǒng)與用戶數(shù)據(jù)。對(duì)企業(yè)現(xiàn)有應(yīng)用系統(tǒng)與相關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),制作遷移計(jì)劃表。計(jì)劃8月底完成遷移工作,9-12月進(jìn)行系統(tǒng)優(yōu)化,解決遷移過(guò)程中發(fā)現(xiàn)的問(wèn)題,同時(shí)要做好規(guī)劃和分步實(shí)施。
二是組織開展數(shù)據(jù)和應(yīng)用整合。分析數(shù)據(jù)庫(kù)和應(yīng)用系統(tǒng)的邏輯結(jié)構(gòu)和對(duì)應(yīng)關(guān)系,逐步把油藏、采油等專業(yè)數(shù)據(jù)遷移到異地?cái)?shù)據(jù)中心主數(shù)據(jù)庫(kù)系統(tǒng)中,梳理數(shù)據(jù)庫(kù)之間視圖關(guān)聯(lián)信息、數(shù)據(jù)維護(hù)軟件配置信息及數(shù)據(jù)分析應(yīng)用軟件數(shù)據(jù)調(diào)用情況,建立統(tǒng)一的用戶訪問(wèn)試圖,確保各項(xiàng)數(shù)據(jù)的唯一性,提高數(shù)據(jù)服務(wù)質(zhì)量。
三是完成服務(wù)器物理整合。組織技術(shù)人員認(rèn)真討論、分析各單位服務(wù)器性能,確定服務(wù)器整合、報(bào)廢原則,詳單見(jiàn)表2。將32位機(jī)器中運(yùn)行的應(yīng)用系統(tǒng)通過(guò)P2V的形式轉(zhuǎn)換到虛擬化集群當(dāng)中,不改變數(shù)據(jù)庫(kù)和應(yīng)用系統(tǒng)部署的邏輯結(jié)構(gòu),保證原有應(yīng)用的穩(wěn)定運(yùn)行,實(shí)現(xiàn)系統(tǒng)集中管理。對(duì)這些性能落后、無(wú)升級(jí)利用價(jià)值的硬件設(shè)備由原單位直接報(bào)廢。
3.2 ? 實(shí)施云計(jì)算遠(yuǎn)程運(yùn)行管理
堅(jiān)持統(tǒng)一性原則建設(shè)一體化平臺(tái),借助云計(jì)算技術(shù)通過(guò)集中式管理系統(tǒng)建立完善的數(shù)據(jù)體系和信息共享機(jī)制,其中集中式管理系統(tǒng)集中安裝在云計(jì)算平臺(tái)上,通過(guò)嚴(yán)密的權(quán)限管理和安全機(jī)制來(lái)實(shí)現(xiàn)平臺(tái)對(duì)數(shù)據(jù)和信息管理系統(tǒng)的把控和安全保障,實(shí)現(xiàn)了云管理。
通過(guò)開發(fā)統(tǒng)一、開放、包容、安全、穩(wěn)定的管理平臺(tái)。滿足了技術(shù)研究、生產(chǎn)管理、信息管理等各級(jí)人員的需求。實(shí)現(xiàn)了服務(wù)資源申請(qǐng)與分配業(yè)務(wù)的自動(dòng)化、信息化管理。制定了服務(wù)器管理流程、應(yīng)用系統(tǒng)管理流程、擴(kuò)展業(yè)務(wù)管理流程和外網(wǎng)管理流程。通過(guò)在線設(shè)計(jì)、審批、實(shí)施、跟蹤流程,為業(yè)務(wù)和人員搭建了高效、共享的工作平臺(tái),通過(guò)各項(xiàng)關(guān)鍵指標(biāo),掌握油田生產(chǎn)運(yùn)行狀況,為決策管理層提供了有力工具。
3.3 ? 建立異地災(zāi)備系統(tǒng),確保數(shù)據(jù)安全
3.3.1 ? 數(shù)據(jù)備份
一是建立同步數(shù)據(jù)備份機(jī)制。應(yīng)用流復(fù)制技術(shù)建立異地?cái)?shù)據(jù)中心主數(shù)據(jù)庫(kù)到本地?cái)?shù)據(jù)中心的數(shù)據(jù)備份系統(tǒng),當(dāng)有數(shù)據(jù)寫入數(shù)據(jù)庫(kù)時(shí),數(shù)據(jù)庫(kù)間的同步機(jī)制會(huì)將數(shù)據(jù)復(fù)制一份到災(zāi)備中心,實(shí)現(xiàn)數(shù)據(jù)庫(kù)實(shí)時(shí)備份。這種備份機(jī)制支持增量備份方式,可以節(jié)省數(shù)據(jù)備份的帶寬占用,縮短數(shù)據(jù)備份時(shí)間;二是建立異步數(shù)據(jù)備份機(jī)制。應(yīng)用系統(tǒng)任務(wù)計(jì)劃與Oracle EXP/IMP機(jī)制,定期將數(shù)據(jù)復(fù)制備份,實(shí)現(xiàn)了數(shù)據(jù)日備份。通過(guò)這兩種方式,提高了數(shù)據(jù)的安全性和服務(wù)的可靠性。
3.3.2 ? 業(yè)務(wù)應(yīng)用備份與恢復(fù)實(shí)現(xiàn)
應(yīng)用環(huán)境備份的目的是確保災(zāi)備中心能夠快速重建數(shù)據(jù)中心應(yīng)用系統(tǒng)環(huán)境,并實(shí)現(xiàn)備份業(yè)務(wù)系統(tǒng)對(duì)生產(chǎn)系統(tǒng)有效替代。對(duì)應(yīng)用環(huán)境備份的設(shè)計(jì)要點(diǎn)包括:
通過(guò)配置實(shí)現(xiàn)數(shù)據(jù)中心應(yīng)用環(huán)境的一致性。災(zāi)備中心的應(yīng)用環(huán)境在技術(shù)路線、設(shè)備部署方面應(yīng)盡量保證與數(shù)據(jù)中心應(yīng)用環(huán)境一致。這樣有利于提高災(zāi)備應(yīng)用環(huán)境與生產(chǎn)應(yīng)用環(huán)境之間手工切換的效率,也有利于日常檢驗(yàn)災(zāi)備應(yīng)用環(huán)境的可用性。一般可通過(guò)災(zāi)備應(yīng)用環(huán)境定期向生產(chǎn)應(yīng)用環(huán)境讀取配置文件、參數(shù)等方式,實(shí)現(xiàn)兩者配置的同步。
災(zāi)備中心業(yè)務(wù)系統(tǒng)實(shí)現(xiàn)集群間自動(dòng)切換模式。數(shù)據(jù)中心應(yīng)用服務(wù)器一般通過(guò)HA等技術(shù)建立高可用性集群,保證本地應(yīng)用服務(wù)的高可靠性,滿足RTO一小時(shí)以內(nèi)的災(zāi)備恢復(fù)需求。對(duì)于數(shù)據(jù)通過(guò)手工方式進(jìn)行主備數(shù)據(jù)庫(kù)切換,恢復(fù)信息運(yùn)行。
采用虛擬化技術(shù)對(duì)備份環(huán)境進(jìn)行整合。災(zāi)備中心應(yīng)用環(huán)境備份資源畢竟有限,充分利用備份應(yīng)用資源對(duì)數(shù)據(jù)中心應(yīng)用環(huán)境保護(hù)十分重要。虛擬化技術(shù)可實(shí)現(xiàn)一臺(tái)物理應(yīng)用服務(wù)器對(duì)多臺(tái)邏輯服務(wù)器的虛擬。這樣在數(shù)據(jù)中心里,大量性能要求不苛刻、RTO要求在數(shù)小時(shí)以上的應(yīng)用系統(tǒng)災(zāi)備環(huán)境就可以集中部署在少數(shù)的硬件服務(wù)器資源中,有利于災(zāi)備中心盡可能提高對(duì)數(shù)據(jù)中心應(yīng)用系統(tǒng)的災(zāi)備范圍。保障本單位生產(chǎn)的持續(xù)性和穩(wěn)定性,提高安全性與可靠性。
3.4 ? 完善運(yùn)維體系,確保服務(wù)質(zhì)量
實(shí)行服務(wù)器資源云遷移后,應(yīng)用系統(tǒng)和數(shù)據(jù)全部集中在異地?cái)?shù)據(jù)中心,服務(wù)器資源的申請(qǐng)與運(yùn)維對(duì)企業(yè)生產(chǎn)經(jīng)營(yíng)管理的順利開展具有決定性影響,因此開展了制度與崗位職責(zé)的重新修訂。運(yùn)維管理范圍涵蓋本地?cái)?shù)據(jù)中心運(yùn)維和異地?cái)?shù)據(jù)中心資源運(yùn)維管理兩部分。依據(jù)上級(jí)公司數(shù)據(jù)中心相關(guān)管理規(guī)范,修訂了《數(shù)據(jù)中心運(yùn)維管理制度》進(jìn)一步加強(qiáng)了機(jī)房門禁卡發(fā)放、機(jī)房出入、設(shè)備巡檢、故障處理流程等管理內(nèi)容。同時(shí),修改了中心值班管理內(nèi)容,增加了非工作時(shí)間值班人員機(jī)房狀態(tài)檢查記錄與處理流程。將異地?cái)?shù)據(jù)中心云資源聯(lián)系人由一人增至兩人,確保聯(lián)系暢通,有效保證了本地機(jī)房與云資源安全穩(wěn)定運(yùn)行。
4 ? ? ?結(jié) ? ?論
通過(guò)兩地雙中心云化建設(shè),對(duì)提高服務(wù)資源管理水平,減低生產(chǎn)經(jīng)營(yíng)成本效果十分明顯。一是安全性和服務(wù)可靠性進(jìn)一步提升;二是成本壓力有效降低;三是提高了數(shù)據(jù)服務(wù)質(zhì)量;四是提高工作效率,節(jié)省了人力和工作時(shí)間;五是完善的運(yùn)維業(yè)務(wù)管理為信息生產(chǎn)提供巨大支持作用。