閻迅
【摘要】? ? 當今信息高速發(fā)展,隨著各行業(yè)及個人用戶需求不斷增加,信息、數據與IT系統(tǒng)儲存的重要性日益體現(xiàn),對災備需求也日益增多,“兩地三中心”的概念亦日漸被市場接受,將有變?yōu)橛残孕枨蟮内厔荩鄶祿行牟渴鹨嘧鳛闉膫涞幕A條件。傳統(tǒng)災備系統(tǒng)存在著各式各樣的問題:界面的差異,以及存儲服務器品牌型號不一,導致數據的備份遷移基本都需要業(yè)務中斷進行,造成用戶的經濟或運營損失。 在現(xiàn)今用戶不同品牌型號設備之間傳輸和共享日漸劇增的需求前提下,災備云解決方案就能完全解決以上問題。
【關鍵詞】? ? 災備云? ? 雙活
一、簡介
1.1災備評價指標
災備云的標準指標是數據的損失量與數據恢復時間,一般我們會通過數據的損失量與系統(tǒng)的恢復時間評估云平臺災備系統(tǒng):恢復點目標和恢復時間目標。
1.1.1恢復點目標:
1.以時間為基準單位,在數據系統(tǒng)崩潰時,系統(tǒng)和數據需要在此時間點前完成轉換或恢復的指標要求。
2.數據系統(tǒng)發(fā)生意外停機崩潰時,可承受的數據損失量最大值。
1.1.2恢復時間目標:
1.以時間為基準單位,在數據系統(tǒng)崩潰時,信息系統(tǒng)或業(yè)務功能需要在此時間點前完成轉換或恢復的指標要求。
2.數據系統(tǒng)發(fā)生崩潰時,可承受的工作時間停止的最大值。
1.2災難恢復能力等級
國際通用網絡災難判定標準為SHARE 78,該標準主要還是以恢復點目標和恢復時間目標為指標進行判定,我國在國際通用標準SHARE78基礎上制定并規(guī)范了符合我國網絡數據災備狀況的災備恢復能力等級的關系,主要等級如下:
1.3災備的分類
通過災備距離進行分類,可劃分為災備系統(tǒng)部署在同一物理地址的本地災備,災備系統(tǒng)部署在同一城市的近距離災備以及災備系統(tǒng)部署在不同城市的遠距離災備。
通過災備的層次進行分類,可分成只對數據進行災備操作的數據災備和對應用與數據進行災備操作的應用災備。
1.4主流數據災備技術
1.4.1數據備份
數據備份是災備系統(tǒng)的根本,是基礎災備系統(tǒng)的實現(xiàn)前提條件。當前的數據備份技術主要有快照、離線、異地存儲等三種。
1.4.2實時備份
實時備份是指在多塊存儲磁盤、多個存儲陣列、多臺存儲服務器以至到多個數據中心進行實時的數據或應用保存,實現(xiàn)多個備份的高端備份模式。
1.數據鏡像。數據鏡像是冗余備份的一種,具體原理是備份于A磁盤數據或應用同樣在B磁盤存在一致的副本,這個副本就稱之為鏡像,數據鏡像可按照備份手段分為軟件鏡像和硬件鏡像。
2.數據復制。數據復制工作原理是將原數據及其改動部分,以后續(xù)機制為手段拷貝到其他存儲點上,存儲點可以表現(xiàn)為磁盤、陣列、服務器、數據中心等等,并且通過實現(xiàn)的機制可劃分為同步復制與異步復制。
二、災備云的必要性
現(xiàn)今高速發(fā)展的網絡數據時代,存儲數據并不單純?yōu)榫W絡的通信手段了,更發(fā)展成為各行各業(yè)、以至個人的重要資產組成。因此繼續(xù)沿用傳統(tǒng)災備方案,無疑將存在資源利用率低、可用性差、災備停機時間長、數據恢復慢等問題。
而雙活模式的兩地三中心數據中心云災備系統(tǒng)將改進以上傳統(tǒng)災備系統(tǒng)的缺點,并且是往后發(fā)展的趨勢,而雙活存儲災備更是數據中心災備系統(tǒng)今后發(fā)展的必要基礎部分。
三、災備云系統(tǒng)建設的技術原則
高性能:將災備系統(tǒng)的處理性能提升到最大,保障災備系統(tǒng)整體在五年內的先進水平與高可適用性,使災備系統(tǒng)具備擴展能力,可適應將來災備核心技術的發(fā)展。
高可靠性:建立災備系統(tǒng)的目的是增強關鍵性業(yè)務應用與數據的抗災難能力,因此在災備系統(tǒng)方案制定階段需以系統(tǒng)本身穩(wěn)定性與可靠性為出發(fā),實現(xiàn)保障關鍵應用與數據的穩(wěn)定性。
可擴展性:災備系統(tǒng)的方案構建除應符合當前應用與數據的需求外,還需考慮到未來業(yè)務的發(fā)展對應用與數據的需求,并且能接受新技術和新概念的擴展,實現(xiàn)當前系統(tǒng)的穩(wěn)定保值。
可維護性:對災備系統(tǒng)的方案構建,應具備方便管理,易于維護,易于擴展,智能自動操作,主動告知故障等特性。
四、災備云實現(xiàn)的方式
4.1云到云間災備
一般為了滿足建設災備云平臺的需求,我們會為災備云平臺構建兩地三中心方案。兩地物理服務機做集群,共享存儲LUN使用。在本地機房利用原存儲結合SMA(存儲容錯引擎)和核心存儲系統(tǒng)搭建本地HA,當本地某套存儲出現(xiàn)意外,另一套存儲可以及時接管原有存儲運行中的業(yè)務,并可以保障無間斷的數據訪問,實現(xiàn)本地系統(tǒng)業(yè)務工作不間斷,確保用戶在用業(yè)務高效運營。同時異地機房利用存儲容錯引擎SMA和異地機房原有存儲搭建異地數據災備,當本地機房發(fā)生災難,異地機房系統(tǒng)可以及時自動無縫接管業(yè)務并進行數據生產。通過這種兩地三中心的項目規(guī)劃,使得云平臺的虛擬機可以在3個站點之間實現(xiàn)不停機的虛擬機遷移,當某節(jié)點出現(xiàn)宕機情況,用戶在用業(yè)務系統(tǒng)可轉換至備用生產節(jié)點上恢復正常業(yè)務,形成業(yè)務主備間零切換狀態(tài)。
4.1.1數據雙活設計
4.1.1.1通過SMA進行數據讀寫
異地數據中心,原有存儲對SMA分配一個LUN,SMA隨即應導出V-LUN,再且由兩個節(jié)點各自的SMA生成分布式虛擬LUN,并實現(xiàn)分布式Mirror防護。
兩地數據中心的災備云系統(tǒng)都能訪問到生成后的分布式虛擬LUN,由于災備云架構方案實現(xiàn)的是雙活災備云高可用方案,因此在導入數據同時,必須確認數據可同時導入到兩地的數據中心中,通過此方式,可保障數據的一致性。
4.1.1.2數據可持續(xù)
1.主機故障切換。災備云方案將單個云平臺的集群中的兩套業(yè)務主機分別安置在本地和異地數據中心中,使得兩套業(yè)務主機構成跨數據中心的集群系統(tǒng)。此方案設置將確保在正常情況下,一個節(jié)點的業(yè)務正常運作,而另外一個節(jié)點備用;而當業(yè)務正常運作節(jié)點的業(yè)務主機發(fā)生意外導致停機,業(yè)務會即時無縫切換到備用節(jié)點的業(yè)務主機實現(xiàn)雙活接管。
2.存儲故障切換。業(yè)務主機停機切換由HA集群實現(xiàn),而業(yè)務存儲系統(tǒng)停機的切換則由SMA實現(xiàn)。雙HA數據中心的構建,通過SMA能為用戶實現(xiàn)零恢復點目標的高效解決方案。而SMA系統(tǒng)自身是全冗余設計,包括電源風扇,管理端口等,可用性接近100%。
3.本地數據中心恢復。本地數據中心完成修復后,需要重新將本地數據中心與異地數據中心的SMA關聯(lián)起來。通過配置SMA,本地數據中心和異地數據中心的數據在后臺進行復制,直到兩邊數據一致。在這個過程中。在此過程中,不會影響到本地數據應用。
4.1.2應用雙活設計
4.1.2.1對于x86服務器應用的災備
這個部分也分為兩種:第一種部署了虛擬化集群的x86服務器;第二種直接物理部署應用的服務器。
第一種,通過在備機房部署一定比例的服務器同主機房的x86服務器形成一個大的虛擬化資源池,借助云平臺特有的故障恢復、應用集群等功能實現(xiàn)兩地應用的災備集群。
第二種,我們可以通過部署雙機軟件實現(xiàn)主機機房與災備機房物理服務器的雙機集群系統(tǒng),從而保證兩地直接的物理服務器災備。
4.1.2.2核心數據庫系統(tǒng)的災備
在災備中心部署專門的數據庫一體機系統(tǒng),并安裝數據庫作為業(yè)務數據庫服務器對外提供服務,通過配置異構平臺軟件:DSG數據庫災備軟件,獲取在線日志數據所產生的變化,轉變成用戶指定的數據格式儲存在本地隊列或遠端隊列中,實現(xiàn)由數據中心至災備數據中心的雙活。另外,為了保證系統(tǒng)的高效可用,生產中心自身小型機系統(tǒng)可以組成雙機集群;災備中心可根據實際需要部署1臺數據庫一體機,要求數據庫一體機采用分布式存儲架構實現(xiàn)軟件與設備硬件的松耦合,同時業(yè)務節(jié)點與存儲節(jié)點都能實現(xiàn)冗余架構。
4.2存儲級災備服務
云平臺可提供分布式存儲,可以實現(xiàn)應用數據存放于分布式存儲上,通過分布式存儲技術將數據分別儲存在多臺設備上。云平臺通過分布式網絡存儲系統(tǒng)的可擴展性結構,實現(xiàn)無需購買額外的存儲設備,能夠通過每臺物理機的本地硬盤構建分布式存儲環(huán)境,支持在分布式存儲上的故障恢復及多副本功能,默認三個副本,副本數量可根據用戶實際需要進行配置,當主副本所在硬盤出現(xiàn)故障時,能自動切換到可用副本,不影響業(yè)務正常運行,同時保障數據高可靠性。
4.3應用級備份服務
云平臺可提供多級別數據備份技術,支持硬盤配置備份與恢復功能,包括主動備份與自動備份,同時支持異地自動備份功能,多種備份方案,靈活方便;同時增加了鏡像去重技術,節(jié)約了備份文件儲存空間。云平臺通過定時備份功能支持配置備份服務器地址方式支持異地自動備份。并且云平臺通過快照的方式對運作中的業(yè)務主機進行在線備份。
五、結束語
在云平臺日益普及的當代,其具有部署便捷,可用性高,可擴展性大等優(yōu)點已被廣大用戶接受,而日漸增長的云平臺業(yè)務量,必將造成龐大的云數據存儲需求的產生,而數據存儲的災備功能將是往后各大云平臺關注的重點所在。
基于云平臺的災備云系統(tǒng)具備了可靠性高、擴展性大、維護便捷容易、業(yè)務風險低、性價比超傳統(tǒng)等等特點,因此,今后各大企業(yè)以及政府機關的數據存儲必將通過災備云系統(tǒng)實現(xiàn)數據信息的保駕護航。
參? 考? 文? 獻
[1]鄭晨溪,史曉卓.存儲災備私有云數據中心建設[J].電子世界,2013,10.
[2]張慧,張鵬,李文學.以“云災備”防不測——“中小金融機構災備服務云平臺”順利實施災備切換[J].金融電子化,2012,10.
[3]姜杰.基于二層網絡互通的跨數據中心電信私有云災備體系研究[J].互聯(lián)網天地,2015,12.