武衛(wèi)國 潘清 王霄軍 莊澤南裝備指揮技術(shù)學(xué)院 北京 101416
伴隨著社會(huì)信息化程度的不斷提高,需要管理的數(shù)據(jù)呈現(xiàn)了“指數(shù)級”增長,高端磁盤陣列作為存儲(chǔ)海量數(shù)據(jù)的解決方案被廣泛使用,人們對其可用性的要求也越來越高。在金融、軍隊(duì)、安全等領(lǐng)域中,一旦海量存儲(chǔ)陣列發(fā)生故障,將會(huì)造成大量數(shù)據(jù)丟失、許多重要業(yè)務(wù)停頓,其損失是難以估量的。
本文對高端磁盤陣列體系結(jié)構(gòu)進(jìn)行了分析,主要介紹了EMC公司的Symmetric V-Max和IBM DS8700高端存儲(chǔ)服務(wù)器的特性架構(gòu)以及他們典型的功能特點(diǎn),對他們進(jìn)行了比較,最后總結(jié)了高端磁盤陣列采用技術(shù)和未來發(fā)展趨勢。
EMC Symmetric V-Max是EMC的第一個(gè)基于虛擬矩陣架構(gòu)的高端存儲(chǔ)服務(wù)器。V-Max(圖 1)的核心部件是 V-Max Engine。通過在線增加 Engine的數(shù)量,最多可以連接 8個(gè)Engine,最大1TB全局緩存,以及最高192GB/S系統(tǒng)帶寬。
每個(gè) Engine 包含一對高可用性控制器、前端與主機(jī)連接的端口、后端與磁盤連接的端口和連接矩陣的接口。每個(gè)控制器包含兩個(gè)2.33GHZ Intel Xeon 4核處理器,高達(dá)64GB的全局緩存。單個(gè)Engine支持16個(gè)后端端口,16個(gè)前端端口,24GB/S帶寬。優(yōu)化的硬件邏輯和數(shù)據(jù)保護(hù)編碼通過通道自動(dòng)故障切換確保端到端的數(shù)據(jù)完整性,最大限度地實(shí)現(xiàn)了可用性和負(fù)載平衡。V-Max最多可以裝載2400個(gè)驅(qū)動(dòng)器。
虛擬互連矩陣(Virtual Matrix)提供兩個(gè)非阻塞的RapidIO私有網(wǎng)絡(luò)作為內(nèi)部節(jié)點(diǎn)來進(jìn)行互連。所有的控制器都可以通過有冗余的內(nèi)部Ethernet來管理矩陣路徑初始化、選擇、容錯(cuò)和隔離錯(cuò)誤以及其他配置。
V-Max所有的關(guān)鍵部件都是完全冗余的,包括V-Max控制器,虛擬矩陣數(shù)據(jù)通道,電源供給部件,備用電源和所有的光纖通道后端組件。
Symmetrix V-Max 系統(tǒng)支持所有常用的硬件和操作系統(tǒng)平臺、存儲(chǔ)區(qū)域網(wǎng)絡(luò) (SAN) 和高可用性群集環(huán)境。
圖1 EMC Symmetric V-Max
IBM DS8700 為IBM公司最新的高端存儲(chǔ)服務(wù)器。IBM聲稱DS8700提供了芯片技術(shù)、架構(gòu)技術(shù)以及安全技術(shù)與存儲(chǔ)系統(tǒng)的完美結(jié)合達(dá)到了99.999%的高可用性。
DS8700(圖 2)采用了高達(dá) 4.7GHz的頻率 POWER6 (eClipz L4服務(wù)器)。每個(gè)控制器處理器單元擁有雙處理器卡,每個(gè)處理器卡支持最多兩個(gè)處理器,使得每個(gè)控制器處理器單元能夠容納最多4個(gè)POWER6處理器。用戶最初可以選擇2路處理器,隨后可以在不中斷系統(tǒng)運(yùn)行的情況下升級到4路。
在POWER6中,IBM加入了恢復(fù)單元功能,該技術(shù)可以記憶CPU歷史信息,處理器出現(xiàn)錯(cuò)誤時(shí),可以根據(jù)歷史信息恢復(fù)到出錯(cuò)前狀態(tài)。
圖2 IBM DS8700
DS8700的POWER6服務(wù)器與IO模塊之間改變了之前系列所采用的RapidIO連接,取而代之的是采用點(diǎn)到點(diǎn)、雙單工的PCIe連接,最高達(dá)到了2Gb/s傳輸速度。但連接兩個(gè)POWER6控制器處理器單元的連接仍然采用RapidIO,以完成同步和控制兩個(gè)控制器單元的目的。PCIe通過自我修復(fù)以及接收器溢出校驗(yàn)、流量控制錯(cuò)誤校驗(yàn)、端對端CRC(ECRC)、崩潰TLP等技術(shù),提供了極好的可靠性。
DS8700的I/O模塊數(shù)量可以靈活配置,最初可以選擇兩個(gè)IO模塊,之后按需增加IO模塊。最多可以支持到8個(gè)IO模塊和5個(gè)機(jī)柜。由于采用了PCIe連接,I/O模塊的安裝只需要將電纜與 PCIe接口連接即可。DS8700最多可以支持1024塊磁盤,最高384GB緩存。
(1)自動(dòng)分層存儲(chǔ)優(yōu)化
EMC V-Max與IBM DS8700均支持閃存、光纖通道和SATA等驅(qū)動(dòng)器類型。同時(shí),V-Max與DS8700均提供了智能數(shù)據(jù)分層存儲(chǔ)功能,V-Max為FAST技術(shù),IBM為Smart Data Placement 技術(shù)。下面以V-Max的FAST技術(shù)為例介紹自動(dòng)分層存儲(chǔ)技術(shù)。
V-Max的自動(dòng)存儲(chǔ)分層(FAST)技術(shù)可以根據(jù)業(yè)務(wù)策略、預(yù)測模型和實(shí)時(shí)訪問情況把一個(gè)LUN的數(shù)據(jù)或者一個(gè)LUN當(dāng)中的某一個(gè)熱點(diǎn)數(shù)據(jù)塊的數(shù)據(jù)在閃存盤、光纖通道或者SATA硬盤之間遷移,從而充分發(fā)揮企業(yè)級閃存驅(qū)動(dòng)器的性能,并利用SATA硬盤驅(qū)動(dòng)器在容量和成本上的優(yōu)勢。LUN數(shù)據(jù)遷移允許在線遷移存儲(chǔ)在不同設(shè)備以及不同RAID保護(hù)類型上的數(shù)據(jù),可以遷移單個(gè)設(shè)備、群組設(shè)備或者整個(gè)存儲(chǔ)組。Symmetrix VLUN 遷移是在矩陣?yán)锿瓿傻?,不?huì)消耗CPU或I/O周期,不會(huì)給服務(wù)器造成任何附加負(fù)擔(dān)(圖3)。
圖3 分層存儲(chǔ)
(2)Thin Provision
V-Max與DS8700均支持Thin Porvision(在V-Max中叫做Virtual Porvision)。Thin Provision通過展現(xiàn)比實(shí)際可用物理空間更大的存儲(chǔ)空間,顯著的改善資源利用率。傳統(tǒng)的方法如果程序請求2TB空間,服務(wù)器分配2TB實(shí)際空間,而通過Thin Provision服務(wù)器只給使用的卷分配實(shí)際空間,按需擴(kuò)展,既增加了靈活性,也避免了潛在的資源浪費(fèi)。尤其是程序宕機(jī)的時(shí)候,只需要恢復(fù)實(shí)際使用的空間,而不是2TB(圖4)。
圖4 Thin Provision
高端磁盤陣列對數(shù)據(jù)安全性越來越重視,V-Max與DS8700均提供了相應(yīng)的數(shù)據(jù)安全解決方案。V-Max的數(shù)據(jù)安全技術(shù)主要采用基于RSA算法的PowerPath軟件加密實(shí)現(xiàn),安全控制策略包括日志記錄、訪問授權(quán)、 數(shù)據(jù)擦除等。而IBM DS8700采用了全磁盤自動(dòng)加密技術(shù),并結(jié)合軟件管理密鑰方式。下面介紹IBM DS8700的數(shù)據(jù)安全解決方案:
DS8700采用的是基于IBM全磁盤加密技術(shù)的希捷全加密硬盤,每個(gè)磁盤的驅(qū)動(dòng)器都內(nèi)嵌了加密/解密固件引擎,引擎采用對稱加密算法AES,結(jié)合256位的加密密鑰,在數(shù)據(jù)寫入磁盤時(shí)全速實(shí)時(shí)加密,讀出磁盤時(shí)全速實(shí)時(shí)解密,對上層應(yīng)用完全透明,并且對系統(tǒng)性能基本無影響。
TKLM(IBM Tivoli Key Lifecycle Manager)則為包括DS8700在內(nèi)的 IBM 加密存儲(chǔ)設(shè)備提供安全有效的密鑰服務(wù),如提供、保護(hù)、存儲(chǔ)以及維護(hù)密鑰等特性和功能。
同時(shí),DS8700擁有的分組加密技術(shù)則實(shí)現(xiàn)了對存儲(chǔ)資源的有效管理,“加密組”概念的引入使得數(shù)據(jù)的刪除和加密解密形成了封閉的鏈條,從而保證了數(shù)據(jù)不會(huì)被任意刪除。TKLM、分組加密技術(shù)和IBM全磁盤加密技術(shù)的有機(jī)結(jié)合,形成了DS8700解決靜態(tài)數(shù)據(jù)安全性問題的完整方案。
V-Max與DS8700均提供了以本地復(fù)制和遠(yuǎn)程復(fù)制為基礎(chǔ)的業(yè)務(wù)持續(xù)性解決方案。
(1)本地復(fù)制:EMC的TimeFineder系列軟件,IBM的FlashCopy 和FlashCopy SE。
(2)遠(yuǎn)程復(fù)制:EMC的SRDF系列軟件。相應(yīng)的IBM的遠(yuǎn)程鏡像和復(fù)制功能軟件為:Metro Mirror,Global Copy,Global Mirror和Metro/Global Mirror等。
此外,兩者均提供了 Three-site備份方案,EMC為SRDF/Star,IBM為Metro/Global Mirror。
下面以IBM DS8700為例,介紹業(yè)務(wù)持續(xù)性解決方案。
FlashCopy 和FlashCopy SE,提供了邏輯卷的時(shí)間點(diǎn)復(fù)制功能,原卷和目的卷可以立即訪問,對應(yīng)用程序沒有或者很小影響。
FlashCopy典型的應(yīng)用是生產(chǎn)數(shù)據(jù)備份,僅需要幾秒鐘即可建立FlashCopy源卷和目的卷的成對關(guān)系,創(chuàng)建必要的控制位圖,然后可以對源卷與目的卷進(jìn)行讀寫,好像所有的數(shù)據(jù)已經(jīng)復(fù)制完成(圖5)。
如果FlashCopy在后臺運(yùn)行時(shí),I/O請求到達(dá),F(xiàn)lashCopy操作如下:
① 讀源卷請求:直接從源卷讀取數(shù)據(jù)。
② 讀目的卷請求:FlashCopy檢查控制位圖,如果數(shù)據(jù)已經(jīng)復(fù)制到目的卷,從目的卷讀??;如果數(shù)據(jù)還沒有復(fù)制完成,從源卷讀取。
③ 寫源卷請求:數(shù)據(jù)暫時(shí)存入“寫緩存”頁,當(dāng)相應(yīng)寫緩存頁被換出時(shí),F(xiàn)lashCopy檢查位圖,如果數(shù)據(jù)已經(jīng)復(fù)制到目的卷,執(zhí)行寫入源卷;如果沒有復(fù)制到目的卷,同步地復(fù)制到目的卷,然后寫入源卷。
④ 寫目的卷請求:寫入目的卷,更新位圖,確保源卷不會(huì)重新改寫直接寫入目的卷的數(shù)據(jù)。
圖5 FlashCopy
FlashCopy SE 為虛擬的時(shí)間點(diǎn)的復(fù)制卷,僅復(fù)制改變的數(shù)據(jù)??梢詣?chuàng)建多個(gè)恢復(fù)點(diǎn),只需要幾分鐘即可完成。FlashCopy SE大大減少了需要傳輸?shù)臄?shù)據(jù)量(圖6)。
圖6 FlashCopy SE
Metro Mirror,提供了同步的端到端邏輯卷的實(shí)時(shí)鏡像,在備份完成之前,對源卷的寫操作同時(shí)在副本上完成,兩個(gè)站點(diǎn)距離可達(dá)300km。
Global Mirror,兩站點(diǎn)的遠(yuǎn)程異步鏡像技術(shù),主機(jī)寫到本地存儲(chǔ)單元的數(shù)據(jù)異步鏡像到遠(yuǎn)程站點(diǎn)存儲(chǔ)單元,支持的距離僅受限于網(wǎng)絡(luò)的能力和通道擴(kuò)展技術(shù)。
Metro/Global Mirror是一個(gè)三站點(diǎn)、多目的復(fù)制解決方案。B站點(diǎn)作為Metro Mirror的目的端和Global Mirror的源端(圖7)。
圖7 Metro/Global Mirror
A站點(diǎn)與B站點(diǎn)備份采用Metro Mirror技術(shù),為同步鏡像,由于B站點(diǎn)與本地站點(diǎn)距離較近,提供了高可用性、高性能和快速恢復(fù)能力。
B站點(diǎn)與C站點(diǎn)采用Global Mirror技術(shù),為異步鏡像,距離僅受限于網(wǎng)絡(luò)的能力和通道擴(kuò)展技術(shù)。通過恢復(fù)點(diǎn)目標(biāo),3到5秒內(nèi)即可提供可恢復(fù)的、可重啟的 、一致性鏡像。
(1)系統(tǒng)架構(gòu)
V-Max采用Engine為服務(wù)單元,向分布式集合體方向發(fā)展,支持橫向擴(kuò)展和縱向擴(kuò)展。Engine結(jié)構(gòu)的大小適中,可以減少能源和降熱的需求,因?yàn)榇髾C(jī)柜需要復(fù)雜的風(fēng)扇、電源、電池組件。但是V-Max基于Engine的設(shè)計(jì)表明,如果增加處理器、緩存或者需要多于 16個(gè)主機(jī)接口時(shí),不能夠單獨(dú)配置,必須以Engine為單位配置。
DS8700采用SMP對稱處理器,所有任務(wù)在處理器之間分享,各處理器的能力得到充分使用,但是進(jìn)一步擴(kuò)展受到物理限制,擴(kuò)展能力比V-Max弱。
DS8700存儲(chǔ)單元為全局管理模式,V-Max的存儲(chǔ)單元為分布管理模式。對于后者,一個(gè) Engine失效將導(dǎo)致其他Engine無法訪問其數(shù)據(jù)。
V-Max采用RapidIO技術(shù)互連Engine,1Gb/s傳輸速率。Ds8700采用PCIe連接I/O模塊與控制器,2Gb/s傳輸速率,而兩個(gè)POWER6控制器處理器單元的連接采用RapidIO,以完成同步和控制兩個(gè)控制器單元的目的。PCIe為點(diǎn)到點(diǎn)的連接,錯(cuò)誤定位準(zhǔn)確。
V-Max最高提供1TB全局緩存,DS8700最高提供384GB緩存;V-Max對“讀寫”均提供緩存功能,DS8700僅對“寫”提供緩存功能。V-Max將緩存分成 64KB頁大小,DS8700分為4KB頁大??;DS8700采用一系列高級緩存算法,算法效率較高。
(2)容量
V-Max通過配置 600GB FC驅(qū)動(dòng)器容量最高可達(dá)1440TB,通過配置 1TB SATA驅(qū)動(dòng)器容量可達(dá) 2400TB;DS8700通過配置450GB FC驅(qū)動(dòng)器容量最高達(dá)460.8TB,通過配置1TB SATA驅(qū)動(dòng)器最多可達(dá)1024TB。
(3)安全性
DS8700支持全盤加密技術(shù),磁盤驅(qū)動(dòng)器自帶加密解密引擎,對上層應(yīng)用完全透明,并且對系統(tǒng)性能基本無影響。V-Max不支持自加密驅(qū)動(dòng)器技術(shù),采用基于 RSA算法的PowerPath加密,效率較硬件加解密低,給處理器造成負(fù)擔(dān)。
(4)可恢復(fù)性
V-Max與DS8700 均提供了遠(yuǎn)程實(shí)時(shí)復(fù)制和恢復(fù)的健壯方案。V-Max解決方案包括SRDF系列軟件,IBM提供了Global Mirror and Metro Mirror 軟件。兩者均提供了Three-site備份方案,EMC為SRDF/Star ,IBM 為Metro/Global Mirror。
(5)智能數(shù)據(jù)分層存儲(chǔ)
V-Max與 DS8700均提供了智能數(shù)據(jù)分層存儲(chǔ)功能,V-Max為FAST技術(shù),IBM為Smart Data Placement 技術(shù)。通過自動(dòng)分層存儲(chǔ)技術(shù)可以識別“熱點(diǎn)”數(shù)據(jù)并自動(dòng)將其遷移到或者遷移出固態(tài)盤和光纖通道驅(qū)動(dòng)器以實(shí)現(xiàn)價(jià)格和性能的優(yōu)化。
本文分析了EMC V-Max與IBM DS8700高端存儲(chǔ)系統(tǒng)的體系結(jié)構(gòu)以及典型軟件功能,并對兩者進(jìn)行了對比??梢钥闯觯叨舜鎯?chǔ)系統(tǒng)在各個(gè)方面采用多種設(shè)計(jì)來提高系統(tǒng)的性能。系統(tǒng)架構(gòu)上,采用了多個(gè)高主頻的多核處理器以及大容量緩存,并在部分硬件加入了自動(dòng)查錯(cuò)糾錯(cuò)功能。I/O通道采用了高速互連技術(shù),如RapidIO技術(shù)、PCIe等技術(shù)。支持不同的驅(qū)動(dòng)器類型和主機(jī)接口,以滿足不同需求,并且有效降低成本。同時(shí)關(guān)鍵部件全部冗余的策略,提高了容錯(cuò)性和可靠性。值得注意的是,VM AX 的虛擬矩陣互連,是一種全新的陣列架構(gòu),突破了物理限制,能夠同時(shí)支持橫向擴(kuò)展和縱向擴(kuò)展。
軟件功能上,提供了大量的性能優(yōu)化軟件和管理軟件。自動(dòng)分層存儲(chǔ)軟件,可以識別“熱”數(shù)據(jù)并自動(dòng)將其在固態(tài)盤、光纖通道、SATA磁盤之間遷移,以實(shí)現(xiàn)價(jià)格和性能的最優(yōu)化。本地復(fù)制和遠(yuǎn)程復(fù)制為基礎(chǔ)的多數(shù)據(jù)中心解決方案,可以有效防止例如地震、大規(guī)模停電等自然災(zāi)害的發(fā)生,快速進(jìn)行災(zāi)難恢復(fù),提供了最高的業(yè)務(wù)持續(xù)性。
高端磁盤陣列對數(shù)據(jù)安全性更加重視,IBM采用的全磁盤自動(dòng)加密技術(shù),結(jié)合軟件管理密鑰方式,效率高、安全性好。未來,高端磁盤陣列應(yīng)當(dāng)會(huì)繼續(xù)沿著自動(dòng)分層存儲(chǔ)技術(shù)、可擴(kuò)展技術(shù)、資源自動(dòng)分配技術(shù)以及數(shù)據(jù)安全技術(shù)方向發(fā)展。
[1]IBM System Storage DS8700 Architecture and Implementation. http://www.redbooks.ibm.com/redbooks/pdfs/sg248786.pdf.
[2]Brian Garrett.Tony Palmer.Mark Peters:EMC Symmetrix V-Max 24xForever Storage for Virtualized Data Centers.2009.