郭 鋰,蒙慶全,葉惠文
(華南師范大學 教育信息技術中心,廣東 廣州510631)
在社會信息化日益深入,知識增長迅速的今天,各種網(wǎng)絡教學平臺和數(shù)字化教學資源在高校教學活動中的參與程度越來越高,各高校對教學資源建設的投入也越來越大。學校里的數(shù)據(jù)資源就相當于商業(yè)社會中的銀行資金,一旦數(shù)據(jù)資源管理系統(tǒng)出現(xiàn)故障或學習資源被破壞,師生將無法進行正常的教學和學習。隨著教育信息化程度的不斷推進,高校對于數(shù)據(jù)支撐系統(tǒng)的穩(wěn)定性和可靠性的要求隨之提高。同時,在經(jīng)歷了信息化建設的10多年過程后,由于存儲技術的進步、資金預算有限等眾多因素,各高校在數(shù)據(jù)存儲管理方面也普遍遭遇了一些問題和困惑,如:
目前高校絕大多數(shù)的應用服務器采用直連式存儲,每增加一臺服務器就需要增加相應的存儲,導致了存儲分布散、擴容難、利用率不高、異構化嚴重、不易管理等問題。
在不同的時期,各校都購置了各種各樣的存儲設備,其中多數(shù)設備是依賴當時硬件系統(tǒng)和應用系統(tǒng)理念來配置的,隨著時間推移應用系統(tǒng)升級,存儲設備的性能和容量不再滿足要求,存儲設備的動態(tài)擴展和兼容問題以及提高舊硬件設備的再利用率的問題也隨之出現(xiàn)。
隨著各高校教學資源數(shù)據(jù)量的與日俱增,由于人為誤操作、硬件故障、系統(tǒng)錯誤、不可抗災難等因素引發(fā)的數(shù)據(jù)損壞丟失問題也給管理人員愈加帶來困擾,災難備份與數(shù)據(jù)保護成為管理工作面臨的困難之一。
面對這些各高校普遍存在的代表性問題,華南師范大學在分析高校數(shù)據(jù)存儲管理新需求的基礎上,結合虛擬存儲和CDP等新技術,構建了一套存儲虛擬化應用方案,實現(xiàn)了對存儲資源進行統(tǒng)一管理和按需分配,提高了資源利用率和系統(tǒng)穩(wěn)定性,降低了系統(tǒng)的投入和維護的成本。
存儲虛擬化這個名詞正越來越受到大家的關注,其相關技術作為一種適應當前社會數(shù)據(jù)爆炸性增長速度并緩解企業(yè)數(shù)據(jù)管理壓力的高端解決方案,已經(jīng)為許多大型公司企業(yè)所普遍采用。隨著技術和產(chǎn)品的成熟發(fā)展,尤其是產(chǎn)品性價比的不斷提升,存儲虛擬化技術在教育行業(yè)中的應用也變得不再遙不可及。
虛擬存儲的概念可以理解為:通過一定的技術方法將所有存儲設備集中在一個存儲池(Storage Pool)中進行統(tǒng)一管理,并可根據(jù)服務器的需要分配存儲空間,對服務器而言就好像一個超大容量的虛擬磁盤。這種可以將多種不同的存儲物理媒介和存儲子系統(tǒng)整合起來,為使用者提供大容量、高數(shù)據(jù)傳輸性能的存儲系統(tǒng),就稱之為虛擬存儲。[1]當前虛擬存儲的實現(xiàn)方式主要分為以下三種。
(1)基于服務器端
此種方式主要是在服務器平臺上安裝管理軟件,通過服務器端將鏡像映射到外圍存儲設備上,除了分配數(shù)據(jù)外,對外圍存儲設備沒有任何控制。由于控制軟件是運行在主機上,占用主機的處理時間,服務器端常常產(chǎn)生性能瓶頸問題。[2]
(2)基于存儲子系統(tǒng)端
此種方式中實施虛擬的位置在于存儲設備本身。在存儲子系統(tǒng)端的虛擬存儲設備主要通過大規(guī)模的RAID子系統(tǒng)和多個I/O通道連接到服務器上,智能控制器提供LUN訪問控制、緩存和其他如數(shù)據(jù)復制等的管理功能,此技術多被傳統(tǒng)儲存設備廠商采用。
(3)基于網(wǎng)絡設備端
此種方式是通過網(wǎng)絡設備端實施虛擬存儲,將邏輯鏡像映射到外圍存儲設備,除了分配數(shù)據(jù)外,對外圍存儲設備沒有任何控制。其優(yōu)勢在于,其實施介于服務器和存儲設備兩個環(huán)境之間,可能是最“開放”的虛擬實施環(huán)境,最有可能支持任何的服務器、操作系統(tǒng)、應用和存儲設備。
華南師范大學虛擬存儲解決方案中采用上述第三種方式(基于網(wǎng)絡設備端的虛擬存儲),主要考慮到其便于支持眾多不同類型的服務器、操作系統(tǒng)、應用和存儲設備,擴展性和兼容性較強,且價格成本相對較低。存儲虛擬化軟件在設備上創(chuàng)建一個邏輯空間,在物理磁盤空間和邏輯磁盤空間之間建立映射關系的方式來管理源數(shù)據(jù),存儲硬件的增減、調(diào)換、分拆、合并對服務器層完全透明。采用這種開發(fā)式存儲架構優(yōu)勢在于:支持常規(guī)的標準存儲協(xié)議,實現(xiàn)強兼容,同時可提供二次開發(fā)API接口列表,有利于實現(xiàn)與教學輔助平臺的無縫鏈接,以最高的效率、最低的成本來滿足各類不同應用在性能和容量等方面的需求。
CDP(Continuous Data Protection,CDP)連續(xù)數(shù)據(jù)保護是當前數(shù)據(jù)備份領域內(nèi)的一項新技術,它能夠持續(xù)實時地跟蹤捕獲數(shù)據(jù)變化,并記錄到專用的存儲設備或通過網(wǎng)絡發(fā)送到專用服務器上;在故障發(fā)生時,能夠將被保護的數(shù)據(jù)狀態(tài)恢復到任意時間點。[3]數(shù)據(jù)保護系統(tǒng)可以基于塊、文件或應用實現(xiàn),可以為恢復對象提供足夠細的恢復粒度,將容災指標數(shù)據(jù)恢復點目標(Recovery Point Objective,RPO)和恢復時間目標 (Recovery Time Objective,RTO)提高到一個新的臺階[4]。
華南師范大學作為教育信息化建設起步較早的“211”師范類教學科研型大學,學科涉及門類眾多,多年來陸續(xù)建設有大量的精品課程、視頻資源、學習平臺、各類應用和管理系統(tǒng),其數(shù)據(jù)存儲管理的需求在國內(nèi)高校中具備一定的代表性,可歸納總結如下。
(1)當增加一個應用模塊時,通過系統(tǒng)能自動或手動虛擬一個與應用的虛擬服務器對應的虛擬磁盤。當減少一個應用模塊時,系統(tǒng)能自動或手動刪去相應的所虛擬的磁盤。
(2)實現(xiàn)將各種的存儲器陣列集成一個虛擬存儲器池,在物理上視為一個磁盤。根據(jù)應用模塊隨時劃出一個存儲空間與應用虛擬服務器對應,完成數(shù)據(jù)的存儲管理。
(3)實現(xiàn)存儲增刪的動態(tài)管理,即,當應用發(fā)展的需要發(fā)現(xiàn)存儲陣列中容量不足時,可隨之增加虛擬磁盤容量。
(4)具有對多種不同廠家和型號的存儲陣列的管理功能。
(5)支持應用模塊的各種數(shù)據(jù)需求(數(shù)據(jù)類型、容量、運行系統(tǒng)等),能夠自動或手動生成多個虛擬存儲空間的鏈接表,供用戶選擇合適的對應數(shù)據(jù)存儲服務。
(6)能夠建立各種存儲陣列的參數(shù)與信息詞典,清晰描述出各個存儲器的基本參數(shù)。
(7)能夠實現(xiàn)存儲空間預警功能。
為解決上述需求,經(jīng)過多次研究和討論,通過各種測試和實驗,華南師范大學構建了一套存儲虛擬化應用解決方案,本方案的目的是實現(xiàn)資源的有效利用,通過將新舊資源的重新整合,實現(xiàn)對海量教學資源及眾多的應用系統(tǒng)進行有效的支撐,并且根據(jù)應用系統(tǒng)的需求動態(tài)分配存儲資源。本方案中虛擬存儲支撐平臺的結構如圖1所示。
圖1 虛擬存儲支撐平臺架構示意
本方案主要采用信核數(shù)據(jù)三種 “存儲引擎、SAN引擎、虛擬化引擎”的技術實現(xiàn)。信核數(shù)據(jù)設備采用OSN(Open Storage Network)開放式存儲平臺技術,通過標準的FC/IP/SAS/Infiniband等協(xié)議管理存儲設備,從而獲取存儲中的卷組信息。
(1)實現(xiàn)異構存儲虛擬化
1)構造虛擬系統(tǒng)平臺,支持多品牌存儲設備整合
本方案中采用的OSN(Open Storage Network)開放式存儲平臺技術能夠構建網(wǎng)絡存儲虛擬化平臺、統(tǒng)一管理異構設備和各種數(shù)據(jù)、整合不同類型的存儲資源,如ATDX、IBM、Dell等公司的存儲設備,其異構結構如圖2所示。
圖2 多品牌整合結構
2)虛擬系統(tǒng)對多品牌組成的存儲池管理方法
虛擬存儲管理解決方案將應用服務器與后端存儲進行透明的分離,通過集成 CDP、SnapShot、DR、HA 等多項增值保護功能,建立完整的數(shù)據(jù)保護體系,以經(jīng)濟高效的方式將數(shù)據(jù)損失風險降至最低,保證在發(fā)生任意單點故障的情況下,業(yè)務能夠保持7×24小時的連續(xù)運行。
(2)實現(xiàn)存儲虛擬化與前端主機虛擬化的融合
前端主機采用了Red Hat KVM主機虛擬化軟件,每個虛擬機的文件系統(tǒng)都創(chuàng)建在虛擬化存儲系統(tǒng)上。服務器平臺上運行Red Hat GFS高性能的群集文件系統(tǒng),允許多個物理服務器安裝同時訪問同一虛擬機存儲,實現(xiàn)安裝數(shù)據(jù)庫文件、系統(tǒng)數(shù)據(jù)等。這樣建立起來的系統(tǒng),實現(xiàn)了服務器和存儲系統(tǒng)的無縫融合。
(3)數(shù)據(jù)遷移
在不改變原有數(shù)據(jù)的前提下,將數(shù)據(jù)從現(xiàn)有的存儲平滑遷移至其他存儲陣列上,對前端的業(yè)務等應用沒有影響。
(4)虛擬存儲的動態(tài)負載均衡
本方案中,在網(wǎng)絡層通過Block塊的技術去實現(xiàn)數(shù)據(jù)的同步寫入,不依賴主機和存儲系統(tǒng),實現(xiàn)靈活的架構配置和管理??稍诓挥绊懍F(xiàn)有應用的情況下,透明實現(xiàn)存儲集群,實現(xiàn)了以下幾點:
1)支持FC SAN+IP SAN綜合網(wǎng)絡存儲架構,實現(xiàn)統(tǒng)一存儲和應用混合使用。
2)支持 Standard、MPIO 和 Cluster,支持 Active/Active和Active/StandBy模式。
3)實現(xiàn)基于FC和IP的數(shù)據(jù)同步,對業(yè)務網(wǎng)絡不造成負擔壓力。
4)提供Cache能力,加速提升了存儲IO能力。
5)實現(xiàn)存儲故障自動切換和存儲修復自動切換,可提供99.99%的可用性,支持業(yè)務持續(xù)應用。
6)提供現(xiàn)有存儲自動遷移服務,最大限度地減少業(yè)務宕機時間。
(5)CDP在線系統(tǒng)級實時保護和恢復系統(tǒng)
本方案中的CDP模塊利用數(shù)據(jù)鏡像和數(shù)據(jù)復制(同步或異步)策略,實現(xiàn)將待備服務器的待備數(shù)據(jù)納入CDP平臺的保護體系,以確保數(shù)據(jù)發(fā)生錯誤時,數(shù)據(jù)恢復到最新的時間點。同時,采用配合數(shù)據(jù)復制卷的時間點快照技術(快照流),通過時間指針的方式,按增量快照的方式記錄下數(shù)據(jù)復制卷的變化,每一個快照對應一個時間點,記住了數(shù)據(jù)多個時刻的歷史變化過程,產(chǎn)生多個基于時間點數(shù)據(jù)影像 (自動情況下精確到每十分鐘,手動情況下精確到秒級)。這些數(shù)據(jù)影像不僅時間點細致精確,而且通過快照的回滾操作還可以直接使用,用戶經(jīng)過簡單的設置就可以對快照數(shù)據(jù)進行操作,解決誤刪除、誤操作、病毒破壞等造成的數(shù)據(jù)丟失。
華南師范大學的存儲虛擬化應用方案,經(jīng)過一年多的論證、建設和測試,實現(xiàn)了高穩(wěn)定性、易維護性、高效低成本的建設目標。方案在利用現(xiàn)有的主機和存儲系統(tǒng)等硬件環(huán)境下,實現(xiàn)了存儲數(shù)據(jù)整合;有效的利用了閑置的、不同接口的存儲設備;提高了存儲的利用率;同時也優(yōu)化了原存儲的性能。系統(tǒng)中配置的CDP在線保護模塊確保了整合后數(shù)據(jù)的安全性和教學平臺的連續(xù)性,避免了各種不可測因素造成的數(shù)據(jù)丟失,實現(xiàn)數(shù)分鐘立即恢復教學應用的保障效果。
目前,在新建成的虛擬存儲系統(tǒng)支持下運行了如下7個應用系統(tǒng):“課程中心”網(wǎng)絡資源學習平臺、移動學習平臺、精品課程點播平臺、教育信息技術中心網(wǎng)站、機房管理中心、直播系統(tǒng)平臺、教學主樓教學觀摩系統(tǒng)目錄服務器,所有系統(tǒng)應用存儲合計占用20T空間,運行穩(wěn)定良好,具體列表1所示。[5]
系統(tǒng)經(jīng)過一年的反復實驗,證實其安全、易操作,能夠較好地緩解學校目前數(shù)據(jù)存儲和管理的壓力,并可以靈活適應將來的擴展需求。與舊有存儲結構相比,其優(yōu)勢主要體現(xiàn)在以下幾點:
(1)可以集中管理分散的不同品牌的存儲設備,可以提高存儲空間的利用率。
(2)可以通過一個統(tǒng)一的存儲管理界面平臺或界面,來管理現(xiàn)有的存儲設備。
表1 虛擬存儲系統(tǒng)支持的應用平臺
(3)可以隨需擴展不同的異構存儲品牌,同時通過TVM功能遷移將原來存儲上的數(shù)據(jù),通過底層技術遷移到新的存儲上。
(4)可以實現(xiàn)在異構的不同存儲系統(tǒng)之間進行數(shù)據(jù)容災或復制。
(5)可以按不同的存儲性能分層存儲,例如根據(jù)磁盤品種(SSD/FC/SAS/SATA)進行分類。[l4]
(6)可以實現(xiàn)存儲容量的靈活分配,可以超出物理磁盤空間,隨需擴容。
(7)使用OSN PA功能后,可以提高低端存儲系統(tǒng)的性能。
在高校教學支撐平臺中采用存儲虛擬等相關技術,是解決當前教育數(shù)據(jù)海量增長的一條新思路。華南師范大學在大數(shù)據(jù)量、多應用、多品牌的存儲系統(tǒng)環(huán)境下探索出的基于網(wǎng)絡設備端的存儲虛擬化應用方案,實現(xiàn)了對舊有資源的高效整合,解決了數(shù)據(jù)管理工作中的問題,為高校及教育科研單位的存儲設備的有效使用和管理找到了一條新路徑,我們將在后續(xù)的工作中繼續(xù)總結經(jīng)驗,向讀者提供更具有借鑒價值的實踐指導。
[1]任永堅.存儲管理和數(shù)據(jù)保護.[EB/OL].http://www.infocore.cn/xzzx.aspx?ref=3.2010.6[l5]
[2]付云生.王開云.虛擬存儲技術的研究與比較[J].計算機科學,2011(10):202-203,238.
[3]李紅艷.塊級連續(xù)數(shù)據(jù)保護系統(tǒng)元數(shù)據(jù)管理方法[J].計算機應用,2012,32(8):2141-2145,2149.
[4]李珺晟.淺談CDP連續(xù)數(shù)據(jù)保護技術及其應用[J].數(shù)字技術與應用,2011(6):191.
[5]張效嚴.郭翠英.高校信息化多應用虛擬支撐平臺的應用研究[J].中國教育信息化,2012(2):93-96.