張培賓
(鄭州航空工業(yè)管理學(xué)院 圖書館,河南 鄭州 450015)
某校圖書館信息中心虛擬化探討
張培賓
(鄭州航空工業(yè)管理學(xué)院 圖書館,河南 鄭州 450015)
針對目前該校圖書館存在的服務(wù)器故障、數(shù)字資源安全性、服務(wù)保障水平和管理難度等問題,進(jìn)行了詳細(xì)分析,提出了機(jī)房改造解決方案,并總結(jié)了采用新方案后可達(dá)到的預(yù)期目標(biāo)。
圖書館;服務(wù)器虛擬化;存儲虛擬化;Vmware
圖書館作為學(xué)校的文獻(xiàn)信息資源中心、學(xué)習(xí)交流中心和知識傳播的重要基地,擁有豐富的圖書文獻(xiàn)資源和數(shù)字資源。該校圖書館的信息中心部門負(fù)責(zé)校園網(wǎng)的規(guī)劃、建設(shè)、運(yùn)行、管理和維護(hù)工作,利用現(xiàn)代化的教學(xué)手段為學(xué)校的教學(xué)和科研服務(wù)。
目前學(xué)校的新校區(qū)網(wǎng)絡(luò)基礎(chǔ)建設(shè)已經(jīng)基本完成,當(dāng)前主要任務(wù)是如何發(fā)揮機(jī)房服務(wù)器的最大作用,如何方便的管理配置服務(wù)器,如何處理圖書館海量的數(shù)字資源,以及如何安全合理高效的利用服務(wù)器資源。
目前圖書館信息中心存在的問題有:
(1)基礎(chǔ)設(shè)施復(fù)雜,管理工作量大。目前有20余臺服務(wù)器和大量的網(wǎng)絡(luò)設(shè)備。
(2)單點故障多,服務(wù)保障水平較低。系統(tǒng)安全存在隱患,缺乏系統(tǒng)冗余和安全備份,如服務(wù)器宕機(jī),當(dāng)前服務(wù)馬上終止,影響正常的教學(xué)和辦公活動;部分服務(wù)器沒有提供數(shù)據(jù)備份功能,一旦硬件損壞或是受到惡意攻擊將會造成不可挽回的損失。
(3)軟硬件資源分配不合理。如DNS和DHCP服務(wù)負(fù)荷較輕,但仍占用一臺服務(wù)器;由于各院系部Web站點共用一臺服務(wù)器,導(dǎo)致負(fù)荷過大。由于圖書館對資源存儲容量要求很高,而目前只有一臺磁盤陣列,考慮到以后的需求和數(shù)據(jù)的安全備份與共享,應(yīng)依據(jù)實際情況增加存儲設(shè)備。
(4)應(yīng)用環(huán)境復(fù)雜,統(tǒng)一管理困難。目前的應(yīng)用主要有流量控制、防火墻、身份認(rèn)證、郵件服務(wù)、Web站點、SSL VPN等多種服務(wù),這些服務(wù)分散在各個服務(wù)器上面。
(5)機(jī)房空間不足。當(dāng)實驗或測試新業(yè)務(wù)時,缺乏硬件支持,無法搭建實驗環(huán)境用于教學(xué)實驗。
服務(wù)器虛擬化(Server Virtualization)是指多個操作系統(tǒng)在同一時間一起運(yùn)行在同一臺主機(jī)上。通過這種技術(shù),一臺機(jī)器可以支持像Linux、Windows、Unix等操作系統(tǒng)一起運(yùn)行,而不需要重啟機(jī)器以切換操作系統(tǒng)。簡單地講,服務(wù)器虛擬化是將物理機(jī)器、操作系統(tǒng)及其應(yīng)用程序“打包”成為一個文件,稱之為Virtual Machine(VM)。虛擬化將提高服務(wù)器的利用率,減少系統(tǒng)管理的復(fù)雜度,促進(jìn)服務(wù)器的可用性,減少服務(wù)器的需求數(shù)量,節(jié)省投資和維護(hù)成本[1]。
數(shù)據(jù)是數(shù)字圖書館的核心,它和各種應(yīng)用接口一起運(yùn)行在整個信息系統(tǒng)的底層,是圖書館各項業(yè)務(wù)正常運(yùn)行的基石, 為此要為它提供一個保證數(shù)據(jù)安全的環(huán)境。由于目前內(nèi)部存儲存在一些限制,如計算機(jī)機(jī)箱大小、操作系統(tǒng)支持硬盤數(shù)量、擴(kuò)充卡數(shù)量、無法適應(yīng)集群環(huán)境等問題,需要采用存儲虛擬化技術(shù)的來應(yīng)對這一問題。
虛擬存儲技術(shù),是指把多個物理上獨(dú)立存在的存儲體通過軟件或硬件的手段集中管理起來,形成一個邏輯上的虛擬存儲單元供主機(jī)訪問[2]。從用戶角度看,使用存儲空間而不是使用物理存儲硬件,管理存儲空間而不是管理物理存儲部件。
2.2.1 三種主要的存儲虛擬化方法
要存儲海量的數(shù)字資源,需要結(jié)合實際情況,選擇合適的存儲方式。目前存儲虛擬化有三種技術(shù)[3]:
方法1:基于主機(jī)的虛擬存儲
基于主機(jī)的虛擬存儲依賴于代理或管理軟件,它們安裝在一個或多個主機(jī)上,實現(xiàn)存儲虛擬化的控制和管理。由于控制軟件是運(yùn)行在主機(jī)上,這就會占用主機(jī)的處理時間。因此,這種方法的可擴(kuò)充性較差,實際運(yùn)行的性能不是很好。基于主機(jī)的方法也有可能影響到系統(tǒng)的穩(wěn)定性和安全性,因為有可能導(dǎo)致不經(jīng)意間越權(quán)訪問到受保護(hù)的數(shù)據(jù)。這種方法要求在主機(jī)上安裝適當(dāng)?shù)目刂栖浖?,因此一個主機(jī)的故障可能影響整個SAN(Storage Area Network存儲區(qū)域網(wǎng)絡(luò))系統(tǒng)中數(shù)據(jù)的完整性。軟件控制的存儲虛擬化還可能由于不同存儲廠商軟硬件的差異而帶來不必要的互操作性開銷,所以這種方法的靈活性也比較差。
但是,因為不需要任何附加硬件,基于主機(jī)的虛擬化方法最容易實現(xiàn),其設(shè)備成本最低。使用這種方法的供應(yīng)商趨向于成為存儲管理領(lǐng)域的軟件廠商,而且目前已經(jīng)有成熟的軟件產(chǎn)品。這些軟件可以提供便于使用的圖形接口,方便地用于SAN的管理和虛擬化,在主機(jī)和小型SAN結(jié)構(gòu)中有著良好的負(fù)載平衡機(jī)制。從這個意義上看,基于主機(jī)的存儲虛擬化是一種性價比不錯的方法。
方法2:基于存儲設(shè)備的虛擬化
基于存儲設(shè)備的存儲虛擬化方法依賴于提供相關(guān)功能的存儲模塊。如果沒有第三方的虛擬軟件,基于存儲的虛擬化,只能提供一種不完全的存儲虛擬化解決方案。對于包含多廠商存儲設(shè)備的SAN存儲系統(tǒng),這種方法的運(yùn)行效果并不是很好,利用這種方法意味著最終將鎖定某一家單獨(dú)的存儲供應(yīng)商。
方法3:基于網(wǎng)絡(luò)的虛擬存儲
基于網(wǎng)絡(luò)的虛擬化方法是在網(wǎng)絡(luò)設(shè)備之間實現(xiàn)存儲虛擬化功能,是目前發(fā)展的方向?;诰W(wǎng)絡(luò)的虛擬化分為帶內(nèi)(in-band)虛擬和帶外(out-of-band)虛擬。帶內(nèi)虛擬是在應(yīng)用服務(wù)器和存儲的數(shù)據(jù)通路內(nèi)部實現(xiàn)虛擬存儲,控制數(shù)據(jù)(Metadata)和需要存儲的實際數(shù)據(jù)在同一個數(shù)據(jù)通路內(nèi)傳遞。帶內(nèi)虛擬具有較高的安全性,黑客很難侵入存儲系統(tǒng)。但是,在服務(wù)器層面看,帶內(nèi)存儲會占用較多的數(shù)據(jù)網(wǎng)絡(luò)帶寬來傳輸控制數(shù)據(jù),因而容易在服務(wù)器和存儲設(shè)備之間產(chǎn)生性能瓶頸。帶外虛擬是在數(shù)據(jù)通路外的服務(wù)器上實現(xiàn)的虛擬功能,也就是將控制數(shù)據(jù)和存儲數(shù)據(jù)安排在不同的數(shù)據(jù)通路上傳輸。這種方式減少了存儲數(shù)據(jù)網(wǎng)絡(luò)中的流量,有助于提高系統(tǒng)性能,但是一般需要安裝專用軟件,也容易受到攻擊。
2.3.1 服務(wù)器虛擬化軟件VMware Infrastructure 3
VMWARE公司的VMware Infrastructure 3就是一款比較成熟的服務(wù)器虛擬化軟件。VMware虛擬平臺作為獨(dú)立的一層系統(tǒng)軟件直接運(yùn)行在硬件平臺上,作為計算機(jī)硬件系統(tǒng)和虛擬機(jī)操作系統(tǒng)的通信層,它完全獨(dú)立地響應(yīng)所有虛擬機(jī)操作系統(tǒng)對硬件資源的訪問。在虛擬服務(wù)器上,可以安裝不同的虛擬操作系統(tǒng),獨(dú)立運(yùn)行,互不干涉,就像單獨(dú)的物理服務(wù)器一樣。
VMware Infrastructure 3主要用于服務(wù)器端虛擬化,通過在一臺物理服務(wù)器上虛擬出多臺虛擬機(jī)來起到服務(wù)器整合和資源優(yōu)化等目的。VMware Infrastructure 3主要可被為兩部分:其一是VMM(虛擬化管理器)部分,VMware ESX 4,其二是用于整合和管理VMM的VMware vCenter。
· ESX Server
ESX Server直接構(gòu)建于硬件層之上,它將處理器、內(nèi)存、存儲器、網(wǎng)絡(luò)和一些I/O設(shè)備資源抽象到多個虛擬機(jī)中,每個虛擬機(jī)再在這些抽象的資源上運(yùn)行自己不同的操作系統(tǒng)和應(yīng)用程序,這些虛擬機(jī)之間相對獨(dú)立,各自擁有虛擬的CPU、內(nèi)存、存儲器、網(wǎng)卡等資源,互相不知道對方的存在,唯一的影響是硬件資源的分配上的爭用與協(xié)調(diào)問題[4]。
· VMware vCenter
Virtual Center為IT環(huán)境提供了集中化管理、操作自動化、資源優(yōu)化和高可靠性。這些功能使IT環(huán)境具有前所未有的可維護(hù)性和高可用性。VMware vCenter是用于VMware vSphere環(huán)境的管理程序,它作為管理節(jié)點來控制和整合屬于其域的vSphere主機(jī),其既可以安裝物理機(jī)的操作系統(tǒng)上,也可以安裝在虛擬機(jī)的操作系統(tǒng)。
2.3.2 存儲虛擬化軟件VMware vStorage
VMware vStorage 是一套技術(shù)和接口,它采用虛擬化技術(shù)創(chuàng)建有效而靈活的存儲池,不僅可以簡化虛擬機(jī)的存儲操作,還可以直接利用存儲基礎(chǔ)架構(gòu)的各項功能。vStorage 可降低為虛擬化應(yīng)用程序部署存儲資源的復(fù)雜性,并能簡化常見的存儲操作。
目前機(jī)房的服務(wù)器主要用途使用情況如下:提供網(wǎng)絡(luò)服務(wù)如DNS、NAT、DHCP;銳捷SAM收費(fèi)管理服務(wù)器;郵件服務(wù)器及郵件過濾系統(tǒng);提供VOD點播和FTP文件下載的資源服務(wù)器;驅(qū)逐艦殺毒服務(wù)器、流量監(jiān)控服務(wù)器和網(wǎng)絡(luò)拓?fù)錉顟B(tài)服務(wù)器;磁盤陣列;辦公自動化系統(tǒng)等,共25臺服務(wù)器。服務(wù)器基本采用曙光天闊620R和DELL 2950等型號的老式服務(wù)器。
這里采用服務(wù)器虛擬化軟件,利用一臺HP DL380服務(wù)器,可以整合目前7臺老式服務(wù)器。
表2
在服務(wù)器HP DL380上創(chuàng)建虛擬機(jī),在相應(yīng)虛擬機(jī)上安裝相應(yīng)的應(yīng)用軟件。如果應(yīng)用系統(tǒng)平臺相同,可以使用虛擬機(jī)的克隆功能快速部署出一個新的系統(tǒng)平臺。圖1是服務(wù)器虛擬化的運(yùn)行狀態(tài)。
3.2.1 數(shù)據(jù)安全性
在圖中考慮到了數(shù)據(jù)安全性,采用了雙機(jī)熱備,可以根據(jù)具體情況決定是否采用。如果一臺HP DL380服務(wù)器出現(xiàn)故障,VMware VMotion可以使正在運(yùn)行的整個虛擬機(jī)能夠瞬間從一臺服務(wù)器遷移到另一臺服務(wù)器上。
圖1
3.2.2 存儲需要
因為目前圖書館對海量存儲要求很高,特別是各種期刊電子圖書數(shù)據(jù)庫、光盤資源庫、在線視頻講座等需要本地鏡像,所以要采用大規(guī)模的IP SAN網(wǎng)絡(luò)存儲,同時虛擬機(jī)文件也可存放在磁盤陣列中。
3.2.3 安裝虛擬機(jī)
在HP DL380服務(wù)器上安裝7個虛擬機(jī),提供相應(yīng)的應(yīng)用服務(wù)。
通過對圖書館服務(wù)器進(jìn)行虛擬化,具體到本館館情可以實現(xiàn)如下目標(biāo):
(1)最大化服務(wù)器利用率并降低采購數(shù)量。利用虛擬化技術(shù)進(jìn)行統(tǒng)一管理維護(hù),通過集中管理控制臺對多臺服務(wù)器進(jìn)行集中管理,極大降低管理工作量。
(2)由于虛擬構(gòu)架可使虛擬機(jī)具有動態(tài)可遷移性,可以進(jìn)行快速的維護(hù)和升級,不用擔(dān)心某臺服務(wù)器出現(xiàn)問題,會影響到整個應(yīng)用平臺。
(3)降低單點故障,提高服務(wù)保障水平。服務(wù)器合并后降低了所需要管理的物理服務(wù)器數(shù)目,減輕管理負(fù)擔(dān)。
(4)提高了服務(wù)器資源利用率,為實驗創(chuàng)建專用的服務(wù)器環(huán)境;可快速部署新的虛擬服務(wù)器,大量節(jié)約實驗室成本和實驗準(zhǔn)備環(huán)節(jié)。物理服務(wù)器虛擬分割成多個虛擬環(huán)境,為學(xué)生和其他科研人員提供專用的服務(wù)器環(huán)境。利用虛擬機(jī)技術(shù)大量節(jié)約了服務(wù)器環(huán)境部署時間,簡化了實驗環(huán)境的準(zhǔn)備過程,最大程度地滿足科研及教學(xué)實踐對專用服務(wù)器環(huán)境的需求。
(5)只有選用安全且大容量的數(shù)據(jù)存儲與保護(hù)方式,才能為整個數(shù)據(jù)中心提供完整的集中數(shù)據(jù)備份。采用虛擬化存儲后,用戶可方便地劃分、擴(kuò)展、縮小虛擬存儲空間,只需要簡單地更改配置就可在線增加新的物理存儲設(shè)備。用戶將注意力集中在存儲系統(tǒng)的容量和安全模式的需求上,而不必關(guān)心存儲系統(tǒng)的硬件容量、類型或者其他物理磁盤的特性,提高存儲資源的利用率,最大程度滿足用戶對存儲資源的空間需求。
(6)降低能源消耗。采用虛擬化技術(shù),可以減少5臺服務(wù)器,每年僅電費(fèi)就能節(jié)約數(shù)萬元。同時發(fā)機(jī)房發(fā)熱量減少,使空調(diào)負(fù)荷降低。
通過服務(wù)器初步整合,我們將9臺服務(wù)器成功整合到6臺服務(wù)器、1套IP SAN設(shè)備里,明顯地提高了每個物理服務(wù)器及其CPU的資源利用率。同時采用雙機(jī)備援規(guī)則,不但減少了物理服務(wù)器的擴(kuò)充數(shù)量,大大地降低硬件成本,同時保證了圖書館業(yè)務(wù)的運(yùn)行穩(wěn)定。
虛擬化技術(shù)的應(yīng)用使得服務(wù)器的利用率提高了30~50%,服務(wù)器的性能得到充分發(fā)揮,并減少了物理服務(wù)器的數(shù)量,節(jié)省了設(shè)備經(jīng)費(fèi)。利用虛擬機(jī)的快照功能對系統(tǒng)和數(shù)據(jù)進(jìn)行備份,可以快速修復(fù)系統(tǒng)故障,使應(yīng)用服務(wù)的穩(wěn)定性和質(zhì)量得到了保障。
[1] 湯小康.服務(wù)器虛擬化技術(shù)在校園網(wǎng)中的應(yīng)用[J].計算機(jī)時代,2009,2.
[2] 李華子,等.數(shù)字圖書館中的數(shù)字存儲技術(shù)[J].情報科學(xué),2006,5.
[3] 數(shù)據(jù)存儲虛擬化的三種方法完全對比[EB/OL].http://tech.watchstor.com/tech-29514.htm,2010-05-25.
[4] 張巍.企業(yè)虛擬化實戰(zhàn)[M].機(jī)械工業(yè)出版社,2009.
G258
A
1008-7427(2011)04-0152-02
2011-03-01