劉波濤
[摘 要]隨著日益增長的數(shù)據(jù)信息需求,對數(shù)字圖書館的存儲技術(shù)和存儲設(shè)備提出了更高的要求,傳統(tǒng)的存儲設(shè)備和存儲技術(shù)已經(jīng)無法滿足數(shù)字圖書館的存儲要求。本文從設(shè)備成本,系統(tǒng)可靠性,兼容性,安全性等方面對常用的幾種存儲技術(shù)進行分析和比較,探討符合現(xiàn)階段數(shù)字圖書館存儲要求的存儲方式,并為未來存儲技術(shù)的發(fā)展和運用進行戰(zhàn)略性思考。
[關(guān)鍵詞]網(wǎng)絡(luò)存儲 NAS SAN IP SAN ISCSI 存儲技術(shù)
[中圖分類號]TP393[文獻標識碼]A[文章編號]1007-9416(2009)12-0075-03
The IP Network Storage Technology of Digital Library System
Liu Botao
(College of Computer Science, Hunan University of Arts and Science Hunan Changde Post:415000)
[Abstract]With the growing demand for data and information on the Digital Library of the storage technology and storage devices a higher demand,the traditional storage devices and storage technology has been unable to meet the storage requirements of digital libraries. Based on current digital library funding,technology,the existing storage methods were compared.Discussion on Digital Library meets the present requirements of the storage memory,and for the future storage technology in the development and use of strategic thinking.
[Key words]Network Storage;NAS;SAN ;IP-SAN;ISCSI
1 引言
知識經(jīng)濟時代的到來,促使人們對于信息和知識的需求進一步擴大,圖書館作為一個傳統(tǒng)意義上的知識獲取媒介,其單一的實體化模式已經(jīng)嚴重的制約了其發(fā)展,在這種大背景之下,依托于傳統(tǒng)實體圖書館的網(wǎng)上數(shù)字圖書館建立和發(fā)展了起來。與傳統(tǒng)的圖書館相比,數(shù)字圖書館具有信息存儲量大,檢索方便,可遠程迅速傳遞,并且還具有信息共享優(yōu)勢,在很大程度上提高了信息的使用率[1]。近年來,數(shù)字圖書館憑借這些優(yōu)勢,迅速被互聯(lián)網(wǎng)用戶所青睞,其發(fā)展速度驚人。我國數(shù)字圖書館的建設(shè)從1997年的“中國試驗型數(shù)字式圖書館項目”實施開始,經(jīng)過不到十年的發(fā)展,取得了一定的發(fā)展,目前已經(jīng)進入初步實用階段,以中國數(shù)字圖書館,中國期刊網(wǎng),超星數(shù)字圖書館為代表的數(shù)字圖書館也已初具規(guī)模。但是隨著數(shù)據(jù)業(yè)務(wù)的迅速增長,數(shù)字圖書館迫切需要一種大容量且可實現(xiàn)共享的高速存儲設(shè)備。
2 幾種常用的存儲技術(shù)研究
2.1 NAS
NAS(Network Attached Storage,網(wǎng)絡(luò)附加存儲)是一種專業(yè)的網(wǎng)絡(luò)文件存儲及文件備份設(shè)備。它按照TCP/IP協(xié)議進行通信,面向消息傳遞,以文件的I/O方式進行數(shù)據(jù)傳輸。
NAS系統(tǒng)包括處理器、文件服務(wù)管理模塊和多個用于數(shù)據(jù)存儲的硬盤驅(qū)動器(如圖1所示),其完全獨立于操作系統(tǒng),可實現(xiàn)不同類型文件的共享[2],Web界面易于操作和管理,在增加和減少服務(wù)器時均不會中斷網(wǎng)絡(luò)服務(wù)。此外,NAS在RAID的基礎(chǔ)上增加了存儲操作系統(tǒng),其數(shù)據(jù)可以在異構(gòu)平臺上共享。NAS使文件訪問操作更為快捷,并且易于向基礎(chǔ)設(shè)施增加文件存儲容量。NAS適用于通過網(wǎng)絡(luò)將文件數(shù)據(jù)傳送到多臺客戶機上的應(yīng)用,尤其在數(shù)據(jù)長距離傳送的環(huán)境中優(yōu)勢明顯;NAS應(yīng)用于高效的文件共享任務(wù)中,例如Unix中的NFS和Windows NT中的CIFS。 NAS設(shè)備可以進行優(yōu)化,以文件級保護向多臺客戶機發(fā)送文件信息,提供可靠的文件級數(shù)據(jù)整合(見圖1)。
NAS設(shè)備的安裝、調(diào)試、使用和管理非常簡單,采用NAS可以節(jié)省一定的設(shè)備管理與維護費用。NAS設(shè)備提供RJ-45 接口和單獨的IP地址,可以將其直接掛接在主干網(wǎng)的交換機或其它局域網(wǎng)的Hub 上,通過簡單的設(shè)置(如設(shè)置機器的IP地址等)就可以在網(wǎng)絡(luò)即插即用地使用NAS 設(shè)備,而且進行網(wǎng)絡(luò)數(shù)據(jù)在線擴容時也無需停頓,從而保證數(shù)據(jù)流暢存儲。
2.2 FC SAN
FC(光纖通道技術(shù))是ANSI為網(wǎng)絡(luò)和通道I/O接口建立的一個標準集成,支持HIP PI、IPI、SCSI、IP、ATM等多種高級協(xié)議,它的最大特性是將網(wǎng)絡(luò)和設(shè)備的通訊協(xié)議與傳輸物理介質(zhì)隔離開[3]。這樣多種協(xié)議可在同一個物理連接上同時傳送,高性能存儲體和寬帶網(wǎng)絡(luò)使用單I/O 接口,使得系統(tǒng)的成本和復雜程度大大降低,并且其可以支持點到點(Links)、仲裁環(huán)(FC-AL)、交換式網(wǎng)絡(luò)等多種拓撲結(jié)構(gòu)。
FC使用全雙工串行通信原理傳輸數(shù)據(jù),在1GB標準下,傳輸速率高達1062.5Mbps ,即為100MB/S,雙環(huán)可達200MB/S,2Gb下,上述數(shù)字將翻倍。FC標準下可以通過同軸線、光纖介質(zhì)進行設(shè)備間的信號傳輸,使用同軸線傳輸距離為30米,使用單模光纖傳輸距離可達10公里以上,這使得在SAN模式下實現(xiàn)物理上分離的、不在機房的存儲變得非常容易(見圖2)。
2.3 IP SAN
IP SAN就是指iSCSI SAN。iSCSI(Internet Small Computer System Interface, 互聯(lián)網(wǎng)小型計算機系統(tǒng)接口)是由互聯(lián)網(wǎng)工程任務(wù)組(Internet Engineering Task Force)開發(fā)的基于互聯(lián)網(wǎng)協(xié)議(IP)的存儲網(wǎng)絡(luò)協(xié)議。
IP SAN服務(wù)器通常使用專用SCSI連接以及塊級接口實現(xiàn)與本地連接的存儲系統(tǒng)的通信。iSCSI將SCSI塊存儲命令封裝到以太網(wǎng)數(shù)據(jù)包中,以便通過IP網(wǎng)絡(luò)進行傳輸[4]。(如圖3所示)這樣,服務(wù)器就能夠使用標準的SCSI存儲命令通過標準的 IP基礎(chǔ)設(shè)施與共享的存儲設(shè)備進行通信。iSCSI 就是透過IP 網(wǎng)絡(luò),將SCSI 塊數(shù)據(jù)轉(zhuǎn)換成網(wǎng)絡(luò)封包的一種傳輸標準,它和NAS一樣透過IP網(wǎng)絡(luò)來傳輸數(shù)據(jù),但在數(shù)據(jù)存取方式上,則采用與NAS不同、卻與FC-SAN相同的塊協(xié)議(Block Protocal)見圖3。
3 數(shù)字圖書館系統(tǒng)存儲方式的可行性分析
3.1 三種存儲方式對比分析
NAS、FC SAN和IP SAN在性能、存儲介質(zhì)等技術(shù)參數(shù)上存在一定的區(qū)別,而且其構(gòu)建成本和管理模式也存在很大差異,數(shù)字圖書館系統(tǒng)要選用哪一種存儲方式,必須經(jīng)過對這些技術(shù)參數(shù)的深入研究,并結(jié)合自身的資金和設(shè)備條件,在現(xiàn)有資金技術(shù)條件下,采用最經(jīng)濟性的方案。NAS、FC SAN和IP SAN的差異如表1所示。
從上圖可以看出,FC SAN在其性能上具有明顯的優(yōu)勢,便于集中管理而且完全不受電磁感染的影響,但數(shù)據(jù)傳輸受到距離的影響很大,在通常情況下不會大于50km,這決定了它不能有效地整合更多的主機與存儲的需求。從資金投入上考慮,基于FC SAN的存儲設(shè)備價格居高不下,使用FC SAN,必須購買HBA、光纖交換機、光纖磁盤陣列、管理軟件等,其購置成本相對較高。NAS系統(tǒng)與FC SAN相比存在明顯的成本優(yōu)勢,但是由于NAS基于TCP/IP通信機制,在擴展性上存在局限性,性能不高,而且管理分散,無法滿足用戶對高效性和可靠性的要求。IP SAN 雖然在性能上略遜與FC SAN,但是其成本低廉,而且沒有距離的限制。
3.2 數(shù)字圖書館存儲方式的選擇
我國的數(shù)字圖書館發(fā)展時間不長,而且在資金上相對緊張,購入高成本的存儲設(shè)備對于圖書館的整體生存和發(fā)展來說是不經(jīng)濟的。在選擇存儲方式時,應(yīng)該從實用性和經(jīng)濟性兩個方面進行綜合考慮,在三種方法中選取性價比最高的存儲技術(shù)和存儲方式。通過以上對NAS,SAN,IP SAN這三種方式相關(guān)技術(shù)參數(shù)的對比分析,不難看出,IP SAN在性能和成本上具有顯著的優(yōu)勢。
IP SAN與上述兩種方法相比,其優(yōu)勢主要體現(xiàn)在以下四個方面。首先,IP SAN構(gòu)建成本低廉。適配卡、交換機和纜線的購置成本都比FC要低很多,而且還可以使用免費下載的iSCSI Initiator 驅(qū)動程序模擬iSCSI卡。其次,IP SAN技術(shù)的使用沒有距離的限制,它通過IP網(wǎng)絡(luò)來傳輸數(shù)據(jù),傳輸距離無限制,這對于異地數(shù)據(jù)的傳輸及備份相對方便。第三,傳輸速度較快,雖然與FC SAN的速度相比,IP SAN 稍微遜色,但其高達1GB的速度相比與NAS已經(jīng)相當出色,完全可以滿足數(shù)字圖書館的數(shù)據(jù)傳輸需要,并且在未來隨著10GB以太網(wǎng)的普及,IP SAN的速度可以隨著提升為10GB,這比新一代的FC SAN的4GB還要快得多[5]。最后,由于IP SAN采用的iSCSI技術(shù),對于系統(tǒng)管理人員不像FC SAN系統(tǒng)要求那么高,這就為數(shù)字圖書館省去了聘請專業(yè)技術(shù)人員的成本??傊?IP SAN存儲技術(shù)是在數(shù)字圖書館現(xiàn)有的資金水平和人員水平下,最具經(jīng)濟性的方案,是數(shù)字圖書館最佳的存儲方式。
4 對未來數(shù)字圖書館網(wǎng)絡(luò)存儲技術(shù)的展望
數(shù)字圖書館是一個電子化信息的倉儲,能夠存儲大量各種形式的信息,用戶可以通過網(wǎng)絡(luò)方便地訪問它,以獲得這些信息,并且其信息存儲和用戶訪問不受地域限制。數(shù)字圖書館是將包括多媒體在內(nèi)的各種信息的數(shù)據(jù)化、存儲管理、查詢和發(fā)布集成在一起,使這些信息得以在網(wǎng)絡(luò)上傳播,從而最大限度地利用這些信息。數(shù)字圖書館利用多媒體數(shù)據(jù)庫技術(shù)、超媒體技術(shù),針對數(shù)字化書館中各種媒體的特性,在圖象檢索、視頻點播和文獻資料提出等方面提出了一套有效可行的管理檢索方案。在當今電子商業(yè)、環(huán)球市場、虛擬機構(gòu)日趨普及的年代BitLibrary作為一套完善的媒體資產(chǎn)管理系統(tǒng),無疑創(chuàng)造了一個安全穩(wěn)妥的環(huán)境,方便共享和銷售數(shù)字資料。數(shù)字圖書館是傳統(tǒng)圖書館在信息時代的發(fā)展,它不但包含了傳統(tǒng)圖書館的功能,向社會公眾提供相應(yīng)的服務(wù),還融合了其他信息資源(如博物館、檔案館等)的一些功能,提供綜合的公共信息訪問服務(wù)??梢赃@樣說,數(shù)字圖書館將成為未來社會的公共信息中心和樞紐。信息化、網(wǎng)絡(luò)化、數(shù)字化,這一連串的名詞符號其根本點在于信息數(shù)字化;同樣電子圖書館、虛擬圖書館、數(shù)字圖書館,不管我們用什么樣的名詞,數(shù)字化也是圖書館的發(fā)展方向。
網(wǎng)絡(luò)化存儲是未來數(shù)據(jù)存儲的發(fā)展趨勢,網(wǎng)絡(luò)存儲提高了數(shù)據(jù)的共享性、可用性、可擴展性和管理性,符合數(shù)字圖書館對信息存儲的高可靠性、高兼容性和高安全性些缺陷的要求。目前NAS的性能較低,FC-SAN 的實現(xiàn)費用較高,互操作性差,IP-SAN作為性價比最高的信息存儲方式是數(shù)字圖書館系統(tǒng)的最佳選擇,IP SAN存儲網(wǎng)絡(luò)技術(shù)具有低成本、被廣泛采用、良好的標準化情況、高擴展性、以及良好的安全性和QoS保證等諸多優(yōu)點,并且隨著高速度以太網(wǎng)的普及,IP SAN存儲方式的速度還將得到顯著的提升,為數(shù)字圖書館系統(tǒng)的進一步發(fā)展提供強大的存儲技術(shù)支持。
[參考文獻]
[1] 郭建峰.數(shù)字圖書館信息存儲系統(tǒng)架構(gòu)的探討[J].現(xiàn)代情報,2005(06):71-73.
[2] 周林,石夫乾.數(shù)字圖書館系統(tǒng)中的IP網(wǎng)絡(luò)存儲技術(shù)研究[J].中國信息導報,2005(12):44-45.
[3] 何中林.基于IP的網(wǎng)絡(luò)存儲技術(shù)研究[J].中國科技信息,2005(23):95-96.
[4] 彭建榮.網(wǎng)絡(luò)存儲技術(shù)及其發(fā)展趨勢[J].計算機與現(xiàn)代化,2006(07):66-68.
[5] 周敬治,張蓮芬,林桂娜.數(shù)字資源存儲系統(tǒng)的構(gòu)建模式研究[J].情報科學,2007(01):113-116,138.