李愛勤 鮑凌云 馮曉娜
〔摘 要〕文章在介紹云存儲(chǔ)的相關(guān)概念及獨(dú)特優(yōu)勢(shì)的基礎(chǔ)上,將云存儲(chǔ)引入數(shù)字圖書館資源存儲(chǔ)中,構(gòu)建了從體系結(jié)構(gòu)、拓?fù)浣Y(jié)構(gòu)及功能模塊三方面的數(shù)字圖書館資源云存儲(chǔ)方案,指出了云存儲(chǔ)在存儲(chǔ)安全及圖書館知識(shí)產(chǎn)權(quán)方面的缺陷。
〔關(guān)鍵詞〕數(shù)字圖書館;資源存儲(chǔ);云存儲(chǔ)
DOI:10.3969/j.issn.1008-0821.2012.02.012
〔中圖分類號(hào)〕G250.76 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2012)02-0048-03
Cloud Storage Model Research of Digital Library ResourcesLi Aiqin Bao Lingyun Feng Xiaona
(Library,Shandong University of Technology,Zibo 255049,China)
〔Abstract〕On the basis of the introduction of related concepts and unique advantage of cloud storage,the article brought cloud storage into digital library resources storage,moreover,it established a system structure from the topology structure and function modules of the three aspects of the digital library resources and pointed out the defects of cloud storage in the secure storage and the library intellectual property rights.
〔Key words〕digital library;resources storage;cloud storage model
1 云存儲(chǔ)
1.1 云存儲(chǔ)概念與特征
云計(jì)算(Cloud Computing)作為IT產(chǎn)業(yè)繼個(gè)人計(jì)算機(jī)和因特網(wǎng)之后的第三次變革,在社會(huì)各界引起了軒然大波。而云計(jì)算的資源存儲(chǔ)即云存儲(chǔ)(Cloud Storage),它是通過集群應(yīng)用、網(wǎng)格技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲(chǔ)設(shè)備通過應(yīng)用軟件集合起來協(xié)同工作,共同對(duì)外提供數(shù)據(jù)存儲(chǔ)和業(yè)務(wù)訪問功能的一個(gè)系統(tǒng)[1]。
與以往存儲(chǔ)方式不同的是,云存儲(chǔ)中不僅僅是硬件的整合,更多的融合了網(wǎng)絡(luò)設(shè)備、存儲(chǔ)設(shè)備、服務(wù)器、應(yīng)用軟件、公用訪問接口、接入網(wǎng)和客戶端程序。通過結(jié)合應(yīng)用軟件與存儲(chǔ)設(shè)備,云存儲(chǔ)為用戶提供的不只是單純?cè)贫舜鎯?chǔ)設(shè)備的存儲(chǔ)服務(wù),而是整個(gè)云存儲(chǔ)系統(tǒng)帶給用戶的一種數(shù)據(jù)訪問服務(wù)[2]。此外,由于集成統(tǒng)一,云存儲(chǔ)更是具有其他存儲(chǔ)所不具有的的規(guī)模經(jīng)濟(jì)性、資源虛擬性、彈性收縮性、高安全性、高可靠性以及可根據(jù)自身需要即買即用的云存儲(chǔ)服務(wù)。
1.2 常見的云存儲(chǔ)服務(wù)
云存儲(chǔ)提倡的是利用云服務(wù)廠商的系統(tǒng)而不是本地系統(tǒng)來存儲(chǔ)資源,用戶則需要接入互聯(lián)網(wǎng),通過網(wǎng)絡(luò)來訪問存儲(chǔ)在云上的數(shù)據(jù)。目前,國內(nèi)外已經(jīng)有數(shù)百種不同的云存儲(chǔ)服務(wù),如專門面向特定環(huán)境、特定用戶的,專門存儲(chǔ)電子郵件或數(shù)字圖片的,專門負(fù)責(zé)存儲(chǔ)視頻、音頻文件的等等。目前較常見的一些云存儲(chǔ)服務(wù)有:
(1)電子郵件提供商,如Google的Hotmail和Yahoo!Mail,他們可以允許用戶在廠商服務(wù)器上存儲(chǔ)電子郵件消息。用戶只要接入互聯(lián)網(wǎng)就可以隨時(shí)隨地訪問自己的電子郵件。
(2)YouTube為用戶提供了在線的存儲(chǔ)服務(wù)器,方便用戶上傳視頻文件;而Flickr和Picasa,則是讓用戶通過創(chuàng)建自己的在線圖庫,任意上傳數(shù)字圖片。
(3)社交類網(wǎng)站,如Facebook和人人網(wǎng)、博客等則建立大型的服務(wù)器中心,方便其用戶將文字、圖片、視頻、音頻等各種數(shù)據(jù)存儲(chǔ)在云存儲(chǔ)廠商的服務(wù)器上。
(4)Amazon的ES3是一種可擴(kuò)展、高速、低成本的基于Web的存儲(chǔ)服務(wù),可以為個(gè)人和企業(yè)用戶提供各種數(shù)據(jù)及應(yīng)用程序的在線備份和存檔。
(5)IBM的Smart Business Storage和MicroSoft的Windows Azure則是一種基于私有云技術(shù),為企業(yè)用戶提供應(yīng)用程序存儲(chǔ)支持的云存儲(chǔ)服務(wù)。
(6)金山的快盤,華為的DBANK數(shù)據(jù)銀行,也都做到了以用戶為中心,以企業(yè)服務(wù)器集群為基礎(chǔ),為用戶提供方便快捷的在線云存儲(chǔ)服務(wù)。
2 數(shù)字圖書館資源云存儲(chǔ)研究
2.1 數(shù)字圖書館資源云存儲(chǔ)體系結(jié)構(gòu)
云存儲(chǔ)的理念就是盡可能的整合資源,實(shí)現(xiàn)資源的共享利用。在利用各大高校圖書館原有資源的基礎(chǔ)上,整合搭建可以共享的云數(shù)字圖書館,能夠有效減少圖書館的硬件費(fèi)用支出,最大程度上實(shí)現(xiàn)圖書館資源的有效利用。結(jié)合云存儲(chǔ)的結(jié)構(gòu)模型,本文構(gòu)建了針對(duì)數(shù)字圖書館應(yīng)用的數(shù)字資源云存儲(chǔ)體系結(jié)構(gòu),如圖1所示。
訪問層數(shù)字圖書館用戶各類存儲(chǔ)應(yīng)用統(tǒng)計(jì)訪問入口、用戶認(rèn)證授權(quán)管理應(yīng)用層數(shù)字圖書館資源存儲(chǔ)平臺(tái)、數(shù)字圖書館各種Web服務(wù)基礎(chǔ)管理層集群系統(tǒng)、分布式文件系統(tǒng)、網(wǎng)絡(luò)計(jì)算CDN、P2P、重復(fù)數(shù)據(jù)刪除、數(shù)據(jù)壓縮數(shù)據(jù)加密、數(shù)據(jù)備份、數(shù)據(jù)容災(zāi)存儲(chǔ)層文件系統(tǒng)、數(shù)據(jù)庫、元數(shù)據(jù)集存儲(chǔ)設(shè)備、存儲(chǔ)虛擬化、存儲(chǔ)管理設(shè)備圖1 數(shù)字圖書館云存儲(chǔ)體系結(jié)構(gòu)
2012年2月第32卷第2期數(shù)字圖書館資源云存儲(chǔ)模型研究Feb.,2012Vol.32 No.2系統(tǒng)模型體系結(jié)構(gòu)共分4層,從底層依次是存儲(chǔ)層、基礎(chǔ)管理層、服務(wù)應(yīng)用層和訪問層[3]。
最底層是存儲(chǔ)層,也是數(shù)字圖書館云存儲(chǔ)體系的硬件層。該層為整個(gè)云存儲(chǔ)系統(tǒng)提供基本的網(wǎng)絡(luò)環(huán)境、物理存儲(chǔ)資源和邏輯存儲(chǔ)資源,包括存儲(chǔ)設(shè)備(磁盤陣列、光盤庫和磁帶庫、FC光纖通道存儲(chǔ)設(shè)備、NAS和iSCSI等IP存儲(chǔ)設(shè)備、SCSI或SAN、DAS等存儲(chǔ)設(shè)備)、存儲(chǔ)管理設(shè)備、數(shù)據(jù)邏輯存儲(chǔ)系統(tǒng)(文件系統(tǒng)、數(shù)據(jù)庫和元數(shù)據(jù)集)等。其中云存儲(chǔ)系統(tǒng)中的存儲(chǔ)設(shè)備大部分是現(xiàn)有的存儲(chǔ)設(shè)備通過網(wǎng)絡(luò)連接整合形成。而統(tǒng)一的存儲(chǔ)設(shè)備管理系統(tǒng),可以實(shí)現(xiàn)所整合存儲(chǔ)設(shè)備的邏輯虛擬化管理、多鏈路冗余管理,以及各種硬件設(shè)備的狀態(tài)實(shí)時(shí)監(jiān)控和故障維護(hù)。
第二層是基礎(chǔ)管理層,是數(shù)字圖書館云存儲(chǔ)體系的核心層。該層通過集群、分布式文件系統(tǒng)、網(wǎng)格計(jì)算等技術(shù),實(shí)現(xiàn)云存儲(chǔ)中的多個(gè)存儲(chǔ)設(shè)備間的協(xié)同工作,包括存儲(chǔ)監(jiān)控、調(diào)度、副本管理等,可以根據(jù)數(shù)字圖書館的需求在某個(gè)時(shí)刻對(duì)外提供同一種服務(wù),并提供更大更強(qiáng)更好的數(shù)據(jù)訪問性能,保證眾多用戶可以同時(shí)訪問使用數(shù)字圖書館資源。此外,該層還采用CDN內(nèi)容分發(fā)、數(shù)據(jù)加密技術(shù)保證云存儲(chǔ)中的數(shù)據(jù)不會(huì)被未授權(quán)的用戶所訪問,還利用數(shù)據(jù)備份和數(shù)據(jù)容災(zāi)技術(shù)保證數(shù)字圖書館云存儲(chǔ)系統(tǒng)中數(shù)據(jù)的自身安全和穩(wěn)定。
第三層是服務(wù)應(yīng)用層,為用戶提供了數(shù)字圖書館資源云存儲(chǔ)平臺(tái)和數(shù)字圖書館各類Web服務(wù),包括信息采集、加工、管理所需的存儲(chǔ);信息的發(fā)布與服務(wù)所需的存儲(chǔ)以及容災(zāi)備份等所需的存儲(chǔ)。同時(shí),數(shù)字圖書館中的業(yè)務(wù)管理、書目管理OPAC等,通過應(yīng)用層共享云端平臺(tái),圖書館管理人員都可以更方便地訪問與管理。
最上層是訪問層。任何一個(gè)獲得授權(quán)的用戶,只要擁有能夠接入互聯(lián)網(wǎng)的終端設(shè)備,諸如PC、手機(jī)、移動(dòng)多媒體等,就可以在任何時(shí)候任何地點(diǎn)通過應(yīng)用層的數(shù)字圖書館資源存儲(chǔ)平臺(tái)使用數(shù)字圖書館資源的云存儲(chǔ)服務(wù),滿足自己的信息需求。
2.2 數(shù)字圖書館資源云存儲(chǔ)模型
2.2.1 數(shù)字圖書館資源云存儲(chǔ)模型拓?fù)浣Y(jié)構(gòu)
圖書館的職責(zé)就是為社會(huì)公眾提供他們所需要的知識(shí)服務(wù),數(shù)字圖書館的出現(xiàn)更是將圖書館的服務(wù)進(jìn)一步提升。在構(gòu)建數(shù)字圖書館資源云存儲(chǔ)模型時(shí),可以借鑒IT界著名的服務(wù)管理最佳實(shí)踐——ITIL(IT Infrastructure Library),ITIL最新版本三主要包含5個(gè)部分的流程:服務(wù)策略、服務(wù)設(shè)計(jì)、服務(wù)轉(zhuǎn)移、服務(wù)運(yùn)營和持續(xù)服務(wù)改善[4]。根據(jù)實(shí)際需求,在構(gòu)建的云存儲(chǔ)模型系統(tǒng)中并沒有集成所有的ITIL流程,具體的系統(tǒng)拓?fù)浣Y(jié)構(gòu)如圖2所示。
2.2.2 數(shù)字圖書館云存儲(chǔ)模型功能模塊
云存儲(chǔ)的核心就是應(yīng)用軟件與存儲(chǔ)設(shè)備相結(jié)合,通過應(yīng)用軟件來實(shí)現(xiàn)存儲(chǔ)設(shè)備向存儲(chǔ)服務(wù)的轉(zhuǎn)變。在構(gòu)建的數(shù)字圖書館云存儲(chǔ)系統(tǒng)中,圖書館所使用的云存儲(chǔ)不僅僅是單純的存儲(chǔ)設(shè)備的集合體,而是由眾多存儲(chǔ)設(shè)備集合帶來的數(shù)據(jù)訪問服務(wù)。從功能上劃分,可以將整個(gè)數(shù)字圖書館云存儲(chǔ)模型系統(tǒng)分成七大模塊:物理存儲(chǔ)設(shè)備和管理模塊,虛擬化存儲(chǔ)管理模塊,存儲(chǔ)網(wǎng)絡(luò)連接設(shè)備管理模塊,資源管理模塊,存儲(chǔ)管理模塊,備份管理模塊和㊣/O管理模塊[5]。
(1)物理存儲(chǔ)設(shè)備和管理模塊。利用該模塊可以對(duì)云存儲(chǔ)系統(tǒng)中所有的物理設(shè)備監(jiān)控,實(shí)時(shí)收集、管理各個(gè)設(shè)備的運(yùn)行信息,保證云存儲(chǔ)系統(tǒng)中各設(shè)備能聯(lián)合起來協(xié)同工作,為數(shù)字圖書館工作的正常運(yùn)行作保障。
(2)虛擬化存儲(chǔ)管理模塊。此模塊作為數(shù)字圖書館資源云存儲(chǔ)系統(tǒng)中的關(guān)鍵模塊,它在物理設(shè)備整合的基礎(chǔ)之上,對(duì)形成的巨大的邏輯資源池進(jìn)行管理。
(3)存儲(chǔ)網(wǎng)絡(luò)連接設(shè)備管理模塊。利用該模塊,當(dāng)整個(gè)云存儲(chǔ)系統(tǒng)中某個(gè)設(shè)備不能正常工作或遇到某個(gè)設(shè)備被集中訪問時(shí),則可以及時(shí)地將任務(wù)轉(zhuǎn)移到其他設(shè)備,來保證云存儲(chǔ)服務(wù)的可靠。
(4)資源管理模塊。該模塊可以通過對(duì)所存儲(chǔ)的信息資源進(jìn)行合理調(diào)配和規(guī)劃,根據(jù)用戶的訪問需求,自動(dòng)地查找云存儲(chǔ)系統(tǒng)中的可用資源來及時(shí)響應(yīng)應(yīng)用程序需求。圖2 數(shù)字圖書館云存儲(chǔ)模型系統(tǒng)拓?fù)浣Y(jié)構(gòu)
(5)存儲(chǔ)管理模塊。用戶向存儲(chǔ)管理模塊提供的應(yīng)用程序接口(API)提出數(shù)據(jù)訪問請(qǐng)求后,此模塊利用元數(shù)據(jù)目錄中的信息進(jìn)行協(xié)議轉(zhuǎn)接,并將轉(zhuǎn)接后的數(shù)據(jù)訪問請(qǐng)求發(fā)向不同的存儲(chǔ)設(shè)備,利用虛擬化存儲(chǔ)實(shí)現(xiàn)對(duì)異構(gòu)存儲(chǔ)資源的統(tǒng)一訪問。
(6)備份管理模塊。云存儲(chǔ)系統(tǒng)中數(shù)據(jù)是被集中存儲(chǔ)在云數(shù)據(jù)中心,云數(shù)據(jù)中心的構(gòu)建又是集合了數(shù)量龐大的服務(wù)器、存儲(chǔ)設(shè)備等,設(shè)備的出故障率自然明顯提高。為了在某個(gè)或某些設(shè)備出現(xiàn)故障,而不影響圖書館數(shù)據(jù)的安全、可靠及服務(wù)的正常提供,云存儲(chǔ)提供中的備份管理模塊發(fā)揮了很大作用。
(7)㊣/O管理模塊。在云存儲(chǔ)中,動(dòng)態(tài)存儲(chǔ)給數(shù)字圖書館帶來了解決途徑,通過㊣/O管理模塊,可以很好的分配圖書館存儲(chǔ)系統(tǒng)中的服務(wù)器資源,為用戶提供實(shí)時(shí)不間斷的服務(wù)。
3 結(jié)束語
隨著計(jì)算機(jī)性能的不斷提高和網(wǎng)絡(luò)通信技術(shù)的迅猛發(fā)展,應(yīng)用需求日益朝著高性能、大規(guī)模、多樣性、多功能的方向發(fā)展,要求將地理上分布的、異構(gòu)的各種高性能計(jì)算資源、存儲(chǔ)資源、數(shù)據(jù)資源和其他特殊資源通過高速網(wǎng)絡(luò)連接起來,實(shí)現(xiàn)高性能聯(lián)合計(jì)算,共同完成重大應(yīng)用問題。云計(jì)算和云存儲(chǔ)的提出,使得高性能運(yùn)算、大范圍共享和低成本運(yùn)營成為可能。
可以說,云計(jì)算與云存儲(chǔ)的出現(xiàn),不僅是IT界的又一個(gè)里程碑,也給圖書館界帶來新的發(fā)展活力,尤其是將會(huì)帶動(dòng)互聯(lián)網(wǎng)下數(shù)字圖書館的新發(fā)展。利用云存儲(chǔ)來構(gòu)建數(shù)字圖書館的資源存儲(chǔ)系統(tǒng),可以實(shí)現(xiàn)近乎無限的系統(tǒng)容量擴(kuò)展,便于集中式統(tǒng)一管理,能有效減少圖書館的成本支出,滿足眾多用戶并發(fā)訪問的實(shí)時(shí)響應(yīng)等。它能夠在資源分布較廣的范圍內(nèi)實(shí)現(xiàn)大范圍聯(lián)合為更多用戶提供服務(wù),真正消除數(shù)字圖書館的信息孤島,實(shí)現(xiàn)數(shù)字圖書館資源的共享,發(fā)揮數(shù)字圖書館知識(shí)寶藏的潛能。但是由于云存儲(chǔ)是通過硬件設(shè)備的共用以及虛擬存儲(chǔ)等技術(shù)來完成存儲(chǔ),數(shù)據(jù)的安全性以及圖書館中資源的版權(quán)等問題還需要進(jìn)一步探討。
參考文獻(xiàn)
[1]Anthony T etc.Cloud Computing:A Practical Approach[M].The McGraw-Hill Companies,Inc,2010:106-111.
[2]Mesnier M,Ganger G R,Riedel E.Object-based Storage:Pushing More Functionality into Storage[J].Potentials,IEEE,2005,24(2).
[3]劉文云,鮑凌云.“云”下的數(shù)字圖書館資源存儲(chǔ)研究[J].情報(bào)資料工作,2011,(2):51-54.
[4]余智敏.深圳圖書館的存儲(chǔ)技術(shù)的研究[D].武漢:武漢理工大學(xué),2006.
[5]鮑凌云.基于云計(jì)算的數(shù)字圖書館資源存儲(chǔ)研究[D].淄博:山東理工大學(xué),2011.