〔摘 要〕分析高校圖書館各類數(shù)字資源建設(shè)現(xiàn)狀,并對(duì)數(shù)字資源在其信息生命周期如何降低管理成本獲得最大信息價(jià)值進(jìn)行探討。
〔關(guān)鍵詞〕數(shù)字資源;信息生命周期管理;分級(jí)存儲(chǔ);數(shù)據(jù)遷移
〔中圖分類號(hào)〕G201 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2009)07-0067-03
Research on University Library Digital Resource
Based on Information Lifecycle ManagementLiu Chunjin
(Library,Zhejiang Chinese Medical University,Hangzhou 310053,China)
〔Abstract〕In this paper,the different types of digital resources in university library and how to get the maximum benefit with the minimum costs from digital resources by applying the information lifecycle was discussed.
〔Key words〕digital resource;information life cycle management;hierarchical storage;data migration
人類社會(huì)進(jìn)入21世紀(jì)以來(lái),信息、物質(zhì)和能源構(gòu)成了現(xiàn)代人類生存和社會(huì)發(fā)展的三大基本資源。信息社會(huì)中,信息的積累呈幾何級(jí)數(shù)增長(zhǎng),各數(shù)據(jù)中心的信息存儲(chǔ)量幾乎每18~24個(gè)月就會(huì)翻番。在信息爆炸的時(shí)代,信息過量幾乎成為人人都需要面對(duì)的問題。如何管理海量信息,使之發(fā)揮最大價(jià)值,已經(jīng)成為大多數(shù)高校圖書館亟待解決的問題。
1 信息生命周期管理的提出
美國(guó)著名信息資源管理專家霍頓曾提出,信息是有生命的,信息資源是一種具有生命周期的資源。他認(rèn)為,信息生命周期(Information Lifecycle)是指信息運(yùn)動(dòng)的自然規(guī)律,一般由信息需求的確定以及信息資源的生產(chǎn)、采集、傳播、處理、存儲(chǔ)和利用等階段所組成。信息就如同人類以及其他生物一樣,是具有生命特征的,會(huì)隨著生命周期的不同階段而起落。
為了讓信息更好地在其生命周期中有序地流動(dòng),并在流動(dòng)過程中實(shí)現(xiàn)其最大價(jià)值,就要對(duì)信息進(jìn)行必要的管理,于是產(chǎn)生了信息生命周期管理(Information Lifecycle Management,ILM)這一概念。信息生命周期管理不是一個(gè)新的存儲(chǔ)解決方案,也不是某個(gè)硬件或軟件產(chǎn)品,而是評(píng)估和管理信息的存儲(chǔ)方式,是一種信息管理模型,貫穿信息整個(gè)生命過程并對(duì)其進(jìn)行管理,從創(chuàng)建、使用到歸檔和處理[1]。信息生命周期管理就是要在信息生命周期的不同階段,根據(jù)信息價(jià)值的不同而采取不同程度的管理,達(dá)到以最低的成本在信息生命周期的每一個(gè)階段都能獲得信息最大效益的目的。
ILM是一種針對(duì)信息主動(dòng)管理的策略,通過實(shí)施真正意義上的ILM,可讓信息在正確的時(shí)間處于正確的位置,從而幫助客戶在信息生命的各個(gè)階段以最低的整體擁有成本獲得最大的價(jià)值。ILM作為新興的信息管理策略,其最早并不是用于圖書館領(lǐng)域,而是用于金融、通信和醫(yī)院等行業(yè)中。近年來(lái),作為社會(huì)知識(shí)、信息、文化的記憶裝置和擴(kuò)散裝置的高校圖書館,各類資源特別是數(shù)字館藏資源增長(zhǎng)非常迅猛,大部分高校圖書館面臨將內(nèi)部龐大信息的利用價(jià)值充分發(fā)揮的難題。本文試圖將ILM策略引入高校圖書館數(shù)字資源建設(shè)中,希望借此降低數(shù)字資源管理成本,提高數(shù)字資源利用率,并對(duì)此進(jìn)行一定探討。
2 高校圖書館數(shù)字資源建設(shè)現(xiàn)狀
現(xiàn)代高校圖書館數(shù)字資源不僅包含本館擁有物理實(shí)體的數(shù)字資源,還包括可通過互聯(lián)網(wǎng)獲取利用的館外信息資源所構(gòu)成的虛擬數(shù)字資源[2]。實(shí)體數(shù)字資源主要由保存在本地服務(wù)器或單機(jī)上的數(shù)字資源組成。虛擬數(shù)字資源則主要由提供異地存取服務(wù)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)資源導(dǎo)航系統(tǒng)組成。虛擬數(shù)字資源極大地延伸了數(shù)字資源的范圍,成為高校圖書館資源中重要的組成部分。
紙質(zhì)文獻(xiàn)載體形式單一,分類方式較簡(jiǎn)單。而數(shù)字資源特別是高校圖書館數(shù)字資源,無(wú)論是構(gòu)成方式還是表現(xiàn)形式,都比較復(fù)雜,因此對(duì)數(shù)字資源進(jìn)行分類是一個(gè)相當(dāng)棘手的問題。為了簡(jiǎn)化研究,筆者暫且將高校圖書館數(shù)字資源,按照資源來(lái)源不同,劃分為6種類型:圖書館管理系統(tǒng)數(shù)據(jù)庫(kù)、特色數(shù)據(jù)庫(kù)、自建學(xué)位論文數(shù)據(jù)庫(kù)、學(xué)術(shù)型網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、光盤數(shù)據(jù)庫(kù)、試用數(shù)據(jù)庫(kù)。
2.1 圖書館管理系統(tǒng)數(shù)據(jù)庫(kù)不可或缺
除了上述的數(shù)字資源之外,高校圖書館普遍采用各種圖書館管理系統(tǒng),如金盤、ILASⅡ與Interlib圖書館管理系統(tǒng)等對(duì)人員、讀者以及傳統(tǒng)館藏資源等進(jìn)行管理。這些管理系統(tǒng)經(jīng)過多年運(yùn)行積累起來(lái)的大量珍貴數(shù)據(jù)資源,在確保圖書館正常運(yùn)轉(zhuǎn)中發(fā)揮舉足輕重的作用。這些數(shù)字資源如果丟失的話,圖書館無(wú)疑將迎來(lái)一場(chǎng)可怕的災(zāi)難。另外,由于計(jì)算機(jī)技術(shù)的迅猛發(fā)展,圖書館管理系統(tǒng)升級(jí)更新很快,淘汰后的老版本圖書館管理系統(tǒng)數(shù)據(jù)庫(kù)因?yàn)楸4媪藞D書館重要的歷史信息,其存儲(chǔ)也應(yīng)納入數(shù)字資源的管理范疇,以應(yīng)不時(shí)之需。
2.2 特色數(shù)據(jù)庫(kù)發(fā)展迅速
在高校圖書館中的數(shù)字資源中,特色數(shù)據(jù)庫(kù)的建設(shè)是高校圖書館數(shù)字資源建設(shè)的重中之重。隨著信息技術(shù)的發(fā)展,高校圖書館特色數(shù)據(jù)庫(kù)的建設(shè),實(shí)現(xiàn)了從書目數(shù)據(jù)庫(kù)向內(nèi)容數(shù)據(jù)庫(kù)、從館藏文獻(xiàn)資源向網(wǎng)絡(luò)資源鏈接、從各館孤立建設(shè)轉(zhuǎn)向多館共享建設(shè)、從自給自足的資源服務(wù)方式拓展到網(wǎng)上專題資源共享服務(wù)的轉(zhuǎn)變[3]。目前,國(guó)內(nèi)比較典型的特色數(shù)據(jù)庫(kù)有浙江中醫(yī)藥大學(xué)圖書館的浙江中醫(yī)藥古籍?dāng)?shù)據(jù)庫(kù)、蘭州大學(xué)圖書館的敦煌學(xué)數(shù)據(jù)庫(kù)、廈門大學(xué)圖書館的東南亞研究與華僑華人研究題錄數(shù)據(jù)庫(kù)等。國(guó)內(nèi)眾多高校圖書館都意識(shí)到要提高圖書館的服務(wù)水平,必須建立具有本館館藏特色、本校學(xué)科特色和本地區(qū)特色相結(jié)合的數(shù)據(jù)庫(kù),目前這些特色數(shù)據(jù)庫(kù)正在蓬勃發(fā)展中。
2.3 自建學(xué)位論文數(shù)據(jù)庫(kù)建設(shè)踴躍
除了特色數(shù)據(jù)庫(kù)外,國(guó)內(nèi)高校圖書館還對(duì)本校資源進(jìn)行整理挖掘,如高校中的碩博士學(xué)位論文因?yàn)樘接懙膯栴}專深,學(xué)術(shù)價(jià)值高,引起高校圖書館的高度重視,不少圖書館將本校的碩博士學(xué)位論文進(jìn)行統(tǒng)一管理,建立高校學(xué)位論文數(shù)據(jù)庫(kù)并加以利用,如北京大學(xué)、復(fù)旦大學(xué)、上海交通大學(xué)等都建立了各自的學(xué)位論文數(shù)據(jù)庫(kù)。
2.4 學(xué)術(shù)型網(wǎng)絡(luò)數(shù)據(jù)庫(kù)比重大
科研工作作為高校的重要組成部分,各種類型的學(xué)術(shù)型網(wǎng)絡(luò)數(shù)據(jù)庫(kù)在高校圖書館中占有很大比重。如外文方面,部分高校購(gòu)置了EBSCO、Springer、Elsevier等網(wǎng)絡(luò)數(shù)據(jù)庫(kù);中文方面,大部分高校圖書館相繼購(gòu)置了中國(guó)學(xué)術(shù)期刊全文數(shù)據(jù)庫(kù)、維普資訊數(shù)據(jù)庫(kù)及萬(wàn)方數(shù)據(jù)資源系統(tǒng)等。這些學(xué)術(shù)型網(wǎng)絡(luò)數(shù)據(jù)庫(kù)在高校的教學(xué)和科研工作中受到廣大師生的歡迎,得到較廣泛的利用。
2.5 光盤數(shù)據(jù)庫(kù)建設(shè)日益重視
隨著光盤數(shù)據(jù)量的激增,傳統(tǒng)的單光盤的檢索方式已經(jīng)不能適應(yīng)人們對(duì)光盤數(shù)據(jù)庫(kù)的使用需求。光盤庫(kù)、磁盤陣列、光盤鏡像硬盤塔和硬盤組合技術(shù)的出現(xiàn)基本上解決了這個(gè)難題。一些高校圖書館對(duì)這部分資源越來(lái)越重視,購(gòu)買或自建了多種光盤數(shù)據(jù)庫(kù)系統(tǒng),如Medline光盤數(shù)據(jù)庫(kù)、中國(guó)生物醫(yī)學(xué)文獻(xiàn)光盤數(shù)據(jù)庫(kù)(CBMDisc)以及將一些隨書光盤通過技術(shù)手段建立起來(lái)的隨書光盤系統(tǒng)。
2.6 試用數(shù)據(jù)庫(kù)種類多
知識(shí)經(jīng)濟(jì)社會(huì)中,各大小知識(shí)產(chǎn)品供應(yīng)商都積極開發(fā)了不同類型、不同層次、不同面向?qū)ο蟮臄?shù)據(jù)庫(kù)產(chǎn)品。由于市場(chǎng)競(jìng)爭(zhēng)激烈,這些數(shù)據(jù)庫(kù)中正式列入高校圖書館的采購(gòu)計(jì)劃前,往往會(huì)為高校用戶提供數(shù)據(jù)庫(kù)產(chǎn)品的試用,試用周期長(zhǎng)短不一。試用結(jié)束后提供使用統(tǒng)計(jì)報(bào)告,使資源的最終使用者能真正參與資源的評(píng)估和建設(shè)環(huán)節(jié)。這些數(shù)據(jù)庫(kù)產(chǎn)品的試用在增加了高校圖書館的選擇空間時(shí),無(wú)疑也增加了數(shù)字資源管理的難度。
3 高校圖書館數(shù)字資源ILM策略實(shí)施
研究發(fā)現(xiàn),各類傳統(tǒng)文獻(xiàn)都具有一定的使用壽命,如圖書一般在10~20年,期刊3~5年,科技報(bào)告10年左右,產(chǎn)品樣本3~5年,文獻(xiàn)使用壽命一定程度上反映了信息生命周期規(guī)律。
數(shù)字資源和傳統(tǒng)文獻(xiàn)相比,盡管信息的載體發(fā)生了變化,但兩者的生命周期整體大致相當(dāng)。數(shù)字資源依靠先進(jìn)的信息技術(shù),信息更新的周期短,不受時(shí)間、地點(diǎn)限制,傳遞速度快,具有高度共享性。為便于對(duì)信息生命周期進(jìn)行研究,不同專家和學(xué)者采用不同的標(biāo)準(zhǔn)如信息價(jià)值標(biāo)準(zhǔn)、信息作用標(biāo)準(zhǔn),并且從多個(gè)角度如信息利用次數(shù)、使用頻率等對(duì)信息生命周期的階段進(jìn)行了劃分。全球知名的數(shù)據(jù)存儲(chǔ)商EMC公司將數(shù)字資源的信息生命周期,分為創(chuàng)建、保護(hù)、訪問、遷移、歸檔和銷毀6個(gè)階段[4]。
3.1 數(shù)字資源創(chuàng)建階段
信息技術(shù)的飛速發(fā)展,使得作為高校教學(xué)科研信息資源主要提供者的高校圖書館的服務(wù)突破了時(shí)間和空間的限制,服務(wù)內(nèi)容多樣化,服務(wù)手段先進(jìn)化,服務(wù)項(xiàng)目個(gè)性化。高校圖書館在保持傳統(tǒng)服務(wù)的同時(shí),更要實(shí)現(xiàn)由傳統(tǒng)服務(wù)向網(wǎng)絡(luò)服務(wù)的轉(zhuǎn)變,不僅要積極地把館藏傳統(tǒng)資源轉(zhuǎn)化為網(wǎng)絡(luò)數(shù)字資源,在網(wǎng)上拓展圖書館的信息服務(wù)項(xiàng)目,而且要把網(wǎng)絡(luò)中豐富的信息資源轉(zhuǎn)化為圖書館信息資源的一部分,提供給廣大讀者,從而提高文獻(xiàn)信息的生命周期。
3.2 數(shù)字資源保護(hù)階段
高校圖書館集中了各種特色資源和豐富的學(xué)術(shù)資源,這些資源對(duì)高校教學(xué)科研工作非常重要。因此,高校圖書館應(yīng)該不僅要重視數(shù)字資源的建設(shè),更要重視資源的硬件基礎(chǔ)建設(shè),加強(qiáng)對(duì)數(shù)字資源的保護(hù)。不過,國(guó)內(nèi)大部分高校圖書館存在經(jīng)費(fèi)短缺的問題,根據(jù)信息生命周期相關(guān)理論,我們可以根據(jù)數(shù)字資源的不同價(jià)值,對(duì)數(shù)字資源采取不同的措施和技術(shù)來(lái)進(jìn)行保護(hù),從而降低管理成本。
3.3 數(shù)字資源訪問階段
針對(duì)傳統(tǒng)文獻(xiàn)進(jìn)行管理時(shí),為了降低文獻(xiàn)保存成本,解決圖書館空間與文獻(xiàn)數(shù)量劇增矛盾,一些專家提出了一系列解決方案,比較著名的方案是“三線典藏制”,該方案是以美國(guó)圖書館專家R#8226;W#8226;Truesovel提出的“二八率”(2/8 rule)為理論依據(jù)制定的,即將傳統(tǒng)文獻(xiàn)按照利用率的高、中、低,分別將傳統(tǒng)文獻(xiàn)分配到一線館藏區(qū)、二線館藏區(qū)和三線館藏區(qū),從而方便讀者找到利用率較高的文獻(xiàn),降低保存成本。這個(gè)方案和ILM的思想基本類似。
將ILM策略應(yīng)用到高校圖書館數(shù)字資源管理中,就要依據(jù)數(shù)字資源在其信息生命周期中價(jià)值的變化規(guī)律,對(duì)不同類型的數(shù)字資源,在不同的時(shí)間、不同的階段,進(jìn)行分級(jí)存儲(chǔ)、保護(hù)和服務(wù),達(dá)到以最低的管理成本實(shí)現(xiàn)信息價(jià)值的最大化。和傳統(tǒng)文獻(xiàn)的“三線典藏制”類似,高校圖書館的數(shù)字資源按訪問頻率可分為在線數(shù)據(jù)、近線數(shù)據(jù)和離線數(shù)據(jù)三類(見表1)。
在線數(shù)據(jù)是高校圖書館數(shù)據(jù)庫(kù)中最為活躍的部分,提供日常業(yè)務(wù)處理所需的數(shù)據(jù)和信息,如圖書館管理系統(tǒng)數(shù)據(jù)庫(kù),另外特色數(shù)據(jù)庫(kù)和學(xué)位論文數(shù)據(jù)庫(kù)專有性強(qiáng),訪問頻率高,因此也列入在線數(shù)據(jù)范疇。在線數(shù)據(jù)存儲(chǔ)時(shí)應(yīng)達(dá)到高性能、大容量要求,保證系統(tǒng)的正常運(yùn)轉(zhuǎn)。
近線數(shù)據(jù)指訪問頻率一般的數(shù)字資源,這類數(shù)字資源可以保存在本地或網(wǎng)絡(luò)服務(wù)器上,如學(xué)術(shù)型網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、光盤數(shù)據(jù)庫(kù)等。如果用戶對(duì)某些數(shù)字資源訪問量特別大,最好是將其保存在本地服務(wù)器上,加快訪問速度。
離線數(shù)據(jù)指平時(shí)訪問率非常低的數(shù)據(jù),如過期數(shù)據(jù)庫(kù)、老版本圖書館管理系統(tǒng)數(shù)據(jù)庫(kù)等。對(duì)于這些數(shù)據(jù),我們應(yīng)將其存放在價(jià)格更低的存儲(chǔ)介質(zhì)或單機(jī)上,供單機(jī)查詢。
3.4 數(shù)字資源遷移階段
數(shù)字資源具有一定的生命周期,經(jīng)過其利用高峰后,我們應(yīng)將訪問率降低的數(shù)字資源由主存儲(chǔ)設(shè)備遷移到次級(jí)存儲(chǔ)設(shè)備,遷移操作可以為訪問頻率高的數(shù)字資源騰出寶貴的主存儲(chǔ)空間,提高資源訪問和備份的速度[5]。目前,一些數(shù)據(jù)庫(kù)系統(tǒng)公司開發(fā)出相應(yīng)軟件,可以方便地進(jìn)行數(shù)據(jù)遷移操作,如CommVault系統(tǒng)公司開發(fā)的Simpana軟件可以采用自動(dòng)的、基于策略的方法,快捷高效地遷移數(shù)據(jù),而且遷移過程對(duì)于最終用戶而言是隱匿的,即可以在不影響系統(tǒng)正常運(yùn)行情況下將數(shù)據(jù)從一個(gè)存儲(chǔ)設(shè)備轉(zhuǎn)移到另一個(gè)存儲(chǔ)設(shè)備。
3.5 數(shù)字資源歸檔階段
高校圖書館對(duì)一些非常重要的數(shù)字資源,應(yīng)及時(shí)進(jìn)行歸檔處理,萬(wàn)一在進(jìn)行誤操作的情況下,可以使原始數(shù)字資源完整恢復(fù)過來(lái)而不至于影響圖書館的正常運(yùn)作。
3.6 數(shù)字資源銷毀階段
數(shù)字資源在經(jīng)歷創(chuàng)建、保護(hù)、訪問、遷移、歸檔階段后,資源被訪問的頻率逐漸降低,甚至喪失了保存的價(jià)值。這時(shí),我們可以考慮將其進(jìn)行銷毀處理。在銷毀前,可以根據(jù)高校圖書館的目標(biāo)和數(shù)字資源的特點(diǎn),構(gòu)建一個(gè)合理的評(píng)價(jià)指標(biāo)體系,依據(jù)一定方法對(duì)數(shù)字資源的價(jià)值進(jìn)行評(píng)價(jià)[6]。由于數(shù)字資源一旦被銷毀,恢復(fù)的難度很大,筆者認(rèn)為這對(duì)數(shù)字資源進(jìn)行銷毀時(shí)要慎而又慎,以免造成難以預(yù)測(cè)的災(zāi)難性后果。
4 結(jié) 語(yǔ)
數(shù)字資源的信息生命周期管理是一個(gè)復(fù)雜的系統(tǒng)工程,其核心是針對(duì)不同數(shù)據(jù)的不同生命階段,采取不同的存儲(chǔ)策略和存儲(chǔ)介質(zhì)。高校圖書館采用ILM策略管理數(shù)字資源,可以從新的角度深入了解信息,以最低成本實(shí)現(xiàn)信息價(jià)值最大化,提高圖書館的管理和服務(wù)水平。在實(shí)施ILM策略過程中,還存在相當(dāng)多需要研究的問題,期待更多專家對(duì)數(shù)字資源的信息生命周期管理這一課題進(jìn)行關(guān)注和探討。
參考文獻(xiàn)
[1]翁佳.信息生命周期管理[J].情報(bào)科學(xué),2005,23(6):880-884.
[2]馬越.普通高校圖書館的數(shù)字館藏建設(shè)[J].河南圖書館學(xué)刊,2002,22(3):47-50.
[3]魏靜,宋秋水.中國(guó)高校圖書館特色數(shù)據(jù)庫(kù)的發(fā)展[J].河南職工醫(yī)學(xué)院學(xué)報(bào),2007,19(5):510-512.
[4]吳錫剛,趙莉娜.圖書館數(shù)字信息生命周期管理[J].圖書館學(xué)研究,2005,(12):59-61.
[5]周杭霞,鐘梅,劉硯秋.運(yùn)用信息生命周期管理思想建設(shè)存儲(chǔ)系統(tǒng)[J].計(jì)算機(jī)時(shí)代,2006,(4):40-41.
[6]索傳軍.基于信息生命周期的數(shù)字館藏管理研究[J].大學(xué)圖書館學(xué)報(bào),2005,(1):26-29.