亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于信息生命周期的數(shù)字圖書館館藏資源動態(tài)存儲模型

        2010-01-01 00:00:00梁達(dá)基
        現(xiàn)代情報 2010年3期

        摘 要]分析了數(shù)字館藏的特點(diǎn)及其生命周期,以及數(shù)字館藏存儲技術(shù)#65377;結(jié)合信息生命周期理念及現(xiàn)代存儲技術(shù)和分級存儲管理思想,提出數(shù)字圖書館館藏資源動態(tài)存儲模型,并重點(diǎn)論述其中的資源利用價值評價模型及數(shù)據(jù)遷移策略#65377;

        [關(guān)鍵詞]數(shù)字圖書館;動態(tài)存儲;信息生命周期;分級存儲管理;數(shù)據(jù)遷移策略

        [中圖分類號]G250.76 [文獻(xiàn)標(biāo)識碼]A [文章編號]1008-0821(2010)03-0158-05

        Research on Digital Library Dynamic Information Storage Model Based on ILMLiang Daji

        (School of Information Management,Wuhan University,Wuhan 430072,China)

        [Abstract]The paper analyzed the features of digital storage in digital library and its lifecycle,as well as storage technology of those resources.On considering ILM(Information Lifecycle Management)and modern storage technology and the HSM(Hierarchical Storage Management),this paper proposed a dynamic information storage model,and then focused on the resources utility value evaluation model and the data transfer policies.

        [Key words]digital library;dynamic storage;ILM;HSM;data transfer policies

        我國數(shù)字圖書館建設(shè)正處于加速發(fā)展階段,隨著館藏?cái)?shù)字資源的急劇增加,不可避免地要考慮對海量數(shù)字資源進(jìn)行有效管理,盡可能節(jié)約成本同時又對數(shù)字資源充分利用,為圖書館用戶提供優(yōu)質(zhì)高效的資源服務(wù)的問題#65377;隨著相關(guān)研究的進(jìn)展,越來越多的專家學(xué)者已經(jīng)意識到數(shù)字資源是有生命周期的,通過研究其生命周期規(guī)律,在不同的生命周期階段采取不同的管理策略,能夠很好地解決數(shù)字圖書館海量數(shù)字館藏的管理與服務(wù)問題#65377;

        而在數(shù)字館藏管理中,存儲問題是關(guān)鍵問題之一,其對數(shù)字圖書館建設(shè)成本和資源服務(wù)都有重要影響#65377;本文將結(jié)合信息生命周期理念探討數(shù)字館藏存儲問題,提出數(shù)字館藏動態(tài)存儲模型,并重點(diǎn)探討其中的數(shù)據(jù)遷移策略,以期為解決海量館藏存儲管理問題提供一種思路#65377;

        1 數(shù)字館藏特點(diǎn)及其生命周期分析

        1.1 數(shù)字館藏的界定

        數(shù)字圖書館尚沒有一個一致認(rèn)可的統(tǒng)一定義,有學(xué)者這樣描述:“數(shù)字圖書館是一個系統(tǒng)化的信息工程,它將分散于各種載體#65380;不同地理位置的信息資源以數(shù)字化形式存儲再以網(wǎng)絡(luò)連接,提供及時利用,實(shí)現(xiàn)資源共享”[1]#65377;

        而數(shù)字館藏則有狹義和廣義之分#65377;狹義的數(shù)字館藏一般指最終提供給用戶使用的信息資源,包括電子書刊#65380;文獻(xiàn)資料#65380;音視頻資料等;廣義的數(shù)字館藏除了上述信息資源外,還應(yīng)包括為了實(shí)現(xiàn)對上述信息資源的管理以及提供服務(wù)而需要的各種元數(shù)據(jù)及其他管理性信息,也就是數(shù)字圖書館中需要存儲起來的所有信息資源#65377;本文討論數(shù)字圖書館的存儲問題,將從廣義的角度理解數(shù)字館藏的范圍界定#65377;

        1.2 數(shù)字館藏的特點(diǎn)

        根據(jù)學(xué)者們的研究,從存儲角度看,數(shù)字館藏具有如下一些特點(diǎn):[2-3]

        1.2.1 存儲容量大

        圖書館是社會的知識寶庫,是高校的信息資源中心#65377;隨著數(shù)字化進(jìn)程加快,數(shù)字圖書館館藏急劇增加,存儲信息的度量單位由MB#65380;GB向TB#65380;PB轉(zhuǎn)變,其存儲的數(shù)據(jù)總量達(dá)到了海量規(guī)模#65377;

        1.2.2 訪問量大且呈現(xiàn)動態(tài)性

        數(shù)字圖書館是各研究人員,學(xué)生等獲取信息資源的重要機(jī)構(gòu)#65377;電子期刊#65380;電子圖書#65380;常用的鏡像站點(diǎn)數(shù)據(jù)庫等在圖書館中的訪問量極大,有時可同時有幾百人乃至成千人進(jìn)行訪問#65377;同時,人們訪問數(shù)字圖書館在時間分布上不是均勻的,而是呈現(xiàn)出波浪形訪問頻率曲線#65377;

        1.2.3 媒體形式多

        數(shù)字館藏內(nèi)容包括數(shù)字化圖書#65380;文獻(xiàn)#65380;碩博士論文#65380;多媒體課件#65380;音視頻資料等等#65377;其存儲格式多樣,包括文本文件#65380;位圖文件#65380;矢量圖#65380;各種音視頻文件#65380;各種數(shù)據(jù)庫特定存儲文件等等,數(shù)據(jù)類型復(fù)雜#65377;

        1.2.4 數(shù)據(jù)時效性大

        信息資源是有生命周期的,在不同的生命周期階段,其價值不一樣,被人們訪問利用的頻率也不一樣#65377;

        1.2.5 資源分布廣且呈異構(gòu)性

        數(shù)字館藏包含存儲在本地的實(shí)體館藏以及存儲在遠(yuǎn)程服務(wù)器上的虛擬館藏,存儲路徑復(fù)雜,存儲格式多樣#65377;存儲設(shè)備包括磁盤陣列#65380;磁帶庫#65380;光盤庫等,不同廠商的產(chǎn)品規(guī)格型號各異;主機(jī)系統(tǒng)包括Windows#65380;Unix#65380;Linux等#65377;因此數(shù)字館藏資源分布廣,且呈現(xiàn)很大的異構(gòu)性#65377;

        1.3 數(shù)字館藏的生命周期分析

        和文獻(xiàn)信息擁有半衰期一樣,圖書館的數(shù)字館藏也是有其生命周期的#65377;有關(guān)數(shù)字信息資源生命周期的研究是一個較新的領(lǐng)域,對于信息資源生命周期的劃分,不同的學(xué)者給出了不同的劃分模型#65377;國際科技信息委員會(ICSTI)的一項(xiàng)研究將數(shù)字信息資源的生命周期劃分為創(chuàng)建#65380;采集#65380;編目/鑒別#65380;存儲#65380;長期保存#65380;訪問這6個階段[4]#65377;世界著名的存儲供應(yīng)商EMC也將數(shù)據(jù)的生命周期劃分為6個階段:數(shù)字資源創(chuàng)建階段#65380;數(shù)字資源保護(hù)階段#65380;數(shù)字資源訪問階段#65380;數(shù)字資源遷移階段#65380;數(shù)字資源歸檔階段和數(shù)字資源回收(銷毀)階段[5]#65377;

        通過分析與歸納,結(jié)合數(shù)字館藏的特點(diǎn),可將數(shù)字館藏的生命周期劃分為如下6個階段:生產(chǎn)#65380;獲取#65380;組織#65380;存儲#65380;利用#65380;長期保存或銷毀#65377;本節(jié)對各個階段涉及的主要內(nèi)容進(jìn)行簡要分析#65377;

        1.3.1 生產(chǎn)

        數(shù)字館藏有不同來源,某些來源的數(shù)字館藏不涉及本階段,如網(wǎng)絡(luò)信息資源#65380;電子出版物和遠(yuǎn)程數(shù)據(jù)庫都并非數(shù)字圖書館生產(chǎn),因而它們在數(shù)字圖書館的生命周期中不包括生產(chǎn)階段#65377;此階段起主要作用的主體是數(shù)字圖書館,生產(chǎn)階段的數(shù)字資源不僅源于傳統(tǒng)館藏?cái)?shù)字化產(chǎn)品,即數(shù)字圖書館對館藏的書籍#65380;文獻(xiàn)以及碩#65380;博士論文和教師的課件等資源的數(shù)字化,還包括對之前存入的數(shù)字資源進(jìn)行的格式轉(zhuǎn)化更新#65377;

        1.3.2 獲取

        獲取主要是指數(shù)字圖書館從外部獲取數(shù)字資源到達(dá)本地,包括獲取網(wǎng)絡(luò)上的公開資源#65380;選購數(shù)字資源提供商的信息資源產(chǎn)品等#65377;涉及的活動包括選擇資源#65380;協(xié)商知識產(chǎn)權(quán)等相關(guān)問題#65380;購買#65380;取得使用權(quán)或下載資源到本地等#65377;

        ] No.32010年3月第30卷第3期基于信息生命周期的數(shù)字圖書館館藏資源動態(tài)存儲模型Mar.,2010Vol.30 No.31.3.3 組織

        組織就是將獲取到本地的數(shù)字資源整合進(jìn)數(shù)字圖書館的知識倉庫并對其進(jìn)行編目和標(biāo)引等操作的過程#65377;其中,元數(shù)據(jù)的創(chuàng)建與組織將是重要的工作#65377;元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),數(shù)字圖書館要提供高效優(yōu)質(zhì)的服務(wù),使用戶有效地獲取合適的館藏資源,則必須要有良好的元數(shù)據(jù)支撐,以滿足用戶的各種檢索及利用需求#65377;

        1.3.4 存儲

        存儲是數(shù)字圖書館建設(shè)#65380;數(shù)字館藏管理過程中的關(guān)鍵階段之一#65377;由于數(shù)字館藏容量巨大,不同的資源在不同的階段其利用價值不同等原因,存儲系統(tǒng)的好壞,將直接影響到數(shù)字圖書館的建設(shè)成本#65380;服務(wù)效率#65380;系統(tǒng)可靠性及穩(wěn)定性等方面#65377;因此需要把存儲系統(tǒng)的設(shè)計(jì)作為數(shù)字圖書館建設(shè)的重要工作加以重視#65377;

        1.3.5 利用

        利用主要涉及用戶對數(shù)字圖書館提供的服務(wù)及資源的查詢#65380;下載或在線使用等活動,是數(shù)字圖書館所提供服務(wù)的具體體現(xiàn),同時也是數(shù)字圖書館獲得用戶反饋信息從而調(diào)整各種管理策略及提供更好服務(wù)的主要途徑#65377;

        1.3.6 長期保存或銷毀

        經(jīng)過一定時期之后,數(shù)字館藏的利用價值已經(jīng)降低或消失,或其保存格式已不被軟硬件支持而難以有效提供服務(wù),這時就需要對其進(jìn)行評估,根據(jù)不同情況,對其進(jìn)行轉(zhuǎn)換格式已重新利用,或?qū)⑵溥M(jìn)行長期保存以備日后查詢或?qū)⒋_認(rèn)可銷毀的資源進(jìn)行銷毀,從而釋放存儲資源#65377;

        2 數(shù)字圖書館存儲技術(shù)

        數(shù)據(jù)存儲和存儲管理技術(shù)起源于20世紀(jì)70年代,主要經(jīng)歷了集中存儲#65380;分布式存儲和網(wǎng)絡(luò)存儲3個階段#65377;在數(shù)字圖書館中應(yīng)用較多的主要有3種存儲技術(shù):直接附加存儲#65380;網(wǎng)絡(luò)附加存儲#65380;存儲區(qū)域網(wǎng)絡(luò)#65377;同時,針對數(shù)字圖書館館藏容量大,動態(tài)性強(qiáng)等特點(diǎn),分級存儲管理的思路在數(shù)字圖書館建設(shè)中也得到了廣泛應(yīng)用#65377;

        2.1 主要存儲技術(shù)分析

        在數(shù)字圖書館中應(yīng)用較多的存儲技術(shù)主要有3種[6-7]:DAS(Direct Attached Storage,直接附加存儲)#65380;NAS(Network Attached Storage,網(wǎng)絡(luò)附加存儲)#65380;SAN(Storage Area Network,存儲區(qū)域網(wǎng))#65377;下面簡要分析這3種技術(shù)各自的優(yōu)缺點(diǎn)及適用情況#65377;

        2.1.1 DAS

        DAS是指主機(jī)與存儲設(shè)備(磁盤或磁盤陣列等)之間直接連接,存儲設(shè)備通過SCSI或ATA(目前連接方式已擴(kuò)展為FC#65380;USB等多種)作為數(shù)據(jù)接口的存儲方式#65377;DAS技術(shù)出現(xiàn)較早,具有技術(shù)成熟,標(biāo)準(zhǔn)統(tǒng)一,兼容性較好,價格及安裝維護(hù)成本較低等優(yōu)點(diǎn)#65377;不足之處在于其對服務(wù)器直接依賴,不利于擴(kuò)充,難以適應(yīng)數(shù)據(jù)量增長迅速的數(shù)字圖書館的應(yīng)用#65377;因此,DAS技術(shù)只適用于資金投入少#65380;數(shù)據(jù)流量小的小型數(shù)字圖書館#65377;

        2.1.2 NAS

        NAS是指直接掛接在網(wǎng)絡(luò)上的專業(yè)化存儲設(shè)備,具有獨(dú)立的優(yōu)化存儲操作系統(tǒng),不受應(yīng)用服務(wù)器干預(yù),通過網(wǎng)絡(luò)接口與網(wǎng)絡(luò)連接,數(shù)據(jù)通過網(wǎng)絡(luò)協(xié)議進(jìn)行傳輸,支持異構(gòu)服務(wù)器間共享數(shù)據(jù)#65377;NAS主要優(yōu)點(diǎn)有方便快捷,即插即用;不依賴于服務(wù)器,擴(kuò)展性較好;價格適中;跨平臺等#65377;不足之處在于其存取速度受網(wǎng)絡(luò)帶寬影響較大,當(dāng)NAS設(shè)備增多時,其網(wǎng)絡(luò)性能會明顯下降;不適用于存儲音視頻等流量大的文件;由于NAS設(shè)備直接連接到網(wǎng)絡(luò),因此其安全性較難保障#65377;因此,NAS適用于并發(fā)訪問數(shù)不是很大的中小型數(shù)字圖書館或者用于數(shù)據(jù)庫系統(tǒng)容災(zāi)備份#65377;

        2.1.3 SAN

        SAN是一種通過集線器#65380;路由器#65380;交換機(jī)等連接設(shè)備將磁盤陣列#65380;磁帶等存儲設(shè)備與相關(guān)服務(wù)器連接起來的高速專用子網(wǎng),傳輸媒介主要采用光纖通道#65377;SAN引入存儲網(wǎng)絡(luò)的理念,實(shí)現(xiàn)數(shù)據(jù)存儲的集中化;存儲網(wǎng)絡(luò)與應(yīng)用網(wǎng)絡(luò)分割,不影響原有網(wǎng)絡(luò)性能#65377;SAN具有高速#65380;高可靠性#65380;高可擴(kuò)展性,支持異構(gòu)服務(wù)器,管理方便,設(shè)備位置布置靈活等優(yōu)點(diǎn)#65377;SAN的不足主要有安裝維護(hù)費(fèi)用高;數(shù)據(jù)集中存儲,共享較困難等#65377;因此,SAN技術(shù)適用于有經(jīng)濟(jì)實(shí)力的大型數(shù)字圖書館#65377;

        2.2 分級存儲管理

        按照信息生命周期的觀點(diǎn),數(shù)字資源創(chuàng)建之后,隨著時間的推移,其利用價值#65380;被訪問頻率會動態(tài)發(fā)生變化#65377;同時,在所有數(shù)字資源當(dāng)中,不同的資源被利用頻率也不一樣,在某個階段,少部分資源被頻繁利用,大部分資源被利用頻率較少#65377;而存儲設(shè)備同樣存在著性能#65380;價格#65380;容量等方面的巨大差異,若所有數(shù)字資源均使用高速磁盤存儲,則費(fèi)用高昂難以負(fù)擔(dān);若所有數(shù)字資源均采用低端磁盤甚至關(guān)盤庫#65380;磁帶庫等廉價存儲設(shè)備,則不能滿足服務(wù)需求#65377;針對上述問題,分級存儲技術(shù)便應(yīng)運(yùn)而生#65377;

        分級存儲一般分在線#65380;近線#65380;離線3種方式#65377;在線存儲使用高速#65380;高性能存儲設(shè)備存放被頻繁訪問的#65380;對訪問速度有較高要求的數(shù)字資源;這類設(shè)備價格較高#65377;近線存儲一般使用價格較低#65380;速度與性能一般,但存儲容量大的磁盤設(shè)備,存儲隨時需要訪問,但對訪問速度要求不是很高的大量數(shù)字資源#65377;離線存儲則使用低性能#65380;廉價#65380;大容量的存儲設(shè)備,如光盤庫#65380;磁帶庫等,存儲偶爾需要訪問的數(shù)字資源,或用于存儲備份#65377;

        分級存儲管理(Hierarchical Storage Management,HSM)就是將各級存儲設(shè)備進(jìn)行融合,實(shí)現(xiàn)統(tǒng)一管理的思想與技術(shù)手段#65377;分級存儲管理最重要的一項(xiàng)功能,是根據(jù)某種策略,實(shí)現(xiàn)數(shù)據(jù)在各級存儲設(shè)備中的自動遷移,同時這種遷移應(yīng)該是對應(yīng)用服務(wù)透明的#65377;實(shí)現(xiàn)分級存儲管理,既能最大限度地滿足用戶需求,又可使總體存儲成本最小化,從而達(dá)到綜合效益最高的目的[8]#65377;

        3 動態(tài)存儲模型

        結(jié)合信息生命周期管理理念及分級存儲管理思想,考慮數(shù)字圖書館館藏資源的特點(diǎn),針對大型數(shù)字圖書館,本文提出一個數(shù)字圖書館動態(tài)存儲模型,并重點(diǎn)分析其中的數(shù)據(jù)遷移策略#65377;

        3.1 模型總體設(shè)計(jì)

        本文提出的動態(tài)存儲模型主要采用SAN存儲技術(shù),由客戶端#65380;局域網(wǎng)#65380;應(yīng)用服務(wù)器集群#65380;分級存儲管理服務(wù)器#65380;SAN存儲網(wǎng)絡(luò)組成#65377;其中,分級存儲管理服務(wù)器實(shí)現(xiàn)元數(shù)據(jù)管理及分級存儲管理,使資源存儲對應(yīng)用透明,并實(shí)現(xiàn)數(shù)字資源的自動遷移#65377;模型層次結(jié)構(gòu)如圖1所示#65377;

        元數(shù)據(jù)數(shù)據(jù)庫是模型的重要組成部分#65377;元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),記錄了原始資源的各種屬性及描述性信息,以及實(shí)現(xiàn)分級存儲管理的各種信息,包括面向應(yīng)用服務(wù)器的資源邏輯地址和資源物理存儲地址之間的映射等#65377;

        應(yīng)用服務(wù)器接收到客戶端的查詢請求后,先從元數(shù)據(jù)服務(wù)器中查詢出相應(yīng)記錄,反饋到客戶端#65377;當(dāng)接收到客戶端訪問某個資源的請求后,應(yīng)用服務(wù)器根據(jù)資源邏輯地址,將資源訪問請求及訪問者相關(guān)信息提交給分級存儲管理服務(wù)器,后者根據(jù)預(yù)先定義好的資源利用價值評定策略做好相應(yīng)記錄,然后將資源實(shí)際地址反饋給應(yīng)用服務(wù)器,從而應(yīng)用服務(wù)器可獲取相應(yīng)資源反饋給客戶端#65377;

        實(shí)現(xiàn)分級存儲管理,需要預(yù)先定義資源遷移策略,包括資源利用價值的評價及自動遷移策略#65377;數(shù)據(jù)遷移策略應(yīng)盡量少影響應(yīng)用服務(wù)的提供#65377;對策略的管理,可通過管理終端實(shí)現(xiàn)遠(yuǎn)程管理#65377;

        3.2 數(shù)據(jù)遷移策略

        數(shù)據(jù)遷移策略包括資源利用價值評價和自動遷移執(zhí)行兩部分#65377;目前已有一些學(xué)者探討過相關(guān)問題[9-10],但都是討論通用數(shù)據(jù)遷移策略,沒有針對數(shù)字圖書館的固有特點(diǎn),而且有些因素(如文件大小)考慮得過于簡單,其在數(shù)字圖書館中的適用性不強(qiáng)#65377;因此,本文以高校數(shù)字圖書館為例,探討具體的數(shù)據(jù)遷移策略#65377;另外,由于本文提出的資圖1 數(shù)字圖書館存儲模型結(jié)構(gòu)圖 源利用價值評價涉及到文件的大小,而高校數(shù)字圖書館所提供的主要資源為文獻(xiàn)資源,且文獻(xiàn)資源與音視頻資源文件大小相差懸殊,因此本文認(rèn)為兩者需分別考慮#65377;在此本文僅以文獻(xiàn)資源(非音視頻資源)為對象考慮相關(guān)問題,且如下討論只針對在線資源和近線資源,對于離線資源,一旦被訪問則立即將其遷移至近線存儲設(shè)備#65377;

        3.2.1 資源利用價值評價模型

        數(shù)字圖書館的服務(wù)目標(biāo)是為廣大用戶提供各種數(shù)字資源,以滿足用戶的信息需求#65377;因此考慮數(shù)字館藏分級存儲管理中的資源利用價值時,應(yīng)主要從資源被用戶利用的角度考慮#65377;本文提出的價值評價模型涉及如下指標(biāo):利用頻率#65380;時間#65380;用戶類別#65380;文件大小#65377;

        (1)簡單利用率:主要考慮數(shù)字資源本身(不包括元數(shù)據(jù)#65380;二次信息)被訪問的頻率,頻率的計(jì)算方式為:f=ΔN/Δt#65377;其中,ΔN為單位時間內(nèi)該資源被訪問的總次數(shù),時間單位為一個遷移周期,可通過經(jīng)驗(yàn)設(shè)定及調(diào)整#65377;

        (2)時間#65377;對于剛創(chuàng)建的數(shù)字資源,其利用價值尚未知道,應(yīng)將其存放在一級存儲設(shè)備上#65377;可設(shè)定一個初始保留時間ΔT,在資源新建后ΔT時間內(nèi),不將其遷移至下一級存儲設(shè)備上#65377;對于過了初始保留時間的資源,使用一致的公式計(jì)算其利用價值#65377;計(jì)算資源利用價值時,也需考慮到資源的訪問時間點(diǎn)#65377;對于越靠近下一次遷移時間點(diǎn)的訪問,其對資源利用價值的貢獻(xiàn)應(yīng)越大,也就是說,在同一個判斷周期內(nèi),兩個不同資源被訪問次數(shù)同樣時,訪問次數(shù)的二分位數(shù)在訪問曲線上越靠近下一次遷移時間點(diǎn),則對應(yīng)的資源對于系統(tǒng)而言的利用價值應(yīng)越大,應(yīng)優(yōu)先被保留在一線存儲設(shè)備上#65377;基于此,有必要考慮訪問時間點(diǎn)#65377;設(shè)第i次訪問時距離上一次遷移時間點(diǎn)的天數(shù)為Ti,其重要性呈對數(shù)曲線遞增,底數(shù)為2,則Ni=Ni-1+log2Ti#65377;其中,Ni為一累計(jì)值,表示到第i次訪問時,考慮了時間因素的資源訪問數(shù)#65377;

        (3)用戶類別:數(shù)字圖書館有不同類型的用戶(如高校中有教師#65380;博士生#65380;碩士生#65380;本科生等),各類型用戶對圖書館的重要性(服務(wù)優(yōu)先級)應(yīng)該是有差異的,要能更加準(zhǔn)確地評價數(shù)字資源的利用價值,還應(yīng)該考慮到使用該資源的用戶的類型#65377;具體做法為將數(shù)字圖書館的用戶分成若干類,為每類用戶設(shè)定一個權(quán)重值,某類用戶訪問數(shù)字資源時,應(yīng)將訪問次數(shù)乘以權(quán)重之后再計(jì)算資源的利用頻率#65377;

        (4)文件大小#65377;小而且熱的資源應(yīng)優(yōu)先存放在一級存儲設(shè)備上,從而更好地提高高性能存儲設(shè)備的效益#65377;而考慮到數(shù)字圖書館文獻(xiàn)資源大小一般從幾十KB到幾MB不等,其大小對系統(tǒng)而言影響不是很大,因此其對利用價值的影響不應(yīng)太大#65377;所以,本文考慮文件大小對利用價值的影響時,使用的是“加法”而不是“乘法”#65377;

        綜合上述討論,資源利用價值評價模型為:

        資源利用價值Vu=Fw+CS=∑ni=1Wijlog2TiΔt+CS

        其中,F(xiàn)w為考慮了用戶類型及訪問時間點(diǎn)的資源加權(quán)利用率,S為文件大小(單位為KB),C為一合適常數(shù)(根據(jù)實(shí)踐經(jīng)驗(yàn)確定);Wij為第i此訪問者所屬用戶類型之權(quán)重值,Ti為第i次訪問時距離上一次遷移時間點(diǎn)的天數(shù)#65377;

        3.2.2 資源利用價值評價實(shí)現(xiàn)

        要實(shí)現(xiàn)上述資源利用價值的計(jì)算,需做好相應(yīng)的元數(shù)據(jù)記錄#65377;

        涉及的資源元數(shù)據(jù)主要有:資源創(chuàng)建時間T0,資源大小S,資源加權(quán)訪問數(shù)累加器N,資源利用價值Vu#65377;其中,N在每個遷移周期開始時置為0,其后資源每次被訪問時,根據(jù)用戶所屬類型權(quán)重值及Ti值,將Wijlog2Ti的計(jì)算結(jié)果加到累加器中#65377;

        當(dāng)需要執(zhí)行數(shù)據(jù)遷移時,計(jì)算資源利用價值Vu,然后對存在時間大于初始保留時間ΔT的資源按照指定策略執(zhí)行遷移,而對存在時間小于ΔT的資源不執(zhí)行遷移#65377;當(dāng)遷移執(zhí)行完畢之后,將N和Vu重置為0,進(jìn)入下一周期的累積計(jì)算#65377;

        3.2.3 自動遷移策略及流程

        配置相關(guān)參數(shù)以制定自動遷移策略,包括:①自動遷移觸發(fā)條件,可指定兩種條件:一是按指定周期定時執(zhí)行;二是當(dāng)在線存儲設(shè)備可用空間小于指定值時(如20%);②需遷移資源的判定#65377;對于指定周期執(zhí)行的遷移,將在線資源中利用價值小于指定值Vu0的資源遷移到近線存儲設(shè)備,將近線資源中利用價值大于Vu0的資源遷移到在線存儲設(shè)備,小于Vu1的資源遷移到離線存儲設(shè)備;對于存儲設(shè)備容量不足觸發(fā)的遷移,則將上一級存儲設(shè)備中利用價值低的資源遷移到下一級存儲設(shè)備,直至設(shè)備可用容量達(dá)到指定值(如30%);③自動遷移執(zhí)行的時間段#65377;為了減少數(shù)據(jù)遷移對應(yīng)用服務(wù)的影響,遷移執(zhí)行時間段應(yīng)設(shè)在沒有用戶或極少用戶使用數(shù)字圖書館的時間,如凌晨2點(diǎn)到6點(diǎn)#65377;

        自動遷移過程:當(dāng)訪問到離線資源時,立即將其遷移到近線存儲設(shè)備#65377;對于在線和近線資源,當(dāng)達(dá)到遷移條件時,計(jì)算Vu,按照指定策略執(zhí)行遷移#65377;流程分別如圖2和圖3所示#65377;

        圖2 訪問不同級別資源時的處理流程圖3 在線和近線資源自動遷移流程 4 結(jié)論及展望

        本文針對數(shù)字圖書館館藏資源的特點(diǎn),結(jié)合信息生命周期管理理念及分級存儲管理思想,提出一個數(shù)字館藏資源動態(tài)存儲模型,并重點(diǎn)論述了其中的重要組成部分——數(shù)據(jù)遷移策略,對數(shù)字圖書館存儲系統(tǒng)建設(shè)思路具有一定價值,對信息生命周期管理的具體應(yīng)用具有一定的探索意義#65377;

        關(guān)于數(shù)字圖書館信息生命周期管理的研究尚處于初級階段,相關(guān)理論與實(shí)踐問題如信息生命周期階段的劃分#65380;資源價值評價等還需進(jìn)一步研究與探索#65377;本文提出的動態(tài)存儲模型需進(jìn)一步細(xì)化,并驗(yàn)證其可行性及系統(tǒng)性能;資源利用價值評價模型中的參數(shù)需通過實(shí)驗(yàn)與實(shí)踐加以確定#65377;這些問題將是下一步研究的重點(diǎn)#65377;

        參考文獻(xiàn)

        [1]陳傳夫.信息高速公路知識產(chǎn)權(quán)問題探討[J].圖書館學(xué)#65380;信息科學(xué)#65380;資料工作,1999,(1):64.

        [2]劉妹.對高校圖書館建設(shè)數(shù)字資源存儲系統(tǒng)的思考[J].大學(xué)圖書館學(xué)報,2008,(6):75-78.

        [3]余玲.基于網(wǎng)格的數(shù)字圖書館資源存儲研究[D].華中師范大學(xué)碩士學(xué)位論文,2007.

        [4]Gail M.Hodge.Best Practices for Digital Archiving:An Information Life Cycle Approach[J].D-Lib Magazine,2000,6(1).

        [5]索傳軍.基于ILM的數(shù)字館藏管理策略[J].圖書情報工作,2005,49(7):76-79.

        [6]田立峰.圖書館存儲技術(shù)方案的選擇與應(yīng)用[J].圖書館工作與研究,2006,(5):28-30.

        [7]陳永生,薛四新.基于分級存儲的數(shù)字化檔案利用模式研究[J].檔案學(xué)研究,2006,(5):33-37.

        [8]白廣思.信息資源分級存儲實(shí)現(xiàn)信息生命周期管理[J].情報雜志,2007,(1):12-14.

        [9]呂帥,劉光明,徐凱,等.海量信息分級存儲數(shù)據(jù)遷移策略研究[J].計(jì)算機(jī)工程與科學(xué),2009,(A1):163-167.

        [10]熊偉偉,汪東升.T-Archive:基于分級存儲的信息生命周期管理系統(tǒng)[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,29(5):1041-1045.

        国产亚洲超级97免费视频| 日日爽日日操| 午夜香蕉av一区二区三区| av免费不卡一区二区| 18禁无遮拦无码国产在线播放 | 日出白浆视频在线播放| 亚洲毛片αv无线播放一区 | 精品人妻av一区二区三区不卡| 亚洲成人精品在线一区二区| 久9re热视频这里只有精品| 亚洲综合av在线在线播放| jiZZ国产在线女人水多| 蜜桃视频一区二区三区四| 国产午夜毛片v一区二区三区| 男女男在线精品网站免费观看| 一本色道久久综合亚洲精品蜜臀 | 97se亚洲国产综合自在线| 九九99久久精品午夜剧场免费| 免费人妻精品一区二区三区| 国产乱码卡二卡三卡老狼| 精品人妻少妇一区二区不卡| 国产精品视频免费一区二区三区 | 国产精品黄在线观看免费软件 | 饥渴少妇一区二区三区| 色偷偷色噜噜狠狠网站30根| 中文字幕无码av激情不卡| av手机天堂| 美女扒开内裤让我捅的视频| 国产成人精品久久一区二区三区| 国产精品入口牛牛影视| 日本久久黄色高清视频| 久久国产劲爆∧v内射-百度| 蜜桃精品免费久久久久影院| 日本少妇爽的大叫高潮了| 女女同恋一区二区在线观看| 欧美操逼视频| www.亚洲天堂.com| 日本成人精品在线播放| 久久精品噜噜噜成人| 亚洲福利天堂网福利在线观看| 情av一区二区三区在线观看|