亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于元數(shù)據(jù)的重慶地區(qū)電子文獻資源整合研究

        2013-04-29 00:44:03彭渝等
        現(xiàn)代情報 2013年5期
        關(guān)鍵詞:整合高校圖書館醫(yī)院

        彭渝等

        〔摘要〕通過調(diào)查重慶地區(qū)高校、公共圖書館、醫(yī)院電子文獻資源,發(fā)現(xiàn)各單位在資源種類、總量、平均擁有量,特別是外文資源,差距更大,整合與共享勢在必行,通過對各單位元數(shù)據(jù)的抽取,構(gòu)建本地區(qū)電子資源元數(shù)據(jù)倉儲,使讀者通過對元數(shù)據(jù)倉儲的“一站式”檢索,實現(xiàn)對資源的統(tǒng)一訪問,從而達到整合目的。

        〔關(guān)鍵詞〕元數(shù)據(jù);電子文獻資源;整合;高校圖書館;公共圖書館;醫(yī)院

        DOI:10.3969/j.issn.1008-0821.2013.05.011

        〔中圖分類號〕G25076〔文獻標(biāo)識碼〕A〔文章編號〕1008-0821(2013)05-0047-04

        21本地鏡像的商業(yè)數(shù)據(jù)庫資源

        由于知識產(chǎn)權(quán)的原因,數(shù)據(jù)廠商一般情況下是不愿意提供資源的元數(shù)據(jù)的,不過可以通過與數(shù)據(jù)廠商協(xié)商,獲取一些數(shù)據(jù)庫的元數(shù)據(jù)資源。對于可以獲取元數(shù)據(jù)的商業(yè)數(shù)據(jù)庫,可以實施基于數(shù)據(jù)層的資源整合。對于不能獲取元數(shù)據(jù)的數(shù)據(jù)資源,數(shù)據(jù)廠商可以提供該資源所遵循的協(xié)議和訪問許可方式,實現(xiàn)應(yīng)用層的整合。

        22本館自建特色資源

        由于這類資源由本館自建,本館擁有該資源的元數(shù)據(jù)和對象數(shù)據(jù),通過元數(shù)據(jù)收割獲取各館自建資源的元數(shù)據(jù)。

        23隨書光盤資源

        各館自建的隨書光盤數(shù)據(jù)庫,各館擁有元數(shù)據(jù)及對象數(shù)據(jù),可以實施元數(shù)據(jù)整合。

        總之,對于較容易獲取元數(shù)據(jù)的電子文獻資源都可以通過元數(shù)據(jù)實現(xiàn)數(shù)據(jù)整合。

        3元數(shù)據(jù)整合模型分析

        基于元數(shù)據(jù)的區(qū)域電子文獻資源整合的中心思想是:通過建立區(qū)域內(nèi)統(tǒng)一的元數(shù)據(jù)中心,系統(tǒng)通過OAI(Open Archive Initiative for Protocol Meta-data Harvesting)技術(shù),將各校各類型資源收割到臨時的元數(shù)據(jù)倉儲中,然后通過對臨時元數(shù)據(jù)倉儲中的數(shù)據(jù)進行清洗、轉(zhuǎn)換,將這些數(shù)據(jù)追加到中心元數(shù)據(jù)倉儲中。用戶只需要對中心元數(shù)據(jù)倉儲進行檢索,即可實現(xiàn)對區(qū)域內(nèi)電子文獻資源的統(tǒng)一檢索。

        在所調(diào)查的高校圖書館、公共圖書館、醫(yī)院分別屬于3個不同的系統(tǒng),所以在模型圖中我們分別設(shè)立高校圖書館DC元數(shù)據(jù)中心、公共圖書館DC元數(shù)據(jù)中心、醫(yī)院DC元數(shù)據(jù)中心,通過OAI收割各個區(qū)域的元數(shù)據(jù)資源。所謂DC元數(shù)據(jù)中心,即采用DC元數(shù)據(jù)標(biāo)準(zhǔn)的元數(shù)據(jù)中心。3個分中心,分別對各系統(tǒng)內(nèi)各單位的各類電子文獻資源實施元數(shù)據(jù)收割,建立系統(tǒng)的元數(shù)據(jù)中心。

        31分布集中系統(tǒng)思想

        通過上面的分析,針對重慶地區(qū)種類多樣的電子文獻資源,本文提出了基于元數(shù)據(jù)的集中與分布相結(jié)合的區(qū)域電子文獻資源整合與共享模型,所謂集中與分布相結(jié)合,即元數(shù)據(jù)的集中存儲,對象數(shù)據(jù)的集中與分布存儲相結(jié)合。在資源整合過程中,數(shù)據(jù)有兩部分組成,即元數(shù)據(jù)和對象數(shù)據(jù)。元數(shù)據(jù)是描述對象數(shù)據(jù)的數(shù)據(jù),本模型中資源整合與共享的實現(xiàn)主要依靠元數(shù)據(jù),通過元數(shù)據(jù)揭示資源,為讀者提供檢索瀏覽的線索,最終定位對象數(shù)據(jù)。對象數(shù)據(jù)是知識的載體,如PDF格式的電子圖書、光盤鏡象文件、音視頻文件等,是我們整合的最終對象。在本模型中,對于元數(shù)據(jù)采取集中的存儲模式,不同類型數(shù)字資源的元數(shù)據(jù)經(jīng)過規(guī)范化處理,被分別存儲在相應(yīng)的元數(shù)據(jù)倉儲數(shù)據(jù)庫中。而針對對象數(shù)據(jù)的存儲,本模型采取分布與集中相結(jié)合的方式,即系統(tǒng)在整合資源時,對象數(shù)據(jù)仍保留在各院校的系統(tǒng)中,不會被抽取到中心。當(dāng)某些院校沒有能力存儲某資源時,可以將這些資源存儲到某資源中心,實現(xiàn)相對集中的存儲[1]。

        32整合流程

        在模型中,整合系統(tǒng)被分為了3層,第一層:重慶地區(qū)DC元數(shù)據(jù)中心。第二層:高校圖書館DC元數(shù)據(jù)中心、公共圖書館DC元數(shù)據(jù)中心、醫(yī)院DC元數(shù)據(jù)中心。第三層:每一個分中心下面的高校。所以系統(tǒng)運行的流程是:

        (1)高校DC元數(shù)據(jù)中心、公共圖書館DC元數(shù)據(jù)中心、醫(yī)院DC元數(shù)據(jù)中心分別將所屬的圖書館的元數(shù)據(jù)收割到分中心,形成分中心的元數(shù)據(jù)倉儲。

        3個分中心分別構(gòu)建自己的DC元數(shù)據(jù)倉儲(電子圖書DC元數(shù)據(jù)倉儲、電子期刊DC元數(shù)據(jù)倉儲、自建資源DC元數(shù)據(jù)倉儲等),然后對所屬的高校的元數(shù)據(jù)進行收割,將收割的元數(shù)據(jù)存儲到臨時元數(shù)據(jù)倉儲中。

        (2)元數(shù)據(jù)ETL(Extract-Transform-Load)

        ETL,即數(shù)據(jù)抽?。‥xtraction)、數(shù)據(jù)轉(zhuǎn)換(Transfonnation)、數(shù)據(jù)裝載(Loading)。ETL是數(shù)據(jù)倉庫體系結(jié)構(gòu)當(dāng)中的一個重要過程,也是數(shù)據(jù)倉庫建設(shè)過程中最復(fù)雜、費時的環(huán)節(jié),ETL開發(fā)通常會占整個數(shù)據(jù)倉庫項目時間的60%~80%,ETL是實現(xiàn)異構(gòu)資源集成的關(guān)鍵環(huán)節(jié)。

        數(shù)據(jù)抽?。簲?shù)據(jù)抽取是從異構(gòu)數(shù)據(jù)源中采集原始數(shù)據(jù),這些數(shù)據(jù)可以是元數(shù)據(jù)據(jù),也可以是對象數(shù)據(jù)。在本模型中只采集元數(shù)據(jù)資源,對象數(shù)據(jù)仍保留在各系統(tǒng)中。

        數(shù)據(jù)轉(zhuǎn)換:數(shù)據(jù)轉(zhuǎn)換包括數(shù)據(jù)的清洗和轉(zhuǎn)換兩部分功能。各系統(tǒng)中元數(shù)據(jù)的數(shù)據(jù)表現(xiàn)形式存在差異,所以必須消除這些差異,第一,數(shù)據(jù)標(biāo)準(zhǔn)化,數(shù)據(jù)的標(biāo)準(zhǔn)化主要表現(xiàn)在數(shù)據(jù)格式的規(guī)范化和數(shù)據(jù)表達方式的同一化。舉例說明:對于“語種”字段,不同的系統(tǒng)著錄方式是不一樣的,如中文、CN、CHN、China等,面對這些差異,必需制定中心元數(shù)據(jù)標(biāo)準(zhǔn),規(guī)定著錄方式,系統(tǒng)依據(jù)該標(biāo)準(zhǔn),對各個異構(gòu)的元數(shù)據(jù)進行標(biāo)準(zhǔn)化。第二,數(shù)據(jù)解析,由于各系統(tǒng)元數(shù)據(jù)字段所概括的內(nèi)容不一,某系統(tǒng)中其中一個元數(shù)據(jù)字段可能對應(yīng)別的系統(tǒng)中的兩個字段,數(shù)據(jù)存在不同的細節(jié)級別,稱之為粒度。粒度越高,所表示的綜合程度越高。在中心數(shù)據(jù)倉儲中的查詢涉及到不同的細節(jié),不同的數(shù)據(jù)圖1基于元數(shù)據(jù)的重慶地區(qū)電子文獻資源整合模型

        源對信息的描述可能具有不同的粒度,這使得對來自不同數(shù)據(jù)源的數(shù)據(jù)很難做相應(yīng)的比較。所以本模塊的任務(wù)就是消除各系統(tǒng)元數(shù)據(jù)粒度不一致的問題,對該拆分的字段進行拆分,該合并的字段進行合并。第三,數(shù)據(jù)增強,數(shù)據(jù)增強的任務(wù)是對原始數(shù)據(jù)進行補充,實現(xiàn)系統(tǒng)數(shù)據(jù)的完整性。數(shù)據(jù)中心所制定的元數(shù)據(jù)標(biāo)準(zhǔn)中,并非所有的系統(tǒng)都擁有標(biāo)準(zhǔn)中所擁有的元素或者修飾詞,這時候就要增加字段,使被整合的系統(tǒng)的元數(shù)據(jù)信息更加完整。第四,重復(fù)記錄歸并,在中心元數(shù)據(jù)倉儲中,每一條記錄都對應(yīng)一篇文獻,不允許重復(fù)記錄的存在,必須保證數(shù)據(jù)的惟一性。但從各系統(tǒng)抽取的元數(shù)據(jù),不可避免的存在重復(fù),所以記錄的去重與歸并成為必然。通過數(shù)據(jù)清洗,對各系統(tǒng)中采集的原始數(shù)據(jù)進行有效性檢查,對不規(guī)范、重復(fù)的記錄進行規(guī)范化處理,使采集的各系統(tǒng)的原始信息統(tǒng)一化,標(biāo)準(zhǔn)化,即完成元數(shù)據(jù)的標(biāo)準(zhǔn)化,將異構(gòu)的元數(shù)據(jù)轉(zhuǎn)換成為標(biāo)準(zhǔn)一致、著錄規(guī)范的元數(shù)據(jù),從而提高了數(shù)據(jù)的質(zhì)量[2]。

        數(shù)據(jù)裝載:在數(shù)據(jù)清洗完畢之后,即可以將清洗后的標(biāo)準(zhǔn)元數(shù)據(jù)加載到中心元數(shù)據(jù)倉儲中,數(shù)據(jù)裝載的功能是將采集、清洗、轉(zhuǎn)換過后的標(biāo)準(zhǔn)元數(shù)據(jù)加載到目標(biāo)數(shù)據(jù)倉庫中,該功能是對經(jīng)過清洗和轉(zhuǎn)換的數(shù)據(jù)進行匯總、保存,以達到數(shù)據(jù)級整合的目的[3]。

        (3)收割高校圖書館、公共圖書館、醫(yī)院三系統(tǒng)中心元數(shù)據(jù),形成重慶地區(qū)總的DC元數(shù)據(jù)倉儲。之所以會設(shè)立3個分中心,是三系統(tǒng)分別屬于不同的系統(tǒng),本系統(tǒng)內(nèi)實施起來更加容易,系統(tǒng)較易管理,也具有較強的擴展性。但系統(tǒng)最終的目的是實現(xiàn)重慶地區(qū)電子文獻資源共享,所以還要將3個分中心的元數(shù)據(jù)追加到重慶地區(qū)DC元數(shù)據(jù)倉儲中,建立重慶地區(qū)總的DC元數(shù)據(jù)倉儲[4]。

        (4)反向收割重慶地區(qū)DC元數(shù)據(jù)倉儲,高校圖書館、公共圖書館、醫(yī)院三系統(tǒng)中心元數(shù)據(jù)反向收割重慶地區(qū)DC元數(shù)據(jù)倉儲,三系統(tǒng)與中心系統(tǒng)實現(xiàn)元數(shù)據(jù)的同步,這樣做的好處,第一,元數(shù)據(jù)的安全性。第二,系統(tǒng)性能提升,各系統(tǒng)只需要對本系統(tǒng)的元數(shù)據(jù)中心進行訪問即可實現(xiàn)對資源的訪問。

        (5)通過OpenURL實現(xiàn)原文獲取。

        用戶通過對重慶DC元數(shù)據(jù)倉儲進行檢索,系統(tǒng)通過OpenURL建立原文的鏈接。OpenURL規(guī)定鏈接源不直接指向鏈接對象,而是由第三方鏈接服務(wù)器作為用戶與所需求資源之間的中介。鏈接服務(wù)器接收鏈接源傳送到的OpenURL,通過惟一的標(biāo)識符(如DOI)解析其內(nèi)容,建立對上下文對象的描述,以動態(tài)選擇合適的鏈接目標(biāo),從而使鏈接源和鏈接對象處于一個開放式互聯(lián)框架內(nèi),不同資源系統(tǒng)中各類資源,只要符合OpenURL框架,均可很方便地實現(xiàn)多種資源的鏈接[5]。

        4系統(tǒng)優(yōu)點

        本文提出的基于元數(shù)據(jù)的區(qū)域電子文獻資源整合模型,與基于數(shù)據(jù)倉庫,檢索代理的整合技術(shù)相比,具有如下的優(yōu)點:

        (1)檢索速度快?;跈z索代理的資源整合,其整合的數(shù)據(jù)資源非常有限,當(dāng)數(shù)據(jù)庫較多時,其檢索速度非常慢。與檢索代理技術(shù)相比,由于用戶是對實現(xiàn)了元數(shù)據(jù)的物理集中與規(guī)范的長株潭DC元數(shù)據(jù)倉儲進行檢索,所以速度非??靃6]。

        (2)系統(tǒng)中心存儲壓力小?;跀?shù)據(jù)倉庫技術(shù)的資源整合,在集成元數(shù)據(jù)的同時,還要集中各系統(tǒng)的對象數(shù)據(jù),這樣系統(tǒng)中心將面臨非常大的存儲壓力。本模型中,系統(tǒng)中心僅僅存儲元數(shù)據(jù)資源,對象數(shù)據(jù)仍保存在各館中,所以系統(tǒng)中心沒有存儲壓力。

        (3)系統(tǒng)管理容易,具有擴展性。在本模型中,我們在重慶DC元數(shù)據(jù)中心下面,分設(shè)了高校圖書館DC元數(shù)據(jù)中心、公共圖書館DC元數(shù)據(jù)中心、醫(yī)院DC元數(shù)據(jù)中心,實現(xiàn)了分層管理,不至于系統(tǒng)較大造成管理混亂。同時當(dāng)新的區(qū)域加入整合與共享建設(shè)中時,只需要對新增加的區(qū)域的元數(shù)據(jù)進行收割與清洗,然后追加到重慶DC元數(shù)據(jù)倉儲中去就可以了,系統(tǒng)具有較強的擴展性。

        (4)實現(xiàn)了元數(shù)據(jù)的物理集中與對象數(shù)據(jù)的分布管理。通過對各系統(tǒng)元數(shù)據(jù)的清洗、轉(zhuǎn)換,實現(xiàn)了各系統(tǒng)中元數(shù)據(jù)的一致,構(gòu)建了區(qū)域內(nèi)統(tǒng)一的元數(shù)據(jù)倉儲,從而實現(xiàn)區(qū)域內(nèi)各系統(tǒng)資源的整合。而對象數(shù)據(jù)仍保存在各館原來的系統(tǒng)之中,這樣在實現(xiàn)資源整合的同時,各館仍可獨立的開展各項服務(wù)。

        (5)可以在統(tǒng)一的規(guī)范的元數(shù)據(jù)倉儲的基礎(chǔ)上開展各項服務(wù)。可以以重慶元數(shù)據(jù)中心為核心,提供統(tǒng)一檢索、元數(shù)據(jù)的聯(lián)合編目、數(shù)據(jù)挖掘、數(shù)據(jù)分析等個性化服務(wù)。這是其它整合模型無法實現(xiàn)的。

        同時系統(tǒng)也有如下缺點:

        (1)由于涉及知識產(chǎn)權(quán)問題,元數(shù)據(jù)的獲取較為困難,對于中文數(shù)據(jù)庫,可以通過與數(shù)據(jù)商協(xié)商解決。對于外文數(shù)據(jù)庫,基本上無法獲取元數(shù)據(jù)。

        (2)由于各系統(tǒng)沒有遵循統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),在構(gòu)建統(tǒng)一元數(shù)據(jù)倉儲時,必須對元數(shù)據(jù)進行清洗,這是構(gòu)建統(tǒng)一元數(shù)據(jù)倉儲的關(guān)鍵。而對元數(shù)據(jù)清洗是非常不容易的。

        (3)系統(tǒng)中心必須對元數(shù)據(jù)倉儲進行維護,保證系統(tǒng)正常運行。

        5小結(jié)

        電子文獻資源整合及共享的目標(biāo)是提高文獻信息資源的可獲知能力和可獲得能力。構(gòu)筑重慶地區(qū)的電子文獻資源的整合與共享體系的根本目的,就是通過圖書館協(xié)作的規(guī)模效益來提高三地區(qū)開發(fā)和利用電子文獻信息資源的綜合能力,提高電子文獻資源的可獲知能力和可獲得能力[7]。

        參考文獻

        [1]張建中,陳松喬,方正.基于數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)的信息檢索體系[J].高校圖書館工作,2007,(5):1-3.

        [2]王愛麗.高校圖書館數(shù)字資源整合及其實現(xiàn)[J].江西圖書館學(xué)刊,2007,(4):26-28.

        [3]王穎霞.論數(shù)字圖書館的資源整合[J].現(xiàn)代圖書情報技術(shù),2004,(S1):106-107.

        [4]熊擁軍,歐鵬杰.圖書相關(guān)文獻資源發(fā)現(xiàn)與獲取系統(tǒng)構(gòu)建——基于預(yù)索引元數(shù)據(jù)倉儲[J].圖書情報知識,2011,(6):101-106.

        [3]陳良.高校圖書館數(shù)字資源整合分析[J].河北科技圖苑,2008,(1):81-83.

        [6]袁小一,張建中.檢索代理及其在資源整合中的應(yīng)用[J].圖書館論壇,2007,(5):31-33.

        [7]劉其云.基于數(shù)字信息資源整合的研究[J].現(xiàn)代情報,2008,(6):125-126.

        (本文責(zé)任編輯:馬卓)

        猜你喜歡
        整合高校圖書館醫(yī)院
        我不想去醫(yī)院
        兒童繪本(2018年10期)2018-07-04 16:39:12
        高校圖書館閱讀推廣案例分析
        科技視界(2016年21期)2016-10-17 19:32:37
        微信公眾平臺在高校圖書館信息服務(wù)中的應(yīng)用研究
        科技視界(2016年21期)2016-10-17 19:25:20
        記初中英語詞匯教學(xué)的一次歸類、整合改革及反思
        考試周刊(2016年76期)2016-10-09 08:23:04
        音樂與科學(xué)有效整合的研究
        成才之路(2016年26期)2016-10-08 11:39:33
        幼兒教育中美術(shù)與科學(xué)整合的研究
        成才之路(2016年25期)2016-10-08 10:33:44
        “1+1”微群閱讀
        高校圖書館閱讀推廣實踐探討
        科技視界(2016年20期)2016-09-29 13:17:57
        高校圖書館電子資源的宣傳與推廣
        科技視界(2016年20期)2016-09-29 11:22:45
        萌萌兔醫(yī)院
        激情视频在线观看免费播放| 国产丝袜无码一区二区三区视频| 亚洲欧洲巨乳清纯| 国产av久久久久精东av| 国产一区二区精品久久| 人妻丰满多毛熟妇免费区| 久久精品国产一区二区涩涩| 国产一区二区av免费观看| 久久精品aⅴ无码中文字字幕| 97精品久久久久中文字幕 | 精品少妇一区二区三区视频| 婷婷激情五月综合在线观看| 产精品无码久久_亚洲国产精| 中文字幕日本韩国精品免费观看| 久久亚洲中文字幕乱码| 亚洲成在人线av品善网好看| 99精品电影一区二区免费看| 亚洲24小时在线免费视频网站| 亚洲福利二区三区四区| 777米奇色狠狠俺去啦| 射精情感曰妓女色视频| 亚洲美女av一区二区| 中文有码人妻字幕在线| 亚洲一区二区三区香蕉| 色丁香久久| 国产精品国产三级国产专区51区| 久久伊人这里都是精品| 五月四房播播| 国产精品.xx视频.xxtv| 欧美在线a| 亚洲一区二区三区视频免费| 97丨九色丨国产人妻熟女| 9lporm自拍视频区| 亚洲va在线va天堂va四虎| 亚洲综合久久精品少妇av| 成人爽a毛片免费视频| 老太脱裤让老头玩ⅹxxxx| 色婷婷激情在线一区二区三区| 亚洲黄片av在线播放| 亚洲熟妇无码八av在线播放 | 精品亚洲第一区二区三区|