亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于元數(shù)據(jù)的高校機(jī)構(gòu)知識庫建設(shè)研究*——以北京科技大學(xué)機(jī)構(gòu)知識庫為例

        2012-03-14 07:09:02李國俊王瑜王李梅劉恩濤季淑娟邱小花張麗英
        關(guān)鍵詞:北京科技大學(xué)字段論文

        □李國俊 王瑜 王李梅 劉恩濤 季淑娟 邱小花 張麗英

        1 引言

        互聯(lián)網(wǎng)已經(jīng)成為科研人員信息交換的主要途徑之一?;趥鹘y(tǒng)出版模式的學(xué)術(shù)交流體系已經(jīng)不適應(yīng)科學(xué)家們獲取最新前沿信息的需求[1]。隨著開放獲取活動(dòng)的發(fā)展,開放獲取理念被越來越多的人所認(rèn)同,更多的科研人員愿意將他們的論文投向開放獲取期刊。同時(shí),技術(shù)的進(jìn)步也使得越來越多的科研人員傾向自我存取服務(wù),將他們的論文和科研數(shù)據(jù)保存在個(gè)人或?qū)I(yè)網(wǎng)站上[2]。傳統(tǒng)的學(xué)術(shù)信息交流模式正在發(fā)生改變,機(jī)構(gòu)知識庫就是在這樣的背景下產(chǎn)生的。

        隨著開放獲取活動(dòng)的深入發(fā)展,以及對長期保存迫切需求的推動(dòng)下,國外的機(jī)構(gòu)知識庫呈快速發(fā)展趨勢,據(jù)OpenDOAR的統(tǒng)計(jì)[3],截至2012年1月14日已有2149個(gè)機(jī)構(gòu)庫在其站點(diǎn)上進(jìn)行了注冊。國內(nèi)也 有 多 所 大 學(xué) 進(jìn) 行 了 機(jī) 構(gòu) 庫 建 設(shè)[4][5][6],但 是與2004年國內(nèi)對機(jī)構(gòu)庫的熱情相比,現(xiàn)在國內(nèi)高校對機(jī)構(gòu)庫的態(tài)度更為理性和現(xiàn)實(shí),有學(xué)者稱之為大陸機(jī)構(gòu)庫實(shí)踐的“冷現(xiàn)象”[7]。造成這種“冷現(xiàn)象”的原因是多方面的,包括版權(quán)、制度、機(jī)構(gòu)本身等等。但是總的來說,資源獲取與組織、可持續(xù)發(fā)展問題是困擾 目 前 機(jī) 構(gòu) 庫 建 設(shè) 的 兩 大 難 點(diǎn)[8][9][10][11]。 針 對上述問題,北京科技大學(xué)圖書館在建設(shè)機(jī)構(gòu)庫的過程中做出了一些有益的嘗試,供其他高校參考。

        2 機(jī)構(gòu)庫建設(shè)方案

        機(jī)構(gòu)庫建設(shè)的意義主要包括三個(gè)方面:長期保存本校學(xué)術(shù)研究成果,展示本校各機(jī)構(gòu)的研究實(shí)力,提高學(xué)術(shù)聲譽(yù)、促進(jìn)學(xué)術(shù)發(fā)展;減少因數(shù)據(jù)庫購買不足而導(dǎo)致部分全文本校師生無法查閱的問題,促進(jìn)學(xué)術(shù)交流;建立規(guī)范的題錄內(nèi)容和良好的組織架構(gòu),加強(qiáng)圖書館與學(xué)校人事、科技處等部門的合作,共享數(shù)據(jù),提高工作效率。

        Dspace是目前國內(nèi)外機(jī)構(gòu)庫建設(shè)中采用最多的系統(tǒng)平臺(tái),據(jù)Open DOAR統(tǒng)計(jì),截至2012年1月全世界的機(jī)構(gòu)庫中有38.9%的選擇了DSpace系統(tǒng)。DSpace能夠管理和描述各種數(shù)字資源,并長期保存開放源代碼系統(tǒng)。北京科技大學(xué)圖書館選用Dspace作為機(jī)構(gòu)庫建設(shè)的基礎(chǔ)軟件,機(jī)構(gòu)庫建設(shè)的流程如圖1所示。

        3 基于元數(shù)據(jù)的機(jī)構(gòu)庫建設(shè)實(shí)踐

        建設(shè)機(jī)構(gòu)知識庫的難點(diǎn)之一就是機(jī)構(gòu)庫的資源獲取。Crow[12]認(rèn)為機(jī)構(gòu)庫的資源可以包括以下類型:正式出版的期刊文獻(xiàn)、會(huì)議文獻(xiàn)、專著、學(xué)位論文、文獻(xiàn)的預(yù)印本、工作文檔、數(shù)據(jù)集、輔助研究材料、灰色文獻(xiàn)等。其中出版過的期刊文獻(xiàn)和會(huì)議文獻(xiàn)是最容易獲取的,這也是目前機(jī)構(gòu)庫中主要存儲(chǔ)的文獻(xiàn)類型。北京科技大學(xué)機(jī)構(gòu)庫的建設(shè)內(nèi)容主要也是以期刊文獻(xiàn)和會(huì)議文獻(xiàn)為主,本校的學(xué)位論文數(shù)據(jù)已經(jīng)存入TPI系統(tǒng)中,暫時(shí)不將這些數(shù)據(jù)導(dǎo)入到機(jī)構(gòu)庫中。

        圖1 機(jī)構(gòu)庫建設(shè)流程

        元數(shù)據(jù)是機(jī)構(gòu)庫建設(shè)的核心。DSpace采用都柏林(Dubin)核心元數(shù)據(jù)[13]來描述其管理的資源。都柏林核心元數(shù)據(jù)的元素集總共有15個(gè)元素,每個(gè)元素都不是必須的,并且可以重復(fù),可以以任何順序出現(xiàn),這樣就可以描述不同領(lǐng)域中的資源。都柏林核心元數(shù)據(jù)的可擴(kuò)展性和互操作性使其可以描述任何網(wǎng)絡(luò)資源,這也是DSpace采用此元數(shù)據(jù)標(biāo)準(zhǔn)的原因之一。

        機(jī)構(gòu)庫是長期存儲(chǔ)一個(gè)機(jī)構(gòu)各種資源的平臺(tái),各種資源既有不同的屬性和特點(diǎn),又有一些相同的屬性。如果使用一個(gè)統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)來管理這些資源,需要對這些資源的屬性進(jìn)行分析和歸類,取這些資源屬性的并集,然后根據(jù)這些并集屬性來設(shè)計(jì)機(jī)構(gòu)庫的元數(shù)據(jù)。同時(shí)為了今后機(jī)構(gòu)庫共享數(shù)據(jù),進(jìn)行互操作,在設(shè)計(jì)元數(shù)據(jù)時(shí)應(yīng)盡量按照都柏林15個(gè)基本元數(shù)據(jù)對屬性進(jìn)行歸類。

        3.1 元數(shù)據(jù)規(guī)范設(shè)計(jì)

        我們將Web of Science、EI和CNKI三個(gè)數(shù)據(jù)庫中提供的字段全部提取出來,然后取這些數(shù)據(jù)庫字段的并集。其中Web of Science和EI中的期刊論文和會(huì)議論文的字段不相同,CNKI中的期刊論文和會(huì)議論文的字段相同,將這三個(gè)數(shù)據(jù)庫的所有字段分別列出,如表1-表3所示。根據(jù)各種機(jī)構(gòu)不同的特點(diǎn)和要求可以選用其中的一些或者全部字段。

        北京科技大學(xué)機(jī)構(gòu)庫除了要滿足圖書館要求的字段外,還須兼顧校人事處和科研處對科研論文數(shù)據(jù)的需求,因?yàn)槊磕晷H耸绿幎夹枰獙處熯M(jìn)行考核,其中很重要的一條就是科研論文,而科研處也會(huì)每年對發(fā)表高質(zhì)量論文的教師進(jìn)行獎(jiǎng)勵(lì)。因此,他們對科研論文的數(shù)據(jù)有一定的要求。圖書館作為一個(gè)文獻(xiàn)信息組織與管理的機(jī)構(gòu),在文獻(xiàn)管理方面很有經(jīng)驗(yàn),能夠很好地完成這項(xiàng)工作。

        校人事處和科研處對第一作者、通訊作者、第一作者單位、國內(nèi)/國外、卷期的格式、發(fā)表年月的格式、頁碼的格式都有要求,這些要求不能直接通過數(shù)據(jù)庫的題錄數(shù)據(jù)得到,需要經(jīng)過程序的處理。此外,根據(jù)需要我們還額外加上了所屬學(xué)院和全文鏈接地址,所屬學(xué)院是根據(jù)作者地址中寫的單位名稱進(jìn)行匹配,全文鏈接地址是在文獻(xiàn)的DOI基礎(chǔ)之上利用DOI解析網(wǎng)站(http://dx.doi.org)拼接而成,這也在部分上彌補(bǔ)了部分全文不足的問題。為了利用NoteExpress插件和DSpace命令行進(jìn)行提交,我們需要將題錄數(shù)據(jù)轉(zhuǎn)成相應(yīng)的NE格式和DSpace要求的簡單存儲(chǔ)XML格式。在此之前,需要將NE模板字段、數(shù)據(jù)庫字段和DC元數(shù)據(jù)字段對應(yīng)起來,這是元數(shù)據(jù)規(guī)范設(shè)計(jì)的重點(diǎn),北京科技大學(xué)機(jī)構(gòu)庫元數(shù)據(jù)字段之間的對應(yīng)關(guān)系如圖2所示。我們在利用自編程序進(jìn)行數(shù)據(jù)轉(zhuǎn)換和導(dǎo)入時(shí)都要遵循這個(gè)規(guī)范。

        3.2 元數(shù)據(jù)采集

        元數(shù)據(jù)采集是機(jī)構(gòu)庫建設(shè)的重要一步。期刊論文和會(huì)議論文大都數(shù)被商業(yè)數(shù)據(jù)庫所收錄,北京科技大學(xué)師生發(fā)表的科研論文絕大部分能夠在Web of Science、EI和CNKI中檢索到。我們從上述三個(gè)數(shù)據(jù)庫中檢索作者單位為北京科技大學(xué)的科研論文,時(shí)間從2005年到2010年。由于建立了學(xué)院、資源類型和年份三級樹狀組織結(jié)構(gòu),同時(shí)為了更好地管理,我們分別按照數(shù)據(jù)庫和年份從各個(gè)數(shù)據(jù)庫下載全記錄的題錄數(shù)據(jù),以文本文件形式保存。目前已經(jīng)采集的外文數(shù)據(jù)將近1萬5千條。

        由于圖書館的人力有限,自動(dòng)采集一直是機(jī)構(gòu)庫建設(shè)努力的目標(biāo)。有的高校利用NoteExpress文獻(xiàn)管理軟件進(jìn)行自動(dòng)采集[4],這樣做存在兩個(gè)問題:一個(gè)是NoteExpress在采集外文數(shù)據(jù)時(shí)存在很多問題,我們根本就不能使用NoteExpress來采集外文數(shù)據(jù);另一個(gè)方面是NE采集的字段無法轉(zhuǎn)換為機(jī)構(gòu)庫所要求的格式,滿足不了人事處和科研處等單位對數(shù)據(jù)庫字段的其他要求?;诖?,我們放棄利用NE來進(jìn)行自動(dòng)采集,轉(zhuǎn)用其他的方式,如圖3所示。

        表1 Web of Science的字段標(biāo)識[14]

        表2 EI字段標(biāo)識[15]

        字段 中文 字段 中文Source title 期刊名 Monograph title 專著標(biāo)題Abbreviated source title 期刊名縮寫 Publisher 出版商Volume 卷 Abstract 摘要Issue 期 Number of references 參考文獻(xiàn)數(shù)量Issue date 出版日期 Main heading 主題詞Publication year 出版年 Controlled terms 受控主題詞Pages 頁碼 Uncontrolled terms 非受控主題詞Language 語言 Classification code 分類代碼ISSN 國際標(biāo)準(zhǔn)刊號 DOI 數(shù)字標(biāo)識符CODEN 期刊代碼 Treatment 主題類型Document type 文獻(xiàn)類型 Database 數(shù)據(jù)庫

        表3 CNKI數(shù)據(jù)庫的字段標(biāo)識[16]

        由于各個(gè)數(shù)據(jù)庫提供批量下載題錄數(shù)據(jù)的功能,我們首先人工批量從各個(gè)數(shù)據(jù)庫下載題錄數(shù)據(jù),然后利用自編程序根據(jù)設(shè)計(jì)好的元數(shù)據(jù)規(guī)范將這些元數(shù)據(jù)轉(zhuǎn)為NE格式和相應(yīng)的XML格式,最后導(dǎo)入到DSpace系統(tǒng)中。雖然我們是人工批量獲取,但是我們所花費(fèi)的時(shí)間與NE自動(dòng)獲取的時(shí)間差不多,而且這樣獲取的數(shù)據(jù)質(zhì)量更有保障。Web of Science一次可以下載500條記錄,EI一次可以下載400條記錄,CNKI一次可以下載50條記錄數(shù)據(jù)。

        3.3 元數(shù)據(jù)提交

        本系統(tǒng)提供三種方式將元數(shù)據(jù)導(dǎo)入到DSpace機(jī)構(gòu)庫中:

        (1)通過網(wǎng)站后臺(tái)(命令行)批量提交[17]

        DSpace本身提供批量導(dǎo)入的API,批量導(dǎo)入的命令格式為:/dspace/bin dsrun org.dspace.a(chǎn)pp.itemimport.ItemImport-a-e irp@ustb.edu.cnc 123456789/928 -s D:/data_dspace/1100 -m output.txt

        在利用這種方式導(dǎo)入之前需要將題錄數(shù)據(jù)轉(zhuǎn)為DSpace要求的簡單存儲(chǔ)XML格式。

        DSpace簡單存儲(chǔ)XML格式也可以通過API導(dǎo)出命令得到,導(dǎo)出的命令格式為:

        dsrun org.dspace.a(chǎn)pp.itemexport.Item Export–t ITEM –i 123456789/1054–d d:/dspace/exports–n 10

        該命令只導(dǎo)出一條記錄,如須將整個(gè)專題全部導(dǎo)出,需要用COLLECTION替換ITEM,并更換-i參數(shù)后專題ID。上述的導(dǎo)入和導(dǎo)出命令的具體參數(shù)可以參考DSpace相關(guān)的系統(tǒng)文檔。

        (2)利用NE插件進(jìn)行提交

        NE插件將命令行方式以一種可視化的方式顯示出來,以一種簡單友好界面的形式進(jìn)行提交,并反饋每條記錄提交的結(jié)果。

        (3)通過網(wǎng)站頁面單篇提交

        前面兩種方式主要是管理員進(jìn)行操作,網(wǎng)站提交方式是為了方便作者自行提交,然后由管理員進(jìn)行審核,這種方式一次只能提交一篇,是對批量提交方式的補(bǔ)充。

        4 機(jī)構(gòu)庫的可持續(xù)發(fā)展

        機(jī)構(gòu)庫的可持續(xù)發(fā)展問題是目前機(jī)構(gòu)庫建設(shè)面臨的又一問題。很多機(jī)構(gòu)庫由于缺乏資金、人力和制度的保障,機(jī)構(gòu)庫的數(shù)據(jù)往往不能常年更新。北京科技大學(xué)圖書館積極探索,從提供統(tǒng)計(jì)報(bào)告服務(wù)和合作兩個(gè)方面來保證機(jī)構(gòu)庫的可持續(xù)發(fā)展。

        圖2 數(shù)據(jù)庫字段、NE模板和DC元數(shù)據(jù)的對應(yīng)關(guān)系

        圖3 元數(shù)據(jù)采集的流程圖

        4.1 提供機(jī)構(gòu)論文的統(tǒng)計(jì)報(bào)告

        機(jī)構(gòu)庫的目的之一就是長期保存本機(jī)構(gòu)的科研論文,展示機(jī)構(gòu)各部門的研究成果。北京科技大學(xué)圖書館計(jì)劃利用機(jī)構(gòu)庫的數(shù)據(jù),分析統(tǒng)計(jì)出整個(gè)學(xué)校的科研論文狀況,為學(xué)校的相關(guān)部門提供參考。目前我們正在統(tǒng)計(jì)2010年的數(shù)據(jù),統(tǒng)計(jì)報(bào)告主要包括學(xué)校和二級單位被SCIE、SSCI、CPCI-S、EI、CNKI、CSSCI等數(shù)據(jù)庫收錄的論文數(shù)量,作者發(fā)文量排行榜,期刊分析,學(xué)科主題分析,基金分析,合作分析等等。

        4.2 為??蒲刑幒腿耸绿幪峁?shù)據(jù)

        北京科技大學(xué)圖書館每年都需向校人事處和科研處提供本校教師所發(fā)表的科研論文數(shù)據(jù),主要用于教師的考核、職稱評定和獎(jiǎng)勵(lì)。圖書館每年在提供數(shù)據(jù)的同時(shí),也把這些數(shù)據(jù)導(dǎo)入到機(jī)構(gòu)庫中,保證機(jī)構(gòu)庫數(shù)據(jù)的常年更新。

        由于各個(gè)文獻(xiàn)數(shù)據(jù)庫在收錄文獻(xiàn)時(shí)會(huì)存在一定的錯(cuò)誤記錄,一部分原因是數(shù)據(jù)庫商標(biāo)注錯(cuò)誤,另一部分原因是作者在投稿時(shí)寫錯(cuò)。比如有些文獻(xiàn)的標(biāo)題與紙質(zhì)刊上的標(biāo)題不同,有些作者使用不規(guī)范的校名,還有些作者將郵編寫錯(cuò)或者不寫郵編等等,這些錯(cuò)誤會(huì)造成漏檢的情況??蒲刑幵讵?jiǎng)勵(lì)論文前會(huì)向全校教師公示,并要求教師認(rèn)領(lǐng),漏檢論文的教師須向科研處提交數(shù)據(jù)。教師認(rèn)領(lǐng)完并審核后會(huì)將正確的數(shù)據(jù)反饋給圖書館,圖書館再將漏檢的數(shù)據(jù)添加到機(jī)構(gòu)庫中,將利用程序?qū)Χ墕挝粴w類錯(cuò)誤的數(shù)據(jù)進(jìn)行更新,保證機(jī)構(gòu)庫數(shù)據(jù)的質(zhì)量。

        5 結(jié)語

        北京科技大學(xué)圖書館在機(jī)構(gòu)庫建設(shè)中積極探索新的途徑和方法,在資源獲取與組織方面和可持續(xù)發(fā)展方面有了比較滿意的解決方案,但是對于困擾機(jī)構(gòu)庫建設(shè)的版權(quán)問題、政策支持問題等還沒有很好的解決辦法。這也是國內(nèi)機(jī)構(gòu)庫面臨的共同問題。

        此外,DSpace系統(tǒng)本身還存在很多問題,如不支持元數(shù)據(jù)在不同的主題集合間的管理與移動(dòng),使用方面也不太符合用戶的習(xí)慣等等,這也是需要我們進(jìn)一步改進(jìn)的地方。

        1 Vishala BK,Bhandi MK.Building institutional repository(IR):Role of the library.In:the 5th International CALIBER-2007.Chandigarh:Panjab University,2007:631-640

        2 Lynch CA.Institutional repositories:Essential infrastructure for scholarship in the digital age.[2011-11-15].http://www.a(chǎn)rl.org/resources/pubs/br/br226/br226ir.shtml

        3 The directory of open access repositories—Open DOAR.[2012-01-14].http://www.opendoar.org/

        4 鄒榮等.基于DSpace構(gòu)建科研論文管理系統(tǒng).現(xiàn)代圖書情報(bào)技術(shù),2009(10):90-94

        5 史艷芬,劉玉紅.高校機(jī)構(gòu)庫可行性方案研究——以同濟(jì)大學(xué)為例.圖書館雜志,2010,29(9):47-50,41

        6 張靜等.大學(xué)機(jī)構(gòu)庫構(gòu)建過程中的關(guān)鍵問題研究——以西安交通大學(xué)機(jī)構(gòu)庫為例.現(xiàn)代情報(bào),2011,31(6):138-140,147

        7 張巧娜.我國大陸機(jī)構(gòu)庫實(shí)踐的“冷現(xiàn)象”研究.大學(xué)圖書館學(xué)報(bào),2010(6):48-51

        8 郭少友.機(jī)構(gòu)庫建設(shè)的若干問題研究.中國圖書館學(xué)報(bào),2006,32(1):77-80

        9 李曉輝.機(jī)構(gòu)庫愿景實(shí)現(xiàn)過程中面臨的若干問題述評.圖書館建設(shè),2010(4):2-5

        10 Little G.Solutions in search of problems?The challenges and opportunities of institutional repositories.The Journal of Academic Librarianship,2012,1,in press:1-3

        11 Li Y.Institutional repositories and digital preservation:Accessing current practices at research libraries.D-Lib Magazin,2011,17(5-6).[2011-11-15].http://www.dlib.org/dlib/may11/yuanli/05yuanli.html

        12 Crow R.The case for institutional repositories:A SPARC position paper.[2011-11-20].http://www.a(chǎn)rl.org/sparc/repositories/readings.shtml

        13 申曉娟等.GB/T 25100-2010,信息與文獻(xiàn)——都柏林核心元數(shù)據(jù)元素集.北京:中國標(biāo)準(zhǔn)出版社,2010

        14 Web of Science的字段標(biāo)識.[2011-11-8].http://images.webofknowledge.com/WOKRS54B7/help/WOS/hs_wos_fieldtags.html

        15 EI字段標(biāo)識.[2011-11-8].http://www.engineeringvillage.org

        16 CNKI字 段 標(biāo) 識.[2011-11-8].http://epub.cnki.net/grid2008/index/ZKCALD.htm

        17 DSpace系統(tǒng)文檔.[2011-06-09].https://wiki.duraspace.org/display/DSPACE/DSpaceResources

        猜你喜歡
        北京科技大學(xué)字段論文
        《北京科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)》
        理論縱橫(2024年1期)2024-01-11 07:56:12
        《北京科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)》
        理論縱橫(2022年6期)2022-12-06 04:27:50
        圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
        《北京科技大學(xué)學(xué)報(bào)》(社會(huì)科學(xué)版)
        理論縱橫(2022年1期)2022-02-16 07:26:06
        田永訴北京科技大學(xué)拒絕頒發(fā)畢業(yè)證、學(xué)位證案
        下期論文摘要預(yù)登
        下期論文摘要預(yù)登
        下期論文摘要預(yù)登
        CNMARC304字段和314字段責(zé)任附注方式解析
        無正題名文獻(xiàn)著錄方法評述
        青青草高中生在线视频| 欧美狠狠入鲁的视频777色| 成人无码av一区二区| 丰满少妇大力进入av亚洲| 激情97综合亚洲色婷婷五| 亚洲熟女av中文字幕网站| 国产少妇一区二区三区| 久久精品国产黄片一区| 脱了老师内裤猛烈进入| 亚洲一区二区三区四区五区六| 亚洲狠狠婷婷综合久久| 黄色网址国产| 国产av色| 亚洲人妖女同在线播放| 色男色女午夜福利影院| 蜜臀av一区二区三区免费观看 | 久久精品国产亚洲av蜜点| 又大又紧又粉嫩18p少妇| 香蕉视频一级| 国产成人久久精品激情91| 亚洲av天堂一区二区| 国产精品久久久亚洲| 日韩人妻无码精品久久| 日韩中文网| 国产丝袜在线福利观看| 久久伊人亚洲精品视频| 男人的天堂av高清在线| 中文人妻熟妇乱又伦精品| 真人与拘做受免费视频| 亚洲女同成av人片在线观看| 蜜桃在线一区二区三区| 99久久国产免费观看精品| 久久夜色精品国产亚洲av动态图| 久久水蜜桃亚洲av无码精品麻豆 | 国产精品无圣光一区二区| 污污污污污污污网站污| 久久久国产不卡一区二区| 日韩五码一区二区三区地址| 免费在线黄色电影| 台湾无码av一区二区三区| 日本加勒比东京热日韩|