亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)部署及維護的策略

        2015-11-26 08:03:11邱萍周琴
        山東圖書館學刊 2015年6期
        關鍵詞:西安交通大學編目書目

        邱萍周琴

        (西安交通大學圖書館,陜西西安710049)

        OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)部署及維護的策略

        邱萍周琴

        (西安交通大學圖書館,陜西西安710049)

        OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)成功部署,必須具備優(yōu)良的書目數(shù)據(jù)及準確的數(shù)據(jù)映射。維護需根據(jù)記錄類型選擇不同的上載策略,在上載目錄的劃分,記錄唯一識別符及刪除策略的選擇上也要結合本館的工作方式作出明確的規(guī)定。

        發(fā)現(xiàn)系統(tǒng) OPAC數(shù)據(jù) 數(shù)據(jù)部署

        1 引言

        自PROQUEST公司旗下的Serial solution于2009年7月推出了首款發(fā)現(xiàn)系統(tǒng)Summon[1],這一新的信息發(fā)現(xiàn)工具立即引起了全球圖書館、信息集成商、內(nèi)容提供商的廣泛關注。繼Summon之后,Exlibris公司的Primo、Ebsco公司的EDS、OCLC的Worldcat Local等發(fā)現(xiàn)系統(tǒng)的產(chǎn)品也相繼出現(xiàn)。在國內(nèi)高校圖書館如清華大學圖書館、北京大學圖書館、西安交通大學圖書館等首批引進發(fā)現(xiàn)系統(tǒng)并取得良好效果后,更多國內(nèi)圖書館開始調研、試用并引進發(fā)現(xiàn)系統(tǒng)。

        從某種意義上說,發(fā)現(xiàn)系統(tǒng)是一個學術搜索引擎,是擁有海量學術信息(包括圖書館引進的紙質資源、數(shù)據(jù)庫資源、以及網(wǎng)絡免費學術資源)的元數(shù)據(jù)倉儲。元數(shù)據(jù)質量不僅關系到發(fā)現(xiàn)內(nèi)容的質量,還關系到針對海量元數(shù)據(jù)倉儲進行數(shù)據(jù)挖掘的效果[2]。OPAC數(shù)據(jù),作為圖書館的自生元數(shù)據(jù),是發(fā)現(xiàn)系統(tǒng)元數(shù)據(jù)倉儲中非常重要的部分,其在發(fā)現(xiàn)系統(tǒng)的部署及維護,也是圖書館參與度與可控性最高的部分,因此成為各圖書館發(fā)現(xiàn)系統(tǒng)調研的關注點。

        本文以西安交通大學圖書館的實踐為例,從數(shù)據(jù)準備、數(shù)據(jù)映射、數(shù)據(jù)上載等方面,探討OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)部署及維護的策略,以期為同行順利地引進與運行發(fā)現(xiàn)系統(tǒng)提供一些參考。

        2 發(fā)現(xiàn)系統(tǒng)OPAC數(shù)據(jù)部署的策略

        發(fā)現(xiàn)系統(tǒng)OPAC數(shù)據(jù)部署的目標是全面、準確地將本館OPAC中的書目記錄整合到發(fā)現(xiàn)系統(tǒng)的元數(shù)據(jù)倉儲中,主要包括數(shù)據(jù)準備、數(shù)據(jù)映射兩項內(nèi)容。

        2.1 數(shù)據(jù)準備工作

        國內(nèi)高校圖書館管理系統(tǒng)已經(jīng)歷了20多年的發(fā)展歷史,多校合并帶來的書目數(shù)據(jù)整合、回溯建庫、編目外包等都對OPAC數(shù)據(jù)庫的質量造成了影響,數(shù)據(jù)冗余以及書目質量良莠不齊是普遍存在的問題。為保證發(fā)現(xiàn)的效果,OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)資源部署之前,必須改善質量。

        高校圖書館的OPAC系統(tǒng)經(jīng)過多年建設,已形成資源類型豐富,記錄數(shù)量龐大的書目體系。以西安交通大學圖書館為例,截止2011年6月圖書館OPAC數(shù)據(jù)庫的書目總量為86萬余條,其中包含紙本圖書、紙本期刊、光盤、磁帶、學位論文、電子圖書、電子期刊記錄……等。清除數(shù)據(jù)冗余,改善書目質量,是非常繁雜瑣碎的工作。鑒于此,西安交通大學圖書館制定了分塊、分步的數(shù)據(jù)整理方針。根據(jù)館藏建設階段,OPAC系統(tǒng)的書目記錄被分為三塊:基本對應回溯建庫階段、合校整合階段、新書建設階段,整理按照規(guī)范類型標注,剔除垃圾數(shù)據(jù),修改錯誤記錄3個步驟依次進行。

        2.1.1 規(guī)范類型標注

        書目記錄的類型標注反映書目的文獻類型,是OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)中文獻類型的映射源。一個完善的書目系統(tǒng),必須對類型標注做明確的規(guī)定,并保證其應用的準確。表1為西安交通大學圖書館OPAC書目的類型標注。

        表1 文獻類型MARC頭標對應表

        類型標注信息出現(xiàn)在書目記錄頭標中,對應頭標區(qū)的書目級別代碼和記錄類型代碼(leader06-07),是在建立書目記錄時生成的。目前圖書館廣泛利用外部數(shù)據(jù)源的書目,不同書目系統(tǒng)的類型標注不禁相同,若不加修改的直接利用,將造成OPAC系統(tǒng)中類型標注體系的混亂。由于類型標注是不易識別的代碼形式,很容易在編目及維護過程中被忽視,因此OPAC書目系統(tǒng)中類型標注的錯誤比較普遍。例如:CALIS規(guī)定書目級別s=連續(xù)出版物,包括現(xiàn)刊……專著叢編等[3],而西安交通大學圖書館編目細則規(guī)定專著叢編按照專著單獨著錄,因此從CALIS套中的專著叢編必須把類型標注leader06-07由as改為am,否則將與期刊混淆不清。再如:從OhioLINK(The Ohio Library and Information Network,俄亥俄圖書館與信息網(wǎng)絡)套中的電子圖書leader06-07=am,而本館規(guī)定leader06-07=an,因此進入本館系統(tǒng)也需要修改。

        需要指出的是,類型標注不僅反映文獻類型,也是書目記錄完整性與準確性的考量依據(jù),它為進一步的書目整理提供依據(jù)。

        2.1.2 剔除垃圾數(shù)據(jù)

        OPAC數(shù)據(jù)庫冗余數(shù)據(jù)的產(chǎn)生有多種原因。在回溯建庫及多校合并階段主要的原因有:卡片目錄及圖書的信息缺失,錄入的錯誤、合并書目不完全……等,造成的結果是重復書目記錄、孤單書目記錄……等。而新書建設階段由于工作方法的問題,也會產(chǎn)生冗余數(shù)據(jù),例如:西安交通大學圖書館訂購記錄遴選工作在OPAC系統(tǒng)內(nèi)進行,未選中書目應及時刪除,但實際操作中,刪除工作經(jīng)常被遺忘,未選中書目長期滯留,給OPAC數(shù)據(jù)庫造成了嚴重的冗余。

        無關聯(lián)記錄的孤單書目記錄,在確定不屬于本館館藏外必須予以剔除。西安交通大學圖書館OPAC系統(tǒng)各類型記錄(書目記錄、訂購記錄、記到記錄、館藏記錄……)具有關聯(lián)性,如:圖書書目記錄的關聯(lián)記錄有館藏記錄和訂購記錄,期刊書目記錄的關聯(lián)記錄有記到記錄和館藏記錄。因此垃圾數(shù)據(jù)的確定可通過文獻類型結合記錄關聯(lián)性來實現(xiàn)。圖1為垃圾圖書記錄的確定條件,同法可以確定期刊、學位論文……等類型文獻的垃圾數(shù)據(jù),進而剔除冗余。重復書目記錄的情況由于數(shù)量少且難于發(fā)現(xiàn),不作為數(shù)據(jù)準備的重點。

        圖1 OPAC垃圾圖書書目的確定條件

        2.1.3 修改錯誤記錄

        OPAC數(shù)據(jù)庫在新書建設階段,編目規(guī)范化程度較高,編目員普遍接受過權威編目機構(CALIS、中國國家圖書館等)的培訓,實際工作有《CALIS聯(lián)機合作編目手冊》及《中國機讀目錄格式使用手冊》等工具書做指導,書目質量得到根本保證,但回溯階段及多校合并階段的書目數(shù)據(jù)則質量不佳,字段使用的錯誤及著錄的錯誤較多。

        MARC格式作為標準的機讀目錄格式,具有結構嚴謹、字段豐富的特點,MARC記錄的錯誤也是復雜多樣的,因此對OPAC數(shù)據(jù)進行徹底的修改難度很大。發(fā)現(xiàn)系統(tǒng)類似搜索引擎,為用戶提供學術資源檢索,并可按時間、類型、主題、學科、作者……等維度對檢索結果進行聚類顯示,對于元數(shù)據(jù)中檢索字段及索引字段的要求相對更高。因此修改錯誤記錄主要應針對檢索及索引字段,包括題名、責任者、ISBN,出版發(fā)行等字段。修改采用批量方式,針對普遍問題,包括易錯字段,如210$c;及對著錄內(nèi)容有明確規(guī)定的字段,如010$a、210$d;以及錯字符、亂字符等問題。

        西安交通大學圖書館數(shù)據(jù)準備耗時6個月,共刪除垃圾數(shù)據(jù)6萬余條,修改記錄10余萬條。為OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)的部署打下了良好的數(shù)據(jù)基礎。

        2.2 數(shù)據(jù)映射工作

        OPAC數(shù)據(jù)必須通過映射轉換成發(fā)現(xiàn)系統(tǒng)的數(shù)據(jù)字段,映射的精準直接影響發(fā)現(xiàn)的效果。

        為簡化數(shù)據(jù)映射工作,發(fā)現(xiàn)系統(tǒng)平臺商會為圖書館提供基礎映射表,其中包含Introduction,Content Type Mapping(文獻類型映射),MARC Mapping (MARC映射),Location List(館藏地)等表單,Content type mapping針對的是文獻類型的映射,主要對應MARC記錄頭標區(qū),如圖(2)。MARC Mapping (MARC映射)是針對MARC格式字段的映射,基本對應MARC記錄數(shù)據(jù)區(qū),如圖(3)。

        圖2 Content Type Mapping

        圖3 MARC Mapping

        基礎映射表單含蓋了發(fā)現(xiàn)系統(tǒng)全部數(shù)據(jù)字段與OPAC數(shù)據(jù)的映射關系,為圖書館OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)的映射提供了便利。需要指出的是,鑒于各館對MARC格式字段使用的個性化規(guī)定,基礎映射表必須經(jīng)過逐項分析、調整、映射測試后才能正式利用,否則可能出現(xiàn)映射錯誤或丟失數(shù)據(jù)的情況。西安交通大學圖書館在利用基礎映射表做測試的過程中,曾出現(xiàn)主要責任者項映射丟失的情況,原因在于本館編目細則規(guī)定使用CNMARC的700 $a子字段著錄主要責任者,而映射表中主要責任者對映的卻是701$a子字段,由于錯誤的映射關系,主要責任者未能映射成功。

        3 發(fā)現(xiàn)系統(tǒng)OPAC數(shù)據(jù)維護的策略

        發(fā)現(xiàn)系統(tǒng)與OPAC的數(shù)據(jù)整合并不是一勞永逸的。部署完成后,圖書館還須制定持續(xù)維護的政策保證發(fā)現(xiàn)系統(tǒng)與OPAC數(shù)據(jù)的同步,維護針對的是新增、刪除、更新的記錄,圖書館應按需設置上載目錄,確定書目唯一識別符及刪除策略,并根據(jù)記錄類型制定上載策略。

        3.1 按需設置上載目錄

        將OPAC系統(tǒng)中的哪些數(shù)據(jù)整合到發(fā)現(xiàn)系統(tǒng),各圖書館有不同的考量。清華大學將中西文紙本資源,多媒體光盤、電子期刊、電子圖書、學位論文等數(shù)據(jù)配置到發(fā)現(xiàn)系統(tǒng)中[4]。而華中科技大學圖書館、北京工商大學圖書館等只將傳統(tǒng)文獻資源數(shù)據(jù)整合到發(fā)現(xiàn)系統(tǒng)。

        鑒于國內(nèi)圖書館普遍采用2種MARC格式編制中外文文獻書目,發(fā)現(xiàn)系統(tǒng)平臺商會提供2個基礎上載目錄,分別對應CNMARC及USMARC格式的記錄。對于提交多類型文獻記錄的圖書館,僅有2個基礎目錄將會導致大而全的映射,容易造成邏輯的混亂從而影響映射效果,同時也不利于圖書館監(jiān)視OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)的整合結果。基于以上考慮,建議提交多類型文獻的圖書館,按需求設置上載目錄的個數(shù)。如西安交通大學圖書館規(guī)定將OPAC中的傳統(tǒng)文獻(中西文紙本書刊,磁帶、光盤等)、電子期刊、電子圖書、學位論文數(shù)據(jù)整合到發(fā)現(xiàn)系統(tǒng),因此設置了5個上載目錄,分別對應CNMARC傳統(tǒng)文獻、USMARC傳統(tǒng)文獻,電子期刊、電子書、學位論文數(shù)據(jù)。

        3.2 書目唯一識別符的確定及刪除策略的選擇

        唯一識別符(Unique identifier)的作用是匹配維護記錄以及指引發(fā)現(xiàn)系統(tǒng)創(chuàng)建超鏈接到達OPAC相關記錄。書目中具有唯一性的字段,如索書號,控制號,書目記錄號等都可作為唯一識別符。但索書號、控制號是人為生成的字段,容易在編目過程中被錯誤更改,導致失敗或錯誤的匹配。而書目記錄號是系統(tǒng)生成的,穩(wěn)定性高,因此建議選擇書目記錄號作為唯一識別符。

        為保證數(shù)據(jù)同步,OPAC系統(tǒng)中的刪除記錄也需同時在發(fā)現(xiàn)系統(tǒng)中刪除。刪除記錄的上載有幾種策略,策略一:在書目記錄中標記刪除信息[如將記錄頭標的記錄狀態(tài)符改為d(被刪除的記錄)],作為更新記錄統(tǒng)一上載update目錄中。策略二:刪除記錄單獨形成文件,上載delete目錄,記錄會從發(fā)現(xiàn)系統(tǒng)刪除并不會檢查標識字段的意義。策略三:只輸出刪除記錄的唯一標示符,形成.txt,.keys,或.xm文件。

        刪除策略如何選擇應根據(jù)OPAC系統(tǒng)處理刪除記錄的方式而定。如圖書館編目管理要求:刪除記錄必須先標記為刪除狀態(tài),再由專人刪除,則可選取策略一,同時需要保證上載發(fā)現(xiàn)系統(tǒng)先于OPAC刪除。選擇策略二的前提是,圖書館批量備份全部刪除記錄,該策略也適用采用批量方法更新維護的電子資源書目記錄。如果圖書館管理系統(tǒng)能夠提供批量刪除書目記錄報表,策略三也將是很好的選擇。

        3.3 不同類型的數(shù)據(jù)制定不同的上載策略

        OPAC中不同類型文獻的書目記錄,編制周期及維護方式具有差異。因此在發(fā)現(xiàn)系統(tǒng)中維護方式也不應一概而論,而需要綜合考慮數(shù)據(jù)的同步性以及維護的必要性。

        西安交通大學圖書館,根據(jù)書目編制周期及維護方式的不同,將需上載的書目記錄分為3大類:傳統(tǒng)文獻書目、電子資源書目、特色館藏書目,并對其制定了不同的上載策略(見表2)。傳統(tǒng)文獻包括中、西、日、俄不同語種的圖書、期刊、資料等。傳統(tǒng)文獻在OPAC系統(tǒng)中采用持續(xù)編目、持續(xù)維護的方式,具有記錄穩(wěn)定,更新速度快,數(shù)量龐大的特點,因此上載采用定期批量策略,每周抓取上載一次。OPAC中電子資源的編目及維護根據(jù)數(shù)據(jù)庫的引進和更新不定期進行,因此電子資源記錄的抓取上載應按照維護頻次不定期進行。學位論文的編目是當年完成上一年度論文的編目,因此抓取和上載應以年為單位。若圖書館管理系統(tǒng)的開放性較好,發(fā)現(xiàn)系統(tǒng)也可通過API接口實現(xiàn)OPAC更新數(shù)據(jù)的自動抓取上載,這樣更加有利于發(fā)現(xiàn)系統(tǒng)與OPAC系統(tǒng)的數(shù)據(jù)同步。

        表2 各類型書目的提交策略

        4 結語

        在發(fā)現(xiàn)系統(tǒng)元數(shù)據(jù)倉儲的建設中,OPAC數(shù)據(jù)的部署及維護是圖書館參與度最高,可控性最強的工作。因此圖書館要認真制定OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)部署及維護的政策。部署中要做好數(shù)據(jù)準備工作,確保元數(shù)據(jù)的質量,同時逐項審視并修訂OPAC數(shù)據(jù)與發(fā)現(xiàn)系統(tǒng)元數(shù)據(jù)的映射關系,保證映射的準確。維護過程則要結合本館實際,制定不同資源的上載策略,確定書目唯一識別符及書目刪除的策略,同時盡量簡化映射層次,保證映射的效果。

        〔1〕The Summon Service[EB/OL].[2013-05-03].http://www.proquest.com/products-services/The-Summon-Service.html

        〔2〕竇天芳,姜愛蓉.資源發(fā)現(xiàn)系統(tǒng)功能分析及應用前景[J].圖書情報工作,2012(7):38-43

        〔3〕謝琴芳.CALIS聯(lián)機合作編目手冊(上)[M].北京:北京大學出版社,2000:67

        〔4〕竇天芳,等.清華大學學術資源發(fā)現(xiàn)平臺的建設及思考—以“水木搜索”為例[J].圖書館雜志,2013(12):71-75

        Strategies of Deploying and Maintaining OPAC Data in Discovery System

        Qing Ping Zhou Qin

        Excellent bibliographic data and accurate data mapping are the premise that OPAC data can be successfully deployed into Discovery System.Data maintenance needs to choose different upload strategies depending on data record types.Upload directory partition,unique identifier recording and deletion strategy selection should be clearly defined in conjunction with library’s work.

        Discovery system;OPAC data;Data deployment

        G254.3

        A

        邱萍(1974~),女,碩士,副研究館員,西安交通大學采編部副主任,目前從事電子資源整合工作,發(fā)表論文數(shù)篇。周琴(1970~),女,碩士,副研究館員,西安交通大學信息咨詢部副主任。

        猜你喜歡
        西安交通大學編目書目
        推薦書目《初春之城》
        都市人(2022年3期)2022-04-27 00:44:57
        《西安交通大學(社會科學版)》青年編委招募
        《西安交通大學(社會科學版)》再獲“最受歡迎期刊”
        西安交通大學馬克思主義學院簡介
        國家圖書館藏四種古籍編目志疑
        天一閣文叢(2020年0期)2020-11-05 08:28:36
        粵劇編目整理之回顧與展望
        戲曲研究(2017年3期)2018-01-23 02:51:01
        échanges humains dans le contexte de la mondialisation
        法語學習(2015年3期)2015-04-17 07:08:16
        圖書館編目業(yè)務外包發(fā)展探討
        河南科技(2014年22期)2014-02-27 14:18:37
        本刊郵購書目
        圖書在版編目(CIP)數(shù)據(jù)
        全國新書目(2009年8期)2009-05-22 11:31:16
        国产丝袜视频一区二区三区| 男生自撸视频在线观看 | 国产自偷亚洲精品页65页| 亚洲制服无码一区二区三区| 99精品国产成人一区二区在线| 久久久精品国产三级精品| 真实夫妻露脸自拍视频在线播放| 人与动牲交av免费| 乱子伦视频在线看| 国产精品涩涩涩一区二区三区免费 | 国产一区二区内射最近更新| 欧美午夜精品久久久久久浪潮| 91自国产精品中文字幕| 一级内射免费观看视频| 夜夜高潮夜夜爽夜夜爱爱一区| 无码国产伦一区二区三区视频| 亚州精品无码久久aV字幕| 日韩最新av一区二区| 国产丝袜美腿在线播放| 又色又爽又黄的视频软件app| 国产亚洲人成a在线v网站| 久久亚洲日本免费高清一区| 亚洲综合有码中文字幕| 亚洲一区二区三区特色视频| 三年中文在线观看免费大全| 性饥渴艳妇性色生活片在线播放| 人妻爽综合网| 韩国日本一区二区在线| 免费乱理伦片在线观看| 一本久久a久久精品亚洲| 人人爽亚洲aⅴ人人爽av人人片| 精品中文字幕精品中文字幕| 国产国产精品人在线视| 日韩亚洲av无码一区二区三区| 国产精品高潮av有码久久| 国产三级c片在线观看| 欧美国产激情18| 人人澡人人澡人人看添av| 国产片三级视频播放| 熟女少妇av一区二区三区| 少妇被又大又粗又爽毛片久久黑人|