蔡建康
(1.西安交通大學(xué),陜西 西安 710049;2.西安交通大學(xué)城市學(xué)院,陜西 西安 710018)
利用Excel進行圖書查重方案的設(shè)計
蔡建康1,2
(1.西安交通大學(xué),陜西 西安 710049;2.西安交通大學(xué)城市學(xué)院,陜西 西安 710018)
圖書查重是圖書管理工作的重要組成部分,不能只采用某一字段進行單一查重,而應(yīng)以題名、責(zé)任者、ISBN為主、參考其他字段為輔的復(fù)合查重方式。文章提出的利用Excel進行多字段圖書查重工作的辦法,能夠?qū)崿F(xiàn)批量圖書查重,提高圖書查重工作效率。
Excel;ISBN;VLOOKUP函數(shù);圖書查重
查重工作是圖書館日常工作的重要組成部分之一,貫穿了整個圖書采購和圖書編目的過程。采購查重是指通過有關(guān)檢查工具將準備購買的文獻和館藏文獻進行對比,剔除待購買文獻中的重復(fù)部分,挑選出未入藏或需要增加訂購副本的文獻信息的過程。采購查重的質(zhì)量直接決定著圖書館館藏圖書的數(shù)量和質(zhì)量,是影響圖書館館藏資源建設(shè)的先決因素。編目查重則在對待編新書進行加工時,再次通過題名、作者、ISBN等多種途徑進行查重,保證同種文獻的分類標(biāo)識和主題標(biāo)引的前后一致性,提高圖書分編工作效率。編目查重的質(zhì)量直接影響著圖書館館藏書目數(shù)據(jù)的質(zhì)量,關(guān)系著讀者使用圖書服務(wù)的質(zhì)量。通過計算機實現(xiàn)高效的查重工作,不僅可以促進圖書采購工作,而且對圖書編目工作的也具有重要意義。
1.1現(xiàn)有的查重方案
(1)手工逐條錄入查重。工作人員在圖書館自動化管理系統(tǒng)內(nèi)通過對每冊圖書的信息進行手工錄入,逐條審核判定是否為重書。手工逐條錄入的速度慢、效率低,且長期重復(fù)簡單勞動容易使得工作人員產(chǎn)生懈怠情緒,進而影響查重效率。
(2)便攜采集器查重。便攜采集器因其體積小巧、方便攜帶,被廣泛應(yīng)用于圖書現(xiàn)采工作中。通過掃描圖書的ISBN條碼,與預(yù)先導(dǎo)入便攜采集器中館藏數(shù)據(jù)的ISBN進行比對,判定是否為重書,是否需要新訂或增加副本。但便攜采集器一般只通過ISBN號來判定是否為重書,而實際工作中存在多卷書共用同一ISBN、精裝簡裝版本使用不同ISBN、同一內(nèi)容多個出版社發(fā)行等多種復(fù)雜情況,單純通過ISBN進行判定難免會出現(xiàn)漏訂或重訂的情況,影響圖書館經(jīng)費高效利用和館藏資源建設(shè)質(zhì)量。
(3)計算機批處理程序查重。部分圖書館結(jié)合本館自動化管理系統(tǒng),利用VB,VF,C語言等設(shè)計開發(fā)了適應(yīng)本館的查重批處理程序,網(wǎng)絡(luò)上也有出版社或供貨商提供的各種查重批處理軟件,但這些批處理工具的普遍適用性不足,與不同的圖書館自動化系統(tǒng)之間兼容性不足,且不能針對每個圖書館提供個性化功能,而技術(shù)能力不足的圖書館又無法在此基礎(chǔ)上進行二次開發(fā)。
1.2現(xiàn)有查重途徑
(1)ISBN查重。國際標(biāo)準書號(International Standard Book Number,ISBN)ISO 2108作為國際標(biāo)準化組織認定的國際標(biāo)準之一被廣泛應(yīng)用于圖書出版領(lǐng)域,現(xiàn)行的中國國家標(biāo)準GB/T5795-2006同樣規(guī)定國際標(biāo)準書號可獨立使用。理論上講,ISBN具有唯一性,每一種圖書都有自己唯一對應(yīng)的ISBN,因此可以廣泛利用于圖書館的編目、檢索以及查重工作中。但在實際工作中卻存在每一種圖書與一個ISBN并非一一對應(yīng)的關(guān)系。有同一種圖書使用多個不同的ISBN的情況,如:重印圖書與原版圖書ISBN不同、簡裝和精裝版本圖書ISBN不同、影印版圖書和原書ISBN不同等;也有同一ISBN被分給多個不同的圖書的情況,如:多卷書共用同一ISBN,ISBN由10位升至13位時更換圖書種類等其他“一號多用”的情況。這使得單純依靠ISBN進行圖書查重工作可能會出現(xiàn)重復(fù)訂購和漏訂的可能。
(2)題名查重。題名能夠最直接地反映圖書的內(nèi)容,通過輸入圖書的題名進行計算機查重也是常見的查重途徑之一。但是按題名進行查重的效率,一方面當(dāng)題名復(fù)雜時,受輸入速度的影響;另一方面,當(dāng)題名過于簡單時,命中的檢索結(jié)果會很多,逐條去對比也影響查重效率,如高等數(shù)學(xué)、大學(xué)物理、統(tǒng)計學(xué)等。
(3)責(zé)任者查重。責(zé)任者也可以作為判斷圖書異同的重要標(biāo)準,通過單獨使用圖書責(zé)任者或在題名過于簡單時輔以責(zé)任者查重也是有效的查重方法之一。但是當(dāng)責(zé)任者是以下情況時,查重的效率就會大打折扣,如易重名使得無法判斷責(zé)任者是否為同一人、高產(chǎn)作者作品多導(dǎo)致命中大量書目記錄、外國人名的不同翻譯結(jié)果等。
圖書查重不能僅僅依靠單一字段,需要綜合使用多個字段來進行判定,如最常用的題名、責(zé)任者、ISBN。都相同或者都不同則非常容易判定是否為重書;而ISBN相同,其他字段不同,則有重書的可能性;而ISBN不同,但題名和責(zé)任者兼相同,同樣有重書的可能性。Excel作為日常辦公軟件之一,處理數(shù)據(jù)簡單高效。因此,多字段的圖書查重可以通過Excel實現(xiàn)。
2.1 統(tǒng)一館藏MARC數(shù)據(jù)和待訂購圖書數(shù)據(jù)為Excel格式
首先需要導(dǎo)出全部館藏MARC數(shù)據(jù)。以ILAS 2.0為例,導(dǎo)出方法為:編目管理→數(shù)據(jù)接口→輸出館藏數(shù)據(jù),在打開的館藏數(shù)據(jù)輸出頁面,“輸出檢索途徑”選擇分類號,起始和終止鍵值分別為A,Z,這樣即可導(dǎo)出全部館藏MARC數(shù)據(jù)。
接著使用Marc To Excel轉(zhuǎn)換工具把導(dǎo)出的MARC文件轉(zhuǎn)換為Excel格式文件。轉(zhuǎn)換的過程中,可以只保留需要的題名、責(zé)任者、ISBN對應(yīng)的200$a,200$f,010$a 3個字段,其他字段可以根據(jù)實際需要進行選取。
無論是訂單選購還是現(xiàn)采,一般圖書供應(yīng)商或出版社都會提供Excel格式的待訂購數(shù)據(jù)。如果為MARC格式,按前述方法轉(zhuǎn)換為Excel即可。
為了方便處理數(shù)據(jù),把館藏數(shù)據(jù)和待訂購數(shù)據(jù)分別放置在一個Excel文件的兩個sheet中,分別取名為“館藏表”和“訂購表”,館藏表的A,B,C列依次為:題名、責(zé)任者、ISBN,訂購表的A,B,C列同樣依次為:題名、責(zé)任者、ISBN。
2.2利用VLOOKUP函數(shù)進行查重
在訂購表中新建D列“ISBN查重結(jié)果”,選中D2單元格,選擇菜單欄中的“公式”→插入函數(shù)→常用函數(shù)→VLOOKUP,打開函數(shù)參數(shù)頁面,在Lookup_value(即查找值)一欄內(nèi)輸入“C2”,在Table_array(即數(shù)據(jù)表)一欄內(nèi)輸入“館藏表!C:C”,在Col_index_num(即序列數(shù))一欄內(nèi)輸入“1”,在Range_lookup(即匹配條件)一欄內(nèi)輸入“0”,輸入完成后點擊確定,這樣即完成了對訂購表中C2單元格ISBN的查重。這個VLOOKUP函數(shù)表示查詢訂購表C2單元格的ISBN,查詢范圍為館藏表C列,返回查詢范圍中第一列(即館藏表C列)的命中結(jié)果,匹配條件為精確匹配。如果館藏中已有相同ISBN則查詢結(jié)果顯示該ISBN;如果館藏表中沒有相同ISBN則顯示“#N/A”。
在訂購表中新建E列“題名+責(zé)任者查重結(jié)果”,選中E2單元格,插入以題名+責(zé)任者進行查重的VLOOKUP函數(shù)。按上述路徑打開函數(shù)參數(shù)頁面,在Lookup_value(即查找值)一欄內(nèi)輸入“A2&B2”,在Table_array(即數(shù)據(jù)表)一欄內(nèi)輸入“IF({1,0},館藏表!A:A&館藏表!B:B,館藏表!C:C)”,在Col_index_num(即序列數(shù))一欄內(nèi)輸入“2”,在Range_ lookup(即匹配條件)一欄內(nèi)輸入“0”,輸入完成后點擊確定,這樣即完成了對訂購表中“A2+B2”單元格“題名+責(zé)任者”的查重。這個VLOOKUP函數(shù)表示以訂購表“A2+B2”單元格的“題名+責(zé)任者”為一個變量進行查詢,查詢范圍為館藏表A+B列、C列,返回查詢范圍中第二列(即館藏表C列)的命中結(jié)果,匹配條件為精確匹配。如果館藏中已有相同“題名+責(zé)任者”則查詢結(jié)果顯示該書的ISBN;如果館藏表中沒有相同“題名+責(zé)任者”則顯示“#N/A”。
最后,選中D2與E2兩個單元格,點擊單元格右下方的填充柄,按住鼠標(biāo)左鍵向下填充,直至訂購表的結(jié)尾處。
查重結(jié)果可能出現(xiàn)4種情況,需要進行相應(yīng)的數(shù)據(jù)處理:
(1)都顯示ISBN號碼。則表明圖書的題名、責(zé)任者、ISBN完全一致,可以判定為重書。
(2)都顯示“#N/A”。則表示圖書的題名+責(zé)任者、ISBN完全不同,判定為新書。
(3)ISBN查重結(jié)果顯示圖書ISBN,題名+責(zé)任者查重結(jié)果顯示“#N/A”,則需要參考其他字段進一步考慮,是否為多卷書共用ISBN、分冊共用ISBN等其他一號多用的情況。
(4)ISBN查重結(jié)果顯示“#N/A”,題名+責(zé)任者查重結(jié)果顯示圖書ISBN,則需要參考其他字段進一步考慮,是否為相同內(nèi)容再版圖書、精裝與簡裝的差異、影印版與原版圖書等情況。
通過前述方法完成每次圖書的查重工作,產(chǎn)生新的訂單。把本次新訂數(shù)據(jù)添加到館藏表中,完成數(shù)據(jù)的同步工作,下次查重即可省去館藏數(shù)據(jù)導(dǎo)出轉(zhuǎn)換部分,直接進行查重操作。
設(shè)計方案以常見的查重途徑題名、責(zé)任者、ISBN來進行綜合判定,如需要進一步判斷,可再輔以副題名、出版發(fā)行項、叢編項等其他字段。而Excel又是辦公自動化常用軟件之一,其普遍適用性是毋庸置疑的。經(jīng)過在圖書館圖書采購過程中的使用,完全滿足圖書查重工作的需要,杜絕了新書到館查重后退書的問題,減輕了圖書館工作人員的負擔(dān),而且緩解了圖書館與書商之間因為退書可能產(chǎn)生的不快。
[1]邵永強.基于ilasⅡ2.0系統(tǒng)的采訪批量查重[J].現(xiàn)代情報,2005(4):133-134.
[2]肖婷.從ISBN的唯一性談中文圖書采訪的查重[J].圖書館工作與研究,2013(5):85-87.
[3]鄭燕平.信息技術(shù)發(fā)展對文獻現(xiàn)采查重模式的影響分析[J].圖書館工作與研究,2015(8):28-30.
Design of books check up scheme by use of Excel
Cai Jiankang1,2
(1.Xi'an Jiaotong University, Xi'an 710049, China; 2.Xi'an Jiaotong University City College, Xi'an 710018, China)
Books checking is an important part of the work of library management, not only using a single field investigation, and should take a heavy check method of basing on the title, responsible, ISBN, and composite reference other fields. This paper supplemented by Excel multi field books checking work, which can realize batch books checking, and improve books checking work efficiency.
Excel; ISBN; VLOOKUP function; books checking
蔡建康(1987— ),男,陜西榆林,碩士,館員;研究方向:信息咨詢,用戶教育。