摘 要:本文以本館日文數(shù)據(jù)數(shù)據(jù)庫建設的經驗和問題為基礎,從館藏整理、運行環(huán)境、操作規(guī)范等方面論述了日文自建書目數(shù)據(jù)庫的質量控制。
關鍵詞:回溯建庫;質量控制;日文圖書
目前我國圖書館的中、西文圖書書目數(shù)據(jù)庫的建設已經基本完成,并日趨成熟,形成了全國性和地區(qū)性的聯(lián)合目錄數(shù)據(jù)庫。而日文圖書由于在各館館藏中所占的比例小,館員日文編目能力較弱,計算機軟、硬件條件限制等因素,日文圖書書目數(shù)據(jù)庫的建設仍然處于起步階段。雖然CALIS聯(lián)合編目中心已經建立了以日本國立情報學研究所綜合書目數(shù)據(jù)庫為數(shù)據(jù)源的日文聯(lián)合編目數(shù)據(jù)庫,但是由于多種原因,仍有許多館不能利用CALIS聯(lián)合編目數(shù)據(jù)庫,需要進行以原始編目為基礎的回溯建庫工作,這樣,日文圖書自建數(shù)據(jù)庫書目質量的控制問題就成為建庫的核心問題。
近年我館進行了日文圖書的回溯建庫工作,總結建庫工作中的經驗和問題,筆者想以建庫工作流程為思路,主要從館藏整理、運行環(huán)境、操作規(guī)范等方面談一下自建日文數(shù)據(jù)庫的書目質量控制。
1 館藏的清點與整理
館藏清點與整理是數(shù)據(jù)錄入的前提,也是書目質量控制重要環(huán)節(jié)。館藏圖書是書目數(shù)據(jù)庫的物質基礎,書目數(shù)據(jù)庫是館藏圖書的數(shù)據(jù)反映。只有將館藏圖書理清、理順,以其為依據(jù)的書目數(shù)據(jù)庫的建設才能有序進行,所形成的書目數(shù)據(jù)質量才能得到保證,以此為依托的館藏數(shù)據(jù)統(tǒng)計、檢索查重等圖書館業(yè)務工作和讀者檢索、圖書流通等讀者工作才能得到有效保證。
館藏數(shù)據(jù)清點與整理主要包括以下三個方面的內容:
1.1 書卡核對
書卡核對的依據(jù)應該是公務目錄中的分類目錄。圖書館藏書經過多年的流通,肯定會有一定的流失,而由于諸多原因,這些流失的圖書沒有被詳細記錄,沒有在公務目錄上全部反映的情況一定存在;另一方面,由于人員的更替,圖書館公務目錄在長期積累的過程中在著錄項目、著錄規(guī)范等方面存在許多問題和紕漏。
書卡核對主要做以下工作:①以公務分類目錄為依據(jù)核對圖書順序,對亂架的圖書進行整序。②核對圖書存在情況。對于沒有相對應圖書的登錄號,如經查證后確實沒有圖書,在卡片上注明“無書”字樣,對該登錄號做注銷處理;對有書無卡的情況,應補充卡片數(shù)據(jù)。③核對分類號、書次號是書卡核對的重點。圖書館在長期編目過程中,由于分類法的更換、修訂、分編人員變化以及同一人員在不同時期對分類法的理解不同、查重不準確等等諸多因素,會產生分類錯誤或分類不一致;同時由于圖書集中與分散著錄的標準在執(zhí)行時的不一致,致使多卷書、叢書的分類號和書次號取號原則不一致,;圖書版本、印次的不同所產生的書次號混淆現(xiàn)象也很常見。而以上這些問題表如果不進行修改,在下一步的計算機數(shù)據(jù)錄入時會出現(xiàn)索書號重復、同書異號等現(xiàn)象。這就需要圖書館制定建庫分類標準、集中著錄與分散著錄標準、同類書區(qū)標準,并在書卡核對環(huán)節(jié)按照標準更正和修改與標準不符的分類號和書次號,為數(shù)據(jù)錄入打好基礎。
1.2 藏書剔除
在書卡核對過程中,對復本過多和破損嚴重的文獻進行剔除,并在卡片上做標注。
1.3 注銷登記
依據(jù)卡片標注,對在查明無書和剔除的藏書進行圖書和/或財產帳的注銷。
2 條形碼和磁條的加工
在完成館藏整理后就可以進行圖書條碼和磁條的加工。條形碼是圖書館財產的反映,條形碼數(shù)量應根據(jù)注銷后的財產帳的統(tǒng)計數(shù)據(jù),條形碼的語種號應根據(jù)本館對各語種的管理方法給定。
3 圖書分類
對于自建數(shù)據(jù)庫來說,本步驟是個可選過程。每個圖書館的日文圖書都采用一種分類法,如中國人民大學圖書館分類法、中國科學院圖書分類法或中圖法,有的圖書館在不同時期使用了不同的分類法。如果從資源共享的角度考慮,在建庫時,應對圖書進行中圖法分類,增加中國圖書館圖書分類號;如果只是想建成本館數(shù)據(jù)庫,在局域網進行運行,本步驟可以省略。
3.1 圖書分類
圖書的分類遵循《中國圖書館分類法》最新版相關規(guī)定。
3.2 圖書書次號的選取。
日文圖書書次號的選取應遵循以下原則:①西文姓名直接取姓、名首字母;習慣以名稱呼的西方作者,則依次取兩位首字母;西文團體依次取前兩詞首字母(不含首冠詞)。②佚名作品(無原作者,不包括譯者等)根據(jù)題名前兩個漢字??;西文佚名作品取前兩詞首字母(不含首冠詞)。③如果重號再加大寫字母區(qū)分,同一著者的書盡量取號接近:④同一作者同一種書,如為不同版次,用括號加版次區(qū)分,如ABA(3);否則加短橫數(shù)字區(qū)分(從2往后取),如ABA-2。
4 運行環(huán)境
4.1 MARC格式
關于日文圖書的計算機編目系統(tǒng),除了日本的JAPAN/MARC系統(tǒng)以外,有美國的RLG于1983年開發(fā)的處理中、日、朝文資料的CJK系統(tǒng)和加拿大公用書組織Utlas自1986年以來開發(fā)的以日本標準格式JAPAN/MARC為基礎的日文資料聯(lián)機編目系統(tǒng)。在我國,有關日文編目系統(tǒng)方面的報道尚未見到。
依據(jù)中國農業(yè)大學圖書館李晨英、韓明杰以該館實踐經驗為基礎的《套用CNMARC機編中文圖書的可行行分析》中對CNMARC字段和JAPAN/MARC的比較(如圖)可以看出,JAPAN/MARC中關于ISBN(M)所要求的著錄規(guī)則在CNMARC中都可以得到體現(xiàn)。
經過CALIS聯(lián)合目錄編目中心近幾年的實踐也證明,采用CNMARC格式可以實現(xiàn)中文平臺的檢索和流通。所以可以采用CNMARC格式進行日文圖書的回溯建庫。(見表1)
4.2 文字處理系統(tǒng)
Microsoft IME 2000的出現(xiàn)解決了日文輸入法的問題。它提供了在中文Windows 2000/xp環(huán)境下的日文羅馬輸入法,支持中文Word、Excel、WPS、Outlook記事本等常見編輯器內的日文整句自動切入(包括常見變化處理),通過輸入法的切換,一個文件里可以同時出現(xiàn)中、日、英文字,不會出現(xiàn)亂碼,在書寫器中有平假名、片假名、全角、半角等選項,為難字、生字的輸入提供方便。
4.3 系統(tǒng)軟件
我館使用PFT大連伯菲特文獻集成管理系統(tǒng)中文圖書編目系統(tǒng)。
5 操作規(guī)范
在數(shù)據(jù)錄入前要根據(jù)日文圖書編目特點,依據(jù)ISBD標準,編寫出日文圖書編目著錄原則、名稱規(guī)范(標引)原則和主題標引原則,同時編制MARC必備字段及其使用說明。
日文圖書著錄總則:
如前所述,日文圖書的著錄采用CNMARC格式,那么著錄規(guī)則也應以中文著錄規(guī)則為準,在涉及到日文的特殊地方作區(qū)別規(guī)定。
5.1 適用范圍
細則適用于正文為日本語,或以日本語為主的印刷型日文圖書。日本或中國出版的面向具有中文能力讀者的中文學習材料和中國出版的日本語文獻重印本,以日文圖書著錄。
5.2 著錄文字和數(shù)字
題名與責任說明項、出版發(fā)行項、叢編項均按文獻本身所用文字如實著錄;載體形態(tài)項、附注項、文獻標準編號與獲得方式項用日文著錄(日文固有漢字及片假名、平假名)。
5.3 字符錄入原則
基本套用中文數(shù)據(jù)錄入原則;遇到計算機系統(tǒng)難以顯示的文字、圖形及符號等用“◆U◆”表示。
5.4 詳簡級次
圖書館可參照本館中文著錄詳簡級次和機讀目錄的有關規(guī)定,確定每個記錄中字段與子字段的必備性。
5.5 集中著錄與分散著錄
●單行本文獻,一般分散著錄。
●叢書一般采取分散著錄。
●多卷集
具有共同題名,但單個物理單位沒有具有獨立意義的題名,只有卷冊區(qū)別,采用集中著錄。下層的各卷冊不作分析著錄。
多卷冊雖有分卷題名,但沒有獨立意義,并且有總責任者時,一般應集中著錄。
多卷冊圖書雖然有分卷冊,但沒有獨立意義,各分卷冊有獨立的ISBN及各自的責任者時,最好采用分散著錄。
具有共同題名,且各個物理單位都又相對獨立的分卷題名、作者等區(qū)別于其他卷冊的書目信息時,一般以卷冊為單位分散著錄。
具有共同題名的一套書中,當若干個卷冊具有相同的、具有區(qū)別于其他卷冊的題名時,這幾個卷冊采取集中著錄。
文學作品中的全集類文獻,要根據(jù)題名頁的正題名情況判斷是分散著錄還是集中著錄。
6 日文圖書著錄細則
以下以MARC記錄為順序,談以下日文圖書著錄中特殊需要注意的地方。
6.1 000記錄頭標區(qū)
5字符位 記錄狀態(tài)代碼:回溯建庫的代碼選用“n”;
6字符位 記錄類型代碼:選用“a”表示印刷型文字資料;
7字符位 書目級別代碼:單冊圖書、集中著錄的多卷書用“m”;分散著錄叢書的單冊用“m”;集中著錄的叢書用“s”;
8字符位 層次等級代碼:無等級關系的單冊圖書、集中著錄的多卷書選用“0”。
6.2 010國際標準書號
●“$b 限定信息”是對ISBN范圍的說明,通常是ISBN與整套文獻或特定卷冊的關系說明;本字段還可以記錄說明文獻裝訂形式的信息,如“並裝版”、“合裝版”、“改裝版”等。
●“$d價格”子字段中貨幣符號統(tǒng)一使用“円”;若文獻已經注明是“非賣品”,且無價格,則在本子字段注明;當同一圖書同時存在“売品”和“非売品”2種銷售方式時,不論ISBN號是否相同,都以“売品”為著錄對象;圖書單冊著錄,但價格是全套價格時,需在價格后的圓括號內著錄“全套”或“X冊”字樣。
6.3 100一般數(shù)據(jù)處理
●8-16字符位與中文普通圖書的填寫方法相同。注意授權影印版日文圖書的代碼應選擇“e”。
●17-19字符位注意a不能與b、c、d、e組配,常用代碼“kna”。
●21字符位,通常情況下用“0”。
●22-24字符位,選用“jpn”。
●25字符位,通常情況下選未使用音譯方案,代碼為“y”。
●26-29字符位,選用GBK字符集代碼為“0121”。
●30-33字符位,通常情況下不需要補充字符集,用“####”。
●34-35字符位,表明正題名使用文字,選用代碼“da”。
6.4 101 文獻語種代碼
本字段代碼的填寫“jpn”。
6.5 102出版國別
日文文獻沒有出版地區(qū)代碼,只有出版國別代碼,為“JP”。
6.6 105 編目數(shù)據(jù)字段:專著性文字資料
大多數(shù)數(shù)據(jù)元素的選取與中文普通圖書相同,只在0-3字符位圖表代碼的描述中,注意以下兩個問題:
●描述圖的類型時,日文文獻只采用“図”、“地図”、“肖像”三種表達形式。
●自然科學文獻中的示意圖,應用代碼“a”,并在215$c子字段中著錄“図”。
6.7 200 題名與責任說明項
6.7.1 正題名按照規(guī)定信息源所載題名如實著錄,但由于在排版的特殊性,應特別注意以下幾點:
●正題名上含有對某一詞的日語注音時,要直接著錄在該詞后的圓括號中。
例:200 1#$a青い思想(こころ)$Aアオイ ココロ
●題名前冠有出版社時,依原題照錄,并在517字段提供除去出版社名稱的題名檢索點。
例: 角川 漢和中詞典
200 1#$a角川漢和中詞典
517 1#$a漢和中詞典
●題名前冠有年代、時代時,依原題著錄。
例: 明治以降本幫主要経済統(tǒng)計
200 1#$a明治以降本幫主要経済統(tǒng)計
●題名前文字對書中內容起限定作用時,依原題照錄。
例 學校 図書館の整理
200 1#$a學校図書館の整理
●表示內容程度的文字依據(jù)原題照錄。
例: 初級フランス語
200 1#$初級フランス語
●題名前冠有說明圖書特色、性質的文字,如講座、年譜、年表、圖解、口述、體系、最新、新編、概說、總說、參考、評傳、應用、實用等冠詞時,依照原題照錄,并在517字段提供去掉冠詞的題名檢索點。
例: 改正健康保險法解說
200 1#$a改正健康保險法解說
517 1#$a健康保險法解說
●責任者已是題名的組成部分時,如著作集、專題匯編等題名前冠有責任者名稱時依原題照錄。
6.7.2 責任說明
●責任者超過三個,只著錄第一個,后加[ほか]表示。
●若文獻題名頁上的責任者有“監(jiān)修”、又有“編”者時,“編”者作為第一責任說明,“監(jiān)修”為第二責任說明;若文獻題名頁上只有“監(jiān)修”,則著錄“監(jiān)修”。
例: コンサイス外國人名事典
200 1#$aコンサイス外國人名事典$三省堂編修所編$相田重夫[ほか]監(jiān)修
●題名前冠有小字責任者時,不應視責任者為題名的組成部分,應將其著錄在相應的責任說明字段。
例: ストテン有機機器入門/小松芳郎訳
200 1#$a有機機器入門$fストテン著$f小松芳郎訳
6.7.3 205版本項
●除第一版外,各個版次以及與版本有關的說明信息均著錄在$a子字段,版次一律用阿拉伯數(shù)字表示。著錄時用“第x版”形式。
例: 205 ##$a第二版
205 ##$a改訂増補版
●題名前冠有表示版本內容、版本種類的信息,應著錄在版本項。
例: 縮約 國史大系
200 1#$a國史大系
205 ##$a縮約
6.7.4 出版發(fā)行項
●著錄影印本和其他復制本時,本項應著錄復制本的出版地、出版者及出版日期。原版的出版信息著錄在附注項。
例:200 1#$a新明解國語詞典
205 ##$a復刻本
210 ##$a北京$c世界圖書出版公司北京公司$d1999
300 ##$a復刻原本:東京:三省堂,1997.11
●版發(fā)行年一律用阿拉伯數(shù)字著錄,著錄到月。如出版年非公元年,一律改為公元年著錄。
●版本為私家版時,出版者著錄個人名。
例: 210 1#$a音羽街(愛知縣)$c山口卓郎$d1978
●多卷書出版年各不相同時,如集中著錄,100出版類型代碼用“g”。
6.7.5 載體形態(tài)項
●圖書同時有図、彩図、地図、肖像、摹真等特征時,只著錄“図,地図,肖像”,中間用逗號標識;表格不著錄。
●附件的數(shù)量用阿拉伯數(shù)字,單位可用“p、枚、冊”表示。
6.7.6 叢編項
日文叢編的卷冊標識比較復雜,著錄時一律照錄,不可隨意更改位阿拉伯數(shù)字編號。
6.7.7 4xx 連接款目塊
日文著錄中一般常用的連接字段有410、423、454,其他連接字段可根據(jù)編目文獻的具體情況選擇使用。
6.7.8 6xx和7xx著錄信息塊的機讀目錄格式的使用說明與中文普通圖書基本相同;關于標目的選取可參照《國立國會圖書館件名標目表》、《現(xiàn)代日本名人錄》、《廣辭苑》、《日本人物辭典》;分類法的使用參照各分類體系。
6.7.9 館藏項
建立書目數(shù)據(jù)庫前,圖書館財產帳的管理如果是按語種分別做財產登記,那么,不同語種的圖書就會有許多相同的登錄號,在建立計算機數(shù)據(jù)庫時,如果對登錄號不進行區(qū)分,容易在中央數(shù)據(jù)庫產生重復登錄號,在以登錄號做檢索點進行數(shù)據(jù)檢索時則檢索不到該數(shù)據(jù)。
我館用登錄號前加語種英文字母首字母的方法解決了不同語種登錄號的重復問題,方便了數(shù)據(jù)的檢索,提高了數(shù)據(jù)庫的書目質量。
7 數(shù)據(jù)錄入
鑒于建庫工作量大,需要工作時間長,熟悉編目的工作人員少的情況,數(shù)據(jù)的錄入可以分兩步來做。
第一步進行卡片數(shù)據(jù)錄入。先對普通工作人員或懂日文的勤工儉學人員進行MARC格式和著錄規(guī)則的培訓,然后根據(jù)核對過的公務分類目錄的卡片順序,按批號進行數(shù)據(jù)錄入。
第二步實物數(shù)據(jù)錄入。由本館編目人員根據(jù)批號調出卡片數(shù)據(jù),依據(jù)圖書實體進行數(shù)據(jù)核對、主題詞錄入,條形碼掃描。
結束語
日文書目數(shù)據(jù)庫的建設,既有回溯書目數(shù)據(jù)庫建設的普遍特點,也有日文書目數(shù)據(jù)的特殊性。所以在日文書目數(shù)據(jù)庫的建設過程中,可以借鑒中、西文書目數(shù)據(jù)庫的建設和管理方法,對數(shù)據(jù)庫進行統(tǒng)籌管理;同時要抓住日文建庫的重點,克服難點,制定有針對性的條例和實施辦法,將書目質量控制貫穿于數(shù)據(jù)庫建設的各個階段。
參考文獻
[1]李晨英,韓明杰.現(xiàn)代圖書情報技術,1996(2):47-50
[2]張艷.圖書館回溯書目數(shù)據(jù)庫建設,2003(12):107-110
[3]謝琴芳.CALIS聯(lián)機合作編目手冊(上冊).北京:北京大學出版社,2000
[4]CALIS聯(lián)合目錄日文文獻著錄細則.http://www.calis.edu.cn
作者簡介:許愛萍(1968-),女,碩士,副研究館員,發(fā)表論文10篇。