(三明學院逸夫圖書館,福建三明365004)
計算機編目中393字段著錄分析
胡彩云
(三明學院逸夫圖書館,福建三明365004)
393字段是《新版中國機讀目錄格式使用手冊》中新增的一個字段.在編制機讀目錄格式過程中,393字段著錄出現(xiàn)了一些問題.通過著錄分析并結合古籍著錄的一些實例,總結出該字段在著錄中出現(xiàn)的問題,即393字段與其他相關字段的配合使用問題和如何客觀著錄字庫中未收錄的古文字問題,并提出相應的解決辦法.
計算機編目;393字段;100字段
隨著計算機編目工作的廣泛開展與完善,《新版中國機讀目錄格式使用手冊》中較之前的版本新增了393字段,即系統(tǒng)外字符(OUTSYSTEM CHINESE CHARACTER NOTE).393字段的新增,是針對中國古籍進行客觀如實著錄而增設的.然在現(xiàn)實編目過程中我們發(fā)現(xiàn)有幾個問題需注意,故在此進行分析探討.
《新版中國機讀目錄格式使用手冊》中將393字段定義為“本字段包含有關記錄中出現(xiàn)的字符集所缺字符的附注”[1].而韋衣昶的《特種文獻的機讀書目數(shù)據(jù)》中更加明確地指出“393系統(tǒng)外字符注是用于古籍數(shù)據(jù)錄入時字符集里所缺字符的結構和讀音”[2],并舉例說明.然就單純393字段出現(xiàn),并不是3——附注其他字段一樣配合相關字段使用,由此使393字段顯得更加抽象和孤立.
其實,該字段以附注形式出現(xiàn),并不是孤立的,在其他相關的必備字段是可以得到體現(xiàn)的.100通用處理數(shù)據(jù)字段中補充字符集,字符位30-33.《新版中國機讀目錄格式使用手冊》中說,用兩組雙位字符表示最多兩個在記錄交換中使用的補充字符集.30-31字符位標識G2集,32-33字符位標識G3集.如果沒有補充字符集,則上述字符位標識空位.在常見的機讀目錄中,30-33字符位一般都為####.關于字符集G2、G3,其實是由G1集完善而來的.G1集,即《GB2312-80信息交換用漢字編碼字符集基本集》(雙七位表示)或雙八位表示的基本集輔3、輔5三個集構成的一個集合,對于處理繁體字出版物的機讀目錄,可將漢字編碼字符集第一輔助集作為G1集,或雙八位表示的輔1、輔3、輔5三個集構成的集合作為G1集.
因為漢字字集幾乎囊括了常用的漢字,而對于須在393字段附注的表外字符比較少.編目員在進行中文古籍著錄時如果發(fā)現(xiàn)須使用表外字符,在100字段的30-33字符位應體現(xiàn),并且啟用393字段,以實現(xiàn)必備字段與附注字段的對接.
393字段是對在編古籍數(shù)據(jù)錄入時字符集所缺字符的結構和讀音的描述記錄.中國文字起源源遠流長,很多古文字現(xiàn)在已不用,也無法確定如何發(fā)音.393字段應如何處理這個問題呢?
“字形結構描述”可使用漢字(上、下、左、右、中、左上、左下、右上、右下、內、外等)描述缺省漢字某一組成部分所在位置,也可使用約定符號“—”表示去掉漢字中某一部分,或“→”表示置換漢字中的某一部分.這一方法的使用解決了大部分表外字符的結構、字形著錄難題.如下例:
韋衣昶在《特種文獻的機讀書目數(shù)據(jù)》中還對表外的繁體字符運用了“繁簡變更”法[2],即使用符號(繁),表示用該字或該部的繁體.而對于字形復雜難以描述的字,可注明該字所在字典的頁碼.如下例:
如果說上述方法的運用解決了表外字符集的字形描述的難題,讀音描述的問題依然存在.對于古籍中出現(xiàn)的一些地方通用字符,只知道字形,卻不知道古音者,該如何著錄?
該字是西北邊塞戍守文書中流行的文字,查詢古今字典,都不知道其讀音,而393字段該如何進行著錄呢?這時候就要求編目員有相關語音學的知識,將音標著出來.筆者結合語音學的知識提出以下解決方法:
(1)編目員可以查閱古代的韻律書籍,運用古代的反切法,將讀音標出;也可以運用周殿福的國際音標將其標出.這種方法雖沒辦法做到將古音完全正確的標出,但是與古音已經比較接近了.
(2)如遇到完全不可考的,可由編目人員加“?”置于圓括號內,表示古音不可考,或是在圓括號內標注“不詳”字樣,并且在相關字段進行說明.
以上所作的分析是基于閱讀《新版中國機讀目錄格式使用手冊》及在實際的編目工作中遇到的問題而作的分析.這是國家圖書館采用的字段,而CALIS針對這個問題啟用了303字段描述表外漢字.“但這種補救方式畢竟是權宜之計,既有礙書目數(shù)據(jù)的完整性,如果出現(xiàn)在檢索字段(是常有的),還會造成難以檢索的麻煩.所以在古籍書目數(shù)據(jù)整改階段,應該使用ISO10646Level3(UNICODE)國際漢字大字符集(它應建立新字補入機制),補齊原來的系統(tǒng)外字(含清除“”和393字段),提高讀者對古籍文獻的查全率.”[4]可以說在《新版中國機讀目錄格式使用手冊》中新設的393字段有效地解決了表外字符的著錄問題,編目人員在如實著錄相關信息的時候應該多運用3——段的附注,在針對古籍之類的書目著錄時應發(fā)揮393字段著錄的長處,準確如實的著錄,而對于著錄的是否完全正確有待于進一步努力.
[1]國家圖書館.新版中國機讀目錄格式使用手冊[M].北京:北京圖書館出版社,2004:246.
[2]韋衣昶.特種文獻的機讀書目數(shù)據(jù)[M].北京:北京圖書館出版社,2002:86.
[3]陳彭年,丘雍.宋本廣韻[M].北京:北京市中國書店,1982:6、15、99.
[4]鮑國強.古籍書目數(shù)據(jù)庫整改工作構想[J].文津流殤,2005(8).
G254.362
A
1008-7974(2012)08-0099-02
2012-04-03
胡彩云(1984-),女,福建沙縣人,碩士,三明學院逸夫圖書館助理館員.
(責任編輯:徐星華)