廖大蓉,李 渡
(重慶圖書館,四川 重慶 400037)
套錄編目主要是指編目員為一種圖書編目之前,先對從外部獲取的編目數(shù)據(jù)進行必要的編輯加工,而后轉換為本館數(shù)據(jù)庫記錄的過程。由于套錄編目不僅能節(jié)省大量的人力、物力,大大提高工作效率,而且還能有效地促進和提高本館的編目質(zhì)量,使書目數(shù)據(jù)朝著標準化、規(guī)范化方向發(fā)展,因此套錄編目這一工作方式,越來越受到各館的歡迎。
1.1.1 套錄數(shù)據(jù)的優(yōu)點
采用完全著錄級次。一些圖書館雖已實現(xiàn)了計算機編目,但由于多種原因,對書目數(shù)據(jù)的編制,僅局限于目錄狀態(tài)下著錄單元的內(nèi)容,著錄級次較低。而套錄的數(shù)據(jù)采用的都是完全著錄級次,對每種文獻所提供的信息源都盡可能地進行全面的、準確地著錄。如對于影印版的圖書,除了在205字段進行著錄外,還在305字段作相應的說明;著作者的著錄,除在200字段的$f、$g進行著錄外,又在7-字段進行了詳細的著錄,完善了書目數(shù)據(jù)的質(zhì)量,滿足讀者多途徑檢索的需要,充分地發(fā)揮書目揭示文獻的作用。
重視MARC格式中的連接對應。連接對應是機讀目錄的一個最明顯的特點,也是最能體現(xiàn)機讀目錄的優(yōu)勢之處。套錄的數(shù)據(jù),重視了MARC格式的連接對應,如頭標區(qū)與225、4字段的連接,105與215、320字段的連接對應。通過這些字段的連接對應,既使MARC的結構變得清晰有序,又保證了數(shù)據(jù)的前后一致,而且還能充分發(fā)揮計算機的檢索功能,在文獻檢索中為用戶提供更多的信息。
各字段、指示符和代碼著錄的準確率高。套錄的數(shù)據(jù),不僅比較準確地理解和使用了MARC格式中的各個子段、指示符,而且還特別注意對代碼的準確著錄。在MARC格式中,代碼部分的頭標區(qū)和編碼信息中的每個字母都代表著文獻的一個特征,如頭標區(qū)中的第5字符位,c代表經(jīng)修改的記錄,d代表被刪除的記錄,n代表新記錄;又如105字段中的0-3字符位為圖表的代碼,其中a代表圖表,b代表地圖,c代表肖像、畫像,g代表樂譜,k代表表格,y代表無圖表等等。對于習慣于傳統(tǒng)編目的工作人員來說,代碼部分的著錄往往容易被忽視,致使這些字段的填充混亂不堪,影響了機讀目錄的檢索效率。而在套錄的數(shù)據(jù)中,編目員對文獻的特征都進行了認真的分析,給出了正確的代碼,使書目數(shù)據(jù)的質(zhì)量上了一個新的臺階。
加強了文獻標引的標準化程度。文獻標引包括分類標引和主題標引兩方面。分類標引:套錄的數(shù)據(jù),在分類標引上使用《中國圖書分類法》(第四版),統(tǒng)一了分類標準,所給的類號能比較準確地揭示文獻的學科屬性,對于那些涉及多個學科內(nèi)容的文獻,僅用一個分類號難以揭示其完整內(nèi)容,除了給主分類號外,還作了附加分類,這樣既保證了分類規(guī)則對文獻分類一致性的要求,使同類和相關的文獻得以集中,又充分地揭示了文獻的學科內(nèi)容,便于讀者檢索。主題標引:許多館在建庫時,由于工作量大、時間緊等原因,缺少對主題分析字段的著錄,形成有缺陷的數(shù)據(jù),而套錄的數(shù)據(jù),加強了對這一字段的著錄,使每一條記錄都有主題分析字段,通過多個主題能從不同學科、不同時空、不同類型等角度去揭示文獻的內(nèi)容,比分類法更直觀、更有專指性。
1.1.2 套錄數(shù)據(jù)存在的問題
題名著錄不規(guī)范。由于對題名的理解錯誤,使200字段中的$a子字段與$e子字段在著錄時內(nèi)容相混淆,造成某些數(shù)據(jù)在題名著錄上的不規(guī)范。
例:由文貫中等主編的《WTO與中國:走經(jīng)濟全球化發(fā)展之路》一書,其封面、書名頁、書脊及版權頁上均以“WTO與中國:走經(jīng)濟全球化發(fā)展之路”的形式作為題名,但源記錄著錄為:
2001$aWTO與中國$e走經(jīng)濟全球化發(fā)展之路
在這條記錄里,編目人員把“走經(jīng)濟全球化發(fā)展之路”錯誤地理解成是副題名,而根據(jù)文獻編目規(guī)則規(guī)定:普通圖書題名著錄的主要信息資源應以書名頁和版權頁為準,因此,“走經(jīng)濟全球化發(fā)展之路”是正題名的組成部分,應著錄在正題名各項里,不能作為副題名來著錄。正確的著錄方法應該為:
2001$aWTO與中國:走經(jīng)濟全球化發(fā)展之路
責任者著錄比較混亂。在套錄數(shù)據(jù)中,責任者著錄所存在的問題是最多的,由于采用的標準不同,其著錄形式也五花八門。當責任者超過三個時,有的只著錄第一責任者,后面用“等”代替,如×××等編;有的只著錄前面三個,后用……連接;還有的則采用責任者全部著錄的方式。此外,在對責任者進行著錄時,有的數(shù)據(jù)使用[ ],有的則不用。對于這些套錄數(shù)據(jù)的處理,各館可以根據(jù)實際情況采用某一標準,對不符合這一標準的數(shù)據(jù)進行逐條修改。
分類號錯誤:例《青少年團體治療》分類號錯標為:G913.5 應為:C913.5;《社會救助學》G913.7 應為:C913.7;《秘書基礎》分類號錯標為:G931.46應為:C931.46
因此,外部數(shù)據(jù)也難免存在這樣或那樣的問題,所以在使用外部數(shù)據(jù)時應該認真分析和嚴格審驗,辨別對錯,不能盲目使用或套錄外部數(shù)據(jù)。
除了套錄下載聯(lián)機編目中心的數(shù)據(jù)和書商提供的數(shù)據(jù),還有一部分圖書沒有數(shù)據(jù),這些書有的比較新,有的是贈書或教材、標準、地方資料之類的圖書,只能由分編人員自己進行原始編目。
原始編目存在的問題:
著錄內(nèi)容不規(guī)范。由于圖書館在不斷地發(fā)展,在不同時期對著錄的標準要求不同,導致對著錄的級次也各異。隨著網(wǎng)絡的發(fā)展,現(xiàn)時期的著錄的級次要求比較高,著錄細致,使用了很多字段和子字段,做了較詳細的著錄;在回溯建庫時著錄粗淺,用簡易編目,字段相對少,也許連225,410,702等必備字段也無從著錄;有的使用了字段之間的連接和內(nèi)容摘要,只進行必備的字段著錄,對字段間的連接很少進行考慮,內(nèi)容摘要更是沒有著錄;另外,對于作為主要檢索點的主題詞和關鍵詞的標引,有的進行較深的標引,有的卻沒有作相應的標引。
著錄標準不統(tǒng)一。在實際工作中發(fā)現(xiàn)館藏數(shù)據(jù)庫中的數(shù)據(jù)在著錄上存在著不統(tǒng)一的現(xiàn)象。主要表現(xiàn)為:第一,多卷書分散著錄和集中著錄不同。有的集中著錄作了一條記錄,有的分散作了多條記錄。第二,分散著錄時正題名選擇不同。一種做法是把總題名作為文獻的正題名,與分卷題名共同組成文獻的題名信息,另一種是把總題名作為叢編題名,把分卷題名作為文獻的正題名。第三,3個及3個以上責任者的著錄方式不同,有的所有責任者同時全部著錄,有的只著錄第一個責任者,其余的用“等”表示,在304字段說明。第四,對副題名、并列題名是否作檢索點不統(tǒng)一。有的就在5—字段著錄檢索點了,有的就沒著錄,有的沒有檢索意義,由于編目員的水平和理解不同,也做了檢索點著錄。以上問題是由于受本館編目傳統(tǒng)、所用軟件系統(tǒng)的影響及編目人員對編目規(guī)則理解不一致等原因造成,也是目前普遍存在的問題。
著錄信息不準確。在館藏數(shù)據(jù)庫中存在著同書異號的,沒有歸類的數(shù)據(jù);書名和作者錄入有錯字的;分類不準確及分類和主題標引不對應的,主題標引沒有輪排的;字段和子字段使用不準確,以及字段的指示符錄入錯誤等問題。有些是由于使用的系統(tǒng)軟件的局限性,如我館使用的韓國軟件ECO,剛開始使用時因系統(tǒng)不穩(wěn)定,造成一段時間編目員之間互相不能查重;有些是由于編目員工作態(tài)度不認真,只使用一種途徑查重。而使用多種途徑查重,確定無誤后,再編目,就會減少同書異號現(xiàn)象的發(fā)生。
一個稱職的編目人員不僅應具備廣博的知識儲備和精湛的專業(yè)技能,還要有嚴謹細致的工作作風和崗位意識,這是評價編目員業(yè)務能力的重要指標。面對當前學科的交叉、文理的滲透,分編人員要有足夠的耐心,運用相關知識認真辨別、準確歸類,決不能模棱兩可妄下定論。對于聯(lián)機下載來的數(shù)據(jù)還需要編目員去甄別、修改,才能轉化成自己的數(shù)據(jù)。
選擇優(yōu)質(zhì)的編目軟件是做好計算機編目工作的前提,它直接關系到書目數(shù)據(jù)庫及編目工作的水平。不同時期,編目軟件有其各自的優(yōu)缺點和局限性。且隨著計算機自動化程度和機讀目錄編制工作的開展和深化,在實際運用中就會出現(xiàn)許多新問題。因此要求更新編目軟件,不斷修訂和完善編目規(guī)則,增加新字段。在系統(tǒng)軟件更新時,對原館藏數(shù)據(jù)庫的轉換由于軟件相互之間的不兼容性,也會造成編目數(shù)據(jù)質(zhì)量的許多問題,如有的字段轉換不過去或不完整,出現(xiàn)亂碼等現(xiàn)象。
原始數(shù)據(jù)都是由分編業(yè)務人員掌握的,相關性也是他們最清楚,但他們不懂計算機程序。而編程人員大多數(shù)不熟悉業(yè)務,對相關性也難于理解,很難編寫出業(yè)務人員使用方便、適應面寬、又很靈活的口徑調(diào)整工具。一些領導對數(shù)據(jù)的認識缺乏嚴肅性和遠見性,將手工處理時的隨意性帶到計算機處理中,長遠下去工作肯定會受到影響。應用需求不明確,影響數(shù)據(jù)完整性和準確性。在系統(tǒng)開發(fā)之初,管理者說不清應用需求,設計目標難明確;系統(tǒng)開發(fā)中,不斷冒出新要求,計劃趕不上變化;系統(tǒng)開發(fā)完后,為了適應眾口難調(diào)狀況,修改、完善周期拖得很長。這樣的系統(tǒng),可利用的程度自然不高。
由于多數(shù)檢索系統(tǒng)沒有進入實際應用階段,數(shù)據(jù)質(zhì)量的控制和監(jiān)督往往被人們忽視。絕大多數(shù)單位在數(shù)據(jù)準備、錄入階段缺乏審核等質(zhì)量控制、監(jiān)督措施。著錄標引的檢查,一般采取自己審核或互相審核的方法,少數(shù)單位也設專人負責質(zhì)量檢查,但實際上由于種種原因,不能將著錄卡片與文件一一對應起來審核,有些問題也難發(fā)現(xiàn)。還有一些單位,由錄入人員看著圖書或僅僅看著預訂目錄往計算機中輸入數(shù)據(jù),質(zhì)量就更無法控制和監(jiān)督了。上述諸因素影響了數(shù)據(jù)質(zhì)量的提高。
在應用程序范圍,必須保證正確無誤地輸入和記錄數(shù)據(jù)。應用程序的數(shù)據(jù)質(zhì)量標準包括:保證數(shù)據(jù)的正確錄入,信息沒有因為自由形式的字段而被掩蓋和飄浮不定。用于探測數(shù)據(jù)差錯的程序是很重要的,這樣可以確保錯誤的拼寫不會導致重復的客戶或產(chǎn)品條目的正確維護。
對于擁有大量客戶記錄的眾多企業(yè),或者甚至是對于那些只擁有普通客戶數(shù)據(jù)庫的企業(yè)來說,常規(guī)的數(shù)據(jù)庫清理對于維護客戶關系都是至關重要的。
數(shù)據(jù)質(zhì)量提高后,在原有信息系統(tǒng)的基礎上,通過數(shù)據(jù)挖掘?qū)I(yè)務信息進行深加工,從中抽取知識或規(guī)律,并從不同的角度進行分析研究,將所發(fā)現(xiàn)的知識運用到信息管理、查詢處理、決策支持、過程控制等許多領域,以構筑自己的競爭優(yōu)勢,擴大自己的營業(yè)額。將這些來自于不同部門的歷史遺留數(shù)據(jù)進行分析、匹配,從而得到關于該客戶詳細、全面、一致而不重復的記錄,并且將其存儲到公司統(tǒng)一的中央客戶數(shù)據(jù)庫中??绮块T綜合分析時,數(shù)據(jù)的相關性也很明確,可以按維劃分、分簇、分類、分層、旋轉,為今后的數(shù)據(jù)挖掘奠定一個良好的基礎。
信息資源的多樣化,導致信息資源渠道的多樣性。只有編目技術才能把雜散的信息資源有序而系統(tǒng)的整合起來,全面而深入的給予揭示。我們未來的編目工作應該從傳統(tǒng)的文獻編目轉向?qū)π畔①Y源的整合,從揭示館藏轉向?qū)π畔①Y源內(nèi)容和完整知識體系的全面、深入的報道和揭示。
在網(wǎng)絡環(huán)境下,編目工作除要保留原有職能外還應兼顧對多樣化的信息資源的揭示、報道與提供。不能單一地處理信息資源的書目數(shù)據(jù),還應多層面地處理文獻和信息資源,包括:書目、目次、條目、規(guī)范名稱、數(shù)據(jù)庫、網(wǎng)站信息、全文信息、相關知識等。
目前的狀況是:成熟的編目工作已經(jīng)陸續(xù)被相關領域應用著,編目工作不再是圖書館的專利。如書商承包編目工作,編制簡單書目數(shù)據(jù),Library Thing之類的圖書網(wǎng)站利用圖書分類和主題標引整序圖書,甚至鏈接到各個大型的圖書館獲取或查詢館藏書目;圖書館資源的數(shù)字化和非MARC格式元數(shù)據(jù)的出現(xiàn),都利用了編目技術和標準。編目工作孤軍奮戰(zhàn)的結果只能是自我消亡,唯一出路是與相關機構合作,與GOOGLE合作就意味著圖書館與相關機構攜手的有力嘗試。只有這樣才能更好地整合信息資源內(nèi)容,從而實現(xiàn)對知識體系全面深入的報道和揭示。
[1]方微,凌麗君.變革時代的文獻編目——第二屆全國文獻編目工作研討會論文集[G].北京:國家圖書館出版社,2010.
[2]張云瑾.數(shù)字化環(huán)境下編目工作的變革[J].科技情報開發(fā)與經(jīng)濟,2006(8).
[3]姚錦芳.淺析影響機讀書目數(shù)據(jù)庫質(zhì)量的因素及解決對策[J].科技情報開發(fā)與經(jīng)濟,2006(22).