朱開忠
(安徽省圖書館,合肥 230001)
安徽省館藏古籍數字化工作探析
朱開忠
(安徽省圖書館,合肥 230001)
古籍數字化是對古籍進行科學保護和有效利用的重要手段,是古籍整理的發(fā)展方向。文章在對安徽館藏古籍數字化情況進行調查的基礎上,分析了古籍數字化工作存在的問題,并提出具體建議。
古籍;古籍數字化;安徽
安徽人文淵藪,典籍藏量豐富。據統(tǒng)計,目前安徽57家圖書館、博物館等公藏單位收藏古籍1022248冊,加上民間所藏,安徽所藏古籍總量120萬冊左右(不包括契約文書、尺牘和誥命等零散文獻)[1]。自上世紀90年代開始,各古籍收藏單位,特別是公共圖書館和高校圖書館積極進行古籍數字化實踐,為更好地保護和利用古籍做出了一定的成績。
(1)古籍書目數據庫建設 “安徽省歷代皖人書目數據庫”[2]??商峁?949年以前皖人著作9833種的書目記錄。這些書目,主要以安徽省圖書館的收藏為主,兼顧安徽省博物館、安徽大學圖書館、安慶市圖書館、桐城市圖書館等單位的收藏。該數據庫可提供題名、責任者、出版項等多種檢索途徑。
“安徽省善本書目數據庫”[3]。收錄宋、元、明、清時期的刻本、稿本、抄本、活字本等古籍善書目記錄6216種。此數據庫的最大特點是收錄范圍廣,它涵蓋了安徽省公共圖書館系統(tǒng)、安徽省大學圖書館系統(tǒng)和安徽省博物館系統(tǒng)等。本數據庫基本反映了安徽省古籍善本書的收藏情況,詳細記錄了古籍善本的外部特征、版本情況、內容信息等,可以用來檢索的途徑有題名、責任者和版本等。
“普通古籍書目數據庫”[4]。收錄安徽省圖書館館藏30余萬冊古籍的書目數據100574條。本數據庫揭示了該館所藏古籍書目全貌,提供題名、責任者、版本等檢索點。
(2)專題數據庫建設 “譜牒文獻專題數據庫”。[5]安徽省圖書館收藏明清家譜400余種3200冊。以徽州地區(qū)居多,多為明代所刊,具有較高的價值。如《汪氏淵源錄》,元泰定年間修,明正德十三年(1518)刻本,全國僅存兩套,內載有關黃山和西湖的大量藝文,有刻工姓名,十分珍貴。休寧《商山吳氏家譜》,為海內孤本?!缎輰幋魇献谧V》,刻印精美,內有多幅精品版畫。另有如包拯家族《合肥包氏支譜》,李鴻章家族《合肥李氏宗譜》、龔氏所修《合肥龔氏宗譜》等名人名譜。該數據庫整合了安徽省圖書館收藏的、包括部分新修家譜在內的900余條家譜數據,配備了較為完善的檢索功能。
“安徽刻書專題數據庫”[6]。安徽歷代刻書深邃而廣博,涉及社會生活和文化生活的所有領域,不僅流派紛呈、成績斐然,而且英才輩出,影響巨深。安徽省圖書館珍藏的地方刻書文獻,見證了安徽刻書的興盛與發(fā)展,反映了安徽地區(qū)在印刷史、科技史、經濟史、社會學史等諸多方面的流變與發(fā)展,為多學科專家學者的研究提供了翔實可信的史料依據。該數據庫掃描書影1201幅,并編制相關款目,整理相關文檔,共212MB。
“桐城文派專題數據庫”[7]。桐城古文自成特色,綿延二百余年,縱貫整個清代文壇,是清朝最為流行、也是最大的一個散文派別,影響之大,波及范圍之廣,為歷來所罕見。該庫搜集整理了902位桐城派名家資料,這些資料按規(guī)定格式建成專題數據庫,供讀者在網上檢索。
“安徽地方志專題數據庫”[8]。收集整理安徽方志446種,以CM方式制作在網上發(fā)布。該數據庫分3級頁面,11個字段,可以提供名稱、年代、版本、關鍵詞等檢索點。
其它如安徽大學圖書館制作的“館藏古籍題錄數據庫”和“古籍電子書籍”[9],安徽中醫(yī)學院圖書館制作的“新安醫(yī)學”[10],皖西學院圖書館制作的“古籍特藏書目”[11]等專題庫,都為古籍數字化工作提供了較好的范例。
安徽省館藏古籍數字化建設已形成了一定的規(guī)模,具有一定的特色,取得了一定的效益。但與江蘇、浙江等發(fā)達地區(qū)相比,還存在較大的差距:
(1)經費投入不足 存世古籍主要收藏于公共圖書館、高校圖書館、博物館等文物保護單位,這些單位屬于國家全額撥款的事業(yè)單位,但經費投入往往不足。特別是有些單位的領導對古籍重要性的認識不足,沒有古籍保護意識,不愿意在古籍保護和古籍數字化方面投入人力、物力和財力。
(2)數字化內容重復 這是在全國范圍內普遍存在的問題,安徽省也相當突出。目前來看,全國還沒有一個統(tǒng)一的機構來管理和運作古籍數字化工作,各收藏單位和開發(fā)商都單純地從自身角度來進行數字化選題,造成的內容重復現象相當嚴重。以《四庫全書》為例,1998年一年內,就有上海人民出版社與香港迪志文化發(fā)展公司聯合開發(fā)的電子版,有武漢大學出版社的電子版,有湖南電子音像出版社的電子版等幾種版本問世。近年來,超星圖書館與國家圖書館等單位在古籍數字化的選題上也有重復的地方。經費投入本來就不足,重復建設更造成古籍數字化建設進展緩慢。
(3)數字化產品格式不統(tǒng)一 相對于普通中文文獻來說,古籍數字化的標引和規(guī)范控制更為復雜,對技術要求更高,是文獻數字化的特例。數字化古籍改變了文獻的物理形態(tài),深入到它所包含的信息單元,并將這些信息單元進行分合與重組,是紙本古籍的更高級形式。因此,優(yōu)質的古籍數字化產品能向讀者提供互動性更強、針對性更高、內容更豐富的服務。目前古籍數字化開發(fā)工作的主要現狀是各自為政,格式不統(tǒng)一,而且大多需要專用的閱讀器才能閱讀使用。常用的格式有txt、doc和html,其它還有如exe、pdg、ebk、edb、wdl等,安徽省館藏古籍數字化建設也部分存在這種情況。這種狀況為讀者和用戶造成了極大的不方便,也為資源共享設置了很大的障礙。
(4)數字化產品利用率低 囿于經費投入、工作人員工作態(tài)度和本身素質,有些數字化古籍的質量較差。除此以外,網絡運行環(huán)境,讀者的閱讀和使用習慣等也影響著數字資源的使用。這些因素導致安徽館藏古籍數據庫的利用率一直較低。
書是為了用的。存世古籍是先人留給我們的珍貴文化遺產,保護和利用好這些典籍是我們義不容辭的責任。古籍數字化產品存在的問題需要我們去研究和探討,在數字化實踐中去逐步解決和規(guī)范。
(1)統(tǒng)籌規(guī)劃,資源共享 古籍數字化是一項系統(tǒng)工程,應該充分考慮、合理規(guī)劃。首先,項目開發(fā)者要根據“用戶第一”的原則,充分進行市場調研,對自身開發(fā)能力和發(fā)展目標合理定位,選擇適合自己的選題,以保證開發(fā)出來的產品滿足用戶需求。選題確定后,開發(fā)者要根據選題進行信息和資料搜集,包括責任者信息、版本類型、版本年代、版式、字體、刊刻地點、刻工姓名、批校題跋、文獻價值、現有各種相關專題資料等都是搜集的對象。這些工作做好之后,就要對數字化目標進行采樣、技術處理、試用、修改、完善,直到正式通過網絡發(fā)布。各收藏單位應抱著合作共建、聯合開發(fā)的態(tài)度,結合資源優(yōu)勢,進行橫向聯合,合理分配選題,與收藏單位、高科技公司和投資人等開展多方位的合作。數字化古籍產品的使用對象畢竟有限,與其大家都同時開發(fā)某一種數字化產品,不如團結協(xié)作、互通有無、避免重復,突出特色和優(yōu)勢。條件許可的話,可以成立安徽甚至是全國古籍數字化建設工作小組,對安徽和全國的古籍數字化工作進行統(tǒng)一管理,統(tǒng)籌規(guī)劃,最終實現資源共享。
(2)以安徽地方文獻作為數字化建設的首選 安徽文化古老而又深厚,各館可根據自身館藏情況,分工協(xié)作,優(yōu)先從反映安徽文化特色的項目入手,進行館藏數字化建設。先期工作應該構建出一個數字化“安徽古籍文獻”框架,見圖1。
圖1 安徽古籍文獻框架
這一構架可以涵蓋安徽省館藏地方文獻的精華,也在一定程度上代表了安徽深厚的文化底蘊。
(3)充分采納古籍專家的意見 古籍數字化項目確定后,由誰占主導地位來組織實施,是古籍數字化工作必須思考的問題,也是人們容易誤解的問題。有人認為古籍數字化就是將古籍通過掃描或照相方式搬進電腦,然后通過技術處理將結果輸出,供人們在計算機上閱讀。這種看法是片面的,對于以文字為主的古籍文獻來說,其數字化絕不是單純的紙質版本的翻版和簡單的文獻載體的轉換,而是融入學術研究成果的工作。掃描是必要的,但掃描只是數字化的前期準備。有實踐表明,掃描工作量大約只占數字化總工程的2%,大量的工作還是其標引與發(fā)布。應該說古籍數字化屬于古籍整理和學術研究范疇,涉及版本、標點、校讎等一系列的學問。技術是形式,古籍內容才是本質和核心,只有熟悉古籍內容的專家學者才有能力決定古籍數字化的基本思路和總體構架。因此,古籍數字化必須以相關領域的學者即內容專家為主導,主要由他們來決定數字化的內容、標引的深度、相關檢索工具的配置等。
(4)注重數字化古籍的檢索功能 數字化產品的功能是衡量其質量高低的重要標準。一個高質量的古籍數字化產品,提供給用戶的不僅僅是相關知識寶庫,而且要具有強大的研究支持功能和卓有成效的研究手段。目前的古籍數字化建設,還沒有建立統(tǒng)一、規(guī)范的數據交換格式[12],但是有一些標準和規(guī)范還是可以參照的,如《古籍描述元數據著錄規(guī)則》、《古籍描述元數據規(guī)范》、《地方志描述元數據規(guī)范》、《地方志描述元數據著錄規(guī)則》[13]等。這些規(guī)則和規(guī)范,為我們策劃和操作古籍數字化項目提供了一定的標準,也為數字化產品研究支持功能的實現提供了保障。如今,古籍數字化用戶對產品的要求已從單一檢索變?yōu)槎嘣獧z索,從定向檢索變?yōu)殛P聯檢索,從靜態(tài)檢索變?yōu)閯討B(tài)檢索,智能化檢索已成為必然。實施古籍數字化項目時,我們應借鑒現有的規(guī)范和規(guī)則,充分考慮其檢索和研究支持功能,如古籍版本的自動校對,古籍原文的自動斷句、自動標點、自動翻譯,古籍中異體字的顯示、生僻字讀音的自動標注,字典、詞典、中西歷對照表、辭典等各種工具書和輔助工具庫的配備,以及相關研究成果的網上鏈接等,以實現古籍內容的數字化和多種有效而又強大的檢索處理工具的完美統(tǒng)一。隨著古籍數字化研究的深入,進行語義識別和檢索成為古籍數字化研究的熱點[14]。學者們認為,要系統(tǒng)地解析古籍文獻資源的組織方法和標引方法,借鑒普通文獻主題標引和分類標引的相關知識,嘗試編制適合知識庫建設的古籍分類表和古籍概念關系體系,以更好地推進數字化古籍資源的全面標引和檢索。另一方面,要改善網絡環(huán)境,搭建優(yōu)質的古籍數字資源檢索平臺,并加強管理和維護,為讀者方便、靈活、快捷地訪問和查找所需資源提供保障。
(5)加強對古籍數字化產品的宣傳推廣 上文提到,目前安徽館藏數字化產品的利用率不高,這與宣傳力度有很大關系。我們應該通過多種方式,爭取各種機會,大力宣傳古籍數字化資源,引導讀者使用或優(yōu)先使用現有的數字化文獻。比如在本館網站顯著界面上設立專門的檢索平臺;對新到館讀者特別是古籍讀者進行針對性培訓;設立在線咨詢,及時解答和處理讀者在使用過程中遇到的各類問題。印發(fā)宣傳手冊,介紹數字資源的使用方法等。
[1]朱開忠.關于安徽古籍存藏與保護情況的調查[J].圖書館理論與實踐,2009,(5):86-89.
[2]安徽省圖書館.安徽省地方文獻書目查詢[DB/OL].[2011-11-12].http://opacvod.ahlib.com/IlaswebInfo_DB4.html.
[3]安徽省圖書館.安徽省善本書目數據庫[DB/OL].[2011-11-12].http://opacvod.ahlib.com/IlaswebInfo_DB5.html.
[4]安徽省圖書館.普通古籍書目數據庫[DB/OL].[2011-11-12].http://opacvod.ahlib.com/IlaswebInfo_DB6.html.
[5]安徽省圖書館.譜牒文獻專題數據庫[DB/OL].[2011-11-12].http://www.ahlib.com/ah/gjb/gcjp-index.htm.
[6]安徽省圖書館.安徽刻書專題數據庫[DB/OL].[2011-11-12].http://www.ahlib.com/ah/ahks/index.html.
[7]安徽省圖書館.桐城文派專題數據庫[DB/OL].[2011-11-12].http://cm.ahlib.com:9080/tcwp/.
[8]安徽省圖書館.安徽地方志專題數據庫[DB/OL].[2011-11-12].http://cm.ahlib.com:9080/ahdfz/.
[9]安徽大學圖書館.館藏古籍題錄數據庫[DB/OL].[2011-11-12].http://www.lib.ahu.edu.cn/modules.php?name=tsk&l_op=viewlinkjj&lid=3008.
[10]安徽中醫(yī)學院.新安醫(yī)學[DB/OL].[2011-11-12].http://xinan.ahtcm.edu.cn.
[11]皖西學院.古籍特藏書目[DB/OL].[2011-11-12].http://211.70.171.1/shownews.asp?news_id=94.
[12]周 進,宋登漢.中文古籍數字化開發(fā)研究綜述[J].圖書情報知識,2010,(6):40-49.
[13]康爾琴.公共圖書館古籍數字化的實踐與思考[J].圖書館工作與研究,2010,(8).
[14]郭偉玲,戴艷清.論古籍數字化的檢索問題[J].圖書館理論與實踐,2011,(10).
On the Digitization of Ancient Books in Libraries of Anhui Province
ZHU Kai-zhong
(Anhui Provincial Library,Hefei 230001,China)
The digitalization of ancient books is an important way to scientifically protect and effectively utilize the ancient books,and it is also a development trend of ancient books collection.Based on a survey of the status quo of the digitalization of ancient books in libraries of Anhui Province,this paper points out the current problems in this respect and gives some relevant suggestions.
ancient books;digitalization of ancient books;Anhui Province
G250.74
A
1008-3634(2012)03-0145-04
2011-12-30
朱開忠(1970-),男,安徽六安人,副研究員。
(責任編輯 劉 翠)