張小燕
(江西省圖書館 南昌 330046)
古代典籍是中國歷史文化遺產(chǎn)最為重要的物質(zhì)載體。從前,古籍收藏單位注重古籍整理和保護,隨著現(xiàn)代信息技術的發(fā)展,各古籍收藏單位開始對古籍進行數(shù)字化加工、整理以便專家學者研究利用。那么,什么是古籍數(shù)字化?簡單來說,古籍數(shù)字化就是利用掃描儀、照相機等設備將實體古籍轉換成電子數(shù)據(jù),接著利用現(xiàn)代計算機技術對電子數(shù)據(jù)進行整理與發(fā)布,形成一個龐大精深的連續(xù)性、開放式的古籍數(shù)據(jù)庫,供大眾進行海量信息查詢、字詞頻分析,使古籍的閱讀、翻檢大為便利,提高專家學者研究古籍的工作效率[1]。古籍數(shù)字化的意義有:一是解決了古籍善本藏和用的矛盾;二是有利于地方古籍文獻的保護;三是有利于地域文化的建設;四是能為科研工作提供有效服務。
江西古稱文獻大邦,存世典籍浩如煙海。作為全省規(guī)模最大、藏書最多的綜合性公共圖書館,江西省圖書館以古籍珍善本特色藏書著稱,是國家古籍重點保護單位。古籍數(shù)字化是江西省圖書館古籍保護的一項基礎性工作,從2003年開始建設書目數(shù)據(jù)庫到現(xiàn)在建設全文數(shù)據(jù)庫,江西省圖書館一直致力于保護和利用好贛鄱大地上的珍貴古籍,繼承和發(fā)揚傳統(tǒng)文化,提升江西文化軟實力。2015開始,江西省圖書館開始實施江西省珍貴古籍數(shù)字化項目——“江西珍貴古籍數(shù)字資源庫”的建設。
20世紀80年代,臺灣“中央圖書館”率先開始建立古籍書目數(shù)據(jù)庫。該數(shù)據(jù)庫可以提供題名、作者等多種查詢途徑。遼寧省圖書館是大陸地區(qū)最早開始建立古籍書目數(shù)據(jù)庫的公共圖書館,于1997年建成“普通古籍書目數(shù)據(jù)庫”,錄入數(shù)據(jù)3萬余條[2]。1999年,中國大陸最大的古籍收藏單位國家圖書館在古籍書目數(shù)據(jù)庫方面做了一些探索。緊接著,我國圖書館界開展了如何建立古籍書目數(shù)據(jù)庫的熱烈討論和實踐,上海圖書館、浙江圖書館、山東省圖書館、南京圖書館等公共圖書館紛紛開始建設書目數(shù)據(jù)庫[3]。90年代末開始,隨著古籍數(shù)字化相關技術的發(fā)展和成熟,我國公共圖書館界古籍數(shù)字化又向前邁進了一大步,各地公共圖書館在古籍書目數(shù)據(jù)庫建設的基礎上,開始進行古籍全文數(shù)據(jù)庫建設[4]。古籍全文數(shù)據(jù)庫有三種模式,一是圖像模式,二是文字模式,三是圖文模式。圖像模式是利用電子掃描技術將古籍以圖片的格式存入數(shù)據(jù)庫,這種模式可以保持古籍的原貌,處理技術相對簡單,一般可進行書目檢索;文字模式是圖像模式的升華,在提供古籍原貌圖片的同時還提供古籍全文的文字版,可以對古籍內(nèi)容進行檢索,實現(xiàn)精確查找;圖文模式是圖像模式和文字模式的結合,既可看古籍原貌,又可進行內(nèi)容檢索[5]。
雖然大陸地區(qū)古籍數(shù)字化起步晚,但由于國家重視,近十幾年來發(fā)展迅速。國家有關機構最早提到古籍數(shù)字化是2006年4月,全國古籍整理出版規(guī)劃領導小組制訂的《國家古籍整理出版“十一五”(2006—2010年)重點規(guī)劃》提到“運用現(xiàn)代技術,開展古籍數(shù)字化、影印出版和縮微工作,促進古籍的有效利用”[6]。2007年1月,國務院辦公廳下發(fā)《關于進一步加強古籍保護工作的意見》,其中明確要求制定古籍數(shù)字化標準,規(guī)范古籍數(shù)字化工作,建立古籍數(shù)字資源庫。2011年8月,文化部發(fā)布《關于進一步加強古籍保護工作的通知》,要求加快古籍的數(shù)字化建設。
在一系列政策的支持下,我國公共圖書館界更加重視古籍數(shù)字化,相關工作開展得如火如荼,古籍數(shù)字化逐步走向規(guī)?;⒁?guī)范化、成熟化。2012年5月22日,由文化部主辦,國家圖書館、國家古籍保護中心承辦的“全國古籍數(shù)字化建設與服務工作研討會”在北京召開,國家圖書館相關負責人和各省、自治區(qū)、直轄市省級圖書館館長及有關專家出席研討會,就全國古籍數(shù)字化合作服務機制、國內(nèi)外古籍數(shù)字化保護利用、古籍數(shù)字化成果共享方式和古籍數(shù)字化標準規(guī)范等問題進行了充分討論[7]。在國家政策的扶持下,全國性古籍保護工程“中華古籍保護計劃”正式啟動,在此框架下,國家圖書館(國家古籍保護中心)聯(lián)合各省級公共圖書館古籍保護中心共同開展了“全國古籍普查基本數(shù)據(jù)庫”“中華古籍數(shù)字資源庫”“國家珍貴古籍名錄”等的建設。近幾年來,數(shù)字人文在古籍數(shù)字化資源深度開發(fā)利用中的應用不斷被提及,古籍數(shù)字資源庫正在發(fā)生從只能達到基于字符匹配的全文檢索層次到從概念或知識層次對文獻進行挖掘利用的轉變[8]。目前,國家圖書館、上海圖書館、天津圖書館等聯(lián)合在線發(fā)布全文古籍數(shù)字資源,資源量在我國公共圖書館界位列前茅。國家圖書館發(fā)布了1.7萬部古籍,上海圖書館發(fā)布了6 000種家譜,天津圖書館發(fā)布了1 000部古籍[9],而江西省圖書館全文古籍數(shù)字資源是空白。據(jù)統(tǒng)計,江西省古籍總藏量100萬余冊,其中善本8萬余冊,分散收藏于文化、文物、教育、科研和檔案等不同行業(yè)和系統(tǒng)[10]。由于人才匱乏、經(jīng)費不足、環(huán)境污染等問題,一些珍貴古籍破損嚴重,其整體保存情況令人憂心。為了做好古籍保護工作,開發(fā)古籍的文獻價值,填補古籍全文數(shù)據(jù)庫的空白,縮小與外省公共圖書館古籍數(shù)字化成果數(shù)量的差距,2014年10月,江西省委宣傳部下?lián)軐m椯Y金開展江西珍貴古籍數(shù)字化項目建設工作。2015年1月,在江西省文化廳的統(tǒng)一部署下,按照統(tǒng)一規(guī)劃、統(tǒng)一標準、合作共建、資源共享的原則,由江西省圖書館牽頭組織全省各有關古籍收藏單位共同實施,江西珍貴古籍數(shù)字化項目——“江西珍貴古籍數(shù)字資源庫”的建設工作正式拉開了帷幕。
“國家珍貴古籍名錄”數(shù)字化是“中華古籍保護計劃”工作的一部分,是為了建立完備的珍貴古籍檔案而開展的,由文化部擬定,報國務院批準后公布的一份名錄。從2008年3月1日第一批《國家珍貴古籍名錄》公布到2016年5月24日第五批《國家珍貴古籍名錄》公布,我國已公布國家珍貴古籍名錄12 274部[11],收錄范圍是1912年以前書寫或印刷的,以中國古典裝幀形式存在,具有重要歷史、思想和文化價值的珍貴古籍[12],是最具代表性的中華民族典籍文化遺產(chǎn)。江西省古籍入選國家珍貴古籍名錄的共有125部[13],包括宋王安石撰,宋紹興二十一年兩浙西路轉運司王玨刻元明遞修本《臨川先生文集》;宋歐陽修撰,宋慶元二年周必大刻本《歐陽文忠公集》;宋歐陽修、宋祁等撰《唐書》225卷;宋鄭樵撰,元大德三山郡庠刻本《通志》;宋司馬光撰,元胡三省音注,元刻本《資治通鑒》;明金幼孜撰,明金昭伯編,明成化四年金昭伯刻明弘治六年重修本《金文靖公集》;宋黃庭堅撰,明弘治葉天爵刻嘉靖六年喬遷、余載仕重修本《豫章黃先生文集》;元馬端臨撰,明嘉靖三年司禮監(jiān)刻本《文獻通考》;明林庭修,周廣撰,明嘉靖四年刻十七年增修三十八年遞修本《江西通志》;宋文天祥撰,明嘉靖三十一年刻本《文山先生全集》;明宋應星撰,明崇禎間自刻本《宋應星四種》;明泥金寫本《太上洞玄靈寶無量度人上品妙經(jīng)》。這些古籍都具有重要的文學價值、史學價值和版本價值,還有很多古籍具有極高的藝術價值,堪比孤本,屬稀世珍品。為了保護和傳承江西這些極其珍貴的古籍資源,“江西珍貴古籍數(shù)字資源庫”根據(jù)珍貴性、地方性、系統(tǒng)性原則,選擇了江西入選國家珍貴古籍名錄的116部古籍文獻作為建設對象。
2.2.1 數(shù)據(jù)采集
為了最大限度保護古籍,江西省圖書館在開展“江西珍貴古籍數(shù)字資源庫”建設前,對市面上主流的專業(yè)古籍掃描設備進行了對比研究,選擇了對古籍文獻沒有損傷的德國BOOKEYE非接觸式線性CCD書刊掃描儀BOOKEYE4 A1 A2 A3生產(chǎn)型,滿足A1—A3幅面的掃描需求。在確保古籍文獻安全的前提下,江西省圖書館分階段、分批次對古籍進行掃描,將其轉換成數(shù)字圖像。數(shù)據(jù)采集過程嚴格按照國家古籍保護中心2014年版的《古籍數(shù)字化工作手冊》來執(zhí)行[14]。
江西珍貴古籍頁面主要有筒子葉、半葉、雙半葉等類型,根據(jù)這些珍貴古籍實際的物理狀態(tài),“江西珍貴古籍數(shù)字資源庫”的建設選擇雙半葉進行圖像采集,數(shù)據(jù)采集掃描參數(shù)設置為彩色掃描色深24,光學分辨率600DPI,輸出TIFF格式圖像文件保存。在數(shù)據(jù)采集過程中注意防護光源,避免透光或反射光的影響。線性掃描后的圖像清晰,采集到的圖像文件色彩平衡,頁碼連續(xù),沒有重頁、缺頁,錯頁、折頁等情況。
2.2.2 圖像加工
清晰完整的古籍再現(xiàn),是古籍數(shù)字資源庫的建設重點,對圖像文件進行后期處理得好與壞,直接關系到古籍數(shù)字資源庫的建設質(zhì)量和讀者的閱讀體驗。因此,江西省圖書館對圖像加工環(huán)節(jié)進行嚴格把控。在“江西珍貴古籍數(shù)字資源庫”建設過程中,江西省圖書館使用PHOTOSHOP軟件對圖像文件進行后期加工。在圖像加工過程中,江西省圖書館在未改變原掃描圖像分辨率、色彩、格式等情況下對方向不正確的圖像進行旋轉還原,消除了書脊中縫陰影,對圖像進行糾偏處理、圖像拼接、去污處理等。
糾偏處理。數(shù)據(jù)采集過程中因為操作者沒有將古籍放置平行整齊導致掃描出來的圖片出現(xiàn)傾斜,需要后期進行糾偏處理,使版心居中,頁面端正。
圖像拼接。圖像拼接在版面較大的古籍文獻數(shù)字化過程中較為常見,一般線裝書不需要拼接,它們頁面圖像幅面大多在A2內(nèi),而經(jīng)折裝、卷軸等裝幀形式的古籍文獻掃描出來的圖像均需拼接。圖像拼接的好處是可將分次掃描出的圖像文件整合在一起,展現(xiàn)古籍原貌,方便讀者閱覽。
去污處理。古籍文獻經(jīng)過掃描得出的圖像文件一般不對內(nèi)容進行修改,通常盡量展現(xiàn)古籍的原貌。但古籍文獻在掃描時,通常會因為空氣中的灰塵、古籍脫落的紙屑等掉在掃描平臺上,使圖像文件產(chǎn)生黑點或陰影,嚴重影響古籍圖像的美觀和閱讀效果。因此,需要對圖像文件進行去污處理,將古籍頁面上不存在的污點進行消除,使得頁面整潔清晰。
裁切和水印處理。由于掃描出的圖像文件容量較大,在保證古籍內(nèi)容完整的基礎上,對圖像文件進行糾偏、拼接、去污等一系列加工后,還要對較寬的頁邊距進行裁切。因“江西珍貴古籍數(shù)字資源庫”建成后將在互聯(lián)網(wǎng)上對讀者開放,為防止惡意下載和商業(yè)牟利,江西省圖書館在圖像加工時進行水印處理,將江西省圖書館的館徽添加到頁面中,其顏色與頁面顏色統(tǒng)一,不影響古籍閱讀。
圖像命名。圖像文件命名需要科學規(guī)范,顯示完整路徑,區(qū)分其唯一性。“江西珍貴古籍數(shù)字資源庫”命名規(guī)則如下:加工記錄標識號(8位)+古籍冊號(4位)+圖像文件順次號(4位)。其中,加工記錄標識號(8位)由國家圖書館給的單位代碼(1901)和古籍數(shù)字化流水號(4位)組成;每部古籍有多冊實體,古籍冊號每冊命名為4位數(shù)字,從0001開始,依次按流水號命名;圖像文件順次號是以冊為單位進行數(shù)字化,從古籍封面、前護、正文、后護、封底等依次加工。
2.2.3 元數(shù)據(jù)著錄
古籍元數(shù)據(jù)的著錄是古籍數(shù)字資源庫建設的基礎,只有擁有統(tǒng)一結構的古籍元數(shù)據(jù),各古籍數(shù)字化單位的古籍數(shù)字化成果才能實現(xiàn)共建共享。國家圖書館(國家古籍保護中心)建議全國各公共圖書館按照2014年修訂的《古籍數(shù)字化工作手冊》中元數(shù)據(jù)著錄規(guī)范來進行元數(shù)據(jù)著錄?!豆偶當?shù)字化工作手冊》規(guī)定的著錄內(nèi)容包括文獻整理登記、描述元數(shù)據(jù)、管理元數(shù)據(jù),著錄字段包括加工記錄標識號、名錄號、普查編號、書目記錄標識號、索書號、分類、題名、卷次、責任者、版本、冊數(shù)、板框、版式、合訂狀態(tài)、裝幀形式、批跋、館藏單位、制作單位等。規(guī)范元數(shù)據(jù)的著錄,是建立數(shù)據(jù)庫的基礎,是進行數(shù)據(jù)標引和數(shù)據(jù)關聯(lián)的前提,是數(shù)字資源庫實現(xiàn)信息檢索和知識挖掘的關鍵。為了將來能和各級公共圖書館實現(xiàn)數(shù)據(jù)共建共享,江西省圖書館在“江西珍貴古籍數(shù)字資源庫”的建設中,按照《古籍數(shù)字化工作手冊》元數(shù)據(jù)著錄要求對古籍提名、卷次、責任者、版本、頁碼等各字段進行了客觀詳細的描述,以便后期生成一個規(guī)范化、標準化、結構化的古籍資源關系數(shù)據(jù)庫,實現(xiàn)智能檢索、排序、數(shù)據(jù)挖掘等功能。
2.2.4 數(shù)據(jù)發(fā)布和利用
江西省圖書館借鑒國家圖書館(國家古籍保護中心)古籍建庫經(jīng)驗和標準,依托計算機互聯(lián)網(wǎng)大數(shù)據(jù)技術服務平臺,對珍貴古籍數(shù)字資源進行整合,最終建成“江西珍貴古籍數(shù)字資源庫”。通過古籍數(shù)字資源共享和發(fā)布平臺,實現(xiàn)了江西省全省古籍數(shù)字資源整合、信息發(fā)布,為讀者提供資源檢索、信息查閱和古籍專題研究服務。
服務架構?!敖髡滟F古籍數(shù)字資源庫”采用B/S多重結構模式建設。與傳統(tǒng)C/S結構相比,B/S模式具有分布式的特點,不受客戶端不同操作系統(tǒng)的影響,只需在圖書館搭建好服務器,安裝SQL標準化數(shù)據(jù)庫,即可通過瀏覽器隨時隨地訪問古籍數(shù)字資源服務,方便提高圖書館數(shù)字化古籍資源服務的廣度和深度,使更多讀者獲取自己所需的數(shù)字資源。
云平臺。云計算技術已經(jīng)成為圖書館不可缺少的技術之一。它提供的模擬計算機系統(tǒng),可動態(tài)配置內(nèi)存、CPU、硬盤,隨時搭載不同操作系統(tǒng),充分發(fā)揮出數(shù)據(jù)庫的性能,使資源得到充分調(diào)度,也使管理者能快速搭建平臺,提供系統(tǒng)的運行環(huán)境,并可對各個系統(tǒng)進行統(tǒng)一管理、維護。“江西珍貴古籍數(shù)字資源庫”采用分布式云化技術、服務器端采用Windows系統(tǒng)、.NET環(huán)境語言,創(chuàng)建了擁有強大的穩(wěn)定性、兼容性、安全性和靈活性的分布式古籍數(shù)字云平臺。
數(shù)據(jù)分發(fā)。古籍數(shù)字資源的特點決定了古籍數(shù)字資源庫必然是擁有海量的數(shù)據(jù)。數(shù)據(jù)分發(fā)服務DDS由對象管理組織(OMG)制定的分布式實時網(wǎng)絡中間件技術規(guī)范,它遵循了HLA及CORBA標準。DDS強調(diào)以數(shù)據(jù)資源為核心,采用發(fā)布/訂閱總分體系架構,提供了豐富的數(shù)據(jù)訪問服務質(zhì)量策略,能保障古籍數(shù)字資源分布式管理標準,對數(shù)據(jù)源進行實時、高效、靈活地下發(fā),可響應各種分布式實時服務需求。數(shù)據(jù)分發(fā)服務DDS采用的分發(fā)中間件是一種輕便的、能夠提供實時信息傳送的中間件技術,這種技術有效支撐了古籍大數(shù)據(jù)服務,多異地同步構建分發(fā)的需求。
前端展示?!敖髡滟F古籍數(shù)字資源庫”前端展示平臺采用ASP.NET技術,創(chuàng)建后綴名為ASPX的動態(tài)Web頁面文件。ASP.NET是一個開源的跨平臺的開發(fā)框架,基于分布式云化服務的Web展示設計應用,是微軟公司推出的新一代腳本語言,目前最新版本為ASP.NET Core。它所有開發(fā)框架都是基于平臺應用程序的需求。它的開發(fā)框架囊括了驗證管理、緩存管理、狀態(tài)管理、調(diào)試管理和部署管理等全部應用級功能。它的分布式特點保證了ASP.NET既可以部署在公有云、私有云上也可以部署在本地服務器上。另外,它使得平臺構建更加精簡和模塊化,具有跨平臺、云優(yōu)化的特點,其程序設計代碼與最終展示頁面的內(nèi)容相互隔離,這使得網(wǎng)頁表現(xiàn)形式更豐富多彩,同時也使平臺應用看起來更規(guī)范、更簡單。
“江西珍貴古籍數(shù)字資源庫”是依托江西省圖書館、星子縣文物管理所、廬山圖書館、修水縣圖書館、贛州市圖書館、樂平市圖書館、景德鎮(zhèn)市圖書館、萍鄉(xiāng)市圖書館、南康市圖書館等九家“全國古籍重點保護單位”的豐富館藏而建成。建成的數(shù)字資源庫目前只在九家共建單位之間共享?!敖髡滟F古籍數(shù)字資源庫”也提供遠程訪問模式,只要是以上九家共建單位的有效注冊讀者,就可憑讀者證(身份證)進行統(tǒng)一用戶認證,認證后可登陸到資源庫訪問數(shù)字資源。目前,“江西珍貴古籍數(shù)字資源庫”只在九家共建單位之間共享,是為了促使更多的古籍收藏單位加入到古籍數(shù)字化的隊伍當中。長期以來,公共圖書館過分強調(diào)古籍保護,將古籍作為自己的館藏特色,不愿讓館藏古籍呈現(xiàn)在大眾面前。如果這些古籍收藏單位想共享江西古籍數(shù)字化成果,就要加入江西省古籍數(shù)字化的隊伍,成為合作共建的一員,這在一定程度上促進了江西古籍數(shù)字化規(guī)模的壯大。在這種模式下,隨著古籍收藏固有觀念和保護壁壘不斷被打破,參與共建的古籍收藏單位必會日益增多,江西古籍數(shù)字資源將不斷增加。當共建單位發(fā)展到一定規(guī)模時,江西古籍數(shù)字化的資源將會考慮在互聯(lián)網(wǎng)開放,讓讀者不受時間、空間、讀者身份的限制就能訪問江西珍貴古籍數(shù)字資源。
江西省圖書館在“江西珍貴古籍數(shù)字資源庫”的建設和服務中,發(fā)現(xiàn)江西省公共圖書館古籍數(shù)字化還存在缺乏省級層面的宏觀管理和統(tǒng)一規(guī)劃、缺乏基于互聯(lián)網(wǎng)的統(tǒng)一檢索導航平臺、古籍數(shù)字化工作發(fā)展不均衡、古籍數(shù)字化技術較為薄弱、缺乏古籍數(shù)字化復合型人才等問題。
江西省公共圖書館館藏古籍數(shù)量眾多,各圖書館的古籍數(shù)字化工作主要是根據(jù)其館藏古籍資源有選擇、有目的地進行,特色濃郁,封閉性較強。20世紀開始,江西省公共圖書館開始了古籍數(shù)字化的摸索嘗試,至今已經(jīng)建成了一定規(guī)模的古籍數(shù)字資源。由于江西省公共圖書館古籍數(shù)字化工作缺乏省級層面的宏觀管理和統(tǒng)一規(guī)劃,各公共圖書館各行其是,缺乏溝通交流,導致古籍數(shù)字化重復建設嚴重,極大浪費人力、物力和財力。因此,結合江西省古籍數(shù)字化的現(xiàn)狀,江西省公共圖書館古籍數(shù)字化的后續(xù)開展,應該在江西省圖書館的統(tǒng)一規(guī)劃下建設古籍數(shù)字資源庫。同時,江西省圖書館應在國家圖書館的統(tǒng)一規(guī)劃和指導下,加強與各基層公共圖書館的交流,統(tǒng)籌江西省各基層公共圖書館開展古籍資源庫建設任務,這樣才能有效避免重復建設的現(xiàn)象。
雖然國家圖書館(國家古籍保護中心)2012年編制了《古籍數(shù)字化工作手冊》(試用本),2014年對其進行了修訂,對著錄規(guī)范、字庫標準、分類標準、格式規(guī)范、系統(tǒng)規(guī)范、長期保存規(guī)范等都有詳細的說明,但也只是建議各公共圖書館在古籍數(shù)字化時參考執(zhí)行。江西省公共圖書館在古籍數(shù)字資源庫建設過程中采用的著錄標準、技術規(guī)范類型各異,難以統(tǒng)一,致使各數(shù)據(jù)之間無法實現(xiàn)數(shù)據(jù)交換和格式交換,導致缺乏基于互聯(lián)網(wǎng)的古籍數(shù)字資源的統(tǒng)一檢索導航平臺。因此,江西省圖書館應該在省內(nèi)有關部門的推動下,確保各基層公共圖書館古籍數(shù)字化按照國家圖書館發(fā)布的統(tǒng)一的標準規(guī)范執(zhí)行;同時整合省內(nèi)公共圖書館已經(jīng)建設完成的古籍數(shù)字資源,實現(xiàn)統(tǒng)一平臺的分類導航和集中檢索,方便讀者對古籍的研究和利用。這樣做的好處是,江西省統(tǒng)一的古籍數(shù)字資源檢索導航平臺可以和國家圖書館古籍數(shù)字資源平臺對接,實現(xiàn)國內(nèi)古籍數(shù)字資源統(tǒng)一檢索。
江西省各地區(qū)因經(jīng)濟水平差異,經(jīng)濟發(fā)達地區(qū)的古籍數(shù)字化工作開展得較好,欠發(fā)達或落后地區(qū)的古籍數(shù)字化工作進展緩慢。江西省有很多基層公共圖書館因為設備技術落后,很多珍貴古籍不能及時通過數(shù)字化進行整理,無法加強保護和利用。從全國層面看,江西省公共圖書館古籍數(shù)字化整體發(fā)展水平較為落后。江蘇省古籍數(shù)字化加工單位已達到30余家,占了江蘇省各級古籍館藏單位總數(shù)的50%以上。江蘇省各加工單位建設的古籍數(shù)字資源庫共有69個,最多的是書目數(shù)據(jù)庫,其次是圖像數(shù)據(jù)庫,少量為全文數(shù)據(jù)庫[15]。而江西省參與古籍數(shù)字資源共建的單位只有9家,古籍數(shù)字資源庫成果數(shù)量與其他各省相比也偏少。針對此種情況,一方面,國家和地方財政應加大對經(jīng)濟欠發(fā)達或落后地區(qū)古籍數(shù)字化工作的經(jīng)費投入,將古籍數(shù)字化經(jīng)費納入財政預算;另一方面,省級公共圖書館在國家圖書館的規(guī)劃和指導下,應積極聯(lián)合基層公共圖書館、博物館等公益性機構,加大力度、加快進度進行珍貴古籍文獻數(shù)字化工作。
現(xiàn)階段,江西省公共圖書館建設的古籍數(shù)字資源庫仍以書目數(shù)據(jù)庫和圖像版數(shù)據(jù)庫為主,不支持古籍全文在線檢索功能。而很多企業(yè)、公司建設的古籍數(shù)據(jù)庫大多為圖文版,支持全文檢索、圖文參照功能,有的還實現(xiàn)了智能檢索,具備超文本鏈接功能。對比之下,江西省公共圖書館古籍數(shù)字化技術較為薄弱。目前的局面是,江西省各級公共圖書館擁有大量具有歷史價值和研究價值的文獻,公司、企業(yè)擁有較為先進的古籍數(shù)字化技術,這二者之間可以優(yōu)勢互補。江西省各級公共圖書館應該和技術力量先進的公司開展合作,圖書館出資源,公司出技術,共同建設古籍數(shù)字資源庫,取長補短。另外,古籍數(shù)字資源庫的用戶不再只是專家學者,非專業(yè)的古籍愛好者越來越多,公共圖書館的職責之一就是普及古籍資源,傳播傳統(tǒng)文化。因此,江西省公共圖書館在建設古籍數(shù)字資源庫的同時,要考慮到非專業(yè)古籍愛好者的閱讀需求,注重利用技術開發(fā)資源庫的輔助閱讀功能、繁簡字體轉換功能、白話文翻譯功能等,同時完善檢索技術,實現(xiàn)精確檢索、模糊檢索、邏輯檢索等各類型檢索。再者,移動用戶的比例逐年上升,古籍資源庫的開發(fā)要向適用于手機、平板等移動終端設備傾斜。
古籍文獻數(shù)字化建設的關鍵是人才。要想做好古籍文獻數(shù)字化工作,就必須擁有一批既懂得古籍相關知識又懂得現(xiàn)代計算機技術的復合型人才。當下,江西省從事圖書館古籍文獻整理、修復、管理的人才本就少,既要精通古籍文獻保護,還要熟練掌握現(xiàn)代計算機技術的復合型人才就更稀缺了。當前現(xiàn)代計算機技術日新月異,發(fā)展迅猛,新技術的涌現(xiàn)讓老一輩古籍保護專家不能適應,而年輕的計算機專業(yè)人才又缺乏古籍相關知識,使得現(xiàn)代圖書館古籍文獻數(shù)字化建設與古籍信息化服務停滯不前。因此,應加大對古籍數(shù)字化工作技術人才的培養(yǎng),保障現(xiàn)代圖書館古籍數(shù)字化建設與服務能力的不斷提升。
古籍數(shù)字化是圖書館、博物館等古籍收藏單位的古籍整理的方向,是圖書館、文博單位網(wǎng)絡化 、信息化、數(shù)字化發(fā)展的必然要求,與網(wǎng)絡信息社會的發(fā)展相適應,同時也是古籍保護和利用最有效的方法之一。然而,在技術實現(xiàn)上,古籍文獻數(shù)字化建設從管理、建設、發(fā)布到保存都沒有一整套完善的體系,古籍數(shù)字化仍有極大的發(fā)展空間。我們應該在古籍數(shù)字化道路上,統(tǒng)籌規(guī)劃,注意統(tǒng)一標準,注重人才培養(yǎng),關注新技術利用,提升古籍文獻數(shù)字化水平,發(fā)揚中華民族傳統(tǒng)文化。
(來稿時間:2018年9月)