喬紅霞 李晉元
摘 要:古籍?dāng)?shù)字化是當(dāng)代保護(hù)和傳承古籍的時代特征。進(jìn)行古籍?dāng)?shù)字圖書館建設(shè),使古籍在紙質(zhì)載體得到保護(hù)的同時,通過數(shù)字加工成為數(shù)字古籍,得以數(shù)字古籍的形式網(wǎng)絡(luò)再生。文章構(gòu)思了省域各古籍收藏單位共建古籍?dāng)?shù)字圖書館的工作模式,以海南省古籍資源為例,分析了古籍?dāng)?shù)字化工作流程中古籍元數(shù)據(jù)描述、對象數(shù)據(jù)采集、管理數(shù)據(jù)的命名等標(biāo)準(zhǔn)運(yùn)用問題,以期為聯(lián)合共建古籍?dāng)?shù)字圖書館提供參考。
關(guān)鍵詞:古籍?dāng)?shù)字化;數(shù)字圖書館;標(biāo)準(zhǔn)化;海南省
中圖分類號:G250.7? ?文獻(xiàn)標(biāo)識碼:A? ?文章編號:1003-1588(2023)04-0128-07
古籍?dāng)?shù)字化是運(yùn)用信息處理技術(shù)將古籍原本文獻(xiàn)轉(zhuǎn)化為計(jì)算機(jī)可識別和處理的數(shù)字信息的過程,即從利用和保護(hù)古籍的目的出發(fā),采用計(jì)算機(jī)技術(shù),將古籍和其承載的知識信息轉(zhuǎn)化為能被計(jì)算機(jī)識別的數(shù)字符號,從而制成古籍電子索引、古籍書目數(shù)據(jù)庫和古籍全文數(shù)據(jù)庫,用以呈現(xiàn)古籍文獻(xiàn)信息資源的一項(xiàng)系統(tǒng)工作[1]。它是當(dāng)代在計(jì)算機(jī)技術(shù)、信息處理技術(shù)、網(wǎng)絡(luò)傳輸技術(shù)廣泛應(yīng)用的形勢下,保護(hù)古籍的重要方法,也是當(dāng)代區(qū)別于我國歷史上任何一次保護(hù)古籍行動的時代特征。歷史上,我國古代文獻(xiàn)保護(hù)和傳承經(jīng)歷過甲骨、金石、簡冊、寫本、刻本、抄本、石印、鉛印等載體形式的變化,隨著每次文字載體的變更,作為中華文明載體的古籍,其保護(hù)和傳承形式也隨之變更,如:春秋時孔子保護(hù)古籍是簡冊、東漢保護(hù)古籍是刻石、宋代用的是雕版印刷、明代《永樂大典》和清代《四庫全書》用的是抄寫、近現(xiàn)代用的石印和鉛印等,在一次次傳承形式更替的過程中,中華文明得以綿延賡續(xù)。
我國自1984年臺灣地區(qū)“中央研究院”歷史語言研究所首先運(yùn)用計(jì)算機(jī)技術(shù)實(shí)施“史籍自動化系統(tǒng)”以來,中文古籍和計(jì)算機(jī)逐漸融合,出現(xiàn)過單機(jī)版、網(wǎng)絡(luò)版古籍?dāng)?shù)據(jù)庫,古籍?dāng)?shù)據(jù)庫類型有書目數(shù)據(jù)庫、圖片數(shù)據(jù)庫、全文數(shù)據(jù)庫等形式。2007年“中華古籍保護(hù)計(jì)劃”實(shí)施后,古籍?dāng)?shù)字化建設(shè)與開放共享走上了快車道,全國累計(jì)發(fā)布古籍及特藏文獻(xiàn)影像資源達(dá)13萬部,國家圖書館建設(shè)的“中華古籍資源庫”通過全彩影像數(shù)字化和縮微膠卷轉(zhuǎn)化影像方式,目前已在線發(fā)布古籍?dāng)?shù)字資源約10.2萬部(件),先后7次聯(lián)合39家單位發(fā)布數(shù)字古籍2.8萬部,其中有明清版刻、稿抄本古籍、碑帖拓本等,實(shí)現(xiàn)了古籍資源統(tǒng)一入口檢索、讀者免登錄訪問,平臺智能推薦、多種瀏覽器兼容,為廣大讀者和學(xué)者利用古籍提供了極大便利。古籍?dāng)?shù)字化平衡了古籍的文物屬性與文獻(xiàn)屬性,實(shí)現(xiàn)了古籍保護(hù)與利用的和諧統(tǒng)一[2]。
2022年4月,中共中央辦公廳、國務(wù)院辦公廳印發(fā)了《關(guān)于推進(jìn)新時代古籍工作的意見》(以下簡稱《意見》),再次強(qiáng)調(diào)推進(jìn)古籍?dāng)?shù)字化,加強(qiáng)古籍?dāng)?shù)字化資源管理和開放共享。我國古籍現(xiàn)存數(shù)量約20萬種[3],截至2021年年底,全國古籍保護(hù)工作座談會發(fā)布全國漢文古籍普查完成270余萬部[4]。可見古籍?dāng)?shù)字化工作任重而道遠(yuǎn)。
1 海南省古籍?dāng)?shù)字化的資源現(xiàn)狀和建設(shè)內(nèi)容
海南省歷史上曾經(jīng)出現(xiàn)過豐富的古籍收藏,因天氣溽熱、臺風(fēng)頻繁、蚊蟲叢聚、瓊北地震等自然因素,以及孤懸海外、社會動蕩等歷史原因,曾經(jīng)見于記載的古籍收藏,省內(nèi)十不存一,僅存的古籍屬吉光片羽,十分珍貴。目前,海南省參加普查的14家古籍收藏單位和個人普查登記古籍約2,240部、23,931冊。全省古籍普查中發(fā)現(xiàn)了瓊臺書院藏書、蘇泉書院藏書(即海南第一樓藏書)、王國憲藏書、樂嗣炳專藏等大宗文獻(xiàn)遺存,內(nèi)容覆蓋經(jīng)、史、子、集、叢(含新學(xué))五大部類,版本以漢文刻本為主,有刻本、稿本、抄本、活字本、套印本、石印本、鉛印本等類型。海南省有三部古籍入選《國家珍貴古籍名錄》:海南師范大學(xué)圖書館藏明徐氏東雅堂刻本《昌黎先生集》入選《第二批國家珍貴古籍名錄》、海南省民族博物館藏明黃氏集義書堂刻本《大廣益會玉篇》、明復(fù)古齋刻本《詩法》(樂嗣炳跋)入選《第六批國家珍貴古籍名錄》。海南省圖書館、??趫D書館、文昌市圖書館、海南師范大學(xué)圖書館、海南大學(xué)圖書館收藏的54部古籍入選《第一批海南省珍貴古籍名錄》[5]。海南古籍語言文字專題特色突出,善本古籍品位可觀,普通古籍亦可見證海南歷史發(fā)展,有重要的文獻(xiàn)價值和文物價值,因此基于保護(hù)和傳承的理念,建設(shè)全省古籍?dāng)?shù)字圖書館建設(shè)十分必要且迫在眉睫,主要有三項(xiàng)內(nèi)容:一是應(yīng)用古籍普查登記目錄成果,編寫古籍編目元數(shù)據(jù),建成古籍書目數(shù)據(jù)庫。二是保護(hù)現(xiàn)存海南古籍,進(jìn)行古籍圖像數(shù)字化加工,實(shí)現(xiàn)省內(nèi)古籍?dāng)?shù)字化母本收藏地存儲,全省統(tǒng)一備份,并將發(fā)布版上傳至省古籍?dāng)?shù)字圖書館平臺網(wǎng)絡(luò)發(fā)布。三是采集現(xiàn)存古籍資源(包括影印古籍)[6],進(jìn)行線下古籍采訪,線上數(shù)字專題古籍收集,尤其是海南地方古籍,經(jīng)省古籍?dāng)?shù)字圖書館平臺整合,實(shí)現(xiàn)地方古籍和特色專題古籍的數(shù)字版網(wǎng)絡(luò)回歸。
2 古籍?dāng)?shù)字圖書館是智慧圖書館建設(shè)的基礎(chǔ)
古籍?dāng)?shù)字圖書館多數(shù)是以古籍書目數(shù)據(jù)庫+數(shù)字古籍圖像庫為資源、以檢索瀏覽為主要服務(wù)形式的模式。近年來,我國開始了古籍智慧化的探索,應(yīng)用OCR掃描、AI識別、自動標(biāo)點(diǎn)等技術(shù)建設(shè)古籍全文數(shù)據(jù)庫,進(jìn)行信息整合挖掘,建設(shè)知識圖譜,實(shí)現(xiàn)古籍智能化整理。影響較大的是由字節(jié)跳動與北京大學(xué)數(shù)字人文實(shí)驗(yàn)室、國家圖書館聯(lián)合推出的古籍?dāng)?shù)字化閱讀平臺“識典古籍”[7],由四川大學(xué)、阿里巴巴集團(tuán)公益基金會、美國加州大學(xué)伯克利分校聯(lián)合發(fā)起的“漢典重光”海外古籍?dāng)?shù)字化回歸與研究整理平臺[8]。對于圖書館等古籍收藏單位來說,進(jìn)行古籍?dāng)?shù)字化的初衷是基于古籍本體的保護(hù)和傳承,重點(diǎn)是要保存古籍的真實(shí)面貌,不同版本原樣復(fù)制,即通過掃描、拍照,把古籍圖像文字保存下來,用數(shù)字圖像形式實(shí)現(xiàn)古籍的文物屬性。
海南省現(xiàn)存古籍藏量不多、收藏分散,省古籍保護(hù)中心可采用“明確責(zé)權(quán),分別加工,集中建庫,統(tǒng)一檢索”的協(xié)作方式,聯(lián)合各古籍收藏單位建設(shè)全省古籍?dāng)?shù)字圖書館。明確責(zé)權(quán)是指明確各古籍收藏單位對古籍和古籍?dāng)?shù)據(jù)的所有權(quán),明確聯(lián)合共建過程中的各協(xié)作單位對古籍?dāng)?shù)據(jù)的加工、轉(zhuǎn)讓、使用、共享、保護(hù)等工作規(guī)則,完善古籍?dāng)?shù)字產(chǎn)品的分級分類管理,通過數(shù)據(jù)開放、特許開發(fā)、授權(quán)應(yīng)用的方式,實(shí)現(xiàn)省內(nèi)古籍?dāng)?shù)字產(chǎn)品的依法、有序、規(guī)范保護(hù)和利用。集中建庫是指全省古籍?dāng)?shù)字資源集中在一個數(shù)據(jù)平臺發(fā)布,分三個步驟:各單位首先利用前期《海南省古籍普查登記目錄》書目數(shù)據(jù),轉(zhuǎn)換為館藏古籍元數(shù)據(jù);其次對收藏的古籍有序進(jìn)行圖像掃描,按照技術(shù)要求保存古籍?dāng)?shù)字母本;再次將古籍元數(shù)據(jù)和古籍圖像命名封裝,TIFF格式圖像除本地存儲,另備份一份保存版和發(fā)布版,和元數(shù)據(jù)一并提交省古籍保護(hù)中心,統(tǒng)一在全省古籍?dāng)?shù)字圖書館平臺網(wǎng)絡(luò)發(fā)布。統(tǒng)一檢索是指讀者可以由一個頁面登錄省域古籍?dāng)?shù)字圖書館網(wǎng)站進(jìn)行模糊檢索,也可以根據(jù)題名、著者、主題詞、出版地、出版發(fā)行、索書號等進(jìn)行檢索、瀏覽,根據(jù)古籍的“經(jīng)、史、子、集、叢”分類法進(jìn)行瀏覽。智慧古籍圖書館建設(shè)將在建設(shè)省域古籍?dāng)?shù)字圖書館基礎(chǔ)上,對特色古籍、專題古籍再進(jìn)行AI識別、知識挖掘,循序漸進(jìn)實(shí)現(xiàn)古籍?dāng)?shù)字圖書館的智慧化升級。
3 保護(hù)傳承理念與古籍?dāng)?shù)字圖書館建設(shè)的關(guān)系
3.1 保護(hù)傳承理念是以保護(hù)為核心,保護(hù)和利用相結(jié)合
進(jìn)行古籍?dāng)?shù)字化是以保護(hù)為核心,紙質(zhì)古籍得到保護(hù),數(shù)字古籍母本也以數(shù)字的形式長期典藏,即用古籍原本通過掃描拍照,獲取長期保存級數(shù)字古籍母本,實(shí)現(xiàn)紙質(zhì)古籍保護(hù)和數(shù)字古籍母本的雙重版本保護(hù);再通過復(fù)制、衍生出數(shù)字古籍,通過數(shù)字圖書館發(fā)布,使紙質(zhì)古籍避免了過多直接翻閱而受損,文物屬性得以保護(hù);加工后的數(shù)字古籍母本,TIFF格式、不壓縮、長期保存級,作為數(shù)字古籍的典藏本;由母本衍生出版印刷本、網(wǎng)絡(luò)發(fā)布本,可用于古籍研究、影印復(fù)制、網(wǎng)絡(luò)發(fā)布,實(shí)現(xiàn)了開放和共享,數(shù)字古籍可通過網(wǎng)絡(luò)“化身千百”,實(shí)現(xiàn)古籍的文獻(xiàn)屬性。數(shù)字化后,古籍的文物價值和文獻(xiàn)價值可以用不同的形式體現(xiàn)。作為文物價值的古籍原本,得以在收藏單位恒溫恒濕庫保存;作為學(xué)術(shù)資料價值的古籍,以數(shù)字載體形式在數(shù)字圖書館存儲、網(wǎng)絡(luò)發(fā)布,讓科研人員和普通讀者可隨時通過電腦、手機(jī)等終端,遠(yuǎn)程訪問古籍?dāng)?shù)字圖書館,瀏覽、下載。
用保護(hù)傳承理念指導(dǎo)古籍?dāng)?shù)字圖書館建設(shè),保護(hù)是前提,傳承是目的,因此要正確處理保護(hù)古籍和數(shù)字化開放的關(guān)系。對古籍原本、數(shù)字古籍母本加強(qiáng)保護(hù),數(shù)字古籍的發(fā)布版本應(yīng)最大限度地方便讀者使用,從登錄方式、響應(yīng)速度、閱讀方式、文字識別、下載打印、多媒體分享等方面,為利用數(shù)字古籍的讀者提供更多的便捷方式,讓讀者共享中華古代文明智慧。
3.2 保護(hù)傳承理念倡導(dǎo)對現(xiàn)存古籍全面數(shù)字化
基于保護(hù)傳承理念進(jìn)行古籍?dāng)?shù)字化,是基于地域或機(jī)構(gòu)收藏古籍為主的數(shù)字化工作,倡導(dǎo)館藏古籍全面數(shù)字化,即凡是1912年以前的我國典籍,只要在本地或本機(jī)構(gòu)收藏,均具有數(shù)字化價值。在開展數(shù)字化前,收藏機(jī)構(gòu)可以對古籍進(jìn)行文獻(xiàn)評估,善本、孤本、稀見本、專題古籍可以優(yōu)先,品相不完整可以待修復(fù)后數(shù)字化,普通古籍也應(yīng)數(shù)字化。全國現(xiàn)存20萬種古籍全部數(shù)字化可能需要幾十億元,在國家財力允許的條件下應(yīng)盡快集中力量實(shí)現(xiàn)全部重要古籍的數(shù)字化[9]。
3.3 保護(hù)傳承理念統(tǒng)籌古籍?dāng)?shù)字圖書館建設(shè)全過程
基于保護(hù)傳承理念進(jìn)行古籍?dāng)?shù)字化,應(yīng)是圍繞“保護(hù)古籍、傳承文明、開發(fā)資源、服務(wù)讀者”方針,統(tǒng)籌古籍保護(hù)工作全過程的數(shù)字化。將古籍?dāng)?shù)字化并用軟件系統(tǒng)平臺呈現(xiàn),形成古籍收藏、管理、采訪、編目、修復(fù)、數(shù)據(jù)加工、數(shù)據(jù)傳遞等工作模塊,檢索、瀏覽、下載、打印、圖像索取、讀者交流等讀者服務(wù)模塊,具備古籍收集、典藏、開發(fā)、利用等功能,以獨(dú)立的網(wǎng)絡(luò)IP呈現(xiàn)在互聯(lián)網(wǎng)上,就形成了古籍?dāng)?shù)字圖書館。古籍?dāng)?shù)字化作為數(shù)字圖書館建設(shè)的一個重要部分,大致有古籍?dāng)?shù)字化加工準(zhǔn)備、古籍元數(shù)據(jù)著錄、古籍圖像數(shù)字化、數(shù)據(jù)命名、數(shù)據(jù)檢驗(yàn)、數(shù)據(jù)保存與提交、發(fā)布利用等環(huán)節(jié)。見圖1。
3.3.1 提取古籍前的書況檢查。書況檢查是古籍安全的重要保證,檢查古籍原本情況并進(jìn)行登記,是古籍藏品出庫前古籍庫管人員必須做好的基礎(chǔ)工作,也是數(shù)字化加工、交接、質(zhì)檢、標(biāo)引等后續(xù)工作的依據(jù)。根據(jù)國家古籍保護(hù)中心編寫的《古籍?dāng)?shù)字化工作手冊》(V.1)要求,主要是對古籍原本逐葉翻檢,清點(diǎn)古籍冊數(shù)和葉數(shù),填寫古籍《文獻(xiàn)整理登記表》(全書)和《文獻(xiàn)整理登記表》(各卷)。《文獻(xiàn)整理登記表》(全書)有六個字段,分別是ID、加工記錄標(biāo)識號、名錄號、題名卷數(shù)、相關(guān)說明、冊數(shù)。《文獻(xiàn)整理登記表》(各卷)有二十一個字段,分別是ID、內(nèi)部序號、加工記錄標(biāo)識號、冊次、卷次、葉數(shù)、封面、前護(hù)、后護(hù)、封底、開本、板框、透字、夾框、夾字、皺折、缺葉、殘葉、簽條、夾紙、備注。檢查書況過程中按書葉原貌統(tǒng)計(jì)總?cè)~數(shù),記錄古籍的缺葉、漏葉、錯葉、重葉、空白葉等情況,注明是否需要補(bǔ)配、去重、變更葉碼順序等,登記掃描或拍攝的葉數(shù),形成較為完整的書況檢查記錄。
3.3.2 古籍元數(shù)據(jù)制作。古籍元數(shù)據(jù)制作除了前面需要制作《文獻(xiàn)整理登記表》(全書)和《文獻(xiàn)整理登記表》(各卷)外,還需要制作《書目數(shù)據(jù)表》《卷目數(shù)據(jù)表》《外字表》《管理信息表》?!稌繑?shù)據(jù)表》有23個字段,分別是ID、加工記錄標(biāo)識號、名錄號、普查編號、書目記錄標(biāo)識號、索書號、分類、題名卷數(shù)、其他題名、主要責(zé)任者、其他責(zé)任者、存(缺)卷、版本(含補(bǔ)配)、冊數(shù)、板框、版式、合訂狀態(tài)、裝幀形式、叢編、附注、批跋、館藏單位、制作單位?!毒砟繑?shù)據(jù)表》有10個字段,分別是ID、內(nèi)部序號、加工記錄標(biāo)識號、叢書標(biāo)識號、子目題名、層級號、冊號、卷名、葉碼、屬性?!锻庾直怼返怯浀氖枪偶?dāng)?shù)字化使用的Unicode 5.0 UTF-8字符集里不包括的文字,即集外字,本表格有6個字段,分別是ID、內(nèi)部序號、加工記錄標(biāo)識號、外字、描述、位置,依據(jù)《漢語文古籍機(jī)讀目錄格式使用手冊》393字段系統(tǒng)外字附注的外字描述方法,即左右結(jié)構(gòu)不用標(biāo)出偏旁位置,其他結(jié)構(gòu)都要標(biāo)出字的結(jié)構(gòu)位置。例如:
左右結(jié)構(gòu)“儋”:##@a=#[亻詹]#(dan)
其他結(jié)構(gòu)“惖”:##@a=#[易(上)、心(下)]#(ti)
《管理信息表》是古籍在數(shù)字化加工過程中的數(shù)字化參數(shù)等管理信息。每部古籍12個字段,分別是ID、加工記錄標(biāo)識號、技術(shù)信息、格式、分辨率、色彩、色彩位深、壓縮、加工方式、事件類型、操作、操作日期等。另外,《古籍?dāng)?shù)字化工作手冊》(V.1)還規(guī)定:使用Microsoft Office Access 2003進(jìn)行數(shù)據(jù)制作,使用Unicode 5.0 UTF-8字符集,用通行繁體字、字體字號為宋體11號;著錄文字處理錯誤率不超過0.3‰,著錄信息描述與古籍實(shí)際內(nèi)容完全一致,標(biāo)引詞與標(biāo)引對象文件正確鏈接等。
3.3.3 古籍圖像數(shù)字化。根據(jù)古籍的裝幀形式,在不拆分古籍的前提下進(jìn)行古籍?dāng)?shù)字化,掃描的頁面是半葉和雙半葉,封面、封底、空白頁、附件、書口、天頭、地腳,都在掃描(拍攝)范圍。掃描的半葉和全葉位置見表1。古籍?dāng)?shù)字化環(huán)境應(yīng)注意防護(hù)光源,避免透光或反射光的影響。如果是彩色掃描(拍照),首先進(jìn)行數(shù)字化設(shè)備的基本色彩校正,測量數(shù)字輸入設(shè)備和數(shù)字輸出設(shè)備的色彩屬性,將色標(biāo)與古籍放在一起進(jìn)行比對。古籍原件掃描(拍照)時頁面向上,用零邊距掃描儀(數(shù)碼相機(jī)),將古籍放在翻拍臺上,冷光源照明,按1:1比例掃描,葉面外圍要求留白,寬度不超過1厘米;書葉間距不超過0.1厘米。掃描后圖像清晰、端正,圖像傾斜角度不大于0.2度。掃描后的數(shù)據(jù)文件葉碼連續(xù),沒有重葉、缺葉、錯葉、折葉等情況(原書缺葉、錯葉除外)。補(bǔ)掃缺葉圖像要與同冊圖像文件的大小一致,顏色接近。見下頁表2。
3.3.4 加工記錄標(biāo)識命名。《古籍?dāng)?shù)字化工作手冊》(V.1)規(guī)定,一部古籍的加工記錄標(biāo)識號為8位阿拉伯?dāng)?shù)字,由單位代碼(4位,由國家古籍保護(hù)中心統(tǒng)一分配)+單位內(nèi)部古籍?dāng)?shù)字化流水號(4位)組成(從1開始,不足4位以0補(bǔ)齊)。古籍保存文件命名由三級結(jié)構(gòu)組成:第一級目錄名稱為加工記錄標(biāo)識號。第二級目錄名稱為古籍冊號。每部古籍有多冊實(shí)體,每一冊命名為4位數(shù)字,從0001開始,依次按流水號命名。第三級保存圖像數(shù)據(jù)文件,按照掃描頁碼,命名從0001開始,加“.tif”。以海南省圖書館藏明刻本《宋大家蘇文忠公文抄》二十八卷為例:加工記錄標(biāo)識號為XXXX0001,該書第一冊號為0001,第一葉的葉號為0001,文件保存目錄為XXXX0001/0001,圖像文件名為0001.tif。
4 古籍?dāng)?shù)字圖書館建設(shè)的基本要素
4.1 古籍?dāng)?shù)字圖書館建設(shè)平臺
古籍?dāng)?shù)字化是傳統(tǒng)古籍整理與現(xiàn)代計(jì)算機(jī)技術(shù)相結(jié)合的產(chǎn)物,是運(yùn)用信息處理技術(shù)將文獻(xiàn)轉(zhuǎn)化為計(jì)算機(jī)可識別和處理的數(shù)字信息的過程。古籍?dāng)?shù)字化平臺軟件是古籍?dāng)?shù)字圖書館建設(shè)的基礎(chǔ)設(shè)施,應(yīng)具有安全性、易用性、開放性、可持續(xù)發(fā)展等特征,一般應(yīng)具備以下功能:①古籍?dāng)?shù)據(jù)庫制作管理與發(fā)布。②數(shù)字資源制作加工。③統(tǒng)一檢索平臺。④數(shù)字參考咨詢。⑤互聯(lián)網(wǎng)信息資源整合。⑥讀者登錄及個性化信息服務(wù)。⑦古籍閱覽和整理輔助工具[11]。
古籍?dāng)?shù)字圖書館軟件平臺應(yīng)具備資源、服務(wù)和管理三大職能,古籍平臺通過模塊組織實(shí)現(xiàn)這些功能,主要模塊有資源加工、資源發(fā)布、資源檢索、資源訪問權(quán)限、下載和安全控制、用戶服務(wù)、用戶登錄、交互數(shù)據(jù)管理、統(tǒng)計(jì)分析、日志管理等。
我國現(xiàn)有應(yīng)用較廣泛的古籍?dāng)?shù)字化平臺有書同文公司的“數(shù)碼翰林”等,“數(shù)碼翰林”是北京書同文公司在推出文淵閣《四庫全書》電子版、《四部叢刊》的基礎(chǔ)上,繼續(xù)研發(fā)的大型數(shù)字化軟件工具。該軟件是一個對實(shí)體資源信息和元數(shù)據(jù)實(shí)施數(shù)字化加工、結(jié)構(gòu)化置標(biāo)、提交發(fā)布,并在網(wǎng)絡(luò)環(huán)境下向公眾提供信息服務(wù)的集成性軟件,包括數(shù)碼大師、電子編目員、發(fā)布系統(tǒng)三個部分,用于《中國歷代石刻史料匯編》全文檢索數(shù)據(jù)庫,兩岸五地(大陸、港、澳、臺、日)13個成員館聯(lián)合共建的“孫中山數(shù)字圖書館”等[12],中易公司開發(fā)的《中易漢神e》、北大方正集團(tuán)公司開發(fā)的“DABSI—方正德賽古籍?dāng)?shù)字化系統(tǒng)”[13],臺灣“中央研究院”歷史語言研究所“漢籍電子文獻(xiàn)資料庫”、日本“日本國立公文館內(nèi)閣文庫漢書庫”所用古籍?dāng)?shù)字化平臺,值得借鑒。
海南省古籍?dāng)?shù)字圖書館服務(wù)平臺是基于對本省古籍進(jìn)行保護(hù)理念基礎(chǔ)上的共建共享一體化、分布式的古籍?dāng)?shù)字化服務(wù)體系,是全省古籍資源收集、加工、保存和發(fā)布、讀者服務(wù)的網(wǎng)絡(luò)窗口。該平臺在總體技術(shù)上應(yīng)選擇基于國際標(biāo)準(zhǔn)編碼字符集ISO/IEC 10646/Unicode(CJK+)的漢字平臺,支持漢字繁體和簡體,有中文、英文、日文等版本,具備統(tǒng)一性、開放性、安全性、互操作性、兼容整合性、成熟性、組件化、標(biāo)準(zhǔn)化等多重特征,以便于各個應(yīng)用系統(tǒng)和各類資源系統(tǒng)的互操作、鏈接、交換數(shù)據(jù)和數(shù)據(jù)集成。
4.2 古籍?dāng)?shù)字化加工工具
4.2.1 掃描設(shè)備。館藏古籍是珍貴而脆弱的文獻(xiàn)資源,數(shù)字圖像采集需要精度高、速度快,對書籍無損壞的非接觸式、保護(hù)性的數(shù)字化大型掃描設(shè)備,主要參數(shù)要求是零邊距或非接觸,冷光掃描,設(shè)備A3幅面的光學(xué)分辨率600dpi以上,CCD感光元件不低于5,000像素點(diǎn),色彩位數(shù)24bit,目前市場上有賽數(shù)OS12002V、Book2net、Bookeye5等,賽數(shù)OS12002V是一款高精度專業(yè)古籍掃描儀,頂置式掃描頭,臺式非接觸掃描,V型書稿臺,打開角度90~180度,可快速掃描成標(biāo)準(zhǔn)圖像,解決了掃描古籍時不能接觸、不能分拆的難題。
4.2.2 數(shù)碼拍照設(shè)備。單反數(shù)碼相機(jī)的有效像素不低于2,100萬像素,最好選擇有效像素達(dá)3,300萬像素以上的數(shù)碼設(shè)備。
4.2.3 其他工具。包括古籍翻拍架、大容量移動硬盤、DVD光盤、用作背景的中灰色紙板或黑色紙板、IT8標(biāo)準(zhǔn)色彩導(dǎo)表(色卡)、衡量古籍開本和板框的標(biāo)尺、玻璃壓板、玻璃清潔劑、襯紙等。見圖2。
5 專業(yè)人才是建設(shè)古籍?dāng)?shù)字圖書館的必要因素
古籍?dāng)?shù)字化應(yīng)是古籍收藏、保護(hù)、整理、閱讀、研究、利用等各階段、多層次的數(shù)字化。古籍?dāng)?shù)字圖書館建設(shè)是古籍整理工作的系統(tǒng)化體現(xiàn),集古籍?dāng)?shù)字化加工、讀者服務(wù)、數(shù)據(jù)檢索、古籍全文數(shù)據(jù)庫、古籍業(yè)務(wù)管理于一體,因此必須堅(jiān)持古籍保護(hù)專業(yè)引領(lǐng)的原則,遵守古籍整理的思路,在古籍?dāng)?shù)字化規(guī)劃中要貫穿保護(hù)和傳承理念:一是數(shù)字化之后盡量達(dá)到無須再看印本古籍的目的。二是印本古籍因保管不善損毀后,能夠盡可能原色再造古籍原本[14]。進(jìn)行專業(yè)管理,首先要用專業(yè)思維制訂保護(hù)古籍且行之有效的建設(shè)方案,做好規(guī)劃,保證古籍?dāng)?shù)字圖書館建設(shè)扎實(shí)有序開展。專業(yè)管理還要把古籍保護(hù)和利用的專業(yè)思維運(yùn)用到古籍?dāng)?shù)字化過程中的項(xiàng)目管理、項(xiàng)目評價、古籍藏品管理與保存、應(yīng)急預(yù)案、數(shù)據(jù)安全、質(zhì)量監(jiān)督、管理制度實(shí)施等方面。
每一部古籍的數(shù)字化都涉及繁體字的辨認(rèn)、古籍元數(shù)據(jù)著錄、古籍圖像掃描(或拍照)、管理數(shù)據(jù)著錄,需要一大批熱愛古籍、耐心細(xì)致、有古文獻(xiàn)基礎(chǔ)的專業(yè)工作者。古籍?dāng)?shù)字圖書館建設(shè)是計(jì)算機(jī)和古籍的結(jié)合,古籍專業(yè)人員要與計(jì)算機(jī)網(wǎng)絡(luò)專業(yè)人員密切協(xié)作,用計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)演繹古籍?dāng)?shù)字化的專業(yè)流程,以開放共享的傳承理念,激活古籍里的文字,讓數(shù)字化后的古籍走出文物庫房,供用戶在網(wǎng)絡(luò)上閱讀研究,通過手機(jī)微信、微博、QQ、抖音等轉(zhuǎn)發(fā)分享,真正實(shí)現(xiàn)古籍資源的公益性、基本性、均等性和便利性[15],讓數(shù)字古籍更便捷地惠及學(xué)者和普通讀者。
參考文獻(xiàn):
[1][13] 毛建軍.古籍?dāng)?shù)字化理論與實(shí)踐[M].北京:航空? 工業(yè)出版社,2009:5-6.
[2] 免費(fèi)閱覽全文影像!國家圖書館聯(lián)合39家單位累計(jì)在線發(fā)布古籍?dāng)?shù)字資源13萬部(件)[EB/OL].[2023-01-04].http://www.nlc.cn/pcab/zx/xw/202301/t20230105_214422.htm.
[3] 中國古籍總目編纂委員會.中國古籍總目前言//中國古籍總目[M].北京:中華書局,2009:3.
[4] 全國漢文古籍總量達(dá)270余萬部 資源分布和保存狀況基本摸清[EB/OL].[2023-01-04].https://www.163.com/dy/article/GR8IR85K0514R9KU.html.
[5] 喬紅霞.海南古籍何處尋[N].海南日報,2022-04-25(A15).
[6] 姚伯岳.“北京大學(xué)數(shù)字圖書館古文獻(xiàn)資源庫”的建設(shè)[J].數(shù)字圖書館論壇,2006(12):12-17.
[7] “識典古籍”測試版上線,3000萬字符在這里跳動[EB/OL].[2023-01-04].https://www.sohu.com/a/592831356_121124334.
[8] 樂艷娜.數(shù)字化助力古籍回歸與再造[J].環(huán)球,2021(19):54-56.
[9] 古籍為何要數(shù)字化 該如何加速[EB/OL].[2023-01-04].https://www.sohu.com/a/117949838_48677.
[10] 朱強(qiáng),張春紅,龍偉.國家圖書館圖像數(shù)據(jù)加工標(biāo)準(zhǔn)和操作指南[M].北京:國家圖書館出版社,2011:9,45.
[11] 劉曉清.怎樣建設(shè)數(shù)字圖書館[M].北京:海洋出版社,2010:215-260.
[12] 王立清.中文古籍?dāng)?shù)字化研究[M].北京:國家圖書館出版社,2011:90.
[14] 朱本軍.海外漢籍?dāng)?shù)字化加工現(xiàn)狀與實(shí)踐研究[J].古籍保護(hù)研究,2020(1):113-129.
[15] 趙文友.基于開放共享理念的古籍?dāng)?shù)字資源服務(wù):以“中華古籍保護(hù)計(jì)劃”為中心[J].古籍保護(hù)研究,2020(2):21-28.
(編校:周雪芹)