吳玉靈
(江西省圖書館,江西 南昌 330046)
黨的十八大以來,習近平總書記高度重視傳承發(fā)展中華優(yōu)秀傳統(tǒng)文化,多次作出重要指示。他指出,中華民族在幾千年歷史中創(chuàng)造和延續(xù)的中華優(yōu)秀傳統(tǒng)文化,是中華民族的根和魂,要讓書寫在古籍里的文字活起來[1]。
古籍數(shù)字化是響應國家號召,保護和再造古籍的重要途徑。面對蟲噬鼠咬、保管不當或其他不可抗力因素導致許多珍貴古籍消失在歷史長河的現(xiàn)象,古籍數(shù)字化保護工作應運而生。然而近年來,許多館藏機構在古籍數(shù)字化工作中出現(xiàn)了以下問題:元數(shù)據(jù)標準不統(tǒng)一,古籍數(shù)字化保護經(jīng)費不足,古籍數(shù)字化設備落后,缺乏古籍修復專業(yè)技術人才,館藏古籍數(shù)字化占比低、數(shù)字化后的影印古籍文獻無法通過系統(tǒng)平臺分享給讀者利用,古籍數(shù)字化資源利用率低,無法獲取并滿足古籍文獻讀者真正需求等。伴隨著信息技術的發(fā)展,將科技與古籍融合或將成為古籍數(shù)字化保護的利器,提高古籍數(shù)字化保護的工作效率。
在我國,“古籍”是“中國古代書籍的簡稱,主要是指書寫或印刷于1912年以前具有中國古典裝幀形式的書籍[2]”。
古籍數(shù)字化是對古籍或古籍內(nèi)容的復制加工,是古籍保護的重要手段之一。古籍數(shù)字化保護的概念有狹義和廣義之分。廣義的古籍數(shù)字化保護是指通過現(xiàn)代技術、數(shù)字化手段對古籍資源再生,將古籍內(nèi)容復制或轉移到其他載體,以達到對古籍長期保護與有效利用的目的。狹義的古籍數(shù)字化保護可囊括為3點:一是制定古籍文獻資源的數(shù)字化標準。數(shù)字化標準是指古籍編目的標準,主要包含古籍著錄和目錄組織的標準化工作。二是建立基于古籍數(shù)字化對象數(shù)據(jù)的資源載體。資源載體可以是數(shù)據(jù)庫、光盤、存儲系統(tǒng)軟件平臺等多媒體介質(zhì)。三是面向讀者公眾開放古籍資源載體,將古籍數(shù)字化資源發(fā)布出去,實現(xiàn)古籍文獻資源的共享和利用。
雖然古籍數(shù)字化保護是在古籍文獻重藏輕用的特殊歷史背景下產(chǎn)生的,但其最終意義是使古籍文獻資源更廣泛、更便捷、更有效地為人們所利用,使沉淀五千年厚重底蘊的中華文明得以傳承和發(fā)展。古籍數(shù)字化保護的價值除了對重要史料長期保存外,還體現(xiàn)在以下幾點:
一是有利于古籍文獻資源的再生性保護,避免后期因保存管理不當造成原稿的損壞或永久性丟失。古籍一般保存于圖書館古籍特藏書庫中,全國圖書館標準化技術委員會于2013年組織起草的《圖書館古籍書庫基本要求》(GB∕T 30227-2013)對圖書館古籍書庫的溫濕度要求、空氣凈化要求、光照和防紫外線要求以及書庫的建筑、消防、安防等與古籍保護和安全都有較為嚴格的規(guī)定,然而許多圖書館的古籍特藏書庫條件無法滿足,必然導致古籍在保存過程中出現(xiàn)不同程度的損壞[3]。
二是有利于解決圖書館古籍“藏”和“用”的矛盾。傳統(tǒng)形式下,為最大限度地延長文獻保存壽命,古籍需要處于溫度日較差不大于2℃,相對濕度日較差不大于5%的恒溫恒濕環(huán)境下,加之重藏輕用的現(xiàn)象普遍,嚴重制約了古籍文獻的開發(fā)和利用。古籍數(shù)字化可利用現(xiàn)代信息技術對古籍文獻進行加工處理,古籍文獻資源以電子版或影印版的方式再現(xiàn),通過網(wǎng)絡介質(zhì)保存和傳播呈現(xiàn)給讀者,有效化解古籍藏用矛盾。
三是有利于古籍文獻資源的整理和再造。古籍數(shù)字化保護的先決條件是對現(xiàn)有古籍文獻資源的編排整理,在徹底摸清“家底”后,才能更好地整合與編排古籍數(shù)字化文獻資源,形成較為體系化的古籍文獻索引目錄,便于公眾使用。
筆者在此從政策支持、重點工作和實踐案例3個維度闡述國內(nèi)古籍數(shù)字化保護現(xiàn)狀。
2.1.1 政策支持
早在2007年,我國就已經(jīng)意識到古籍保護的重要性,提出了一系列古籍保護的政策性文件。例如,2007年1月國務院辦公廳頒布《國務院辦公廳關于進一步加強古籍保護工作的意見》(國辦發(fā)〔2007]6號),其中明確提出要充分認識古籍保護工作的重要性和緊迫性,突出重點,科學規(guī)范開展古籍保護工作[4]。我國首次從政府層面主導實施國家級重要文化工程——“中華古籍保護計劃”,建立了全國古籍保護工作部際聯(lián)席會議制度,成立了國家古籍保護中心和各省級古籍保護中心、全國古籍保護工作專家委員會、中國古籍保護協(xié)會,形成了較為完善的古籍保護工作協(xié)調(diào)推進機制。
2.1.2 重點工作
一是古籍普查。在國務院辦公廳頒布的古籍保護意見中,著重提出了5項重點工作任務,其中第一條就是古籍普查工作,文件要求從2007年開始,用3至5年的時間,在全國范圍內(nèi)組織開展古籍普查登記工作,全面了解和掌握各級圖書館、博物館等單位及民間收藏古籍情況。古籍普查是古籍數(shù)字化的先決條件,只有摸清古籍“家底”才能更好地進行古籍數(shù)字化工作。中國國家圖書館(國家古籍保護中心)按照國務院要求,開展“中華古籍保護計劃”,建立了全國古籍普查登記基本數(shù)據(jù)庫,截至2020年11月30日,累計發(fā)布264家單位古籍普查數(shù)據(jù)825362條,約7973050冊古籍文獻。
二是制定數(shù)字化標準。從2008年開始,國家古籍保護中心在國家數(shù)字圖書館相關標準的基礎上研制古籍數(shù)字化標準規(guī)范,并且組織行業(yè)專家編撰了《古籍數(shù)字化技術手冊》,對古籍字符編碼、元數(shù)據(jù)著錄、古籍圖像的網(wǎng)頁發(fā)布級與長期保存級參數(shù)設定以及古籍數(shù)據(jù)命名等作出了詳細規(guī)定,初步建立了古籍數(shù)字化標準,為全國范圍古籍數(shù)字化建設工作提供了重要指導[5]。
三是建立古籍數(shù)字化項目。目前,國內(nèi)主要的古籍數(shù)字化項目主要有古籍書目信息數(shù)據(jù)庫、古籍影像數(shù)據(jù)庫和古籍全文檢索數(shù)據(jù)庫3種類別。古籍書目信息數(shù)據(jù)庫主要記錄古籍文獻館藏目錄,其元數(shù)據(jù)字段信息包含題名、責任者、版本時間、版本類型、冊數(shù)、裝幀方式、典藏編號、收藏單位等基本信息。例如上海圖書館開發(fā)的“中文古籍聯(lián)合目錄及認證平臺”,目前收錄了1400余家機構的古籍館藏目錄。古籍影像數(shù)據(jù)庫包含完整的古籍影像資源,支持在線閱覽。例如,由中國國家圖書館開發(fā)的“中華古籍資源”,它是“中華古籍保護計劃”項目的重要成果,已發(fā)布數(shù)字善本古籍2.1萬余部,地方志資源6529種。古籍全文檢索數(shù)據(jù)庫一般是指對某一類古籍文獻的全文檢索,其數(shù)字化加工方式需要將拍攝的古籍高清圖像經(jīng)過OCR文字識別轉儲到后臺數(shù)據(jù)庫中以支持全文檢索。例如《四庫全書》全文數(shù)據(jù)庫、《永樂大典》全文數(shù)據(jù)庫等,支持精確到被檢索關鍵詞所在卷和頁碼。
2.1.3 項目案例實踐
隨著國家對古籍數(shù)字化保護的日益重視,國內(nèi)許多古籍保護單位開始將古籍數(shù)字化項目納入發(fā)展計劃,同時,越來越多從事數(shù)字資源開發(fā)的企業(yè)也逐漸把核心產(chǎn)品聚焦到古籍數(shù)字化項目中。國內(nèi)古籍數(shù)字化產(chǎn)品主要是古籍類型的數(shù)據(jù)庫,其開放類型主要有免費和商購兩種,其中,免費開放的數(shù)據(jù)庫又分為注冊免費和公益免費,注冊免費類型需要注冊賬號后才可免費使用,公益免費則無需注冊即可免費使用。免費開放的古籍數(shù)字化項目多由公共圖書館或高校圖書館等相關古籍保護機構開發(fā),還有部分由資源共享精神較高的志愿者個人開發(fā)。商用的古籍數(shù)字化項目多由數(shù)據(jù)資源庫廠商開發(fā),需要購買使用授權。當前國內(nèi)主要的古籍數(shù)字化項目實踐應用案例主要有古籍館數(shù)據(jù)庫、典藏古籍庫、中華經(jīng)典古籍庫、中華古籍資源庫、大學數(shù)字圖書館國際合作項目CADAL(China Academic Digital Associative Library)、徽州文書數(shù)據(jù)庫、天津圖書館館藏古籍資源庫、云南古籍數(shù)字圖書館、蘇州圖書館館藏古籍資源庫、杭州圖書館館藏古籍數(shù)據(jù)庫、臺灣圖書館古籍影像數(shù)據(jù)庫、清人文集影像數(shù)據(jù)庫、上圖古籍漢籍電子文獻資料庫等,其中古籍館數(shù)據(jù)庫、典藏古籍庫和中華經(jīng)典古籍庫均為商購庫,其余為注冊免費或公益免費庫。
國外歐美國家在古籍數(shù)字化項目的建設上要比國內(nèi)早。例如,1970年到1979年間,美國俄亥俄州的聯(lián)機計算機圖書館中心(OCLC)和美國研究圖書館協(xié)會(RLIN)就已經(jīng)對古籍索引類元數(shù)據(jù)標準進行研究,并先后推出了《朱熹大學章句索引》《王陽明傳習錄索引》等中文古籍索引類型數(shù)據(jù)庫[6]。到了2013年,其研究內(nèi)容主要偏向古籍編目數(shù)字化標準規(guī)范建設上,例如,美國研究并制定出總則和善本編目手冊,并就珍本和手稿數(shù)字化存儲做出了數(shù)字化指南。美國國會圖書館中國善本數(shù)字館藏庫中收納了約5300種中國善本古籍資源,其中就包含按照數(shù)字化指南創(chuàng)建的電子版手稿古籍文獻[7]。澳大利亞國家圖書館于1960年開始研究數(shù)字化項目,但其古籍數(shù)字項目實施時間稍晚,在2013年8月澳大利亞南澳博物館開始對澳大利亞土著家庭的歷史古籍、照片和工藝品等藏品進行數(shù)字化[8]。
國外古籍數(shù)字化項目實踐的相關案例主要有哈佛大學的唐納德·斯特龍先生開發(fā)的中國哲學書電子計劃項目線上古籍文獻檢索系統(tǒng)、國際敦煌項目IDP(International DUNHUANG Project)絲綢之路在線、由韓國中央圖書館和日本國會圖書館共同創(chuàng)建的古籍影印類別的門戶系統(tǒng)東亞數(shù)位圖書館、日本東京大學東洋文化研究所漢籍善本全文影像數(shù)據(jù)庫“稀有中文圖書的修復和數(shù)字化”、日本東京國立博物館創(chuàng)建的日本東京博物館古籍數(shù)據(jù)庫、日本東京大學東洋文化研究所開發(fā)的雙紅堂文庫古籍影像庫、日本京都大學人文科學研究所開發(fā)的石刻拓本數(shù)據(jù)庫、韓國學中央研究院開發(fā)的王室圖書館藏書閣古籍影像資源庫、美國國會圖書館中國善本數(shù)字館藏、由世界數(shù)字圖書館發(fā)布的在線古籍善本資源數(shù)據(jù)庫等。
紙本古籍文獻是古籍數(shù)字化的文獻來源,也是古籍文獻數(shù)字化的基礎。如果原始古籍紙本文獻就出現(xiàn)了嚴重破損,勢必會影響到后期古籍數(shù)字化的效果。根據(jù)以往的經(jīng)驗,南方地區(qū)保存的古籍因為氣候暖,空氣潮濕,蟲鼠較多,其古籍損壞多表現(xiàn)為蟲蛀鼠噬為主,相較于南方,北方地區(qū)保存的古籍因為氣候干燥,其古籍損壞多表現(xiàn)為脆化為主。
早在宋代,我國就已經(jīng)出現(xiàn)古籍修復。面對因保管不善而自然老化,或者是因為蟲蛀鼠咬導致?lián)p壞的古籍,古籍修復人員便通過傳統(tǒng)技藝對其進行修復保護,修復過程一般要經(jīng)過定損、揭頁、襯紙、修復、壓平、裝訂等步驟。古籍修復師的修復水平在古籍修復的過程中起了至關重要的作用。例如,修復古籍時的襯紙紙張顏色、薄厚程度都會影響到古籍修復的整體效果,紙張顏色與古籍文獻紙張相差太大,則難以維持古籍原貌;紙張的厚度選擇太薄,則容易造成前后頁古籍文獻內(nèi)容出現(xiàn)“透字”現(xiàn)象,選擇太厚則容易導致在加襯中損傷古籍。面對破損嚴重的古籍,古籍修復師們一個輕微的錯誤選擇往往會造成古籍文獻不可逆的破壞,因此,破損嚴重的紙本古籍修復難度較高。
隨著我國對古籍數(shù)字化保護的日益重視,古籍數(shù)字化標準規(guī)范在國家圖書館以及各古籍保護單位的不懈努力下已經(jīng)基本建設完成,但仍存在許多需要完善的地方。例如,目前我國古籍數(shù)字化缺少統(tǒng)一的行業(yè)標準。公共圖書館、高校圖書館、古籍數(shù)字資源開發(fā)商等均在嘗試制定古籍數(shù)字化標準,各機構制定的古籍數(shù)字化標準存在差異,導致數(shù)據(jù)庫的質(zhì)量良莠不齊,且未開發(fā)統(tǒng)一的跨平臺接口,不利于異構數(shù)據(jù)庫之間的二次開發(fā)與利用,同時也給基層圖書館古籍數(shù)字化開發(fā)標準的選擇帶來了困擾。又如,除基本的字符編碼、生僻字、元數(shù)據(jù)、對象數(shù)據(jù)等建設標準外,還可從項目管理類目標準上考慮,如善本類、手稿類、碑石拓片類等古籍,從而保證數(shù)據(jù)標準的完整性。
繼古籍修復和古籍數(shù)字化拍攝后的另一重要環(huán)節(jié)便是古籍數(shù)字化加工。古籍數(shù)字化加工是對古籍數(shù)字化文獻進行歸類、整理、合并、圖像文字識別、元數(shù)據(jù)著錄和對象數(shù)據(jù)存儲等一系列操作的過程,也是古籍數(shù)字化管理平臺的一個基本功能。古籍數(shù)字化加工管理平臺一般是集后端古籍數(shù)字化著錄加工和前端頁面瀏覽檢索為一體的應用軟件系統(tǒng)。
當前,我國許多古籍館藏機構均不同程度地存在缺乏古籍數(shù)字化加工管理平臺的問題。例如,黎發(fā)仙學者在其《探討彝文古籍數(shù)字化保護發(fā)展研究》一文中就提出了其遭遇的系統(tǒng)平臺建設難題,即古籍文獻被大量數(shù)字化為PDF文件后,如何高效地通過檢索平臺展示的難題[9]。雖然國內(nèi)市場上已經(jīng)有許多古籍數(shù)字化加工管理平臺,但其功能參差不齊,價格昂貴,使得許多想要進行古籍數(shù)字化的館藏機構望而卻步。
古籍數(shù)字化保護專業(yè)技術人才匱乏是當前古籍數(shù)字化保護存在的主要問題。一個完整古籍數(shù)字化保護項目的實施需要有古籍普查、整理和修復人才,古籍文獻專業(yè)數(shù)字化拍攝人才,古籍數(shù)字化管理平臺開發(fā)研究人才以及古籍數(shù)字化加工人才。各類專業(yè)人才各司其職,分工合作,方能保障古籍數(shù)字化項目的順利開展。然而現(xiàn)實往往不盡如人意。筆者通過線上問卷和線下走訪的方式對基層圖書館進行調(diào)研,發(fā)現(xiàn)普遍存在以下現(xiàn)象:基層公共圖書館古籍普查和古籍修復人員短缺;僅有的古籍數(shù)字化人才在被專業(yè)技術培訓若干年后轉行從事其他崗位工作,造成古籍人才流失。人才的匱乏嚴重制約了古籍數(shù)字化保護項目工作的開展。
隨著古籍數(shù)字化項目的不斷增多,傳統(tǒng)普通的書目數(shù)據(jù)檢索型和影像古籍數(shù)字化文獻型的資源庫已經(jīng)不再能夠滿足古籍用戶的需求,從海量古籍文獻中按照題名來篩查出他們想要的文獻檢索方式已經(jīng)過時,許多古籍數(shù)字化終端用戶更樂意按照時代、學派、文獻章節(jié)等多字段進行組合式全文檢索,或者想要查閱某個句子或詞語的出處,通過輸入關鍵詞就能按照聚類分析的算法實現(xiàn),古籍文獻數(shù)字化產(chǎn)品的開發(fā)設計與古籍使用者的需求這一對矛盾日益凸顯,如何發(fā)現(xiàn)并滿足古籍文獻資源使用者的真正需求成為亟待解決的難題。
當前古籍數(shù)字化產(chǎn)品以古籍數(shù)據(jù)資源庫居多,其核心功能大多局限于全文檢索,有的甚至不支持全文檢索,只限于簡單的翻頁閱覽,不能滿足學術科研界或者社會的知識服務需求。與其他行業(yè)(如智慧物流、智慧城市、智慧交通等)知識服務相比,古籍數(shù)字化產(chǎn)品的科技融合度偏低。將大數(shù)據(jù)、云計算和人工智能等前沿技術引入到古籍數(shù)字化項目中不僅能夠拓展古籍數(shù)字化產(chǎn)品類別,還能提升古籍利用率,為科研學者、古籍用戶提供更加便利的知識服務。
雖然公共圖書館或者高校圖書館以及古籍數(shù)字化企業(yè)開發(fā)出了許多古籍數(shù)字化項目,但是筆者通過全球網(wǎng)站排名與流量趨勢分析系統(tǒng)調(diào)查研究發(fā)現(xiàn),除了幾個古籍數(shù)字化開發(fā)較早的古籍數(shù)字化資源庫(如國家古籍保護中心的中華古籍資源庫、中華書局開發(fā)的中華經(jīng)典古籍庫等,其中,中華經(jīng)典古籍庫日均訪客數(shù)達320人次,日均訪問量達2000余次),其余古籍數(shù)字化資源庫的訪問量普遍不高。究其原因,主要有以下幾點:一是缺乏宣傳推廣。許多古籍數(shù)字化資源庫在正式發(fā)布完成后沒有進行有效的宣傳,只有開發(fā)人員和體制內(nèi)的少數(shù)人知道,導致古籍數(shù)字化資源庫鮮為人知。二是功能單一。大多數(shù)古籍數(shù)字化資源庫只有簡單的基于字段的檢索和瀏覽功能,有的甚至不支持全文檢索,降低了古籍用戶使用的積極性。三是數(shù)字資源揭示能力低,這主要表現(xiàn)為頁面展現(xiàn)方式千篇一律,大多數(shù)古籍數(shù)字化資源庫只是圖片和文字的堆疊,頗為枯燥乏味,缺乏新意。
完善古籍數(shù)字化標準規(guī)范可以從以下幾方面開展:一是確定古籍數(shù)字化標準制定的行業(yè)權威機構。建立古籍數(shù)字化標準規(guī)范小組,小組成員可以是各古籍整理、古籍保護、古籍出版等單位的行業(yè)領軍人物,由小組確定古籍數(shù)字化保護的權威標準,能夠有效解決標準差異問題。二是繼續(xù)完善古籍數(shù)字化標準。從辯證唯物主義的角度看,古籍數(shù)字化標準規(guī)范也要經(jīng)過“發(fā)展”的過程,需要在實踐應用中不斷完善。即古籍數(shù)字化標準建設從最初的摸著石頭過河的“實踐”到基本的古籍數(shù)字化標準規(guī)范的“認識”,再到新一輪“實踐”,如此不斷迭代更新,實踐過程中又會發(fā)現(xiàn)許多新的問題,提出新的解決方案,邊建設邊完善,最終形成我國相對完整的古籍數(shù)字化標準規(guī)范。三是參考借鑒國外相關標準,去粗取精,去偽存真,優(yōu)化我國古籍數(shù)字化資源建設標準,保證古籍數(shù)字資源的精確性和完整性。
隨著古籍數(shù)字化工作愈發(fā)受到國家的重視,地方財政也在一定程度上給予了資金支持,但其經(jīng)費往往是以一般性支出作為條目列出,并非作專項資金用途,且用于古籍數(shù)字化的經(jīng)費也是杯水車薪。因此,財政部門應對古籍數(shù)字化經(jīng)費進行單獨立項,增加古籍數(shù)字化經(jīng)費的投入,以便有效保障古籍數(shù)字化保護經(jīng)費。
通過增加古籍數(shù)字化保護經(jīng)費投入,館藏機構可有效解決當前我國基層館藏古籍數(shù)字化的軟硬件基礎設施落后的問題。例如,通過購置先進的古籍修復定損設備可以提高古籍修復人員在修復過程的精準定位,減少因個人經(jīng)驗主義導致的不可逆的失誤;購置先進的古籍拍攝儀器可以提高古籍數(shù)字化成像圖像資源的清晰度,保證古籍影像資源的質(zhì)量精度;購置古籍數(shù)字化工具軟件實現(xiàn)古籍的自動校勘、自動標點、自動編纂、自動注釋、自動索引、自動排版等功能,極大地提高古籍整理出版工作效率,并降低人力成本;購置便捷易用的古籍數(shù)字化管理平臺,用于古籍數(shù)字化資源的采集、組織、加工、存儲和發(fā)布管理工作。
古籍數(shù)字化保護人才的缺乏是阻礙古籍數(shù)字化項目發(fā)展的直接原因,因此,組建古籍數(shù)字化保護團隊顯得尤為重要。古籍數(shù)字化保護團隊的組成主要有:(1)古籍整理修復組,負責各專門學科的專業(yè)古籍整理和修復歸檔工作;(2)古籍影印掃描組,負責古籍文獻影印掃描工作,包括掃描后圖像的糾偏、去污處理;(3)古籍數(shù)字化平臺研發(fā)組,負責古籍文獻數(shù)字化軟件系統(tǒng)平臺的研發(fā)工作,包含后端數(shù)據(jù)庫字段設計、元數(shù)據(jù)著錄規(guī)則創(chuàng)建,其他功能性設計開發(fā)以及前端展示頁面的程序編碼;(4)古籍數(shù)字化加工著錄發(fā)布組,負責古籍文獻數(shù)據(jù)的著錄和發(fā)布工作,包含元數(shù)據(jù)錄入,OCR文字識別、圖片對象數(shù)據(jù)格式轉換、添加版權水印處理以及平臺數(shù)據(jù)審校發(fā)布。每個小組在古籍數(shù)字化項目的開發(fā)中各司其職,以流水作業(yè)的方式協(xié)作完成古籍數(shù)字化項目的建設,詳見圖1。
圖1 古籍數(shù)字化項目開發(fā)流程
通過激勵性措施,儲備復合型古籍數(shù)字化保護人才,建設古籍數(shù)字化保護團隊。激勵措施可以是以評促建[10],評選范圍可以是全國范圍的館藏機構,亦可以是省域范圍“古籍數(shù)字化保護先進集體”,或者是本單位古籍保護優(yōu)秀個人,通過評選表彰的方式提高古籍保護館藏單位、集體和個人的積極性,從而最終實現(xiàn)古籍數(shù)字化保護團隊的建設。例如,國家統(tǒng)籌依據(jù)館藏量、館藏保護基礎設施條件定期評定“全國古籍重點保護單位”,該申報評選工作已經(jīng)連續(xù)開展六期,截至2020年底,已經(jīng)有203家收藏古籍的圖書館、博物館、檔案館等科研機構成功申報為全國古籍重點保護單位[11]。此外,還可通過建立古籍保護人才培訓基地,開設集古籍修復、拍攝、數(shù)字化加工為一體的課程,定期組織專項業(yè)務培訓班,提高人才隊伍質(zhì)量。
當前我國古籍保護工作主要由古籍整理、古籍保護和古籍出版三方構成,各單位或機構在古籍保護過程中難免會存在工作交叉,但由于職權劃分,難以形成合力。實行國家層面統(tǒng)籌規(guī)劃,引導古籍整理、古籍保護和古籍出版三方協(xié)作,將有效促進資源共建共享,避免重復建設。
4.4.1 館際聯(lián)盟共建
為保證古籍文獻資源建設的完整性和準確性,避免資源重復建設,可通過聯(lián)合各公共圖書館、博物館、檔案館公益事業(yè)單位與高校圖書館共同建設古籍數(shù)字化資源庫。以唐宋八大家專題古籍數(shù)字化文獻資源庫建設為例,因唐宋八大家包含韓愈(河南?。?、柳宗元(山西?。W陽修(江西?。?、蘇洵、蘇軾、蘇轍(四川?。?、王安石(江西?。⒃枺ń魇。?,可通過聯(lián)合河南省、山西省、江西省和四川省多地的省級圖書館(省級古籍重點保護單位)和高校圖書館,組建古籍館際聯(lián)盟,共同創(chuàng)建唐宋八大家專題古籍數(shù)字化文獻資源庫,實現(xiàn)古籍文獻資源的共建共享。
4.4.2 館企合作共建
加強館企跨域合作,共同推進古籍數(shù)字化保護技術創(chuàng)新。許多從事古籍數(shù)字化的民營企業(yè)在古籍數(shù)字化技術和市場拓展上雖然比較占據(jù)優(yōu)勢,但由于缺乏古籍傳統(tǒng)專業(yè)學科的理論素養(yǎng),導致其開發(fā)的古籍數(shù)字化產(chǎn)品存在先天不足。可以充分利用各公共圖書館、博物館等公益事業(yè)單位以及高校圖書館等機構的古籍整理保護領軍人才的學科專長,彌補出版機構文獻學和考古學等專業(yè)人才的不足,同時發(fā)揮出版社機構高新技術的數(shù)字出版技術優(yōu)勢,共同為古籍數(shù)字化保護助力。
創(chuàng)建基于古籍讀者用戶數(shù)據(jù)的知識服務。傳統(tǒng)形式下古籍數(shù)字文獻庫缺乏讀者使用日志記錄功能,用戶訪問數(shù)據(jù)無法保存,圖書館無法獲取讀者需求信息。通過創(chuàng)建讀者用戶數(shù)據(jù)的知識服務可以很好地解決讀者交互數(shù)據(jù)問題,更深層次挖掘讀者潛在需求。
4.5.1 建立古籍數(shù)據(jù)中臺
古籍數(shù)據(jù)中臺的數(shù)據(jù)包含古籍用戶數(shù)據(jù)和古籍文獻數(shù)據(jù)。搭建數(shù)據(jù)中臺服務器集群將有古籍文獻需求的讀者數(shù)據(jù)統(tǒng)一存儲到數(shù)據(jù)庫中,有利于后期古籍文獻知識服務的挖掘。讀者用戶數(shù)據(jù)包含讀者瀏覽、檢索、下載等日志數(shù)據(jù)。
4.5.2 挖掘古籍文獻讀者的真實需求
通過網(wǎng)絡問卷調(diào)查表、定向古籍讀者用戶線下訪談的方式了解讀者對當前古籍文獻資源中關于功能、內(nèi)容、改進等多個方面的建議或意見。例如古籍文獻的檢索與篩選功能是否支持館藏號檢索、主題檢索、題名或條目檢索、全文檢索等;又如,數(shù)字資源的揭示方式是否支持可視化展示,文獻是否支持郵件文獻傳遞知識服務等。
4.5.3 引入智能推薦服務
以古籍數(shù)據(jù)中臺中的古籍用戶數(shù)據(jù)為基礎,利用算法分析計算出讀者感興趣的古籍文獻,并通過PC或移動端媒介增設“您可能感興趣的資源”欄目,將相關文獻資源推送給讀者,實現(xiàn)智能推薦知識服務。
4.5.4 實現(xiàn)聯(lián)合跨庫檢索功能
跨庫檢索是指一個以多個分布式異構數(shù)據(jù)源為檢索對象的數(shù)據(jù)檢索功能,簡而言之即用戶只要輸入一次檢索關鍵詞,就能夠實現(xiàn)同時在多個不同的數(shù)據(jù)資源庫中檢索。隨著古籍數(shù)字化資源庫的不斷增多,出現(xiàn)了許多數(shù)據(jù)庫類型和建庫標準異構的資源庫,其檢索方式和使用方法可能存在差異,讀者若要使用它們,就必須對每個資源庫的使用方法都掌握,這無疑給其帶來了極大的不便。通過聯(lián)合跨庫檢索功能可以大大節(jié)約讀者的檢索時間,提高查全率和檢索效率??鐜鞕z索功能的實現(xiàn)可以有多種,一是通過定期同步各數(shù)據(jù)資源庫的編目文獻數(shù)據(jù)匯總到古籍數(shù)據(jù)中臺,再通過技術手段對獲取的數(shù)據(jù)進行篩選和數(shù)據(jù)清洗,避免出現(xiàn)數(shù)據(jù)質(zhì)量問題,最后將經(jīng)過“清洗”無誤的數(shù)據(jù)整合到以數(shù)據(jù)中臺數(shù)據(jù)為檢索對象的檢索系統(tǒng),實現(xiàn)一鍵跨庫檢索;二是通過建立多個異構古籍數(shù)據(jù)庫的連接,利用數(shù)據(jù)庫操作語句將不同檢索結果進行組合、去重、拼接,最終將其顯示在前端頁面。
4.5.5 融合科技元素,讓書寫在古籍里的文字活起來
通過融合科技創(chuàng)新元素,為讀者提供透明化、智慧化、創(chuàng)新化的知識獲取服務,這不僅有利于用戶對古籍文獻的資源獲取,提升用戶的使用體驗,同時亦可提高館藏古籍文獻的利用率。例如,可引入大數(shù)據(jù)、AI人工智能和可視化、虛擬現(xiàn)實等技術,對古籍文獻轉換后的數(shù)據(jù)進行深度知識挖掘、加工和可視化展示,積極引入智能聚合算法,構建知識圖譜,有效提升和改變知識獲取方式。
古籍數(shù)字化成果的利用是古籍數(shù)字化保護的目的所在,檢驗其利用率的高低能夠間接反映古籍數(shù)字化成果的優(yōu)劣。除去館藏機構基礎設施不健全、技術薄弱等問題,出現(xiàn)古籍數(shù)字化成果利用率低的主要原因是缺乏宣傳推廣。早期古籍文獻“重藏輕用”思想的根深蒂固導致了古籍文獻資源共享意識的缺失,為古籍數(shù)字化成果的利用帶了嚴重阻礙。因此,首先必須從意識上強化古籍數(shù)字化文獻資源開放共享的認知理念。其次,加強古籍數(shù)字化成果的推廣活動。通過聯(lián)合多家館藏機構開設展覽、組織名家講座、古籍品鑒有獎活動等,創(chuàng)新古籍數(shù)字化成果線上閱覽和線下展覽新模式。最后,組織有力的宣傳報道。通過微信、微博、抖音直播、門戶網(wǎng)站、新聞媒體等媒介大力宣傳古籍數(shù)字化成果,提高古籍數(shù)字化成果知名度。
古籍數(shù)字化保護任重而道遠,它是一項具有周期性的長期工作。如果說數(shù)字化標準、資金投入和人才建設是古籍數(shù)字化保護的基石,那么技術創(chuàng)新、統(tǒng)籌協(xié)作和宣傳推廣則是關乎古籍數(shù)字化保護得以發(fā)展的必由之路。