文·紀瑋
據(jù)有關統(tǒng)計,我國保存至今的古籍約23萬卷,古籍藏量約5000萬冊,可謂卷帙浩繁,這些寶貴的歷史文化遺產,蘊藏著豐富的信息資源,是現(xiàn)代科學研究中重要的原始材料[1]。但隨著時間的推移,我國古籍檔案正由于各種自然或人為的原因遭受著不同程度的損害,造成了文化遺產的損失,因此在信息時代必須對古籍檔案加以數(shù)字化保護。古籍檔案數(shù)字化就是從保護和開發(fā)古籍檔案的目的出發(fā), 利用計算機數(shù)字技術, 將常見的語言文字或圖畫轉化為能被計算機讀取的數(shù)字符號, 從而制成古籍檔案目錄數(shù)據(jù)庫或古籍檔案全文數(shù)據(jù)庫, 用以系統(tǒng)展示古籍檔案信息資源的一項工作。古籍檔案數(shù)字化工作不僅有助于古籍檔案的保護工作,還可有效提高古籍檔案的利用率,讓古籍發(fā)揮科研、史料等多方面作用。
我國自上世紀八十年代開始古籍檔案的數(shù)字化工作,雖然取得一定成果,但由于資金、技術等原因仍存在一些問題,取得的成果在實用性、通用性、有效性等方面還存在許多不足[2]。古籍檔案數(shù)字化是一項艱巨且復雜的長期性工程,涉及各級機構和各種部門,既有教學研究的相關機構,又有各級圖書館、檔案館、博物館,還有許多商業(yè)機構和部門。由于各個單位相互獨立、各自為政,從而難以進行整體規(guī)劃和共同開發(fā)利用,不利于古籍檔案數(shù)字化的發(fā)展和數(shù)字化后的資源共享,也使數(shù)字化選題內容重復建設嚴重,例如《四庫全書》就有多種檢索版本,直接影響到古籍數(shù)字化產品的服務質量和用戶數(shù)量。此外,沒有制定統(tǒng)一的古籍數(shù)字化著錄標引格式,缺少一套完整的標準規(guī)范,數(shù)字化文件格式數(shù)量多,不統(tǒng)一。截止目前,我國也沒有形成一個相對完整的全國性的古籍書目或是全文數(shù)據(jù)庫,古籍檔案數(shù)字資源分散,不利于古籍數(shù)字資源的共享和進行深層次的研究。
古籍數(shù)字化的定位就在于對紙質古籍的完全數(shù)字還原,但數(shù)字化后的文本內容或多或少都會由于簡繁字體、俗體字、音同音近字、避諱字,甚至是另外加入的標點符號等復雜的原因產生與原文意義上的偏差[3],另外由于計算機字庫不足,古今的視圖版式的差異,導致部分古籍數(shù)字版本難以適應現(xiàn)代讀者的閱讀習慣。大部分進行影印的古籍,與現(xiàn)代格式有所差別,四頁內容被合并到一頁上,進行重新排列,大部分讀者可能會對這種影印古籍的排版產生不適感,導致一定的閱讀困難。古籍檔案數(shù)字化不僅要求古籍內容的真實性和完整性不被破壞,還要保證數(shù)字化古籍檔案可以滿足當代人的閱讀習慣。形成數(shù)字版本的古籍不只是古籍數(shù)字化的終點,還需進一步的挖掘整理,進入知識深度開發(fā)階段,目前我國對運用數(shù)字技術對古籍進行分析、文本聚類、可視化等方面還存在不足,尚待將隱形信息顯性化。
古籍檔案編目人員既要有扎實的歷史文化知識,又要對目錄學、文字學、版本學、文獻學等專業(yè)范疇有一定的了解和基礎,此外,還要能夠較好地掌握古代漢語知識,這樣才能對古籍檔案內容進行最大限度地保真還原,充分發(fā)揮其作用。古籍整理的相關人員通常具有一定的古漢語知識和文獻學基礎,并擁有豐富的古籍整理經(jīng)驗,但他們對于現(xiàn)代的網(wǎng)絡技術和云技術等信息技術方面的掌握并不一定充分。反之,那些檔案數(shù)字化方面的相關人員可能在計算機技術、網(wǎng)絡技術、信息技術等領域擁有較為熟悉,擁有扎實的業(yè)務能力,但由于缺少相關文學知識和古籍整理經(jīng)驗,也難以勝任該工作。大數(shù)據(jù)時代,古籍檔案管理工作者自身的能力素質直接影響到古籍檔案數(shù)字化工作的質量與效率,而既熟悉業(yè)務又掌握技術的復合型人才建設跟不上實際需求,是數(shù)字化建設過程中不可忽視的重要問題[4],新形勢下,提高相關人員的素質能力和知識以適應工作需要已迫在眉睫。
為了避免相關部門各自為政,缺乏整體規(guī)劃而導致的同一項目重復制作的現(xiàn)象,古籍檔案數(shù)字化工作需要一個全國性的權威機構進行統(tǒng)一管理和協(xié)調,對古籍檔案數(shù)字化工作進行宏觀調控和業(yè)務指導??傮w規(guī)劃有利于加強各部門之間的聯(lián)系,統(tǒng)籌協(xié)調各相關單位的古籍檔案資源與檔案數(shù)字化工作,及時發(fā)現(xiàn)數(shù)字化工作中的問題并進行指導協(xié)力解決,有效避免產品重復問題,減少資源浪費的現(xiàn)象。同時,需要建立統(tǒng)一的數(shù)字化標準規(guī)范,優(yōu)化數(shù)字化流程,降低數(shù)字化古籍不兼容問題的幾率,充分實現(xiàn)古籍檔案數(shù)字化共建共享,推動數(shù)字化和信息化社會的建設。
古籍因為種種原因會形成不同版本。不同版本古籍中的文獻版式、牌記、行款、題跋、藏書印等原始特征會有所差異,而這些細節(jié)也蘊含著大量的重要信息。選擇不同版本數(shù)字化,結果可能相差較大。一般說來,古籍檔案數(shù)字應當以相對完善的版本為首選,最好能夠同時形成文本和圖形兩種形式,這樣既可以進行古籍檔案的全文檢索,又可以還原古籍原貌。因此,古籍檔案數(shù)字化過程中應該盡可能的選擇善本作為數(shù)字化的基礎,為人們提供更為準確的信息和更加詳盡的資料。
伴隨著信息技術、知識經(jīng)濟的不斷發(fā)展,古籍管理人員必須意識到終身學習的必要性,不斷強化個人知識素養(yǎng)的培養(yǎng),自覺提高職業(yè)道德水平、主動豐富圖書館學、檔案學、博物館學等方面的知識、努力掌握一定的計算機能力,熟練應用信息學和先進的網(wǎng)絡知識,進而提高古籍檔案整理的素質和業(yè)務能力。各部門也應定期開展相關培訓和學習,為相關人員的業(yè)務能力和知識水平提高提供幫助;應建立在職教育培訓機制,啟動檔案專業(yè)技術職務評定制度,側重培養(yǎng)掌握檔案專業(yè)知識技能、具備歷史文化和現(xiàn)代信息技術背景知識的人才[5]。
古籍檔案數(shù)字化符合信息社會網(wǎng)絡化和信息化的要求,是時代發(fā)展的潮流與趨勢。但目前我國古籍檔案數(shù)字化的發(fā)展尚未成熟,仍有許多方面的問題,各相關部門應積極配合古籍檔案的數(shù)字化工作,相互合作協(xié)調,積極進行數(shù)字化建設,共同促進古籍檔案的高效管理與利用工作。