文·金澤龍
廣東輕工職業(yè)技術(shù)學院(以下簡稱:廣東輕院)是一所具有85年歷史的國家示范高職院校,圖書館與檔案室歷史悠久,有豐富檔案館藏,是學術(shù)研究的重要機構(gòu)。然而大量珍貴檔案為紙質(zhì)版本,保存相當脆弱,無法全面開放供外界閱覽。為了將可公開的珍貴檔案予外界使用,圖書館與檔案室響應“國家館藏數(shù)字化計劃”,積極參與整理規(guī)劃珍貴館藏資料的數(shù)字化活動,加速館藏“輕工文獻”資料的數(shù)據(jù)庫建設(shè),力圖使“養(yǎng)在閨中”的深具輕工文化特色的文獻資料早日供大眾使用,協(xié)同學術(shù)研究發(fā)展。
輕工文獻資料中“紙文化特色檔案”是一個比較重要的資源,是獨立的有影響的紙物態(tài)文化、行為文化、制度文化與心態(tài)文化的表象,是以紙為主線,延展由此而派生出來的生產(chǎn)與應用內(nèi)容。
“紙文化特色檔案”包括了紙的物態(tài)文化檔案——紙生產(chǎn)、紙應用、造紙術(shù)傳播;紙的行為文化檔案——紙習俗、紙使用導致進步;紙的制度文化檔案——紙載體法律、宗教、政治、經(jīng)濟等制度形成;紙的心態(tài)文化檔案——紙精神、紙語言藝術(shù)、紙載體藝術(shù)等。
為展現(xiàn)廣東輕院檔案資料的數(shù)字化成果,館員和數(shù)據(jù)庫商協(xié)同合作,依據(jù)數(shù)字化工作經(jīng)驗,針對“紙文化特色檔案”數(shù)據(jù)庫要求,制定了相關(guān)規(guī)則與規(guī)范,編排了文字、影像、聲音等檔案資源轉(zhuǎn)化的程序,打好檔案資源數(shù)字化的工作基礎(chǔ)。
“紙文化特色檔案”數(shù)字化工作,分為文字的電子化、建構(gòu)可供檢索的數(shù)據(jù)庫、影像資料的電子化三個部份進行。具體流程為:了解數(shù)據(jù)現(xiàn)狀,制作詳細列表與各種相關(guān)表格→設(shè)置數(shù)字化的規(guī)格與工作標準,撰寫數(shù)字化規(guī)格書→訂定工作規(guī)范→搭建數(shù)據(jù)庫。
首先,對“紙文化特色檔案”資料清點與記錄。紙文化特色檔案復雜度頗高,文獻現(xiàn)實狀態(tài)非常不堪。較多紙質(zhì)文獻相互黏連,尺寸規(guī)格又不一致;很多檔案文獻包含有多個附屬文件,且部分附件無從判斷其原屬于哪件文獻;有的較大篇幅文獻必須分區(qū)掃描,才能顯示完整等等。
其次,制作綱要式清單,設(shè)計對應列表及各種相關(guān)表格。清單制作遵循以下條件:①明確長度較長的檔案名稱;②標記數(shù)字化圖像文獻名稱;③鑒定數(shù)據(jù)復雜性高的檔案。紙文化特色檔案里兩種清單都要制作,如進行掃描的時候,每掃描一筆,即在流水式清單中打勾,并在檔名之旁標注所測量尺寸,同類檔案文獻掃描完成后的總清單,交由館員依據(jù)輸入檔案文獻的尺寸,更新檔案文獻名列表。同時,對于沒有修裱也未掃描的檔案文獻,在檔案文獻名旁加注特定符號,完成全部掃描并更新檔案文獻名列表之后,再以篩選特定符號的方式,尋找出相關(guān)檔案文獻,即可簡易的以復制、黏貼的手段,為未掃描的檔案文獻制作清單,方便日后調(diào)取檔案文獻,及時送去修裱和掃描建檔。
“紙文化特色檔案”因為前人的耕耘和有意識的收集,已經(jīng)保有一定的館藏量,但并不完整。根據(jù)我館現(xiàn)狀,我們將“紙文化特色檔案”文字部分制作了兩種電子版。一種是經(jīng)由全文電子文件為藍圖排印出版,特色是字體較為清晰;一種為微卷影印制成的紙本,比較不失原貌。
電子版經(jīng)過排版、校稿修正后,已非館內(nèi)初步校稿工作完成的版本。因為“紙文化特色檔案”文檔版式復雜,印刷本大多為上下雙欄,文中間雜不同大小粗細字體,又有雙行并排文字以及粗黑方括號等不適用一般的排版軟件,直接轉(zhuǎn)換回純文本文檔后,錯誤率極高。而OCR漢字辨識系統(tǒng)對于版面樣式復雜、較早期印刷與文字清晰度不均勻的印刷版本,又無法進行辨識。因此,紙文化特色檔案文字資料電子化可以考慮直接以印刷本進行轉(zhuǎn)換,亦即采用將印刷版本轉(zhuǎn)換成PDF文檔的方式,以節(jié)省再度檢校的時間。
數(shù)字化工作目的是通過技術(shù)手段,將檔案文字內(nèi)容轉(zhuǎn)換為數(shù)據(jù)形式永久保存,建立數(shù)字化成果文檔,進而建構(gòu)可供查詢利用的數(shù)據(jù)庫,增進使用的方便性。理想數(shù)據(jù)庫功能應擁有:提供人名、地名權(quán)威檔目的靈活便捷檢索;提供主題詞、關(guān)鍵詞清單;提供選單檢索;提供閱覽簡目、閱覽詳目、閱覽全文、閱覽影像等選項;提供某一筆(某一頁)資料和具有相關(guān)性的上下屬、平行等資料,或前翻頁、后翻頁等選項。
“紙文化特色檔案”數(shù)據(jù)庫建構(gòu)目的就是使紙文化特色信息廣泛流傳,發(fā)揮其收藏的文化與學術(shù)價値。數(shù)據(jù)庫功能均涉及“詮釋數(shù)據(jù)”或“后設(shè)數(shù)據(jù)”的檔案資料,有批注與描述數(shù)據(jù)呈現(xiàn)保存記錄。數(shù)據(jù)庫字段設(shè)計遵照國際和國家標準,從流水式清單產(chǎn)生,以備將來能夠與各國各地檔案館交換數(shù)據(jù),便于整合成更完整的數(shù)據(jù)庫,也是圖書館或檔案室管理“紙文化特色檔案”數(shù)據(jù)的依據(jù)。同時,運用數(shù)據(jù)庫,還須考慮回收率、精確率與排序,區(qū)分“簡單類目”與“詳細類目”,以符合使用者的需求。
在影像檔案資料轉(zhuǎn)變?yōu)殡娮踊郧?,需依照功能、類目,合理編排各種檔案規(guī)格大小,統(tǒng)一建立新的檔案目錄資料。按照當前中國國家和行業(yè)標準,一般分為館藏級、電子級和公共級三種。館藏級:未經(jīng)壓縮之檔,如Tiff檔(純文字),僅用于永久館藏,作為電子檔案文件被損壞,沒有其它檔案可供轉(zhuǎn)檔或復制時的備份;電子級:將檔案先建立Tiff檔(純文字),之后轉(zhuǎn)檔成JPEG檔(圖片);公共級:將數(shù)字成果放于網(wǎng)絡閱覽,考慮網(wǎng)速因素,一般設(shè)置檔案文獻大小在350KB內(nèi)較佳。
“紙文化特色檔案”數(shù)量大,規(guī)格多,經(jīng)初步收集整理后,委托廠商對大量檔案原件掃描成圖像案卷,再配合全文電子檔案放于網(wǎng)絡。原則上檔案文獻以“件”為單位,每個全文電子檔案配一個影像電子檔案。使用者在閱讀全文電子檔案的同時,如果要了解跟蹤與此檔案文獻其它相關(guān)內(nèi)容,可以點選影像電子檔案做進一步的查閱工作。影像電子檔案還有放大的功能,讀者可以在最佳的情況下察看影像電子檔案。
“紙文化特色檔案”數(shù)據(jù)庫對廣東輕院數(shù)字化的影響,不僅可以體現(xiàn)檔案本身價値,而且對高校檔案教育有積極推動的作用。希望借此項工作的開展,嘗試回答“紙”的某些問題,充盈“紙”的知識,豐富“紙”的文化,推動“紙”的應用,拓展其它檔案數(shù)字化工作,樹立高校檔案數(shù)字化的品牌。
據(jù)檔案文獻考證,我國西漢時已開始了紙的制作,東漢時得以完善。魏晉南北朝時期紙廣泛流傳,普遍為人們所使用,造紙術(shù)進一步提高,也有了竹簾紙、藤紙、魚卵紙等名目繁多的紙的名字出現(xiàn)。與此同時,人的聰明才智也在造紙原料開發(fā)方面得以充分發(fā)揮。如蔡倫造紙的原料就非常廣泛,以爛魚網(wǎng)造的“網(wǎng)紙”,破布造的“布紙”等。隋唐時期,利用樹皮制造“宣紙。唐代在前代“染黃紙”的基礎(chǔ)上,在紙上均勻涂蠟,使紙具有光澤瑩潤艷美,生產(chǎn)出“硬黃紙”。北宋歙州制造出當時公認為是最好的“澄心堂紙”。到了明清,造紙業(yè)又興旺和創(chuàng)新,各種“箋紙”再次盛行起來。質(zhì)地上推崇白紙地和淡雅的色紙地,顏色上以鮮明靜穆為主,如康熙、乾隆時期的“粉蠟紙”,印花圖繪的“染色花紙”等。彼時,紙的制作已到了完美絕倫的地步。
時代的發(fā)展進步,使記錄各種知識的“紙”成為展現(xiàn)獨立的有影響的紙物態(tài)文化、行為文化、制度文化與心態(tài)文化的特殊物質(zhì)。造紙術(shù)傳播體現(xiàn)了紙的物態(tài)文化;紙習俗體現(xiàn)了紙的行為文化;紙載體的法律、宗教、政治、經(jīng)濟等形成了紙的制度文化;紙精神、紙語言藝術(shù)展現(xiàn)了紙的心態(tài)文化。
由此可見,廣東輕院雖本身擁有不少的珍貴檔案,但優(yōu)先挑選“紙文化特色檔案”進行數(shù)字化,發(fā)揮紙文化的特殊性,輔助師生教育學習有十分重要的意義。主要原因有四:
一是“紙文化特色檔案”由于年代久遠、政局動蕩與保存不易等因素,目前僅有部分文化檔案流傳至今,珍貴性可想而知。對此文化遺產(chǎn)的保護利用是我們責無旁貸的義務和責任。
二是“紙文化特色檔案”做過一定的系統(tǒng)整理與校稿。早在民國時期和解放初期,廣東省第一技工學校、輕工業(yè)部廣州中等專業(yè)學校(廣東輕工職業(yè)技術(shù)學院前身)曾因?qū)W校專業(yè)建設(shè),輔助教學,增進“紙”知識的了解和應用的需要,就將這些紙文化特色檔案陸續(xù)收集,并進行了部分的整理供研究利用,如“紙圖大觀”和“紙與國學”就有“紙文化特色檔案”的案例影子。后來,中國輕工業(yè)部、廣東省輕工業(yè)廳、廣東省造紙研究所、中國輕工總會、廣東省輕工學會等輕工技術(shù)及造紙專家與我校林潤惠教授等學者通力合作,經(jīng)過數(shù)年時間開展 正式的大規(guī)模整理檔案,進行了裱褙修補、分類編號,并且將之更名為“紙文化特色檔案”,雖還有遺缺,但也為參與數(shù)字館藏計劃與數(shù)據(jù)庫建構(gòu)打下了良好的基礎(chǔ),展現(xiàn)了高校檔案室和圖書館數(shù)字化行動的活力,成為廣東輕院檔案數(shù)字化的模范。
三是因為“紙文化特色檔案”內(nèi)容與我校輕工類專業(yè)和藝術(shù)設(shè)計專業(yè)(均為國家重點建設(shè)專業(yè)項目)相關(guān)的歷史、地理、造紙學、藝術(shù)學等各方面知識匹配。例如歷史部份,可以將特色檔案中紙張由來、紙張制造、折紙和剪紙藝術(shù)設(shè)計相關(guān)的案例,做成一個可供查詢的紙歷史文化數(shù)據(jù)庫,提供師生學習利用。
四是選定優(yōu)秀的成熟的數(shù)字建設(shè)數(shù)據(jù)庫廠商協(xié)同合作。為響應“數(shù)字中國”建設(shè),跟上新時代步伐,我校傾全力在資金時間上加大投入力度,由學校教授學者專家團隊聯(lián)合目前中國規(guī)模最大的數(shù)字圖書館解決方案提供商和數(shù)字圖書資源提供商——北京超星公司,在廣東省檔案局指導下,強強聯(lián)手開展高校數(shù)字檔案計劃,由雙方共同制作,搭建“紙文化特色檔案”數(shù)據(jù)庫,傳承以紙為主線,由此而派生出來的生產(chǎn)與應用的檔案文獻遺產(chǎn)。
“紙文化特色檔案”收集了非常翔實的數(shù)據(jù),內(nèi)容豐富多彩,提供社會生活的實態(tài),全部以動態(tài)“紙”檔案方式呈現(xiàn),希望以生動簡單的敘述引起使用者的興趣,喚醒使用者對紙文化特色檔案的需求,為研究東西方“紙”歷史的政治、經(jīng)濟、社會、行政組織各方面做出貢獻,也使“紙文化特色檔案”數(shù)據(jù)庫成為廣東輕院檔案數(shù)字化的首個自建數(shù)字檔案。
“紙文化特色檔案”數(shù)據(jù)庫網(wǎng)站共分為“紙文化”“紙與藝術(shù)”“紙的大觀”“紙的藝術(shù)”“紙與社會”“紙與經(jīng)濟”“紙與自然”“紙的視頻”“紙的歌曲”“中國的造紙”“其他”等十一個部分。
內(nèi)容上描述了紙的發(fā)明與歷史環(huán)境與人類需求的關(guān)系;鏈接了紙文化特色信息系統(tǒng)和多媒體數(shù)據(jù)庫;呈現(xiàn)了較豐富的紙文化特色參考資料。并且,在“紙與經(jīng)濟”欄目中嵌入了電子游戲與市場調(diào)查,冀望借由活潑的教學與游戲,讓使用者能夠更深入了解“紙”的歷史。同時,附有教師的教輔資料與意見交流,希望能做出使學生真正喜歡的動態(tài)的紙文化特色檔案館。
廣東輕院推廣的“紙文化特色檔案”是介于古典與現(xiàn)代交互的學術(shù)檔案文書,包含了紙張來源與廣泛使用的相關(guān)資料。數(shù)字檔案中行文與用詞遣字,風格新舊雜陳,涵蓋了古代、現(xiàn)代、東西方種種紙文化特色歷史,加強了學術(shù)與教育應用,充實了“紙文化”特色檔案豐富內(nèi)容,建構(gòu)了學習知識網(wǎng)(http://211.66.190.2/),為讀者了解“紙文化”,查詢利用“紙文化特色檔案”做出了貢獻,極大提升了師生思維和文史素
1.具有充盈內(nèi)容的“紙文化特色檔案”學習課程與知識庫。數(shù)據(jù)庫有紙文化特色(藏書票集、非紙之紙、節(jié)約用紙、金石藝術(shù));紙與藝術(shù)(紙與煙標、3D畫集、兒童畫集、鋼板畫集),紙的大觀(紙品大觀、紙圖大觀),紙的藝術(shù)(龍飛鳳舞、裱畫藝術(shù)、玻璃紙集、疊紙藝術(shù)),紙與社會(紙的漫畫、紙能破案、紙與法律、紙與國學),紙與經(jīng)濟(電子游戲、市場調(diào)查、紙的廣告、紙與包裝),紙與自然(紙與地理、紙與化學、紙與生物、紙與數(shù)學)等豐富多彩的紙檔案內(nèi)容與品目,甚至還有紙的視頻和紙的歌曲。
2.圖文并茂的詳細解說了“紙”角色及紙文化檔案內(nèi)涵。通過“文字描述”和“多樣圖片”等形式,將社會歷史進程中各種“紙文化特色檔案”加以解說,幫助讀者掌握各類紙檔案中的重要信息,正確解讀“紙文化特色檔案”。列舉了紙檔案的行政、民事、刑事等較具完整的個案,說明“紙”在各流程工作中的作用;不僅呈現(xiàn)全案內(nèi)容,亦可以了解涉及當時社會各層面的生活狀態(tài)。
3.設(shè)置“測驗”欄目,提供讀者測評學習成果的參考。數(shù)據(jù)庫也具備知識庫中的百科特色,設(shè)置了相關(guān)內(nèi)容的測驗。如什么是紙文化特色、紙的市場應用在哪里以及視頻測試等等。同時,也開辟了主人為貓貓建造紙、紙制航母、紙的旋律show、造紙術(shù)的體驗等欄目?!笝n案柜”則是收錄與“紙文化特色檔案”相關(guān)的期刊論文、博碩士論文、專著、學者評論、研討會論文與網(wǎng)絡資源等內(nèi)容。
4.為后續(xù)完善“紙文化特色檔案”歸類整理打下良好基礎(chǔ)?!凹埼幕厣珯n案”內(nèi)容與種類繁多,數(shù)據(jù)庫的構(gòu)建前期分類妥善,制作了相關(guān)清單,標注了檔案名目,記錄了數(shù)字化流程,對今后決定修裱、文字電子化與影像數(shù)字化打下良好基礎(chǔ)。從館藏目的出發(fā),盡可能的將“紙文化特色檔案”信息展示在使用者面前,進一步走向推廣運用,使讀者掌握使用特色數(shù)據(jù)庫,并從中加深人文素養(yǎng)與歷史認同。
“紙文化特色檔案”數(shù)據(jù)庫為廣東輕院自主建構(gòu)的檔案數(shù)字化產(chǎn)物,建設(shè)之初遇到了許多的問題,只能憑借團隊集思廣益,制定適當?shù)囊?guī)范進行處理解決。
隨著社會發(fā)展進步,收集的“紙文化特色檔案”越來越多,數(shù)據(jù)量呈幾何數(shù)增長。為整理并數(shù)字化處理紙文化檔案,建檔工作必須有具體的規(guī)則可循,確保工作前后一致性,保障數(shù)字化工作質(zhì)量,高校必需投入大量人員,增加整理歸類的時間。
首先,根據(jù)檔案數(shù)據(jù)狀況、數(shù)據(jù)價值、未來規(guī)劃、數(shù)據(jù)管理原則等,制定合適的紙文化檔案數(shù)字化的規(guī)格及各種規(guī)范。其次,整體全盤考慮檔案數(shù)字化作業(yè),將其分割成上游(影像數(shù)字化、全文數(shù)字化)模塊與下游(檢索程序撰寫、數(shù)據(jù)庫建構(gòu))模塊。充分協(xié)調(diào)各步驟,研究商榷各階段工作銜接方案,盡可能完善規(guī)劃,以不需日后回溯修正為最高目標,努力達到既有助于高校內(nèi)部檔案文獻處理,也減少與數(shù)據(jù)庫商間銜接問題的目的。
廣東輕院紙文化檔案數(shù)字化建設(shè)與建構(gòu)“紙文化特色檔案”數(shù)據(jù)庫的目標與展望是相符的,最終目的是如何妥善應用與輔助教學,提升教學質(zhì)量。對研究人員來說,目前“紙文化特色檔案”數(shù)據(jù)庫的電子全文僅于校內(nèi)瀏覽,若要進行相關(guān)研究,不僅要利用出版的“紙文化特色檔案”的紙本數(shù)據(jù),還要注冊廣東輕院數(shù)據(jù)庫,應用范圍上或多或少成為限制。雖然可以保護“紙文化特色檔案”的版權(quán),卻失去了數(shù)字化中“交流”的意義;對一般讀者來說,“紙文化特色檔案”數(shù)據(jù)庫的內(nèi)容必須轉(zhuǎn)換成教學教育娛樂的方式,然而如何“寓教于樂”,仍是一項艱巨的挑戰(zhàn)。
一是特色檔案資源有機利用,鍥入文化活動網(wǎng)站?!凹埼幕厣珯n案”學習知識網(wǎng)應適應各類人群,通過較活潑的動畫與游戲,吸引使用者的目光。網(wǎng)站整體內(nèi)容不能過于簡單,否則學習效果有限。希望透過網(wǎng)站教導如何使用“紙文化特色檔案”數(shù)據(jù)庫,鎖定有興趣的使用者,明確網(wǎng)站建構(gòu)預定目標與內(nèi)容,豐富網(wǎng)站面貌。二是完善自身數(shù)據(jù)庫出版物建設(shè),奠定研究基礎(chǔ)。“紙文化特色檔案”數(shù)據(jù)庫(電子版)與“紙文化特色檔案”(紙質(zhì)版)出版要相輔相成,不能忽略其一。當前“紙文化特色檔案”數(shù)據(jù)庫僅限于本高校使用,外校使用者并不方便。數(shù)據(jù)庫雖具館藏效果,但仍有將學術(shù)成果視為自身財產(chǎn)的意識,應打破壁壘,實現(xiàn)共贏共促,深入探究數(shù)字館藏計劃所面臨的共同問題。
已有85年建校歷史的廣東輕院,前身為輕工業(yè)部廣州中等專業(yè)學校,其設(shè)立宗旨是以輕工專業(yè)教育為主,從事輕工、造紙、藝術(shù)的有關(guān)歷史、自然、產(chǎn)業(yè)、資源等各方面的科學研究和企業(yè)生產(chǎn);更以培養(yǎng)華南地區(qū)輕工人才,服務于華南地區(qū)經(jīng)濟為設(shè)立目標,是極具地域特色的輕工業(yè)技術(shù)教育。因此,學校對于“紙文化特色”相關(guān)檔案資料的收藏與研究成果,堪稱華南地區(qū)研究的重地。
“紙文化特色檔案”重要資源文獻的數(shù)字化建設(shè),不僅證明廣東輕院有實力將自身的館藏檔案文獻整體規(guī)劃進行數(shù)字化與應用,而且表示了檔案數(shù)字化技術(shù)方面的成功,呈現(xiàn)了交叉學科合作的互融效能,對于高校檔案未來數(shù)字化的方向給予莫大的鼓勵,也是高校積極參與“國家館藏數(shù)字化計劃”工作的現(xiàn)實行為表現(xiàn)。
隨著數(shù)字化工作經(jīng)驗的增進,高校各種文獻資源的數(shù)字化成果不僅要保持傳統(tǒng)本色,也要適應新技術(shù)網(wǎng)絡化物聯(lián)網(wǎng)的發(fā)展。因此,“紙文化特色檔案”數(shù)據(jù)庫在保存檔案、檢索系統(tǒng)與開放應用方面的成功,冀望提供后人模仿改良的藍圖,影響高校檔案數(shù)字化工作今后發(fā)展方向,在數(shù)字化的里程碑方面有不可磨滅的意義。
為適應新時代,在國家推行建立“數(shù)字中國”“數(shù)字檔案”政策指導下,各地檔案館或圖書館均積極響應以核心館藏內(nèi)容為基礎(chǔ)、延展學術(shù)教育、社會學習與產(chǎn)業(yè)應用發(fā)展為目標的數(shù)字化工作?!凹埼幕厣珯n案”數(shù)據(jù)庫具有前瞻性和有效性,最大意義是廣東輕院圖書館與檔案室館藏數(shù)字化成果的展現(xiàn),可以將“紙文化”廣泛傳播,了解“紙文化檔案”內(nèi)容與價值,提供完善便捷的檢索服務,實現(xiàn)了推廣利用目的。“紙文化特色檔案”雖歷年收集,但長期臥于高校檔案室和圖書館,應用不普及。目前建構(gòu)的“紙文化特色檔案”數(shù)據(jù)庫尚有許多不足之處,希望對所有的檔案數(shù)字化有引導借鑒的作用。