肖 紅 吳 茗 曾 燕(國(guó)家圖書館,北京100081)
?
民國(guó)報(bào)紙縮微膠片數(shù)字化及服務(wù)探析
——以國(guó)家圖書館為例
肖紅吳茗曾燕
(國(guó)家圖書館,北京100081)
[摘要]民國(guó)報(bào)紙是研究民國(guó)歷史、把握民國(guó)文化精髓的重要文獻(xiàn),受載體損壞、組織形式復(fù)雜等因素影響,一直未能廣泛為讀者提供服務(wù)。結(jié)合國(guó)家圖書館的具體實(shí)踐,系統(tǒng)分析了民國(guó)報(bào)紙縮微膠片的數(shù)字化方法及服務(wù)模式,并介紹了工作中存在的問題及對(duì)未來的展望。
[關(guān)鍵詞]民國(guó)報(bào)紙縮微膠片數(shù)字化服務(wù)
[分類號(hào)]G255.72
自我國(guó)第一種報(bào)紙——唐朝時(shí)的邸報(bào)(官報(bào))問世以來,我國(guó)報(bào)業(yè)便迅速發(fā)展,并成為傳播知識(shí)、社會(huì)教育的重要媒介。民國(guó)報(bào)紙經(jīng)歷了辛亥革命、五四運(yùn)動(dòng)等多次社會(huì)動(dòng)蕩,承載著特定歷史時(shí)期的珍貴記錄,是反映民國(guó)時(shí)期中國(guó)政治、經(jīng)濟(jì)、軍事、科學(xué)、文化、生活等各個(gè)方面的重要文獻(xiàn),同時(shí)也是中華民族文化寶庫的有機(jī)組成部分,具有特殊的參考價(jià)值和史料價(jià)值。
民國(guó)時(shí)期是造紙工藝過渡時(shí)期,因材料混雜,工藝落后,導(dǎo)致民國(guó)報(bào)紙酸度大,質(zhì)量差,極易老化。另外,報(bào)紙建報(bào)之初并未考慮長(zhǎng)期保存,受保存條件和方法所限,大量民國(guó)報(bào)紙出現(xiàn)紙張惡化、無法利用的慘狀。近年來,很多圖書館采用縮微或數(shù)字化技術(shù)進(jìn)行民國(guó)報(bào)紙的搶救、保存為讀者服務(wù)。筆者在國(guó)家圖書館從事文獻(xiàn)數(shù)字化工作多年,并親身參與民國(guó)報(bào)紙縮微膠片的數(shù)字化及服務(wù)工作,提出幾點(diǎn)想法,希望能為其他圖書館的民國(guó)報(bào)紙數(shù)字化工作起到借鑒作用。
1.1縮微膠片的優(yōu)點(diǎn)
與民國(guó)報(bào)紙?jiān)?yán)重?fù)p壞、一觸即碎屑滿地的情況相比,其縮微膠片在很大程度上解決了民國(guó)報(bào)紙的保存和服務(wù)問題。縮微膠片節(jié)省存儲(chǔ)空間,通過拷貝的方式可基本實(shí)現(xiàn)長(zhǎng)期保存,并可通過一定的政策實(shí)現(xiàn)各圖書館間民國(guó)報(bào)紙的共建共享,查漏補(bǔ)缺。
1.2縮微膠片的局限
膠片因其載體的特殊性,只能使用專門的膠片閱讀設(shè)備閱讀,硬件成本較高,圖書館配置數(shù)量有限,尤其是經(jīng)費(fèi)緊張的小型圖書館,無法充分提供服務(wù)。讀者缺乏膠片閱讀設(shè)備的使用知識(shí),需要圖書館員的技術(shù)支持,增加了人員成本。報(bào)紙出版周期短,信息量大,版數(shù)多,而且編目時(shí)一般只揭示到報(bào)紙名稱,膠片閱讀設(shè)備只能以瀏覽方式閱讀某卷報(bào)紙,無法按讀者指定的日期、版次等進(jìn)行精確的檢索服務(wù),讀者往往需要不停地更換膠卷并逐頁瀏覽報(bào)紙來找到所需的信息,花費(fèi)較多的時(shí)間也未必能獲得想要的信息資源,讀者需求較難滿足。
1.3數(shù)字化的必要性
眾所周知,很多圖書館很早便開始針對(duì)館藏民國(guó)圖書和民國(guó)期刊的數(shù)字化工作,民國(guó)報(bào)紙卻始終被束之高閣,國(guó)家圖書館亦是如此,除少數(shù)幾種報(bào)紙用于數(shù)字化實(shí)驗(yàn)外,并未大規(guī)模開展民國(guó)報(bào)紙的數(shù)字化工作[1]。報(bào)紙具有出版頻率高、載體形態(tài)復(fù)雜、內(nèi)容組織形式豐富、數(shù)量大等特點(diǎn),加上民國(guó)報(bào)紙?jiān)拇嗳酰瑢?dǎo)致民國(guó)報(bào)紙的數(shù)字化工作進(jìn)展緩慢。但在互聯(lián)網(wǎng)和多媒體技術(shù)迅速發(fā)展的今天,為了將民國(guó)報(bào)紙這一珍貴資源早日呈現(xiàn)給讀者,并提供報(bào)名、篇名、版面等多種檢索方式的網(wǎng)絡(luò)閱讀服務(wù),其數(shù)字化工作迫在眉睫。
2.1縮微膠片數(shù)字化的優(yōu)缺點(diǎn)
1985年全國(guó)圖書館文獻(xiàn)縮微復(fù)制中心成立[2],因每個(gè)成員館藏民國(guó)報(bào)紙種類有限,存在殘缺、內(nèi)容不全、載體損壞等多種問題,報(bào)紙縮微拍攝前通常會(huì)進(jìn)行補(bǔ)缺、登記、整熨、修補(bǔ)、排序等多項(xiàng)整理工作[3],因此用縮微膠片數(shù)字化比直接數(shù)字化原件更全面,信息更完整。民國(guó)報(bào)紙數(shù)字化除了要得到報(bào)紙的影像文件,經(jīng)過OCR處理的全文文件也是很重要的數(shù)字化成果,經(jīng)過一定的計(jì)算機(jī)技術(shù)處理,可以實(shí)現(xiàn)民國(guó)報(bào)紙的全文檢索。然而,原件本身的劣化,拍攝時(shí)的縮微比例,最終可能導(dǎo)致文字?jǐn)喙P、透字、重影和模糊,將直接影響文字識(shí)別的準(zhǔn)確性,除了需要設(shè)計(jì)較好的識(shí)別算法來控制,還需要大量的人力輔助工作。
2.2對(duì)象數(shù)據(jù)
2.2.1民國(guó)報(bào)紙的特點(diǎn)
民國(guó)報(bào)紙縮微膠片數(shù)字化除了考慮掃描圖像的格式、分辨率等參數(shù),還應(yīng)充分考慮其載體形態(tài)和內(nèi)容組織的特殊性。民國(guó)時(shí)期報(bào)紙開本大小不統(tǒng)一,版面版次也有很大的隨意性;一張兩版的報(bào)紙部分有中縫內(nèi)容,部分沒有,有中縫內(nèi)容的也因?yàn)檎郫B裝訂導(dǎo)致中縫內(nèi)容被遮掩而看不清;有號(hào)外、增刊、特刊、副刊等特殊版面內(nèi)容;報(bào)紙內(nèi)容另一個(gè)顯著的特點(diǎn)是各類廣告所占篇幅較大。
2.2.2實(shí)踐中應(yīng)側(cè)重考慮的問題
①圖像格式:數(shù)字化圖像分長(zhǎng)期保存級(jí)和發(fā)布服務(wù)級(jí)兩個(gè)級(jí)別。長(zhǎng)期保存級(jí)數(shù)據(jù)用于數(shù)據(jù)保存,不應(yīng)用于網(wǎng)絡(luò),可作格式轉(zhuǎn)換和復(fù)制的母本。經(jīng)過大量的試驗(yàn)對(duì)比,國(guó)家圖書館選用業(yè)界廣泛接受的不壓縮TIFF格式作為民國(guó)報(bào)紙長(zhǎng)期保存級(jí)數(shù)據(jù)格式,8位灰度掃描,分辨率為300DPI。
發(fā)布服務(wù)級(jí)數(shù)據(jù)由長(zhǎng)期保存級(jí)數(shù)據(jù)經(jīng)適當(dāng)?shù)膲嚎s和格式轉(zhuǎn)換獲得,經(jīng)由互聯(lián)網(wǎng)等渠道為廣大讀者提供服務(wù)。國(guó)家圖書館提供數(shù)字資源服務(wù)的方式豐富多樣,如個(gè)人計(jì)算機(jī)、觸摸屏、數(shù)字電視、移動(dòng)終端等,每種服務(wù)方式對(duì)發(fā)布服務(wù)級(jí)數(shù)據(jù)的格式均有一定的要求,綜合考慮后將發(fā)布服務(wù)級(jí)數(shù)據(jù)格式選為JPG格式和雙層PDF格式,雙層PDF格式的上層為圖像層,下層為文本層。
②OCR識(shí)別的范圍:影像數(shù)據(jù)只能提供簡(jiǎn)單的版面瀏覽服務(wù),無法像全文文本數(shù)據(jù)一樣,經(jīng)過計(jì)算機(jī)和數(shù)據(jù)處理便可實(shí)現(xiàn)按用戶指定的檢索詞來快速準(zhǔn)確地檢索信息。受經(jīng)費(fèi)和民國(guó)報(bào)紙數(shù)字化經(jīng)驗(yàn)等多方面因素的限制,本著先做起來再逐步完善的思想,國(guó)家圖書館民國(guó)報(bào)紙縮微膠片數(shù)字化項(xiàng)目規(guī)定現(xiàn)階段只對(duì)報(bào)紙篇目?jī)?nèi)容(包括引題、標(biāo)題和副題)進(jìn)行OCR文字識(shí)別和位置置標(biāo),方便用戶檢索報(bào)紙標(biāo)題內(nèi)容來相對(duì)精確地查找信息。
③圖像的切分與合并:民國(guó)報(bào)紙?jiān)陂_本和版面安排上沒有一定的規(guī)律,可能一張為一版,也可能一張有多版,為能夠向讀者提供最基本的按版面進(jìn)行檢索與瀏覽的服務(wù),規(guī)定每版加工成一幅圖像。如縮微膠片存在一拍多版時(shí),按版拆分圖像;一版多拍時(shí),長(zhǎng)期保存級(jí)文件按拍攝膠片直接轉(zhuǎn)換圖像,發(fā)布服務(wù)級(jí)圖像需將多拍圖像拼接為一幅JPG或PDF文件。
④中縫和廣告:據(jù)抽樣統(tǒng)計(jì),報(bào)紙廣告所占的版面比例很高,北京《晨報(bào)》占52.7%,天津《益世報(bào)》占62%,上?!渡陥?bào)》占42.7%[4],由于開本較大,在裝訂時(shí)常采用中縫對(duì)折裝訂、導(dǎo)致中縫內(nèi)容損壞嚴(yán)重??s微拍攝時(shí)不論中縫裝訂部分拆與不拆,裝訂過的中縫信息都將不同程度地破損或缺失,基本無法還原原有信息內(nèi)容。考慮民國(guó)報(bào)紙的中縫內(nèi)容破損較嚴(yán)重以致難以恢復(fù),且多為廣告類資源,實(shí)質(zhì)性信息較少,轉(zhuǎn)成數(shù)字化圖像時(shí)將采用計(jì)算機(jī)圖像處理技術(shù)去除中縫信息。目前,由于經(jīng)費(fèi)和時(shí)間等因素限制,各版面中的廣告原樣保存,但雙層PDF的文本層將暫時(shí)放棄對(duì)廣告內(nèi)容的識(shí)別,未來可以考慮再進(jìn)行廣告加工。
⑤號(hào)外、增刊、副刊、特刊:大部分民國(guó)報(bào)紙的號(hào)外、增刊、副刊和特刊是和當(dāng)日普通版面報(bào)紙一起出版的,有的為獨(dú)立版面,有的占據(jù)普通版面。如此看來,號(hào)外等特殊版面的圖像加工和普通版面并無兩樣,但需在相應(yīng)的文檔里進(jìn)行記錄,以便日后的檢索和統(tǒng)計(jì)等。
2.3元數(shù)據(jù)
國(guó)家圖書館館藏民國(guó)報(bào)紙縮微膠片的元數(shù)據(jù)是標(biāo)準(zhǔn)MARC格式,記錄了該種報(bào)紙的名稱、出版地、出版時(shí)間等各種信息。民國(guó)報(bào)紙?jiān)跀?shù)字化過程中會(huì)產(chǎn)生很多新的元數(shù)據(jù)信息,如版次、篇目坐標(biāo)和篇目作者等,考慮讀者的個(gè)性化需求和未來可能為讀者提供的各類檢索服務(wù),此處用ACCESS數(shù)據(jù)庫和XML文件來保存新的元數(shù)據(jù)內(nèi)容。ACCESS數(shù)據(jù)庫記錄信息更全面,分基本信息表、版面篇目信息表和結(jié)構(gòu)信息表,分別用于基本信息記錄、元數(shù)據(jù)與對(duì)象數(shù)據(jù)掛接和報(bào)紙結(jié)構(gòu)揭示。XML文件主要從全文識(shí)別的角度來記錄數(shù)據(jù)。兩種元數(shù)據(jù)文件都將記錄到標(biāo)題及其在版面的具體位置等最小粒度。
2.4存儲(chǔ)路徑
國(guó)家圖書館館藏民國(guó)報(bào)紙種類多、出版頻率高(一日、三日、一周等)、每期有多個(gè)版面等特點(diǎn)要求其在介質(zhì)上的存儲(chǔ)路徑要清晰,便于查找。結(jié)合每種報(bào)紙編目時(shí)賦予的唯一標(biāo)識(shí)號(hào)和出版日期,將其存儲(chǔ)路徑設(shè)為兩個(gè)層級(jí)。第一級(jí)為每種報(bào)紙的唯一標(biāo)識(shí)號(hào),不同的報(bào)紙此標(biāo)識(shí)號(hào)唯一、不重復(fù),可由MARC中的001字段內(nèi)容充當(dāng)。第二級(jí)為期號(hào),8位數(shù)字組成:4位年、兩位月、兩位日組成,相應(yīng)的文件夾下放置該期的版次掃描圖像。如:唯一標(biāo)識(shí)號(hào)為2009n00884,出版日期為1940年2月1日,民國(guó)報(bào)紙相應(yīng)的圖像掃描文件應(yīng)存放于 2009n0088419400201目錄下。
數(shù)字報(bào)紙的服務(wù)模式依賴于數(shù)字報(bào)紙的格式、整合深度和整合方式。格式分圖像、文本和圖像文本雙層3種格式。整合深度為對(duì)報(bào)紙的揭示深度,從大到小可分為報(bào)紙名稱級(jí)別、版面級(jí)別、篇目標(biāo)題級(jí)別和篇目?jī)?nèi)容級(jí)別。整合方式,即針對(duì)報(bào)紙各級(jí)別內(nèi)容進(jìn)行多個(gè)維度的分類處理、數(shù)據(jù)挖掘而獲得更深層次的內(nèi)容聚合,如主題知識(shí)庫、人物知識(shí)庫等。早期報(bào)紙因缺少原始排版的電子文件,需經(jīng)過掃描等方式將印本轉(zhuǎn)換為數(shù)字化圖像提供圖像級(jí)別服務(wù)。近期報(bào)紙?jiān)诨ヂ?lián)網(wǎng)和數(shù)字出版技術(shù)不斷發(fā)展的大環(huán)境下,可以原始原貌的數(shù)字格式提供各種級(jí)別的檢索服務(wù),無需從紙本進(jìn)行數(shù)字化,不但可以有效降低成本,還能極大地滿足讀者的需求。國(guó)家圖書館正在深入研究自建或已購買的數(shù)字報(bào)紙庫的服務(wù)模式,總結(jié)經(jīng)驗(yàn),努力探尋當(dāng)前民國(guó)報(bào)紙的最佳服務(wù)模式。
3.1基于圖像的服務(wù)
3.1.1基于版面的圖像服務(wù)
基于版面的圖像服務(wù)為按照?qǐng)?bào)紙名稱、版面、出版日期等提供對(duì)數(shù)字報(bào)紙的簡(jiǎn)單瀏覽和檢索服務(wù)。如國(guó)家圖書館的“數(shù)字報(bào)紙典藏與服務(wù)項(xiàng)目”,通過網(wǎng)絡(luò)采集、報(bào)社繳送等方式收集的近年來出版的數(shù)字報(bào)紙,按照?qǐng)?bào)紙名稱、地區(qū)、出版日期和版次進(jìn)行整理,提供版面級(jí)別的原版原式圖像瀏覽服務(wù)。
“報(bào)紙?jiān)诰€閱讀系統(tǒng)”對(duì)通過網(wǎng)絡(luò)采集獲得的報(bào)紙資源,提供字序、報(bào)紙種類和地區(qū)3個(gè)維度的分類瀏覽和按報(bào)紙名稱的檢索服務(wù),對(duì)每種報(bào)紙可進(jìn)行逐頁圖像的瀏覽,并支持對(duì)感興趣區(qū)域的剪報(bào)服務(wù)。
此種方式因支持報(bào)紙?jiān)嬖綀D像瀏覽,能滿足大多讀者的讀報(bào)體驗(yàn)。
3.1.2基于篇目標(biāo)題的圖像服務(wù)
“臺(tái)灣時(shí)報(bào)數(shù)據(jù)庫”提供按報(bào)紙篇目進(jìn)行檢索,檢索結(jié)果為該篇目?jī)?nèi)容的圖像文件,不可編輯和復(fù)制內(nèi)容。每個(gè)篇目文件為黑白二值圖像,字多圖少,如此提供服務(wù)也符合了時(shí)報(bào)快捷、簡(jiǎn)單的特點(diǎn)。
3.2基于內(nèi)容的服務(wù)
3.2.1基于篇目標(biāo)題的內(nèi)容服務(wù)
基于篇目標(biāo)題的內(nèi)容服務(wù)即提供篇目名稱的檢索、瀏覽,并可對(duì)內(nèi)容進(jìn)行編輯等操作。如“中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(清華同方)”提供篇目級(jí)別的按主題、題名、關(guān)鍵詞、全文、出版時(shí)間、作者、句子和中圖分類號(hào)等進(jìn)行的模糊和精確檢索服務(wù)。檢索結(jié)果為簡(jiǎn)單排版的篇目?jī)?nèi)容,包括報(bào)名、出版日期、版次、題名、作者和正文。
該方式不體現(xiàn)原報(bào)紙的排版信息,適用于側(cè)重內(nèi)容查找的讀者,對(duì)讀報(bào)體驗(yàn)有較高要求的讀者不太適合。
“中國(guó)報(bào)紙資源全文數(shù)據(jù)庫(方正阿帕比)”提供按報(bào)紙名稱、新聞圖片和新聞3類進(jìn)行檢索,并可按地區(qū)進(jìn)行分類。報(bào)紙名稱檢索,針對(duì)名稱和刊號(hào)進(jìn)行查找;新聞檢索,按標(biāo)題、內(nèi)容、出處、作者和版名進(jìn)行檢索;新聞圖片檢索,檢索點(diǎn)包括標(biāo)題、內(nèi)容、作者和出處。用戶界面可同時(shí)展示報(bào)紙?jiān)?、版?hào)、版面名稱和各版的篇目標(biāo)題。通過點(diǎn)擊篇目標(biāo)題或鼠標(biāo)單擊報(bào)紙感興趣的篇目區(qū)域來獲得篇目?jī)?nèi)容。篇目?jī)?nèi)容的展示與原報(bào)紙排版略有差異,文字部分可編輯。
該方式既能展現(xiàn)報(bào)紙?jiān)?,又可進(jìn)行篇目閱讀、檢索與編輯,較好地滿足大多數(shù)讀者的需求。
3.2.2基于全文的內(nèi)容服務(wù)
基于全文的內(nèi)容服務(wù)是在報(bào)紙全文文字識(shí)別的基礎(chǔ)上,實(shí)現(xiàn)對(duì)全文內(nèi)容進(jìn)行檢索、瀏覽和編輯的服務(wù)。如本館購買的“參考消息”數(shù)據(jù)庫提供了該報(bào)紙自創(chuàng)刊以來的全部報(bào)紙?jiān)?、文字、圖片、表格和廣告的全文信息,支持對(duì)各部分內(nèi)容的文字檢索。依據(jù)“參考消息”的報(bào)道特點(diǎn),數(shù)據(jù)庫對(duì)報(bào)紙進(jìn)行了特色分類,并可在各自分類下進(jìn)行檢索,同時(shí)具有題名、報(bào)紙名稱、期號(hào)和全文內(nèi)容的檢索能力。
此種方式為目前較受歡迎的服務(wù)方式,提供類似服務(wù)方式的還有“經(jīng)濟(jì)日?qǐng)?bào)”。
3.3國(guó)家圖書館民國(guó)報(bào)紙數(shù)字資源的服務(wù)模式
通過研究各種數(shù)字報(bào)紙的服務(wù)模式,比較現(xiàn)代報(bào)紙和民國(guó)報(bào)紙的多方面情況(如表1所示),充分考慮民國(guó)報(bào)紙的自身特點(diǎn)、經(jīng)費(fèi)限制以及迫切需要對(duì)外提供服務(wù)等因素,秉承“先做起來再逐步完善”的基本思想,國(guó)家圖書館克服諸多困難完成了縮微膠片到影像圖片的轉(zhuǎn)換,并進(jìn)行標(biāo)題內(nèi)容的文字識(shí)別工作,以期盡快將數(shù)字化數(shù)據(jù)用于網(wǎng)絡(luò)服務(wù),最終選用基于篇目標(biāo)題的圖像服務(wù)模式。考慮到將來各方面條件充足時(shí),可能進(jìn)行基于全文的內(nèi)容服務(wù),民國(guó)報(bào)紙的發(fā)布平臺(tái)會(huì)預(yù)留全文服務(wù)的接口。
此種方式提供報(bào)紙名稱、版面、出版日期、篇名等信息的簡(jiǎn)單瀏覽和檢索服務(wù),既能實(shí)現(xiàn)讀者按報(bào)紙?jiān)嬖介喿x,同時(shí)還能對(duì)篇目進(jìn)行檢索服務(wù)。
表1 現(xiàn)代報(bào)紙和民國(guó)報(bào)紙比較
4.1面臨的問題
4.1.1部分報(bào)紙信息存在變更
民國(guó)報(bào)紙種數(shù)多,出版周期、每期版數(shù)和報(bào)紙名稱等變化大,尤其對(duì)存在繼承、替代等關(guān)系的報(bào)紙,如果要在元數(shù)據(jù)中清晰地著錄這些信息將會(huì)遇到一定的困難,需要查閱大量資料來確定變化前后的名稱、關(guān)系等各種信息的真實(shí)性。
4.1.2文字識(shí)別困難較大,需大量人為干預(yù)
報(bào)紙?jiān)诳s微拍攝前進(jìn)行了很多細(xì)致的整理工作,但由于原件本身質(zhì)量較差,文字不清晰,透字較嚴(yán)重,尤其是縮微倍率的問題,導(dǎo)致報(bào)紙縮微膠片的內(nèi)容有斷筆、模糊等情況,OCR文字識(shí)別準(zhǔn)確率不到30%,要實(shí)現(xiàn)報(bào)紙全文識(shí)別,從而提供全文檢索服務(wù)仍任重而道遠(yuǎn)。
4.1.3發(fā)布平臺(tái)需更新
資源的質(zhì)量和加工深度是基礎(chǔ),好的展示平臺(tái)是關(guān)鍵。國(guó)家圖書館正在使用的資源發(fā)布平臺(tái)是以圖書類型資源為主體設(shè)計(jì)的,元數(shù)據(jù)即為MARC數(shù)據(jù),對(duì)象數(shù)據(jù)為每頁書的影像數(shù)據(jù),一般為PDF格式。民國(guó)報(bào)紙的組織形式和圖書迥異,很難在現(xiàn)有的發(fā)布平臺(tái)上得到很好的展示,尤其考慮將來完成報(bào)紙全文的文字識(shí)別后,現(xiàn)有平臺(tái)就更難以滿足其服務(wù)需求。
4.2展望
第一,在民國(guó)報(bào)紙縮微膠片數(shù)字化過程中,盡量克服人力和財(cái)力的困難,多與其他圖書館進(jìn)行合作交流,做好邊建設(shè)邊梳理的工作,將每種報(bào)紙的變化信息理清。
第二,民國(guó)報(bào)紙縮微膠片本身的問題已幾乎無法挽回,為了提高文字識(shí)別的準(zhǔn)確率,可與市面上有經(jīng)驗(yàn)且技術(shù)成熟的數(shù)字加工公司合作,來獲得更高品質(zhì)的數(shù)據(jù)。
第三,著眼于未來,全面考慮民國(guó)報(bào)紙可能的整合方式和展現(xiàn)方式,選用最先進(jìn)的技術(shù),開發(fā)能夠?qū)崿F(xiàn)滿足民國(guó)報(bào)紙各種展示方式和檢索方式的發(fā)布平臺(tái)。
民國(guó)報(bào)紙具有較高的文物價(jià)值、資料價(jià)值和藝術(shù)價(jià)值。數(shù)字化后,兼具數(shù)字化媒介和紙質(zhì)報(bào)紙的優(yōu)勢(shì),可按多維度進(jìn)行檢索并方便在網(wǎng)絡(luò)上展示。國(guó)家圖書館民國(guó)報(bào)紙數(shù)字化工作是該領(lǐng)域一項(xiàng)很好的嘗試,通過實(shí)踐來獲得民國(guó)報(bào)紙數(shù)字化和發(fā)布的最佳方式方法,希望有更多的圖書館可以開展此項(xiàng)工作,及時(shí)將館藏民國(guó)報(bào)紙通過網(wǎng)絡(luò)為廣大讀者提供服務(wù)。
參考文獻(xiàn):
[1]謝雷.圖書館民國(guó)文獻(xiàn)保護(hù)探析[J].圖書館建設(shè),2012 (8):13-17.
[2]張煒.報(bào)紙的保存與保護(hù):縮微化與數(shù)字化探究[J].圖書館建設(shè),2007(2):37-40.
[3]李建莊.報(bào)紙縮微復(fù)制的七個(gè)程序[J].河南圖書館學(xué)刊,1988(3):36-37.
[4]趙琛.民國(guó)報(bào)紙廣告[J].中國(guó)廣告,2005(4):65-69.
肖紅女,1982年生。碩士,館員。研究方向:文獻(xiàn)數(shù)字化方式方法。
吳茗女,1975年生。碩士,館員。研究方向:數(shù)字資源發(fā)布與使用。
曾燕女,1962年生。本科學(xué)歷,副研究館員。研究方向:數(shù)字資源驗(yàn)收與檢查。
收稿日期:(2015-05-11;責(zé)編:徐向東。)