摘要:借助榆林學(xué)院綏德師范校區(qū)獨(dú)特的紅色文化優(yōu)勢,收集整理在革命戰(zhàn)爭年代留存的許多珍貴的紅色文獻(xiàn),建設(shè)綏德師范校區(qū)紅色資源館藏庫和數(shù)字研究平臺,不僅是保護(hù)紅色文獻(xiàn)資源的需要,也是大數(shù)據(jù)時代科學(xué)研究的需要。該文闡述了綏德師范校區(qū)紅色文獻(xiàn)的收集整理方法,研究了國內(nèi)紅色文獻(xiàn)數(shù)字化加工技術(shù),提出了綏德師范校區(qū)紅色文獻(xiàn)的數(shù)字化方案和實(shí)施流程,以期為高校圖書館進(jìn)行紅色文獻(xiàn)保護(hù)提供參考。
關(guān)鍵詞:綏德師范;紅色文獻(xiàn);數(shù)字化;OCR文字識別
中圖分類號:G255" " " " " " " " " " "文獻(xiàn)標(biāo)識碼:A" " " " " " " " "文章編號:2096-4110(2023)01(b)-0154-04
Research on the Construction and Digitization of Red Literature in Local Universities
—Taking Suide Normal Campus of Yulin University as an Example
Abstract: With the unique red cultural advantages of Suide Normal Campus of Yulin University, collected and sorted out many precious red documents preserved during the revolutionary war. It is not only the need to protect red literature resources, but also the need of scientific research in the era of big data to construct red resources collection library and digital research platform in Suide Normal Campus. The article expounds the collection and sorting method of red literature in Suide Normal Campus, studies the digital processing technology of domestic red literature, puts forward the digitization scheme and implementation process of red literature in Suide Normal Campus, which provides a reference for the protection of red documents in university libraries.
Key words: Suide Normal Campus; Red Literature; Digitization; OCR Character Recognition
陜西省綏德縣,地處榆林市東南部,在抗日戰(zhàn)爭時期和解放戰(zhàn)爭時期是抗日軍政大學(xué)、綏德警備區(qū)司令部和359旅司令部駐地。地處綏德革命老區(qū)的綏德師范學(xué)校,早在1924年就建立了陜北地區(qū)最早的黨團(tuán)組織,在革命戰(zhàn)爭年代留下了許多珍貴的紅色文獻(xiàn),這些紅色文獻(xiàn)具有極高的史料價值、文化價值和教育價值,搶救、收集、整理、保護(hù)這些珍貴的紅色文獻(xiàn)資料十分必要。2017年,綏德師范學(xué)校并入榆林學(xué)院后,更名為榆林學(xué)院綏德師范校區(qū),榆林學(xué)院圖書館作為榆林學(xué)院文獻(xiàn)資源信息中心,應(yīng)承擔(dān)起建設(shè)綏師紅色文獻(xiàn)資源庫的重任。
1 榆林學(xué)院綏德師范校區(qū)紅色文獻(xiàn)數(shù)字化建設(shè)的背景
1.1 榆林學(xué)院綏德師范校區(qū)紅色文獻(xiàn)資源豐富
紅色文獻(xiàn)資料主要指從1921年7月中國共產(chǎn)黨成立起至1949年10月新中國建立前,由中國共產(chǎn)黨機(jī)關(guān)或各根據(jù)地所出版、發(fā)行、制作的各種文獻(xiàn)資料[1]。紅色文獻(xiàn)記載著中國共產(chǎn)黨領(lǐng)導(dǎo)中國革命的光輝歷程,是彌足珍貴的黨史資料,在目前大力開展的黨史學(xué)習(xí)教育中具有重大現(xiàn)實(shí)意義和理論價值[2]。榆林學(xué)院綏德師范校區(qū),原陜西省綏德師范學(xué)校,是一所紅色歷史底蘊(yùn)深厚的學(xué)校。在近百年的歷史發(fā)展中,榆林學(xué)院綏德師范校區(qū)作為“革命搖籃育才基地”“西北革命策源地”和“革命英才的搖籃”留下了許多珍貴的紅色文獻(xiàn),這些紅色文獻(xiàn)是在艱苦的戰(zhàn)爭年代中出版和發(fā)行的,面對敵人的嚴(yán)密封鎖,當(dāng)時的印制條件非常簡陋,后又經(jīng)歷了戰(zhàn)火的洗禮、校址整體搬遷、綏德縣“7·26”特大洪災(zāi),留存下來品相較好的文獻(xiàn)資料十分有限,甚至有些紅色文獻(xiàn)到今天已成為孤本、善本,具有重要的史料價值、文化價值和教育價值。收集整理紅色文獻(xiàn)這一專題信息并使之形成滿足讀者需要的文獻(xiàn)資源是信息服務(wù)部門的一項光榮任務(wù)[3]。高校圖書館工作者在注重服務(wù)教學(xué)、科研的同時,要本著“立足老區(qū)、強(qiáng)化特色、服務(wù)地方”的研究宗旨,注重老區(qū)文化建設(shè)工作[4]。榆林學(xué)院圖書館作為陜北革命老區(qū)重要的文獻(xiàn)資源收藏地,在紅色文獻(xiàn)收集、整理和建設(shè)方面具有天然的地理優(yōu)勢、豐富的資源優(yōu)勢和優(yōu)秀的人才隊伍優(yōu)勢。
1.2 榆林學(xué)院綏德師范校區(qū)紅色文獻(xiàn)收集整理的意義
榆林學(xué)院綏德師范校區(qū)的前身是創(chuàng)立于1923年的陜西省立第四師范學(xué)校。建校初期,在共產(chǎn)黨人的領(lǐng)導(dǎo)下,成為西北革命的活動中心,是最早的西北地區(qū)黨團(tuán)組織的發(fā)源地,為西北紅軍、西北革命根據(jù)地的創(chuàng)建與發(fā)展立下了汗馬功勞。通過對檔案原件、文獻(xiàn)資料、回憶資料考辨,相互印證,綜合考察,可以得出如下結(jié)論:學(xué)校黨小組創(chuàng)建于1924年11月;1925年初,校內(nèi)成立陜北第一個中共黨支部;1925年夏,校內(nèi)成立中共綏德特別支部;1926年6月,中國綏德地方執(zhí)行委員會成立[5]。
2017 年7月,經(jīng)陜西省委、省政府批準(zhǔn),陜西省綏德師范學(xué)校并入榆林學(xué)院后,更名為榆林學(xué)院綏德師范校區(qū)(以下簡稱綏師)。保護(hù)好綏德師范校區(qū)現(xiàn)存的紅色文獻(xiàn),收集整理各種紅色資源,把這些資源保護(hù)好、建設(shè)好、傳承好,使其成為紅色教育的珍貴教材,對弘揚(yáng)和傳承紅色歷史文化、強(qiáng)化黨史學(xué)習(xí)教育具有重要意義。
2 綏師紅色文獻(xiàn)收集整理的方法及數(shù)字化的必要性
2.1 綏師紅色報紙收集整理的方法及存放環(huán)境
綏師辦學(xué)歷史悠久,留下了很多特色鮮明的紅色報紙。課題小組對綏師的這些報紙進(jìn)行了細(xì)致的分類整理,按照報紙出版的年代順序,依次進(jìn)行了排序、登記、造冊、電子錄入、上架、標(biāo)記。存放紅色報紙的房間做到避光、防潮、防火、防塵,安裝布置了專用的紅色報紙柜,并對專柜中的每一層報紙按照名字和年代范圍貼標(biāo)簽標(biāo)記,便于后期對原始文獻(xiàn)的查找。在分類整理的過程中,發(fā)現(xiàn)了很多份具有綏師元素的紅色報紙,例如解放戰(zhàn)爭時期,綏德縣當(dāng)?shù)匕l(fā)行出版的《大眾日報》和《大眾報》。這些報紙中詳細(xì)記載了綏師在解放戰(zhàn)爭年代發(fā)生的一些事跡,對研究陜北革命史和綏師校史具有重要的史料價值。課題組還對缺失的紅色報紙通過購買、復(fù)印等途徑進(jìn)一步完善,逐步建成綏師紅色資源館藏庫。
2.2 綏師紅色文獻(xiàn)數(shù)字化的必要性和緊迫性
綏師現(xiàn)存的紅色文獻(xiàn)因?yàn)槟甏眠h(yuǎn),無專人管理,保存條件簡陋,隨著歲月的流逝,都已發(fā)黃變脆,不能經(jīng)受頻繁的人工翻閱。歷史上又經(jīng)歷過綏師校址搬遷、綏德縣“7·26”特大洪災(zāi),珍貴的紅色文獻(xiàn)難以得到有效保護(hù)。如果再不進(jìn)行搶救性保護(hù)、整理,若干年后,這些紅色文獻(xiàn)將不能再被翻閱,無法再被使用。為了將現(xiàn)存的綏師紅色文獻(xiàn)保護(hù)好和利用好,紅色文獻(xiàn)數(shù)字化十分必要,而且刻不容緩。另外,人工翻閱大量的紅色文獻(xiàn),不僅不能快速地查找到所需的文獻(xiàn)史料,而且耗時費(fèi)力,非常不利于紅色文化研究工作的開展,使得研究人員查找資料的積極性減弱。由于缺乏對原始文獻(xiàn)的挖掘,造成研究的深度和寬度不夠,科研成果的數(shù)量和質(zhì)量都受到影響[6]。此外,館藏紅色文獻(xiàn)資源的數(shù)字化,不僅能夠讓紅色文獻(xiàn)資源實(shí)現(xiàn)永久保存,而且能夠通過新媒體融合傳播活起來,有助于擴(kuò)大紅色文化資源內(nèi)容的影響規(guī)模[7]。因此,將紅色文獻(xiàn)進(jìn)行數(shù)字化是保存好和利用好紅色文獻(xiàn)的重要方法和有效途徑。
3 國內(nèi)紅色文獻(xiàn)數(shù)字化發(fā)展現(xiàn)狀
課題組通過查閱資料和調(diào)查研究發(fā)現(xiàn),目前國內(nèi)各種機(jī)構(gòu)紅色文獻(xiàn)數(shù)字化主要有兩種形式。
3.1 掃描成電子圖像
這種數(shù)字化的方法是把文獻(xiàn)內(nèi)容掃描成電子圖像,之后不進(jìn)行深加工,那么讀者只能一張張地查看圖像,無法進(jìn)行檢索,如由中國社會科學(xué)院、國家圖書館、國家檔案局和中國社會科學(xué)院共同建設(shè)完成的“抗日戰(zhàn)爭與近代中日關(guān)系文獻(xiàn)數(shù)據(jù)平臺”,收錄了《紅色中華》《解放日報》《晉綏日報》等紅色報刊,該數(shù)據(jù)平臺可以實(shí)現(xiàn)根據(jù)報紙的名稱和出版時間進(jìn)行電子圖像瀏覽,不足之處是讀者不能對數(shù)字化后的報紙內(nèi)容使用關(guān)鍵詞進(jìn)行檢索。
3.2 OCR 數(shù)字化
OCR是Optical Character Recognition的縮寫,意為“光學(xué)字符識別”。這種數(shù)字化的方法是在文獻(xiàn)內(nèi)容掃描成電子圖像的基礎(chǔ)上進(jìn)行OCR文字識別,識別完成后,可以提供關(guān)鍵詞檢索服務(wù)。從唐月娥[8]的研究中得知,OCR文字識別分為3個層次:第一層次只是對正文標(biāo)題進(jìn)行文字識別,這樣識別的效果可以提供標(biāo)題的檢索,可以定位到標(biāo)題所在的版面,但篇目的位置還要讀者自行查找;第二層次是對OCR文字識別后的篇目進(jìn)行標(biāo)引,可以實(shí)現(xiàn)標(biāo)題、作者、出版者、出版時間等關(guān)鍵詞的檢索,如上海圖書館開發(fā)的《中國近代報紙資源全庫》,該資源庫是依托上海圖書館豐富的近代文獻(xiàn)館藏資源制作的大型報紙全文數(shù)據(jù)庫,可以實(shí)現(xiàn)對題名、作者、文獻(xiàn)來源和出版時間等字段的檢索功能;第三層次是對紅色文獻(xiàn)進(jìn)行全文OCR文字識別后,再加以字段標(biāo)引,就可以實(shí)現(xiàn)對紅色文獻(xiàn)的全文檢索,功能比較強(qiáng)大,檢索出來的信息較為全面,如北京愛如生數(shù)字化技術(shù)研究中心研發(fā)的全文檢索版大型數(shù)據(jù)庫《愛如生紅色歷史文獻(xiàn)庫》,是國內(nèi)外第一款紅色主題、全文檢索、圖文對照的大型數(shù)據(jù)庫,該庫的“三窗點(diǎn)選式”全圖頁面可以瞬間切換,強(qiáng)大的檢索系統(tǒng)可以實(shí)現(xiàn)毫秒級全文檢索。
通過對3個層次的OCR文字識別技術(shù)比較可以看出,實(shí)現(xiàn)全文檢索的全文OCR文字識別數(shù)字化技術(shù)的優(yōu)點(diǎn)是顯而易見的,缺點(diǎn)是成本較高,對合作公司技術(shù)實(shí)力的要求也較高。
4 綏師紅色文獻(xiàn)數(shù)字化的建設(shè)思路
4.1 綏師紅色文獻(xiàn)數(shù)字化建設(shè)目標(biāo)
為了將綏師的紅色資源進(jìn)行系統(tǒng)科學(xué)的收集、整理和利用,弘揚(yáng)和宣傳綏師紅色文化,傳承紅色精神,賡續(xù)紅色血脈,滿足專家學(xué)者對西北革命策源地中共黨史、政治、經(jīng)濟(jì)、文化等課題研究的需要,榆林學(xué)院圖書館專門成立了紅色資源建設(shè)課題組,并邀請了西安交通大學(xué)、西北大學(xué)和延安大學(xué)的紅色資源專家為課題組指導(dǎo),對紅色資源的收集范圍、建設(shè)方向、制度建設(shè)和來源途徑等進(jìn)行了論證指導(dǎo),課題組將負(fù)責(zé)完整系統(tǒng)地收集、整理綏師現(xiàn)存紅色資源,并同時聯(lián)合綏德革命紀(jì)念館、榆林革命紀(jì)念館、中共榆林市委黨史研究室、榆林市紅色文化研究會、榆林學(xué)院馬克思主義學(xué)院等研究機(jī)構(gòu),實(shí)現(xiàn)紅色資源共建共享,并與專業(yè)的數(shù)字化公司進(jìn)行合作,對收集到的紅色資源進(jìn)行數(shù)字化加工。一方面,建成西北革命策源地紅色資源館藏庫,為研究西北革命史奠定史料基礎(chǔ);另一方面,建成涵蓋電子圖書、電子報刊、圖片、音視頻等媒體類型的西北革命策源地紅色資源數(shù)字研究平臺,成為研究陜北早期黨史和綏師校史方面最為全面豐富的紅色資源數(shù)字平臺。平臺建成后,將能夠?qū)崿F(xiàn)對紅色文獻(xiàn)的原版原貌展示,除了可以逐層點(diǎn)擊瀏覽網(wǎng)頁信息以外,還能夠按照篇名、作者、出版社、出版時間等關(guān)鍵詞進(jìn)行檢索,將具有文獻(xiàn)檢索、成果展示、學(xué)術(shù)交流等主要功能。
4.2 綏師紅色文獻(xiàn)數(shù)字化的建設(shè)原則
在紅色特色圖書館館藏資源數(shù)字化工作方面,應(yīng)確立館藏文獻(xiàn)資源中價值與實(shí)用性高的,且具特色性的文獻(xiàn)資源品種范圍,有重點(diǎn)分步驟地實(shí)施,做好館藏資源數(shù)字化工作。結(jié)合孫烈濤提出的紅色文獻(xiàn)數(shù)字化建設(shè)原則,課題組認(rèn)為,綏師紅色文獻(xiàn)數(shù)字化、建設(shè)紅色文獻(xiàn)數(shù)字研究平臺應(yīng)當(dāng)充分展現(xiàn)綏師自身的紅色血脈,應(yīng)當(dāng)將突出綏師作為“西北革命策源地”“革命英才的搖籃”“陜北地區(qū)最早的黨團(tuán)組織”等紅色元素的文獻(xiàn)作為首批紅色文獻(xiàn)數(shù)字化的建設(shè)內(nèi)容,體現(xiàn)綏師在早期陜北革命史中的重要地位。基于以上建設(shè)原則,課題組經(jīng)過反復(fù)的論證,在與指導(dǎo)專家交流討論后,最終篩選出《大眾日報》等報紙,作為第一批數(shù)字化加工的對象。
4.3 綏師紅色文獻(xiàn)數(shù)字化方案
為迎接榆林學(xué)院百年校慶,作為百年校慶的一份獻(xiàn)禮,課題組決定對綏師紅色文獻(xiàn)資源進(jìn)行全文OCR文字識別的數(shù)字化方案。在數(shù)字化過程中,將嚴(yán)格按照國家圖書館制定的《特色館藏專題資源建設(shè)項目加工及著錄規(guī)則(2019)》進(jìn)行數(shù)據(jù)加工,依據(jù)《中國分類主題詞表》對主題詞或關(guān)鍵詞進(jìn)行標(biāo)引,根據(jù)國標(biāo)《信息資源的內(nèi)容形成和媒體類型表示》進(jìn)行著錄,元數(shù)據(jù)的設(shè)置遵循都柏林核心元素集的標(biāo)準(zhǔn),在選擇元數(shù)據(jù)時要考慮到各種類型資源的特征,在尊重差異和使用習(xí)慣的基礎(chǔ)上統(tǒng)一,在保證通用性的前提下,滿足不同類型資源的個性化需求[9]。數(shù)字化工作將緊密依托榆林學(xué)院圖書館資源數(shù)字化方面人才、技術(shù)的支撐,發(fā)揮本館的專業(yè)隊伍優(yōu)勢,對綏師紅色文獻(xiàn)資源循序漸進(jìn)地開展數(shù)字化掃描、OCR文字識別、標(biāo)引、入庫、索引工作。
4.4 綏師紅色文獻(xiàn)數(shù)字化實(shí)施流程
按照制定好的綏師紅色文獻(xiàn)數(shù)字化方案,遵循項目實(shí)施流程,進(jìn)行綏師紅色文獻(xiàn)數(shù)字化工作。綏師紅色文獻(xiàn)的數(shù)字化實(shí)施流程如圖1所示。
4.4.1 收集整理
全面完整地收集整理綏師紅色資源,包括圖書、報紙、期刊、圖片、音視頻等多類型的紅色資源,再通過購買、復(fù)印、共享等多種途徑,補(bǔ)足綏師缺失的紅色資源,建立西北革命策源地紅色資源館藏庫。
4.4.2 登記造冊
對收集整理的紅色資源進(jìn)行分類整合并且登記造冊,制作為電子表格文件,同時將紙質(zhì)版留存。
4.4.3 數(shù)字化
選擇技術(shù)實(shí)力雄厚的數(shù)字化公司作為項目合作方,使用技術(shù)成熟的數(shù)字加工平臺,要求合作的數(shù)字化公司出具合理可行的項目執(zhí)行方案,要求文獻(xiàn)資源掃描數(shù)字化的速度較快,掃描工作的工期要在可接受范圍內(nèi)。
4.4.4 搭建平臺
搭建西北革命策源地數(shù)字研究平臺,平臺搭建工作可外包給專業(yè)公司進(jìn)行,平臺建成后,用戶可以通過互聯(lián)網(wǎng)在電腦、手機(jī)等多種終端訪問平臺資源。
4.4.5 錄入數(shù)據(jù)
按照資源分類將數(shù)字化后的紅色資源錄入到數(shù)字研究平臺中。在錄入工作前期,可依托數(shù)字化公司批量錄入數(shù)據(jù),在錄入工作后期,指定專人進(jìn)行數(shù)據(jù)錄入工作。
4.4.6 校驗(yàn)勘誤
數(shù)據(jù)錄入后,課題組必須進(jìn)行多次校驗(yàn)勘誤工作,以保證數(shù)據(jù)的準(zhǔn)確性和完整性,對錄入到數(shù)據(jù)庫中的內(nèi)容進(jìn)行全面校驗(yàn),有必要時,將待校驗(yàn)內(nèi)容提交給相關(guān)專家進(jìn)行考證,對出現(xiàn)錯誤的內(nèi)容及時進(jìn)行勘誤。
4.4.7 驗(yàn)收發(fā)布
驗(yàn)收階段必須嚴(yán)格把關(guān),可分為預(yù)驗(yàn)收環(huán)節(jié)和專家驗(yàn)收環(huán)節(jié)。預(yù)驗(yàn)收環(huán)節(jié)由課題組負(fù)責(zé),驗(yàn)收過程必須嚴(yán)格對照項目計劃書和項目需求報告。預(yù)驗(yàn)收合格后,邀請課題組指導(dǎo)專家和文獻(xiàn)資源數(shù)字化專家進(jìn)行聯(lián)合測試并驗(yàn)收發(fā)布。
5 結(jié)語
紅色文獻(xiàn)記錄了老一輩無產(chǎn)階級革命先烈奮斗的歷程,為我們后人留下了珍貴的精神財富,是進(jìn)行黨史教育的優(yōu)質(zhì)教材,有助于廣大黨員干部深入學(xué)習(xí)貫徹習(xí)近平新時代中國特色社會主義思想,繼承和發(fā)揚(yáng)黨的光榮傳統(tǒng)。整理好、保護(hù)好、傳承好地方高校紅色文獻(xiàn)資源,是高校圖書館義不容辭的重任。在紅色文獻(xiàn)資源數(shù)字化的基礎(chǔ)上,應(yīng)當(dāng)進(jìn)一步整合資源,構(gòu)建紅色文獻(xiàn)資源平臺,逐步形成紅色文獻(xiàn)資源體系,充分發(fā)揮高校圖書館服務(wù)于教學(xué)科研、服務(wù)于文化傳承、服務(wù)于社會主義建設(shè)、服務(wù)于地方經(jīng)濟(jì)發(fā)展的重要職能。
參考文獻(xiàn)
[1] 趙莉.紅色文獻(xiàn)資料綜述[J].絲綢之路,2009(18):31-36.
[2] 任靜,林衛(wèi)東,李洪梅.紅色文獻(xiàn)數(shù)字化建設(shè)現(xiàn)狀研究[J].圖書館界,2021(5):11-15.
[3] 孔輝,王宗枝.高校紅色文獻(xiàn)資源建設(shè)與服務(wù)——以遵義師范學(xué)院為例[J].圖書館學(xué)刊,2015,37(7):21-24.
[4] 袁子英.紅色資源數(shù)據(jù)庫建設(shè)研究——以籌建賀龍圖書館為例[J].圖書館學(xué)研究,2012(14):46-48.
[5] 王天強(qiáng),王守文.中共陜西省綏德師范學(xué)校黨組織建立時間考證[J].榆林學(xué)院學(xué)報,2021,31(3):45-51.
[6] 賈翠玲.延安時期紅色文獻(xiàn)收集整理與數(shù)字化建設(shè)[J].延安大學(xué)學(xué)報(社會科學(xué)版),2016,38(4):122-125.
[7] 孫烈濤.紅色文獻(xiàn)資源數(shù)字化建設(shè)實(shí)踐探索——以梅園新村紀(jì)念館周恩來圖書館數(shù)字化建設(shè)為例[J].新世紀(jì)圖書館,2021(4):48-52.
[8] 唐月娥,李敏.紅色報紙文獻(xiàn)數(shù)字化探索與實(shí)踐——以《晉綏日報》為例[J].圖書館雜志,2021,40(11):4-8.
[9] 吳茗,龍偉,肖紅.自建數(shù)字資源的元數(shù)據(jù)管理實(shí)踐及啟示——以國家圖書館中文圖書數(shù)字化資源庫為例[J].數(shù)字圖書館論壇,2014(3):44-48.