陳凱 肖芒
摘 要:文中在剖析海南省民族文獻數字化系統現況的基礎上,明確指出了信息社會中民族文獻資料數字化系統的發(fā)展途徑。文章闡述了海南少數民族文獻數字化建設的意義,具體論述了民族文獻的搜集范圍、搜集方法和整理加工,并就特色數據庫建設應注意的一些問題進行了探討。
關鍵詞:海南少數民族;文獻資料;數字建設
海南是一個多民族省份,除了漢族,還有黎族、苗族、回族、壯等少數民族。在海南省少數民族中,黎族人口最多,其次是苗族、壯族和回族。海南省少數民族聚居地區(qū)為瓊中、保亭、白沙、樂東、昌江、陵水,以及三亞、五指山、東方市等。海南的少數民族人口數量為136萬。在信息時代,圖書館除了對全國各地文獻信息資源開展數字化建設服務外,也可以為海南省少數民族地域的政治、經濟、文化、高新科技等給予高品質、有效地服務。
一、民族文獻數字化的重要性
民族文獻數字化建設的實際意義,應在民族文獻的原創(chuàng)設計、出版發(fā)行、發(fā)展和運用的基礎上,授予其新時代的意義。對于民族地區(qū)的教育資源、信息資源以及信息資源數字化等諸多概念都有一個比較精準的定位,并且對于民族文獻數字化建設、資源數字化建設之間的關系做出了精準的劃分和掌握,可以為少數民族的教育信息數字化以及資源數字化給予強大的理論支撐。
1.民族文獻數字化有利于弘揚各民族文化
中國數字圖書館新項目資源建設的總體目標是建設一個體現中華民族特點、具備多種多樣中華民族文化含義的數據庫。這一目標是由國家項目執(zhí)行,體現在中國的各個單獨數據庫中。數據庫建設正日益變成全世界資產投資和市場競爭的網絡熱點。文獻數字化建設的關鍵是體現其民族和民族歷史時代文化的核心思想。中華民族文化歷史久遠和文化多元,為了更好地發(fā)揚我國各民族文化,推動全球各民族的文化交流,應在民族文獻工作上選用數字化建設的技術方式,創(chuàng)建民族文獻數據庫,使民族文化信息在信息時代和全球文化領域有一定的影響力。
2.民族文獻數字化有利用于搶救保護民族古籍
中國的民族古籍一般指1949年10月之前,以民族文本(包含口語)撰寫和記載的全部文化媒體。它包含下述三個層面:第一,由古時候各民族發(fā)展起來或應用,但如今不會再應用的古文字撰寫、印刷和包裝的文獻。主要包含有法盧文、焦書——龜茲文、于閱文、突厥文、鮮卑文、粟特文、回鶻文、察合臺文、西夏文、契丹文、女真文、滿文等,這一部分文獻具備較高的學術研究和使用價值,但沒有確切的數據分析;第二,在歷史上有很多由極個別民族撰寫、印刷和包裝成文字的文檔,迄今仍被權威專家應用。例如,據調查,中國藏文古籍60多萬冊,蒙古古籍1萬余冊,北京市彝族古籍1000余冊,散播在中國的傈僳族經典數萬部。在2萬多份彝族歷史文獻中,僅佛教書籍就有84.1部書,長詩500余首,古壯文數十萬字;第三,是各民族根據口述和用戶反饋的方法世世代代廣為流傳和儲存的民族文獻,如《格薩爾》《江格爾》《瑪納斯》,這三部英雄史詩在全世界都廣為流傳,還有侗族的《侗歌》、土家族的《擺手歌》、哈尼族的《哈尼創(chuàng)世史詩》、赫哲族的民間說唱文學《伊瑪堪》、苗族的《古老歌》、水族的《古歌》、彝族的《阿詩瑪》,甚至是目前仍頗有爭議的黎族口述史《吞德剖》等全是經典之作。民族古籍不但卷帙浩繁,并且以各種各樣的方式傳播。但同時,很多寶貴的古籍因為損壞比較嚴重,急需拯救維護。
3.民族文獻數字化有利于民族文獻的充分開發(fā)利用
一方面,為了更好地深入我國民族研究,民族文獻應用數字化建設的方式,向教科研工作人員給予研究動態(tài)性和最新研究的成效,掌握研究方位,正確看待民族教學內容,使民族地區(qū)數字化系統建設步入正確軌道。另一方面,民族文獻數字化為黨建工作領導干部、機關單位和企業(yè)的科學管理決策給予信息咨詢。民族文學類的民族文獻在我國數量較多的,有多種多樣的課題。光憑人力資源檢索某一主題的有關文獻可能會花費很多的人工和時間,民族文獻數字化系統應用使得信息查找系統均值每10分鐘左右就可以完成一個課題研究,其勞動量等同于一個人閱讀了30種語言表達的2000種專業(yè)刊物和9000篇科學論文的勞動量。國家文獻信息數字化建設不但利于研究者以不同的形式開展查找和剖析,還能夠利用互聯網上的商品流轉和共享資源,因此,實現數字化對民族文學類充分開發(fā)和運用意義重大。
二、民族文獻信息資源數字網絡化現狀分析
全文文獻信息愈來愈多。比如,到現在為止,中國已經開始經營各式各樣的數據圖書館新項目,包含國務院辦公廳公布并準許的“國家公共圖書館二期和國家數據圖書館基礎建筑項目”。國家科學數據圖書館(中國科學院專業(yè)知識創(chuàng)新新項目的核心構成部分),中國高教育文獻適用系統(CALIS)二期新項目——國家教育數據圖書館、湖南省委黨校系統數據圖書館和國防大學數據圖書館,現在中國早已刮起了一輪數據圖書館建設風潮。數字化建設的文獻資源很大程度上拓寬了人們運用文獻的方法,但是作為一個有著諸多民族和多種多樣文獻資源的國家,到現在為止,還沒有體現中國少數民族文獻信息主題的數據庫,更別說相關國家數據庫的建設了。高建中撰寫發(fā)表在2003年第五期《中華民族》上的“誰將建設中國國家數據圖書館”的文章,深度剖析了建設中國國家數據圖書館的重要意義,明確指出了建設中國國家數據圖書館的理論依據。
與中國現階段的信息化發(fā)展水準對比,中華民族文獻資料數字化系統的水準相比較低,尤其是西部少數民族文獻信息資源相對集中化,這也是我國信息化水準最低的地域。
因而,國家數據庫的建設、中國少數民族文獻資料數字化系統的建設,有利于對歷史悠久的少數民族文化的救治及其文獻信息的開發(fā),為執(zhí)行西部大開發(fā)給予強大的信息基礎支撐,將提升我國信息化的總體水準,推動我國數據圖書館新合理布局的產生,及其具備的核心實際意義。
我國少數民族文獻資料數字化系統的研究在20世紀80時代初發(fā)展緩慢,那時候都還沒有“數字化建設”的界定,一般稱作“計算機化”和“數據數字電子化”。比如,1984年,西南民族大學教授沙馬拉毅研制成功彝文輸入法。之后,他依次開發(fā)了藏文、蒙文等計算機文本處理系統。近期,云南麗江的一位傈僳族年輕人解決了東巴象形字的計算機處理和翻譯工作。東巴是一種錯綜復雜的圖文,它的產品研發(fā)看到了解決中華文化文本處理技術的期待。
除此之外,對于少數民族文本有幾種計算機處理系統,為極個別文檔的數字化建設奠定了較好的基礎。現階段,我國少數民族文獻資料數字化系統的種類包含各民族地區(qū)高校圖書館建立的專題、特色數據庫等。
數據庫建設是文獻資料數字化系統建設的核心內容和行為主體,開發(fā)不同特點的文獻數據庫是文獻信息資源共建共享的重要條件。少數民族地域的高校圖書館、文獻組織和個人藏品有很多體現該地域少數民族的文獻資源,為創(chuàng)建與眾不同的少數民族專題數據庫創(chuàng)造了有利條件。教育部可采用的中國高等教育文獻保障機制(CALIS)的首要目的之一是創(chuàng)建高等教育特點數據庫。
比如,內蒙古大學公共圖書館創(chuàng)建的蒙古族學特色圖書館是我國高等教育文獻保障機制的分部分項工程。項目的服務宗旨是在教育部的指導下融合國家投資項目、公共圖書館的核心價值、出色的技術方式、多種多樣的高校文獻資源和人力,搭建以我國高等教育數據庫為關鍵的教育文獻協作保障機制,完成信息資源的共創(chuàng)共享;云南大學融合該校發(fā)展的課程內容,創(chuàng)建了《納西東巴文化數據庫》,產生了含有一定民族特色和教學內容特點的專題講座數據庫。
三、數字資源庫的建設
1.民族文獻的搜集范圍
為防止因片面化導致的互聯網資源耗費,研究團隊融合地區(qū)環(huán)境,依據院校特性、日常任務、服務總體目標等關鍵點,明確了文獻個人收藏范疇。
在海南省的眾多民族中,黎族人口最多,次之是苗族、壯族和回族。因此,研究團隊將黎族、苗族、壯族和回族文學類明確為民族文學類的個人收藏范疇,凸顯黎族文學類作為關鍵個人收藏的總體目標。
民族文獻收集的地區(qū)范疇集中在前面提及的9個縣和區(qū),但因為17.8%的少數民族在萬寧、瓊海、屯昌、儋州等區(qū)縣的少數民族城區(qū),因而該地區(qū)少數民族文獻也包含在收集范疇內。除此之外,海南省原是廣東的一個行政區(qū)域,廣東各公共圖書館也收藏了很多寶貴的海南省民族文獻,這類來源于其他省區(qū)的海南省民族文獻也是主要的收集目標。
對海南省少數民族文獻館藏品標準界定如下:第一,內容為海南省少數民族文獻的材料、民族民俗文化和作家作品;第二,海南及少數民族地區(qū)的縣區(qū)志、民族志、鄉(xiāng)志;第三,民族地區(qū)的自然資源、特點、商品散播、資源調研、經濟發(fā)展、土地轉變、歷史時間演化、人口數量調節(jié)、自然地理演化、氣候、災難等有關文獻和材料。以上文檔的內容涉及海南省少數民族地區(qū)的政治、經濟、文化、教育、體育文化、語言表達能力、文學、藝術、歷史、自然地理、民族宗教、風俗習慣和歷史人文條件、服飾、住宅建筑、工業(yè)生產、農牧業(yè)生產、城市公共交通、休閑度假、高新技術、藥業(yè)等領域。
2.民族文獻收集的方式方法
海南省少數民族文獻的收集是一項十分艱難和嚴謹的工作。它覆蓋面積大,種類繁雜。此外,經歷較長的時間,因此個人收藏尤其艱難。研究工作人員集中在有關少數民族地區(qū)的最底層收集相關民族文獻,主要是收集經常出版發(fā)行的資料和各種各樣文獻選編的原文材料。例如,縣區(qū)地方的志辦、古書、歷史編年、文化核心、博物館、市政協文史類聯合會、黨的知識、公共圖書館以及國家科研院所和其他有關公司。
民族地區(qū)活動涉及很多專業(yè)工作人員,他們專注于思索海南省極個別民族。很多年來,他們一直專注于發(fā)掘、收集、整理和修訂民族文獻,收集了一定數目的民族地區(qū)經典文獻。針對這一部分收藏的原材料,研究組應用各種各樣方式整理、加工,從而掌握和收集了很多寶貴的少數民族文學類資料。
3.資源的整理和加工
資源搜集整理、生產加工的有機融合就是“藏以致用”。紙版文檔選用北大方正(Apabi)電子書籍系統和四方德賽(DESI)數據庫建立軟件,利用掃描儀將紙質文件轉化成圖像儲存在計算機中,并依靠OCR鑒別系統開展圖像處理,如版塊剖析、橫縱核查等,隨后再開展撰寫、排版設計、數據庫索引等制作和處理,將多個民族地域的文本文檔集成到數字化系統中。針對相片、稿件、譜子等方式的民族文獻,為了能夠更好地維持其原狀,使用掃描儀選用圖像儲存方法作為正本,確保檔案信息數字化系統的高品質、高效率運行。
雖然采用這類辦法必須占有比較大的儲存空間,但保存了民族文獻原來的外觀設計和設計風格,可以真正體現民族文獻的特性。視覺數據在計算機中利用專用型設備和相對應的軟件轉化成相應位圖文件,并儲存在光碟或Internet服務器中。
在標引數據制作過程中,研究團隊嚴格遵守國家文獻編目標引原則,制定了統一編目標準和標引方式,依照《中國圖書館圖書資料分類法》(第四版)對文獻開展歸類,“關鍵字”依據《中國圖書分類主題詞表》的主題詞匯,并且十分重視自由詞的運用,盡量提升文獻標引的深度和深度廣度,擴張查找點,創(chuàng)建多種渠道查找方法。依據不同的資源、內容和媒體,信息數據庫在海南省創(chuàng)建了4個單獨的民族文獻數據庫,即《海南民族研究圖書庫》《海南民族研究論文庫》《海南民族研究圖片庫》《海南民族研究多媒體庫》。
四、結語
隨著計算機、多媒體系統和相對密度高的儲存等信息技術的發(fā)展和運用,尤其是互聯網技術快速普及和發(fā)展,文獻資源的數字化系統水準已成為全球信息水準的標志。在21世紀,我國與眾不同的少數民族文化發(fā)展機遇愈來愈多,民族文學類凝結了大家的智慧,它不但是中華民族文化寶藏中的精神財富,也是全世界獨一無二的珍貴信息資源。因此,加速海南民族文獻資源數字化系統建設,必將推動中華民族文化的發(fā)展。
參考文獻:
[1]喻筱程.信息化時代下少數民族文獻數字化整理與利用——以貴州彝文文獻資料為例[J].貴州工程應用技術學院學報,2019
[2]郭世華.論貴州少數民族文獻數字化建設[J].牡丹,2015
[3]張炳華,郭 軍.東北少數民族文獻資源數字化建設模式探討[J].河南圖書館學刊,2013
[4]任 柯.HTML5構建Android少數民族文獻數字化平臺研究[J].西南民族大學學報(自然科學版),2013
[5]王幼紅.貴州少數民族文獻數字化建設探討[J].貴州民族研究,2006
[6]安群英,曹德玉,柳小蓉,吳 俊.我國少數民族文獻資料數字化建設探討[J].西南民族大學學報(人文社科版),2003
[7]李小玲,洪秋蘭.海南省高校圖書館少數民族數字資源建設的模糊評價[J].海南熱帶海洋學院學報,2017
[8]章 達.少數民族歷史文獻開發(fā)利用的思考[J].圖書館工作與研究,1998
[9]包和平,王學艷.論民族文獻的開發(fā)利用[J].圖書館學研究,2002
[10]朱逸輝.略論海南文化之發(fā)展[J].海南大學學報(社會科學版),1994
[11]李冕斌,歐陽美林.海南地方文獻收集整理現狀分析與對策[J].圖書館學研究,2013
(作者單位:三亞學院)
基金項目:海南省高等學??茖W研究一般項目《自貿港背景下海南傳統技藝非遺的融媒體傳播與保護多視野探究》(HnKy2022-41)前期研究成果。
作者簡介:陳凱(1978—),男,漢族,四川資中人,碩士,館員,研究方向:圖書館學、圖書館管理、智慧圖書館、服務創(chuàng)新、閱讀推廣、新媒體、民俗等;肖芒(1964—),女,漢族,云南昆明人,博士,教授,研究方向:人類學、民族學、社會學。