高建輝
(楚雄師范學(xué)院圖書館,楚雄 675000)
彝文古籍是彝族十分珍貴的歷史文化遺產(chǎn),是彝族先民在社會活動中直接形成和使用的文獻資料。文化部《“十三五”時期全國古籍保護工作規(guī)劃》要求,“到2020年,要完成古籍?dāng)?shù)字化并發(fā)布古籍?dāng)?shù)字資源7萬部,鼓勵和支持各古籍收藏單位加快古籍?dāng)?shù)字化步伐,借助互聯(lián)網(wǎng)、大數(shù)據(jù)、云服務(wù)等高新技術(shù),率先對館藏特色文獻和珍貴古籍進行數(shù)字化,擴大古籍?dāng)?shù)字資源開放,促進資源共享,提高利用效率”。[1]據(jù)調(diào)查,彝文古籍?dāng)?shù)量眾多、內(nèi)容豐富,分布廣泛,彝族聚居地區(qū)的文化機構(gòu)一般都有收藏,但很多機構(gòu)保存的彝文古籍質(zhì)量參差不齊,保存條件差,且內(nèi)容重復(fù)率高,利用效率低。要解決這些問題,應(yīng)當(dāng)對彝文古籍進行一體化管理,但在目前的體制下這一做法幾乎不可能實現(xiàn),只有將散存于各個保存機構(gòu)的彝文古籍按照一定的模式進行數(shù)字化整合,才符合國家發(fā)展規(guī)劃和各方利益需求,才有實施的基礎(chǔ)。古籍資源整合后有利于維護民族文化的完整性,有利于古籍的有效保護和利用,有利于民族地區(qū)的社會穩(wěn)定和民族文化的傳承與傳播。
彝文古籍是1949年以前用彝文寫成的少數(shù)民族文獻,其內(nèi)容體現(xiàn)在彝族政治、經(jīng)濟、文化、宗教、哲學(xué)、軍事等社會活動的方方面面,具有重要的歷史文化價值,主要分布在云南、貴州、四川和廣西等省或自治區(qū),據(jù)統(tǒng)計,其總量在10萬冊以上。彝文古籍具有多元屬性,它既是古籍,又是文物,也是檔案和史料,除散落民間外,有很多機構(gòu)都有收藏[2-3]。據(jù)調(diào)查,彝文古籍保存機構(gòu)包括圖書館、博物館、檔案館、民族事務(wù)委員會(以下簡稱“民委”)、民族宗教事務(wù)局(以下簡稱“民宗局”)、彝學(xué)會、紀念館、民族文化研究所、文化館、史志辦等。據(jù)不完全統(tǒng)計,部分機構(gòu)保存數(shù)量如下。云南省民委古籍辦1 200冊,省圖書館32冊,省博物館37冊,省社科院圖書館20余冊。楚雄彝族自治州彝族文化研究院1 000余冊,州博物館36冊,州民委古籍辦30余冊,州檔案館150冊,州圖書館1 000余冊;楚雄師范學(xué)院圖書館93冊;雙柏縣文化館400余冊;武定縣民委226冊。紅河州民族研究所191冊,州群眾藝術(shù)館3冊;州民宗局8冊,縣圖書館3冊。貴州省博物館2 500余冊,省民族研究所100冊,省民族學(xué)院500余冊;貴州民族圖書館30冊;畢節(jié)市檔案館171冊;大方縣奢香博物館109冊,縣民委284冊;赫章縣民委250多冊;威寧縣民委50冊;六盤水市民委30冊;水城縣民委90余冊;盤縣民委20冊;納雍縣民委30余冊。四川涼山州彝文編譯局1 500余冊,州博物館60余冊;西南民族大學(xué)6 000余冊;西昌學(xué)院30余冊;雷波縣民委85冊;昭覺語言文字工作委員會100多冊;樂山市峨邊縣民委77冊。廣西壯族自治區(qū)圖書館2冊,博物館1冊;隆林縣民委2冊,縣文化館5冊[4-5]。
彝文古籍?dāng)?shù)字資源主要有以下5種存在形式,即彝文古籍書目數(shù)據(jù)庫、圖片版全文數(shù)據(jù)庫、文本版全文數(shù)據(jù)庫、圖片版電子圖書、文本版電子圖書。目前的建設(shè)情況如下。云南楚雄州圖書館的“彝文文獻數(shù)據(jù)庫檢索平臺中有70冊彝文古籍書目數(shù)據(jù),楚雄師范學(xué)院圖書館彝文古籍?dāng)?shù)據(jù)庫中包含300多冊彝文古籍書目數(shù)據(jù),彝族文化數(shù)字資源平臺數(shù)據(jù)庫中包含5冊圖片版彝文古籍電子圖書,楚雄彝族優(yōu)秀文化作品數(shù)據(jù)庫中有200多條彝文古籍書目數(shù)據(jù);西南民族大學(xué)民族古籍?dāng)?shù)據(jù)庫中包含部分彝文古籍,云南紅河學(xué)院的彝族文化相關(guān)數(shù)據(jù)庫中有少量彝文古籍(以上兩個數(shù)據(jù)庫還在建設(shè)中,其包含的古籍?dāng)?shù)量不詳)。楚雄彝族自治州編制的彝族畢摩經(jīng)典譯注106冊中含有云南、四川、貴州、廣西四省區(qū)的6 000多冊(篇、條)文本版彝文古籍資源和電子版圖書,如《武定歷算書》《雙柏拉婚經(jīng)》《昭通喪葬經(jīng)》《查姆》等。云南紅河州編制《紅河彝族文化遺產(chǎn)古籍典藏》20冊中包含110多部圖片版彝文古籍,如《尼蘇奪節(jié)》《蘇嫫》《萬物的起源》《吾查們查》等。楚雄師范學(xué)院編制的《彝族古籍文獻考略(一)》中包含10部圖片版彝文古籍電子圖書,如《驅(qū)重喪經(jīng)書》《祈雨經(jīng)合經(jīng)》《裝殮經(jīng)》等。此外,在彝族主要分布區(qū)域的各類型圖書館的書目數(shù)據(jù)庫中也包含部分彝文古籍書目數(shù)據(jù),其數(shù)量無法統(tǒng)計??傊壳耙呀?jīng)數(shù)字化的彝文古籍?dāng)?shù)量不多,根據(jù)彝文古籍總量10萬冊測算,彝文古籍?dāng)?shù)字化比例還不到現(xiàn)存總量的10%,如果只是整合已有的數(shù)字資源,其意義不大,在數(shù)字資源整合之前,還需要對各機構(gòu)保存的彝文古籍資源進行數(shù)字化處理[6]。
(1)數(shù)字化整合的理論研究情況。首先,國家近年來加大了少數(shù)民族古籍資源的收集、整理和數(shù)字化力度,也加大了對相關(guān)項目的支持力度,相關(guān)領(lǐng)域的項目立項數(shù)量和學(xué)術(shù)研究成果不斷增加。目前資源整合領(lǐng)域主要研究以下方面。一是古籍資源整合的基礎(chǔ)理論。如李榮艷[7]、薩蕾[8]等提出古籍整合過程中要利用文本自動分析技術(shù),加強多方合作,構(gòu)建古籍知識庫,借鑒國外的資源整合平臺和項目,設(shè)計自己的整合模型。二是圖檔博資源整合、合作與發(fā)展相關(guān)理論。羅紅等[9]提出基于LAM協(xié)作的圖書館館藏建設(shè)理論,以及張衛(wèi)東[10]關(guān)于LAM合作模式的研究。三是區(qū)域性數(shù)字資源整合方式的相關(guān)理論。如近年來周俊燁[11]、程靜[12]等提出的基于關(guān)聯(lián)數(shù)據(jù)、異構(gòu)數(shù)據(jù)、GIS、知識集成、云計算、總分館的資源整合模式。這些成果為彝文古籍?dāng)?shù)字資源的整合奠定了理論基礎(chǔ)。此外,華林等[13]提出“彝文古籍既是圖書,又是文物和檔案的多元屬性”為資源整合主體的確定提供了理論依據(jù)。根據(jù)國內(nèi)外資源建設(shè)的發(fā)展趨勢,最終必然走向圖檔博等文化機構(gòu)的資源整合。
(2)彝文古籍?dāng)?shù)字化整合的資源基礎(chǔ)。首先,彝文古籍資源數(shù)量眾多、分布廣泛,雖然還有很多彝文古籍資源散落民間,但文化機構(gòu)可以通過采集、收集、征集、交換、購買等方法不斷獲取。從目前的保存情況看,大量的彝文古籍已經(jīng)被收集到了各類文化機構(gòu)中進了統(tǒng)一保存。如1.1中所述,其中檔案館、圖書館、博物館和民委四大系統(tǒng)保存的數(shù)量最多,只要條件具備,隨時可以進行數(shù)字化處理。其次,有部分資源已經(jīng)進行數(shù)字化,并且已經(jīng)建成數(shù)據(jù)庫或制作成電子圖書。如1.2中所述,這些資源以彝文古籍的書目、圖片、圖書、文字、數(shù)據(jù)庫條目等形式存在,在整合時可以直接利用。
(3)數(shù)字化整合技術(shù)的應(yīng)用情況。首先,隨著計算機和網(wǎng)絡(luò)技術(shù)的發(fā)展,古籍?dāng)?shù)字化轉(zhuǎn)換和存儲技術(shù)已經(jīng)成熟,大數(shù)據(jù)和云計算技術(shù)的廣泛應(yīng)用為彝文古籍?dāng)?shù)字資源的檢索和利用開拓了新的領(lǐng)域。如國家圖書館對古籍?dāng)?shù)據(jù)庫的元數(shù)據(jù)著錄標(biāo)準(zhǔn)已經(jīng)有了明確的規(guī)范,彝文古籍可以參考使用。其次,異構(gòu)數(shù)據(jù)的整合方法不斷完善,而且已經(jīng)應(yīng)用到很多數(shù)據(jù)庫整合平臺,彝文古籍?dāng)?shù)字資源的整合可以直接借鑒和利用。如元數(shù)據(jù)收割協(xié)議的廣泛應(yīng)用。最后,近年來彝文信息化技術(shù)得到快速發(fā)展,在彝文輸入法和彝文信息化標(biāo)準(zhǔn)的制定方面形成很多成果。如彝漢互譯軟件已于2012年上線運行,標(biāo)準(zhǔn)彝文識別和手寫彝文識別技術(shù)已于2017年產(chǎn)生[14]。
(1)宏觀層面。首先,彝文古籍資源數(shù)字化整合所涉及的機構(gòu)眾多,并且隸屬于不同的主管部門,例如文化局、檔案局、文物局等,復(fù)雜的隸屬關(guān)系是阻礙整合工作的關(guān)鍵。沒有相關(guān)的政策或規(guī)定來支持和保障資源整合工作,再加上部分機構(gòu)的整合意愿不強,整合措施難以實施。其次,資源整合工作的理念和思路,機構(gòu)間的合作模式,數(shù)字化模式和數(shù)據(jù)整合模式都有待進一步研究和明確,這是啟動整合工作的關(guān)鍵所在。最后,由于我國還沒有開展過此類工作,缺乏實踐經(jīng)驗,難以進行頂層設(shè)計和系統(tǒng)規(guī)劃,因此可以先進行區(qū)域性整合試驗,最終把各個區(qū)域的數(shù)字資源再整合到一起。
(2)微觀層面。第一,目前可直接利用的數(shù)字彝文古籍資源不多,而且這些資源大多為書目數(shù)據(jù)庫,沒有全文,數(shù)字化工作十分繁重。如果要實現(xiàn)彝文古籍電子化和全文或彝文檢索,需要消耗大量的時間和人力物力進行彝文錄入和翻譯。第二,已經(jīng)完成數(shù)字化的資源數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,難以實現(xiàn)資源的統(tǒng)一檢索和深度開發(fā)。第三,所有自建數(shù)據(jù)庫都存在資源整合后如何做好后續(xù)維護和更新工作,如何在總體規(guī)劃時考慮后續(xù)工作的經(jīng)費和人員投入,如何保持數(shù)據(jù)庫的生命力等難題。
由于紙質(zhì)古籍資源保存比較分散,且很多機構(gòu)沒有古籍保存和修復(fù)的條件,容易出現(xiàn)損壞和重復(fù)收藏的情況;彝文古籍?dāng)?shù)字資源總量較少,建設(shè)數(shù)據(jù)庫的機構(gòu)屈指可數(shù),且各機構(gòu)所用的標(biāo)準(zhǔn)不統(tǒng)一,很多都是書目或圖片數(shù)據(jù),檢索和利用效率極低。因此,彝文古籍?dāng)?shù)字化整合十分必要。首先,資源整合有利于維護彝族歷史文化的完整性,永久保存完整的民族記憶。內(nèi)容豐富、學(xué)科齊全、門類繁多的彝文古籍資源對增強彝族人民的文化自信,弘揚民族文化具有深遠的歷史意義和重要的現(xiàn)實意義。其次,資源整合工程可以把彝文古籍按照統(tǒng)一的標(biāo)準(zhǔn)進行數(shù)字化處理,保證數(shù)字資源質(zhì)量,避免重復(fù)建設(shè),能為國家節(jié)約人力物力和經(jīng)費。再次,資源整合可以實現(xiàn)統(tǒng)一檢索,這為利用者提供了極大的便利,提高了利用率,擴大了利用范圍,提升相關(guān)機構(gòu)的服務(wù)質(zhì)量。最后,彝文古籍?dāng)?shù)字資源的集中管理是資源大規(guī)模開發(fā)利用的前提。資源整合后可提供利用的資源數(shù)量倍增,通過大數(shù)據(jù)的統(tǒng)計和分析,可以進行數(shù)據(jù)挖掘和知識關(guān)聯(lián),深度開發(fā)彝文古籍資源。
彝文古籍的數(shù)字資源整合工作的指導(dǎo)思想是易于實現(xiàn)、可持續(xù)更新、方便檢索利用、降低成本、注重效益、避免版權(quán)糾紛、便于開發(fā)。資源整合的思路如下。首先,組建相關(guān)管理機構(gòu)。一是由政府部門統(tǒng)一組建領(lǐng)導(dǎo)和協(xié)調(diào)機構(gòu)。二是組建牽頭和責(zé)任機構(gòu),形成資源共建共享聯(lián)動機制。三是落實主體責(zé)任,就工作的考核評價達成共識。其次,進行總體規(guī)劃。一是時間和進度規(guī)劃,資源整合是一項長期的工作,對每年完成的資源數(shù)量要做好長期規(guī)劃,從而保證相關(guān)經(jīng)費和人力的持續(xù)投入。二是整合層次規(guī)劃,整合層次包括國家、省、州(市)和縣級層面。三是資源類型規(guī)劃,彝文古籍按主題可分為十大類,如祭祀類、軍事類、歷史類、祈福類等,按數(shù)字化程度可分為未數(shù)字化、書目已數(shù)字化和全文已數(shù)字化、全文已文本化4種。四是協(xié)作區(qū)域規(guī)劃,區(qū)域可以是一個城市、一個彝族分布區(qū)、區(qū)域聯(lián)盟、一個系統(tǒng)等。最后,具體工作的開展。一是由牽頭機構(gòu)制定和出臺相關(guān)政策,為整合工作的開展提供基本制度保障。二是建立標(biāo)準(zhǔn)規(guī)范,包括工作考核標(biāo)準(zhǔn)、數(shù)字化標(biāo)準(zhǔn)、數(shù)據(jù)及平臺接口標(biāo)準(zhǔn)等。三是分步實施,可以分層次,逐層落實;也可以分類型,劃分重點,不同類型分部進行;還可以分區(qū)域?qū)嵤?,先在小范圍?nèi)開展,積累經(jīng)驗,最終把各個區(qū)域的整合成果匯集后再進一步整合。
整合工作的主體包括資源整合區(qū)域內(nèi)彝文古籍保存機構(gòu)和政府的行政主管部門,這是一項涉及面較廣的系統(tǒng)工程,需要相關(guān)單位長期的通力合作。因此,應(yīng)由政府相關(guān)部門負責(zé)人組成區(qū)域性彝文古籍資源數(shù)字化整合領(lǐng)導(dǎo)小組負責(zé)整個過程的監(jiān)督和指導(dǎo),由區(qū)域內(nèi)的彝文古籍保存機構(gòu)的主要負責(zé)人組成協(xié)調(diào)委員會負責(zé)相關(guān)規(guī)定和標(biāo)準(zhǔn)的制定和日常事務(wù)的商討與協(xié)調(diào),由區(qū)域內(nèi)影響力較大的圖書館負責(zé)這項工程的具體實施。
整合工作的內(nèi)容由三個階段組成。第一階段主要是開展前期工作,包括資源保存地點、數(shù)量和質(zhì)量的詳細調(diào)查,協(xié)商并簽訂資源共建共享協(xié)議或整合意向,以及破損資源的修復(fù)等工作。第二階段是開展中期工作,包括制定項目規(guī)劃,確定主體機構(gòu)與合作機構(gòu),確定整合的對象、范圍、類型和層次,制定紙質(zhì)資源數(shù)字化標(biāo)準(zhǔn)和規(guī)范,確定數(shù)字資源整合的模式,實施信息資源的數(shù)字化整合。第三階段是開展后續(xù)工作,包括各合作機構(gòu)新增資源的數(shù)字化整合以及軟硬件平臺的日常維護。
協(xié)作模式可分為以下類型。一是政府主導(dǎo)的國家層面的協(xié)作模式。在這一模式中政府發(fā)揮著主導(dǎo)作用,為機構(gòu)的協(xié)作制定有關(guān)政策提供資金和人力支持,通過行政手段引導(dǎo),為協(xié)作過程及效果提供保障。二是跨行業(yè)的協(xié)作模式。很多彝文古籍保存機構(gòu)都有業(yè)務(wù)與學(xué)術(shù)的行業(yè)機構(gòu)(如彝學(xué)會、圖書館學(xué)會、檔案學(xué)會、檔案工作者協(xié)會等),可以從學(xué)會和協(xié)會的角度成立跨行業(yè)的綜合性機構(gòu),專門負責(zé)協(xié)作事務(wù),通過這一機構(gòu)建立統(tǒng)一的標(biāo)準(zhǔn)(如數(shù)字化標(biāo)準(zhǔn)、著錄標(biāo)準(zhǔn)、統(tǒng)一門戶網(wǎng)站、用戶身份認證等),從而實現(xiàn)跨行業(yè)的協(xié)作。三是跨機構(gòu)的區(qū)域內(nèi)自發(fā)合作模式。該模式可以由某一機構(gòu)牽頭,出于對特定服務(wù)目標(biāo)的自覺追求或公眾的迫切需求,基于自愿和互利的原則,共同制定戰(zhàn)略規(guī)劃,分擔(dān)成本,該模式要求牽頭機構(gòu)在規(guī)模、用戶、人力、技術(shù)、資金、聲望等方面具有明顯優(yōu)勢。四是跨區(qū)域的項目聯(lián)盟。該模式需要來自不同區(qū)域的機構(gòu)組成一個臨時的聯(lián)盟,針對某一項目,在其生命周期內(nèi)開展合作,項目終止后,聯(lián)盟活動也停止,也可以不斷增加新的項目以延長聯(lián)盟持續(xù)時間,如“世界數(shù)字圖書館”和“世界記憶工程”項目。五是全面合并模式。把協(xié)作的相關(guān)機構(gòu)無縫整合為一個新的組織機構(gòu),統(tǒng)一管理和調(diào)配各種資源并整合相關(guān)的要素,該模式在目前的情況下難以實現(xiàn)[15]。
根據(jù)彝文古籍?dāng)?shù)字資源的特點和整合工作的指導(dǎo)思想與思路,綜合以上5種協(xié)作模式的優(yōu)缺點,提出跨機構(gòu)的區(qū)域內(nèi)的綜合協(xié)作模式,如圖1所示。整個項目由地方政府統(tǒng)一領(lǐng)導(dǎo)和制定政策,提供人力物力和資金的支持,項目管理機構(gòu)由各彝文古籍保存機構(gòu)及其主管機構(gòu)的負責(zé)人組成,根據(jù)各行業(yè)機構(gòu)的意見建立各種標(biāo)準(zhǔn)并由行業(yè)機構(gòu)提供技術(shù)支持,由牽頭機構(gòu)具體負責(zé)實施資源整合,該工程可以劃分為多個階段,實施過程中政府可以適時引導(dǎo),資源整合區(qū)域內(nèi)的各彝文古籍保存單位作為協(xié)作成員參與,形成一個跨機構(gòu)的區(qū)域內(nèi)綜合協(xié)作項目。
在實施彝文古籍?dāng)?shù)字化整合工程的過程中,對于尚未數(shù)字化或者數(shù)字化不徹底的資源,需要先進行數(shù)字化處理。其過程包括資源的數(shù)字化轉(zhuǎn)化與存儲以及數(shù)字資源的整理與著錄兩個階段,這一過程主要關(guān)注兩個問題,即主體與標(biāo)準(zhǔn)。工作主體方面,數(shù)字化相關(guān)工作都可以由古籍保存機構(gòu)、牽頭機構(gòu)或第三方來實施,但由于彝文古籍的特殊性,需要綜合考慮原件安全、數(shù)據(jù)安全、工作效率、數(shù)據(jù)質(zhì)量等要素。其中,安全問題尤為重要,因此,建議把數(shù)字化主體確定為牽頭機構(gòu),把彝文古籍和數(shù)據(jù)集中到牽頭機構(gòu)進行數(shù)字化處理和保存,牽頭機構(gòu)可以再委托并監(jiān)管第三方實施該工程。
資源加工標(biāo)準(zhǔn)分為數(shù)字化轉(zhuǎn)換與存儲標(biāo)準(zhǔn)和標(biāo)引著錄標(biāo)準(zhǔn),前者規(guī)定了數(shù)字化設(shè)備和參數(shù)設(shè)置以及數(shù)字資源的屬性;后者規(guī)定了元數(shù)據(jù)著錄規(guī)范和要求,該標(biāo)準(zhǔn)由項目協(xié)調(diào)委員會負責(zé)制定。經(jīng)過長期的研究和實踐,楚雄師范學(xué)院圖書館編制了符合自身要求的彝文古籍?dāng)?shù)字化標(biāo)準(zhǔn)。數(shù)字化轉(zhuǎn)換與存儲標(biāo)準(zhǔn)包括兩個方面。一是數(shù)字資源的屬性標(biāo)準(zhǔn)。彝文古籍涉及的數(shù)字資源格式包括圖片、PDF文檔、WORD文檔、文本文檔等,其中對圖片的拍攝尺寸、存儲格式、裁剪尺寸、留白邊距、分辨率、文檔格式、文件名稱等作了統(tǒng)一規(guī)定。二是軟硬件標(biāo)準(zhǔn)。軟件方面包括彝文輸入法、圖片和文字處理軟件、操作系統(tǒng)、資源整合平臺和后臺管理功能等。如彝文的輸入法統(tǒng)一采用收集了9 438個彝文文字的《楚雄彝文電腦字庫和輸入法》軟件,圖片資源后期批量處理使用軟件《光影魔術(shù)手》,資源數(shù)據(jù)庫采用MySQL,整合平臺用Java編制,Web服務(wù)器軟件用Apache Tomcat等。硬件方面則統(tǒng)一規(guī)定了拍攝相機的鏡頭焦距、ISO、光照條件、輔助工具、掃描儀DPI的參數(shù)要求。對于標(biāo)引著錄標(biāo)準(zhǔn),楚雄師范學(xué)院圖書館根據(jù)《國家圖書館古籍元數(shù)據(jù)規(guī)范與著錄規(guī)則》,考慮到與MARC格式互相映射和轉(zhuǎn)換,編制了由21個元素組成的彝文古籍元數(shù)據(jù)結(jié)構(gòu),分別是題名、內(nèi)容提要、關(guān)鍵詞、責(zé)任者、日期、版權(quán)所有者、相關(guān)資源、主題類型、年代、格式、來源、權(quán)限、附注、版本、載體形態(tài)、文物保護、館藏信息、收集地點、收集時間、頁碼、頁數(shù)。每個元素均規(guī)定了元素名稱、著錄要求和數(shù)據(jù)類型,著錄時分為必著項和選著項兩類,以平衡著錄的效率和質(zhì)量。詳細內(nèi)容可參照楚雄師范學(xué)院圖書館提出的彝文古籍?dāng)?shù)字化標(biāo)準(zhǔn)。所有彝文古籍都按照統(tǒng)一的標(biāo)準(zhǔn)進行數(shù)字化處理,以保證數(shù)據(jù)的質(zhì)量,便于下一步的數(shù)據(jù)整合[16]。
圖1 彝文古籍?dāng)?shù)字資源整合跨機構(gòu)的區(qū)域內(nèi)綜合協(xié)作模式
(1)在協(xié)作機構(gòu)之間進行的資源整合與共建模式。該模式適用于數(shù)據(jù)無法集中的存量資源或者新增資源分散存放于各個機構(gòu)且資源由于某些原因不能完全開放的情況,協(xié)作成員各自建立檢索平臺,對彝文古籍進行數(shù)字化并保存資源,牽頭機構(gòu)建立一個統(tǒng)一檢索平臺,并掛接各協(xié)作單位的檢索系統(tǒng),從而實現(xiàn)資源的統(tǒng)一檢索,但資源獲取必須按照保存單位的設(shè)置權(quán)限從該單位鏈接獲取。其優(yōu)點是資源平臺和服務(wù)都掌握在各協(xié)作機構(gòu)手中,更新維護方便,一般不存在知識產(chǎn)權(quán)問題。缺點是由于受制于各單位的軟硬件條件,整合與開發(fā)利用效果不好。
(2)數(shù)據(jù)提供者和服務(wù)提供者分離的資源整合共建模式。協(xié)作機構(gòu)作為數(shù)據(jù)提供者,只負責(zé)按照統(tǒng)一的標(biāo)準(zhǔn)數(shù)字化處理本館的資源并及時更新,數(shù)據(jù)存儲在各自的服務(wù)器上,按要求開通數(shù)據(jù)訪問接口,后續(xù)事宜均由牽頭機構(gòu)處理。例如“歐洲數(shù)字圖書館”項目就采用了這種模式。牽頭機構(gòu)統(tǒng)一進行平臺和資源體系建設(shè),根據(jù)“元數(shù)據(jù)收割協(xié)議OAI-PMH”從數(shù)據(jù)提供者的服務(wù)器中收割提供服務(wù)所需的數(shù)據(jù)并為用戶服務(wù)[17]。其優(yōu)點是服務(wù)提供者可以將獲取的元數(shù)據(jù)進行加工處理和深層次開發(fā),拓展更多的服務(wù)類型,例如數(shù)據(jù)挖掘、知識發(fā)現(xiàn)和智能化服務(wù)等,服務(wù)更加專業(yè)化。其缺點是元數(shù)據(jù)需要進行虛擬擴展,對具有多元屬性的資源要進行交叉著錄,更新較慢,獲取原文不方便。
(3)機構(gòu)相對獨立的資源整合模式。在該模式下,協(xié)作機構(gòu)提供原始的彝文古籍或者數(shù)字資源,由一個單獨的機構(gòu)統(tǒng)一進行彝文古籍的數(shù)字化轉(zhuǎn)換、標(biāo)引著錄、編輯存儲、建立獨立的數(shù)字資源軟硬件平臺,并為用戶提供服務(wù)。這一機構(gòu)可以是牽頭機構(gòu)或者第三方機構(gòu),其完全掌握資源的組織、技術(shù)實現(xiàn)、運行和服務(wù)機制。這一模式的缺點是大量元數(shù)據(jù)都要重新制作,工程的實施需要消耗巨大的人力物力和時間,并且容易出現(xiàn)知識產(chǎn)權(quán)問題,短時間內(nèi)很難達到較大的數(shù)據(jù)規(guī)模。優(yōu)點是數(shù)據(jù)質(zhì)量和服務(wù)質(zhì)量比較高。例如世界數(shù)字圖書館項目整合了世界各國LAM的文化資源,為全球用戶提供了一站式信息資源集成服務(wù),但數(shù)據(jù)量較少。
(4)基于四大系統(tǒng)的資源整合模式。通過對保存機構(gòu)的分析,目前彝文古籍的保存和保護主體主要是圖書館、檔案館、博物館和民委古籍辦(含民族文化研究所)四大系統(tǒng),它們所保存的彝文古籍?dāng)?shù)量占了所有保存機構(gòu)的一半以上,在古籍資源的集中保護中發(fā)揮了主要作用。通過構(gòu)建以四大系統(tǒng)為主體的資源共建共享模式,可以解決古籍文獻信息資源整合問題。四大系統(tǒng)可以在各省區(qū)的省級機構(gòu)建立“古籍保護與資料信息中心”,建設(shè)各個系統(tǒng)的彝文古籍目錄和摘要數(shù)據(jù)庫及網(wǎng)站,開展古籍目錄資源的聯(lián)合檢索服務(wù);然后系統(tǒng)內(nèi)各機構(gòu)對各自的彝文古籍進行全文數(shù)字化,并集中上傳到省級中心的網(wǎng)站;最后,在四大系統(tǒng)中實現(xiàn)數(shù)字彝文古籍的文獻傳遞。由于協(xié)作機構(gòu)只有4種,協(xié)調(diào)和執(zhí)行機構(gòu)等問題相對容易解決,這種模式的優(yōu)點是實施難度較低,成果見效快,資源整合效率和質(zhì)量較高。缺點是資源的整合范圍不夠全面。
綜上所述,考慮到已完成數(shù)字化的彝文古籍?dāng)?shù)量較少,數(shù)字化質(zhì)量普遍不高,紙質(zhì)古籍具有文物的特點,破損較多,利用的目的主要以學(xué)術(shù)研究為主,很多參與機構(gòu)不具備數(shù)據(jù)保存條件。最佳的彝文古籍?dāng)?shù)字資源整合模式宜采用以牽頭機構(gòu)為主體的獨立資源整合共建模式,即協(xié)作機構(gòu)把已有的數(shù)字資源或者原始彝文古籍提供給牽頭機構(gòu),由牽頭機構(gòu)統(tǒng)一進行異構(gòu)數(shù)據(jù)的整合與重構(gòu),對未數(shù)字化的彝文古籍統(tǒng)一進行修復(fù)和數(shù)字化處理并確保原件安全,最后由牽頭機構(gòu)建立資源檢索平臺并提供服務(wù)。在這一模中適合作為牽頭機構(gòu)的最佳單位是圖書館,因為只有圖書館才能同時具備古籍修復(fù)條件、建設(shè)軟硬件平臺的人力物力條件、確保原件和數(shù)據(jù)安全的資源保存條件以及提供利用的條件。
隨著信息技術(shù)的發(fā)展,各文化機構(gòu)保存的各種信息資源的整合已成為一種趨勢,也是文化機構(gòu)面臨的一個機遇與挑戰(zhàn),在維護民族文化完整性、增強文化自信的背景下,筆者對機構(gòu)保存的彝文古籍的區(qū)域性數(shù)字化整合模式進行了理論探索、協(xié)作框架構(gòu)建和整合模式的探討,提出了資源整合的構(gòu)想,但對于整合過程中的具體措施還有待于進一步研究,將來還可以從具體實踐的層面進行細化。希望能通過對相關(guān)問題的研究和呼吁,引起有關(guān)部門對彝文古籍的數(shù)字化整合這一問題的重視,盡快在一定區(qū)域內(nèi)進行實踐,然后逐步推向全國,最終實現(xiàn)我國彝文古籍資源的全國性整合。