丁海斌 趙錦濤
(1.廣西民族大學(xué)管理學(xué)院,廣西南寧,530006;2.廣西數(shù)字檔案管理研究所,廣西南寧,530006)
隨著信息技術(shù)的發(fā)展,以及國家層面對于史料整理的重視,中國古代檔案史史料電子資源近30年來呈現(xiàn)幾何式增長。電子資源的產(chǎn)生不僅改變了傳統(tǒng)史料的整理與保存方式,也極大地提高了史料搜集和利用的效率。目前,學(xué)界尚未對中國古代檔案史史料電子資源進(jìn)行深入專門的研究。由此,本文著重對中國古代檔案史史料電子資源進(jìn)行專門研究,對其類型、特點(diǎn)、優(yōu)勢和應(yīng)用情況進(jìn)行探析,以展現(xiàn)中國古代檔案史史料電子資源的概貌和獨(dú)特價值。
電子資源已成為中國古代檔案史研究中不可或缺的史料來源,對檔案史研究具有極為重要的價值,為中國古代檔案史的教學(xué)和科研發(fā)展奠定了基礎(chǔ)。中國古代檔案史史料電子資源主要存在于檔案館官網(wǎng)和在線數(shù)據(jù)庫中。
對我國31個省級檔案館和國家級檔案館進(jìn)行網(wǎng)絡(luò)調(diào)查發(fā)現(xiàn),共有13個保存有中國古代檔案史史料電子資源的網(wǎng)站,多以明清檔案史料為主。多數(shù)檔案館僅能提供目錄查詢,其中只有中國第一歷史檔案館的《清實(shí)錄》和《清會典》能夠?qū)崿F(xiàn)全文查詢。在這些檔案館官網(wǎng)電子資源中,涉及中國古代檔案史史料最多的是清代檔案,其次是明朝和唐朝的檔案史料,最具代表性的是中國第一歷史檔案館、遼寧省檔案館和四川省檔案館,均保存了大量史料,且數(shù)字化后開放利用的規(guī)模和程度較高(詳情見表1)。
表1 重要檔案館史料電子資源介紹
20世紀(jì)90年代后檔案數(shù)字化整理進(jìn)入快速發(fā)展階段,截至目前,中國古代檔案史史料數(shù)字化已經(jīng)取得重大進(jìn)展,各種類型的檔案史史料數(shù)據(jù)庫也紛紛建立。通過調(diào)查發(fā)現(xiàn),現(xiàn)階段檔案史史料數(shù)據(jù)庫以檢索型數(shù)據(jù)庫為主,包括愛如生大型古籍?dāng)?shù)據(jù)庫、國學(xué)寶典(網(wǎng)絡(luò)版)、中華古籍資源庫、中華再造善本庫、中國方志庫、中國學(xué)術(shù)期刊全文數(shù)據(jù)庫、萬方數(shù)據(jù)等。以國學(xué)寶典(網(wǎng)絡(luò)版)和中國學(xué)術(shù)期刊全文數(shù)據(jù)庫為例,前者收錄了從先秦至清末所有以漢字作為載體的歷代典籍。后者收錄了包含較多與中國古代檔案史史料相關(guān)的內(nèi)容,如專業(yè)詞典、國學(xué)寶典等。量化型數(shù)據(jù)庫仍在不斷地探索,成果相對較少,包括中國歷史地理信息系統(tǒng)、中國歷代人物傳記資料庫、臺灣歷史數(shù)位圖書館等。其中集合臺灣史一手史料的臺灣歷史數(shù)位圖書館收錄了與中國古代檔案史史料相關(guān)的明清臺灣行政檔案、古契書等。
通過對調(diào)查所得的重要檔案館網(wǎng)站和在線數(shù)據(jù)庫進(jìn)行分析,可以總結(jié)出史料電子資源具有如下特點(diǎn):第一,建設(shè)主體。我國史料電子資源建設(shè)主體主要包括檔案館、公共圖書館、學(xué)術(shù)機(jī)構(gòu)和古籍?dāng)?shù)字化企業(yè)。[1]檔案館和公共圖書館主要以建設(shè)館藏史料電子資源為首要目的,主要解決館藏、保護(hù)以及利用三者之間的矛盾;學(xué)術(shù)機(jī)構(gòu)以教學(xué)和科研為首要目的,主要解決科研的需要;古籍?dāng)?shù)字化企業(yè)主要以營利為首要目的,以市場需求為指導(dǎo)原則。各種建設(shè)主體之間雖然出發(fā)點(diǎn)和目的不同,但是也相互合作、各取所長,共同構(gòu)建更加完整的檔案史史料電子資源。第二,資源內(nèi)容。在資源建設(shè)內(nèi)容上,中文古籍類和館藏檔案類史料數(shù)字化資源較多。檔案館電子資源主要是清代檔案史料,其次是明代和唐代檔案史料。如一史館的《清實(shí)錄》和《清會典》全文數(shù)據(jù)庫。公共圖書館、學(xué)術(shù)機(jī)構(gòu)和古籍?dāng)?shù)字化企業(yè)電子資源主要以紙本古籍為主。其中公共圖書館根據(jù)自身館藏特色建設(shè)和開發(fā)史料資源;學(xué)術(shù)機(jī)構(gòu)根據(jù)科研需要,以史學(xué)類和方志類資源建設(shè)為主,建設(shè)的資源內(nèi)容重復(fù)性較小。[2]第三,資源類型。在所調(diào)查統(tǒng)計(jì)的電子資源中,各主體提供的均是專題數(shù)據(jù)庫。在檔案館官網(wǎng)中其主要功能是檢索,提供檔案史料目錄查詢;公共圖書館和古籍?dāng)?shù)字化企業(yè)提供的是古籍全文數(shù)據(jù)庫,但是古籍?dāng)?shù)字化企業(yè)提供的產(chǎn)品需要付費(fèi)才能使用。量化分析型史料數(shù)據(jù)庫建設(shè)主要以學(xué)術(shù)機(jī)構(gòu)為主,能夠提供統(tǒng)計(jì)分析和可視化展示等綜合分析功能。[3]
史料電子資源具有檢索便利性、使用快捷性、內(nèi)容精準(zhǔn)性等特征,不僅能夠促進(jìn)檔案史料的永續(xù)保存和充分利用,對于檔案史及檔案史史料學(xué)的發(fā)展也大有裨益。其應(yīng)用使中國古代檔案史研究向跨學(xué)科、精準(zhǔn)性和科學(xué)性的方向發(fā)展[4],相對于傳統(tǒng)史料資源,電子資源具有巨大的應(yīng)用優(yōu)勢:第一,電子資源使史料檢索更加便捷,不僅提高了研究者查找史料、??焙涂加喪妨系男剩掖蚱屏酥袊糯鷻n案史史料保存和用戶利用之間的時空阻隔;第二,相較于傳統(tǒng)史料研究,電子資源拓寬了史料搜集范圍,研究者可以進(jìn)行整庫與全網(wǎng)檢索和統(tǒng)計(jì),使其研究范圍更加開闊,數(shù)量關(guān)系更加準(zhǔn)確、全面,在長期梳理事實(shí)、觀念、詞匯源流等方面具有傳統(tǒng)史料無可比擬的優(yōu)勢[5];第三,任何用戶可通過互聯(lián)網(wǎng)平臺使用電子資源,這不僅有利于促進(jìn)學(xué)科和技術(shù)間更好地融合與發(fā)展,而且能夠催發(fā)“新文科”和“數(shù)字人文”等新學(xué)術(shù)形態(tài)的產(chǎn)生。
(1)數(shù)據(jù)統(tǒng)計(jì),探究源流
信息技術(shù)的發(fā)展促進(jìn)了歷史語言學(xué)和計(jì)量語言學(xué)的進(jìn)一步發(fā)展。研究者可通過對關(guān)鍵詞進(jìn)行聚類檢索以統(tǒng)計(jì)字頻和出現(xiàn)的次數(shù),分析詞族的相同和相異之處,并將這些信息共同呈現(xiàn)給讀者;還可以通過查找關(guān)鍵詞以追蹤詞字歷史演變的軌跡。這也是近年來電子資源在中國古代檔案史研究應(yīng)用中比較常見的方式。如,筆者主持承擔(dān)的國家社科基金項(xiàng)目“中國文檔名詞發(fā)展演變史”,其中古代部分的數(shù)據(jù)主要來源于“國學(xué)寶典數(shù)據(jù)庫”和“四庫全書數(shù)據(jù)庫”,后期亦使用了“愛如生基本古籍?dāng)?shù)據(jù)庫”,與其他數(shù)據(jù)庫相互參考、對比、補(bǔ)充。該系列文章以電子資源文本檢索和數(shù)據(jù)統(tǒng)計(jì)為基礎(chǔ),應(yīng)用數(shù)量分析的方法了解歷史上文檔名詞應(yīng)用的頻次與范圍等。[6]
(2)E考據(jù)——檔案史料的“立體”應(yīng)用
E考據(jù)是黃一農(nóng)教授提出,意為充分利用電子資源進(jìn)行考據(jù)。其在中國古代檔案史領(lǐng)域應(yīng)用中,研究內(nèi)容以明清時期檔案史較多,這與明清時期史料保存和公開的電子資源較多有很大的關(guān)系;研究重點(diǎn)在考疏歷史淵源、探究檔案史相關(guān)內(nèi)容的功能演變及歷史特殊性等方面;研究類型較多集中在檔案名詞、文書檔案研究以及對檔案史研究的評介與綜述等方面。
(3)數(shù)字人文與特殊檔案史料資源開發(fā)
數(shù)字人文帶來了新的研究方法和研究工具,助力電子史料資源的分析和利用,對研究中國古代檔案史某一個專題具有重大的意義。數(shù)字人文與社會人文歷史領(lǐng)域的融合促進(jìn)了研究者對歷史人物—事件間關(guān)系的關(guān)注,海量的電子資源和數(shù)據(jù)分析技術(shù)為高效厘清人、事、物之間復(fù)雜的關(guān)系提供全新的范式,為中國古代檔案史史料的發(fā)展研究提供了新的思路和方法。此外,中國古代檔案史史料的形式多樣,除古籍文本外,被應(yīng)用較多的還有碑文檔案、圖畫以及地圖檔案等。研究者通過對這些特殊檔案史料進(jìn)行研究能夠窺探某一地區(qū)變遷的情況或者某一事物的全貌,更好地還原當(dāng)時的場景。
中國古代檔案史史料種類繁多,資源結(jié)構(gòu)和類型各不相同,史料數(shù)字化和數(shù)字人文研究方式的應(yīng)用以及各種數(shù)據(jù)庫的出現(xiàn),有利于對大量史料的檢索,輔助實(shí)證研究,但史料電子資源的應(yīng)用尚存在不足。
(1)史料數(shù)據(jù)庫自身的信息服務(wù)功能需要完善
古籍全文數(shù)據(jù)庫可分為三類:圖文型、圖像型、文本型。圖文型數(shù)據(jù)庫不僅能提供文本檢索,還能對照古籍原文內(nèi)容,避免文字自動識別出現(xiàn)錯誤。[7]而文本型數(shù)據(jù)庫,如常用的國學(xué)寶典數(shù)據(jù)庫[8],需要用戶在使用過程中把查到的古籍電子版本與古籍原始版本進(jìn)行對比以確保引用的準(zhǔn)確性,這無形中增加了用戶的時間成本。這類數(shù)據(jù)庫應(yīng)完善信息服務(wù)功能,增添古籍影印版,從而使用戶能夠在線完成對比、提高效率。此外,在糾錯勘誤功能上,目前常用的數(shù)據(jù)庫中僅有中國基本古籍庫、瀚堂典藏、中華經(jīng)典古籍庫具有該功能,亟須加強(qiáng)對該功能的建設(shè)與完善。
(2)存在以檢索代替研究的問題
“電子史料資源給研究帶來很大便利,但是‘搜索式’文章,缺乏對史料上下文語境的考察,從而忽視了史料真正價值?!保?]研究者在享受電子資源便利性的同時,還應(yīng)把史料電子資源當(dāng)作技術(shù)手段輔助研究,不能“買櫝還珠”,忽略史料本身的價值。
(3)對特殊載體的電子史料資源應(yīng)用關(guān)注度低
中國古代檔案史史料電子資源應(yīng)用多以古籍文本為研究內(nèi)容,進(jìn)而作實(shí)證分析,但中國古代檔案史史料資源豐富、題材眾多,如地方文獻(xiàn)類、碑文類等,還未受到研究者的較多關(guān)注。重視對特殊載體類史料電子資源的應(yīng)用,對中國古代檔案史史料的研究大有裨益,同時也有利于促進(jìn)中國古代檔案史史料電子資源更加完整。
電子資源是中國古代檔案史史料中的重要組成部分,是信息化時代人們最常檢索、閱覽的史料形式。一方面,電子資源的出現(xiàn)和新技術(shù)的應(yīng)用不僅拓寬了中國古代檔案史史料的應(yīng)用場景,也實(shí)現(xiàn)了不同學(xué)科之間的交叉與融合。但另一方面,技術(shù)在給我們帶來便利的同時,也給我們帶來了新的挑戰(zhàn)。我們應(yīng)以更加嚴(yán)謹(jǐn)?shù)膽B(tài)度,對史料電子資源進(jìn)行科學(xué)鑒別、篩選和分析,提升電子資源的利用效率。