夏亭亭
摘要:計(jì)算機(jī)科學(xué)技術(shù)的普及與發(fā)展已對(duì)歷史學(xué)產(chǎn)
生了不可忽視的影響,本文就其對(duì)史料的數(shù)字化問(wèn)題提出了初步的探討。主要敘述了網(wǎng)絡(luò)普及對(duì)歷史學(xué)的影響及解決史料數(shù)字化問(wèn)題的最基本方案。
關(guān)鍵詞:史料 數(shù)字化 網(wǎng)絡(luò)
中圖分類號(hào):K0文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1006-026X(2014)02-0000-01
歷史學(xué)是一門不能創(chuàng)造直接經(jīng)濟(jì)價(jià)值的邊緣學(xué)科,但是卻是一門非常重要的學(xué)科,我們每一個(gè)人都不能與歷史脫離關(guān)系,因?yàn)闅v史就是由我們創(chuàng)造。計(jì)算機(jī)科學(xué)與技術(shù)是現(xiàn)今發(fā)展速度較快的學(xué)科之一,
當(dāng)計(jì)算機(jī)與古老的歷史學(xué)結(jié)合起來(lái)會(huì)發(fā)生什么呢?
一、網(wǎng)絡(luò)史學(xué)的興起
網(wǎng)絡(luò)史學(xué)是歷史學(xué)科在信息時(shí)代的一種新的存在形式。它是以電子形式存在,以網(wǎng)絡(luò)作為學(xué)科承載和傳播手段的一門新興的史學(xué)邊緣交叉學(xué)科。由于其獨(dú)特的研究與交流方式,使其有別于傳統(tǒng)的紙質(zhì)史
學(xué)。正是由于網(wǎng)絡(luò)史學(xué)的存在方式不是不是以紙質(zhì)史學(xué)形式而是以電子史學(xué)形式,才是使它之所以能夠從歷史學(xué)科的母體中分離出來(lái)并作為一門獨(dú)立的歷史分支學(xué)科的理由之所在,即網(wǎng)絡(luò)史學(xué)實(shí)為傳統(tǒng)
紙質(zhì)史學(xué)在電子時(shí)代的一種延伸。[1]
二、歷史學(xué)網(wǎng)站的興起
博物館、高校、科研機(jī)構(gòu)等也紛紛建立起了自己的網(wǎng)站,為研究信息的及時(shí)發(fā)布做出了重要貢獻(xiàn)。也為實(shí)現(xiàn)教育資源共享提供了平臺(tái)。在中國(guó)歷史的研究上,日本是除中國(guó)之外最重要的地方,部分原因
是由于中國(guó)和日本有著悠久的歷史淵源。由日本學(xué)者開發(fā)和建設(shè)的一些研究中國(guó)歷史的網(wǎng)站具有很強(qiáng)的專業(yè)性,其內(nèi)容既有關(guān)于某個(gè)特定朝代的研究,也有就某個(gè)社團(tuán)組織就某個(gè)歷史問(wèn)題所進(jìn)行的研討
。例如研究“三國(guó)”歷史的站點(diǎn)又有47個(gè)之多,在私的中國(guó)史調(diào)查會(huì)網(wǎng)站,管理員設(shè)立了一個(gè)投票處,日本民眾可以為他們喜愛的中國(guó)歷史人物投票,1996-2002年間,一共有502位歷史人物榜上有名,
最終關(guān)羽、曹操兩位人物居得票數(shù)榜首。從這個(gè)例子中,不僅可以看出日本人對(duì)中國(guó)歷史的強(qiáng)烈興趣,也從側(cè)面反映了網(wǎng)絡(luò)的力量。
三、史學(xué)研究手段的革新
史料是研究歷史的基礎(chǔ),傅斯年先生甚至提出“史學(xué)即史料學(xué)”的觀點(diǎn),他強(qiáng)調(diào)歷史研究要“上窮碧落下黃泉,動(dòng)手動(dòng)腳找東西”。史料包括實(shí)物史料與文獻(xiàn)資料,其中實(shí)物史料包括遺址與墓葬,文獻(xiàn)
資料包括口傳資料與文字資料,文字資料相對(duì)而言更加豐富,包括傳統(tǒng)的經(jīng)史子集、檔案、地方志、甲骨和金石銘文以及外國(guó)人的著述等。近現(xiàn)代由于歷史研究領(lǐng)域的豐富及考古學(xué)的發(fā)展,大批新史料
不斷被發(fā)掘,如何存儲(chǔ)處理史料成為歷史學(xué)者面對(duì)的新的難題。
數(shù)字化是史料整理的新方式,代表了未來(lái)發(fā)展的新方向。將計(jì)算機(jī)技術(shù)與歷史學(xué)相結(jié)合,有著傳統(tǒng)史料學(xué)不可比擬的優(yōu)勢(shì)。
(一)實(shí)物史料的數(shù)字化
實(shí)物史料較之文獻(xiàn)史料,不僅數(shù)量少,而且零散,連續(xù)性和系統(tǒng)性都比價(jià)差,但實(shí)物史料的優(yōu)勢(shì)在于比較真實(shí)可靠,作為史學(xué)認(rèn)識(shí)成果的檢驗(yàn)形式和依據(jù),它的發(fā)掘和發(fā)現(xiàn),不僅可以補(bǔ)充文獻(xiàn)史料的不
足,而且有助于糾正文獻(xiàn)史料記載中的錯(cuò)誤,并增強(qiáng)對(duì)歷史的真實(shí)感。目前能夠有效保存實(shí)物史料的數(shù)字化方法即數(shù)字博物館。
數(shù)字博物館的發(fā)展歷程比較短暫。美國(guó)國(guó)會(huì)于1990年開始推動(dòng)“美國(guó)記憶(American Memory)計(jì)劃”,這標(biāo)志著數(shù)字博物館建立的興起。2001年7月16日,故宮數(shù)字博物館網(wǎng)站開通,標(biāo)志著我國(guó)第一個(gè)
真正意義上的數(shù)字博物館的誕生。2008年7月23日,中國(guó)非物質(zhì)文化遺產(chǎn)保護(hù)中心開通“羌族文化數(shù)字博物館”,標(biāo)志著我國(guó)首個(gè)少數(shù)民族數(shù)字博物館的開通。2009年5月20日,海南旅游數(shù)字博物館開通
,這是我國(guó)首家旅游數(shù)字博物館。[2]
(二)文獻(xiàn)史料的數(shù)字化
由于主客觀條件的限制,文獻(xiàn)史料的記載者既不可能完整無(wú)缺的將歷史記載下來(lái),也不可能避免個(gè)人立場(chǎng)、觀點(diǎn)和感情好惡,記載中的不足和錯(cuò)誤在所難免,但一般說(shuō)來(lái),文獻(xiàn)史料以內(nèi)容繁富、完備、
連續(xù)和系統(tǒng)見長(zhǎng),所以成為最重要的史料來(lái)源。
1古籍電子化
古籍作為重要的史料資源,其錄入是史學(xué)工作者面臨的一大難題,更由于古籍的使用繁體字等特殊性,對(duì)古籍的檢索手段也提出了更高的要求。
目前計(jì)算機(jī)的輸入方式與古籍輸入相匹配的有鍵盤、掃描等。鍵盤錄入方式使用的最多也最成熟,目前廣泛使用的字庫(kù)是UNICODE,它是對(duì)國(guó)際標(biāo)準(zhǔn)ISO/ICE 10646編碼的一種稱謂,它包含了33884個(gè)字符
集,提供了高達(dá)21億多個(gè)的碼位,解決了古籍?dāng)?shù)字化中的碼位短缺問(wèn)題。但是鍵盤輸入方式對(duì)校對(duì)者的要求較高,需要其具有一定的古籍整理知識(shí),因此這種方式并不是古籍錄入的理想方式。
掃描錄入一直是古籍電子化界追求的一種方式,但因其對(duì)古籍識(shí)別率不高,又沒有解決校對(duì)問(wèn)題,故很少采用,北京同文公司制作“文淵閣《四庫(kù)全書》”電子版是,與清華大學(xué)合作完善了OCR技術(shù),并
開發(fā)出與之配套的校對(duì)軟件“較得準(zhǔn)”、“較得精”、“較得快”,實(shí)現(xiàn)圖文對(duì)照,點(diǎn)擊改錯(cuò),大大降低了對(duì)校對(duì)者的要求,減輕了勞動(dòng)強(qiáng)度,錯(cuò)誤率大為減少。同文公司的這一嘗試意味著利用OCR技術(shù)
掃描錄入將成為一種重要的古籍錄入方式[3]。
電子古籍相對(duì)于傳統(tǒng)古籍最大的優(yōu)勢(shì)便是對(duì)古籍的檢索功能。古籍浩如煙海,一本本的翻閱尋找自己想要的史料是十分困難和浪費(fèi)時(shí)間的事情。而很多有價(jià)值的史料也會(huì)因?yàn)闄z索的不便而被遺漏。因此
檢索方便是電子古籍最基本的要求。
目前大多數(shù)電子化古籍都實(shí)現(xiàn)了任意字、詞和字符串的檢索(字庫(kù)中沒有而用組字方式構(gòu)造的字,一般不能檢索,故除外),但這只是最基本的;一些較好的則實(shí)現(xiàn)了按條件檢索,即按檢索范圍,檢索
單位及組合規(guī)則進(jìn)行檢索。臺(tái)灣的“漢籍電子文獻(xiàn)”系統(tǒng)與袁林的“二十五史”全文檢索系統(tǒng)較好,基本上實(shí)現(xiàn)了這些功能。[4]
2方志數(shù)字化
地方志是記載各個(gè)時(shí)期各個(gè)地區(qū)的的社會(huì)生活、歷史變遷、地理沿革、風(fēng)土人情等情況的書籍,是古籍的一種,但由于其特殊性,故單列出來(lái)敘述。
目前方志界存在的一個(gè)比較大的問(wèn)題即方志的保存與利用。對(duì)于這個(gè)問(wèn)題,現(xiàn)在通用的一個(gè)解決方法是制作古籍的影印版,通過(guò)影印微縮出版,這個(gè)方法可以有效的保存的古籍,但是影印版古籍大多價(jià)
格不菲,不利于古籍的傳播和資源的充分利用。因此,在計(jì)算機(jī)比較普及的今天,我們可以結(jié)合數(shù)字圖書館的成熟理論,提出一個(gè)初步建立專門性的數(shù)字圖書館的方案。
四、新時(shí)期對(duì)史學(xué)工作者的要求
近年來(lái),歷史劇、歷史講座通過(guò)廣播、電視、網(wǎng)絡(luò)等途徑得到廣泛的傳播,一些劇集、講座也確實(shí)受到了普通觀眾的歡迎。但是我們不難發(fā)現(xiàn),做這些工作的大多非專業(yè)歷史學(xué)者,由于專業(yè)上的隔膜,
他們?cè)趥鞑v史知識(shí)時(shí)并不能完全還原歷史的真相,甚至有人為了提高收視率和發(fā)行量,不惜歪曲歷史,誤導(dǎo)了觀眾對(duì)歷史的認(rèn)知。
隨著科學(xué)技術(shù)的進(jìn)步與發(fā)展,計(jì)算機(jī)網(wǎng)絡(luò)是目前為止最先進(jìn),普及型最廣的平臺(tái),歷史學(xué)家應(yīng)該學(xué)會(huì)利用這個(gè)有利的平臺(tái)幫助自己進(jìn)行歷史研究。而一般說(shuō)來(lái),學(xué)習(xí)人文學(xué)科的人似乎對(duì)科技都有抗拒的
傾向,但是正是科技正在推動(dòng)世界的進(jìn)步。因此,現(xiàn)代的歷史學(xué)家不僅要培養(yǎng)優(yōu)秀的研究歷史的素質(zhì),更要增強(qiáng)自己使用先進(jìn)工具即計(jì)算機(jī)的能力。
參考文獻(xiàn)
[1]焦?jié)櫭瘛⑼踅ㄩ骸墩摼W(wǎng)絡(luò)史學(xué)的研究對(duì)象及方法》,《遼寧大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)》,2010年第1期
[2]楊璇、朱開嶼:《中國(guó)數(shù)字博物館大事記》,《數(shù)字博物館發(fā)展的階段性???/p>
[3]張尚英:《古籍電子化問(wèn)題探析》2002年3月第30卷第2期
[4]王薈,肖禹:《數(shù)字方志建設(shè)與思考》