◎郝雪麗
(西華師范大學 四川 南充 637009)
1900年道士王圓箓在敦煌莫高窟藏經洞內發(fā)現(xiàn)了從十六國到北宋初期紙質或絹帛的寫本、繪畫與印刷文獻,多達五萬多件,隨后敦煌文獻流散各國,給研究者帶來極大的不便。隨著現(xiàn)代信息技術的應用及電子出版物的普及,大數據時代的文獻儲存方式逐漸向數字化發(fā)展,這也是未來敦煌文獻整理的趨勢。
敦煌文獻的整理工作在其發(fā)現(xiàn)之日就開始進行了,結合前代學者的研究[1],現(xiàn)在可將敦煌文獻的整理大致分為三個階段:第一個階段(1909-1960),此階段敦煌文獻的刊布與整理以學者抄錄為主。1909年,法國漢學家伯希和(Paul Pelliot,1878-1945)截獲敦煌遺書的第二年,在北京向羅振玉、蔣斧、王仁俊等學者展示了部分寫本,羅振玉在第二天便撰寫了《敦煌石室書目及發(fā)現(xiàn)之原始》。敦煌藏經洞的發(fā)現(xiàn)震驚中外,各國學者對敦煌文獻的編目工作也如火如荼展開[2-4]。第二階段(1960-2000)敦煌文獻的刊布與整理以縮微膠卷及影印圖版的出版為主。1957年前后,英國博物館制作的英藏敦煌文獻6980號縮微膠卷傳入中國,此后法國在七十年代亦公布了縮微膠卷,隨后各國陸續(xù)公布。隨著影印技術的進步,敦煌文獻圖版類出版物開始發(fā)行,如《敦煌寶藏》《英藏敦煌文獻》 《法藏敦煌西域文獻》 《俄藏敦煌文獻》《王重民向達所攝敦煌西域文獻照片合集》等,由于這些圖版部頭大,價格昂貴,因此流傳范圍不太廣泛。第三階段(2000年至今)以敦煌國際項目的建立為標志,敦煌文獻的刊布與整理進入了數字化時代。除了敦煌國際項目網,筆者所知的國內外敦煌文獻數據庫檢索平臺有近十家?,F(xiàn)就較完備、易使用的數字化平臺進行介紹。
敦煌國際項目(International Dunhuang Project,簡稱 IDP)的網址:http://idp.bl.uk/。1998年 10月IDP網站正式開通,用戶可以在網上進入IDP數據庫免費檢索,目前在IDP上公布敦煌文獻數據的機構有21家。在IPD“收集品”條目下可了解各國收藏信息及寫本圖版獲取方式,IDP的開放是敦煌文獻數字化工作的開端,是國際敦煌學研究的重要里程碑。該網站能獲取敦煌寫本的高清彩色圖版,其缺點在于公布的圖版部分卷背或正面空白的部分未提供,造成寫本信息的遺漏;還有就是IDP合作機構眾多,網絡不穩(wěn)定,查閱者有時無法獲得急需圖版。
敦煌文獻庫又稱敦煌文獻數字圖書館,網址:http://dunhuang.HanjiLibrary.com,由陜西師范大學出版總社開發(fā)制作,是《漢籍數字圖書館》2.0版的專庫之一,2016年上線,由敦煌文獻目錄數據庫和敦煌文獻圖版數據庫兩部分組成。該庫收錄14類機構所藏的敦煌文獻,其“文獻詳細信息”中包含文獻編號、文獻機構、文獻釋文、研究著錄、題記說明、規(guī)格品形等多項,目前僅可查到某一件寫本的所藏單位及其在相關圖版書中的具體頁碼,對寫本外部形態(tài)及內容描述還相當薄弱。
法國國家圖書館的數字圖書館項目Gallica是可在網上訪問的世界上最大的數字圖書館之一,網址:http://gallica.bnf.fr/。Gallica手稿部中可查閱的法藏敦煌文獻彩色圖版分為三類:一是伯希和漢文文獻(Pelliot chinois,簡稱 P.ch 或 P.);二是伯希和藏文文獻(Pelliot tibétain);三是伯希和其他收藏品(Pelliot autres collections),包括維吾爾文(ou?gour)、梵文(sanscrit)、粟特文(sogdien)、西夏文(xixia)等。Gallica是目前最為完備、最有誠意的敦煌文獻整理數字化平臺,部分寫本內容描述甚至精確到第幾行抄錄的內容。
2018年3月,法國國家圖書館藏敦煌文獻數字資源正式在中國國家圖書館網站“中華古籍資源庫”發(fā)布,該批資源吸收了法藏敦煌文獻共計5300余條,讀者可于中國國家圖書館網站在線進行檢索和全文瀏覽。
鼎秀古籍全文檢索平臺網址:http://www.dingxiu.com,其實現(xiàn)了全文檢索大型古籍典藏數據庫。鼎秀可以實現(xiàn)敦煌文獻原圖顯示、文本顯示、圖文并排顯示等不同顯示方法,不足之處在于收集的敦煌文獻不全面,不能顯示敦煌文獻收藏機構、編號、尺寸等基本信息。對于字跡模糊、書寫潦草的敦煌文獻,其文字信息錯誤較多。
“敦煌在中國,而敦煌學在世界”,莫高窟藏經洞內發(fā)現(xiàn)的敦煌文獻流散海外,乃中國學術之傷心史,但同時我們也應當關注到國際力量為保護敦煌文獻所付出的巨大努力。梁任公說“學術乃天下之公器”,在開放與共享為主題的大數據時代,國際敦煌文獻整理秉承合作共贏的態(tài)度,最終找到每一個寫本或寫本群在敦煌文獻中的位置,從而促進對古代中國、古代世界文明的研究。
目前敦煌數據庫建設已取得喜人成果,隨著科學技術的發(fā)展,我們還應該做到以下幾點:
其一,敦煌學的國際性決定了從事敦煌研究的學者需擁有國際視野,具備良好的與國際文獻接軌的能力。IDP和國外各大圖書館的數據庫雖支持中文訪問方式,但還不夠完善,要求訪問者具備較高的外語水平。
其二,利用現(xiàn)代攝影技術將長卷正反面完全掃描上網,展現(xiàn)寫本完整的正反面高清照片,便能夠省去保存敦煌文獻圖版時編號、拼合工作之勞。
其三,關注敦煌寫本與寫本之間的聯(lián)系,還原寫本時代敦煌文獻生成的原生態(tài)。在藏經洞發(fā)現(xiàn)時,敦煌寫本原有的秩序已經打亂,被各國收藏機構編上了毫無邏輯關系的序號。利用現(xiàn)代考古技術可對部分寫本的質地、年代進行還原與鑒別,通過對寫本的釋讀可聯(lián)系內容、年代相關寫本群,這些相關寫本群的信息在數據庫應當有所展現(xiàn)。
其四,數據庫在全面展示敦煌寫本全貌的同時,還需充分吸收、及時更新學界研究成果,包含準確的文獻目錄、錄文與???、單篇研究成果及綴合關系等。
建設學術價值更豐富、查閱更便捷、內容更全面的敦煌文獻數據庫是敦煌文獻數字化的方向,拙文為敦煌學徒一點學習心得,不妥之處,懇請方家指正。