內(nèi)容摘要:“數(shù)字史學(xué)”是歷史學(xué)科運(yùn)用計(jì)算機(jī)技術(shù)開展研究、教學(xué)與出版的新型學(xué)術(shù)組織模式,其創(chuàng)新性、跨學(xué)科、合作性的特征符合當(dāng)下出版史深化發(fā)展的內(nèi)在需求?!皵?shù)字史學(xué)”現(xiàn)階段的實(shí)踐可從材料、技術(shù)及方法論上為出版史研究提供新的發(fā)展路徑:開拓?cái)?shù)字時(shí)代的出版史料整理方式,依據(jù)紙本史料的編排邏輯開發(fā)檢索型和專題型出版史料數(shù)據(jù)庫(kù);同時(shí),結(jié)合歷史地理信息學(xué)和群體傳記學(xué)的相關(guān)理論,運(yùn)用GIS、關(guān)聯(lián)數(shù)據(jù)、可視化等技術(shù)工具開展空間研究和社會(huì)網(wǎng)絡(luò)研究,挖掘潛藏于出版史料中的時(shí)空信息和社會(huì)關(guān)系,發(fā)現(xiàn)長(zhǎng)時(shí)段、綜合性的現(xiàn)象及規(guī)律,在出版人物、出版群體及出版環(huán)境等研究方向上有所創(chuàng)新。在新技術(shù)和新理論的推動(dòng)下,學(xué)界有望在“數(shù)字史學(xué)”領(lǐng)域建構(gòu)“數(shù)字出版史學(xué)”,為出版史的學(xué)術(shù)實(shí)踐創(chuàng)設(shè)更具創(chuàng)造力和生產(chǎn)力的數(shù)字研究空間,開拓中國(guó)出版史研究的新境界。
關(guān)鍵詞: 數(shù)字史學(xué);出版史;史料數(shù)據(jù)庫(kù);空間分析;社會(huì)網(wǎng)絡(luò)分析
課題:國(guó)家社科基金重大項(xiàng)目“中國(guó)出版學(xué)學(xué)術(shù)史文獻(xiàn)整理、研究和資料庫(kù)建設(shè)”子課題“作為學(xué)科的新時(shí)代出版學(xué)研究”(編號(hào):21amp;ZD321)
DOI:10.3969/j.issn.2095-0330.2024.05.001
數(shù)字技術(shù)與人文學(xué)科的深度融合塑造了“數(shù)字人文”這一新型學(xué)術(shù)組織模式和跨學(xué)科合作形式,它改變了知識(shí)生產(chǎn)和知識(shí)分享的規(guī)則,也為人文學(xué)科帶來了新的思想活力和方法靈感。從歷史學(xué)科的視角對(duì)“數(shù)字人文”進(jìn)行界定,我們可將其視作數(shù)據(jù)科學(xué)在歷史研究中的應(yīng)用,由此,其可進(jìn)一步衍生出“數(shù)字史學(xué)”這一分支。目前,“數(shù)字史學(xué)”在國(guó)內(nèi)吸引了一批歷史學(xué)者圍繞其展開理論探討和實(shí)踐探索,它已不僅是一種供學(xué)者查詢和檢索的技術(shù)手段,更象征著一種傳統(tǒng)治學(xué)方式與數(shù)字技術(shù)關(guān)聯(lián)融通的開放態(tài)度。
開放外向的學(xué)科結(jié)構(gòu)可以激發(fā)出版史研究的內(nèi)在活力。在“數(shù)字史學(xué)”引發(fā)的學(xué)術(shù)熱潮和學(xué)科變革中,出版史研究如何擇善而從,提取、吸收可供參照的方法和理論,為深化出版史學(xué)科發(fā)展注入技術(shù)動(dòng)力,是一個(gè)值得深思的問題。因此,本文立足于國(guó)內(nèi)“數(shù)字史學(xué)”和出版史研究的發(fā)展現(xiàn)狀,借鑒相鄰學(xué)科的實(shí)踐經(jīng)驗(yàn),從史料整理、技術(shù)工具和研究方法論3個(gè)層面論證出版史研究借重“數(shù)字史學(xué)”的合理路徑。
一、“數(shù)字史學(xué)”:技術(shù)催生史學(xué)變革
20世紀(jì)60年代,計(jì)量史學(xué)的興起被視為數(shù)字史學(xué)的先聲。1997年,美國(guó)弗吉尼亞大學(xué)(Universityof Virginia)成立“弗吉尼亞數(shù)字史學(xué)中心”(Virginia Center for Digital History),正式提出“Digital History”。2013年,周兵在國(guó)內(nèi)引入“數(shù)字史學(xué)”概念,指代運(yùn)用數(shù)字媒體和工具展開的歷史學(xué)實(shí)踐、演示、分析和研究。
整體而言,“數(shù)字史學(xué)”為歷史文獻(xiàn)的存儲(chǔ)和歷史問題的分析搭建起不同于以往的數(shù)字環(huán)境,在史學(xué)領(lǐng)域帶來3個(gè)層面的革新。一是建成多種綜合型和專題型歷史文獻(xiàn)數(shù)據(jù)庫(kù),為學(xué)者整理與檢索史料提供便捷的數(shù)字化服務(wù)。二是提供綜合分析的數(shù)字平臺(tái),支持學(xué)者運(yùn)用算法模型、計(jì)算系統(tǒng)對(duì)海量史料進(jìn)行數(shù)據(jù)化處理和可視化呈現(xiàn),開拓史料解讀的多維視角。如今,“數(shù)字史學(xué)”緊隨環(huán)境史、新文化史等新興史學(xué)的發(fā)展趨勢(shì),不斷推進(jìn)變革的深度,逐漸走向第3層面的革新——嘗試建構(gòu)解釋框架,迎來范式轉(zhuǎn)換,展現(xiàn)現(xiàn)代技術(shù)對(duì)傳統(tǒng)歷史學(xué)科的深刻影響力和塑造力。王濤指出,“數(shù)字史學(xué)”作為“解釋框架”的一種可能性在于:其通過發(fā)現(xiàn)和分析事物之間的鏈接來解釋歷史的演進(jìn),尤其是挖掘那些隱藏在海量史料中,通過傳統(tǒng)查閱手段難以發(fā)掘的潛在因果關(guān)系。這種“鏈接”的思維在中國(guó)歷代人物傳記資料庫(kù)(以下簡(jiǎn)稱“CBDB”)的建設(shè)和使用過程中已漸有體現(xiàn)。該數(shù)據(jù)庫(kù)是結(jié)合關(guān)聯(lián)數(shù)據(jù)技術(shù),開展群體傳記學(xué)研究的平臺(tái)典范,能夠幫助學(xué)者探尋研究對(duì)象的職業(yè)走向、親屬關(guān)系和社會(huì)交往網(wǎng)絡(luò)。以北宋時(shí)期的歐陽(yáng)修和龐籍為例,二人的關(guān)系在史料中鮮有提及,但是當(dāng)與二人有關(guān)的墓志銘、傳記等資料被錄入CBDB后,CBDB利用系統(tǒng)的數(shù)據(jù)編排技術(shù)便能快速發(fā)現(xiàn)二人的親屬關(guān)系以及歐陽(yáng)修的其他數(shù)百個(gè)血親姻親。近年來,史學(xué)界運(yùn)用這個(gè)數(shù)據(jù)庫(kù)開展了多項(xiàng)學(xué)術(shù)實(shí)踐,例如探討唐宋政治精英的聯(lián)姻網(wǎng)絡(luò)、宋元地方家族的學(xué)術(shù)交往、中國(guó)佛教史上的關(guān)鍵人物、近代中國(guó)官僚體制內(nèi)部的權(quán)力分配等,研究涉及政治史、社會(huì)史、宗教史等多個(gè)領(lǐng)域。
隨著不同歷史子學(xué)科嘗試邁入“ 數(shù)字軌道”,出版史自身的學(xué)科屬性和研究取徑是否也應(yīng)吸收“數(shù)字史學(xué)”激起的學(xué)術(shù)思潮,進(jìn)入“數(shù)字史學(xué)”的觀照空間之中?答案應(yīng)該是肯定的。目前已有學(xué)者從學(xué)理層面探討過出版史與數(shù)字技術(shù)的結(jié)合。周蔚華在論述出版史研究的方法論時(shí)提及大數(shù)據(jù)分析技術(shù)可以為出版史研究提供十分有用的輔助工具:“有了大數(shù)據(jù)分析技術(shù),我們就可以對(duì)海量的、長(zhǎng)時(shí)間段的出版史料進(jìn)行跨時(shí)空、多角度、綜合性分析,極大地提升出版史研究的科學(xué)性?!苯袨閯t論證過利用大數(shù)據(jù)技術(shù)開展清末科學(xué)翻譯出版史研究的優(yōu)勢(shì),認(rèn)為大數(shù)據(jù)的運(yùn)用將有助于創(chuàng)新科學(xué)出版史的研究方法,提高科學(xué)出版史的人文關(guān)懷價(jià)值。
出版史研究雖以過去的出版活動(dòng)為研究對(duì)象,但也不能因此忽視現(xiàn)代數(shù)字技術(shù)重塑研究范式的可能性。馬克·布洛赫(Marc Bloch)曾言:“古今之間的關(guān)系是雙向的,對(duì)現(xiàn)實(shí)一無(wú)所知的人,要了解歷史也必定徒勞無(wú)功?!蓖瑫r(shí),“數(shù)字史學(xué)”作為一種新型史學(xué)研究形態(tài),依托于信息技術(shù),鼓勵(lì)歷史學(xué)者打破學(xué)科界限和話語(yǔ)壟斷,在歷史研究中實(shí)現(xiàn)開放性、去中心化和跨學(xué)科合作,這正好吻合了當(dāng)下出版史學(xué)科尋求研究創(chuàng)新、完善學(xué)科結(jié)構(gòu)、實(shí)現(xiàn)文理相融的發(fā)展需求。那么,“數(shù)字史學(xué)”能為中國(guó)出版史的研究創(chuàng)新帶來哪些可能性?對(duì)此,筆者將基于數(shù)字技術(shù)推動(dòng)史學(xué)變革的3個(gè)層面,進(jìn)一步探討能與中國(guó)出版史研究相互契合的技術(shù)軌道和方法論路徑。
二、基于史料存儲(chǔ)的數(shù)字化建設(shè)
中國(guó)史學(xué)界自古有為書籍編目、制作索引和工具書、整理和匯編地方著述的學(xué)術(shù)傳統(tǒng),史學(xué)研究衍生出藝文志、類書、志書這一類文獻(xiàn),形成了以“辨章學(xué)術(shù),考鏡源流”為學(xué)問的目錄學(xué)。20世紀(jì)初期,胡適、傅斯年、陳垣等學(xué)者呼吁開展史料的搜尋與整理工作。1 9 2 9年,陳垣在燕京大學(xué)作題為“中國(guó)史料亟待整理”的演講,提及近代西方印書、打字機(jī)械的發(fā)達(dá),指出唯有替代讀書的機(jī)器還沒有發(fā)明出來。陳垣認(rèn)為:“我們雖然不能以機(jī)器代替我們讀書,我們盡可以改良讀書的方法,整理研究的材料,使以最經(jīng)濟(jì)的時(shí)間得最高效能,正如我們中國(guó)現(xiàn)在雖然不能全筑起鐵路來,盡可以先修成公路馬路一樣?!边@番言論表明了一位歷史學(xué)家在國(guó)家陷于技術(shù)窘境之時(shí)對(duì)機(jī)械技術(shù)的憧憬,其希望通過整理史料來改良讀書方法,提升治學(xué)能效。陳垣將當(dāng)時(shí)的史料整理工作比喻成“修建公路馬路”。如今百年將過,隨著數(shù)字技術(shù)的飛速發(fā)展,我們能夠在整理研究材料的范疇中實(shí)現(xiàn)陳垣曾經(jīng)設(shè)想過的“鐵路愿景”——建設(shè)歷史數(shù)據(jù)庫(kù)(堪稱“數(shù)字高鐵”)。
可見,歷史文獻(xiàn)的數(shù)字化存儲(chǔ)其實(shí)與傳統(tǒng)的史學(xué)觀念和治學(xué)思路一脈相承,只是在方法上有進(jìn)一步的改良,人工編排進(jìn)化為人機(jī)合作。申斌和楊培娜指出,典藏檢索型數(shù)據(jù)庫(kù)便是依照實(shí)證史學(xué)的傳統(tǒng)和紙本史料的整理習(xí)慣設(shè)計(jì)開發(fā)的,例如以中華書局點(diǎn)校本“二十四史”為文獻(xiàn)來源建設(shè)的中華經(jīng)典古籍庫(kù),還有收錄了中國(guó)歷代總志、通志、府州志和縣志的中國(guó)數(shù)字方志庫(kù),等等。
出版史的研究工作者對(duì)于利用數(shù)據(jù)庫(kù)檢索文獻(xiàn)定然不會(huì)陌生。吳永貴在編著《民國(guó)圖書出版史編年:1912—1949》時(shí)便是采取了傳統(tǒng)查閱與數(shù)字檢索相結(jié)合的方式開展文獻(xiàn)輯錄工作?!氨境晒妨现詴?huì)做到比前人更加豐富、精確,實(shí)大大得益于現(xiàn)代網(wǎng)絡(luò)檢索手段提供的強(qiáng)大技術(shù)支持?!狈盾娫诰幾搿吨袊?guó)出版文化史研究書錄》時(shí),也充分利用了數(shù)字技術(shù)與網(wǎng)絡(luò)資源。從學(xué)者的親身實(shí)踐中,我們可以看到現(xiàn)代技術(shù)在出版史料整理工作中發(fā)揮的具體功能:一是提升史料檢索的效率;二是擴(kuò)大史料的查閱范圍,挖掘新史料和稀缺史料;三是實(shí)現(xiàn)多種史料文本的比對(duì),提升史料的精確性,輔助史實(shí)的考據(jù)。
但是,出版史學(xué)界目前尚未形成服務(wù)于自身的獨(dú)立數(shù)據(jù)庫(kù),學(xué)者開展研究往往需要借助其他大型綜合數(shù)據(jù)庫(kù)或者相鄰學(xué)科的數(shù)據(jù)庫(kù),在這個(gè)過程中難免會(huì)出現(xiàn)檢索字段的不匹配或者史料的遺漏。因此,隨著“數(shù)字史學(xué)”不斷推進(jìn)和完善歷史數(shù)據(jù)庫(kù)的建設(shè),出版史學(xué)界應(yīng)當(dāng)進(jìn)一步設(shè)計(jì)符合自身研究取徑、切合出版史料整理邏輯的數(shù)據(jù)庫(kù),如此既能為學(xué)者提供更多精準(zhǔn)的、專業(yè)的知識(shí)服務(wù),亦能呼應(yīng)出版史料學(xué)的發(fā)展,這是完善出版史學(xué)科結(jié)構(gòu)的必然要求。具體的建設(shè)路徑可以參鑒兩種類型數(shù)據(jù)庫(kù)的設(shè)計(jì)思路,一種是依托紙本史料編排邏輯而打造的檢索型數(shù)據(jù)庫(kù),另一種則是根據(jù)具體研究主題而設(shè)計(jì)的專題型數(shù)據(jù)庫(kù)。
(一)建設(shè)檢索型出版史料數(shù)據(jù)庫(kù)
保管、分析、編輯和建模是數(shù)字人文的核心基礎(chǔ)活動(dòng)。保管即資料的存儲(chǔ),范圍可涵蓋檔案、館藏紙本、資源庫(kù)等文字資料。歷史數(shù)據(jù)庫(kù)在研發(fā)初期以存儲(chǔ)史料、索引文獻(xiàn)為目標(biāo),研發(fā)者結(jié)合文獻(xiàn)類型及學(xué)科領(lǐng)域?qū)κ妨线M(jìn)行數(shù)字化編排,進(jìn)而建成基礎(chǔ)的檢索型數(shù)據(jù)庫(kù)。例如為文獻(xiàn)學(xué)研究提供服務(wù)的大成古籍庫(kù),主要收錄南宋至民國(guó)時(shí)期正式出版過的書籍文獻(xiàn);上海圖書館依靠豐富的文獻(xiàn)館藏打造的“全國(guó)報(bào)刊索引”線上平臺(tái),既涵蓋了《晚清期刊全文數(shù)據(jù)庫(kù)(1833—1911)》《民國(guó)時(shí)期期刊全文數(shù)據(jù)庫(kù)(1911—1949)》等全文庫(kù),也設(shè)有《晚清期刊篇名數(shù)據(jù)庫(kù)(1833—1911)》《現(xiàn)刊索引數(shù)據(jù)庫(kù)(1833年至今)》等索引庫(kù)。
檢索型數(shù)據(jù)庫(kù)的開發(fā)流程相對(duì)簡(jiǎn)單,設(shè)計(jì)邏輯一般是直接收錄版本質(zhì)量較高的紙本文獻(xiàn),將其影印和進(jìn)行數(shù)字化呈現(xiàn),并按照一定的學(xué)科分類方法進(jìn)行編排和整合。于出版史學(xué)科而言,傳統(tǒng)的紙質(zhì)史料整理工作已經(jīng)取得一批成果。張靜廬于20世紀(jì)50年代整理和輯注了《中國(guó)近現(xiàn)代出版史料》(全7編8冊(cè));21世紀(jì)初,宋原放主編,汪家熔、方厚樞、陳江等輯注了《中國(guó)出版史料》(全10冊(cè),后有補(bǔ)編多冊(cè));2008年,北京圖書館出版社出版《民國(guó)出版發(fā)行史料匯編》(全20冊(cè),另有補(bǔ)編20余冊(cè));2013年,吳永貴主編了《民國(guó)時(shí)期出版史料匯編》(全22冊(cè));等等。下一步,結(jié)合“數(shù)字史學(xué)”的史料整理方法,出版史學(xué)界可嘗試將已匯編成型的出版史料叢刊進(jìn)行數(shù)字化處理,搭建高質(zhì)量、檢索型的出版史料數(shù)據(jù)庫(kù),依照紙本史料的整理體裁和分類方式進(jìn)一步細(xì)分出文本型數(shù)據(jù)庫(kù)、圖文型數(shù)據(jù)庫(kù)和圖像型數(shù)據(jù)庫(kù),將出版史料的紙質(zhì)出版和數(shù)字出版相結(jié)合,形成線上線下一體化的知識(shí)服務(wù)體系。
(二)建設(shè)專題型出版史料數(shù)據(jù)庫(kù)
專題型數(shù)據(jù)庫(kù)依據(jù)一定的研究旨趣和選題需求重新整合史料,其搜集形式體現(xiàn)出更為明確的主題性,能夠提升檢索的精準(zhǔn)度,其編排邏輯也能在一定程度上延展研究思路。在社會(huì)經(jīng)濟(jì)史領(lǐng)域,王業(yè)鍵帶領(lǐng)的團(tuán)隊(duì)自20世紀(jì)90年代開始建設(shè)清代糧價(jià)數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)現(xiàn)已成為經(jīng)濟(jì)史研究的基礎(chǔ)數(shù)字設(shè)施;前文提及的CBDB收錄了52萬(wàn)多位中國(guó)古代人物的歷史文獻(xiàn),為群體傳記學(xué)及相關(guān)人物研究提供了數(shù)據(jù)支持和分析平臺(tái);另有中國(guó)社會(huì)科學(xué)院近代史研究所主持建設(shè)的“抗日戰(zhàn)爭(zhēng)與近代中日關(guān)系文獻(xiàn)數(shù)據(jù)平臺(tái)”,以抗日戰(zhàn)爭(zhēng)的相關(guān)文獻(xiàn)為搜集主題,服務(wù)于抗日戰(zhàn)爭(zhēng)史、近代中日關(guān)系史的研究。
出版史學(xué)界可借鑒這種專題型數(shù)據(jù)庫(kù)的設(shè)計(jì)思路,在建設(shè)檢索型數(shù)據(jù)庫(kù)的基礎(chǔ)上,進(jìn)一步編排和整合出版家的傳記、書信集、作品集、年譜等類型史料,依據(jù)人物研究的史料需求優(yōu)化數(shù)據(jù)庫(kù)建設(shè),創(chuàng)建以人物為主題的出版家數(shù)據(jù)庫(kù);或聯(lián)合一些歷史悠久的大型出版企業(yè),開發(fā)以出版機(jī)構(gòu)為主題的民國(guó)出版企業(yè)數(shù)據(jù)庫(kù)。
在推進(jìn)出版史料數(shù)字化的過程中,還需注意3個(gè)問題:
第一,增強(qiáng)“設(shè)計(jì)”的自覺意識(shí)。設(shè)計(jì)是一種利用文化、社會(huì)、經(jīng)濟(jì)和技術(shù)約束而進(jìn)行的創(chuàng)造性實(shí)踐。在從事數(shù)據(jù)庫(kù)的開發(fā)時(shí),設(shè)計(jì)不僅是一項(xiàng)技術(shù)工作,同樣也是一種思維方式。出版史研究者應(yīng)嘗試從數(shù)據(jù)庫(kù)的使用者轉(zhuǎn)變?yōu)樵O(shè)計(jì)者,積極參與數(shù)字研究空間的研發(fā):一方面,要結(jié)合研究選題提出明確的研發(fā)思路;另一方面,要掌握相關(guān)領(lǐng)域的共同術(shù)語(yǔ),成為主導(dǎo)數(shù)據(jù)庫(kù)“工程圖”的思維設(shè)計(jì)師,與技術(shù)設(shè)計(jì)師達(dá)成高效合作。
第二,培養(yǎng)專業(yè)的史料學(xué)理論素養(yǎng)。參與開發(fā)史料數(shù)據(jù)庫(kù)的工作者對(duì)于史料的理解和掌握,會(huì)直接影響到數(shù)據(jù)庫(kù)的呈現(xiàn)形態(tài)和實(shí)際質(zhì)量。因此有學(xué)者認(rèn)為,數(shù)據(jù)庫(kù)建設(shè)的第一步并非數(shù)字技術(shù)的介入,而是對(duì)史料的文獻(xiàn)學(xué)研究,以及對(duì)相關(guān)研究問題的總體把握。而在做好出版史料發(fā)掘、整理和刊刻的基礎(chǔ)上,重視出版史料學(xué)的建設(shè)也是深化中國(guó)出版史研究的一個(gè)重要著力點(diǎn)。
第三,認(rèn)清史料形式對(duì)研究思維的影響。羅杰·夏蒂埃(Roger Chartier)在看待書籍的技術(shù)變革時(shí)采用了一種辯證的觀點(diǎn)。他認(rèn)為,人類歷史上的思維形象和智力活動(dòng)與傳統(tǒng)的紙本形式緊密相連,而文本的數(shù)字化則意味著這種形象與活動(dòng)的疏離?!懊恳环N形式,每一種載體,每一種傳播和接受文字的結(jié)構(gòu)都會(huì)深深影響其用法和闡釋。”而史料的不同形式亦會(huì)影響學(xué)者對(duì)具體問題的分析思路和闡釋角度。因此,既要推進(jìn)史料的數(shù)字化進(jìn)程,也不可舍棄對(duì)紙質(zhì)史料的傳統(tǒng)整理工作,只有將兩種路徑相結(jié)合,才能最大程度發(fā)揮史料的應(yīng)用價(jià)值。
三、基于海量文獻(xiàn)的可視化分析
在史料存儲(chǔ)實(shí)現(xiàn)數(shù)字化后,只有運(yùn)用技術(shù)工具對(duì)史料進(jìn)行綜合分析,尋找新的研究問題與解讀視角,才能迎來“數(shù)字史學(xué)”的第二層革新。計(jì)算分析的過程通常會(huì)結(jié)合可視化呈現(xiàn),這使分析結(jié)果更為形象易讀。如今,知識(shí)圖譜、關(guān)聯(lián)數(shù)據(jù)、GIS(地理信息系統(tǒng))等信息技術(shù)正不斷深入“數(shù)字史學(xué)”領(lǐng)域,為出版史研究提供了一些可供參考的技術(shù)工具和分析平臺(tái)??臻g分析和社會(huì)網(wǎng)絡(luò)分析理論能進(jìn)一步延展出版史研究的思路與視角,從方法論的角度促成出版史研究的“去熟悉化”。
(一)空間分析:挖掘出版史研究中隱藏的時(shí)空信息
GIS技術(shù)具備采集、存儲(chǔ)、管理、運(yùn)算和分析地理信息的強(qiáng)大功能,常被用于歷史問題中涉及時(shí)空信息的挖掘,歷史地理信息學(xué)也因此成為跨學(xué)科合作的范例。歷史地理信息化的理論支點(diǎn)來源于沃爾多·R.托布勒(Waldo R. Tobler)提出的“地理學(xué)第一定律”:任何事物都是相互聯(lián)系的,相鄰事物之間的聯(lián)系更為緊密。地理空間的相互影響說明了歷史研究中時(shí)空信息的特殊意義。學(xué)者在引入地理信息科學(xué)、統(tǒng)計(jì)學(xué)的研究方法后,再運(yùn)用GIS技術(shù)將原來分散在文本中的時(shí)空信息進(jìn)行整合和可視化。例如李明杰和楊璐嘉以明代雕版印刷的古籍版本資源為目標(biāo)對(duì)象,運(yùn)用GIS技術(shù)和相關(guān)的組件對(duì)象平臺(tái)設(shè)計(jì)了明代古籍版刻信息數(shù)據(jù)庫(kù),呈現(xiàn)了明代古籍版刻的空間分布情況及時(shí)空變遷的信息。
在書籍史領(lǐng)域,歷史地理信息化和空間分析具有廣闊的研究前景。歷史上書籍的生產(chǎn)、刻印、傳播與收藏常會(huì)涉及地理空間的轉(zhuǎn)移和變遷。包筠雅(Cynthia Joanne Brokaw)在考察清末民初福建四堡的書籍貿(mào)易史時(shí),發(fā)現(xiàn)出版商人會(huì)雇用一些流動(dòng)的刻印工匠。戴思哲(Joseph Dennis)在探究明代地方志的刊印時(shí)亦發(fā)現(xiàn)了同樣的現(xiàn)象。北京、邯鄲、江西、南京、建陽(yáng)及一些江南地區(qū)的刻工經(jīng)?;钴S于本省及外地的方志出版業(yè)中,他們的工作區(qū)域是動(dòng)態(tài)的,連接著不同的城市,涉及不同的地理位置,人們?nèi)魧?duì)這些信息進(jìn)行統(tǒng)計(jì)和分析,就有可能辨認(rèn)出一些從前鮮為人知的區(qū)域性刊印中心。羅寶川使用地方志數(shù)字研究工具LoGaRT生成了清代官學(xué)藏書樓地理信息的可視化圖景,探究其空間分布的特征及成因。楊璐嘉運(yùn)用文化地理學(xué)的相關(guān)理論,借助GIS可視化技術(shù)分析古代私家藏書樓的地理空間數(shù)據(jù),從宏觀層面對(duì)藏書史的時(shí)空分布特征予以總結(jié)和補(bǔ)充。
中國(guó)出版史研究亦可嘗試運(yùn)用數(shù)字技術(shù)對(duì)涉及地理信息和空間演變的出版機(jī)構(gòu)、出版事件進(jìn)行史實(shí)的考證和可視化呈現(xiàn)。例如在研究亞東圖書館時(shí),朱莉等結(jié)合文獻(xiàn)記載使用無(wú)人機(jī)等現(xiàn)代技術(shù)考證了亞東圖書館編輯所與發(fā)行所的舊址。陳思航也使用搜索引擎、AI人臉識(shí)別等技術(shù)手段進(jìn)行史料搜集和史實(shí)考據(jù)。
(二)網(wǎng)絡(luò)分析:探尋出版史研究中潛在的因果關(guān)系
紙本文獻(xiàn)通過計(jì)算機(jī)數(shù)據(jù)化處理后,便具備了“原子化”的特性。不同于紙本文獻(xiàn)一旦編排出版就無(wú)法調(diào)整,數(shù)位化后的資料能將文獻(xiàn)中的原始脈絡(luò)進(jìn)行重組,進(jìn)而產(chǎn)生多重脈絡(luò)。這時(shí),關(guān)聯(lián)數(shù)據(jù)技術(shù)便有了用武之地。關(guān)聯(lián)數(shù)據(jù)技術(shù)的優(yōu)勢(shì)在于將零散的、異構(gòu)的數(shù)據(jù)進(jìn)行關(guān)聯(lián)組織,展示數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,為進(jìn)一步面向內(nèi)容和知識(shí)的挖掘奠定基礎(chǔ)。研究者通過關(guān)聯(lián)數(shù)據(jù)技術(shù)重組史料脈絡(luò),便有可能編織出在傳統(tǒng)紙本中難以尋覓到的某一事件或人物關(guān)系網(wǎng)絡(luò),進(jìn)而發(fā)現(xiàn)新的歷史現(xiàn)象。
關(guān)聯(lián)數(shù)據(jù)技術(shù)與社會(huì)網(wǎng)絡(luò)分析法的結(jié)合是“數(shù)字史學(xué)”開展的又一項(xiàng)學(xué)術(shù)實(shí)踐。社會(huì)網(wǎng)絡(luò)分析結(jié)合了心理學(xué)和社會(huì)人類學(xué)的學(xué)科特點(diǎn),在研究中重視人際關(guān)系和社會(huì)結(jié)構(gòu)的探討,為群體研究提供了理論支持,從而延伸出“群體傳記學(xué)”(Prosopography)這一研究領(lǐng)域。群體傳記學(xué)一般采取歸納法,傳記學(xué)家在明確有待研究的目標(biāo)群體后,收集關(guān)于這個(gè)群體的統(tǒng)一觀測(cè)數(shù)據(jù),例如生卒年、家庭背景、教育背景、職業(yè)情況等,再通過數(shù)據(jù)分析對(duì)目標(biāo)群體的相關(guān)特征進(jìn)行概括。李中清(James Lee)—康文林(Cameron Campbell)研究團(tuán)隊(duì)依托民國(guó)時(shí)期大學(xué)的學(xué)籍檔案和學(xué)生名冊(cè)搭建了民國(guó)大學(xué)生量化數(shù)據(jù)庫(kù),幫助學(xué)者探究民國(guó)時(shí)期大學(xué)生群體的社會(huì)階層、宗教信仰、專業(yè)選擇、就業(yè)去向等相關(guān)信息;沈立力等運(yùn)用上海圖書館“人名規(guī)范庫(kù)”等數(shù)據(jù)庫(kù)和“歷史人文大數(shù)據(jù)平臺(tái)”,從人物、地點(diǎn)、事件、共同體等維度搭建了近代報(bào)人群體的關(guān)系圖譜,可視化呈現(xiàn)其先賦性關(guān)系網(wǎng)絡(luò)、業(yè)緣網(wǎng)絡(luò)和自獲性關(guān)系網(wǎng)絡(luò),挖掘隱藏在近代報(bào)人群體內(nèi)部的信息特征和規(guī)律;另有李惠等基于歷史人物的書信檔案,從時(shí)間維度建立了古代書信網(wǎng)絡(luò)模型,設(shè)計(jì)了信聯(lián)活躍度和節(jié)點(diǎn)刷新率等網(wǎng)絡(luò)度量概念,以便動(dòng)態(tài)考察歷史人物的社會(huì)交際行為,充分挖掘書信的史料價(jià)值。
民國(guó)出版業(yè)的地緣網(wǎng)絡(luò)和人情網(wǎng)絡(luò)涉及出版業(yè)與政界、文化界的多重互動(dòng),出版企業(yè)的經(jīng)營(yíng)管理和制度建設(shè),企業(yè)內(nèi)部管理者的權(quán)力博弈,出版從業(yè)者之間的人情往來等多方面的問題。隨著出版史研究日趨向微觀史、生活史的領(lǐng)域延展和深化,研究者若能借助關(guān)聯(lián)數(shù)據(jù)技術(shù)對(duì)歷史上出版從業(yè)者的親屬關(guān)系和社會(huì)關(guān)系進(jìn)行深度挖掘,就有可能激活和形塑更為多元復(fù)雜的人物網(wǎng)絡(luò)和出版業(yè)態(tài),發(fā)現(xiàn)新的觀察視角和研究命題。對(duì)出版家的日記、書信、傳記和年譜進(jìn)行數(shù)據(jù)化處理,亦能形成不同線索的群體傳記網(wǎng)絡(luò),其既可用來開展以人際交往為中心的人物研究,也可支持有共同背景特征的群體研究。
以出版家張?jiān)獫?jì)為例,關(guān)于張?jiān)獫?jì)的史料十分豐富,除了其本人的日記、書信集、詩(shī)文集,還有許多關(guān)于他本人的零散史料,它們可能散布在商務(wù)印書館的檔案中,或其他相關(guān)人物的書信、日記、回憶錄里,研究者若通過關(guān)聯(lián)數(shù)據(jù)技術(shù)對(duì)張?jiān)獫?jì)的零散史料進(jìn)行重新編排和整合,便能對(duì)其地緣網(wǎng)絡(luò)、人際網(wǎng)絡(luò)有一個(gè)更為清晰全面的認(rèn)知,可能會(huì)有新的發(fā)現(xiàn)。目前,已有學(xué)者開始嘗試對(duì)《張?jiān)獫?jì)全集》《張?jiān)獫?jì)書札》中涉及人情交往、書信往來的史料信息進(jìn)行數(shù)據(jù)提取,運(yùn)用超圖搭建“收信人—寄信人”網(wǎng)絡(luò)、“共同寄件人”網(wǎng)絡(luò)及“聯(lián)合寄件人”網(wǎng)絡(luò),以此了解張?jiān)獫?jì)更為潛在的公共交往情況。
關(guān)于“數(shù)字史學(xué)”技術(shù)工具的詳細(xì)介紹見表1。
四、理論與方法: 建構(gòu)“ 數(shù)字出版史學(xué)”
20世紀(jì)30年代,陳寅恪在談及“古今學(xué)術(shù)史之通義”時(shí)有言:“一時(shí)代之學(xué)術(shù),必有其新材料與新問題。取用此材料,以研究問題,則為此時(shí)代學(xué)術(shù)新潮流?!痹摃r(shí)期甲骨文、敦煌寫卷、漢晉木簡(jiǎn)等古代史料相繼出土,學(xué)者從中發(fā)現(xiàn)新的研究課題,提出相應(yīng)的研究方法,推動(dòng)了近代史學(xué)思潮的發(fā)展。在數(shù)字時(shí)代,史料從存儲(chǔ)形式和可視化分析的角度也能被視為一種“新材料”,有望促成新問題的發(fā)現(xiàn)和新潮流的出現(xiàn)。
建議研究者基于現(xiàn)有的研究成果,在“數(shù)字史學(xué)”的方法論指導(dǎo)下,參考文獻(xiàn)學(xué)、經(jīng)濟(jì)史、社會(huì)史、歷史地理學(xué)等領(lǐng)域的研究工具和方法路徑, 推動(dòng)出版史研究邁入“ 技術(shù)軌道”,這項(xiàng)工作可從材料整理、分析手段和理論引介3個(gè)層面分別發(fā)力:第一,建設(shè)檢索型和專題型出版史料數(shù)據(jù)庫(kù),創(chuàng)新數(shù)字時(shí)代出版史料的整理方法;第二,借助GIS、關(guān)聯(lián)數(shù)據(jù)、可視化等技術(shù)對(duì)出版史料進(jìn)行脈絡(luò)重組和綜合分析;第三,引入社會(huì)網(wǎng)絡(luò)分析、歷史地理信息化的相關(guān)理論和研究方法,深入挖掘出版史研究中潛藏的時(shí)空信息以及出版家、出版群體的潛在關(guān)系網(wǎng)絡(luò)。
不可否認(rèn)的是,當(dāng)下出版史研究與數(shù)字技術(shù)的結(jié)合仍處于初步探索的階段,學(xué)者開展研究大多停留在“數(shù)字史學(xué)”的第一個(gè)層面——運(yùn)用基礎(chǔ)的檢索工具查閱史料。同時(shí)筆者也注意到,有研究者對(duì)西南聯(lián)大多部人物日記進(jìn)行數(shù)字化的文本聯(lián)合挖掘,雖有一定新意,但又明顯存在關(guān)鍵性的學(xué)理問題,其被數(shù)據(jù)所碾壓而顯得異常扁平化,帶給人們的新見與啟示并不是太多。這樣似新而實(shí)舊的問題也同樣可能出現(xiàn)在出版人物社會(huì)網(wǎng)絡(luò)分析的數(shù)字化中。
數(shù)字人文的收益無(wú)法僅從數(shù)字技術(shù)或傳統(tǒng)方法的單一途徑中獲得。因此,我們對(duì)數(shù)字技術(shù)既要有敢為人先的嘗試,亦要堅(jiān)守人文學(xué)科的本質(zhì)。我們?nèi)灾鲝堃猿霭鎸W(xué)理論為指導(dǎo),在數(shù)字研究環(huán)境中繼續(xù)吸納書籍史、新文化史、知識(shí)社會(huì)史等其他學(xué)科的研究理論與方法,設(shè)計(jì)適合出版史學(xué)科邏輯的技術(shù)工具,在實(shí)際研究中堅(jiān)持問題的學(xué)理性和論證的科學(xué)性。
經(jīng)過長(zhǎng)期的積累與探索,我們或許可以在“數(shù)字史學(xué)”領(lǐng)域建構(gòu)“數(shù)字出版史學(xué)”——在材料、方法及理論層面創(chuàng)設(shè)出版史的數(shù)字研究空間,鼓勵(lì)學(xué)者積極運(yùn)用計(jì)算機(jī)技術(shù)開展出版史的學(xué)術(shù)實(shí)踐,開拓出中國(guó)出版史研究的新境界。
“數(shù)字出版史學(xué)”的研究空間至少要由3個(gè)要素構(gòu)成:出版史料數(shù)據(jù)庫(kù)、綜合分析平臺(tái)、支撐研究的方法論。數(shù)據(jù)庫(kù)建設(shè)能夠幫助收錄和整合海量的出版史料,是推動(dòng)“數(shù)字出版史學(xué)”研究進(jìn)程的基礎(chǔ)環(huán)節(jié)。在開拓出版史料的數(shù)字化整理途徑后,要根據(jù)研究訴求進(jìn)一步聯(lián)合相關(guān)的統(tǒng)計(jì)分析系統(tǒng)開展數(shù)據(jù)挖掘,將經(jīng)過數(shù)字化編排的史料導(dǎo)入綜合分析平臺(tái),利用統(tǒng)計(jì)和定量的分析方法對(duì)目標(biāo)文獻(xiàn)分別進(jìn)行近距閱讀和遠(yuǎn)距閱讀。近距閱讀源自人文學(xué)研究的語(yǔ)言學(xué)傳統(tǒng),要求學(xué)者理解文本的內(nèi)涵、版本及歷史,并能對(duì)內(nèi)容作出深度解讀。遠(yuǎn)距閱讀則是數(shù)字時(shí)代的一種新型研究方式,研究者運(yùn)用計(jì)算機(jī)的自然語(yǔ)言處理能力從海量文本中抽取要旨、歸納總結(jié),有可能發(fā)現(xiàn)一些大范圍、長(zhǎng)時(shí)段的模式、關(guān)系與規(guī)律。同時(shí),結(jié)合兩種閱讀方式解讀史料有利于在研究中聯(lián)結(jié)起“目光向上”的宏觀視角與“眼光向下”的微觀史。特別是在過去的研究中,政治史、革命史視角下的宏大敘事與社會(huì)史、文化史視角下的微觀分析常被用來對(duì)立討論,但在“數(shù)字史學(xué)”提供的論證軌道中,計(jì)算機(jī)強(qiáng)大的數(shù)據(jù)處理能力既可以處理長(zhǎng)時(shí)段的宏觀敘事分析,同時(shí)也可以支持微觀數(shù)據(jù)的深度挖掘,能夠支持學(xué)者在同一研究問題中靈活切換不同的考察視角。在出版史研究引入新技術(shù)和新方法后,我們可以展望“數(shù)字出版史學(xué)”實(shí)現(xiàn)“數(shù)字史學(xué)”的第三層革新——整合出版史研究的原有理論,創(chuàng)建一種關(guān)于“鏈接”的闡釋策略和論證框架,在考察書籍生產(chǎn)、知識(shí)傳播、出版人的生活交往時(shí)對(duì)事件的整體趨勢(shì)及內(nèi)外部關(guān)系進(jìn)行更深層次、綜合性的理解與分析。最后,出版史的學(xué)科基體在注入“數(shù)字思維”后將更為注重跨學(xué)科合作,在科學(xué)研究與知識(shí)分享上將更具生產(chǎn)性和創(chuàng)造力,切實(shí)遵循文理融合的新文科發(fā)展目標(biāo),向具有共有價(jià)值和共有范例的學(xué)科共同體進(jìn)一步邁進(jìn)。
(作者范軍系華中師范大學(xué)文學(xué)院教授、博士生導(dǎo)師;秦雅婕系華中師范大學(xué)文學(xué)院2023 級(jí)博士研究生)