高 瑾
在過去幾十年中,數(shù)字人文獲得許多學(xué)術(shù)領(lǐng)域的關(guān)注,并為日益增長的數(shù)字文化發(fā)展做出了巨大貢獻(xiàn)(Siemens,2016)[1]xxi。相較文學(xué)、哲學(xué)或藝術(shù)等傳統(tǒng)人文學(xué)科,數(shù)字人文的歷史較短,學(xué)科發(fā)展迅,研究內(nèi)容多變。隨著其全球影響力的逐漸擴(kuò)大,數(shù)字人文從深層次改變著人文學(xué)、社會(huì)學(xué)等一系列相關(guān)學(xué)科的研究方法與思維方式(de Smedt,2002)[2],并不斷為人文學(xué)和計(jì)算機(jī)科學(xué)等領(lǐng)域的科研和教學(xué)開拓新的思路(Terras,2012)[3]。在數(shù)字人文的“大帳篷”之下,科研設(shè)施、研究中心、出版物、學(xué)術(shù)交流和教學(xué)計(jì)劃等一系列學(xué)科建設(shè)不斷增長,涵蓋了各種快速發(fā)展的多元研究主題,從研究項(xiàng)目的開展到具體技術(shù)的開發(fā),百花齊放(Weingart and Eichmann-Kalwara,2017)[4]。然而,在如此蓬勃發(fā)展的形勢之下,我們對(duì)數(shù)字人文本身的學(xué)科結(jié)構(gòu)卻知之甚少,連對(duì)其歷史的探究也因高度的跨學(xué)科性和邊界模糊的學(xué)術(shù)范疇而止步不前。雖然數(shù)字人文作為一個(gè)“大帳篷”可以被看作一個(gè)整體,但其中究竟是支離破碎的零散研究論題還是在交流鞏固之下形成的成熟學(xué)科體系也不得而知。
有學(xué)者嘗試通過尋找數(shù)字人文的定義而解決上述問題,然而定義數(shù)字人文并厘定其知識(shí)邊界的任務(wù)同樣十分艱難。從Rockwell在1999年提出定義的必要(Rockwell,1999)[5],到2009年的“數(shù)字人文日”將“定義數(shù)字人文”正式搬上國際論壇,過去20年間,眾多學(xué)者從不同角度出發(fā),紛紛對(duì)其進(jìn)行了定義,由此而引發(fā)的討論和批評(píng)更是數(shù)不勝數(shù)?!岸x數(shù)字人文”這一現(xiàn)象也因此成為了數(shù)字人文的核心問題之一。直到今日,雖然仍沒有得到普遍認(rèn)同的結(jié)論(Svensson,2010)[6],不過大多數(shù)學(xué)者都接受了McCarty對(duì)于定義的態(tài)度——“這是一個(gè)無法得出確切答案但是可以隨著學(xué)科發(fā)展不斷探索和完善的問題”(McCarty,2005;Terras et al.,2013)[7-8]。為了方便本文的論述,筆者將其定義為:數(shù)字技術(shù)與人文學(xué)科不斷發(fā)展的一個(gè)交叉領(lǐng)域,其內(nèi)容涉及兩者間的相互作用,即人文學(xué)中數(shù)字資源的應(yīng)用,以及數(shù)字時(shí)代人文角度的探討(Siemens,2016;Nyhan and Flinn,2016)[1]xxi[9]1-2。
本文旨在回顧和討論以歐美學(xué)者為主的針對(duì)數(shù)字人文學(xué)科結(jié)構(gòu)和歷史的相關(guān)量化研究,以期從前人關(guān)于數(shù)字人文的統(tǒng)計(jì)研究中歸納其知識(shí)范疇、評(píng)價(jià)出版物、概述社交媒體使用,從而嘗試解答“何為數(shù)字人文”這一核心問題,并將其置于更廣泛的學(xué)科知識(shí)地圖中,幫助學(xué)界理解數(shù)字人文與其他學(xué)科間的聯(lián)系。
中國大陸“數(shù)字人文”這一學(xué)科名詞屬于翻譯詞匯,由英文詞“Digital Humanities”直譯而來。其學(xué)科名稱在其他大多數(shù)語言環(huán)境中也都由英文詞衍變而來,如德語(Digital Humanities①)、法語(Humanités Numériques)、西班牙語(Humanidades Digitales)。由于不同的翻譯傳統(tǒng),全球不同漢語區(qū)域所使用的中文學(xué)科名稱也有所不同。例如,中國大陸使用“數(shù)字人文”,中國臺(tái)灣多使用“數(shù)位人文”,而中國香港多使用“數(shù)碼人文”。同時(shí),翻譯工作也無法借鑒日語漢字翻譯,因?yàn)槿毡緦W(xué)者選擇了使用假名以直接音譯的方式,避免了漢字的使用(即,“デジタル·ヒューマニティーズ”)。
然而,“數(shù)字人文”并不是這一領(lǐng)域唯一的名稱,它還有許多“曾用名”,如“人文計(jì)算”(Humanities Computing)(Nyhan et al., 2013)[10]。從“人文計(jì)算”到“數(shù)字人文”的轉(zhuǎn)變通常由2005 年劃分開來,前者多用于1949-2005 年,而后者多出現(xiàn)于2006年至今。這一劃分不光在時(shí)間線上切割出學(xué)科歷史的不同階段,也展示了學(xué)科發(fā)展從最初的“技術(shù)服務(wù)于人文”逐步向“領(lǐng)域內(nèi)獨(dú)特創(chuàng)新的方法和研究”的質(zhì)的轉(zhuǎn)變(Hayles,2012)[11]。雖然2006 年之后仍有聲音挑戰(zhàn)“數(shù)字人文”學(xué)術(shù)名稱的地位,例如,批評(píng)該詞匯“毫無含義”(Dinsman,2016)[12],提出各種新名稱,諸如“數(shù)字研究”(Digital Studies)(Stiegler,2012)[13]、“數(shù)字自由藝術(shù)”(Digital Liberal Arts)(Pannapacker,2013)[14]、“計(jì)算批評(píng)”(Computational Criticism)(Dinsman, 2016)[12],提出數(shù)字人文的反義詞“模擬人文”(Analog Humanities) (Sterne,2015)[15]等,然而這些討論并未能撼動(dòng)“數(shù)字人文”被大多數(shù)學(xué)者、機(jī)構(gòu)和組織所接受并使用。這一學(xué)科標(biāo)簽的使用不僅給傳統(tǒng)人文學(xué)帶來深遠(yuǎn)的影響,而且為學(xué)者們創(chuàng)造了各種各樣研究、教學(xué)、項(xiàng)目資金等機(jī)會(huì),還促進(jìn)了數(shù)字人文學(xué)者群體、科研社區(qū)、共同價(jià)值文化,以及學(xué)科范疇和歷史的形成。
雖然數(shù)字人文作為一個(gè)研究領(lǐng)域持續(xù)快速地發(fā)展著,但它是否已經(jīng)具有一門學(xué)科的地位和屬性仍然存在爭議(Schreibman et al.,2016)[16]。這不僅影響著大學(xué)人文學(xué)科的基礎(chǔ)建設(shè)和圖書館、博物館等一系列機(jī)構(gòu)的工作,而且對(duì)研究相關(guān)題目的學(xué)者來說,也是重要的科研前提和方法論對(duì)象(Nyhan and Flinn,2016)[9]1-2。從學(xué)科設(shè)置、科研開展、資金啟動(dòng)等務(wù)實(shí)的角度來看,數(shù)字人文早已具備了作為一門學(xué)科的各種屬性(如學(xué)者群體、出版物、國際學(xué)術(shù)活動(dòng)),并發(fā)展為一個(gè)“學(xué)術(shù)生態(tài)系統(tǒng)”(Svensson,2016)[17]。
具體來說,首先,數(shù)字人文在世界范圍內(nèi)有完善的學(xué)者社區(qū)和定期交流活動(dòng),如最大的國際交流平臺(tái)——數(shù)字人文組織聯(lián)盟(Alliance of Digital Humanities Organization,ADHO)及其區(qū)域成員組織。從1964年首次在美國約克敦高地舉辦的“文學(xué)數(shù)據(jù)處理會(huì)議”(Literary Data ProcessingConference)(BessingerandParrish,1965)[18],到ADHO 每年最大規(guī)模的全球會(huì)議,再到北京大學(xué)舉辦的年度數(shù)字人文論壇(朱本軍和聶華,2016,2017a,2017b)[19-21],各種規(guī)模的數(shù)字人文會(huì)議遍布全球每個(gè)大陸。各類數(shù)字人文組織、機(jī)構(gòu)、活動(dòng)和教學(xué)計(jì)劃構(gòu)建起一套完整的學(xué)科生態(tài)系統(tǒng),不僅鞏固了數(shù)字人文的學(xué)科地位和科研意義,而且為掌握新技術(shù)、創(chuàng)造新知識(shí)的學(xué)者提供更多的工作崗位和研究機(jī)會(huì)。
其次,數(shù)字人文從1966年開始就有了學(xué)科的正式期刊——《計(jì)算機(jī)與人文學(xué)》(Computers and the Humanities,CHum)。其后,其他有影響力的期刊也層出不窮,如ADHO直屬的3種期刊:一是牛津大學(xué)出版社出版的《人文數(shù)字學(xué)術(shù)期刊》(Digital Scholarship in the Humanities,DSH)(原刊名為《文學(xué)與語言計(jì)算》,Literary and Linguistic Computing,LLC),成立于1986年,現(xiàn)已成為數(shù)字人文最核心的刊物;二是2007 年創(chuàng)刊且全文開放存取的《數(shù)字人文季刊》(Digital Humanities Quarterly,DHQ);三是加拿大數(shù)字人文學(xué)會(huì)1992 年創(chuàng)立的以法語為主的多語言期刊《數(shù)字研究》(Digital Studies/LeChamp Numérique)。此外,數(shù)字人文還擁有其他相關(guān)期刊和出版物,以協(xié)助研究、開展項(xiàng)目、幫助教學(xué)、管理圖書館和建設(shè)基礎(chǔ)設(shè)施等,如《數(shù)字人文伴侶》《數(shù)字人文爭論》《數(shù)字人文讀本》(Schreibman et al.,2004;Gold,2012;Terras et al.,2013)[22-23,8]。
數(shù)字人文可以通過常規(guī)的定性定量方法進(jìn)行學(xué)科監(jiān)測和評(píng)估,這也從旁力證了數(shù)字人文日趨完善的學(xué)科屬性。例如,英國的研究卓越框架(Research Excellence Framework,REF)就被用來評(píng)價(jià)數(shù)字人文的學(xué)科建設(shè),以期分析出版物、發(fā)掘?qū)W科強(qiáng)項(xiàng)和出現(xiàn)的問題,從而使科研和教學(xué)活動(dòng)健康發(fā)展(Nyhan and Flinn,2016)[9]1-2。
數(shù)字人文的“學(xué)術(shù)生態(tài)系統(tǒng)”為當(dāng)前發(fā)展提供了新的思路,并反過來影響“數(shù)字”和“人文”這兩個(gè)領(lǐng)域(Gold,2012)[23]1-2。雖然數(shù)字人文已經(jīng)具備上述學(xué)科屬性并且日趨成熟,但很多關(guān)于其學(xué)科范疇和歷史等學(xué)科研究的問題依然亟待解決。例如,數(shù)字人文包含哪些子領(lǐng)域?它們之間的關(guān)系是什么?哪個(gè)影響力最大?早期的數(shù)字人文研究內(nèi)容和現(xiàn)在有什么不同?研究內(nèi)容如何隨著時(shí)間推移而變化?誰是數(shù)字人文最有影響力的學(xué)者?他們之間有哪些合作模式?數(shù)字人文學(xué)者地理分布是否具有全球化特點(diǎn)?在性別和語言方面是否足夠多樣化?學(xué)者的性別和地理因素會(huì)對(duì)數(shù)字人文社區(qū)產(chǎn)生哪些結(jié)構(gòu)性的影響?從1966 年開始到現(xiàn)在,學(xué)者們持續(xù)不斷地根據(jù)個(gè)人經(jīng)驗(yàn)和主觀討論來嘗試回答這些問題。作為CHum主編,Raben描述了數(shù)字人文的學(xué)科范圍(Raben,1966)[24]。但他當(dāng)時(shí)并未將其與傳統(tǒng)人文學(xué)區(qū)分開,而只是歸為“使用計(jì)算機(jī)的廣泛人文學(xué)研究領(lǐng)域”。直到2003年,McCarty根據(jù)經(jīng)驗(yàn)繪制了數(shù)字人文的第一張知識(shí)結(jié)構(gòu)圖(2005年重新修訂),從而將數(shù)字人文中“數(shù)字”與“人文”的部分以圖解的方式各自獨(dú)立出來,以幫助了解其研究主題和內(nèi)在聯(lián)系(McCarty,2003)[25]1233。該結(jié)構(gòu)圖不僅展示了各類研究方法、關(guān)鍵要素、核心主題“知識(shí)云”和它們之間存在的互相作用,而且提供了以圖像定義數(shù)字人文的新思想,為其后的研究奠定了一個(gè)堅(jiān)實(shí)的起點(diǎn)。
2004年Hockey出版了最具影響力的數(shù)字人文歷史研究(Hockey,2004)[26],從個(gè)人觀察出發(fā),以回顧學(xué)科重要事件為主線將歷史分為4個(gè)時(shí)期。然而,這一歷史總結(jié)也隨著文章的出版在2004年戛然而止,使得它沒能涵蓋“數(shù)字人文”作為學(xué)科名稱出現(xiàn)后的15年歷史。為補(bǔ)全歷史,Nyhan 等以口述歷史的方法采訪40 位早期的數(shù)字人文先驅(qū)(Nyhan and Flinn,2016)[9],不僅從歷史親歷者的個(gè)人視野出發(fā)帶來了詳盡描述和第一手?jǐn)?shù)據(jù),還創(chuàng)建了對(duì)公眾開放的訪談文本和語音數(shù)據(jù)庫,為之后的數(shù)據(jù)分析和量化歷史研究提供了豐富素材。但是在過去幾年間,特別是在《數(shù)字人文讀本》(Defining Digital Humanities:A Reader)于 2013 年 12 月出版之后(Terras et al.,2013)[8],越來越多的聲音不斷強(qiáng)調(diào)數(shù)字人文的多樣變化和持續(xù)發(fā)展的特點(diǎn),這使得像以上這樣用傳統(tǒng)的文獻(xiàn)回顧、個(gè)案分析、主觀總結(jié)等方式進(jìn)行的研究,不再能勝任厘清學(xué)科范疇和匯編學(xué)科歷史的任務(wù)。
如上所述,雖然早期基于個(gè)人主觀總結(jié)的學(xué)科研究為探索數(shù)字人文做出了開創(chuàng)性的貢獻(xiàn),但是這些研究相對(duì)零散,通常點(diǎn)到為止,無法結(jié)合大量的數(shù)據(jù)進(jìn)行全面回顧。而量化研究則可以有效解決這些因主觀原因所產(chǎn)生的局限性。量化方法是數(shù)字人文領(lǐng)域最常使用的研究方法之一,而應(yīng)用該方法來研究其本身不僅能夠更周詳?shù)亟沂緦W(xué)科本質(zhì),還可以為科研發(fā)展帶來新的思路。
科學(xué)技術(shù)和科研方法的不斷進(jìn)步也為收集大量數(shù)據(jù)提供了技術(shù)前提,使量化數(shù)字人文的概念得以實(shí)踐。從2006年至今的13年間,不斷有學(xué)者使用數(shù)據(jù)代替描述來勾畫數(shù)字人文的知識(shí)脈絡(luò)和學(xué)者群體。這些統(tǒng)計(jì)和計(jì)算數(shù)據(jù)通過各種可視化方法,不僅宏觀地展現(xiàn)了數(shù)字人文的總體概貌,而且還能夠?qū)⑶叭怂仡櫟木唧w事件、個(gè)別案例、詳細(xì)信息進(jìn)行系統(tǒng)地串連,補(bǔ)充缺失的知識(shí)和來源,還原數(shù)字人文完整的“學(xué)科生態(tài)系統(tǒng)”(B?rner,2011)[27]。
這些量化數(shù)字人文的研究,不僅可以使我們了解前人在學(xué)科研究方面做出的努力,而且能為未來全面解析和認(rèn)識(shí)數(shù)字人文提供理論基礎(chǔ)和實(shí)踐經(jīng)驗(yàn)。Weingart 與Earhart 等學(xué)者都曾收集和列舉過相關(guān)的研究(Weingart,2018;Earhart,2018)[28-29]。本文在他們的收集基礎(chǔ)上,對(duì)量化數(shù)字人文的研究進(jìn)行系統(tǒng)性回顧與綜述。除了補(bǔ)充更多相關(guān)研究,并分別從文獻(xiàn)計(jì)量學(xué)和社會(huì)計(jì)量學(xué)兩個(gè)方面來分析之外,本文對(duì)量化方法、數(shù)據(jù)收集,以及結(jié)果分析也進(jìn)行了比對(duì)討論,以期從量化的角度逐步劃清數(shù)字人文的學(xué)科范圍和發(fā)展歷史。此外,通過分析這些定量研究,能夠在對(duì)歷史和學(xué)科發(fā)展有新理解的基礎(chǔ)上,超越前人的努力來填補(bǔ)歷史的缺失和知識(shí)結(jié)構(gòu)的空白。
過去10年間,與數(shù)字人文有關(guān)的各種期刊和會(huì)議出版物增長迅速,為文獻(xiàn)計(jì)量學(xué)研究提供了豐富的研究資料(Hellqvist,2010)[30]。通過收集標(biāo)題、作者、關(guān)鍵詞、參考文獻(xiàn)等各類文獻(xiàn)數(shù)據(jù),文獻(xiàn)計(jì)量(又稱“信息計(jì)量”或“科學(xué)計(jì)量”)方法能夠幫助我們發(fā)掘并構(gòu)建數(shù)據(jù)間的聯(lián)系,以此分析數(shù)字人文的科學(xué)產(chǎn)出、學(xué)科(知識(shí))結(jié)構(gòu)和子領(lǐng)域、社會(huì)環(huán)境、學(xué)術(shù)信息交流渠道,并預(yù)測未來發(fā)展趨勢,等等(Tang et al.,2017)[31]。
2.1.1 知識(shí)結(jié)構(gòu)
研究表明,數(shù)字人文知識(shí)結(jié)構(gòu)在不斷變化發(fā)展,量化研究的樣本大小也對(duì)結(jié)果起著決定性影響。從定量的角度來看,數(shù)字人文的研究主題并沒有學(xué)者們所認(rèn)為的那樣多元化。
2006 年 ,Terras 對(duì) 1996-2005 年 間 ACH/ALLC會(huì)議②(ADHO會(huì)議的前身)的摘要和作者數(shù)據(jù)進(jìn)行了詞頻和作者研究(Terras,2006)[32]。結(jié)果顯示,這10年間文本分析主題占到絕大部分,同時(shí)與會(huì)者主要來自圖書館信息學(xué)、英語研究、語言學(xué)等學(xué)科。
2009年,王曉光和Inaba在Terras的基礎(chǔ)上加入了期刊的數(shù)據(jù)。除了ADHO會(huì)議集,他們還將兩種期刊(LLC和DHQ)納入研究范疇。3項(xiàng)數(shù)據(jù)來源共計(jì)得到548 篇文獻(xiàn),時(shí)間跨度5 年(2005-2009)。通過對(duì)應(yīng)分析和共詞分析,他們對(duì)提取的1,219 個(gè)詞匯進(jìn)行網(wǎng)絡(luò)可視化(Wang and Inaba,2009)[33]處理,發(fā)現(xiàn)數(shù)字人文內(nèi)部并沒有明顯的子領(lǐng)域。這一令人驚訝的結(jié)論與大多數(shù)之前的學(xué)科概述(McCarty,2003;Hockey,2004)[25-26]并不相符。
緊接著Leydesdorff 和Salah 也發(fā)現(xiàn)了數(shù)字人文的知識(shí)結(jié)構(gòu)過于單一。2010年1月他們通過關(guān)鍵詞檢索,對(duì)829篇來自81種不同期刊1975-2009 年的文獻(xiàn)構(gòu)建期刊共引網(wǎng)絡(luò)(Leydesdorff and Salah,2010)[34],發(fā)現(xiàn)這些期刊只來自幾個(gè)固定的領(lǐng)域,如圖書館信息學(xué)(34.6%)、計(jì)算語言學(xué)(10.9%),以及計(jì)算機(jī)和文學(xué)的交叉學(xué)科(6.1%)。該結(jié)果證實(shí)數(shù)字人文研究僅僅與計(jì)算語言學(xué)和文本分析兩個(gè)核心主題相關(guān),并且出版物只集中在兩種期刊聚類上,即圖書館信息學(xué)期刊和數(shù)字人文期刊。這與號(hào)稱具有廣泛包容性和多樣性的數(shù)字人文“大帳篷”特征相差甚遠(yuǎn)。這或許是由于數(shù)據(jù)樣本太小,因此2015年Salah等擴(kuò)大數(shù)據(jù)量,重新構(gòu)建期刊網(wǎng)絡(luò)圖(Salah et al.,2015)[35]78-89,見圖1。這一次結(jié)果稍有好轉(zhuǎn),圖1展示了數(shù)字人文在更廣泛的學(xué)術(shù)環(huán)境中的定位,以及它與圖書館、計(jì)算機(jī)、信息學(xué)、媒體、文學(xué)史、藝術(shù)等其他領(lǐng)域更完整的關(guān)系。隨著數(shù)據(jù)量的增加,與數(shù)字人文有關(guān)的文章除了發(fā)表在圖書館信息學(xué)和計(jì)算機(jī)兩個(gè)學(xué)科的期刊上之外,還出現(xiàn)在文學(xué)、語言學(xué)、教育研究和歷史等領(lǐng)域出版物上。當(dāng)然,該研究的數(shù)據(jù)規(guī)模依然偏小,時(shí)間跨度也有局限。
圖1 數(shù)字人文在廣泛學(xué)術(shù)環(huán)境中的期刊網(wǎng)絡(luò)圖[35]83
2012-2017 年,Weingart 收集整理了ADHO 舉辦的6 年會(huì)議文獻(xiàn)數(shù)據(jù),不僅補(bǔ)充了Terras以及王曉光和Inaba停留在DH2009的分析,而且發(fā)現(xiàn)了更多的子領(lǐng)域。首先,與Terras的結(jié)論相似,Weingart 發(fā)現(xiàn)從DH2012 到DH2014,研究主題大多集中在“文學(xué)研究”和“文本挖掘”(Weingart,2014a,2013a,2013b,2012)[36-39]上。然而,從DH2015 開始,研究重點(diǎn)逐漸多元化,由基于文本的項(xiàng)目轉(zhuǎn)向以創(chuàng)新方法和學(xué)科發(fā)展為中心,如應(yīng)用新技術(shù)方法的歷史研究(Weingart and Eichmann-Kalwara,2017)[4]。
2017 年,高瑾等繼續(xù)對(duì)數(shù)字人文的各個(gè)子領(lǐng)域進(jìn)行了深化研究。他們通過對(duì)3 種期刊(CHum,LLC/DSH,DHQ)的3,251篇時(shí)間跨度52年(1966-2017)的文獻(xiàn)進(jìn)行作者共被引網(wǎng)絡(luò)分析,發(fā)現(xiàn)了數(shù)字人文的6大研究主題,即:先驅(qū)及歷史研究、計(jì)算語言學(xué)、圖書館信息學(xué)、統(tǒng)計(jì)文學(xué)、新媒體、數(shù)據(jù)挖掘與技術(shù)分析(Gao et al.,2017;高瑾,2017)[40-41]。
這些定量研究結(jié)果為數(shù)學(xué)人文學(xué)者提供了有數(shù)據(jù)支持的可視化知識(shí)結(jié)構(gòu),使我們能夠清晰地認(rèn)識(shí)到數(shù)字人文的知識(shí)范圍和重點(diǎn)研究內(nèi)容。同時(shí),加上時(shí)間這一新的維度,則可以更明確地探索數(shù)字人文領(lǐng)域的發(fā)源、形成、發(fā)展以及內(nèi)容演變。
2.1.2 內(nèi)容演變
數(shù)字人文的研究內(nèi)容在其發(fā)展過程中動(dòng)態(tài)變化著。王曉光和Inaba在2009年的工作不僅是首例數(shù)字人文網(wǎng)絡(luò)化研究,而且是首個(gè)通過數(shù)據(jù)結(jié)果證實(shí)數(shù)字人文內(nèi)容演變的研究。他們發(fā)現(xiàn)2005~2009 年間學(xué)科名稱從“人文計(jì)算”轉(zhuǎn)移到“數(shù)字人文”的明顯趨勢(Wang and Inaba,2009)[33](見圖2)。在圖2中,紫色的“人文計(jì)算”(Humanities Computing)一詞在文章標(biāo)題中的使用越來越少,并且其網(wǎng)絡(luò)核心地位逐漸被棕色的“數(shù)字人文”(Digital Humanities)一詞所取代。這些網(wǎng)絡(luò)可視圖印證了LLC/DSH主編Vanhoutte提出的以2005-2006年作為兩個(gè)學(xué)科名稱分水嶺時(shí)間點(diǎn)(Vanhoutte,2013)[42]的論斷,并為這一論斷提供了可視化定量網(wǎng)絡(luò)圖作為有力證據(jù)。
之后,Spiro對(duì)2005-2011年間134個(gè)世界各地的數(shù)字人文教學(xué)大綱(及其相關(guān)項(xiàng)目)進(jìn)行了分析,包括教育水平、學(xué)科分布、技術(shù)技能、需求模式。她發(fā)現(xiàn),在這7年間,數(shù)字人文的教學(xué)內(nèi)容不斷吸納各種新的元素(如視覺圖像、音樂、視頻、游戲、地圖、模擬、3D 建模)(Spiro,2011)[43]。這一統(tǒng)計(jì)展現(xiàn)了數(shù)字人文內(nèi)容演變新階段的概況,不僅提供了不同類型的課程建設(shè)和實(shí)例指導(dǎo),而且還用數(shù)據(jù)重點(diǎn)論述了這一領(lǐng)域的教學(xué)價(jià)值觀(如開放性、網(wǎng)絡(luò)化、互動(dòng)性)。
圖2 2005-2009年高頻詞共現(xiàn)網(wǎng)絡(luò)[33]18
此外,不同文獻(xiàn)來源也會(huì)對(duì)內(nèi)容有影響。DHQ是領(lǐng)域內(nèi)的新刊,2007年創(chuàng)刊,旨在鼓勵(lì)多樣化的數(shù)字人文研究。而正因?yàn)檫@一創(chuàng)刊目的,該期刊比其他期刊包含更多元的研究主題。De la Cruz等分析了DHQ8年來(2007-2014)文章關(guān)鍵詞的變化趨勢(De la Cruz et al.,2015)[44],發(fā)現(xiàn)其中的絕大多數(shù)研究與數(shù)字人文最新涌現(xiàn)的主題有關(guān),如對(duì)數(shù)字人文及學(xué)者的討論和新媒體研究。這一結(jié)果表明了DHQ的學(xué)術(shù)前沿性和突出的多樣化主題出版偏好,以及不同數(shù)據(jù)樣本對(duì)量化數(shù)字人文研究所產(chǎn)生的影響。
在DH2015 會(huì)議上,由Tang 領(lǐng)導(dǎo)的一組學(xué)者介紹了對(duì)數(shù)字人文期刊內(nèi)容演變的分析(Tang et al.,2015)[45]。此后,他們通過搜索關(guān)鍵詞,進(jìn)行文檔共引分析及網(wǎng)絡(luò)可視化分析(見圖3)。從圖3看到,被引用最多的期刊是網(wǎng)絡(luò)底部的LLC,然后是左邊的A Companon to Digital Humanities(與書籍Defining Digital Humanities:A Reader緊密相連)。 Tang等將數(shù)據(jù)時(shí)間(1989~2014)分為每5年一段,通過對(duì)每個(gè)時(shí)間段單獨(dú)進(jìn)行網(wǎng)絡(luò)分析,驗(yàn)證了數(shù)字人文正朝著主題多樣化、作者全球化的方向發(fā)展。
隨后,高瑾等(Gao et al.,2018)[46]也對(duì)52年來(1966-2017)的期刊數(shù)據(jù)進(jìn)行了5個(gè)時(shí)間段的切分,并通過每段的作者共被引可視化,將數(shù)字人文的學(xué)科發(fā)展細(xì)化為5 個(gè)具體的階段(見圖4)。這一量化結(jié)果與Hockey提出的經(jīng)典數(shù)字人文歷史階段契合(Hockey,2004)[26]。1966-1970 年為發(fā)源階段,主題集中于文本的機(jī)器輸入;1971-1985 年為鞏固階段,各個(gè)數(shù)字人文先驅(qū)為人熟知的索引項(xiàng)目逐漸引起高度關(guān)注(如Busa),數(shù)字人文由此形成了一個(gè)領(lǐng)域;1986-1990 年為發(fā)展階段,計(jì)算語言學(xué)主題成為最主要的研究核心;1991-2005 年為互聯(lián)網(wǎng)階段,科技的進(jìn)步給圖書館信息學(xué)、文學(xué)統(tǒng)計(jì)研究、歷史研究、多語言研究等帶來了新的研究主題,而計(jì)算語言學(xué)主題逐漸退出核心舞臺(tái);2006-2017年為后互聯(lián)網(wǎng)階段,雖然各種新媒體內(nèi)容層出不窮,但圖書館文本分析依然有著巨大影響力,數(shù)字人文呈現(xiàn)出百花齊放的繁榮趨勢。
圖3 數(shù)字人文1989-2014年文檔共引分析[31]
圖4 1966-2017年數(shù)字人文作者共被引網(wǎng)絡(luò)的5個(gè)發(fā)展階段[46]
2.1.3 合作模式
量化研究除了可以展現(xiàn)知識(shí)結(jié)構(gòu)和內(nèi)容的演變之外,還可以對(duì)學(xué)者合作模式進(jìn)行探索。以“多樣化和包容性”為核心價(jià)值觀的數(shù)字人文,一直以區(qū)別于人文學(xué)單一作者模式的多作者合作模式作為其獨(dú)特標(biāo)志。而量化研究不僅能夠用數(shù)據(jù)對(duì)此進(jìn)行驗(yàn)證,而且可以揭示數(shù)字人文與其它傳統(tǒng)學(xué)科間的差異性。
Spiro 發(fā)現(xiàn)LLC期刊 2004-2008 年間 48%文章為多作者合作出版。這一結(jié)果遠(yuǎn)遠(yuǎn)大于同時(shí)期的傳統(tǒng)人文學(xué)期刊《美國文學(xué)史》(American Literary History,ALH)的(合著)結(jié)果(僅有 1.93%文章由多個(gè)作者合作完成)。另一數(shù)字人文期刊DHQ2007-2014年間也有逾36%文章為合作出版(De la Cruz et al.,2015)[44]。另外,數(shù)字人文作者所在國家更為多樣化。例如,LLC中16%文章為國際間合作(即作者來自不同國家),而ALH一篇也沒有。Spiro 將這一重要合作模式差異解釋為數(shù)字人文和傳統(tǒng)人文學(xué)對(duì)學(xué)術(shù)實(shí)踐的不同需求。例如,數(shù)字人文項(xiàng)目需要更多的合作、不同類型的專業(yè)知識(shí)和技術(shù)、各種設(shè)備資料;而傳統(tǒng)人文學(xué)科更重視個(gè)體研究,其科研活動(dòng)可以由單一學(xué)者獨(dú)自完成,即完全獨(dú)立地進(jìn)行閱讀、思考和寫作。這一特點(diǎn)在歐洲區(qū)域性的數(shù)字人文會(huì)議中更加明顯。Henny-Krahmer 與Sahle 分析德語地區(qū)的數(shù)字人文會(huì)議DHd2018的論文,發(fā)現(xiàn)72.7%論文由多位學(xué)者共同撰寫[47]。
然而,在數(shù)字人文與其它非人文學(xué)領(lǐng)域的對(duì)比中,作者合作模式?jīng)]有顯著區(qū)別。2014 年Nyhan和Duke-Williams分析了2,291篇發(fā)表在CHum和LLC上的論文,并將其與《美國地理學(xué)家協(xié)會(huì)年刊》 (Annals of the Association of American Geographers,AAAG)上的文章進(jìn)行對(duì)比,發(fā)現(xiàn)合作出版論文在數(shù)字人文兩刊中分別占31%(CHum)和35%(LLC),而AAAG為40%。這與Spiro 的結(jié)論有些出入(Spiro,2009)[48]。究其原因,可能是因?yàn)镾piro只分析了非常小的一部分?jǐn)?shù)字人文論文(145篇),而Nyhan 和Duke-Williams 搜集了相對(duì)全面的論文(2,291 篇),更完整地展示了作者合作度。Nyhan 和Duke-Williams也改進(jìn)了Spiro對(duì)數(shù)字人文作者合作模式過于積極的肯定。當(dāng)然,通過時(shí)間切片分析,他們的研究也正面地反映出多作者合作的趨勢和科研合作現(xiàn)象在數(shù)字人文領(lǐng)域中日漸增加。
2.1.4 學(xué)者背景統(tǒng)計(jì)
在數(shù)字人文多樣化和全球化浪潮下,各國各類研究中心和交流活動(dòng)層出不窮,這吸引了量化分析的關(guān)注熱點(diǎn)。學(xué)者們通過數(shù)據(jù)可視化考察了“大帳篷”下不同學(xué)者背景的客觀分布情況。
(1)地理分布。從國家分布來說,以ADHO為代表的國際數(shù)字人文社區(qū)仍然以歐美學(xué)者為主。2006 年,Terras 發(fā)現(xiàn) ADHO 會(huì)議 1996-2005 年間幾乎所有參會(huì)者都來自西方國家,且北美占到一半以上(美國37%、加拿大24%)(Terras,2006)[32]。隨后期刊DHQ的出版數(shù)據(jù)也得出相同的結(jié)果,2007-2014年間有大約75%作者來自北美科研機(jī)構(gòu)(De la Cruz et al.,2015)[44]。Weingart在對(duì)比了2013-2015年的ADHO會(huì)議數(shù)據(jù)之后,發(fā)現(xiàn)在澳大利亞舉辦的DH2015因?yàn)榇笱笾蕺?dú)特的地理位置而吸引到了比前兩屆(美國與瑞士)更為多樣化的參會(huì)群體,如圖5所示[49]。
圖5 DH2013-2015作者地理分布[50]
圖6 1966-2017年數(shù)字人文被引用量排名前三千的作者國別分布[46]
在DH2018會(huì)議上,高瑾等對(duì)CHum、LLC/DSH、DHQ等3種期刊1966-2017年所有被引作者進(jìn)行了地理分析,并將被引用量排名最前的三千位作者進(jìn)行了共被引網(wǎng)絡(luò)可視化分析(Gao et al.,2018)[46](見圖6),發(fā)現(xiàn)在被引用作者中,美國、英國、德國、加拿大等歐美國家的作者依然占據(jù)著絕大多數(shù)的被引用量。
除參與ADHO的歐美主流數(shù)字人文學(xué)者外,各種區(qū)域性的數(shù)字人文科研活動(dòng)也成為人口統(tǒng)計(jì)研究的重要對(duì)象。區(qū)域性學(xué)術(shù)活動(dòng)不僅參加者更為本地化,研究題目也更具地方特色。
在西班牙舉辦的數(shù)字人文會(huì)議上(如HDH 2015和第一屆歐洲數(shù)字人文日EADH Day 2015),絕大多數(shù)參會(huì)者來自歐洲(Tello,2015)[51]。在德國舉辦的針對(duì)德國及德語區(qū)域的數(shù)字人文會(huì)議(DHd2016 和DHd2018)上,德國參會(huì)者分別占80%(Tello,2016)[52]和81.9%(Henny-Krahmer and Sahle,2018)[47]。荷蘭語數(shù)字人文會(huì)議(DHBenelux2014-2018)和北歐地區(qū)數(shù)字人文會(huì)議(DHN2016-2018)也有著很大的本地學(xué)者參會(huì)比例(Kemman,2016a,2016b,2017,2018;M?kel? and Tolonen,2018)[53-57]。
華語地區(qū)同樣具有這一特點(diǎn),詳見朱本軍和聶華對(duì)兩屆北京大學(xué)數(shù)字人文論壇(簡稱“北大論壇”)的學(xué)者分析(朱本軍和聶華,2016,2017a)[19-20]。此外,Chen和Hsueh研究中國臺(tái)灣最大數(shù)字人文會(huì)議——數(shù)位典藏與數(shù)位人文國際研討會(huì)(DADH)2009-2012 年的會(huì)議論文(Chen and Hsueh,2013)[58],發(fā)現(xiàn)盡管來自日本、中國大陸、泰國、英國和美國的與會(huì)者數(shù)量逐年增加,但幾乎所有論文都集中在研究中國相關(guān)問題上(70.8%)。
(2)性別分布。學(xué)者性別在數(shù)字人文領(lǐng)域尤為重要,然而在絕大多數(shù)歐美數(shù)字人文出版物中,很難找到女性學(xué)者。最近女性主義研究在數(shù)字人文領(lǐng)域引起越來越多的關(guān)注,很大一部分原因是由于這一極度不平衡的性別比例所帶來的各種批評(píng)與辯論(Liu,2012;Nyhan and Terras,2017;Wernimont,2018)[59-61]。這使得“女權(quán)數(shù)字人文”(Feminist Digital Humanities)一詞成為數(shù)字人文(至少在其英語出版物)討論的熱詞之一。
圖7 1966-2017年數(shù)字人文被引用量排名前三千的作者性別分布[46]
Weingart 發(fā)現(xiàn)ADHO 會(huì)議中存在極度不平衡的性別比例(DH2010-2013每年參會(huì)的女學(xué)者僅約占30%)(Weingart,2014d)[62]。之后高瑾等擴(kuò)大數(shù)據(jù)量,對(duì)CHum、LLC/DSH、DHQ等3種期刊1966~2017 引用量最高的 3,118 名被引作者進(jìn)行性別分析(Gao et al.,2018)[46](見圖7),發(fā)現(xiàn)只有21%的作者為女性,但其中很大一部分有顯著的引用數(shù)量,并位居引用排名前列。
然而,男性并不是一直在數(shù)字人文學(xué)者中占據(jù)主導(dǎo)地位。在歐洲的區(qū)域性學(xué)者群中,則有更多女性學(xué)者的身影。Tello 發(fā)現(xiàn)參加西班牙會(huì)議HDH2015 和 EADH Day 2015 的229名與會(huì)者中,約有55%的女學(xué)者(Tello,2015)[51]。
近年,筆者與Nyhan 和Duke-Williams 繼續(xù)合作,深入研究其他特征對(duì)數(shù)字人文作者間合作關(guān)系的影響(如性別、國家、語言)。通過對(duì)新增數(shù)據(jù)的分析,發(fā)現(xiàn)女性學(xué)者在數(shù)字人文作者合著網(wǎng)絡(luò)中起到顯著且重要的“橋梁作用”(Nyhan et al.,forthcoming)[63]。也就是說,在多作者團(tuán)隊(duì)研究的環(huán)境下,女性數(shù)字人文學(xué)者通常是啟發(fā)交流、建立關(guān)系、主導(dǎo)合作的人,在團(tuán)隊(duì)合作中起到關(guān)鍵的“橋梁作用”。
2009年,Borgman指出社會(huì)研究在數(shù)字人文中的重要性和短缺現(xiàn)象(Borgman,2009)[64],Leydesdorff和Salah提出單從出版物角度分析,無法全面涵蓋數(shù)字人文的知識(shí)范疇和歷史發(fā)展(Leydesdorff and Salah,2010)[34]。因此,有必要尋找其他形式的數(shù)據(jù)來源和分析角度。利用社會(huì)學(xué)方法對(duì)社交媒體進(jìn)行定量研究能從更具互動(dòng)性的角度對(duì)復(fù)雜的跨學(xué)科屬性和高度合作的社會(huì)屬性進(jìn)行分析(Witting,2018)[65],因而被廣泛應(yīng)用于各領(lǐng)域,如人際關(guān)系研究(Jones et al.,2012)[66]、群體合作研究 (Kim et al.,2008)[67]、引文研究(Anheier et al.,1995)[68]、數(shù)字人文社區(qū)研究(Quan-Haase et al.,2015;Grandjean,2016)[69-70]。學(xué)者們的社交媒體使用行為,可為研究和理解其社會(huì)活動(dòng)與學(xué)術(shù)生活之間的關(guān)系提供數(shù)據(jù)基礎(chǔ)(Choo et al.,2015)[71]。學(xué)者的在線社交活動(dòng)還可以揭示學(xué)者之間的非正式交流,如哪些學(xué)者是社交媒體上最活躍的用戶、他們?nèi)绾卧诰W(wǎng)絡(luò)上互動(dòng)以協(xié)同工作、社交媒體活動(dòng)和學(xué)術(shù)生產(chǎn)力有無聯(lián)系。
2.2.1 推特(Twitter)研究
在所有在線應(yīng)用中,推特(Twitter)是數(shù)字人文學(xué)術(shù)圈(至少是西方學(xué)術(shù)圈)最受歡迎的社交網(wǎng)絡(luò)平臺(tái),不僅支持學(xué)者間的學(xué)術(shù)交流,而且還支持學(xué)術(shù)活動(dòng)的實(shí)時(shí)討論,即“后臺(tái)渠道”(backchannel)(Ross et al.,2011)[72]。
雖然并非所有學(xué)者都使用Twitter(Van Noorden,2014)[73],但自2006年推出以來,它已被越來越多的學(xué)者接受,甚至成為進(jìn)入歐美數(shù)字人文學(xué)術(shù)圈的必備技能之一(C?té and Darling,2018)[74]。很多數(shù)字人文Twitter“大號(hào)”擁有10萬以上的關(guān)注人數(shù)。例如,截至2018 年底,Digital Humanities Now(@dhnow)擁有27,954名關(guān)注者,這一數(shù)字在過去6 年內(nèi)增了10 倍(2012年為2,794人)(Terras,2012)[3]。
Twitter 因?yàn)閷?duì)數(shù)據(jù)下載的開放和友好,逐漸成為研究在線社交網(wǎng)絡(luò)的完美數(shù)據(jù)源。它歡迎各種API(應(yīng)用程序編程接口),使數(shù)據(jù)下載和處理更加容易,也提供相對(duì)干凈的量化數(shù)據(jù)(如“關(guān)注”“轉(zhuǎn)發(fā)”“提到”“@”等學(xué)者間的網(wǎng)絡(luò)關(guān)系),從而簡化繁瑣的數(shù)據(jù)清理難題(Eysenbach,2011;Peoplesetal.,2016;Thelwalletal.,2013)[75-77]。
(1)使用目的。數(shù)字人文學(xué)者使用Twitter的目的并不是唯一的,它隨著時(shí)間和用戶量的擴(kuò)大而不斷發(fā)展。2009年,F(xiàn)rench對(duì)兩個(gè)數(shù)字人文會(huì)議(THATcamp 和MLA2009)的學(xué)者數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)學(xué)者在開會(huì)期間上Twitter主要是為了分享和閱讀有關(guān)會(huì)議的新聞,而非點(diǎn)對(duì)點(diǎn)地在線聊天(French,2009)[78]。其中,在 Twitter 上推送THATcamp 會(huì)議信息的用戶數(shù)甚至比實(shí)際參會(huì)的人數(shù)還多出1倍。兩年后,在擴(kuò)大會(huì)議數(shù)據(jù)量的情況下,Ross等發(fā)現(xiàn)除了分享新聞和資源之外,學(xué)者主要的Twitter社交需要還包括另外6類,即:對(duì)演講的評(píng)論、討論和對(duì)話、會(huì)議筆記、建立公關(guān)、詢問問題以及其他;她們不僅首次提出了Twitter在數(shù)字人文交流中“后臺(tái)渠道”的概念,而且還發(fā)現(xiàn)使用Twitter可以增強(qiáng)數(shù)字人文的會(huì)議體驗(yàn),加強(qiáng)會(huì)后的學(xué)術(shù)合作關(guān)系(Ross et al.,2011)[72]。此外,她們用數(shù)據(jù)證實(shí)了學(xué)者使用Twitter的行為是隨著時(shí)間不斷變化的。以2009年為界,此前大多數(shù)用戶只發(fā)送原創(chuàng)推文(90%),不喜歡轉(zhuǎn)發(fā)他人的信息。但幾年之后,轉(zhuǎn)發(fā)量占到用戶活動(dòng)的大部分,而且含有網(wǎng)址鏈接的推文(24%)也在迅速增長。
數(shù)字人文的科研發(fā)展已經(jīng)越來越依賴于Twitter 上的交流活動(dòng)。2014 年Holmberg 和 Thelwall 通過比較 Twitter上的10 個(gè)學(xué)科(數(shù)字人文、天體物理學(xué)、生物化學(xué)、經(jīng)濟(jì)學(xué)、科學(xué)史、化學(xué)信息學(xué)、認(rèn)知科學(xué)、藥學(xué)、社會(huì)網(wǎng)絡(luò)分析和社會(huì)學(xué))447 位學(xué)者的賬戶活動(dòng)(Holmberg and Thelwall,2014)[79],發(fā)現(xiàn)學(xué)術(shù)圈的學(xué)者比一般用戶更喜歡轉(zhuǎn)發(fā)資源和鏈接。此外,相較于其他學(xué)科,數(shù)字人文學(xué)者不僅互動(dòng)更活躍、更依賴平臺(tái)、更多線上對(duì)話和討論(占推文的38%),而且學(xué)術(shù)地位越高的學(xué)者越喜歡使用Twitter。
2015 年 , Quan-Haase 等采訪25位歐美數(shù)字人文學(xué)者,對(duì)他們使用Twitter的滿意度進(jìn)行調(diào)查(Quan-Haase et al.,2015)[69],發(fā)現(xiàn)Twitter上的數(shù)字人文社區(qū)正向著穩(wěn)定的社會(huì)關(guān)系發(fā)展,并且數(shù)字人文研究的很多主題反過來開始很大程度上依賴于Twitter 而展開。這與Holmberg和Thelwall 提出的依賴關(guān)系不謀而合(Holmberg and Thelwall,2014)[79]。
(2)地理分布。2014 年墨西哥學(xué)者Galina 指出數(shù)字人文Twitter 社區(qū)地理和語言多元化的缺失(Galina,2014)[80]312-313,提出歐洲、拉美等西班牙語地區(qū)學(xué)者在Twitter上也非?;钴S,只是因?yàn)檎Z言不通而被英語主流學(xué)者忽視。該情況在其他非英語的數(shù)字人文社交網(wǎng)絡(luò)群體中也屢見不鮮。 2013-2016 年, 瑞士學(xué)者Grandjean先后收集大量關(guān)于數(shù)字人文的Twitter數(shù)據(jù),發(fā)現(xiàn)兩個(gè)活躍且突出的法語和德語學(xué)者群體(Grandjean,2016)[70]。通過對(duì) 2,538 名數(shù)字人文Twitter用戶構(gòu)建“關(guān)注與被關(guān)注”的關(guān)系網(wǎng)絡(luò),Grandjean首次繪制全球視角下的Twitter數(shù)字人文可視化圖像(見圖8)。由圖8可見清晰的英語(白色)、法語(藍(lán)色)、德語(黃色)、西班牙語(紅色)和其他語言(黑色)的集群,其中27%用戶使用非英語在Twitter上進(jìn)行交流,說同一種語言的用戶更可能在網(wǎng)絡(luò)圖上聚集在一起。
圖8 基于2,538名用戶互相關(guān)注數(shù)據(jù)繪制的Twitter數(shù)字人文網(wǎng)絡(luò)[70]
(3)性別分布。Twitter環(huán)境下的性別平衡也是數(shù)字人文研究關(guān)注的重點(diǎn)之一。比如,以Twitter 話題標(biāo)簽 #transformDH 和 #femDH 為代表的相關(guān)討論引起眾多數(shù)字人文學(xué)者的參與(Bailey et al.,2016)[81]。2010年,F(xiàn)luharty分析164位數(shù)字人文Twitter用戶的性別分布,發(fā)現(xiàn)只有 40%為女性(65 人)(Fluharty,2010)[82]。考慮到數(shù)字人文與人文學(xué)之間緊密的相關(guān)性,女性理論上應(yīng)該占據(jù)非常重要的部分(如在現(xiàn)實(shí)行業(yè)中,女性圖書館員占80%、檔案管理員66%、公共歷史學(xué)家66%)。但參照2009年Twitter上所有用戶的性別統(tǒng)計(jì),發(fā)現(xiàn)整個(gè)女性用戶群體只占到43%(Nielsen Mobile,2009)[83]。此外,F(xiàn)luharty[82]還發(fā)現(xiàn)數(shù)字人文女性用戶的平均關(guān)注人數(shù)(564)低于平均值(779),而男性用戶往往對(duì)他們所關(guān)注的用戶“過于挑剔”,即他關(guān)注的用戶數(shù)總是少于關(guān)注他的人數(shù)(比例為0.57,而女性比例為0.69)。
總的來說,對(duì)Twitter的量化研究為了解數(shù)字人文知識(shí)結(jié)構(gòu)和學(xué)者群體提供了另一個(gè)角度。通過對(duì)前人研究的梳理,我們能看到了一個(gè)溝通方式、地理語言更加多樣化,并且性別更加平衡的社交環(huán)境,這與文獻(xiàn)計(jì)量結(jié)果形成對(duì)比。
2.2.2 博客和論壇
除Twitter 外,博客也是數(shù)字人文學(xué)術(shù)傳播的主要渠道。正因?yàn)閷?duì)博客的依賴,數(shù)字人文甚至被McPherson描述為“博客人文”(Blogging Humanities)(McPherson,2009)[84]。博客圈與數(shù)字人文學(xué)者的日?;?dòng)密切相關(guān),是學(xué)科發(fā)展的重要組成部分。博客交流介于文獻(xiàn)出版和Twitter 對(duì)話之間,既不需要通過正式出版物出版,也不像推文那樣短小而無法延展思想、深入論述。由此,博客這種非正式的傳播方式正改變著學(xué)術(shù)出版的傳統(tǒng),同時(shí)也提升了數(shù)字技術(shù)在學(xué)術(shù)交流中的地位。此外,以郵件推送為主的論壇也為數(shù)字人文發(fā)展提供了肥沃的土壤,如數(shù)字人文最大的論壇Humanist。論壇在數(shù)字人文社區(qū)的形成和演變中也發(fā)揮著不容忽視的作用。
2011年Meeks邁出數(shù)字人文博客量化研究的第一步(Meeks,2011)[85]。通過收集博客文章、期刊和書籍內(nèi)容,繪制了粗淺的數(shù)字人文主題詞網(wǎng)絡(luò)圖(見圖9)。
受 Meeks 啟發(fā),Burton 進(jìn)一步對(duì) 396 個(gè)數(shù)字人文博客的106,804篇博文(1995-2013)構(gòu)建模型,發(fā)現(xiàn)博客在數(shù)字人文學(xué)術(shù)交流中具有“基礎(chǔ)設(shè)施”一般的重要性,其中32%的內(nèi)容關(guān)于主流數(shù)字人文研究、20%學(xué)科建設(shè)、14%學(xué)科管理、10%博客技巧等(Burton,2015)[86]。
2015年,Puschmann和Bastos研究兩個(gè)權(quán)威的數(shù)字人文博客HASTAC 和Hypotheses(PuschmannandBastos,2015)[87]。通過構(gòu)造術(shù)語共生矩陣,他們的研究揭示了數(shù)字人文學(xué)者喜歡使用“人文”而不是“數(shù)字”的相關(guān)術(shù)語進(jìn)行主題討論,并發(fā)現(xiàn)了不同術(shù)語之間的不同用法,繪制了可視化網(wǎng)絡(luò)圖(見圖10)。不同的主題術(shù)語聚類在一起,形成整個(gè)數(shù)字人文知識(shí)地圖。在圖10的4個(gè)集群中,最大的是左上方的檔案館和圖書館、右上方是教育和學(xué)習(xí)主題、右下方是一般人文、文化和藝術(shù)主題,而小部分的人類學(xué)和歷史集群位于圖中的左下方。
圖9 數(shù)字人文主題和文檔之間的可視化網(wǎng)絡(luò)[85]
圖10 數(shù)字人文相關(guān)術(shù)語的共現(xiàn)網(wǎng)絡(luò)圖③
除博客外,論壇也是進(jìn)行學(xué)術(shù)交流的重要地方。1987年McCarty創(chuàng)立了現(xiàn)今依然十分活躍的郵件推送論壇Humanist(Rockwell and Sinclair,2012)[88],為數(shù)字人文學(xué)者提供一個(gè)“持久、溫暖、非正式”的交流場所。
Rockwell 和 Sinclair 對(duì) Humanist(1987~2008)進(jìn)行分析 (Rockwell and Sinclair,2016)[89],發(fā)現(xiàn)其發(fā)展經(jīng)歷3 個(gè)焦點(diǎn)時(shí)期:1987-1995 年(人文計(jì)算)、1996-2000 年(過渡時(shí)期)、2001-2008年(向數(shù)字網(wǎng)絡(luò)服務(wù)和合作項(xiàng)目轉(zhuǎn)變)。這些結(jié)果與Wang和Inaba的結(jié)論一致,即該領(lǐng)域的名稱明顯從“人文計(jì)算”轉(zhuǎn)向“數(shù)字人文”(Wang and Inaba,2009)[33]。此外,他們發(fā)現(xiàn)“數(shù)字人文”一詞的使用不僅引發(fā)學(xué)校行政體系的改變,而且改變了數(shù)字內(nèi)容的消費(fèi)方式?;ヂ?lián)網(wǎng)為Humanist 在1990年代中期發(fā)布和傳播數(shù)字內(nèi)容提供了更多的機(jī)會(huì),從而改變了“人文計(jì)算”領(lǐng)域(關(guān)鍵詞顯示,論壇從對(duì)“硬件”和“軟件”的討論轉(zhuǎn)變?yōu)殛P(guān)于“服務(wù)”的討論)的發(fā)展方向。
2014 年 McClure 繼續(xù)對(duì)Humanist 總計(jì) 27 年(1987-2014)1,150 萬字的數(shù)據(jù)進(jìn)行全面研究(McClure,2014)[90],并將這些單詞歸納為138,476種類型,然后生成論壇主題的“概念圖集”(見圖11)。從圖11可清楚地看到不同時(shí)期的討論主題。例如,1980年代的“硬件”和“軟件”就與Rockwell和Sinclair 的研究結(jié)果一致(Rockwell and Sinclair,2016)[89];1990年代的各種地名與當(dāng)時(shí)全球化的數(shù)字人文中心和機(jī)構(gòu)建設(shè)聯(lián)系緊密;2000年之后出現(xiàn)許多將數(shù)字人文作為獨(dú)立學(xué)科看待的主題詞,標(biāo)志著學(xué)科管理建設(shè)的開始;從2011年開始,出現(xiàn)了許多與新媒體相關(guān)的主題詞,揭示了這一時(shí)期的各種新型研究項(xiàng)目。
對(duì)博客和論壇的量化研究是了解數(shù)字人文非常重要的一部分。一方面,相較文獻(xiàn)來說,博客和論壇基本都是數(shù)字文本,便于進(jìn)行文本處理;另一方面,相較社交媒體來說,博客和論壇有著深入的研究和充分展開的討論,便于探索內(nèi)容。這些研究不僅展示了數(shù)字人文“大帳篷”下各種主題術(shù)語的使用情況,并且反映出構(gòu)成數(shù)字人文的具體內(nèi)容及其與其它學(xué)科的關(guān)聯(lián)性。
圖11 Humanist論壇主題詞網(wǎng)絡(luò)可視化(1987-2014)
本文通過對(duì)數(shù)字人文定量分析的相關(guān)研究進(jìn)行回顧,從文獻(xiàn)和社交兩個(gè)角度來揭示數(shù)字人文的學(xué)科(知識(shí))結(jié)構(gòu)、(內(nèi)容)歷史演變、合作模式和學(xué)者背景。通過分析研究學(xué)者間正式和非正式的交流渠道,本文旨在從數(shù)據(jù)的新角度幫助讀者理解關(guān)于數(shù)字人文的一系列問題。
盡管量化研究存在誤差而且只能通過數(shù)據(jù)對(duì)這些問題進(jìn)行統(tǒng)計(jì)表述,但它們可以成為定性研究有力的數(shù)據(jù)線索,同時(shí)從宏觀和個(gè)案角度為我們了解學(xué)科領(lǐng)域和學(xué)者群體奠定客觀基礎(chǔ),甚至可以使我們“對(duì)研究的看法發(fā)生根本性的轉(zhuǎn)變”(Bboyd and Crawford,2012)[91]。而且,它們還可以幫助我們填補(bǔ)還未認(rèn)識(shí)到的數(shù)字人文歷史和結(jié)構(gòu)空白。這不僅方便我們了解“我們是誰”,同時(shí)將學(xué)科歷史上的零散個(gè)例串聯(lián)成整體脈絡(luò)。從事這項(xiàng)工作的學(xué)者們站在“數(shù)字”和“人文”兩個(gè)領(lǐng)域的十字路口,研究著這一雙向關(guān)系中的聯(lián)系和差異,探索著其學(xué)科目標(biāo)和本質(zhì)在當(dāng)前數(shù)字時(shí)代的定位(Svensson,2010)[6]。
然而需要承認(rèn)的是,量化研究也有許多局限性。高度跨學(xué)科的數(shù)字人文領(lǐng)域有很多無法用數(shù)據(jù)分析來解決的矛盾。雖然量化可以展示數(shù)字人文的主題分布、揭示“數(shù)字”和“人文”的占比,但不能僅僅依靠統(tǒng)計(jì)來解決真實(shí)環(huán)境下更加復(fù)雜的數(shù)字人文爭論和批評(píng),例如,仍有待加強(qiáng)的多樣化學(xué)者群體和研究內(nèi)容、對(duì)實(shí)事政治的較少關(guān)注、研究和教學(xué)的不平衡、仍需拓寬的開放存取的版權(quán)意識(shí),以及對(duì)高科技高資金項(xiàng)目的趨之若鶩(Gold,2012)[23]。
其中,對(duì)地理分布和性別分布的統(tǒng)計(jì)雖然為案例研究提供了宏觀脈絡(luò),但現(xiàn)實(shí)中區(qū)域發(fā)展和性別分配的缺陷依然存在。改善這些問題除了需要更頻繁且有質(zhì)量的學(xué)術(shù)交流之外,也需要認(rèn)清數(shù)字人文在各國的發(fā)展并不一定代表著全球化。正如Mahony所指出的,并非所有區(qū)域的學(xué)術(shù)活動(dòng)都與主流的ADHO 組織相關(guān)聯(lián)(比如,北大論壇就沒有),但對(duì)數(shù)字人文學(xué)者地理及性別分布多樣化的研究填補(bǔ)了數(shù)字人文區(qū)域化發(fā)展缺失的空白,由此可以為未來解決地理和性別的不平衡提供數(shù)據(jù)指南(Mahony,2018)[92]。同時(shí),也正因?yàn)檫@些不同背景的學(xué)者群體所起到的橋梁作用,使得原本充斥著不同語言、不同學(xué)術(shù)傳統(tǒng)、不同研究范式的子集得以匯聚在一個(gè)具有包容特點(diǎn)的“大帳篷”之下。而目前的量化研究在分析“大帳篷”復(fù)雜的學(xué)術(shù)環(huán)境問題上,還停留在表層的統(tǒng)計(jì)階段。
此外,數(shù)字人文中“數(shù)字”與“人文”的雙向融合問題則更體現(xiàn)出定量研究的不足,需要大量的定性研究加以深入分析。數(shù)字人文整體上對(duì)科技相關(guān)主題趨利避害的缺點(diǎn)使得傳統(tǒng)人文研究變得束手束腳,甚至有些人文學(xué)者開始懷疑和否定他們在這個(gè)數(shù)字時(shí)代開展研究的本質(zhì)目的(Berry and Fagerjord,2017)[93]1。會(huì)不會(huì)編程的技能甚至一度成為進(jìn)入數(shù)字人文學(xué)術(shù)圈的門檻;人們重視技術(shù)有時(shí)片面地超過了重視人文主題。部分大學(xué)管理制度盲目地將數(shù)字人文誤認(rèn)為人文學(xué)科新的替代領(lǐng)域,認(rèn)為它能夠帶來新的技術(shù)、工作、資金和利益。這種“市場化”的數(shù)字人文因此被傳統(tǒng)人文學(xué)科所排斥(McGann,2014)[94],并出現(xiàn)了很多批評(píng)的聲音,認(rèn)為這種現(xiàn)象會(huì)將高等教育推向經(jīng)濟(jì)利益最大化的價(jià)值觀(Grusin,2013)[95]。當(dāng)然,這種被計(jì)算技術(shù)所“威脅”的想法是非常片面的。數(shù)字人文不僅以各種方式為傳統(tǒng)人文做出貢獻(xiàn),而人文社會(huì)學(xué)科歡迎和使用計(jì)算機(jī)進(jìn)行文本處理的歷史遠(yuǎn)早于其他大部分學(xué)科。在對(duì)計(jì)算機(jī)的應(yīng)用做出貢獻(xiàn)的同時(shí),數(shù)字人文學(xué)者更應(yīng)該與相對(duì)應(yīng)的人文學(xué)科加強(qiáng)聯(lián)系(Drucker,2012)[96],以回歸研究的初衷,堅(jiān)定人文內(nèi)容的核心地位(Siemens,2016)[1]。
在量化基礎(chǔ)上,對(duì)數(shù)字人文的進(jìn)一步了解可以緩和人文學(xué)者對(duì)“數(shù)字”相關(guān)研究的負(fù)面印象,并且可幫助人文學(xué)研究合理發(fā)展新的研究模式(Berry and Fagerjord,2017)[93]1。反過來從“數(shù)字”角度講,隨著數(shù)字人文的發(fā)展,越來越多的計(jì)算機(jī)學(xué)者加入到促進(jìn)人文學(xué)科技和新模式發(fā)展的潮流中。計(jì)算機(jī)專業(yè)的許多機(jī)構(gòu)和院系,都聘請(qǐng)了數(shù)字人文專家或人文學(xué)者來協(xié)助他們開展人文主題中的數(shù)字應(yīng)用工作和研究,如阿蘭圖靈大數(shù)據(jù)研究所(The Alan Turing Institute,2018)[97]以及谷歌數(shù)字博物館。此外,許多著名的國際計(jì)算機(jī)會(huì)議也逐漸涌現(xiàn)數(shù)字人文研究的相關(guān)主題,如WWW 2018會(huì)議(WWW2018,2018)[98]。
為適應(yīng)數(shù)字人文的發(fā)展潮流,人文學(xué)、社會(huì)學(xué)、計(jì)算機(jī)科學(xué)等相關(guān)學(xué)科需要建立對(duì)數(shù)字人文更全面的理解。這樣不僅可以避免人文學(xué)與大眾化的數(shù)字應(yīng)用社區(qū)隔離開來(Berry and Dieter,2015)[99],也可以使計(jì)算機(jī)學(xué)者獲得必備的人文學(xué)應(yīng)用知識(shí),并依此迎接新技術(shù)新思路的來臨。
注釋
①“數(shù)字人文”德語直譯應(yīng)該是“Digitale Geisteswissenschaften”,但是在德語語境下,大部分學(xué)者和機(jī)構(gòu)都使用“Digital Humanities”。
②ACH/ALLC 會(huì)議為ADHO 會(huì)議的前身,此后的ADHO 會(huì)議以“DH+年份”(如DH2016)的格式表示。
③圖片使用符合開放存取CC 4.0許可。