文/李桂芬
數(shù)字人文最初起源自“人文計(jì)算”,其公認(rèn)的開端是1949年羅伯托·布薩(Roberto Busa)神父與IBM合作,對(duì)圣托馬斯·阿奎那的作品和《死海古卷》進(jìn)行數(shù)字化編譯。20世紀(jì)70年代,英國(guó)學(xué)者開始涉足這個(gè)領(lǐng)域,隨后數(shù)字人文傳播到整個(gè)歐洲和美國(guó),并于近20年間在全球掀起了研究熱潮。
經(jīng)過多年發(fā)展,數(shù)字人文的基本概念仍有爭(zhēng)議,但總體來說,數(shù)字人文就是將計(jì)算技術(shù)應(yīng)用于人文學(xué)科,利用創(chuàng)新的計(jì)算機(jī)和數(shù)字技術(shù),推動(dòng)和轉(zhuǎn)變藝術(shù)、文學(xué)、歷史、哲學(xué)及其他社會(huì)科學(xué)和人文學(xué)科的學(xué)術(shù)研究,以形成新的知識(shí)或?qū)χR(shí)進(jìn)行再加工。數(shù)字人文主要涉及數(shù)字化內(nèi)容(語(yǔ)料庫(kù))、數(shù)字/計(jì)算工具、跨學(xué)科協(xié)作、研究和教學(xué)等多個(gè)方面,本文將從這幾個(gè)方面通過最新的研究范例多角度呈現(xiàn)數(shù)字人文的發(fā)展與趨勢(shì)。
數(shù)字內(nèi)容是數(shù)字人文開展分析與研究的基礎(chǔ),目前采用數(shù)字人文研究方法最多的是歷史、文學(xué)、語(yǔ)言、藝術(shù)等學(xué)科,因此,大部分?jǐn)?shù)字人文研究項(xiàng)目的數(shù)據(jù)來源是保存在圖書館、博物館和檔案館中的歷史文獻(xiàn)資料。學(xué)者面臨的挑戰(zhàn)是如何找到并收集他們研究所需的文獻(xiàn)資料,轉(zhuǎn)錄或翻譯其中的文本,并將其整理并整合為可供文本分析和數(shù)據(jù)挖掘的數(shù)字化內(nèi)容。數(shù)字內(nèi)容的精準(zhǔn)識(shí)別與維度拓展提供了數(shù)字人文研究的新思路。
第一,數(shù)字內(nèi)容的精準(zhǔn)識(shí)別。數(shù)字化文本的質(zhì)量決定著分析結(jié)果所能夠呈現(xiàn)的關(guān)聯(lián)和意義,因此,文獻(xiàn)數(shù)字化所用的技術(shù)——光學(xué)字符識(shí)別(OCR,用于印刷文本)和手寫文本識(shí)別(HTR,用于手稿)——一直是數(shù)字人文領(lǐng)域的焦點(diǎn)。此外,除了字符識(shí)別的準(zhǔn)確性,歷史手稿不同版本的修改,尤其是刪減往往也影響著分析結(jié)果和結(jié)論。
第二,數(shù)字內(nèi)容的時(shí)空拓展。在文字之外,物品、工藝品、圖像、聲音、空間、表演、儀式也都可以成為數(shù)字人文的研究對(duì)象。數(shù)字人文研究重新聚焦于現(xiàn)實(shí)媒介,通過3D建模和3D打印、虛擬現(xiàn)實(shí)、聲光處理等數(shù)字工具從多個(gè)維度復(fù)制和重現(xiàn)研究對(duì)象所處的獨(dú)特時(shí)空,保存歷史遺產(chǎn)和文化傳承。較為復(fù)雜的項(xiàng)目則需要更高級(jí)軟硬件的支持和跨學(xué)科、跨領(lǐng)域的協(xié)作。
數(shù)字工具通常被認(rèn)為是用于分析、處理和呈現(xiàn)數(shù)據(jù)的應(yīng)用軟件。多年來,尤其是過去20年間,人文學(xué)者與計(jì)算機(jī)科學(xué)家合作,構(gòu)建出以全新方式實(shí)現(xiàn)人文學(xué)科研究目的的工具,推動(dòng)了人文學(xué)者的研究工作,大大提高了多方位解讀人類生活、思想和行為的歷史記錄的可能性與效率。這些創(chuàng)新性的工具帶來的也是數(shù)字人文研究方法的創(chuàng)新。
數(shù)字人文研究中使用的數(shù)字工具大致分為四類:一是基于文本的工具,包括文本分析、文本注釋、文本轉(zhuǎn)化和編碼、文本編輯和處理、文本挖掘、文本識(shí)別(光學(xué)字符識(shí)別、手寫文本識(shí)別、音樂識(shí)別、語(yǔ)音識(shí)別等)以及文本轉(zhuǎn)錄(語(yǔ)音轉(zhuǎn)文字、文字轉(zhuǎn)文字)和文本可視化;二是基于數(shù)據(jù)的工具,包括數(shù)據(jù)管理系統(tǒng)、數(shù)據(jù)采集、數(shù)據(jù)分析、數(shù)據(jù)管理(包括數(shù)據(jù)遷移和數(shù)據(jù)存儲(chǔ))、數(shù)據(jù)可視化和地圖繪制工具等;三是基于圖像和聲音的工具,包括圖像創(chuàng)建、圖像處理(包括編輯、注釋和標(biāo)記)、3D建模、3D打印、視頻和音頻處理工具等;四是基于結(jié)果的工具,例如撰寫博客、頭腦風(fēng)暴、協(xié)作工具、交流工具、組織工具、出版和分享(包括網(wǎng)站開發(fā))工具、同行評(píng)審、搜索工具(包括圖形搜索)等。數(shù)字工具的全新開發(fā)帶來了新維度、新視角與新的研究路徑。
第一,數(shù)字工具的多功能開發(fā)。在實(shí)際的數(shù)字人文研究流程中,一種工具可能兼具多種功能,學(xué)者們可以利用現(xiàn)有的應(yīng)用軟件,也會(huì)根據(jù)自己研究的需求定制開發(fā)自己的工具。Gale公司于2018年發(fā)布的Gale數(shù)字學(xué)術(shù)實(shí)驗(yàn)室(Gale Digital Scholar Lab)將語(yǔ)料庫(kù)創(chuàng)建和管理、文本和數(shù)據(jù)分析與可視化、結(jié)果導(dǎo)出與分享整合在一個(gè)平臺(tái)上,解決了眾多數(shù)字人文學(xué)者在編程和計(jì)算機(jī)技術(shù)方面的障礙。其中,整合的6種分析工具都是目前數(shù)字人文領(lǐng)域知名開發(fā)者開發(fā)的最常用的工具。
第二,數(shù)字工具帶來的新維度與新視角。在數(shù)字人文蓬勃發(fā)展的今天,個(gè)體開發(fā)者、大學(xué)、研究機(jī)構(gòu)和商業(yè)公司都在不斷開發(fā)新的數(shù)字學(xué)術(shù)工具,幫助各種研究方向的數(shù)字人文學(xué)者更快速、更輕松地揭示海量文本和數(shù)據(jù)中存在的錯(cuò)綜復(fù)雜的關(guān)聯(lián),從新的維度和視角去理解歷史、社會(huì)和文化,為人文學(xué)科建立新的研究路徑。例如:Stefan Bornhofen和Marten Düring利用Intergraph——一項(xiàng)基于圖形的、用于探索和研究歷史文獻(xiàn)典藏內(nèi)容的視覺分析演示技術(shù),對(duì)大約15 000份發(fā)表于1945年以后有關(guān)歐洲一體化的數(shù)字化文獻(xiàn),繪制出了語(yǔ)料庫(kù)中出現(xiàn)和同時(shí)出現(xiàn)命名實(shí)體的多層次、動(dòng)態(tài)關(guān)系圖,為研究者優(yōu)化語(yǔ)料庫(kù)、改進(jìn)關(guān)系圖結(jié)構(gòu)提供了思路。
第三,數(shù)字工具對(duì)數(shù)字內(nèi)容的新演繹。虛擬現(xiàn)實(shí)(VR)不僅僅是科技界的發(fā)展熱點(diǎn),它在數(shù)字人文領(lǐng)域的應(yīng)用也愈來愈受到重視。這項(xiàng)技術(shù)也可以用于文字記錄的歷史,例如,Laia PujolˉTost開發(fā)了一種用于設(shè)計(jì)數(shù)字考古虛擬現(xiàn)實(shí)體驗(yàn)的新方法3D·CoD,并選擇了聯(lián)合國(guó)教科文組織世界遺產(chǎn)土耳其加泰土丘新石器時(shí)代遺址作為這種全新考古虛擬重建技術(shù)的理論和方法學(xué)基礎(chǔ),建立了“文化存在”(Cultural Presence)概念的實(shí)例。
盡管有越來越多的數(shù)字化內(nèi)容可供數(shù)字人文學(xué)者進(jìn)行挖掘和分析,越來越多的數(shù)字工具幫助學(xué)者們更便捷地獲得可視化分析結(jié)果,研究者、圖書館以及計(jì)算機(jī)專家之間的協(xié)作仍是數(shù)字人文領(lǐng)域的重要組成部分。Jasmijn Van Gorp和Marc Bron通過對(duì)荷蘭數(shù)字人文項(xiàng)目BRIDGE日常研究工作的觀察強(qiáng)調(diào)了數(shù)字人文中跨學(xué)科協(xié)作的重要性。Gabriele Griffin和Matt Steven Hayler提出協(xié)作是數(shù)字人文研究的標(biāo)志,在近幾年的數(shù)字人文研究工作中存在幾種不同類型的協(xié)作:人—人互動(dòng)、人—機(jī)器/材料互動(dòng)和機(jī)器/材料—機(jī)器/材料互動(dòng)。
隨著數(shù)字學(xué)術(shù)對(duì)大學(xué)和研究機(jī)構(gòu)內(nèi)人文研究從研究?jī)?nèi)容、研究方法上帶來的轉(zhuǎn)變,培養(yǎng)學(xué)生們的數(shù)字素養(yǎng)和數(shù)字學(xué)術(shù)技能也逐漸成為很多大學(xué)和圖書館的教學(xué)重點(diǎn)之一。教師聯(lián)合數(shù)字開發(fā)人員和圖書館員之力將數(shù)字人文引入課堂,開闊學(xué)生們的思路和視野,為學(xué)生們未來的研究工作提供多種可能性已經(jīng)成為培養(yǎng)學(xué)生研究能力的新趨勢(shì)。數(shù)字學(xué)術(shù)的發(fā)展,也帶來了對(duì)現(xiàn)有教學(xué)方法與教學(xué)評(píng)價(jià)體系的思考與重構(gòu)。
歐洲和美國(guó)在數(shù)字人文領(lǐng)域獨(dú)占鰲頭,有很多的私人和公共機(jī)構(gòu)提供資金支持?jǐn)?shù)字人文的發(fā)展,這些機(jī)構(gòu)不但資助數(shù)字人文研究,開發(fā)新技術(shù)和新工具,也幫助建設(shè)數(shù)字人文基礎(chǔ)設(shè)施。亞太地區(qū)的數(shù)字人文研究雖起步較晚,但近幾年發(fā)展勢(shì)頭也很迅猛,從最初以了解和探討西方的數(shù)字人文實(shí)踐為主,到逐漸建立對(duì)數(shù)字人文研究的支持和協(xié)作。國(guó)際合作已經(jīng)逐漸成為數(shù)字人文領(lǐng)域的重要標(biāo)志性特點(diǎn)。
數(shù)字人文組織聯(lián)盟(Alliance of Digital Humanities Organizations,ADHO)是國(guó)際性數(shù)字人文組織中的典型代表。它成立于2004年,旨在推動(dòng)和支持國(guó)際性的數(shù)字人文研究和教學(xué),致力于幫助學(xué)者在數(shù)字人文研究、出版、協(xié)作和培訓(xùn)中取得更出色的成果。
歐洲數(shù)字人文協(xié)會(huì)成立于1973年,最初立足文學(xué)與語(yǔ)言計(jì)算,現(xiàn)在已拓展到更廣泛的人文學(xué)科,并廣泛涉足新聞、出版、教育、國(guó)際會(huì)議等領(lǐng)域,是歐洲數(shù)字人文學(xué)科的代表。加拿大數(shù)字人文學(xué)會(huì)每年組織數(shù)字人文國(guó)際年會(huì),是加拿大人文和社會(huì)科學(xué)聯(lián)合會(huì)組織的社會(huì)科學(xué)和人文科學(xué)大會(huì)的一部分。日本數(shù)字人文協(xié)會(huì)成立于2011年,致力于為國(guó)際數(shù)字人文研究活動(dòng)提供服務(wù)。日本的數(shù)字人文研究主要集中在語(yǔ)言學(xué)、文學(xué)和歷史領(lǐng)域,同時(shí),日本的人文科學(xué)與計(jì)算機(jī)研究會(huì)(SIGˉCH)在過去的30年中也一直從計(jì)算機(jī)角度在日本的數(shù)字人文領(lǐng)域發(fā)揮重要作用。澳洲數(shù)字人文協(xié)會(huì)是澳大利亞數(shù)字人文的主要倡導(dǎo)者,其資金來源主要為政府資助,發(fā)起的研究項(xiàng)目往往與政府當(dāng)前的政策議題密切相關(guān)。上述協(xié)會(huì)都已加入數(shù)字人文組織聯(lián)盟。
除了澳洲與日本,亞太地區(qū)新加坡與韓國(guó)在數(shù)字人文上的發(fā)展也引人矚目。多語(yǔ)種、跨學(xué)科和視聽研究項(xiàng)目是新加坡數(shù)字人文的突出特點(diǎn),新加坡數(shù)字人文研究不僅涉及傳統(tǒng)的語(yǔ)言和文學(xué)、哲學(xué)、法律、地理、歷史、藝術(shù)史、音樂等領(lǐng)域,還涉及人類學(xué)、博物館學(xué)、表演藝術(shù)和視覺藝術(shù)領(lǐng)域。而在韓國(guó),瓦格納·宋科舉考試項(xiàng)目(WagnerˉSong Munkwa Project)自20世紀(jì)60年代啟動(dòng),持續(xù)30多年,在朝鮮歷史研究和韓國(guó)數(shù)字人文領(lǐng)域都留下了不可磨滅的印記。21世紀(jì)初,商業(yè)驅(qū)動(dòng)的“人文內(nèi)涵”(Humanities Content)主導(dǎo)了韓國(guó)的數(shù)字人文發(fā)展,近年來越來越多的學(xué)者加入數(shù)字人文運(yùn)動(dòng)中,迫切地想要學(xué)習(xí)和嘗試新的數(shù)字方法,拓寬和深化他們的研究。
在中國(guó),數(shù)字人文方興未艾,北京大學(xué)、中國(guó)人民大學(xué)、南京大學(xué)、武漢大學(xué)、清華大學(xué)都先后成立了數(shù)字人文研究中心,也多次舉辦數(shù)字人文研討會(huì)交流最新研究項(xiàng)目、工具和平臺(tái),并在中國(guó)古詩(shī)詞、地方志、中國(guó)古代人物、古代遺址地理信息系統(tǒng)等方面取得了很多出色的研究成果。其中,最為著名的就是北京大學(xué)與哈佛大學(xué)等合作的中國(guó)歷代人物傳記資料庫(kù)(CBˉDB)項(xiàng)目。
臺(tái)灣地區(qū)數(shù)位人文學(xué)會(huì)則已連續(xù)舉辦了12屆“數(shù)位典藏與數(shù)位人文國(guó)際研討會(huì)”,每年圍繞一個(gè)具體的主題邀請(qǐng)海內(nèi)外數(shù)字人文學(xué)者分享和探討新的研究方向、方法和工具,并在2018年年中加入了ADHO聯(lián)盟,在國(guó)際上的影響力正在逐漸提高。
近年來中國(guó)在數(shù)字人文上的研究也進(jìn)入了新的領(lǐng)域和方向,例如:香港大學(xué)建筑系的OCEAN CN顧問網(wǎng)絡(luò)項(xiàng)目,通過對(duì)工業(yè)范式轉(zhuǎn)變的歷史和理論分析,推測(cè)出技術(shù)與城市文化關(guān)系的變化趨勢(shì)和發(fā)展方向,從而建立交互式城市模型,并最終將計(jì)算和制造技術(shù)應(yīng)用于21世紀(jì)的城市建設(shè);臺(tái)灣的數(shù)位文化中心組織探討的如何在現(xiàn)有的語(yǔ)意網(wǎng)標(biāo)準(zhǔn)和最佳操作原則下構(gòu)建知識(shí)組織體系(KOS),如何設(shè)計(jì)和表現(xiàn)數(shù)字資產(chǎn)中的數(shù)據(jù)以便讓普通用戶和機(jī)器都能夠處理和理解等研究主題,都在從多個(gè)角度推動(dòng)數(shù)字人文跨學(xué)科的研究和討論。
綜觀數(shù)字人文領(lǐng)域的這些最新研究范例,數(shù)字人文近年來在數(shù)字內(nèi)容識(shí)別、數(shù)字工具與平臺(tái)開發(fā)等基礎(chǔ)設(shè)施建設(shè)、數(shù)據(jù)分析、歷史重現(xiàn)等研究方式方法上都取得了突出成效,同時(shí)也在不斷嘗試和突破學(xué)科、技術(shù)與時(shí)空的壁壘。綜合來看,數(shù)字人文的發(fā)展重點(diǎn)與發(fā)展趨勢(shì)主要集中在以下四點(diǎn):
第一,為跨學(xué)科研究破壁。數(shù)字人文從一開始就是以跨學(xué)科交叉研究的全新面貌出現(xiàn),破除數(shù)字與人文之間的障礙,建立數(shù)字與人文的有機(jī)結(jié)合,一直是數(shù)字人文的發(fā)展方向。多學(xué)科的協(xié)同推進(jìn)與共同參與在現(xiàn)今的數(shù)字人文研究中非常常見。但不同學(xué)科之間如何進(jìn)行融合、如何打破壁壘、如何破除邊界,仍是數(shù)字人文領(lǐng)域時(shí)常探討的重要命題。
第二,廣泛開展機(jī)構(gòu)、區(qū)域與國(guó)際合作。數(shù)字人文的蓬勃發(fā)展除了來源于其跨學(xué)科的有機(jī)結(jié)合帶來的全新研究范式,也來自其跨機(jī)構(gòu)合作、區(qū)域合作及國(guó)際合作帶來的對(duì)研究領(lǐng)域、研究深度、研究技術(shù)支持的全新突破。數(shù)字人文作為一個(gè)新興發(fā)展領(lǐng)域,要想突破瓶頸,應(yīng)對(duì)缺乏統(tǒng)一的國(guó)際國(guó)內(nèi)共同標(biāo)準(zhǔn)、不同理念不同制度的碰撞以及來自學(xué)術(shù)研究?jī)?nèi)部的資料獲取及技術(shù)性限制等挑戰(zhàn),開闊視野、開展更廣泛的合作是有效的解決辦法。
第三,培養(yǎng)具備數(shù)字技術(shù)素養(yǎng)的跨學(xué)科人才是數(shù)字人文教育的重要目標(biāo)。數(shù)字技術(shù)的極速發(fā)展革新了人文研究解決問題的方法,人文學(xué)者需要積極主動(dòng)地?fù)肀Ъ夹g(shù)進(jìn)步,使數(shù)字技術(shù)與人文研究形成良性互動(dòng),才能推動(dòng)數(shù)字人文的發(fā)展。培養(yǎng)兼?zhèn)鋽?shù)字技術(shù)與人文知識(shí)的跨學(xué)科人才是未來數(shù)字人文領(lǐng)域人才培養(yǎng)的重要目標(biāo)。
第四,重視圖書館在數(shù)字人文的發(fā)展中的重要作用??梢钥吹?,很多重要數(shù)字人文項(xiàng)目的研究過程中都有圖書館員的參與。一是許多項(xiàng)目的基礎(chǔ)數(shù)據(jù)、歷史資料、相關(guān)文獻(xiàn)等研究基礎(chǔ)來源于圖書館的館藏;二是圖書館的基礎(chǔ)設(shè)施建設(shè)可以為研究者提供數(shù)據(jù)管理、數(shù)據(jù)存儲(chǔ)服務(wù)以及研究交流平臺(tái)等支持;三是圖書館員在文獻(xiàn)搜集、檢索、標(biāo)引等方面的專業(yè)能力也契合數(shù)字人文項(xiàng)目的研究需要。
過去的10年里,數(shù)字人文在國(guó)外發(fā)展快速,研究與實(shí)踐日新月異。我國(guó)在數(shù)字人文發(fā)展上,雖然諸多頂級(jí)高校正在努力建設(shè)基礎(chǔ)設(shè)施,積極參與數(shù)字人文研究的國(guó)際合作,組織數(shù)字人文研討會(huì)促進(jìn)學(xué)術(shù)交流,但因?yàn)槠鸩捷^晚、研究項(xiàng)目多圍繞中國(guó)歷史和文化,同時(shí)存在一定的語(yǔ)言障礙,見之于國(guó)際性期刊和國(guó)際性數(shù)字人文研討會(huì)的成果比較少,國(guó)際影響力仍待提高。強(qiáng)化基礎(chǔ)研究,開發(fā)適合漢語(yǔ)研究環(huán)境的前沿工具和平臺(tái),建立更加多元化的研究方法,推動(dòng)促進(jìn)多學(xué)科領(lǐng)域的跨學(xué)科數(shù)字人文研究,這些都將有助于提升國(guó)內(nèi)數(shù)字人文的研究水平和國(guó)際影響力。數(shù)字人文的發(fā)展來自創(chuàng)新發(fā)展的需求,在國(guó)際國(guó)內(nèi)的發(fā)展都仍有無限可能。