蘇芳荔 常人杰
數(shù)字人文,是對人文學(xué)科與計(jì)算之間的重合地帶進(jìn)行研究、創(chuàng)新的領(lǐng)域[1]26。從20世紀(jì)80年代初開始到20世紀(jì)末獲得較快發(fā)展,主要集中在文本分析與編目、語言特征、教學(xué)支持和學(xué)習(xí)環(huán)境、結(jié)構(gòu)化數(shù)據(jù)分析的影響等方面[2]190,如將古典文學(xué)資料轉(zhuǎn)為數(shù)字形式的珀?duì)栃匏鬼?xiàng)目、提出了文獻(xiàn)在文化歷史學(xué)家工作中的角色問題的暗影之谷(The Valley of The Shadow)項(xiàng)目等[3]55。數(shù)字人文的研究為人文學(xué)科提供新的視角,產(chǎn)生新的問題并進(jìn)行解答。數(shù)字人文研究所涉及的領(lǐng)域較多,在研究對象方面也呈現(xiàn)著多學(xué)科特征。
知識(shí)的產(chǎn)生與傳承離不開知識(shí)擴(kuò)散,同時(shí),知識(shí)擴(kuò)散還可以促進(jìn)知識(shí)創(chuàng)新?,F(xiàn)在,我們處在互聯(lián)網(wǎng)時(shí)代,信息需求量旺盛,所接觸的數(shù)據(jù)大部分都來自于各種網(wǎng)站與數(shù)據(jù)庫,可供選擇的數(shù)據(jù)源較多且獲取方便。對于大量的信息需求,研究知識(shí)擴(kuò)散的規(guī)律可以幫助降低獲取知識(shí)的成本,并大大提高效率。引用關(guān)系即代表知識(shí)擴(kuò)散[4]31。 “ 基于引文的知識(shí)擴(kuò)散 ” 是指知識(shí)在研究性文獻(xiàn)中的轉(zhuǎn)移[5]13。也有學(xué)者的研究把知識(shí)擴(kuò)散分為組織知識(shí)擴(kuò)散和學(xué)科知識(shí)擴(kuò)散[6]48??傮w而言,知識(shí)擴(kuò)散可以幫助學(xué)科的知識(shí)傳承并且還可以幫助學(xué)科創(chuàng)新。
1.數(shù)據(jù)選擇與獲取。Web of Science 是世界上最廣泛的學(xué)術(shù)信息資源數(shù)據(jù)庫,包括在各個(gè)研究領(lǐng)域影響力最大的核心學(xué)術(shù)期刊。以Web of Science 上2009—2018年收錄的有關(guān)數(shù)字人文的文獻(xiàn)為對象,從引文分析角度,對數(shù)字人文領(lǐng)域跨學(xué)科知識(shí)擴(kuò)散的現(xiàn)狀進(jìn)行分析研究。
本研究選取Web of Science 核心合集為研究數(shù)據(jù)庫,在主題字段中以 “ digital humanity ” or “ digital humanities ” 作為主題詞進(jìn)行檢索,文獻(xiàn)類型限定為 “ article ” ,時(shí)間范圍限定為2009—2018,索引數(shù)據(jù)庫包括SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH、BKCI-S、BKCI-SSH、ESCI、CCR-EXPANDED、IC。共獲得1710條文獻(xiàn)數(shù)據(jù),對檢索所得文獻(xiàn)記錄進(jìn)行下載,保存為原始文獻(xiàn)集。原始文獻(xiàn)總計(jì)被引6246 次,篇均被引3.65次,施引文獻(xiàn)共4775 篇。打開原始文獻(xiàn)檢索結(jié)果頁面引文分析中的施引文獻(xiàn)記錄,對施引文獻(xiàn)記錄進(jìn)行下載,定義為施引文獻(xiàn)集。
2.知識(shí)擴(kuò)散指標(biāo)。被引頻次受時(shí)間因素影響較大,在進(jìn)行知識(shí)擴(kuò)散分析時(shí)還需要考慮到時(shí)間因素的影響。知識(shí)擴(kuò)散指標(biāo)包括知識(shí)擴(kuò)散廣度、知識(shí)擴(kuò)散強(qiáng)度與知識(shí)擴(kuò)散速度。
(1)知識(shí)擴(kuò)散廣度(KDB)。廣度值是指某一領(lǐng)域文獻(xiàn)被引用總次數(shù)與統(tǒng)計(jì)時(shí)間段內(nèi)的年數(shù)的比值。公式為:
Ni為統(tǒng)計(jì)時(shí)間內(nèi)的被引總數(shù),Ypub表示從統(tǒng)計(jì)起點(diǎn)到終點(diǎn)的年數(shù)。學(xué)科的知識(shí)擴(kuò)散是一個(gè)逐漸積累上升的一個(gè)過程,累積擴(kuò)散廣度KDB*反映了一個(gè)學(xué)科知識(shí)擴(kuò)散的累積狀況,其計(jì)算公式如下:
其中Ni為第i年的被引次數(shù)。該指標(biāo)能夠更好地反映出學(xué)科知識(shí)擴(kuò)散廣度的積累發(fā)展情況,根據(jù)公式計(jì)算得到數(shù)字人文領(lǐng)域的累積擴(kuò)散廣度KDB*。
(2)知識(shí)擴(kuò)散強(qiáng)度(KDI)。A 學(xué)科被B 學(xué)科引用的數(shù)量除以總被引次數(shù)叫做A 學(xué)科對B 學(xué)科的知識(shí)擴(kuò)散強(qiáng)度,簡稱KDI,其計(jì)算公式為:
其中Ni為A 學(xué)科被B 學(xué)科引用的數(shù)量,∑Ni為A學(xué)科的總被引次數(shù)。
(3)知識(shí)擴(kuò)散速度(KDS)。知識(shí)擴(kuò)散速度(KDS)的計(jì)算公式為:
其中,Pcit表示不同引用期刊總數(shù),Ypub表示從統(tǒng)計(jì)起點(diǎn)到終點(diǎn)的年數(shù)。
1.跨學(xué)科知識(shí)擴(kuò)散分布。數(shù)字人文領(lǐng)域擴(kuò)散學(xué)科中,圖書情報(bào)學(xué)、計(jì)算機(jī)科學(xué)等占有較大比重,學(xué)科擴(kuò)散速度越來越快,擴(kuò)散學(xué)科越來越多,擴(kuò)散多樣性好。學(xué)科交叉融合背景下,學(xué)科的邊界正在逐漸被打破,通過互相合作實(shí)現(xiàn)學(xué)科間互利共贏、知識(shí)創(chuàng)新和優(yōu)勢互補(bǔ),學(xué)科間的互相滲透能夠細(xì)分出更多的交叉學(xué)科,實(shí)現(xiàn)學(xué)科的發(fā)展。學(xué)科知識(shí)的擴(kuò)散不僅能通過合作等方式達(dá)成,也能通過引用和被引達(dá)成。一個(gè)學(xué)科通過引用其他學(xué)科的知識(shí)來發(fā)展自己的研究。數(shù)字人文知識(shí)擴(kuò)散次數(shù)最多的學(xué)科多屬于人文與社會(huì)科學(xué)領(lǐng)域,圖書情報(bào)學(xué)對數(shù)字人文知識(shí)的吸收為19.23%,是最大的知識(shí)吸收學(xué)科,遠(yuǎn)遠(yuǎn)高于排在第二位的人文計(jì)算(374 次,9.58%),在知識(shí)擴(kuò)散接收方中占據(jù)核心地位。2009—2018年,數(shù)字人文領(lǐng)域文獻(xiàn)共被201 個(gè)學(xué)科引用,我國圖書情報(bào)學(xué)學(xué)科交叉能力快速增長,但綜合影響力仍然有限。
2.知識(shí)擴(kuò)散測度。
(1)知識(shí)擴(kuò)散廣度(KDB)分析。知識(shí)擴(kuò)散廣度是從范圍的角度對科研領(lǐng)域的知識(shí)擴(kuò)散進(jìn)行描述,指某一學(xué)科領(lǐng)域文獻(xiàn)的被引用次數(shù)除以年數(shù)的商。學(xué)科的知識(shí)擴(kuò)散是一個(gè)逐漸積累上升的過程,累積擴(kuò)散廣度KDB*是一個(gè)對于知識(shí)擴(kuò)散的修正指標(biāo),反映了一個(gè)學(xué)科知識(shí)擴(kuò)散的累積狀況。通過該指標(biāo)能夠更好地反映出學(xué)科知識(shí)擴(kuò)散廣度的積累發(fā)展情況,根據(jù)公式計(jì)算得到數(shù)字人文領(lǐng)域的累積擴(kuò)散廣度KDB*。數(shù)字人文相關(guān)研究的年度知識(shí)擴(kuò)散廣度如表1。
表1 數(shù)字人文領(lǐng)域逐年知識(shí)擴(kuò)散廣度
可以看出,數(shù)字人文領(lǐng)域知識(shí)擴(kuò)散廣度在十年間總體呈現(xiàn)上升趨勢,隨著大數(shù)據(jù)時(shí)代的到來,學(xué)科之間的知識(shí)交流增加,越來越多的學(xué)者開始關(guān)注數(shù)字人文與學(xué)科的融合。
(2)知識(shí)擴(kuò)散強(qiáng)度(KDI)分析。知識(shí)擴(kuò)散強(qiáng)度是從指定路徑上的頻次的角度對知識(shí)擴(kuò)散進(jìn)行描述,指定路徑上的擴(kuò)散次數(shù)越多,知識(shí)擴(kuò)散強(qiáng)度越大。Liu 和Rousseau 定義了 “ 學(xué)科擴(kuò)散廣度 ” ,A 學(xué)科被B 學(xué)科引用次數(shù)與總被引次數(shù)的比值為A 學(xué)科對B 學(xué)科的知識(shí)擴(kuò)散強(qiáng)度。知識(shí)擴(kuò)散強(qiáng)度可以體現(xiàn)本學(xué)科對其他學(xué)科的影響程度,2009—2018 十年間數(shù)字人文領(lǐng)域知識(shí)在不同學(xué)科的擴(kuò)散強(qiáng)度如表2 所示(見下頁)。
由表2 可知,受數(shù)字人文知識(shí)影響最大的學(xué)科是圖書情報(bào)學(xué),擴(kuò)散強(qiáng)度達(dá)到了0.120,其次為人文計(jì)算、教育研究。總體來看,數(shù)字人文知識(shí)對人文與社會(huì)科學(xué)領(lǐng)域?qū)W科的影響程度較大。值得注意的是,計(jì)算機(jī)相關(guān)學(xué)科雖然沒有排在擴(kuò)散學(xué)科高位,但是計(jì)算機(jī)科學(xué)在數(shù)字人文領(lǐng)域知識(shí)擴(kuò)散接收方中也占據(jù)著重要地位。
表2 數(shù)字人文領(lǐng)域知識(shí)擴(kuò)散學(xué)科強(qiáng)度TOP20
(3)知識(shí)擴(kuò)散速度(KDS)分析。知識(shí)擴(kuò)散速度描述的角度是從單位時(shí)間內(nèi)運(yùn)動(dòng)距離。對于擴(kuò)散目標(biāo)來說,所耗時(shí)間越短,擴(kuò)散速度越快。知識(shí)擴(kuò)散速度會(huì)影響到知識(shí)創(chuàng)新的進(jìn)步,知識(shí)擴(kuò)散的速度越快,會(huì)使知識(shí)共享與融合更加快捷和廣泛,降低知識(shí)創(chuàng)新成本,從而加速科技發(fā)展。2009—2018年數(shù)字人文領(lǐng)域1710 篇論文共被2025 個(gè)不同期刊引用。數(shù)字人文領(lǐng)域2009—2018十年間的知識(shí)擴(kuò)散速度見表3。
表3 數(shù)字人文領(lǐng)域每年知識(shí)擴(kuò)散速度
知識(shí)擴(kuò)散的速度可以用來衡量知識(shí)發(fā)展的快慢。加快知識(shí)擴(kuò)散的速度,可以有效減少可用知識(shí)流失。提高知識(shí)擴(kuò)散的速度可以減少獲取知識(shí)所需的時(shí)間,提升知識(shí)利用效率。表3 表明,知識(shí)擴(kuò)散速度整體呈明顯的逐年增長趨勢,知識(shí)擴(kuò)散速度越快,代表數(shù)字人文領(lǐng)域知識(shí)的利用率越高。
主路徑是在某一領(lǐng)域的引文網(wǎng)絡(luò)中具有最高遍歷值的一條引文路徑,計(jì)算的是一篇文獻(xiàn)與其他文獻(xiàn)連接時(shí)的需要程度。主路徑分析方法可以幫助有效地識(shí)別領(lǐng)域的知識(shí)變化,是一種基于 “ 連通性 ” 降低知識(shí)網(wǎng)絡(luò)復(fù)雜程度,提取關(guān)鍵路徑的定量和可視化方法,對于探測技術(shù)發(fā)展路徑具有重要意義。
本文首先利用Histcite 中的Graph Maker 作圖分析功能,采用搜索路徑計(jì)數(shù)(SPC),識(shí)別出2009—2018年數(shù)字人文研究領(lǐng)域研究內(nèi)容知識(shí)擴(kuò)散的主路徑主要有三條且較獨(dú)立,包含12 個(gè)節(jié)點(diǎn),大多處于知識(shí)擴(kuò)散網(wǎng)絡(luò)的核心位置。知識(shí)擴(kuò)散的過程中,新知識(shí)產(chǎn)生后隨著其不確定性的降低,知識(shí)接受者會(huì)先迅速增加然后逐漸下降,圖中知識(shí)擴(kuò)散主路徑呈現(xiàn)由分散到聚合的趨勢,表明數(shù)字人文研究逐漸成熟,界定更加清晰,形成核心研究領(lǐng)域。三條主路徑的信息見表4、5、6(見下頁)。
路徑1:由數(shù)字人文研究的方法論到與歷史學(xué)科結(jié)合的 “ 數(shù)字歷史 ” 的變化。數(shù)字人文本就是一個(gè)數(shù)字技術(shù)在科學(xué)研究領(lǐng)域普及的背景下,人文學(xué)科開始使用快速發(fā)展的網(wǎng)絡(luò)技術(shù)來進(jìn)行研究而發(fā)展起來的跨學(xué)科領(lǐng)域。由表4 中可以得出路徑1 的情況,原始數(shù)據(jù)時(shí)間段內(nèi),人文學(xué)科由如何與電子科學(xué)進(jìn)行融合的方法論研究,數(shù)字化的趨勢愈演愈烈,研究者需要相應(yīng)的工具來進(jìn)行研究工作,開始注重實(shí)踐當(dāng)中數(shù)字化研究的基礎(chǔ)設(shè)施的發(fā)展方向,然后開始關(guān)注領(lǐng)域發(fā)展出現(xiàn)的問題與爭議, “ 數(shù)字歷史 ” 受到關(guān)注。眾所周知,數(shù)字人文是一個(gè)文科與工科的交叉學(xué)科,其研究內(nèi)容與范圍受技術(shù)發(fā)展的影響很大。從目前國際數(shù)字人文研究趨勢來看,基于GIS 的歷史地理可視化是數(shù)字人文目前所受關(guān)注較多的研究方向。
路徑2:由對數(shù)字人文領(lǐng)域?qū)W科的譜系研究到數(shù)字人文與圖書館的結(jié)合研究,與歷史學(xué)科結(jié)合的數(shù)字歷史的變化。該路徑早期對數(shù)字人文進(jìn)行譜系研究,探討其發(fā)展等理論性研究,然后開始關(guān)注圖書館與數(shù)字人文研究之間進(jìn)行融合的現(xiàn)實(shí)性研究。
路徑3:由數(shù)字人文對人文學(xué)科的影響到數(shù)字人文學(xué)科與人文學(xué)科、圖書館的結(jié)合。早期關(guān)注點(diǎn)仍然在于數(shù)字技術(shù)與人文學(xué)科的融合方面,擔(dān)心數(shù)字技術(shù)正在對人文學(xué)科產(chǎn)生不利的影響,然后開始關(guān)注數(shù)字人文是否能促進(jìn)人文學(xué)科的發(fā)展以及數(shù)字人文與高等教育的關(guān)系,最后落腳點(diǎn)在圖書館與數(shù)字人文研究之間進(jìn)行融合的現(xiàn)實(shí)性研究。
整體看來,數(shù)字人文領(lǐng)域的總趨勢是由對學(xué)科自身特點(diǎn)及發(fā)展趨勢等理論研究,發(fā)展為與學(xué)科進(jìn)行融合發(fā)展的研究,如數(shù)字圖書館與數(shù)字歷史。從目前國際數(shù)字人文研究趨勢來看,數(shù)字圖書館、數(shù)字歷史都是數(shù)字人文研究前沿。
數(shù)字人文領(lǐng)域知識(shí)擴(kuò)散跨學(xué)科性越來越顯著,到2018年已擴(kuò)散至160 個(gè)學(xué)科。擴(kuò)散速度也是呈明顯增長趨勢,呈現(xiàn)了活躍的知識(shí)擴(kuò)散勢頭。數(shù)字人文領(lǐng)域知識(shí)擴(kuò)散的路徑主要有三種趨勢,總趨勢是由對學(xué)科自身特點(diǎn)及發(fā)展趨勢等理論研究,發(fā)展為與學(xué)科進(jìn)行融合發(fā)展的研究,如數(shù)字圖書館與數(shù)字歷史。從目前國際數(shù)字人文研究趨勢來看,數(shù)字圖書館、數(shù)字歷史(歷史地理可視化)都是數(shù)字人文研究前沿。數(shù)字人文領(lǐng)域的研究脈絡(luò)在不斷細(xì)分和深化,歷史學(xué)相關(guān)研究集中度較高,并有研究逐漸深化的趨勢。
表4 數(shù)字人文領(lǐng)域知識(shí)擴(kuò)散路徑1
表5 數(shù)字人文領(lǐng)域知識(shí)擴(kuò)散路徑2
表6 數(shù)字人文領(lǐng)域知識(shí)擴(kuò)散路徑3