蘇芳荔 常人杰
數(shù)字人文,是對人文學(xué)科與計算之間的重合地帶進行研究、創(chuàng)新的領(lǐng)域[1]26。從20世紀80年代初開始到20世紀末獲得較快發(fā)展,主要集中在文本分析與編目、語言特征、教學(xué)支持和學(xué)習(xí)環(huán)境、結(jié)構(gòu)化數(shù)據(jù)分析的影響等方面[2]190,如將古典文學(xué)資料轉(zhuǎn)為數(shù)字形式的珀爾修斯項目、提出了文獻在文化歷史學(xué)家工作中的角色問題的暗影之谷(The Valley of The Shadow)項目等[3]55。數(shù)字人文的研究為人文學(xué)科提供新的視角,產(chǎn)生新的問題并進行解答。數(shù)字人文研究所涉及的領(lǐng)域較多,在研究對象方面也呈現(xiàn)著多學(xué)科特征。
知識的產(chǎn)生與傳承離不開知識擴散,同時,知識擴散還可以促進知識創(chuàng)新?,F(xiàn)在,我們處在互聯(lián)網(wǎng)時代,信息需求量旺盛,所接觸的數(shù)據(jù)大部分都來自于各種網(wǎng)站與數(shù)據(jù)庫,可供選擇的數(shù)據(jù)源較多且獲取方便。對于大量的信息需求,研究知識擴散的規(guī)律可以幫助降低獲取知識的成本,并大大提高效率。引用關(guān)系即代表知識擴散[4]31。 “ 基于引文的知識擴散 ” 是指知識在研究性文獻中的轉(zhuǎn)移[5]13。也有學(xué)者的研究把知識擴散分為組織知識擴散和學(xué)科知識擴散[6]48??傮w而言,知識擴散可以幫助學(xué)科的知識傳承并且還可以幫助學(xué)科創(chuàng)新。
1.數(shù)據(jù)選擇與獲取。Web of Science 是世界上最廣泛的學(xué)術(shù)信息資源數(shù)據(jù)庫,包括在各個研究領(lǐng)域影響力最大的核心學(xué)術(shù)期刊。以Web of Science 上2009—2018年收錄的有關(guān)數(shù)字人文的文獻為對象,從引文分析角度,對數(shù)字人文領(lǐng)域跨學(xué)科知識擴散的現(xiàn)狀進行分析研究。
本研究選取Web of Science 核心合集為研究數(shù)據(jù)庫,在主題字段中以 “ digital humanity ” or “ digital humanities ” 作為主題詞進行檢索,文獻類型限定為 “ article ” ,時間范圍限定為2009—2018,索引數(shù)據(jù)庫包括SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH、BKCI-S、BKCI-SSH、ESCI、CCR-EXPANDED、IC。共獲得1710條文獻數(shù)據(jù),對檢索所得文獻記錄進行下載,保存為原始文獻集。原始文獻總計被引6246 次,篇均被引3.65次,施引文獻共4775 篇。打開原始文獻檢索結(jié)果頁面引文分析中的施引文獻記錄,對施引文獻記錄進行下載,定義為施引文獻集。
2.知識擴散指標。被引頻次受時間因素影響較大,在進行知識擴散分析時還需要考慮到時間因素的影響。知識擴散指標包括知識擴散廣度、知識擴散強度與知識擴散速度。
(1)知識擴散廣度(KDB)。廣度值是指某一領(lǐng)域文獻被引用總次數(shù)與統(tǒng)計時間段內(nèi)的年數(shù)的比值。公式為:
Ni為統(tǒng)計時間內(nèi)的被引總數(shù),Ypub表示從統(tǒng)計起點到終點的年數(shù)。學(xué)科的知識擴散是一個逐漸積累上升的一個過程,累積擴散廣度KDB*反映了一個學(xué)科知識擴散的累積狀況,其計算公式如下:
其中Ni為第i年的被引次數(shù)。該指標能夠更好地反映出學(xué)科知識擴散廣度的積累發(fā)展情況,根據(jù)公式計算得到數(shù)字人文領(lǐng)域的累積擴散廣度KDB*。
(2)知識擴散強度(KDI)。A 學(xué)科被B 學(xué)科引用的數(shù)量除以總被引次數(shù)叫做A 學(xué)科對B 學(xué)科的知識擴散強度,簡稱KDI,其計算公式為:
其中Ni為A 學(xué)科被B 學(xué)科引用的數(shù)量,∑Ni為A學(xué)科的總被引次數(shù)。
(3)知識擴散速度(KDS)。知識擴散速度(KDS)的計算公式為:
其中,Pcit表示不同引用期刊總數(shù),Ypub表示從統(tǒng)計起點到終點的年數(shù)。
1.跨學(xué)科知識擴散分布。數(shù)字人文領(lǐng)域擴散學(xué)科中,圖書情報學(xué)、計算機科學(xué)等占有較大比重,學(xué)科擴散速度越來越快,擴散學(xué)科越來越多,擴散多樣性好。學(xué)科交叉融合背景下,學(xué)科的邊界正在逐漸被打破,通過互相合作實現(xiàn)學(xué)科間互利共贏、知識創(chuàng)新和優(yōu)勢互補,學(xué)科間的互相滲透能夠細分出更多的交叉學(xué)科,實現(xiàn)學(xué)科的發(fā)展。學(xué)科知識的擴散不僅能通過合作等方式達成,也能通過引用和被引達成。一個學(xué)科通過引用其他學(xué)科的知識來發(fā)展自己的研究。數(shù)字人文知識擴散次數(shù)最多的學(xué)科多屬于人文與社會科學(xué)領(lǐng)域,圖書情報學(xué)對數(shù)字人文知識的吸收為19.23%,是最大的知識吸收學(xué)科,遠遠高于排在第二位的人文計算(374 次,9.58%),在知識擴散接收方中占據(jù)核心地位。2009—2018年,數(shù)字人文領(lǐng)域文獻共被201 個學(xué)科引用,我國圖書情報學(xué)學(xué)科交叉能力快速增長,但綜合影響力仍然有限。
2.知識擴散測度。
(1)知識擴散廣度(KDB)分析。知識擴散廣度是從范圍的角度對科研領(lǐng)域的知識擴散進行描述,指某一學(xué)科領(lǐng)域文獻的被引用次數(shù)除以年數(shù)的商。學(xué)科的知識擴散是一個逐漸積累上升的過程,累積擴散廣度KDB*是一個對于知識擴散的修正指標,反映了一個學(xué)科知識擴散的累積狀況。通過該指標能夠更好地反映出學(xué)科知識擴散廣度的積累發(fā)展情況,根據(jù)公式計算得到數(shù)字人文領(lǐng)域的累積擴散廣度KDB*。數(shù)字人文相關(guān)研究的年度知識擴散廣度如表1。
表1 數(shù)字人文領(lǐng)域逐年知識擴散廣度
可以看出,數(shù)字人文領(lǐng)域知識擴散廣度在十年間總體呈現(xiàn)上升趨勢,隨著大數(shù)據(jù)時代的到來,學(xué)科之間的知識交流增加,越來越多的學(xué)者開始關(guān)注數(shù)字人文與學(xué)科的融合。
(2)知識擴散強度(KDI)分析。知識擴散強度是從指定路徑上的頻次的角度對知識擴散進行描述,指定路徑上的擴散次數(shù)越多,知識擴散強度越大。Liu 和Rousseau 定義了 “ 學(xué)科擴散廣度 ” ,A 學(xué)科被B 學(xué)科引用次數(shù)與總被引次數(shù)的比值為A 學(xué)科對B 學(xué)科的知識擴散強度。知識擴散強度可以體現(xiàn)本學(xué)科對其他學(xué)科的影響程度,2009—2018 十年間數(shù)字人文領(lǐng)域知識在不同學(xué)科的擴散強度如表2 所示(見下頁)。
由表2 可知,受數(shù)字人文知識影響最大的學(xué)科是圖書情報學(xué),擴散強度達到了0.120,其次為人文計算、教育研究??傮w來看,數(shù)字人文知識對人文與社會科學(xué)領(lǐng)域?qū)W科的影響程度較大。值得注意的是,計算機相關(guān)學(xué)科雖然沒有排在擴散學(xué)科高位,但是計算機科學(xué)在數(shù)字人文領(lǐng)域知識擴散接收方中也占據(jù)著重要地位。
表2 數(shù)字人文領(lǐng)域知識擴散學(xué)科強度TOP20
(3)知識擴散速度(KDS)分析。知識擴散速度描述的角度是從單位時間內(nèi)運動距離。對于擴散目標來說,所耗時間越短,擴散速度越快。知識擴散速度會影響到知識創(chuàng)新的進步,知識擴散的速度越快,會使知識共享與融合更加快捷和廣泛,降低知識創(chuàng)新成本,從而加速科技發(fā)展。2009—2018年數(shù)字人文領(lǐng)域1710 篇論文共被2025 個不同期刊引用。數(shù)字人文領(lǐng)域2009—2018十年間的知識擴散速度見表3。
表3 數(shù)字人文領(lǐng)域每年知識擴散速度
知識擴散的速度可以用來衡量知識發(fā)展的快慢。加快知識擴散的速度,可以有效減少可用知識流失。提高知識擴散的速度可以減少獲取知識所需的時間,提升知識利用效率。表3 表明,知識擴散速度整體呈明顯的逐年增長趨勢,知識擴散速度越快,代表數(shù)字人文領(lǐng)域知識的利用率越高。
主路徑是在某一領(lǐng)域的引文網(wǎng)絡(luò)中具有最高遍歷值的一條引文路徑,計算的是一篇文獻與其他文獻連接時的需要程度。主路徑分析方法可以幫助有效地識別領(lǐng)域的知識變化,是一種基于 “ 連通性 ” 降低知識網(wǎng)絡(luò)復(fù)雜程度,提取關(guān)鍵路徑的定量和可視化方法,對于探測技術(shù)發(fā)展路徑具有重要意義。
本文首先利用Histcite 中的Graph Maker 作圖分析功能,采用搜索路徑計數(shù)(SPC),識別出2009—2018年數(shù)字人文研究領(lǐng)域研究內(nèi)容知識擴散的主路徑主要有三條且較獨立,包含12 個節(jié)點,大多處于知識擴散網(wǎng)絡(luò)的核心位置。知識擴散的過程中,新知識產(chǎn)生后隨著其不確定性的降低,知識接受者會先迅速增加然后逐漸下降,圖中知識擴散主路徑呈現(xiàn)由分散到聚合的趨勢,表明數(shù)字人文研究逐漸成熟,界定更加清晰,形成核心研究領(lǐng)域。三條主路徑的信息見表4、5、6(見下頁)。
路徑1:由數(shù)字人文研究的方法論到與歷史學(xué)科結(jié)合的 “ 數(shù)字歷史 ” 的變化。數(shù)字人文本就是一個數(shù)字技術(shù)在科學(xué)研究領(lǐng)域普及的背景下,人文學(xué)科開始使用快速發(fā)展的網(wǎng)絡(luò)技術(shù)來進行研究而發(fā)展起來的跨學(xué)科領(lǐng)域。由表4 中可以得出路徑1 的情況,原始數(shù)據(jù)時間段內(nèi),人文學(xué)科由如何與電子科學(xué)進行融合的方法論研究,數(shù)字化的趨勢愈演愈烈,研究者需要相應(yīng)的工具來進行研究工作,開始注重實踐當中數(shù)字化研究的基礎(chǔ)設(shè)施的發(fā)展方向,然后開始關(guān)注領(lǐng)域發(fā)展出現(xiàn)的問題與爭議, “ 數(shù)字歷史 ” 受到關(guān)注。眾所周知,數(shù)字人文是一個文科與工科的交叉學(xué)科,其研究內(nèi)容與范圍受技術(shù)發(fā)展的影響很大。從目前國際數(shù)字人文研究趨勢來看,基于GIS 的歷史地理可視化是數(shù)字人文目前所受關(guān)注較多的研究方向。
路徑2:由對數(shù)字人文領(lǐng)域?qū)W科的譜系研究到數(shù)字人文與圖書館的結(jié)合研究,與歷史學(xué)科結(jié)合的數(shù)字歷史的變化。該路徑早期對數(shù)字人文進行譜系研究,探討其發(fā)展等理論性研究,然后開始關(guān)注圖書館與數(shù)字人文研究之間進行融合的現(xiàn)實性研究。
路徑3:由數(shù)字人文對人文學(xué)科的影響到數(shù)字人文學(xué)科與人文學(xué)科、圖書館的結(jié)合。早期關(guān)注點仍然在于數(shù)字技術(shù)與人文學(xué)科的融合方面,擔心數(shù)字技術(shù)正在對人文學(xué)科產(chǎn)生不利的影響,然后開始關(guān)注數(shù)字人文是否能促進人文學(xué)科的發(fā)展以及數(shù)字人文與高等教育的關(guān)系,最后落腳點在圖書館與數(shù)字人文研究之間進行融合的現(xiàn)實性研究。
整體看來,數(shù)字人文領(lǐng)域的總趨勢是由對學(xué)科自身特點及發(fā)展趨勢等理論研究,發(fā)展為與學(xué)科進行融合發(fā)展的研究,如數(shù)字圖書館與數(shù)字歷史。從目前國際數(shù)字人文研究趨勢來看,數(shù)字圖書館、數(shù)字歷史都是數(shù)字人文研究前沿。
數(shù)字人文領(lǐng)域知識擴散跨學(xué)科性越來越顯著,到2018年已擴散至160 個學(xué)科。擴散速度也是呈明顯增長趨勢,呈現(xiàn)了活躍的知識擴散勢頭。數(shù)字人文領(lǐng)域知識擴散的路徑主要有三種趨勢,總趨勢是由對學(xué)科自身特點及發(fā)展趨勢等理論研究,發(fā)展為與學(xué)科進行融合發(fā)展的研究,如數(shù)字圖書館與數(shù)字歷史。從目前國際數(shù)字人文研究趨勢來看,數(shù)字圖書館、數(shù)字歷史(歷史地理可視化)都是數(shù)字人文研究前沿。數(shù)字人文領(lǐng)域的研究脈絡(luò)在不斷細分和深化,歷史學(xué)相關(guān)研究集中度較高,并有研究逐漸深化的趨勢。
表4 數(shù)字人文領(lǐng)域知識擴散路徑1
表5 數(shù)字人文領(lǐng)域知識擴散路徑2
表6 數(shù)字人文領(lǐng)域知識擴散路徑3