孫宗緣 馬秀峰
(1曲阜師范大學(xué)傳媒學(xué)院,山東日照 276826;2曲阜師范大學(xué)繼續(xù)教育學(xué)院,山東曲阜 273165)
“美國(guó)數(shù)字圖書(shū)館計(jì)劃”于1994年啟動(dòng)[1],自此作為傳統(tǒng)信息時(shí)代圖書(shū)館的延伸與擴(kuò)展[2]——數(shù)字圖書(shū)館開(kāi)始出現(xiàn)。歷經(jīng)數(shù)十年的快速發(fā)展,數(shù)字圖書(shū)館已成為集數(shù)據(jù)資源為一體、以用戶為中心、以各種信息技術(shù)為手段的綜合分布式平臺(tái)[3]。隨著人類進(jìn)入到數(shù)據(jù)科學(xué)社會(huì),數(shù)字圖書(shū)館的研究和建設(shè)受到了前所未有的重視,學(xué)界針對(duì)數(shù)字圖書(shū)館領(lǐng)域進(jìn)行了多維度的深入探索。國(guó)外已有學(xué)者對(duì)該領(lǐng)域相關(guān)研究成果做了綜述,較有代表性的是:里烏利用發(fā)表在圖書(shū)情報(bào)科學(xué)期刊上的577篇文獻(xiàn)進(jìn)行計(jì)量分析,重點(diǎn)關(guān)注組織和人的問(wèn)題,包括哪些涉及社會(huì)、文化、法律、道德和使用維度的問(wèn)題[4];吉姆采用仿形分析、平行最近鄰聚類和基于聚類的網(wǎng)絡(luò)方法分析“數(shù)字圖書(shū)館”的相關(guān)研究領(lǐng)域[5];狄克瑪在對(duì)四個(gè)不同數(shù)據(jù)庫(kù)進(jìn)行全面檢索的基礎(chǔ)上,分析了多語(yǔ)種數(shù)字圖書(shū)館的核心文獻(xiàn),并對(duì)這一主題的文獻(xiàn)進(jìn)行了闡述[6]。但經(jīng)過(guò)十余年的發(fā)展,國(guó)外數(shù)字圖書(shū)館研究領(lǐng)域已出現(xiàn)許多新的研究分支與生長(zhǎng)點(diǎn),并產(chǎn)出了很多新穎的研究成果[7]。因此,重新對(duì)國(guó)外數(shù)字圖書(shū)館的研究發(fā)展情況進(jìn)行系統(tǒng)梳理是很有必要的。本文以R語(yǔ)言為分析工具對(duì)相關(guān)文獻(xiàn)進(jìn)行了深入分析探討,以期為后續(xù)相關(guān)研究作出一定的貢獻(xiàn)。
為精選研究樣本,文獻(xiàn)選取WOS核心數(shù)據(jù)庫(kù)為數(shù)據(jù)源,并行設(shè)置“Subject”和“Title”均出現(xiàn)“digital library”的檢索條件,時(shí)間框選定為2006年初至2019年末,檢索并導(dǎo)出全記錄與引用的參考文獻(xiàn)共計(jì)990篇樣本文獻(xiàn)。本文采用“R語(yǔ)言+文獻(xiàn)計(jì)量分析法+文獻(xiàn)調(diào)查法+內(nèi)容分析法”對(duì)研究樣本進(jìn)行分析。
首先,通過(guò)R語(yǔ)言自編程序分別提取出文獻(xiàn)的發(fā)文時(shí)間、高被引作者、高被引文獻(xiàn)、文獻(xiàn)所屬期刊以及文獻(xiàn)產(chǎn)出機(jī)構(gòu)這五個(gè)要素所對(duì)應(yīng)的數(shù)據(jù)。其次,清理提取出的數(shù)據(jù):在文獻(xiàn)發(fā)文時(shí)間分析中,檢索并剔除空值年份的文獻(xiàn),共計(jì)得到990篇有效文獻(xiàn);在高被引作者分析中,通過(guò)自編程序?qū)ψ髡哌M(jìn)行消歧工作(包括剔除匿名作者),計(jì)算得到作者的全局被引次數(shù)(TC)與本地被引次數(shù)(LCS),選取出TC值與LCS值排名在前20位的作者(共計(jì)35位作者);在高被引文獻(xiàn)分析中,提取出選定樣本的TC值以及本地21981條參考文獻(xiàn)所產(chǎn)生的LCS值,選定排名在前20位的文獻(xiàn)(共計(jì)33篇)配以“作者+出版時(shí)間+期刊簡(jiǎn)稱”的關(guān)鍵信息;在文獻(xiàn)所屬期刊的分析中,提取出“J”類型的期刊文獻(xiàn)共計(jì)947篇,利用布拉德福定律進(jìn)行核心區(qū)、中間區(qū)、后繼區(qū)的計(jì)算;在文獻(xiàn)產(chǎn)出機(jī)構(gòu)分析中,通過(guò)檢索出文獻(xiàn)樣本所屬“Institute”數(shù)據(jù),對(duì)產(chǎn)出自同一機(jī)構(gòu)的文獻(xiàn)進(jìn)行累加,并將其按照降序排列;然后利用ggmap、cowplot等程輯包和ggplot函數(shù)分別生成發(fā)文時(shí)間分布圖譜、高影響作者圖譜、高影響文獻(xiàn)圖譜、高影響期刊圖譜、以及高影響機(jī)構(gòu)發(fā)文散點(diǎn)圖,最后以控制臺(tái)運(yùn)行plcstop函數(shù)獲取各文獻(xiàn)DOI編號(hào),以便檢索到對(duì)應(yīng)文獻(xiàn)進(jìn)行內(nèi)容深度解析。
文獻(xiàn)發(fā)表時(shí)間的分布情況可以在一定程度上反映該研究領(lǐng)域某階段的研究情況。在圖1中,橫坐標(biāo)為年份,左邊標(biāo)尺為年均發(fā)文量,右邊標(biāo)尺為總計(jì)發(fā)文量,紅色折線對(duì)應(yīng)年均發(fā)文量,藍(lán)色折線對(duì)應(yīng)總計(jì)發(fā)文量。
3.1.1 發(fā)文時(shí)間階段研究
研究結(jié)果表明,國(guó)外數(shù)字圖書(shū)館領(lǐng)域的相關(guān)研究大致經(jīng)過(guò)了三個(gè)階段,第一階段為快速萌芽期(2006-2008年),發(fā)文量共304篇,年均達(dá)101篇,且在2006年,發(fā)文量達(dá)到頂峰(136篇),這一階段僅為3年,但研究?jī)?nèi)容已涉及到數(shù)字圖書(shū)館領(lǐng)域的多個(gè)方面,如數(shù)字圖書(shū)館的使用、發(fā)展、咨詢服務(wù)方面,影響用戶使用的因素方面以及用戶使用的意愿等,為后續(xù)研究做了重要的鋪墊。第二階段為發(fā)展波動(dòng)期(2009-2015年),發(fā)文量共487篇,年均69篇,這一階段持續(xù)了7年,發(fā)文量上下?lián)u擺度大。隨著計(jì)算機(jī)分析與圖譜繪制工具的出現(xiàn),在該研究階段計(jì)算機(jī)科學(xué)領(lǐng)域與圖書(shū)情報(bào)科學(xué)領(lǐng)域具有較大的交叉強(qiáng)度,評(píng)價(jià)模型、知識(shí)系統(tǒng)與復(fù)雜算法的探索與實(shí)證成為該階段的重要研究?jī)?nèi)容。第三階段為穩(wěn)定增長(zhǎng)期(2016-2019年),發(fā)文量共199篇,年均49篇,此階段處于國(guó)外數(shù)字圖書(shū)館研究領(lǐng)域的成熟時(shí)期,發(fā)文量沒(méi)有出現(xiàn)很強(qiáng)的波峰,研究者多關(guān)注于數(shù)字圖書(shū)館的系統(tǒng)評(píng)價(jià)模型和未來(lái)發(fā)展趨勢(shì)等方面,在該階段各領(lǐng)域的交叉融合度進(jìn)一步加深,數(shù)字圖書(shū)館領(lǐng)域的跨學(xué)科性進(jìn)一步彰顯。
3.1.2 發(fā)文峰值點(diǎn)及趨勢(shì)研究
從圖1可以觀察到有兩處高峰值年限點(diǎn)(2006年,2014年)。2006年收錄的文獻(xiàn)數(shù)為136,在圖中處于最高值。這是由于在2006年,以美國(guó)為首開(kāi)展的數(shù)字圖書(shū)館項(xiàng)目在世界各地紛紛啟動(dòng),各國(guó)對(duì)數(shù)字圖書(shū)館領(lǐng)域開(kāi)始了不同程度的探索。其中,美國(guó)在2006年產(chǎn)出了59篇文獻(xiàn),占全年數(shù)量的43.38%,為該領(lǐng)域貢獻(xiàn)最多的國(guó)家;而中國(guó)總計(jì)產(chǎn)出5篇文獻(xiàn),占比僅為3.68%。相較于美國(guó)的探索程度來(lái)說(shuō),我國(guó)此時(shí)仍處于萌芽階段,研究進(jìn)展相差懸殊。在2014年,美國(guó)產(chǎn)出26篇文獻(xiàn),占全部文獻(xiàn)量的28.89%,仍居于貢獻(xiàn)榜首,而中國(guó)共計(jì)發(fā)文12篇,占比12.22%。相較于前一峰值點(diǎn),中國(guó)產(chǎn)出文獻(xiàn)占比和產(chǎn)出文獻(xiàn)數(shù)均有大幅增長(zhǎng),反映出中國(guó)對(duì)數(shù)字圖書(shū)館領(lǐng)域的研究進(jìn)入了加速發(fā)展階段。
從整體趨勢(shì)上看年均發(fā)文數(shù)量呈下降趨勢(shì),這并不是說(shuō)明該領(lǐng)域不受重視,主要原因在于國(guó)外針對(duì)該領(lǐng)域的研究已達(dá)到穩(wěn)定期,經(jīng)作者計(jì)算,得到該領(lǐng)域的總體發(fā)文趨勢(shì)線為y=65.903x+99.582,R2=0.9856,R2趨近于1,預(yù)測(cè)該領(lǐng)域在2020年的發(fā)文總量將保持在50篇左右,總體呈穩(wěn)定增長(zhǎng)的態(tài)勢(shì)。
為進(jìn)一步分析該領(lǐng)域內(nèi)的高影響力作者,文獻(xiàn)通過(guò)TC與LCS指標(biāo)對(duì)作者進(jìn)行學(xué)術(shù)評(píng)價(jià)。TC是指被WOS核心數(shù)據(jù)庫(kù)全局引用的總次數(shù),LCS是指在特定領(lǐng)域內(nèi)被引用的總次數(shù),在本文中特指WOS核心數(shù)據(jù)庫(kù)中的數(shù)字圖書(shū)館領(lǐng)域。將兩圖中重復(fù)出現(xiàn)的作者用底線標(biāo)注,研究結(jié)果如圖2所示。
圖1 文獻(xiàn)樣本時(shí)間分布圖譜
圖2 高影響作者圖譜
3.2.1 作者整體分析
由圖可知,在TC圖與LCS圖均出現(xiàn)的作者共有五位,分別為埃雷拉·維德瑪、弗里亞斯·馬丁內(nèi)斯、陳淑珍、謝鴻、加布里佐,其中作者埃雷拉·維德瑪以被引558次在TC值排名中居于絕對(duì)領(lǐng)先的位置,其被引用次數(shù)為絕大多數(shù)作者均次的4-5倍。經(jīng)R語(yǔ)言解析發(fā)現(xiàn)該作者的發(fā)文多圍繞決策算法、層次模型、系統(tǒng)模型等主題,主要被計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域、信息科學(xué)與工程領(lǐng)域、圖書(shū)情報(bào)科學(xué)領(lǐng)域引用,一方面說(shuō)明了該作者產(chǎn)出的文獻(xiàn)質(zhì)量高、影響力大,受到了相關(guān)研究領(lǐng)域的重視;同時(shí)表明了該作者產(chǎn)出文獻(xiàn)的可交叉性、可適用性、可融合性較高,在一定程度上加速了跨學(xué)科領(lǐng)域的融合與發(fā)展。在TC值中位居第二位的作者波塞爾被引次數(shù)也較高(322次),經(jīng)分析該作者的文獻(xiàn)多以模糊決策、復(fù)雜算法、推薦系統(tǒng)為研究主題,其發(fā)文主要被計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域、知識(shí)系統(tǒng)領(lǐng)域、圖書(shū)情報(bào)科學(xué)領(lǐng)域所引用。值得注意的是,該作者就數(shù)字圖書(shū)館設(shè)計(jì)了多學(xué)科資源推薦服務(wù)系統(tǒng),為后續(xù)資源推薦系統(tǒng)的研究做了重要支撐。同時(shí),考察到波塞爾與埃雷拉·維德瑪有多次科研協(xié)作,這也是該作者被引次數(shù)較高的原因之一。通過(guò)對(duì)TC值為100左右的作者進(jìn)行考察,發(fā)現(xiàn)大多數(shù)作者的研究方向均不唯一,主要分布在數(shù)字圖書(shū)館領(lǐng)域用戶行為研究方面、用戶需求實(shí)證研究方面,數(shù)字圖書(shū)館系統(tǒng)搭建、應(yīng)用與評(píng)價(jià)方面和計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域復(fù)雜算法、系統(tǒng)模型方面,所采用的研究方法也涉及到多個(gè)學(xué)科門類,促進(jìn)了不同領(lǐng)域之間的知識(shí)流動(dòng)。
從LCS圖中可知,相鄰作者被引次數(shù)相差較小,并沒(méi)有出現(xiàn)TC圖中的斷崖式下降。但是,最大值與最小值的差值也達(dá)4倍之多,這與TC圖基本保持一致。作者謝鴻以LCS值42居首位,說(shuō)明在數(shù)字圖書(shū)館特定領(lǐng)域內(nèi),作者謝鴻具有重要的領(lǐng)頭作用。分析其相關(guān)文獻(xiàn),發(fā)現(xiàn)該作者的高被引論文均為數(shù)字圖書(shū)館評(píng)估與評(píng)價(jià)研究方向。隨著數(shù)字圖書(shū)館的發(fā)展,采用什么樣的評(píng)估體系與如何評(píng)價(jià)數(shù)字圖書(shū)館是必不可少的方面;且該作者的發(fā)文多集中于《Evaluation of digital libraries》系列圖書(shū),這也是該作者在數(shù)字圖書(shū)館領(lǐng)域引證高的原因之一。LCS圖中的其他作者,可認(rèn)為是數(shù)字圖書(shū)館領(lǐng)域內(nèi)的中堅(jiān)作者。通過(guò)分析其發(fā)文分布,發(fā)現(xiàn)數(shù)字圖書(shū)館體系、用戶與數(shù)字圖書(shū)館、數(shù)字圖書(shū)館服務(wù)是重點(diǎn)研究方向。因多數(shù)作者研究方向不存在絕對(duì)的專一性,所以后續(xù)研究者就自身研究點(diǎn)在引用文獻(xiàn)時(shí)具有一定的主觀選擇性,從而使得中堅(jiān)作者被引情況呈現(xiàn)溫和下降的局面。
3.2.2 作者位次變化分析
對(duì)比兩圖中同一作者的位次變化可知,有3位作者位次下降,2位作者位次上升。其中,弗里亞斯·馬丁內(nèi)斯下降了14位,是下降位次最多的作者;埃雷拉·維德瑪下降1位;陳淑珍下降了2位;謝鴻上升了6個(gè)位次,是位次上升最多的作者;加布里佐上升了3位。分析得出,在TC圖中研究者普遍涉及到兩個(gè)或多個(gè)研究領(lǐng)域,研究范圍大幅度交叉,因此施引作者也分布在計(jì)算機(jī)科學(xué)、工程科學(xué)、管理學(xué)、圖書(shū)情報(bào)學(xué)等多個(gè)領(lǐng)域。例如作者埃雷拉·維德瑪就語(yǔ)言評(píng)估背景下研究了群體決策一致性模型,該文獻(xiàn)在計(jì)算機(jī)科學(xué)領(lǐng)域、工程科學(xué)領(lǐng)域、圖書(shū)情報(bào)領(lǐng)域均有引用且頻次不一,說(shuō)明該文獻(xiàn)具有較強(qiáng)的普適性和奠基性,也解釋了該作者在TC值中位居前茅的原因,佐證了該作者的學(xué)術(shù)影響力。對(duì)于下降位次較多的作者也可做相同的解釋,但這不能說(shuō)明該作者的學(xué)術(shù)能力弱,只能說(shuō)明該作者的論文還未被特定領(lǐng)域所大范圍引用。另外,本文認(rèn)為位次上升的作者是數(shù)字圖書(shū)館領(lǐng)域研究的專攻員,如作者謝鴻發(fā)文大多為數(shù)字圖書(shū)館評(píng)估體系方向,被引次數(shù)高說(shuō)明該作者產(chǎn)出的文獻(xiàn)質(zhì)量?jī)?yōu)越,為該分支研究領(lǐng)域作出了重要貢獻(xiàn)。
在TC圖與LCS圖中,有30位作者只出現(xiàn)一次,這說(shuō)明不論是在WOS全局核心數(shù)據(jù)庫(kù)中,還是限于數(shù)字圖書(shū)館領(lǐng)域,研究者對(duì)于該領(lǐng)域有著較高的關(guān)注度,且因絕大多數(shù)作者的研究方向均涉及多個(gè)研究領(lǐng)域,研究方法也常出現(xiàn)交叉或借鑒,也在一定程度上印證了數(shù)字圖書(shū)館是學(xué)科背景豐富、融合度高、交叉性強(qiáng)的研究領(lǐng)域。
高被引文獻(xiàn)是一個(gè)領(lǐng)域研究發(fā)展中支柱性的存在,對(duì)領(lǐng)域的發(fā)展有著重要的導(dǎo)向作用,本研究同樣以TC、LCS指標(biāo)去勘探數(shù)字圖書(shū)館領(lǐng)域的高被引文獻(xiàn),TC圖是選定文獻(xiàn)在核心數(shù)據(jù)庫(kù)中被引用次數(shù)的可視化展現(xiàn),LCS圖是在本地21981條參考文獻(xiàn)中生成,將兩圖中重復(fù)出現(xiàn)的文獻(xiàn)用底線標(biāo)注。
圖3 高影響文獻(xiàn)圖譜
3.3.1 文獻(xiàn)整體分析
由圖可知,在TC圖和LCS圖中共現(xiàn)的文獻(xiàn)共計(jì)7篇,主要涉及到數(shù)字圖書(shū)館推薦系統(tǒng)方向、數(shù)字資源整合方向、數(shù)字圖書(shū)館的評(píng)估方向和用戶研究方向。作者波塞爾以文獻(xiàn)被引154次居首位,其被引次數(shù)為最低文獻(xiàn)被引次數(shù)的3倍左右,該文獻(xiàn)提出了一種模糊語(yǔ)言推薦系統(tǒng),能夠更好的獲取用戶偏好,以此方便數(shù)字圖書(shū)館資源的充分利用。經(jīng)R語(yǔ)言分析其引文網(wǎng)絡(luò)發(fā)現(xiàn),該文獻(xiàn)的被引領(lǐng)域高達(dá)29個(gè),其中引用次數(shù)最多的是計(jì)算機(jī)科學(xué)領(lǐng)域、信息系統(tǒng)領(lǐng)域以及跨學(xué)科應(yīng)用領(lǐng)域,充分表現(xiàn)出該文獻(xiàn)的跨學(xué)科性和多元融合性。TC圖中其他文獻(xiàn)從不同方法、不同維度、不同時(shí)間上進(jìn)行研究,絕大多數(shù)文獻(xiàn)均涉及到2-3個(gè)研究領(lǐng)域以及不同學(xué)科的研究方法,從不同的學(xué)科背景推動(dòng)了該研究領(lǐng)域的進(jìn)展。
文本觀察到在TC值圖中,作者波塞爾與作者謝鴻均產(chǎn)出2篇文獻(xiàn),但作者波塞爾產(chǎn)出的2篇文獻(xiàn)均沒(méi)有在LCS圖中出現(xiàn),原因在于這2篇文獻(xiàn)的內(nèi)容均具有較強(qiáng)的學(xué)科交叉性,多被計(jì)算機(jī)科學(xué)人工智能領(lǐng)域、計(jì)算機(jī)科學(xué)信息系統(tǒng)領(lǐng)域所引用;此外,LCS圖僅展示選定樣本的在數(shù)字圖書(shū)館領(lǐng)域前20位高被引文獻(xiàn),經(jīng)R語(yǔ)言查看后續(xù)排名驗(yàn)證,發(fā)現(xiàn)這2篇文獻(xiàn)均在圖書(shū)情報(bào)學(xué)領(lǐng)域被引用5次。
在LCS圖中,相鄰文獻(xiàn)被引次數(shù)差值隨名次下降而緩慢下降,但是,首末文獻(xiàn)的被引次數(shù)也差3倍之多,這與TC圖基本保持一致。其中,作者謝鴻在2008年產(chǎn)出的文獻(xiàn)以23次被引居首位,該文從用戶角度出發(fā),闡述了用戶看待數(shù)字圖書(shū)館評(píng)價(jià)的標(biāo)準(zhǔn)和問(wèn)題。這篇文獻(xiàn)在數(shù)字圖書(shū)館評(píng)價(jià)、數(shù)字圖書(shū)館評(píng)估體系、數(shù)字圖書(shū)館用戶研究中均有引用。LCS圖中的其他文獻(xiàn),均可認(rèn)為是數(shù)字圖書(shū)館領(lǐng)域的專研文獻(xiàn),對(duì)于數(shù)字圖書(shū)館分支領(lǐng)域的發(fā)展具有重要的意義。
3.3.2 文獻(xiàn)時(shí)區(qū)分析
在選定樣本中2008年,2012年產(chǎn)出高被引文獻(xiàn)最多,分別為9篇,5篇,可認(rèn)定是對(duì)數(shù)字圖書(shū)館領(lǐng)域做出重要貢獻(xiàn)的年份??疾?008年與2012年的高被引文獻(xiàn)內(nèi)容,發(fā)現(xiàn)主要的研究方向是數(shù)字圖書(shū)館的服務(wù)改進(jìn)與相關(guān)建議、對(duì)圖書(shū)館質(zhì)量的評(píng)估以及用戶與數(shù)字圖書(shū)館系統(tǒng)的關(guān)聯(lián),其中最有代表性的觀點(diǎn)有:作者諾吾奧德在2008年以個(gè)人差異和系統(tǒng)特征作為感知易用性的決定因素,探討了“抗拒改變”RTC與高校數(shù)字圖書(shū)館感知易用性之間的關(guān)系,提高了數(shù)字圖書(shū)館被使用的效率與質(zhì)量[8]。作者唐杰在2012年提出了一種動(dòng)態(tài)估計(jì)人數(shù)進(jìn)行名稱消岐的兩步參數(shù)估算法,并提出優(yōu)于聚類算法的概率框架,為模糊消岐工作做出了巨大的貢獻(xiàn)[9]。與此同時(shí),作者謝鴻以用戶為基點(diǎn),讓用戶親身體驗(yàn)兩個(gè)數(shù)字圖書(shū)館,并寫(xiě)出他們的評(píng)價(jià)標(biāo)準(zhǔn)與評(píng)估結(jié)果,進(jìn)一步探討了數(shù)字圖書(shū)館評(píng)價(jià)標(biāo)準(zhǔn)的感知重要性、數(shù)字圖書(shū)館的使用與數(shù)字圖書(shū)館評(píng)價(jià)之間的關(guān)系以及用戶對(duì)數(shù)字圖書(shū)館評(píng)價(jià)的偏好、經(jīng)驗(yàn)和知識(shí)結(jié)構(gòu)[10]。
3.3.3 文獻(xiàn)位次變化分析
在共現(xiàn)的7篇文獻(xiàn)中,作者謝鴻產(chǎn)出了2篇文獻(xiàn)。考察這7篇文獻(xiàn)的位次變化發(fā)現(xiàn):作者帕克在2009年發(fā)表的一文由左圖第2名下降到右圖第18名,下降了16位,是下降名次最多的文獻(xiàn),作者諾吾奧德在2008年發(fā)出的文獻(xiàn)也由TC值第7位下降到15位,下降了11個(gè)位次,羅斯在2008年產(chǎn)出的文獻(xiàn)上升了3個(gè)位次,作者查克納斯在2008年產(chǎn)出的文獻(xiàn)由位次14上升到第9位,同時(shí)作者施里法馬迪在2008年產(chǎn)出的文獻(xiàn)也由TC值排名中的18位上升到了LCS圖中的第11位,而作者謝鴻的兩篇文獻(xiàn)均呈現(xiàn)不同位次的上升情況,其中一篇從位次11上升到第3位,另一篇從位次15躍居到LCS圖首位,是上升位次最多的文獻(xiàn)。
文獻(xiàn)位次下降并不表明該文獻(xiàn)質(zhì)量低、影響力低。相反正是該文獻(xiàn)具有一定影響力的體現(xiàn),因?yàn)槲墨I(xiàn)是被多個(gè)領(lǐng)域所引用,只是某一文獻(xiàn)在數(shù)字圖書(shū)館領(lǐng)域中被引數(shù)較低;又因文獻(xiàn)研究的方向較為獨(dú)特、切入點(diǎn)不同,也是導(dǎo)致引用數(shù)量較低的因素。如作者帕克在2009年發(fā)表的論文:以發(fā)展中國(guó)家為切入點(diǎn),從宏觀出發(fā)探索影響各國(guó)用戶使用數(shù)字圖書(shū)館的因素,并為促進(jìn)發(fā)展中國(guó)家成功采用數(shù)字圖書(shū)館系統(tǒng),借用技術(shù)接受模型ATM測(cè)試數(shù)字圖書(shū)館在發(fā)展中國(guó)家的適用性[11],通過(guò)引文網(wǎng)絡(luò)分析發(fā)現(xiàn)該文獻(xiàn)被25個(gè)領(lǐng)域的不同作者所引用,引用領(lǐng)域并不集中于數(shù)字圖書(shū)館領(lǐng)域,但在本文限定核心數(shù)據(jù)庫(kù)數(shù)字圖書(shū)館領(lǐng)域中的21981條參考文獻(xiàn)中,被引用次數(shù)不是那么高。針對(duì)在TC圖轉(zhuǎn)向LCS圖位次出現(xiàn)上升的文獻(xiàn),可判定為專研數(shù)字圖書(shū)館領(lǐng)域的文獻(xiàn)。最具代表性的是作者謝鴻在圖書(shū)中《Discover Digital Libraries》刊登的兩篇文獻(xiàn),分析其內(nèi)容發(fā)現(xiàn)兩篇文獻(xiàn)均為從用戶的角度探尋數(shù)字圖書(shū)館的評(píng)價(jià)標(biāo)準(zhǔn),并基于用戶主體的判斷標(biāo)準(zhǔn)匯編了質(zhì)量收集量表,最后借助分析結(jié)果揭示了當(dāng)前數(shù)字圖書(shū)館設(shè)計(jì)與開(kāi)發(fā)中存在的問(wèn)題,提出改進(jìn)數(shù)字圖書(shū)館設(shè)計(jì)的建議[12]。該文認(rèn)為數(shù)字圖書(shū)館的評(píng)估不僅要確保其正確的演化,而且要得到用戶和應(yīng)用群體的接受。這個(gè)觀點(diǎn)在現(xiàn)在看來(lái)仍具有至關(guān)重要的意義,因此在數(shù)字圖書(shū)館領(lǐng)域中存在較高的引用值。
因高影響文獻(xiàn)在一定程度上對(duì)所屬期刊有影響,所以本文在高影響文獻(xiàn)的基礎(chǔ)上,繼續(xù)分析該領(lǐng)域的高影響期刊。本文樣本數(shù)據(jù)僅來(lái)自于WOS核心數(shù)據(jù)庫(kù),并不能代表整個(gè)領(lǐng)域的研究狀況,因此會(huì)在計(jì)算數(shù)值上產(chǎn)生相對(duì)偏差,但布拉德福定律仍對(duì)我們探尋該領(lǐng)域的高影響期刊具有一定的幫助。借助R語(yǔ)言得到核心區(qū)期刊散點(diǎn)圖,如圖4。其中主圖是按照布拉德福定律繪制的核心期刊圖(因圖幅面積有限,僅展示核心區(qū)期刊名稱),輔圖是按照核心期刊年均載文量進(jìn)行統(tǒng)計(jì)說(shuō)明的期刊散點(diǎn)圖。
圖4 高影響期刊圖譜
3.4.1 主圖分析
在主圖中,橫坐標(biāo)為核心期刊名稱,縱坐標(biāo)表示期刊所收錄的文獻(xiàn)數(shù)量,陰影部分面積為期刊收錄文獻(xiàn)數(shù)量的反映,圖中的數(shù)據(jù)框表示按照布拉德福定律劃分的核心區(qū)、中間區(qū)、后繼區(qū)三個(gè)區(qū)域。在主圖我們可以看出核心區(qū)共有8種期刊,從左到右依次標(biāo)號(hào)為1-8號(hào),這8種期刊分別是《ELECTRONIC LIBRARY》《PROGRAM-ELECTRONIC LIBRARY AND INFORMATION SYSTEMS》《JOURNAL OF ACADEMIC LIBRARIANSHIP》《ONLINE INFC ORMATION REVIEW》《LIBRARY HI TECH》《JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY》《LIBRARY JOURNAL》和《INFORMATION RESEARCH-AN INTERNATIONAL EL ECTRONIC JOURNAL》。數(shù)據(jù)顯示這8種期刊包含了321篇核心文獻(xiàn),共占比樣本文獻(xiàn)的33.90%;中間區(qū)共有27種期刊,刊登了317篇核心文獻(xiàn),占總文獻(xiàn)數(shù)的33.47%;后繼區(qū)共有197種期刊,收錄了309篇核心文獻(xiàn),占總數(shù)的32.63%??稍谝欢ǔ潭壬险f(shuō)明數(shù)字圖書(shū)館領(lǐng)域的論文大量集中在一定數(shù)量的核心期刊上,剩余部分則依次分散在大量相關(guān)期刊中。
3.4.2 輔圖分析
輔圖是對(duì)核心區(qū)期刊的進(jìn)一步直觀解釋。其中,橫坐標(biāo)代表年份,縱坐標(biāo)從上到下依次對(duì)應(yīng)于1-8號(hào)期刊名稱,圖中的黑色圓圈為該期刊在對(duì)應(yīng)年份收錄的核心論文數(shù),黑點(diǎn)越大說(shuō)明文獻(xiàn)數(shù)越多,反之越少。為便于觀察,設(shè)置頻次在2以下的文獻(xiàn)數(shù)不予顯示,并用數(shù)字標(biāo)明期刊所收錄的文獻(xiàn)數(shù)。橫向來(lái)看,1-8號(hào)期刊收錄文獻(xiàn)數(shù)按遞減順序排列,其中1號(hào)期刊所收錄數(shù)字圖書(shū)館領(lǐng)域核心文獻(xiàn)數(shù)最多為110篇,其余期刊收錄數(shù)量遠(yuǎn)低于1號(hào)(均量為20-30篇),與1號(hào)期刊存在顯著差異,可說(shuō)明1號(hào)期刊具有較高的影響力,并且獲得了學(xué)者們的廣泛關(guān)注??v向來(lái)看,僅有1號(hào)期刊和5號(hào)期刊在2006-2019年時(shí)間內(nèi)連續(xù)收錄了核心文獻(xiàn),其余期刊都存在間斷收錄現(xiàn)象。這是因?yàn)槎鄶?shù)期刊所涵蓋多個(gè)領(lǐng)域,例如2號(hào)期刊涉及到計(jì)算機(jī)科學(xué)領(lǐng)域、以及信息科學(xué)領(lǐng)域和圖書(shū)情報(bào)科學(xué)領(lǐng)域,但是自2016年之后,便未收錄數(shù)字圖書(shū)館領(lǐng)域內(nèi)文獻(xiàn),因此在本研究中出現(xiàn)空白,側(cè)面印證了1號(hào)、5號(hào)期刊的生命力。
3.4.3 主題演化分析
文獻(xiàn)將核心區(qū)期刊在每年發(fā)表的文獻(xiàn)數(shù)進(jìn)行豎向相加,得到每一年的發(fā)表的文獻(xiàn)總數(shù)。經(jīng)計(jì)算,2011年發(fā)表文獻(xiàn)26篇、2014年發(fā)表文獻(xiàn)30篇,2017年發(fā)表文獻(xiàn)16篇,這三個(gè)年份發(fā)文量均高于相鄰年份,可作為拐點(diǎn)輔助說(shuō)明該領(lǐng)域的主題演化趨勢(shì)。
通過(guò)程序分析8種選定核心區(qū)期刊在2006-2011年、2012-2014年、2015-2017年和2018-2019年發(fā)布的文獻(xiàn),即將每一時(shí)間段所發(fā)表的文獻(xiàn)進(jìn)行主題提取并精煉匯總,按照時(shí)間序列分析數(shù)字圖書(shū)館領(lǐng)域內(nèi)的主題演化情況,可作如下總結(jié):在數(shù)字圖書(shū)研究初期(2006-2011年),該領(lǐng)域的探索主題集中在圖書(shū)館信息服務(wù)、用戶如何更好的利用圖書(shū)館,以及用戶研究上;第二階段(2012-2014年)利用WEB技術(shù)加強(qiáng)了對(duì)于大學(xué)圖書(shū)館的研究,并對(duì)于電子圖書(shū)館、學(xué)術(shù)圖書(shū)館領(lǐng)域展開(kāi)了相關(guān)探索,涉及到數(shù)字圖書(shū)館系統(tǒng)搭建以及設(shè)計(jì)等問(wèn)題;第三個(gè)階段(2015-2017年)主要勘探了數(shù)字圖書(shū)館系統(tǒng)質(zhì)量、個(gè)人數(shù)字圖書(shū)館、數(shù)字圖書(shū)館的未來(lái)等相關(guān)方面的研究;現(xiàn)如今(2018-2019年)研究主題集中于數(shù)字圖書(shū)館的發(fā)展機(jī)遇、用戶對(duì)于數(shù)字圖書(shū)館的滿意程度、數(shù)字圖書(shū)館科學(xué)接受模型、數(shù)字圖書(shū)館的發(fā)展趨勢(shì)上。從宏觀來(lái)看,針對(duì)數(shù)字圖書(shū)館領(lǐng)域的探索范圍持續(xù)擴(kuò)大、研究線索趨向細(xì)化、研究思路走向多元、應(yīng)用方法更加科學(xué),交叉融合更為豐富。
通過(guò)考察發(fā)文機(jī)構(gòu)產(chǎn)出的文獻(xiàn)數(shù),來(lái)判別數(shù)字圖書(shū)館領(lǐng)域中的高影響機(jī)構(gòu),結(jié)果見(jiàn)圖5。圖中的橫坐標(biāo)對(duì)應(yīng)發(fā)文年,縱坐標(biāo)為選定的10個(gè)高影響機(jī)構(gòu),左邊為機(jī)構(gòu)簡(jiǎn)稱,將機(jī)構(gòu)按其發(fā)文量多少依次遞減排列,圖中的黑色圓點(diǎn)表示機(jī)構(gòu)在某一年的發(fā)文量,黑色圓點(diǎn)越大,說(shuō)明該機(jī)構(gòu)發(fā)文量越多,反之越少。為便于觀察,設(shè)定發(fā)文頻次在2以下的不予顯示,并用數(shù)字標(biāo)明機(jī)構(gòu)發(fā)文數(shù)。
圖5 高影響機(jī)構(gòu)發(fā)文散點(diǎn)圖
3.5.1 機(jī)構(gòu)整體分析
通過(guò)R語(yǔ)言計(jì)算得出共有783個(gè)機(jī)構(gòu)探索數(shù)字圖書(shū)館領(lǐng)域,其中30.1%的機(jī)構(gòu)產(chǎn)出了62.1%的文獻(xiàn),也就是說(shuō)79.9%的機(jī)構(gòu)僅產(chǎn)出1篇文獻(xiàn),說(shuō)明各機(jī)構(gòu)對(duì)于該領(lǐng)域的探索程度是不同的,存在一定數(shù)量的高影響機(jī)構(gòu),但絕大部分機(jī)構(gòu)并未深入且連續(xù)的探索該領(lǐng)域。
圖中展示的10所機(jī)構(gòu)和發(fā)文量依次為,中國(guó)武漢大學(xué)(18篇)、美國(guó)威斯康星大學(xué)系統(tǒng)(17篇)、西班牙格拉納達(dá)大學(xué)(15篇)、新西蘭惠靈頓維多利亞大學(xué)(12篇)、伊朗阿扎德大學(xué)系統(tǒng)(11篇)、巴西米納斯吉拉斯聯(lián)邦大學(xué)(11篇)、美國(guó)伊利諾伊大學(xué)系統(tǒng)(11篇)、美國(guó)賓州州立大學(xué)(10篇)、美國(guó)新澤西州立羅格斯大學(xué)(10篇)、加拿大阿爾伯塔大學(xué)(9篇)。相鄰機(jī)構(gòu)之間發(fā)文數(shù)相差較少,但是所屬國(guó)別的發(fā)文總數(shù)相差較大。從宏觀上衡量,除美國(guó)之外其他國(guó)家都僅有一所機(jī)構(gòu)上榜,中國(guó)僅有武漢大學(xué)出現(xiàn),而其它均9所為國(guó)外大學(xué)或大學(xué)系統(tǒng),其中所屬美國(guó)的機(jī)構(gòu)數(shù)量(4所)和核心發(fā)文總數(shù)(48篇)都居首位,作為后起之秀的武漢大學(xué)處于單個(gè)機(jī)構(gòu)發(fā)文量排名第1位,其實(shí)力是值得認(rèn)可的,但就機(jī)構(gòu)整體分布而言,美國(guó)在高影響機(jī)構(gòu)數(shù)量上和發(fā)文總量上都領(lǐng)先于其他各國(guó)機(jī)構(gòu),說(shuō)明在各國(guó)機(jī)構(gòu)對(duì)該領(lǐng)域的研究進(jìn)展深度不一,中美之間在核心研究機(jī)構(gòu)數(shù)量和總發(fā)文數(shù)上還是存在很大的差距。
3.5.2 機(jī)構(gòu)發(fā)文時(shí)區(qū)分析
從機(jī)構(gòu)發(fā)文起始年分析,在2006年共計(jì)有4所機(jī)構(gòu)發(fā)表論文,包括美國(guó)維斯康斯大學(xué)系統(tǒng)、美國(guó)伊利諾伊大學(xué)系統(tǒng)、美國(guó)賓州州立大學(xué)和新西蘭惠靈頓維多利亞大學(xué)。這4所機(jī)構(gòu)在數(shù)字圖書(shū)館計(jì)劃啟動(dòng)時(shí),就對(duì)數(shù)字圖書(shū)館領(lǐng)域保有較強(qiáng)的敏感度,而所屬美國(guó)的3所機(jī)構(gòu)在這1年就發(fā)表文獻(xiàn)7篇,考察其內(nèi)容主要圍繞數(shù)字圖書(shū)館的用途、影響方面,為其后續(xù)研究數(shù)字圖書(shū)館領(lǐng)域建立了根基,使得自身處于較領(lǐng)先的地位。在2006-2019年14個(gè)時(shí)間段內(nèi),威斯康星大學(xué)系統(tǒng)共有11年被WOS核心數(shù)據(jù)庫(kù)收錄文獻(xiàn),在選定高影響機(jī)構(gòu)中所占年數(shù)最多,其他機(jī)構(gòu)均次在8左右,這不僅是該機(jī)構(gòu)產(chǎn)出文獻(xiàn)質(zhì)量高的作證,也說(shuō)明該機(jī)構(gòu)對(duì)數(shù)字圖書(shū)館領(lǐng)域的探索深度只增不減。
國(guó)內(nèi)武漢大學(xué)自2008年開(kāi)始被WOS核心集收錄文獻(xiàn),單個(gè)機(jī)構(gòu)發(fā)文總量(18篇)排名第一,以沈祥興、查先進(jìn)、胡昌平為主體的團(tuán)隊(duì)在該領(lǐng)域做出了重大貢獻(xiàn)。首篇文獻(xiàn)對(duì)數(shù)字圖書(shū)館和CALIS進(jìn)行了文獻(xiàn)綜述,然后分析了我國(guó)學(xué)術(shù)圖書(shū)館存在的問(wèn)題,闡述了數(shù)字圖書(shū)館和CALIS項(xiàng)目的背景、發(fā)展和未來(lái)趨勢(shì),打開(kāi)了該領(lǐng)域探索的大門[13]。此后研究主題集中在用戶研究和數(shù)字圖書(shū)館的發(fā)展評(píng)價(jià)中,此外還包括一篇在WOS核心集被引頻次達(dá)48的文獻(xiàn)計(jì)量型論文,該文獻(xiàn)采用共詞分析方法,通過(guò)測(cè)量相關(guān)期刊關(guān)鍵詞的關(guān)聯(lián)強(qiáng)度,揭示了我國(guó)數(shù)字圖書(shū)館領(lǐng)域的格局,并指出我國(guó)數(shù)字圖書(shū)館領(lǐng)域存在一些熱點(diǎn)研究課題和邊緣話題,與國(guó)際研究相比,我國(guó)研究課題相對(duì)分散,同時(shí)該篇文獻(xiàn)為中國(guó)數(shù)字圖書(shū)館領(lǐng)域的發(fā)展厘清了脈絡(luò)[14],也確立了武漢大學(xué)在該領(lǐng)域研究中的重要地位。
本文基于WOS核心數(shù)據(jù)庫(kù),對(duì)國(guó)外數(shù)字圖書(shū)館領(lǐng)域進(jìn)行研究,綜合采用R語(yǔ)言、文獻(xiàn)計(jì)量法、文獻(xiàn)調(diào)查法、內(nèi)容分析法對(duì)990篇核心文獻(xiàn)進(jìn)行分析。本文并未僅僅停留在“可視化”的表面,而是對(duì)發(fā)文時(shí)間、高影響作者、高影響文獻(xiàn)、高影響期刊、高影響機(jī)構(gòu)進(jìn)行深入研究,可將其總結(jié)如下:國(guó)外對(duì)數(shù)字圖書(shū)館領(lǐng)域的研究已趨于穩(wěn)定、成熟,但仍是當(dāng)下積極探索的熱點(diǎn);國(guó)外數(shù)字圖書(shū)館領(lǐng)域的研究融合性越發(fā)明顯,跨學(xué)科性日益突出,知識(shí)交叉與流動(dòng)更加頻繁;在國(guó)外數(shù)字圖書(shū)館領(lǐng)域的研究演進(jìn)路徑中,從以數(shù)字圖書(shū)館為基點(diǎn)延展至數(shù)字圖書(shū)館的發(fā)展與評(píng)價(jià),并涉及到相關(guān)模型與知識(shí)系統(tǒng),研究關(guān)注點(diǎn)更加顆?;?、細(xì)致化、創(chuàng)新化。
需要注意的是,本文取樣時(shí)間截止于2019年末,并未考慮新收錄的文獻(xiàn),且僅針對(duì)于國(guó)外WOS核心集收錄的文獻(xiàn)做出研究,并未涉及到其他數(shù)據(jù)庫(kù)收錄的文獻(xiàn),這在一定程度上導(dǎo)致文獻(xiàn)樣本不完整,不能完全覆蓋國(guó)外數(shù)字圖書(shū)館的發(fā)展現(xiàn)狀。在后續(xù)研究中會(huì)擴(kuò)充文獻(xiàn)樣本范圍,分析更多的研究因素,更為嚴(yán)謹(jǐn)?shù)膶?duì)比該領(lǐng)域的國(guó)內(nèi)外研究現(xiàn)狀、熱點(diǎn)和發(fā)展趨勢(shì)。