季 瑩 任俊霞 郁 鴻 (哈爾濱工業(yè)大學(xué)圖書館 黑龍江 哈爾濱 150001)
“數(shù)字圖書館”( Digital library) 一詞由美國在 1991 年首先提出[1]。20余年來,數(shù)字圖書館已成為評(píng)價(jià)一個(gè)國家信息基礎(chǔ)水平的重要標(biāo)志,與此同時(shí),數(shù)字圖書館相關(guān)的理論與實(shí)踐研究也受到世界各國的重視。1995 年我國國家圖書館開始跟蹤國際上數(shù)字圖書館的研發(fā)進(jìn)展,1998 年由國家立項(xiàng)實(shí)施“中國數(shù)字圖書館工程”。經(jīng)過10余年的努力,我國數(shù)字圖書館工程建設(shè)取得了豐碩的成果,相關(guān)研究也一直是圖情領(lǐng)域的熱點(diǎn)。本文通過對(duì)科學(xué)引文索引(Science Citation Index,簡(jiǎn)稱 SCI)和社會(huì)科學(xué)引文索引(Social Sciences Citation Index, 簡(jiǎn)稱SSCI)收錄的2000—2010年的有關(guān)數(shù)字圖書館的研究論文進(jìn)行統(tǒng)計(jì)分析和研究主題數(shù)據(jù)挖掘,揭示了國際數(shù)字圖書館研究的現(xiàn)狀和前沿?zé)狳c(diǎn)。
某一學(xué)科領(lǐng)域文獻(xiàn)的關(guān)鍵詞術(shù)語的使用頻次和共現(xiàn)頻次可以反映該學(xué)科的研究主題或熱點(diǎn)問題,能夠統(tǒng)計(jì)關(guān)鍵詞術(shù)語的使用頻次和共現(xiàn)頻次的方法即共詞分析方法。Monarch認(rèn)為,“共詞分析就是通過對(duì)相關(guān)文獻(xiàn)的代表性術(shù)語之間的聯(lián)系強(qiáng)度的分析,得到某一學(xué)科領(lǐng)域研究發(fā)展的方式和趨勢(shì)?!盵2]共詞分析的原理就是統(tǒng)計(jì)出一組文獻(xiàn)中的關(guān)鍵詞、主題詞或名詞短語在同一篇文獻(xiàn)中出現(xiàn)的次數(shù),計(jì)算出詞匯的共現(xiàn)頻次,并形成由這些詞對(duì)關(guān)聯(lián)所組成的共詞網(wǎng)絡(luò)。網(wǎng)絡(luò)節(jié)點(diǎn)之間的距離可以反映主題內(nèi)容的親疏關(guān)系。在共詞分析的基礎(chǔ)上,以共詞出現(xiàn)的頻率為分析對(duì)象,利用聚類的統(tǒng)計(jì)學(xué)方法把眾多分析對(duì)象之間錯(cuò)綜復(fù)雜的共詞網(wǎng)狀關(guān)系簡(jiǎn)化為數(shù)目相對(duì)較少的若干類群之間的關(guān)系并直觀地表示出來的過程稱為共詞聚類。通過聚類分析能把關(guān)聯(lián)密切的主題聚集在一起形成類團(tuán),表達(dá)某一領(lǐng)域分支的組成[3]。
本文運(yùn)用文獻(xiàn)計(jì)量學(xué)方法對(duì)SCI和SSCI收錄的數(shù)字圖書館研究論文進(jìn)行計(jì)量評(píng)價(jià),并對(duì)研究數(shù)據(jù)的研究方向和影響力等進(jìn)行了定量分析。計(jì)量對(duì)象主要包括文獻(xiàn)量(論文數(shù)量和引文數(shù)量)、作者數(shù)(個(gè)人或團(tuán)體數(shù)量)、詞匯數(shù)等。
共詞分析工具選取美國德雷塞爾大學(xué)(Drexel University)信息科學(xué)與技術(shù)學(xué)院陳超美博士開發(fā)的CiteSpaceⅡ軟件[4],筆者通過共詞詞頻分析法和共詞聚類分析法考察有關(guān)數(shù)字圖書館的研究論文的主題領(lǐng)域和研究熱點(diǎn)。
本文數(shù)據(jù)來源于SCI和SSCI檢索平臺(tái)——ISI的Web of Science數(shù)據(jù)庫。檢索主題字段為“digital librar*”,年代限定在2000—2010年。根據(jù)中國科技信息研究所發(fā)布的中國科技論文統(tǒng)計(jì)結(jié)果的統(tǒng)計(jì)指標(biāo),筆者將文獻(xiàn)類型限定為Article(論文)、Proceedings Paper(會(huì)議論文)、Review(綜述)、Letter(函件)。
SCI和SSCI在2000—2010年共收錄數(shù)字圖書館研究論文1 706篇。論文總被引量達(dá)7 264次,篇均引用次數(shù)為4.26次。論文數(shù)量從2000年的149篇增長(zhǎng)到2004年的223篇后呈逐年下降趨勢(shì),2007年跌至121篇,之后的4年變化不大(見圖1)。這主要是受會(huì)議論文的影響,2002—2006年會(huì)議論文數(shù)量較多,而之后的會(huì)議論文數(shù)量銳減,導(dǎo)致近幾年的論文總量也呈現(xiàn)出下滑的特點(diǎn)。但僅從Article(論文)的發(fā)文數(shù)量來看,數(shù)字圖書館研究的成果還是在緩步增加的。
在此期間中國作者(僅包括大陸地區(qū)和港澳地區(qū))共發(fā)表數(shù)字圖書館研究論文127篇,占全部文獻(xiàn)的7.44%,排在美國和英國之后,位列世界第三(見表1)。發(fā)文數(shù)量的年代分布趨勢(shì)與論文整體趨勢(shì)相似,如果除去會(huì)議論文數(shù)量的影響,Article(論文)數(shù)量變化不大。
中國數(shù)字圖書館研究論文的被引總頻次為532次,篇均引用次數(shù)達(dá)到4.19次,略低于全部論文的篇均引用次數(shù),這說明我國作者論文的影響力接近但略低于平均水平。
在數(shù)字圖書館研究方面,發(fā)文數(shù)量排在前幾位的作者是弗吉尼亞理工大學(xué)計(jì)算機(jī)科學(xué)系Fox E A,發(fā)表論文27篇;巴西米納斯聯(lián)邦大學(xué)計(jì)算機(jī)科學(xué)系Goncalves M A,發(fā)表論文20篇;新西蘭懷卡托大學(xué)計(jì)算機(jī)科學(xué)系Witten I H,發(fā)表論文18篇;新加坡南洋理工大學(xué)Goh D H L,發(fā)表論文17篇和Theng Y L發(fā)表論文15篇。
在我國數(shù)字圖書館研究方面,發(fā)文數(shù)量排在前幾位的作者是中國數(shù)字圖書館工程專家組成員、清華大學(xué)信息技術(shù)研究院 WEB 與軟件技術(shù)研究中心主任邢春曉,共發(fā)表論文8篇,占我國作者發(fā)文總量的6.3% ;原清華大學(xué)計(jì)算機(jī)技術(shù)與應(yīng)用系主任周立柱,發(fā)表論文7篇;浙江大學(xué)計(jì)算機(jī)學(xué)院院長(zhǎng)莊越挺,發(fā)表論文6篇;香港中文大學(xué)系統(tǒng)工程和工程管理系楊傳智,發(fā)表論文5篇。
數(shù)字圖書館研究論文來自世界各國的1 000多個(gè)機(jī)構(gòu),發(fā)表論文數(shù)量最多的前10個(gè)機(jī)構(gòu)均為大學(xué)(見表2)。中國發(fā)表論文最多的前10個(gè)機(jī)構(gòu)同樣也是國內(nèi)著名的大學(xué)(見下頁表3)。作者機(jī)構(gòu)署名為我國圖書館的論文共33篇,其中上海交通大學(xué)圖書館6篇,北京大學(xué)圖書館2篇,上海圖書館2篇,清華大學(xué)圖書館2篇。
1706篇有關(guān)數(shù)字圖書館研究的論文共發(fā)表在431種期刊及會(huì)議錄等出版物上。發(fā)表數(shù)字圖書館研究論文數(shù)量最多的前10種出版物如表4所示。其中,發(fā)表論文數(shù)量排名第1位和第2位的期刊在2006年之后、排名第10位的期刊在2003年之后都被SCI和SSCI剔除,這也是造成近幾年SCI和SSCI收錄的數(shù)字圖書館研究論文減少的原因之一。
表2 發(fā)文數(shù)量排名前10位的機(jī)構(gòu)
表3 發(fā)文數(shù)量排名前10位的國內(nèi)機(jī)構(gòu)
數(shù)字圖書館研究包括多種理論和技術(shù),而且研究的熱點(diǎn)主題也是隨著研究的拓展與深入而動(dòng)態(tài)發(fā)展的。為了了解國際上該領(lǐng)域的研究主題及前沿?zé)狳c(diǎn)的發(fā)展趨勢(shì),本文使用CiteSpaceⅡ信息可視化軟件對(duì)數(shù)字圖書館研究論文的數(shù)據(jù)進(jìn)行共詞分析和聚類分析。將2000—2005年和2006—2010年兩個(gè)年代的統(tǒng)計(jì)數(shù)據(jù)分別導(dǎo)入CiteSpaceⅡ中,對(duì)其進(jìn)行關(guān)鍵詞共現(xiàn)和聚類分析,即得到兩個(gè)階段的研究熱點(diǎn)主題,再分別計(jì)算得出兩個(gè)階段的關(guān)鍵詞共現(xiàn)頻次(見表5、下頁表6),繪制關(guān)鍵詞共現(xiàn)圖譜(見圖2、圖3)。圖中每個(gè)節(jié)點(diǎn)代表一個(gè)關(guān)鍵詞,節(jié)點(diǎn)之間的連線代表兩個(gè)關(guān)鍵詞之間的共現(xiàn)關(guān)系。共現(xiàn)圖譜中節(jié)點(diǎn)之間距離越近,說明兩個(gè)關(guān)鍵詞的相關(guān)度越大。若干個(gè)關(guān)系密切的節(jié)點(diǎn)就形成了一個(gè)知識(shí)群體,也就是說由關(guān)鍵詞將知識(shí)聚類為相關(guān)的領(lǐng)域。
表4 發(fā)文數(shù)量排名前10位的出版物
表5 2000—2005年論文關(guān)鍵詞共現(xiàn)頻次排
表6 2006—2010年論文關(guān)鍵詞共現(xiàn)頻次排名
2000—2005年SCI和SSCI共收錄數(shù)字圖書館研究論文1 010篇。根據(jù)圖2的共現(xiàn)圖譜和表5的關(guān)鍵詞共現(xiàn)頻次排序可以看出,這個(gè)階段的數(shù)字圖書館研究以信息檢索技術(shù)、電子出版問題和用戶研究為主。主要研究主題為:
主題1:電子出版相關(guān)研究,包括出版成本、版權(quán)問題、電子存檔、同行評(píng)審、電子期刊影響因子等。
主題2:信息檢索技術(shù),包括網(wǎng)絡(luò)檢索技術(shù)、檢索系統(tǒng)設(shè)計(jì)、文本檢索技術(shù)、識(shí)別技術(shù)。
主題3:數(shù)字圖書館管理,包括知識(shí)管理、服務(wù)模式等問題。
主題4:圖書館用戶研究,包括大學(xué)圖書館用戶研究,其他類型圖書館的用戶教育、用戶行為和心理研究。
主題5:網(wǎng)站建設(shè)研究,包括網(wǎng)站架構(gòu)、統(tǒng)一門戶認(rèn)證及整合檢索等。
2006—2010年SCI和SSCI共收錄數(shù)字圖書館研究論文696篇。與2000—2005年相比,該階段的研究主題有了一些變化,數(shù)字存儲(chǔ)、信息服務(wù)、用戶個(gè)性化成為研究的熱點(diǎn),信息檢索技術(shù)也增加了很多新的內(nèi)容,其主要的研究主題有:
主題1:數(shù)字存儲(chǔ),包括存檔管理、國家圖書館及大學(xué)圖書館數(shù)字資源的存儲(chǔ)研究等。
主題2:信息檢索技術(shù),包括信息可視化、圖像索引和檢索、視頻檢索、數(shù)字圖書館互操作、pathfinder算法和語義技術(shù)的應(yīng)用等。
主題3:用戶個(gè)性化研究,包括用戶的差異研究、行為研究、個(gè)性化界面、個(gè)性化檢索等。
主題4:數(shù)字圖書館服務(wù)研究,包括數(shù)字化參考咨詢服務(wù)、數(shù)字文獻(xiàn)傳遞、知識(shí)管理等。
主題5:數(shù)字資源組織與利用研究,包括元數(shù)據(jù)收割,電子期刊、互聯(lián)網(wǎng)資源、搜索引擎等的質(zhì)量、服務(wù)、訪問研究等。
通過對(duì)數(shù)字圖書館研究論文及我國學(xué)者在該領(lǐng)域發(fā)表論文的多角度分析可以看出,國際數(shù)字圖書館研究經(jīng)過20多年的發(fā)展,研究的主題熱點(diǎn)已由單純的數(shù)字資源組織建設(shè)和相關(guān)標(biāo)準(zhǔn)建立的研究逐步轉(zhuǎn)向注重用戶的個(gè)性化需求、信息檢索新技術(shù)開發(fā)及數(shù)字資源的永久保存等方面的研究。知識(shí)檢索、Tag標(biāo)簽技術(shù)、Mashup位置感知技術(shù)[5]等新技術(shù)的引入使數(shù)字圖書館服務(wù)的內(nèi)容、手段、時(shí)空都發(fā)生了質(zhì)的飛躍。
我國的數(shù)字圖書館研究論文數(shù)量雖然從排名上看比較靠前,但與美國、英國相差甚遠(yuǎn)。我國的論文大都出自于國內(nèi)知名大學(xué)的計(jì)算機(jī)科學(xué)領(lǐng)域?qū)<业墓P下,而圖書館員作為數(shù)字圖書館的直接服務(wù)人員,其研究成果卻屈指可數(shù)。事實(shí)上,數(shù)字圖書館研究離不開信息技術(shù)的支撐,但也同樣需要對(duì)資源進(jìn)行整合、對(duì)服務(wù)進(jìn)行轉(zhuǎn)變、對(duì)用戶進(jìn)行培訓(xùn)。因此,針對(duì)數(shù)字圖書館的相關(guān)服務(wù)和資源建設(shè)的研究可以成為圖書館員進(jìn)行研究的突破口。
針對(duì)國內(nèi)數(shù)字圖書館建設(shè)與研究的具體情況,筆者認(rèn)為要從以下幾個(gè)方面開展工作:(1)積極開展國際交流與合作,與國外的研究機(jī)構(gòu)進(jìn)行合作研究;積極爭(zhēng)取和參與國際協(xié)作的科研項(xiàng)目,力爭(zhēng)在國際先進(jìn)的科學(xué)研究隊(duì)伍中占有一席之地,提高自身的國際影響力。(2)加強(qiáng)國內(nèi)的合作交流,與上海交通大學(xué)、清華大學(xué)等相關(guān)研究機(jī)構(gòu)建立合作關(guān)系,跟蹤并關(guān)注他們的研究動(dòng)向與成果。(3)關(guān)注國外圖情高水平研究的進(jìn)展,跟蹤本領(lǐng)域的國際會(huì)議預(yù)告并積極參與會(huì)議論文的撰寫。(4)加強(qiáng)外語學(xué)習(xí),打破國際交流的語言壁壘。總之,我國數(shù)字圖書館的建設(shè)與研究要立足國內(nèi),走向世界,加強(qiáng)學(xué)習(xí)研究的氛圍,開展更高層次的學(xué)術(shù)研究,使中國的數(shù)字圖書館科研水平邁入世界先進(jìn)的行列。
[1]李 瑋. 1995年以來我國數(shù)字圖書館研究和發(fā)展綜述[J].圖書館學(xué)刊,2005(6):53-55.
[2]Monarch I A.Information Science and Information Systems:Converging or Diverging? [EB/OL]. [2011-06-01].http://www.caisacsi.ca/proceedings/2000/monarch_2000.pdf.
[3]鐘偉金,李 佳,楊興菊.共詞分析法研究:三:共詞聚類分析法的原理與特點(diǎn)[J].情報(bào)雜志,2008(7):118-120.
[4]Chen Chaomei. CiteSpace II: Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Literature[J].Journal of the American Society for Information Science and Technology, 2006(3): 359-377.
[5]李春旺,李 宇.2009歐洲數(shù)字圖書館會(huì)議(ECDL)述評(píng)[J].現(xiàn)代圖書情報(bào)技術(shù),2009(11): 1-5.