[摘要] 數(shù)據(jù)庫評價是圖書館數(shù)字資源測評的重要內(nèi)容,以上海師范大學(xué)圖書館購買的數(shù)據(jù)庫為例,在了解數(shù)據(jù)庫建設(shè)現(xiàn)狀的基礎(chǔ)上,收集中外文數(shù)據(jù)庫用戶使用數(shù)據(jù),進行利用成本效益分析,并提出復(fù)選建議。
[關(guān)鍵詞] 數(shù)據(jù)庫 成本效益分析 復(fù)選 測評
數(shù)據(jù)庫是圖書館數(shù)字館藏的重要組成部分,隨著資源建設(shè)的發(fā)展,各圖書館數(shù)據(jù)庫購買的數(shù)量不斷增加,同時數(shù)據(jù)庫商也在不停地漲價,如何利用有限的經(jīng)費選購合適的數(shù)據(jù)庫是圖書館面臨的共同問題。數(shù)據(jù)庫測評是了解用戶利用情況,掌握其運行狀態(tài),為采訪提供參考的重要工作。數(shù)據(jù)庫測評的角度、方法較多,其中使用情況與成本效益分析法是一個常規(guī)的定量方法。本文以上海師范大學(xué)圖書館(以下簡稱“我館”)為例,對購買的數(shù)據(jù)庫進行測評并給出復(fù)選建議,同時對這種定量分析方法作出評價。
1 測評方法
使用情況與成本效益分析法是數(shù)據(jù)庫測評中常用的定量分析法。在充分了解本館數(shù)據(jù)庫建設(shè)現(xiàn)狀的基礎(chǔ)上,以數(shù)據(jù)庫的訪問量、檢索量、全文下載量三個指標來衡量數(shù)據(jù)庫使用情況。選取相同的時間段,統(tǒng)計這三個指標。本次統(tǒng)計截取的時間為2009年10月至2010年9月,對于新購數(shù)據(jù)庫從購買當月算起至2010年9月為止,為保證可比性,以月均數(shù)據(jù)進行比較。
各數(shù)據(jù)庫所屬的數(shù)據(jù)庫商不同,使用的平臺不同,數(shù)據(jù)獲取途徑也各不相同。外文數(shù)據(jù)庫大多遵循COUNTER標準,進入后臺管理可以直接獲取用戶使用情況的數(shù)據(jù),但是由于一些數(shù)據(jù)庫是文摘庫,或者沒有遵循COUNTER標準,無法將訪問量、檢索量、全文下載量全部獲取。相比而言,中文數(shù)據(jù)庫在用戶使用情況統(tǒng)計方面做得不夠好,只有少數(shù)幾個中文數(shù)據(jù)庫能獲取一部分數(shù)據(jù),其他的數(shù)據(jù)庫商沒有提供此項服務(wù)。對于這些無法獲取數(shù)據(jù)的中文庫,以我館介紹頁面的登陸量為參照,需要指出的是登陸量是體現(xiàn)登陸該數(shù)據(jù)庫介紹頁面的次數(shù),是該數(shù)據(jù)庫被關(guān)注程度的體現(xiàn),不是其訪問量。
數(shù)據(jù)庫價格與全文下載量之比即單篇下載成本,以單篇下載成本來衡量數(shù)據(jù)庫成本效益。外文數(shù)據(jù)庫可獲取Calis集團采購單篇下載成本的數(shù)據(jù),與我館情況加以對比。中文數(shù)據(jù)庫由于只有部分具有下載量,且價格方面一些是購買一個庫贈送另一個庫,比較難獲取單篇下載成本,因此只列舉少量的中文數(shù)據(jù)庫使用成本。
2 測評結(jié)果與分析
2.1 我館中外文數(shù)據(jù)庫建設(shè)現(xiàn)狀
2008年以來,我館加大了對數(shù)字資源的投入,引進的中外文數(shù)據(jù)庫數(shù)量穩(wěn)步增長。目前,我館中外文數(shù)據(jù)庫共79個(為了對比方便,部分數(shù)據(jù)庫按平臺計算),其中中文數(shù)據(jù)庫40個,外文數(shù)據(jù)庫39個(自建庫未計算在內(nèi))。與上海其他高校圖書館購買的數(shù)據(jù)庫相比,我館在數(shù)量上排名第5,達到“211”學(xué)校的建設(shè)目標,如表1所示:
從品種上看,重復(fù)度比較高的中文數(shù)據(jù)庫我們都已購買,外文數(shù)據(jù)庫中IEEE(美國電子電機工程師學(xué)會)和ISI Web of Knowledge(三大索引)我館暫未購買,其中Ei(工程索引)已開通試用。說明核心數(shù)據(jù)庫我館基本上都已具備。如表2所示:
從學(xué)科分布上看,我館數(shù)據(jù)庫基本上涵蓋了學(xué)校所有的學(xué)科,包括生物學(xué)、化學(xué)、環(huán)境、材料、數(shù)學(xué)、物理、語言、文學(xué)、歷史、教育、心理學(xué)、工程技術(shù)、經(jīng)濟、法律、旅游等學(xué)科,基本上保證了我校重點學(xué)科和其他學(xué)科建設(shè)和發(fā)展的需求。
2.2 使用情況統(tǒng)計分析
2.2.1 外文數(shù)據(jù)庫使用情況統(tǒng)計分析 購買的外文數(shù)據(jù)庫僅對其中32個庫進行統(tǒng)計,對某些數(shù)據(jù)庫未予包含的主要原因是無法獲取數(shù)據(jù)或所得數(shù)據(jù)不佳(EEBO、大英百科全書、金圖數(shù)字圖書館、Netlibrary、Scifinder),贈送的(Gale-Associations unlimited),最近新購買(Sage)等。
表3反映的是2009年10月至2010年9月外文數(shù)據(jù)庫的使用情況,以全文下載量即月均下載量降序排列,其中劃線表示無此項數(shù)據(jù)。MathScinet(數(shù)學(xué)評論)是一個二級數(shù)據(jù)庫,查看全文是鏈接到第三方地址、Biosis Previews(生物學(xué)文摘)是文摘庫、Credo Reference(全球工具書大全)是工具書數(shù)據(jù)庫,這三個數(shù)據(jù)庫都沒有全文下載量。表中最后4個數(shù)據(jù)庫Emerald、Science Online(科學(xué)在線)、Taylor Francis、Nature是今年新購的,目前正式使用了5-10個月,因此將這些單獨列出。
可以看出,使用較好的外文數(shù)據(jù)庫有EBSCO、ACS(美國化學(xué)學(xué)會)、Elsevier ScienceDirect Online、JSTOR(西文過刊全文庫)、Wiley、Springer期刊,其中EBSCO、JSTOR(西文過刊全文庫)、Springer期刊是綜合性期刊,這類期刊外文庫涉及的學(xué)科面廣、期刊數(shù)量多,因此使用量較大,ACS(美國化學(xué)學(xué)會)、Wiley、Elsevier ScienceDirect Online是化學(xué)、理工科的數(shù)據(jù)庫,表明重點學(xué)科建設(shè)數(shù)據(jù)庫的使用情況良好。使用比較少的數(shù)據(jù)庫是EBSCO旅游、CUP(劍橋期刊)、PAO(典藏學(xué)術(shù)期刊全文庫)、SIAM(工業(yè)和應(yīng)用數(shù)學(xué)學(xué)會)、Gale人物傳記和十八世紀作品在線,原因是這些數(shù)據(jù)庫涉及單一學(xué)科或者單個出版社的期刊,種數(shù)較少。今年新購買的4個數(shù)據(jù)庫Emerald、Science Online(科學(xué)在線)、Taylor Francis、Nature利用情況比較好。
與前一年數(shù)據(jù)庫使用情況相比,表4顯示今年月均下載量均有所提高。其中EBSCO全文庫、ACS(美國化學(xué)學(xué)會)、Elsevier ScienceDirect Online下載量增加的幅度很大,表明用戶對這三個數(shù)據(jù)庫熟悉、使用程度增加。需要指出的是ProQuest學(xué)位論文下載量下降,其中原因可能是今年該數(shù)據(jù)庫平臺更換,可能導(dǎo)致一些數(shù)據(jù)丟失,參照其登陸到介紹頁面的訪問量,該庫使用情況還是比較好的。
2.2.2 中文數(shù)據(jù)庫使用情況統(tǒng)計分析
表5中顯示中國知網(wǎng)系列(期刊網(wǎng)、博碩士論文庫、重要報紙全文庫)的數(shù)據(jù)庫、維普、國研網(wǎng)、國學(xué)寶典、數(shù)字圖書館、萬方學(xué)位論文(中國學(xué)位論文全文庫)使用比較好,萬方系列中其他幾個庫(期刊、學(xué)術(shù)會議、法律法規(guī)、新方志)利用情況不好。中國期刊網(wǎng)月均下載量最高,表明它最為用戶所熟悉。萬方利用不好的原因是期刊方面實力不如知網(wǎng)與維普,學(xué)術(shù)會議、法規(guī)與新方志在內(nèi)容上做得也不夠好,所以導(dǎo)致利用率低,萬方只有學(xué)位論文因為收錄得比較全,所以使用情況較好。
表6顯示2010年中文數(shù)據(jù)庫使用量略有增加,使用情況比較平穩(wěn)。
其他中文數(shù)據(jù)庫因為不能獲取全文下載量和檢索量數(shù)據(jù),因此統(tǒng)計訪問量。表7顯示超星數(shù)字圖書館使用較好,新購買的四六級模擬考題關(guān)注度也較高。用的比較少的主要是古籍、報紙等數(shù)據(jù)庫,月均只有幾十次的訪問量,而實際真正鏈接入庫的次數(shù)以及檢索量、全文下載量則更少,原因是涉及的學(xué)科單一,或者報紙品種單一,但因是一次性買斷,所以不存在復(fù)選的問題。
2.3 數(shù)據(jù)庫成本效益分析
表8反映,我館外文數(shù)據(jù)庫使用成本呈下降趨勢,今年使用情況好于往年。外文數(shù)據(jù)庫使用成本較高的有Gale系列的十八世紀作品在線、人物傳記中心、CUP(劍橋期刊)、EBSCO旅游、PAO(典藏學(xué)術(shù)期刊全文庫)、SIAM (工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會)。今年外文數(shù)據(jù)庫使用成本與2009年相比總體來說下降了,其中JSTOR(西文過刊全文庫)與Springer期刊略有提高,Elsevier ScienceDirect Online漲價多造成成本提高、CUP(劍橋期刊)、ProQuest學(xué)位論文使用成本大幅提高,原因是CUP(劍橋期刊)下載量有所下降,Proquest學(xué)位論文可能是更換平臺的原因,下載量可能有誤差,這些因素導(dǎo)致單篇下載成本提高了。
與CALIS數(shù)據(jù)相比,我館外文數(shù)據(jù)庫使用成本較高。除EBSCO全文與教育、Wiley、Springer期刊、Project Muse、Taylor Francis外,我館外文數(shù)據(jù)庫單篇下載成本均大幅高于CALIS集團采購的平均使用成本,說明與全國其他高校相比,我館利用情況還有差距。
表9顯示中文數(shù)據(jù)庫單篇下載成本,與前一年基本持平。
2.4 復(fù)選建議
外文數(shù)據(jù)庫中可考慮復(fù)選的有Gale系列的十八世紀作品在線和人物傳記中心、CUP(劍橋期刊)、PAO(典藏學(xué)術(shù)期刊全文庫)、SIAM (工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會)。
從下載量看,這幾個數(shù)據(jù)庫今年月均全文下載量很少,均小于90篇,其中Gale十八世紀作品在線月均全文下載只有10篇,在所有數(shù)據(jù)庫中排在末尾。此外,他們的月均訪問量與月均檢索量也很少。參考去年的數(shù)據(jù),這幾個數(shù)據(jù)庫的下載量也很低,是排在末幾位的。 從單篇成本看,其單篇下載成本非常高,大大超過CALIS的成本價,其中Gale十八世紀作品在線高達171.76元/篇。因此將他們列為復(fù)選的首選數(shù)據(jù)庫。
中文數(shù)據(jù)庫中古籍、報紙等數(shù)據(jù)庫使用情況不好,但是這些都是一次性買斷,不存在復(fù)選的問題。
3 結(jié) 論
數(shù)據(jù)庫測評的內(nèi)容包括很多方面,如收錄范圍、檢索功能、服務(wù)功能、收費情況、網(wǎng)絡(luò)安全等,測評方法主要包括定性與定量兩種。定量評價強調(diào)數(shù)量計算,收集和處理數(shù)據(jù)資料,對評價對象做出定量結(jié)果的判斷,其結(jié)果具有客觀性、精確性、數(shù)量化與簡便化等特點。使用情況與成本效益分析法操作性強,獲取、比較、分析數(shù)據(jù)相對簡單,而且是從投入與效果的角度來衡量,是一個最有說服力的方法。
從本次實證過程來看,使用情況與成本效益分析法運用于外文數(shù)據(jù)庫評價,效果更好,原因是外文數(shù)據(jù)庫商提供的用戶使用數(shù)據(jù)比較完備,而中文數(shù)據(jù)庫商在這方面比較欠缺。因此對中文數(shù)據(jù)庫可以嘗試利用其他方法進行評價。
參考文獻:
[1] CALIS引進資源信息平臺.[2010-11-12].http://dbinfo.calis.edu.cn/.
[2] 索傳軍.數(shù)字館藏評價和績效分析.北京:北京圖書館出版社.2007.
[作者簡介] 馬凌云,女 ,1978年生,館員,發(fā)表論文9篇。
雷順利,女 ,1977年生,副研究館員,信息研發(fā)部副主任,發(fā)表論文12篇。