于 洋
(河南科技學(xué)院圖書(shū)館 河南 新鄉(xiāng) 453000)
?
國(guó)內(nèi)三大中文數(shù)字期刊庫(kù)的比較分析
于洋
(河南科技學(xué)院圖書(shū)館河南 新鄉(xiāng)453000)
選取中國(guó)知網(wǎng)、維普以及萬(wàn)方三大數(shù)字出版集團(tuán)的中文學(xué)術(shù)期刊數(shù)據(jù)庫(kù)作為調(diào)查對(duì)象, 分別從其收錄期刊的整體重復(fù)率、更新延遲情況、檢索時(shí)的易操作性和界面友好等幾個(gè)角度對(duì)三大期刊數(shù)據(jù)庫(kù)進(jìn)行比較和分析,以為高校圖書(shū)館在數(shù)字資源建設(shè)方面提供一定的參考。
中國(guó)知網(wǎng); 重慶維普;萬(wàn)方數(shù)據(jù)庫(kù);中文數(shù)字期刊庫(kù)
中國(guó)數(shù)字期刊于20 世紀(jì)90年代開(kāi)始出版發(fā)行,期間幾家大型的數(shù)字出版集團(tuán)顯露頭角并逐漸占領(lǐng)大部分市場(chǎng),它們分別是中國(guó)知網(wǎng)(以下簡(jiǎn)稱CNKI)、重慶維普(以下簡(jiǎn)稱VIP)和萬(wàn)方數(shù)據(jù)庫(kù)。
本次研究選取了CNKI、VIP以及萬(wàn)方三大數(shù)字出版集團(tuán)中的中文學(xué)術(shù)期刊數(shù)據(jù)庫(kù)作為調(diào)查對(duì)象, 分別從其收錄期刊的整體重復(fù)率、收錄期刊的更新延遲情況、檢索時(shí)的易操作性和界面友好等幾個(gè)角度對(duì)三大期刊數(shù)據(jù)庫(kù)進(jìn)行比較和分析。本次研究期望能從整體的角度反映中文數(shù)字學(xué)術(shù)期刊的出版發(fā)行現(xiàn)狀,以為高校圖書(shū)館在數(shù)字資源建設(shè)方面提供一定的參考。
三大期刊庫(kù)的源數(shù)據(jù)均是來(lái)自各數(shù)據(jù)服務(wù)商,
截至?xí)r間到2014年。其中,CNKI所出版的《中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)》樣本的期刊數(shù)量7 842種。VIP出版的《中文科技期刊數(shù)據(jù)庫(kù)》樣本期刊數(shù)量9 569種。萬(wàn)方的《中國(guó)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)》集中了多種科技、人文和社會(huì)科學(xué)期刊的全文內(nèi)容,樣本期刊有7 676種。本研究目的旨在了解各期刊庫(kù)中所有數(shù)據(jù)的整體重復(fù)率,而不僅僅是選取其中某一學(xué)科進(jìn)行對(duì)比,因此樣本數(shù)量較大,誤差是不可避免的。為了了解三大數(shù)字期刊庫(kù)收錄期刊的整體重復(fù)情況,分析時(shí)采取兩兩比較的方式,即分別將兩個(gè)期刊庫(kù)中的數(shù)據(jù)通過(guò)逐條對(duì)比得出重復(fù)的數(shù)量,然后再計(jì)算出重復(fù)量占兩個(gè)庫(kù)的百分率[1]。
通過(guò)逐條對(duì)比,發(fā)現(xiàn)CNKI與VIP的重復(fù)期刊數(shù)量是6 541種,占CNKI總數(shù)量的83.41%,占VIP總數(shù)量的68.36%。CNKI與萬(wàn)方的重復(fù)期刊是6 048種,占CNKI的77.12%,占萬(wàn)方的78.79%。
表1 三大期刊庫(kù)收錄期刊的整體重復(fù)率
VIP與萬(wàn)方的期刊重復(fù)數(shù)量最高,達(dá)到6 773種,占VIP的70.78%,占萬(wàn)方的88.24%。也就是說(shuō),三大期刊庫(kù)兩兩對(duì)比的重復(fù)期刊數(shù)量都超過(guò)了6 000種,重復(fù)數(shù)量是相當(dāng)高的,均超過(guò)各期刊庫(kù)的70%以上。其中,萬(wàn)方庫(kù)的重復(fù)率是最高的,與CNKI的重復(fù)率有78.79%,與VIP的重復(fù)率更高,為88.24%??梢?jiàn)重復(fù)建設(shè)現(xiàn)象非常嚴(yán)重,應(yīng)該給予相當(dāng)?shù)闹匾?。另外,VIP的重復(fù)率分別是68.36%(CNKI與VIP)和70.78%(VIP與萬(wàn)方),重復(fù)率是相對(duì)較低的,分析其原因可能是由于VIP數(shù)據(jù)庫(kù)中期刊總量是最多的,分母就是最大的,因此,重復(fù)率的數(shù)值相對(duì)比其他要小。
本次研究統(tǒng)計(jì)了三大期刊庫(kù)收錄中文核心期刊的情況,中文核心期刊目錄是參照北大中文核心期刊目錄(2011年版),核心數(shù)量是1 983種[2]。通過(guò)對(duì)比發(fā)現(xiàn)目前三大期刊庫(kù)的核心期刊覆蓋率均達(dá)到90%以上。
表2 三大期刊庫(kù)的中文核心期刊收錄情況
數(shù)字期刊庫(kù)中的期刊如果能同步更新,無(wú)疑是對(duì)科研工作者最有益的幫助。研究通過(guò)隨機(jī)選取30種期刊進(jìn)行調(diào)查分析。為了使樣本能夠兼顧一般性和重點(diǎn)性,參照三大期刊庫(kù)的學(xué)科分類,此次調(diào)研選擇工業(yè)技術(shù)、經(jīng)濟(jì)管理和農(nóng)業(yè)科學(xué)3個(gè)類別,每類挑選10種期刊作為研究對(duì)象。其中每個(gè)類別中前五種為核心刊,后五種為一般刊物。進(jìn)行調(diào)查分析的時(shí)間集中在2014年12月。因此,截止到調(diào)研時(shí)間,樣本期刊發(fā)行的最新的季刊應(yīng)該是第4期,雙月刊是第6期,單月刊是12期,半月刊是24期。
通過(guò)表3可以看到樣本期刊在三大期刊庫(kù)中均存在明顯的延遲現(xiàn)象,其中只有CNKI中的2種期刊和萬(wàn)方中的1種期刊基本實(shí)現(xiàn)了同步更新。另外,截止到調(diào)查日期,樣本期刊在VIP期刊庫(kù)中的缺期現(xiàn)象比較普遍,但是通過(guò)研究分析,只是當(dāng)年的期刊存在缺期的現(xiàn)象。在萬(wàn)方期刊庫(kù)中,一些樣本期刊存在長(zhǎng)時(shí)間滯后的現(xiàn)象,如《水電能源科學(xué)》最后更新日期是2012年8月。類似的還有《現(xiàn)代圖書(shū)情報(bào)技術(shù)》更新至2009年9月,《中國(guó)食用菌》更新到2012年3月,《飼料與畜牧》更新到2008年12月。
2.2絕對(duì)延遲時(shí)間
絕對(duì)延遲時(shí)間是指調(diào)查采樣時(shí)期刊庫(kù)中收錄的某本期刊最近一期的發(fā)行時(shí)間滯后于該刊最新一期發(fā)行的時(shí)間[3]。首先,從各期刊庫(kù)中收錄期刊的絕對(duì)延遲情況進(jìn)行調(diào)查,絕對(duì)延遲時(shí)間下文用TD表示。另外,考慮到上文觀察到在萬(wàn)方庫(kù)中有4本期刊存在長(zhǎng)時(shí)間滯后的問(wèn)題,為了使數(shù)據(jù)具有對(duì)比意義,在下面的分析中不考慮它們。
2.1更新情況
表3 隨機(jī)選取的期刊更新情況
注:(Q:季刊,D:雙月刊,S:單月刊,H:半月刊)
表4 隨機(jī)選取期刊的絕對(duì)延遲情況
通過(guò)調(diào)查三類學(xué)科的延遲時(shí)間,在CNKI中,TD=47;在VIP中,TD=99;在萬(wàn)方中,TD=108。在CNKI、VIP和萬(wàn)方期刊庫(kù)中的樣本期刊分別平均滯后了1.8期、3.3期和3.6期??偟膩?lái)說(shuō),CNKI的期刊更新速度遠(yuǎn)遠(yuǎn)優(yōu)于VIP和萬(wàn)方,究其原因,應(yīng)當(dāng)考慮到樣本情況的復(fù)雜性,比如有些期刊是半月刊,一旦缺期就會(huì)對(duì)分母影響比較大,比如萬(wàn)方庫(kù)中收錄的圖書(shū)情報(bào)工作屬于半月刊,更新到了第5期,就滯后了19期。
2.3相對(duì)延遲時(shí)間
表5顯示了三大期刊庫(kù)兩兩之間的相對(duì)延遲情況,其中CNKI期刊庫(kù)相對(duì)VIP在期刊更新速度上領(lǐng)先了53期,VIP相對(duì)萬(wàn)方領(lǐng)先了8期,萬(wàn)方相對(duì)CNKI的期刊更新速度滯后了61期。
表5 隨機(jī)選取期刊的相對(duì)延遲情況
3.1檢索界面接入方式
VIP推出的平臺(tái)即維普期刊資源整合服務(wù)平臺(tái),通過(guò)在同一個(gè)界面切換菜單的方式可以檢索文獻(xiàn)或者查找期刊。萬(wàn)方新改版的萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)操作更加方便,實(shí)現(xiàn)了一站式檢索的功能,可通過(guò)切換檢索框上方的期刊類型進(jìn)行檢索。當(dāng)切換為期刊類型時(shí),輸入框后面會(huì)有檢索論文和檢索刊名兩種選擇按鍵,輸入信息后只需點(diǎn)擊對(duì)應(yīng)按鍵即可。相對(duì)來(lái)說(shuō),CNKI的期刊檢索體驗(yàn)就繁瑣一些,在主頁(yè)檢索框上切換到期刊類型后,可以檢索到文獻(xiàn)內(nèi)容;如果需要查找某本期刊,需要點(diǎn)擊頁(yè)面右上角的期刊導(dǎo)航打開(kāi)新的界面,反之亦然??偟膩?lái)講,VIP和萬(wàn)方都推出了專門(mén)的平臺(tái),無(wú)論是檢索某篇文獻(xiàn)還是查找某種期刊,其相對(duì)應(yīng)的檢索輸入框是很容易找到的,CNKI則是在不同的頁(yè)面實(shí)現(xiàn)的,給用戶帶來(lái)了一些不便。
3.2期刊導(dǎo)航
CNKI的期刊導(dǎo)航做得是最細(xì)致的,可以按照大學(xué)科類別、刊期、出版地、刊源、核心刊等多種形式進(jìn)行查找。并且每種類別及子類的后面均備注了期刊的數(shù)量[4]。VIP實(shí)現(xiàn)了按照學(xué)科、核心刊、地區(qū)分布和國(guó)內(nèi)外數(shù)據(jù)庫(kù)進(jìn)行導(dǎo)航的功能,并且在小類的后面標(biāo)注了相應(yīng)的期刊數(shù)量[5]。萬(wàn)方的期刊導(dǎo)航界面目前實(shí)現(xiàn)了學(xué)科、地區(qū)和首字母導(dǎo)航。并在首界面展示了最近更新的期刊圖片和最新上網(wǎng)期刊列表。但是如果要了解每類期刊的數(shù)量,需要通過(guò)點(diǎn)擊具體的類別打開(kāi)新的界面才能找到相關(guān)數(shù)據(jù)[6]。綜上,三大期刊庫(kù)的期刊導(dǎo)航都可以實(shí)現(xiàn)最基本的首字母、學(xué)科和地區(qū)的導(dǎo)航功能,值得一提的是CNKI的導(dǎo)航界面制作的更細(xì)膩,功能實(shí)現(xiàn)的更全面。
表6 三大期刊庫(kù)的檢索途徑
3.3檢索方式及檢索途徑
CNKI期刊檢索界面提供的檢索方式比較多,有基本、專業(yè)、高級(jí)、作者發(fā)文、科研基金、句子和來(lái)源期刊檢索。VIP的期刊檢索界面提供了基本、專業(yè)和高級(jí)檢索。除此之外,CNKI和VIP在主界面可以選擇期刊的來(lái)源和限定年限,VIP還可以限定學(xué)科類別。CNKI和VIP均可以很方便地實(shí)現(xiàn)二級(jí)檢索。而萬(wàn)方主界面只實(shí)現(xiàn)了按關(guān)鍵詞或者篇名的基本檢索功能。如果需要使用其他檢索途徑需打開(kāi)高級(jí)檢索頁(yè)面,這樣操作起來(lái)顯得比較麻煩。另外,高級(jí)檢索界面無(wú)法實(shí)現(xiàn)二級(jí)檢索,這也是一個(gè)不足之處。下面詳細(xì)列出了各自的具體檢索途徑。從表6的檢索途徑可以看出三大期刊庫(kù)均提供了多種形式的檢索途徑,其中,各期刊庫(kù)獨(dú)有的檢索方式有:CNKI可按照ISSN和CN號(hào)檢索以及全文檢索;VIP實(shí)現(xiàn)了第一作者、作者簡(jiǎn)介、欄目信息和任意字段的檢索;萬(wàn)方可以實(shí)現(xiàn)按照DOI和日期的方式進(jìn)行檢索[4-6]。
表7 三大期刊庫(kù)的檢索結(jié)果顯示
3.4檢索結(jié)果顯示
從檢索結(jié)果的顯示界面來(lái)看,目前三大期刊庫(kù)的顯示都是比較詳細(xì)的,序號(hào)、題名、作者、期刊、摘要這些關(guān)鍵信息均可以看到,萬(wàn)方庫(kù)還單獨(dú)提供了關(guān)鍵詞信息。其中,如果需要看到CNKI的摘要信息,需要通過(guò)點(diǎn)擊檢索結(jié)果上方的切換按鍵,稍顯繁瑣。另外,萬(wàn)方庫(kù)在文獻(xiàn)處標(biāo)識(shí)了來(lái)源刊的情況和被引用情況,CNKI還標(biāo)明了下載次數(shù)。三大期刊庫(kù)在結(jié)果頁(yè)面均提供了下載和在線閱讀的功能。CNKI和萬(wàn)方的檢索結(jié)果頁(yè)面均可以找到相關(guān)信息的推薦服務(wù)。在檢索結(jié)果進(jìn)行列表展示時(shí),三大期刊庫(kù)均可以實(shí)現(xiàn)任意頁(yè)碼跳轉(zhuǎn),CNKI更是可以設(shè)置每頁(yè)顯示的記錄數(shù)(10,20和50條),而VIP只能實(shí)現(xiàn)每頁(yè)顯示20條的記錄,萬(wàn)方每頁(yè)只能顯示10條的記錄。在檢索結(jié)果分組瀏覽方面,實(shí)現(xiàn)方式最多的還是CNKI,可以做到按照學(xué)科、時(shí)間、基金等方式瀏覽。萬(wàn)方也具備按照學(xué)科、時(shí)間、機(jī)構(gòu)、出版狀態(tài)和期刊方式的分組瀏覽功能。但是VIP基本不具備此功能[4-6]。
本文對(duì)這三家出版的學(xué)術(shù)期刊庫(kù)內(nèi)容進(jìn)行了整體的重復(fù)度調(diào)查,通過(guò)兩兩比較我們發(fā)現(xiàn)重復(fù)率是非常高的,均高于70%。關(guān)于學(xué)術(shù)期刊數(shù)據(jù)庫(kù)更新延遲的情況, 本文分別從絕對(duì)延遲以及相對(duì)延遲的角度進(jìn)行觀察。結(jié)果表明三大期刊庫(kù)都存在絕對(duì)延遲的現(xiàn)象, 其收錄的期刊最新期數(shù)基本上都滯后于期刊最新發(fā)行的期數(shù)。檢索的易用性方面,三大期刊庫(kù)均在主頁(yè)提供了檢索入口,都提供了期刊導(dǎo)航功能。萬(wàn)方更是實(shí)現(xiàn)了一站式檢索的便利。CNKI的期刊導(dǎo)航分類項(xiàng)目更豐富,但是期刊文獻(xiàn)檢索和期刊導(dǎo)航之間需要切換到不同的頁(yè)面。檢索功能的比較從兩方面進(jìn)行,首先,三大期刊庫(kù)都可以實(shí)現(xiàn)基本、專業(yè)和高級(jí)檢索,但是萬(wàn)方不提供二級(jí)檢索。關(guān)于檢索途徑, 各數(shù)據(jù)庫(kù)都已經(jīng)將常用的幾種檢索方式(如題名、作者、關(guān)鍵詞等)納入其中,并在此基礎(chǔ)上提供了一些各自特有的檢索方式。三大期刊庫(kù)的檢索結(jié)果頁(yè)面也都非常詳細(xì),頁(yè)面顯示形式可以說(shuō)是正趨于統(tǒng)一,但是小細(xì)節(jié)上又具有特色??偟膩?lái)講,頁(yè)面制作的最精良的是CNKI,分類導(dǎo)航和瀏覽等方面做得較豐富的也是CNKI。而VIP定位于咨詢數(shù)據(jù)庫(kù), 因此其期刊數(shù)據(jù)庫(kù)的數(shù)量最多,結(jié)果顯示也相對(duì)較簡(jiǎn)單。萬(wàn)方是一個(gè)以科技信息為主的平臺(tái), 其目標(biāo)是為廣大科研工作者提供最優(yōu)的檢索服務(wù)。
本次研究也存在些許不足:(1)研究的樣本數(shù)量繁雜龐大,在對(duì)照整體重復(fù)數(shù)量時(shí),各數(shù)據(jù)庫(kù)的期刊名稱有出入,有些還在使用曾用名。這些必然影響整體的準(zhǔn)確性。(2)在調(diào)查期刊延遲現(xiàn)象時(shí),樣本數(shù)量較少,只能在一定程度上反映一些問(wèn)題。(3)在比較操作性和檢索功能時(shí),指標(biāo)較為凌亂, 沒(méi)有形成一個(gè)整體的評(píng)價(jià)體系。以上這些不足,均需要在以后的研究中不斷改進(jìn)。
[1]溫芳芳.試論中文電子期刊數(shù)據(jù)庫(kù)資源重復(fù)建設(shè)問(wèn)題[J].新世紀(jì)圖書(shū)館,2008,(2):69-71.
[2]谷景亮,趙芳,曹先平.3大中文期刊數(shù)據(jù)庫(kù)收錄期刊重復(fù)情況探究[J].醫(yī)學(xué)信息學(xué)雜志,2011,32(8):26-28.
[3]譚捷,張李義,饒麗君.中文學(xué)術(shù)期刊數(shù)據(jù)庫(kù)的比較研究[J].圖書(shū)情報(bào)知識(shí),2010,(4):4-13.
[4]中國(guó)知網(wǎng).期刊導(dǎo)航[EB/OL].[2015-03-08].http://epub.cnki.net/kns/oldnavi/n_Navi.aspx?NaviID=1&DataSource=CJFD.
[5]維普.期刊文獻(xiàn)檢索[EB/OL].[2016-01-08].http://lib.cqvip.com/.
[6]萬(wàn)方.期刊[EB/OL].[2016-01-08].http://c.wanfangdata.com.cn/Periodical.aspx.
G250.76
A
2016-01-31責(zé)任編輯:孫煒)