■丁佐奇
中國(guó)藥科大學(xué)《中國(guó)天然藥物》編輯部,江蘇省南京市童家巷24號(hào) 210009
科學(xué)計(jì)量指標(biāo)可以客觀反映期刊論文的質(zhì)量和影響,是期刊評(píng)價(jià)和科研管理工作的重要工具[1]。論文的被引頻次和下載量是用于論文評(píng)價(jià)的金指標(biāo),被引頻次是衡量學(xué)術(shù)質(zhì)量以及學(xué)術(shù)影響力的重要評(píng)價(jià)指標(biāo),下載量則可測(cè)度論文的可見(jiàn)度及傳播速率。因此,對(duì)論文及期刊進(jìn)行評(píng)價(jià),包括對(duì)核心期刊的確定,被引頻次與下載量同時(shí)作為文獻(xiàn)價(jià)值的表征而共同被納入到評(píng)價(jià)指標(biāo)體系。被引頻次越高,學(xué)術(shù)影響力越大,Web即年下載率越高,說(shuō)明讀者對(duì)期刊的興趣越大[2]。
近年來(lái),國(guó)內(nèi)學(xué)者主要利用中國(guó)知網(wǎng)(CNKI)等引文數(shù)據(jù)庫(kù)對(duì)論文的被引頻次與下載量的相關(guān)性進(jìn)行了研究。王麗[3]研究發(fā)現(xiàn)CNKI中醫(yī)藥衛(wèi)生科技類文獻(xiàn)的下載量與被引頻次之間沒(méi)有明顯的相關(guān)性,無(wú)規(guī)律可循。張小強(qiáng)[4]對(duì)CNKI、中國(guó)科學(xué)引文數(shù)據(jù)庫(kù)(CSCD)和中國(guó)人文社會(huì)科學(xué)引文數(shù)據(jù)庫(kù)(CHSSCD)來(lái)源期刊的下載量和被引頻次的相關(guān)性進(jìn)行了研究,發(fā)現(xiàn)兩者之間具有高度正相關(guān)性。嚴(yán)美娟等[5]對(duì)CNKI中的6種兒科類期刊進(jìn)行了研究,發(fā)現(xiàn)被引頻次與下載量相關(guān)性的高低和不同欄目論文內(nèi)容有關(guān)。國(guó)際上有不少學(xué)者利用各大國(guó)際數(shù)據(jù)庫(kù)對(duì)論文的下載量與被引頻次的相關(guān)性做了廣泛的研究。Nieder等[6]研究了5種腫瘤學(xué)領(lǐng)域的開(kāi)放獲取(OA)期刊的情況,下載量數(shù)據(jù)來(lái)源于這些期刊的網(wǎng)站,被引頻次數(shù)據(jù)來(lái)源于Scopus數(shù)據(jù)庫(kù),結(jié)果發(fā)現(xiàn)下載量和被引頻次的相關(guān)性較差。趙一權(quán)等[7]利用美國(guó)計(jì)算機(jī)協(xié)會(huì)數(shù)字圖書(shū)館數(shù)據(jù)庫(kù)研究了計(jì)算機(jī)領(lǐng)域的31種期刊,發(fā)現(xiàn)無(wú)論是在期刊層面,還是在文獻(xiàn)層面,下載量和被引頻次都具有較強(qiáng)的正相關(guān)性。Jiang等[8]對(duì)JAmMedInformAssoc網(wǎng)站的論文下載量和其在Web of Science(WoS)的被引頻次進(jìn)行了研究,發(fā)現(xiàn)兩者之間存在較強(qiáng)的正相關(guān)性。Moed等[9]根據(jù)ScienceDirect平臺(tái)的下載量和Scopus數(shù)據(jù)庫(kù)的被引頻次發(fā)現(xiàn)所研究期刊的下載量和被引頻次呈正相關(guān),但高被引和高下載論文之間重合的論文較少。Guerrero-Bote等[10]也利用ScienceDirect平臺(tái)和Scopus數(shù)據(jù)庫(kù)對(duì)期刊和論文兩個(gè)層面下載量和被引頻次的相關(guān)性進(jìn)行研究,發(fā)現(xiàn)期刊層面的相關(guān)性優(yōu)于論文層面。Jahandideh等[11]則利用ScienceDirect平臺(tái)和Scopus數(shù)據(jù)庫(kù),研究了高下載和低下載論文各25篇及其后續(xù)被引頻次的相關(guān)情況,發(fā)現(xiàn)一定時(shí)段內(nèi)的下載量可以較好地預(yù)測(cè)論文未來(lái)可能達(dá)到的被引頻次。Subotic等[12]同樣利用ScienceDirect平臺(tái)和Scopus數(shù)據(jù)庫(kù),研究了高下載及低下載論文各129篇及其后續(xù)被引頻次的相關(guān)情況,發(fā)現(xiàn)先期的下載量和后續(xù)的被引頻次呈正相關(guān)。Lippi等[13]利用ScienceDirect平臺(tái)的下載量和SciVerse上的被引頻次,發(fā)現(xiàn)一定時(shí)段內(nèi)的高下載能夠帶來(lái)后兩年的高引用。
從以上文獻(xiàn)綜述可以看出,由于ScienceDirect平臺(tái)能夠提供下載量、而Scopus數(shù)據(jù)庫(kù)能夠提供被引頻次,國(guó)際上利用其對(duì)下載量和被引頻次的相關(guān)性做了大量研究。WoS雖然有強(qiáng)大的文獻(xiàn)檢索和分析功能,但一直沒(méi)有文章下載量這個(gè)指標(biāo),直到2015年9月26日,WoS 數(shù)據(jù)庫(kù)平臺(tái)升級(jí)至5.19版,才新增了“文獻(xiàn)級(jí)別用量指標(biāo)”,即使用次數(shù)。“文獻(xiàn)級(jí)別用量指標(biāo)”反映了某篇論文滿足用戶信息需要的次數(shù),具體表現(xiàn)為用戶點(diǎn)擊了指向出版商處全文的鏈接(直接鏈接或開(kāi)放鏈接),或是對(duì)論文進(jìn)行了保存以便在題錄管理工具中使用(通過(guò)直接導(dǎo)出或另存為將論文重新導(dǎo)到其他格式)。使用次數(shù)每天更新一次,使用次數(shù)是從 2013年2月1日開(kāi)始某條記錄的全文得到訪問(wèn)或是對(duì)記錄進(jìn)行保存的次數(shù),該次數(shù)可能會(huì)逐漸增長(zhǎng)或保持不變;使用次數(shù)(180天),是最近180天內(nèi)通過(guò)某條記錄的全文得到訪問(wèn)或是對(duì)記錄進(jìn)行保存的次數(shù),該計(jì)數(shù)會(huì)隨著固定時(shí)段結(jié)束日期的推進(jìn)而上升或下降[14]。
鑒于目前利用WoS數(shù)據(jù)庫(kù)進(jìn)行下載量和被引頻次相關(guān)性研究的文獻(xiàn)較少[15-16],本文利用WoS數(shù)據(jù)庫(kù)對(duì)《中國(guó)天然藥物》(CJNM)高被引論文和高使用論文各自的使用次數(shù)和被引頻次的相關(guān)性進(jìn)行研究。有大量的研究發(fā)現(xiàn),科技期刊論文被引量的峰值年在論文發(fā)表后的第6~8年,而論文下載量的峰值年在論文發(fā)表后第2年[2,17-19]。由于高被引和高下載論文的峰值年相差較遠(yuǎn),同一發(fā)表年份的高被引和高下載論文重合率的研究?jī)r(jià)值不大,本研究還對(duì)CJNM及其所在學(xué)科整合替代醫(yī)學(xué)論文同一年份的高使用和低使用論文的后續(xù)被引頻次進(jìn)行比較,分析2014年和2015年高使用和低使用論文對(duì)應(yīng)的被引頻次是否有差異。
(1) 研究CJNM 2013—2017年在WoS核心合集中總被引頻次(TC)排名前50(TOP50)論文、使用次數(shù)(180天)(U1)TOP50論文、使用次數(shù)(U2)TOP50論文的具體情況,分析被引頻次TOP50論文TC和U1、U2的相關(guān)性,使用次數(shù)(180天)TOP50論文U1和TC、U2的相關(guān)性,使用次數(shù)TOP50論文U2和TC、U1的相關(guān)性。(2)研究CJNM及整合替代醫(yī)學(xué)學(xué)科的論文2014年和2015年單年的使用次數(shù)TOP50論文和排名最后50(LOWER50)論文,分析其后續(xù)的被引頻次是否有顯著性差異。CJNM數(shù)據(jù)檢索日期為2017年4月20日,整合替代醫(yī)學(xué)學(xué)科數(shù)據(jù)檢索日期為2017年9月10日。
采用GraphPad Prism 6.01軟件分析數(shù)據(jù),Pearson相關(guān)性分析,雙尾,置信區(qū)間為95%,顯著性系數(shù)P<0.05時(shí)差異有統(tǒng)計(jì)學(xué)意義;t檢驗(yàn)P<0.05時(shí)差異有統(tǒng)計(jì)學(xué)意義。
對(duì)CJNM 2013—2017年在WoS核心合集中被引頻次、使用次數(shù)(180天)、使用次數(shù)TOP50論文的發(fā)表年份進(jìn)行統(tǒng)計(jì),結(jié)果如表1所示。被引頻次TOP50論文主要集中在2013—2015年,其中以2013年居首(24篇,占48%);使用次數(shù)TOP50論文同樣集中在2013—2015年,但以2014年居首(18篇,占36%);使用次數(shù)(180天)TOP50論文集中在2016年(30篇,占60%)。
表1 CJNM被引頻次、使用次數(shù)、使用次數(shù)(180天)TOP50論文數(shù)量分布 (篇)
表2顯示被引頻次TOP50論文的TC和U1、U2均呈正相關(guān)性,其中TC和U2的相關(guān)性較強(qiáng)(相關(guān)系數(shù)r=0.802,P<0.0001)。表3顯示使用次數(shù)(180天)TOP50論文的U1和TC、U2均呈正相關(guān)性,其中U1和U2的相關(guān)性較強(qiáng)(r=0.646,P<0.0001)。表4顯示使用次數(shù)TOP50論文的U2和TC、U1均呈正相關(guān)性,其中U2和TC的相關(guān)性較強(qiáng)(r=0.843,P<0.0001)。
表2 CJNM被引頻次TOP50論文的TC和U1、U2相關(guān)性
表3 CJNM使用次數(shù)(180天)TOP50論文的U1和TC、U2相關(guān)性
表4 CJNM使用次數(shù)TOP50論文的U2和TC、U1相關(guān)性
CJNM 2014年和2015年單年的使用次數(shù)TOP50論文和LOWER50論文的TC差異性見(jiàn)表5,2014年和2015年使用次數(shù)TOP50論文和LOWER50論文的TC差異均有顯著性,2014年和2015年使用次數(shù)TOP50論文的篇均被引頻次分別是使用次數(shù)LOWER50論文的2倍和11倍。
表5 CJNM使用次數(shù)TOP50論文和LOWER50論文的TC差異性
為了探討上述個(gè)刊案例結(jié)果是否可以推及到整個(gè)學(xué)科,繼續(xù)分析了整合替代醫(yī)學(xué)學(xué)科2014年和2015年單年的使用次數(shù)TOP50論文和LOWER50論文(表6),發(fā)現(xiàn)2014年和2015年使用次數(shù)TOP50論文和LOWER50論文的TC差異均有顯著性,2014年和2015年使用次數(shù)TOP50論文的篇均被引頻次分別是使用次數(shù)LOWER50論文的31倍和16倍。
表6 整合替代醫(yī)學(xué)學(xué)科使用次數(shù)TOP50論文和LOWER50論文的TC差異性
由于大多數(shù)情況下文獻(xiàn)的被引頻次與該文獻(xiàn)質(zhì)量呈高度正相關(guān),使得引文分析作為科學(xué)評(píng)價(jià)的方法具備一定的可行性,但是作者引用的文獻(xiàn)往往僅占其在研究工作中所閱讀過(guò)的文獻(xiàn)的一部分,那么其中未被引用的文獻(xiàn)的價(jià)值該如何去體現(xiàn)?下載量成為一個(gè)日漸公認(rèn)的評(píng)估指標(biāo),它在直觀上能夠與該文獻(xiàn)的被閱讀次數(shù)相對(duì)應(yīng)。相對(duì)于被引頻次來(lái)說(shuō),下載量能夠較早地反映文章的受關(guān)注度。文章的下載量與被引頻次是否呈正相關(guān)?普遍認(rèn)為:文章被閱讀的次數(shù)越多,被引用的可能性越大。事實(shí)上,下載量雖然反映了文章被社會(huì)關(guān)注的程度,但它僅是文章被引的前奏,并不是所有的下載都會(huì)帶來(lái)引用。Carey[20]認(rèn)為下載量較于被引頻次能夠更好地反映期刊的真實(shí)影響力。也有專家認(rèn)為,下載量只是反映了論文的可獲得性及可見(jiàn)度,而被引頻次才能真正反映論文的學(xué)術(shù)質(zhì)量。目前尚未有論文下載量與被引頻次相關(guān)性的定論。
WoS數(shù)據(jù)庫(kù)作為國(guó)際上公認(rèn)的權(quán)威數(shù)據(jù)庫(kù),一直沒(méi)有下載量指標(biāo)是一個(gè)比較大的遺憾,且該數(shù)據(jù)庫(kù)文獻(xiàn)的入庫(kù)速度比較緩慢,當(dāng)然這和該數(shù)據(jù)庫(kù)嚴(yán)謹(jǐn)?shù)氖珍浟鞒逃嘘P(guān),不過(guò)文獻(xiàn)信息的實(shí)時(shí)公開(kāi)同樣是非常重要的。所幸的是,WoS 數(shù)據(jù)庫(kù)于2015年下半年增加了“文獻(xiàn)級(jí)別用量指標(biāo)”,即使用次數(shù)指標(biāo)。本研究對(duì)CJNM及其所在整合替代醫(yī)學(xué)類論文進(jìn)行了分析,得出以下幾點(diǎn)結(jié)論:
分析CJNM 2013—2017年發(fā)表的論文,發(fā)現(xiàn)被引頻次TOP50論文主要集中發(fā)表在2013年,使用次數(shù)TOP50論文主要集中發(fā)表在2014年,使用次數(shù)(180天)論文主要集中發(fā)表在2016年。畢竟從引用到發(fā)表還有一定的時(shí)滯,而使用次數(shù)相對(duì)及時(shí),本研究結(jié)果再次驗(yàn)證了高被引論文是較老的文獻(xiàn),而高使用論文是較新的文獻(xiàn),尤以使用次數(shù)(180天)高的論文為最新。
本研究中,被引頻次和使用次數(shù)及使用次數(shù)(180天)三者之間互相具有較好的相關(guān)性。多位專家發(fā)現(xiàn)論文在發(fā)表當(dāng)年及第二年達(dá)到下載高峰,而引用高峰則需要幾年的時(shí)間才能達(dá)到。目前論文下載量與被引頻次的相關(guān)性未能形成定論,其中時(shí)間跨度的選擇可能是造成矛盾結(jié)果的主要原因。因此,在論文下載量與被引頻次相關(guān)性的研究中,研究對(duì)象的發(fā)表年份的選擇很重要。例如,Coats[21]研究了IntJCardiol同一年份內(nèi)的TOP10被引和下載論文,發(fā)現(xiàn)兩者沒(méi)有重合的論文;還有一些文獻(xiàn)選擇5年甚至10年前的論文進(jìn)行研究,得到下載量與被引頻次無(wú)相關(guān)性的結(jié)論,這有待商榷,畢竟5年前的論文早已達(dá)到被引高峰,而高下載的論文集中在近2年,高被引和高下載論文之間無(wú)重合也情有可原。
本研究發(fā)現(xiàn),被引頻次TOP50論文的被引頻次和使用次數(shù)及使用次數(shù)(180天)均呈正相關(guān)。這和Wang等[16]的研究結(jié)果一致,他們利用WoS的使用次數(shù)指標(biāo)分析發(fā)現(xiàn),研究人員整體上傾向于使用較新的文獻(xiàn),但被引頻次高的老文獻(xiàn)有助于其后續(xù)使用次數(shù)的二次提高。畢竟,歷年發(fā)表的文獻(xiàn)多如恒河沙數(shù),研究人員可能通過(guò)被引頻次的降序排列以盡快獲得需要的論文。
本研究還發(fā)現(xiàn),單刊使用次數(shù)TOP50論文的使用次數(shù)和被引頻次的相關(guān)性較強(qiáng),單刊和整個(gè)學(xué)科論文2014年和2015年的高使用論文和低使用論文分別對(duì)應(yīng)后續(xù)的高被引和低被引論文,說(shuō)明可以通過(guò)論文發(fā)表后2年內(nèi)的使用次數(shù)來(lái)預(yù)測(cè)未來(lái)可能達(dá)到的被引頻次。
此外,影響論文下載量和被引頻次的因素還有很多。Timsit等[22]利用WoS的被引頻次和SpringerLink的下載量研究了影響IntensiveCareMedicine下載和引用的因素,發(fā)現(xiàn)每年第二季度下載量較多,綜述下載量較多,且最后一位作者的h指數(shù)越高,下載越多;而會(huì)議報(bào)道和專論被引較多,且第一位作者的h指數(shù)越高,被引頻次越高。Wang等[23]研究了NatureCommunicationsOA論文和非OA論文,發(fā)現(xiàn)OA論文較非OA論文在引用和下載方面均有優(yōu)勢(shì),且OA論文不僅能增加總下載量,還能延長(zhǎng)被下載的時(shí)限。
綜上所述,期刊可以利用論文發(fā)表后2年內(nèi)的使用次數(shù)對(duì)其未來(lái)是否為高被引進(jìn)行預(yù)測(cè);年代悠久的高被引文獻(xiàn),也可能帶來(lái)后續(xù)使用次數(shù)的二次提高。WoS文獻(xiàn)級(jí)別用量指標(biāo)能夠在論文發(fā)表后的短時(shí)間內(nèi),對(duì)其影響力進(jìn)行快速評(píng)估,提示該指標(biāo)可作為論文影響力早期評(píng)價(jià)的客觀指標(biāo),期刊可以借助這個(gè)指標(biāo)來(lái)選擇論文進(jìn)行及時(shí)宣傳和推廣。
[1] 馬崢. 通過(guò)計(jì)量指標(biāo)分析發(fā)現(xiàn)操縱期刊評(píng)價(jià)結(jié)果的行為[J]. 編輯學(xué)報(bào),2016,28(6):608-611.
[2] 丁佐奇,鄭曉南,吳曉明. 科技論文被引頻次與下載頻次的相關(guān)性分析[J]. 中國(guó)科技期刊研究,2010,21(4):467-470.
[3] 王麗. 中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)中高被引文獻(xiàn)與高下載文獻(xiàn)類型分析——以醫(yī)藥衛(wèi)生科技類文獻(xiàn)為例[J]. 編輯學(xué)報(bào),2015,27(5):503-506.
[4] 張小強(qiáng). 期刊下載頻次與被引頻次及影響因子相關(guān)性——以中國(guó)知網(wǎng)CSCD與CHSSCD刊物為樣本的計(jì)量分析[J]. 情報(bào)理論與實(shí)踐,2011,34(8):36-40.
[5] 嚴(yán)美娟,肖麗娟,張莉,等. 兒科類期刊欄目設(shè)置與論文被引頻次和下載頻次之間的關(guān)系[J]. 編輯學(xué)報(bào),2012,24(4):399-401.
[6] Nieder C,Dalhaug A,Aandahl G. Correlation between article download and citation figures for highly accessed articles from five open access oncology journals[J].Springerplus,2013,2(1):261.
[7] 趙一權(quán),王振民,熊文炳,等. 科學(xué)論文的下載與引用關(guān)系研究:以ACM數(shù)字圖書(shū)館為例[J]. 中國(guó)科技期刊研究,2014,25(6):818-823.
[8] Jiang X,Tse K,Wang S,etal. Recent trends in biomedical informatics:a study based on JAMIA articles[J].JournaloftheAmericanMedicalInformaticsAssociation,2013,20(e2):e198-e205.
[9] Moed H F,Halevi G. On full text download and citation distributions in scientific-scholarly journals[J].JournaloftheAssociationforInformationScienceandTechnology,2015,67(2):412-431.
[10] Guerrero-Bote V P, Moya-Anegón F. Relationship between downloads and citations at journal and paper levels, and the influence of language[J].Scientometrics,2014,101(2):1043-1065.
[11] Jahandideh S,Abdolmaleki P,Asadabadi E B. Prediction of future citations of a research paper from number of its internet downloads[J].MedicalHypotheses,2007,69(2):458-459.
[12] Subotic S,Mukherjee B. Short and amusing:The relationship between title characteristics,downloads,and citations in psychology articles[J].JournalofInformationScience,2014,40(1):115-124.
[13] Lippi G,Favaloro E J. Article downloads and citations:Is there any relationship?[J].ClinicaChimicaActa,2013,415:195.
[14] 孫學(xué)軍. SCI新增功能“文獻(xiàn)級(jí)別用量指標(biāo)”是個(gè)什么東東[EB/OL]. [2015-10-10]. http://blog.sciencenet.cn/blog-41174-926981.html.
[15] 付中靜. WoS數(shù)據(jù)庫(kù)收錄論文文獻(xiàn)級(jí)別用量指標(biāo)與被引頻次的相關(guān)性[J]. 中國(guó)科技期刊研究,2017,28(1):68-73.
[16] Wang X W,Fang Z C,Sun X L. Usage patterns of scholarly articles on Web of Science:A study on Web of Science usage count[J].Scientometrics,2016,109(2):917-926.
[17] 方紅玲. 我國(guó)科技期刊論文被引量和下載量峰值年代——多學(xué)科比較研究[J]. 中國(guó)科技期刊研究,2011,22(5):708-710.
[18] 丁佐奇,鄭曉南,吳曉明. SCI藥學(xué)論文被引峰值研究及國(guó)別比較[J]. 科技與出版,2012 (8):114-116.
[19] Schl?gl C,Gorraiz J,Gumpenberger C,etal. Comparison of downloads,citations and readership data for two information systems journals[J].Scientometrics,2014,101(2):1113-1128.
[20] Carey R M. Quantifying scientific merit:Is it time to transform the impact factor?[J].CirculationResearch,2016,119(12):1273-1275.
[21] Coats A J. Top of the charts:Download versus citations in the International Journal of Cardiology[J].InternationalJournalofCardiology,2005,105(2):123-125.
[22] Timsit J F,Citerio G,Lavilloniere M,etal. Determinants of downloads and citations for articles published in intensive care medicine[J].IntensiveCareMedicineExperimental,2015,3(1):A863.
[23] Wang X W,Liu C,Mao W L,etal. The open access advantage considering citation,article usage and social media attention[J].Scientometrics,2015,103(3):1149.