■林德明 郭銀鑫 姜 磊
大連理工大學科學學與科技管理研究所WISE實驗室,遼寧大連凌工路2號 116023
影響因子(Impact Factor,IF)是衡量期刊學術(shù)影響力的重要指標之一,廣泛應用于期刊、論文、學科、機構(gòu)和人才評價當中,在我國科研績效評價中發(fā)揮著重要的導向作用[1]。然而,關(guān)于影響因子的爭論卻從未休止,反對者認為影響因子受到諸多因素的影響,影響因子高的期刊不代表里面每一篇論文質(zhì)量都是高的[2-5]。很多學者通過單篇論文的被引頻次與期刊總被引頻次之間的關(guān)系論證這一觀點。
Franco-Lopez[6]等人利用論文累加貢獻率曲線圖發(fā)現(xiàn)Top5%的論文被引頻次占總被引頻次的30%,并且Top50%的論文被引頻次幾乎是剩余論文被引頻次的十倍;Monge-Najera[7]研究發(fā)現(xiàn)Nature至少40%的文章從未被引用,對于拉丁美洲的期刊來說情況更糟;Rezaei E[8]通過研究公共健康系列期刊并計算被引頻次百分比發(fā)現(xiàn)大約一半論文從未被引用,約90%的論文被引頻次小于6;丁佐奇[9]通過研究“中國科技期刊國際影響力提升計劃”資助期刊,發(fā)現(xiàn)Top20%的高被引論文對總被引頻次的貢獻在48.65%~82.61%;盛麗娜[10]對國際眼科學權(quán)威期刊研究,發(fā)現(xiàn)Top5%高被引論文對影響因子的貢獻度為20.70%~37.79%;劉雪立[11]對10種國際權(quán)威期刊進行研究,發(fā)現(xiàn)Top5%高被引論文對影響因子的貢獻度為19.1%~57.2%,另外還有不少學者在研究不同的文獻類型對影響因子的貢獻度[12-14]。
總的來說,目前的研究都是通過簡單計算被引頻次占總被引頻次的比重來測度單篇學術(shù)論文對影響因子的貢獻。如果考慮到論文被引頻次的極值現(xiàn)象以及期刊論文的被引頻次分布特性,以上方法就存在著一定的局限性。本文試圖通過計算單篇學術(shù)論文對影響因子的貢獻率,定量測度論文對影響因子做出的貢獻比例,并提出計算每篇論文與影響因子的絕對標準距離,進一步完善影響因子貢獻率的分析方法,并且更加直觀地反映單篇論文對影響因子的貢獻。
本文使用最有影響力的學術(shù)期刊之一Nature作為樣本期刊,Nature是由英國商業(yè)出版商Nature出版集團出版發(fā)行的旗艦[15],是世界上最早的國際性科技期刊,自從1869年創(chuàng)刊以來,始終如一地報道和評論全球科技領(lǐng)域里最重要的突破。Nature的影響因子排名始終靠前且相對穩(wěn)定,2015年的JCR顯示 Nature的影響因子高達 38.138。本文以Nature為研究對象,進行影響因子與五年影響因子(5-year impact factor,IF5)的研究,得出的結(jié)論較為有說服力且具有一定的代表性。另一方面是數(shù)據(jù)的選取,本文以Web of Science的核心合集為數(shù)據(jù)源,逐年檢索Nature在2009—2013年的發(fā)文,由于影響因子分母計算僅涉及類型為“Article”和“Review”的文獻,因此對上述論文進行文獻類型篩選,然后創(chuàng)建引文分析報告并下載數(shù)據(jù),從中獲取期刊每一年的發(fā)文量、被引頻次等。
本文的研究方法主要采用文獻計量法,從定量的角度來研究單篇學術(shù)論文對影響因子的貢獻率,并建立新的指標進行非線性回歸分析。設(shè)某期刊為,欲研究期刊年與年刊載的篇論文對期刊年影響因子的貢獻程度。從影響因子的公式:
可以看出,影響因子的本質(zhì)為期刊論文的平均被引率。因此,期刊中的每一篇論文統(tǒng)計當年的被引頻次在期刊統(tǒng)計當年總被引頻次中占的比例(設(shè)為P),可以看成是對影響因子高低的貢獻程度,即:
同時,設(shè)J期刊的影響因子為基準線,利用基準線以上論文數(shù)與基準線以下論文數(shù)的比值、基準線以上論文數(shù)占論文總數(shù)比例、基準線以上論文對影響因子的累加貢獻率三個指標分析Yt年的被引頻次分布,初步判斷期刊單篇論文對影響因子的貢獻程度。
在上述研究基礎(chǔ)上,進一步建立一個新的指標來深入研究單篇論文對影響因子的貢獻率,具體分析方法如下:
(2)為避免數(shù)據(jù)受最大值、最小值的影響而造成結(jié)果的偏差,需要對數(shù)據(jù)進行標準化;
按照上述研究方法,首先計算Nature在2012/2013年發(fā)表的某文獻對2014年影響因子的貢獻程度,即:
根據(jù)公式(3)的計算結(jié)果對2014年影響因子貢獻率進行分析,設(shè)Nature在2014年的影響因子為基準線,如表1所示。
表1 Nature以影響因子為基準線的被引頻次分布情況統(tǒng)計表
表1結(jié)果顯示:在2014年Nature影響因子的計算中,27.12%論文的被引頻次之和占到了總被引頻次的63.50%。可見,在影響因子基準線之上的文獻占少數(shù),但是它們對影響因子的貢獻程度卻占到了60%以上。也就是說,期刊中的少部分文獻對影響因子做出的是很大的貢獻。
為了進一步分析各類期刊論文對影響因子的貢獻,按照前文所述方法對數(shù)據(jù)進行處理,得到論文到影響因子的絕對標準距離,并確定為影響因子的基準線。從圖1影響因子絕對距離的分布特征可以看出,絕對標準距離呈指數(shù)型分布,即。利用統(tǒng)計分析軟件SPSS對標準化后的數(shù)據(jù)進行非線性回歸分析,得到:
圖1 每篇論文與影響因子的絕對標準距離
表2 絕對標準距離回歸分析
從分布情況可以看出,各論文與影響因子的相對距離分布比較分散,真正與影響因子接近的論文少之又少,基準線之上的文獻對于影響因子的貢獻也是參差不齊的,少數(shù)高被引的論文對影響因子做出了較大的貢獻,多數(shù)論文都與影響因子有較大距離,并對影響因子做出了較大的負貢獻。
國際著名科學計量學家Price DJD在經(jīng)過大量的文獻統(tǒng)計后得出結(jié)論:科學論文發(fā)表后2年為論文的被引用高峰期。長期以來,湯森路透(Thomson Reuters)在JCR中公布的影響因子一直采用2年作為時間跨度。但是學術(shù)界對影響因子計算方法的局限性引起了熱議,認為時間跨度是導致期刊影響因子局限性的因素之一;以2年為時間跨度太短,對于一些發(fā)展進程比較慢的學科,IF不能合理地測度其期刊論文影響力。經(jīng)過熱議后,湯森路透于2009年發(fā)布的新版JCR中增加了五年影響因子IF5[16]。五年影響因子相較于影響因子能更為宏觀、穩(wěn)定的反映期刊的水平。因此,有必要進一步研究分析單篇論文對五年影響因子的貢獻度。
首先計算Nature在2009—2013年發(fā)表的某文獻對2014年五年影響因子的貢獻程度,即:
根據(jù)計算結(jié)果,對2014年五年影響因子貢獻率進行分析,如表3所示。
表3 Nature以五年影響因子為基準線的被引頻次分布情況統(tǒng)計表
表3結(jié)果顯示:在Nature2014年五年影響因子計算中,28.85%論文的被引頻次之和占到了總被引頻次的65.53%,這個結(jié)論和前文對影響因子進行分析的結(jié)論相似,也就是說,期刊中的少部分文獻對五年影響因子做出了貢獻。
圖2 每篇論文與五年影響因子的絕對標準距離
為了進一步分析期刊論文對五年影響因子的貢獻,按照前文所述方法對數(shù)據(jù)進行處理,利用統(tǒng)計分析軟件SPSS對標準化后的論文被引頻次與影響因子的絕對距離進行非線性回歸分析,可知圖中的非線性回歸趨勢線為,且。因此可以得到與影響因子同樣的結(jié)論,各論文與五年影響因子的相對距離分布比較分散,基準線之上的文獻對于五年影響因子的貢獻也是參差不齊的,真正與五年影響因子接近的論文很少,少數(shù)高被引論文對五年影響因子做出了較大的貢獻,多數(shù)論文都與五年影響因子有較大距離,并對五年影響因子做出了較大的負貢獻。
通過上述Nature影響因子及五年影響因子的貢獻率研究,可以得出以下結(jié)論:
(1)影響因子的貢獻率表明,27.12%論文的被引頻次在影響因子基準線以上,它們的被引頻次之和占總被引頻次的63.50%,也就是說,真正為影響因子做出了貢獻的論文只占一少部分,在五年影響因子的貢獻率分析中,也充分說明這一點。
(2)影響因子絕對標準距離的回歸分析表明,論文與影響因子的絕對標準距離符合指數(shù)分布,即使少數(shù)基準線之上的文獻對于影響因子的貢獻也是參差不齊的,高被引論文對影響因子做出了較大的貢獻,大部分基準線以下的論文都與影響因子有較大距離,并對影響因子做出了較大的負貢獻。五年影響因子的結(jié)論也不盡相同。
綜上所述,期刊影響因子是由少部分的高被引論文做出突出的貢獻,這部分優(yōu)秀論文既要抵消負貢獻的論文,又要保證期刊的影響因子。因此,使用期刊影響因子來評價期刊中的單篇論文是不夠客觀和全面的。建議在評價單篇論文時,綜合考慮影響因子與論文被引頻次的關(guān)系,盡量消除少數(shù)高被引論文尤其是極值論文的影響,可考慮將絕對標準距離指標加入到論文評價指標體系中,從而更科學合理地評價單篇學術(shù)論文的質(zhì)量,同時對于科技期刊的評價也不應過于注重影響因子。
[1]耿艷輝.影響因子的局限性研究綜述論文[J].中國科技期刊研究,2014,25(8):1052-1057.
[2]王玉霞,印莉娟.科技期刊影響因子的本質(zhì)意義、表征意義及影響因素[J].編輯學報,2006,(S1):172-173.
[3]Lewenstein B V.Editorial:A decade of public understanding[J].Public Understanding of Science,2002,11(1):1-4.
[4]CoupéT.Peer review versus citations-An analysisof best paper prizes[J].Research Policy,2013,42(1):295-301.
[5]Garfield E.Journal impact factor:a brief review[J].Canadian Medical Association Journal,1999,161(8):979-980.
[6]Franco-López A, González-Gallego J, Sanz-Valero J, et al.Some considerations about the intrinsic value of the impact factor of scientific journals[J].Nutricionhospitalaria,2014,32(6):2369-2373.
[7]Monge-Nájera J.The invalidity of the Impact Factor as indicator of the impact of Latin American scientific journals[J].Revista de Biología Tropical/International Journal of Tropical Biology and Conservation,2014,62(1):9-13.
[8]Rezaei E,Navidi I,Rokni M B,et al.Assessing the effect of highly cited papers on the impact factor of journals in the field of public health[J].Iranian journal of public health,2012,41(12):84.
[9]丁佐奇.“中國科技期刊國際影響力提升計劃”資助期刊的影響因子貢獻因素分析及啟示[J].中國科技期刊研究,2015,26(3):305-311.
[10]盛麗娜.國際眼科學權(quán)威期刊不同文獻對影響因子貢獻度分析[J].中國科技期刊研究,2015,26(1):106-111.
[11]劉雪立,蓋雙雙,張詩樂,等.“非可被引文獻”的引證特征及其對科技期刊影響因子的貢獻[J].編輯學報,2015,27(5):495-499.
[12]單衛(wèi)華.不同文獻類型對期刊影響因子的貢獻度--以Web of Science收錄的兒科學權(quán)威期刊為例[J].情報探索,2016(1):68-71.
[13]盛麗娜.SSCI信息科學和圖書館學期刊文獻類型及其對影響因子貢獻度分析[J].情報科學,2016,34(6):116-120.
[14]付中靜.國際權(quán)威期刊非可被引文獻的引證特征以及對影響因子的貢獻[J].中國科技期刊研究,2016,27(3):324-329.
[15]Waaijer CJF.Careers in science:policy issues according to Nature and Science editorials[J].Scientometrics,2013,96(2):485-495.
[16]王娟,鄭春厚.JCR 5年期影響因子實證分析[J].圖書情報工作,2012,56(4):143-147.