?
期刊影響因子與被引半衰期關系之比較研究——以圖書情報學期刊為例
何文葉繼元
摘要影響因子和被引半衰期是期刊評價的兩個重要指標,論文利用《中國期刊引證報告(擴刊版)》和Journal Citation Reports(JCR)的數(shù)據(jù),以SPSS和Excel為統(tǒng)計分析工具,探討圖書情報領域的影響因子和被引半衰期的關系,并簡單分析了產生該關系的原因,認為在構建期刊評價指標體系時應將二者的關系考慮在內。
關鍵詞影響因子被引半衰期圖書情報學相關分析SPSS
分類號G250.1
A Comparative Study of the Relationship between Impact Factor and Cited Half-life:Taking the Library and Information Science Journal as an Example
He Wen,Ye Jiyuan
Abstract The journal impact factor and cited half-life are two important indicators of journal evaluation. This paper uses data from Journal Citation Reports at home and abroad, selects SPSS and Excel as statistical analysis tools, explores the relationship between the two indicators in Library and Information journals, and briefly analyses the reasons. At last, it advises that the relationship should be taken into consideration during the construction of journal evaluation index system.
Keywords Impact factor. Cited half-life. Library and information science. Correlation analysis. SPSS.
影響因子(Impact Factor)是Garfield等在20世紀60年代初在《科學引文索引》選取來源期刊時提出的,是“一種簡單的、不受期刊大小和被引次數(shù)影響的對期刊進行比較的方法”[1]。該指標是一個相對統(tǒng)計平均值,可克服期刊由于歷史長短、刊期不同及載文量多少所帶來的偏差。期刊發(fā)表學術成果的被引用率與時間之間存在著反比例關系,被引半衰期就是對二者這種關系的具體體現(xiàn),它是測度期刊老化速度的一個指標。
本文利用《中國期刊引證報告(擴刊版)》和Web of Science的Journal Citation Report(JCR)的數(shù)據(jù),通過SPSS和Excel數(shù)據(jù)統(tǒng)計分析工具進行多重比較和回歸分析,定性分析和定量分析相結合,探討圖書情報領域期刊的影響因子和被引半衰期的關系,以期為中國的期刊評價提供參考。
1.1國外文獻綜述
Tsay, Ming-Yueh利用皮爾遜相關等分析方法,以物理、化學、工程類期刊為研究對象,比較被引量、影響因子、引用半衰期、被引半衰期等科學計量指標之間的關系,發(fā)現(xiàn)被引半衰期與其他指標之間并不存在顯著相關[2]。T Markpin,N Premkamolnetr和Sombatsompop將影響因子和被引半衰期相結合,提出了一種新的計算影響因子的方法:Cited Half-Life Impact Factor(CHAL)[3]。
Chen Yi-ling和Tsay Ming-yueh通過對內外科醫(yī)學期刊的研究分析發(fā)現(xiàn)影響因子和即年指標都與被引次數(shù)顯著相關,影響因子和即年指標之間也存在顯著相關,但是被引半衰期和除引用半衰期以外的引用指標之間都不存在相關關系[4]。
1.2國內文獻綜述
張志轉、朱永和以農業(yè)綜合性學術期刊為例,分析發(fā)現(xiàn)影響因子與5年影響因子、Web即年下載率、即年指標、總被引頻次、基金論文比等指標存在正相關關系等,且相關系數(shù)都較大[5]。白云在實際考察社會、人文幾個代表學科后發(fā)現(xiàn)期刊被引半衰期與期刊在學科中的影響度及學術地位沒有明顯的關聯(lián),并通過分析大量統(tǒng)計數(shù)據(jù),得出結論:半衰期較長的,影響因子相對較?。欢绊懸蜃虞^大的,則半衰期較短,但是兩者之間并不存在明顯的負相關[6]。王文兵等通過對1999—2007年SCI和SSCI按學科影響因子排名前50的期刊共735種的實證研究,發(fā)現(xiàn)被引次數(shù)、是否英文與之正相關,而載文量、自引次數(shù)、自引比例、半衰期與之負相關,且不同學科的期刊影響因子差異很大[7]。董敏紅以中文核心期刊要目總覽(北京大學2008年版)刊登的19種圖書情報類核心期刊的排序為對象,利用科學技術文獻出版社2009年版中國期刊引證報告進行相關數(shù)據(jù)的統(tǒng)計分析,得出總被引頻次與引用刊數(shù)和學科擴散指標顯著負相關,影響因子與即年指標、H指數(shù)和被引半衰期正相關、即年指標與被引半衰期、H指數(shù)正相關,引用刊數(shù)與學科擴散指標呈極顯著正相關[8]。
以上評價指標相關關系的研究中,涉及到影響因子和被引半衰期的相關性,但是得出的結論相去甚遠甚至相反。白云認為半衰期較長的,影響因子相對較小;而影響因子較大的,則半衰期較短,但是兩者之間并不存在明顯的負相關。王文兵等認為影響因子與半衰期負相關。董敏紅認為影響因子與半衰期正相關。為什么影響因子和半衰期這兩個評價指標在經不同的研究后呈現(xiàn)出的關系如此復雜,讓人不解呢?也許是影響因子和半衰期在不同學科間的差異造成的,或許是因為統(tǒng)計樣本過小、統(tǒng)計方法不當?shù)?,以下就以圖書情報學期刊為研究對象,探討影響因子和半衰期之間的相關性。
表1 2005年圖書情報類期刊影響因子和被引半衰期
2.1數(shù)據(jù)來源:《中國期刊引證報告(擴刊版)》[9]
《中國期刊引證報告(擴刊版)》依托中國科學技術信息研究所國家工程技術數(shù)字圖書館“知識服務”系統(tǒng),在“萬方數(shù)據(jù)—數(shù)字化期刊群”基礎上,結合中國科技論文與引文數(shù)據(jù)庫(CSTPCD),以我國正式出版的各學科6217種中英文期刊為統(tǒng)計源期刊。本文以圖書情報期刊為研究對象,取總被引頻次、影響因子、被引半衰期三個指標,分析影響因子和被引半衰期的相關性。
2.2方法和工具:SPSS20
SPSS(Statistical Package for the Social Sciences)是一款在調查統(tǒng)計行業(yè)、市場研究行業(yè)、醫(yī)學統(tǒng)計、政府和企業(yè)的數(shù)據(jù)分析應用中久享盛名的統(tǒng)計分析工具,是世界上最早的統(tǒng)計分析軟件。SPSS20是一種用于分析數(shù)據(jù)的綜合系統(tǒng),它可以從幾乎任何類型的文件中獲取數(shù)據(jù),然后用這些數(shù)據(jù)生成分布和趨勢、描述統(tǒng)計以及復雜統(tǒng)計分析的表格式報告、圖表和圖,且有簡單友好的操作界面。本文選擇SPSS20對《中國期刊引證報告(擴刊版)》的圖書情報期刊的影響因子和半衰期進行相關性分析。
3.1關于數(shù)據(jù)的處理
《中國期刊引證報告(擴刊版)》按照學科對期刊進行分類,將統(tǒng)計源期刊分為8個大類,124個小類。其中,本文研究對象的載體便是教科文藝大類下屬的G25圖書情報類。
關于數(shù)據(jù)時間跨度的選擇:中國科學技術作息研究所國家工程技術數(shù)字館網站(http://www.istic.ac. cn)上2006—2011年①的年度報告。
關于期刊數(shù)量的確定:由于期刊的合并、分化和新增是客觀情況,所以在2006到2012年之間被報告收錄的期刊數(shù)量難免會不同,經過篩選之后的數(shù)據(jù)是2005—2011年38種期刊的總被引頻次、影響因子和被引半衰期。
3.2運用SPSS20具體分析
3.2.1以2005年的數(shù)據(jù)為例進行相關分析
首先,表1是2006年《中國期刊引證報告(擴刊版)》上2005年圖書情報類各期刊的名稱、影響因子和被引半衰期。
用SPSS的圖表功能繪制出二者的散點圖。它可以給人以直觀的關于影響因子和被引半衰期二者關系的印象和判斷。從散點圖可以看出,影響因子和被引半衰期存在著一定的相關性,在一定程度上,隨著影響因子的增加,被引半衰期縮短,但二者的負相關并不明顯。
然后再對影響因子和被引半衰期進行雙變量的相關分析。2005年圖書情報類期刊的影響因子均值為1.054 53,被引半衰期的平均水平為3.191 8年。但是從相關性分析的指標看到,二者的相關系數(shù)為-0.089,說明二者負相關,但相關性很低;顯著性(雙側)系數(shù)為0.593,遠遠高出于0.01,說明相關程度很低。由此得出,二者并沒有明顯的相關性。
3.2.2對其他年度的分析
用同樣的方法得到2006—2011年度圖書情報類期刊影響因子與半衰期二者關系的散點圖以及描述性統(tǒng)計量和相關性數(shù)據(jù),可以看出,在不同的年度,影響因子與半衰期之間的關系并不確定,2006年度二者的相關系數(shù)為-0.142,顯著性(雙側)系數(shù)為0.396;2007年度二者的相關系數(shù)為-0.062,顯著性(雙側)系數(shù)為0.711;2008年度相關系數(shù)為0.000,顯著性(雙側)系數(shù)為0.999;2009年度相關系數(shù)為0.033,顯著性(雙側)系數(shù)為0.843;2010年度是-0.016和0.925;2011年度-0.031和0.856.也就是說,各年度顯示影響因子和被引半衰期的兩個系數(shù)均很低,在各個年度二者的相關性很低,或者說沒有明顯的相關性。
3.2.3分析整合數(shù)據(jù)
我們可以對以上的分析結果提出假設,是否各年度的數(shù)據(jù)量偏少,導致二者關系趨勢不明顯?基于此,筆者將2005—2011年的數(shù)據(jù)整合起來,加大其樣本量,以供我們進一步觀察分析和研究。將7個年度共有的38種(去除《文獻》)圖書情報學期刊的影響因子和被引半衰期整合得出的266個數(shù)據(jù)組合。將以上數(shù)據(jù)重新進行相關性分析,與前面步驟一樣,首先看影響因子和被引半衰期的散點圖,但從相關性分析的指標結果來看,二者依然不顯著相關,觀察散點圖,發(fā)現(xiàn)這些期刊的半衰期絕大部分集中在2~5年之間,只有25個散點在此之外,于是考慮將這些被引半衰期超過5年的期刊去掉,然后對其他數(shù)據(jù)進行分析。見圖1。
從表2二者的相關性分析可以看出,影響因子和被引半衰期之間的相關性系數(shù)為0.210,且二者在0.01水平(雙側)上顯著相關,說明二者通過了相關性檢驗,存在著較明顯的相關性,但是相關程度偏低。
3.3對JCR中圖書館學類期刊影響因子和被引半衰期的分析
前面提到,有學者研究發(fā)現(xiàn)語言會對影響因子產生影響,例如,作為國際語言的英語類期刊由于被更多人引用研究而導致影響因子大于小語種期刊。下面就以JCR收錄的圖書情報學類期刊為例,研究期刊的影響因子和被引半衰期之間的關系。
表2 241組數(shù)據(jù)的相關性分析結果
圖1 去除25個散點之后的241組數(shù)據(jù)的散點圖
JCR(Journal Citation Reports),期刊引用指標報告,是Web of Knowledge的期刊評價工具,提供了一套客觀、系統(tǒng)的方法,對全球頂尖的學術期刊進行嚴格評價。利用JCR對圖書情報類期刊的影響因子和被引半衰期的關系進行研究分析。在JCR中該類對應的是Information Science & Library Science,以2012年的數(shù)據(jù)為研究樣本,該類共有84種期刊,除去Cited Half-life缺省和大于10的情況,共有59組數(shù)據(jù)。用同樣的方法對這59組數(shù)據(jù)進行相關性分析。得出相關系數(shù)為-0.063,顯著性系數(shù)為0.635,未通過相關性檢驗,因而可以得出結論JCR中收錄的Information Science & Library Science類期刊的Impact Factor和Cited Half-Life兩個因素之間不存在相關性。
4.1我國圖書情報類期刊近7年的影響因子水平不一,且與同類學科相比,影響因子相對較高
(1)各期刊的影響因子水平相去甚遠。以2010年為例,《古籍整理研究學刊》的影響因子只有0.127,而《中國圖書館學報》的影響因子高達3.451。由影響因子的計算公式可知,影響因子不僅與期刊的規(guī)模和載文量相關,期刊的論文被引用的次數(shù)也是一個重要因素。從更加基本的層次來看,影響因子可能會受到出版周期和出版時滯、學科分類、論文類型、參考文獻、馬太效應和專業(yè)特點的影響[10]。
(2)與其他學科相比,圖書期刊類的影響因子偏高。有學者之前通過分析相關數(shù)據(jù)發(fā)現(xiàn):圖書館、情報與文獻學在整個社會科學、人文科學的排名中,在前10位所占比例為60%,而整個社會科學共有26個學科,并提出質疑,一個學科的比重如此之大是不合情理的。這種排名主要是以影響因子為依據(jù)的。我們都清楚,圖書館學和情報學雖然在我國經過很長時間的發(fā)展,取得了一定的研究成果,但必須清醒地認識到,它們并不是我國發(fā)展最突出最成熟的學科。那么是什么因素造成這種局面呢?當然,專業(yè)特點、引文峰值出現(xiàn)的時間都是很重要的影響因素。另外,引文著錄質量也在一定程度上促成了圖書情報類期刊的高影響因子。因為文獻著錄和標引本就是圖書情報學科內容的一部分,其規(guī)則、方法都是由該學科人士提出的,所以,本學科的著者在發(fā)表文章時,非常重視參考文獻,因而引文數(shù)量較多,標注較為規(guī)范,被統(tǒng)計率也相對較高。
4.2我國圖書情報類期刊的被引半衰期相差較大,在整個社會科學中被引半衰期偏短
(1)在選作樣本的圖書情報學期刊中,被引半衰期變化較大。2009年《古籍整理研究學刊》的被引半衰期為7.55年,《情報探索》為2.71年。通過分析可發(fā)現(xiàn)我國圖書情報類期刊的被引半衰期集中分布在3~5年,且均值有逐年上升的趨勢。說明引文峰值出現(xiàn)的時間有些后移。
(2)與同類其他學科相比,圖書情報學期刊的被引半衰期較短。除了新聞出版類,圖書情報類期刊的被引半衰期在中國期刊引證報告(擴刊版)》統(tǒng)計源期刊劃分的圖書情報類所屬的8大類之一的教科文藝下的10個小類目中最短,這說明相對其他社會科學類學科而言,該類期刊的老化速度快,被利用的時間短。被引半衰期與學科特點緊密相關,例如,考古學、歷史學類期刊的半衰期就較長,而新聞出版類由于其社會時效性而被引半衰期較短。
4.3與中文期刊相比,圖書情報類的英文期刊影響因子的均值偏大,被引半衰期偏長
圖書情報類的英文期刊2011年影響因子的均值為1.235,被引半衰期為7.1年;而圖書情報類的中文期刊的相應指標分別為0.8886和4.417年。
4.4期刊的影響因子和被引半衰期關系之探討
通過利用SPSS20的相關分析,發(fā)現(xiàn)我國圖書情報類期刊的影響因子和被引半衰期之間存在著顯著的相關關系,但相關程度偏低。
通過分析不難發(fā)現(xiàn),期刊的影響因子和被引半衰期在理論上都與引文峰值的出現(xiàn)時間有一定關系,在實際應用中都有鮮明的學科特色,作為期刊文獻計量評價指標體系之中的兩個指標,這些都在一定程度上促成了二者的相關性。在進行期刊評價時要注意評價指標的學科屬性和適用范圍,并將影響因子和被引半衰期的相關性關系考慮在內。袁培國等在多種探索基礎上,對高校文科綜合性學報,采用他引因子、期刊影響廣度和被引半衰期分別乘以0.85、0.1和0.05的加權處理,以改善多學科期刊由于刊載各學科論文比重不同造成影響因子的變異給期刊比較工作帶來的困難局面,就是綜合考慮將被引半衰期納入影響因子計算的嘗試[1]。
在期刊評價中,要將定性評價和定量評價相結合。其中,定量評價要構建良好的評價指標體系,評價指標的選擇要考慮到各指標的內涵以及適用范圍,還要考慮到指標之間的關系。影響因子是定量評價期刊的重要指標之一,但不是唯一的指標,在使用時要注意影響因子的學科屬性和相對性,被引半衰期作為反映期刊老化和被利用速度的指標,也有鮮明的學科屬性,與各學科的引用行為有密切關系。影響因子和被引半衰期分別從學術影響力和被利用速度方面衡量和測度期刊,二者有著一定的相關性,在指標體系的構建中應有所反映。
參考文獻:
[1]袁培國,吳向東,馬曉軍.多指標加僅值對多學科學術期刊排序初探[J].重慶大學學報:社會科學版,2009 (4):74-82.
[2]Tsay Mingyueh. An Analysis and Comparison of Scientometric Data between Journals of Physics,Chemistry and Engineering [J].Scientometrics,2009,78(2):279-293.
[3]Markpin T,Premkamolnetr N,Sombatsomop,et al. A modified method for calculating the impact factors of journals in ISI Journal Citation Reports: Polymer Science Category in 1997-2001[J]. Scientometrics,2004,60(2):217-235.
[4]Tsay Mingyueh, Chen Yiling. Journals of general & internal medicine and surgery:An analysis and comparison of citation[J].Scientometrics,2005,64(1):17-30.
[5]張志轉,朱永和.學術期刊引證指標間的相關性研究:以農業(yè)綜合性學術期刊為例[J].安徽農業(yè)科學,2010(2):封2,封3.
[6]白云.中國人文社會科學期刊被引半衰期分析研究[J].云南師范大學學報:哲學社會科學版,2006(4):127-130.
[7]王文兵,王學斌,譚鴻益,等.影響因子的局限性:基于SCI和SSCI期刊1999—2007年面板數(shù)據(jù)的實證研究[J].圖書與情報,2009(4):28-32.
[8]董敏紅.基于主成分分析的圖書情報類核心期刊評價指標有效性研究[J].情報科學,2010(11):1670-1672.
[9]中國科學技術信息研究所,萬方數(shù)據(jù)股份有限公司.中國期刊引證報告(擴刊版)[M].北京:科學技術文獻出版社,2012:1.
[10]魏彬,侯漢清.社會科學期刊影響因子的“影響因子”:從圖書館學情報學期刊排名談起[J].南京農業(yè)大學學報:社會科學版,2002(2):81-87.
何文南京大學信息管理學院碩士研究生。江蘇南京,210093。
葉繼元南京大學信息管理學院教授。江蘇南京,210093。
收稿日期:(2014-06-10編校:鄒婉芬)