陳清文 郭強(qiáng) 劉建國
摘 要:評(píng)估科學(xué)家學(xué)術(shù)影響力的傳統(tǒng)方法只考慮科學(xué)家的產(chǎn)出(論文數(shù)量、引用總數(shù)等)而不考慮科學(xué)家的投入。提出一種基于超效率DEA的科學(xué)家學(xué)術(shù)影響力模型,將合作科學(xué)家數(shù)量和合作機(jī)構(gòu)數(shù)量作為產(chǎn)出要素,論文總數(shù)和引用總數(shù)作為投入要素。在APS數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,諾貝爾獎(jiǎng)科學(xué)家的學(xué)術(shù)影響力比非諾貝爾獎(jiǎng)科學(xué)家的學(xué)術(shù)影響力高,超效率DEA模型計(jì)算出的AUC值為0.795 6,比傳統(tǒng)指標(biāo)中最高總引用量指標(biāo)提高了8.75%,對(duì)評(píng)價(jià)科學(xué)家的學(xué)術(shù)影響力有十分重要的借鑒意義。
關(guān)鍵詞:學(xué)術(shù)影響力;H指數(shù);總引用量;超效率DEA
DOI:10. 11907/rjdk. 182555
中圖分類號(hào):TP319 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2019)005-0155-03
Abstract: The current methods of quantifying and assessing academic Influence Analysis of scientists only take into account the outputs of scientists, regardless the fact that the input factors are different for each scientist. In this paper, taking into account the input and output factors measured by the number of cooperating scientists, the number of cooperating institutions, total number of papers and total number of citations, we present a model to evaluate the performance of scientists. The method on the APS dataset can more accurately identified Nobel Prize-winning scientists than the published articles, total citations, I10 index, and H index. The AUC value of this model was 0. 7956, which was 8.75% higher than total number of citations.The work of this paper is of great significance for quantifying the academic influence of scientists.
Key Words: Academic influence; H index; total citations; super efficiency DEA
0 引言
評(píng)價(jià)科學(xué)家的學(xué)術(shù)影響力,對(duì)科學(xué)家的職稱評(píng)定、科研獎(jiǎng)勵(lì)具有重要指導(dǎo)意義。計(jì)量科學(xué)家學(xué)術(shù)影響力有許多方法[1-2],如發(fā)表論文數(shù)[3]、引用量[4]等。2001年,學(xué)術(shù)信息出版機(jī)構(gòu)美國科技信息所(ISI)提出一種衡量科學(xué)家、學(xué)術(shù)機(jī)構(gòu)、國家/地區(qū)科研水平及影響力的重要評(píng)價(jià)方法——ESI[5-6]。2005年,Hirsch教授[7]提出了基于科學(xué)家引用論文和數(shù)量引用的H指數(shù)。2006年,Egghe[8]在H指數(shù)上進(jìn)行改進(jìn),提出了G指數(shù)。2011年,谷歌提出了I10指數(shù),I10指數(shù)表示科學(xué)家超過10次被引用的文章數(shù)量[9]。然而上述方法僅考慮科學(xué)家的產(chǎn)出,通常無法準(zhǔn)確計(jì)量科研背景不同、投入資源不同的科學(xué)家。本文提出一種基于超效率DEA的科學(xué)家學(xué)術(shù)影響力模型,通過合作科學(xué)家數(shù)量、合作機(jī)構(gòu)數(shù)量、論文總數(shù)和引用總數(shù)評(píng)估科學(xué)家的學(xué)術(shù)影響力。首先計(jì)算每個(gè)科學(xué)家的投入(科學(xué)家數(shù)量、合作機(jī)構(gòu)數(shù)量)和產(chǎn)出(發(fā)表論文數(shù)和引用量),然后利用超效率DEA模型計(jì)算每個(gè)科學(xué)家的學(xué)術(shù)影響力。本文采用美國物理學(xué)會(huì)(American Physical Society,APS)的數(shù)據(jù),以獲得諾貝爾獎(jiǎng)的科學(xué)家為測試數(shù)據(jù)集,以非諾貝爾獎(jiǎng)的科學(xué)家為非測試數(shù)據(jù)集,用AUC值表示算法的準(zhǔn)確性。在APS數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,諾貝爾獎(jiǎng)科學(xué)家的學(xué)術(shù)影響力比非諾貝爾獎(jiǎng)科學(xué)家的學(xué)術(shù)影響力高,超效率DEA模型計(jì)算的AUC值為0.795 6,比傳統(tǒng)指標(biāo)中最高的總引用量指標(biāo)提高了8.75%。
1 科學(xué)家學(xué)術(shù)影響力模型
1.1 模型構(gòu)建
3 數(shù)值實(shí)驗(yàn)
3.1 數(shù)據(jù)集
本文采用美國物理學(xué)會(huì)(APS)的數(shù)據(jù)。APS數(shù)據(jù)包括美國物理學(xué)會(huì)1893-2009年248 738名科學(xué)家發(fā)表的463 348篇論文,其中包括35名獲諾貝爾物理學(xué)獎(jiǎng)的科學(xué)家。數(shù)據(jù)集包含唯一的文章編號(hào)、文章標(biāo)題、出版日期(年-月-日),科學(xué)家姓名和每位科學(xué)家的隸屬機(jī)構(gòu),另一個(gè)數(shù)據(jù)集利用文章編號(hào)提供了超過470萬條引用關(guān)系。
3.2 實(shí)驗(yàn)結(jié)果
本文將科學(xué)家排名結(jié)果與傳統(tǒng)的科學(xué)家學(xué)術(shù)影響力指標(biāo)排名結(jié)果進(jìn)行對(duì)比分析,以驗(yàn)證基于超效率DEA的學(xué)術(shù)影響力模型能更準(zhǔn)確地從248 738名科學(xué)家中識(shí)別出獲得諾貝爾獎(jiǎng)的35名科學(xué)家[20],結(jié)果如圖2所示。橫坐標(biāo)表示排名靠前的[n]名科學(xué)家,縱坐標(biāo)表示前[n]名科學(xué)家中獲諾貝爾獎(jiǎng)的科學(xué)家數(shù)目,如前10 000名科學(xué)家中,發(fā)表文章數(shù)指標(biāo)、I10指標(biāo)、H指數(shù)指標(biāo)、總引用量指標(biāo)、學(xué)術(shù)影響力指標(biāo)分別包含了25位、30位、31位、35位獲諾貝爾獎(jiǎng)的科學(xué)家。從圖2可以看出,本文提出的超效率DEA模型對(duì)科學(xué)家排名的準(zhǔn)確性比傳統(tǒng)指標(biāo)高。
本文采用AUC(the area under a receiver operating characteristic curve)評(píng)價(jià)指標(biāo)評(píng)價(jià)超效率DEA模型的準(zhǔn)確性。將數(shù)據(jù)集中所有科學(xué)家分為兩類:測試集合和非測試集合,其中測試集合是獲得諾貝爾獎(jiǎng)的科學(xué)家。從測試集合和非測試集合中分別隨機(jī)選取一位科學(xué)家,計(jì)算他們的學(xué)術(shù)影響力值。[n]次比較之后,從測試集合中取出學(xué)術(shù)影響力值高于非測試集合中科學(xué)家的學(xué)術(shù)影響力值,將其次數(shù)記為[n1],從測試集合中取出科學(xué)家的學(xué)術(shù)影響力值和非測試集合中科學(xué)家的學(xué)術(shù)影響力值次數(shù)相同的記為[n2],AUC值計(jì)算公式如下:
[AUC=n1+0.5×n2n] (3)
當(dāng)AUC=1時(shí),說明計(jì)算得到的所有測試集合中取出的科學(xué)家學(xué)術(shù)影響力值高于非測試集合中取出的科學(xué)家學(xué)術(shù)影響力值,當(dāng)AUC=0.5則說明計(jì)算得到的科學(xué)家學(xué)術(shù)影響力是隨機(jī)的,AUC值越接近1說明計(jì)算得到的科學(xué)家學(xué)術(shù)影響力越準(zhǔn)確。在AUC值計(jì)算中,參數(shù)[n]的值越大,AUC值越準(zhǔn)確穩(wěn)定。實(shí)證數(shù)據(jù)取[n=105]計(jì)算結(jié)果如表1所示,超效率DEA模型計(jì)算的AUC值為0.795 6,比傳統(tǒng)指標(biāo)中最高的總引用量指標(biāo)提高了8.75%。
4 結(jié)語
本文提出一種基于超效率DEA的科學(xué)家學(xué)術(shù)影響力模型,該模型以科學(xué)家合作人數(shù)和合作機(jī)構(gòu)數(shù)作為投入要素,以發(fā)表論文數(shù)和文章引用次數(shù)作為產(chǎn)出要素。綜合考慮投入和產(chǎn)出,對(duì)科學(xué)家的績效進(jìn)行評(píng)價(jià)和排名。在APS數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,獲諾貝爾獎(jiǎng)的科學(xué)家學(xué)術(shù)影響力比非諾貝爾獎(jiǎng)科學(xué)家的學(xué)術(shù)影響力高,超效率DEA模型計(jì)算的AUC值為0.795 6,比傳統(tǒng)指標(biāo)中最高的總引用量指標(biāo)提高了8.75%。
盡管本文提出的模型實(shí)證結(jié)果較引用量等指標(biāo)有所提升,但仍存在不足。由于APS數(shù)據(jù)集的學(xué)科領(lǐng)域局限性,本文提出的方法只在物理學(xué)領(lǐng)域得到驗(yàn)證,未在其它科學(xué)領(lǐng)域驗(yàn)證。此外,基于超效率DEA的科學(xué)家學(xué)術(shù)影響力模型取決于投入要素和產(chǎn)出要素的選取,還需研究更多投入要素,使科學(xué)家排名更為準(zhǔn)確。在未來工作要考慮加入主題進(jìn)行科學(xué)家學(xué)術(shù)影響力研究。
參考文獻(xiàn):
[1] 曹志梅,劉偉輝,楊光. 高校 ESI 潛勢學(xué)科排名提升策略探討[J]. 情報(bào)探索, 2017 (4): 44-47.
[2] 王露, 郭強(qiáng), 劉建國. 基于加權(quán)方法的節(jié)點(diǎn)重要性度量[J]. 計(jì)算機(jī)應(yīng)用研究, 2018(5):1426-1428.
[3] PETERSEN A M, WANG F, STANLEY H E. Methods for measuring the citations and productivity of scientists across time and discipline[J]. Physical Review E, 2010, 81(3): 36-114.
[4] 楊帥,潘云濤,王海燕,等. 引用次數(shù)、相對(duì)影響力和社會(huì)網(wǎng)絡(luò)在論文評(píng)價(jià)中的應(yīng)用[J]. 中華醫(yī)學(xué)圖書情報(bào)雜志, 2016, 25(7):1-9.
[5] FITZPATRICK R B. Essential science indicators.[J]. Medical Reference Services Quarterly, 2005, 24(4): 67-68.
[6] 曹志梅,劉偉輝,楊光. 高校 ESI 潛勢學(xué)科排名提升策略探討[J]. 情報(bào)探索,2017 (4): 44-47.
[7] HIRSCH J E. An index to quantify an individual's scientific research output[J].Proceedings of the National academy of Sciences of the United States of America, 2005, 102(46): 65-69.
[8] EGGHE L. Theory and practise of the g-index[J]. Scientometrics, 2006, 69(1): 131-152.
[9] 曹麗江. 基于Altmetrics的學(xué)者影響力綜合評(píng)價(jià)研究[D]. 蘇州:蘇州大學(xué), 2017.
[10] CHARNES A, COOPER W W, RHODES E. Measuring the efficiency of decision making units[J]. European Journal of Operational Research, 1978, 2(6): 429-444.
[11] 馬占新. 數(shù)據(jù)包絡(luò)分析方法的研究進(jìn)展[J]. 系統(tǒng)工程與電子技術(shù), 2002, 24(3):42-46.
[12] 馬璐, 高李昊. 帶負(fù)值的Hybrid DEA模型研究及其應(yīng)用[J]. 中國管理科學(xué), 2016, 24(3):149-158.
[13] 魏權(quán)齡. 評(píng)價(jià)相對(duì)有效性的數(shù)據(jù)包絡(luò)分析模型:DEA和網(wǎng)絡(luò)DEA[M]. 北京:中國人民大學(xué)出版社, 2012.
[14] 李倩. 基于超效率DEA模型的高等教育效率評(píng)價(jià)[J]. 黑龍江高教研究, 2015, 36(9):153-156.
[15] 王文娟. 論文合作的效率——從合作者數(shù)量與論文發(fā)表速度角度研究[D]. 濟(jì)南:山東大學(xué), 2016.
[16] 蘇芳荔. 科研合作對(duì)期刊論文被引頻次的影響[J]. 圖書情報(bào)工作, 2011, 55(10): 144-148.
[17] 李文聰. 國際科研合作的網(wǎng)絡(luò)演變及其對(duì)科研產(chǎn)出的影響研究[D]. 北京:中國科學(xué)院大學(xué), 2016.
[18] 王文平. 基于科學(xué)計(jì)量的中國國際科技合作模式及影響研究[D]. 北京:北京理工大學(xué), 2014.
[19] 張冬玲. 中國科學(xué)論文產(chǎn)出與合作狀況的計(jì)量研究[D]. 大連:大連理工大學(xué), 2009.
[20] SHEN H W,BARABáSI A L. Collective credit allocation in science[J]. Proceedings of the National Academy of Sciences,2014,111(34):12325-12330.
(責(zé)任編輯:杜能鋼)