宋艷輝 魏新星 邱均平
關(guān)鍵詞: 高產(chǎn)學者; 學者影響力; Altmetrics 指標; 評價指標
DOI:10.3969 / j.issn.1008-0821.2024.01.014
〔中圖分類號〕G250.252 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2024) 01-0153-15
2020 年《中共中央關(guān)于制定國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和二0三五年遠景目標的建議》中指出, 要激發(fā)人才創(chuàng)新活力, 貫徹尊重勞動、尊重知識、尊重人才、尊重創(chuàng)造方針, 深化人才發(fā)展體制機制改革, 全方位培養(yǎng)、引進、用好人才, 造就更多國際一流的科技領(lǐng)軍人才和創(chuàng)新團隊, 培養(yǎng)具有國際競爭力的青年科技人才后備軍。現(xiàn)今, 論文發(fā)表的數(shù)量已經(jīng)成為衡量學者和機構(gòu)對科學研究作出貢獻的一個重要依據(jù)[1] 。并且隨著研究的深入和擴展, 科研人員為促進彼此之間資源共享、提高科研攻關(guān)能力而越來越多地采取合作科研的方式[2] , 因此論文合著現(xiàn)象越來越普遍, 這有效提高了學者的科研產(chǎn)出量, 在領(lǐng)域內(nèi)也逐漸形成了高產(chǎn)學者群。各個不同研究領(lǐng)域匯集著不同的學者群體, 而高產(chǎn)學者群是其中的骨干力量, 在科研工作中發(fā)揮著關(guān)鍵的導向作用, 能夠推動該領(lǐng)域研究的繁榮與進步。普賴斯最早注意到高產(chǎn)作者研究的重要性, 他在1969 年發(fā)表的《小科學, 大科學》一書中指出: 撰寫全部論文一半的高產(chǎn)作者的數(shù)量等于全部科學作者總數(shù)的平方根, 這就是著名的普賴斯定律[3] , 該定律是文獻計量學領(lǐng)域獲取主要學者分布數(shù)據(jù)的理論基礎(chǔ)[4] , 并被學者們在甄別高產(chǎn)學者時廣泛使用。評估高產(chǎn)學者的影響力有利于推動學者研究的積極性, 也可為上級引進優(yōu)秀人才提供參考[5] 。普賴斯定律對高產(chǎn)學者的定義已經(jīng)通過科研產(chǎn)出量這一單一指標對學者的影響力進行了一定的評判, 但合理的學者影響力評價方法在評價學者科研產(chǎn)出絕對數(shù)量的基礎(chǔ)上還應(yīng)考慮科研成果的質(zhì)量, 對學者進行多維度的綜合影響力評價研究。學者綜合影響力是學者獲得學術(shù)界和社會大眾的重視及影響他們的作用力, 包括科研影響力和社會影響力, 對高產(chǎn)學者的綜合影響力展開評價, 可以甄別領(lǐng)域內(nèi)真正高質(zhì)量的高產(chǎn)學者, 幫助學者摒棄唯發(fā)文量至上的觀念, 促進領(lǐng)域研究的進步, 切實提升論文質(zhì)量, 也能為政府引進優(yōu)秀人才, 打造領(lǐng)先科研團隊, 從而推動地區(qū)領(lǐng)域研究攀上新高度提供有效參考。
以往對于學者的影響力評價大多以傳統(tǒng)文獻計量指標為主。而近些年來, 越來越多研究采用Alt?metrics 指標來評價學者的影響力, Altmetrics 指標用于學者影響力評價的科學性和有效性已經(jīng)基本得到證實, 并且大部分學者認為Altmetrics 指標主要適用于學者的社會影響力評價[6] 。Altmetrics.com 是Altmetrics 指標數(shù)據(jù)的主要搜集來源之一, Altmet?rics.com 會追蹤記錄包括News、Blog、Policy Docu?ment 等約20 項指標, 并給這些指標賦予一定的權(quán)重, 從而計算加權(quán)的Altmetric Score。自2012 年10月, Nature 雜志及其子刊開始對其2012 年1 月1日及之后發(fā)表的論文開始實時在線統(tǒng)計, NatureMetrics 為Nature 的每一篇研究論文提供CrossRef 數(shù)據(jù)(DOI 文獻的被引用情況)、Web of Science 引用數(shù)據(jù)和在線關(guān)注數(shù)據(jù)(Altmetrics)[7] , 并提供Online Attention Score(Altmetric Score)。由于Altmetrics.com的評分標準歷史上發(fā)生過幾次變更, 并且官網(wǎng)也存在很多不夠透明的信息, 所以僅根據(jù)Online Atten?tion Score 不足以判斷某篇論文的社會影響力或水平, 需要對各項Altmetrics 指標做進一步分析。
本文以Nature 生物科技子刊為例, 為深入了解該領(lǐng)域高產(chǎn)學者的綜合影響力, 選取了反映學者學術(shù)水平和科研合作程度的一系列傳統(tǒng)指標作為待選指標, 同時融合Altmetrics 指標, 以3 本Nature生物科技子刊的官網(wǎng)為數(shù)據(jù)源, 試圖從高產(chǎn)學者的科研影響力和社會影響力兩個維度構(gòu)建其綜合影響力評價指標體系。通過相關(guān)性分析、因子分析、主成分分析等方法分別對高產(chǎn)學者的科研影響力和社會影響力進行評價, 并分析兩個維度間的相互關(guān)系,最后得到高產(chǎn)學者影響力的二維評價結(jié)果。
1 國內(nèi)外研究現(xiàn)狀
1.1 基于傳統(tǒng)文獻計量指標的學者影響力研究
目前, 較多研究側(cè)重從學者的學術(shù)、科研水平角度, 基于傳統(tǒng)的文獻計量指標對學者的影響力進行研究。2005 年, 美國物理學家Hirsch J E[8] 基于學者與其文獻間的內(nèi)在關(guān)聯(lián), 率先提出一項旨在評價科研學者科研績效的新指標———h 指數(shù)(h-in?dex)。h 指數(shù)隨即風靡世界的學術(shù)圈, 成為學術(shù)界被廣泛應(yīng)用的計量指標, 并催生出一些新的h 型指數(shù)。2006 年, 比利時計量學家Egghe L[9] 在分析h指數(shù)評價效果時, 提出了一種基于學者以往累積貢獻的g 指數(shù)(g-index); 同年, 金碧輝等[10] 提出了R 指數(shù)和AR 指數(shù), 作為h 指數(shù)的補充指標。隨著對學者影響力的研究越來越全面, 學術(shù)文獻測度指標也逐漸完善。葉鷹[11] 圍繞發(fā)文量和引用量這兩個基本的學術(shù)文獻評價指標, 將學術(shù)文獻評價指標歸納為均值測度指標(篇均被引頻次、期刊影響因子、皇冠指數(shù)[12] 、活動指數(shù)[13] 、相對特化指數(shù)[11] 、引發(fā)距[11] 、h 指數(shù))、高影響特征測度(R 指數(shù)[10] 、e 指數(shù)[14] 、AR 指數(shù)[10] 、調(diào)和h 指數(shù)[15] )、整體綜合測度(調(diào)和R 指數(shù)[15] 、學術(shù)跡[11] 、集成影響因子[16] )3 類。學者們采用這些傳統(tǒng)的文獻計量指標對學者的影響力進行了眾多實證分析。邱均平等[17]認為, 將核心期刊的發(fā)文量和h 指數(shù)相結(jié)合的方法在篩選高影響力作者時具有優(yōu)勢, 并通過對圖書情報學領(lǐng)域的實證研究證明了該方法的有效性。劉萍等[18] 則在考慮傳統(tǒng)引文指標的同時, 基于構(gòu)建的加權(quán)文獻引文網(wǎng)絡(luò)模型, 收集圖書情報學領(lǐng)域的16 種重要期刊文獻數(shù)據(jù), 利用引文對該領(lǐng)域的學者文獻影響以及學者學術(shù)影響力分別進行了綜合測度。
由于科研合作和跨學科研究的流行, 測度學者科研合作行為的計量指標也不斷涌現(xiàn), 如合作度[19] 、合作率[20] 、合作系數(shù)[21] 這些常用指標。進一步地,András S[22] 參照h 指數(shù)的設(shè)計思想, 同時考慮合作學者的數(shù)量及合作頻次, 提出了評價學者科研合作水平的新指標: 合作能力指數(shù), Guillaume C[23] 驗證了該指數(shù)在計算機領(lǐng)域的適用性。不少學者也研究了合作能力指數(shù)與傳統(tǒng)文獻計量指標之間可能存在的關(guān)系。Ronald R[24] 指出“合作能力指數(shù)及其衍生指標在計量學領(lǐng)域、社會科學領(lǐng)域中具有潛在研究價值”。國內(nèi)學者王衛(wèi)等[2] 通過對圖書情報領(lǐng)域522 位作者的實證分析, 得到合作能力指數(shù)與作者科研績效指標(發(fā)文量、總被引、h 指數(shù))存在正相關(guān)關(guān)系, 而合作度、合作率、合作系數(shù)這些指標卻不具備上述特征的結(jié)論。
還有一部分研究在傳統(tǒng)文獻計量指標的基礎(chǔ)上, 引入了社會網(wǎng)絡(luò)分析的觀點對學者的影響力進行研究。余波等[25] 選取了社會網(wǎng)絡(luò)分析方法的點度中心度、中介中心度、接近中心度的測度指標,同被引頻次、學者發(fā)文數(shù)等傳統(tǒng)文獻計量指標作為二級評價指標測度中國學術(shù)話語權(quán)。范如霞等[26]則結(jié)合發(fā)文量和度數(shù)中心度兩個指標分別測度學者在不同時間維度下的個人影響力和在團隊的影響力,以補充學者的動態(tài)學術(shù)影響力測評。
根據(jù)以上回顧總結(jié), 梳理的評價學者影響力傳統(tǒng)指標如表1 所示。
1.2 基于Altmetrics 指標的學者影響力研究
開放科學背景下, 在線學術(shù)交流日益盛行, 傳統(tǒng)的學術(shù)評價方式已不能全面反映學術(shù)成果的多維度影響。美國學者Jason Priem 在2010 年首次于Twitter 上使用“Altmetrics” 一詞, 并將其視為對傳統(tǒng)文獻計量指標的補充。經(jīng)歷了兩年熱議后,Altmetrics 指標因其客觀性、時效性和開放性得到驗證而逐漸受到學者們的廣泛關(guān)注[28] 。
應(yīng)用Altmetrics 指標評價學者影響力的研究越來越多。Li X 等[29] 以Nature 和Science 雜志上的論文為樣本, 將WoS、Google 的被引數(shù)據(jù)與CiteU?Like、Mendeley 兩個平臺上的讀者數(shù)據(jù)進行相關(guān)性分析, 結(jié)果表明讀者數(shù)指標適用于論文學術(shù)影響力評價。郭穎等[6] 在分析國外Altmetrics 指標來源平臺的基礎(chǔ)上, 從國內(nèi)相似平臺的代表性平臺: 知網(wǎng)、科學網(wǎng)、微信公眾號、微博、百度百科以及新聞提及中選?。粒欤簦恚澹簦颍椋悖?指標, 構(gòu)建評價指標體系,用于我國學者的影響力評價。楊柳等[30] 則以機構(gòu)知識庫為數(shù)據(jù)源, 分別基于標準化Altmetrics 得分、Altmetric Score、標準化被引得分3 種方法進行學者影響力評價。
目前, Altmetrics 指標的研究工具主要有Alt?metrics. com、ImpactStory、Plum Analytics 和PLoSALMs, 各種研究工具在評價對象、面向用戶、獲取方式和服務(wù)形式上都存在著異同[31] 。本研究使用最常用的Altmetrics.com 作為Altmetrics 指標的研究工具, 依靠點擊每篇Nature 論文的簡介網(wǎng)頁中的“Metric” 按鈕從而跳轉(zhuǎn)至Altmetrics.com。
1.3 結(jié)合傳統(tǒng)計量指標和Altmetrics 指標的學者影響力研究
隨著對學者影響力的研究日益深入, 學者影響力的評價從單一指標向多維指標轉(zhuǎn)變, 許多學者采用傳統(tǒng)計量指標和Altmetrics 指標相結(jié)合的方法對學者的綜合影響力進行探究。王妍[32] 從學術(shù)維度和社會維度兩方面測度學者影響力, 選取傳統(tǒng)引文指標和Altmetrics 指標為待選指標, 通過因子分析法得到分別代表學術(shù)影響力和社會影響力的兩個公因子, 將這兩個因子投射到二維直角坐標系中, 以反映學者的科研角色。王菲菲等[33] 為研究基因編輯領(lǐng)域?qū)W者的綜合影響力, 分別選取調(diào)和h 指數(shù)、調(diào)和R 指數(shù)等作為學術(shù)文獻影響力的二級指標,選?。粒欤簦恚澹簦颍椋?Score 均值、Altmetric-h 指數(shù)、Alt?metric 各項均值作為社會影響力的二級指標, 探究多類指標對各維度影響力的作用程度。
通過實證分析學者們也證實了Altmetrics 指標對傳統(tǒng)計量指標的有效補充作用。Torres-Salinas D等[34] 比較了傳統(tǒng)計量指標引文量和Altmetrics 指標的關(guān)系, 研究表明被引量最高的論文Altmetrics 得分也最高, 得到被引量和Altmetrics 得分之間具有正相關(guān)關(guān)系的結(jié)論。劉曉娟等[35] , 獲得Mendeley與Web of Science 兩平臺的交叉文獻集合, 通過具體分析證實了以閱讀數(shù)和標簽數(shù)為代表的選擇性計量指標可以在一定程度上評估文獻的影響力。范少萍等[36] 對比僅使用學術(shù)跡進行學者學術(shù)影響力的評價結(jié)果發(fā)現(xiàn), 學術(shù)跡與F1000 因子的綜合方法可彌補傳統(tǒng)評價方式的不足。
根據(jù)前人的研究可知, 學者影響力評價的發(fā)展方向應(yīng)為傳統(tǒng)計量方法與Altmetrics 指標計量方法的結(jié)合。雖然在對學者的綜合影響力進行評價研究時, 有學者考慮了多維度的影響力因素, 但都是對所有水平的學者進行的一貫評價。因此, 本文選定高產(chǎn)學者為樣本學者, 預先界定了學者的水平, 作為一個新的角度, 融合傳統(tǒng)指標和Altmetrics 指標對他們的綜合影響力進行評價, 分析領(lǐng)域內(nèi)不同發(fā)文量的高產(chǎn)學者的綜合影響力差異, 探究學者的科研成果的高產(chǎn)量是否就同時意味著高質(zhì)量。
2 高產(chǎn)學者綜合影響力評價指標體系構(gòu)建
構(gòu)建高產(chǎn)學者綜合影響力評價指標體系, 須初步采集科研影響力和社會影響力這兩個維度的待選傳統(tǒng)指標和Altmetrics 指標及其數(shù)據(jù), 再通過一系列分析篩選可用指標, 最終完成評價指標體系構(gòu)建。
2.1 高產(chǎn)學者綜合影響力的評價指標選取
2.1.1 傳統(tǒng)指標的選取
針對傳統(tǒng)指標, 根據(jù)表1, 考慮從學者學術(shù)文獻水平、科研合作行為及社會網(wǎng)絡(luò)地位3 個評價角度分別篩選指標。
1) 學者學術(shù)文獻水平角度
由于大部分論文的合著作者較多, 因此在前人研究的基礎(chǔ)上, 同時考慮指標的代表性和學者署名次序, 經(jīng)過謹慎遴選, 確定發(fā)文量、總被引頻次、調(diào)和被引頻次、調(diào)和h 指數(shù)、調(diào)和R 指數(shù)這5 個指標為待選指標。前兩個指標為最基本的文獻計量指標。由于學者的署名次序差異大, 采用簡單的均值測度指標可能對研究結(jié)果產(chǎn)生影響, 因此用調(diào)和被引頻次指標代替均值測度指標中的篇均被引頻次。調(diào)和h 指數(shù)與調(diào)和R 指數(shù)分別為高影響特征測度和整體綜合測度指標。
其中, 調(diào)和h 指數(shù)是指學者發(fā)表的N 篇論文中, 有h 篇論文的調(diào)和被引頻次大于或等于h 次,而其余N-h 篇論文的調(diào)和被引頻次均小于h 次[15] 。調(diào)和h 指數(shù)(harmonic h-core)中的調(diào)和被引次數(shù)(harmonic citations)考慮學者的署名次序進而分配不同的權(quán)重, 用c 表示作者第j 篇文獻的被引頻次,i 表示作者的署名次序, n 為作者人數(shù)[33] , 其計算公式如下:
2) 學者科研合作行為角度
確定合作能力指數(shù)為待選指標。主要考慮到合作度、合作率、合作系數(shù)這3 項指標通常作為一組整體指標對學者的科研合作行為進行測度, 而合作能力指數(shù)可作為一個單獨的指標, 以不同的角度,在揭示作者的科研績效方面更有優(yōu)勢。
合作能力指數(shù)的計算方法可表述為: 將某一作者的合作者按照其與該作者的合作頻次降序排列,當合作者序號首次大于對應(yīng)合作頻次時, 該序號減1 即為該作者的合作能力指數(shù)[37] 。
3) 學者社會網(wǎng)絡(luò)地位角度
確定點度中心度、中介中心度作為待選指標。點度中心度和中介中心度關(guān)注的都是某個節(jié)點與網(wǎng)絡(luò)中其他節(jié)點的直接關(guān)系, 而接近中心度關(guān)注的是捷徑[25] 。簡單來說, 中介中心度表現(xiàn)控制能力,而接近中心度表現(xiàn)不被控制的能力, 為了對學者的影響力進行最直接的評價, 本文沒有選取接近中心度這個指標。
點度中心度是在網(wǎng)絡(luò)分析中刻畫節(jié)點中心性的最直接度量指標。一個節(jié)點的節(jié)點度越大就意味著這個節(jié)點的點度中心性越高, 該節(jié)點在網(wǎng)絡(luò)中就越重要[38] 。用C(N )表示節(jié)點i 的點度中心度, 用于計算節(jié)點i 與其他g-1 個j 節(jié)點(i≠j), 其計算公式如下:
2.1.2 Altmetrics 指標的選取
針對Altmetrics 指標, 為保證所有指標的時序一致性, 將Weibo、Google+、LinkedIn 和Pinterest這4 項分別于2015 年、2019 年、2014 年、2013 年不再被追蹤記錄的指標剔除, 將剩余19 個Altmet?ric.com 會記錄的指標都納入評價學者社會影響力的待選指標。
初步選取的高產(chǎn)學者綜合影響力的所有評價指標如表2 所示。
2.2 數(shù)據(jù)來源及說明
作為科研創(chuàng)新的核心力量, 活躍高產(chǎn)的頂尖學者群體在引領(lǐng)學術(shù)發(fā)展和推動科學革命過程中發(fā)揮著關(guān)鍵作用[40] 。本文在Scopus 數(shù)據(jù)庫中選擇Bio?technology 學科類別, 選取2021 年CiteScore 前3 位的期刊: Nature Biotechnology、Nature Methods 和Na?ture Biomedical Engineering 作為數(shù)據(jù)源, 在3 本期刊的官網(wǎng)中采集所需數(shù)據(jù)。這3 本期刊中的論文是生物科技領(lǐng)域高被引的高水平論文, 論文質(zhì)量與頂尖學者比例較高, 因此選擇它們有助于采集到理想的指標數(shù)據(jù), 得到更科學合理的研究結(jié)果。分別選?。?本期刊Research Articles 目錄下類別為Article的文章, 綜合考慮高產(chǎn)學者的活躍度、時效性, 與論文被引高峰因素, 將發(fā)表年份設(shè)置為2019—2021年, 數(shù)據(jù)采集時間為2023 年3 月。共檢索得到727篇論文, 涉及8 675名不同的學者。根據(jù)普賴斯定律計算得出高產(chǎn)學者人數(shù)為√8675, 向上取整即為94 名。統(tǒng)計8 675名學者的發(fā)文數(shù)量并從大到小排序, 發(fā)現(xiàn)發(fā)文量大于等于3 篇的學者共95 名, 因此將這95 名學者全部納入樣本, 樣本數(shù)量為95 個。
針對Altmetrics 指標, 由于Altmetrics.com 顯示的指標相比Nature Metrics 更為完整, 因此以每篇文章為單位, 記錄每篇文章下由“Metric” 按鈕跳轉(zhuǎn)至Altmetrics.com 詳情頁中的各項Altmetrics 指標值。發(fā)文量、總被引頻次、調(diào)和被引頻次、調(diào)和h指數(shù)、調(diào)和R 指數(shù)以及合作能力指數(shù)的計算是通過統(tǒng)計的期刊官網(wǎng)提供的各文章的CrossRef(DOI文獻的被引用情況)數(shù)據(jù), 以及每篇文章的作者總數(shù)及樣本學者的署名次序、合作關(guān)系簡單計算得出。點度中心度和中介中心度則利用Ucinet 軟件計算得出。為了避免各項指標值在短時間內(nèi)發(fā)生變動而對研究結(jié)果產(chǎn)生影響, 所有數(shù)據(jù)均在連續(xù)的3 天內(nèi)采集完成。在全部指標計算完成后, 發(fā)現(xiàn)有12 名學者的重要指標值缺失, 因此將這12 名學者從樣本中整體剔除, 得到有效樣本學者83 名, 最終的作者合作網(wǎng)絡(luò)也由這83 名學者所構(gòu)建??紤]同一論文由83名學者中的多名學者共著的情況, 2019—2021 年83名學者共計發(fā)表不重復的論文310 篇, 具體發(fā)文量情況如表3 所示。
2.3 評價指標的描述性統(tǒng)計分析
為進一步了解樣本數(shù)據(jù)的分布情況, 初步剔除表2 中表征能力較弱的評價指標, 利用SPSS 軟件分別對Altmetrics 指標和傳統(tǒng)指標進行描述性統(tǒng)計分析, 得到如表4 所示的結(jié)果。繪制P-P 圖, 發(fā)現(xiàn)樣本數(shù)據(jù)點均不在明顯的一條直線上, 因此指標數(shù)據(jù)都不符合正態(tài)分布。觀察表4 的指標覆蓋率結(jié)果, 發(fā)現(xiàn)Altmetrics 指標中出現(xiàn)較多0 值, 共有5項, 為Syllabi、Q&A、Youtube、Citeulike Readers 和Connotea Readers。覆蓋率低的Altmetrics 指標還包括Reddit(11.61%)、Research Highlights (11.29%)、Wikipedia(10.65%)、Video Uploader(4.19%)、Poli?cy Document ( 2.26%)、Peer Review (0.65%) 和F1000(0.32%)。考慮到覆蓋率低的指標表征能力較弱, 本文借鑒王凱利等[41] 的做法, 剔除覆蓋率值取整后低于25%的Altmetrics 指標, 剩余8 個Altmet?rics 指標, 分別為: ①Altmetric Score、②News、③Blog、④Patent、⑤Twitter、⑥Facebook、⑦MendeleyReaders、⑧Dimensions & WoS Citations。所有8 個傳統(tǒng)指標均采集到數(shù)據(jù), 指標覆蓋率100%。從表4 可知, 初步篩選后的兩部分指標數(shù)值的最大值與最小值差異顯著, 說明指標數(shù)值的波動范圍極大。兩個維度指標數(shù)值的均值差異顯著, 標準差也較大, 表明指標數(shù)值整體上具有離散程度較高的特征。最后,從分布形態(tài)上看, 高產(chǎn)學者綜合影響力評價指標數(shù)值的偏度、峰度均為正值, 表明數(shù)值的分布均呈長尾偏右的尖頂曲線特征。因此這16 個評價指標在各自的維度內(nèi)整體上差異顯著, 表征能力較強, 保留這兩部分共16 個指標以做下一步分析。
2.4 科研影響力評價
2.4?.1 指標相關(guān)性及信效度檢驗
樣本數(shù)據(jù)都不符合正態(tài)分布, 因此采用Spearman相關(guān)性分析方法。將8 個傳統(tǒng)指標依次用T1 ~ T8表示, 得到的Spearman 相關(guān)系數(shù)如表5 所示。分析表5 結(jié)果可知, 各指標間均存在顯著相關(guān)的指標對, 故保留所有傳統(tǒng)指標。
為保證所有數(shù)據(jù)可比, 運用SPSS 軟件對8 個傳統(tǒng)指標進行Z-score 標準化處理, 并對指標的信效度進行檢驗, 結(jié)果如表6 所示。通常, 可以通過Cronbach Alpha 系數(shù)的大小評價內(nèi)在的信度的高低[42] , 分析檢驗結(jié)果可知, 傳統(tǒng)指標的CronbachAlpha 值為0.844, 指標信度較高, 對全部傳統(tǒng)指標進行保留, 指標篩選結(jié)束。
一般認為, 當KMO 值小于0.5 時, 不適合進行因子分析, 而KMO 值大于0.9 時, 則非常適合進行因子分析[43] 。由表6 可知, KMO 值為0.771, 大于0.5, Bartlett 檢驗的顯著水平為0.000, 達到顯著水平。因此, 本文的樣本數(shù)據(jù)適合進行因子分析。
2.4.2 因子分析與主成分分析
在多指標綜合評價中很多指標信息重復, 會增加計算工作量從而影響評價的準確性。主成分分析法就是通過降維將原來眾多具有一定相關(guān)性的指標重新組合成一組新的互相無關(guān)、盡量少的綜合指標來代替原來的指標, 這些新的綜合指標保留了原始變量的主要信息, 同時彼此之間又不相關(guān), 比原始變量具有更優(yōu)越的性質(zhì), 從而更能反映問題的實質(zhì)。確定主成分以及相應(yīng)的權(quán)數(shù)一般可以用特征根大于1 作為納入標準[44] 。根據(jù)表7 的總方差解釋表, 實驗對傳統(tǒng)指標共提取出兩個公共因子, 特征值均大于1, 累計方差貢獻率為68.568%, 說明前兩個因子可以揭示大部分變量的特征。
由因子分析得到成分矩陣, 通過最大方差法進行因子旋轉(zhuǎn)后, 得到旋轉(zhuǎn)成分矩陣表, 如表8 所示。因子載荷是變量與公共因子的相關(guān)系數(shù), 當變量在某公共因子中的載荷絕對值越大, 表明該變量與該公共因子更密切[45] 。表中只顯示了因子載荷大于0.5 的值, 因子載荷小于0.5 值已被隱去。觀察表8 可知, 各指標間不存在交叉載荷, 說明篩選出的可用指標均有意義。
因子1 主要解釋發(fā)文量、總被引頻次、調(diào)和被引頻次、調(diào)和h 指數(shù)、調(diào)和R 指數(shù)和中介中心度6個變量。其中, 一個學者發(fā)文量的多少會對論文的總被引頻次產(chǎn)生影響, 基本上呈促進作用。而調(diào)和被引頻次的計算需要依據(jù)單篇論文被引頻次的數(shù)據(jù)最后得出一個加總數(shù), 依托調(diào)和被引頻次數(shù)據(jù)才能計算調(diào)和h 指數(shù), 接著計算調(diào)和h 指數(shù)的平方根才可得到調(diào)和R 指數(shù)。因此這5 個變量環(huán)環(huán)相扣,同時在因子1 下顯現(xiàn)?!爸行男浴?是社會網(wǎng)絡(luò)分析的重點之一, 個人或組織在社會網(wǎng)絡(luò)中具有怎樣的權(quán)力, 或者說居于怎樣的中心地位, 對于信息在整個網(wǎng)絡(luò)中如何傳播, 及其傳播效果如何都有著十分重要的意義[46] , 點度中心度和中介中心度都是社會網(wǎng)絡(luò)中心性分析的方法。生物科技領(lǐng)域高產(chǎn)學者的論文合著現(xiàn)象極多, 也就是說該領(lǐng)域的高產(chǎn)學者之間普遍存在科研合作的關(guān)系, 而社會網(wǎng)絡(luò)分析方法正是以研究關(guān)系見長的一種方法[47] 。所謂“社會網(wǎng)絡(luò)” 指的是社會行動者及其間的關(guān)系的集合[48] , 社會網(wǎng)絡(luò)分析就是要對社會網(wǎng)絡(luò)中行為者之間的關(guān)系進行量化研究[49] 。而發(fā)文量的多少就會影響論文作者(社會行動者)數(shù)量的多少, 即某一學者發(fā)文量越多, 涉及與其合作的作者就越多, 因此中介中心性同另外5 個傳統(tǒng)文獻計量指標共用一個公因子便有據(jù)可依了。這與李亮等[47] 的研究結(jié)論也是一致的: 發(fā)表文獻比較多的作者同他人的合作也比較頻繁。
因子2 解釋合作能力指數(shù)和點度中心度兩個變量。中介中心性著重刻畫行動者對資源的控制程度, 而網(wǎng)絡(luò)中某個節(jié)點的點度中心度則是根據(jù)網(wǎng)絡(luò)中與該點有連接的點的數(shù)目來衡量, 即節(jié)點的連接數(shù)越多, 就代表該節(jié)點的社會關(guān)系越多, 其影響力就越強。合作能力指數(shù)也融有網(wǎng)絡(luò)概念, 從考察學者的嵌入自我網(wǎng)絡(luò)方式出發(fā), 著重研究學者的合作行為是否穩(wěn)定, 測度其高頻合作水平如何??傮w上, 合作能力指數(shù)和點度中心度都是度量科研合作網(wǎng)絡(luò)中的一個節(jié)點(一位學者)與其他節(jié)點(其他學者)的聯(lián)系密切程度, 所以兩個變量同時在因子2下顯現(xiàn)。
根據(jù)表7, 把進行因子旋轉(zhuǎn)后的各因子方差貢獻率占總方差貢獻率的比重作為權(quán)重, 并進一步加權(quán)匯總, 得出生物科技領(lǐng)域高產(chǎn)學者的科研影響力得分計算公式如下:
根據(jù)上述公式計算得出每位樣本學者的科研影響力得分, 得分排名前30 位的學者如表10 所示。
2.5 社會影響力評價
2.5.1 指標相關(guān)性分析及信效度檢驗
同樣用SPSS 軟件對樣本數(shù)據(jù)進行Spearman 相關(guān)性分析。根據(jù)檢驗結(jié)果, 各Altmetrics 指標之間均存在顯著的相關(guān)關(guān)系, 故保留所有指標。
接著對8 個Altmetrics 指標進行數(shù)據(jù)標準化處理, 進行信效度檢驗。剔除同時在兩個因子中負荷較高的指標——Mendeley Readers 后, 得到表11 的檢驗結(jié)果。指標整體的Cronbach Alpha 值為0.91,表明指標的信度很高; KMO 值為0.671, 因此樣本數(shù)據(jù)適合進行因子分析。
2.5.2 因子分析與主成分分析
根據(jù)表12 的總方差解釋表, 實驗對Altmetrics指標提取出兩個公共因子, 特征值均大于1, 累計方差貢獻率達到83.847%, 說明前兩個因子可以揭示大部分變量的特征。
由因子分析得到成分矩陣, 通過最大方差法進行因子旋轉(zhuǎn)后, 得到旋轉(zhuǎn)成分矩陣表如表13 所示。結(jié)果顯示各指標間不存在交叉載荷, 證明篩選出的Altmetrics 指標均有意義。
因子1 解釋Altmetric Score、News、Blog、Twit?ter 和Facebook 5 個變量。News、Blog、Twitter 和Facebook 是最具代表性的幾個Altmetrics 指標。其中, News 指示有幾條新聞中提到了某篇論文; Blog指示一篇論文所引發(fā)的在線學術(shù)討論的次數(shù),Twitter 和Facebook 顯示了由出版物引發(fā)的一般公眾在社交媒體平臺上發(fā)帖的次數(shù)[50] 。這4 個變量注重新聞、百科及社交媒體上這些學術(shù)界外的廣泛影響力, 也是Altmetric Score 計分的主要來源。
因子2 解釋Patent 與Dimensions & WoS Cita?tions 兩個變量。Patent 指示論文被專利文件引用的次數(shù), 即實體文件的引用次數(shù), 已經(jīng)脫離了互聯(lián)網(wǎng)和媒體的范疇, 而Dimensions & WoS Citations 指標由于包含論文在Dimensions 和WoS 網(wǎng)站上的引用量數(shù)據(jù), 因此兩個變量共用一個公因子。
2.5.3 社會影響力評價指標函數(shù)的構(gòu)建及結(jié)果評價
Altmetrics 指標各成分得分系數(shù)矩陣如表14 所示, 將表中的變量依次表示為Y、Y、…、Y, 兩個成分分別表示為F3 和F4, 則可以得到以下因子得分函數(shù):
根據(jù)上述公式計算得出樣本學者的社會影響力得分, 分值排名前30 位的學者如表15 所示。表中同時顯示了各學者的社會影響力得分排名與科研影響力得分排名相比的變化情況, 正數(shù)表示和科研影響力相比, 該學者的社會影響力排名有所上升, 負數(shù)表示排名下降。觀察排名變動可知, 表中大部分的學者在兩個維度的影響力排名變化較大。說明兩個評價維度的結(jié)果差異明顯, 單獨使用任一維度的指標體系對高產(chǎn)學者的影響力進行評價都是不全面的。
3 高產(chǎn)學者的影響力二維測度
3.1 科研影響力及社會影響力相關(guān)性分析
對樣本學者的科研影響力及社會影響力得分值結(jié)果進行Spearman 相關(guān)分析, 得到如表16 所示的相關(guān)系數(shù)表。根據(jù)相關(guān)分析結(jié)果, 兩者的相關(guān)系數(shù)為0.629, 表明兩者呈較強的正相關(guān)關(guān)系。因此,本文將科研影響力和社會影響力二者結(jié)合進行高產(chǎn)學者影響力評價具有一定的意義, 將兩個維度結(jié)合得到的高產(chǎn)學者綜合影響力結(jié)果更具合理性。本文故借鑒王妍[32] 的二維評價方法對高產(chǎn)學者的影響力進行測度。
3.2 二維測度
本文將樣本學者的科研影響力得分值繪制于X軸, 社會影響力得分值繪制于Y 軸, 以代表平均水平的(0,0)點為原點, 并依據(jù)原點設(shè)置標準分界線,繪制的高產(chǎn)學者影響力的二維評價散點圖如圖1 所示。根據(jù)王妍[32] 的評價思想, 可將樣本學者劃分為以下4 類。
1) “名家學者”: 得分點落于第一象限, 共有14 位高產(chǎn)學者, 占比16.87%。他們同時具有高科研影響力和高社會影響力, 是其所在研究領(lǐng)域的關(guān)鍵人物。“名家學者” 中最突出的得分點來自美國康涅狄格大學病理生物學與獸醫(yī)科學系(Depart?ment of Pathobiology and Veterinary Science, Univer?sity of Connecticut, Storrs) 的學者Tyler D.Gavitt,其3 年的發(fā)文量為53 篇, 并且于每篇論文中均是署名第二的作者。該學者的科研影響力與社會影響力排名都是第一名, 說明他為生物科技領(lǐng)域的研究做出了卓越的貢獻。
2) “明星學者”: 得分點落于第二象限, 共有5位高產(chǎn)學者, 占比6.02%。這部分學者獲得了較高的社會關(guān)注度, 但科研貢獻度相對較低。以該區(qū)域的學者Jonathan S. Weissman 為例, 他來自美國加州大學舊金山分校細胞與分子藥理學研究中心(Depart?ment of Cellular and Molecular Pharmacology, Univer?sity of California, San Francisco), 3 年間共發(fā)表4 篇論文, 論文News 累積提及量就有34 次, Twitter 累計提及量更是高達781 次, 被專利文件引用的次數(shù)也多達19 次, 因此其社會影響力排名較高, 為14名。相較之下, 該學者發(fā)表的4 篇論文的總被引頻次為300 次, 而調(diào)和被引頻次只有19.55 次, 其科研影響力排名僅為59 名, 兩份排名結(jié)果懸殊。
3) “普通學者”: 得分點落于第三象限, 這個區(qū)域共有52 位高產(chǎn)學者, 占比62.65%, 是占全體樣本學者比重最大的部分。這部分學者在科研貢獻度和社會關(guān)注度方面都表現(xiàn)平平, 并且這個區(qū)域的大部分學者與坐標軸都有一定距離, 因此這部分學者無論是在提高科研水平還是獲得社會關(guān)注度方面都應(yīng)持續(xù)努力。
4) “專業(yè)學者”: 得分點落于第四象限, 共有12 位高產(chǎn)學者, 占比14.46%?!皩I(yè)學者” 有著較強的科研能力, 卻沒能贏得大眾的廣泛關(guān)注。以該區(qū)域來自美國斯坦福大學病理學系(Departments ofPathology, Stanford University)的學者Caleb A.Lareau為例, 其在3 年間所發(fā)表的5 篇論文中就有4 篇署名第一或第二, 調(diào)和被引頻次高達103.87 次。但這幾篇論文的Blog 累計提及量僅為3 次, Facebook累計提及量僅為6 次, 顯示出其發(fā)表的論文的較低社會關(guān)注度。因此“專業(yè)學者” 可以適當提高自身在社交媒體的活躍度[51] , 以期提升大眾熟知度及其科研成果的社會影響力。
4 結(jié)論
本文為構(gòu)建融合Altmetrics 指標和傳統(tǒng)指標的高產(chǎn)學者綜合影響力評價指標體系, 在前人的研究基礎(chǔ)上, 初步遴選傳統(tǒng)指標和Altmetrics 指標, 以Nature 生物科技子刊雜志官網(wǎng)為數(shù)據(jù)源, 采集相關(guān)指標數(shù)據(jù)。分別從科研影響力和社會影響力兩個維度, 對樣本學者的影響力開展評價并進行排序, 同時比較了兩份排名的結(jié)果。結(jié)果發(fā)現(xiàn), 大部分學者在兩個維度的影響力排名結(jié)果差別較大, 即單獨使用任一維度的評價指標體系對高產(chǎn)學者的影響力進行評價都是有局限性的。遂進一步對樣本學者的科研影響力及社會影響力的得分結(jié)果進行Spearman相關(guān)分析, 得到兩者呈較強的正相關(guān)關(guān)系, 說明本文將科研影響力即傳統(tǒng)指標與社會影響力即Alt?metrics 指標二者結(jié)合進行高產(chǎn)學者的綜合影響力評價具有合理性。最后本文得出高產(chǎn)學者影響力的二維測度結(jié)果。
同時, 觀察高產(chǎn)學者的影響力排名與發(fā)文量關(guān)系可知, 在高產(chǎn)學者群體中, 部分發(fā)文數(shù)量較多的學者和發(fā)文量相對較少的學者相比, 其科研影響力和社會影響力卻并不如后者。以3 年發(fā)文量為7 篇的學者Robert Langer 和發(fā)文量為3 篇的學者MikhailKolmogorov 為例作對比, 前者的科研和社會影響力排名分別為22 名和15 名, 而后者的排名為8 名和12 名, 即發(fā)文量少的這名學者的排名都比這名發(fā)文量多的學者靠前。說明高產(chǎn)學者科研成果的“高產(chǎn)出量” 并不完全意味著“高質(zhì)量”。生物技術(shù)是促進經(jīng)濟社會可持續(xù)發(fā)展的有效途徑, 各國(地區(qū))在生物科技領(lǐng)域的競爭也日益加?。郏担玻?。領(lǐng)域內(nèi)的科研學者應(yīng)摒棄唯發(fā)文量至上的觀念, 不能單純關(guān)注科研產(chǎn)出的絕對數(shù)量, 在保證科研產(chǎn)出量的同時, 學者們還應(yīng)切實提高成果的質(zhì)量, 努力形成一支高質(zhì)量的高產(chǎn)作者隊伍, 不僅帶領(lǐng)領(lǐng)域研究攀上新的高度, 也能促進經(jīng)濟社會的可持續(xù)發(fā)展,使研究成果成功轉(zhuǎn)化為社會效益。
本文研究的不足之處在于僅選定了3 本Nature生物科技子刊的高產(chǎn)學者作為樣本進行研究, 存在一定的局限性, 對于其他領(lǐng)域是否適用還有待進一步考證; 對傳統(tǒng)指標的選擇可能也不盡完善。未來的研究中, 會進一步擴大數(shù)據(jù)源, 增加樣本的多樣性, 同時選擇更多具有代表性的傳統(tǒng)指標, 使研究結(jié)果更具說服力, 以期對不同領(lǐng)域高產(chǎn)學者的影響力進行更加深入的評價研究。