陶文倩,潘云濤,王海燕
(中國(guó)科學(xué)技術(shù)信息研究所,北京 100038)
2021 年9 月,中央人才工作會(huì)議上,習(xí)近平總書(shū)記發(fā)表重要講話(huà):當(dāng)前實(shí)現(xiàn)中華民族偉大復(fù)興奮斗目標(biāo),高水平科技自立自強(qiáng)是關(guān)鍵。綜合國(guó)力競(jìng)爭(zhēng)說(shuō)到底是人才競(jìng)爭(zhēng)。人才是自主創(chuàng)新的關(guān)鍵,頂尖人才具有不可替代性[1]??萍疾空诜e極推進(jìn)科技人才評(píng)價(jià)改革,在改革試點(diǎn)的工作方案中強(qiáng)調(diào)要“破四唯”和“立新標(biāo)”并舉,加快建立以創(chuàng)新價(jià)值、能力、貢獻(xiàn)為導(dǎo)向的科技人才評(píng)價(jià)體系,為實(shí)現(xiàn)高水平科技自立自強(qiáng)和建設(shè)世界科技強(qiáng)國(guó)提供有力人才支撐[2]。在科學(xué)研究領(lǐng)域,頂尖學(xué)者是頂尖人才最重要的表現(xiàn)形式之一。在此背景下,需要深化對(duì)頂尖學(xué)者的認(rèn)識(shí),理解其在科學(xué)發(fā)展中發(fā)揮的作用以及呈現(xiàn)的不同影響模式,以便為改善人才評(píng)價(jià)工作提供更多信息。
科研人員在知識(shí)發(fā)現(xiàn)、科學(xué)產(chǎn)出的表現(xiàn)等方面差距很大,其中部分科研人員水平遠(yuǎn)超過(guò)平均水平,構(gòu)成了學(xué)術(shù)精英群體[3]??茖W(xué)共同體內(nèi)根據(jù)科學(xué)知識(shí)貢獻(xiàn)的社會(huì)分層是客觀存在的,科爾兄弟在《科學(xué)界的社會(huì)分層》中描述了美國(guó)大學(xué)物理科學(xué)共同體的分層結(jié)構(gòu)[4]。因此,頂尖學(xué)者即這種分層結(jié)構(gòu)中的高層。在這種社會(huì)分層基礎(chǔ)上,國(guó)內(nèi)外研究紛紛對(duì)頂尖學(xué)者的遴選提出了不用依據(jù)與方法,總結(jié)以往研究中關(guān)于頂尖學(xué)者,或者與之相似的概念如杰出科學(xué)家、高層次科技人才等的論述,主要有3 種遴選依據(jù):①獲得某一領(lǐng)域的國(guó)際重大科學(xué)獎(jiǎng)項(xiàng),如諾貝爾獎(jiǎng)、菲爾茲獎(jiǎng)等[5]。它強(qiáng)調(diào)學(xué)者在某一科學(xué)領(lǐng)域做出的重大貢獻(xiàn)并于科學(xué)界獲得巨大聲望。該依據(jù)在以往研究中使用最為廣泛,最早源于朱克曼在《科學(xué)界的精英——美國(guó)的諾貝爾獎(jiǎng)金獲得者》中將美國(guó)諾貝爾獎(jiǎng)獲得者視為科學(xué)界金字塔頂端的人才[6],隨后許多學(xué)者基于朱克曼的理論采用這種依據(jù)進(jìn)行頂尖學(xué)者研究,比如,高志等[5]認(rèn)為,在某一學(xué)科領(lǐng)域獲得過(guò)國(guó)際頂尖科學(xué)獎(jiǎng)項(xiàng)的科學(xué)家是頂尖科學(xué)家。②獲得特殊的科學(xué)地位,如院士、國(guó)家的人才計(jì)劃的入選者[7]。該依據(jù)常見(jiàn)于國(guó)內(nèi)的科技人才研究,比如,婁偉[8]認(rèn)為,高層次科技人才包括兩院院士、享受政府特殊津貼政策或者獲得“長(zhǎng)江學(xué)者”等稱(chēng)號(hào)的學(xué)者。③高被引學(xué)者。它強(qiáng)調(diào)學(xué)者所發(fā)表的論文的影響力,容易測(cè)度。其具體遴選指標(biāo)常用的是總被引指標(biāo)、h 指數(shù)及其衍生指標(biāo)[9]。比如,Li 等[10]以總被引指標(biāo)前5%來(lái)確定頂尖學(xué)者人選,Ioannidis 等[11]主要采用基于總被引次數(shù)的指標(biāo)和基于h 指數(shù)的指標(biāo)對(duì)全球有影響力的科學(xué)家進(jìn)行影響力評(píng)估。
考慮到依據(jù)①遴選出的學(xué)者極少,不同國(guó)家在依據(jù)②上的標(biāo)準(zhǔn)和情況差距較大,本文決定結(jié)合使用依據(jù)①和依據(jù)③,即獲得國(guó)際重大科學(xué)獎(jiǎng)項(xiàng)以及高被引學(xué)者。此外,本文選擇總被引指標(biāo)作為高被引學(xué)者遴選指標(biāo),因?yàn)殡m然h 指數(shù)是從數(shù)量和質(zhì)量綜合評(píng)價(jià)科學(xué)家的有效指標(biāo),但以往許多研究表明總引用頻次是諾貝爾獎(jiǎng)獲得者區(qū)別于一般科學(xué)家的重要特征,而h 指數(shù)由于容易忽略極高被引的論文而表現(xiàn)不佳[12-14]。同時(shí)在遴選標(biāo)準(zhǔn)上,目前國(guó)際上一些權(quán)威的科學(xué)評(píng)價(jià)數(shù)據(jù)庫(kù)的相關(guān)標(biāo)準(zhǔn)具有一定的參考價(jià)值??祁Nò驳幕究茖W(xué)指標(biāo)(Essential Science Indicators,ESI)篩選出同學(xué)科、同出版年被引前1%的文獻(xiàn)稱(chēng)為“高被引論文”,以每個(gè)學(xué)科中高被引論文的作者總數(shù)的平方根作為閾值,遴選出全球高被引科學(xué)家[15]。斯坦福大學(xué)與Elsevier 聯(lián)合推出全球前2%頂尖科學(xué)家榜單(World's Top 2%Scientists),遴選各個(gè)學(xué)科中被引前2% 的科學(xué)家[11,16]。
依據(jù)上述研究對(duì)頂尖人才的定義以及國(guó)際上的相關(guān)標(biāo)準(zhǔn),并考慮數(shù)據(jù)集的規(guī)模,本文將頂尖學(xué)者定義為:在各學(xué)科領(lǐng)域,擁有頂尖級(jí)別影響力的科研成果的學(xué)者群體。衡量標(biāo)準(zhǔn)是出版物總被引頻次位于學(xué)科前1%的學(xué)者,并包含獲得國(guó)際重大科學(xué)獎(jiǎng)項(xiàng)的學(xué)者。
以往頂尖學(xué)者、杰出學(xué)者群體的研究可大致分為三類(lèi)。第一類(lèi)是杰出學(xué)者誕生的影響因素,如性別的影響[17],家庭、學(xué)校、導(dǎo)師的影響[18-19],以及各種影響因素的組合[20-21]等。第二類(lèi)是杰出學(xué)者的學(xué)術(shù)生命周期與脈動(dòng)節(jié)奏。Yair 等[22]發(fā)現(xiàn)大多數(shù)杰出學(xué)者都擁有“奇跡年”,即研究生涯的高峰期。Liang[23]提出了一種R 指標(biāo)用于描述學(xué)者科研節(jié)奏,并以科學(xué)計(jì)量學(xué)領(lǐng)域的頂尖學(xué)者劉則淵為例論證了科研節(jié)奏的存在及特征[24]。第三類(lèi)是杰出學(xué)者對(duì)其他學(xué)者或者學(xué)術(shù)界的作用。Yin 等[25]研究了杰出學(xué)者對(duì)組織內(nèi)其他人員知識(shí)產(chǎn)出的溢出效應(yīng),Dong等[26]研究了頂尖科學(xué)家對(duì)基礎(chǔ)研究學(xué)術(shù)社區(qū)發(fā)展的影響。頂尖學(xué)者的工作往往導(dǎo)致現(xiàn)有知識(shí)的深刻變革,帶動(dòng)相關(guān)學(xué)科與領(lǐng)域向更深、更廣的層次發(fā)展,催生更多新發(fā)現(xiàn)與新突破[27]。這樣的例子很多。高錕(Charles Kuen Kao)提出使用光纖作為通信的通用介質(zhì),開(kāi)創(chuàng)了光纖領(lǐng)域的研究,引發(fā)了學(xué)界對(duì)光纖的學(xué)術(shù)研究熱情,在應(yīng)用階段,持續(xù)激發(fā)著技術(shù)改進(jìn)研究的新見(jiàn)解的產(chǎn)生[28]。在神經(jīng)學(xué)領(lǐng)域,高爾基(Camillo Golgi)發(fā)明高爾基染色法,第一次清晰地觀察到神經(jīng)纖維,由此開(kāi)創(chuàng)了神經(jīng)網(wǎng)狀學(xué)說(shuō);卡哈爾(Ramón y Cajal)基于改良的高爾基染色法,提出神經(jīng)細(xì)胞互相獨(dú)立的觀點(diǎn),開(kāi)創(chuàng)了神經(jīng)元學(xué)說(shuō);瓦爾德?tīng)枺╓ihelm von Waldeyer)在此基礎(chǔ)上正式提出“神經(jīng)元”這一名詞,建立了“神經(jīng)元學(xué)說(shuō)”;謝林頓(Charles Scott Sherrington)發(fā)現(xiàn)了“突觸”,彌補(bǔ)了神經(jīng)元學(xué)說(shuō)對(duì)神經(jīng)元如何相互交流的理解[29]。Hu 等[27]、Xi 等[30]計(jì)量了諾貝爾獎(jiǎng)獲得者的出版物產(chǎn)生的兩種類(lèi)型的影響:直接點(diǎn)火型與引發(fā)火花型。直接點(diǎn)火型帶來(lái)大量的引用,引發(fā)新的研究和見(jiàn)解;引發(fā)火花型是通過(guò)后續(xù)論文來(lái)實(shí)現(xiàn)它的影響潛力;之后又發(fā)現(xiàn)了頂尖學(xué)者更有可能在引發(fā)火花型研究的起源中發(fā)揮關(guān)鍵作用并產(chǎn)生積極的反應(yīng)[31]。
綜上,以往研究對(duì)頂尖學(xué)者研究活動(dòng)規(guī)律的探討已有一定積累,但是仍然鮮有關(guān)于頂尖學(xué)者研究動(dòng)態(tài)對(duì)學(xué)科發(fā)展影響的認(rèn)識(shí)與量化研究。因此,本文以基因編輯領(lǐng)域的頂尖學(xué)者為研究對(duì)象,從學(xué)者發(fā)文和學(xué)科主題發(fā)展之間關(guān)系的視角,量化學(xué)者研究動(dòng)態(tài)對(duì)學(xué)科發(fā)展的影響,并判別具體影響類(lèi)型。
本文通過(guò)觀察學(xué)者所發(fā)表的文獻(xiàn)在特定主題、特定年份的被引情況,結(jié)合主題的發(fā)展階段,從語(yǔ)義和時(shí)序上揭示學(xué)者研究動(dòng)態(tài)對(duì)學(xué)科發(fā)展的影響。
本文分析學(xué)者對(duì)學(xué)科領(lǐng)域發(fā)展影響的4 個(gè)要素:影響來(lái)源、影響對(duì)象、影響類(lèi)型和作用特點(diǎn)。其中,影響來(lái)源為學(xué)者的研究動(dòng)態(tài),使用學(xué)者發(fā)表的成果文獻(xiàn)作為直接體現(xiàn);影響對(duì)象為學(xué)科主題發(fā)展動(dòng)態(tài),使用學(xué)科主題熱度變化及該主題下的文獻(xiàn)作為直接體現(xiàn);影響類(lèi)型與作用特點(diǎn)則可以通過(guò)學(xué)者發(fā)表的成果文獻(xiàn)被特定主題的文獻(xiàn)的引用情況來(lái)反映。假設(shè)這樣一個(gè)現(xiàn)實(shí)場(chǎng)景:學(xué)者甲發(fā)表了一篇關(guān)于主題A 的成果文獻(xiàn)A1,A1 對(duì)主題A 產(chǎn)生影響,體現(xiàn)為成果文獻(xiàn)A1 被主題A 下的文獻(xiàn)所引用。當(dāng)然,該成果文獻(xiàn)也可能對(duì)其他主題產(chǎn)生影響,如假設(shè)主題B,體現(xiàn)為被主題B 下的文獻(xiàn)所引用。因此,使用學(xué)者甲的成果文獻(xiàn)在各個(gè)主題下的全部被引信息,并結(jié)合各個(gè)主題的發(fā)展,就可以分析學(xué)者甲對(duì)各個(gè)主題的影響。最后綜合學(xué)者的成果文獻(xiàn)對(duì)所有主題的影響,分析其對(duì)該學(xué)科領(lǐng)域發(fā)展的影響。
基于以上分析,本文設(shè)計(jì)了研究思路,如圖1所示。
圖1 本文的研究思路
本文通過(guò)3 個(gè)維度描述學(xué)者發(fā)表的文章對(duì)某一主題在某一年份的影響情況:①時(shí)間維度。文章發(fā)表時(shí)間與所需要分析的影響年份之間存在一個(gè)時(shí)間差,其代表了該文獻(xiàn)產(chǎn)生的影響的凸顯時(shí)間,本文提出作用時(shí)間差TD 指標(biāo)來(lái)描述。②主題維度。本文采用熱度變化率Δh反映該主題年度熱度變化情況。③影響關(guān)系維度。本文借助引用關(guān)系來(lái)反映影響關(guān)系?;诖?,提出指標(biāo)影響強(qiáng)度S。
生命周期理論是指事物從產(chǎn)生到消亡的整個(gè)過(guò)程中,各個(gè)事物的生命都會(huì)經(jīng)歷出生、成長(zhǎng)、成熟和衰退4 個(gè)階段。馬費(fèi)成等[32]認(rèn)為,學(xué)科領(lǐng)域的發(fā)展也遵循生命周期的一般規(guī)律?;谏芷诶碚?,一個(gè)主題發(fā)展通常會(huì)經(jīng)歷萌芽、增長(zhǎng)、繁榮、衰退的完整階段,或者部分階段,或者幾個(gè)階段的更迭。一篇或多篇文章發(fā)表后可能會(huì)對(duì)一個(gè)主題的開(kāi)創(chuàng)起作用,可能會(huì)促進(jìn)一個(gè)主題的快速上升與繁榮發(fā)展,也可能在發(fā)表多年后又對(duì)該主題的發(fā)展起到支撐作用等。
因此,本文從時(shí)間、主題、影響關(guān)系3 個(gè)維度設(shè)計(jì)一組用于描述一篇文章對(duì)特定主題在特定年份的影響的基礎(chǔ)指標(biāo);然后,結(jié)合主題生命周期發(fā)展階段進(jìn)一步劃分4 種影響類(lèi)型,包括開(kāi)創(chuàng)作用、引導(dǎo)作用、促進(jìn)作用、支撐作用;最后,計(jì)算學(xué)者的影響函數(shù)值。
本文定義3 個(gè)基礎(chǔ)指標(biāo)用于描述一篇文獻(xiàn)對(duì)特定主題在目標(biāo)年份的影響。所描述的影響情況主要包含以下3 個(gè)方面的特征:
(1)影響的作用時(shí)間,即該篇文獻(xiàn)的發(fā)表時(shí)間與目標(biāo)年份之間相距多久。衡量該特征的基礎(chǔ)指標(biāo)為作用時(shí)間差TD,計(jì)算公式為
其中,ttarget表示目標(biāo)年份;tpublish表示文獻(xiàn)發(fā)表年份。
一般來(lái)說(shuō),文獻(xiàn)具有半衰期,同一學(xué)科的文獻(xiàn)可能具有相似的文獻(xiàn)老化規(guī)律。因此,在分析影響時(shí),需要考慮到一種特殊情況:若文章的發(fā)表時(shí)間距目標(biāo)分析年份過(guò)久,超過(guò)本學(xué)科的一般半衰期,則有可能在發(fā)表多年后又對(duì)該領(lǐng)域的發(fā)展起到支撐作用??赡茉蛑皇呛罄m(xù)文獻(xiàn)促進(jìn)了該文獻(xiàn)的被引。
(2)影響的效果,即主題產(chǎn)生的熱度變化。衡量該特征的基礎(chǔ)指標(biāo)為熱度變化值Δh,計(jì)算公式為
其中,Httarget表示目標(biāo)年份主題熱度;Httarget-1表示目標(biāo)年份前一年的主題熱度。
學(xué)者成果文獻(xiàn)發(fā)表后,可能會(huì)促進(jìn)一個(gè)主題的發(fā)展,如產(chǎn)生較明顯的刺激效果,表現(xiàn)為主題熱度上升,也可能產(chǎn)生一般性的促進(jìn)作用,表現(xiàn)為主題熱度不變或下降。
(3)影響的強(qiáng)度,即學(xué)者文獻(xiàn)發(fā)表后,該主題產(chǎn)生的變化多大程度上與該學(xué)者有關(guān)。衡量該特征的指標(biāo)是影響強(qiáng)度S,計(jì)算公式為
其中,Ctarget表示文獻(xiàn)在目標(biāo)年份的施引論文數(shù)量;Ntarget表示目標(biāo)年份出版的論文數(shù)。
科學(xué)文獻(xiàn)是直接反映科學(xué)發(fā)展的重要標(biāo)志之一,其增長(zhǎng)規(guī)律能夠幫助判斷科學(xué)發(fā)展階段。庫(kù)恩的《科學(xué)革命的結(jié)構(gòu)》中提出,科學(xué)的發(fā)展模式是一個(gè)動(dòng)態(tài)的歷史過(guò)程和新陳代謝的革命過(guò)程,具有顯著的“階段革命”的特點(diǎn)[33]。王海山[34]、王康等[35]將文獻(xiàn)增長(zhǎng)與科研人員研究興趣程度變化相聯(lián)系,解釋了文獻(xiàn)邏輯增長(zhǎng)模型的發(fā)展階段??茖W(xué)文獻(xiàn)的階段變化反映科研人員對(duì)該主題研究的興趣程度變化,這種變化也會(huì)體現(xiàn)在領(lǐng)域內(nèi)研究主題的熱度變化上,呈現(xiàn)為研究主題熱度的新陳代謝現(xiàn)象。其完整過(guò)程應(yīng)當(dāng)大致呈現(xiàn)為先增加,然后高位發(fā)展,之后再降低的過(guò)程。Tattershall 等[36]使用大規(guī)模數(shù)據(jù)集DBLP(digital bibliography &library project)統(tǒng)計(jì)不同主題的流行比例變化時(shí),也發(fā)現(xiàn)了它們呈現(xiàn)指數(shù)上升和峰值的特點(diǎn),一定程度上佐證了上述研究結(jié)論。
基于此,本文將主題的熱度變化過(guò)程抽象為一個(gè)類(lèi)似于正態(tài)分布的圖像,并且根據(jù)熱度將主題演變劃分為不同發(fā)展階段。本文將主題熱度最高的年份認(rèn)定為峰值年份,以峰值點(diǎn)熱度的一半作為分界線(xiàn),高于此分界線(xiàn)的階段認(rèn)定為熱度高位期,如圖2 所示。
圖2 主題熱度變化
影響類(lèi)型的劃分是為了區(qū)分學(xué)者文獻(xiàn)對(duì)學(xué)科發(fā)展所起到的不同作用,如1.1 節(jié)所述,其包括開(kāi)創(chuàng)作用、引導(dǎo)作用、促進(jìn)作用和支撐作用,如表1所示。
表1 學(xué)者文獻(xiàn)對(duì)學(xué)科發(fā)展影響類(lèi)型定義
開(kāi)創(chuàng)作用、引導(dǎo)作用、促進(jìn)作用的主要區(qū)別在于學(xué)者文獻(xiàn)在所分析主題不同發(fā)展階段起到不同作用。開(kāi)創(chuàng)作用關(guān)注的是學(xué)者文獻(xiàn)對(duì)主題誕生階段產(chǎn)生的影響,引導(dǎo)作用關(guān)注的是學(xué)者文獻(xiàn)對(duì)主題提升熱度進(jìn)入熱度高位期所產(chǎn)生的影響,促進(jìn)作用關(guān)注的是學(xué)者文獻(xiàn)對(duì)主題繼續(xù)保持高位熱度所產(chǎn)生的影響。支撐作用區(qū)別于以上3 種作用,其基于這3 種作用,但是要求作用時(shí)間差大于學(xué)科半衰期。此類(lèi)影響下,學(xué)者的發(fā)文時(shí)間點(diǎn)與分析年份之間具有較大的時(shí)間差,具有較為長(zhǎng)遠(yuǎn)的支撐影響。
構(gòu)建學(xué)者對(duì)某主題的影響函數(shù)。其中,不區(qū)分影響類(lèi)型的全作用影響函數(shù)為
開(kāi)創(chuàng)作用、引導(dǎo)作用、促進(jìn)作用的影響函數(shù)為
支撐作用的影響函數(shù)為
其中,f(t)是權(quán)重函數(shù),
TD 是作用時(shí)間差指標(biāo);Δh是熱度變化值指標(biāo);S是影響強(qiáng)度指標(biāo);paper 是學(xué)者發(fā)表的所有文獻(xiàn);T為指定目標(biāo)年份范圍長(zhǎng)度。
學(xué)者影響函數(shù)是計(jì)算學(xué)者對(duì)主題發(fā)展全階段每一年“影響效果”的加權(quán)平均值。其中,“影響效果”使用熱度變化值Δh和影響強(qiáng)度S的乘積表示,可衡量學(xué)者某篇文章對(duì)該年份主題熱度變化的影響力。此外,為進(jìn)一步描述學(xué)者在各類(lèi)影響類(lèi)型,即在主題發(fā)展不同時(shí)期下的表現(xiàn),附加權(quán)重函數(shù)f(t),見(jiàn)公式(7)。比如,為了描述開(kāi)創(chuàng)作用,使用f(t)加強(qiáng)學(xué)者文獻(xiàn)在主題誕生的前兩年產(chǎn)生的影響,抑制學(xué)者文獻(xiàn)在其余主題發(fā)展階段的影響。其他幾種影響類(lèi)型作用計(jì)算同理。權(quán)重函數(shù)f(t)圖像如圖3 所示。
圖3 權(quán)重函數(shù)f(t)
本文選取基因編輯領(lǐng)域?yàn)槔M(jìn)行頂尖學(xué)者研究動(dòng)態(tài)對(duì)學(xué)科發(fā)展的影響研究。選擇該領(lǐng)域是考慮到這是一個(gè)新興學(xué)科領(lǐng)域,知識(shí)更迭快,階段革命特征明顯;而且該領(lǐng)域也是近年來(lái)最受關(guān)注、最活躍的研究領(lǐng)域之一,領(lǐng)域的頂尖學(xué)者屢次上榜Nature年度影響力十大科學(xué)家。本文以Web of Science 核心合集作為數(shù)據(jù)來(lái)源,檢索基因編輯領(lǐng)域所有出版物記錄,不限制出版年份。使用的檢索式如下:TS=(“gene edit*”O(jiān)R“genome edit*”O(jiān)R“genetic* edit*”)OR TS=(“clustered regularly interspaced short palindromic repeat$”O(jiān)R CRISPR$ OR (CRISPER near/2 cas$)) OR TS=(meganuclease* OR“homing endonuclease*”O(jiān)R“family endonuclease*”) OR TS=(((“ZFN”O(jiān)R“ZFNs”) AND (gene OR genome OR nuclease OR nucleases)) OR (“zinc finger endonuclease*”)) OR TS=(“transcription activator near/1 like effector*”O(jiān)R“transcriptional activator near/1 like effector*”O(jiān)R“TAL effector*”O(jiān)R ((“TALEN”O(jiān)R“TALENs”) AND (gene OR genome OR nuclease OR nucleases)))。檢索日期為2022年6 月8 日,最終得到檢索記錄34992 條。
2.1.1 頂尖學(xué)者的提取
本文選取基因編輯領(lǐng)域總被引頻次居前1%的學(xué)者以及獲得國(guó)際重大科學(xué)獎(jiǎng)項(xiàng)的學(xué)者為頂尖學(xué)者,國(guó)際科學(xué)重大獎(jiǎng)項(xiàng)包括諾貝爾獎(jiǎng)、霍維茨獎(jiǎng)、沃爾夫獎(jiǎng)、蓋爾德納獎(jiǎng)、科學(xué)突破獎(jiǎng)、阿爾伯尼獎(jiǎng)。以學(xué)者標(biāo)識(shí)符(ORCID、Researcher ID)、郵箱信息、地址信息為特征值,編制程序?qū)λ袑W(xué)者進(jìn)行姓名消歧,在此基礎(chǔ)上進(jìn)行人工消歧。最終得到下載記錄數(shù)34992 條,學(xué)者174561 人,其中頂尖學(xué)者1745 人。
2.1.2 主題抽取
由于基因編輯領(lǐng)域的學(xué)科發(fā)展主要體現(xiàn)為基因編輯技術(shù)研究的發(fā)展,因此,本文采用基因編輯技術(shù)主題的發(fā)展情況來(lái)刻畫(huà)該學(xué)科的發(fā)展過(guò)程。根據(jù)期刊Science、Nature和Cell被引最高的相關(guān)綜述文章以及國(guó)內(nèi)一流高校和科研院所聯(lián)合所著的經(jīng)典書(shū)籍[37-40],本文將基因編輯領(lǐng)域主題劃分為10 類(lèi)主題,如表2 所示。
表2 基因編輯領(lǐng)域主題劃分
根據(jù)主題抽取結(jié)果,繪制主題的熱度變化圖,如圖4 所示。
圖4 基因編輯領(lǐng)域各主題熱度變化
根據(jù)統(tǒng)計(jì)結(jié)果,基因編輯技術(shù)主題熱度變化呈現(xiàn)先增加,然后高位發(fā)展,之后再降低的過(guò)程。不過(guò)由于基因編輯領(lǐng)域仍是一個(gè)比較年輕、具有活力的新興發(fā)展領(lǐng)域,較新的幾個(gè)主題還未產(chǎn)生明顯的衰退。
2.2.1 不同代技術(shù)主題頂尖學(xué)者影響的比較分析
本文分別計(jì)算了基因編輯領(lǐng)域10 個(gè)技術(shù)主題中,頂尖學(xué)者和所有學(xué)者的全作用、開(kāi)創(chuàng)作用、引導(dǎo)作用、促進(jìn)作用、支撐作用的學(xué)者影響函數(shù)值,以及頂尖學(xué)者相對(duì)數(shù)(頂尖學(xué)者/所有學(xué)者),如表3 所示。
學(xué)者影響函數(shù)值反映的是學(xué)者對(duì)主題特定作用的影響強(qiáng)度,指的是對(duì)該主題研究熱度在學(xué)科內(nèi)地位變化的作用,而不是普遍意義上的一般性影響,換言之,反映的是學(xué)者對(duì)領(lǐng)域內(nèi)技術(shù)主題迭代的影響。因此,表3 中的負(fù)值指的是學(xué)者對(duì)該主題有某種類(lèi)型的一般性影響,但是對(duì)于該主題在學(xué)科內(nèi)占比的上升沒(méi)有正向刺激作用。頂尖學(xué)者相對(duì)數(shù)反映的是頂尖學(xué)者的影響程度與所有學(xué)者相比所具有的優(yōu)勢(shì),即相對(duì)優(yōu)勢(shì)。
不論哪個(gè)技術(shù)主題,與所有學(xué)者相比,頂尖學(xué)者對(duì)學(xué)科發(fā)展的影響都非常顯著。目前的頂尖學(xué)者群體在第三代基因編輯技術(shù)CRISPR(包括其系統(tǒng)下的cas9、cas12、cas13 子技術(shù)主題,即技術(shù)主題5~技術(shù)主題8)的相對(duì)優(yōu)勢(shì)最為顯著,相對(duì)數(shù)在60~70。這意味著目前本領(lǐng)域頂尖學(xué)者群體對(duì)學(xué)科發(fā)展最顯著的影響體現(xiàn)在推動(dòng)CRISPR 成為最主流的基因編輯研究主題,實(shí)現(xiàn)了技術(shù)研究的迭代。
然而,在改進(jìn)CRISPR 系統(tǒng)(Base editor、Prime editor,即技術(shù)主題9 和技術(shù)主題10)的研究中,當(dāng)前的頂尖學(xué)者群體影響的相對(duì)優(yōu)勢(shì)減弱,很可能新的有影響力的學(xué)者成長(zhǎng)了起來(lái),學(xué)者的影響力分布比之前更均衡。結(jié)合基因編輯領(lǐng)域的實(shí)際情況來(lái)看確實(shí)如此,Base editor 和Prime editor 出現(xiàn)后確實(shí)誕生了一批新的高影響力學(xué)者,如Base editor 在植物學(xué)領(lǐng)域應(yīng)用的先驅(qū)之一北京大學(xué)劉江宇教授等。
2.2.2 頂尖學(xué)者群體的影響類(lèi)型分析
根據(jù)表3 中頂尖學(xué)者相對(duì)數(shù)的均值,頂尖學(xué)者開(kāi)創(chuàng)作用的相對(duì)優(yōu)勢(shì)最為顯著,其次是支撐作用。這反映了對(duì)于學(xué)科發(fā)展來(lái)說(shuō),頂尖學(xué)者與其他學(xué)者相比,一是對(duì)領(lǐng)域的創(chuàng)新性研究主題具有顯著的影響,能夠引領(lǐng)學(xué)科的發(fā)展方向和前沿。這是頂尖學(xué)者最顯著的優(yōu)勢(shì)所在。二是與所有學(xué)者相比,頂尖學(xué)者的論文成果對(duì)領(lǐng)域的長(zhǎng)期支撐作用優(yōu)勢(shì)顯著,長(zhǎng)期影響比短期影響更具有優(yōu)勢(shì)。
下文將對(duì)各代基因編輯技術(shù)主題進(jìn)行詳細(xì)分析。
(1)早期技術(shù)主題情況分析
早期技術(shù)主題是指第一代技術(shù)之前的技術(shù)主題(Cre-LoxP、meganucleases,即技術(shù)主題1 和技術(shù)主題2)。早期技術(shù)主題在學(xué)科中發(fā)文占比是逐年降低的,因此數(shù)據(jù)集中只包括了早期技術(shù)主題的高位發(fā)展期和衰退期,部分?jǐn)?shù)據(jù)缺失。根據(jù)表3 中的促進(jìn)作用和支撐作用計(jì)算結(jié)果,頂尖學(xué)者在早期技術(shù)主題的高位發(fā)展期已展現(xiàn)了一定的影響優(yōu)勢(shì),但并不顯著。支撐作用的優(yōu)勢(shì)略強(qiáng)于促進(jìn)作用。
(2)第一代和第二代技術(shù)主題情況分析
在第一代基因編輯技術(shù)主題下(ZFN,即技術(shù)主題3),頂尖學(xué)者的促進(jìn)作用優(yōu)勢(shì)最強(qiáng),開(kāi)創(chuàng)作用和引導(dǎo)作用的優(yōu)勢(shì)不強(qiáng),支撐作用優(yōu)勢(shì)最低。說(shuō)明頂尖學(xué)者對(duì)ZFN 相關(guān)研究的影響優(yōu)勢(shì)主要體現(xiàn)在高位發(fā)展期,并且短期影響的優(yōu)勢(shì)更顯著。
在第二代基因編輯技術(shù)主題下(TALEN,即技術(shù)主題4),頂尖學(xué)者的全作用為正,所有學(xué)者為負(fù)。這說(shuō)明頂尖學(xué)者對(duì)該技術(shù)主題在學(xué)科內(nèi)占比的上升有明顯的正向刺激作用,而所有學(xué)者總體來(lái)說(shuō)起到了一般性作用,沒(méi)有明顯的正向刺激作用。此外,頂尖學(xué)者影響優(yōu)勢(shì)非常顯著,各種作用相比差異不大。
(3)第三代技術(shù)主題情況分析
從第三代技術(shù)主題(CRISPR,即技術(shù)主題8)來(lái)看,頂尖學(xué)者的開(kāi)創(chuàng)作用的影響優(yōu)勢(shì)最強(qiáng),支撐作用的影響優(yōu)勢(shì)次之,而引導(dǎo)作用、促進(jìn)作用的影響優(yōu)勢(shì)相對(duì)于前兩者較弱,但絕對(duì)值仍很高。這說(shuō)明頂尖學(xué)者群體的研究對(duì)CRISPR 技術(shù)發(fā)展各個(gè)階段都產(chǎn)生了非常大的影響,但最顯著的影響優(yōu)勢(shì)體現(xiàn)在兩個(gè)方面:一是對(duì)CRISPR 的開(kāi)創(chuàng)產(chǎn)生了遠(yuǎn)超所有學(xué)者平均水平的影響作用(約100 倍),能夠引領(lǐng)學(xué)科中具有巨大潛力的發(fā)展方向和前沿。二是對(duì)CRISPR 技術(shù)后續(xù)發(fā)展的長(zhǎng)期影響優(yōu)勢(shì)顯著。雖然在開(kāi)創(chuàng)階段之后,頂尖學(xué)者的影響優(yōu)勢(shì)略微下降,但長(zhǎng)期支撐作用優(yōu)勢(shì)仍十分顯著,能夠?yàn)镃RISPR 研究的發(fā)展奠定持久的堅(jiān)實(shí)基礎(chǔ)。
詳細(xì)分析CRISPR 技術(shù)主題下的cas9、cas12、cas13 子技術(shù)主題,可以發(fā)現(xiàn),隨著CRISPR 的發(fā)展,頂尖學(xué)者的引導(dǎo)作用和促進(jìn)作用的影響優(yōu)勢(shì)在持續(xù)下降,但是開(kāi)創(chuàng)作用和支撐作用的影響優(yōu)勢(shì)仍可以保持;觀察改進(jìn)的CRISPR/CAS 工具(技術(shù)主題9 和技術(shù)主題10),也具有相似現(xiàn)象。
綜上所述,頂尖學(xué)者群體的顯著影響優(yōu)勢(shì)體現(xiàn)在能夠引領(lǐng)學(xué)科中具有巨大潛力的發(fā)展方向和前沿,為技術(shù)的研究發(fā)展奠定持久的堅(jiān)實(shí)基礎(chǔ),且隨著該主題相關(guān)研究的不斷出現(xiàn),這兩個(gè)顯著的影響優(yōu)勢(shì)可以得到較好的保持。
本文選擇基因編輯領(lǐng)域兩位典型學(xué)者進(jìn)行案例分析。
詹妮弗·杜德納(Jennifer Doudna)是美國(guó)加利福尼亞大學(xué)伯克利分校的生物化學(xué)家,她在基因編輯領(lǐng)域進(jìn)行了開(kāi)拓性工作并做出基礎(chǔ)性貢獻(xiàn)(關(guān)于CRISPR 技術(shù)),也是基因編輯倫理學(xué)的一位思想領(lǐng)袖。她與埃馬紐埃爾·卡彭蒂耶(Emmanuelle Charpentier)分享了2020 年諾貝爾化學(xué)獎(jiǎng)。張鋒是美國(guó)麻省理工學(xué)院和哈佛大學(xué)伯德研究所的生物化學(xué)家、神經(jīng)科學(xué)家。張鋒第一個(gè)成功將CRISPRCas9 應(yīng)用于哺乳動(dòng)物細(xì)胞。張鋒持續(xù)完善這套工具,推動(dòng)CRISPR 技術(shù)廣泛應(yīng)用,獲得了專(zhuān)利權(quán)。基因編輯領(lǐng)域普遍認(rèn)為杜德納在CRISPR 研究中做出了一定的奠基和開(kāi)拓貢獻(xiàn),而張鋒是推動(dòng)CRISPR 技術(shù)廣泛應(yīng)用的最主要貢獻(xiàn)者之一。
根據(jù)表4 全作用情況的CRISPR 主題(技術(shù)主題8)計(jì)算結(jié)果,兩位學(xué)者的研究工作都對(duì)CRISPR主題的發(fā)展產(chǎn)生了巨大影響,為所有學(xué)者平均水平的1700~1800 倍,杜德納稍高于張鋒。觀察子主題以及改進(jìn)技術(shù)主題(技術(shù)主題5~7、技術(shù)主題9 和技術(shù)主題10),張鋒的影響高于杜德納。顯然兩位學(xué)者呈現(xiàn)了不同特征,張鋒對(duì)CRISPR 研究的影響主要優(yōu)勢(shì)在于子技術(shù)主題和改進(jìn)技術(shù)主題的相關(guān)研究,而對(duì)前期研究和基礎(chǔ)性研究的影響相對(duì)較小。杜德納雖在子技術(shù)主題和改進(jìn)技術(shù)主題上的影響力略低于張鋒,但影響優(yōu)勢(shì)更全面。
從表4 的開(kāi)創(chuàng)作用情況可以發(fā)現(xiàn),兩人對(duì)CRISPR 的開(kāi)創(chuàng)階段都沒(méi)有影響;在子技術(shù)主題和改進(jìn)技術(shù)主題的開(kāi)創(chuàng)階段,杜德納的影響優(yōu)勢(shì)較顯著,體現(xiàn)了她的研究有利于推動(dòng)領(lǐng)域創(chuàng)新性研究主題的開(kāi)創(chuàng)。這也印證了學(xué)界對(duì)杜德納在CRISPR 研究領(lǐng)域一定的奠基性貢獻(xiàn)的認(rèn)可。
從表4 的引導(dǎo)作用情況可以發(fā)現(xiàn),杜德納對(duì)于CRISPR 技術(shù)研究的增長(zhǎng)并進(jìn)入熱度高位期具有顯著影響,包括子技術(shù)主題和改進(jìn)技術(shù)主題。這說(shuō)明杜德納對(duì)學(xué)科發(fā)展的引導(dǎo)作用較強(qiáng),能夠促進(jìn)學(xué)科具有潛力的發(fā)展方向成為學(xué)科的熱點(diǎn);而張鋒學(xué)者則缺乏這方面的體現(xiàn)。
從表4 的促進(jìn)作用情況可以發(fā)現(xiàn),兩位學(xué)者都對(duì)CRISPR 保持高位熱度具有很大的影響,但張鋒對(duì)CRISPR 高位繁榮的促進(jìn)作用顯著強(qiáng)于杜德納。這也印證了學(xué)界對(duì)張鋒在CRISPR 技術(shù)廣泛應(yīng)用方面的貢獻(xiàn)的認(rèn)可。
從表4 的支撐作用情況可以發(fā)現(xiàn),張鋒的影響優(yōu)勢(shì)在于對(duì)改進(jìn)的CRISPR 技術(shù)主題的支撐作用,而杜德納的影響優(yōu)勢(shì)在于對(duì)CRISPR 技術(shù)主題的支撐作用。
綜上所述,兩位學(xué)者呈現(xiàn)了兩種不同的影響模式。張鋒學(xué)者是一種以促進(jìn)作用為主的影響模式,能夠促進(jìn)CRISPR 研究的繁榮與廣泛應(yīng)用,并在后期支撐改進(jìn)型技術(shù)的研究發(fā)展。杜德納是一種以開(kāi)創(chuàng)作用、引導(dǎo)作用與支撐作用為主的影響模式,體現(xiàn)了較強(qiáng)的奠基性、引領(lǐng)性特點(diǎn),能夠促進(jìn)基因編輯領(lǐng)域創(chuàng)新性研究主題的誕生,引領(lǐng)學(xué)科具有潛力的發(fā)展方向和前沿成為學(xué)科熱點(diǎn),較全面地支撐CRISPR 的相關(guān)研究。
本文提出的頂尖學(xué)者研究動(dòng)態(tài)對(duì)學(xué)科發(fā)展影響的計(jì)量模型能夠量化學(xué)者對(duì)學(xué)科發(fā)展的影響,并判別具體影響類(lèi)型。基因編輯領(lǐng)域所呈現(xiàn)的分析結(jié)果與該領(lǐng)域的現(xiàn)實(shí)情況較為符合,說(shuō)明本文的模型方法具有一定可靠性。
研究結(jié)論主要體現(xiàn)在3 個(gè)方面。
其一,與所有學(xué)者相比,頂尖學(xué)者對(duì)學(xué)科發(fā)展的影響非常顯著,在基因編輯領(lǐng)域最明顯的體現(xiàn)是:推動(dòng)CRISPR 系統(tǒng)成為最主流的基因編輯技術(shù)研究主題,實(shí)現(xiàn)了技術(shù)研究的迭代。之后在改進(jìn)的技術(shù)主題的研究下,當(dāng)前的頂尖學(xué)者群體影響力的相對(duì)優(yōu)勢(shì)有所減弱。
其二,對(duì)于學(xué)科發(fā)展來(lái)說(shuō),頂尖學(xué)者與所有學(xué)者相比,一是對(duì)領(lǐng)域的創(chuàng)新性研究主題具有顯著的影響,能夠引領(lǐng)學(xué)科的發(fā)展方向和前沿;二是論文成果對(duì)領(lǐng)域的長(zhǎng)期支撐作用優(yōu)勢(shì)顯著。并且隨著研究不斷發(fā)展,這兩個(gè)顯著的影響優(yōu)勢(shì)可以得到較好的保持。
其三,基于本文提出的計(jì)量模型,實(shí)證中發(fā)現(xiàn)兩位典型學(xué)者的研究結(jié)果與現(xiàn)實(shí)基本符合。本文發(fā)現(xiàn)兩位學(xué)者呈現(xiàn)了兩種不同的影響模式:以促進(jìn)作用為主的影響模式,以開(kāi)創(chuàng)作用、引導(dǎo)作用與支撐作用為主的影響模式。
綜上所述,本文的研究方法與研究結(jié)論在揭示頂尖學(xué)者研究動(dòng)態(tài)對(duì)學(xué)科發(fā)展的影響、探索頂尖學(xué)者不同的影響模式及特征等方面都具有一定的理論價(jià)值與研究意義。同時(shí),本文提供了一種可以觀察頂尖學(xué)者不同影響模式的方法,為人才評(píng)價(jià)工作提供更豐富的信息,有助于面向不同評(píng)價(jià)任務(wù)和評(píng)價(jià)目的改善人才評(píng)價(jià)工作。此外,也有助于預(yù)測(cè)并把握一個(gè)學(xué)科領(lǐng)域的發(fā)展階段與趨勢(shì)。
后續(xù)研究可以從兩個(gè)方面進(jìn)行改進(jìn):①本文選擇了基因編輯領(lǐng)域開(kāi)展實(shí)證研究,是考慮到基因編輯領(lǐng)域作為一個(gè)新興學(xué)科領(lǐng)域,有其知識(shí)更迭快和階段革命特征明顯的特點(diǎn),但還應(yīng)考慮到不同學(xué)科具有不同的特點(diǎn),本文的方法、結(jié)論及規(guī)律不能簡(jiǎn)單地泛化,需要進(jìn)一步研究。②本文使用引用情況來(lái)表征影響,未來(lái)可以深入文本和語(yǔ)義層面來(lái)表征影響,以使本文提出的模型更為完善,結(jié)果更為準(zhǔn)確。