高 遐
(浙江理工大學圖書館,浙江 杭州 310018)
2015年國務(wù)院印發(fā)了《統(tǒng)籌推進世界一流大學和一流學科建設(shè)總體方案》[1],旨在推動我國高校進入世界前列,為我國高等教育建設(shè)引領(lǐng)航向。2017年9月,教育部、財政部、國家發(fā)展改革委研究并報國務(wù)院批準,公布了“雙一流”建設(shè)高校及建設(shè)學科名單[2],其中包括一流大學建設(shè)高校42所、一流學科建設(shè)高校95所,進一步為我國高校建設(shè)做出了明確部署。世界一流大學的建設(shè)需要以一流學科建設(shè)為基礎(chǔ),因此選擇恰切的學科布局及其戰(zhàn)略顯得尤為關(guān)鍵。
基于國際視野的學科評價無疑是學科建設(shè)中的重要環(huán)節(jié),而基本科學指標數(shù)據(jù)庫(Essential Science Indicators,ESI)是當前世界范圍內(nèi)普遍用以評價學術(shù)機構(gòu)、國家或地區(qū)學術(shù)水平及影響力的重要工具。ESI是由美國科睿唯安科技信息集團(原湯森路透公司)推出的基準評價數(shù)據(jù)庫,根據(jù)研究主題劃分了22個學科領(lǐng)域,其數(shù)據(jù)來源為近十年Web of Science(WoS)數(shù)據(jù)庫核心合集(SCIE/SSCI)中收錄的學術(shù)論文(論文類型為Article和Review)[3],主要通過論文被引頻次、論文數(shù)、篇均被引頻次等指標,分別對國家、機構(gòu)、期刊、研究員的學術(shù)水平進行分析。近年來,InCites數(shù)據(jù)庫作為ESI數(shù)據(jù)庫的輔助和補充,也受到了廣泛關(guān)注和應(yīng)用。InCites數(shù)據(jù)庫是科睿唯安科技信息集團在匯集和分析WoS數(shù)據(jù)庫(SCIE/SSCI/A&HCI)引文數(shù)據(jù)基礎(chǔ)上建立起來的科研評價工具,能綜合各種計量指標,具有全面的數(shù)據(jù)資源、多元化的指標體系和豐富的可視化效果[4-5]。許多學者都利用ESI與InCites數(shù)據(jù)庫,研究學科分布結(jié)構(gòu)、學科發(fā)展模式、學科校際布局等,為高校的學科建設(shè)提供理論基礎(chǔ)和數(shù)據(jù)支撐。董政娥等[6]基于ESI和InCites數(shù)據(jù)庫引文分析,引入學科區(qū)位商,在跟蹤其ESI學科以及高被引論文、熱門論文和頂尖論文的基礎(chǔ)上,探討圖書館支持高校學科評價和管理決策等方面的服務(wù)模式。王婧等[7]以ESI數(shù)據(jù)庫高水平論文數(shù)據(jù)為基礎(chǔ),從地區(qū)分布、科研競爭力、研究領(lǐng)域、區(qū)域合作等多角度對我國各地區(qū)的“雙一流”及非“雙一流”高校進行計量分析,建議高校根據(jù)自身特色針對性發(fā)展特色學科、差別化建設(shè)。鄧小茹[8]采用Incites數(shù)據(jù)庫和ESI數(shù)據(jù)庫,通過對國家自然科學基金項目的資助發(fā)文情況進行耦合分析,尋找近年的熱點研究方向、某機構(gòu)或某學科的研究優(yōu)勢,挖掘出其最熱或最具優(yōu)勢的課題定位,提升“雙一流”學科建設(shè)中的“暗數(shù)據(jù)”可視綜合情報分析能力。本文對ESI與InCites數(shù)據(jù)庫在學科建設(shè)中的研究進展動態(tài)進行分析梳理,以期能通過完整、及時、客觀、直觀的數(shù)據(jù)分析,揭示其動態(tài)和熱點,為高校學科建設(shè)提供一定的參考。
數(shù)據(jù)來源的可靠性與可獲取性是數(shù)據(jù)采集的重要因素,因此本文選取中國知網(wǎng)(CNKI)數(shù)據(jù)庫作為數(shù)據(jù)來源。本文中采用同源數(shù)據(jù)進行分析,以保證統(tǒng)計過程的針對性、準確性、可比性與累計性。數(shù)據(jù)檢索起止時間段設(shè)定為“不限”,通過“主題”與“篇名”兩種途徑,采用“ESI”“InCites”作為主要檢索詞,組配“學科”“評估”“評價”“發(fā)展”“高?!薄按髮W”“雙一流”“科研”“績效”“競爭力”“影響力”“優(yōu)勢”“高被引”等檢索詞(組配邏輯為“AND”)的方式進行檢索(檢索時間為2019年4月23日),經(jīng)過篩選去除與主題相關(guān)性不大的文獻,檢索得到475條期刊文獻信息。
本文利用SATI(Statistical Analysis Toolkit for Informetrics)分析有關(guān)我國ESI與InCites數(shù)據(jù)庫在學科建設(shè)中的應(yīng)用的論文的研究主體力量分布,主要包括論文發(fā)表核心著者、機構(gòu)、時序、期刊等。本文利用Citespace對有關(guān)我國ESI與InCites數(shù)據(jù)庫在學科建設(shè)中的應(yīng)用的論文進行關(guān)鍵詞共現(xiàn)聚類分析,得到可視化知識圖譜,采用的軟件版本為CiteSpace 5.2.R2,參數(shù)設(shè)置中時間跨度設(shè)置為2003—2019年,時間切片為1年,節(jié)點類型選擇關(guān)鍵詞,閾值選擇Top N 50,運行結(jié)果采用LLR算法提取聚類標簽。
論文的發(fā)表時間分布可以在一定程度上反映該領(lǐng)域?qū)W術(shù)研究的理論水平和發(fā)展進程[9]。近年間關(guān)于ESI與InCites數(shù)據(jù)庫在學科建設(shè)中的應(yīng)用的論文,其發(fā)表時間分布情況如圖1所示??梢?,該領(lǐng)域的研究文獻最早出現(xiàn)于2003年,隨后進入緩慢的增長階段,自2011年開始進入了第一個快速增長期,2013年論文數(shù)量達到第一個頂峰,而2014年略有下降,這一趨勢符合D.普賴斯的Logistic增長模式,第一個高峰過后論文的數(shù)量可能會趨于平緩,進入飽和期[10];但自2015年論文數(shù)量又恢復了增長,且增幅較大,這主要是由于2015年國務(wù)院提出了“雙一流”建設(shè),使基于ESI與InCites數(shù)據(jù)庫的學科建設(shè)成為新的研究熱點,且目前仍處于上升時期。這一變化趨勢表明人文社會科學的知識積累呈現(xiàn)出往復式的增長方式[11]。研究論文分布于185種期刊中,其中發(fā)表5篇以上文獻的期刊有25種,其發(fā)表論文數(shù)占全部論文的49.89%,呈現(xiàn)出較高的集中趨勢。載文量前三的期刊分別為《情報探索》《農(nóng)業(yè)圖書情報學刊》《現(xiàn)代情報》,核心刊物的出版主題主要為圖書情報與數(shù)字圖書館,并涉及出版、高等教育、管理學、基礎(chǔ)科學綜合等主題。
圖1 論文發(fā)表趨勢分布
利用SATI按第一作者統(tǒng)計了研究者的發(fā)文量,在檢索所得文獻中共有作者356名,發(fā)文量較高的作者(按第一作者統(tǒng)計)分布情況如表1所示。根據(jù)情報學家普賴斯的理論,核心作者為在某一研究領(lǐng)域進行持續(xù)的研究、且對該領(lǐng)域的研究者產(chǎn)生一定影響的作者[12],從定量的角度,核心作者發(fā)文量計算公式為:,其中:M核心作者最少發(fā)文篇數(shù);nmax為發(fā)文最多的作者論文篇數(shù)。計算可知,核心作者發(fā)文量M=3.669,即發(fā)文量在4篇以上的作者為核心作者。表2中前8位作者為核心作者群,主要分布在高校圖書館、信息管理系、高校發(fā)展規(guī)劃機構(gòu)與期刊編輯部等。其中,發(fā)文量最多的邱均平教授為我國著名情報學家和評價管理專家、文獻計量學的主要奠基人之一,成果豐富。
表1 發(fā)文量大于等于3篇的作者分布
利用SATI按照論文中作者的署名機構(gòu)統(tǒng)計了研究機構(gòu)的發(fā)文量,發(fā)文量大于或等于4篇的研究機構(gòu)分布如表2所示。統(tǒng)計的結(jié)果顯示,高校圖書館為主要研究機構(gòu),機構(gòu)排名依次為武漢大學中國科學評價研究中心、東華大學圖書館、南京航空航天大學圖書館、大連理工大學圖書館等。其中,邱均平教授所在的武漢大學中國科學評價研究中心在該研究領(lǐng)域的處于領(lǐng)先、權(quán)威地位。表2與表1的順序并不完全一致,主要由于有些機構(gòu)在該領(lǐng)域的發(fā)文量較大,形成了研究團隊,但每個作者相關(guān)論文較少;或有些作者在多個機構(gòu)任職,在不同論文中署名的第一機構(gòu)不完全相同。
表2 發(fā)文量大于等于4篇的機構(gòu)分布
關(guān)鍵詞反映了某研究領(lǐng)域在一定時間段內(nèi)的研究主題,將關(guān)鍵詞聚類并可視化,將幫助我們從整體上了解ESI與InCites數(shù)據(jù)庫在學科建設(shè)中應(yīng)用的研究主題分布。利用CiteSpace進行關(guān)鍵詞共現(xiàn)聚類分析,采用LLR算法對聚類命名,運行結(jié)果如圖2所示。CiteSpace依據(jù)網(wǎng)絡(luò)結(jié)構(gòu)和聚類的清晰度,提供了模塊值(Modularity Q,Q)和平均輪廓值(Mean Slihouette,S)兩個指標[13];模塊值為網(wǎng)絡(luò)模塊化評價指標,Q的取值區(qū)間為[0,1],當Q>0.3時得到的網(wǎng)絡(luò)社團結(jié)構(gòu)是顯著的;平均輪廓值是用來衡量網(wǎng)絡(luò)同質(zhì)性的指標,當S>0.5時聚類結(jié)果是合理的,當S值為0.7時,聚類是高效率令人信服的。本次運行結(jié)果中,Q=0.4077,S=0.721,可見通過關(guān)鍵詞共現(xiàn)聚類獲得的知識圖譜是合理的。
圖2 關(guān)鍵詞聚類知識圖譜
表3列出頻次大于20的關(guān)鍵詞信息。CiteSpace根據(jù)關(guān)鍵詞共現(xiàn)挖掘,可獲得的6大聚類,其中聚類標簽根據(jù)關(guān)鍵詞提取,標注數(shù)字代表聚類編號(Cluster ID),聚類編號越小,表示該聚類的經(jīng)典文獻數(shù)量越多,包含的節(jié)點數(shù)量越大[14];相似性(Slihouette)表示經(jīng)典文獻之間的相關(guān)程度,平均年份[Mean(Year)]可反映聚類中文獻的時效性[15]。6大聚類的平均年份分布于2013—2017年,具有較強的時效性,說明有關(guān)我國ESI與InCites數(shù)據(jù)庫在學科建設(shè)中的應(yīng)用在近年來得到了廣泛的關(guān)注。圖2顯示,6大聚類關(guān)系非常緊密,結(jié)合閱讀文獻,可以歸納出機構(gòu)科研競爭力評價、學科科研績效分析與發(fā)展趨勢預測、學科高被引論文計量分析與前沿研究三大研究主題。
表3 高頻關(guān)鍵詞信息
在“雙一流”建設(shè)背景下,應(yīng)用ESI及InCites數(shù)據(jù)庫的各項指標對機構(gòu)科研實力進行剖析,從而為機構(gòu)發(fā)展提供參考是目前研究的一大熱點。邱均平教授[16]提出了四個維度的綜合指標體系,包括科研生產(chǎn)力、科研影響力、科研創(chuàng)新力與科研發(fā)展力,具有權(quán)威影響。吳愛芝等[17]以文獻計量方法為基礎(chǔ),從多角度、多渠道對數(shù)據(jù)進行整合分析,開展學科競爭力評價方法的研究,形成一套合理的、可供推廣和復用的系統(tǒng)性評價方法和報告模式。許多學者運用ESI及InCites數(shù)據(jù)庫的指標對特定區(qū)域或集群高校或單一機構(gòu)的科研實力進行了分析。例如,徐娟[18]基于InCites數(shù)據(jù)庫,從發(fā)文數(shù)量、引用率、社會影響力、決策影響力四個角度,分析對比了我國高??蒲懈偁幜υ?981—2013年的變化趨勢;田稷等[19]選取中國中國大陸九校聯(lián)盟(China Nine,C9)及世界典型研究型大學聯(lián)盟為研究對象,基于信息計量學特征的統(tǒng)計與分析,探究世界一流研究型大學及其聯(lián)盟的整體概況和主要特征,揭示我國一流大學聯(lián)盟與國外一流大學聯(lián)盟的差距;閆文軒[20]利用ESI數(shù)據(jù)庫,從地域分布、論文量、被引頻次、高被引論文和熱點論文以及學科類別等方面,對入圍ESI的“985工程”高校學術(shù)影響力進行了分析;胡雯[21]基于ESI數(shù)據(jù)平臺建立了科研評價指標體系,以湖北省進入ESI排名的所有高校為研究對象,從各高校的論文產(chǎn)出角度來分析其科研競爭力現(xiàn)狀。這些研究成果在國家、地域、學科領(lǐng)域等不同層面,對科研機構(gòu)的實力進行分析比對,從而為其提供客觀的定位和合適的發(fā)展策略。
ESI根據(jù)研究主題劃分了22個學科領(lǐng)域,是否進入ESI世界排名前1%是衡量科研機構(gòu)學科實力的重要指標。基于ESI及InCites數(shù)據(jù)庫的各項指標識別優(yōu)勢學科,并進行跟蹤分析是圖書館學科服務(wù)的重點之一。蔣德鳳[22]采用Incites數(shù)據(jù)庫的連續(xù)數(shù)據(jù)對廣西大學ESI學科進行了動態(tài)性評價和持續(xù)追蹤分析;劉敏[23]以浙江省高校進入ESI全球前1%學科為研究對象,對2017年1月至11月的6期ESI數(shù)據(jù)進行計量分析,通過ESI指標來展現(xiàn)浙江省高校學科的發(fā)展現(xiàn)狀及趨勢。通過對學科的分析評價,判斷學科發(fā)展趨勢,預測潛力學科進入ESI世界前1%排名的可能性是當前一個重要應(yīng)用,可為學科培育方案提供參考。例如,侯志江[24]提出一種基于InCites數(shù)據(jù)庫直接獲得機構(gòu)排名信息的方法,繞過了被引頻次,獲得基于學科發(fā)展態(tài)勢的入圍ESI前1%的時間預測方法;董政娥等[25]采用ESI和InCites數(shù)據(jù)庫,在探討東華大學優(yōu)勢學科特征、高引用率論文、熱門論文和頂尖論文與學科發(fā)展關(guān)系分析的基礎(chǔ)上,對后續(xù)學科進入ESI世界前1%排名進行了預測;秦萍等[26]應(yīng)用灰色系統(tǒng)理論,依據(jù)InCites數(shù)據(jù)建立GM(1,1)模型,通過模型的擬合分析,預測未來若干年高校潛力學科高水平論文的發(fā)展趨勢,并進行了實證研究;蘇光耀[27]則對灰色GM(1,1)模型進行改進,形成等維遞補GM(1,1)模型,對高校潛勢學科的發(fā)展進行預測。
ESI的統(tǒng)計數(shù)據(jù)兩個月滾動更新一次,持續(xù)關(guān)注某學科領(lǐng)域的ESI高被引論文,有助于揭示該學科的研究現(xiàn)狀,跟蹤該學科領(lǐng)域的研究熱點與前沿,從而為科研人員提供研究方向和參考。周群等[28]提出一種基于學科前沿性的科研機構(gòu)評測方法,基于ESI中學科研究前沿的共被引關(guān)系,構(gòu)建研究前沿的共被引矩陣,利用VOSviewer生成學科研究前沿的全局知識圖譜,并以中國農(nóng)業(yè)大學為例進行實證分析。馬倩等[29]采用6期ESI數(shù)據(jù),分別從論文年份、學科和引文閾值的角度,分析全球高被引論文的整體動態(tài)、新增論文及剔除論文的變化特征,剖析全球高被引論文的動態(tài)變化現(xiàn)象和特征。許多學者針對某單一學科的高被引論文進行分析,試圖為該學科的發(fā)展做出總結(jié)與展望。例如,李曉紅[30]基于ESI對2002~2012年我國高被引化學類論文進行了分析研究,揭示了我國化學學科的分布及研究狀況;劉月雷等[31]利用ESI基本科學指標數(shù)據(jù)庫對2004—2014年地球科學領(lǐng)域的文獻進行了計量分析,通過對國家和地區(qū)、研究機構(gòu)、期刊、科學家、高被引論文、熱點論文、頂級論文、研究前沿、基線等各項指標統(tǒng)計分析,為我國地球科學領(lǐng)域研究提供參考;雷蕾[32]采用文獻計量方法分析了語言學領(lǐng)域的ESI高被引論文,從國際高質(zhì)量論文的視角,為語言學一流學科建設(shè)提供參考;張娜[33]對2006—2016年ESI計算機學科的高被引論文進行文獻計量研究,以了解和評價國際計算機學科目前的研究現(xiàn)狀、研究熱點和發(fā)展趨勢;李榮等[34]對婦產(chǎn)科學ESI高被引論文的數(shù)量特征和內(nèi)容特征進行分析,探索全球范圍內(nèi)婦產(chǎn)科學研究中最受關(guān)注的熱點與前沿,為我國婦產(chǎn)科學研究的發(fā)展提供借鑒。通過對學科高被引論文與前沿研究的分析,呈現(xiàn)出學科的知識結(jié)構(gòu)與布局,可以在研究領(lǐng)域的層次評價學科的科研競爭力,彌補單純采用文獻計量指標評價機構(gòu)科研績效的不足,具有重要的參考作用。
大數(shù)據(jù)時代,合理挖掘和利用ESI和InCites數(shù)據(jù)庫的各項指標與數(shù)據(jù),支持一流學科發(fā)展、建設(shè)一流高校是當前的主流趨勢。在高水平學科建設(shè)中,針對機構(gòu)科研競爭力、學科科研績效與發(fā)展趨勢、學科高被引論文與研究前沿等,圖情部門或發(fā)展規(guī)劃部門進行動態(tài)、定期跟蹤分析,對學科發(fā)展方向進行合理規(guī)劃,從而制定出合適的科研激勵政策是十分必要的,能夠有效提高其核心競爭力,也有利于獲得更多的政策與財政支持。不可忽視的是,科研活動和學科建設(shè)具有復雜性和多樣性,在運用ESI和InCites數(shù)據(jù)庫時,需要注意以下問題:(1)針對不同區(qū)域、不同類型、不同發(fā)展時期的高校,對學科建設(shè)標準進行動態(tài)調(diào)整,有針對性地選擇ESI 1%或ESI 1‰作為評價指標;(2)認識到ESI體系在學科分類上的局限性,合理使用包含包括ESI分類、Web of Science分類和中國國務(wù)院學位辦學科分類SCADC等學科分類體系的InCites數(shù)據(jù)庫,從一定程度上彌補ESI體系的局限性;(3)ESI從引文分析角度對科研績效進行評價,其數(shù)據(jù)沒有排除自引,導致有機構(gòu)或?qū)W者可能通過增加自引而提高排名;同時ESI數(shù)據(jù)沒有區(qū)分論文的第一作者和主要完成機構(gòu),對于參與完成研究的作者與機構(gòu)給予了相同的評價,導致評價結(jié)果的偏差,在學科建設(shè)中需要仔細甄別此類情況,而不能唯排名論;(4)“高被引”在一定程度上代表了科研成果的影響力,但并不完全等同于“高質(zhì)量”,對研究成果的評價還需要結(jié)合期刊的影響力、同行評議的結(jié)果等進行綜合評價;(5)在學科建設(shè)中,不僅僅要關(guān)注學術(shù)產(chǎn)出的水平和狀態(tài),也需要關(guān)注學科組織本體,并將學生滿意度、社會貢獻度等指標納入評價體系。綜上所述,研究者們需要綜合運用各項指標而非單一指標進行解析,注重樣本數(shù)據(jù)完整性、時效性,盡量客觀展現(xiàn)學科表現(xiàn)的全貌,進而選擇恰切的學科布局及戰(zhàn)略。