[作者單位]南京航空航天大學(xué)圖書館,江蘇 南京 211106
ESI(Essential Science Indicators)是基于SCI和SSCI的衡量科學(xué)研究績(jī)效、跟蹤科學(xué)發(fā)展趨勢(shì)的重要分析評(píng)價(jià)工具[1-2]。ESI高被引論文是各學(xué)科領(lǐng)域被引頻次最高的前1%的論文,是國(guó)內(nèi)外公認(rèn)的高水平研究成果,因此ESI高被引論文數(shù)已成為一流學(xué)科的重要評(píng)估指標(biāo)之一。本文以ESI高被引論文為切入點(diǎn),探索近10年來全球范圍內(nèi)圖情學(xué)科的發(fā)展情況,為我國(guó)圖情學(xué)科的發(fā)展提供參考。
學(xué)術(shù)界早已認(rèn)識(shí)到ESI高被引論文的研究?jī)r(jià)值,并已對(duì)材料學(xué)[3-4]、醫(yī)學(xué)[5-6]等學(xué)科的ESI高被引論文進(jìn)行了計(jì)量分析。目前尚未見有學(xué)者對(duì)圖情學(xué)科的ESI高被引論文進(jìn)行研究。
以往對(duì)ESI高被引論文的研究往往是從期刊、機(jī)構(gòu)、作者等文獻(xiàn)的外部特征入手,較少深入到論文的內(nèi)容層面。ESI高被引論文代表著各學(xué)科領(lǐng)域的研究熱點(diǎn)與前沿,對(duì)其內(nèi)容進(jìn)行分析無疑對(duì)明確學(xué)科發(fā)展方向有重要意義。因此,本文不僅對(duì)圖情學(xué)科ESI高被引論文的數(shù)量特征進(jìn)行了分析,還對(duì)其內(nèi)容特征進(jìn)行深入挖掘。
本文數(shù)據(jù)來源于Web of Science(WOS)核心合集。首先在WOS核心合集中檢索圖情領(lǐng)域的研究論文,檢索式為WC=“Information Science & Library Science”,共得到405 296篇文獻(xiàn);然后在檢索結(jié)果頁面中選擇“ESI精煉”,將檢索結(jié)果中的高被引論文篩選出來,共得到圖情領(lǐng)域的ESI高被引論文356篇。ESI的統(tǒng)計(jì)數(shù)據(jù)以10年為1個(gè)周期,每?jī)蓚€(gè)月滾動(dòng)更新一次,本文檢索時(shí)間為2016年4月20日,檢索到的ESI高被引論文時(shí)間跨度為2005-2015年。
本文從數(shù)量特征和內(nèi)容特征兩個(gè)層面對(duì)圖情學(xué)科的ESI高被引論文進(jìn)行分析。
數(shù)量特征分析著眼于ESI高被引論文的被引頻次、國(guó)家分布和機(jī)構(gòu)分布,并對(duì)機(jī)構(gòu)ESI高被引論文數(shù)與h指數(shù)進(jìn)行相關(guān)分析,為評(píng)估我國(guó)高校圖情學(xué)科的發(fā)展提供參照。
內(nèi)容特征分析從構(gòu)建引文網(wǎng)絡(luò)入手,提取356篇ESI高被引論文間的引用關(guān)系,利用社會(huì)網(wǎng)絡(luò)分析工具Ucinet對(duì)引文網(wǎng)絡(luò)進(jìn)行可視化,然后用Pajek對(duì)引文網(wǎng)絡(luò)進(jìn)行主路徑分析。主路徑分析首先計(jì)算每個(gè)研究起點(diǎn)(最初發(fā)表的文獻(xiàn))指向每個(gè)終點(diǎn)(最新發(fā)表的文獻(xiàn))的所有途徑,然后計(jì)算每個(gè)節(jié)點(diǎn)(文獻(xiàn))或邊(引用關(guān)系)位于的路徑條數(shù)。這個(gè)數(shù)值被稱為遍歷計(jì)數(shù),通過歸一化處理后得到相應(yīng)的權(quán)值,稱為遍歷權(quán)值。遍歷權(quán)值是每條邊在引文網(wǎng)絡(luò)中重要性的體現(xiàn),其最高的路徑即為主路徑。通過對(duì)大型網(wǎng)絡(luò)的主路徑分析可以實(shí)現(xiàn)海量數(shù)據(jù)的降維處理,從而得到領(lǐng)域演化的基本骨架[7]。董克等人[8]采用主路徑分析篩選出了對(duì)網(wǎng)絡(luò)計(jì)量學(xué)領(lǐng)域發(fā)展延續(xù)最重要的文獻(xiàn),韓毅[9]利用主路徑算法識(shí)別出國(guó)外知識(shí)管理領(lǐng)域發(fā)展的脈絡(luò)。本文通過主路徑分析識(shí)別ESI高被引論文中的重要文獻(xiàn),進(jìn)而探索其研究?jī)?nèi)容發(fā)展演化的骨架結(jié)構(gòu)。
2.1.1 被引頻次
對(duì)356篇ESI高被引論文的被引頻次進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)其最低被引頻次是4次,最高被引頻次是964次,平均每篇論文被引126次,50%的論文被引頻次不低于93次。圖情學(xué)科ESI高被引論文的最低被引頻次逐年下降,由2005年的142次降低到2015年的4次。
2.1.2 國(guó)家分布
對(duì)圖情學(xué)科ESI高被引論文的國(guó)家分布的分析結(jié)果顯示,美國(guó)ESI高被引論文共210篇,占總量的近60%,遙遙領(lǐng)先于其他各國(guó);荷蘭37篇;英國(guó)33篇;加拿大22篇;我國(guó)ESI高被引論文數(shù)為19篇,數(shù)量位居全球第五。將香港和臺(tái)灣地區(qū)的高校排除后,我國(guó)大陸地區(qū)的高校圖情學(xué)科僅有7篇ESI高被引論文。
2.1.3 機(jī)構(gòu)分布
通過Incites數(shù)據(jù)庫可獲得國(guó)內(nèi)外大學(xué)在圖情學(xué)科的論文數(shù)量、總被引頻次、h指數(shù)和ESI高被引論文數(shù)。ESI高被引論文數(shù)大于6篇的高校見表1。共有272所大學(xué)擁有圖情學(xué)科的ESI高被引論文,對(duì)這272所大學(xué)的h指數(shù)和ESI高被引論文數(shù)進(jìn)行相關(guān)分析,發(fā)現(xiàn)二者的Pearson相關(guān)系數(shù)r=0.671,p<0.01,二者呈顯著正相關(guān)。ESI高被引論文是機(jī)構(gòu)的高水平研究成果,h指數(shù)則反映機(jī)構(gòu)的整體研究水平,二者都是機(jī)構(gòu)科研實(shí)力的體現(xiàn),因而會(huì)有較強(qiáng)的相關(guān)性。
國(guó)內(nèi)共有280所高校的圖情學(xué)科論文被WOS(Web of Science)收錄,對(duì)各高校圖情學(xué)科的研究水平進(jìn)行分析,發(fā)現(xiàn)有7所高校發(fā)表了ESI高被引論文,有9所高校h指數(shù)大于10(表2)。
由于ESI高被引論文數(shù)和h指數(shù)的顯著相關(guān)性,北京大學(xué)、復(fù)旦大學(xué)等高校h指數(shù)較高,在國(guó)內(nèi)處于領(lǐng)先地位,有望在未來實(shí)現(xiàn)圖情學(xué)科ESI高被引論文零的突破。
從表1和表2,可以發(fā)現(xiàn),我國(guó)高校無論是ESI高被引論文數(shù)、h指數(shù)、WOS論文總數(shù)還是總被引頻次都遠(yuǎn)遠(yuǎn)落后于國(guó)外頂尖高校,我國(guó)圖情學(xué)科距離世界一流水平還有較遠(yuǎn)的距離。
表1 圖情學(xué)科ESI高被引論文>6篇的高校
表2 我國(guó)高校發(fā)表圖情學(xué)科ESI高被引論文發(fā)表情況
2.2.1 引文網(wǎng)絡(luò)的構(gòu)建
提取356篇ESI高被引論文相互間的引用關(guān)系,構(gòu)建引文網(wǎng)絡(luò),網(wǎng)絡(luò)密度為0.004。網(wǎng)絡(luò)中共有356個(gè)節(jié)點(diǎn),其中有79個(gè)節(jié)點(diǎn)為孤立節(jié)點(diǎn),表示有79篇論文與本數(shù)據(jù)集其他論文不存在引用或被引關(guān)系。刪除孤立節(jié)點(diǎn)后,共得到3個(gè)規(guī)模較大的子網(wǎng),共包含277個(gè)節(jié)點(diǎn)(圖1)。圖1中以論文編號(hào)、論文作者、發(fā)表年份作為節(jié)點(diǎn)標(biāo)簽,節(jié)點(diǎn)大小與其特征向量中心度成正比,箭頭方向從施引文獻(xiàn)指向被引文獻(xiàn)。
圖1 ESI高被引論文間的引用網(wǎng)絡(luò)
2.2.2 引文網(wǎng)絡(luò)的主路徑分析
對(duì)這3個(gè)子網(wǎng)分別進(jìn)行主路徑分析,得到3條引文網(wǎng)絡(luò)主路徑(圖2),每條主路徑都代表著圖情學(xué)科的一個(gè)核心研究方向。
圖2 引文網(wǎng)絡(luò)主路徑分析
2.2.2.1 主路徑1:h指數(shù)及其擴(kuò)展指標(biāo)研究
子網(wǎng)1有219篇節(jié)點(diǎn)文獻(xiàn),其中12篇構(gòu)成了該子網(wǎng)的主路徑。這一路徑由Bornmann、Egghe等專家主導(dǎo),關(guān)鍵節(jié)點(diǎn)文獻(xiàn)的內(nèi)容主要集中于h指數(shù)及其擴(kuò)展指標(biāo)的研究。
Batista[10]2006年提出了個(gè)人h指數(shù),基于篇均作者人數(shù)對(duì) h指數(shù)進(jìn)行標(biāo)準(zhǔn)化處理,為不同學(xué)科的作者比較提供了新思路。Braun[11]2006年擴(kuò)展了h指數(shù)的應(yīng)用范圍,將h指數(shù)應(yīng)用于對(duì)學(xué)術(shù)期刊影響力的評(píng)價(jià)。Cronin[12]2006年使用H指數(shù)測(cè)度了信息科學(xué)領(lǐng)域研究人員的學(xué)術(shù)影響力。Egghe[13]2006年建立了h指數(shù)的信息計(jì)量模型,提出了g指數(shù)[14],并于2010年對(duì)h指數(shù)的研究與應(yīng)用進(jìn)行了回顧[15]。 Bornmann[16]2007年回顧了學(xué)術(shù)界對(duì)h指數(shù)效度的研究,總結(jié)了h指數(shù)的優(yōu)勢(shì)和不足;2008年又對(duì)h指數(shù)做了進(jìn)一步完善,提出m指數(shù)[17]。到2011年,他又對(duì)h指數(shù)及其37種擴(kuò)展指標(biāo)的相關(guān)性進(jìn)行了Meta分析[18]。
Sidiropoulos[19]2007年指出了h指數(shù)的幾點(diǎn)不足,在h指數(shù)的基礎(chǔ)上提出了新的引用指標(biāo),并驗(yàn)證了其有效性。Harzing[20]2009年提出用Google Scholar作數(shù)據(jù)源測(cè)定期刊h指數(shù),比影響因子更能準(zhǔn)確地評(píng)估期刊的影響力。Waltman[21]2012年提出h指數(shù)不適合用于對(duì)科學(xué)家的整體學(xué)術(shù)影響力的評(píng)價(jià),并對(duì)能替代h指數(shù)的指標(biāo)進(jìn)行了討論。
對(duì)學(xué)術(shù)論文、期刊和科研人員的科學(xué)評(píng)價(jià)始終是學(xué)術(shù)界關(guān)注的焦點(diǎn),h指數(shù)及其擴(kuò)展指標(biāo)研究是圖情學(xué)科對(duì)學(xué)術(shù)界的重要貢獻(xiàn),對(duì)提高本學(xué)科影響力有著重要意義。
2.2.2.2 主路徑2:臨床決策支持系統(tǒng)研究
子網(wǎng)2有24篇節(jié)點(diǎn)文獻(xiàn),其中8篇構(gòu)成了該子網(wǎng)的主路徑,關(guān)鍵節(jié)點(diǎn)文獻(xiàn)的內(nèi)容集中于對(duì)臨床決策支持系統(tǒng)的研究。
Poissant 等人2005年分析了電子病歷對(duì)醫(yī)生和護(hù)士效率的影響[22]。Shah等人 2006年研究了電子藥物處方系統(tǒng),致力于提高該系統(tǒng)的接受度[23]。Campbell 等人2006年對(duì)臨床電子醫(yī)囑(CPOE)系統(tǒng)帶來的負(fù)面影響進(jìn)行了分類,并分析了產(chǎn)生負(fù)面影響的原因[24]。Kuperman等人 2007年在文獻(xiàn)回顧的基礎(chǔ)上,為醫(yī)療機(jī)構(gòu)、知識(shí)庫供應(yīng)商、政府部門和研究人員有效利用基于CPOE的臨床決策支持系統(tǒng)提出了相應(yīng)的建議[25]。Schedlbauer 等人2009年對(duì)電子藥物處方系統(tǒng)的有效性進(jìn)行了研究[26]。Ammenwerth 等人2008年研究了CPOE在減少用藥差錯(cuò)和藥物不良事件中的作用[27]。Jaspers等人分析了臨床決策支持系統(tǒng)對(duì)醫(yī)療人員效率和病人健康產(chǎn)出的影響[28]。Bell等人研究了基于藥物遺傳學(xué)檢測(cè)的臨床決策支持系統(tǒng),對(duì)該系統(tǒng)的研發(fā)、使用和效果評(píng)估進(jìn)行了介紹[29]。
2.2.2.3 主路徑3:醫(yī)學(xué)數(shù)據(jù)挖掘
子網(wǎng)3有20篇節(jié)點(diǎn)文獻(xiàn),其中12篇構(gòu)成了該子網(wǎng)的主路徑,關(guān)鍵節(jié)點(diǎn)文獻(xiàn)的內(nèi)容集中于醫(yī)學(xué)數(shù)據(jù)挖掘。值得注意的是,這12篇文獻(xiàn)均為2009年及以后發(fā)表,是近幾年圖情學(xué)科新興研究熱點(diǎn)與前沿之一。
電子病歷(Electronic medical records, EMR)產(chǎn)生于臨床治療過程,包含了大量與患者健康狀況密切相關(guān)的醫(yī)療知識(shí)[30],因而對(duì)電子病歷的臨床數(shù)據(jù)進(jìn)行分析和挖掘有著重要的應(yīng)用價(jià)值。主路徑3的節(jié)點(diǎn)文獻(xiàn)主要研究對(duì)電子病歷的數(shù)據(jù)挖掘,內(nèi)容可分為兩大類,一類是設(shè)計(jì)面向電子病歷的自然語言處理系統(tǒng)和知識(shí)挖掘系統(tǒng),另一類是直接研究醫(yī)學(xué)數(shù)據(jù)挖掘的算法。
Weber等人[31]2009年提出了衛(wèi)生研究信息網(wǎng)絡(luò)標(biāo)準(zhǔn),為面對(duì)建立臨床數(shù)據(jù)中心查詢工具的技術(shù)、管理和政策的挑戰(zhàn)提供參考。Murphy[32]2010年介紹了Informatics for integrating biology and the bedside(i2b2)項(xiàng)目,該項(xiàng)目旨在為研究者提供必要的工具,以整合醫(yī)療記錄和基因組學(xué)臨床研究數(shù)據(jù)。Hripcsak等人[33]2013年對(duì)下一代電子病歷系統(tǒng)的特征進(jìn)行了展望。Uzuner[34-35]2010年對(duì)面向臨床病歷藥物信息挖掘的自然語言處理系統(tǒng)進(jìn)行了統(tǒng)計(jì)分析,次年又探索了電子病歷中醫(yī)學(xué)概念的抽取,以及概念間關(guān)系的識(shí)別與聚類問題。Savova[36]、Xu Hua等人[37]2010年分別設(shè)計(jì)了臨床文本分析和知識(shí)挖掘系統(tǒng)(cTAKES)和自然語言處理系統(tǒng)——MedEx,并對(duì)系統(tǒng)的應(yīng)用情況進(jìn)行了評(píng)估。Nadkarni等人[38]2011年對(duì)自然語言處理技術(shù)和自然語言處理系統(tǒng)的設(shè)計(jì)進(jìn)行了綜述,展望了醫(yī)療界自然語言處理的未來發(fā)展。
Kho等人[39]2012年設(shè)計(jì)了一種專門的算法,用于對(duì)不同的電子病歷系統(tǒng)進(jìn)行數(shù)據(jù)挖掘,對(duì)2型糖尿病進(jìn)行了全基因組關(guān)聯(lián)研究。Carroll等人[40]2012年提出了一種算法,可從不同電子病歷系統(tǒng)中快速識(shí)別類風(fēng)濕性關(guān)節(jié)炎患者。Newton等人[41]2013年研發(fā)、實(shí)施并確認(rèn)了13種電子病歷挖掘算法的有效性。Tate等人[42]2014年探索了面向大規(guī)模電子病歷數(shù)據(jù)的快速檢索算法和直觀檢索界面。
主路徑2和主路徑3上的所有節(jié)點(diǎn)文獻(xiàn)全部發(fā)表于JournalofTheAmericanMedicalInformaticsAssociation。在Web of Science的學(xué)科分類中,這些文獻(xiàn)同時(shí)屬于醫(yī)學(xué)信息學(xué)(Medical Informatics)和圖情學(xué)科(Information Science & Library Science)。
我國(guó)圖情學(xué)科的ESI高被引論文數(shù)遠(yuǎn)遠(yuǎn)落后于美國(guó),大陸地區(qū)只有7所高校在圖情學(xué)科發(fā)表了ESI高被引論文(7篇),明顯少于國(guó)外一流名校,說明我國(guó)高校圖情學(xué)科離世界一流水平還相去甚遠(yuǎn)。
武漢大學(xué)、南京大學(xué)等是已經(jīng)具備較好學(xué)科基礎(chǔ)的高校,有望在近年產(chǎn)出更多的ESI高被引論文。由于機(jī)構(gòu)h指數(shù)和ESI高被引論文成顯著正相關(guān),北京大學(xué)、復(fù)旦大學(xué)、中山大學(xué)等高校圖情學(xué)科的h指數(shù)均已達(dá)到10以上,顯示出較高的科研水平,有望較快實(shí)現(xiàn)ESI高被引論文零的突破。國(guó)內(nèi)高校應(yīng)注重增強(qiáng)國(guó)際學(xué)術(shù)影響力,向世界一流學(xué)科靠近。
本文通過對(duì)引文網(wǎng)絡(luò)的主路徑分析得到了圖情學(xué)科的3個(gè)最受全球?qū)W者關(guān)注的核心研究方向——h指數(shù)及其擴(kuò)展指標(biāo)的研究、臨床決策支持系統(tǒng)研究、醫(yī)學(xué)數(shù)據(jù)挖掘。這3個(gè)研究方向集中了圖情學(xué)科大量高被引論文,是近10年圖情領(lǐng)域最受全球?qū)W者關(guān)注的研究方向,跟蹤其最新發(fā)展動(dòng)態(tài)可為國(guó)內(nèi)圖情學(xué)科進(jìn)一步凝練研究方向提供依據(jù)。Bornmann、Egghe等專家發(fā)表的多篇ESI高被引論文,對(duì)圖情學(xué)科各研究領(lǐng)域起著重要的引領(lǐng)作用,因此國(guó)內(nèi)高校應(yīng)加強(qiáng)與國(guó)外頂尖專家的合作交流。
國(guó)外圖情研究的一個(gè)顯著特點(diǎn)是用圖情的視角研究醫(yī)學(xué)領(lǐng)域的信息問題。與醫(yī)學(xué)信息學(xué)的學(xué)科交叉研究成效顯著,尤其臨床決策支持系統(tǒng)、醫(yī)學(xué)數(shù)據(jù)挖掘等研究方向都是醫(yī)學(xué)信息學(xué)與圖情學(xué)科交叉形成的研究領(lǐng)域,產(chǎn)出了多篇ESI高被引論文。這些交叉學(xué)科研究極大地拓展了傳統(tǒng)圖情研究的范圍,預(yù)計(jì)在今后一段時(shí)間內(nèi)仍會(huì)成為圖情學(xué)科的增長(zhǎng)點(diǎn),為圖情學(xué)科的創(chuàng)新發(fā)展與轉(zhuǎn)型起到重要的推動(dòng)作用。與國(guó)外相比,國(guó)內(nèi)圖情學(xué)科和醫(yī)學(xué)信息學(xué)的交叉融合尚未足夠深入,未來有著廣闊的發(fā)展空間。
中華醫(yī)學(xué)圖書情報(bào)雜志2016年10期