許建武 姜春林 丁堃
〔摘 要〕主要利用文獻(xiàn)計量學(xué)的方法,對科學(xué)計量學(xué)最高獎——普賴斯獎獲得者埃格赫(Leo Egghe)從學(xué)術(shù)生涯開始至今發(fā)表的論文進(jìn)行定量分析。對埃格赫發(fā)文的時間、領(lǐng)域、引文等方面做了詳細(xì)解讀,全面展示其在科學(xué)計量學(xué)的杰出成就和重要影響。
〔關(guān)鍵詞〕文獻(xiàn)計量學(xué);埃格赫;普賴斯獎
埃格赫(Leo Egghe)和魯索(R Rousseau),出于他們在科學(xué)計量學(xué)領(lǐng)域的杰出成就一同獲得2001年科學(xué)計量學(xué)界最高獎——普賴斯獎。埃格赫是比利時安特衛(wèi)普(Universitaier Instelling)的數(shù)學(xué)博士,現(xiàn)任比利時安特衛(wèi)普教授,比利時皇家圖書館館長,委員會成員,世界科學(xué)計量學(xué)和信息計量學(xué)委員會成員。埃格赫的研究主要涉及信息理論、引文分析、信息檢索、協(xié)作和合作理論、信息科學(xué)的數(shù)學(xué)模型等領(lǐng)域。他和弟子也是其親密的科研合作伙伴魯索合著的《情報計量學(xué)引論》(Introduction to Informetrics)早在1990年代就由中國科學(xué)技術(shù)文獻(xiàn)出版社翻譯出版,成為我國學(xué)術(shù)界了解國外科學(xué)計量學(xué)與信息計量學(xué)領(lǐng)域的重要文獻(xiàn)。
1984年埃格赫在林堡大學(xué)圖書館工作,出席并參加了世界40多個關(guān)于數(shù)學(xué)和信息科學(xué)計量學(xué)的重要學(xué)術(shù)會議。自從1987年他開始參加國際科學(xué)計量學(xué)和信息計量學(xué)會議,并擔(dān)任組委會成員。在比利時召開的第一次國際科學(xué)計量學(xué)和信息計量學(xué)會議上,他還是信息計量學(xué)方面的負(fù)責(zé)人。所謂文獻(xiàn)計量學(xué),“乃是把數(shù)學(xué)和統(tǒng)計方法應(yīng)用于研究圖書及其它的交流中介”,所謂科學(xué)計量學(xué),“乃是研究分析作為情報信息過程的科學(xué)的定量方法”[1]。埃格赫把以科學(xué)為計量單元的科學(xué)計量學(xué)拓展為研究領(lǐng)域更加寬廣的以信息為計量單元的信息計量學(xué),堪稱信息計量學(xué)奠基人。埃格赫博士已在數(shù)學(xué),信息計量,科學(xué)計量學(xué)領(lǐng)域的國際期刊上發(fā)表過許多的學(xué)術(shù)論文,他同魯索一起編輯了前兩部信息計量和科學(xué)計量學(xué)國際會議論文集。他還應(yīng)邀在計算機(jī)科學(xué)與技術(shù)百科全書和圖書館信息科學(xué)的百科全書上寫文章。其創(chuàng)辦的《Journal of Informertics》在短短幾年時間里,其影響因子已位居JCL中LIS學(xué)科的前3名。
埃格赫博士的研究工作主要集中在科學(xué)團(tuán)體的排名問題上。一般情況下是用算術(shù)平均數(shù)來解釋這個問題,但是埃格赫對于實體問題的研究,強(qiáng)烈建議采用幾何平均數(shù)。他研究了科學(xué)出版物的延遲和科學(xué)文獻(xiàn)的年齡分布上的問題,提出出版物與運營商之間的分布函數(shù)可以使用卷積函數(shù)。
埃格赫博士論著頗豐,無論是在專業(yè)科學(xué)研究領(lǐng)域,還是在向國家科技發(fā)展諫言獻(xiàn)策方面都給我們留下了一筆寶貴的財富。本文通過對埃格赫博士在學(xué)術(shù)生涯中發(fā)表在學(xué)術(shù)期刊上的學(xué)術(shù)論文進(jìn)行定量分析,梳理他在信息計量學(xué)和科學(xué)計量學(xué)方面做出的重要貢獻(xiàn)。
1 數(shù)據(jù)來源及方法
1.1 數(shù)據(jù)來源
為了全面反應(yīng)體現(xiàn)埃格赫的論文發(fā)表記錄,在本文的研究中,我們采用的數(shù)據(jù)庫是能夠反映國際學(xué)術(shù)論文記錄的美國Web of Science數(shù)據(jù)庫,其收錄了全世界出版的230個領(lǐng)域的9000多種核心期刊。Web of Science是美國Thomson Scientific(湯姆森科技信息集團(tuán))基于WEB開發(fā)的產(chǎn)品,是大型綜合性、多學(xué)科、核心期刊引文索引數(shù)據(jù)庫,包括三大引文數(shù)據(jù)庫科學(xué)引文索引(Science Citation Index,簡稱SCI)、社會科學(xué)引文索引(Social Sciences Citation Index,簡稱SSCI)和藝術(shù)與人文科學(xué)引文索引(Arts & Humanities Citation Index,簡稱A&HCI)和兩個化學(xué)信息事實型數(shù)據(jù)庫,以及科學(xué)引文檢索擴(kuò)展版、科技會議文獻(xiàn)引文索引和社會科學(xué)以及人文科學(xué)會議文獻(xiàn)引文索引3個引文數(shù)據(jù)庫,以ISI Web of Knowledge作為檢索平臺,覆蓋了全世界最重要、最有影響力的研究成果。
通過研究被SCI收錄的個人論文的時間分布,合作情況、引文數(shù)量,H指數(shù)等,能夠反映出科學(xué)家目前的研究現(xiàn)狀,研究能力和學(xué)術(shù)水平,是評價科學(xué)家學(xué)術(shù)能力和影響力的重要指標(biāo)。在WOS的檢索中,我們采用的“AU=Egghe L”檢索式,共得到186篇論文。在SCI中的論文搜索時間截止到2011年7月14日。
1.2 方 法
科學(xué)文獻(xiàn)通過引文形成了相互引證關(guān)系,構(gòu)成了具有內(nèi)在聯(lián)系的“文獻(xiàn)網(wǎng)”。所謂“引文分析”,就是以引用文獻(xiàn)為素材,通過分析“文獻(xiàn)網(wǎng)”的內(nèi)在結(jié)構(gòu),揭示文獻(xiàn)間的相互關(guān)系,研究科學(xué)文獻(xiàn)的動態(tài)規(guī)律,評價科技生產(chǎn)率[2]。引文分析屬于文獻(xiàn)計量學(xué)的范疇,是根據(jù)文獻(xiàn)間相互引證的關(guān)系及特點,運用數(shù)理統(tǒng)計、圖論、模糊數(shù)學(xué)等,對文獻(xiàn)的引用與被引用現(xiàn)象進(jìn)行分析,以揭示科學(xué)發(fā)展態(tài)勢的一種研究方法[3]。引文分析方法已被作為研究文獻(xiàn)利用規(guī)律、科學(xué)評價、科學(xué)預(yù)測和研究科學(xué)與社會的關(guān)系的重要手段[4]。引文分析的測度指標(biāo)很多,有引文量、引用率、影響因子,共引強(qiáng)度和耦合強(qiáng)度等[5]。
2 數(shù)據(jù)分析
2.1 科學(xué)產(chǎn)出
通過考察埃格赫科學(xué)產(chǎn)出的時間分布,可以大致了解他在不同時期研究的活躍情況。我們以論文的發(fā)表時間為橫軸,以每年發(fā)表的論文數(shù)量為縱軸,得出埃格赫的論文產(chǎn)出時間分布圖,圖1給出了1980-2010年間埃格赫先生一共186篇文章的時間分布情況,可以看出埃格赫先生發(fā)表論文數(shù)從開始學(xué)術(shù)生涯到現(xiàn)在一直處于上升階段,發(fā)表論文數(shù)出現(xiàn)了兩個高峰期,一個是1998-2002年間,另一個是2006-2010年間。
根據(jù)我們檢索出的186篇文章中,共有161篇article,7篇proceeding paper,4篇editorial material,5篇letter,3篇note,3篇CORRECTION和3篇book review。埃格赫是一個高產(chǎn)科學(xué)家。根據(jù)埃格赫每年的論文產(chǎn)出,我們可以了解他在不同時期的科學(xué)研究活動情況。研究發(fā)現(xiàn),埃格赫的研究在不同時期有不同的重點,并出現(xiàn)了兩個成果高峰期。在1990年代期間,埃格赫的研究主要集中在信息檢索和演化拓?fù)渖?,具有代表性的論文?《Generalized Success-Breeds-Success Principle Leading to Time-Dependent Informetric Distributions》、《A Theoretical Study of Recall and Precision Using a Topological Approach to Information Retrieval》;在2000年左右期間,他的研究主要是對科學(xué)文獻(xiàn)、出版物延遲等問題的關(guān)注上,《The influence of publication delays on the observed aging distribution of scientific literature》、《Methods for accrediting publications to authors or countries:Consequences for evaluation studies》;之后他的興趣逐漸轉(zhuǎn)移到H指數(shù)上,對于H指數(shù)的研究成為了他的主要研究方向,2006年發(fā)表在SCIENTOMETRICS上的《Theory and practise of the g-index》被引次數(shù)達(dá)到了206次。
他的研究領(lǐng)域主要集中在信息科學(xué)和圖書館學(xué)、計算機(jī)科學(xué)和信息系統(tǒng)這3個學(xué)科,幾乎囊括了他的大部分論文。他的許多論文都是涉及到多個學(xué)科,他最主要的貢獻(xiàn)是在對H指數(shù)的研究上,他在2006年發(fā)表在科學(xué)計量學(xué)上的《Theory and practise of the g-index》的這篇文章,總被引頻次達(dá)到了206次,年平均引用次數(shù)達(dá)到了31.33。在這篇文章中,埃格赫在分析h 指數(shù)評價效果時,提出了一種新的論文影響測度指標(biāo),即基于學(xué)者以往累積貢獻(xiàn)的g指數(shù),可以評價科研人員整體學(xué)術(shù)水平:一個科學(xué)家的分值為g,當(dāng)且僅當(dāng)在他/她發(fā)表的N篇論文中有g(shù)篇論文總共獲得了不少于g2次的引文總數(shù),而(g+1)篇論文總共獲得了少于(g+1)2次的引文總數(shù)。計算方法如下:將論文按照引文數(shù)從高到低的順序排列,g指數(shù)是引文累積數(shù)量大于等于排序位次平方的最大排序位次。埃格赫進(jìn)而研究了h指數(shù)與g指數(shù)相互轉(zhuǎn)換的影響。g指數(shù)打破了文獻(xiàn)總數(shù)的限制,對文獻(xiàn)產(chǎn)出少但被引頻次高的學(xué)者和機(jī)構(gòu)更為公正。g指數(shù)的提出,為h指數(shù)研究注入了活力。而他的其它關(guān)于H指數(shù)的文章的年平均引用次數(shù)也都很高。
2.2 科學(xué)合作
社會科學(xué)研究規(guī)模與研究難度的不斷增大,促使人們在社會科學(xué)研究組織中采用類似自然科學(xué)的工業(yè)化原則,形成了分工協(xié)作的研究模式。大科學(xué)時代科研合作的日趨頻繁,反映在科學(xué)論文中則表現(xiàn)為合著現(xiàn)象的越來越多,合著規(guī)模亦越來越大[6]。
表1是埃格赫的科研合作關(guān)系表,從中我們可以很清楚的看到埃格赫和魯索的合作關(guān)系最密切,這也許與兩人曾經(jīng)的師生關(guān)系和性格互補(bǔ)有關(guān)。從兩位比利時科學(xué)家1986年合作發(fā)表第一篇論文起,至今已發(fā)表了24篇合作論著。曾與魯索合作過的人很多,然而,除埃格赫,魯索與其他科學(xué)家合作的最高頻次僅為3。相比之下,埃格赫除魯索外,與其他科學(xué)家合作的最高頻次僅為5。與埃格赫合作的論著占魯索全部論著的31.7%,與魯索合作的論著占埃格赫全部論著的12.9%[7]。
從表中我們還可以發(fā)現(xiàn),埃格赫同多人有過學(xué)術(shù)合作,但合作的論文數(shù)都不是很多,他與另外兩個學(xué)生I.K.Ravichandra Rao和Christine Michel的合作論文數(shù)分別是5和2。值得的一提的是,埃格赫同我國學(xué)者梁立明教授有兩篇合著論文,分別是《Fundamental properties of rhythm sequences》和《A relation between h-index and impact factor in the power-law model》,這也是他關(guān)注中國同行的研究領(lǐng)域并與之學(xué)術(shù)交流的重要體現(xiàn)。
2001年7月,埃格赫和魯索雙雙走上普賴斯獎領(lǐng)獎臺。獲獎之后,二人分別發(fā)表了誠摯的致謝詞。發(fā)言中,他們都追溯了雙方合作的歷史,都稱對方是自己最好的合作伙伴。埃格赫是急性子,有時為某一新思路或新模型一天之內(nèi)給魯索打好幾次電話。魯索也極富創(chuàng)造性,但比較沉穩(wěn),往往為完善埃格赫尚不成熟的設(shè)想而夜以繼日地工作[7]??茖W(xué)合作使得兩人在學(xué)術(shù)研究上的互補(bǔ),在各自的研究中發(fā)揮了重要的作用。
2.3 引文分析
引文分析作為文獻(xiàn)計量學(xué)的重要研究方法,其有力工具就是引文索引。所謂引文索引(Citation Index)是一種以文獻(xiàn)之間的引用關(guān)系為基礎(chǔ)的文獻(xiàn)索引,即它以被引用文獻(xiàn)即引文為標(biāo)目,其下列出引用過該文獻(xiàn)的全部文獻(xiàn)(來源文獻(xiàn))的檢索工具[2]。引文分析方法已被作為研究文獻(xiàn)利用規(guī)律科學(xué)評價、科學(xué)預(yù)測和研究科學(xué)與社會的關(guān)系的重要手段。通過引文分析可以調(diào)查到論文作者是否與人合作,合作規(guī)模、程度如何對科研管理、圖書情報服務(wù)工作有很大啟發(fā)[8]。
根據(jù)檢索出的186篇文章,對其進(jìn)行被引,可以看到,埃格赫論文的被引總頻次是1 632,每篇平均引用次數(shù)達(dá)8.77。通過按被引頻次排列,被引頻次在30以上的論文有10篇,被引頻次在20以上的論文有18篇,其中《Theory and practise of the g-index》《The R- and AR-indices:Complementing the h-index》兩篇論文的被引頻次分別達(dá)到了188和104,年平均引用次數(shù)達(dá)31.33和20.80,都是和H指數(shù)有關(guān)的論文。
通過查看去除自引的引文報告,檢索到771篇文章,再通過分析檢索報告,可以得到771篇引文的時間分布圖(圖2)和引文的作者分布圖(圖3)。
從圖2中我們可以看出,埃格赫引文的數(shù)量在逐年增加,從上升的趨勢看,還有繼續(xù)增加的可能;尤其從2007年以后開始突然增加,分析埃格赫的論文不難發(fā)現(xiàn),在2006-2007年,埃格赫先后發(fā)表了《Theory and practise of the g-index》、《The R-and AR-indices:Complementing the h-index》、《An informetric model for the Hirsch-index》3篇論文,這3篇論文的被引頻次都非常高。從埃格赫引文的作者分布圖可以看出,ROUSSEAU、BURRELL、SCHREIBER等人排在前3位,尤其ROUSSEAU引用埃格赫的論文次數(shù)達(dá)到了28篇,這也從一個側(cè)面反映了他二人的科學(xué)合作關(guān)系。從圖4中可以看出,引用埃格赫論文的主要國家分布在美國、中國、英國、比利時等國家,這些國家最近幾年在科學(xué)計量學(xué)的研究方面也相當(dāng)活躍,對于埃格赫論文的引用也相當(dāng)頻繁。因此,埃格赫是一個具有廣泛國際影響力的科學(xué)家。
3 小 結(jié)
以上分析表明,埃格赫既是一個高產(chǎn)的科學(xué)家,也是一個具有廣泛國際影響力的科學(xué)家。埃格赫具有高尚的科學(xué)道德和為科學(xué)獻(xiàn)身的精神,通過持之以恒和扎實的工作,贏得了國際學(xué)術(shù)界的公認(rèn),他同魯索的科學(xué)合作關(guān)系被世人公認(rèn)為一個典范。他在科學(xué)計量學(xué)方面做出了杰出貢獻(xiàn),同時也為科學(xué)計量學(xué)的傳播做出了不凡功績。
參考文獻(xiàn)
[1]T·布勞溫.科學(xué)計量學(xué)與文獻(xiàn)計量學(xué)[J].趙紅州,蔣國華,譯.科學(xué)學(xué)與科學(xué)技術(shù)管理,1987,(9):45-46.
[2]張靜.引文、引文分析與學(xué)術(shù)論文評價[J].社會科學(xué)管理與評論,2008,(1):33-38.
[3]周云平,孫媛.我國引文分析研究現(xiàn)狀與21世紀(jì)發(fā)展趨勢[J].圖書情報工作,2001,(2):80-82,89.
[4]俞培果.論引文分析方法的發(fā)展[J].圖書情報工作,1995,(4):9-13.
[5]龐龍.科學(xué)引文分析的科學(xué)評價功能和意義[D].太原:山西大學(xué),2006.
[6]鐘旭,黃暉,薛健.中國社會科學(xué)期刊論文合著率指標(biāo)現(xiàn)狀及發(fā)展趨勢研究[J].情報學(xué)報,2000,(3):280-288.
[7]梁立明,侯長紅.科學(xué)合作與小國普賴斯獎獲得者共生現(xiàn)象[J].自然辯證法研究,2002,(6):61-64,82.
[8]思萌.引文分析法的作用、局限性及其改進(jìn)[J].圖書館建設(shè),1992,(6):17-20.
(本文責(zé)任編輯:馬 卓)