呂鵬輝, 邵建芳, 程 誠
(合肥工業(yè)大學(xué) a.管理學(xué)院;b.教育部過程優(yōu)化與智能決策重點實驗室;c.信息技術(shù)與工程管理研究所,合肥 230009)
面向科學(xué)技術(shù)創(chuàng)新的科學(xué)引文網(wǎng)絡(luò)研究
呂鵬輝a,b, 邵建芳a,c, 程 誠a,b
(合肥工業(yè)大學(xué) a.管理學(xué)院;b.教育部過程優(yōu)化與智能決策重點實驗室;c.信息技術(shù)與工程管理研究所,合肥 230009)
科學(xué)引文網(wǎng)絡(luò)是知識網(wǎng)絡(luò)以至知識管理領(lǐng)域發(fā)展最好的領(lǐng)域之一,這種科學(xué)知識網(wǎng)絡(luò)是知識管理專家基于科學(xué)文獻之間的相互引證關(guān)系總結(jié)出來的最早的一種知識網(wǎng)絡(luò)類型。文章首先回顧了科學(xué)引文網(wǎng)絡(luò)的發(fā)展史,隨后介紹了科學(xué)引文網(wǎng)絡(luò)的基本理論并總結(jié)了它的研究方法。最后,以我國自然科學(xué)領(lǐng)域為例進行了科學(xué)引文網(wǎng)絡(luò)的實證與應(yīng)用研究,即以我國發(fā)展最好學(xué)科的數(shù)據(jù),如材料學(xué)科中石墨烯領(lǐng)域2010年之前的數(shù)據(jù)為例繪制了科學(xué)引文網(wǎng)絡(luò),明顯發(fā)現(xiàn)了科技創(chuàng)新的路徑。同時根據(jù)引文網(wǎng)絡(luò)中文獻節(jié)點的冪律分布,以全球2004-2014年化學(xué)與材料科學(xué)有引用記錄的全部高質(zhì)量論文為例,繪制了科學(xué)引文網(wǎng)絡(luò),進行科技創(chuàng)新規(guī)律及創(chuàng)新路徑的發(fā)現(xiàn)。通過對來源于ISI的InCites數(shù)據(jù)庫的化學(xué)與材料科學(xué)的引文網(wǎng)絡(luò)特征的剖析,發(fā)現(xiàn)中國科學(xué)家論文有被引延遲現(xiàn)象,科學(xué)引文網(wǎng)絡(luò)知識圖譜說明中國科學(xué)研究目前仍處于自我提升的進程之中。
科技創(chuàng)新;引文網(wǎng)絡(luò);知識基礎(chǔ);知識結(jié)構(gòu)
在人類科技創(chuàng)新史上,科學(xué)引文網(wǎng)絡(luò)催生科技創(chuàng)新有毋庸置疑的著名先例,偉大如愛因斯坦這樣的科學(xué)家,如果沒有之前黎曼幾何作為基礎(chǔ),其相對論學(xué)說也無從誕生[1]??茖W(xué)史上縱然在1666年、1905年這樣的科學(xué)奇跡年,科學(xué)創(chuàng)新切實發(fā)生了,但之前的科學(xué)文獻對于后人的科學(xué)創(chuàng)新所起的作用依然不容小覷。
在科學(xué)知識的時間維度上,后出現(xiàn)的論文引用了先前發(fā)表的論文,則它們之間就在時間軸上產(chǎn)生了共現(xiàn)關(guān)系。但科學(xué)引文網(wǎng)絡(luò)在時間上須遵守先后次序,這種在時間軸上形成的共現(xiàn)現(xiàn)象對于科學(xué)知識的繼承和傳播的研究非常重要。本文所謂科學(xué)引文網(wǎng)絡(luò),實質(zhì)上是將論文本身(以TI字段代表)作為被引和施引對象來構(gòu)建引文網(wǎng)絡(luò)的,這是基于文獻在“篇”整體層面上的一種知識網(wǎng)絡(luò)。
對于未來的科學(xué)大數(shù)據(jù)研究來說,要全體不要抽樣、要效率不要精確、要相關(guān)不要因果,這種情況下知識共現(xiàn)網(wǎng)絡(luò)就能發(fā)揮大用。引文網(wǎng)絡(luò)這種知識網(wǎng)絡(luò)實質(zhì)上是V Bush所提的以文獻單元為實體的引文鏈接思想的一種實現(xiàn)[2],引文鏈接通過展示科學(xué)文獻中的內(nèi)容主題間的相互關(guān)聯(lián),揭示了科學(xué)研究之間承前啟后的內(nèi)在邏輯。
在科學(xué)引文網(wǎng)絡(luò)中,80%的引用指向38%的科學(xué)家[3],因此人類的最為巨大的科技創(chuàng)新是那些位居冪律之巔的科學(xué)偉人創(chuàng)造和引領(lǐng)的,大多數(shù)科學(xué)家可能只能跟在他們后面做一些跟隨型的研究。因此本文認為只要重點分析得到高被引20%的科學(xué)文獻,一個學(xué)科領(lǐng)域的主流和脈絡(luò)的大部分就能被認識和掌握了,這也是引文網(wǎng)絡(luò)對于學(xué)科主流知識的主要貢獻,并可以從知識圖譜中分析獲得。沿著這樣的科學(xué)引文網(wǎng)絡(luò)的主線和脈絡(luò),也可以迅速地厘清一個學(xué)科或者領(lǐng)域的科技創(chuàng)新歷程,因此,引文網(wǎng)絡(luò)在科學(xué)創(chuàng)新中亦能發(fā)揮其作用。
科學(xué)引文網(wǎng)絡(luò)是知識網(wǎng)絡(luò)領(lǐng)域甚至知識管理領(lǐng)域發(fā)展最早、最好的領(lǐng)域之一,論文之間的相互引用是目前研究的較為充分的一種引證關(guān)系,作者和作者團隊之間、機構(gòu)之間甚至國家之間的引用作為無形學(xué)院的有形痕跡[4],至今已經(jīng)形成完善的理論構(gòu)架和思路設(shè)計,是知識管理學(xué)科可向其他學(xué)科輸出的為數(shù)不多的方法之一。這種知識網(wǎng)絡(luò)是知識管理專家基于科學(xué)文獻之間的相互引證關(guān)系領(lǐng)悟出來的最早的一種知識網(wǎng)絡(luò)類型,對于這些引用和被引之間的研究更能獲得科學(xué)交流模式上的特征與規(guī)律,這是本文要對科學(xué)引文網(wǎng)絡(luò)繼續(xù)研究的主要目的之一。
1.引文網(wǎng)絡(luò)思想的發(fā)展歷程
早在1927年,P.L.K Cross進行了科技文獻研究史上第一次引文分析,他統(tǒng)計了化學(xué)專業(yè)的某些期刊論文的參考文獻并進行了綜合分析,據(jù)此得到了化學(xué)教育方面的核心期刊。由此開始,引文分析逐漸得到計量情報學(xué)家的重視。其后,加菲爾德(E Garfield)使用他創(chuàng)立的SCI數(shù)據(jù)庫,嘗試利用科學(xué)引證網(wǎng)絡(luò)來研究知識之間的傳承、發(fā)展的脈絡(luò)和結(jié)構(gòu),并開發(fā)了專門繪制引文網(wǎng)絡(luò)的在線軟件與工具。Price D在1965年發(fā)表的《科學(xué)論文的網(wǎng)絡(luò)》中正式提出了科學(xué)引文網(wǎng)絡(luò)的最初設(shè)想,在這種“引證網(wǎng)絡(luò)”中他首次發(fā)現(xiàn)了知識之間的關(guān)聯(lián)關(guān)系,并將其投射為二維網(wǎng)絡(luò)圖,其后的各種引文網(wǎng)絡(luò)研究基本都是基于這種關(guān)聯(lián)共現(xiàn)關(guān)系的一種應(yīng)用。PriceD還借助于物理統(tǒng)計的辦法對引文網(wǎng)絡(luò)的拓撲結(jié)構(gòu)及引用行為進行深入分析,并形成了引證過程中的經(jīng)典理論和研究前沿。
借助于生物學(xué)和醫(yī)學(xué)中的基因?qū)W說,英國著名遺傳學(xué)家道金斯還提出了思想基因?qū)W說,隨后被印度情報學(xué)家S.K Sen發(fā)展成為情報基因?qū)W說。我國學(xué)者劉植慧更是發(fā)展出了知識基因?qū)W說[5],該學(xué)說的基本思想體現(xiàn)為知識基因的遺傳與變異的交互運動,這些關(guān)于科學(xué)引文網(wǎng)絡(luò)學(xué)說的建立均是為了更好探明引文網(wǎng)絡(luò)背后的動力學(xué),目標(biāo)在于揭示科學(xué)知識增長的內(nèi)在機制,以及確立科學(xué)大廈的規(guī)律。
2. 引文網(wǎng)絡(luò)發(fā)展的前沿研究
沿著科學(xué)引文網(wǎng)絡(luò),人類的科學(xué)知識得到發(fā)展。數(shù)據(jù)、信息和知識的負熵值是不斷減小的,因此科學(xué)的進步也是一個信息熵值不斷減小的過程,該過程符合耗散理論的原理[6]。對于整個學(xué)科的引文網(wǎng)絡(luò),或者說引文網(wǎng)絡(luò)引導(dǎo)下的整個學(xué)科的發(fā)展方向的研究,是極為重要的問題。在科學(xué)引文網(wǎng)絡(luò)的研究方面,數(shù)據(jù)為其根本,深入挖掘可得到令人信服的研究結(jié)果;方法為其兩翼,長久發(fā)展可以令其飛的更遠[7]。論文之所以能被引,是因為被引文獻觸發(fā)了同行沿著該方向強烈而持久的研究動機[8],因此論文被引就是對于本身內(nèi)容一定的認可與發(fā)展。
科學(xué)引文網(wǎng)絡(luò)之所以能夠形成,從科學(xué)知識創(chuàng)新路徑的角度來看,一般是在一個學(xué)科領(lǐng)域的早期出現(xiàn)了原始的重大創(chuàng)新,從科學(xué)知識繼承和發(fā)展的角度來看,后來者縱然能做出更大的創(chuàng)新,也是因為他“站在了巨人的肩膀上”,因此引文網(wǎng)絡(luò)中大多數(shù)節(jié)點雖然未受關(guān)注,但不代表其對于學(xué)科的進步?jīng)]有貢獻。在科學(xué)引文網(wǎng)絡(luò)中,當(dāng)科學(xué)文獻被其后的論文引用時,知識就流向了施用文獻,因此從被引文獻到施用文獻的鏈接就可以作為一種主要路徑來進行研究,以識別科學(xué)發(fā)展的主要路徑。然而在一個大型引文網(wǎng)絡(luò)中,要想沿著這樣的思路跟蹤一個學(xué)科領(lǐng)域主要思想的流變殊為不易,因此一種更為簡化的方法就是識別其“主路徑”,Hummon等人已經(jīng)將此方法應(yīng)用在中心性產(chǎn)出的文獻引文網(wǎng)絡(luò)中,之后該方法還被從諸如轉(zhuǎn)化醫(yī)學(xué)科學(xué)文獻的引文網(wǎng)絡(luò)移植到燃料電池的專利引文網(wǎng)絡(luò)中。
3.引文網(wǎng)絡(luò)創(chuàng)新的研究誤區(qū)
對于科學(xué)引文網(wǎng)絡(luò)的圖譜指向,不管是以代數(shù)形式還是拓撲網(wǎng)絡(luò)表示,科學(xué)引文作為一種典型的有向非循環(huán)網(wǎng)絡(luò)(Directed acylic networks),在圖論中簡稱DAG,也就是在這樣的網(wǎng)絡(luò)中,知識的傳遞路徑是有著明確指向的[9],也就是時間反演不對稱,這與其他類型的知識網(wǎng)絡(luò)明顯不同。
然而目前在這樣一個高度成熟和發(fā)展的理論基礎(chǔ)上,很多應(yīng)用和實證型研究工作甚至圖書情報領(lǐng)域的研究論文中,仍然沒有在時間序列上將這些節(jié)點排序起來,忽視時間序列使得引用失去明確指向,導(dǎo)致節(jié)點之間的鏈接要么是雙向的、要么是無方向的。如果引用關(guān)系在引文網(wǎng)絡(luò)中指向不明,只是將引文網(wǎng)絡(luò)當(dāng)作一個復(fù)雜網(wǎng)絡(luò)的對象研究,就失去了科學(xué)引文網(wǎng)絡(luò)的本來意義。
科學(xué)引文網(wǎng)絡(luò)可以實現(xiàn)知識轉(zhuǎn)移,即對原有科學(xué)知識是一次再利用過程,這項創(chuàng)新指標(biāo)可以由節(jié)點的知識轉(zhuǎn)移存量,以及節(jié)點的知識開放度來衡量[10]??茖W(xué)論文的被引可作為衡量論文價值的有形指標(biāo),比如沒有被引的論文會很快在知識汪洋中陷入沉寂。
本文主要研究科學(xué)引文網(wǎng)絡(luò)中知識轉(zhuǎn)移與擴散和傳播的規(guī)律,其中此處所指的知識主要指個人知識,科學(xué)引文網(wǎng)絡(luò)中的科學(xué)文獻節(jié)點的主要來源是科學(xué)家個人,而非其所在機構(gòu),所以不能被認定為組織知識。而科學(xué)引文網(wǎng)絡(luò)中包含了多種具體的創(chuàng)新模式與路徑,比如模仿創(chuàng)新的路徑就主要來自于科學(xué)引文知識網(wǎng)絡(luò)。
1. 科學(xué)引文網(wǎng)絡(luò)主要構(gòu)建辦法
一般情況下,我們將前后相繼的引文關(guān)系表達成時間的函數(shù),但事實上這種關(guān)系同樣也可以用矩陣的方式來表達,如果將論文本身編號后寫成一行,而將論文的參考文獻編號后寫成一列,矩陣的節(jié)點上表示引用次數(shù),那么這種二元引用矩陣同樣可以用來表現(xiàn)論文與參考文獻之間的關(guān)聯(lián)關(guān)系網(wǎng)絡(luò)[11],其方向?qū)⒂闪兄赶蛐小?/p>
引用矩陣與被引矩陣不同,同被引矩陣的行與列具有相同的含義,代表被引用的參考文獻、作者或期刊,而引用矩陣行與列具有不同的含義,代表不同類型的特征項共現(xiàn)矩陣:行表示引用特征項(citing entity),矩陣的列代表被引特征項(cited entity)。例如在期刊引用矩陣中,行代表引證期刊,列代表被引期刊。因為引用矩陣的行與列代表同一種特征項,但特征項類型不同,行是引用特征項,列是被引特征項;另外,大多數(shù)異共現(xiàn)矩陣是矩形陣,而文獻計量研究的引用矩陣基本是方陣。
2. 科學(xué)引文網(wǎng)絡(luò)一般創(chuàng)建流程
引文網(wǎng)絡(luò)出現(xiàn)以來,世界各國科學(xué)家陸續(xù)建立起包括期刊、專利、會議錄以及網(wǎng)絡(luò)文獻在內(nèi)的多種文獻之間的科學(xué)引文數(shù)據(jù)庫[12],并且其中的引文關(guān)系還可以跨庫構(gòu)建,形成了全球范圍內(nèi)的日趨完備的科學(xué)知識網(wǎng)絡(luò),其獲取流程如圖1所示,尤其要注意將文獻及其參考文獻同時下載下來存儲在本地數(shù)據(jù)庫里才能繼續(xù)構(gòu)建引文網(wǎng)絡(luò)。
圖1 科學(xué)引文網(wǎng)絡(luò)圖的一般獲取流程
Eugene Garfield早在2001年前后就開發(fā)了Histcite系列應(yīng)用軟件,這是一個可對大規(guī)模數(shù)據(jù)進行分析的在線工具,可對學(xué)科領(lǐng)域文獻進行引文時序分析,對于來源于SCI數(shù)據(jù)庫的數(shù)據(jù)分析得很好。當(dāng)然根據(jù)其他軟件也可以嘗試繪制科學(xué)引文網(wǎng)絡(luò),但是要避免本文1.3節(jié)中說所述的誤區(qū),避免失去科學(xué)引文網(wǎng)絡(luò)的本質(zhì)特色。
在科學(xué)引文數(shù)據(jù)庫中,一般包括引用(Citing)和被引(Cited)兩種關(guān)系,當(dāng)然這個區(qū)分主要還是以主體的不同視角而決定的,在學(xué)術(shù)界也被稱為后引(Backword Citation)和前引(Forword Citation),以引文網(wǎng)絡(luò)的視角來看,科學(xué)文獻引用的參考文獻一般被稱為引文,引用一篇科學(xué)文獻的文獻被稱為施引文獻(Citing Documents),在構(gòu)建科學(xué)引文網(wǎng)絡(luò)時要注意同時將文獻及其參考文獻下載下來才能構(gòu)建科學(xué)引文網(wǎng)絡(luò)。
3.引文網(wǎng)絡(luò)與創(chuàng)新路徑的發(fā)現(xiàn)
知識擴散是知識生產(chǎn)的核心環(huán)節(jié),對知識的傳承與創(chuàng)新起到了重要作用。引用是科研人員在撰寫科學(xué)文獻時的一種學(xué)術(shù)行為[13],也是知識擴散的表現(xiàn)形式之一,大量的引用關(guān)系構(gòu)成了引文網(wǎng)絡(luò),體現(xiàn)了知識擴散過程的持續(xù)性與復(fù)雜性,為研究知識擴散提供了方法與平臺[14]。通過后續(xù)發(fā)表的論文均引用前述論文,從而形成了一張科學(xué)引文網(wǎng)絡(luò)圖的同時也清晰指明了科技創(chuàng)新發(fā)展的創(chuàng)新流動路徑。
科學(xué)引文網(wǎng)絡(luò)中創(chuàng)新能力較強的那些節(jié)點一般都是知識存量大,對內(nèi)部、外部知識進行識別、捕捉、評價和消化并整合、利用和創(chuàng)造新知識的能力較強的節(jié)點??茖W(xué)引文網(wǎng)絡(luò)的拓撲次序是指引文網(wǎng)絡(luò)中由起點到終點的方向,引文網(wǎng)絡(luò)中的知識主要是從一個專家手中轉(zhuǎn)移到另一個專家之處,據(jù)此Nancy Dixon認為知識轉(zhuǎn)移包括遠轉(zhuǎn)移、近轉(zhuǎn)移、連續(xù)轉(zhuǎn)移、傳略轉(zhuǎn)移、專家轉(zhuǎn)移等類型[15]。
在科學(xué)引文網(wǎng)路中,如果將創(chuàng)新看成一種可以沿著網(wǎng)絡(luò)傳播和擴散的元素,那么這種創(chuàng)新和思想就會沿著知識網(wǎng)絡(luò)在人際中傳播,因為與樞紐節(jié)點連接的節(jié)點極多,一旦新的思想出現(xiàn),就會很快通過核心節(jié)點連接到網(wǎng)絡(luò)中的其他節(jié)點,這樣創(chuàng)新就迅速蔓延和傳播開來,這種情形下科技創(chuàng)新的效率較高。科學(xué)引文網(wǎng)絡(luò)同時也是一個動態(tài)網(wǎng)絡(luò)[16],另外,由于科學(xué)引文網(wǎng)絡(luò)是有向網(wǎng)絡(luò),根據(jù)巴拉巴西的研究結(jié)果,科學(xué)引文網(wǎng)絡(luò)也是具有四個核心區(qū)域的復(fù)雜網(wǎng)絡(luò),跟其他有向網(wǎng)絡(luò)一樣具有四大核心子集。
在這樣的復(fù)雜網(wǎng)絡(luò)中,位于某個學(xué)科領(lǐng)域之內(nèi)的所有論文之間的鏈接關(guān)系形成一個最大的連通網(wǎng)絡(luò),在這個連通網(wǎng)絡(luò)中任意節(jié)點之間互相可達,但網(wǎng)絡(luò)規(guī)模較??;另外有部分文獻是指向這個文獻集合的,他們是該連通網(wǎng)絡(luò)的參考文獻,形成了該領(lǐng)域的知識基礎(chǔ);還有一部分文獻是該集合中論文的施引文獻,他們是這個文獻集合的發(fā)展產(chǎn)物屬于學(xué)科前沿,跟隨這樣的文獻可以進入核心區(qū)域;最外層的文獻集合是較小規(guī)模網(wǎng)絡(luò),其中的文獻有引用關(guān)系,但未與核心節(jié)點有引用關(guān)系,自身形成一個孤島[17]。因此如果能夠預(yù)測到這些網(wǎng)絡(luò)的規(guī)模和結(jié)構(gòu),其特點也就能掌握了。
進入21世紀以來,在國家創(chuàng)新戰(zhàn)略和科技引領(lǐng)經(jīng)濟的政策推動下,中國科學(xué)家在科技界的成果數(shù)量持續(xù)上升。通過中國科學(xué)家群體的共同努力,自然科學(xué)一些主要領(lǐng)域成果數(shù)量提高很快,甚至一些學(xué)科的成果數(shù)量進入了全球最前列。
比如2014年度大陸地區(qū)(不包括港、澳、臺)發(fā)表的SCI收錄論文數(shù)為1 448 977篇,僅次于美國的3 578 524篇,但總被引次數(shù)少于美國、德國和英國,位居全球第四[18]。人民日報曾經(jīng)刊文指出,經(jīng)過多年大力發(fā)展,我國自然科學(xué)論文數(shù)雖然位居全球第二,但我國科技人員發(fā)表論文的總被引次數(shù)還比較靠后,且篇均被引次數(shù)低于世界平均值,有較大比例的論文為零被引論文,我國論文數(shù)量總量較高,但總被引次數(shù)較為落后。
在我國論文發(fā)表數(shù)量已經(jīng)邁入科學(xué)大國的同時,如何實現(xiàn)我國向科學(xué)強國轉(zhuǎn)變?如此之大的科學(xué)數(shù)據(jù)中又蘊含著怎樣的科學(xué)再創(chuàng)新規(guī)律?未來我國尤其是自然科學(xué)應(yīng)該如何布局和分配有限的科研經(jīng)費等等?這些問題的答案其實可以通過基于共現(xiàn)的科學(xué)引文網(wǎng)絡(luò)獲得,在科學(xué)大數(shù)據(jù)引文網(wǎng)絡(luò)的基礎(chǔ)上,通過數(shù)據(jù)挖掘就可以逐漸獲得上述問題的答案,找到未來我國科技創(chuàng)新的思路。
1.引文網(wǎng)絡(luò)中主節(jié)點對創(chuàng)新的啟示
從全球發(fā)文和高被引數(shù)據(jù)看,中國科學(xué)家入選人數(shù)越來越多,其中我國的材料科學(xué)表現(xiàn)最為突出;石墨烯領(lǐng)域又屬于近年來的熱點和重要研究方向,曾于2010年獲得了諾貝爾獎,在我國也是重要的研發(fā)方向之一,其應(yīng)用方向涉及多個具體行業(yè)及領(lǐng)域[19]。近五年(2010-2014)來,全球發(fā)表的石墨烯高端論文數(shù)已經(jīng)超過46 150篇。
本文以材料科學(xué)中的石墨烯領(lǐng)域數(shù)據(jù)繪制了該領(lǐng)域的科學(xué)引文網(wǎng)絡(luò),來通過知識網(wǎng)絡(luò)研究科技創(chuàng)新路徑。本文數(shù)據(jù)截止到2010年,即石墨烯獲諾貝爾獎之前,以WoS科學(xué)數(shù)據(jù)集為例繪制了石墨烯的科學(xué)引文網(wǎng)絡(luò),如圖2所示。
圖2 全球石墨烯科學(xué)引文網(wǎng)絡(luò)圖(部分)
該引文網(wǎng)絡(luò)顯示,在獲諾貝爾獎之前,1996年Nakada K發(fā)表于PRB(Physical Review B)上的論文(405#節(jié)點)一直引領(lǐng)著該領(lǐng)域的發(fā)展,其后是康斯坦丁·諾沃肖洛夫(Novoselov K.S)和安德烈·海姆Geim A.K師生發(fā)表于Science和Nature Materials上的論文(1674#和2524#節(jié)點)在科學(xué)引文網(wǎng)絡(luò)中影響最大,也正是他們師生摘取了諾貝爾獎的桂冠。這說明在引文網(wǎng)絡(luò)中不以時間早晚評價其影響力,我國物質(zhì)科學(xué)盡管起步較晚,但依然可能產(chǎn)生世界級高影響力的成果。
另外節(jié)點1945#、1946#在科學(xué)引文網(wǎng)絡(luò)中起到的作用也較大,這兩篇論文中都有華人科學(xué)家的貢獻,前者是來自英國的Jiang D,后者是來自美國的Zhang Y.B。這說明華人科學(xué)家創(chuàng)造能力同樣突出,但要正確引導(dǎo)和鼓勵,我國近年來出臺了多項科技政策吸引海歸科學(xué)家回國效力,就是基于這樣的一個考慮。石墨烯引文網(wǎng)絡(luò)中,從1674#、1945#到2524#節(jié)點就形成了這樣一條路徑,科學(xué)知識在這樣的節(jié)點上匯聚起來,對整個引文網(wǎng)絡(luò)又能產(chǎn)生較大影響,但目前我國科學(xué)家撰寫的綜述性論文還較少,沒有在國際科學(xué)界產(chǎn)生應(yīng)有影響[20]。
科技創(chuàng)新一方面依靠內(nèi)生,一方面也可以依靠外引,因為在引文網(wǎng)絡(luò)中這樣的樞紐節(jié)點發(fā)揮的示范和引領(lǐng)作用很大,能給我國科技帶來較高起點和更多創(chuàng)新[21]。在科學(xué)引文網(wǎng)絡(luò)中,關(guān)鍵節(jié)點對于引文網(wǎng)絡(luò)的前后連接作用很大,尤其是一些貢獻突出的關(guān)鍵性節(jié)點,會催生和引發(fā)后續(xù)的多個較大節(jié)點的誕生[22],科技創(chuàng)新在這樣的節(jié)點上容易誕生、傳播和擴散,這一點在本課題組之前多個研究工作中都取得了證明[23-24]。但如果這樣節(jié)點的相關(guān)工作申報了專利,就會對后續(xù)的應(yīng)用型科技創(chuàng)新產(chǎn)生一定人為影響[25],這也提醒我國科學(xué)家在科技創(chuàng)新的同時,也要重視對知識產(chǎn)權(quán)的保護,2015年國家出臺的《國務(wù)院關(guān)于關(guān)于深化體制改革加快實施創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略的若干意見》中有著這方面的明確要求,說明我國已經(jīng)根據(jù)引文網(wǎng)絡(luò)中的節(jié)點認識到了科學(xué)創(chuàng)新路徑發(fā)現(xiàn)的一些規(guī)律。
2. 引文網(wǎng)絡(luò)節(jié)點產(chǎn)出冪律分布規(guī)律
科學(xué)引文網(wǎng)絡(luò)是一種復(fù)雜網(wǎng)絡(luò),在科學(xué)引文網(wǎng)絡(luò)這樣的網(wǎng)絡(luò)中主要節(jié)點的中心度分布如果呈冪律分布,核心節(jié)點就會因此擁有比其他節(jié)點更大的發(fā)展優(yōu)勢[26]。如果在科學(xué)引文網(wǎng)絡(luò)中冪律開始占據(jù)統(tǒng)治地位的話,那么它的這種趨勢就會越來越強,也就是說冪律趨勢帶來的優(yōu)勢統(tǒng)治地位也會隨之越來越強[27]。
在科學(xué)引文網(wǎng)絡(luò)中,Price D等人發(fā)現(xiàn)網(wǎng)絡(luò)鏈接的度分布滿足負的冪律分布,根據(jù)數(shù)學(xué)上的證明,如果一個能夠描述兩種現(xiàn)象的冪律的冪指數(shù)不同的話,那么支配兩種現(xiàn)象的原理就有著本質(zhì)的不同。多年來美國位于科學(xué)引文的核心樞紐位置,從而憑借其科學(xué)技術(shù)優(yōu)勢在全球經(jīng)濟領(lǐng)域稱霸[28],這對未來中國科學(xué)的發(fā)展,將會產(chǎn)生不可低估的作用。
本文在WoS數(shù)據(jù)庫中收集了全球化學(xué)與材料科學(xué)2004年至2014年間發(fā)表有引用記錄的全部高質(zhì)量論文,并以這些論文的被引情況為例,來繪制其科學(xué)引文網(wǎng)絡(luò)。其中化學(xué)學(xué)科的高被引論文數(shù)為1 784 780篇,總被引次數(shù)為23 335 144次,篇均被引110次;材料科學(xué)高被引論文為769 456篇,總被引次數(shù)為7 678 818次,篇均被引9.98次。這些論文分別形成了其領(lǐng)域內(nèi)的科學(xué)引文網(wǎng)絡(luò),其中的主節(jié)點按照國別區(qū)分后,依據(jù)國家節(jié)點的中心度排名,并對數(shù)據(jù)取對數(shù)后如圖3所示,基本呈線性分布。
圖3 中國化學(xué)與材料科學(xué)引文網(wǎng)絡(luò)中心度
就這兩個中國科學(xué)論文數(shù)量已在全球居首的優(yōu)勢學(xué)科而言,其引文網(wǎng)絡(luò)的節(jié)點度分布規(guī)律是:在化學(xué)學(xué)科引文網(wǎng)絡(luò)里,中國依然處于非核心地位;在材料科學(xué)中,盡管已處于核心地位,但與位居其次的美國相比差距很小。在以冪律主導(dǎo)的樞紐節(jié)點的分布中,只有占據(jù)絕對優(yōu)勢,才能在全球科技領(lǐng)域具有話語權(quán)。
就科技創(chuàng)新而言,只有第一,沒有第二,如果一項科技成果創(chuàng)新性高則其被引率就會遠大于其他論文。因此在科學(xué)發(fā)展方面,擁有絕對數(shù)量和質(zhì)量的科技成果才能保證科學(xué)創(chuàng)新上的優(yōu)勢地位。根據(jù)科學(xué)引文網(wǎng)絡(luò)反映的規(guī)律來看,科學(xué)技術(shù)在自然競爭和發(fā)展條件下成果傾向于分布成冪律形式,并且這種趨勢還將繼續(xù)保持下去并獲得強者具有更強的先發(fā)優(yōu)勢,因此我國應(yīng)該抓住當(dāng)前的發(fā)展良機,繼續(xù)將學(xué)科優(yōu)勢的地位加強并鞏固下來,不要因為暫時的影響力不如他國或者尚未收到效果而因噎廢食,導(dǎo)致固步自封。
3. 中國科學(xué)家論文的被引延遲現(xiàn)象
在我國全球發(fā)表論文數(shù)量不斷攀升的同時,論文質(zhì)量卻受到了來自國內(nèi)外同行的一致質(zhì)疑[29],理由是這些年雖然我國發(fā)表的SCI論文數(shù)量上去了,但是被引數(shù)量卻并沒有相應(yīng)地居于全球最前列。然而,在論文數(shù)據(jù)迅速崛起的同時,論文被引沒有相應(yīng)跟上,該現(xiàn)象稱之為被引延遲,是一種科研成果發(fā)表中的正?,F(xiàn)象,因為被引需要時間,不是立刻可以看到效果的事情。
但國內(nèi)外同行的質(zhì)疑也對我國科學(xué)家努力提高論文被引提出了要求,因為畢竟論文的被引與科學(xué)創(chuàng)新休戚相關(guān),論文數(shù)量與被引上升有無規(guī)律可言呢?我國應(yīng)該沿著什么樣的路徑來引導(dǎo)未來科學(xué)的發(fā)展呢?
下文將對化學(xué)與材料科學(xué)的引文網(wǎng)絡(luò)特征做一剖析,數(shù)據(jù)來源于ISI的InCites數(shù)據(jù)庫,選擇InCites數(shù)據(jù)庫的學(xué)科影響力作為評價指標(biāo),因為它是以篇均被引次數(shù)為基礎(chǔ)、與全球平均水平相比的綜合評價指標(biāo)。根據(jù)中國國務(wù)院學(xué)位辦頒布的學(xué)科分類,學(xué)科門是最高父系統(tǒng),本節(jié)以中國國務(wù)院學(xué)位辦學(xué)科分類(SCADC)學(xué)科分類為依據(jù),考察我國自然科學(xué)整體被引情況的變化。
根據(jù)ISI的InCites數(shù)據(jù)庫數(shù)據(jù),中國在自然科學(xué)內(nèi)的學(xué)科影響力和國家影響力年度增長趨勢圖如圖4所示,中國篇均被引在近幾年才逐漸趕上世界平均水平,但增長趨勢較好,近十年來一直呈逐步上升趨勢。引用期增加后,中國的自然科學(xué)2006~2013年發(fā)文的影響力有不同幅度的提升,和美國的差距也有縮小,這表明近年來我國SCI發(fā)文量快速增長的同時,論文質(zhì)量也得到較大的提升。這提示我們適當(dāng)?shù)匮娱L引用期有助于對我國SCI論文進行更為合理的評價,因此被引暫時位居他國之后,不能代表當(dāng)前論文質(zhì)量欠佳,延長被引周期,從更長時間維度看我國自然科學(xué)論文的被引率會得到更公正的評價。
圖4 中國自然科學(xué)在全球的影響發(fā)展趨勢圖
本文基于科學(xué)文獻與參考文獻在時間上的共現(xiàn)關(guān)系重構(gòu)了科學(xué)引文網(wǎng)絡(luò)這種知識網(wǎng)絡(luò)類型,并對科學(xué)引文網(wǎng)絡(luò)的發(fā)展歷程和前沿發(fā)展方向作了回顧,在此基礎(chǔ)上重點論述了科學(xué)引文網(wǎng)絡(luò)的構(gòu)建辦法、創(chuàng)建流程和發(fā)展誤區(qū)等。最后總結(jié)了科學(xué)引文網(wǎng)絡(luò)的創(chuàng)新特征,比如引文網(wǎng)絡(luò)的知識擴散、知識傳播和知識繼承規(guī)律,這些規(guī)律對于我國目前對科技創(chuàng)新的吸收、利用和再創(chuàng)新將有所啟示。
本文還以中國自然科學(xué)尤其是目前發(fā)文數(shù)量居首的化學(xué)、材料科學(xué)等學(xué)科的數(shù)據(jù)做了實證研究,結(jié)果表明我國在材料科學(xué)、化學(xué)等的優(yōu)勢學(xué)科中,近年來在諸如石墨烯這樣的領(lǐng)域逐漸跟上主流但仍需根據(jù)引文網(wǎng)絡(luò)揭示的一些規(guī)律調(diào)整自我發(fā)展戰(zhàn)略。上述兩個優(yōu)勢學(xué)科中國家成果數(shù)量與排名呈冪律分布,我國暫時被引落后僅僅是因為被引延遲,在物質(zhì)科學(xué)領(lǐng)域科學(xué)未來創(chuàng)新趨勢良好,目前仍需加強這種優(yōu)勢。
科學(xué)引文網(wǎng)絡(luò)對于我們的深刻啟示是知識的繼承與創(chuàng)新發(fā)展相結(jié)合,我國才能走出一條真正的自己的自強之路。在我國的科技強國戰(zhàn)略中,目前已經(jīng)有了引進、吸收、再創(chuàng)新的實踐,但有些領(lǐng)域做了,更多的領(lǐng)域還缺乏這種自發(fā)的實踐與能動的反饋。面對我國的現(xiàn)實國情,將更多的人力、物力、財力等有限的稀缺資源向跟蹤、學(xué)習(xí)、引進、吸收和轉(zhuǎn)化方向上傾斜,將是一條與國家現(xiàn)有條件相符的科學(xué)發(fā)展之路。
[1] 閻晨光,鄧明立. 黎曼的幾何思想及其對相對論的影響[J]. 科學(xué)技術(shù)與辯證法,2009,03:82-85+101+112.
[2] VANNEVAR B. As we may think (Reprinted)[J].Library Computing, 18(3):180-188.
[3] REN F X, SHEN H W, CHENG X Q. Modeling the clustering in citation networks[J]. Physica A-Statistical Mechanics, Its Applications ,2012,(391): 3533-3539.
[4] MOORE S, SHIELL A, HAWE P, HAINES, V.A. The privileging of communitarian ideas: Citation practices, the translation of social capital into public health research[J]. American Journal of Public Health,2005,(95): 1330-1337.
[5] 劉植惠. 知識基因探索[J]. 情報理論與實踐.,1998, (1): 62-64.
[6] HARMAN K, KOOHANG A, PALISZKIEWICZ J. Scholarly interest in gamification: a citation network analysis[J]. Industrial Management & Data Systems,2014, (114): 1438-1452.
[7] DAVID B T, FERNANDO J S, ITZIAR C M. Mapping the importance of the real world: The validity of connectivity analysis of patent citations networks[J]. Research Policy ,2011, (40):473-486.
[8] CSARDI G. Dynamics of citation networks[M]//In Artificial Neural Networks.ICANN 2006, Pt 1 (Kollias, S., et al., eds), 2006: 698-709.
[9] ROBINSON K A, DUNN A G, TSAFNAT G, GLASZIOU P. Citation networks of related trials are often disconnected: implications for bidirectional citation searches[J]. Journal of Clinical Epidemiology,2014,(67): 793-799.
[10] REAGANS R, MCEVILY B. Network structure, knowledge transfer: The effects of cohesion, range[J]. Administrative science quarterly ,2003,(48): 240-267.
[11] 周曉英, 陳蘭杰. 基于引文網(wǎng)絡(luò)的知識鏈接框架研究[J]. 情報雜志, 2010,(10): 37-40.
[12] SHIBATA N, KAJIKAWA Y, TAKEDA Y, et al. Detecting emerging research fronts based on topological measures in citation networks of scientific publications[J]. Technovation ,2008 ,(28):758-775.
[13] SEELEY H, URQUHART C. Action research in developing knowledge networks[J]. Health informatics journal,2008,(14): 279-296.
[14] 王亮. 基于SCI引文網(wǎng)絡(luò)的知識擴散研究[D]. 哈爾濱:哈爾濱工業(yè)大學(xué), 2014.
[15] 曾建勛, 趙捷, 吳雯娜,等. 基于引文的知識鏈接服務(wù)體系研究[J]. 情報理論與實踐, 2009,(5):1-4+8.
[16] CHEN P, REDNER S. Community structure of the physical review citation network[J]. Journal of Informetrics ,2010, (4), 278-290.[17] ERDI P, MAKOVI K, SOMOGYVARI Z, et al. Prediction of emerging technologies based on analysis of the US patent citation network[J]. Scientometrics ,2013,(95): 225-242.
[18] 馬佰蓮, 李正風(fēng). 中國科學(xué)創(chuàng)新能力(2000-2010)評價[J]. 自然辯證法通訊, 2013,(5):82-87+127.
[19] LV PENGHUI, WANG GUIFANG, WAN YONG, et al.Bibliometric trend analysis on global graphene research [J]. Scientometrics, 2011, 88 (2):399-419.
[20] HO YUHSHAN, MICHAEL KAHN. A bibliometric study ofhighly cited reviews in the Science Citation Index expanded[J]. Journal of the Association for Information Science and Technology, 65(2):372-385, 2014.
[21] 劉臣, 單偉, 于晶中國學(xué)科知識網(wǎng)絡(luò)的演化研究——基于1981-2010年引文數(shù)據(jù)[J]. 系統(tǒng)工程理論與實踐, 2013,(2):430-436.
[22] KAJIKAWA Y, OHNO J, TAKEDA Y, et al. Creating an academic landscape of sustainability science: an analysis of the citation network[J]. Sustainability Science, 2007 ,(2): 221-231.
[23] MA FEICHENG, LYU PENGHUI, WANG XIAOYONG. Quantitative characterization of the research productivity of interdisciplinary [J]. COLLNET Journal of Scientoemtrics and Information Management, 2014, 8(1): 153-168.
[24] REN JUNLIN, LYU PENGHUI, WU XINMU, et al. An informetric profile of water resources management literatures [J]. Water Resources Management, 2013, 27(13): 4679-4696.
[25] 李杰, 當(dāng)前我國自然科學(xué)創(chuàng)新的人文環(huán)境研究[D]. 南寧:廣西大學(xué), 2006.
[26] LEYDESDORFF L, RAFOLS I. Indicators of the interdisciplinarity of journals: Diversity, centrality, citations[J]. Journal of Informetrics ,2011, (5): 87-100.
[27] ZHAO S X, YE F Y. Power-law link strength distribution in paper cocitation networks[J]. Journal of the American Society for Information Science, Technology,2013,(64):1480-1489.
[28] GENG X M, WANG Y. Degree correlations in citation networks model with aging[J]. EPL 009 (88).
[29] OYRANOSKI D. Chinese institute is an innovation in theory[J]. Nature ,2002:416, 572-572.
(責(zé)任編輯 劉 翠)
Research on Scientific Innovation Oriented Science Citation Network
(a.School of Management; b.Key Laboratory of Process Optimization and Intelligent Decision Making of Ministry of Education; c.Institute of Information Technology and Engineering Management, Hefei University of Technology, Hefei 230009, China)
Science citation network is one of the earliest and best developed areas in the field of knowledge network and even knowledge management. This scientific knowledge network is one of the earliest types of knowledge network based on the mutual citation relationship between scientific literatures through summary of information scientists. This paper first reviews the development of the science citation network, and then introduces the basic theory of the science citation network and summarizes its research methods. Finally, the empirical research of the science citation network is carried out in view of the natural science field in China. The science citation network of the field of graphene in materials science is drawn from the data before 2010, and the innovation path is discovered. According to the power law distribution of literature node in citation network, and taking all the cited high quality papers in the field of chemistry and materials science in the world from 2004 to 2014 as an example, the scientific citation network is drawn, and the scientific innovation law and the innovation path are discovered. Through the analysis of the characteristics of the chemistry and materials science citation network based on the data from the InCites database of ISI, the phenomenon of the cited delay of Chinese scientists' papers is summed up. The result of science citation network knowledge graph shows that the scientific research in China is in the process of self-promotion.
scientific innovation; citation network; knowledge base; knowledge structure
2016-09-21
國家自然科學(xué)基金面上項目(71571060);中國博士后科學(xué)基金面上項目(2015M581984);安徽省軟科學(xué)研究計劃重點項目
呂鵬輝(1982-),男,陜西西安人,助理研究員,博士后。
G252.7
A
1008-3634(2016)06-0116-8.5
(1607A0202039);中央高?;究蒲袠I(yè)務(wù)費專項資金項目(2015HGBZ0490)