, ,
合作研究能夠?qū)⒎稚⒌闹R和能力連接成新的思路和新的研究路徑,簡單地說,合作研究就是連接不同的人才共同進行科研生產(chǎn)[1]。自20世紀60年代以來,運用合著網(wǎng)絡測量科研合作一直是一個重大課題[2]。
作者合著網(wǎng)絡屬于復雜網(wǎng)絡,其研究方法一般是建立某一領域(如生物醫(yī)學、化學和計算機科學等)的作者合著網(wǎng)絡,分析網(wǎng)絡的各種屬性,如點度中心度、中間中心度、接近中心度和特征向量等,從而篩選出網(wǎng)絡中的重要節(jié)點,確定該領域的重要科研人員及所屬機構,同時發(fā)現(xiàn)合著網(wǎng)絡中合作頻繁的團體[3]。
近年來,合著網(wǎng)絡研究逐漸成為復雜網(wǎng)絡研究的熱點。本文以傳統(tǒng)文獻計量學評價指標和合著網(wǎng)絡評價指標為對象,通過研究作者發(fā)文量、被引量與合著網(wǎng)絡節(jié)點重要性評價指標(點度中心度、中間中心度、接近中心度和特性向量中心度指標)之間的相關性,探索作者合著網(wǎng)絡的結構與特征,以此發(fā)現(xiàn)作者合著網(wǎng)絡節(jié)點重要性指標的評價意義。
本文以2014年JCR中腫瘤學領域影響因子最高的3種期刊CA-ACancerJournalforClinicians,NatureReviewsCancer,LancetOncology在2012-2015年發(fā)表的研究論文為數(shù)據(jù)樣本。
從檢索角度看,由指定期刊獲得文獻數(shù)據(jù)能夠有效避免主題詞檢索帶來的漏檢;從學科領域看,腫瘤學是發(fā)展比較成熟、覆蓋面比較廣的一個學科,其數(shù)據(jù)適用于分析作者發(fā)文量、被引率與合著網(wǎng)絡節(jié)點分析指標之間的相關性研究。檢索上述期刊2012-01-01至2015-08-11期間發(fā)表的論文,將文獻類型限定為“article”、“review”、“proceedings paper”,最終得到905篇研究論文。
1.2.1 原始數(shù)據(jù)處理
BICOMB是中國醫(yī)科大學崔雷教授及其團隊研發(fā)的一款書目共現(xiàn)分析系統(tǒng),可對重要生物醫(yī)學文獻數(shù)據(jù)庫(如PubMed、SCI、中國知網(wǎng)、萬方等) 進行字段抽取、統(tǒng)計,對重要字段構建共現(xiàn)矩陣(如作者合著矩陣、論文同被引矩陣、主題詞共現(xiàn)矩陣等)導入SPSS和UCINET等軟件進行聚類分析和網(wǎng)絡屬性分析[4]。本文利用BICOMB 2.01 處理原始數(shù)據(jù),統(tǒng)計作者字段,并構建作者共現(xiàn)矩陣。
1.2.2 構建作者合著網(wǎng)、計算網(wǎng)絡節(jié)點屬性指標
UCINET是由加州大學歐文(Irvine)分校的Linton Freeman教授編寫的社會網(wǎng)絡分析軟件,包括大量的網(wǎng)絡分析指標,如中心度分析、二方關系凝聚力測度、子群分析、因子分析[5],還提供數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)處理的工具,可以將圖論程序轉(zhuǎn)換成矩陣代數(shù)語言[6]。UCINET還集成了用于一維與二維數(shù)據(jù)分析的NetDraw和正在發(fā)展應用的三維展示分析軟件Mage等,同時還集成了Pajek用于大型網(wǎng)絡分析的Free應用軟件程序,是一種功能強大的社會網(wǎng)絡分析軟件[7]。本文將作者共現(xiàn)矩陣導入 UCINET 6.186,繪制作者合著網(wǎng)絡,并計算各個節(jié)點的點度中心度、中間中心度、接近中心度和特征向量中心度。
1.2.3 統(tǒng)計學處理
將分析數(shù)據(jù)導入SPSS 19.0,進行Spearman秩和相關分析,以P<0.01時為差異具有統(tǒng)計學意義。
2.1.1 作者合著論文情況
905篇論文中,61篇文獻為獨著,844篇文獻(占93.26%)為合著(表1)。
其中主要為2-10人合著,也有更多人合著的情況;有2篇論文作者人數(shù)超過100,作者人數(shù)最多的文獻共有302位作者。905篇論文共涉及7 815位作者,參與合著的作者達7 774人,占作者總數(shù)的99.48%。
表1 作者論文合著情況
本文對作者參與論文篇數(shù)作進一步統(tǒng)計。其中,參與1篇論文的作者6 474人,占82.84%;參與2-5篇論文的作者1 299人,占16.62%;參與6-9篇論文的作者37人,占0.47%;參與論文≥10篇的作者5人,占0.064%。參與論文≥8篇的13位高產(chǎn)作者見表2。
表2 參與論文篇數(shù)的高產(chǎn)作者
2.1.2 作者論文被引情況
作者論文被引頻次是指作者參與的所有論文的被引頻次之和。
論文累計被引頻次超過10 000的有2位作者(表3),其中Jemal A參與論文的總被引頻次高達13 677,位居第一;Siegel R參與論文的總被引次數(shù)為12 949,位列第二。
表3 作者論文被引頻次
將作者共現(xiàn)矩陣導入UCINET 6.186,繪制作者合著網(wǎng)絡,并計算各個節(jié)點的點度中心度、中間中心度、接近中心度和特征向量中心度。其中,點度中心度是指與該節(jié)點直接相連的鄰居節(jié)點的數(shù)目, 直接反映網(wǎng)絡中一個節(jié)點對其他節(jié)點的影響力,度值較高的節(jié)點在維持網(wǎng)絡結構完整性上有重要意義;中間中心度是指網(wǎng)絡中所有節(jié)點對的最短路徑之中經(jīng)過該節(jié)點的數(shù)量占所有節(jié)點對最短路徑數(shù)量的比例,通過中間中心度可以準確找到網(wǎng)絡中某些“流量”非常大的重要節(jié)點[8];接近中心度是指節(jié)點到網(wǎng)絡中所有其他節(jié)點的最短路徑之和,反映節(jié)點在網(wǎng)絡中居于中心的程度[9],網(wǎng)絡中較短的距離意味著更少的消息傳遞時間和花費[10];特征向量中心度是指把復雜網(wǎng)絡中單個個體的影響力看作是其他所有成員影響力的線性組合,因而得到一個線性方程組,該方程組最大的特征值所對應的特征向量即為每個節(jié)點的重要性指標,就是一個個體具有與高特征向量中心度的個體相連的程度[11]。本文共涉及7 815名作者,數(shù)量龐大。為了得到更好、更清晰的合著網(wǎng)絡圖,同時為了更好地表現(xiàn)和分析合著者之間的合作關系,本文繪制了參與合著論文≥2篇的1 341位作者的合作圖(圖1),圖中節(jié)點的大小代表節(jié)點的度數(shù)。
圖1 作者合著網(wǎng)絡圖
如圖1所示,作者合著網(wǎng)絡圖中節(jié)點的點度中心度最大為436,最小為0,整個圖的中心勢為3.7%;節(jié)點中間中心度最大為51 000.816,最小為0,圖的中間中心勢為5.48%;節(jié)點接近中心度最大為1 795 600.000,最小為66 959.000,因為本圖為非連通圖,故無法計算圖的接近中心勢;節(jié)點特征向量中心度最大為25.916,最小為-0.000,圖的特征向量中心勢為25.52%。
2.3.1 作者發(fā)文與網(wǎng)絡評價指標的相關性
我們利用UCINET繪制出作者合著網(wǎng)絡圖,并通過Network-centrality,分別計算出作者合著網(wǎng)絡各個節(jié)點的點度中心度、中間中心度、接近中心度和特征向量中心度等屬性指標。
作者發(fā)文量≥8篇的作者及其網(wǎng)絡評價指標見表4。
表4 高產(chǎn)作者的發(fā)文量與網(wǎng)絡評價指標
本文所指的“發(fā)文量”是指作者獨著或合著論文的總量。
以參與論文≥2篇的1 341條作者數(shù)據(jù)為基礎,利用SPSS 19.0計算出作者發(fā)文量與點度中心度、中間中心度、接近中心度和特征向量中心度的相關性,分析結果見表5。
表5 作者發(fā)文量與網(wǎng)絡評價指標相關性
由表5可知,發(fā)文量與點度中心度、中間中心度、接近中心度和特征向量中心度的P值<0.01,差異具有統(tǒng)計學意義,可認為作者發(fā)文量與4個網(wǎng)絡指標之間具有相關性。其中發(fā)文量與點度中心度、中間中心度和特征向量中心度呈正相關關系,作者發(fā)文量與接近中心度呈負相關關系。
2.3.2 作者論文被引頻次與網(wǎng)絡評價指標相關性
作者論文被引頻次是指作者參與的所有論文的被引頻次之和。論文被引頻次大于900的前10位作者見表6。
表6 作者論文被引頻次與網(wǎng)絡評價指標
統(tǒng)計參與論文≥2篇的1 341位作者的論文被引頻次、點度中心度、中間中心度、接近中心度和特征向量中心度,數(shù)據(jù)導入SPSS,分析作者論文被引頻次與4個網(wǎng)絡節(jié)點評價指標值的相關性,結果見表7。
表7 作者論文被引頻次與網(wǎng)絡評價指標相關性
由表7可知,作者論文被引頻次與點度中心度、中間中心度、接近中心度和特征向量中心度存在相關性P<0.01,具有統(tǒng)計學意義。其中作者論文被引頻次與點度中心度、中間中心度和特征向量中心度呈正相關關系,作者發(fā)文量與接近中心度呈負相關。
以上統(tǒng)計分析發(fā)現(xiàn),905篇研究論文中,93.26%的論文是由2位及以上作者合作完成的,而且99.48%的作者與其他作者有過合作,論文合著率和作者合作率都比較高,說明腫瘤學領域研究人員知識交流活躍,新成果分享頻繁,這有利于該領域?qū)W術知識合作范圍的擴大、學術水平的提高以及研究領域的拓展成熟。
通過相關性分析發(fā)現(xiàn),作者發(fā)文量、被引頻次與4個網(wǎng)絡指標之間有相關性。其中發(fā)文量、被引頻次與點度中心度、中間中心度和特征向量中心度呈正相關關系,即作者發(fā)文量或被引頻次越高,其在合著網(wǎng)絡中的點度中心度、中間中心度和特征向量中心度3個指標值也高。
點度中心度高說明發(fā)文越多或論文被引頻次越高的作者,與其合作的作者也越多,在合著網(wǎng)絡中表現(xiàn)為與該作者節(jié)點直接相連的鄰居作者數(shù)目越多,對其他作者節(jié)點的影響也越大,反映了其對維護網(wǎng)絡結構完整性上有重要意義;中間中心度高說明發(fā)文越多或論文被引頻次越高的作者在合著網(wǎng)絡中表現(xiàn)為該作者處于許多作者交往的最短路徑之上,具有控制其他作者合作的能力,反映了該作者在網(wǎng)絡中的重要地位;特征向量中心度高說明發(fā)文越多或者論文被引頻次越高的作者在該領域的人氣程度也越高,與高特征向量中心度作者合作的機會越大,在網(wǎng)絡中表現(xiàn)為該節(jié)點對網(wǎng)絡的影響也越大。相關性分析還發(fā)現(xiàn),作者發(fā)文量、論文被引頻次與接近中心度呈負相關關系。
作者接近中心度越低,則到達其他所有作者的距離越短,即處于合著網(wǎng)絡中心位置,與其他作者越容易發(fā)生合作,故該作者的發(fā)文量會越高,論文被引的機率也越高。
本文通過分析作者發(fā)文量、被引量與合著網(wǎng)絡節(jié)點重要性評價指標之間的相關性,找到傳統(tǒng)文獻計量學指標與網(wǎng)絡指標的具體聯(lián)系,以此發(fā)現(xiàn)合著網(wǎng)絡節(jié)點重要性指標的具體評價意義,使合著網(wǎng)絡節(jié)點重要性評價指標更具針對性,更有助于理解網(wǎng)絡中不同位置的節(jié)點所蘊含的信息。本文結果可能會受所選學科領域、時間跨度等因素影響,未來應拓展至其他學科領域進行深入對照研究,得出更客觀完善的結果。