吳利俊 宋元明 陳 堅 王 森 應 峻△
(1復旦大學圖書館 上海 200433;2復旦大學附屬華山醫(yī)院消化科,3感染科 上海 200040;4國家傳染病醫(yī)學中心 上海 200040)
2019冠狀病毒?。╟oronavirus disease 2019,COVID-19)已經在全球引發(fā)了大量科學研究,相關論文“井噴式”產生,針對COVID-19 的科學研究所面臨的問題也非常復雜,需要全球不同科研主體之間積極開展協(xié)同研究工作,才能有望早日攻破難題[1]。然而,這場疫情又在政治、經費、空間等多個角度限制了科研合作的展開,COVID-19 國際科研合作現狀及未來趨勢尚有待研究。
基本科學指標(Essential Science Indicator,ESI)數據庫所標注的高被引論文是指近十年來各研究領域中被引頻次排名位于前1% 的論文,通常代表全球科研論文的頂尖水平,針對高被引論文數量進行分析,可對相關地區(qū)或機構的學科競爭力進行評估,針對其研究內容的挖掘則可用于指引學科發(fā)展方向,能夠體現學科研究熱點與前沿[2-3]。有研究證實大多數高被引論文均由國際合作完成,而通過對研究領域內的高被引論文進行分析,能夠高效地尋找到該領域的國際合作網絡結構與特征[4-5]。
社會網絡分析法最初是基于數學方法、圖論等發(fā)展起來的定量分析方法,目前已拓展至科研領域合作關系的研究[6]。利用社會網絡分析,通過對研究領域內的國際合作網絡的特征演化進行研究,不但有助于了解國際合作網絡的動態(tài)變化過程,還能夠幫助科研人員迅速掌握研究領域的發(fā)展趨勢以及前沿研究的成果[7]。
本研究以COVID-19 高被引論文作為樣本數據,基于社會網絡分析方法,深入探究國際科研合作率、科研合作團隊規(guī)模、合作網絡特征及其演變規(guī)律,以可視化形式揭示COVID-19 國際科研合作現狀以及變化趨勢,以期為科研人員和決策人員掌握該領域的研究特點和探索國際合作路徑提供參考。
數據來源本研究檢索Web of Science 核心合集數據庫,選擇主題檢索途徑,設置檢索詞為“COVID-19”、“COVID19”、“COVID 19”、“2019-nCov”、“2019 nCov”、“SARS-Cov-2”、“SARS CoV 2”、“Coronavirus Disease-19”,“Coronavirus Disease 2019”、“2019 Novel Coronavirus”,在檢索結果頁面中選擇“ESI 精煉”,篩選出檢索結果中的ESI 高被引論文。數據采集時間截至2021年04月30日。
數據清理將數據庫中采集到的數據導入Excel軟件進行人工清理,排除無法確定出版日期以及作者地址字段缺失的文獻,按照作者所屬機構來標引文獻的所屬國家或地區(qū),用于國際科研合作網絡分析數據來源;沿用ESI 對每一位作者的貢獻都給予統(tǒng)計的方法,一篇論文只要作者標注超過2 個國家或地區(qū),則被認為存在國際合作。為了分析合作網絡的演化規(guī)律,將納入文獻按照出版時間分成4 個階段,即:(1)第一階段:2019年12月1日—2020年3月31日;(2)第二階段:2020年4月1日—6月30日;(3)第三階段:2020年7月1日—9月30日;(4)第四階段:2020年10月1日—2021年4月30日。在此基礎上,分別建立納入的樣本數據在4 個不同時間窗口的合作共現矩陣。
數據分析社會網絡分析法是對社會關系結構及其屬性加以分析的一套規(guī)范和方法,其分析的對象是社會行動者之間的關系,能夠對社會關系進行 量 化 研 究[8]。 本文以COVID-19 相關研究中的ESI 高被引論文作為樣本數據,結合多元統(tǒng)計分析方法,統(tǒng)計國際科研合作率、科研合作團隊規(guī)模等,并利用社會網絡分析法,借助Ucinet 軟件,繪制出國際合作網絡關系的可視化圖譜,并分別從網絡密度、中心性、核心度等方面對COVID-19 國際科研合作網絡結構進行深入分析。
納入文獻總體特征在Web of Science 核心合集數據庫中,通過檢索獲得118353 篇文獻,其中,ESI 高被引論文共3794 篇,進一步去除無法確定出版時間的文獻(65 篇)以及作者地址字段缺失的文獻(14 篇),最終納入3715 篇文獻作為本研究樣本數據(圖1)。其中,從發(fā)文時間來看,2019年1 篇,2020年3687 篇,2021年27 篇;從文獻類型來看,綜述732 篇,原始研究論文2983 篇。截至2020年4月30日,納入樣本文獻在Web of Science 核心合集中的總被引頻次為494669,篇均被引頻次為133.15。
圖1 文獻檢索和篩選流程Fig 1 Flow chart of the literature search and selection
國際科研合作總覽針對樣本數據,根據作者機構所屬國家或地區(qū)進行統(tǒng)計,發(fā)現作者共來源于全球118 個國家或地區(qū)。其中,ESI 高被引論文數量最多的10 個國家分別為美國(35.90%)、中國(30.31%)、意大利(14.16%)、英國(12.68%)、德國(6.43%)、加拿大(6.27%)、法國(5.90%)、西班牙(5.52%)、澳大利亞(5.25%)和荷蘭(4.09%)。論文總數能夠反映總體科研能力,而合作率則能夠體現各個國家或地區(qū)在COVID-19 國際科研合作中的參與度。表1 顯示了國際總體科研合作率(34.27%)以及上述10 個國家科研合作程度,結果發(fā)現各國總體合作率為34.54%~81.97%,除了中國(34.54%)、美國(50.79%)和意大利(52.47%)以外,其余國家科研合作率都在60% 以上。從不同時間窗口來看,國際總體科研合作程度呈緩步上升趨勢,進一步針對中美兩國的科研合作率進行統(tǒng)計,發(fā)現中美兩國的科研合作率在4 個時間窗口中呈現逐步下降趨勢(25.40%、20.54%、18.85%、11.85%)。
表1 COVID‐19 發(fā)文量排名前10 國家在各時間窗口的科研合作率Tab 1 Scientific research collaboration rate of the top 10 countries in each time window
國際科研合作團隊規(guī)模有研究表明,科學研究中的國際科研合作團隊規(guī)模會隨著時間的推移呈現逐漸增長的趨勢[9-10]。在本研究中,以參與研究的合著者數量的平均值以及國家或地區(qū)數量的平均值來表示國際科研合作團隊規(guī)模。表2 顯示了4個時間階段的團隊規(guī)模分析結果,與既往學者的研究結果類似,從合著者數量來看,COVID-19 總體科研團隊規(guī)模(9.34、9.20、11.09、13.46)以及國際合作中的團隊規(guī)模(10.73、10.55、13.71、17.68)除了在第二階段略有下降以外,整體隨著時間變化呈現上升趨勢;從參與研究的國家或地區(qū)數量來看,總體科研團隊規(guī)模也呈上升趨勢(1.46、1.81、1.83、1.88),國際合作中的團隊規(guī)模在第二階段出現短暫縮?。?.83),在第三、四階段再次上升并呈穩(wěn)定狀態(tài)(3.45、3.30)。
表2 各時間窗口COVID‐19 國際科研合作團隊規(guī)模Tab 2 Team size of COVID‐19 international scientific collaboration in each time window
國際科研合作網絡構建由于不同國家或地區(qū)在科研基礎和科研資源等方面存在差異,在國家或地區(qū)層面上就會表現出特定的合作網絡結構。在本研究中,以所納入的樣本數據中的國家或地區(qū)作為節(jié)點,利用Ucinet 繪制4 個不同時間階段COVID-19 國際科研合作的可視化圖譜。如圖2 所示,節(jié)點的大小代表度中心性,節(jié)點間的連線代表國家或地區(qū)之間的合作,連線的粗細代表合作次數。在該圖譜中,第一階段至第4 個階段分別有46、111、90 和63 個節(jié)點,256、2998、2684 和1022 個連接??梢钥吹?,在第一階段位于中心位置的最大節(jié)點是中國,但是,在此后三個階段中,美國一直處于整個合作網絡的中心位置,是全球最大的節(jié)點。
圖2 COVID‐19 高被引論文國際合作網絡結構圖Fig 2 COVID‐19 international collaboration network structure of highly cited papers
國際科研合作網絡特征及演變網絡密度(Density)在社會網絡分析中主要用于刻畫整個網絡的合作情況,密度值越大,說明各個國家或地區(qū)之間的聯(lián)系越緊密,而中心性(Centrality)則是衡量整個網絡中心化程度的重要指標,包括度中心度(Degree)、接近中心度(Closeness)和中介中心度(Betweenness)[11-13]。借助Ucinet 軟件,本研究揭示了COVID-19 國際科研合作網絡的內部結構特征和演變,樣本數據在各時間窗口的網絡密度和中心性特征參數等指標的測量結果如表3 所示。整個合作網絡在第一階段的網絡密度最低(0.186),但是3 個反映中心性的指標較高(1.159、2.422、15.630),說明在第一階段雖然合作網絡不是很大,但是卻相對集中;到了第二階段,網絡密度迅速增高(0.690),各中心性指標明顯下降(0.630、0.638、12.717),說明這一階段網絡中的科研合作緊密程度進一步加強,網絡規(guī)模擴大;但是隨著時間推移,到了第三和第四階段,整個合作網絡又呈現縮小趨勢,表現為網絡密度值下降,而合作網絡向中心聚集的趨勢又在不斷加強,表現為中心性指標上升。
表3 COVID‐19 高被引論文合作網絡中心性指標Tab 3 COVID‐19 collaboration network centrality of highly cited papers
此外,在社會網絡分析中,常用核心—邊緣這一結構模型來幫助尋找網絡中的核心節(jié)點,這類節(jié)點通常與其他節(jié)點之間的聯(lián)系較緊密,擁有較大的作用強度,處于網絡的核心位置,通常采用核心度(Coreness)這個指標來表示[12]。借助Ucinet 軟件,通過計算得到了樣本數據中各個國家或地區(qū)在各個時間窗口的核心度指標參數值,通過核心度可以追蹤到各個國家或地區(qū)在合作網絡中地位的變化。如表4 所示,總體來看,核心度排在前10 位的國家在各個階段相對比較固定,與上述發(fā)文數量最高的10 個國家比較一致,但是從某個具體國家來看,在第一階段,中國是核心度最高的國家(0.741),但是隨著時間推移,其核心地位在逐漸下降(0.364、0.309、0.205),從第三位逐漸降到第七位,而美國從第二階段開始,一直穩(wěn)居整個網絡中最核心的位置,英國則緊隨其后排在第二位。
表4 各時間窗口核心度排名前10 位國家Tab 4 Top 10 countries with the highest coreness in each time window
科研合作是解決復雜科學問題和推動科學進步的有效途徑[14]。由于科學問題的復雜性日益增加,使得科研合作已經從個人合作、機構合作邁入國家合作的時代,國際科研合作已成為前沿科學發(fā)現的主導力量[15]。本研究以COVID-19 相關ESI 高被引論文作為樣本,基于社會網絡分析,對COVID-19 國際科研合作率、科研合作團隊規(guī)模、國際合作網絡特征和演變等方面進行了深入闡述和分析,從而揭示了COVID-19 國際科研合作發(fā)展態(tài)勢。
國際合作的定義是指論文的合著作者屬于兩個或以上國家或者地區(qū),既往有研究發(fā)現國際合作更加有利于提升論文質量,提高研究深度,以及促進學科成熟[16]。本研究發(fā)現COVID-19 高被引論文的國際科研合作率達到34.27%,與此同時,還發(fā)現在發(fā)文量最多的10 個國家中,除了中國以外,其他國家的國際科研合作率均超過50%,進一步證實加強國際合作將有助于促進高水平論文的產出[17]。這提示中國還需要加強與核心國家的科研合作以提升自身影響力,但同時也從側面體現出中國具有越來越強大的獨立科研實力,在國際合作程度偏低的情況下仍然在核心圈占有一席重要位置。
Cai 等[18]對比分 析了COVID-19 疫情發(fā)生前后全球科研合作規(guī)模和緊密程度的差異變化,發(fā)現隨著疫情的發(fā)展,科研團隊的規(guī)模和合作率呈下降趨勢。但本研究發(fā)現科研合作團隊規(guī)模和合作率總體呈上升趨勢,這可能與本研究選取高被引論文作為研究樣本相關。Wagner 等[19]研究發(fā)現中美兩國合作發(fā)展迅速,超過世界上任何兩個國家,但本研究發(fā)現中美兩國在COVID-19 中的合作率隨著時間變化呈逐步下降趨勢,可能與兩國政府主張的政策差異有關,例如,有研究人員會對于美國政府提出的加強對中美合作的審查而產生擔憂,這就可能會影響兩國科研合作的正常開展[20]。
Zhang 等[21]發(fā)現:美國、中國和英國是COVID-19 發(fā)文數量最多、國際合作最多的3 個國家;與受影響較小的國家相比,受疫情影響較大的國家通常會更多地參與國際合作;在規(guī)模更小、更集中化的網絡中,核心還是由部分發(fā)達國家組成的精英團體。本研究也發(fā)現在COVID-19 整個科研合作網絡中,上述3 個國家也是高被引論文產出最高的國家,同時國際合作網絡的規(guī)模也逐漸呈現縮小趨勢,合作網絡不斷呈向中心聚集。中國在第一階段是網絡核心,可能與中國是疫情初期受影響最嚴重且科研產出最多的國家有關,從第二階段開始隨著美國病例數增加,其作為全球科研實力最強的國家開始取代中國成為合作網絡最核心的位置。各個國家在合作網絡中的核心度分析表明,處于核心圈的國家相對固定,也說明科研大國之間的合作仍然在數量上占有絕對優(yōu)勢[22]。
綜上所述,本文從上述多個角度針對COVID-19 國際科研合作網絡特征及演化進行了分析,獲得了有意義的研究結果。本研究也存在明顯局限性:(1)由于高被引文獻標記需要一定時間積累,導致第四階段的樣本數據量偏少,對數據分析結果的可靠性產生一定影響;(2)對國際合作網絡特征的分析僅包括網絡密度、中心性和核心度這幾個參數,凝集子群、結構洞等網絡特征分析不夠深入;(3)僅從國家合作角度進行了合作網絡的分析,機構合作、作者合作等方面未進一步挖掘。但通過本研究取得的結論仍可以在一定程度上反映COVID-19 國際科研合作態(tài)勢,為研究人員今后進一步提升科研論文影響力及探尋合作路徑提供啟示。
作者貢獻聲明吳利俊 數據采集、清理和統(tǒng)計分析,論文撰寫。宋元明 數據清理和核對。陳堅,王森 論文修改。 應峻 研究設計和論文修改。
利益沖突聲明所有作者均聲明不存在利益沖突。