陳靜飛,王懷璋,高文博,陳耕耘,梁婷*
1解放軍陸軍防化學院,北京 102205;2解放軍32169部隊,西藏林芝 860000;3四川省地震局,成都 610000
近年來,隨著全球冠狀病毒疫情多次暴發(fā)[1-2],科研人員對冠狀病毒的研究也隨之增多。2019年底,中國湖北省武漢市暴發(fā)了一種以新型冠狀病毒(SARS-CoV-2)為病原的肺炎(corona virus disease 2019,COVID-19)疫情[3];為盡快控制疫情,各地科研人員對SARS-CoV-2展開了相關(guān)研究[4]。文獻計量學是一種對某學科領(lǐng)域的文獻進行分析,評估一段時間內(nèi)研究活動趨勢的研究方法。為了全面了解冠狀病毒的研究狀態(tài),并為后期冠狀病毒的研究者提供直觀明了的參考依據(jù),本研究運用文獻計量學、可視化等方法對冠狀病毒的研究結(jié)果進行系統(tǒng)整理,并分析冠狀病毒在全球的研究情況,以期為當前乃至今后研究冠狀病毒提供幫助。
1.1 數(shù)據(jù)來源 在Web of Science(以下簡稱WoS)文獻檢索平臺,選擇WoS核心合集,檢索主題:Coronavirus;時間跨度:1968-2019;索引:SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH、BKCI-S、BKCI-SSH、ESCI、CCREXPANDED及IC。共檢索到13 959篇文獻,其中論文(Article)11 242篇,綜述(Review)1198篇,其他類型(Other types)1519篇(圖1)。本研究使用的數(shù)據(jù)集包括所有文獻類型,為避免跨學科文獻的丟失,未對文獻來源進行精簡。
圖1 冠狀病毒相關(guān)文獻類型分布(1968-2019年)Fig.1 Distribution of document type related to coronavirus (1968 to 2019)
1.2 方法 所有數(shù)據(jù)均獨立收集,并以TXT格式下載。將數(shù)據(jù)導入Microsoft Excel 2019和CiteSpace 5.5.R2軟件(由美國Drexel大學陳超美教授基于Java開發(fā)的程序[5])進行定性和定量分析。運用Microsoft Excel 2019軟件對文獻類型分布、年度發(fā)表文獻數(shù)量趨勢進行分析;運用CiteSpace 5.5.R2軟件確定國家、機構(gòu)之間的合作關(guān)系,描繪期刊、研究者共引關(guān)系,進行文獻共引分析及關(guān)鍵詞突現(xiàn)分析,并將上述所有項目進行可視化呈現(xiàn)。
2.1 每年度發(fā)表文獻 1968-2019年每年度發(fā)表文獻數(shù)量分布如圖2所示:第1篇與冠狀病毒相關(guān)的文獻發(fā)表于1968年;年度發(fā)文量出現(xiàn)了2個波峰,第1個波峰在2004年,即中國嚴重急性呼吸綜合征(severe acute respiratory syndrome,SARS)暴發(fā)的第2年;第2個波峰在2016年,即中東呼吸綜合征(Middle East respiratory syndrome,MERS)暴發(fā)之后。
2.2 國家合作網(wǎng)絡 統(tǒng)計結(jié)果顯示,全球有138個國家/地區(qū)發(fā)表了13 959篇冠狀病毒相關(guān)文獻。將1968-2019年所有文獻加載至CiteSpace 5.5.R2軟件生成國家合作網(wǎng)絡圖譜,結(jié)果顯示其由121個網(wǎng)絡節(jié)點和952條連接線組成,如圖3所示,表明研究冠狀病毒的國家/地區(qū)之間進行了緊密合作。
統(tǒng)計排名得出發(fā)表冠狀病毒相關(guān)文獻數(shù)量最多的10個國家(表1)。其中美國(USA,4698篇)貢獻最大,其次是中國(China,2660篇)、德國(Germany,857篇)、英格蘭(England,805篇)和荷蘭(the Netherlands,738篇)。中心性數(shù)值顯示,西方國家與其他國家建立的合作關(guān)系較緊密,如美國(0.38)、英格蘭(0.23)、荷蘭(0.23)和德國(0.19);亞洲國家與其他國家之間建立的合作關(guān)系較薄弱,如中國(0.09)、日本(0.09)、沙特阿拉伯(0.03)和韓國(0.00)。
表1 發(fā)表冠狀病毒相關(guān)文獻數(shù)量最多的10個國家Tab.1 The top 10 countries contributed to publications of coronavirus-related literature
圖2 冠狀病毒相關(guān)文獻發(fā)表年份分布(1968-2019年)Fig.2 Annual distribution of published coronavirus-related literature (1968 to 2019)
圖3 參與冠狀病毒研究的國家/地區(qū)網(wǎng)絡圖譜Fig.3 Network map of countries/regions engaged in coronavirus research
2.3 機構(gòu)合作網(wǎng)絡 統(tǒng)計結(jié)果顯示,全球有7119個機構(gòu)發(fā)表了13 959篇冠狀病毒相關(guān)文獻。將1968-2019年所有文獻加載至CiteSpace 5.5.R2軟件生成機構(gòu)合作網(wǎng)絡,結(jié)果顯示其由1473個網(wǎng)絡節(jié)點和8567條連接線組成,如圖4所示,表明研究冠狀病毒的機構(gòu)之間進行了廣泛合作。與國家間合作相比,機構(gòu)間的合作亦同樣緊密。
圖4 參與冠狀病毒研究的機構(gòu)網(wǎng)絡圖譜Fig.4 Network map of the institutions engaged in coronavirus research
統(tǒng)計排名得出發(fā)表冠狀病毒相關(guān)文獻數(shù)量最多的10個機構(gòu)(表2)。其中香港大學(Univ Hong Kong,511篇)貢獻最大,其次是中國科學院(Chinese Acad Sci,354篇)、烏得勒支大學(Univ Utrecht,216篇)、香港中文大學(Chinese Univ Hong Kong,215篇)和美國疾病控制與預防中心(Ctr Dis Control Prevent,214篇)。中心性數(shù)值顯示,香港大學與其他機構(gòu)建立的合作關(guān)系最為緊密。
表2 發(fā)表冠狀病毒相關(guān)文獻數(shù)量最多的10個機構(gòu)Tab.2 The top 10 institutions contributed the most publications of coronavirus-related literature
2.4 期刊發(fā)文量與期刊共引 統(tǒng)計結(jié)果顯示,有2048種學術(shù)期刊發(fā)表了13 959篇冠狀病毒相關(guān)文獻。在發(fā)表文獻數(shù)量前10名的期刊中(表3),《病毒學雜志》(Journal of Virology,1166篇,8.35%)發(fā)表文獻數(shù)量最多,然后是《病毒學》(Virology,516篇,3.70%)、《實驗醫(yī)學與生物學進展》(Advances in Experimental Medicine and Biology,371篇,2.66%)、《普通病毒學雜志》(Journal of General Virology,338篇,2.42%)和《病毒學檔案》(Archives of Virology,271篇,1.94%)。
選取1968-2019年每一年中被引次數(shù)最高的前100篇文獻,加載至CiteSpace 5.5.R2軟件后生成期刊共引網(wǎng)絡,結(jié)果顯示其由291個網(wǎng)絡節(jié)點和2294條連接線組成,如圖5所示,表明發(fā)表冠狀病毒相關(guān)文獻的期刊之間存在廣泛的引用關(guān)系。
表3 發(fā)表文獻數(shù)量最多的10種期刊Tab.3 The top 10 journals with most published literature
圖5 期刊共引網(wǎng)絡的可視化圖譜Fig.5 Visualized map of the journal co-citation network
在期刊共引前10名中(表4),影響因子(IF 2019)為4.324的《病毒學雜志》在冠狀病毒研究方面的被引頻率最高,然后是《病毒學》《美國科學學院學報》《普通病毒學雜志》和《科學》。
表4 共引次數(shù)最多的10種期刊Tab.4 Top 10 journals with most cited count
2.5 研究者發(fā)文量與研究者共引 統(tǒng)計結(jié)果顯示,共有35 039名研究者參與了冠狀病毒相關(guān)研究。研究者發(fā)表文獻的數(shù)量(表5),Yuen KY排在第一位(216篇),然后是Perlman S(187篇)、Enjuanes L(176篇)、Baric RS(171篇)和Weiss SR(150篇)。
表5 發(fā)表文獻數(shù)量最多的10名研究者Tab.5 The top 10 researchers with most published literature
選取1968-2019年每一年中被引次數(shù)最高的前100篇文獻,加載至CiteSpace 5.5.R2軟件生成研究者共引網(wǎng)絡,結(jié)果顯示其由943個網(wǎng)絡節(jié)點和7971條連接線組成,如圖6所示,表明冠狀病毒研究者之間存在廣泛的引用關(guān)系。
在研究者共引前10名中(表6),Peiris JSM被引頻率最高,其次是Drosten C、Ksiazek TG、Woo PCY和Lai MMC。
圖6 研究者共引網(wǎng)絡的可視化圖譜Fig.6 Visualized map of the researchers co-citation network
表6 共引次數(shù)最多的10名研究者Tab.6 The top 10 researchers with most co-citation count
2.6 文獻共引分析 選取2010-2019年每一年中被引次數(shù)最高的前100篇文獻,構(gòu)建當年的共被引網(wǎng)絡,將每年的共被引網(wǎng)絡合成,得到文獻共引網(wǎng)絡圖譜(圖7)。該圖譜由452個網(wǎng)絡節(jié)點、2400條連接線和12個主要聚類組成。
12個主要聚類詳細信息中(表7),最大的聚類#0被標記為“MERS-CoV感染(MERS-CoV infection)”;輪廓值最高的聚類#8被標記為“流行性腹瀉病毒(epidemic diarrhea virus)”;時間最晚的聚類#13被標記為“中國西南(southwestern China)”。
2.7 關(guān)鍵詞分析 選取2015-2019年每一年中被引次數(shù)最高的前100篇文獻突現(xiàn)關(guān)鍵詞,加載至CiteSpace 5.5.R2軟件生成突現(xiàn)關(guān)鍵詞圖譜(圖8)。該圖譜由156個網(wǎng)絡節(jié)點、1046條連接線和19個突現(xiàn)關(guān)鍵詞組成。
圖7 冠狀病毒相關(guān)文獻共引網(wǎng)絡圖譜(2010-2019年)Fig.7 Co-citation network map of coronavirus-related literature (2010 to 2019)
表7 冠狀病毒相關(guān)文獻共引聚類Tab.7 Co-citation cluster of coronavirus-related literature
圖8 冠狀病毒相關(guān)文獻中突現(xiàn)關(guān)鍵詞網(wǎng)絡圖譜(2015-2019年)Fig.8 Network map of burst keywords from publications of coronavirus research (2015 to 2019)
19個突現(xiàn)關(guān)鍵詞詳細信息如表8所示,在2019年仍然有10個突現(xiàn)關(guān)鍵詞,按照突現(xiàn)強度排列依次為:“SARS冠狀病毒(SARS-CoV,8.3124)”“傳染病(infectious disease,8.0148)”“冠狀病毒S蛋白(coronavirus spike protein,7.1222)”“核因子κB(NF-kappa B,7.1222)”“中國(China,7.1015)”“單克隆抗體(monoclonal antibody,5.0540)”“MERS病毒感染(MERS-CoV infection,4.2241)”“遺傳多樣性(genetic diversity,3.9357)”“貓(cat,3.3408)”和“埃博拉病毒(Ebola virus,3.2633)”。
3.1 一般數(shù)據(jù) 根據(jù)每年度文獻發(fā)表數(shù)量,目前可將冠狀病毒研究分為3個階段。第1階段(1968-2003年)可視為冠狀病毒研究的初始階段,該階段相關(guān)文獻的數(shù)量增長緩慢。第2階段(2004-2012年)冠狀病毒相關(guān)文獻數(shù)量隨SARS暴發(fā)急劇增加,隨后略微回跌,但文獻數(shù)量仍多于第1階段。該階段可視為冠狀病毒研究的第1個黃金發(fā)展時期。第3階段(2013-2019年)冠狀病毒相關(guān)文獻數(shù)量隨MERS出現(xiàn)快速增加,該階段可視為冠狀病毒研究的第2個黃金發(fā)展時期。由此,筆者預計,2019年的這次COVID-19疫情暴發(fā)后會迎來冠狀病毒研究的又一個黃金時期。
表8 19個突現(xiàn)關(guān)鍵詞(2015-2019年)Tab.8 Top 19 burst keywords (2015 to 2019)
在發(fā)表文獻數(shù)量前10名的國家中(亞洲4個國家、歐洲4個國家、北美洲2個國家),美國排名第一,中國排名第二且是唯一一個發(fā)展中國家。香港大學是發(fā)表文獻最多的機構(gòu),亦是與其他機構(gòu)建立合作關(guān)系最為緊密的機構(gòu)。發(fā)表文獻數(shù)量前10名的期刊合計發(fā)表文獻數(shù)量占總量的26.95%,但僅《新發(fā)傳染病》(Emerging Infectious Diseases,IF2019為7.185)影響因子超過5.000,其余期刊影響因子為1.000~5.000,表明研究者在高影響因子期刊上發(fā)表冠狀病毒相關(guān)文獻具有挑戰(zhàn)性。
3.2 共引數(shù)據(jù) 在發(fā)表文獻數(shù)量前10名的研究者中,每名研究者發(fā)表的文獻≥119篇。因此,他們可被認定為“高產(chǎn)研究者”。然而,這些高產(chǎn)研究者中僅有3名進入共引次數(shù)前10名。
在研究者共引中,Peiris JSM提出了冠狀病毒可能是導致SARS的原因[6];Drosten C報告了利用細胞培養(yǎng)和分子技術(shù)從SARS患者的臨床標本中完成了新型冠狀病毒的鑒定[7];Ksiazek TG明確提出新型冠狀病毒在SARS中具有致病作用,并命名了第1個與SARS相關(guān)的冠狀病毒分離株[8]。雖然這些研究者中僅Drosten C屬于高產(chǎn)研究者,但其余非高產(chǎn)研究者對冠狀病毒研究亦做出了重要貢獻。
根據(jù)文獻共引分析得到的文獻共被引聚類中,時間最晚(2015年)的聚類#13(Southwestern China)引起了筆者的注意。該聚類中排名第一的文獻題為《在中國西南地區(qū)少量馬蹄蝙蝠中發(fā)現(xiàn)的新冠狀病毒和遺傳分析》[9],明確提出馬蹄蝙蝠攜帶著遺傳上類似SARS的冠狀病毒。由于蝙蝠冠狀病毒之間重組的可能性很高,將來可能會出現(xiàn)其他類似蝙蝠SARS的冠狀病毒。為了更好地預測并預防蝙蝠起源的冠狀病毒引起的疾病,有必要保持對蝙蝠冠狀病毒的長期監(jiān)測。值得一提的是,該聚類中另一篇文獻《中國蝙蝠冠狀病毒》由Fan等[10]于2019年3月發(fā)表于Viruses,指出很有可能未來的SARS或MERS樣冠狀病毒暴發(fā)將源于蝙蝠,且在中國發(fā)生的可能性更大。因此,關(guān)于蝙蝠冠狀病毒的研究已成為檢測預警信號的緊迫問題。結(jié)合當前的COVID-19疫情,筆者發(fā)現(xiàn)這兩篇文獻具有很強的前瞻性。但令人遺憾的是,這些文獻提出的觀點在當時并未引起足夠的重視。
3.3 研究前沿 突現(xiàn)關(guān)鍵詞提供了對研究前沿的合理預測[11]。通過檢測突現(xiàn)關(guān)鍵詞,可發(fā)現(xiàn)相關(guān)研究領(lǐng)域中發(fā)展迅速的課題[12]。本研究應用CiteSpace 5.5.R2軟件鎖定2015-2019年冠狀病毒的研究前沿。按照突現(xiàn)強度排列,至2019年冠狀病毒研究的三大前沿如下。①SARS-CoV:SARS于2002年底在中國首次發(fā)生,并擴散至東南亞乃至全球。SARS-CoV具有極強的傳播力和較高的致死率。由于沒有特定的抗病毒藥物,SARS的救治給醫(yī)護人員帶來了難題,也給人類衛(wèi)生安全帶來了重大挑戰(zhàn)。因此,有研究人員進行系統(tǒng)回顧,試圖梳理出對抗新型冠狀病毒的最新措施[1],總結(jié)冠狀病毒的流行病學、病毒學、臨床特征和最佳治療策略[13]。而部分研究者致力于研究SARS-CoV的起源和演變,并強調(diào)為未來類似SARS樣疾病的出現(xiàn)做好準備的必要性[14]。②傳染?。涸谌藵M為患的急診室中,患者所攜帶的MERS-CoV傳播潛力增加[15],為全世界醫(yī)療機構(gòu)預防和控制此類傳染病增加了難度。研究表明,60%~80%的新出現(xiàn)的人類傳染病(EID)源自野生生物[16]。Wu等[17]于2016年首次報道了許多新型蝙蝠病毒,并發(fā)現(xiàn)了一些與已知的人類或動物病原體密切相關(guān)的蝙蝠病毒。③冠狀病毒S蛋白(coronavirus spike protein):冠狀病毒進入細胞是由跨膜S糖蛋白介導的。Walls等[18]觀察到了冠狀病毒S蛋白三聚體的低溫電子顯微鏡結(jié)構(gòu)。Haagmans等[19]提出可用MERS-CoV S蛋白的改良痘苗病毒疫苗賦予單峰駱駝黏膜免疫力。Kirchdoerfer等[20]介紹了人冠狀病毒S蛋白融合前的結(jié)構(gòu),為基于β-冠狀病毒疫苗免疫原的結(jié)構(gòu)設計奠定了基礎。
本研究有助于研究者了解冠狀病毒的研究趨勢。美國、中國和德國是進行冠狀病毒研究的主要國家;西方國家之間的合作較為緊密,特別是美國占主導地位。香港大學是發(fā)表冠狀病毒相關(guān)文獻最多的機構(gòu),亦是與其他機構(gòu)建立合作關(guān)系最為緊密的機構(gòu)。發(fā)表文獻居前三位的期刊是《病毒學雜志》《病毒學》和《實驗醫(yī)學與生物學進展》。Peiris JSM、Drosten C和Ksiazek TG可能是冠狀病毒研究領(lǐng)域合作的較好人選。SARS-CoV、傳染病、冠狀病毒S蛋白可能是研究前沿,相關(guān)研究可能在未來幾年深入這些領(lǐng)域。
本研究從WoS核心數(shù)據(jù)庫中檢索和收集了冠狀病毒相關(guān)文獻的數(shù)據(jù),數(shù)據(jù)分析較全面客觀。WoS核心數(shù)據(jù)庫可提供較為詳細的數(shù)據(jù)(如國家和機構(gòu)信息、期刊來源、作者信息等),研究者對此可有一個較全面的把握。然而,本研究仍存在一定的局限性:第一,該數(shù)據(jù)庫中的大多數(shù)出版物是英文的,非英語文獻很少;部分數(shù)據(jù)庫(如PubMed、Scopus和Google Scholar)未進行分析。第二,分析軟件可處理的數(shù)據(jù)類型有限,本研究僅選取WoS數(shù)據(jù)庫中核心合集的文獻作為數(shù)據(jù)來源,未來研究可進一步豐富數(shù)據(jù)來源。第三,本研究僅對1968-2019年的國際文獻研究趨勢與特點進行討論,下一步研究可結(jié)合國內(nèi)的冠狀病毒研究做進一步分析和對比。第四,文獻計量分析的結(jié)果與實際研究情況仍存在差異,因為近期發(fā)表的部分文獻的引用率并不高。所有數(shù)據(jù)均于2020年2月2日檢索,但未納入2020年相關(guān)文獻。盡管如此,本研究包含了1968年以來的絕大多數(shù)文獻,少量新數(shù)據(jù)可能不會改變結(jié)論。