基因編輯技術的發(fā)展始于20世紀80年代,在CRISPR技術平臺出現(xiàn)后,該技術受到了學術界、產業(yè)界的高度關注,進而發(fā)展迅猛[1]。目前,該技術不僅被應用于基因功能的研究、基因治療,還被應用于動物模型的構建、動植物新品種的改造和培育等。同時,該技術能夠高效率、低成本地定點修改以及編輯更多物種的基因,其未來的發(fā)展將會對學界、產業(yè)界以及國家層面的競爭力產生一定的影響。因此,整合利用各國優(yōu)勢資源要素,開展國際合作,探索科技前沿已成為該領域研究的重要內容??紤]到國際合作論文是國際合作成果的一種重要表現(xiàn)形式[2],中日同為人類基因組計劃的亞洲參與國,兩國各自的基因編輯國際合作研究甚少有人關注,因而本文主要以國際合作論文為數(shù)據(jù)基礎,從論文發(fā)表情況、學科分布、研究熱點與前沿、合作網絡等角度,比較分析中國、日本在該領域的國際合作情況及兩國之間的異同點,為相關研究提供參考。
本文所收集的數(shù)據(jù)來自美國的科學引文索引(擴展版)數(shù)據(jù)庫(Science Citation Index Expanded,SCIE)。在SCIE中,針對基因編輯技術領域進行主題檢索。其中所采用的關鍵詞主要圍繞gene edit(基因編輯)、meganuclease(歸巢核酸內切酶)、zinc finger nuclease(鋅指核酸酶)、transcription activator-like effector nuclease(轉錄激活樣效應因子核酸酶)、clustered regularly interspaced short palindromic repeats(規(guī)律間隔成簇短回文重復序列)等方面,檢索的時間跨度為2000-2018年(檢索時間為2019年1月25日),具體檢索式為:TS=(("genome edit*" OR "gene edit*" OR "genetically edit*" OR "genetic edit*") OR (meganuclease* OR ("engineered meganuclease*") OR ("homing endonuclease*") OR ("family endonuclease*") OR ("engineered endonuclease*")) OR ("zinc finger nuclease*" OR"zinc finger endonuclease*" OR ( "Zinc Finger " AND "Protein") OR ("Zinc Finger " AND "gene") OR ("Zinc Finger" AND "peptide") ) OR ("Transcription activator-like effector nuclease*" OR ("TAL*" AND "effector nuclease*") OR ("Transcription Activator-Like Effector" AND "gene*") OR("TALEN" AND "gene*" )) OR (("Clustered Regularly Interspaced Short Palindromic Repeat") OR ("Clustered Regularly Interspaced Short Palindromic Repeats") OR ("CRISPR$") OR("CRISPER AND Cas9") OR("CRISPER AND Cas")))。經過對下載數(shù)據(jù)的清洗,最終得到32 848條論文數(shù)據(jù),8 486條國際合作論文數(shù)據(jù)。在整合論文的國家信息后,經統(tǒng)計中國該領域論文5 916篇,國際合作論文1 979篇;日本該領域論文3 061篇,國際合作論文904篇。需要說明的是,中國的數(shù)據(jù)包含港澳臺地區(qū)。在選取國際合作論文數(shù)據(jù)時,界定標準為地址字段中至少出現(xiàn)兩個國家。
本文以基因編輯領域的論文及國際合作論文為數(shù)據(jù)基礎,主要使用文獻計量法及Excel、CiteSpace、Pajek等軟件,重點分析中日兩國在該領域的國際合作發(fā)展態(tài)勢,以期把握兩國在該領域的國際合作研究現(xiàn)狀、發(fā)展趨勢以及異同點。使用社會網絡分析法,分析中國、日本在該領域國際合作網絡的特征,同時輔以可視化軟件呈現(xiàn)分析結果。
對中國、日本基因編輯技術領域的論文數(shù)量、國際合作論文數(shù)量以及發(fā)表年限進行統(tǒng)計,并計算相應發(fā)表年限的國際合作率,得到兩國國際合作歷年分布(圖1)以及兩國歷年國際合作率情況(圖2)。國際合作率是一段時間內,各國國際合作論文數(shù)占其總論文數(shù)的百分比。該比值可表示某一時間段某一國家在國際合作方面的活躍程度,比值越高活躍程度越高[3]。
從兩國論文發(fā)表總數(shù)來看, 2000-2018年中國在該領域的研究論文數(shù)呈指數(shù)型增長,同期日本在該領域的研究論文數(shù)增速較為平緩。2010年,中國在該領域的研究論文數(shù)超過日本,并在隨后的幾年中兩國之間的差距越來越大。
從國際合作論文數(shù)看,2000-2018年中國在該領域的合作論文數(shù)呈增長態(tài)勢,2018年有545篇;同期日本在該領域的國際合作論文數(shù)也同步增長,但增速不及中國迅猛,2010年后兩國之間的差距逐漸變大。
圖1 2000-2018年中日兩國基因編輯技術領域國際合作歷年分布
圖2 2000-2018年中日兩國基因編輯技術領域歷年國際合作率
從國際合作率來看,2000-2018年全球在該領域的國際合作率有一定的起伏,波動范圍為17%~30%,但整體呈增長態(tài)勢,說明全球基因編輯技術領域國際合作的活躍程度在不斷提高。在此背景下,中國該領域的國際合作率總體上維持在24%~40%之間,且自2013年以來呈現(xiàn)明顯的增長態(tài)勢,存在與全球國際合作率變化幅度明顯不同的點,主要因為中國國際合作論文數(shù)與總論文數(shù)變化幅度的差值變大。同期日本在該領域的國際合作率也并不穩(wěn)定,總體維持在16%~35%之間,整體上處于增長的趨勢,說明中日兩國在該領域的國際合作活躍程度均在逐漸提高,而且兩國的國際合作率基本上都高于全球國際合作率,說明兩國在該領域的國際化程度較高。
對中國、日本基因編輯技術領域的國際合作論文數(shù)量、總被引頻次進行統(tǒng)計,并計算兩國的篇均被引頻次、h指數(shù)以及標準引文影響指數(shù)(Normalized Citation Impact,NCI)[4](表1)。其中本部分所使用的h指數(shù)表示某一國家最多有h篇國際合作論文被引用了h次,該指數(shù)在一定程度上反映某一國家的合作論文質量;NCI為某一時間段內某一國家的國際合作論文篇均被引次數(shù)與全球的國際合作論文篇均被引次數(shù)的比值,該比值可在一定程度上代表該國在基因編輯技術領域國際合作的平均研究水平。其中全球的NCI代表全球國際合作的平均研究水平。
2000-2018年,在該領域中,雖然中國的國際合作論文發(fā)表量約是日本的2.2倍,但其總被引頻次只是日本的1.5倍,導致中國的篇均被引次數(shù)小于日本,說明中國國際合作論文的平均質量低于日本。而在h指數(shù)方面,兩國差異較小,說明兩國都有質量較高的國際合作論文。在NCI方面,中國為0.76,低于全球國際合作的平均研究水平;日本為1.11,高于全球國際合作的平均研究水平,說明中國國際合作的平均研究水平與日本還存在一定的差距。
表1 2000-2018年中日兩國基因編輯技術領域國際合作論文被引頻次
根據(jù)Web of Science類別字段整合統(tǒng)計中國、日本基因編輯技術領域的國際合作論文所屬學科信息發(fā)現(xiàn),中國該領域的國際合作論文涉及100個學科,日本該領域的國際合作論文涵蓋71個學科,其中中國國際合作包含的100個學科的合作論文發(fā)表數(shù)總和為3 021篇,日本國際合作包含的71個學科的合作論文發(fā)表數(shù)總和為1 388篇。基于國際合作論文數(shù)的中國、日本各自排名前10的該領域國際合作所涉及的學科見表2。經比較,在排名前10學科中,兩國有8個相同的學科,分別為生物化學與分子生物學,細胞生物學,多學科科學,遺傳學和遺傳性,植物學,生物工程學和應用微生物學,腫瘤學,醫(yī)學、研究和試驗;兩國分別有2個不同的排名前10的學科,中國的是生物化學研究方法和微生物學,日本的是發(fā)育生物學和免疫學。通過兩國各自排名前10學科的所占比例可知,中、日國際合作均有2個重點學科,分別是生物化學與分子生物學、細胞生物學,但日本這2個學科的占比均超過中國,其他6個相同學科在比例和排名方面均存在差異,并且日本排名前10的學科的占比存在較為明顯的分層。第一部分為排名前4的學科,其占比總和約50.79%;第二部分為排名5至10的學科,其占比總和約為20.39%。中國排名前4的學科與日本相同,占比總和約為43.32%,比日本低,說明中日兩國在該領域國際合作方面存在較高的契合度。兩國國際合作學科傾向存在的差異與各國在該領域的規(guī)劃布局、資源優(yōu)勢、生產要素等原因有較為緊密的關系,日本在其排名前4的學科方面顯示出較高的集中度。
文獻的關鍵詞是研究成果核心內容的一種重要表現(xiàn)形式[5],對其進行分析可以識別特定研究領域的熱點以及前沿主題。高頻關鍵詞或具有重要知識連接作用的高中介中心性關鍵詞均可在一定程度上反映其研究熱點。通過探測突現(xiàn)強度高的關鍵詞(即突發(fā)詞)可識別特定領域的研究前沿[6]。本文分析比較了中日兩國在基因編輯技術領域的研究熱點,并識別兩國在該領域的研究前沿。
本文利用CiteSpace軟件,選取“Keyword”(關鍵詞)作為節(jié)點類型,“Top 50”(即選取每年頻次排名前50的關鍵詞)作為參考閾值,分別繪制出中日兩國的關鍵詞共現(xiàn)圖譜(圖3和圖4)。
表2 中日兩國排名前10的基因編輯技術領域國際合作的學科分布比較
圖3 中國基因編輯技術領域國際合作關鍵詞共現(xiàn)圖譜
圖4 日本基因編輯技術領域國際合作關鍵詞共現(xiàn)圖譜
圖3和表3顯示,2000-2018年中國該領域國際合作研究中,頻次與中介中心性均較高的關鍵詞分別為expression(表達)、crispr/cas9(成簇規(guī)律間隔的短回文重復序列)、zinc finger protein(鋅指蛋白)、identification(識別)、activation(活性)、in vivo(體內)、mice(老鼠)、arabidopsis(擬南芥)?!颁\指蛋白“是鋅指核酸酶的重要組成部分,它來源于轉錄調控因子家族。ZFN技術通過鋅指蛋白構成的DNA識別域和Fok I構成的切割域實現(xiàn)定點修飾基因,至今已應用于大鼠、小鼠、斑馬魚、擬南芥等物種細胞或胚胎中[7],說明中國該領域國際合作的前期研究主要集中于對ZFN技術的應用及研究。crispr/cas9是頻次第二高的關鍵詞,說明中國的研究熱點逐漸集中于研究crispr/cas9系統(tǒng)的應用及原理,表3中關鍵詞cancer(癌癥)和human cell(人體細胞)說明中國在積極探索基因治療。
圖3中,2011年出現(xiàn)的關鍵詞mechanism(方法)也從一定程度上驗證了中國在該領域國際合作的“生物化學研究方法”學科傾向,即位列第9的生物化學研究方法。
表3 2000-2018年中國基因編輯技術領域國際合作高頻和高中介中心性關鍵詞
圖4和表4顯示,2000-2018年,日本該領域國際合作研究中頻次與中介中心性均較高的關鍵詞分別為expression(表達)、zinc finger protein(鋅指蛋白)、differentiation(分化)、transcription factor(轉錄因子)、cell(細胞)、activation(活性)、mice(老鼠)、sequence(序列)、in vivo(體內)。日本該領域國際合作的前期研究主要集中于由轉錄因子鋅指蛋白和Fok I核酸內切酶構成的ZFN技術的應用研究,并已應用于鼠、斑馬魚以及擬南芥等物種中。關鍵詞system(系統(tǒng))以及cas9于2014年開始出現(xiàn),且system的頻次較高,說明日本已開始探索新一代基因編輯技術crispr/cas9系統(tǒng)。圖4中所顯示的關鍵詞evolution(進化)、embryo(胚胎)、growth(發(fā)育)以及出現(xiàn)頻次較高的關鍵詞differentiation(分化)從一定程度上驗證了日本在該領域國際合作的“發(fā)育生物學”學科傾向。表4中中介中心性較高的關鍵詞cancer(癌癥)和圖4中human cell(人體細胞)說明日本密切關注基因治療。
中日兩國在該領域國際合作的研究熱點呈現(xiàn)一定的相似性,前期研究熱點主要是對ZFN技術的應用研究,2014年左右研究熱點逐漸集中于crispr/cas9系統(tǒng)的應用研究,兩國都密切關注基因治療。兩國的研究熱點顯示出各自的學科傾向,如中國對生物化學研究方法的關注,日本對發(fā)育生物學的關注。
在CiteSpace中,選擇術語類型為“Burst Term”(突發(fā)詞),再次運行可以得到該領域關鍵詞的突現(xiàn)強度。本文選取突現(xiàn)強度排名前20的關鍵詞,對中日兩國在該領域國際合作的研究前沿分別進行歸納并比較(表5和表6)。
表4 日本基因編輯技術領域國際合作高頻和高中介中心性關鍵詞
表5 中國基因編輯技術領域國際合作研究前沿
表6 日本基因編輯技術領域國際合作研究前沿
表5顯示,中國國際合作的研究前沿可歸納為3個方面:一是對比研究不同的基因編輯技術,如ZFN技術、TALEN技術和crispr/cas9系統(tǒng),優(yōu)化相關技術;二是拓展基因編輯技術的應用范圍,構建動物模型以進一步研究抗癌藥物或開展基因治療;三是深入研究不同基因編輯技術的原理,如zinc finger protein(鋅指蛋白)、domain(域)、messenger RNA(信使RNA)、double strand break(雙鏈斷裂)以及homologous recombination(同源重組)等。
由表6可知,日本國際合作的研究前沿可歸納為4個方面:一是研究不同的基因編輯技術,優(yōu)化相關技術;二是深入研究不同基因編輯技術的原理機制;三是通過基因編輯技術,研究基因表達的激活(activation)和抑制(repressor);四是拓展基因編輯技術的應用,如模式植物的構建、疾病模型的構建與基因治療。
從兩國國際合作的研究前沿來看,兩國存在較高的相似性,均緊密跟進基因編輯技術的新進展,同時深入研究基因編輯技術的原理與機制,拓展技術的應用(如基因治療、模式動物或植物的構建)。與中國相比,日本對運用基因編輯技術研究基因表達的激活與抑制更為關注。
利用國際合作論文數(shù)據(jù)中的國家信息,通過Pajek分別構建中日兩國的國際合作網絡。Pajek是自由可視化網絡分析軟件[8],可高效處理網絡數(shù)據(jù),具有出色的圖形展示功能。本文主要從網絡規(guī)模和結構特征的角度比較分析中日兩國在該領域的國際合作網絡。網絡規(guī)模涉及節(jié)點、節(jié)點連線數(shù)以及網絡密度3個指標,結構特征指標包含平均路徑長度和聚類系數(shù)。其中節(jié)點連線粗細表示任意兩個國家之間的合作頻次大小,它與網絡密度都可以用來衡量各國之間合作的緊密程度;平均路徑長度反映網絡的連通性,可表示國家間的知識交流與合作關系的緊密程度[9];聚類系數(shù)表示網絡的傳遞性,可反映網絡中各國之間建立合作交流的可能性[10]。
中國基因編輯技術領域國際合作網絡共涉及92個國家,以92個國家為節(jié)點,以國家間的合作關系為節(jié)點連線,得到了圖5所示的中國基因編輯技術領域的國際合作網絡。在Pajek中,通過相關指令去除重復的國家合作邊,并將刪除的國家合作間的邊的值加到沒刪除的相應邊的值上,得到1 424條節(jié)點連線。該網絡的密度為0.33,平均路徑長度為1.66,聚類系數(shù)為0.76。從圖5可以看出,中國與其他國家的國際合作存在較大的發(fā)展空間,與美國、英國、加拿大、日本、澳大利亞等國的合作較為緊密。平均路徑長度的數(shù)值表明網絡中任意2個國家合作最多只需經過2個中介國家,網絡的連通性較高說明中國可以與網絡中其他國家進行較好的知識交流,網絡中各國之間建立合作交流的可能性較大。
圖5 中國基因編輯技術領域國際合作網絡
日本基因編輯技術領域國際合作網絡共涉及88個國家,以88個國家為節(jié)點,以國家間的合作關系為節(jié)點連線,得到了圖6所示的日本基因編輯技術領域的國際合作網絡。通過Pajek中的相關指令去除重復的國家合作邊,得到1 435條節(jié)點連線。該網絡的密度為0.37,平均路徑長度為1.63,聚類系數(shù)為0.76。從圖6可以看出,日本與其他國家的國際合作也存在較大的發(fā)展空間,與美國、中國、英國、德國、法國等國的合作較為緊密。網絡連通性較高。說明日本與其他國家的知識交流較好,知識也可以得到較為廣泛的傳播,各國之間進行知識合作與交流的可能性較大。
圖6 日本基因編輯技術領域國際合作網絡
經比較可以發(fā)現(xiàn),在網絡規(guī)模方面,雖然中日兩國各自的國際合作網絡規(guī)模相似,與美國、英國等國之間的合作都較為緊密,但中國的網絡密度小于日本,說明日本與其他國家的合作更為緊密。在結構特征方面,兩國的數(shù)值相差不大,說明兩國的國際合作網絡均具有較好的連通性和傳遞性,都可以與網絡中的其他國家進行較好的知識交流與合作,且網絡中各國之間進行合作交流的可能性較大。
通過對2000-2018年中日兩國基因編輯技術領域國際合作論文的分析,可以得出以下結論。
一是中日兩國在基因編輯技術領域的論文及國際合作論文發(fā)表數(shù)均呈增長態(tài)勢,但兩國增速存在較大差異。中國的增速迅猛,論文及國際合作論文發(fā)表數(shù)均從落后日本的狀態(tài)進入反超日本的狀態(tài);而日本的增速較為平緩,與中國的差距逐漸變大。
二是中日兩國近年來在基因編輯技術領域的國際合作率雖均有起落,但整體上呈增長態(tài)勢,說明兩國的國際合作活躍程度在逐漸提高。
三是中日兩國均有質量較高的國際合作論文,但中國國際合作論文的平均質量不及日本,中國在該領域國際合作的研究水平也低于日本,說明中國在SCIE國際合作論文的質量方面仍有待提高。
四是從中日兩國國際合作的學科傾向、研究熱點以及研究前沿可知,兩國在基因編輯技術領域國際合作方面存在較好的契合性,兩國可進一步加深合作。兩國國際合作方向差異性與國家層面的規(guī)劃、資源優(yōu)勢等有一定的關系,如應用微生物技術是中國的傳統(tǒng)優(yōu)勢[11],而日本學者率先報道了與發(fā)育生物學密切相關的誘導性多功能干細胞[12]。
五是中日兩國各自的國際合作網絡規(guī)模相似,兩國與其他國家的合作均存在較大的發(fā)展空間,且合作較為緊密的國家包括美國、英國。與中國相比較,日本與其合作網絡中的其他國家的合作更為緊密。兩國在各自的合作網絡中均具有較好的知識交流及擴散性。