楊永昌,常 帥,趙欣宇
(解放軍總醫(yī)院第七醫(yī)學中心檢驗科,北京 100010)
基因組編輯技術的迅猛發(fā)展引起科學界的廣泛重視?;蚪M編輯技術與基因克隆技術差異很大,它的設計操縱簡便,可在特定位點進行DNA序列的敲除、插入、突變等操作,對生物學的基礎研究及應用具有重大貢獻。
1.1 概述 目前常用的基因編輯技術有3種:真核轉錄因子的鋅指核酸酶(ZFN)[1],轉錄激活物樣效應器核酸酶(TALEN)[2-3]和CRISPR-Cas系統(tǒng),即聚集且規(guī)則的間隔短回文重復序列(CRISPR)和相關蛋白質(CRISPR-associated,Cas)系統(tǒng)[4-5]。ZFN、TALEN 和 CRISPR-Cas系統(tǒng)同屬于人工核酸內切酶(EEN)技術,用于基因組的定點編輯。
EEN的結構包括DNA結合結構域和DNA切割結構域兩部分。分別用于特異性識別DNA和切割DNA以形成DNA雙鏈斷裂(DSB)。DSB可以修復內源性的DNA損傷,包括非同源末端連接和同源性定向修復,利用這個過程產(chǎn)生的基因突變進行遺傳改造[6-7]。非同源末端連接的出錯率較高,重復修復同一斷裂位點會導致DNA在靶點處的插入或缺失[8],從而改變閱讀框,并使靶基因的表達遭到破壞,導致mRNA降解或產(chǎn)生非功能性蛋白,并達到基因敲除的結果[8-9]。同源性定向修復則通過含有來自外部的與DSB同源序列的模板DNA參與修復過程,并將目的基因連接到模板DNA上,然后將其整合到DSB的內源性位點中,實現(xiàn)精確的基因組序列修改,即基因敲入[6]。
1.2 CRISPR-Cas技術 CRISPR-Cas作為細菌的適應性免疫系統(tǒng),廣泛存在于細菌和古生菌的染色體上,與其免疫相關。當外源病毒或質粒DNA進入細胞時,專門的Cas蛋白將外源DNA剪成小片段,并將它們粘貼到連續(xù)的DNA片段中,稱為CRISPR序列。然后,Cas蛋白表達并加工CRISPR基因座以產(chǎn)生CRISPR RNA(crRNA)。通過序列同源性,這些crRNA基于序列特異性將Cas復合物靶向到外源DNA,并切割目標DNA以干擾外來入侵者。在基因編輯過程中,與ZFN和TALEN的DNA結合結構域的構建需要執(zhí)行蛋白融合過程相比,CRISPR-Cas技術利用設計的特異性向導RNA分子(sequence-specific guide RNA)作為DNA結合結構域替代了蛋白融合過程,大大降低了技術難度,從而表現(xiàn)出了極大的優(yōu)勢。
2.1 CRISPR技術的發(fā)展 1987年,ISHINOY等[10]研究組在分析大腸桿菌iap基因及周邊序列時發(fā)現(xiàn)iap基因3'端含有29個核苷酸高度同源重復序列,它們被含32個核苷酸的序列間隔開。但當時人們并不知道這些重復序列的作用。2000年,西班牙研究者MOJICA FJ等[11]在多種微生物中也陸續(xù)發(fā)現(xiàn)這類重復性序列。直到2002年,JANSENR等[12]觀察了大量細菌和古細菌基因組后,首次提出CRISPR,其代表了同一類特征明顯、排列整齊、秩序一致的重復序列,總稱為Clustered Regularly Interspaced Short Palindromic Repeats CRISPR。多個CRISPR相關基因則被命名為Cas(CRISPR-associated)家族。CRISPR序列用于微生物對噬菌體的免疫被BARRANGOUR等人證實[13],并揭示出CRISPR序列在微生物中的主要功能。
嗜熱鏈球菌廣泛用于乳制品行業(yè)制作酸奶和奶酪,2007年,Danisco公司的Horvath與其同事試圖解決嗜熱鏈球菌免受噬菌體攻擊這一問題。他們通過實驗證實CRISPR系統(tǒng)確實是一種適應性免疫系統(tǒng):嗜熱鏈球菌被病毒入侵后,它整合了來自噬菌體基因組中的一個新間隔序列,當同一種病毒再次入侵時,細菌對其的攻擊便具有了抵抗力。如果改變特定間隔區(qū)序列,則會影響細菌抵抗噬菌體的免疫功能。他們還研究了Cas7和Cas9,認為Cas9蛋白可能是產(chǎn)生這種免疫能力所必需的。2008年,John van der Oost研究團隊率先在大腸桿菌中發(fā)現(xiàn)被轉錄成的小RNA,推測其可來自噬菌體的間隔序列,并稱該RNA為CRISPR RNA(crRNA),可引導Cas蛋白至靶DNA上;Marraffini和Sontheimer在同年證明了CRISPR-Cas系統(tǒng)的目標分子是DNA,他們還明確指出,如果將CRISPR-Cas轉移到非細菌系統(tǒng)中,也可成為一種強悍的系統(tǒng)。2010年12月,Moineau團隊證明了CRISRP-Cas9在PAM序列上游位置精確切割,使DNA雙鏈斷裂。而作為Ⅱ型CRISPR系統(tǒng)的顯著特征,Cas9是切割唯一需要的蛋白,它與crRNAs共同介導CRISPR-Cas9的干擾功能;2011年,Charpentier研究組對釀膿鏈球菌進行了小RNA測序,發(fā)現(xiàn)除了crRNA以外,還有一種小RNA,稱為式激活CRISPR RNA(tracrRNA)。tracrRNA通過24個核苷酸與crRNA中的重復序列互補配對與形成雙鏈,引導Cas9到其目標DNA;至此,天然CRISPR-Cas9干擾機制的拼圖基本拼搭完整[14-15]。2011年7月,Siksnys團隊從嗜熱鏈球菌(Ⅱ型系統(tǒng))中克隆了整個CRISPR-CAS基因座,并在沒有Ⅱ型系統(tǒng)的大腸桿菌中表達,實現(xiàn)了對質粒和噬菌體DNA的靶向干擾;2012年6月和9月,Charpentier、Doudna團隊與Siksnys團隊,先后發(fā)表了CRISPR-Cas系統(tǒng)應用于基因編輯的論文,他們在體外系統(tǒng)中證明了crRNA通過堿基互補配對與tracrRNA形成雙鏈RNA,指導Cas9蛋白在目標DNA上切割,引起雙鏈斷裂,精確的平端切割點位于PAM上游3個核苷酸位置[16]。tracrRNA: crRNA在被融合為單鏈向導RNA(single guide RNA,sgRNA)時也可以發(fā)揮指導Cas9的作用,此外,crRNA可以減少到20nt,仍足以有效切割;通過改變crRNA的序列可以重新定位Cas9的靶向位點[15]。2016年,有研究發(fā)現(xiàn)一種來自纖毛菌(Leptotrichiashahii)的CRISPR酶Cas13a(C2c2)蛋白具有RNA介導的RNA酶功能,8個月后,他們又發(fā)現(xiàn)了另一種同類酶Cas13b[17]。目前為止,CRISPR技術在微生物混合篩選方面也有相關的應用。
2.2 CRISPR技術的分類 根據(jù)Cas蛋白在細菌免疫防御過程中的不同功能,將CRISPR/Cas系統(tǒng)分為兩大類:一類是單亞基蛋白完成特異性靶向及切割過程,其作用分子是相對單一的Cas蛋白,例如Ⅱ型Cas9蛋白和Ⅴ型的Cpf蛋白,目前該類系統(tǒng)僅發(fā)現(xiàn)于細菌中;另一類則是多亞基結構的crRNA-蛋白復合體完成crRNA加工、靶向定位及剪切,包括Ⅰ型、Ⅲ型和Ⅳ型,該系統(tǒng)在細菌及古細菌中廣泛存在[18]。然而因CRISPR/Cas系統(tǒng)更為龐雜,因此還未得到廣泛應用,而單亞基蛋白因其原理及操作淺易而被廣泛使用[19-20]。CRISPR/Cas技術于2013年正式用于DNA編輯修飾中,與ZFN和TALEN相比,該技術的性價比更為優(yōu)越[4]。它的不斷研究和發(fā)現(xiàn)給生物學的發(fā)展和臨床應用帶來了巨大的變化。
CRISPR-Cas9系統(tǒng)并非天生就是為人類使用而產(chǎn)生的。它的本質其實是細菌中一種對付病毒等外來DNA的防御系統(tǒng)。Cas9 蛋白是CRISPR系統(tǒng)中最常用的切割組件,在CRISPR系統(tǒng)的基因編輯過程中,首先被轉錄和表達的是tracrRNA、pre-crRNA和Cas9蛋白,然后tracrRNA會對precrRNA進行修飾,通過啟動RNA酶Ⅲ形成成熟的crRNA;最終crRNA、tracrRNA和Cas9 蛋白會形成復合物,通過識別crRNA將復合物靶向目標DNA,同一時間,Cas9 蛋白被激活并發(fā)揮切割目的DNA的作用,最終可使DNA雙鏈斷裂從而產(chǎn)生DSBs[21]。DSB可以激活內源性DNA損傷修復。簡化識別組件單鏈向導RNA(sgRNA)可取代crRNA和tracrRNA。在sgRNA的靶序列下游的PAM序列是確保復合體的成功識別的關鍵,PAM 位于靶向DNA 3′端后,可被sgRNA和Cas9蛋白復合體識別[22-23]。該系統(tǒng)經(jīng)過上述過程在生物體內實現(xiàn)基因的敲除、敲入和替換等基因編輯操作,使生物體表現(xiàn)出與編輯前不同的特性,實現(xiàn)特定的生物學功能。
近年來,Science雜志曾多次將CRISPR技術及其相關成果評選為全球年度十大科技突破之一。CRISPR基因編輯技術不僅是理想的基因編輯工具,更為改造生物體提供了新的手段。
4.1 CRISPR-Cas系統(tǒng)在哺乳動物細胞中的應用 2013年以來,很多科學家將CRISPR-Cas系統(tǒng)成功地應用到了哺乳動物細胞中。其中,Church研究組設計了Ⅱ型CRISPR-Cas系統(tǒng),在人293T細胞、K562細胞以及誘導多能干細胞(induced pluripotent stem cells, iPSC)中通過設計sgRNA成功靶向特定序列,且多個gRNA可以實現(xiàn)對目標基因的多重編輯[5]。Qi研究組則建立了CRISPRi系統(tǒng),將Cas9改造為失去核酸內切酶活性的dCas9,通過sgRNA的指導定點結合到目標基因座上,從而抑制目標基因的表達[24]。WUY等人利用CRISPR-Cas9系統(tǒng)對Crygc顯性突變的小鼠進行基因治療使其獲得了健康的后代,為CRISPR-Cas9 系統(tǒng)用于遺傳疾病的基因治療提供了依據(jù)[25]。之后,MIZUNOS等人利用CRISPR-Cas9技術成功構建了酪氨酸酶基因(Tyr)突變的白化病小鼠模型[26]。
4.2 CRISPR-Cpf1的發(fā)現(xiàn) 2015年,CRISPR-Cpf1被發(fā)現(xiàn)。Cpf1蛋白是一種比spCas9蛋白更小更簡單的核酸內切酶,自然形態(tài)下僅需要一條RNA引導。Cpf1蛋白切割DNA后產(chǎn)生黏性末端,便于新DNA序列插入。Cpf1識別富含胸腺嘧啶(T)的PAM序列,這也擴展了基因編輯靶點的選擇范圍,也使得CRISPR-Cpf1系統(tǒng)在特異性和多基因編輯方面擁有了很大的優(yōu)勢。
4.3 Cas13RNA酶的發(fā)現(xiàn) 2016年,張鋒實驗室發(fā)現(xiàn)一種來自纖毛菌(Leptotrichiashahii)的CRISPR酶Cas13a(C2c2)蛋白,具有RNA介導的RNA酶功能。8個月后,他們又發(fā)現(xiàn)了另一種同類酶Cas13b,Cas13可以在不破壞DNA的情況下與RNA結合并切割RNA,實現(xiàn)細菌的自衛(wèi)[27]。且在cas13系列中的cas13b(C2c6)和cas13d也具有同樣的特征[28-29]。RNA水平的編輯是可逆及可變的。開發(fā)和利用動態(tài)調控元件,控制該通路的調控程度及時間,將具有廣闊的應用前景。
隨著CRISPR基因編輯技術的迅速發(fā)展,其應用范圍也不斷擴大,特別是在生物的基因定點編輯、基因組篩選、基因轉錄調控、基因組成像、基因診療、生態(tài)應用等領域的研究與應用,取得了突破性進展。目前,基因編輯技術主要應用于生命科學、醫(yī)學、農(nóng)業(yè)與環(huán)境科學等領域。
5.1 CRISPR/Cas9技術在生命科學中的應用 CRISPR/Cas9技術高效便捷的特點極大地縮短了修改傳統(tǒng)真核生物模型和細胞系基因組所需的時間,開啟了基因編輯技術領域新篇章,為第三代基因編輯技術。該技術可以在幾周到幾個月內完成以前用改良的胚胎干細胞,耗時1~2年才能完成的基因敲除小鼠模型的構建[30-31]。因此,CRISPR/Cas在生物學研究發(fā)展中最主要的應用是動、植物和細胞模型的建立。研究人員可以使用這些專門創(chuàng)建的模型來復制在人類中發(fā)現(xiàn)的基因變體[32]。同時,研究人員還可以利用這些疾病模型更加精確地研究疾病發(fā)生的機制,為其治療開發(fā)新的思路。有研究報道稱,通過Cas9介導的基因驅動可以加速小鼠模型的產(chǎn)生,靈長類動物模型同樣適用[33-34]。研究人員通過Cas9介導的基因編輯創(chuàng)建了亨廷頓舞蹈癥的豬模型,以研究這種特定動物模型中的疾病[35]。2016年,Science雜志在同一期發(fā)表了3個研究機構成功使用CRISPR治療遺傳性疾病動物模型的方法[36-38]。他們利用CRISPR系統(tǒng)編輯Dystrophin基因,能夠不同程度修復杜氏肌營養(yǎng)不良癥(Duchenne muscular dystrophy,DMD)小鼠的肌肉功能,從而達到治療DMD的效果。2018年,LONG C等人將肌營養(yǎng)不良患者的干細胞進行修飾,最終使其健康表達[39]。此外,研究人員還使用CRISPR/Cas在特定細胞中進行多種基因敲除,更快地模擬疾病用以研究其生物學過程[40-43]。
5.2 CRISPR/Cas9技術在遺傳性疾病中的應用 CRISPR/Cas9系統(tǒng)在遺傳性疾病治療的應用中表現(xiàn)出明顯的優(yōu)勢,主要歸因于其強大的基因編輯能力。文獻報道的已應用該技術治療的遺傳性疾病包括:杜氏肌營養(yǎng)不良[44]、α1-抗胰蛋白酶缺乏癥[45]、Crygc基因突變引發(fā)的白內障[46]、X連鎖慢性肉芽腫病[47]和囊性纖維化[48]等。此外,CRISPR/Cas9系統(tǒng)還可以和誘導性多能干細胞(induced pluripotent stem cells,iPSC)技術相結合,可以為血友病B[49]、地中海貧血[50]以及鐮狀細胞性貧血[51]患者定制個性化治療方案。
5.3 CRISPR/Cas9技術在其他疾病治療中的應用 CRISPR/Cas9技術通過對免疫相關基因的編輯與免疫療法相結合,使其在相關疾病治療的領域中不斷取得突破性進展。由于G蛋白偶聯(lián)因子超家族成員CCR5基因缺失的血細胞對人類免疫缺陷病毒Ⅰ型(HIV-1)進入具有抗性,CCR5基因已成為治療HIV-1感染的理想靶點[52]。研究表明,利用CRISPR/Cas9技術將供者CD34+成體造血干細胞的CCR5基因敲除,將其移植到HIV-1感染的患者中,便可穩(wěn)定重建造血系統(tǒng),在之后的觀察中未發(fā)現(xiàn)基因編輯造成的脫靶及其他不良反應,證明了CRISPR/Cas9治療AIDS和白血病的可行性和安全性[53]。除此之外,由于免疫檢查點分子PD-1可促進細胞的凋亡且只能在活化的T細胞中表達,敲除PD-1可以抑制細胞周期檢查點,從而延長活化的T細胞的存活時間以完善CAR-T療法。用CRISPR/Cas9技術敲除PD-1顯著增加了血液中免疫活性T細胞的數(shù)量,進而可以使腫瘤生長得到抑制[54]。
5.4 CRISPR/Cas9技術在農(nóng)業(yè)與環(huán)境科學等領域的應用隨著CRISPR/cas9技術的快速發(fā)展,由于其操作簡單、高效、成本相對較低,使得該技術在農(nóng)作物育種、改良性狀等方面都顯現(xiàn)了巨大的優(yōu)勢,通過調控基因的表達獲得農(nóng)作物高產(chǎn)、抗病、抗逆等優(yōu)良品種。目前,除了應用于玉米、大豆等大型農(nóng)作物商品品種以外,研究人員已將其應用于不同的物種,例如六倍體面包小麥和蘑菇等。
CRISPR/Cas9技術在環(huán)境科學等方面也具有巨大的應用潛力。蚊蟲是瘧疾、登革熱、黃熱病、寨卡病等多種疾病的傳播媒介,有效防治蚊蟲可以大大減少蚊媒傳染病的發(fā)生。利用基因編輯技術開發(fā)的基因驅動系統(tǒng)將CRISPR/Cas9技術與基因驅動結合是防治蚊蟲新方法。目前,科研人員正通過昆蟲不育技術、RNA干擾技術、攜帶顯性致死基因昆蟲的釋放技術和基因改造技術降低了野外蚊蟲種群數(shù)量或傳播疾病的能力,控制蚊蟲及蚊媒傳染病,最終達到戰(zhàn)勝由蚊子傳播的疾病從而保護人類健康的目的。
利用CRISPR-Cas系統(tǒng)進行基因編輯后,將產(chǎn)生不同的突變,目前基因編輯位點檢測方法最常用的有3種[55]:Sanger測序的靶點檢測方法、T7E1法和高通量二代測序(NGS)。
6.1 Sanger測序的靶點檢測方法 在該方法中,編輯位點序列通過特定引物擴增進行測序,測序結果顯示為正常的純合子突變類型,若測序結果為雙峰,應觀察雙峰位點是否從切割位點附近開始,然后構建克隆T 載體,選取多個克隆進行Sanger測序,從而獲得多種突變類型。此方法只適用于少量基因編輯的檢測,費時且昂貴。
6.2 T7E1法 這種方法通過特異切割不匹配的分子來檢測突變。它可以識別和切割不匹配的異源雙鏈DNA,并檢測高達12nt的插入和刪除[56]。它適用于任何目標序列,但其靈敏度較低。
6.3 高通量二代測序(NGS) 利用該技術,可對編輯物種的整個基因組進行測序,以獲得所有序列信息。目前,該方法用于分析CRISPR-CAS系統(tǒng)的未命中率。通過全基因組測序可檢測多種細胞的基因序列信息,并將獲得的SNP、Indel和SNV進行比較,以評估其編輯結果和缺失[57]。
CRISPR-Cas系統(tǒng)的出現(xiàn)為編輯動植物和微生物的基因組提供了有力的工具,促進了合成生物學的發(fā)展。該方法具有方便、快捷、高效等特點,已經(jīng)成為目前生物界最為新穎熱門的技術之一。作為革命性基因編輯工具,它擁有強大的修飾功能,在人類疾病治療中必將發(fā)揮重要作用。但對人類基因的修飾會引發(fā)一系列的類倫理問題,相關管理機構應給予足夠的重視,防止該技術可能帶來的負面影響。