李文,曹俊國,曹滿園,李丹麗,許保增
(中國農業(yè)科學院特產研究所特種經濟動物分子生物學重點實驗室,長春 130112)
基因編輯是一種對生物體基因組特定位點進行精確修飾的技術,通過對基因片段的敲除、敲入及替換,實現(xiàn)對生物體某一特性或性狀的改變。最早的基因編輯技術出現(xiàn)在1986年,Thomas 等[1]通過基因打靶成功將抗藥基因導入新霉素抗藥缺陷細胞,使細胞重新恢復抗藥性,其主要是利用了基因的同源重組原理。隨后,基因編輯技術不斷發(fā)展完善,先后出現(xiàn)了人工鋅指核酸酶(Zinc finger nucleases,ZFN)技術、類轉錄激活因子效應物核酸酶(Transcription activator-like effector nucleases,TALENs)技術,與傳統(tǒng)基因編輯技術相比,新型技術具有更高的效率和打靶準確率,在生物基礎研究、基因治療、遺傳改造等領域展現(xiàn)了巨大的潛力。2013年,Zhang 等[2]開發(fā)了利用規(guī)律性重復短回文序列簇(Clustered regularly interspaced short palindromic repeats/Cas endonuclease,CRISPR/Cas)系統(tǒng)對基因靶向編輯的新技術,大幅度提高了基因編輯的效率和可靠性,且相比前兩種技術,其操作更加簡便、成本較低。CRISPR/Cas 成為第3 代新型基因編輯技術,適用于包括生物技術、醫(yī)藥及臨床在內的多種生物領域,掀起了國內、外基因編輯的熱潮。
ZFN、TALEN 及CRISPR 技術都可以認為是一種用來糾正和編輯遺傳缺陷的基因剪刀,三者在工具或方法上有差異,但原理基本是相同的。通過誘導雙鏈DNA 斷裂(DNA double strand breaks,DSBs),激活DNA 的自我修復機制,包括非同源末端連接修復(Non-homologous end-joining ,NHEJ)或同源重組修復(Homology-directed repair,HDR)兩條途徑。NHEJ是一種低保真度的修復過程,在DSBs 修復重連的過程中易發(fā)生堿基的隨機插入或丟失,導致移碼突變使基因失活, 實現(xiàn)目的基因敲除。若存在一個外源性供體基因序列,NHEJ 也會將其連入DSBs 位點,從而實現(xiàn)定點的基因敲入。而HDR 過程相對具有較高的保真度,在一個帶有同源臂的重組供體存在的情況下,供體中的外源目的基因會通過同源重組過程完整的整合到靶位點,不會出現(xiàn)隨機的堿基插入或丟失。如果在一個基因兩側同時產生DSB,在一個同源供體存在的情況下,可以進行原基因的替換。
鋅指核酸酶由特異識別DNA 的鋅指蛋白(Zinc finger protein,ZFP)和FokⅠ核酸內切酶的剪切結構域兩部分構成,是一種人工合成的融合蛋白。鋅指結構(ZF)是ZFP的基本結構單位,存在于大多數(shù)蛋白質中的一種蛋白基序,1983年首次在非洲爪蟾的轉錄因子TFⅢA 中被發(fā)現(xiàn)[3]。ZF 在不同的物種間具有差異性,至今已發(fā)現(xiàn)了十幾種不同結構,主要表現(xiàn)在鋅指數(shù)目和相鄰鋅指間連接長度的不同。鋅指核酸酶的N 端是多個Cys2-His2 鋅指蛋白組成,每個蛋白可以識別DNA 雙螺旋大溝的3bp 片段,同時早期有研究發(fā)現(xiàn),帶有3 個ZFP 的結構域能識別出9-18bp 的DNA 序列[3]。因此,可以構造不同的ZFP 結構域來特異識別DNA片段,目前,構造方法主要有直接構造法、模塊組裝法、文庫篩選Wolfe 庫、CoDA 法等。其中,應用較多的一種是模塊組裝法,即通過鋅指模塊(能識別連續(xù)3 個堿基的鋅指作為1 個“模塊”)預選庫進行大量組合,能夠識別多達64 種核苷酸三聯(lián)體[4]。另一種寡聚體庫工程法產生的ZFNs 對靶基因有更高的親和性和特異性,但此方法目前未能設計出針對任意序列的核酸酶。將人工設計產生的ZFP 與非特異性FokⅠ剪切結構域結合形成具有活性的二聚體,即可對目標基因進行特異剪切。
ZFN 作為第一項被廣泛使用的基因剪切工具,在小鼠、大鼠、玉米、斑馬魚及人類細胞中的技術建立已經較為成熟。2002年,Bibikova 等[5]利用ZFN 成功敲除果蠅X染色體上的Yellow基因,并且此變異能夠穩(wěn)定遺傳到下一代,證明了ZFN可應用于動物的轉基因研究。2010年,Watanabe 等[6]用ZFN 將豬原代成纖維細胞中穩(wěn)定表達的增強型綠色熒光蛋白成功敲除,經檢測分析,ZFN 誘導的突變包括在其切割位點的堿基插入或敲除、替換,為轉基因豬的模型建立提供了一個方向。盡管ZFN 已在各領域廣泛應用,但仍存在一些問題:1)ZFN 設計成本大、耗時長,并且目前不能設計針對任意靶基因序列相應的ZFN;2)ZFN 切割后的細胞易產生毒性,且脫靶效應較高;3)目前尚無法實現(xiàn)人工鋅指核酸酶的大規(guī)模生產和高效篩選。
與ZFN 類似,TALEN 是由特異識別結合DNA 的Tale 蛋白和FokI 核酸內切酶融合組成。Tale 蛋白是一類從植物病原菌黃單胞菌屬分離出的效應蛋白。2009年,Moscou[7]發(fā)現(xiàn)了Tale 蛋白特異識別并結合DNA 的作用機制。2011年,Cermak[8]首次將改造的Tale蛋白與FokI核酸內切酶構建了TALEN技術,并證實其能定向修飾基因組,此后有大量實驗證明,此技術在人類細胞、小鼠、大鼠、斑馬魚等不同物種均適用[9-11]。Tale 蛋白結構包括N 端轉運信號、C 端核定位信號和轉錄激活結構域,中間是一段高度保守的串聯(lián)重復區(qū)。串聯(lián)重復區(qū)一般由1.5~33.5 個基本單元組成,每個基本單元包含33~35 個氨基酸殘基,其中第12 位和第13 位殘基存在差異,其他位氨基酸殘基相同。因此,第12 位和第13 位殘基又稱為重復可變雙殘基(Repeat variable di-residue,RVD),決定了Tale 蛋白與DNA 堿基的特異識別。另外,有研究認為,第12 位殘基主要起穩(wěn)定RVD 環(huán)的作用,而第13 位氨基酸殘基才真正具有特異識別堿基的功能[12]。RVD 與堿基的識別具有穩(wěn)定的一一對應關系:NI(Asn 和Ile)識別A 堿基、HD(His 和Asp)識別C 堿基、NG(Asn 和Gly)識別T堿基、NN(Asn)識別G/A 堿基及NS(Asn 和Ser)可任意識別4 種堿基[13]。每個基本單元可識別一個核苷酸,并可以任意順序組合。因此,在識別靶序列的特異性上,TALEN 比ZFN 更具有明顯優(yōu)勢。
隨著對TALEN 的深入探索,對靶位點的選擇變得更加靈活,使其在基因修飾中應用日益廣泛。尋找一種便捷、成本低且效果好的TALE 蛋白合成方式成為TALEN 建立的一個關鍵點。目前,人工構建TALE方法主要有:1)Gateway 組裝法,最早的構建方法[14],缺點是成本高且成功率低;2)Golden Gate 組裝法,其主要特點是利用BsaI、BsmBI 等限制性核酸內切酶產生多個不同的黏性末端,再用連接酶拼接成所預想的Tale 重復單元,實現(xiàn)多個模塊的高效連接[15]。此外,還有限制性酶切連接法、單元組裝法等。
CRISPR 普遍存在于90%古細菌和40%細菌中,最早是1987年日本學者在Escherichia coli 染色體上發(fā)現(xiàn)的[16],但在當時其蘊含的生物學意義并沒有被人所察覺。直到2005年,有報道稱CRISPR 能夠通過入侵的噬菌體DNA獲得一段新的DNA序列,且與細菌的天然免疫防御有關[17]。2012年,研究發(fā)現(xiàn),CRISPR/Cas9 實際上是一種由RNA 引導的核酸內切酶[18],能夠靶向切割再次入侵的外來基因組,用來引導的RNA 被稱為向導RNA(guideRNA,gRNA,又被稱為crRNA)。2013年,CRISPR/Cas9 技術正式用于DNA 編輯修飾中,與前兩種技術相比,該技術的構建成本大大降低、操作更加便捷、編輯效率也更高效,其不斷地研究發(fā)現(xiàn)及應用為生物學領域的發(fā)展帶來巨大變革。
CRISPR 系統(tǒng)根據(jù)CAS 蛋白的不同分為3 種,其中Ⅰ型和Ⅲ型依靠多個效應蛋白共同發(fā)揮作用;Ⅱ型僅需單一效應蛋白,如Cas9、Cpf1、C2c1、C2c2 蛋白等。因此,建立以單個效應蛋白為基礎的CRISPR 平臺成為首選。不局限于基因組編輯,近年來,一種新型核酸C2c2(現(xiàn)被稱為Cas13a)被發(fā)現(xiàn)[19],DNA和RNA都可編輯,現(xiàn)已應用于病毒細菌檢測、癌癥早期診斷及遺傳疾病治療等多方面,其應用價值非常具有潛力。
CRISPR基因座主要由一段前導區(qū)(Leader)、多個高度保守的重復序列(Repeats)和高度可變的間隔序列(Spacers)交叉排列組成[20]。crRNA 便是由Spacer轉錄得來。CRISPR 基因座前是一段Cas 基因,用來合成相關蛋白。Cas 基因前有一段被稱為促crRNAs成熟的轉錄活化RNA(Trans-activating crRNA,tracrRNA)的區(qū)域,作用是與crRNA 結合構成RNA 雙鏈體tracerRNA:crRNA,引導Cas9 蛋白對靶序列進行切割。
天然Ⅱ型CRISPR/CAS 防御機理主要分為3 個階段。第1 階段,整合外來噬菌體或質粒的一小段基因片段構成新的間隔序列;第2 階段,由spacer區(qū)域轉錄的前體crRNA,在Cas 蛋白和核酸酶的作用下形成成熟的crRNA,成熟的crRNA 與tracerRNA 和Cas9合成復合體;第3 階段,單鏈引導RNA(sgRNA)識別入侵的DNA 片段與之結合,指導核糖核蛋白復合體對其進行切割。其中在第3 階段,Cas9 蛋白通過與原間隔區(qū)序列鄰近基序(Protospacer adjacent motif,PAM)和sgRNA 共同作用,識別PAM 位點,對PAM臨近序列進行解旋,緊接著Cas9 蛋白發(fā)生構象重排具有切割活性,對2 條單鏈DNA 切割。
CRISPR/Cas9 系統(tǒng)主要由特異引導gRNA 和內切酶Cas9 2 部分構成。其基本工作原理是根據(jù)目標序列設計出gRNA,5'端序列與靶基因互補以及3'端序列能與Cas9 結合,從而定位PAM 前3~5 個堿基距離的任一序列進行敲除、插入及突變等修飾。對于gRNA的設計可以通過在線網站(Optimized CRISPR Design.com 等)進行。該系統(tǒng)能否順利發(fā)揮作用的關鍵之一就是避免脫靶問題,這是gRNA 設計中的重要一點,目前脫靶效應的解決仍處在初期階段,但一些準則及設計算法已被提出,利用生物學信息工具盡可能選擇出特異性最強的目的序列,如一些脫靶效應評估軟件等。
對于轉運CRISPR/Cas9 進入細胞,目前主要有3種方式:1)利用質粒載體,將帶有Cas9 基因片段和gRNA 基因片段的質粒轉入細胞體內,在細胞內通過轉錄翻譯表達Cas9 蛋白,其不足之處在于其過程可能需要較長的時間,且存在脫靶問題,易引起機體自身免疫反應[21,22];2)轉運Cas9mRNA 和人工合成的gRNA,此方法相較于質粒轉染脫靶率低、生物毒性低[23],但此方法的穩(wěn)定性最差;3)將帶有定位信號(NLS)的純化Cas9 蛋白以活性形式導入細胞,例如,使用iTOP(Induced transduction by osmocytosis and pro-panebetaine)運載系統(tǒng)可有效的將蛋白質與其他化合物導入細胞內,有研究表明iTOP 運載Cas9/gRNA復合體進入人體胚胎干細胞,其基因編輯效率達到26%[24]。目前,質粒轉運是最常使用也較為穩(wěn)定的一種方式,但隨著蛋白質和核酸運載體的發(fā)展,或許能為CRISPR/Cas9 的轉載提供更為安全有效的思路。
基因編輯的目的之一是為了實現(xiàn)基因治療,嘗試從基因水平上對遺傳疾病的發(fā)生進行調控,因此,基礎動物模型的構建是關鍵的一步。自CRISPR/Cas9 技術應用以來,被廣泛用于生物模型的建立。2013年,3個實驗室成功實現(xiàn)了對小鼠細胞的單基因、雙基因及多基因的敲除[25-27]。同年,Hwang 等[28]利用CRISPR系統(tǒng)成功在斑馬魚胚胎中進行基因的定點修飾,為脊索動物的研究提供了合適的模式生物。Friedland 等[29]用顯微注射將攜帶gRNA/cas9 的質粒轉入秀麗線蟲胚胎中,實現(xiàn)了個體水平的基因敲除。2014年,中國科研人員首次利用CRISPR/Cas9 對食蟹猴進行精確基因編輯,獲得了一批定向突變的基因工程猴[30],由于靈長類動物與人類同源性較高,這一研究為之后人類疾病的研究提供了很好的研究模型。
培育攜帶遺傳缺陷的小鼠品系是研究癌癥相關突變作用的一種方法,然而常規(guī)培育癌突變小鼠耗時耗力。2014年,Zhang等[31]找到了一種替代方法,用CRISPR 系統(tǒng)將致癌突變基因導入成年小鼠肝臟中,建立攜帶癌基因的小鼠模型,大大降低了研究成本,為癌癥的多方面研究提供了便利。在癌癥小鼠模型中,對體內功能性變異進行高通量檢測,用sgRNA 進行標記,繪制小鼠體內腫瘤抑制因子的臨時功能癌癥基因組圖譜[32],揭示了在免疫功能小鼠中多種突變導致的肝癌發(fā)生,而以往的研究只針對一些經典的致癌基因,缺乏對癌癥發(fā)生過程中其他基因作用的全面評估。
此外,Pcsk9 基因的缺失能夠降低心臟病的發(fā)病率[33],因此,有學者用眼球注射的方法將靶向作用Pcsk9 基因的gRNA/Cas9 載體轉入小鼠體內,結果表明,小鼠肝臟細胞中50%的Pcsk9 產生突變,其表達量也下降了90%[34]。盡管尚未驗證在人體內敲除Pcsk9是否會出現(xiàn)副作用,但是這是科學家首次嘗試用CRISPR/Cas9 系統(tǒng)敲除基因進行基因治療,證明了其可行性。此外,酪氨酸血癥、高血氨癥、杜氏肌營養(yǎng)不良(DMD)、視網膜營養(yǎng)不良等疾病的治療研究中,都嘗試了在小鼠模型中進行基因敲除治療。
目前,大量關于CRISPR/Cas9 的基因治療試驗已有報道,揭示了技術上存在的問題:DNA傳遞效率不理想、HDR 效率較低、脫靶效應等。但盡管如此,CRISPR/Cas9系統(tǒng)的高效性仍使其在基因治療中展現(xiàn)了巨大潛力,理論上基因組中每8 個堿基就能找到一個編輯位點(PAM 序列),基本可以實現(xiàn)任意序列位置的修飾,且操作簡單。
隨著基因編輯技術的不斷發(fā)展進步,各領域的應用也有了更大的空間。除了在基因組編輯方面的應用外,Mazhar Adli[35]教授利用CRISPR/Cas9 技術首次實現(xiàn)了實時觀測活細胞內基因運動,讓人們能夠以三維的視角觀測基因在細胞內的運動路徑及位置。這種全新的視角指明了一種從未有過的方式,通過觀察基因的三維定位來探究基因是如何工作及基因之間的相互作用。
目睹眾多生物的基因組的快速發(fā)展是令人興奮的,在這個過程中,CRISPR/Cas9 系統(tǒng)已經成為許多實驗室的首選工具,成為一種多用途的基因組編輯工具。自從報道利用CRISPR-Cas 進行基因組編輯以來,基因組學及生物醫(yī)學等在過去5年中取得了相當大的進展和突破。這些技術為建立研究、診斷和治療工具提供了一個基礎,具有前所未有的簡單性、精確性和多功能性。這些工具將加深我們對疾病機制的理解,并擴大我們對生物基因網絡的認識。消除許多無法治愈的疾病,如癌癥、先天性遺傳疾病等,在可預見的未來都是有希望實現(xiàn)的。盡管目前這些技術尚處在初級階段,但隨著科研人員的不斷探索發(fā)現(xiàn),這些新技術將帶來真正的價值和效益。