夏 天 林仙花 胡雪峰
(福建師范大學(xué)生命科學(xué)學(xué)院 福州 350108)
基因編輯技術(shù)是修飾特定基因的新型分子工具,包括鋅指核酸酶(zinc finger nucleases, ZFNs)法、轉(zhuǎn)錄激活類效應(yīng)因子(transcription activator-like effector nucleases, TALENs)法和成簇規(guī)律間隔短回文重復(fù)序列核酸酶(clustered regularly interspaced short palindromic repeat-associated cas, CRISPR-Cas)法?;蚓庉嫾夹g(shù)可以用來(lái)標(biāo)記任何感興趣的基因位點(diǎn),刪除或者修飾特定基因序列,分析由基因編輯產(chǎn)生的突變表型則可以探索相關(guān)基因元件的功能。本文綜述基因編輯技術(shù)所涉及的3種酶法及其應(yīng)用研究進(jìn)展。
1.1 鋅指蛋白與ZFNs法基因編輯 鋅指蛋白是在真核生物中分布最廣的一類蛋白質(zhì),研究表明,人類基因組可能有近l%的序列編碼含鋅指結(jié)構(gòu)的蛋白網(wǎng)。鋅指蛋白是一系列含手指狀結(jié)構(gòu)域的轉(zhuǎn)錄因子,在基因表達(dá)調(diào)控、細(xì)胞分化、胚胎發(fā)育、增強(qiáng)植物抗逆性等方面發(fā)揮著重要的作用。近年來(lái)已成功設(shè)計(jì)出特異性鋅指蛋白元件,用于調(diào)節(jié)疾病相關(guān)基因的表達(dá),為疾病的基因治療提供了有用的手段,有著廣闊的應(yīng)用前景。
鋅指核酸酶由鋅指蛋白( zinc finger protein, ZFP)和限制性內(nèi)切酶(Fok I)兩部分融合而成。其中ZFP的功能是識(shí)別特異的DNA序列,而Fok I則行使切割功能域的功能。1983年,Klug等率先在非洲爪蟾卵母細(xì)胞的轉(zhuǎn)錄因子IIIA中發(fā)現(xiàn)重復(fù)鋅指結(jié)構(gòu)域,并將其命名為鋅指( ZF)基序。ZFP由ZFs串聯(lián)而成,每個(gè)ZF由30個(gè)氨基酸殘基組成,這些氨基酸構(gòu)成的兩串α螺旋組氨酸配體和兩串β折疊半胱氨酸配體,圍繞中央鋅離子形成一個(gè)獨(dú)立的四面體結(jié)構(gòu)。每個(gè)ZF通??梢宰R(shí)別3或4bp DNA序列[1],鋅離子起著穩(wěn)定Cys2His2 ZF折疊結(jié)構(gòu)的作用。
已經(jīng)發(fā)現(xiàn),鋅指蛋白有3種與DNA靶向聯(lián)合的結(jié)構(gòu)形式:小鼠體內(nèi)3指的鋅指蛋白268( zinc finger protein 268, Zif268)、果蠅體內(nèi)2指的鋅指軌跡蛋白( tramtrak, TTK)以及人類體內(nèi)5指的神經(jīng)腫瘤膠質(zhì)相關(guān)致癌基因家族鋅指蛋白(gliomma-associated oncogene family zinc finger, GLI)。Zif268具有一種與結(jié)合DNA的簡(jiǎn)單組塊模型:3個(gè)鋅指憑借α螺旋的氨基呈一定角度嵌入DNA雙螺旋大溝( major groove),以每個(gè)起識(shí)別作用的氨基酸對(duì)應(yīng)一個(gè)堿基的方式與DNA三聯(lián)體堿基相連。每個(gè)ZFs識(shí)別堿基時(shí)都會(huì)受到相鄰ZFs的影響。TTK的第一組鋅指與Zif268相比多一條β折疊。GLI只以其后端的兩指與DNA緊密相連[2]。
1986年,Chandrasegaran開(kāi)始研究一種可標(biāo)記特定基因的嵌合型限制酶,其在細(xì)胞內(nèi)可產(chǎn)生特異性核酸內(nèi)切位點(diǎn),可望用來(lái)實(shí)現(xiàn)基因編輯。1996年,Kim報(bào)道鋅指基序和Fok I核酸酶構(gòu)成的修飾酶可以在預(yù)設(shè)位點(diǎn)切割DNA。鋅指蛋白作為可拆分的DNA結(jié)構(gòu)域,F(xiàn)ok I限制內(nèi)切酶作為非特異性切割域,兩者結(jié)合構(gòu)成的鋅指核酸酶在預(yù)定位點(diǎn)切割DNA,其發(fā)現(xiàn)和應(yīng)用是基因組編輯技術(shù)的重大突破[3]。
1.2 ZFNs法基因編輯技術(shù)的應(yīng)用 2005年,Sangamo生物公司運(yùn)用ZFNs第一次成功標(biāo)記人類細(xì)胞內(nèi)源性基因,即在伴X染色體重度免疫缺陷癥患者體內(nèi)標(biāo)記突變的IL-2Rγ基因。
近年來(lái),ZFNs法基因編輯技術(shù)被用于研究病毒-宿主相互作用,以及預(yù)防和治療HIV-1感染。HIV和其他慢性病毒的感染過(guò)程具有隱伏性質(zhì),治療這方面疾病需要一種生命周期長(zhǎng)、可自我更新并具有多品系的造血干細(xì)胞,這類干細(xì)胞可以把耐感染的基因修飾細(xì)胞重新注入宿主體內(nèi)[4]。
然而,分子合成的ZFNs并不總是可以產(chǎn)生高度特異的ZFNs產(chǎn)物。其缺陷在于細(xì)胞內(nèi)標(biāo)記基因常常會(huì)呈現(xiàn)毒理效應(yīng),且實(shí)施過(guò)程耗時(shí)[5]。
2.1 TALENs的結(jié)構(gòu)與作用機(jī)制 將DNA識(shí)別域TALEs和催化域 Fok I核酸酶進(jìn)行人工偶聯(lián),創(chuàng)造出了TALENs法基因編輯技術(shù)[6]。TALEs起初是在植黃單胞菌植物病毒因子中被偶然發(fā)現(xiàn)的,這種病毒可將其蛋白轉(zhuǎn)入宿主細(xì)胞并重新編輯宿主基因。TALE的DNA結(jié)合域包含33~35個(gè)氨基酸的重復(fù)單體,在該結(jié)合域的12/13位置上存在兩個(gè)被稱作重復(fù)可變雙殘基(repeat variable di-residues, RVDs)的高度可變氨基酸,它們決定了序列識(shí)別的特異性,其余的大部分重復(fù)單元相對(duì)保守。標(biāo)記DNA的氨基酸重復(fù)單元和核苷酸序列呈一一對(duì)應(yīng)的關(guān)系,獨(dú)立單元不受相鄰單元的影響。Fok I核酸酶可催化一條DNA鏈斷裂。然而,當(dāng)兩個(gè)TALENs接到一段DNA側(cè)翼時(shí),F(xiàn)ok I域便發(fā)生二聚化,從而使雙鏈DNA斷裂[7]。
2.2 TALENs法基因編輯技術(shù)的應(yīng)用 TALENs法基因編輯技術(shù)主要用途在于制造基因敲除的動(dòng)物模型。該技術(shù)可直接在受精卵打靶目的基因,幫助研究者在兩個(gè)月內(nèi)獲得純合子敲除小鼠。最近一項(xiàng)特別的研究實(shí)現(xiàn)了三基因在小鼠體內(nèi)同時(shí)打靶:研究者將 Agouti, miR-205和 Arf特異的TALEN混合體系注射進(jìn)250顆受精卵,分散輸送到10個(gè)代孕小鼠體內(nèi)。獲得43只幼崽, 鼠尾基因鑒定得到Agouti、miR-205和Arf突變的分別有25只、36和24只,其中 Arf 突變小鼠均可檢測(cè)得到其他兩種突變基因。證明TALENs可以同時(shí)打靶三個(gè)基因,高效繁殖出三基因突變的小鼠[8]。TALENs還可對(duì)人體細(xì)胞、胚胎干細(xì)胞或人體內(nèi)誘導(dǎo)的多能干細(xì)胞系內(nèi)基因位點(diǎn)進(jìn)行打靶,形成包括敲除突變、敲入錯(cuò)義突變以及功能性移碼突變?cè)趦?nèi)的一系列突變。突變效率隨細(xì)胞系和基因位點(diǎn)的變化而異。TALENs曾被用于人K562細(xì)胞內(nèi)敲除CCR5基因,修飾效率范圍為5%~27%。此外,TALENs具有良好的臨床治療潛力,白介素2受體γ( interleukin 2 receptor gamma, IL2RG)轉(zhuǎn)座子突變可導(dǎo)致嚴(yán)重的伴X染色體免疫缺陷癥,TALE-mediated修正IL2RG轉(zhuǎn)座子的效率可達(dá)76%[9]。
TALENs具有巨大應(yīng)用價(jià)值,但它所帶來(lái)的毒副作用也不可忽略。TALENs毒性較ZFNs略小,轉(zhuǎn)染后5天表達(dá)TALENs的細(xì)胞平均80%可以存活,而表達(dá)ZFNs的細(xì)胞平均只有50%存活率。毒副作用發(fā)生是因?yàn)門(mén)ALENs與靶序列沒(méi)有完全配對(duì),導(dǎo)致基因組中不同位點(diǎn)的非特異性切割,這可能抑制重要的基因,從而擾亂基因組的穩(wěn)定或引起細(xì)胞壞死。專性異源二聚體Fok I核酸酶替代常用內(nèi)切酶Fok I也許可以減輕毒理效應(yīng)。
3.1 CRISPR-Cas系統(tǒng)的分類及作用機(jī)制 成簇規(guī)律間隔短回文重復(fù)序列和相關(guān)Cas蛋白是一種適應(yīng)性免疫系統(tǒng),可保護(hù)原核生物免受感染性病毒和質(zhì)粒侵害。這種防御系統(tǒng)依賴小型RNAs指導(dǎo)特異序列檢測(cè)并沉默外源核酸。典型CRISPR基因座長(zhǎng)20~50bp,兩側(cè)是腺嘌呤和胸腺嘧啶豐富的前導(dǎo)序列,中間為獨(dú)立短間隔序列平均分隔的正向重復(fù)序列,間隔序列來(lái)源于入侵基因元件,也稱原間隔序列(protospacers)。CRISPR/Cas介導(dǎo)的免疫發(fā)生分為三個(gè)階段,適配階段:細(xì)菌或古生菌對(duì)病毒或質(zhì)粒入侵作出應(yīng)答,將外源序列的短片段(原間隔序列)整合到宿主染色體的CRISPR陣列近末端;表達(dá)階段:重復(fù)間隔元件轉(zhuǎn)錄成前體CRISPR RNAs(precursor CRISPR RNA, pre-crRNA)分子,接著被核酸內(nèi)切酶加工成短的CRISPR RNA;干擾階段:CRISPR RNAs與入侵病毒或質(zhì)粒的互補(bǔ)原間隔序列配對(duì),指導(dǎo)Cas蛋白沉默外源序列[10]。
根據(jù)標(biāo)志基因的不同,CRISPR-Cas系統(tǒng)可分成3型。所有CRISPR-Cas系統(tǒng)均具有Cas1和Cas2基因。Cas1是金屬依賴性酶,可以用序列非特異的方式切割雙鏈和單鏈DNA,有些Cas1也能切割RNAs;許多Cas2蛋白是呈類鐵氧還蛋白折疊狀的RNA酶( RNases),而嗜堿芽孢桿菌來(lái)源的Cas2是一種金屬依賴的雙鏈DNA酶(DNase)[11]。
3.1.1 I型CRISPR-Cas 系統(tǒng) 該型系統(tǒng)具有抗病毒的CRISPR相關(guān)復(fù)合物和Cas3。Cascade募集Cas3核酸酶降解靶序列。
3.1.2 II型CRISPR-Cas 系統(tǒng) 核糖核酸導(dǎo)向( RNA-guided)核苷酸內(nèi)切酶Cas9出現(xiàn)后,人類構(gòu)建的II型CRISPR-Cas系統(tǒng)是各型CRISPR-Cas系統(tǒng)中最簡(jiǎn)單的一種。
CRISPR-Cas9系統(tǒng)建立在以非編碼RNA為導(dǎo)向的Cas9核酸酶基礎(chǔ)之上。Cas9核酸酶來(lái)源于細(xì)菌和古生菌。Cas9技術(shù)實(shí)現(xiàn)了特定位點(diǎn)的DNA切割,可以較小的脫靶效率在基因組中任何部分(例如,編碼區(qū)、啟動(dòng)子或者增強(qiáng)子)引入隨機(jī)突變或靶突變[12]。CRISPR-Cas9系統(tǒng)中,兩個(gè)非編碼RNA(CRISPR RNA, crRNA)和(trans-activating crRNA, tracrRNA)發(fā)生表達(dá),指導(dǎo)優(yōu)化的哺乳動(dòng)物Cas蛋白切割含間隔序列前體旁基序(protospacer adjacent motif, PAM)的靶向DNA雙鏈[13]。一些基因工程體系中,crRNA 和 tracrRNA可形成一個(gè)共同的轉(zhuǎn)錄子——單導(dǎo)向RNA(single guide RNA, sgRNA)。靶序列以5′-NGG靠近PAM序列后,Cas9蛋白、tracrRNA和 sgRNA 表達(dá)形成復(fù)合物,結(jié)合靶序列并斷裂DNA雙鏈。DNA雙鏈斷裂對(duì)細(xì)胞有潛在致死性,存在兩類修復(fù)機(jī)制:高效誘導(dǎo)非同源性末端結(jié)合(non-homologous end joining, NHEJ)作用下的突變和同源介導(dǎo)修復(fù)(homology-directed repair, HDR)。
3.1.3 III型CRISPR-Cas 系統(tǒng) III 型CRISPR-Cas系統(tǒng)是所有各型CRISPR-Cas系統(tǒng)中最復(fù)雜的一種。Cas10基因編碼蛋白和重復(fù)相關(guān)神秘蛋白( repeat associated mysterious proteins, RAMP)組塊Csm或Cmr共同形成 Cas10-Csm或Cas10-Cmr靶向復(fù)合物。
3.2 CRISPR-Cas法基因編輯技術(shù)的應(yīng)用 CRISPR-Cas 系統(tǒng)可促進(jìn)攜帶多種突變基因動(dòng)物的培育,還能推動(dòng)有關(guān)基因家族和基因間相互作用的研究。2013年2月哈佛大學(xué)Church團(tuán)隊(duì)和麻省理工張峰團(tuán)隊(duì)相繼發(fā)表用CRISPR-Cas法基因編輯技術(shù),在小鼠和人類細(xì)胞中進(jìn)行特定位點(diǎn)基因編輯的文章。2013年3月,麻省理工Jaenisch 團(tuán)隊(duì)利用CRISPR-Cas介導(dǎo)的基因編輯將小鼠胚胎干細(xì)胞中的五個(gè)基因同步破壞[3]。CRISPR-Cas9 已逐漸發(fā)展成為用于基因功能缺失(loss-of-function, LOF)研究的商業(yè)化技術(shù),許多實(shí)驗(yàn)室開(kāi)始用該技術(shù)來(lái)做基因組層面的功能缺失篩選[14]。
Cas9在植物細(xì)胞中同樣可以發(fā)揮作用。中國(guó)科學(xué)院科學(xué)家證明,Cas9可破壞大米內(nèi)源基因、原生質(zhì)體以及小麥原生質(zhì)體[15]。研究者通過(guò)U6 snRNA和NCURVATA2啟動(dòng)子表達(dá)的sgRNA以及Cas9 DNA內(nèi)切酶在擬南芥植物核基因?qū)崿F(xiàn)定向突變[16]。
細(xì)胞核內(nèi)基因工程不僅能引領(lǐng)動(dòng)植物基因功能研究的巨大進(jìn)步,還可推動(dòng)臨床治療方面的變革。CRISPR-Cas系統(tǒng)的一個(gè)令人振奮的潛在應(yīng)用就是修改疾病造成的基因突變。CRISPR-Cas9基因編輯(即II型CRISPR-Cas系統(tǒng))曾被用于糾正囊泡性纖維癥人類細(xì)胞系的基因突變,還被用于改善肝細(xì)胞中乙酰水解酶基因突變?cè)斐傻奈⒘繀s致命的基因環(huán)境。CRISPR-Cas9 技術(shù)也有希望成為抵抗病毒感染的治療手段?,F(xiàn)已經(jīng)實(shí)現(xiàn)活體內(nèi)運(yùn)用CRISPR-Cas9系統(tǒng)肝內(nèi)清除乙肝病毒( hepatitis B virus, HBV)模板,證明CRISPR-Cas技術(shù)有潛力作為治療手段根除病人體內(nèi)頑固的HBV感染[17]。CRISPR-Cas9也可以破壞潛在HIV感染,保護(hù)機(jī)體不被新的HIV侵染,成為治療或防御疾病的新技術(shù)[18]。
此外,通過(guò)修飾或滅活Cas蛋白還可以讓CRISPR-Cas法基因編輯技術(shù)發(fā)展多方面的應(yīng)用,特別是可進(jìn)一步擴(kuò)展在多種細(xì)胞株系和動(dòng)物模型中的廣泛應(yīng)用。
ZFNs, TALENs 和CRISPR-Cas法基因編輯技術(shù)已經(jīng)能夠幫助人類以更高的效率研究和創(chuàng)造疾病模型。尤其值得關(guān)注的是,CRISPR-Cas9作為一種新型的基因編輯技術(shù)在世界范圍內(nèi)得到了廣泛的應(yīng)用。隨著高通量DNA測(cè)序和強(qiáng)大計(jì)算機(jī)算法的應(yīng)用,包括人在內(nèi)的許多有機(jī)體基因組序列都將會(huì)被精確地破譯。相信在不遠(yuǎn)的將來(lái),這項(xiàng)技術(shù)將使科學(xué)家具備前所未有的修飾有機(jī)體的能力,并在基礎(chǔ)生物學(xué)和臨床醫(yī)學(xué)治療研究方面發(fā)揮十分積極的作用并產(chǎn)生深遠(yuǎn)的影響。