鄭小梅, 張曉立, 于建東, 鄭 平, 孫際賓*
1.中國科學(xué)院系統(tǒng)微生物工程重點(diǎn)實(shí)驗(yàn)室, 天津 300308;2.中國科學(xué)院天津工業(yè)生物技術(shù)研究所, 天津 300308;3.天津科技大學(xué)生物工程學(xué)院, 天津 300457
進(jìn)展評述
CRISPR-Cas9介導(dǎo)的基因組編輯技術(shù)的研究進(jìn)展
鄭小梅1,2, 張曉立1,3, 于建東1,2, 鄭 平1,2, 孫際賓1,2*
1.中國科學(xué)院系統(tǒng)微生物工程重點(diǎn)實(shí)驗(yàn)室, 天津 300308;2.中國科學(xué)院天津工業(yè)生物技術(shù)研究所, 天津 300308;3.天津科技大學(xué)生物工程學(xué)院, 天津 300457
CRISPR-Cas (clustered regularly interspaced short palindromic repeats-CRISPR-associated proteins)系統(tǒng)為細(xì)菌與古生菌中抵御外源病毒或質(zhì)粒DNA入侵的獲得性免疫系統(tǒng)。該系統(tǒng)在crRNA的指導(dǎo)下,使核酸酶Cas識別并降解外源DNA。其中,Ⅱ型CRISPR-Cas系統(tǒng)最為簡單,僅包括一個核酸酶Cas9與tracrRNA:crRNA二聚體便可完成其生物功能?;贑RISPR-Cas9的基因組編輯技術(shù)的核心為將tracrRNA:crRNA設(shè)計(jì)為引導(dǎo)RNA,在引導(dǎo)RNA的指導(dǎo)下Cas9定位于特定DNA序列上,進(jìn)行DNA雙鏈切割,實(shí)現(xiàn)基因組的定向編輯。CRISPR-Cas9系統(tǒng)以設(shè)計(jì)操縱簡便、編輯高效與通用性廣等優(yōu)勢成為新一代基因組編輯技術(shù),為基因組定向改造調(diào)控與應(yīng)用等帶來突破性革命。從CRISPR-Cas9介導(dǎo)的基因組編輯技術(shù)的發(fā)展與應(yīng)用等方面綜述其最新研究進(jìn)展,并著重介紹該技術(shù)的關(guān)鍵影響因素,為相關(guān)研究者提供參考。
CRISPR-Cas系統(tǒng);Cas9;基因組編輯技術(shù)
近年來,基因組編輯技術(shù)(genome engineering technologies)的快速發(fā)展為生物學(xué)研究帶來了新紀(jì)元。與傳統(tǒng)的基因克隆技術(shù)不同,基因組編輯技術(shù)可直接在基因組上進(jìn)行DNA序列的敲除、插入、定點(diǎn)突變以及組合編輯等,實(shí)現(xiàn)基因功能與調(diào)控元件的系統(tǒng)研究,在工業(yè)生物工程等方面具有廣闊的應(yīng)用前景。早期,基因組編輯技術(shù)主要利用同源重組介導(dǎo)的打靶技術(shù),但由于效率較低(10-6~10-9)[1],極大地限制了其應(yīng)用。
為解決這一難題,一系列人工核酸內(nèi)切酶介導(dǎo)的基因組編輯技術(shù)被開發(fā),可通過在基因組特定位置上形成DNA雙鏈斷裂(DNA double stranded break,DSB),借助于細(xì)胞自身的修復(fù)系統(tǒng)如非同源末端連接(non-homologous end joining,NHRJ )或同源重組(homology directed repair,HDR),從而實(shí)現(xiàn)在不同生物與細(xì)胞類型中有效的定點(diǎn)基因組編輯[2]。目前,主要有4種不同的人工核酸內(nèi)切酶已應(yīng)用于基因組編輯:巨核酶技術(shù)(Meganucleases)[3]、鋅指核酸內(nèi)切酶 (zinc finger endonuclease,ZFN)[4,5]、類轉(zhuǎn)錄激活因子效應(yīng)物核酸酶(transcription activator-like effector nuclease,TALEN)[6~9]與RNA靶向DNA內(nèi)切酶Cas9[10~12]。
Meganuclease、ZFN與TALEN均可通過蛋白-DNA相互作用識別基因組上的特定DNA序列。Meganuclease具有核酸內(nèi)切酶結(jié)構(gòu)域與DNA結(jié)合域,而ZFN與TALEN分別具有可識別3個與1個核苷酸的DNA結(jié)合域,需與核酸內(nèi)切酶FokI的內(nèi)切酶結(jié)構(gòu)域形成融合蛋白后,完成基因組特定位點(diǎn)的切割。但這些技術(shù)各有不足,如Meganuclease的氨基酸殘基與DNA靶序列之間無明確特異性;ZFN的DNA結(jié)合域則會受DNA靶序列上下游的影響[13,14],需通過構(gòu)建不同的融合蛋白來定位到不同的DNA序列,構(gòu)建操作較為繁瑣,成本較高,脫靶風(fēng)險(xiǎn)較高。
RNA靶向內(nèi)切酶CRISPR-Cas9介導(dǎo)的基因組編輯技術(shù)則通過一段短的引導(dǎo)RNA(guide RNA)來識別特定的DNA序列,只需通過改變這段引導(dǎo)RNA序列即可使Cas9定位到新的DNA序列。該技術(shù)已被應(yīng)用于多種生物,包括人、小鼠、大鼠、斑馬魚、秀麗隱桿線蟲、植物及細(xì)菌。其技術(shù)也不斷被拓展,如利用多個引導(dǎo)RNA序列可同時(shí)進(jìn)行基因組上多個不同位點(diǎn)的編輯;將其DNA結(jié)合域與不同轉(zhuǎn)錄調(diào)控蛋白相融合,可實(shí)現(xiàn)對特定基因的轉(zhuǎn)錄激活或抑制[15,16];將對特定序列的調(diào)控蛋白模塊與基因組或表觀基因組的修飾酶相融合,則可實(shí)現(xiàn)對基因組的動態(tài)控制[15]。CRISPR-Cas9介導(dǎo)的基因組編輯技術(shù)以其操作簡單、特異性高的特點(diǎn)成為研究熱點(diǎn)。
CRISPR-Cas9介導(dǎo)的基因組編輯技術(shù)的開發(fā)與發(fā)展基于細(xì)菌與古生菌中CRISPR-Cas系統(tǒng)相關(guān)的數(shù)十年的基礎(chǔ)生物學(xué)研究。1987年,Ishino等[17]首先在大腸桿菌的堿性磷酸酶基因下游發(fā)現(xiàn)被32 bp非重復(fù)序列所間隔排列的串聯(lián)重復(fù)序列。隨著已測序細(xì)菌基因組的增加,發(fā)現(xiàn)這種間隔排列的串聯(lián)重復(fù)序列廣泛存在于細(xì)菌與古生菌中[17]。至2002年,Mojica與Jansen等[18,19]將間隔排列的串聯(lián)重復(fù)序列命名為串聯(lián)間隔短回文重復(fù)序列(clustered regularly interspaced short palindromic repeats,CRISPR)。并且,鑒定出了與CRISPR序列位于同一基因簇的CRISPR相關(guān)蛋白Cas,以此將CRISPR基因簇分為3個不同的類型(Ⅰ型、Ⅱ型與Ⅲ型),但其生物學(xué)功能還處于未知狀態(tài)。直至2005年,研究發(fā)現(xiàn)間隔序列來源于外源入侵的噬菌體或質(zhì)粒的DNA序列[20~22],推測CRISPR-Cas系統(tǒng)可能與細(xì)菌抵抗外源遺傳物質(zhì)入侵的免疫系統(tǒng)有關(guān)[20]。
2007年,Barrangou等[23]首次用實(shí)驗(yàn)證明了嗜熱鏈球菌(Streptococcusthermophilus)Ⅱ型CRISPR-Cas系統(tǒng)作為獲得性免疫系統(tǒng)的生物功能,揭示出間隔序列指導(dǎo)外源DNA的識別,Cas蛋白負(fù)責(zé)間隔序列的獲得與外源噬菌體的降解 。隨后,一系列研究不斷揭示出了3個不同類型的CRISPR-Cas系統(tǒng)的具體免疫機(jī)制[24~27]。2010年,隨著研究的不斷深入,發(fā)現(xiàn)Ⅱ型CRISPR-Cas系統(tǒng)較為簡單,僅需要核酸酶Cas9、成熟的crRNA(CRISPR-derived RNA)與tracrRNA(trans-activating RNA)就可啟動對特定外源DNA序列的切割。伴隨人工核酸酶ZFN與TALEN介導(dǎo)的基因組編輯技術(shù)的迅速發(fā)展,許多研究組開始將CRISPR-Cas9開發(fā)為RNA靶向的基因組編輯系統(tǒng),并已在不同的原核與真核生物中獲得成功。最近幾年,CRISPR-Cas9介導(dǎo)的基因組編輯技術(shù)發(fā)展更為迅速,在動物建模、作物育種、基因治療、藥物開發(fā)以及工業(yè)生物工程等不同領(lǐng)域中得到廣泛應(yīng)用。CRISPR-Cas9系統(tǒng)基礎(chǔ)研究的深入將推動其介導(dǎo)的基因組規(guī)模的精確編輯與調(diào)控技術(shù)的迅猛發(fā)展。
CRISPR基因簇由CRISPR序列與Cas蛋白的編碼基因組成,CRISPR序列為一系列由不同的間隔序列(spacers)間隔的同向重復(fù)序列,間隔序列來源于外源基因片段即原間隔序列(protospacers),如圖1(彩圖見圖版一)所示。Cas蛋白的編碼基因?qū)⒈磉_(dá)為核酸酶、解旋酶與聚合酶等,CRISPR序列則轉(zhuǎn)錄加工為短的CRISPR RNAs(crRNAs),指導(dǎo)Cas蛋白與外源入侵片段的識別與降解。
與限制修飾系統(tǒng)相似,CRISPR-Cas系統(tǒng)可識別并降解外源入侵的DNA序列,如圖1所示。該過程主要包括四個階段:首先,噬菌體或質(zhì)粒的外源DNA進(jìn)入細(xì)胞,即第一階段噬菌體侵染(phage infection),然后為第二階段新的間隔序列的獲得(spacer acquisition),由特定的Cas蛋白從外源DNA序列 (protospacer)獲得間隔序列,并將其整合到細(xì)菌基因組的CRISPR位點(diǎn)上。這些間隔序列被同向重復(fù)序列所分隔,以確保CRISPR系統(tǒng)對自身序列與外源序列的識別。然后進(jìn)入第三階段crRNA的合成與加工(crRNA biogenesis and processing),CRISPR轉(zhuǎn)錄為pre-crRNA初級轉(zhuǎn)錄本,然后經(jīng)不同的加工過程形成成熟crRNA(由一個間隔序列與部分重復(fù)序列組成),最后通過不同機(jī)制指導(dǎo)Cas核酸內(nèi)切酶對外源DNA序列的識別與降解(target degradation)。
根據(jù)參與蛋白與識別機(jī)制的不同,CRISPR-Cas系統(tǒng)可分為3個不同的類型:Ⅰ型、Ⅱ型與Ⅲ型CRISPR-Cas系統(tǒng)。在Ⅰ型與Ⅲ型CRISPR-Cas系統(tǒng)中,pre-crRNA初級轉(zhuǎn)錄本將被CRISPR相關(guān)RNA酶切割重復(fù)序列,釋放小的成熟crRNA。成熟crRNA將與相關(guān)蛋白結(jié)合形成RNA-蛋白復(fù)合體指導(dǎo)核酸內(nèi)切酶對外源DNA序列的識別與降解。在Ⅰ型CRISPR-Cas系統(tǒng)中,多個Cas相關(guān)蛋白與成熟crRNA形成CRISPR 相關(guān)的病毒防御復(fù)合體 (CRISPR associated complex for antivirus defense,CASCAD),復(fù)合體CASCAD內(nèi)的crRNA與外源DNA的互補(bǔ)鏈配對形成R環(huán)結(jié)構(gòu)。核酸酶Cas3識別R環(huán)結(jié)構(gòu)后,先將DNA的互補(bǔ)鏈切開,再在其解旋酶和核酸酶作用下將非互補(bǔ)鏈切開。在Ⅲ型CRISPR-Cas系統(tǒng)中,成熟crRNA可與Csm或Cmr復(fù)合體結(jié)合,分別對外源DNA或其轉(zhuǎn)錄后的RNA序列進(jìn)行識別降解。
圖1 CRISPR-Cas系統(tǒng)抵御外源噬菌體的獲得性免疫機(jī)制[30]Fig.1 Mechanisms of microbial CRISPR systems in adaptive immunity[30].(彩圖見圖版一)
在Ⅱ型CRISPR-Cas系統(tǒng)中,還有一種反式激活CRISPR-RNA (tracrRNA)可結(jié)合于同向重復(fù)序列而形成RNA二聚體,再由RNA內(nèi)切酶RNase Ⅲ及其他核酸酶進(jìn)行切割。tracrRNA:crRNA復(fù)合體形成的引導(dǎo)RNA與Cas9形成RNA-蛋白復(fù)合體后,將結(jié)合并掃描外源DNA。當(dāng)crRNA的間隔序列與外源DNA序列可互補(bǔ)配對時(shí),Cas9則將在互補(bǔ)配對區(qū)對外源DNA進(jìn)行切割。與Ⅰ型與Ⅲ型CRISPR-Cas系統(tǒng)中需要多個蛋白不同,在Ⅱ型CRISPR-Cas系統(tǒng)中僅需要一個核酸內(nèi)切酶Cas9即可。
在外源DNA序列的原間隔序列(protospacer)的下游存在一個保守的基序(protospacer adjacent motifs,PAMs) 參與Cas蛋白對外源DNA的識別[28]。在Ⅰ型與Ⅱ型CRISPR-Cas系統(tǒng)中,在自身基因組CRISPR序列的下游無PAM (protospacer adjacent motifs)序列,從而將自身基因組DNA序列與外源DNA序列區(qū)分開,避免自我免疫。在Ⅲ型CRISPR-Cas系統(tǒng)中,則通過crRNA的5′末端與外源DNA序列的錯配來識別并區(qū)分外源DNA與自身DNA序列[29]。
3.1 Cas9的蛋白結(jié)構(gòu)
Cas9的蛋白結(jié)構(gòu)包括α-螺旋組成的識別區(qū)(REC)、由HNH結(jié)構(gòu)域與RuvC結(jié)構(gòu)域組成的核酸酶區(qū)以及位于C端的PAM結(jié)合區(qū)(圖2,彩圖見圖版一)。HNH為單個結(jié)構(gòu)域,而 RuvC則分為3個亞結(jié)構(gòu)域:RuvCⅠ位于蛋白的N端,RuvCⅡ/Ⅲ分別位于HNH結(jié)構(gòu)域的兩側(cè)。RuvC與HNH可分別對gRNA的DNA互補(bǔ)鏈與非互補(bǔ)鏈進(jìn)行切割,產(chǎn)生平末端的DNA雙鏈斷裂。位于RuvC結(jié)構(gòu)域中的D10A突變體可導(dǎo)致RuvC結(jié)構(gòu)域的失活,位于HNH結(jié)構(gòu)域的H840A突變體可導(dǎo)致HNH結(jié)構(gòu)域的失活,但單點(diǎn)突變體可使Cas9成為切口酶(nickase),形成單鏈DNA斷裂。在REC識別區(qū)中的一個富含精氨酸的α-螺旋負(fù)責(zé)與RNA-DNA異源二聚體的3′端8~12個核苷酸的結(jié)合。
近年來,對嗜熱鏈球菌SpCas9蛋白結(jié)構(gòu)的研究表明,游離狀態(tài)下的SpCas9蛋白處于一種自我抑制的構(gòu)象,HNH結(jié)構(gòu)域的活性位點(diǎn)被RuvC結(jié)構(gòu)域所封閉且遠(yuǎn)離REC識別區(qū),因而游離的SpCas9不能結(jié)合與切割DNA序列。tracrRNA:crRNA可作為一個骨架指導(dǎo)SpCas9蛋白構(gòu)象的改變,形成一個中心通道可容納RNA-DNA[31]。
圖2 Cas9與引導(dǎo)RNA及靶DNA復(fù)合體的晶體結(jié)構(gòu)[30]Fig.2 Crystal structure of S. pyogenes Cas9 in complex with guide RNA and target DNA[30].(彩圖見圖版一)
3.2 Cas9的識別機(jī)制
Cas9與靶DNA的識別依賴于tracrRNA:crRNA復(fù)合體以及位于靶位點(diǎn)下游的PAM序列。首先RNA-Cas9復(fù)合體沿外源入侵DNA進(jìn)行掃描,當(dāng)遇到PAM序列且DNA序列可與crRNA互補(bǔ)配對形成一個R環(huán)時(shí),Cas9蛋白將分別利用HNH與RuvC結(jié)構(gòu)域?qū)NA的互補(bǔ)鏈與非互補(bǔ)鏈進(jìn)行切割,而形成DNA的雙鏈斷裂。PAM序列是Cas9識別靶DNA的重要影響因素。SpCas9的研究表明PAM序列的識別將引發(fā)Cas9從結(jié)合構(gòu)象向切割構(gòu)象的轉(zhuǎn)變[30~32]。在嗜熱鏈球菌中,PAM序列多數(shù)為5′-NGG,而5′-NAG雖然效率低一些,但也可用于靶DNA的定位,可擴(kuò)展在基因組編輯中靶DNA的選擇范圍[33,34]。Cas9的同源蛋白可識別不同的PAM序列,如嗜熱鏈球菌Ⅰ型Cas蛋白識別的PAM序列為5′-NNAGAAW,Ⅲ型Cas蛋白為5′-NGGNG,來源于Neisseriameningitidis的Cas9 識別5′-NNNNGATT PAM序列[28,35,36]。Cas9 蛋白的PAM特異性可進(jìn)行改造,如將嗜熱鏈球菌Ⅲ型Cas蛋白的PAM識別區(qū)替換為StreptococcuspyogenesSpCas9的PAM識別區(qū),則可將其識別的PAM序列由原來的5′-NGGNG變?yōu)?′-NGG[30]。
4.1 基本設(shè)計(jì)原理
CRISPR-Cas9的基因組編輯技術(shù)的基本原理為將tracrRNA:crRNA設(shè)計(jì)為引導(dǎo)RNA,引導(dǎo)RNA包含位于5′端的靶DNA的互補(bǔ)序列以及位于3′-端的tracrRNA:crRNA的類似序列,利用靶DNA的互補(bǔ)序列來定位需編輯的位點(diǎn),利用tracrRNA:crRNA的類似序列與Cas9結(jié)合,如圖3(彩圖見圖版一)所示[37]。該技術(shù)僅設(shè)計(jì)引導(dǎo)RNA就可實(shí)現(xiàn)對含有PAM序列的任一靶DNA序列進(jìn)行敲除、插入與定點(diǎn)突變等修飾。由于設(shè)計(jì)操作簡單、編輯效率高與通用性好等優(yōu)勢,CRISPR-Cas9的基因組編輯技術(shù)成為ZFN與TALEN之后的新一代基因組編輯技術(shù)。
圖3 CRISPR-Cas9介導(dǎo)的基因組編輯技術(shù)的基本設(shè)計(jì)原理[37]Fig.3 Naturally occurring and engineered CRISPR-Cas systems[37].A:Ⅱ型CRISPR-Cas系統(tǒng)作用機(jī)制示意圖,Cas9在tracrRNA:crRNA復(fù)合體的引導(dǎo)下,對含有原間隔序列(protospacer)的外源DNA進(jìn)行切割。B:CRISPR-Cas系統(tǒng)介導(dǎo)的基因組編輯技術(shù)的基本原理,通常將crRNA與tracrRNA序列融合為一條引導(dǎo)RNA序列(single gRNA,sgRNA),在sgRNA的引導(dǎo)下,Cas9對位于PAM序列上游,且與sgRNA前20個核苷酸(相當(dāng)于crRNA)互補(bǔ)的DNA雙鏈進(jìn)行特異性切割。C:基于tracrRNA:crRNA復(fù)合體的gRNA序列設(shè)計(jì)舉例。(彩圖見圖版一)
CRISPR-Cas9系統(tǒng)還可實(shí)現(xiàn)同時(shí)對多個不同靶DNA序列的編輯[23,38]。利用CRISPR位點(diǎn)本身的特點(diǎn),設(shè)計(jì)對應(yīng)不同靶DNA序列的間隔序列插入到重復(fù)序列之間,經(jīng)過轉(zhuǎn)錄加工后形成多個可定位于不同靶DNA序列的雙引導(dǎo)RNA(tracrRNA:crRNA)[10],或者串聯(lián)不同的sgRNA[11,39]均可對哺乳動物細(xì)胞基因組多個不同基因同時(shí)進(jìn)行編輯。
在大多數(shù)真核生物中,Cas9所產(chǎn)生的DNA雙鏈斷裂被非同源末端接合(non-homologous end joining,NHEJ)或同源重組(homologous recombination,HR)等DNA修復(fù)系統(tǒng)修復(fù)。但在原核生物中,如肺炎鏈球菌S.pneumoniae的早期研究中,發(fā)現(xiàn)Cas9對基因組的切割是致死的。雖然具體機(jī)制尚不清楚,但是這一特點(diǎn)可用于進(jìn)行細(xì)菌基因組編輯后的反篩選。這一策略已在肺炎鏈球菌S.pneumoniae與E.coli中實(shí)現(xiàn)無篩選標(biāo)記的基因組編輯[33]。將Cas9、引導(dǎo)RNA以及一條含有突變位點(diǎn)的靶DNA的同源重組修復(fù)模板共同轉(zhuǎn)化到目的菌株中。若在Cas9對基因組靶DNA序列產(chǎn)生DNA雙鏈斷裂后,可利用導(dǎo)入的同源重組修復(fù)模板進(jìn)行DNA修復(fù),由于修復(fù)模板在識別互補(bǔ)區(qū)或PAM位點(diǎn)中存在突變位點(diǎn)而不能被Cas9再次切割,因而可存活;而未能進(jìn)行同源重組修復(fù)的基因組則由于Cas9的切割降解,無法存活。利用該方法可明顯提高基因組編輯后的篩選效率,且在基因組中不殘留篩選標(biāo)記。
4.2 關(guān)鍵影響因素
CRISPR-Cas9基因組編輯技術(shù)的迅速發(fā)展使越來越多的研究者開始在不同物種中來嘗試使用該技術(shù)進(jìn)行基因組的修飾與改造。而在具體實(shí)驗(yàn)設(shè)計(jì)中,必須充分了解該技術(shù)的關(guān)鍵影響因素,才能更好應(yīng)用該技術(shù)。
4.2.1 引導(dǎo)gRNA的選擇 引導(dǎo)gRNA的設(shè)計(jì)對于Cas9的活性與效率具有顯著的影響。目前,大多數(shù)研究將與靶DNA互補(bǔ)的crRNA與tracrRNA融合為一條單獨(dú)的引導(dǎo)RNA (single guide RNA, sgRNA)。在早期研究中,曾將crRNA與tracrRNA單獨(dú)表達(dá),設(shè)計(jì)為雙引導(dǎo)RNA (dual guide RNA)[10];但結(jié)果表明,與sgRNA相比,雙引導(dǎo)RNA更傾向于形成由易錯修復(fù)系統(tǒng)NHEJ介導(dǎo)的Indel突變。另外,可能由于Cas9:sgRNA兩組分的組裝比Cas9:crRNA-tracrRNA的組裝效率更高,所以sgRNA比雙引導(dǎo)RNA具有更快的編輯速度。
sgRNA中所含有的tracrRNA長度的設(shè)計(jì)也是需考慮的因素之一。在人類基因組編輯過程中,雖然利用含有長至第48位tracrRNA的sgRNA(+48)可在體外對靶DNA進(jìn)行有效切割[40];但在體內(nèi),含有更長tracrRNA 3′端的sgRNA(+72)與sgRNA(+84)對有效的基因組編輯是必須的[11,34]。增加的莖環(huán)結(jié)構(gòu)可提高sgRNA的穩(wěn)定性,有利于Cas9:sgRNA-DNA三聚體正確構(gòu)象的形成[30]。目前,大多數(shù)研究將sgRNA設(shè)計(jì)為100 nt左右,包含位于5′端20 nt的DNA互補(bǔ)區(qū)、crRNA以及位于3′端70~80 nt的tracrRNA。
4.2.2 靶DNA序列的設(shè)計(jì) 靶DNA設(shè)計(jì)時(shí),首先要考慮必須在3′端含有PAM序列,然后還需根據(jù)所用啟動子的特性進(jìn)行選擇。例如依賴于RNA 聚合酶Ⅲ的U6啟動子與T7啟動子需要轉(zhuǎn)錄起始位點(diǎn)分別為G 與GG。如此,使用這些啟動子時(shí),sgRNA靶序列就會限制為GN16~19NGG 或GGN15~18NGG。為減少這種限制,有兩種策略:一是不考慮啟動子帶來的限制,在sgRNA 5′端的第一個或前兩個核苷酸為錯配序列;二是直接在sgRNA 5′端加上額外的G 或GG。目前研究表明,這兩種策略均已可獲得有活性的sgRNA,但會影響基因組編輯的效率。后續(xù),還需進(jìn)一步開展大規(guī)模的研究來揭示這些錯配sgRNA或加長sgRNA對基因組編輯的效率與特異性的影響。
許多研究組開發(fā)了可用于靶序列設(shè)計(jì)的軟件或網(wǎng)站,如ZiFiT Targeter Software (http://zifit.partners.org/),CRISPR Design Tool(http://crispr.mit.edu),http://www. genome-engineering.org 與 http://www.egenome.org,以及開放的數(shù)據(jù)庫Addgene等,可輔助進(jìn)行用于基因組編輯的靶序列設(shè)計(jì)[30,37]。
4.2.3 Cas9與gRNA的表達(dá)與定位 在設(shè)計(jì)好合適的sgRNA后,就需要考慮如何將Cas9與sgRNA導(dǎo)入目的生物或細(xì)胞系中。目前,已在不同的生物與細(xì)胞中建立起Cas9與sgRNA的導(dǎo)入方法。在人工培養(yǎng)的哺乳細(xì)胞中,可通過電穿孔(electroporation)、核轉(zhuǎn)染(nucleofection)與脂質(zhì)體介導(dǎo)的轉(zhuǎn)染等方法將非自主復(fù)制的質(zhì)粒DNA導(dǎo)入細(xì)胞中,使Cas9 與sgRNA可進(jìn)行瞬時(shí)表達(dá)。慢性病毒載體(lentiviral vectors)也已用于在人類或小鼠細(xì)胞中組成型表達(dá)Cas9與sgRNA。體外轉(zhuǎn)錄的RNA也可直接注射導(dǎo)入斑馬魚、果蠅或小鼠的胚胎細(xì)胞中;將純化的Cas9蛋白與sgRNA復(fù)合體直接注射到蛔蟲體內(nèi)。除模式動物與細(xì)胞系外,Cas9也通過聚乙二醇(polyethylene glycol,PEG)介導(dǎo)的原生質(zhì)體轉(zhuǎn)化與農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化等在許多植物中得以成功應(yīng)用,如小麥、水稻、高粱、煙草和擬南芥等[30]。
許多研究表明,Cas9 與sgRNA的瞬時(shí)表達(dá)足以介導(dǎo)有效的基因組編輯。雖然Cas9 與sgRNA的組成型表達(dá)可能會提高基因組編輯的效率,但也有可能會增加脫靶效應(yīng)的幾率[30,34]。另外,由于Cas9 蛋白來源于細(xì)菌如肺炎鏈球菌,在真核細(xì)胞中表達(dá)后,還需定位到細(xì)胞核內(nèi)才能介導(dǎo)基因組編輯。為此,需在Cas9 蛋白N端與(或)C端加上真核細(xì)胞的核定位信號(nuclear localization signal,NLS)。
4.2.4 提高打靶特異性的策略 雖然現(xiàn)在RNA指導(dǎo)的Cas9核酸酶的特異性機(jī)制尚未完全揭示,但許多研究者已開發(fā)多種不同策略以提高其特異性,減少脫靶效應(yīng)。一種策略為降低sgRNA與 Cas9的濃度,但這一方法的效果還有待討論。有研究表明該方法可顯著降低脫靶突變/打靶突變的比例[34],但也有研究稱該方法將同時(shí)降低脫靶突變與打靶突變的發(fā)生[41]。
第二種策略為利用Cas9的切口酶突變體(D10A突變體或H840A突變體)產(chǎn)生DNA單鏈斷裂。因?yàn)榕cDNA雙鏈斷裂相比,DNA單鏈斷裂將誘導(dǎo)保真性更高的堿基切除修復(fù)[42]。為增加與靶序列特異互補(bǔ)識別的堿基數(shù),利用兩條sgRNA與Cas9切口酶的雙切口(double-nicking)的方法被開發(fā)出來[12,43]。通過在同一靶序列上產(chǎn)生相隔一定距離的兩個切口,可模擬雙鏈斷裂介導(dǎo)有效的Indel形成。由于脫靶處的切口可被精確修復(fù),因此雙切口方法的特異性與野生型Cas9相比,可提高1 500倍[43]。Cas9核酸酶形成的平末端雙鏈斷裂或雙切口酶形成的粘性末端雙鏈斷裂均可激活NHEJ修復(fù)的發(fā)生,在導(dǎo)入同源重組修復(fù)模板的細(xì)胞中,將最終形成Indel突變與同源重組突變的混合。因而,利用一條sgRNA、Cas9切口酶與一條同源重組修復(fù)模板共同導(dǎo)入細(xì)胞后,將進(jìn)行更有效、更精確的同源重組修復(fù)。同時(shí),長同源臂(同源重組修復(fù)模板)的存在將大大降低脫靶重組的發(fā)生。
第三種策略為sgRNA的截短與修飾,如截短其3′端相當(dāng)于tracrRNA的序列、在其5′端增加兩個額外的GG以及在截短互補(bǔ)識別序列中5′端的2個或3個堿基均可提高Cas9的特異性。前兩種方法會損失一定的基因組編輯效率,第三種方法的效率與利用全長sgRNA一樣,并能降低脫靶突變的產(chǎn)生,增加對sgRNA:DNA之間單堿基錯配的敏感性[44]。以上不同的方法策略可組合使用,進(jìn)一步降低脫靶突變的產(chǎn)生。Cas9結(jié)構(gòu)與功能研究及其理性改造或定向進(jìn)化等將會不斷提高Cas9的特異性。
CRISPR-Cas9系統(tǒng)介導(dǎo)的基因組編輯技術(shù)在生物工程與生物醫(yī)學(xué)方面有廣泛的應(yīng)用[30],例如:可快速建立基因突變的動物或細(xì)胞模型,從而揭示遺傳變異或表觀遺傳變異與生物功能或疾病之間的關(guān)系;可作為新的作物育種技術(shù),實(shí)現(xiàn)抗極端環(huán)境、病蟲害以及無外源DNA殘留的重要農(nóng)作物的快速獲得;還可在藻類或玉米中直接導(dǎo)入有效的乙醇合成代謝途徑,獲得可持續(xù)生產(chǎn)的低成本生物燃料;還可利用基因組編輯改造細(xì)菌細(xì)胞工廠,生產(chǎn)大宗化學(xué)品與精細(xì)化學(xué)品如藥品前體等。
CRISPR-Cas9系統(tǒng)除可用于簡便有效的基因組定向編輯外,還具有非常廣闊的應(yīng)用,如基因組規(guī)模的功能篩選、內(nèi)源基因的轉(zhuǎn)錄調(diào)控與表觀遺傳調(diào)控以及特定染色體位點(diǎn)的標(biāo)記等[30]。無核酸酶活性的Cas9(“dead”Cas9,dCas9)為Cas9的D10A與H840A雙突變體,使HNH與RuvC核酸酶結(jié)構(gòu)域均失活,雖無核酸酶活性,但可作為RNA靶向的DNA結(jié)合域,在RNA的指導(dǎo)下與特定DNA序列結(jié)合。在E.coli與人類細(xì)胞中,將dCas9直接定位結(jié)合于啟動子區(qū)可有效抑制下游基因的轉(zhuǎn)錄[45,46]。
dCas9可作為一個DNA結(jié)合域招募不同的效應(yīng)蛋白至特定的基因組位點(diǎn)。例如,dCas9與不同的效應(yīng)蛋白如轉(zhuǎn)錄激活結(jié)構(gòu)域(VP64或NF-κB的p65亞基)或轉(zhuǎn)錄抑制結(jié)構(gòu)域(Krüppel-associated box,KRAB)融合后可在人類細(xì)胞與小鼠細(xì)胞中調(diào)控特定靶基因的轉(zhuǎn)錄。與基于TALEN設(shè)計(jì)的轉(zhuǎn)錄因子相比,dCas9融合蛋白所引起的轉(zhuǎn)錄變化要小一些,但是通過利用2~10個sgRNA來靶向同一個啟動子,使dCas9融合的轉(zhuǎn)錄激活結(jié)構(gòu)域可協(xié)同作用,從而獲得較為顯著的轉(zhuǎn)錄激活反應(yīng)[30,37]。dCas9與表觀遺傳效應(yīng)蛋白融合后,可人為設(shè)計(jì)對特定基因位點(diǎn)添加或刪除如組蛋白修飾與DNA甲基化等特定的表觀遺傳標(biāo)記,以研究表觀遺傳修飾的生物學(xué)功能及其在基因組調(diào)控網(wǎng)絡(luò)中的作用[30,37]。在后續(xù)工作中,除考慮潛在的脫靶效應(yīng)外,還需考慮內(nèi)源表觀遺傳蛋白對融合蛋白中效應(yīng)結(jié)構(gòu)域的干擾。
為研究染色體結(jié)構(gòu)組織在基因功能調(diào)控中的作用,可利用dCas9與增強(qiáng)型綠色熒光蛋白(enhanced green fluorecence protein,EGFP)融合形成EGFP-dCas9蛋白,在活細(xì)胞內(nèi)對特定基因位點(diǎn)進(jìn)行成像,以揭示基因組結(jié)構(gòu)(genome architecture)的動態(tài)變化[47]。利用來源不同的Cas9與多個gRNA可同時(shí)對多個不同基因組位點(diǎn)進(jìn)行不同顏色的標(biāo)記,以揭示復(fù)雜染色體的結(jié)構(gòu)與組裝。
最后,Cas9活性的可誘導(dǎo)調(diào)控可通過將Cas9分裂為兩個部分來實(shí)現(xiàn),然后分別與可被小分子或光誘導(dǎo)后二聚化的兩個結(jié)構(gòu)域融合,在誘導(dǎo)劑存在的條件下,Cas9的兩個部分再重新組裝起來,形成有活性的蛋白發(fā)揮功能。例如,與可誘導(dǎo)的TALEN的構(gòu)建相似[14],將Cas9的兩個部分分別與細(xì)胞凋亡過程中的CIB1與CRY2融合后,通過藍(lán)光激活后可重新組裝。利用這種方法進(jìn)行Cas9的活性調(diào)控,實(shí)現(xiàn)細(xì)胞過程中特定基因的實(shí)時(shí)調(diào)控。
CRISPR-Cas9作為細(xì)菌最為簡單的Ⅱ型獲得性免疫系統(tǒng)被成功改造為繼ZFN與TALEN之后的新一代基因組編輯技術(shù),為基因組定向改造調(diào)控與應(yīng)用等帶來突破性革命。與DNA重組技術(shù)類似,CRISPR-Cas9系統(tǒng)以設(shè)計(jì)操縱簡便、編輯高效與通用性廣等優(yōu)勢,有望成為被廣泛應(yīng)用的基本分子操縱技術(shù),將對生物學(xué)的基礎(chǔ)研究與應(yīng)用產(chǎn)生深遠(yuǎn)的影響。雖然目前CRISPR-Cas9系統(tǒng)中仍有一系列有待解決與發(fā)展的問題,例如如何突破PAM序列的限制、如何建立對Cas9特異性(脫靶效應(yīng))的全面評價(jià)體系、如何構(gòu)建不同物種中可通用的Cas9與sgRNA導(dǎo)入與表達(dá)系統(tǒng)以及如何更有效的激活同源重組修復(fù)等。但是基于CRISPR-Cas9系統(tǒng)的迅猛發(fā)展速度,我們可以預(yù)見,隨著相關(guān)基礎(chǔ)科學(xué)研究的深入,CRISPR-Cas9系統(tǒng)將在基因組水平上的基因改造、轉(zhuǎn)錄調(diào)控與表觀遺傳調(diào)控等不同層次上得到更廣闊的發(fā)展與應(yīng)用。
[1] Capecchi M R. Altering the genome by homologous recom-bination[J]. Science,1989,244(4910):1288-1292.
[2] Hsu P D,Lander E S ,Zhang F. Development and applications of crispr-cas9 for genome engineering[J]. Cell,2014,157(6):1262-1278.
[3] Smith J,Grizot S,Arnould S,etal.. A combinatorial approach to create artificial homing endonucleases cleaving chosen sequences[J]. Nucleic Acids Res.,2006,34(22):e149.
[4] Urnov F D,Miller J C,Lee Y L,etal.. Highly efficient endogenous human gene correction using designed zinc-finger nucleases[J]. Nature,2005,435(7042):646-651.
[5] Miller J C, Holmes M C, Wang J,etal.. An improved zinc-finger nuclease architecture for highly specific genome editing[J]. Nat. Biotechnol.,2007,25(7):778-785.
[6] Christian M,Cermak T,Doyle E L,etal.. Targeting DNA double-strand breaks with TAL effector nucleases[J]. Genetics,2010,186 (2):757-761.
[7] Miller J C,Tan S,Qiao G,etal.. A TALE nuclease architecture for efficient genome editing[J]. Nat. Biotechnol.,2011,29(2):143-148.
[8] Boch J,Scholze H,Schornack S,etal.. Breaking the code of DNA binding specificity of TAL-type Ⅲ effectors[J]. Science,2009,326(5959): 1509-1512.
[9] Moscou M J, Bogdanove A J. A simple cipher governs DNA recognition by TAL effectors[J]. Science,2009,326(5959):1501.
[10] Cong L,RanF A,Cox D,etal.. Multiplex genome engineering using CRISPR/Cas systems[J]. Science,339(6121):819-823.
[11] Mali P,Yang L,Esvelt K M,etal.. RNA-guided human genome engineeringviaCas9[J]. Science,2013,339(6121):823-826.
[12] Mali P,Aach J,Stranges P B,etal.. Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering[J]. Nat. Biotechnol.,2013,31(9):833-838.
[13] Maeder M L,Thibodeau-Beganny S,Osiak A,etal.. Rapid “open-source” engineering of customized zinc-finger nucleases for highly efficient gene modification[J]. Mol. Cell,2008,31(2):294-301.
[14] Juillerat A,Dubois G,Valton J,etal.. Comprehensive analysis of the specificity of transcription activator-like effector nucleases[J]. Nucleic Acids Res.,2014,42(8):5390-5402.
[15] Konermann S,Brigham M D,Trevino A E,etal.. Optical control of mammalian endogenous transcription and epigenetic states[J]. Nature,2013,500(7463):472-476.
[16] Mendenhall E M,Williamson K E,Reyon D,etal.. Locus-specific editing of histone modifications at endogenous enhancers[J]. Nat. Biotechnol.,2013,31 (12):1133-1136.
[17] Ishino Y,Shinagawa H,Makino K,etal.. Nucleotide sequence of theiapgene,responsible for alkaline phosphatase isozyme conversion inEscherichiacoli,and identification of the gene product[J]. J. Bacteriol.,1987,169 (12):5429-5433.
[18] Mojica F J,Díez-Villaseor C,Soria E,etal.. Biological significance of a family of regularly spaced repeats in the genomes of Archaea,Bacteria and mitochondria[J]. Mol. Microbiol.,2000,36(1): 244-246.
[19] Jansen R,Embden J D,Gaastra W,etal.. Identification of genes that are associated with DNA repeats in prokaryotes[J]. Mol. Microbiol.,2002,43(6):1565-1575.
[20] Mojica F J,Díez-Villaseor C,García-Martínez J,etal.. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements[J]. J. Mol. Evol.,2005,60(2): 174-182.
[21] Pourcel C,Salvignol G,Vergnaud G. CRISPR elements inYersiniapestisacquire new repeats by preferential uptake of bacteriophage DNA, and provide additional tools for evolutionary studies[J]. Microbiology,2005,151 (Pt 3):653-663.
[22] Bolotin A,Quinquis B,Sorokin A,etal.. Clustered regularly interspaced short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin[J]. Microbiology,2005,151(Pt 8):2551-2561.
[23] Barrangou R,F(xiàn)remaux C,Deveau H,etal.. CRISPR provides acquired resistance against viruses in prokaryotes[J]. Science,2007,315 (5819):1709-1712.
[24] Brouns S J,Jore M M,Lundgren M,etal.. Small CRISPR RNAs guide antiviral defense in prokaryotes[J]. Science,2008,321(5891):960-964.
[25] Marraffini L A,Sontheimer E J.CRISPR interference limits horizontal gene transfer instaphylococciby targeting DNA[J]. Science,2008,322 (5909):1843-1845.
[26] Hale C R,Zhao P,Olson S,etal.. RNA-guided RNA cleavage by a CRISPR RNA-Cas protein complex[J]. Cell,2009,139(5): 945-956.
[27] Hale C R,Majumdar S,Elmore J,etal.. Essential features and rational design of CRISPR RNAs that function with the Cas RAMP module complex to cleave RNAs[J]. Mol. Cell,2012,45(3):292-302.
[28] Deveau H,Barrangou R,Garneau J E,etal.. Phage response to CRISPR-encoded resistance inStreptococcusthermophilus[J]. J. Bacteriol.,2008,190(4):1390-1400.
[29] Marraffini L A,Sontheimer E J. Self versus non-self discrimination during CRISPR RNA-directed immunity[J]. Nature,2010,463(7280):568-571.
[30] Nishimasu H,Ran F A,Hsu P D,etal.. Crystal structure of Cas9 in complex with guide RNA and target DNA[J]. Cell,2014,156(5):935-949.
[31] Jinek M,Jiang F,Taylor D W,etal.. Structures of Cas9 endonucleases reveal RNA-mediated conformational activation[J]. Science,2014,343 (6176):1247997.
[32] Sternberg S H,Redding S,Jinek M,etal.. DNA interrogation by the CRISPR RNA-guided endonuclease Cas9[J]. Nature,2014,507(7490):62-67.
[33] Jiang W,Bikard D,Cox D,etal.. RNA guided editing of bacterial genomes using CRISPR-Cas systems[J]. Nat.Biotechnol.,2013,31(3):233-239.
[34] Hsu P D,Scott D A,Weinstein J A,etal.. DNA targeting specificity of RNA-guided Cas9 nucleases[J]. Nat. Biotechnol.,2013,31(9):827-832.
[35] Horvath P,Romero D A,Coté-Monvoisin A C,etal.. Diversity,activity,and evolution of CRISPR loci inStreptococcusthermophilus[J]. J. Bacteriol.,2008,190(4): 1401-1412.
[36] Zhang Y,Heidrich N,Ampattu B J,etal.. Processing-independent CRISPR RNAs limit natural transformation inNeisseriameningitidis[J]. Mol. Cell,2013,50(4):488-503.
[37] Sander J D,Joung J K. CRISPR-Cas systems for editing,regulating and targeting genomes[J]. Nat. Biotechnol.,32(4):347-355.
[38] Garneau J E,Dupuis M,Villion M,etal.. The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA[J]. Nature,2010,468(7320):67-71.
[39] Wang H,Yang H,Shivalila C S,etal.. One-step generation of mice carrying mutations in multiple genes by CRISPR/Cas-mediated genome engineering[J]. Cell,2013,153(4):910-918.
[40] Jinek M,Chylinski K,F(xiàn)onfara I,etal.. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity[J]. Science,2012,337(6096):816-821.
[41] Fu Y,F(xiàn)oden J A,Khayter C,etal.. High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells[J]. Nat. Biotechnol.,2013,31(9):822-826.
[42] Dianov G L,Hübscher U. Mammalian base excision repair:The forgotten archangel[J]. Nucleic Acids Res.,2013,41(6):3483-3490.
[43] Ran F A,Hsu P D,Lin CY,etal.. Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity[J]. Cell,2013,154(6):1380-1389.
[44] Fu Y,Sander J D,Reyon D,etal.. Improving CRISPR-Cas nuclease specificity using truncated guide RNAs[J]. Nat. Biotechnol.,2014,32(3):279-284.
[45] Bikard D,Jiang W,Samai P,etal.. Programmable repression and activation of bacterial gene expression using an engineered CRISPR-Cas system[J]. Nucleic Acids Res.,2013,41(15):7429-7437.
[46] Qi L S,Larson M H,Gilbert L A,etal.. Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression[J]. Cell,2013,152(5):1173-1183.
[47] Chen B, Gilbert L A, Cimini B A,etal.. Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system[J]. Cell,155:1479-1491.
[48] Charpentier E,Marraffini L A. Harnessing CRISPR-Cas9 immunity for genetic engineering[J]. Curr. Opin. Microbiol.,2014, 19:114-119.
CRISPR-Cas9-based Genome Engineering
ZHENG Xiao-mei1,2, ZHANG Xiao-li1,3, YU Jian-dong1,2, ZHENG Ping1,2, SUN Ji-bin1,2*
1.KeyLaboratoryofSystemsMicrobialBiotechnology,ChineseAcademyofSciences,Tianjin300308,China;2.TianjinInstituteofIndustrialBiotechnology,ChineseAcademyofSciences,Tianjin300308,China;3.SchoolofBiologicalEngineering,TianjinUniversityofScienceandTechnology,Tianjin300457,China
CRISPR-Cas (clustered regularly interspaced short palindromic repeats-CRISPR-associated proteins) systems are the adaptive immune system in bacteria and archaea that defends against infectious viruses and plasmids. Immunity is mediated by Cas nucleases, which use small RNA guides (the crRNAs) to specify a cleavage site within the genome of invading nucleic acids. In type Ⅱ CRISPR-Cas systems, the DNA-cleaving activity is performed by a single enzyme Cas9 guided by an RNA duplex. Using synthetic single RNA guides, Cas9 can be reprogrammed to create specific double-stranded DNA breaks in the genomes of a variety of organisms, ranging from human cells to bacteria, and thus constitutes a powerful tool for genetic engineering. In this review, we described the development and applications of CRISPR-Cas9 system with highlighting the practical considerations for implementing CRISPR-Cas9 technology.
CRISPR-Cas system; Cas9; genome engineering
2014-11-04; 接受日期:2014-12-04
國家863計(jì)劃項(xiàng)目(2013AA020302);國家自然科學(xué)基金面上項(xiàng)目(31370113)資助。
鄭小梅,助理研究員,博士,從事黑曲霉分子生物學(xué)與系統(tǒng)生物學(xué)研究。E-mail:zheng_xm@tib.cas.cn。*通信作者:孫際賓,研究員,博士生導(dǎo)師,主要從事微生物代謝工程與系統(tǒng)生物技術(shù)研究。Tel:022-84861949;E-mail:sun_jb@tib.cas.cn
10.3969/j.issn.2095-2341.2015.01.01