郝夢圓曲曉軍崔艷華
(1. 哈爾濱工業(yè)大學化工與化學學院,哈爾濱 150090;2. 黑龍江省科學院微生物研究所,哈爾濱 150010)
CRISPRs基因編輯技術研究進展
郝夢圓1曲曉軍2崔艷華1
(1. 哈爾濱工業(yè)大學化工與化學學院,哈爾濱 150090;2. 黑龍江省科學院微生物研究所,哈爾濱 150010)
CRISPR(Clustered regularly interspaced short palindromic repeats)基因簇是一段成簇的短間距回文非編碼序列,它可以通過整合新的間隔子序列實現(xiàn)對入侵外源DNA的記憶,而Cas(CRISPR-associated protein)蛋白則負責輔助CRISPR的轉(zhuǎn)錄產(chǎn)物crRNA(CRISPR RNA),對外源DNA進行切割。二者協(xié)作組成了生物體的CRISPR-Cas系統(tǒng),發(fā)揮抵御外源DNA侵染的作用。目前,CRISPR-Cas系統(tǒng)憑借著高效、簡單、低成本、高特異性的獨特優(yōu)勢迅速吸引了整個科學界的注意,成為研究的一大熱點。對CRISPR-Cas系統(tǒng)的組成、結(jié)構、分型以及CRISPR技術作用機理、優(yōu)勢等做了詳細的介紹,并以嗜熱鏈球菌為例,分析了CRISPR基因的堿基排布及其高級結(jié)構,旨在為分子生物學及相關領域的科學研究提供參考。
CRISPR-Cas系統(tǒng);基因編輯;嗜熱鏈球菌;gRNA-Cas9復合體
神奇的自然進化造就了CRISPR-Cas系統(tǒng),它是細菌及古細菌中的一種特異性免疫系統(tǒng),最早由Ishino發(fā)現(xiàn)于大腸埃希菌的iap基因[1]。CRISPR-Cas系統(tǒng)不僅為研究微生物的進化提供了新思路,更為人類對基因的編輯找到了新的突破口。隨著科學界對其研究的逐漸深入,該系統(tǒng)現(xiàn)已發(fā)展成為一種高效的基因編輯手段,強大的優(yōu)勢使其迅速成為近十年來微生物及相關領域研究的熱點。目前,此項技術已經(jīng)成功應用于包括微生物、植物、動物在內(nèi)的諸多物種當中[2-5]。本文詳細闡述了CRISPR-Cas系統(tǒng)的組成、結(jié)構、分型以及CRISPRs技術作用機理、優(yōu)勢等內(nèi)容,并著重分析了嗜熱鏈球菌中CRISPR基因的堿基排布及其高級結(jié)構,旨在為CRISPR技術的進一步研究與應用提供參考。
細菌在長期的生存斗爭中,進化出多種免疫機制[6],包括已研究較為透徹的限制修飾系統(tǒng)、滲透阻斷、流產(chǎn)感染系統(tǒng)及毒素-抗毒素系統(tǒng)等[7]。近幾年發(fā)現(xiàn)的CRISPR-Cas系統(tǒng)與前三者共同構筑了細菌體內(nèi)一道“堅不可摧的城墻”,實施干擾和切斷外源基因片段的作用。
1.1 CRISPR-Cas系統(tǒng)的組成
CRISPRs意為規(guī)律成簇的短間距回文重復序列。CRISPR基因簇以“重復序列-間隔區(qū)”為單元,為細菌DNA上的一段非編碼區(qū)。Cas蛋白是一種與CRISPRs基因相關的蛋白質(zhì),具有核酸酶和解旋酶活性[1]。CRISPRs基因與Cas蛋白共同組成了CRISPR-Cas系統(tǒng),該系統(tǒng)最早發(fā)現(xiàn)于嗜熱古細菌,用于抵御外來DNA(如質(zhì)粒、噬菌體DNA)的侵染[8]。
典型的CRISPRs基因簇由高度保守的重復序列和間隔片段串聯(lián)而成,通常含有21-48 bp正向重復序列,重復序列之間又由長度基本一致的26-72 bp非重復間隔子隔開[9]。其5'端上游通常含有一段高AT含量的DNA片段作為前導序列。CRISPR序列的二級結(jié)構非常穩(wěn)定,且兩端序列高度保守[8,9]。由于其部分回文重復,CRISPR序列可形成穩(wěn)定的發(fā)夾結(jié)構[10]。
毗鄰CRISPR序列的操縱子編碼Cas蛋白,cas基因具有編碼解旋酶、聚合酶和多種RNA結(jié)合蛋白的核酸的特征。Cas蛋白的類型多種多樣,它能夠參與CRISPR基因位點轉(zhuǎn)錄的不同步驟,并協(xié)助目標DNA的裂解和新間隔子的整合[11-13]。不同Cas蛋白參與不同類型CRISPR-CAS 系統(tǒng)的各個過程,執(zhí)行不同的功能,因此,Cas蛋白是該系統(tǒng)必不可少的組成部分。
1.2 CRISPR-CAS系統(tǒng)的作用機理
CRISPR-CAS系統(tǒng)是細菌及部分古細菌的特異性免疫系統(tǒng)[14],它的作用機理類似于RNA干擾。外源DNA侵入宿主細胞后,部分DNA片段會整合到CRISPR基因簇上;待該序列再次入侵時,宿主細胞在CRISPR-Cas系統(tǒng)的作用下,切斷、裂解入侵的DNA[15]。CRISPR-CAS免疫系統(tǒng)對外來DNA的排斥過程主要包括適應、表達和干擾3個階段[15]。
在適應階段,外源DNA入侵宿主細胞后,Cas1、Cas2蛋白通過識別前間隔子相鄰基序(Protospacer adjacent motif,PAM),將一段外源DNA(稱為前間隔子)整合于宿主的CRISPR基因簇前端,形成新的間隔子,由此形成對入侵DNA的“記憶”。在表達階段,帶有外源DNA片段前間隔子的CRISPR 基因簇轉(zhuǎn)錄出一條單鏈RNA(前體crRNA),前體crRNA經(jīng)Cas1、Cas2蛋白及RNA酶的加工、剪切,成為成熟的短鏈crRNA,它由對應于CRISPR 基因簇上的單鏈間隔子和相鄰單鏈重復序列組成。成熟的crRNA可進一步與相關Cas蛋白或Cascade復合體結(jié)合,形成CRISPR效應核蛋白復合體(crRNP)。在干擾階段,crRNP復合體結(jié)合的crRNA作為gRNA引導復合體向目標DNA發(fā)起進攻,最終導致外源DNA的降解。在廣泛應用的CRISPR/Cas9系統(tǒng)中,成熟crRNA可與tracrRNA(Trans-encodedsmall RNA)互補配對形成雙鏈RNA,dsRNA與Cas9蛋白、RNase Ⅲ結(jié)合成為靶向切割復合體,與被識別的目標DNA互補配對,再對其進行切割、裂解[16]。這種高效率、特異性的DNA切割、編輯方式為基因的修飾及突變體的構建提供了新的思路。
1.3 CRISPR-CAS系統(tǒng)的分型
現(xiàn)有的生物信息學分析發(fā)現(xiàn),不同物種的CRISPR基因簇可編碼大約65個同源Cas蛋白,由此可將其分為8個CRISPR-CAS系統(tǒng)亞型,但復雜的分類方法會阻礙CRISPR-CAS系統(tǒng)的應用。結(jié)合系統(tǒng)發(fā)育樹信息和比較基因組分析,Makarova等[17]提出一種新型的分類系統(tǒng),主要包括3種不同類型。
I型CRISPR-Cas系統(tǒng)基因簇包含cas3基因,可編碼一種大分子量的Cas3蛋白,其基因簇上還存在編碼一種Cas蛋白復合體——Cascade(CRISPR-associatedcomplex for antiviral defense)的基因,這種復合體包含大量屬于重復相關可疑蛋白(Repeatassociated mysterious proteins,RAMP)超家族的蛋白質(zhì)(如同源性較近的Cas7和Cas8)。I型系統(tǒng)中,發(fā)揮主要作用的是一種具有RNA酶活性的RAMP蛋白,它能夠切割前體-crRNA,進而將其加工為成熟的crRNA。在對外源DNA的降解階段,目標DNA由Cas3蛋白的HD核酸酶結(jié)構域靶向并進行切割[10]。
II型系統(tǒng)又稱“HNH”系統(tǒng)、鏈球菌樣系統(tǒng)及Nmeni亞型。II型系統(tǒng)除具有普遍存在于各型系統(tǒng)的Cas1和Cas2蛋白外,還含有一種特征性的大分子量(包含約1 000個氨基酸)單亞基蛋白——Cas9,其作用為協(xié)助加工crRNA以及裂解目標DNA。Cas9蛋白上有兩個不相干的核苷酸結(jié)構域[1],分別稱作RuvC樣(RNA酶H折疊)和HNH(McrA樣)核酸酶結(jié)構域[18],它們分別負責CRISPR基因簇的轉(zhuǎn)錄和外源DNA的干擾[1]。II型系統(tǒng)可分為3個亞型,II-A、II-B和II-C亞型。II-A亞型系統(tǒng)包含一個額外的csn2基因。該蛋白雖不具有干擾目標DNA的功能,但在間隔子的整合階段發(fā)揮一定作用,它編碼的Csn蛋白呈四環(huán)結(jié)構,線性雙鏈DNA可通過中心孔結(jié)合于Csn蛋白上[10]。II-B亞型系統(tǒng)則由一種屬于Cas4蛋白大家族的特殊蛋白發(fā)揮主要作用,該蛋白具有5'-單鏈DNA外切酶活性[1]。II-C亞型是已知的CRISPR-CAS 系統(tǒng)中僅僅依靠Cas1、Cas2和Cas9三種蛋白發(fā)揮作用的系統(tǒng)[19],該系統(tǒng)常用于細菌基因組測序,現(xiàn)已發(fā)展成為一種強有力的基因編輯工具[20]。
III型系統(tǒng)主要包括III-A(又稱Mtube和CASS6亞型)和III-B(又稱聚合酶-RAMP模塊)兩個亞型,兩種亞型都含有一種典型的多結(jié)構域Cas10蛋白[21]。III型CRISPR-CAS系統(tǒng)往往不編碼Cas1和Cas2,而是與I 型或者II型系統(tǒng)共用crRNA[22]。III-A亞型具有cas1、cas2和cas6基因,能夠靶向DNA[23];而大多數(shù)III-B亞型缺失這些基因,一般需要依賴同基因組的其它CRISPR-Cas系統(tǒng),該亞型能夠靶向RNA[24]。Cas10蛋白是Ⅲ型系統(tǒng)效應物復合物上的大亞基。每種III型位點也編碼其他亞基的效應復合物,如小亞基基因、編碼Cas5和Cas7大家族RAMP蛋白的基因[25]。
考慮到CRISPR-Cas系統(tǒng)的快速演變,今后將會有更多類型被發(fā)掘出來,即使現(xiàn)有的分型系統(tǒng),也不能涵蓋所有物種,如嗜酸氧化亞鐵硫桿菌Acidithiobacillus ferrooxidans ATCC 23270菌 株 的CRISPR-Cas系統(tǒng)便不能納入上述3種類型,有的分類系統(tǒng)將其歸入U型CRISPR-Cas系統(tǒng)[18]。該系統(tǒng)不含Cas1、Cas2蛋白,也無以上3種系統(tǒng)的任何特征。
1.4 嗜熱鏈球菌中的CRISPR-Cas
嗜熱鏈球菌是CRISPR-Cas II型系統(tǒng)常用的特征模型系統(tǒng),其gRNA-Cas9復合體是一種傳統(tǒng)的CRISPR/Cas基因編輯工具,它能特異性地識別一個包含堿基配對區(qū)和PAM的DNA片段,并且可以誘導DNA雙鏈在目標位點斷裂。相關研究表明,嗜熱鏈球菌的CRISPR/Cas系統(tǒng)以5'-NNAGAA作為PAM識別序列[26]。長期的免疫過程讓嗜熱鏈球菌的CRISPR基因與相關功能單位實現(xiàn)了“進化”,同時CRISPR基因的多樣性也更加豐富。
嗜熱鏈球菌的CRISPR基因呈現(xiàn)多態(tài)性,按其基因位點的不同可分為4種類型,分別為CRISPR1、CRISPR2、CRISPR3及CRISPR4[27]。除CRISPR2的位點在cas基因的中部外,其它3種類型的CRISPR位點均分布在cas基因的下游[27],這在一定程度上,與CRISPR2是原始革蘭氏陽性菌基因的遺留部分有關。
不同CRISPR基因簇的堿基個數(shù)以及組成存在差異(圖1)。CRISPR1/Cas基因簇為8 037 bp,其中CRISPR1基因包含32個間隔子,長2 146 bp,這種多重復序列、多間隔子的特點有利于外源DNA片段的整合;CRISPR2/Cas基因簇總長8 628 bp,但CRISPR2基因僅包含3個間隔子,基因總長為258 bp,所含的Cas蛋白基因比重較大,這樣的結(jié)構不利于新間隔子的整合,使得CRISPR2/Cas發(fā)揮的作用相對較小;CRISPR3/Cas基因簇總長7 147 bp,CRISPR3基因包含12個間隔子,基因長度為827 bp;CRISPR4/Cas基因簇總長為7 343 bp,CRISPR4基因長762 bp,包含12個間隔子[27]。
上述4種類型CRISPR基因包含的重復序列大小及堿基構成各不相同(圖2):CRISPR1、CRISPR2和CRISPR3 3種基因的重復序列(分別以DR1、DR2、DR3表示)包含的堿基個數(shù)相同,但堿基排布各不相同,且均包含回文序列,可形成莖環(huán)狀的二級結(jié)構。DR1的堿基序列構成為GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAAC(5'-3')[28],頭部為21個堿基形成的大環(huán),莖區(qū)長6 bp,尾部長4和1 bp[29],如圖2-a所示;DR2的堿基為GATA TAAACCTAATTACCTCGAGAGGGGACGGAAAC(5'-3')[28],DR2環(huán)頭部僅由6個堿基組成,莖區(qū)長4 bp,很大一部分堿基集中在了尾部的游離區(qū),分別長16和8 bp[29],如圖2-b所示;DR3序列為GTTTTAGA GCTGTGTTGTTTCGAATGGTTCCAAAAC(5'-3')[28],DR3呈典型的莖環(huán)結(jié)構,除頭部外,均形成了莖區(qū),尾部沒有游離堿基[29]。與上述3種CRISPR基因不同,CRISPR4的重復序列DR4僅長28 bp,堿基排布為GGATCACCCCCGCGTGTGCGGGAAAAAC,其二級結(jié)構信息尚未有文獻報道。
圖1 S.thermophilus中不同CRISPR/Cas位點的結(jié)構[1,27]
圖2 不同類型CRISPR基因的重復序列及其二級結(jié)構[29]
在漫長的防御過程中,CRISPR基因與細菌質(zhì)粒、病毒DNA等實現(xiàn)了“共進化”[30],研究表明,它們之間有部分同源性較高的序列[31]。CRISPR基因簇的3'末端(尾部末端)在不同菌株間呈現(xiàn)高同源性,而5'末端(前導末端)呈高變異性[28],這與外源DNA在前導序列之后插入密切相關。間隔子數(shù)量最多的CRISPR1基因呈現(xiàn)最高的多樣性,而僅有3個間隔子的CRISPR2最為保守。Horvath等[28]通過研究表示:CRISPR1是某些嗜熱鏈球菌特有的,CRISPR3在嗜熱鏈球菌CRISPR-Cas系統(tǒng)中的分布更為廣泛,而CRISPR2則可能由原始的革蘭氏陽性菌DNA退化而產(chǎn)生。
不同類型CRISPR基因簇中包含的cas基因也有一定的區(qū)別及相似性,這體現(xiàn)了CRISPR基因與Cas蛋白的聯(lián)系及功能上的協(xié)作。Cas蛋白能夠參與CRISPR的產(chǎn)生過程,如III型系統(tǒng)中內(nèi)切酶樣的Cas蛋白涉及DNA的追蹤,因此噬菌體衍生的間隔子對嗜熱鏈球菌CRISPR結(jié)構有一定偏向性[30]。cas1和cas2基因在4種CRISPR / Cas基因座中的分布可能影響其在防御系統(tǒng)中的活性[32]。CRISPR1和CRISPR3的結(jié)構較為保守,它們的重復間隔區(qū)上游存在有4個cas基因;而CRISPR2基因簇的組成及結(jié)構差異性較大,cas基因則位于重復間隔區(qū)的兩側(cè)[28]。雖然CRISPR1和CRISPR3上cas基因的分布較為相似,但序列相似性低,即使是在蛋白質(zhì)水平也僅有22%的相似度,僅有cas1是3種基因座之間唯一保守的基因[28]。
研究者利用人為改造過的gRNA-cas9復合體進行基因的靶向編輯,即CRISPRs技術,這一重大突破已成為繼ZFN(鋅指核酸酶)、TALEN(類轉(zhuǎn)錄激活因子效應物核酸酶)以后的第三代基因編輯技術。
2.1 CRISPRs基因編輯技術
基因定點編輯是一種針對生物基因組特定的靶位點構建序列特異性核酸酶,從而引導目標位點的DNA雙鏈斷裂(DNA double-strand breaks,DSB),隨后經(jīng)生物體內(nèi)源DNA斷裂修復系統(tǒng)實現(xiàn)斷裂DNA修復的技術。易錯非同源性末端連接(Nonhomologous end joining,NETJ)是一種有效的DNA損傷修復機制,但由易錯非同源性末端連接(NETJ)介導的DNA雙鏈斷裂(DBS)修復有時會伴有缺失突變,從而造成目標位點基因組信息的破環(huán)[9]。在Ⅱ型gRNA-cas9復合體的參與下,同源重組修復反應可以通過引入外源供體DNA作為修復模板產(chǎn)生敲入突變,從而緩解基因組破壞[9]。
ZFN、TALEN和CRISPR/Cas9 系統(tǒng)都可以通過設計目標位點對復雜的基因組實現(xiàn)定點編輯[16],ZFN和TALEN技術目前仍在廣泛使用,而新興的CRISPRs技術能夠基于細菌及古細菌中的CRISPRCAS系統(tǒng),將生物自身的DNA識別、加工手段運用于突變的構建,較前者具有更大的優(yōu)勢。
Ⅱ型系統(tǒng)的靶向切割復合物結(jié)構最為簡單,除tracrRNA、RNase Ⅲ外只需要Cas9一種蛋白的協(xié)助[33],因而成為應用最廣的CRISPR基因編輯技術。CRISPR/Cas9技術的主要工具為sgRNA-Cas9 復合體。Jinek等[34]發(fā)現(xiàn),tracrRNA的5'端能夠與成熟crRNA的3'端部分配對形成莖環(huán)結(jié)構,這是識別靶DNA所必須的,他們將tracrRNA與crRNA表達為嵌合的向?qū)NA(gRNA)。此外,Cas9蛋白也是CRISPR/Cas9技術中必不可少的部分,Cas9蛋白(800-1,400個氨基酸)包含RuvC和HNH兩個核酸酶結(jié)構域[18],二者均能參與靶DNA的裂解[35]。此外,還具有α-螺旋組成的識別區(qū)(REC)以及位于C端的PAM結(jié)合位點[4]。Cas9蛋白的晶體結(jié)構解析顯示:Cas9具有雙葉結(jié)構[36],雙葉的兩環(huán)均貢獻一個PAM識別位點,因此靶DNA和sgRNA可結(jié)合于兩葉之間的接口處。Qi等[37]通過研究指出CRISPR/Cas9系統(tǒng)可以有效地沉默細菌基因,進而有效減少脫靶現(xiàn)象。sgRNA-Cas9 復合體除具有各自功能外,還能夠阻斷轉(zhuǎn)錄期間RNA聚合酶與DNA的結(jié)合[37],從而抑制細菌基因表達,破壞靶DNA穩(wěn)定性。
CRISPRs技術主要運用于基因定點編輯,其中包括單基因及多基因敲除、精確突變、微缺失插入突變以及單基因的多重編輯。該技術在人、鼠等哺乳動物的基因編輯中應用最為廣泛,Mali等[38]將CRISPR/Cas9系統(tǒng)用于誘導人類多能干細胞的多重突變;Zhang等[39]將CRISPRs技術成功運用于小鼠ES細胞中大片段DNA的插入和敲除。Oh等[40]結(jié)合CRISPR-Cas9和重組技術,成功地把密碼子飽和誘變應用于羅伊氏乳桿菌當中,CRISPR-Cas9還可用于在低重組效率的細菌中鑒定重組細胞。此外,對CRISPR基因簇與Cas蛋白的研究還可為探究種屬間親緣關系及多樣性提供新的思路[29]。
CRISPRs基因編輯技術的操作程序主要包括以下幾步:首先通過測定轉(zhuǎn)化效率確定CRISPR-Cas自殺活性,接下來對轉(zhuǎn)座子進行誘變,誘變完成后通過CRISPR / Cas系統(tǒng)篩選自殺逃避型突變體,進而排除假陽性,然后運用PCR技術鑒定轉(zhuǎn)座子插入位點,通過“清除”缺失來驗證表型,最后補充轉(zhuǎn)導中缺失的片段,即可完成基因編輯[41]。
2.2 gRNA-Cas9進行基因編輯的影響因素
當前基于CRISPR-Cas系統(tǒng)的基因編輯主要依賴gRNA-Cas9,其主要受以下因素影響。
2.2.1 gRNA的選擇 gRNA的引導方式及其tracrRNA長度的設計是CRISPRs基因編輯技術的關鍵影響因素[42]。gRNA的引導方式有單獨引導和雙向引導兩種方式,單獨引導是將與靶DNA互補的crRNA與tracrRNA連接成為一條單鏈的引導RNA(single guide RNA,sgRNA)。相對于雙引導RNA(dual guide RNA),sgRNA不易引起Indel突變,編輯速度也比雙引導更快;其次,gRNA上tracrRNA序列的長度也是影響CRISPR系統(tǒng)作用的主要因素,多數(shù)研究將gRNA的大小設計為100 nt左右,gRNA 5'端20 nt的區(qū)域為DNA互補區(qū)、3'端70-80 nt的區(qū)域為tracrRNA序列,crRNA區(qū)則居于中間位置[42]。
gRNA-Cas9復合體的結(jié)合方式也會影響CRISPR/Cas9的作用效率。延伸gRNA上的Cas9結(jié)合區(qū)能夠增強Cas蛋白活性,進而提高編輯效率,主要方法有兩種:在gRNA3'端緊鄰tracrRNA的區(qū)域增加一段5 nt的核苷酸序列,或者于螺旋區(qū)增加4-10 bp的堿基對以增強crRNA與tracrRNA的結(jié)合[43]。
2.2.2 脫靶效應的顯著影響 脫靶效應與gRNA和Cas9蛋白的濃度及比例相關,降低gRNA的濃度可以降低脫靶率,但降低Cas9蛋白濃度在降低脫靶率的同時降低了正靶率[44]。鑒于gRNA及Cas9蛋白對脫靶效應的影響尚有爭議[44-46],我們可以從gRNA及Cas9的濃度比入手,選擇出最佳的gRNA/ Cas9比例,以降低脫靶率。sgRNA的結(jié)構對脫靶效應也有影響,可以通過對sgRNA進行截短、修飾來提高正靶/脫靶之比,如在5'端識別區(qū)之前加額外的GG堿基,或?qū)RNA的3'末端截短[47]。此外,有研究表明gRNA-Cas9復合體能夠耐受靶向序列5'端的突變[48,49]。再者,通過點突變使RuvC或HNH亞基失活,構建Cas9蛋白的突變體DNA切口酶(又稱dCas9,即deadCas9)亦能夠減少脫靶現(xiàn)象。該突變體能夠引起DNA單鏈斷裂(SSB),相比于DNA雙鏈斷裂,DNA單鏈斷裂能夠產(chǎn)生近距離切口,進而引起帶有黏性末端的DSB[45],提高打靶效率,同時能夠減輕脫靶的不利影響。張鋒等人的研究指出,減少mRNA的用量也能夠有效地抑制脫靶現(xiàn)象的發(fā)生[50]。
2.2.3 突變體位點的選擇 CRISPR/Cas9對靶點的識別需要PAM(NGG)和緊鄰PAM的11 bp種子序列完全保守,所以將突變位點設定在這14 bp之內(nèi)可以防止突變引起的切割功能喪失[42]。錯配序列的出現(xiàn)會導致比較嚴重的脫靶現(xiàn)象,有研究表明,前半部分序列的單核苷酸錯配比后半部分的錯配具有更好的耐受性[43],因此對目標位點的合理選擇有望能夠使脫靶效應的不利影響最小化。
2.3 優(yōu)勢
2.3.1 簡單易行的設計操作方法 CRISPR/Cas9系統(tǒng)的構造簡單,該技術對基因的編輯主要依靠一個sgRNA-Cas9 復合體,而無須太多輔助蛋白,編輯成本低,操作更加簡便。此外,CRISPR/Cas9識別域的構建相對簡單,想要改變靶DNA識別位點僅需要改變一小段20 bp大小的前導子序列[51],載體構建時間明顯縮短,大大減少了工作量。
2.3.2 高效率的編輯與更好的通用性 相比于ZFN、TALEN等基因編輯工具,CRISPR技術能夠更加高效地進行基因編輯。Ding等[42]分別用CRISPR、TALEN對人類多功能干細胞進行編輯,結(jié)果顯示CRISPR法的敲入克隆效率可達11%,而TALEN的效率僅有1.6%。CRISPR對靶DNA的特異性識別依賴于長度僅為2-5 bp的PAM序列[52],因此能夠識別更多的序列,擴大CRISPR的通用性。
2.3.3 更高的打靶特異性 利用CRISPR進行定點編輯更加精確。主要原因在于Cas9蛋白有RuvC和HNH兩個功能區(qū),它們分別負責DNA兩條鏈的切割,還能利用任意一個功能區(qū)的突變將其改造為DNA切口酶,分別切割DNA的兩條鏈并產(chǎn)生黏性末端。D10A及H840雙突變dCas9更能夠成為一種高特異性的錨定蛋白[53,54]。
2.3.4 可實現(xiàn)同時對多個不同靶DNA序列的編輯CRISPR/Cas9技術更大的優(yōu)勢在于它能夠用于同時編輯多個靶基因位點?!爸貜?間隔”的CRISPR基因座天然結(jié)構使其能夠同時插入多個新的外源DNA片段,從而實現(xiàn)多位點編輯。Chen等[55]利用CRISPR/Cas9對小鼠模型進行多個靶腫瘤基因的篩查,Zhang等則將多個引導序列編碼到單個CRISPR陣列中,以使其能夠同時編輯哺乳動物基因組內(nèi)的多個位點[56]。
2.3.5 可運用于對真核生物基因的編輯修飾CRISPR-Cas系統(tǒng)雖來自于細菌和古細菌,卻能夠被廣泛應用于真核細胞的DNA突變中。這一應用的實現(xiàn)只需人為將Cas9蛋白轉(zhuǎn)運到哺乳動物細胞內(nèi)。Cong和Zhang等[56]研究首次利用CRISPR/Cas9系統(tǒng)實現(xiàn)了對人293T細胞的EMX1和PVALB基因及小鼠Nero2A細胞的Th基因的定點突變,并指出需要在Cas9蛋白的兩端加上真核細胞的核定位號NLS,但也有研究指出只需在一端添加NLS即可實現(xiàn)Cas9的高效轉(zhuǎn)運[38]。
自21世紀初CRISPRs系統(tǒng)被發(fā)現(xiàn)以來,CRISPRs基因編輯技術飛速發(fā)展,已然成為第三代基因編輯工具,并造就了一批批科研奇跡。該技術的應用,涵蓋生物、農(nóng)業(yè)、環(huán)境及醫(yī)學等多個領域。生物學領域中,它常作為構建突變體的重要手段,將為基因工程的進一步應用以及生物體的保護、研究提供更新、更廣的思路;農(nóng)業(yè)領域中,在動植物的改造以及病原微生物的防治方面蘊藏著巨大的應用潛力;醫(yī)療領域中,CRISPRs不僅可以用于人類遺傳性疾病的治療,還可以用于疾病相關基因的篩查與檢測、幫助確定潛在藥靶,為某些疑難雜癥,如腫瘤、白血病等的治療尋求突破口。
但目前該技術的應用也存在著多方面的問題。脫靶效應是影響CRISPRs編輯效率的一個重要因素,如何有效地降低脫靶率是一個較為棘手的問題。其次,來源于細菌的CRISPRs系統(tǒng)是否會對人類以及現(xiàn)有的動植物產(chǎn)生危害或者引起排異現(xiàn)象?如何減少錯配現(xiàn)象的發(fā)生以及如何緩解突變位點的選擇限制對靶基因編輯的影響也是亟待解決的問題。未來的研究中,除了CRISPRs進一步應用外,我們必須從解決該編輯方法自身的問題入手,為CRISPRs的發(fā)展掃清障礙。
[1] Chylinski K, Makarova KS, Charpentier E, et al. Classification and evolution of type II CRISPR-Cas systems[J]. Nucleic Acids Research, 2014, 42(10):6091-6105.
[2] 朱金潔. CRISPR-Cas9介導的玉米基因組定點編輯研究[D]:北京:中國農(nóng)業(yè)大學, 2015.
[3] Jiang W, Bikard D, Cox D, et al. RNA-guided editing of bacterial genomes using CRISPR-Cas systems[J]. Nature Biotechnology, 2013, 31(3):233-239.
[4] Nishimasu H, Ran FA, Hsu PD, et al. Crystal structure of Cas9 in complex with guide RNA and target DNA[J]. Cell, 2011, 156(5):935-949.
[5] Chang N, Sun C, Gao L, et al. Genome editing with RNA-guided Cas9 nuclease in Zebrafish embryos[J]. Cell Research, 2013, 23(4):465-472.
[6] Sturino JM, Joseph MS, Todd RK. Engineered bacteriophage-defence systems in bioprocessing[J]. Nature Reviews Microbiology, 2006, 4(5):395-404.
[7] Abedon ST. Bacterial ‘immunity’ against bacteriophages[J]. Bacteriophage, 2012, 2(1):50-54.
[8] 王立人. CRISPR/CAS系統(tǒng)介導的基因組大片段DNA編輯[D]:上海:華東師范大學, 2015.
[9] Bondy-Denomy J, Davidson AR. To acquire or resist:the complex biological effects of CRISPR-Cas systems[J]. Trends in Microbiology, 2014, 22(4):218-225.
[10] Kunin V, Sorek R, Hugenholtz P. Evolutionary conservation of sequence and secondary structures in CRISPR repeats[J]. Genome Biology, 2007, 8(4):61.
[11] van Embden JDA, van Gorkom T, Kremer K, et al. Genetic variation and evolutionary origin of the direct repeat locus of mycobacterium tuberculosis complex bacteria[J]. Journal of Bacteriology, 2000, 182(9):2393-2401.
[12] Demay C, Liens B, Burguière T, et al. SITVITWEB-A publicly available international multimarker database for studying Mycobacterium tuberculosis genetic diversity and molecular epidemiology[J]. Infection, Genetics and Evolution, 2012, 12(4):755-766.
[13] Zanden AGMVD, Kremer K, Schouls LM, et al. Improvement of differentiation and interpretability of spoligotyping for mycobacterium tuberculosis complex isolates by introduction of new spacer oligonucleotides[J]. Journal of Clinical Microbiology, 2002, 40(12):4628-4639.
[14] Lillest?l R, Redder P, Garrett RA, et al. A putative viral defence mechanism in archaeal cells[J]. Archaea, 2006, 2(1):59-72.
[15] Choi KR, Sang YL. CRISPR technologies for bacterial systems:current achievements and future directions[J]. Biotechnology Advances, 2016, 34(7):1180-1209.
[16] Li C, Cao W. Advances in CRISPR/Cas9-mediated gene editing[J]. Chinese Journal of Biotechnology, 2015, 31(11):7080-7081.
[17] Makarova KS, Haft DH, Barrangou R, et al. Evolution andclassification of the CRISPR-Cas systems[J]. Nature Reviews Microbiology, 2011, 9(6):467-477.
[18] Makarova KS. Unification of Cas protein families and a simple scenario for the origin and evolution of CRISPR-Cas systems[J]. Biology Direct, 2011, 6(1):38-38.
[19] Chylinski K, Le RA, Charpentier E. The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems[J]. RNA Biology, 2013, 10(5):726-737.
[20] Wei C, Liu J, Yu Z, et al. TALEN or Cas9 - rapid, efficient and specific choices for genome modifications[J]. Journal of Genetics and Genomics, 2013, 40(6):281-289.
[21] Anantharaman V, Iyer LM, Aravind L. Presence of a classical RRM-fold palm domain in Thg1-type 3'-5' nucleic acid polymerases and the origin of the GGDEF and CRISPR polymerase domains[J]. Biology Direct, 2010, 5(1):43.
[22] Nickel L, Weidenbach K, J?ger D, et al. Two CRISPR-Cas systems in Methanosarcina mazei strain G?1 display common processing features despite belonging to different types I and III[J]. RNA Biology, 2013, 10(5):779-791.
[23] Marraffini LA, Sontheimer EJ. CRISPR interference limits horizontal gene transfer in Staphylococci by targeting DNA[J]. Science, 2008, 322(322):1843-1845.
[24] Hale CR, Majumdar S, Elmore J, et al. Essential features and rational design of CRISPR RNAs that function with the Cas RAMP module complex to cleave RNAs[J]. Molecular Cell, 2012, 45(3):292-302.
[25] Makarova KS, Koonin EV. Annotation and classification of CRISPR-Cas systems[J]. Methods in Molecular Biology(Clifton, NJ), 2015, 1311:47-75.
[26] Fujii W, Kakuta S, Yoshioka S, et al. Zygote-mediated generation of genome-modified mice using Streptococcus thermophilus 1 -derived CRISPR/Cas system[J]. Biochemical & Biophysical Research Communications, 2016, 477(3):473-476.
[27] Wu Q, Tun HM, Leung FC, et al. Genomic insights into high exopolysaccharide-producing dairy starter bacterium Streptococcus thermophilus ASCC 1275[J]. Scientific Reports, 2014, 4(7500):4974.
[28] Horvath P, Romero DA, Co?témonvoisin AC, et al. Diversity, activity, and evolution of CRISPR loci in Streptococcus thermophilus[J]. Journal of Bacteriology, 2008, 190(4):1401-1412.
[29] 鄧凱波, 霍貴成. 嗜熱鏈球菌中CRISPR序列的檢測與同源性分析[J]. 食品科學, 2013, 34(3):153-157.
[30] Bolotin A, Quinquis B, Sorokin A, et al. Clustered regularly interspaced short palindrome repeats(CRISPRs)have spacers of extrachromosomal origin[J]. Microbiology, 2005, 151(Pt 8):2551-2561.
[31] Mojica FJ, Díezvillase?or C, Garcíamartínez J, et al. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements[J]. Journal of Molecular Evolution, 2005, 60(2):174-182.
[32] Goh YJ, Goin C, O’Flaherty S, et al. Specialized adaptation of a lactic acid bacterium to the milk environment:the comparative genomics of Streptococcus thermophilus LMD-9[J]. Microbial Cell Factories, 2011, 10 Suppl 1(1):S22.
[33] Brouns SJ, Jore MM, Lundgren M, et al. Small CRISPR RNAs guide antiviral defense in prokaryotes[J]. Science, 2008, 321(5891):960-964.
[34] Jinek M, Chylinski K, Fonfara I, et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity[J]. Science, 2012, 337(6096):81.
[35] Sapranauskas R, Gasiunas G, Fremaux C, et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli[J]. Nucleic Acids Research, 2011, 39(21):9275-9282.
[36] Jinek M, Jiang F, Taylor DW, et al. Structures of Cas9 endonucleases reveal RNA-mediated conformational activation[J]. Science, 2014, 343(6176):124799.
[37] Qi LS, Larson MH, Gilbert LA, et al. Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression[J]. Cell, 2013, 152(5):1173-1183.
[38] Mali P, Yang L, Esvelt KM, Aach J, Guell M, Dicarlo JE, Norville JE, Church GM. 2013. RNA-guided human genome engineering via Cas9. Science 339:823-826.
[39] Zhang L, Jia R, Palange NJ, et al. Large genomic fragment deletions and insertions in mouse using CRISPR/Cas9[J]. PLoS One, 2015, 10(3):e0120396.
[40] Oh JH, van Pijkeren JP. CRISPR-Cas9-assisted recombineering in Lactobacillus reuteri. [J]. Nucleic Acids Research, 2014, 42(17):e131.
[41] Yosef I, Goren MG, Edgar R, et al. Using the CRISPR-Cas systemto positively select mutants in genes essential for its function[J]. Methods in Molecular Biology, 2015, 1311:233-250.
[42] Ding Q, Regan SN, Xia Y, et al. Enhanced efficiency of human pluripotent stem cell genome editing through replacing TALENs with CRISPRs[J]. Cell Stem Cell, 2013, 12(4):393-394.
[43] Jinek M, East A, Cheng A, et al. RNA-programmed genome editing in human cells[J]. Elife, 2013, 2(2):e00471.
[44] Pattanayak V, Lin S, Guilinger JP, et al. High-throughput profiling of off-target DNA cleavage reveals RNA-programmed Cas9 nuclease specificity[J]. Nature Biotechnology, 2013, 31(9):839-843.
[45] Sander JD, Joung JK. CRISPR-Cas systems for editing, regulating and targeting genomes[J]. Nature Biotechnology, 2014, 32(4):347-355.
[46] Fu Y, Foden JA, Khayter C, et al. High frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells[J]. NatureBiotechnology, 2013, 31(9):822-826.
[47] Cho SW, Kim S, Kim Y, et al. Analysis of off-target effects of CRISPR/Cas-derived RNA-guided endonucleases and nickases[J]. Genome Research, 2014, 24(1):377-389.
[48] Semenova E, Severinov K. Interference by clustered regularly interspaced short palindromic repeat(CRISPR)RNA is governed by a seed sequence[J]. Proceedings of the National Academy of Sciences of the United States of America, 2011, 108(25):10098-10103.
[49] Cradick TJ, Fine EJ, Antico CJ, et al. CRISPR/Cas9 systems targeting β-globin and CCR5 genes have substantial off-target activity[J]. Nucleic Acids Research, 2013, 41(20):9584-9592.
[50] Zhang F. CRISPR/Cas9 for genome editing:progress, implications and challenges[J]. Human Molecular Genetics, 2014, 24(R6):40-48.
[51] Gupta RM, Musunuru K. Expanding the genetic editing tool kit:ZFNs, TALENs, and CRISPR-Cas9[J]. The Journal of Clinical Investigation, 2014, 124(10):4154-4161.
[52] Shah SA, Shah SA, Erdmann S, et al. Protospacer recognition motifs:mixed identities and functional diversity[J]. RNA Biology, 2013, 10(5):891-899.
[53] Guilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification[J]. Nature Biotechnology, 2014, 32(6):577-582.
[54] Tsai SQ, Wyvekens N, Khayter C, et al. Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing[J]. Nature Biotechnology, 2014, 32(6):569-576.
[55] Chen S, Sanjana Neville E, Zheng K, et al. Genome-wide CRISPR screen in a mouse model of tumor growth and metastasis[J]. Cell, 2015, 160(6):1246-1260.
[56] Cong L, Ran FA, Cox D, et al. Multiplex genome engineering using CRISPR/Cas systems[J]. Science, 2013, 339(6121):819-823.
(責任編輯 狄艷紅)
Advances in Gene Editing via Clustered Regularly Interspaced Short Palindromic Repeats
HAO Meng-yuan1QU Xiao-jun2CUI Yan-hua1
(1. School of Chemistry and Chemical Engineering,Harbin Institute of Technology,Harbin 150090;2. Institute of Microbiology,Heilongjiang Academy of Sciences,Harbin 150010)
CRISPR is a piece of clustered short-interspaced palindromic non-coding sequences,in which the invasive foreign DNA can be memorized by integrating new spacer sequences. However,Cas protein is responsible for supporting CRISPR transcription products---crRNA(CRISPR RNA)to splice foreign DNA. CRISPR-Cas system,based on the cooperation of the two segments,plays a role in resisting exogenous DNA infection. So far,CRISPR-Cas system attracts the attention from whole scientific community rapidly relying on its unique advantages,such as high efficiency,convenience,low cost and high specificity. This review summarizes the composition,structure and type of CRISPR-Cas system as well as the mechanism and advantages of CRISPR technology. Moreover,taking Streptococcus thermophilus as an example,the base arrangement and advanced structure of the CRISPR gene are also presented in order to provide references for the scientific research in molecular biology and related fields.
CRISPR-Cas system;gene editing;Streptococcus thermophilus;gRNA-Cas9 complex
10.13560/j.cnki.biotech.bull.1985.2016-1085
2016-11-28
郝夢圓,女,碩士研究生:研究方向:分子微生物學;E-mail:myhao1995@163.com
崔艷華,女,博士,教授,研究方向:分子微生物學;E-mail:yhcui@hit.edu.cn