張鈺雯,俞晨霖,戴心忱,肖易倍,陸美玲*
(1中國藥科大學(xué)生命科學(xué)與技術(shù)學(xué)院,南京211198;2中國藥科大學(xué)藥學(xué)院,南京211198)
CRISPR-Cas (clustered regularly interspaced short palindromic repeats and CRISPR associated)系統(tǒng)是一種在細菌和古細菌基因組中發(fā)現(xiàn)的適應(yīng)性免疫系統(tǒng),由RNA 介導(dǎo)來抵擋外源核酸的入侵。1987年,日本大阪大學(xué)在研究大腸埃希菌的堿性磷酸酶同工酶時發(fā)現(xiàn)其基因組中存在一些串聯(lián)間隔重復(fù)序列[1],后續(xù)研究表明這段序列在細菌和古細菌的基因組中廣泛存在,2002年被正式命名為CRISPR[2]。本文介紹了1 類中的Ⅰ型CRISPR-Cas系統(tǒng)近幾年的研究成果和應(yīng)用,主要是其基因簇組成和Cas蛋白的異同點,以及從結(jié)構(gòu)的角度詳細闡述Ⅰ型系統(tǒng)中效應(yīng)復(fù)合物的組裝模式以及特異性識別底物并招募Cas3 蛋白的R-loop 機制,分子作用方式與目前應(yīng)用最廣泛的CRISPR-Cas9 系統(tǒng)相比有很大不同。另外,對Ⅰ型CRISPR-Cas 系統(tǒng)在基因編輯領(lǐng)域的應(yīng)用進行了總結(jié)。相比Cas9蛋白,Cas3 的長片段DNA 降解功能更有利于進行大范圍的基因組功能研究,效應(yīng)復(fù)合物的靶向性可用于融合調(diào)控蛋白來調(diào)節(jié)基因的表達,同時CRISPR 陣列的特性便于多基因同時編輯,具有填補當前基因編輯領(lǐng)域空白的潛力。
CRISPR-Cas 基因簇包含儲存外源核酸序列信息的CRISPR 基因座以及編碼不同功能蛋白的cas基因。CRISPR 基因座是一段由前導(dǎo)序列、重復(fù)序列和間隔序列組成的簇狀規(guī)則間隔的短回文重復(fù)片段。前導(dǎo)序列是CRISPR 基因座的啟動子,轉(zhuǎn)錄重復(fù)序列和間隔序列,但不翻譯為蛋白;長度相近的間隔序列則是來源于噬菌體、質(zhì)粒、轉(zhuǎn)座酶基因或內(nèi)源性的有害核酸片段等;重復(fù)序列區(qū)將不同的間隔序列隔開,轉(zhuǎn)錄后在內(nèi)部通過堿基互補作用形成發(fā)卡結(jié)構(gòu)。cas基因位于CRISPR 基因座附近,根據(jù)在系統(tǒng)中執(zhí)行的功能不同來命名區(qū)分,可編碼幾十種結(jié)構(gòu)和性質(zhì)不同的Cas蛋白(表1)。
Table 1 Type and function of Cas proteins in type I CRISPR-Cas system
CRISPR-Cas 系統(tǒng)的適應(yīng)性免疫過程分為3步:(1)第1 步是適應(yīng)過程。外源核酸片段被Cas蛋白特異性識別,整合特定長度的序列到CRISPR基因座中[3],形成新的間隔序列;(2)第2 步為crRNA(CRISPR RNA)成熟階段。在前導(dǎo)序列控制下,儲存外源核酸信息的CRISPR 基因座轉(zhuǎn)錄成包含重復(fù)序列和間隔序列的長RNA 前體,并被相關(guān)Cas 蛋白加工成為一系列含有部分重復(fù)序列和完整間隔序列的成熟crRNA[4],crRNA 與效應(yīng)Cas 蛋白結(jié)合形成效應(yīng)復(fù)合物;(3)第3 步是干擾階段。效應(yīng)復(fù)合物靶向識別與crRNA 互補的核酸序列;此外,效應(yīng)復(fù)合物接觸底物時,依賴于識別靶標序列附近2 ~7 個堿基長度的PAM(protospacer adjacent motif)序列[5];滿足兩個結(jié)合條件之后,Cas 蛋白在特定位點進行切割或降解,破壞靶標序列。
根據(jù)效應(yīng)復(fù)合物的組成形式不同,CRISPRCas 系統(tǒng)分成1 類和2 類兩大部分:1 類又分為3 個類型(Ⅰ型、Ⅳ型和Ⅲ型)和16個亞型,該類別的共同特征是利用多Cas 蛋白效應(yīng)物復(fù)合物實現(xiàn)干擾靶標核酸;2 類包括有Ⅱ型、Ⅴ型和Ⅵ型3 個類型,該系統(tǒng)只利用單一效應(yīng)蛋白如Cas9 和Cas12 發(fā)揮活性。2020年,科學(xué)家對已經(jīng)發(fā)現(xiàn)的Cas蛋白進行了系統(tǒng)整理[6],主要從適應(yīng)階段、成熟階段、效應(yīng)階段以及信號轉(zhuǎn)導(dǎo)4 個功能模塊進行分類,其中1 類特征蛋白為Cas3 和Cas10,2 類的特征蛋白是Cas9和Cas12。Ⅰ型系統(tǒng)靶向的核酸類型為雙鏈DNA,該系統(tǒng)包含有Cas1、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas10d 等主要蛋白(在不同的亞型中可能會有不同的命名)(表1)。Cas1、Cas2 和Cas4蛋白參與新的間隔序列整合過程[7];Cas3包含解旋酶活性和單鏈DNA 核酸酶活性[8],發(fā)揮切割和降解DNA 作用;其他蛋白則形成效應(yīng)復(fù)合物,骨架部分一般由Cas7、Cas5 和Cas6 蛋白或其同源蛋白組成[9]。Cas7 蛋白的拷貝數(shù)為6 ~7 個,結(jié)合和支撐crRNA 并影響crRNA 與DNA 的結(jié)合形式;Cas5 相對分子質(zhì)量較小,與底物核酸結(jié)合有關(guān);Cas6 具有RNA 內(nèi)切核酸酶活性,催化切割長RNA 前體為成熟的crRNA[10],但在I-C 亞型中,該功能由Cas5 執(zhí)行;此外,復(fù)合物中的大亞基Cas10d、Cas8和Cse1,在底物DNA 結(jié)合過程中識別PAM 序列,具有直接與Cas3 蛋白相互作用的結(jié)構(gòu)域,穩(wěn)定Cas3 的空間位置。
Ⅰ型系統(tǒng)目前分為I-A 至F和I-U 7個亞型(圖1)[11],每個類型有不同的cas基因組合特點,但均包含特征基因cas3[12]。在這些亞型之內(nèi),根據(jù)蛋白的差別又可以細分為多種子類型,例如通過Cas8b 蛋白家族的特點,細分為Hmari 亞型(Cas8b1)、Tneap 亞 型(Cas8b2)和Myxan 亞 型(Cas8b3)等[11]。相比于其他系統(tǒng),I-C 亞型中成熟crRNA 的功能由Cas5 代替[13];I-A 亞型的特征在于Cas8 分裂成兩個蛋白,分別編碼大亞基和小亞基,同時Cas3 蛋白分裂成解旋酶Cas3′和核酸酶Cas3″。I-E 和I-F 亞型系統(tǒng)中不存在Cas4 蛋白,并且I-F 亞型中Cas3 與Cas2 融合表達[14],參與到前間隔序列的識別和整合過程。I-D 亞型具有幾個獨特特征,其大亞基是Ⅲ型特征蛋白Cas10的變體Cas10d,而Cas3 的核酸酶結(jié)構(gòu)域和Cas10d 的氨基端融合,解旋酶結(jié)構(gòu)域單獨表達。最近的研究發(fā)現(xiàn),I-B、I-C 和I-D 等亞型的大亞基基因C 端存在一個獨立開放閱讀框,編碼的多拷貝小亞基蛋白參與形成效應(yīng)復(fù)合物[15]。I-U 亞型中的U 代表無法準確定義屬性,其蛋白的結(jié)構(gòu)功能和相關(guān)機制目前沒有清晰的解釋。因此,CRISPR-Cas 系統(tǒng)可根據(jù)一個或幾個特征基因的差異分成不同的亞型,且部分Cas蛋白功能在不同亞型中有所區(qū)別。
Figure 1 Representative strains and gene cluster information of type I CRISPR-Cas system subtypes.Grey rectangle represents repeat,and pink diamond means different spacers.Cas1 and Cas2 are conserved in all systems
Ⅰ型CRISPR-Cas系統(tǒng)的效應(yīng)復(fù)合物結(jié)構(gòu)具有一些共同特征,目前通過冷凍電鏡或X 射線解析得到的結(jié)構(gòu)有I-E、I-F、I-C 以及I-D 型,其中關(guān)于I-E 型和I-F 型系統(tǒng)的研究最為透徹。以大腸埃希菌的I-E 型為例,其效應(yīng)復(fù)合物有5 種Cas 蛋白,包括11 個亞基(Cas76Cas51Cas61Cse11Cse22)和61 個堿基的成熟crRNA(圖2-A),相對分子質(zhì)量約為405 kD,外觀上呈現(xiàn)出“海馬體”形狀[16],6 個Cas7蛋白形成“海馬體”的背部結(jié)構(gòu),crRNA的間隔序列片段沿著Cas7 蛋白1 ~6 號亞基產(chǎn)生的連續(xù)正電荷凹槽定位,在第6、12 和18 等位置出現(xiàn)核苷酸紐結(jié),扭結(jié)之間5 個核苷酸堆疊的片段為A 型螺旋,位于Cas7 外層的凹面上;而在扭結(jié)位點上的堿基改變方向,從Cas7 的2 ~6 號亞基伸出的5 個長β發(fā)夾結(jié)構(gòu)穿過其中,從而阻止了crRNA 特定位點與靶DNA 的堿基配對(圖2-B)。Cas6 結(jié)合重復(fù)序列部分形成的發(fā)卡結(jié)構(gòu),切割長RNA 前體使其成熟,并在切割后仍與發(fā)夾保持穩(wěn)定結(jié)合,保護crRNA 免受進一步降解[17],然后與其他蛋白形成復(fù)合物,固定crRNA 的3′末端;Cas5 蛋白固定crRNA 的5′末端,Cse1為大亞基,和crRNA 5′端一側(cè)作用,特異性識別和結(jié)合dsDNA 底物,并與招募的Cas3蛋白直接作用;Cse2相對分子質(zhì)量比較小,參與結(jié)合和固定dsDNA底物的非靶標鏈。
不同系統(tǒng)中crRNA 的長度不同,在Ⅰ型系統(tǒng)中作為確定效應(yīng)復(fù)合物大小的分子尺,即與一些Cas蛋白的拷貝數(shù)有關(guān)。在Zymomonas mobilis的I-F亞型系統(tǒng)中,研究者發(fā)現(xiàn)在制備體外復(fù)合物時,添加的crRNA 中間隔序列長度不同,溶液中單體ZmCsy3 會轉(zhuǎn)變?yōu)椴煌牡途蹱顟B(tài)[18];在I-E 系統(tǒng)中,Cas7 蛋白相對間隔序列的周期為6 個堿基,Cse2 為12 個堿基,當間隔序列長度與野生型相差6 個堿基的偶數(shù)倍時,復(fù)合物穩(wěn)定且均一,但相差奇數(shù)倍時,復(fù)合物的穩(wěn)定性會大大降低[19]。這些現(xiàn)象充分說明了crRNA 的長度是影響復(fù)合物分子骨架大小以及其他亞基招募的關(guān)鍵因素。因此可以通過設(shè)計間隔序列的長度,改變骨架蛋白的拷貝數(shù)[20],從而調(diào)節(jié)效應(yīng)復(fù)合物的活性,這一特性為定制靶向特定目標DNA的效應(yīng)復(fù)合物開辟了可能性。
在復(fù)合物的結(jié)構(gòu)中,各亞型一般都包括骨架蛋白、大亞基和小亞基。由于進化或生存環(huán)境的影響,一些蛋白的結(jié)構(gòu)有差異,同時效應(yīng)復(fù)合物的扭曲角度也會有所不同(圖2-A、2-C、2-D)。在I-C亞型中,Cas5d 蛋白能夠識別重復(fù)序列中的發(fā)夾結(jié)構(gòu),將長RNA 前體切割為成熟crRNA,代替了其他系統(tǒng)中Cas6 的功能,同時又與crRNA 的5′端結(jié)合起到固定作用[13]。在I-Fv 亞型中,效應(yīng)復(fù)合物僅由3 種蛋白(Cas7fv-Cas5fv-Cas6fv)組成(圖2-C),Cas5fv 起到識別底物DNA 中的PAM 序列的作用[21]。在I-B、I-C和I-D系統(tǒng)中,大亞基基因C端翻譯產(chǎn)生小亞基蛋白Cas11結(jié)合在骨架蛋白一側(cè),在電鏡結(jié)構(gòu)以及生化研究中發(fā)現(xiàn)能夠結(jié)合底物DNA的非靶標鏈[22],如果沒有該亞基,效應(yīng)復(fù)合物將無法 穩(wěn) 定 結(jié) 合 底 物DNA[15]。Sulfolobus islandicusLAL14/1 的I-D 亞型則同時具有Ⅰ型和Ⅲ型的特征,其Cas3 蛋白分解為解旋酶Cas3′和核酸酶Cas3″,其中核酸酶結(jié)構(gòu)域在Cas10d 的氨基端端融合表達,因此Cas10d具有切割底物dsDNA的活性;此外,該系統(tǒng)的骨架蛋白Csc2 能夠催化特定長度ssDNA 為產(chǎn)物的切割反應(yīng)[23],此功能類似于Ⅲ型系統(tǒng)中骨架蛋白切割前間隔序列轉(zhuǎn)錄產(chǎn)物的特性,說明I-D系統(tǒng)是Ⅰ型和Ⅲ型的進化中間體。
效應(yīng)復(fù)合物識別底物dsDNA 時,需要滿足兩個基本條件:一是識別前間隔序列附近的PAM 序列,二是DNA 序列與crRNA 產(chǎn)生特定長度的互補配對區(qū)域。PAM 序列位于前間隔序列非靶標鏈中(不與crRNA 互補的鏈),Ⅱ型系統(tǒng)一般在前間隔序列的3′端[24],而Ⅰ型系統(tǒng)位于上游5′端。尋找靶標序列時,效應(yīng)復(fù)合物中的大亞基識別PAM 序列,crRNA 接觸到DNA 底物,依靠堿基之間作用力的強弱使得DNA 發(fā)生解旋,其中靶標鏈與crRNA產(chǎn)生局部區(qū)域的互補配對[25],通常稱之為種子序列。研究發(fā)現(xiàn),產(chǎn)生干擾效應(yīng)時該序列至少需要18 個堿基左右的長度[26]。種子序列完成匹配后,非靶標鏈向外彎曲,形成R-loop 結(jié)構(gòu),其中DNA 彎曲的程度與堿基配對解開的DNA 長度之間存在一定關(guān)系[9,27]。
實驗表明,效應(yīng)復(fù)合物必須與靶標DNA 形成完整的R-loop結(jié)構(gòu),才能招募Cas3蛋白[28],這一特性可以防止Cas3 過早地結(jié)合到DNA 上,引起非特異性切割。Cas3 順利被招募后與效應(yīng)復(fù)合物中的大亞基結(jié)合(圖2-E),同時非靶標鏈的單鏈部分進入Cas3 蛋白核酸酶結(jié)構(gòu)域,在Mg2+等金屬離子的催化下,Cas3 的3′→5′方向單鏈核酸酶切割活性會在PAM 下游十幾個堿基左右的位點切割非靶標鏈,形成單鏈上的缺口(圖2-F)。產(chǎn)生缺口的DNA鏈可能會穿過Cas3 的解旋酶結(jié)構(gòu)域,從而啟動后續(xù)的DNA 解鏈以及降解。這一過程中,Cas3 如何對dsDNA 進行持續(xù)降解的具體結(jié)構(gòu)以及分子機制尚未研究清楚。體內(nèi)編輯實驗結(jié)果顯示,長片段缺失主要發(fā)生在PAM 上游5′端,與Cas3 蛋白的切割活性方向一致;同時,下游也會產(chǎn)生小片段缺失,這與細胞內(nèi)同源重組的機制有關(guān),因為編輯后的序列與設(shè)定的修復(fù)模板一致[29-30];也有少部分研究人員認為下游缺失是由于Cas3蛋白在切割位點進行了雙向降解[31],可能與后續(xù)單鏈DNA 的空間位置轉(zhuǎn)變有關(guān)。關(guān)于Cas3蛋白切割方向的定論仍需進一步的實驗證明。
從結(jié)構(gòu)上來看,Ⅰ型CRISPR-Cas 系統(tǒng)的效應(yīng)復(fù)合物由多種蛋白組成,分工明確,遵循著嚴格的分子組裝方式,每種亞型都有各自的特點;在尋找靶標DNA 并干擾時,有著嚴謹?shù)淖R別機制,與Ⅱ型系統(tǒng)如CRISPR-Cas9 的過程相比,要求更加嚴格,這可能是Ⅰ型CRISPR-Cas系統(tǒng)在自然界存在更為廣泛的原因之一。
Figure 2 Cascade complex assembly of type I CRISPR-Cas system subtypes and protein-nucleic acid interactionA: CRISPR RNA-guided surveillance complex binding to dsDNA in Thermobifida fusca (PDB: 5U07); B: The base at the 6th position of spacer is blocked by the residues (sky blue) and does not bind to DNA; C: Cascade consists of only three proteins (Cas7fv-Cas5fv-Cas6fv) in the I-Fv system(PDB: 5O7H); D: Type I-F Cascade complex from Pseudomonas aeruginosa (PDB: 6NE0); E: Cas3 binds to the large subunit in Cascade,and the nuclease domain is close to the non-target DNA (PDB: 6C66); F:Detail of Cas3 and DNA in the E.Grey: Cas7 (backbone); Green: Cas6; Purple: Cse2; Dark blue: Cse1 or Cas8; Orange: Cas5; Light blue: Cas3.Red chain: crRNA; Yellow chain: target DNA; Violet purple chain: non-target DNA.Ball in F:metal ions in Cas3
CRISPR-Cas9 系統(tǒng)是研究者最早發(fā)現(xiàn)并且其分子機制研究透徹的系統(tǒng)之一,已經(jīng)成為基礎(chǔ)和應(yīng)用生物學(xué)研究中普遍選擇的基因編輯工具[32-33],然而簡單易操作也會附帶一些問題,例如Cas9 產(chǎn)生基因敲除后,仍然存在能編碼蛋白的假信使RNA,翻譯產(chǎn)生具有一定活性的蛋白影響編輯效率[34-35],Cas9 和Cas12 進行大片段缺失的能力也相對有限,而Ⅰ型系統(tǒng)或可以填補這一空白,開發(fā)成為效果更佳的基因編輯工具。目前的研究主要從細胞水平出發(fā),在原核或真核細胞中觀察基因編輯的效率和靶向性。
Cas3 切割靶向DNA 之后,核酸酶活性對DNA進行持續(xù)降解,對比Cas9的單堿基突變,這一特性為基因編輯領(lǐng)域提供了新思路。Thermobifida fuscaI-E 型的效應(yīng)復(fù)合物可以在人類細胞中產(chǎn)生一系列大的基因組缺失,通過電轉(zhuǎn)效應(yīng)復(fù)合物和Cas3蛋白,在單個CRISPR 靶向位點的上游引起長片段DNA 損傷(幾百堿基到100 kb)而引起基因沉默,效率最高可達60%,顯示了它們在大范圍基因組操作中的潛力[36]。鑒于純化蛋白復(fù)合物的過程容易限制重新編程和優(yōu)化系統(tǒng)的能力,研究人員開發(fā)了基于轉(zhuǎn)染質(zhì)粒的效應(yīng)復(fù)合物和Cas3蛋白在人類細胞中異源表達方式,便于靶向不同的位置,且編輯 范圍 可 達 到200 kb[37]。 此外,Pseudomonas aeruginosa的I-C 系統(tǒng)在該細菌內(nèi)應(yīng)用時,單靶點的編輯效率94% ~100%,可敲除7 ~424 kb長度的片段;同時,作者將Cas3的大片段敲除功能應(yīng)用于基因組最小化研究中(圖3-A),通過對迭代篩選的存活細胞進行測序,成功敲除了非必需基因總長達849 kb,占整個基因組大小的13.6%[31]。從最小化基因組角度出發(fā),刪除非必需基因有利于我們解析生命在底層上的架構(gòu),促進人工生命設(shè)計和合成的發(fā)展,同時也可用于研究非編碼DNA 的功能。這一應(yīng)用也說明了在選擇靶向位點時,要考慮到大片段敲除的隨機性對細胞生長必需基因的影響,否則將影響細胞本身的存活。
基因敲除后,DNA 的修復(fù)方式之一是細胞內(nèi)的同源重組機制,當人為給予修復(fù)模板時,該系統(tǒng)可以在基因組中的指定位點插入指定片段。一般方法是在表達CRISPR 陣列的質(zhì)粒上攜帶一段非靶向的待插入片段,同時在兩側(cè)加上基因組插入位點兩側(cè)的同源序列,這段特定片段即被插入到基因組中(圖3-B)。例如,在引入靶基因的點突變或連續(xù)點突變片段后,野生型的基因被靶向降解而突變體存活,通過篩選即可以得到一系列基因組水平上的突變菌株[29]。實驗中發(fā)現(xiàn),對某些堿基位點的編輯效率比較低,這可能是因為突變這些位點后序列仍可被有效靶向。從結(jié)構(gòu)上看,DNA結(jié)合crRNA時,第6、12、18等位點的堿基出現(xiàn)翻轉(zhuǎn)而不與crRNA 相互作用,因此在這些位點的突變不會影響特異性識別,從而產(chǎn)生編輯逃逸。此外,基于CRISPR 的基因編輯策略可以對染色體基因進行原位標記,通過設(shè)計同源重組的位點和插入片段序列,在目標基因的起始密碼子ATG 后插入24 個堿基的flag 基因片段的效率接近100%[30],便于在生理條件下進行基因表達研究。需要注意的是,對于多倍體生物而言,每個細胞的染色體數(shù)目為多個,導(dǎo)致自身基因組之間發(fā)生高頻率的同源重組,在一定程度上產(chǎn)生對CRISPR 系統(tǒng)的耐受,理論上可以嘗試更換蛋白表達啟動子,增強CRISPR系統(tǒng)的瞬時表達等方法來控制。
除了對單個基因進行編輯,CRISPR 陣列的序列特點使得多基因同時編輯變得非常容易。Ⅰ型系統(tǒng)中,只需要在表達crRNA 質(zhì)粒中增加幾十個堿基,設(shè)計多個間隔序列即可(圖3-C),I-B[30]、IC[31]和I-F[38]等系統(tǒng)都驗證了這一應(yīng)用。此外,根據(jù)Cas3 的核酸酶活性方向,在需要刪除的片段兩端分別設(shè)計crRNA,向中間降解后或可產(chǎn)生特定范圍的敲除,降低單向降解的隨機性。目前靶向多基因的實驗大都在原核細胞中進行,可能是由于電轉(zhuǎn)質(zhì)粒后再表達蛋白對真核細胞的毒性較大[36],因此需要電轉(zhuǎn)不同的核糖核蛋白復(fù)合物來實現(xiàn),這一手段有一定技術(shù)難度,或許將成為下一階段的研究目標。
CRISPR-Cas 系統(tǒng)精準的靶向性使其可以作為體內(nèi)引導(dǎo)工具。效應(yīng)復(fù)合物在PAM 序列和crRNA的引導(dǎo)下,能夠?qū)⑷诤媳磉_的蛋白帶到調(diào)控位點,從而激活基因(CRISPRa)或沉默基因(CRISPRi)的表達,且該融合一般不會影響效應(yīng)復(fù)合物本身的組裝(圖3-D)。研究人員在HEK293T 細胞中轉(zhuǎn)染相關(guān)質(zhì)粒,將菌株效應(yīng)復(fù)合物的骨架蛋白Cas7 融合轉(zhuǎn)錄激活因子VPR(VP64-p65-Rta)[38],通過效應(yīng)復(fù)合物的靶向作用帶領(lǐng)VPR 到達指定位點,調(diào)控外源蛋白GFP 或內(nèi)源蛋白HBB 的表達。同樣可將效應(yīng)復(fù)合物的蛋白融合一些核酸內(nèi)切酶或DNA 甲基化酶等從而發(fā)揮特定的效應(yīng)[39],例如,融合依賴二聚化的非特異性FokI 核酸酶結(jié)構(gòu)域可實現(xiàn)對靶標基因的高效率特異性編輯[37]。由于骨架蛋白拷貝數(shù)與間隔序列的長度成正相關(guān),研究發(fā)現(xiàn)按比例延長間隔序列的長度能在一定范圍增加骨架蛋白的拷貝數(shù),由此增強對特定靶標位置上基因轉(zhuǎn)錄的沉默調(diào)控[40],這可能與crRNA-DNA 之間互補的長度增加以及效應(yīng)復(fù)合物發(fā)揮的空間位阻效應(yīng)有關(guān),提示可以調(diào)整間隔序列的長度來改變效應(yīng)復(fù)合物的活性,以滿足不同的調(diào)控需求。同時,效應(yīng)復(fù)合物的多亞基特性,也為融合多個調(diào)控因子發(fā)揮作用提供了極大的可能性。
CRISPR-Cas系統(tǒng)存在于約90% 的古細菌以及40% 的細菌基因組中,為了應(yīng)對復(fù)雜的生存環(huán)境,很多細菌同時具有多個CRISPR-Cas 系統(tǒng),這廣泛性揭示了CRISPR-Cas系統(tǒng)作用機制的高效和精確性。通過優(yōu)化改造Ⅰ型系統(tǒng)的效應(yīng)復(fù)合物,可以實現(xiàn)精準地插入、敲除或替換目的基因。例如通過改變Cas 蛋白的某些氨基酸序列改變效應(yīng)復(fù)合物的最佳活性溫度,從而更適合在人類細胞中應(yīng)用;同時,效應(yīng)復(fù)合物的含量在一定范圍內(nèi)與編輯效率呈現(xiàn)正相關(guān)。融合表達調(diào)控基因時,延長間隔序列的長度可以增加骨架蛋白的拷貝數(shù),從而增強調(diào)控作用,一定程度上提高編輯效率;此外由于重復(fù)序列具有同源重組效應(yīng),可能丟失中間的間隔序列而降低效率,這一問題可以通過改變引起重組反應(yīng)的部分堿基來解決。選擇靶標序列時,crRNA 與前間隔序列之間的核苷酸錯配影響CRISPR復(fù)合物干擾的效率,相對于鳥嘌呤,胞嘧啶突變更容易被耐受[41],有研究認為前間隔序列中適度的高鳥嘌呤-胞嘧啶(GC)含量會提高編輯效率,但過高的GC含量(>62.5%)也會降低CRISPR干擾效應(yīng)[42]。
Figure 3 Gene editing applications of type I CRISPR-Cas systemA: Cas3 deletes large fragments of non-essential genes and minimizes the genome; B: Insert a gene into the target fragment through homologous recombination; C: Design different spacers in one CRISPR array to target different genes and edit two genes at the same time; D: Regulatory protein is fused with Cascade,and reaches the transcriptional regulatory region through the targeting effect of Cascade,controlling gene expression or silence
對于Cas3 而言,其長基因片段缺失功能將有助于對非編碼區(qū)基因的探究,有望開發(fā)成為大規(guī)模檢測基因組功能的工具,對遺傳學(xué)研究具有深遠的意義。此外,CRISPR 激活(CRISPRa)和CRISPR 抑制(CRISPRi)的應(yīng)用范圍廣泛,無論在實驗方案設(shè)計或?qū)嶒灢僮髦校诤喜煌{(diào)控蛋白過程的可操控性較強,Ⅰ型CRISPR-Cas 系統(tǒng)的效應(yīng)復(fù)合物在基因編輯的各個方面都具有很大的應(yīng)用價值。未來應(yīng)用中,在動物模型搭建、基因組功能研究、基因檢測以及基因編輯為原理的疾病治療、藥物遞送等領(lǐng)域,Ⅰ型CRISPR-Cas 系統(tǒng)的特點和功能為人們提供更多的方法和思路。