鄭基壇(綜述), 閆娜娜, 左二偉(審校)
CRISPR(clustered regularly interspaced short palindromic repeats)系統(tǒng),即成簇的、間隔規(guī)律的短回文重復序列。該系統(tǒng)廣泛存在于40%的細菌及90%的古細菌中,主要用于應對外源DNA或者病毒入侵的免疫防御[1]。根據該特性,Jinek等[2]將tracrRNA及crRNA整合形成單鏈引導RNA(small guide RNA,sgRNA),該sgRNA由5′端負責與靶序列互補配對的20個核苷酸及3′端參與Cas9蛋白識別的發(fā)卡結構組成,首次在體外實現對靶標序列的切割,為CRISPR/Cas基因編輯技術的廣泛應用奠定了重要基礎。隨后,Cong等[3]和Mali等[4]同時發(fā)表CRISPR/Cas9系統(tǒng)應用于哺乳動物細胞基因組編輯的研究,極大地推動了基因編輯技術的發(fā)展與應用。2016年以來,Gaudelli等[5]和Komor等[6]基于脫氨酶與CRISPR/Cas9系統(tǒng)相繼開發(fā)了胞嘧啶堿基編輯器(cytosine base editor, CBE)和腺嘌呤堿基編輯器(adenine base editor, ABE),Kurt等[7]和Zhao等[8]開發(fā)了C到G堿基編輯器(C-to-G base editor, CGBE),為基礎醫(yī)學和精準基因治療提供了重要技術手段。2019年,Anzalone等[9]又開發(fā)了精準基因編輯工具引導編輯器(prime editor, PE),為單堿基編輯技術無法進行的編輯領域提供了另一重要選擇。
1.1 CRISPR/Cas核酸酶介導的基因編輯技術 目前已經發(fā)現3種不同類型的CRISPR/Cas系統(tǒng),其中第2類最為簡單,只需要1種Cas蛋白參與即可完成對靶序列的識別與切割,更適合用于基因編輯,目前廣泛應用的Cas9蛋白就屬于第2類[1]。CRISPR/Cas在sgRNA的指導下,可對基因組靶序列進行切割,造成DNA雙鏈斷裂(double strands break,DSB)。DSB主要通過2種方式進行修復,即非同源末端連接(non-homologous end joining,NHEJ)與同源重組(homology-directed repair,HDR)。CRISPR/Cas造成的DSB通常在NHEJ修復方式下,造成特定位置的堿基插入或缺失,從而通過移碼突變使基因喪失功能。因此CRISPR/Cas常被用于基因敲除的研究。這種修復方式經常會造成DNA的插入缺失、倒位和易位等問題,使得基因治療存在嚴重的安全風險。另外,在含有雙鏈DNA或者單鏈DNA同源重組模板供體的情況下,DSB可以通過HDR修復方式對基因組進行精準編輯,包括堿基替換、精準插入和精準刪除等。但是,HDR一般發(fā)生于分裂細胞周期的G2和S期,細胞內主要以NHEJ修復方式為主,導致HDR介導的精準編輯效率很低。
但是,研究表明,CRISPR/Cas和sgRNA誘導的DSB可以導致基因組較大片段的改變,如易位或者大片段刪除[10-11],或是激活細胞內p53通路[12-13]。而近期研究報道,Cas9蛋白即使在沒有外源sgRNA的條件下,過表達也可激活多種細胞系中的p53通路,并促進p53失活型突變的選擇性富集[14]。
1.2 擴展CRISPR/Cas基因編輯范圍 Cas蛋白結合DNA靶序列需要有特定的前間隔序列鄰近基序(protospacer adjacent motif,PAM)存在,極大限制了合適sgRNA的選擇。最早開發(fā)并廣泛應用的來源于化膿性鏈球菌(Streptococcuspyogenes)的Cas9蛋白所識別的PAM為NGG[15]。科研人員一直致力于開發(fā)識別不同PAM的Cas蛋白以擴展其應用范圍,主要從以下2個方面進行研究:一是通過尋找不同來源的Cas蛋白,例如金黃色葡萄球菌(Staphylococcusaerou)來源的SaCas9識別“NNGRRT”PAM,具有的蛋白更小,更適合病毒包裝遞送到體內[16];二是通過構建Cas蛋白的不同突變體,例如SpCas9-EQR、SpCas9-VQR和SpCas9-VRER可以分別識別“NGAG”“NGA”和“NGCG” PAM。盡管這些不同來源或不同突變體蛋白可以識別不同PAM,但還是有很多位點難以編輯。2020年,Walton等[17]通過生物工程技術開發(fā)了一種SpCas9的突變體SpRY,該突變體幾乎不需要PAM,可以靶向絕大部分基因組位置,并且具有較高的基因編輯效率。該進展突破了CRISPR/Cas系統(tǒng)因需要特定的PAM而產生的限制,為很多之前不可用的位點提供了被編輯的可能,極大擴展了其編輯范圍。
1.3 提高CRISPR/Cas基因編輯特異性 Cas9蛋白的精確靶向編輯主要取決于它能夠從基因組序列中識別能與sgRNA互補的靶向DNA,但也存在無法區(qū)別相似序列的情況,造成sgRNA依賴性脫靶。通過生物工程技術,工程化改變Cas9蛋白的氨基酸序列,能夠降低脫靶編輯。Slaymaker等[18]通過篩選突變體發(fā)現了一種含有K848A、K1003A和R1060A突變組合的SpCas9變體eSpCas9(1.1),既可以有效編輯靶位置,又可以減少在非靶位置的編輯。Kleinstiver等[19]也開發(fā)了N497A、R661A、Q695A和Q926A突變組合的SpCas9-HF1突變體,該突變體具有更好的保真性。Chen等[20]研究了高保真性的Cas9蛋白減少脫靶的生化機制,研發(fā)了包含N692A、M694A、Q695A和H698A突變的高保真HypaCas9。eSpCas9(1.1)、SpCas9-HF1和HypaCas9是在一定理論基礎上設計得到的,Casini等[21]在酵母系統(tǒng)里通過文庫篩選的方法開發(fā)了新的高保真的SpCas9突變體,即evoCas9。Lee等[22]在大腸桿菌中應用文庫篩選方案研發(fā)了名為Sniper-Cas9的高保真SpCas9突變體。總而言之,通過各種生物工程技術優(yōu)化CRISPR/Cas系統(tǒng),降低無法區(qū)別相似DNA序列的可能性,提高基因編輯的特異性,為應用于臨床奠定基礎。
單堿基編輯技術是基于CRISPR/Cas系統(tǒng)改造的新型基因編輯技術,可精確、高效地將DNA或者RNA中的一個堿基替換為另一個堿基。該技術因具有不產生雙鏈斷裂、無需供體、效率高、普適性等特點,成為基因編輯領域的新寵。目前,已開發(fā)的單堿基編輯器包括可將胞嘧啶(C)替換為胸腺嘧啶(T)的CBE[23]、將腺嘌呤(A)替換為鳥嘌呤(G)的ABE[5],以及最近新開發(fā)的可進行C到G堿基顛換的CGBE[7-8]。
2.1 CBE堿基編輯器 常用的CBE主要由大鼠的胞嘧啶脫氨酶(rApobec)、切口酶活性的nCas9(D10A)以及尿嘧啶DNA糖基化酶抑制劑(uracil glycosylase inhibitor, UGI)組成。胞嘧啶脫氨酶將編輯窗口的胞嘧啶(C)脫氨形成尿嘧啶(U),由CG配對變成UG配對的中間體,在DNA錯配修復的修復機制下,U會被識別為T,實現CG配對向TA配對的轉變,利用nCas9切口酶在非編碼鏈上產生缺口,則會極大提高轉變的效率,UGI的作用則是抑制細胞內堿基錯配切除修復。
為了優(yōu)化CBE編輯器,科研人員從許多方面進行改造,開發(fā)了許多改良版的CBE。例如通過增加核定位信號(nuclear localization signal, NLS)個數優(yōu)化等構建的BE4max、AncBE4max或FNLS-BE3等,均可通過提高堿基編輯器的表達水平,提高編輯效率。CBE的編輯產物純度不是很高,其中非特異性的產物包括靶位點處的C到A或G編輯、indels以及旁觀者編輯(bystander editing)。科研人員通過融合多個UGI可以提高C-T編輯產物的純度[6,24];還可以通過突變rAPOBEC1上與DNA的作用位點(例如YE1、YE2、YEE和EE等)將編輯窗口變窄,從而減少旁觀者編輯[25]。Doman等[26]和Zuo等[27]報道了YE1突變體(YE1-BE4或YE1-BE3-FNLS)能夠在保證編輯效率不下降的同時顯著減少脫靶效率。另外,為了進一步擴大CBE的可編輯范圍,可以將CBE中的SpCas9換成其他Cas蛋白或其突變體,如SaCas9、SpCas9-EQR、SpCas9-VQR、SpRY等,在不同PAM位點進行編輯[16-17]。
2.2 ABE堿基編輯器 ABE堿基編輯器由人工定向進化的腺嘌呤脫氨酶TadA和nCas9組成。TadA將靶序列的A脫氨變?yōu)榧≤誌,隨后在DNA復制過程中,I被當作G進行讀碼,最終實現A到G的替換[5]。
為了提高ABE堿基編輯效率,Koblan等[28]通過增加NLS個數及密碼子優(yōu)化構建的ABEmax顯著提高了A到G的編輯效率。最近,該實驗室又通過噬菌體輔助的非連續(xù)和連續(xù)進化(PANCE和PACE)技術手段,通過引入8個突變位點構建了ABE8e版本,其效率比ABE7.10提高了590倍[29]。雖然ABE相對CBE的保真性更高,但也存在大量RNA脫靶,Zhou等[30]構建的ABE7.10-F148A以及Grünewald等[31]構建的miniABEmax-V82G等均可顯著降低RNA脫靶。
2.3 CGBE堿基編輯器 Kurt等[7]和Zhao等[8]研究報道,使用尿嘧啶-N-糖基化酶(uracil-N glycosylase, UNG)替換掉CBE系統(tǒng)中的UGI,構建了能夠在哺乳動物細胞上介導C到G堿基顛換的新工具CGBE編輯器。前者還開發(fā)出可在原核生物中使用的C-A堿基編輯系統(tǒng)UNG-nCas9-AID,不過目前在真核生物細胞中還不能實現C>A的堿基改變。該編輯器的作用原理是在胞嘧啶脫氨酶的作用下,使靶序列的C變?yōu)閁,然后在UNG的作用下去除U,形成一個無堿基無嘧啶位置(AP site),同時在nCas9的作用下切割互補鏈,造成該鏈斷裂,隨后進行DNA修復,遇到AP site時大概率以C填上去,隨后復制形成C∶G互補配對,最后達到C到G的顛換。
2.4 單堿基編輯系統(tǒng)的脫靶檢測 雖然堿基編輯系統(tǒng)簡易高效,但也存在大量DNA和RNA脫靶效應。堿基編輯系統(tǒng)的脫靶主要分為sgRNA依賴性脫靶以及非sgRNA依賴性脫靶。sgRNA依賴性脫靶是指sgRNA錯誤識別基因組上與靶位點序列相似性很高的位點,引導Cas9發(fā)揮功能造成的脫靶。這類脫靶位點可以通過一些在線工具(例如Cas-OFFinder)根據DNA序列的相似程度預測,然后通過T7EI、Sanger測序或者高通量測序檢測。非sgRNA依賴性脫靶指與sgRNA無關、無法通過軟件預測、隨機分布在基因組的脫靶位點。對于基因組水平的隨機脫靶,研究人員建立了多種實驗方法,例如SITE-Seq[32]、LAM-HTGTS[33]、GUIDE-seq[34]、CIRCLE-seq[35]等進行檢測,但這些研究手段都存在一定局限性,不能高靈敏地檢測脫靶突變。2019年,Zuo等[36]開發(fā)了新一代基因編輯工具脫靶檢測技術——GOTI(genome-wide off-target analysis by two-cell embryo injection),該技術可在不借助任何脫靶位點預測技術的情況下發(fā)現之前脫靶檢測手段無法發(fā)現的脫靶位點,顯著提高了脫靶檢測的靈敏性,為基因編輯工具的安全性評估帶來突破性。對于轉錄組水平的隨機脫靶,可通過轉錄組深度測序來檢測[30-31]。
為實現任意堿基的插入、缺失或者替換,最近Anzalone等[9]報道了一種被稱為Prime Editor的引導編輯器PE,不需要產生DSB及外源模板DNA存在的情況下,PE不僅能夠實現12種不同方式的堿基替換,而且能完成任意堿基的插入、缺失。研究人員將逆轉錄酶與與催化能力部分缺失的Cas9蛋白(H840A)融合表達,并利用與之相應的pegRNA(prime editing guide RNA)最終實現靶位點的基因編輯。pegRNA主要包括3部分,主要在sgRNA的表達載體進行改造,5′端的sgRNA部分、sgRNA 3′端發(fā)卡結構后加入逆轉錄的模板(RT template)、與sgRNA反向互補的PBS(primer binding site)序列。模板DNA中包含需編輯的堿基序列,PBS序列作為逆轉錄引物結合位點,一般為13個堿基左右,成功將sgRNA、逆轉錄的模板、引物結合位點表達在同一條RNA上,在此基礎上形成第一代PE1,堿基替換效率達0.7%~5.5%,插入和缺失效率達4%~17%。PE1雖然可以實現基因組的精確編輯,但效率相對較低。為進一步提高基因編輯的效率,將PE1融合蛋白5個位點進行突變,以提高逆轉錄酶熱穩(wěn)定性、合成能力、與DNA及RNA底物的結合、RNA酶H活性等,形成PE2,靶位點突變的效率提升了1.5~5.1倍。研究表明,在非編碼鏈上產生切口,DNA在修復的過程中以編碼鏈為模板修復,能極大提高修復的效率。因此,在pegRNA靶序列的下游設計一個sgRNA,利用PE2中Cas9 H840A在非編碼鏈上產生切口,進一步提升編輯效率,建立PE3。相對于CRISPR/Cas9、CBE及ABE系統(tǒng),PE有著不可比擬的優(yōu)勢。首先,PE利用切口酶nCas9(H840A),在編輯的過程中不會產生DSB,相對于CRISPR/Cas9介導的HDR或者NHEJ的修復方式,產生的插入或缺失突變更少。其次,PE以pegRNA為模板進行逆轉錄修復,不僅能夠實現12種不同的堿基替換方式,還可以實現單個或多個堿基的插入或缺失,最長可達80個堿基。因此PE不僅可以修復因各種點突變造成的遺傳疾病,還可以修復因堿基插入或缺失造成的遺傳疾病,應用范圍更廣。再者,受到PAM及編輯窗口的限制,BE系統(tǒng)只能在有限的窗口實現基因編輯,考慮到NGG序列在基因組中出現的頻率,PE則可以在任何位置實現編輯,不會受相應的限制。PE系統(tǒng)無論在生物學研究,還是在未來的臨床治療中都表現出廣闊的前景,數據表明,89%的遺傳疾病可以通過PE修復治療。
CRISPR/Cas基因編輯技術快速發(fā)展與優(yōu)化的終極目標是使其應用于疾病治療。目前,CRISPR/Cas相關技術已經成功應用于各種遺傳性疾病的治療。2020年,有1篇發(fā)表于《NEJM》的文章首次在臨床中證實CRISPR/Cas9技術可有效治療鐮刀型紅細胞貧血(sickle cell disease, SCD)和β-地中海貧血(β-thalassemia, TDT)。研究人員利用CRISPR/Cas9技術編輯1例SCD患者和1例TDT患者自體CD34+細胞的BCL11A基因,回輸編輯后的細胞,12個月內2例患者在骨髓和血液中都有高水平的等位基因編輯,目前已不需要接受輸血治療[37];2018年,有2篇文章同時報道利用CBE對小鼠遺傳性肝臟疾病進行了成體治療[38-39];2020年,研究人員利用ABE實現了對先天性黑蒙癥小鼠模型突變基因的高效修復,有效恢復了小鼠模型的視覺能力[40]。由此可見,基于CRISPR/Cas系統(tǒng)的基因編輯工具是可應用于基因治療的。但CRISPR/Cas系統(tǒng)仍存在一些問題,其一就是編輯效率問題,影響成體治療編輯率的可能因素有很多,首當其沖的就是遞送系統(tǒng),目前常用的遞送系統(tǒng)主要為腺相關病毒(adeno-associated virus,AAV),但其載量有限,需將Cas9蛋白拆成兩部分,共同遞送到細胞內再結合發(fā)揮其作用,這在一定程度上影響了其編輯效率,因此,研發(fā)出更高效、安全的遞送系統(tǒng)是推進CRISPR/Cas系統(tǒng)在基因治療領域發(fā)展的一個重要方向。另一個問題就是安全性問題,到目前為止,尚未系統(tǒng)地分析CRISPR/Cas系統(tǒng)在體內發(fā)揮靶位置編輯的同時是否會產生一些不良影響,這也是亟待解決的問題。
CRISPR/Cas系統(tǒng)的發(fā)展速度驚人,這些工具已經改變了生命科學,使基礎研究取得了許多進步,并為開發(fā)新一代基因療法帶來曙光,可以治療甚至可能治愈人類許多具有遺傳成分的疾病。之后的研究不僅要致力于進一步開發(fā)編輯效率更好、安全性更高的基因編輯工具,更需要開發(fā)高效且安全的遞送系統(tǒng),確保將基因編輯工具準確送到靶位置。此外,科研人員也需合乎倫理地規(guī)范應用基因編輯工具,造福人類。