賴昕彤 王柯嵐 由雨欣 譚俊杰
(南京農(nóng)業(yè)大學(xué)農(nóng)學(xué)院 江蘇省植物基因編輯工程研究中心,南京 210095)
基因編輯是一種新興的能對(duì)特定基因組進(jìn)行插入、刪除、替換等各種修飾的基因工程技術(shù)。CRISPR/Cas系統(tǒng)[1],跟傳統(tǒng)基因編輯工具如鋅指核酸酶(zinc finger nucleases,ZFNs)[2]和類轉(zhuǎn)錄激活因子效應(yīng)物核酸酶(transcription activator-like effector nucleases,TALENs)[3]等相比,具有設(shè)計(jì)簡(jiǎn)單、成本低、效率高等優(yōu)點(diǎn),已成為當(dāng)下基因組編輯主導(dǎo)技術(shù),推動(dòng)了各行各業(yè)的發(fā)展。
CRISPR/Cas是細(xì)菌和古細(xì)菌進(jìn)化出來(lái)的用來(lái)抵御噬菌體及外源DNA的適應(yīng)性免疫系統(tǒng)[4]。目前使用最廣泛且技術(shù)開發(fā)最成熟的是來(lái)源于化膿性鏈球菌(Streptococcus pyogenes)并經(jīng)過(guò)改造的CRISPR/Cas9系統(tǒng)。該系統(tǒng)主要包括單向?qū)NA(single guide RNA,sgRNA)及Cas9兩 個(gè) 元 件。CRISPR/Cas9完成基因編輯主要分為兩步(圖1):(1)Cas9核酸酶在sgRNA的引導(dǎo)下利用其包含的兩個(gè)核酸酶結(jié)構(gòu)域RuvC和HNH分別對(duì)靶向DNA的兩條鏈在距離PAM(protospacer adjacent motif)上游大約3 bp處進(jìn)行剪斷,引起DNA雙鏈斷裂(doublestrand break,DSB);(2)DSB內(nèi)源修復(fù)。其修復(fù)途徑主要包括非同源末端連接(non-homologous end joining,NHEJ)[5]和同源重組修復(fù)(homology-directed repair,HDR)[6]。前者介導(dǎo)的DSB修復(fù)簡(jiǎn)單、高效,是大部分細(xì)胞修復(fù)DSB的最主要方式,但其出錯(cuò)率高,往往引發(fā)難以預(yù)測(cè)的核苷酸插入或刪除(insertions and deletions,indels),導(dǎo)致靶基因功能喪失;HDR方式保真度高,但是依賴于外部提供的修復(fù)模板,且在大部分細(xì)胞中效率極低。因此,雖然CRISPR/Cas9介導(dǎo)的基因編輯簡(jiǎn)單高效,但因其對(duì)DSB的高度依賴,缺乏對(duì)編輯結(jié)果的控制,可能導(dǎo)致被編輯后的細(xì)胞產(chǎn)生無(wú)法預(yù)測(cè)的紊亂[7-8]。實(shí)現(xiàn)高效且不依賴DSB的精準(zhǔn)編輯將是未來(lái)基因編輯的發(fā)展趨勢(shì)。
圖1 CRISPR/Cas9介導(dǎo)的基因編輯Fig. 1 CRISPR/Cas9-mediated gene editing
點(diǎn)突變是自然界中最常見(jiàn)的基因突變類型。根據(jù)人類基因組變異數(shù)據(jù)庫(kù)ClinVar分析,超過(guò)半數(shù)的人類遺傳疾病是由點(diǎn)突變引起[9]。在作物遺傳育種上,點(diǎn)突變也是許多重要農(nóng)藝性狀遺傳變異的基礎(chǔ)。將高效、精準(zhǔn)的核苷酸替換應(yīng)用于基因治療,可以從根本上治愈點(diǎn)突變引起的人類遺傳疾?。粦?yīng)用于作物育種,可以簡(jiǎn)化并加快育種進(jìn)程,可見(jiàn)開發(fā)高效精準(zhǔn)的堿基替換工具十分重要。
2016年,哈佛大學(xué)David R. Liu團(tuán)隊(duì)在原有CRISPR/Cas9基礎(chǔ)上首次開發(fā)了實(shí)現(xiàn)單堿基替換的新系統(tǒng)-堿基編輯器(base editor,BE)[10]。其將無(wú)催化活性的Cas9(catalytically inactive Cas9,dCas9)或者Cas9切口酶(Cas9 nickase,nCas9)與胞嘧啶脫氨酶APOBEC1以及尿嘧啶糖基化酶抑制劑 (uracil glycosylase inhibitor,UGI)進(jìn)行融合,通過(guò)sgRNA將融合蛋白帶至靶位點(diǎn),從而在不引入DSB的前提下,實(shí)現(xiàn)對(duì)單個(gè)堿基的精準(zhǔn)替換(圖 2)。跟原有CRISPR/Cas9相比,堿基編輯器既不引入DSB,也無(wú)需提供外源修復(fù)模板即可進(jìn)行高效精準(zhǔn)的基因編輯。該工具的開發(fā)使CRISPR/Cas系統(tǒng)從切割特異DNA的分子“剪刀”變成可以重寫堿基的“修正器”,打開了精準(zhǔn)基因編輯的大門。
由于基于胞嘧啶脫氨酶的堿基編輯器(cytosine base editor,CBE)只能催化C到T的轉(zhuǎn)變,為了擴(kuò)展編輯類型,該團(tuán)隊(duì)隨后嘗試將自然界中的各種腺嘌呤脫氨酶與nCas9融合,基于CBE類似工作原理,腺嘌呤脫氨酶可以將腺嘌呤(A)轉(zhuǎn)變?yōu)榇吸S嘌呤(I),其在DNA復(fù)制中常被識(shí)別為鳥嘌呤(G),因此,I與胸腺嘧啶(T)產(chǎn)生I∶T錯(cuò)配后,通過(guò)DNA修復(fù)途徑或細(xì)胞復(fù)制,完成A到G的轉(zhuǎn)變(圖 2)??紤]到自然界中腺嘌呤脫氨酶只能以RNA為底物,該團(tuán)隊(duì)隨后將大腸桿菌中tRNA腺嘌呤脫氨酶(tRNAspecific adenosine deaminase,TadA)與Cas9切口酶 融合,并進(jìn)行多輪人工進(jìn)化,最終獲得了編輯效率最高的腺嘌呤堿基編輯器(adenine base editor,ABE)ABE7.10[11](圖 2)。
圖2 CBE和ABE介導(dǎo)的堿基編輯Fig. 2 CBE and ABE-mediated base editing
CBE和ABE能實(shí)現(xiàn)全部單堿基轉(zhuǎn)換(base transition),但不能有效實(shí)現(xiàn)單堿基之間的顛換(base conversion)。隨后研究人員也在積極探索除CBE和ABE之外的可以實(shí)現(xiàn)其他類別的堿基編輯技術(shù)。2020年,張學(xué)禮和J. Keith Joung兩團(tuán)隊(duì)首次獨(dú)立報(bào)道了能實(shí)現(xiàn)堿基顛換的新型堿基編輯器 GBEs(glycosylase base editors) 和CGBE1(C-to-G base editors)[12-13]。其工作原理和CBE很接近,都是首先將胞嘧啶轉(zhuǎn)換成尿嘧啶,不同的是,GBE接下來(lái)直接用融合在nCas9另一端的尿嘧啶 DNA 糖基化酶(uracil DNA N-glycosylase,UNG)將U移除,并引發(fā)堿基切除修復(fù),提供C堿基向其他堿基突變的機(jī)會(huì),在大腸桿菌中主要是C→A,而在哺乳動(dòng)物細(xì)胞中主要是C→G[12]。為了在大多數(shù)位點(diǎn)上實(shí)現(xiàn)高效、高純度的C→G堿基編輯,David R. Liu團(tuán)隊(duì)通過(guò)CRISPRi篩選、靶點(diǎn)數(shù)據(jù)庫(kù)分析并聯(lián)合機(jī)器學(xué)習(xí)開發(fā)了更加有應(yīng)用前景的新型CGBE[14]。
這些DNA堿基編輯工具目前已成功應(yīng)用于動(dòng)物[15-17]、植物[18-20]和微生物[21],在點(diǎn)突變引起的人類疾病治療和作物精準(zhǔn)育種上有巨大的應(yīng)用 潛能[22]。
第一版堿基編輯器(BE1)通過(guò)將大鼠的胞嘧啶脫氨酶rAPOBEC1簡(jiǎn)單地融合到dCas9的氨基端,并用一段16 aa的XTEN蛋白基序連接。雖然APOBEC1可以催化C到U的轉(zhuǎn)變,但由于細(xì)胞內(nèi)存在尿嘧啶糖基化酶UNG,會(huì)不斷去除脫氨后產(chǎn)生的U,從而導(dǎo)致C→T轉(zhuǎn)換效率低下。針對(duì)此問(wèn)題,第二版堿基編輯器(BE2)通過(guò)融入尿嘧啶糖基化酶抑制劑UGI,從而保護(hù)U不被移除,使在人體內(nèi)的編輯效率提高了3倍。第三版堿基編輯器(BE3)主要是用Cas9切口酶替代dCas9,通過(guò)在非編輯鏈引入切口,從而激活堿基錯(cuò)配修復(fù)(mismatch repair,MMR)機(jī)制,并以編輯鏈為模板進(jìn)行修復(fù),促進(jìn)了編輯產(chǎn)物的形成,該策略將編輯效率提高了2-6倍,平均編輯效率達(dá)到37%,同時(shí)indel的產(chǎn)生比例僅有約1.1%[10]。第四版堿基編輯器BE4主要是通過(guò)融入更多的UGI,最大程度的減少了編輯副產(chǎn)物,提高了C→T突變的效率[23]。此外,通過(guò)在編輯器兩端融入密碼子優(yōu)化的雙分型核定位信號(hào)(bipartite NLS,bpNLS),產(chǎn)生了編輯效率最大化的BE4max以及ABEmax[24]。在腺嘌呤堿基編輯器ABE7.10的基礎(chǔ)上,研究人員利用腺苷脫氨酶變體庫(kù)對(duì)其進(jìn)行了進(jìn)一步的優(yōu)化,獲得效率更高的ABE8版本,與ABE7.10相比,其在A5-A7處的編輯效率提高了約1.5倍,A3-A4和A8-A10處約3.2倍,非NGG PAM變體的總體目標(biāo)編輯效率提高約4.2倍[25]。David R. Liu團(tuán)隊(duì)對(duì)ABE7.10進(jìn)行多輪定向進(jìn)化,獲得了ABE8e,與ABE7.10相比,該版本在TadA上引入了8個(gè)額外突變,活性更是提高了590倍,且能與各種Cas9 或Cas12同源蛋白廣泛兼容[26],ABE8e的晶體結(jié)構(gòu)解析表明,其催化 DNA 脫氨的速度比早期的ABEs快約1 100 倍[27]。除了哺乳動(dòng)物,ABE8e在編輯其它物種上同樣具有超高的編輯效率,比如多個(gè)研究團(tuán)隊(duì)幾乎同時(shí)報(bào)道ABE8e在編輯水稻基因組上比原來(lái)ABEmax表現(xiàn)出更高的編輯效率,在諸多靶位點(diǎn)的編輯效率更是達(dá)到了幾乎100%[28-29]。此外,周煥斌團(tuán)隊(duì)通過(guò)比較分析ABE8.17、ABE8.20以及ABE8e,開發(fā)了全新版本ABE9,其編輯水稻基因組的能力甚至高于ABE8e,尤其是對(duì)于原來(lái)難以編輯的位點(diǎn),ABE9表現(xiàn)出更佳的編輯能力[28]。
其它的效率優(yōu)化策略還包括在脫氨酶與Cas蛋白之間插入非特異的單鏈DNA結(jié)合蛋白基序,增強(qiáng)脫氨酶與底物的互作[30]。這些策略極大提高了堿基編輯器在哺乳動(dòng)物以及植物細(xì)胞中的編輯效率,推動(dòng)了其進(jìn)一步的應(yīng)用。
Cas9-sgRNA復(fù)合體與目標(biāo)DNA鏈結(jié)合后,隨后與互補(bǔ)的DNA序列退火形成“R-loop” 結(jié)構(gòu)[31],其中暴露的單鏈DNA即為脫氨酶的底物。堿基編輯器在單鏈DNA上具有一定靶向范圍,該范圍內(nèi)的堿基均能被脫氨酶有效脫氨,該編輯范圍稱為堿基編輯器的編輯窗口或活性窗口[10]。由于融合蛋白與目標(biāo)DNA序列結(jié)合后掩蓋了PAM相鄰的核苷酸,因此BE的活性窗口通常位于PAM的遠(yuǎn)端[10,32-33]。例如,BE3的活性窗口為遠(yuǎn)離PAM端的第4-8位堿基(C4-C8)。
編輯窗口的寬度受多種因素的影響,包括脫氨酶與Cas蛋白的類型、堿基編輯器的空間構(gòu)造 等[10-11,15,33-35]。表1 總結(jié)了目前主要的堿基編輯器及其編輯窗口寬度、序列偏向等特征。
表1 主要堿基編輯器及其特征Table 1 Major base editors and their characteristics
靶向堿基的編輯依賴于脫氨酶和底物之間的互作,因此不同種類的脫氨酶會(huì)影響活性窗口寬度[34]。例如,通過(guò)把BE3中的APOBEC1替換為源于海鰻(Petromyzon marinus)的脫氨酶CDA1,構(gòu)建出新的堿基編輯器CDA1-BE3,其編輯窗口變?yōu)镃1-C7。研究學(xué)者利用不同種類的胞嘧啶脫氨酶構(gòu)建了多樣化的堿基編輯編輯器,主要包括哺乳動(dòng)物APOBEC家 族 蛋 白,如AID[36-37]、APOBEC1和APOBEC3(A3A-H)[38-42],以及七鰓鰻CDA1家族蛋白,如CDA1[33-35,43-45]。另外,改變脫氨酶的催化或結(jié)合活性也會(huì)影響編輯窗口的寬度。例如,通過(guò)突變r(jià)APOBEC1中與底物結(jié)合或催化相關(guān)的氨基酸殘基,產(chǎn)生一系列BE3變體YE1/YE2/YEE-BE3,大大縮小了堿基編輯窗口寬度[46]。在APOBEC3A中引入點(diǎn)突變N57G,產(chǎn)生工程化的eA3A-BE3,增強(qiáng)了對(duì)TCR基序的偏好性,間接縮短了編輯窗口寬度[38]。將F148A突變引入人工進(jìn)化的TadA*,所組成的ABE7.10F148A也大大縮小了編輯窗口[47]。此外,通過(guò)同時(shí)融合多個(gè)相同或不同的脫氨酶,使R-loop中底物核苷酸在局部高濃度脫氨酶的環(huán)境中更易暴露,從而達(dá)到拓寬編輯窗口的目的[48],還可使編輯產(chǎn)物多樣化或提高編輯效率[49-52]。大多數(shù)脫氨酶對(duì)其底物DNA的序列表現(xiàn)出一定的偏好,這也間接影響著編輯窗口的寬度。例如,APOBEC1對(duì)底物序列的偏好 性 為TC≥CC≥AC>GC[10],而APOBEC3G偏好CC基序中的第2個(gè)C[41-42]。目前,包含CDA1、AID或A3A脫氨酶的堿基編輯器對(duì)底物DNA序列的依賴性較小,可能是因?yàn)檫@些脫氨酶的活性相對(duì)較高[33,37-40,53]。
自然界天然存在或人工進(jìn)化的Cas變體可以識(shí)別不同的PAM基序,且其組成的堿基編輯器可能擁有不同的編輯窗口。例如SaCas9介導(dǎo)的堿基編輯器支持更寬的編輯窗口:其介導(dǎo)的CBE編輯窗口為C3-C12,ABE編輯窗口為A4-A12[46];基于Cfp1/Cas12a的堿基編輯窗口為C8-C13[54];由微型Cas12f變體(CasMINI)衍生的ABE具有A3-A4的窄窗口[55];而由環(huán)狀排列的Cas9變體(Cas9-CP)組成的CBE和ABE改變了脫氨酶在R-loop中的定位,從而在更寬的編輯窗口中實(shí)現(xiàn)了更有效的靶向堿基[56-57]。
堿基編輯器內(nèi)部構(gòu)象也會(huì)影響編輯窗口寬度,包括脫氨酶與Cas蛋白的融合位點(diǎn)、連接兩者的接頭類型和長(zhǎng)度等。例如,將PmCDA1分別融合到Cas9切口酶的兩端,形成n/cCDA1-BE3,兩者呈現(xiàn)出不同的編輯窗口(nCDA1-BE3,C1-C7;cCDA1-BE3,C2-C5)[34]。對(duì)于nCas9介導(dǎo)的堿基編輯器,將脫氨酶融合在N端通常會(huì)比融合在C端產(chǎn)生更寬的編輯窗口[10,34,44],這可能是由于N端融合會(huì)使脫氨酶更易接近R-loop內(nèi)的ssDNA。除在兩端融合之外,最近還報(bào)道了脫氨酶可以嵌入Cas9中,所產(chǎn)生的一系列堿基編輯器擁有獨(dú)特的活性窗口,其寬度取決于它們?cè)贑as9中的插入位點(diǎn)[58-59]。此外,堿基編輯器中Cas9和脫氨酶的連接長(zhǎng)度也會(huì)影響編輯窗口寬度。例如,適當(dāng)縮短Cas9與CDA1之間的連接長(zhǎng)度,甚至去掉脫氨酶C端不必要的序列,可以很大程度的縮小編輯窗口寬度至1-2 nt[34]。
總之,堿基編輯窗口的多樣化可以滿足堿基編輯器不同的應(yīng)用需求,從而推動(dòng)其進(jìn)一步的發(fā)展和應(yīng)用。
堿基編輯需要靶位點(diǎn)包含PAM,比如基于SpCas9的堿基編輯器識(shí)別的PAM序列為NGG,這種特定的PAM要求限制了可編輯的區(qū)域,嚴(yán)重阻礙了其廣泛應(yīng)用。為了擴(kuò)大堿基編輯的范圍,常采用的方式是利用識(shí)別不同PAM的天然Cas蛋白或人工改造的Cas9變體。比如,陳佳團(tuán)隊(duì)使用Cas12a (Cpf1)開發(fā)了新型的CBE系統(tǒng),識(shí)別的PAM 序列為TTTV(V可以是A、C或G),這一系統(tǒng)適用于富含T的基因組DNA[54]。David R. Liu團(tuán)隊(duì)利用來(lái)自金葡菌(Staphylococcus aureus)的Cas9蛋白,構(gòu)建了靶向包含NNGRRT的PAM序列的堿基編輯器SaBE3[46]。此外,通過(guò)Cas變體的替換,獲得了各種PAM松弛型的堿基編輯變體,如VQRBE3(NGA)、VRER-BE3(NGCG)、SaBE3-KKH(NNNRRT)[46]。尤其是利用Nureki實(shí)驗(yàn)室開發(fā)的SpCas9-NG(NGN)[60]以及Kleinstiver實(shí)驗(yàn)室開發(fā)的SpG(NGN)和SpRY(NRN 或NYN)[61]等Cas9變體所獲得的堿基編輯器,幾乎能夠突破PAM的限制,靶向所有NNN的位點(diǎn)。值得注意的是,盡管這些變體的利用拓展了堿基編輯器的編輯范圍,但卻大大降低了其編輯效率,也增加了對(duì)靶位點(diǎn)的依賴性。因此,如何在維持松弛型PAM的識(shí)別下進(jìn)一步提高堿基編輯器的效率值得進(jìn)一步的研究。此外,這些PAM松弛型的堿基編輯變體的應(yīng)用具有一定的自編輯活性,尤其是基于SpRY的CBE和ABE,其能夠識(shí)別sgRNA骨架上與靶序列相連的GTT PAM 序列,因此會(huì)對(duì)自身的sgRNA進(jìn)行編輯,從而一方面降低其編輯效率,另一方面改變的sgRNA可能會(huì)產(chǎn)生非靶向編輯,導(dǎo)致脫靶效應(yīng)[62-64]。如何減少自編輯活性仍是基因編輯領(lǐng)域目前亟待解決的難題之一。
在細(xì)胞中應(yīng)用堿基編輯器時(shí),會(huì)出現(xiàn)DNA及RNA水平上的脫靶。其中DNA水平上的脫靶分為sgRNA依賴型和非sgRNA依賴型。前者是由于sgRNA錯(cuò)誤地引導(dǎo)了Cas蛋白,使之與相似的DNA序列相結(jié)合[65-67]。研究表明,使用工程化的高保真Cas變體[68-71]或截短的sgRNA[72-73],或遞送堿基編輯器與sgRNA形成的核糖核蛋白復(fù)合體(ribonucleoproteins,RNPs)[74]等策略均可以降低此類脫靶效應(yīng);而后者是由于脫氨酶的過(guò)度表達(dá),使全基因組特別是基因富集區(qū)域發(fā)生了隨機(jī)點(diǎn)突變。值得注意的是,這類脫靶只出現(xiàn)在CBEs中,在ABEs中并未發(fā)生,其原因可能是ABE中的脫氨酶來(lái)源于RNA特異性編輯的腺嘌呤脫氨酶,經(jīng)人工進(jìn)化改造后表現(xiàn)出了較高的特異性,從而未表現(xiàn)出過(guò)度的DNA堿基編輯[75-76]。大量研究表明,通過(guò)工程化改造脫氨酶可以減少這類脫靶現(xiàn)象。例如,利用人工改造的rAPOBEC1變體YE1建立YE1-BE3堿基編輯系統(tǒng),可以大大減少非sgRNA依賴型的脫靶[77-78]。通過(guò)篩選153種胞嘧啶脫氨酶,并進(jìn)一步優(yōu)化其靶標(biāo)位點(diǎn)和非靶標(biāo)位點(diǎn)的編輯,研究人員發(fā)現(xiàn)其中4種脫氨酶變體(AmAPOBEC1,PpAPOBEC1,RrA3F,SsAPOBEC3B)顯示出最小的非sgRNA依賴型的DNA脫靶活性[79]。另有研究表明,將脫氨酶精準(zhǔn)嵌入Cas蛋白結(jié)構(gòu)中,也可以減少全基因組范圍的DNA和RNA脫靶[58-59]。擁有較窄編輯窗口的堿基編輯器一般伴隨著較少的脫靶現(xiàn)象,因?yàn)檫@種情況下,無(wú)論是目標(biāo)還是非目標(biāo)區(qū)域能編輯的堿基都變少了,從而導(dǎo)致脫靶也變少或消失[35,77]。
除了DNA脫靶,由于CBE和ABE所使用的均是能作用于RNA的脫氨酶,因此兩者還會(huì)出現(xiàn)全基因組范圍內(nèi)的RNA脫靶[47,80-82]。盡管RNA脫靶突變存在的時(shí)間很短,但是如果持續(xù)誘導(dǎo),仍存在很高的風(fēng)險(xiǎn),特別是在遺傳疾病治療上。與非sgRNA依賴的DNA脫靶類似,目前消除此類RNA脫靶效應(yīng)的策略是在CBE和ABE中設(shè)計(jì)合適的脫氨酶變體。例如,通過(guò)工程化改造脫氨酶,獲得了3個(gè)高 保 真 的CBE變 體(BE3W90Y/R126E,A3AR128A-BE3,A3AY130F-BE3)和一個(gè)ABE變體(ABE7.10F148A),它們不僅可以高效地靶向目標(biāo)DNA,還能有效減少RNA的脫靶編輯[47]。另有研究人員通過(guò)篩選一系列BE3和ABE變體,發(fā)現(xiàn)兩個(gè)BE3變體(rAPOBEC1;R33A,R33A/K34A)和 兩 個(gè)ABE變 體(TadA*;K20A/R21A,V82G)具有較低的RNA編輯活性[80-81]。而且,他們還發(fā)現(xiàn)含有eA3A(eA3A-BE3)、hAID(hAID-BE3)和CDA1(target-AID)的CBE可以減少RNA脫靶。此外,通過(guò)V106W的替換或R153的缺失突變,獲得了工程化改造的TadA*變體,該變體構(gòu)成的ABE大大減少了RNA脫靶[82-83]。
除了在DNA和RNA水平上發(fā)生非預(yù)期的脫氨,當(dāng)編輯窗口內(nèi)含有多個(gè)非目標(biāo)堿基C時(shí),目標(biāo)堿基C被編輯的同時(shí)也伴隨著非目標(biāo)堿基C的編輯,從而產(chǎn)生大量的編輯副產(chǎn)物,給堿基編輯尤其是基因治療上的應(yīng)用帶來(lái)了潛在的風(fēng)險(xiǎn)。此外,在植物堿基編輯方面,盡管發(fā)生旁側(cè)編輯的植株可以在后期中篩掉,但大量的編輯副產(chǎn)物不僅會(huì)使后續(xù)的篩選工作更加繁瑣,還導(dǎo)致了對(duì)前期轉(zhuǎn)化編輯效率的過(guò)度依賴。因此,縮小堿基編輯器的編輯窗口,提高其編輯精度,變得尤為重要。大量相關(guān)研究表明,縮小堿基編輯窗口的策略主要有以下3種:(1)通過(guò)突變堿基編輯器的脫氨酶,適當(dāng)降低其催化和結(jié)合活性。比如,通過(guò)突變脫氨酶APOBEC1催化及結(jié)合相關(guān)的關(guān)鍵氨基酸殘基W90Y、R126E或R132E,開發(fā)一系列縮小堿基編輯窗口的BE3變體YE1/YE2/YEE-BE3[46]。雖然這3個(gè)變體的編輯窗口均有縮小,但其編輯效率也隨之降低,尤其是編輯窗口最窄的YEE-BE3,在許多位點(diǎn)缺乏編輯活性。(2)通過(guò)突變脫氨酶,增強(qiáng)其對(duì)底物的偏好性。比如,通過(guò)在人類APOBEC3A引入N57G突變,構(gòu)建工程化的堿基編輯器eA3A-BE3,實(shí)現(xiàn)選擇性的識(shí)別TCR底物基序[38]。相似的,通過(guò)工程化產(chǎn)生的eA3G-BE3,增強(qiáng)對(duì)CC底物基序識(shí)別的偏好性[41-42]。該方法雖然在包含特定基序的編輯位點(diǎn)上使編輯窗口變窄,但縮小程度有限且極大依賴于底物序列。(3)調(diào)整堿基編輯器的內(nèi)部空間構(gòu)造。比如,通過(guò)降低脫氨酶與Cas9之間的接頭長(zhǎng)度,改變堿基編輯器的空間構(gòu)造,從而讓脫氨酶的活性區(qū)域在靶向DNA上維持于一個(gè)更加精準(zhǔn)的定位[34-35]。而且該策略不改變氨基酸的催化及結(jié)合活性,只是讓脫氨酶在非靶堿基處“英雄無(wú)用武之地”。盡管該方法目前只測(cè)試了少數(shù)脫氨酶及其構(gòu)成的堿基編輯器,但由于該策略產(chǎn)生的堿基編輯器在大大縮短編輯窗口的同時(shí)并未降低目標(biāo)堿基的催化活性,因此值得進(jìn)一步的研究和發(fā)展。
根據(jù)人類基因組變異數(shù)據(jù)庫(kù)ClinVar分析,超過(guò)半數(shù)的人類遺傳疾病是由點(diǎn)突變引起[9]。而堿基編輯器能夠高效實(shí)現(xiàn)單個(gè)堿基的替換,因此其主要的潛在應(yīng)用之一是用來(lái)糾正點(diǎn)突變引起的人類遺傳疾病。例如,把BE3轉(zhuǎn)入小鼠星形膠質(zhì)細(xì)胞,可以將與阿爾茨海默病相關(guān)的等位基因APOE4轉(zhuǎn)變?yōu)榈惋L(fēng)險(xiǎn)的APOE3r,也可以糾正乳腺癌細(xì)胞中與癌癥相關(guān)的p53基因突變(Y163C)[10]。利用ABE將與鐮狀細(xì)胞?。⊿CD)相關(guān)的致病基因型HBBS轉(zhuǎn)化為造血干細(xì)胞中的良性等位基因型HBBG,并成功將鐮狀細(xì)胞病小鼠的血液學(xué)參數(shù)恢復(fù)到接近正常水平[84]。利用脂質(zhì)納米顆粒將ABE遞送到食蟹猴肝臟細(xì)胞中,并對(duì)PCSK9基因?qū)崿F(xiàn)堿基突變,將其體內(nèi)的壞膽固醇含量降低約60%[85]。其他應(yīng)用堿基編輯治療的疾病包括Duchenne肌營(yíng)養(yǎng)不良癥[86]、白化病[86]、Hutchinson-Gilford早衰綜合征[87]和其他代謝疾?。?8-89]。
與傳統(tǒng)育種相比,堿基編輯器能夠快速高效地對(duì)植物基因組進(jìn)行精準(zhǔn)修飾,加速了作物育種進(jìn)程。近年來(lái),許多植物研究者通過(guò)密碼子優(yōu)化,構(gòu)建了適用于植物的堿基編輯系統(tǒng),由此實(shí)現(xiàn)了對(duì)水稻、小麥等主要農(nóng)作物的重要農(nóng)藝性狀相關(guān)基因定點(diǎn)突變,快速獲得改良品種。例如,Zong等[90]構(gòu)建了植物BE系統(tǒng)PBE(Plant base editor),并在原生質(zhì)體和再生的水稻、小麥和玉米植株中,實(shí)現(xiàn)了C3-C9位點(diǎn)的堿基編輯,效率高達(dá)43.48%。隨后他們又通過(guò)融合nCas9和人類APOBEC3A構(gòu)建了A3A-PBE,并成功在小麥、水稻和馬鈴薯中產(chǎn)生高效C→T的靶向突變。A3A-PBE實(shí)現(xiàn)了在17 nt的編輯窗口內(nèi)對(duì)內(nèi)源基因組位點(diǎn)和不同序列的高效堿基替換[40]。此外,Hua等[91]利用人工進(jìn)化的SpCas9和SaCas9變體,并構(gòu)建了相應(yīng)BE變體,在水稻中大大擴(kuò)展了編輯范圍。ABE和CBE在改變作物株型、提高作物抗性和養(yǎng)分吸收效率方面均發(fā)揮重要作用。Lu等[92]利用大鼠APOBEC1基因開發(fā)了水稻堿基編輯系統(tǒng),并有效編輯了水稻的兩個(gè)重要基因NRT1.1B和SLR1,編輯效率分別為3.7%和13.3%。SLR1編碼DELLA蛋白,其TVHYNP基序及其附近的氨基酸發(fā)生置換,導(dǎo)致植株高度降低,獲得了半矮稈型材料。Li等[93]將nCas9、胞苷脫氨酶和UGI進(jìn)行融 合,在水稻中產(chǎn)生目標(biāo)點(diǎn)突變,成功在OsPDS(編碼一種植物烯去飽和酶),OsSBEIIb(編碼水稻淀粉分支酶IIb)的3個(gè)目標(biāo)位點(diǎn)上引入了精準(zhǔn)編輯。
值得注意的是,BE 在人類和作物上的應(yīng)用有所不同,作物基因編輯上強(qiáng)調(diào)特異性外,也強(qiáng)調(diào)多樣化,產(chǎn)生更多的變異。該特征通常用于植物內(nèi)源基因定向進(jìn)化,通過(guò)對(duì)靶基因區(qū)域進(jìn)行堿基編輯,產(chǎn)生大量和多樣化的突變,隨后進(jìn)行人工篩選獲得提高農(nóng)藝性狀的目標(biāo)變異。最顯著的例子是植物抗除草劑位點(diǎn)的發(fā)掘,例如通過(guò)合用CBE和ABE,以及針對(duì)靶基因的sgRNA文庫(kù),在水稻中對(duì)除草劑內(nèi)源靶標(biāo)基因OsALS1進(jìn)行近乎飽和突變,從而成功鑒定出OsALS1抗除草劑新位點(diǎn),并創(chuàng)制出具有除草劑抗性的水稻新種質(zhì)[94]。高彩霞團(tuán)隊(duì)通過(guò)同時(shí)融合兩種不同類型脫氨酶設(shè)計(jì)了雙堿基編輯器STEMEs,并利用STEME-1和STEME-NG對(duì)水稻OsACC基因進(jìn)行定向進(jìn)化,獲得了抗除草劑的水稻新種質(zhì)[50]。為了提高定向進(jìn)化效率,未來(lái)堿基編輯器需要擁有更寬的活性窗口、更大的編輯范圍和更多堿基轉(zhuǎn)換類型,從而為后續(xù)的人工篩選產(chǎn)生更加多樣化的編輯產(chǎn)物。
CBE可以通過(guò)C→T單堿基轉(zhuǎn)換,將4種密碼子(正義鏈上的CAA、CAG、CGA和反義鏈上的TGG)轉(zhuǎn)換為終止密碼子(TGA、TAG、TAA),實(shí)現(xiàn)在不引入DSB的情況下,在目標(biāo)位點(diǎn)處提前引入終止密碼子來(lái)敲除蛋白質(zhì)編碼基因。Jin Soo Kim團(tuán)隊(duì)率先利用BE3在小鼠胚胎中實(shí)現(xiàn)了對(duì)靶基因Dmd或Tyr的高效終止密碼子引入,并成功在小鼠中建立了肌營(yíng)養(yǎng)不良以及白化病的相關(guān)疾病模型[86]。此外,利用BE3引入無(wú)義突變的原理,Adli團(tuán)隊(duì)以及Ciccia團(tuán)隊(duì)分別建立了使基因失活的CRISPRStop[95]和iSTOP[96]系統(tǒng),后者同時(shí)在包括人類、小鼠和擬南芥等8個(gè)物種建立了sgRNA文庫(kù)用于配合BE3使用,可在全基因組范圍內(nèi)失活真核基因,并模擬癌癥相關(guān)的無(wú)義突變。
與CRISPR介導(dǎo)的移碼突變相比,基于CBE終止密碼子引入方法的最大優(yōu)點(diǎn)是無(wú)需產(chǎn)生DSB。作為最嚴(yán)重的細(xì)胞損傷,DSB會(huì)激活廣泛的細(xì)胞損傷修復(fù)機(jī)制或者細(xì)胞應(yīng)激甚至死亡,相比之下,CBE介導(dǎo)的基因失活策略更加溫和、安全。為了更深入了解二者的差別,Dang等[97]針對(duì)腫瘤抑制基因,設(shè)計(jì)了兩個(gè)靶向TP53位點(diǎn)的sgRNA,利用BE3介導(dǎo)的iSTOP和傳統(tǒng)的CRISPR/ Cas9對(duì)其進(jìn)行敲除。實(shí)驗(yàn)表明,BE3產(chǎn)生的基因型更少,對(duì)染色體結(jié)構(gòu)和鄰近基因影響不大。此外二者對(duì)于兩個(gè)相鄰基因的雙敲除效率存在差異,BE3介導(dǎo)的基因敲除對(duì)相鄰基因的副作用更小,更能安全、有效地敲除兩個(gè)近距離的基因。
此外,該策略形成的編輯結(jié)果精準(zhǔn)可控,利用該策略在第一代獲得純合突變體的概率也會(huì)更高。將其應(yīng)用于在植物中,可以加速獲得純合突變體,從而應(yīng)用于反向遺傳或作物育種過(guò)程。Ren等[98]開發(fā)了高效的A3A/Y130F-CBE_V01系統(tǒng),并用于植物的多重編輯。他們?cè)诙鄠€(gè)控制種子形狀相關(guān)的基因中提前引入終止密碼子,成功敲除OsGS3、OsGW2等基因,并快速獲得純合的多突變體,有效增加籽粒的長(zhǎng)度和寬度。
總之,堿基編輯器在動(dòng)、植物中已獲得了廣泛的應(yīng)用,除了上述主要應(yīng)用外,隨著人們對(duì)堿基編輯器的深入了解,其更多的未知應(yīng)用將被逐一挖掘。
堿基編輯器由于其設(shè)計(jì)簡(jiǎn)單、高效、結(jié)果可預(yù)測(cè)等優(yōu)點(diǎn),在基因治療以及作物精準(zhǔn)育種上有著無(wú)限的應(yīng)用潛能。本文初步概括了DNA堿基編輯的研究進(jìn)展。這些研究進(jìn)展一方面為堿基編輯器進(jìn)一步的發(fā)展奠基了基礎(chǔ);另一方面對(duì)堿基編輯的未來(lái)發(fā)展提出了新的問(wèn)題和挑戰(zhàn):(1)如何進(jìn)一步提高堿基編輯器的精度以及在維持堿基編輯器的高精度下,如何進(jìn)一步平衡編輯范圍、效率以及特異性。盡管目前許多研究報(bào)道了提高堿基編輯器精度的方法,但目前仍然沒(méi)有辦法僅僅編輯單個(gè)堿基而不影響旁側(cè)同類堿基。此外,編輯精度的提高也伴隨靶向區(qū)域減小,以及對(duì)PAM依賴的增加。隨著各種Cas9變體的開發(fā),尤其是較少依賴PAM的Cas9-NG、Cas9-SpRY等的出現(xiàn),維持編輯精度且突破靶向范圍變得可能,但Cas9變體的引入犧牲了部分的編輯效率,此外,隨著精準(zhǔn)堿基編輯范圍的擴(kuò)展,其特異性是否受到影響仍待評(píng)估。其背后的科學(xué)問(wèn)題,比如堿基編輯器中脫氨酶脫氨的結(jié)構(gòu)機(jī)理、sgRNA識(shí)別Cas9的分子機(jī)理以及堿基編輯器脫靶的分子機(jī)制等值得進(jìn)一步的探究,解決這些技術(shù)瓶頸背后的科學(xué)問(wèn)題,為研發(fā)高效、廣適性和特異性的精準(zhǔn)堿基編輯工具提供堅(jiān)實(shí)的理論依據(jù)。(2)如何進(jìn)一步拓寬能夠被編輯的堿基類型。目前的堿基編輯器主要實(shí)現(xiàn)堿基轉(zhuǎn)換而不能進(jìn)行堿基顛換,雖已有少量報(bào)道C到G(或A)的堿基編輯器,但其編輯產(chǎn)物依賴被編輯的細(xì)胞類型,且會(huì)使indel出現(xiàn)的頻率增加,因此還需要進(jìn)一步的優(yōu)化。(3)如何開發(fā)更強(qiáng)大的基于堿基編輯器的人工定向進(jìn)化工具。堿基編輯器可以模擬自然界在設(shè)定的靶向DNA區(qū)域內(nèi)隨機(jī)產(chǎn)生大量的點(diǎn)突變,后續(xù)利用適當(dāng)?shù)暮Y選壓力鑒定出所需的有益變異。擴(kuò)增編輯窗口寬度、拓展可同時(shí)編輯的堿基類型以及提高編輯效率都是未來(lái)優(yōu)化的方向。