劉佳慧 劉葉 花爾并 王猛
(1.天津科技大學(xué)生物工程學(xué)院,天津 300457;2.中國科學(xué)院天津生物工業(yè)技術(shù)研究所,天津 300308)
堿基編輯技術(shù)(base editing)是通過將堿基脫氨酶及其他功能元件與CRISPR/Cas系統(tǒng)相結(jié)合,在引導(dǎo)RNA(guide RNA, gRNA)的指引下,實(shí)現(xiàn)對(duì)基因組上目標(biāo)位置胞嘧啶或腺嘌呤的堿基替換[1]。堿基編輯具有不產(chǎn)生雙鏈切割、不需要外源模板且不依賴染色體同源重組的優(yōu)勢,成為真核及原核生物中一種強(qiáng)大的基因組編輯工具。
近年來堿基編輯技術(shù)不斷發(fā)展壯大,目前已開發(fā)的 DNA 堿基編輯器種類主要包括:可介導(dǎo)C至T替換的胞嘧啶堿基編輯器[2-3]、介導(dǎo)A至 G替換的腺嘌呤堿基編輯器[4]、介導(dǎo)C至G或C至A替換的糖基化酶堿基編輯器[5],以及融和胞嘧啶堿基編輯器與腺嘌呤堿基編輯器的雙功能堿基編輯器[6]等。此外,先導(dǎo)編輯(prime editing)是一種較新的全能型堿基編輯技術(shù),可實(shí)現(xiàn)對(duì)各種類型的堿基序列進(jìn)行替換[7],但目前該工具在原核生物中編輯效率較低[8],未得到廣泛應(yīng)用。除上述堿基編輯器種類的擴(kuò)展以外,堿基編輯技術(shù)的編輯效率、編輯窗口大小以及脫靶等問題也在不斷的得到優(yōu)化[9]。但是,CRISPR/Cas系統(tǒng)存在自身的PAM(protospacer adjacent motif)依賴性,如最常用的SpCas9(Streptococcus pyogenes Cas9),具有NGG PAM要求,這限制了結(jié)合SpCas9堿基編輯技術(shù)的可編輯位點(diǎn)范圍,因此,釋放PAM序列限制是提高基因組目標(biāo)位點(diǎn)覆蓋度的有效方法。通常采用的優(yōu)化方式是利用識(shí)別不同 PAM的SpCas9 突變體或不同種類的Cas蛋白?,F(xiàn)已報(bào)道多種識(shí)別不同PAM的Cas蛋白應(yīng)用于真核或原核生物的堿基編輯中,極大地促進(jìn)了基因組可編輯位點(diǎn)的覆蓋范圍,其中天然Cas蛋白包括Cpf1(也稱為Cas12a, TTTV PAM)、ScCas9(Streptococcus canis Cas9, NNG PAM)、CjCas9(Campylobacter jejuni Cas9, NNNNRYAC PAM)等,SpCas9突變體包括SpCas9 VQR(NGA PAM)/VRER(NGCG PAM)、xCas9 3.7(NG、NNG、GAA、GAT、CAA PAM)、SpCas9-NG(NG PAM)、SpCas9-NRCH/NRTH/NRRH、SpG(NGN)、SpRY(近乎PAMless, NRN>NYN PAM)等[10-13]。
谷氨酸棒桿菌(Corynebacterium glutamicum)是一種重要的食品級(jí)微生物,已被廣泛用于各種氨基酸、有機(jī)酸等的工業(yè)化生產(chǎn)[14]。本研究團(tuán)隊(duì)及合作者前期在谷氨酸棒桿菌中開發(fā)了一種多元自動(dòng)化的堿基編輯方法MACBETH(multiplex automated Corynebacterium glutamicum base editing method),實(shí)現(xiàn)基因組目標(biāo)位點(diǎn)C到T的替換[15],隨后又對(duì)該技術(shù)從編輯覆蓋度、堿基編輯種類、堿基編輯框、堿基編輯實(shí)驗(yàn)條件、多位點(diǎn)堿基編輯等多方面進(jìn)行了優(yōu)化[16-19]。盡管前期的工作已將PAM較為寬松的突變體xCas 3.7,SpCas9-NG應(yīng)用于堿基編輯工具的PAM拓展中,但基因組編輯結(jié)果的穩(wěn)定性較差、編輯效率偏低,而結(jié)合SpCas9 VQR/VRER的堿基編輯工具,雖然編輯效率較高,但這兩種堿基編輯工具的PAM識(shí)別范圍仍然有限[16],因此,谷氨酸棒桿菌堿基編輯工具的PAM仍然需要進(jìn)一步拓展。本研究擬結(jié)合近年來最新報(bào)道的Cas9突變體,進(jìn)一步對(duì)谷氨酸棒桿菌中的胞嘧啶堿基編輯工具進(jìn)行PAM拓展,同時(shí)也為谷氨酸棒桿菌中基于CRISPR/Cas系統(tǒng)的其他基因組編輯工具的PAM拓展提供有力的參考。
1.1.1 菌種和質(zhì)粒 本研究所用菌株和質(zhì)粒均為作者所在實(shí)驗(yàn)室保存和構(gòu)建,結(jié)合各種Cas9蛋白或突變體的堿基編輯器的表達(dá)質(zhì)粒詳見表1,其構(gòu)建所需的引物詳見表2,含基因組靶標(biāo)序列的gRNA質(zhì)粒均由質(zhì)粒pgRNA-ccdB作為模板,替換20 bp gRNA靶標(biāo)序列構(gòu)建獲得。
表1 本文用到的質(zhì)粒與菌株Table 1 Plasmids and strains used in this study
表2 本文質(zhì)粒載體構(gòu)建用到的引物Table 2 Primers for plasmids construction used in this study
1.1.2 酶、引物及相關(guān)試劑盒 Q5 High-Fidelity DNA聚合酶、T4 DNA連接酶、各種限制性內(nèi)切酶購自紐英倫生物技術(shù)有限公司。大腸桿菌感受態(tài)細(xì)胞制備試劑盒購自TaKaRa公司。2×Es Taq Master Mix(Dye)購自康為世紀(jì)有限公司。質(zhì)粒小量抽提試劑盒、普通DNA產(chǎn)物純化試劑盒購自天根生化科技有限公司。重組試劑盒ClonExpress?MultiS One Step Cloning Kit購自南京諾唯贊生物科技有限公司。PCR引物由擎科生物科技有限公司合成。
1.1.3 培養(yǎng)基 LB培養(yǎng)基(g/L):蛋白胨10,氯化鈉10,酵母粉5。NCM培養(yǎng)基(g/L):磷酸氫二鉀17.4,氯化鈉11.6,葡萄糖5,蛋白胨5,酵母粉1,檸檬酸三鈉0.3,七水合硫酸鎂0.05,山梨醇91,調(diào)pH至7.2。BHIS 培養(yǎng)基(g/L):BHI(brain heart infusion)18.5,山梨醇91,調(diào)pH至7.2。LBHIS 培養(yǎng)基(g/L):蛋白胨5,BHI 18.5,氯化鈉10,山梨醇91,酵母粉2.5。制備固體培養(yǎng)基時(shí)添加2%的瓊脂粉。
1.2.1 gRNA的設(shè)計(jì) 本研究所選用的gRNA序列均由CHOPCHOP gRNA設(shè)計(jì)網(wǎng)站設(shè)計(jì)得出,設(shè)計(jì)參數(shù)為gRNA長度20 nt,PAM根據(jù)所需設(shè)置,其他參數(shù)為軟件默認(rèn)參數(shù)。詳見表3。
表3 本文所用到的gRNATable 3 gRNAs used in this study
1.2.2 質(zhì)粒構(gòu)建 質(zhì)粒pnCas9-Sc++(D10A)-AID的構(gòu)建:ScCas9++蛋白編碼基因由金斯瑞公司合成,按照谷氨酸棒桿菌密碼子偏好性進(jìn)行優(yōu)化;以合成基因?yàn)槟0?,用引物ScD10A-1F/1R擴(kuò)增得到相應(yīng)片段;以質(zhì)粒pnCas9(D10A)-AIDTS為模板,用引物ScD10A-2F/R、ScD10A-3F/S-3R、ScD10A-4F/4R擴(kuò)增獲得其他載體片段;將上述片段進(jìn)行多片段同源重組連接,再轉(zhuǎn)化至E.coli DH5α中,經(jīng)酶切及測序驗(yàn)證后,獲得正確質(zhì)粒。
質(zhì)粒pnCas9-SpG(D10A)-AID的構(gòu)建:SpG突變區(qū)域基因片段由公司合成;以合成基因?yàn)槟0澹靡颯pG-1F/1R擴(kuò)增得到相應(yīng)片段;以質(zhì)粒pnCas9(D10A)-AIDTS為模板,用引物SpG-2F/2R、S-3F/S-3R、SpG-4F/4R擴(kuò)增獲得其他載體片段;將上述片段進(jìn)行多片段同源重組連接,再轉(zhuǎn)化至E.coli DH5α中,提取質(zhì)粒后經(jīng)酶切及測序驗(yàn)證后,獲得正確質(zhì)粒。
質(zhì)粒pnCas9-SpRY(D10A)-AID的構(gòu)建:SpRY突變區(qū)域基因片段由公司合成,以此為模板,用引物SpRY-1F/1R擴(kuò)增得到突變體的片段;再以質(zhì)粒pnCas9(D10A)-AIDTS為模板,用引物SpRY-2F/2R、S-3F/S-3R、SpRY-4F/4R分別擴(kuò)增獲取其他片段;將上述片段經(jīng)同源重組連接,轉(zhuǎn)化至E.coli DH5α,質(zhì)粒酶切和測序驗(yàn)證后,得到正確的質(zhì)粒。
含不同gRNA靶標(biāo)位點(diǎn)序列的質(zhì)粒構(gòu)建:合成含gRNA靶標(biāo)序列的上下游引物,同時(shí)上下游引物的5′端添加用于形成黏性末端的4 bp序列,經(jīng)退火結(jié)合后,與質(zhì)粒pgRNA-ccdB 通過Golden Gate方法連接構(gòu)建,具體方法可參見文獻(xiàn)[15]。
1.2.3 谷氨酸棒桿菌的轉(zhuǎn)化 將在BHI液體培養(yǎng)基中過夜(約16 h)培養(yǎng)的C.glutamicum ATCC 13032菌液以初始OD600=0.3轉(zhuǎn)接到含異煙肼(isonicotinyl hydrazide, INH)、Tween80、DL-蘇氨酸和葡萄糖的NCM培養(yǎng)基中。在OD600為0.8-1時(shí),制備C.glutamicum ATCC 13032感受態(tài)細(xì)胞,具體方法參見文獻(xiàn)報(bào)道[20]。
單質(zhì)粒轉(zhuǎn)化:取1 μg 質(zhì)粒加入80 μL C.glutamicum ATCC 13032感受態(tài)細(xì)胞中,在電壓為1.8 kV電轉(zhuǎn)兩次后立即加入1 mL提前預(yù)熱的BHIS培養(yǎng)基中,在46℃的金屬浴鍋中溫浴6 min。搖床30℃,220 r/min培養(yǎng)2 h后,涂布于含5 μg/mL Cm抗性的LBHIS固體培養(yǎng)基平板上,30℃靜置培養(yǎng)2-3 d,直至長出單菌落。
雙質(zhì)粒轉(zhuǎn)化[15]:取2 μg pnCas9(D10A)-AIDTS質(zhì)粒(或pnCas9-SpRY(D10A)-AID、pnCas9-Sc++(D10A)-AID、pnCas9-SpG(D10A)-AID)和1 μg gRNA質(zhì)粒加入到80 μL C.glutamicum ATCC 13032感受態(tài)細(xì)胞中,在電壓為1.8 kV電轉(zhuǎn)兩次后立即加入1 mL提前預(yù)熱的BHIS培養(yǎng)基中,在46℃的金屬浴鍋中溫浴6 min。然后放置30℃,220 r/min的搖床中培養(yǎng)2 h,將培養(yǎng)后的菌液涂布于含15 μg/mL Kan和5 μg/mL Cm抗性的LBHIS固體培養(yǎng)基平板上,放置在30℃培養(yǎng)箱中培養(yǎng)2-3 d,直至長出單菌落。
1.2.4 谷氨酸棒桿菌的培養(yǎng)及堿基編輯 種子培養(yǎng):挑取生長良好的單菌落接種于每孔裝有600 μL LBHIS液體培養(yǎng)基(含15 μg/mL Kan和5 μg/mL Cm)96孔板,30℃,800 r/min培養(yǎng)24 h。誘導(dǎo)培養(yǎng):將種子培養(yǎng)液按初始OD600=0.2的接種量轉(zhuǎn)接于每孔裝有600 μL的LBHIS液體培養(yǎng)基(含1 mmol/L IPTG,15 μg/mL Kan和5 μg/mL Cm)的96孔板中,30℃,800 r/min培養(yǎng)16 h。
1.2.5 堿基編輯比例分析 將誘導(dǎo)編輯后的菌液,用各自引物(距離靶標(biāo)位點(diǎn)上下游約150 bp處設(shè)計(jì)引物)和2×Es Taq Master Mix(Dye)進(jìn)行菌液PCR,將PCR產(chǎn)物送Sanger測序。借助EditR網(wǎng)站[21]分析Sanger測序峰圖結(jié)果,匯總整理編輯效率。
1.2.6 生長曲線測定 挑取生長良好的單克?。糠N3個(gè)平行)轉(zhuǎn)接于5 μg/mL Cm抗性的LBHIS液體培養(yǎng)基中,過夜培養(yǎng)16 h;第2天以此為種子液以初始OD600=0.2的接種量轉(zhuǎn)接至5 μg/mL Cm抗性的LBHIS液體培養(yǎng)基中,分別在培養(yǎng)0、3、6、9、12、24、30 h時(shí)取樣,通過分光光度計(jì)測定其OD600值,并記錄。
谷氨酸棒桿菌為高GC含量的菌株,為了能夠覆蓋更多的基因組位點(diǎn),選擇了3種新型PAM寬松的Cas9蛋白對(duì)谷氨酸棒桿菌中的胞嘧啶堿基編輯器進(jìn)行優(yōu)化,包括近乎PAMless的SpRY突變體(NRN>NYN PAM)、識(shí)別NGN PAM的SpG突變體,以及識(shí)別NNG PAM的ScCas9++蛋白。構(gòu)建了雙質(zhì)粒堿基編輯系統(tǒng),其中一個(gè)質(zhì)粒表達(dá)不同的nCas9(D10A)蛋白與胞嘧啶脫氨酶(activation-induced cytidine deaminase, AID)的融合蛋白(圖1-A),另一個(gè)質(zhì)??赊D(zhuǎn)錄生成靶標(biāo)不同基因組位點(diǎn)的gRNA序列(圖1-B)。相比單質(zhì)粒的堿基編輯系統(tǒng)(將上述融合蛋白與gRNA表達(dá)框構(gòu)建在一個(gè)質(zhì)粒上),gRNA質(zhì)粒的單獨(dú)構(gòu)建,能夠方便本研究中不同堿基編輯器之間的交叉使用,降低構(gòu)建工作的冗余,同時(shí),基于之前的研究結(jié)果,單質(zhì)粒編輯系統(tǒng)與雙質(zhì)粒編輯系統(tǒng)的編輯效率并無明顯差異,不會(huì)對(duì)測試結(jié)果產(chǎn)生影響。本研究中所測試的gRNA序列詳見表3,靶標(biāo)序列均為基因組內(nèi)源序列,可以覆蓋NRN、NNG所有的PAM種類。另外,為了研究結(jié)合不同Cas9蛋白的堿基編輯工具是否會(huì)對(duì)谷氨酸棒桿菌的生長產(chǎn)生影響,測試了含不同堿基編輯工具菌株的生長曲線,并以含pXMJ19TS空質(zhì)粒的菌株作為對(duì)照(圖1-C)。結(jié)果表明,含不同堿基編輯工具的菌株與對(duì)照菌株相比,生長曲線并沒有明顯差異,這表明結(jié)合不同Cas9蛋白的堿基編輯工具不會(huì)對(duì)谷氨酸棒桿菌的生長產(chǎn)生影響。
將包含SpRY突變體的堿基編輯質(zhì)粒與覆蓋NRN PAM的gRNA質(zhì)粒分別轉(zhuǎn)化至谷氨酸棒桿菌13032中,并進(jìn)行編輯,通過對(duì)編輯后菌液的靶標(biāo)區(qū)域進(jìn)行Sanger測序,同時(shí)結(jié)合EditR在線分析軟件對(duì)編輯結(jié)果進(jìn)行評(píng)估。從編輯結(jié)果來看(圖2),結(jié)合SpRY突變體后,堿基編輯框沒有發(fā)生明顯的改變,仍為PAM 序列上游 -16 - -20 位。針對(duì)所測試的PAM類型,相比nCas9(D10A)-AID,nCas9-SpRY(D10A)-AID展示出了更寬松的PAM識(shí)別,除對(duì)CAT、CAC、TAA PAM的位點(diǎn)完全沒有編輯外,對(duì)其他的NRN種類的PAM位點(diǎn)均出現(xiàn)了不同程度的識(shí)別,其中對(duì)AGA PAM位點(diǎn)的編輯效率最高,達(dá)到85%,而原始nCas9(D10A)-AID在該位點(diǎn)未發(fā)生編輯。但是,nCas9-SpRY(D10A)-AID整體編輯效率偏低,所測試的全部32種PAM類型中,僅4種PAM位點(diǎn)的最高編輯效率高于50%(AGA、TGG、CGG、GGG PAM),13種PAM位點(diǎn)的最高編輯效率低于20%。對(duì)原始NGG PAM位點(diǎn)的識(shí)別,相比nCas9(D10A)-AID,nCas9-SpRY(D10A)-AID編輯效率下降17.5%-80%,最高編輯效率僅為59.3%,而nCas9(D10A)-AID最高編輯效率高達(dá)100%。
將結(jié)合SpG突變體的堿基編輯質(zhì)粒與覆蓋所有NGN PAM的gRNA質(zhì)粒分別共轉(zhuǎn)化至谷氨酸棒桿菌13032中,然后進(jìn)行堿基編輯、編輯結(jié)果分析。如圖3所示,結(jié)合SpG突變體后,堿基編輯框沒有發(fā)生明顯的改變。與nCas9(D10A)-AID相比,nCas9-SpG(D10A)-AID能夠?qū)崿F(xiàn)對(duì)所有測試的NGN PAM基因組位點(diǎn)的編輯,其中對(duì)AGT PAM位點(diǎn)的編輯效率最高,達(dá)到83.7%,而原始nCas9(D10A)-AID并沒有在該位點(diǎn)進(jìn)行編輯。對(duì)于原始NGG PAM位點(diǎn)的編輯,nCas9-SpG(D10A)-AID相比于nCas9(D10A)-AID,編輯效率下降9.3%-55.9%,編輯效率最高達(dá)到76.3%。雖然nCas9-SpG(D10A)-AID的PAM識(shí)別范圍不如nCas9-SpRY(D10A)-AID的PAM識(shí)別范圍廣,但nCas9-SpG(D10A)-AID對(duì)NGN PAM的基因組位點(diǎn)的整體編輯效率要優(yōu)于nCas9-SpRY(D10A)-AID。在測試的16種PAM類型中,有6種PAM位點(diǎn)的編輯效率最高超過50%(AGT、AGA、AGG、GGG、TGT、CGC PAM),僅有1種PAM位點(diǎn)的編輯效率低于20%,此外還有10種PAM位點(diǎn)的編輯效率高于nCas9-SpRY(D10A)-AID的編輯結(jié)果。
圖3 nCas9-SpG(D10A)-AID的堿基編輯結(jié)果Fig.3 Base editing results of nCas9-SpG(D10A)-AID
ScCas9為SpCas9的直系同源蛋白,可實(shí)現(xiàn)對(duì)NNG PAM的識(shí)別,ScCas9++突變體為ScCas9蛋白基礎(chǔ)上基于其他直系同源蛋白進(jìn)化得到的突變體,可以進(jìn)一步提高基因組編輯。將結(jié)合ScCas9++蛋白的堿基編輯質(zhì)粒與覆蓋所有NNG PAM的gRNA質(zhì)粒分別共轉(zhuǎn)化至谷氨酸棒桿菌13032中,然后進(jìn)行堿基編輯、編輯結(jié)果分析。如圖4所示,結(jié)合ScCas9++后,堿基編輯框沒有發(fā)生明顯的改變。相比nCas9(D10A)-AID,除對(duì)TCG,CTG PAM的基因組位點(diǎn)沒有編輯外,ScCas9++(D10A)-AID可實(shí)現(xiàn)對(duì)其他測試NNG PAM的基因組位點(diǎn)編輯,大部分位點(diǎn)基因組編輯效率均較高,對(duì)CAG和GAG PAM的基因組位點(diǎn)編輯效率最高達(dá)到100%,而原始nCas9(D10A)-AID在該位點(diǎn)的編輯效率低于10%。對(duì)原始NGG PAM位點(diǎn)的編輯, 相對(duì)于原始的nCas9(D10A)-AID,突變體nCas9-SpG(D10A)-AID的編輯效率沒有明顯下降,甚至個(gè)別位點(diǎn)編輯效率要高于nCas9(D10A)-AID。在測試的16種PAM類型中,除4種PAM位點(diǎn)的最高編輯效率低于20%以外,其他PAM位點(diǎn)的最高編輯效率均高于70%。
圖4 ScCas9++(D10A)-AID的堿基編輯結(jié)果Fig.4 Base editing results of ScCas9++(D10A)-AID
作為近年來新興的基因組編輯工具,堿基編輯工具憑借著自身強(qiáng)大的優(yōu)勢,逐漸在真核及原核微生物領(lǐng)域中得到廣泛的應(yīng)用,包括應(yīng)用于功能基因失活、蛋白進(jìn)化、多基因調(diào)控、分子存儲(chǔ)等領(lǐng)域[1]。本團(tuán)隊(duì)與其合作者率先在重要的工業(yè)生產(chǎn)菌株谷氨酸棒桿菌中開發(fā)了多元自動(dòng)化的堿基編輯工具,并將該技術(shù)進(jìn)行了多方面的應(yīng)用,包括對(duì)代謝途徑關(guān)鍵基因進(jìn)行多基因組合失活或單基因突變,提高谷氨酸或賴氨酸的產(chǎn)量[15-16];結(jié)合自動(dòng)化操作平臺(tái),快速構(gòu)建94個(gè)轉(zhuǎn)錄因子的基因失活文庫,成功率達(dá)到100%[15];開發(fā)了基于堿基編輯工具的新型染色體原位多基因表達(dá)調(diào)控技術(shù)(base editor-targeted and template-free expression regulation, BETTER),實(shí)現(xiàn)了谷氨酸棒桿菌中最高10個(gè)基因的同時(shí)表達(dá)調(diào)控[23]。另外,近期本研究團(tuán)隊(duì)與合作者結(jié)合堿基編輯工具以及靶向全基因組的gRNA混合文庫,開發(fā)了全基因組擾動(dòng)文庫構(gòu)建與篩選技術(shù),作為示例,以基因編碼區(qū)提前生成終止密碼子的方式,構(gòu)建了谷氨酸棒桿菌的全基因組基因失活文庫,并實(shí)現(xiàn)了特定性狀下的功能基因發(fā)掘[24]。但受限于原始Cas9的PAM限制,結(jié)合原始Cas9的胞嘧啶堿基編輯工具,僅能失活88.0%的谷氨酸棒桿菌13032的基因組基因。盡管前期研究嘗試應(yīng)用xCas9 3.7 以及 Cas9-NG突變體將NGG 的PAM限制釋放至NGN,這樣可以將基因組失活基因覆蓋率提高至99.2%,僅有24個(gè)基因不能被失活,但是結(jié)合xCas9 3.7 以及 Cas9-NG突變體的堿基編輯工具,對(duì)基因組位點(diǎn)編輯效率不穩(wěn)定,僅能實(shí)現(xiàn)對(duì)部分NGN PAM位點(diǎn)的編輯[16]。因此,在谷氨酸棒桿菌中對(duì)PAM位點(diǎn)的拓展仍需要進(jìn)一步優(yōu)化。PAM位點(diǎn)的拓展,可以極大地提高基因組可編輯位點(diǎn)的范圍,不僅有利于失活更多的基因,同時(shí)對(duì)蛋白質(zhì)的理性/非理性突變、代謝通路的表達(dá)調(diào)控等均具有重要的意義。
對(duì)PAM序列的拓展,主要通過采用識(shí)別不同PAM的SpCas9突變體或者其他Cas蛋白來實(shí)現(xiàn)。其中,SpG與SpRY突變體是基于原始SpCas9蛋白結(jié)構(gòu),在PAM相互作用區(qū)域(PAM interacting(PI)domain)引入不同突變獲得的PAM限制寬松的兩種突變體,其中SpG突變體包含6個(gè)氨基酸突變位點(diǎn)(D1135L/S1136W/G1218K/E1219Q/R1335Q/T1337R),PAM識(shí)別釋放至NGN PAM,而SpRY突變體則是在SpG基礎(chǔ)上再引入L1111R/A1322R/ A61R/N1317R/R1333P五個(gè)位點(diǎn)突變獲得的突變體,PAM限制釋放至近乎PAMless[12]。SpG與SpRY突變體一經(jīng)開發(fā)便引起眾多關(guān)注,在哺乳動(dòng)物細(xì)胞、植物以及微生物領(lǐng)域均有報(bào)道應(yīng)用。Qiao團(tuán)隊(duì)在乳酸乳球菌中通過結(jié)合SpG、SpRY突變體對(duì)其開發(fā)的堿基編輯工具的PAM進(jìn)行了拓展,其開發(fā)的CRISPR-cDBE(SpGn)可以實(shí)現(xiàn)對(duì)V(T/A/C)GG、NGM(A/C)、K(T/G)GT PAM的識(shí)別,而CRISPR-cDBE(SpRYn)則可以實(shí)現(xiàn)對(duì)NGV(G/A/C)、TGT、W(T/A)AG、H(T/A/C)AA、D(T/A/G)AY(C/T)、R(A/G)CG、D(T/A/G)CA、B(T/C/G)CC、V(A/C/G)CT、V(A/C/G)TS(G/C)、R(A/G)TA、M(A/C)TT PAM的識(shí)別[25]。本研究中,結(jié)合SpRY的胞嘧啶堿基編輯工具在谷氨酸棒桿菌中,除對(duì)CAT、CAC、TAA PAM的基因組位點(diǎn)完全沒有編輯外,對(duì)其他的NRN種類的PAM位點(diǎn)均有不同程度的編輯,但編輯效率整體較低,并且對(duì)原始NGG PAM的基因組位點(diǎn)編輯效率下降較明顯。因此結(jié)合SpRY突變體的堿基編輯工具未能在谷氨酸棒桿菌中實(shí)現(xiàn)對(duì)PAM的有效拓展及基因組穩(wěn)定編輯。而結(jié)合SpG的胞嘧啶堿基編輯工具在谷氨酸棒桿菌中可實(shí)現(xiàn)對(duì)所有NGN PAM的識(shí)別,且編輯效率優(yōu)于結(jié)合SpRY突變體的堿基編輯工具。另外,本研究將ScCas9++蛋白應(yīng)用于谷氨酸棒桿菌堿基編輯工具的PAM擴(kuò)展中,且可以實(shí)現(xiàn)對(duì)大多數(shù)NNG PAM基因組位點(diǎn)的高效編輯,對(duì)NGG PAM位點(diǎn)的編輯效率也要優(yōu)于SpRY、SpG突變體。經(jīng)統(tǒng)計(jì),結(jié)合原始SpCas9蛋白以及上述3種突變體,目前可以實(shí)現(xiàn)對(duì)NNN PAM中的35種PAM進(jìn)行識(shí)別,仍有29種PAM不能覆蓋。
除了對(duì)PAM序列的拓展外,堿基編輯工具基因組編輯范圍的擴(kuò)展還可以通過擴(kuò)展或改變堿基編輯窗口來實(shí)現(xiàn),例如本研究團(tuán)隊(duì)及合作者通過改變gRNA靶標(biāo)序列的長度,實(shí)現(xiàn)了對(duì)谷氨酸棒桿菌堿基編輯窗口的擴(kuò)展(可實(shí)現(xiàn)PAM上游-15位、-21位的編輯)[16];通過構(gòu)建BE3型胞嘧啶堿基編輯器,可以實(shí)現(xiàn)谷氨酸棒桿菌堿基編輯窗口的改變(PAM上游-11- -19位)[17]。另外,脫靶問題也是堿基編輯工具面臨的重要問題,后續(xù)研究將針對(duì)本文新優(yōu)化的堿基編輯工具進(jìn)行進(jìn)一步的脫靶評(píng)估,可通過引入增強(qiáng)Cas蛋白保真性的突變位點(diǎn)進(jìn)一步降低脫靶效率。
本研究在谷氨酸棒桿菌中構(gòu)建結(jié)合不同種類的Cas9蛋白的胞嘧啶堿基編輯系統(tǒng),編輯效率結(jié)果顯示,堿基編輯系統(tǒng)結(jié)合SpRY突變體,可以實(shí)現(xiàn)多數(shù)NRN PAM位點(diǎn)的識(shí)別,但總體編輯效率較低;結(jié)合SpG突變體,雖然可以將PAM限制釋放至NGN,但對(duì)原始NGG PAM位點(diǎn)的編輯效率有所下降;結(jié)合ScCas9++蛋白,可實(shí)現(xiàn)對(duì)大部分NNG PAM位點(diǎn)的編輯,整體編輯效率較高。