金 帆 李奉庭 夏 霖
1(中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院 深圳合成生物學(xué)創(chuàng)新研究院中國(guó)科學(xué)院定量工程生物學(xué)重點(diǎn)實(shí)驗(yàn)室 深圳 518055)
2(中國(guó)科學(xué)院大學(xué) 北京 100049)
隨著定向進(jìn)化技術(shù)的不斷發(fā)展,利用傳統(tǒng)的物理、化學(xué)和生物誘變技術(shù)[1-2]尋找所需的生物性狀往往會(huì)帶來(lái)過(guò)多有害突變,已無(wú)法滿足研究或應(yīng)用的需求。于是人們通過(guò)先對(duì)單個(gè)基因或生物途徑建立突變文庫(kù),再篩選得到具有更高活性的酶[3]、目的產(chǎn)物產(chǎn)量更高的生物體[4]。但這些方法大多需要體外建立突變文庫(kù)、體內(nèi)進(jìn)行篩選,反復(fù)迭代,這無(wú)疑增加了得到目的突變體的難度與成本。而 CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)技術(shù)的出現(xiàn)和發(fā)展,使人們可以站在新的角度,利用新的工具開(kāi)發(fā)定向進(jìn)化技術(shù),以解決目前所面臨的問(wèn)題。
借助 CRISPR/Cas 系統(tǒng),可以實(shí)現(xiàn)對(duì)特定基因或區(qū)域進(jìn)行編輯。根據(jù)小向?qū)?RNA(small guide RNA,sgRNA)引導(dǎo)的 Cas 蛋白或 Cas 融合蛋白的特性,可以使該區(qū)域基因產(chǎn)生雙鏈斷裂、單鏈缺刻和單堿基替換[5]等變化。再由修復(fù)機(jī)制、錯(cuò)配機(jī)制或化學(xué)催化機(jī)制引入突變,實(shí)現(xiàn)突變文庫(kù)的構(gòu)建。結(jié)合生物大分子如轉(zhuǎn)錄因子、核酸適配體等,CRISPR 的功能可以擴(kuò)展到分子檢測(cè)領(lǐng)域。由此可見(jiàn),CRISPR 系統(tǒng)的性能與定向進(jìn)化技術(shù)的需求有著很高的契合度。
另外,通過(guò) PubMed 數(shù)據(jù)庫(kù)檢索 CRISPR 與定向進(jìn)化的論文數(shù)量發(fā)表情況可知,定向進(jìn)化論文數(shù)從 1975 年開(kāi)始,到 2018 年左右出現(xiàn)平臺(tái)期,其年增長(zhǎng)速率僅為 2%~5%。而 CRISPR在同期正呈蓬勃發(fā)展的趨勢(shì),年增長(zhǎng)速率達(dá)14%~24%。因此,借助 CRISPR 為定向進(jìn)化技術(shù)提供新的方法和策略,對(duì)于定向進(jìn)化技術(shù)將是一個(gè)新的機(jī)遇。
本文首先介紹 CRISPR 技術(shù)的最新進(jìn)展,包括不同核酸酶及誘導(dǎo)系統(tǒng)的介紹。其次,從定向進(jìn)化的兩個(gè)核心出發(fā),總結(jié)利用 CRISPR 工具產(chǎn)生遺傳多樣性的策略以及借助 CRISPR 工具進(jìn)行篩選與選擇的方法。最后設(shè)想 CRISPR 介導(dǎo)的定向進(jìn)化(CRISPR-Mediated Directed Evolution,CDE)可能的未來(lái)發(fā)展方向。
圖1 主要的 CRISPR-Cas 工具分子特征與調(diào)控Fig. 1 Main CRISPR-Cas tools’ molecule characteristic and regulation
但在 SpCas9 系統(tǒng)中,存在 PAM 序列限制、SpCas9 蛋白較大和脫靶等問(wèn)題,限制了其進(jìn)一步的應(yīng)用。早期人們通過(guò)開(kāi)發(fā)其他細(xì)菌和古細(xì)菌的 Cas9 同源蛋白來(lái)改善這些問(wèn)題。比 SpCas9 更小的來(lái)自金黃色葡萄球菌的Cas9(SaCas9)可以識(shí)別 5′-NNGRRT-3′PAM[20],且當(dāng)引入 D10A 和 N580A 突變時(shí),SaCas9 同樣可顯示出缺刻酶活性[21]。來(lái)自腦膜炎奈瑟氏球菌 Cas9 (NmCas9)則可以識(shí)別 5′-NNNRRT-3′或 5′-NNNNGMTT-3′PAM 且脫靶效應(yīng)降低[22]。同樣還有嗜熱鏈球菌 Cas9(St1Cas9)可以識(shí)別 5′-NGGNG-3′或 5′-NNAGAAW-3′[23],空腸彎曲桿菌 Cas9(CjCas9)可以識(shí)別5′-NNNNACAC-3′或 5′-NNNNRYAC-3′[24],犬鏈球菌(ScCas9)可以識(shí)別 5′-NNG-3′[25]。
通過(guò)基于結(jié)構(gòu)信息,借助細(xì)菌生存選擇的定向進(jìn)化策略與突變位點(diǎn)組合設(shè)計(jì),SpCas9 VQR、EQR 和 VRER 變體可以分別識(shí)別 NGA、NGAG和 NGCG PAM[26]。借助噬菌體輔助的連續(xù)進(jìn)化,得到可以識(shí)別廣泛 PAM 序列(NG、GAA 和GAT)且特異性更高的 SpCas9 變體 xCas9[27]。另一種 SpCas9 變體(SpCas9-NG)則是通過(guò)結(jié)構(gòu)設(shè)計(jì)獲得識(shí)別 NG PAM 的能力[28]。SpCas9、xCas9和 SpCas9-NG 的 PAM 均包含鳥(niǎo)嘌呤(G),但人們希望 PAM 能不受依賴(lài) G 的限制。Miller 等[29]借助噬菌體輔助進(jìn)化,得到 3 個(gè)對(duì)非 G PAM 具有活性的 SpCas9 變體,分別可以識(shí)別 NRRH、NRCH 和 NRTH PAM;利用結(jié)構(gòu)導(dǎo)向工程策略同樣得到識(shí)別非 G PAM 的 SpG(NGN PAM)和SpRY(NRN>NYN PAM)[30]。這些新型 SpCas9變體的開(kāi)發(fā)使得 CRISPR-Cas9 系統(tǒng)幾乎可以靶向基因組任意位置而不再受 PAM 序列的限制。
改善 CRISPR 系統(tǒng)特異性和表達(dá)泄露對(duì)宿主的影響,可以對(duì) Cas9 蛋白進(jìn)行組合誘變[31]以及將 Cas9 蛋白與誘導(dǎo)性二聚體結(jié)構(gòu)域進(jìn)行融合,如光介導(dǎo)的 Mag 蛋白二聚化[32]、雷帕霉素誘導(dǎo)的 FRB 與 FKBP 互作、脫落酸及赤霉素誘導(dǎo)的對(duì)轉(zhuǎn)錄的激活或抑制[33-34],以實(shí)現(xiàn)時(shí)間或空間上的表達(dá)(圖 1(d))。
CRISPR 工具首先作為基因編輯系統(tǒng),可以與 DNA 修復(fù)機(jī)制串聯(lián),既可以對(duì)單基因進(jìn)行突變,也可以在基因組水平引入廣泛的變化。同時(shí) CRISPR 作為招募平臺(tái),通過(guò)蛋白質(zhì)融合或sgRNA 蛋白相互作用,將功能域募集到特定位點(diǎn),也可以在目標(biāo)基因中引入突變。
利用 CRISPR 系統(tǒng)可以對(duì)靶向 DNA 序列進(jìn)行切割的特性,并激活 DNA 修復(fù)機(jī)制,可以在基因組 DNA 中引入多樣性的突變,表 1 總結(jié)了基于該原理的定向進(jìn)化平臺(tái)。通過(guò) Cas9-sgRNA復(fù)合物對(duì) DNA 雙鏈的切割作用產(chǎn)生雙鏈斷裂(Double-Strand Break,DSB),而 DSB 的修復(fù)主要通過(guò)非同源末端連接(non-Homologous End Joining,NHEJ)途徑和同源性修復(fù)(Homology-Directed Repair,HDR)途徑完成[45](圖 2(a))。其中,NHEJ 不依賴(lài)同源模板[46],通常產(chǎn)生較小的插入或缺失,導(dǎo)致不可控的隨機(jī)突變,對(duì)單核苷酸取代能力不足[47]。HDR 途徑則需要外源雙鏈或單鏈寡脫氧核苷酸(double-strand/single strand DNA,dsDNA/ssDNA)提供模板,所以其擅長(zhǎng)利用攜帶突變的供體模板進(jìn)行單核苷酸的替換,但效率一般較低[48]。由于依賴(lài) HDR 途徑可以獲得更為精確的人工設(shè)計(jì)突變,不會(huì)造成基因大片段的缺失,于是人們開(kāi)展了提高 HDR 效率的研究,如調(diào)節(jié)修復(fù)機(jī)制[49-50]、合理設(shè)計(jì)供體模板等[51-52]。
表1 基于雙鏈斷裂的 CDE 策略Table 1 CDE strategy based on double-strand break
3.1.1 大腸桿菌底盤(pán)系統(tǒng)
在原核生物中,CRISPR 介導(dǎo)的 DNA 鏈切割可以殺死未被編輯過(guò)的細(xì)胞,從而可以增加篩選效率又避免使用抗性標(biāo)記[53]。Wang 等[54]借助λRed 與 dsDNA/ssDNA 開(kāi)發(fā)了多重自動(dòng)化基因組工程(Multiplex Automated Genome Engineering,MAGE),該系統(tǒng)可同時(shí)靶向染色體多個(gè)位置。將 CRISPR-Cas9 引入該系統(tǒng)則可以提高較大核糖體結(jié)合位點(diǎn)(Ribosome Binding Site,RBS)的替換效率(與 MAGE 相比提高了 56%),并且在單輪循環(huán)中引入單突變和雙突變的效率比 MAGE分別高 93% 和 90%[55]。Li 等[56]報(bào)道了一種基于CRISPR-Cas9 的迭代基因組編輯系統(tǒng)。該系統(tǒng)以dsDNA 作為編輯模板,實(shí)現(xiàn)基因缺失、插入和替換的效率可接近 100%,隨后針對(duì) β-胡蘿卜素,進(jìn)行了甲基赤蘚糖醇磷酸和中心代謝途徑的組合優(yōu)化,篩選得到的最優(yōu)菌株在發(fā)酵中可產(chǎn)出2.0 g/L 的 β-胡蘿卜素。
隨著 DNA 合成與測(cè)序成本的降低,人們可以借助高通量方法來(lái)在定向進(jìn)化過(guò)程中產(chǎn)生突變并分析表型(圖 2(b))。結(jié)合大規(guī)模并行寡核苷酸合成和測(cè)序,Garst 等[57]開(kāi)發(fā)了可在全基因組范圍內(nèi)產(chǎn)生能追蹤的編輯平臺(tái)(CRISPR-Enabled Trackable Genome Engineering,CREATE)。該平臺(tái)的核心設(shè)計(jì)是將每個(gè) gRNA 連接到同源修復(fù)盒上,該盒既可以編輯基因位點(diǎn),又可以作為條形碼來(lái)追蹤基因型與表型關(guān)系,實(shí)現(xiàn)引導(dǎo)切割的 gRNA 和同源修復(fù)模板序列的偶聯(lián)。借助 CREATE 可以對(duì)大腸桿菌耐熱和耐藥性的相關(guān)基因繪制超過(guò) 50 000 個(gè)全基因組突變,并鑒定其賦予目標(biāo)表型的突變。利用迭代CREATE(iCREATE)系統(tǒng)[58],研究人員為得到高葡萄糖和木糖利用率且抗水解產(chǎn)物抑制的大腸桿菌菌株以用于 3-羥基丙酸(3-Hydroxypropionic Acid,3HP)生產(chǎn),針對(duì) 30 個(gè)基因中約 40 000 個(gè)突變?cè)O(shè)計(jì)文庫(kù),得到的突變株可以在高水解產(chǎn)物濃度下達(dá)到親本株 3HP 產(chǎn)量的 7~8 倍。同時(shí)Liu 等[59]又針對(duì) 115 個(gè)基因中約 162 000 個(gè)突變?cè)O(shè)計(jì)文庫(kù),優(yōu)化了 3HP 合成代謝相關(guān)途徑,使突變株 3HP 產(chǎn)量高出野生型菌株 60 倍。這種系統(tǒng)的局限性是在追蹤基因型與表型的關(guān)系時(shí),以質(zhì)粒為載體的條形碼穩(wěn)定性較低,但可以采取基因組整合的辦法解決該問(wèn)題。
圖2 DNA 修復(fù)途徑介導(dǎo)的定向進(jìn)化策略Fig. 2 DNA repair pathway mediated directed evolution strategy
3.1.2 酵母底盤(pán)系統(tǒng)
酵母的代謝途徑工程研究對(duì)于生物燃料、化學(xué)藥品的生成具有重要意義,故人們開(kāi)展了酵母中的基因組多樣性研究。早期人們使用的突變文庫(kù)多為可以在酵母細(xì)胞內(nèi)自我復(fù)制的環(huán)狀質(zhì)粒,這種著絲粒質(zhì)粒在單細(xì)胞水平拷貝數(shù)差異很大,相當(dāng)于在表型與基因型之間增加了拷貝數(shù)的干擾項(xiàng),這會(huì)導(dǎo)致定向進(jìn)化的效率大大降低。
Ryan 等[60]在酵母中建立了 CRISPRm(Multiplex CRISPR System),該系統(tǒng)以 dsDNA 為模板,可在二倍體或多倍體釀酒酵母基因組中創(chuàng)建多個(gè) DSB。另外,為增加 CRISPRm 的編輯效率,將 sgRNA 與自切割肺炎三角洲病毒核酶 3′端融合以保護(hù) sgRNA 免受核酸外切酶的影響。最后在單輪定向進(jìn)化中篩選出纖維糊精轉(zhuǎn)運(yùn)蛋白變體,將纖維二糖到酒精的發(fā)酵速率提高了 10 倍。
對(duì)于多基因相關(guān)代謝途徑的優(yōu)化,可以利用CRISPR 系統(tǒng)對(duì)釀酒酵母基因組中甲羥戊酸代謝相關(guān)的 5 個(gè)基因進(jìn)行組合編輯[64],得到 31 個(gè)突變株,其中產(chǎn)量最高的突變菌株比野生型菌株高41 倍。CasPER (Cas9-Mediated Protein Evolution Reaction)[61]是一種 CRISPR-Cas9 介導(dǎo)的大序列定向進(jìn)化方法,可以整合 300~600 bp 的供體模板,其首先通過(guò)易錯(cuò) PCR 得到甲羥戊酸途徑兩個(gè)關(guān)鍵代謝酶的突變文庫(kù),再利用 CRISPR 系統(tǒng)在靶標(biāo)處引入 DSB 后發(fā)生的 HDR,使突變文庫(kù)整合到靶向位點(diǎn),最后得到了異戊二烯產(chǎn)量增加11 倍的突變體。
借助高通量寡核苷酸合成與測(cè)序技術(shù)同樣可以實(shí)現(xiàn)酵母基因組范圍的定向進(jìn)化研究。Guo等[65]介紹了一種基于 CRISPR-Cas9 的策略用于在酵母細(xì)胞中同時(shí)創(chuàng)建數(shù)百個(gè)無(wú)選擇標(biāo)記的遺傳變異,并針對(duì) 315 個(gè)特性不明的小型開(kāi)放閱讀框進(jìn)行評(píng)估,研究這些小型開(kāi)放閱讀框?qū)Νh(huán)境適應(yīng)性生長(zhǎng)的必要性,討論了該策略用于定向進(jìn)化的可能性。CRISPR-Cas9 與 HDR 輔助的基因組規(guī)模工程(CRISPR-Cas9 and Homology-Directed-Repair-Assisted Genome-Scale Engineering,CHAnGE)[62]可以實(shí)現(xiàn)單核苷酸精度的全基因組突變,進(jìn)化出對(duì)生長(zhǎng)抑制劑(如糠醛、乙酸)具有耐受性的菌株。在酵母中也可以使用類(lèi)似大腸桿菌中 CREATE 的策略,利用條形碼對(duì)每個(gè)引導(dǎo)-供體對(duì)序列進(jìn)行標(biāo)記,實(shí)現(xiàn)對(duì)突變文庫(kù)的高通量測(cè)序和功能分析[66]。同時(shí),該實(shí)驗(yàn)還發(fā)現(xiàn)利用融合蛋白 LexA-Fkh1p 將供體 DNA 招募到斷裂位點(diǎn),可以將編輯效率提高 5 倍以上[66]。
在基因組水平對(duì)基因表達(dá)水平進(jìn)行單一類(lèi)型的調(diào)節(jié)(上調(diào)、下調(diào)或敲除)是不全面的,因?yàn)槠錈o(wú)法研究具有不同表達(dá)水平基因間的相互作用對(duì)復(fù)雜表型的影響。多功能基因組水平 CRISPR系統(tǒng)(Multi-Functional Genome-Wide CRISPR,MAGIC)[67]可以有效解決這一問(wèn)題。MAGIC 使用 3 個(gè)正交的 Cas 蛋白開(kāi)發(fā)了三功能 CRISPR 系統(tǒng),將基因激活、干擾和缺失整合在一起。與CHAnGE 相比,在相同篩選條件下 MAGIC 可以發(fā)現(xiàn)更多糠醛耐受性相關(guān)基因間的相互作用,進(jìn)化出糠醛耐受性菌株的效率更高。
3.1.3 植物與動(dòng)物底盤(pán)系統(tǒng)
盡管在酵母中 HDR 途徑非?;钴S[68],但是在植物和哺乳動(dòng)物產(chǎn)生 DSB 后首個(gè)反應(yīng)是NHEJ。主要原因是動(dòng)植物中 NHEJ 途徑發(fā)生的概率要高于 HDR,且難以傳遞足夠的供體DNA(修復(fù)模板)。目前利用 NHEJ 途徑可以實(shí)現(xiàn)廣泛的動(dòng)植物基因缺失文庫(kù)的建立[69-73]。盡管多數(shù)條件下 NHEJ 途徑會(huì)導(dǎo)致基因的插入和缺失,使開(kāi)放閱讀框出現(xiàn)移碼突變,但借助 NHEJ 開(kāi)發(fā)定向進(jìn)化平臺(tái)仍然是可行的。例如,在水稻中開(kāi)發(fā)的 CRISPR-Cas9 定向進(jìn)化平臺(tái)[74],可以進(jìn)化 SF3B1 剪接體蛋白,以抵抗剪接抑制劑。其sgRNA 文庫(kù)靶向必需基因SF3B1,并從 15 000個(gè)愈傷組織中得到 6 個(gè)抗剪接抑制劑(GEX1A)的 SF3B1 突變體。
在哺乳動(dòng)物底盤(pán)中,NHEJ 產(chǎn)生的基因多樣性可以用于細(xì)胞耐藥性研究。CRISPRres(CRISPR-Induced Resistance in Essential Genes)系統(tǒng)[63]可以利用大規(guī)模的 sgRNA 文庫(kù)進(jìn)行癌細(xì)胞抗藥性的遺傳篩選,快速獲得和鑒定必需基因中的耐藥性突變。為驗(yàn)證系統(tǒng)的有效性,結(jié)合蛋白晶體結(jié)構(gòu),解析了煙酰胺磷酸核糖基轉(zhuǎn)移酶突變前后與抗癌藥 KPT-9274 的結(jié)合機(jī)制。Ipsaro 等[75]對(duì)賴(lài)氨酸甲基轉(zhuǎn)移酶(DOT1L)的KMT 結(jié)構(gòu)域設(shè)計(jì)了包含 73 個(gè) sgRNA 的文庫(kù),并在 EPZ-5676 抑制劑的選擇作用下得到具有VVEL293MM(兩個(gè)蛋氨酸替換為兩個(gè)纈氨酸,同時(shí)缺失谷氨酸和賴(lài)氨酸殘基)突變的 DOT1L 變體,生化分析發(fā)現(xiàn)該突變可以使酶活增加,同時(shí)降低對(duì) EPZ-5676 抑制劑的敏感性。
對(duì)于抗體工程,NHEJ 無(wú)法滿足精確位點(diǎn)突變的需求,所以人們開(kāi)發(fā)了利用 HDR 獲得高效抗體的研究。早期,研究人員利用 CRISPR-Cas9,針對(duì) BRCA1 第 18 個(gè)外顯子中 6 個(gè)堿基[76],克隆了包含隨機(jī)六聚體的 HDR 文庫(kù),證明了利用借助 HDR 對(duì)基因組區(qū)域進(jìn)行飽和編輯的可能性。Mason 等[77]利用單鏈寡核苷酸作為供體模板,將文庫(kù)引入抗雞蛋溶菌酶抗體(HEL3)重鏈可變域(VH)的互補(bǔ)決定區(qū) 3 (CDRH3),使用定向進(jìn)化和高通量篩選方法獲得了新的 CDRH3 序列。將 DNA 供體形式由 ssDNA 變?yōu)榭勺跃€性化質(zhì)粒,可以增加 HDR 的效率,再借助易錯(cuò) PCR對(duì) HEL3 的 VH 區(qū)生成隨機(jī)突變文庫(kù),篩選出親和力范圍在皮摩爾范圍內(nèi)的變體[78]。
借助 CRISPR 系統(tǒng)對(duì)基因組產(chǎn)生 DSB 后修復(fù)途徑,往往會(huì)對(duì)宿主本身造成損傷,并且受到需要提供 HDR 供體模板的限制,而利用 Cas9的引導(dǎo)功能,引導(dǎo)誘變功能蛋白可以解決這些問(wèn)題[79]。堿基編輯器是由 DNA 靶向模塊(dCas9 或nCas9)與催化結(jié)構(gòu)域(胞嘧啶或腺苷脫氨酶[80-81])組成的融合蛋白,其中靶向模塊可以結(jié)合到特定的 DNA 位點(diǎn),隨后 sgRNA 與靶 DNA 結(jié)合形成“R-環(huán)”[82],導(dǎo)致一小段單鏈 DNA 移位,這一小段單鏈 DNA 作為催化窗口被催化結(jié)構(gòu)域進(jìn)行堿基替換。由于堿基編輯的 DNA 靶向模塊使用的是 dCas9 或 nCas9,所以并不會(huì)導(dǎo)致 DSB 的產(chǎn)生。借助目前開(kāi)發(fā)的各類(lèi) CRISPR 融合蛋白平臺(tái),可以實(shí)現(xiàn)單堿基的變化、局部序列的多樣化[83-84],用于生成新的蛋白質(zhì)突變體或作物改良[85-86]等。表 2 為相應(yīng)平臺(tái)的匯總描述。
表2 基于與誘變功能蛋白聯(lián)用 CDE 策略Table 2 CDE strategy based on coupling protein with mutation
3.2.1 堿基編輯工具的開(kāi)發(fā)
胞嘧啶堿基編輯器(Cytosine Base Editor,CBE)可以令胞嘧啶(C)脫去氨基,使其轉(zhuǎn)化為尿嘧啶(U),從而將 C·G 堿基對(duì)轉(zhuǎn)化為 T·A 堿基對(duì)(圖 3(a))。第一代堿基編輯器由來(lái)自大鼠的胞嘧啶脫氨酶 APOBEC1,通過(guò)連接肽與 dCas9連接。以 PAM 的遠(yuǎn)端作為位置 1,其有效脫氨窗口在距 PAM 的 4~8 位。由于尿嘧啶糖基化酶(Uracil DNA Glycosylase,UDG)經(jīng)常會(huì)除去尿嘧啶,導(dǎo)致編輯效率較低(體外脫氨效率為25%~40%,細(xì)胞內(nèi)脫氨效率為 0.9%~7.7%),所以在 dCas9 蛋白的 C 末端偶聯(lián)了 UDG 的抑制劑 UGI (Uracil DNA Glycosylase Inhibitor),開(kāi)發(fā)了第二代堿基編輯器,使體內(nèi)編輯效率與第一代堿基編輯器相比提高了 3 倍。而如果將dCas9 替換為 nCas9(D10A),則可將第二代堿基編輯器效率進(jìn)一步提升 2~6 倍[80]。借助豐富的CRISPR 工具盒,人們開(kāi)發(fā)了諸多針對(duì)不同 PAM或者編輯窗口的堿基編輯器。如利用 SpCas9 變體(VQR-BE3、VRER-BE3)分別識(shí)別 NGAN 和NGCG PAM,編輯窗口分別為 4~11 和 3~10位[90];利用不同來(lái)源的 Cas 蛋白(Sa-BE3、SaKKH-BE3 和 Cas12a-BE)分別識(shí)別 NNGRRT、NNNRRT 和 TTTV[90-91]。
腺嘌呤堿基編輯器(Adenine Base Editor,ABE)則是可以將 T·A 轉(zhuǎn)化為 C·G (圖 3(b))。與CBE 類(lèi)似,人們開(kāi)展了一系列 ABE 的優(yōu)化及應(yīng)用[92-94]。例如,Wang 等[95]通過(guò)對(duì) ABE 進(jìn)行核心模塊組合優(yōu)化(包括 sgRNA、nCas9、脫氨酶與核定位信號(hào)肽),獲得了具有更精確的編輯窗口、更高編輯效率的 sABE 系統(tǒng)。
3.2.2 基于堿基編輯的定向進(jìn)化技術(shù)
定向進(jìn)化的實(shí)現(xiàn)需要借助單堿基取代和局部序列多樣化,創(chuàng)建遺傳突變庫(kù)[96]。CRISPR-X[83]和 TAM (Targeted AID-mediated Mutagenesis)[84]是兩個(gè)堿基編輯介導(dǎo)的產(chǎn)生局部序列多樣化的平臺(tái)。其中,CRISPR-X 使用的 sgRNA 融合有兩個(gè) MS2 結(jié)合適體,可以招募 MS2-AID (Activation Induced Cytidine Deaminase,AID)融合蛋白實(shí)現(xiàn)對(duì)局部區(qū)域的誘變(圖 3(c))。Hess 等[83]對(duì)野生型綠色熒光蛋白進(jìn)行誘變,得到 S65T 和 Q80H的綠色熒光蛋白變體(加強(qiáng)型綠色熒光蛋白)。借助 CRISPR-X 同樣可以進(jìn)行耐藥機(jī)制的研究:PSMB5 是蛋白酶抑制劑硼替佐米的靶標(biāo),作者通過(guò)迭代進(jìn)化發(fā)現(xiàn)了 5 個(gè)對(duì)硼替佐米強(qiáng)抗性突變與3 個(gè)適度抗性突變。在 TAM 系統(tǒng)中(圖 3(d)),研究人員則在慢性髓性白血病細(xì)胞中用 dCas9-AID-P182X (AIDx)靶標(biāo)BCR-ABL基因,有效鑒定了賦予細(xì)胞伊馬替尼抗性的已知突變和新突變[84]。除了耐藥性研究,將堿基編輯工具與哺乳動(dòng)物細(xì)胞展示系統(tǒng)結(jié)合使用,可以在多輪突變和選擇下得到更高親和力的抗體[97]。
圖3 Cas9 與誘變蛋白聯(lián)用介導(dǎo)的定向進(jìn)化Fig. 3 Cas9 and protein with mutation coupling mediated directed evolution
單純依靠 CBE 或 ABE 可能無(wú)法產(chǎn)生足夠豐富的突變類(lèi)型,而 CBE 和 ABE 的聯(lián)合使用可以有效解決這一問(wèn)題。Liu 等[98]通過(guò)對(duì)編碼 OsACC羧基轉(zhuǎn)移酶結(jié)構(gòu)域基因設(shè)計(jì) 141 條 sgRNA,結(jié)合兩種 CBE (eBE3 和 eCDA),及一種 ABE(eABE),分別構(gòu)建了 3 個(gè)堿基編輯文庫(kù)。從eABE 文庫(kù)中獲得了未報(bào)道過(guò)的 I1879V 突變,賦予水稻除草劑抗性,而另外兩個(gè)文庫(kù)未獲得新的突變。堿基編輯器介導(dǎo)的基因進(jìn)化技術(shù)(a Base-Editing-Mediated Gene Evolution,BEMGE)[99]則是將胞嘧啶堿基編輯器(rBE9)和腺嘌呤堿基編輯器(rBE14)同時(shí)轉(zhuǎn)入水稻細(xì)胞,對(duì)水稻除草劑靶標(biāo)基因OsALS1進(jìn)行靶向誘變,獲得 4 個(gè)自然界中未曾被發(fā)現(xiàn)的、對(duì)除草劑雙嘧菌鈉具有抗性的蛋白變體。類(lèi)似的策略同樣被用于在放線菌的單堿基編輯。CRISPR-BEST (CRISPR-base Editing System)[87]包含兩個(gè)獨(dú)立的堿基編輯器(CRISPRcBEST 和 CRISPR-aBEST),并在非模式鏈霉菌中通過(guò)引入終止密碼子失活了奇霉素合成途徑中兩個(gè)拷貝的kirN基因,同時(shí)該研究借助 Csy4(1 類(lèi) IF 型核糖核酸內(nèi)切酶)設(shè)計(jì)了 sgRNA 多重化系統(tǒng),可以實(shí)現(xiàn)僅依靠一對(duì)啟動(dòng)子和終止子表達(dá)多個(gè) sgRNA,且每個(gè) sgRNA 表達(dá)強(qiáng)度相同,顯示出強(qiáng)大的用于代謝工程類(lèi)定向進(jìn)化的潛力。飽和靶向內(nèi)源基因突變堿基編輯器(Saturated Targeted Endogenous Mutagenesis Editors,STEME)[88]則將 CBE 與 ABE 系統(tǒng)進(jìn)行合并融合(圖 3(e)),通過(guò)將胞嘧啶脫氨酶(APOBEC3A)和腺嘌呤脫氨酶(ecTadA-ecTadA7.10)同時(shí)融合在nCas9 的 N 端,并將 UGI 融合至 nCas9 (D10A)的 C 端,實(shí)現(xiàn)只在一個(gè) sgRNA 引導(dǎo)下就可以誘導(dǎo)靶位點(diǎn) C>T 和 A>G 的同時(shí)突變,顯著增加靶基因堿基突變的飽和度與多樣性,最后驗(yàn)證 STEME 在植物中的定向進(jìn)化能力,獲得了OsACC 羧基轉(zhuǎn)移酶結(jié)構(gòu)域 3 個(gè)對(duì)氟吡甲禾靈具有抗性的新突變位點(diǎn)。
3.2.3 Cas-DNA 聚合酶定向進(jìn)化技術(shù)
除了利用堿基編輯器進(jìn)行單堿基的轉(zhuǎn)換,借助 CRISPR 系統(tǒng)來(lái)招募其他誘變蛋白同樣可以產(chǎn)生局部序列多樣化。EvolvR 系統(tǒng)[89]將 nCas9 與易錯(cuò) DNA 聚合酶 I (PolI3M)進(jìn)行融合(圖 3(f)),利用 nCas9 創(chuàng)建的 DNA 缺刻作為 DNA 聚合酶起始位點(diǎn),誘變窗口長(zhǎng)度、突變率和取代偏差則由聚合酶變體本身性質(zhì)決定。該系統(tǒng)可以產(chǎn)生高于野生型細(xì)胞 770 多萬(wàn)倍的突變率,編輯 350 個(gè)核苷酸。最后使用 EvolvR 鑒定對(duì)抗生素壯觀霉素耐藥的新型核糖體突變位點(diǎn)。借助類(lèi)似的原理,Tou等[100]在釀酒酵母中也開(kāi)發(fā)了 EvolvR 系統(tǒng)。
對(duì)多樣化突變文庫(kù)進(jìn)行篩選與選擇是定向進(jìn)化中另一個(gè)關(guān)鍵部分。篩選可以對(duì)每種突變體的特性進(jìn)行評(píng)估,而選擇則只會(huì)產(chǎn)生理想的突變體[101]。篩選技術(shù)可以減少錯(cuò)過(guò)所需突變體的機(jī)會(huì),但降低通量;選擇技術(shù)則可以用于更大的文庫(kù),但需要對(duì)突變文庫(kù)施加選擇壓力來(lái)消除非目的突變體[102]。CRISPR 系統(tǒng)除了具有出色的基因編輯能力外,還已應(yīng)用于分子檢測(cè)。而篩選和選擇方法恰恰依賴(lài)分子檢測(cè)等檢測(cè)技術(shù)的開(kāi)發(fā),因?yàn)榇蠖鄶?shù)生物分子與可直接觀察的表型無(wú)關(guān)[96],需要熒光、比色或其他報(bào)告分子。例如,借助氣相色譜檢測(cè)產(chǎn)物的形成,獲得具有高活性細(xì)胞色素 P450 酶變體[103],通過(guò)一連串酶促反應(yīng)來(lái)產(chǎn)生與纖維素酶活相對(duì)應(yīng)的熒光[104]等。目前,CRISPR 系統(tǒng)被廣泛地應(yīng)用于核酸分子的檢測(cè)[105-106],在 2019 年也出現(xiàn)了對(duì)非核酸靶標(biāo)的檢測(cè)系統(tǒng),所以本節(jié)重點(diǎn)對(duì)CRISPR 介導(dǎo)的篩選檢測(cè)技術(shù)進(jìn)行闡述,在未來(lái)展望部分則對(duì) CRISPR 介導(dǎo)的選擇進(jìn)行討論。
Liang 等[107]開(kāi)發(fā)了 CRISPR-Cas12a 和細(xì)菌變構(gòu)轉(zhuǎn)錄因子(allosteric Transcription Factors,aTFs)介導(dǎo)的小分子檢測(cè)平臺(tái) CAT-SMelor(CRISPR-Cas12a- and aTF-mediated Small Molecule Detector),借助 CRISPR-Cas12a 的單鏈 DNA 切割能力與 aTFs 對(duì)小分子和雙鏈 DNA的競(jìng)爭(zhēng)結(jié)合活性,當(dāng)目的小分子存在時(shí),aTF 的構(gòu)象發(fā)生改變,導(dǎo)致 dsDNA 從 aTF 結(jié)合域解離,dsDNA 激活 Cas12a 對(duì)攜帶有熒光團(tuán)-淬滅劑(Fluorophore Quencher,F(xiàn)Q)標(biāo)記的 ssDNA 的切割,檢測(cè)熒光信號(hào)發(fā)生變化,實(shí)現(xiàn)對(duì)尿酸和對(duì)羥基苯甲酸的納摩爾水平的高通量檢測(cè)。另一種 CRISPR 介導(dǎo)的傳感器則是借助功能性 DNA(functional DNA,fDNA)。當(dāng) fDNA 的靶標(biāo)出現(xiàn)時(shí),單鏈 DNA 激活劑與 fDNA 解聚,觸發(fā) Cas12a對(duì)標(biāo)記有 FQ 的單鏈 DNA 進(jìn)行裂解,進(jìn)而出現(xiàn)可檢測(cè)的熒光信號(hào),該策略也成功地用于檢測(cè) ATP和 Na+[108]。類(lèi)似地,Li 等[109]同樣借助 fDNA 實(shí)現(xiàn)了對(duì) Pb2+、鮑曼不動(dòng)桿菌和微小 RNA 的檢測(cè),再次擴(kuò)充了 CRISPR 系統(tǒng)對(duì)非核酸分子的檢測(cè)范圍。
CRISPR 技術(shù)的出現(xiàn)和發(fā)展已經(jīng)徹底改變?nèi)藗儗?duì)基因進(jìn)行編輯、表達(dá)調(diào)控、分子檢測(cè)的能力,出現(xiàn)了一系列基于 CRISPR 技術(shù)的拓展工具,這也促進(jìn)定向進(jìn)化技術(shù)的發(fā)展,并已應(yīng)用于代謝工程、抗體工程、植物育種等領(lǐng)域(圖 4(a))。不同來(lái)源的 CRISPR 系統(tǒng)及其相關(guān)變體,已經(jīng)可以較為有效地解決如 PAM 位點(diǎn)限制[110]、脫靶[111]等問(wèn)題,為進(jìn)一步多基因間協(xié)同進(jìn)化(如人造基因回路或代謝通路)提供可能。利用大規(guī)模gRNA 文庫(kù)及高通量測(cè)序,結(jié)合 DNA 條形碼技術(shù),可以更高效地追蹤與獲得基因組層面上與突變相關(guān)的遺傳信息,提高定向進(jìn)化效率。同時(shí)通過(guò)機(jī)器學(xué)習(xí)與建立模型[112],有希望從獲得的原始數(shù)據(jù)對(duì)進(jìn)化模型進(jìn)行完善,或通過(guò)邏輯線路設(shè)計(jì)實(shí)現(xiàn)對(duì)基因突變(如重復(fù)序列導(dǎo)致的缺失)的追蹤與定量[113],得到普適性的系統(tǒng)突變庫(kù)與目的性狀的定量關(guān)系,幫助人們更好地借助 CRISPR工具箱對(duì)定向進(jìn)化進(jìn)行操縱和預(yù)測(cè)。
圖4 CRISPR 介導(dǎo)定向進(jìn)化的應(yīng)用與機(jī)遇Fig. 4 Application and opportunities of CRISPR-mediated directed evolution
借助 CRISPR 系統(tǒng)對(duì) DNA 的切割活性或靶向活性,可以實(shí)現(xiàn)多樣化突變文庫(kù)的建立。在 CRISPR 介導(dǎo)的修復(fù)途徑的誘變中,NHEJ 和HDR 途徑產(chǎn)生的突變文庫(kù)各有利弊,選擇哪種途徑要取決于宿主本身性質(zhì)和研究需求。因此對(duì)修復(fù)途徑進(jìn)行更深入的研究,規(guī)避不同修復(fù)途徑的劣勢(shì),對(duì)于 CRISPR 介導(dǎo)的定向進(jìn)化非常重要。而對(duì)于 Cas 蛋白將誘變功能蛋白引入靶向位點(diǎn)的策略,可以避免出現(xiàn)雙鏈斷裂對(duì)宿主造成不利影響,實(shí)現(xiàn)對(duì)特定窗口核苷酸進(jìn)行突變。另外,自 2017 年以來(lái),Cas13 系統(tǒng)也展示出巨大的應(yīng)用潛力,其 RNA 的靶向能力將給研究者在RNA 水平開(kāi)發(fā)定向進(jìn)化系統(tǒng)提供可能。與 DNA文庫(kù)相比,RNA 文庫(kù)多樣性更強(qiáng),但是如何將活性 RNA 突變體映射到 DNA 上并迭代遺傳是其開(kāi)發(fā)難點(diǎn)。
基于 CRISPR 的檢測(cè)技術(shù)已經(jīng)拓展到了多種小分子,這為開(kāi)發(fā)新型篩選與選擇系統(tǒng)提供了可能。如在選擇方法的展示技術(shù)中,已提出的CRISPR 展示系統(tǒng)可以構(gòu)建結(jié)合有蛋白質(zhì)、人工適體、隨機(jī)序列庫(kù)或長(zhǎng)非編碼 RNA 的 Cas9 蛋白復(fù)合物[114],在定向進(jìn)化的高通量選擇方法中具有廣闊的應(yīng)用前景。同時(shí),借助 Cas9 對(duì) DNA 的切割宿主致死性,可以進(jìn)一步開(kāi)發(fā)基于生存和生長(zhǎng)的選擇方法,而不是僅依靠藥物或抗生素選擇導(dǎo)致的淘汰,拓寬可研究表型。目前已有研究利用該性質(zhì)進(jìn)行微生物種群水平的選擇性調(diào)控[115],以及結(jié)合致死基因,設(shè)計(jì)基于 CRISPR的正負(fù)選擇策略用于 Cas9 蛋白的定向進(jìn)化[116]。由此可見(jiàn),CRISPR 技術(shù)在定向進(jìn)化中篩選與選擇策略上仍有很大的發(fā)展空間。
CRISPR 的多用途性,能更好地實(shí)現(xiàn)基因型-表型的聯(lián)系,實(shí)現(xiàn)將建立突變文庫(kù)和選擇與篩選的偶聯(lián),并幫助已有定向進(jìn)化技術(shù)進(jìn)行改良。Cas 蛋白作為模塊化程度極高的核酸靶向平臺(tái),可以通過(guò)串聯(lián)多種功能蛋白來(lái)滿足定向進(jìn)化的多種需求,實(shí)現(xiàn)更高的序列多樣性、有效活性域可及性。Cas 蛋白介導(dǎo)的有效活性域可及性將提高突變位點(diǎn)的精準(zhǔn)性,致突變功能蛋白(如易錯(cuò)DNA 聚合酶、脫氨酶等)將提高序列的多樣性。二者共同決定了待進(jìn)化分子的進(jìn)化潛力。利用恰當(dāng)?shù)膫鞲衅鲗?duì)變體活性進(jìn)行篩選,并開(kāi)發(fā)基于傳感器-靶向器-效應(yīng)器之間反饋基因回路的新型可迭代定向進(jìn)化技術(shù)(如當(dāng)篩選系統(tǒng)檢測(cè)到高活性變體在種群中占比較高時(shí),線路會(huì)產(chǎn)生反饋,進(jìn)而調(diào)節(jié)效應(yīng)器與靶向器的效率,使得高活性變體在迭代過(guò)程中具有更小突變壓力的同時(shí),靶向器可對(duì)更廣泛的位點(diǎn)進(jìn)行探索),將是未來(lái)的發(fā)展方向之一(圖 4(b))。
未來(lái),CRISPR 技術(shù)將加速定向進(jìn)化相關(guān)領(lǐng)域的發(fā)展,CRISPR 工具盒將為人們提供多元化工具以解決定向進(jìn)化中的問(wèn)題并使定向進(jìn)化技術(shù)設(shè)計(jì)進(jìn)入全新的階段。值得一提的是,也可以借助定向進(jìn)化手段對(duì) CRISPR 系統(tǒng)進(jìn)行優(yōu)化,而CRISPR 技術(shù)又能改善定向進(jìn)化策略,顯示出二者潛在的緊密聯(lián)系。