林繼聰,鄒根,劉宏民,魏勇軍
(1 鄭州大學(xué)藥學(xué)院,鄭州大學(xué)藥物研究院,鄭州大學(xué)合成生物學(xué)實(shí)驗(yàn)室,藥物關(guān)鍵制備技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,河南鄭州 450001; 2 上海市農(nóng)業(yè)科學(xué)院食用菌研究所,農(nóng)業(yè)農(nóng)村部南方食用菌資源利用重點(diǎn)實(shí)驗(yàn)室,國家食用菌工程技術(shù)研究中心,上海 201403)
絲狀真菌(filamentous fungi)能夠合成抗生素、色素、酶、激素等多種產(chǎn)品[1],在醫(yī)藥、化工、農(nóng)業(yè)和基礎(chǔ)生物學(xué)研究中廣泛應(yīng)用。黃曲霉(Aspergillus flavus)會分泌對人類或動物具有致病性的黃曲霉毒素[2];產(chǎn)黃青霉(Penicilliumchrysogenum)、頂頭孢霉(Acremonium chrysogenum)和土曲霉(Aspergillus terreus)能合成β?內(nèi)酰胺類抗生素[3?4](青霉素和頭孢菌素)或他汀類藥物[5](圖1)。黑曲霉(Aspergillus niger)是葡糖淀粉酶[6]和果膠酶[7]的主要生產(chǎn)宿主,里氏木霉(Trichoderma reesei)是纖維素酶的主要生產(chǎn)宿主[8];絲狀真菌生產(chǎn)的酶占據(jù)工業(yè)酶市場份額的50%[9]。部分絲狀真菌的次級代謝產(chǎn)物在特定環(huán)境條件下產(chǎn)生,但難以在實(shí)驗(yàn)室的生長條件下合成[10]。絲狀真菌中含有大量“沉默的”生物合成基因簇(biosynthetic gene clusters,BGC),這些合成基因簇具有合成活性天然產(chǎn)物的潛力[11]。
圖1 部分次級代謝產(chǎn)物生物合成基因簇及生物合成途徑[21?23]Fig. 1 Biosynthetic gene clusters and biosynthetic pathways of some secondary metabolites
功能基因組研究對真菌次級代謝產(chǎn)物的合成具有重大影響[12]?;蚪M研究需要對宿主基因組進(jìn)行缺失、插入和替換等遺傳操作,以探究基因的功能及其與其他基因的相互作用。與細(xì)菌和酵母相比,絲狀真菌的遺傳背景較為復(fù)雜[13];在進(jìn)行分子水平研究時(shí),可用的遺傳篩選標(biāo)記有限。此外,絲狀真菌的同源重組效率低,生長緩慢,遺傳操作困難,阻礙了對其的工程改造[14],限制了對其的進(jìn)一步開發(fā)應(yīng)用[15]。
基因組編輯技術(shù)為探究真菌生理特性、合成多種天然產(chǎn)物等提供了技術(shù)基礎(chǔ),也是獲取高性能工業(yè)生產(chǎn)菌株的關(guān)鍵。目前,基因組編輯技術(shù)主要有鋅指核酸酶技術(shù)(zinc?finger nucleases,ZFN)、類轉(zhuǎn)錄激活因子效應(yīng)物核酸酶(transcription activator?like effector nuclease proteins,TALEN)以及成簇的規(guī)律間隔短回文重復(fù)序列(clustered regularly interspaced short palindromic repeats,CRISPR)[16]等三種。其中,CRISPR 系統(tǒng)最簡便,在絲狀真菌遺傳育種及基因改造方面得到廣泛應(yīng)用[17?18]。本文對絲狀真菌次級代謝產(chǎn)物(secondary metabolites,SM)合成以及基因組編輯技術(shù)進(jìn)行了綜述,并闡述了絲狀真菌CRISPR 介導(dǎo)的基因組編輯技術(shù)的發(fā)展及其在次級代謝產(chǎn)物合成等方面的應(yīng)用趨勢。
絲狀真菌次級代謝產(chǎn)物是藥物的重要來源之一。青霉素類、頭孢菌素類藥物、灰黃霉素[19]等均屬于絲狀真菌次級代謝產(chǎn)物[20](圖1)。
彎頸霉屬(Tolypocladium)的環(huán)孢菌素被用來預(yù)防器官或組織移植產(chǎn)生的排斥反應(yīng)[24]。短密青霉(Penicillium brevicompactum)的霉酚酸可以抑制免疫排異反應(yīng),在醫(yī)藥領(lǐng)域具有重要的應(yīng)用價(jià)值[25]。高血脂會增加血液的黏稠度,且可能引發(fā)動脈粥樣硬化、高血壓、冠心病等嚴(yán)重疾病。土曲霉(Aspergillus terreus)和橘青霉(Penicillium citrinum)的他汀類活性天然產(chǎn)物是降血脂的首選[26]。洛伐他汀是一種重要的降脂藥,但與其相比,辛伐他汀的降血脂作用更強(qiáng),是效果更好的降血脂藥物。在工業(yè)上,先運(yùn)用土曲霉合成洛伐他汀,然后通過堿水解的方法獲得了中間產(chǎn)物莫納克林J,再通過化學(xué)方法合成辛伐他汀。呂雪峰團(tuán)隊(duì)[27]鑒定了一個(gè)新的水解酶PcEST,該酶可以高效轉(zhuǎn)化洛伐他汀為莫納克林J。同時(shí),研究人員利用土曲霉內(nèi)源性組成型強(qiáng)啟動子PgpdAt過表達(dá)特異性轉(zhuǎn)錄調(diào)控因子lovE,將莫納克林J的產(chǎn)量提高了52.5%[28]。
絲狀真菌次級代謝產(chǎn)物的合成過程復(fù)雜,相關(guān)基因通常成簇排列(圖1)。AntiSMASH等生物信息學(xué)軟件可以預(yù)測基因組中的BGC,但仍需通過敲除等基因操作研究證實(shí)相關(guān)BGC的功能[29]。天然宿主在實(shí)驗(yàn)室條件下生長緩慢且遺傳工具稀缺,部分天然產(chǎn)物BGC難以表達(dá);盡管可在模式宿主中異源表達(dá)天然產(chǎn)物BGC,但成功率較低[30]。通常,釀酒酵母(Saccharomyces cerevisiae)是異源合成天然產(chǎn)物BGC的真菌宿主[31]。釀酒酵母的高效重組方法和多種基因組編輯技術(shù)為復(fù)雜天然產(chǎn)物合成途徑的異源表達(dá)提供了基礎(chǔ)。青蒿酸[32]、人參皂苷Rh2[33]、文多靈和長春質(zhì)堿[34]等多種復(fù)雜植物天然產(chǎn)物已在酵母中成功合成,但長片段天然產(chǎn)物BGC的表達(dá)仍較為困難。開發(fā)真菌類基因組編輯系統(tǒng)是深入研究和表征天然產(chǎn)物BGC的重要途徑。
2013 年,新一代基因編輯技術(shù)CRISPR/Cas9誕生[35],開啟了基因組編輯的新時(shí)代。CRISPR/Cas9 系統(tǒng)作為細(xì)菌的一種特殊防御機(jī)制,主要用來抵御入侵的病毒和質(zhì)粒[36]。DiCarlo 等[37]在釀酒酵母中實(shí)現(xiàn)了基于CRISPR/Cas9 的基因編輯。2015 年,Liu 等[38]第一次將CRISPR/Cas9 技術(shù)應(yīng)用于里氏木霉,為CRISPR/Cas9 基因組編輯系統(tǒng)廣泛應(yīng)用于絲狀真菌的遺傳改造奠定了基礎(chǔ)。與ZFN 和TALEN 技術(shù)相比,CRISPR/Cas9 系統(tǒng)能夠誘導(dǎo)宿主細(xì)胞中DNA 的雙鏈斷裂(double strand break,DSB),提高了基因編輯整合的效率。
CRISPR/Cas9 基因組編輯系統(tǒng)由Cas9 核酸酶以及通過融合CRISPR RNA(crRNA)和trans?activating crRNA (tracrRNA) 形成的 sgRNA(single guide RNA)組成。與ZFN 和TALEN 相比,CRISPR 系統(tǒng)在基因組編輯方面更加快速、通用且精準(zhǔn)[39]。其中,sgRNA 負(fù)責(zé)識別原間隔區(qū)相鄰基序(PAM)位點(diǎn)上游的20 個(gè)核苷酸序列。當(dāng)sgRNA 識別出目標(biāo)DNA 序列后,Cas9 將在PAM和其上游20 bp之間的位點(diǎn)斷裂DNA雙鏈,進(jìn)而激活宿主DNA 非同源末端連接(non?homologous end joining,NHEJ) 或同源重組(homologous recombination,HR)修復(fù)過程(圖2)。
圖2 CRISPR/Cas基因組編輯系統(tǒng)作用機(jī)制Fig. 2 Mechanism of CRISPR/Cas genome editing systems
Cas9 蛋白切割目標(biāo)靶點(diǎn)產(chǎn)生的DSB,可以通過非同源末端連接(NHEJ)或同源重組(HR)修復(fù)。NHEJ 修復(fù)可能會隨機(jī)插入、刪除DNA 序列,精準(zhǔn)度不高;HR 修復(fù)通過同源序列進(jìn)行,精準(zhǔn)度高,是進(jìn)行精準(zhǔn)基因編輯的關(guān)鍵[40]。NHEJ在細(xì)胞周期的G1期隨機(jī)發(fā)生,在Ku 蛋白復(fù)合物(Ku70/80)的作用下,NHEJ 修復(fù)途徑可直接使DNA 末端雙鏈斷裂進(jìn)行連接。HR修復(fù)發(fā)生在DNA復(fù)制過程中,同源供體DNA 片段與其特定靶標(biāo)二者缺一不可[41],能進(jìn)行精確修復(fù)。
基于HR 的原理,Liu 等[38]在絲狀真菌里氏木霉中建立了CRISPR/Cas9 系統(tǒng),發(fā)現(xiàn)不同長度同源臂的同源重組效率均在93%以上,實(shí)現(xiàn)了有效的外源基因整合。Suzuki 等[42]設(shè)計(jì)了一種基于CRISPR/Cas9 的同源獨(dú)立靶向整合(HITI)策略,該方法利用NHEJ途徑,在分裂和非分裂細(xì)胞中實(shí)現(xiàn)靶向敲入,允許通過NHEJ修復(fù)將片段整合到基因組中。Clemmensen等[43]將環(huán)形供體、線性供體分別轉(zhuǎn)入擴(kuò)展青霉(Penicillium expansum)中,發(fā)現(xiàn)轉(zhuǎn)入環(huán)形供體的活轉(zhuǎn)化子數(shù)量高于線性供體。這可能是由于環(huán)形供體不存在DSB,不能通過NHEJ途徑整合到染色體上,從而有利于HR修復(fù)[44]。
Cas9 蛋白是CRISPR/Cas9 基因組編輯系統(tǒng)的重要組成部分,具有切割目標(biāo)靶點(diǎn)的作用[45]。CRISPR/Cas9系統(tǒng)是在細(xì)菌或古細(xì)菌中發(fā)現(xiàn)的,而真菌中不存在Cas9 蛋白[46]。因此,需根據(jù)真菌密碼子偏好性,重新設(shè)計(jì)優(yōu)化Cas9基因序列。此外,需在Cas9基因兩端添加SV40等核定位信號[47],以實(shí)現(xiàn)Cas9 蛋白的定向表達(dá),完成對真菌基因組的編輯。盡管SV40 廣泛應(yīng)用,但在尖孢鐮刀菌(Fusarium oxysporum)[48]和藤倉鐮刀菌(Fusarium fujikuroi)[49]等真菌中,需使用其特有的內(nèi)源核定位信號序列連接Cas9蛋白。
Cas9 蛋白的成功表達(dá)依賴于系統(tǒng)所用啟動子的類型和強(qiáng)度,選擇合適的啟動子對于建立高效的CRISPR/Cas9 系統(tǒng)至關(guān)重要[50]。在絲狀真菌中,主要使用構(gòu)巢曲霉(Aspergillus nidulans)的trpC[51]、gpdA[52]和tef1[53]組成型啟動子表達(dá)Cas9蛋白。有研究表明Cas9 的持續(xù)表達(dá)會產(chǎn)生細(xì)胞毒性[54?55],因此,里氏木霉的cbh1啟動子或構(gòu)巢曲霉的xlnA啟動子等誘導(dǎo)型啟動子常用于Cas9 的表達(dá)。在里氏木霉中,多使用cbh1啟動子表達(dá)Cas9基因,以減少基因編輯的脫靶效應(yīng)[38]。經(jīng)基因組學(xué)研究后,工業(yè)青霉素生產(chǎn)菌產(chǎn)黃青霉Wisconsin 54?1255被歸屬于魯本斯青霉(Penicillium rubens)[56]。在魯本斯青霉中,xlnA啟動子用于高表達(dá)Cas9 蛋白[57]。因此,合適的啟動子是優(yōu)化絲狀真菌CRISPR/Cas9系統(tǒng)的方案之一。
sgRNA 的高效表達(dá)是CRISPR/Cas9 系統(tǒng)發(fā)揮作用的關(guān)鍵。sgRNA 轉(zhuǎn)錄后才能在絲狀真菌中發(fā)揮作用。U6snRNA 基因序列高度保守[58],因此,RNA 聚合酶Ⅲ型U6啟動子是sgRNA 轉(zhuǎn)錄的常用啟動子之一。在嗜熱毀絲霉(Myceliophthora thermophila)中,Liu 等[59]使用U6啟動子,以cre-1等基因?yàn)榘悬c(diǎn),單基因編輯效率高達(dá)95%,多基因共編輯效率最高為70%。除U6啟動子外,tRNA 啟動子也可以用于sgRNA 的轉(zhuǎn)錄。通過魯本斯青霉全基因組測序以及序列注釋[60],鑒定出145個(gè)tRNA 編碼基因。格羅寧根大學(xué)的Pohl 等[57]基于序列分析選取了tRNA?Met 和tRNA?Leu 兩個(gè)啟動子,成功敲除了與色素合成有關(guān)的pks17基因。Song 等[61]報(bào)道了在黑曲霉中由內(nèi)源性tRNA 啟動子驅(qū)動的gRNA 轉(zhuǎn)錄,該啟動子包括一個(gè)tRNA 基因及其上游的100 bp 序列。進(jìn)一步研究表明,將表達(dá)Cas9 的質(zhì)粒與線性的gRNA 共轉(zhuǎn)化后,37 個(gè)tRNA 啟動子中有36 個(gè)能夠在黑曲霉中轉(zhuǎn)錄gRNA[61]。當(dāng)gRNA 和Cas9 在質(zhì)粒中表達(dá)時(shí),基因突變的效率高達(dá)97%[61]。Zheng 等[62]發(fā)現(xiàn)5S rRNA 在細(xì)胞中高度保守且豐富,他們以黑曲霉的5S rRNA 基因?yàn)閱幼域?qū)動sgRNA 的轉(zhuǎn)錄。黑曲霉的一個(gè)多肽合成酶編碼基因albA的敲除效率高達(dá)96%,遠(yuǎn)遠(yuǎn)高于PhU6啟動子15%~23%的敲除效率[62]。
除了上述兩種啟動子,釀酒酵母的SNR52啟動子也成功應(yīng)用于煙曲霉(Aspergillus fumigatus)等絲狀真菌的基因組編輯系統(tǒng)的構(gòu)建[63]。utp25是魯本斯青霉中U3小核RNA相關(guān)蛋白,也可以作為啟動子驅(qū)動sgRNA的轉(zhuǎn)錄[57]。
2.5.1 CRISPR/Cas元件的染色體表達(dá)
脫靶效應(yīng)是絲狀真菌基因編輯效率低下的原因之一,CRISPR/Cas 元件的瞬時(shí)表達(dá)可以降低脫靶現(xiàn)象。誘導(dǎo)型teton啟動子已被用于調(diào)控?zé)熐咕曛腥旧wCas9 的表達(dá)[64]。通過將體外轉(zhuǎn)錄的sgRNA 傳遞到表達(dá)Cas9 的真菌菌株中,可以實(shí)現(xiàn)CRISPR/Cas9的瞬時(shí)表達(dá),已被用于構(gòu)建藤倉鐮刀菌[65]等絲狀真菌的基因編輯系統(tǒng)(圖3)。Xiang等[66]開發(fā)了一種自殺載體,該載體將Cas9元件編碼在線性修復(fù)模板上,該模板包括一個(gè)與靶位點(diǎn)同源的標(biāo)記基因;Cas9 切割靶基因時(shí),標(biāo)記基因可以在目標(biāo)靶點(diǎn)重組,Cas9 則會降解,該方法已用于球毛殼菌(Chaetomium globosum)的基因組編輯。
圖3 在絲狀真菌中構(gòu)建的CRISPR/Cas系統(tǒng)Fig. 3 The CRISPR/Cas system constructed in filamentous fungi
2.5.2 自主復(fù)制質(zhì)粒
在絲狀真菌中,大多數(shù)環(huán)狀質(zhì)粒沒有在染色體外維持和復(fù)制的能力,構(gòu)巢曲霉的AMA1 序列(autonomous replicator derived fromAspergillus nidulans,曲霉自主復(fù)制因子)為質(zhì)粒在絲狀真菌染色體外進(jìn)行自主復(fù)制提供了可能[67]。由于高表達(dá)的Cas9 和多拷貝的sgRNA,AMA1 質(zhì)??梢燥@著提高轉(zhuǎn)化效率;在非選擇性條件下的傳代培養(yǎng)可以去除轉(zhuǎn)化子中帶有AMA1 的質(zhì)粒,實(shí)現(xiàn)篩選標(biāo)記的循環(huán)使用(圖3)[68]。利用AMA1 質(zhì)粒在魯本斯青霉[57]、擴(kuò)展青霉[43]和米曲霉(Aspergillus oryzae)[68]等絲狀真菌中實(shí)現(xiàn)了高效的基因組編輯。
AMA1 質(zhì)粒丟失的難易程度取決于真菌種類。Nielsen 等[69]的研究表明一些菌株可能需要多輪的非選擇性生長才會失去所有的AMA1 質(zhì)粒。使用標(biāo)記基因pyrG[70]或條件致死基因Aoace2[71]等的反向選擇策略可以快速去除轉(zhuǎn)化子中的AMA1質(zhì)粒。
2.5.3 核糖核蛋白復(fù)合物遞送
核糖核蛋白(ribonucleoprotein,RNP)復(fù)合物由Cas 蛋白和體外轉(zhuǎn)錄的gRNA 組成,可以遞送至絲狀真菌細(xì)胞內(nèi),實(shí)現(xiàn)基因組編輯(圖3)。RNP 轉(zhuǎn)化無需優(yōu)化CRISPR/Cas 表達(dá)盒,減少了評估啟動子轉(zhuǎn)錄效率等構(gòu)建步驟,且RNP 只是短暫存在于體內(nèi),降低了脫靶的風(fēng)險(xiǎn)[72]。然而,RNP 介導(dǎo)的編輯效率可能會受到sgRNA 不穩(wěn)定和Cas9 轉(zhuǎn)運(yùn)效率低的限制[57]。RNP 已經(jīng)在里氏木霉[73]、斜臥青霉(Penicillium decumbens)[74]、波蘭青霉(Penicillium polonicum)[75]、層出鐮刀菌(Fusarium proliferatum)[76]等多種真菌中應(yīng)用。
CRISPR/Cas 系統(tǒng)已用于多種絲狀真菌的基因編輯。通過敲除天然代謝途徑中的基因或在宿主細(xì)胞中表達(dá)異源基因,有助于解析天然產(chǎn)物生物合成途徑、增強(qiáng)目標(biāo)天然產(chǎn)物表達(dá)、削弱或消除毒性產(chǎn)物等,促進(jìn)絲狀真菌的開發(fā)與應(yīng)用。
基于CRISPR/Cas9 的基因敲除是進(jìn)行功能缺失研究和探究宿主次級代謝產(chǎn)物生物合成途徑的有效策略?;蚯贸螅梢愿淖兙瓯硇?,消除工業(yè)真菌中的真菌毒素BGC 或解析特定基因/結(jié)構(gòu)域的功能等。
魯本斯青霉是生產(chǎn)青霉素的主要工業(yè)菌種,經(jīng)典菌株改良(classical strain improvement,CSI)積累的突變有助于建立以該菌為底盤菌株的天然產(chǎn)物生產(chǎn)平臺[77]。CRISPR系統(tǒng)可顯著提高青霉菌的遺傳改造效率。在魯本斯青霉菌的基因編輯系統(tǒng)中,AMA1 質(zhì)粒會在無篩選壓力培養(yǎng)時(shí)丟失,可以實(shí)現(xiàn)無痕編輯。同時(shí),在測試不同長度的供體DNA(donor DNA,dDNA)同源臂后,顯示短同源臂(60 bp)即能實(shí)現(xiàn)基因功能缺失。通過破壞與色素合成相關(guān)的基因,實(shí)現(xiàn)了魯本斯青霉的表型變化,從而表明在魯本斯青霉中建立了基于CRISPR/Cas9的基因組編輯系統(tǒng)。
由紅曲霉(Monascus purpureus)生產(chǎn)的紅曲紅被用作食品著色劑,但其產(chǎn)生的腎毒性霉菌毒素(橘霉素)會降低紅曲紅的產(chǎn)量且具有毒副作用。Liang 等[78]認(rèn)為橘霉素生物合成存在冗余基因或同工酶。因此,為了避免工業(yè)真菌合成橘霉素,需要?jiǎng)h除整個(gè)BGC 而不是破壞單個(gè)基因。Liu等[79]設(shè)計(jì)了一種雙質(zhì)粒CRISPR/Cas 系統(tǒng),該系統(tǒng)使用環(huán)形供體質(zhì)粒代替線性DNA 供體片段。雙質(zhì)粒CRISPR/Cas9 系統(tǒng)實(shí)現(xiàn)了紅曲霉工業(yè)菌株中15 kb 的橘霉素BGC 的敲除,獲得了穩(wěn)定的同核突變體。傳代培養(yǎng)10輪,在每輪發(fā)酵過程中均未檢測到橘霉素。與原始菌株紅曲紅色素值(885.30 U/mL)相比,同核突變體紅曲紅色素值(926.00 U/mL)增加了4.6%。含AMA1 的質(zhì)??梢詿o痕敲除大片段基因簇,因此,可以繼續(xù)對M. purpureus工業(yè)菌株進(jìn)行迭代基因組編輯。
黑麥麥角菌(Claviceps purpurea)生產(chǎn)的麥角生物堿可用于治療偏頭痛、高血壓,也可以在產(chǎn)婦分娩后幫助子宮收縮,減少流血[80]。Yu 等[81]開發(fā)了基于體外組裝的RNP 的CRISPR/Cas9 系統(tǒng),對尿苷生物合成(ura5)、菌絲形態(tài)學(xué)(rac)和麥角生物堿(easA)產(chǎn)生密切相關(guān)的3 個(gè)靶基因進(jìn)行敲除,編輯效率達(dá)50%~100%?;隗w外組裝的RNP 可以有效地刪除麥角生物堿途徑中涉及的相關(guān)基因,有助于闡明麥角生物堿的生物合成途徑,促進(jìn)對麥角菌的代謝工程改造,提高麥角生物堿合成效率。
固醇14α?去甲基化酶(Cyp51)可以催化去除固醇前體中的14α?甲基基團(tuán)以轉(zhuǎn)化為麥角固醇[82]。麥角固醇參與多種真菌調(diào)控和發(fā)育過程,在真菌細(xì)胞膜的滲透性和流動性方面發(fā)揮重要作用[83]。唑類抗真菌藥通過抑制Cyp51酶削弱其前體的去甲基化、阻斷麥角固醇的合成,導(dǎo)致細(xì)胞內(nèi)甲基化固醇的積累,從而影響/破壞真菌膜的流動性,抑制細(xì)胞增殖[84]。臨床上,曲霉屬真菌會引起侵襲性曲霉?。╥nvasive aspergillosis,IA)[85]。Pérez?Cantero等[86]構(gòu)建了具有不同遺傳背景和不同唑類敏感性的cyp51A和cyp51B單敲除突變體。cyp51的單基因缺失導(dǎo)致伏立康唑最低抑菌濃度值低于其流行病學(xué)臨界值[86]。
赤霉酸(gibberellic acids,GA)是一類四環(huán)二萜類化合物,在植物生長調(diào)節(jié)中起著重要作用,但其生物合成基因并不成簇分布。在藤倉鐮刀菌中,GA 的生物合成主要分為牻牛兒基牻牛兒基焦磷酸(geranylgeranyl diphosphate,GGPP)、GA12?醛和一系列不同GA 類似物3 個(gè)部分。GA4 和GA7的混合物與傳統(tǒng)使用的GA3 相比,效果更加溫和。但在GA 天然代謝途徑中,GA4 和GA7 會通過細(xì)胞色素P450 單加氧酶基因P450-3進(jìn)一步轉(zhuǎn)化為GA1 與GA3。Shi 等[49]利用CRISPR/Cas9 系統(tǒng)重構(gòu)藤倉鐮刀菌中GAs 生物合成途徑。首先破壞了P450-3基因以阻斷GA3 的合成;在P450-3缺失菌株基礎(chǔ)上,分別對兩個(gè)關(guān)鍵基因Cps/Ks和截短的HMGR(tHMGR) 進(jìn)行過表達(dá)。與原始菌株(88.38 mg/L)相比,代謝途徑重構(gòu)的菌株中GA4/GA7 混合物的產(chǎn)量達(dá)716.37 mg/L,提高了約7 倍。很多次級代謝產(chǎn)物的基因并不成簇排列,CRISPR/Cas 系統(tǒng)可以對代謝途徑中的基因進(jìn)行敲除或過表達(dá),重構(gòu)代謝途徑和調(diào)控網(wǎng)絡(luò),從而獲得目的產(chǎn)物并提高其產(chǎn)量。
Zhang 等[87]使用CRISPR/Cas9 破壞了黑曲霉中的pyrG和kusA基因后,與對照菌株的產(chǎn)量[(16.98±1.91) g/L]相比,突變菌株的檸檬酸產(chǎn)量[(33.59±3.24) g/L]提高了2.17 倍,表明抑制尿苷/嘧啶的合成可促進(jìn)檸檬酸的生產(chǎn)。基于RNP 的CRISPR/Cas9系統(tǒng)已經(jīng)成功應(yīng)用于黑曲霉,通過該系統(tǒng)在工程菌株中破壞和過量表達(dá)多個(gè)琥珀酸合成相關(guān)基因,并優(yōu)化溫度、pH 等條件,顯著提高了琥珀酸的產(chǎn)量[88]。
基于CRISPR/Cas 的基因敲除菌株已用于解析次級代謝產(chǎn)物途徑中的單個(gè)合成關(guān)鍵酶,并闡明其中間產(chǎn)物的結(jié)構(gòu)與合成途徑。Brasiliamides 是由巴西青霉(Penicillium brasilianum)合成的一類含有哌嗪的生物堿,具有多種藥理活性[89]。Yuan 等[90]通過刪除組蛋白去乙?;讣せ頑rasiliamides 的合成。根據(jù)對突變體非核糖體多肽合成酶(nonribosomal peptide synthetase,NRPS)的研究,他們提出了一條新的Brasiliamides生物合成途徑,為后續(xù)Brasiliamides的大量生產(chǎn)提供了新思路。
卡泊芬凈是首個(gè)獲得FDA批準(zhǔn)的棘白菌素類抗真菌劑,對念珠菌屬和曲霉菌屬真菌有良好的臨床活性[91]。Glarea lozoyensis可以合成卡泊芬凈的重要前體紐莫康定B0(Pneumocandin B0)。在發(fā)酵過程中,由于脯氨酸羥化酶基因gloF的區(qū)域選擇性不高,G. lozoyensis會產(chǎn)生PC0等紐莫康定B0的類似物。棘白菌素B生物合成中的脯氨酸羥化酶Ap?Hty具有高區(qū)域選擇性[92]。Wei等[93]采用CRISPR/Cas9策略表達(dá)ap-htyE并成功取代gloF,突變菌株保留了合成紐莫康定B0 的能力,但消除了合成紐莫康定C0 的能力。通過替換關(guān)鍵酶,可以減少紐莫康定C0的分離步驟,具有工業(yè)應(yīng)用的潛力。
來自青霉屬和曲霉屬的部分真菌已經(jīng)成為真菌BGC 的異源表達(dá)宿主[94]。McLean 等[77]使用魯本斯青霉表達(dá)來自橘青霉的美伐他汀BGC(mlcA、mlcB、mlcC、mlcD、mlcE、mlcF、mlcG、mlcH、mlcR),同時(shí)表達(dá)一個(gè)細(xì)胞色素P450基因,將美伐他汀轉(zhuǎn)化為普伐他汀。在中試規(guī)模下,普伐他汀發(fā)酵產(chǎn)量超過6 g/L。他們使用的魯本斯青霉刪除了青霉素合成基因簇,該宿主經(jīng)過多輪菌株改良,釋放了發(fā)酵條件下合成次級代謝產(chǎn)物的潛力。這項(xiàng)工作降低了異源宿主合成天然產(chǎn)物的優(yōu)化成本,為表達(dá)其他天然產(chǎn)物合成基因簇提供了基礎(chǔ)。
3(2H)?呋喃酮是一些活性天然產(chǎn)物的重要組成部分[95]。Setosusin 是一種真菌類二萜,具有獨(dú)特的螺?稠合3(2H)?呋喃酮結(jié)構(gòu)。Wei 等[96]在真菌杜氏曲霉(Aspergillus duricaulis)中鑒定了與Setosusin 相關(guān)的BGC,通過在米曲霉中異源重組相關(guān)酶基因,闡明了其生物合成途徑。Katayama等[68,97]在半AMA1 載體上提供了可誘導(dǎo)的反選擇標(biāo)記Aoace2,實(shí)現(xiàn)了米曲霉的無標(biāo)記整合。
內(nèi)消旋半乳糖二酸是一種六元酸,可以作為護(hù)膚品成分使用,也可以用于生產(chǎn)聚合物,它可通過果膠的主要成分D?半乳糖醛酸氧化生成。黑曲霉生產(chǎn)的果膠酶效率高,適合于轉(zhuǎn)化富含果膠的生物質(zhì)。Kuivanen 等[98]使用CRISPR/Cas9 與體外合成sgRNA 刪除了內(nèi)消旋半乳糖二酸相關(guān)的基因,中斷內(nèi)消旋半乳糖二酸代謝,構(gòu)建了D?半乳糖醛酸分解代謝與異源糖醛酸脫氫酶表達(dá)相結(jié)合的工程化黑曲霉菌株,最終可以通過D?半乳糖醛酸合成內(nèi)消旋半乳糖二酸。Dong 等[99]利用CRISPR/Cas9 介導(dǎo)的多拷貝敲入表達(dá)策略,在黑曲霉中高效表達(dá)了來自嗜熱毀絲霉的高活性海藻糖酶(MthT),最終,工程黑曲霉催化海藻糖水解,酶滴度可達(dá)1698.83 U/mL。
除青霉屬和曲霉屬之外,多種其他真菌也被開發(fā)為異源天然產(chǎn)物生產(chǎn)平臺。麥角酸(LA)和二氫麥角酸(DHLA)是許多藥物的先導(dǎo)化合物,可用于治療癡呆、偏頭痛、高催乳素血癥和其他疾?。?00?101]。但它們通常是麥角生物堿和二氫麥角生物堿合成途徑中的中間代謝產(chǎn)物,難以獲取。褐色綠僵菌(Metarhizium brunneum)可以天然合成多種LA 酰胺,最終合成麥角酸α?羥乙胺(LAH)以及少量的麥角新堿[102]。Davis 等[103]通過RNP 策略在褐色綠僵菌中沉默麥角生物堿途徑,并異源表達(dá)外源基因,合成了麥角酸和二氫麥角酸,且麥角酸(86.9%)和二氫麥角酸(72.8%)的相對產(chǎn)量遠(yuǎn)高于已有的工程煙曲霉菌株(分別為2.6%和2.0%)。
表1 總結(jié)了絲狀真菌中CRISPR/Cas 基因組編輯系統(tǒng)的應(yīng)用情況。
表1 絲狀真菌中CRISPR/Cas基因組編輯系統(tǒng)的應(yīng)用Table 1 Application of CRISPR/Cas genome editing system in filamentous fungi
CRISPRa 通過核酸內(nèi)切酶失活的Cas9(nuclease?dead mutants of Cas9,dCas9)連接轉(zhuǎn)錄激活子,實(shí)現(xiàn)基因組特定位點(diǎn)的轉(zhuǎn)錄[110]。CRISPRi 通過dCas9 與轉(zhuǎn)錄抑制子連接,在gRNA引導(dǎo)下,結(jié)合到靶基因位點(diǎn),抑制轉(zhuǎn)錄起始,沉默靶基因的表達(dá)[111]。Roux 等[112]在構(gòu)巢曲霉中構(gòu)建了首個(gè)CRISPRa 系統(tǒng),通過激活micA基因,提高了微呋喃酮的產(chǎn)量,并通過多基因CRISPRa 鑒定出新代謝產(chǎn)物脫氫微呋喃酮。絲狀真菌有能力合成多種高價(jià)值次級代謝產(chǎn)物,但大多數(shù)BGC 是沉默的。CRISPRa 與次級代謝產(chǎn)物BGC 的表達(dá)激活有助于獲取活性天然產(chǎn)物。Li 等[113]使用CRISPRi 對黑曲霉中的表觀遺傳效應(yīng)進(jìn)行了研究。通過dCas9 作用于內(nèi)源性組蛋白乙?;窯cnE 和組蛋白去乙?;窰osA 和RpdA,抑制了BGC 的轉(zhuǎn)錄,但未發(fā)現(xiàn)表型的變化和新代謝產(chǎn)物的產(chǎn)生。
與ZFN和TALEN相比,CRISPR/Cas系統(tǒng)可以用于高通量正向遺傳篩選[114]。sgRNA 是CRISPR/Cas系統(tǒng)的關(guān)鍵元件,傳統(tǒng)的構(gòu)建sgRNA文庫方法是基于已知的全基因組序列設(shè)計(jì)并合成上萬個(gè)sgRNA,但昂貴的成本以及未知的真菌全基因組阻礙了基于CRISPR/Cas9的全基因組篩選應(yīng)用。Li等[115]開發(fā)了酶切/結(jié)合農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化方法(restriction/ligation coupled with Agrobacterium?mediated transformation,RELATe),在人類真菌病原體新型隱球菌(Cryptococcus neoformans)中創(chuàng)建的sgRNA 文庫可以靶向基因組中超過98%的蛋白質(zhì)編碼基因。新型隱球菌可以穿透血腦屏障,在免疫功能低下的人群中會引發(fā)中樞神經(jīng)系統(tǒng)(central nervous system,CNS)感染。通過高通量功能篩選確定了142 個(gè)與發(fā)病機(jī)制相關(guān)的潛在基因。研究人員選擇SFP1和WDR1兩個(gè)基因進(jìn)行了敲除,結(jié)果表明SFP1和WDR1是新型隱球菌滲透血腦屏障的必需基因。新開發(fā)的RELATe方法降低了高通量篩選的成本,與CRISPR/Cas 系統(tǒng)結(jié)合可以用于闡明真菌功能基因。
有效的高通量篩選策略可以從突變體庫中分離所需的突變體,進(jìn)而使用CRISPR/Cas 系統(tǒng)對其進(jìn)行遺傳改造。Luu 等[116]在里氏木霉中開發(fā)了一種基于液滴微流控技術(shù)的綠色熒光蛋白表達(dá)的新方法。他們將轉(zhuǎn)化綠色熒光蛋白的里氏木霉原生質(zhì)體封裝并在液滴中孵育24 小時(shí),通過高通量篩選液滴,最終收集到一個(gè)轉(zhuǎn)化文庫,標(biāo)記基因轉(zhuǎn)化率達(dá)96%以上。與傳統(tǒng)轉(zhuǎn)化相比,該方法使原生質(zhì)體再生時(shí)間大大縮短,再生頻率提高了8 倍,篩選速度可達(dá)每分鐘8000 液滴。該方法提高了篩選效率,有望應(yīng)用于其他絲狀真菌轉(zhuǎn)化子的篩選,加快遺傳轉(zhuǎn)化速度。
3.5.1 脫靶效應(yīng)
在基因編輯過程中,sgRNA 引導(dǎo)Cas9 至與靶位點(diǎn)相似核苷酸序列結(jié)合,會造成潛在的脫靶效應(yīng)。為了減少脫靶的出現(xiàn),需要設(shè)計(jì)序列特異性較高的sgRNA。近年來,已經(jīng)有多個(gè)用于預(yù)測脫靶位點(diǎn)并為sgRNA 進(jìn)行評估的網(wǎng)站,如E?CRISP[117]、CHOPCHOP[118]、Cas?OFFinder[119]等。此外,研究人員開發(fā)了多種方法提高Cas9 切割的特異性,如構(gòu)建Cas9?sgRNA 核糖核蛋白復(fù)合物進(jìn)入細(xì)胞[120]、使用Cas12a 替換Cas9[121]等。設(shè)計(jì)適宜的sgRNA 是限制脫靶效應(yīng)的關(guān)鍵因素。sgRNA 鄰近原型間隔區(qū)相鄰基序(PAM)的10~12 bp 決定了Cas9 切割特異性[122]。如果基因組含有與靶點(diǎn)sgRNA 相似性過高的序列,會導(dǎo)致Cas9 在非靶向基因位點(diǎn)的非預(yù)期DNA切割[123]。因此,設(shè)計(jì)獨(dú)特適宜的sgRNA,能夠降低Cas9脫靶切割的可能性。新發(fā)現(xiàn)的Cas12b[124]、Cas13[125]、Cas14[126]等核酸酶的應(yīng)用有望在解決脫靶效應(yīng)等問題中發(fā)揮作用。
3.5.2 轉(zhuǎn)化效率低
絲狀真菌較厚的細(xì)胞壁是外源基因片段進(jìn)入細(xì)胞的主要障礙。破除細(xì)胞壁后的原生質(zhì)體可以有效吸收外源DNA,但是原生質(zhì)體的低再生率降低了絲狀真菌的轉(zhuǎn)化效率。Han 等[127]引入并優(yōu)化了一種微流體細(xì)胞膜變形方法,這個(gè)方法使用快速的細(xì)胞機(jī)械變形來產(chǎn)生瞬時(shí)膜孔,不但能將sgRNA 和Cas9 傳遞至難以轉(zhuǎn)染的淋巴瘤細(xì)胞和胚胎干細(xì)胞中,還能保持較高的細(xì)胞活力。絲狀真菌是多核微生物,在菌絲和孢子中含有數(shù)量不定的細(xì)胞核[128]。即使其中一個(gè)細(xì)胞核的基因被破壞,其余細(xì)胞核的基因仍能保持完好,這也是轉(zhuǎn)化菌株假陽性高的原因之一。中國科學(xué)院分子植物科學(xué)卓越創(chuàng)新中心周志華課題組[73]在多核孢子真菌米曲霉中開發(fā)了基于RNP的CRISPR系統(tǒng),通過加入化學(xué)試劑肌醇或苯菌靈,增加了單核原生質(zhì)體的形成,無需進(jìn)行后期的孢子分離步驟,提高了單核菌株的形成率,最高轉(zhuǎn)化效率達(dá)86.67%。通過加入Triton X?100、吐溫?80等表面活性劑,可以促進(jìn)RNP復(fù)合物進(jìn)入細(xì)胞,提高轉(zhuǎn)化效率。周志華團(tuán)隊(duì)[73]在里氏木霉原生質(zhì)體轉(zhuǎn)化中加入Triton X?100,菌落形成單位(colony forming units,CFU)較之前增加3.33倍。
使用Cas9 進(jìn)行基因編輯會受到其5'?NGG?3'PAM 序列的限制[129],位點(diǎn)特異性不高。因此,引入依賴于其他PAM 序列的RNA 引導(dǎo)的核酸酶能夠更精確靶向基因組位點(diǎn)。毛螺菌科細(xì)菌的Cas12a(也被稱為Cpf1)采用由5'?TTTN?3'組成的PAM 序列(圖2)[129]。Abdulrachman 等[121]在棘孢曲霉(Aspergillus aculeatus)TBRC 277 中開發(fā)了基于AMA1的CRISPR/Cas12a表達(dá)載體,并建立了三種不同的靶向pyrG基因的引導(dǎo)crRNA,證明了Cas12a 能夠誘導(dǎo)位點(diǎn)特異性雙鏈斷裂。Huang等[109]在真菌病原體稻瘟病菌(Magnaporthe oryzae)中建立了基于Cas12a核糖核蛋白的基因組編輯系統(tǒng)。BUF1編碼真菌黑色素生物合成所需的三羥基萘還原酶,研究人員設(shè)計(jì)了兩種靶向BUF1位點(diǎn)的gRNA,并與Cas12a 蛋白復(fù)合為RNP 轉(zhuǎn)化原生質(zhì)體,BUF1位點(diǎn)的編輯率達(dá)到77%。Cas12a提高了基因編輯精度,將在絲狀真菌沉默基因簇挖掘和次級代謝產(chǎn)物研究中發(fā)揮作用。
破壞NHEJ 修復(fù)是提高基因組精準(zhǔn)編輯效率的有效策略。美國堪薩斯州立大學(xué)Huang 等[109]在稻瘟病菌中發(fā)現(xiàn)CRISPR/Cas誘導(dǎo)的DNA雙鏈斷裂存在多種修復(fù)途徑。在絲狀真菌中,DNA 雙鏈斷裂修復(fù)主要由NHEJ 和HR 兩種途徑,但仍存在微同源介導(dǎo)的末端連接(microhomology?mediated end?joining,MMEJ)[130]和單鏈退火(single strand annealing,SSA)[131]兩條修復(fù)途徑。研究人員通過PCR、Sanger測序和納米孔長讀值測序技術(shù)的組合,發(fā)現(xiàn)在進(jìn)行CRISPR/Cas12a 介導(dǎo)的基因編輯后,Ku80 缺失菌株中發(fā)生了較野生菌株中更大片段的DNA缺失,這是MMEJ介導(dǎo)的DNA突變的特征。MMEJ 等修復(fù)途徑可能會產(chǎn)生不可預(yù)測的基因組變異,從而引發(fā)CRISPR/Cas 系統(tǒng)的安全性問題。
堿基編輯(base editing,BE)分為胞嘧啶堿基編輯器(cytosine base editor,CBE)和腺嘌呤堿基編輯器(adenine base editor,ABE)(圖2)。CRISPR 介導(dǎo)的堿基編輯可以在靶基因組位點(diǎn)上轉(zhuǎn)換堿基,具有無需雙鏈斷裂、無需供體DNA 以及同源定向修復(fù)等優(yōu)點(diǎn)。第三代堿基編輯器(third?generation base editor,BE3)是最常用的堿基編輯器系統(tǒng),由dCas9 或Cas9?D10A 切口酶(D10A nickase,nCas9)與大鼠胞苷脫氨酶(rat cytidine deaminase,rAPOBEC1)和尿嘧啶糖基化酶抑制劑(uracil glycosylase inhibitor,UGI)組成,可以實(shí)現(xiàn)胞嘧啶(C)轉(zhuǎn)化為胸腺嘧啶(T)或腺嘌呤(A)轉(zhuǎn)化為鳥嘌呤(G)[132]。華南理工大學(xué)Huang等[133]在黑曲霉中應(yīng)用了胞嘧啶堿基編輯器,通過單堿基編輯誘導(dǎo)無義突變,滅活了尿苷相關(guān)基因pyrG和色素相關(guān)基因fwnA,效率為47.36%~100%;對于非表型基因prtT的單堿基編輯效率達(dá)60%。該系統(tǒng)為研究黑曲霉以及其他絲狀真菌提供了便捷的工具。天津工業(yè)生物技術(shù)研究所田朝光團(tuán)隊(duì)[134]在嗜熱毀絲霉中構(gòu)建了進(jìn)化型載脂蛋白B mRNA 編輯酶催化亞基1(APOBEC1)胞嘧啶堿基編輯器4max(Mtevo?BE4max)、噬菌體Mu Gam 蛋白胞嘧啶堿基編輯器4max(MtGAM?BE4max)、進(jìn)化型CDA1脫氨酶胞嘧啶堿基編輯器(Mtevo?CDA1)等三個(gè)新的胞嘧啶堿基編輯器,并成功編輯了amdS、cre-1和Mtclr-2三個(gè)靶基因。研究人員深入研究了Mtclr-2的功能,發(fā)現(xiàn)其與分生孢子的產(chǎn)生、菌絲生長和菌落形態(tài)的維持存在密切關(guān)系。Mtevo?CDA1 的堿基編輯效率可達(dá)92.6%。由于堿基編輯不需要雙鏈斷裂和供體片段,可以彌補(bǔ)CRISPR/Cas9 的不足。但在水稻中應(yīng)用BE3 后,顯示其誘導(dǎo)了大量的全基因組脫靶突變[135]。未來,仍需對堿基編輯系統(tǒng)組成元件和可靠性進(jìn)行優(yōu)化和驗(yàn)證[136?137]。
自CRISPR/Cas 基因組編輯系統(tǒng)應(yīng)用于絲狀真菌以來,研究人員對Cas9 核酸酶、sgRNA 的表達(dá)以及CRISPR/Cas 系統(tǒng)的遞送方式不斷優(yōu)化,在模式或非模式絲狀真菌中建立了多個(gè)CRISPR/Cas 系統(tǒng)。CRISPR/Cas9系統(tǒng)是目前應(yīng)用最廣泛的基因組編輯系統(tǒng),但也存在Cas9核酸酶毒性、脫靶效應(yīng)、轉(zhuǎn)化率低等問題。Cas12a、Cas12b、Cas13、Cas14等核酸酶的應(yīng)用有望解決這些問題。
本文聚焦于絲狀真菌天然產(chǎn)物在醫(yī)藥領(lǐng)域的開發(fā)與應(yīng)用。紐莫康定B0 和他汀類藥物等活性天然產(chǎn)物在野生菌株中存在生物合成途徑基因表達(dá)強(qiáng)度不高、副產(chǎn)物代謝途徑影響等問題。通過CRISPR/Cas 進(jìn)行基因缺失或異源表達(dá),可以探索代謝產(chǎn)物的BGC、改造次級代謝產(chǎn)物生物合成基因、促進(jìn)絲狀真菌細(xì)胞工廠的構(gòu)建。CRISPR/Cas技術(shù)可以進(jìn)行多基因共編輯,調(diào)控副產(chǎn)物合成途徑中的多種酶基因,增強(qiáng)目標(biāo)產(chǎn)物的積累并減少毒性物質(zhì)的產(chǎn)生。CRISPR/Cas 技術(shù)還可以通過選擇功能元件、重構(gòu)底盤細(xì)胞、優(yōu)化代謝途徑等一系列策略實(shí)現(xiàn)絲狀真菌次級代謝產(chǎn)物的高產(chǎn),從而加速絲狀真菌功能基因組學(xué)和次級代謝產(chǎn)物的研究和工業(yè)應(yīng)用。