亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于比較基因組學(xué)的解脂亞羅酵母CA20高產(chǎn)赤蘚糖醇機(jī)理及進(jìn)化分析

        2023-10-30 07:16:26夏凱劉芳美陳雨晴陳珊珊黃春瑩趙學(xué)群沙如意黃俊
        遺傳 2023年10期

        夏凱,劉芳美,陳雨晴,陳珊珊,黃春瑩,趙學(xué)群,沙如意,黃俊

        研究報(bào)告

        基于比較基因組學(xué)的解脂亞羅酵母CA20高產(chǎn)赤蘚糖醇機(jī)理及進(jìn)化分析

        夏凱,劉芳美,陳雨晴,陳珊珊,黃春瑩,趙學(xué)群,沙如意,黃俊

        浙江科技學(xué)院生物與化學(xué)工程學(xué)院,浙江省農(nóng)產(chǎn)品化學(xué)與生物加工技術(shù)重點(diǎn)實(shí)驗(yàn)室,浙江省農(nóng)業(yè)生物資源生化制造協(xié)同創(chuàng)新中心,杭州 310023

        解脂亞羅酵母()是赤蘚糖醇生產(chǎn)中使用的主要菌種,復(fù)合誘變是選育優(yōu)良菌株的常用方法。然而,誘變處理所引起的基因組變化尚待探索。本研究對(duì)前期獲得的高產(chǎn)菌株CA20和原始菌株WT5進(jìn)行基因組測(cè)序,并與已發(fā)布的8株解脂亞羅酵母進(jìn)行比較基因組分析,旨在探究菌株CA20高產(chǎn)赤蘚糖醇的機(jī)理以及不同菌株的基因組進(jìn)化關(guān)系。結(jié)果顯示,菌株CA20基因組大小為20,420,510 bp,GC堿基含量為48.97%,編碼6330個(gè)CDS和649個(gè)ncRNA,菌株CA20和其他8株菌高度同源,平均核苷酸同源性(average nucleotide identity,ANI)> 99.50%,其中與菌株IBT 446和H222具有更近的親緣關(guān)系。比較基因組分析顯示,CA20和其他8株菌共有5342個(gè)核心基因,而CA20特有的65個(gè)基因主要參與物質(zhì)跨膜運(yùn)輸和蛋白質(zhì)轉(zhuǎn)運(yùn)過程。CA20基因組中含有166個(gè)碳水化合物活性酶(carbohydrate-active enzymes,CAZymes)基因,遠(yuǎn)多于其他菌株(108~137個(gè)),包括特有的4個(gè)糖苷水解酶類(glycoside hydrolases,GHs)、2個(gè)糖基轉(zhuǎn)移酶類(glycosyltransferases,GTs)和13個(gè)碳水化合物酯酶類(carbohydrate esterases,CEs)。除轉(zhuǎn)醛酶TAL1外,赤蘚糖醇代謝途徑有關(guān)酶在不同菌株中高度保守。此外,菌株CA20的赤蘚糖醇產(chǎn)量和產(chǎn)率為190.97 g/L和1.33 g/L/h,顯著高于WT5的128.61 g/L和0.92 g/L/h (<0.001)。相比于WT5,CA20中5個(gè)基因發(fā)生移碼變異,15個(gè)基因存在非同義突變位點(diǎn),這些基因主要參與細(xì)胞分裂、細(xì)胞壁合成、蛋白質(zhì)合成及穩(wěn)態(tài)維持等過程。以上結(jié)果表明,解脂亞羅酵母基因組在進(jìn)化過程中保守;生存環(huán)境不同是導(dǎo)致菌株間基因組差異的重要因素;基因組中CAZymes數(shù)量的差異是不同菌株間性能差異的原因之一;菌株CA20高產(chǎn)赤蘚糖醇與其細(xì)胞結(jié)構(gòu)及內(nèi)環(huán)境穩(wěn)定性的提升有關(guān)。本研究結(jié)果為赤蘚糖醇高產(chǎn)菌株的定向選育提供基礎(chǔ)。

        解脂亞羅酵母;赤蘚糖醇;比較基因組;移碼變異;蛋白激酶

        糖過量攝入造成的肥胖、糖尿病等健康問題給人們的生活造成了困擾[1,2]。甜味劑的合理使用有助于降低食品中高熱量糖的添加,從而達(dá)到減少糖攝入的目的。赤蘚糖醇(erythritol),化學(xué)名為(2R, 3S)-butane-1, 2, 3, 4-丁四醇,是一種白色、不吸濕、無光學(xué)活性、熱穩(wěn)定性好以及易溶于水的四碳醇,廣泛存在于水果、蔬菜和發(fā)酵食品中[3,4]。近年來,天然甜味劑赤蘚糖醇憑借獨(dú)特的理化性質(zhì)如熱值低、基本不被人體代謝、穩(wěn)定性高和食用不會(huì)引起腸道不適等受到廣泛關(guān)注,市場(chǎng)需求量持續(xù)增加。據(jù)預(yù)測(cè),到2025年,其市場(chǎng)需求將達(dá)到48.9萬噸左右,這對(duì)赤蘚糖醇的生產(chǎn)提出了新要求[5,6]。

        赤蘚糖醇主要通過微生物發(fā)酵進(jìn)行生產(chǎn),所用菌種為解脂亞羅酵母()[7]。解脂亞羅酵母可以利用葡萄糖、甘油等為底物,通過磷酸戊糖途徑代謝合成赤蘚糖醇,整個(gè)過程由葡萄糖-6-磷酸脫氫酶(glucose-6-phosphate dehydrogenase,ZWF1)、6-磷酸葡萄糖酸內(nèi)酯酶(6-phosphogluconolactonase,PGLS)、磷酸葡萄糖酸脫氫酶(phosphogluconate dehydrogenase,GND1)、核酮糖磷酸 3-差向異構(gòu)酶(ribulose phosphate 3-epimerase,RPE1)、核酮糖-5-磷酸異構(gòu)酶 (ribulose-5-phosphate isomerase,RPI)、轉(zhuǎn)酮酶(transketolase,TKL1)、轉(zhuǎn)醛酶(transaldolase,TAL1)、赤蘚糖-4-磷酸激酶(erythrose-4-phosphate kinase,E4PK)和赤蘚糖還原酶(erythrose reductase,ER)共同催化完成[2,8,9]。目前,赤蘚糖醇生產(chǎn)過程中存在成本較高、冷卻能耗大以及生產(chǎn)效率低等問題[1,10]。因此,如何有效降低赤蘚糖醇生產(chǎn)成本一直備受關(guān)注。

        提高單位時(shí)間內(nèi)細(xì)胞的赤蘚糖醇產(chǎn)量是降低生產(chǎn)成本的有效舉措,目前采用較多的方法是菌種誘變選育、發(fā)酵工藝優(yōu)化和代謝途徑改造[4,11,12]。其中,誘變選育是重要的基礎(chǔ)性工作。通過紫外線(ultraviolet,UV)輻射、硫酸二乙酯(diethyl sulphate,DES)處理、以及常壓室溫等離子體(atmospheric and room temperature plasma,ARTP)誘變等方法,研究人員已獲得產(chǎn)量顯著增加的優(yōu)勢(shì)突變株[13~15]。然而,已報(bào)道的不同菌種間性能差異顯著,同時(shí)對(duì)于誘變所引起性狀變化的潛在機(jī)制尚未清楚。誘變處理可以引起菌種DNA發(fā)生突變和重組,進(jìn)而產(chǎn)生新的性狀[16]。然而,誘變所引起的性狀變化具有隨機(jī)性。因此,探究誘變處理所引起的基因組序列變化有助于闡明菌種高產(chǎn)赤蘚糖醇背后的機(jī)制,挖掘適用于高產(chǎn)菌株定向構(gòu)建的新靶點(diǎn)。

        課題組前期利用60Co-γ射線輻射結(jié)合ARTP復(fù)合誘變處理,已獲得一株高產(chǎn)赤蘚糖醇且遺傳性能穩(wěn)定的解脂亞羅酵母CA20,具有較大的工業(yè)應(yīng)用潛力[17]。為進(jìn)一步揭示CA20高產(chǎn)赤蘚糖醇的分子機(jī)制,深入了解并挖掘其基因資源,本研究對(duì)CA20進(jìn)行全基因組測(cè)序,同時(shí)對(duì)原始菌株WT5進(jìn)行重測(cè)序分析,比較分析高產(chǎn)菌和原始菌株之間的基因組序列差異。此外,通過比較基因組學(xué)分析,比較菌株CA20和已公布的解脂亞羅酵母菌株的基因組異同,分析不同菌株的進(jìn)化關(guān)系。同時(shí),分析碳水化合物活性酶(carbohydrate-active enzymes,CAZymes)家族的多樣性,明確赤蘚糖醇代謝途徑中關(guān)鍵酶的保守性,以期為進(jìn)一步利用基因工程技術(shù)定向構(gòu)建優(yōu)良菌株提供理論基礎(chǔ)。

        1 材料與方法

        1.1 菌株和培養(yǎng)條件

        解脂亞羅酵母CA20保藏于中國(guó)典型培養(yǎng)物保藏中心(CCTCC: M2022880)。研究中所用原始菌株WT5由浙江科技學(xué)院生物與化學(xué)工程學(xué)院生物工程實(shí)驗(yàn)室保存。菌種活化采用YPD (yeast extract peptone dextrose medium)培養(yǎng)基:D-葡萄糖20 g/L、酵母浸出粉(Oxoid) 10 g/L、蛋白胨(Oxoid) 5 g/L、NaCl 5 g/L、KH2PO40.5 g/L,pH值6.0。發(fā)酵培養(yǎng)基中葡萄糖濃度更換為300 g/L,其他成分濃度保持不變。

        赤蘚糖醇發(fā)酵實(shí)驗(yàn)[17]:挑取單菌落過夜活化培養(yǎng),之后以5% (v/v)比例轉(zhuǎn)接于30 mL YPD培養(yǎng)基(250 mL 搖瓶)中于30 °C、200 r/min 條件下培養(yǎng)24 h制備一級(jí)種子液;而后以5%比例轉(zhuǎn)接于80 mL (500 mL 搖瓶)YPD培養(yǎng)基中培養(yǎng)制備二級(jí)種子液,之后以10%比例轉(zhuǎn)接于6.0 L發(fā)酵培養(yǎng)基(發(fā)酵罐體積10 L);控制通氣量在0.6 vvm,轉(zhuǎn)速600 r/min,罐壓0.1 MPa,發(fā)酵周期為6天,消泡劑自動(dòng)添加,發(fā)酵過程中不進(jìn)行補(bǔ)料和pH調(diào)節(jié)。發(fā)酵過程中每隔24 h取樣測(cè)定赤蘚糖醇濃度、葡萄糖濃度和菌液OD600。

        1.2 赤蘚糖醇及葡萄糖檢測(cè)

        產(chǎn)物和底物濃度測(cè)定采用高效液相色譜(high performance liquid chromatography,HPLC),具體過程參照文獻(xiàn)所述[17]。取樣后離心收集上清(8000 r/min,5 min),過0.22 μm濾膜,保存于–20 ℃?zhèn)溆谩悠窓z測(cè)采用e2695高效液相色譜儀(美國(guó)Waters公司)、Aminex HPX-87H分析柱(300 mm× 7.8 mm) (美國(guó)Bio-Rad公司)、2414示差折光檢測(cè)器(美國(guó)Waters公司)。檢測(cè)條件為柱溫35 °C,上樣量10 μL,流動(dòng)相為5 mmol/L硫酸,流速0.6 mL/min。

        1.3 基因組提取與測(cè)序

        菌株CA20和WT5基因組DNA的提取參照真菌基因組DNA提取試劑盒(OMEGA)說明進(jìn)行。采用TBS-380 fluorometer(美國(guó)Turner BioSystems公司)對(duì)提取的DNA進(jìn)行定量。高質(zhì)量DNA樣品(OD260/280= 1.8~2.0,> 6 μg)用于后續(xù)文庫構(gòu)建和測(cè)序。

        文庫構(gòu)建和測(cè)序工作由上海凌恩生物科技有限公司完成。采用Illumina NovaSeq PE150二代測(cè)序(美國(guó)Illumina公司)結(jié)合PacBio Sequel II三代測(cè)序平臺(tái)(美國(guó)Pacific Biosciences公司)完成CA20的全基因組測(cè)序以及WT5的重測(cè)序分析。

        1.4 基因組組裝與基因分析

        使用軟件Trimmomatic (v0.39,http://www. usadellab.org/cms/index.php?page=trimmomatic)去除測(cè)序過程中產(chǎn)生的質(zhì)量較低的序列。利用軟件MaSuRCA (v4.0.8,http://www.genome.umd.edu/ masurca.html)對(duì)二代Illumina reads和三代PacBio long-reads進(jìn)行混合組裝。使用軟件Canu (v2.1.1,https://github.com/marbl/canu)組裝三代PacBio long- reads,同時(shí)使用軟件MUMmer (v4.0,http:// mummer.sourceforge.net/)整合MaSuRCA和Canu的組裝結(jié)果,并去冗余。最后使用軟件Racon (https:// github.com/isovic/racon)和Pilon (https://github.com/ broadinstitute/pilon/wiki)對(duì)整合后的基因組序列進(jìn)行3輪polish和堿基校正。

        以數(shù)據(jù)庫中已報(bào)道的解脂亞羅酵母基因組序列為參考,采用AUGUSTUS(v3.2.3)軟件 (http://bioinf. uni-greifswald.de/augustus/)對(duì)CA20基因組進(jìn)行de novo基因預(yù)測(cè)。利用參考基因組的蛋白序列進(jìn)行同源比對(duì)預(yù)測(cè),過濾較差結(jié)果,去冗余,之后運(yùn)行軟件Genewise (v2.4.1,https://www.ebi.ac.uk/seqdb/ confluence/display/THD/GeneWise)做精確比對(duì),確定基因編碼區(qū)和內(nèi)含子區(qū)。利用軟件EVidenceModeler (v1.1.1,http://evidencemodeler.github.io/)對(duì)所預(yù)測(cè)基因集進(jìn)行整合,得到樣品基因組編碼基因。非編碼RNA (non-coding RNA,ncRNA)包括sRNA、snRNA、miRNA、tRNA及rRNA的預(yù)測(cè)采用rRNAmmer(v1.2)、tRNAscan-SE(v2.0.7)以及Rfam(v14.9)等軟件。串聯(lián)重復(fù)序列(tandem repeat,TR)的預(yù)測(cè)采用軟件RepeatMasker (v4.1.5,http://www.repeatmasker.org/)。

        1.5 基因功能注釋

        將預(yù)測(cè)基因的蛋白序列分別與NR (non-redundant protein database,http://www.ncbi. nlm.nih.gov/)、Swiss-Prot (https://www.uniprot.org/ downloads#uniprotkblink)、eggNOG (evolutionary genealogy of genes:non-supervised orthologous groups,http://eggnogdb.embl.de/)、GO (gene ontology,http://geneontology.org/)和KEGG (kyoto encyclopedia of genes and genomes,http://www.genome.jp/kegg/)數(shù)據(jù)庫進(jìn)行blastp比對(duì)(BLAST+ 2.7.1,值小于10–5),注釋相關(guān)基因的功能。碳水化合物相關(guān)酶(CAZymes)的注釋采用碳水化合物活性酶數(shù)據(jù)庫(http:// www.cazy.org/)[18]。蛋白質(zhì)結(jié)構(gòu)域分析采用NCBI CDD v3.20-59693 PSSMs數(shù)據(jù)庫(Conserved Domain Database,值小于10–3,https://www.ncbi.nlm.nih. gov/Structure/cdd/wrpsb.cgi?)。

        1.6 基因組序列比較與分析

        將CA20基因組序列和NCBI數(shù)據(jù)庫中已完成測(cè)序的8株解脂亞羅酵母基因組進(jìn)行比對(duì)分析,基因組序列信息如表1所示。使用MUMmer(v3.23)軟件對(duì)目標(biāo)基因組和參考基因組進(jìn)行比對(duì),確定基因組間的大范圍共線性關(guān)系。然后使用LASTZ (v1.03.54)對(duì)區(qū)域間進(jìn)行比對(duì),確認(rèn)局部位置排列關(guān)系,查找易位(translocation,TRA),倒置(inversion,INV)和易位+倒置(TRA+INV)區(qū)域。采用pyani (https://github.com/widdowquinn/pyani)對(duì)樣本進(jìn)行平均核苷酸同源性(average nucleotide identity,ANI) 聚類分析。

        利用MUMmer軟件將每個(gè)樣品與參考序列進(jìn)行全局比對(duì),找出樣品序列與參考序列之間的差異位點(diǎn)并進(jìn)行初步過濾,檢測(cè)潛在單核苷酸多態(tài)性位點(diǎn)(single nucleotide polymorphism,SNP)。提取參考序列SNP位點(diǎn)兩邊各100 bp序列,然后使用BLAT(v35)軟件將提取的序列和組裝結(jié)果進(jìn)行比對(duì),驗(yàn)證SNP位點(diǎn)。利用LASTZ軟件將樣品和參考序列進(jìn)行比對(duì),檢測(cè)得到初步插入和缺失(insertion + deletion,Indel)結(jié)果。然后取參考序列Indel位點(diǎn)上下游150 bp與樣品的測(cè)序reads用軟件BWA (v0.7.12-r1039)及SAMtools(v1.17,http://www.htslib. org/)進(jìn)行比對(duì)驗(yàn)證,過濾得到可靠的Indel。利用軟件ANNOVAR(v2019Oct24)對(duì)所鑒定的SNP和Indel位點(diǎn)進(jìn)行注釋。此外,利用軟件BreakDancer(v 1.1.2)鑒定染色體結(jié)構(gòu)變異區(qū)域(structure variants,SV)。

        表1 基因組信息

        同源基因分析采用軟件cd-hit (v4.6.1,http://cd-hit.org)。利用軟件對(duì)需要分析的多個(gè)樣品的蛋白序列進(jìn)行聚類分析(identity > 50%,coverage > 50%),所有樣本中均存在的同源基因作為共有基因(core gene),其余為不同樣品中的特有基因(specific gene)。基于同源基因分析,利用軟件MUSCLE (v3.8.31)進(jìn)行蛋白多序列的比對(duì),比對(duì)結(jié)果用于進(jìn)化樹構(gòu)建。采用PhyML(v3.0)軟件(http://www.atgc- montpellier.fr/phyml/)基于最大似然法(1000 boot-strap)構(gòu)建全基因組系統(tǒng)進(jìn)化樹。赤蘚糖醇代謝途徑中相關(guān)酶的比較分析由NCBI在線BLAST完成,以菌株CA20的蛋白序列為參考序列進(jìn)行搜索比對(duì)。

        1.7 重測(cè)序分析結(jié)果驗(yàn)證

        以菌株CA20基因組為參考序列,對(duì)菌株WT5進(jìn)行基因組重測(cè)序分析,針對(duì)由于基因突變或插入、缺失突變引起的基因缺失及蛋白非同義突變,采用PCR方法進(jìn)行體外擴(kuò)增驗(yàn)證。

        1.8 數(shù)據(jù)統(tǒng)計(jì)分析

        研究中所涉及生物學(xué)實(shí)驗(yàn)均重復(fù)三次以上,每次3組平行,數(shù)據(jù)差異顯著性分析由Origin 9.0軟件中的ANOVA(analysis of variance)分析方法完成[19],選用Bonferroni多重比較,<0.05為兩組數(shù)據(jù)間差異顯著。圖片組合采用軟件Adobe Illustrator CC 2022。部分圖表的繪制由凌波微課在線云平臺(tái)完成(http://www.cloud.biomicroclass.com/CloudPlatform)。

        2 結(jié)果與分析

        2.1 菌株CA20基因組特征及系統(tǒng)發(fā)育分析

        菌株CA20的基因組大小為20,420,510 bp (不包含線粒體),含有6條染色體(表2)?;蚪M的平均GC含量為48.97%,包含6330個(gè)CDS,基因平均長(zhǎng)度為1437 bp,基因總長(zhǎng)占基因組的44.54%?;蚪M含有的ncRNA數(shù)量為649,包括510個(gè)tRNA,112個(gè)5S rRNA,2個(gè)18S rRNA,2個(gè)23S rRNA,以及23個(gè)snRNA (表2)。此外,串聯(lián)重復(fù)序列(TR) 的數(shù)量為9663。已報(bào)道的解脂亞羅酵母基因組大小和GC堿基含量分別在20 Mb和49%左右(表1),CA20與其接近。已將CA20基因組序列上傳至NCBI數(shù)據(jù)庫,BioProject號(hào)為PRJNA957569。

        CA20基因組中分別有4033、4301、和3325個(gè)基因具有GO、COG、和KEGG注釋功能,分別占全部基因的63.71%、67.95%、以及52.53%。COG和KEGG功能分類如圖1所示。COG功能分類中,功能未知蛋白(function unknown,S)數(shù)量最多,共539個(gè),其次為蛋白翻譯后的修飾、伴侶蛋白(posttranslational modification,protein turnover, chaperones,O)、胞內(nèi)轉(zhuǎn)運(yùn)、分泌和小泡運(yùn)輸(intracellular trafficking, secretion, and vesicular transport,U)、翻譯、核糖體結(jié)構(gòu)和生物發(fā)生(translation, ribosomal structure and biogenesis,J)以及信號(hào)轉(zhuǎn)導(dǎo)機(jī)制(signal transduction mechanisms,T) 等。豐富的功能未知蛋白分類可能和CA20特殊的性狀及功能相關(guān),同時(shí)較多的蛋白與基因表達(dá)過程相關(guān)預(yù)示著CA20具備較強(qiáng)的蛋白合成能力。KEGG功能分類中,較多的基因參與信號(hào)轉(zhuǎn)導(dǎo)(signal transduction)、翻譯(translation)、轉(zhuǎn)運(yùn)和代謝(transport and catabolism)、細(xì)胞生長(zhǎng)和死亡(cell growth and death)、碳水化合物代謝(carbohydrate metabolism)以及氨基酸代謝(amino acid metabolism),預(yù)示著CA20具備較強(qiáng)的環(huán)境壓力響應(yīng)能力。

        表2 解脂亞羅酵母CA20基因組特征

        圖1 解脂亞羅酵母CA20基因功能注釋

        A:COG功能分類;B:KEGG功能分類

        為探究菌株CA20和其他解脂亞羅酵母的親緣關(guān)系,從NCBI數(shù)據(jù)庫下載已完成測(cè)序的8個(gè)基因組序列用于構(gòu)建全基因組系統(tǒng)發(fā)育樹(表1)。根據(jù)數(shù)據(jù)庫信息可知,除菌株DSM 3286和CLIB122未記錄分離來源外,其他菌株分離于廢水(W29、22301-5和PO1f)、奶酪(IBT 446)和泥土(H222和WSH-Z06)。雖然分離于不同環(huán)境,但是ANI分析顯示CA20和其他8株解脂亞羅酵母高度同源,ANI值>99.50% (圖2A),其中CA20和IBT-446及H222的ANI值分別高達(dá)99.84%和99.98%,表明這三株菌進(jìn)化距離更近,親緣關(guān)系更強(qiáng)。全基因組進(jìn)化樹分析結(jié)果同樣證實(shí)CA20、IBT-446及H222處于同一分支(圖2B)。

        2.2 比較基因組分析

        2.2.1 基因組共線性分析

        系統(tǒng)發(fā)育分析表明CA20和IBT 446以及H222具有更近的親緣關(guān)系。類似地,共線性分析顯示這三株菌的基因組線性關(guān)系更好(圖3,A和B)。同時(shí),分析結(jié)果表明CA20和其他8株菌的基因組之間存在較大區(qū)域的倒位(inversion)和易位(translocation)現(xiàn)象。其中,和22301-5相比,易位區(qū)域存在于Chr2、Chr3、Chr4、Chr5和Chr6 (圖3C);與DSM 3286相比,易位區(qū)域主要存在于Chr3、Chr4、Chr5和Chr6 (圖3D);和W29、IBT 446、CLIB122、PO1f以及WSH-Z06相比,CA20的Chr2、Chr3、Chr4和Chr6染色體上均存在大區(qū)域的易位現(xiàn)象(圖4,A~D);此外,Chr1存在倒置加易位區(qū)域。大區(qū)域基因組重排現(xiàn)象的發(fā)生可能歸結(jié)于不同菌株為適應(yīng)不同生存環(huán)境而產(chǎn)生的適應(yīng)性變化。

        2.2.2 基因突變位點(diǎn)分析

        除了大區(qū)域基因組重排,基因位點(diǎn)變異是引起菌種遺傳性狀改變的另一個(gè)重要因素。單核苷酸多態(tài)性分析(SNP)顯示,CA20和W29、DSM 3286、22301-5、CLIB122、PO1f以及WSH-Z06基因組相比存在大量突變位點(diǎn),其中同義突變位點(diǎn)數(shù)量大于非同義突變。CA20和IBT 446以及H222之間存在的突變位點(diǎn)數(shù)較少,這與上文中的ANI分析結(jié)果相一致(圖5A)。此外,位點(diǎn)突變所引起的讀碼框改變以及CDS區(qū)域變化在不同菌株中存在差異。其中,除菌株IBT 446和H222以外,其他6株菌中發(fā)生移碼突變的基因數(shù)量均在30個(gè)以上,而CDS區(qū)域中含有插入突變的基因數(shù)量在100個(gè)以上(圖5B)。

        圖2 基于全基因組序列的ANI分析和系統(tǒng)發(fā)育樹

        A:核苷酸同源性分析;B:系統(tǒng)發(fā)育樹分析。

        圖3 解脂亞羅酵母CA20和H222(A)、IBT 446(B)、22301-5(C)以及DSM 3286(D)基因組的共線性分析

        圖4 解脂亞羅酵母CA20和W29 (A)、CLIB122 (B)、PO1f (C)以及WSH-Z06 (D)基因組的共線性分析

        2.2.3 泛基因和核心基因分析

        對(duì)包括CA20在內(nèi)的9株解脂亞羅酵母全基因組進(jìn)行同源基因聚類分析,參與分析的基因總數(shù)為57,254個(gè)。結(jié)果顯示,核心基因數(shù)量隨著樣本數(shù)量的增加而減少(圖6A),泛基因數(shù)量隨著樣本數(shù)量的增加而逐步增加(圖6B),表明解脂亞羅酵母基因組為開放式基因組,具備較高的遺傳多樣性。9株菌共有的核心基因數(shù)量為5342個(gè)(圖6C)。此外,各菌株存在的特有基因數(shù)量分別為65個(gè)(CA20)、64個(gè)(W29)、72個(gè)(DSM 3286)、55個(gè)(22301-5)、62個(gè)(IBT 446)、63個(gè)(H222)、242個(gè)(CLIB122)、54個(gè)(PO1f)和54個(gè)(WSH-Z06)。

        圖5 解脂亞羅酵母CA20與其他菌株基因組間的單核苷酸多態(tài)性和插入缺失位點(diǎn)分析

        A:?jiǎn)魏塑账嵬蛔兯鸬耐x突變和非同義突變位點(diǎn)數(shù)量;B:堿基插入或缺失所引起的基因突變數(shù)量。

        圖6 解脂亞羅酵母核心基因和泛基因分析

        A:核心基因分析;B:泛基因分析;C:9個(gè)基因組的共有和特有基因花瓣圖,圓圈部分為共有基因數(shù)量,花瓣部分為各個(gè)菌株中特有的基因數(shù)量。

        為進(jìn)一步理解不同菌株中特有基因可能發(fā)揮的功能,對(duì)這些特有基因進(jìn)行GO功能注釋。結(jié)果顯示,各菌株特有的基因中未得到注釋的(not available,NA)占有較大比重,特別是菌株CLIB122中,比例高達(dá)75%以上(圖7)。在注釋的特有基因中,大部分基因所編碼蛋白均位于細(xì)胞質(zhì)膜或者細(xì)胞膜(plasma membrane or membrane)。不同的是,菌株CA20和DSM 3286中部分蛋白位于線粒體(mitochondrion),而H222和WSH-Z06中部分蛋白位于細(xì)胞核中(nucleus)(圖7A)。大部分蛋白具有跨膜轉(zhuǎn)運(yùn)活性 (transmembrane transporter activity) (圖7B)。除此以外,CA20中部分蛋白具有氧化還原酶活性 (oxidoreductase activity);DSM 3286中部分蛋白具有NADH脫氫酶活性(NADH dehydrogenase activity)以及催化活性(catalytic activity);IBT 446中部分蛋白具有核酸結(jié)合活性(nucleic acid binding)。類似地,生物過程(BP)分析顯示不同菌株中均存在部分蛋白參與跨膜轉(zhuǎn)運(yùn)(transmembrane transport) (圖7C)。此外,菌株CA20中部分蛋白參與定位(localization);DSM 3286中部分蛋白參與好氧呼吸過程(aerobic respiration);IBT 446中部分蛋白參與蛋白的磷酸化或?;蛱腔?protein phosphorylation or glycosylation or acetylation)以及DNA復(fù)制(DNA replication);PO1f 中部分蛋白參與氨基酸轉(zhuǎn)運(yùn)(amino acid transport)以及WSH-Z06中部分蛋白參與氧化壓力響應(yīng)(response to oxidative stress)等特定生物過程。以上結(jié)果表明不同菌株中的特有基因一部分具有相同的分子生物學(xué)功能,參與類似生物過程;同時(shí)也存在一部分基因發(fā)揮各自特定的功能。

        圖7 不同解脂亞羅酵母中特有基因的GO功能分類

        A:細(xì)胞成分(cellular component,CC);B:分子功能(molecular function,MF);C:生物過程(biological process,BP)。

        2.2.4 碳水化合物活性酶比較分析

        為探索不同解脂亞羅酵母對(duì)碳水化合物利用潛力的差異,對(duì)基因組中的CAZymes進(jìn)行分析。結(jié)果顯示,解脂亞羅酵母中碳水化合物活性酶數(shù)量范圍為108~166個(gè),包括糖苷水解酶類(glycoside hydrolases,GHs)、糖苷轉(zhuǎn)移酶類(glycosyltransferases,GTs)、碳水化合物結(jié)合模塊類(carbohydrate-binding modules,CBMs)、碳水化合物酯酶類(carbohydrate esterases,CEs)和輔助模塊酶類(auxiliary activities,AAs) (表3)。其中,碳水化合物酶數(shù)量最多和最少的菌株分別是CA20和IBT 446。根據(jù)功能的不同,GHs、GTs、CBMs、CEs和AAs分別可細(xì)分為26個(gè)、28個(gè)、6個(gè)、8個(gè)和6個(gè)家族(圖8,A和B)。不同家族酶在不同菌株中的分布存在明顯差異,如GHs中的GH3、GH16、GH17、GH72和GH81,CBMs中的CBM18、CBM19和CBM21,AAs中的AA1、AA2和AA6,以及GTs中的GT1、GT4和GT39等,預(yù)示著不同解脂亞羅酵母對(duì)不同碳水化合物的利用潛力存在差異。

        表3 不同解脂亞羅酵母中碳水化合物活性酶的數(shù)量

        GHs:糖苷水解酶類;GTs:糖苷轉(zhuǎn)移酶類;CBMs:碳水化合物結(jié)合模塊類;CEs:碳水化合物酯酶類;AAs:輔助模塊酶類。

        相比于其他解脂亞羅酵母菌株,菌株CA20含有更豐富的GH4、GH9、GH109、GH158、CBM19、CBM32、CBM43、AA1、AA2、AA4、GT28、GT34、GT90、CE1、CE3、CE4、CE9、CE10、CE12、CE14、CE16,其中GH4、GH9、GH109、GH158、GT28、GT90、CE3、CE10、CE12、CE14、CE16只存在于CA20中(圖8)。基因注釋顯示,GH4為α-葡萄糖苷酶,參與淀粉水解;GH9為β-葡萄糖苷酶,參與纖維素水解;GH109為α-N-乙酰氨基半乳糖苷酶;GH158為內(nèi)切-β-1,3-葡聚糖酶,參與細(xì)胞壁β-葡聚糖水解。在酯酶類中,CE10、CE12、CE14和CE16分別為芳香基酯酶、果膠甲酯酶、幾丁二糖脫乙酰酶和乙酰酯酶,參與果膠及幾丁質(zhì)的降解等過程。綜上可知,解脂亞羅酵母CA20含有更豐富的碳水化合物活性酶,可能具有更好的底物水解能力。

        圖8 解脂亞羅酵母中碳水化合物活性酶的家族分布

        A:GHs,CBMs和AAs的數(shù)量;B:GTs 和CEs的數(shù)量。

        2.2.5 赤蘚糖醇代謝途徑中關(guān)鍵酶的比較分析

        解脂亞羅酵母主要利用葡萄糖為底物通過磷酸戊糖途徑代謝合成赤蘚糖醇。研究中選取和葡萄糖轉(zhuǎn)運(yùn)、葡萄糖代謝、赤蘚糖醇合成直接相關(guān)的蛋白進(jìn)行序列比較分析,包括6個(gè)葡萄糖轉(zhuǎn)運(yùn)蛋白(YHT1-YHT6)、葡萄糖激酶和己糖激酶(GK和HK)、葡萄糖-6-磷酸脫氫酶(ZWF1)、6-磷酸葡萄糖酸內(nèi)酯酶(PGLS)、磷酸葡萄糖酸脫氫酶(GND1)、核酮糖磷酸 3-差向異構(gòu)酶(RPE1)、核酮糖-5-磷酸異構(gòu)酶(RPI)、轉(zhuǎn)酮酶(TKL1)、轉(zhuǎn)醛酶(TAL1)、赤蘚糖-4-磷酸激酶(E4PK)、3個(gè)赤蘚糖還原酶(ER10、ER25和ER27)、赤蘚糖醇脫氫酶(EYD1)、赤蘚酮糖激酶(EYK1)、赤蘚酮糖-1-磷酸異構(gòu)酶(EYI1)和赤蘚酮糖- 4-磷酸異構(gòu)酶(EYI2)。結(jié)果顯示,除HK、YHT6和TAL1以外,其他蛋白在解脂亞羅酵母中高度保守,序列相似度達(dá)100% (圖9)。HK和YHT6編碼基因分別在菌株DSM 3286和PO1f中發(fā)生缺失;來源于W29、IBT 446和H222的轉(zhuǎn)醛酶(TAL1)和CA20中的TAL1相比相似度<85%。以上結(jié)果說明,除小部分菌株外,本文所選取解脂亞羅酵母均具有代謝合成赤蘚糖醇的潛在能力。

        2.3 解脂亞羅酵母CA20和WT5性能差異分析

        2.3.1 菌株CA20與WT5合成赤蘚糖醇性能的比較

        根據(jù)之前菌株篩選結(jié)果,原始菌株WT5的赤蘚糖醇產(chǎn)量顯著低于菌株CA20[17],然而其罐上發(fā)酵性能差異待分析。本研究首先比較菌株CA20和WT5發(fā)酵產(chǎn)赤蘚糖醇的性能差異。整個(gè)過程在10 L發(fā)酵罐中進(jìn)行,發(fā)酵周期6天。結(jié)果顯示,在生長(zhǎng)前24 h,菌株CA20培養(yǎng)液的OD600高于菌株WT5,24 h后兩株菌的生長(zhǎng)無明顯差異,72 h后培養(yǎng)液OD600逐漸穩(wěn)定(圖10A)。發(fā)酵144 h后,培養(yǎng)基中葡萄糖濃度接近于0,菌株CA20的赤蘚糖醇產(chǎn)量達(dá)190.97 g/L,顯著高于菌株WT5的128.61 g/L (< 0.001,圖10B)。此外,菌株CA20利用葡萄糖合成赤蘚糖醇的得率為0.65 g/g,產(chǎn)率為1.33 g/L/h,均顯著高于菌株WT5的0.47 g/g和0.92 g/L/h (<0.001;圖10,C和D)。以上結(jié)果表明,菌株CA20和WT5在發(fā)酵產(chǎn)赤蘚糖醇的性能上存在明顯差異。

        圖9 赤蘚糖醇代謝途徑中關(guān)鍵酶的比較分析

        YHT1-YHT6:glucose transporter (XP_501516.1,XP_501621.1,XP_505610.1,XP_504302.1,XP_500382.1,and XP_500566.1); GK:glucokinase (VBB78679.1);HK:hexokinase (XP_501216.1);ZWF1:glucose-6-phosphate dehydrogenase (XP_504275.1);PGLS:6-phosphogluconolactonase (VBB78832.1);GND1:phosphogluconate dehydrogenase (XP_500938.1); RPE1:ribulose phosphate 3-epimerase (QNP96251.1);RPI:ribulose-5-phosphate isomerase (XP_500588.1);TKL1:transketolase (XP_503628.1);TAL1:transaldolase (XP_505460.1);E4PK:erythrose-4-phosphate kinase;ER:erythrose reductase [ER10 (XP_502540.1),ER25 (XP_501796.1),and ER27 (XP_505585.1)];EYD1:erythritol dehydrogenase (XP_504870.1);EYK1: erythrulose kinase (XP_504868.1);EYI1:erythrulose-1-phosphate isomerase (XP_504867.1);EYI2:erythrulose-4-phosphate isomerase (XP_504869.1);P:phosphate。

        2.3.2 菌株WT5基因組重測(cè)序分析

        為在基因組水平闡明菌株CA20和WT5之間性狀差異的原因,對(duì)菌株WT5進(jìn)行基因組重測(cè)序分析,并比較CA20和WT5的基因組序列差異。結(jié)果顯示,菌株CA20基因組序列中存在278個(gè)SNP和370個(gè)Indel,位點(diǎn)突變產(chǎn)生15個(gè)非同義突變氨基酸,5個(gè)同義突變氨基酸以及5個(gè)移碼變異基因(圖11)。同時(shí),CA20中的染色體結(jié)構(gòu)變異包括9個(gè)染色體之間的易位(inter-chromosomal translocation,CTX)、6個(gè)插入(insertion,INS)、25個(gè)缺失(deletion,DEL)、1個(gè)倒位(inversion,INV) 和9個(gè)染色體內(nèi)部的易位(intra-chromosomal translocation,ITX)。對(duì)這些突變位點(diǎn)所在基因進(jìn)行功能注釋,結(jié)果如表4所示。其中,值得注意的是,5個(gè)移碼變異基因在菌株WT5中為移碼缺失,堿基位點(diǎn)的缺失或替換導(dǎo)致讀碼框改變及引入終止密碼子。CA20中這5個(gè)基因能夠完整表達(dá),分別編碼假設(shè)蛋白(RMI98785.1和VBB88313.1)、蛋白激酶(SEI32238.1)、YALIA101S09e01662g1_1 (SEI35917.1)和YALI0F18458p (CAG78388.1)。結(jié)構(gòu)域分析表明,RMI98785.1含有F-BAR (cd07651)、SH3 (smart00326)和PHA03247 (cl33720),可能參與細(xì)胞分裂;VBB88313.1含有Rad2 (cl36701),參與DNA剪切修復(fù)過程;SEI35917.1為功能未知蛋白;CAG78388.1為轉(zhuǎn)錄因子,參與轉(zhuǎn)錄調(diào)控;SEI32238.1是PKc_like類蛋白激酶,參與細(xì)胞信號(hào)傳遞。序列比較分析發(fā)現(xiàn),上述5個(gè)基因所編碼蛋白序列在其他解脂亞羅酵母中高度保守(相似度> 99%,除了IBT 446的SEI35917.1,圖12)。

        A:菌株WT5和CA20的生長(zhǎng)曲線;B:菌株WT5和CA20的葡萄糖消耗及赤蘚糖醇合成曲線;C:赤蘚糖醇得率;D:赤蘚糖醇產(chǎn)率。“***”代表兩組數(shù)據(jù)間差異顯著(<0.001)。

        發(fā)生非同義突變的蛋白中,幾丁質(zhì)轉(zhuǎn)糖基化酶(VBB85253.1)和幾丁質(zhì)酶(VBB88398.1)與細(xì)胞壁的合成相關(guān);支架蛋白VBB85012.1含有Ecm29結(jié)構(gòu)域,參與穩(wěn)定胞內(nèi)蛋白酶體,與胞內(nèi)蛋白質(zhì)的降解穩(wěn)定維持相關(guān);假設(shè)性蛋白VBB85808.1含有Vps54結(jié)構(gòu)域,參與胞內(nèi)蛋白質(zhì)的轉(zhuǎn)運(yùn)過程;假設(shè)性蛋白B0I72DRAFT_135086 (RDW34205.1) 含有PH_Scd1 (cd13246)、CDC24 (pfam06395)、RhoGEF (pfam00621)和PB1(smart00666)結(jié)構(gòu)域,參與調(diào)節(jié)胞內(nèi)Rho蛋白的信號(hào)轉(zhuǎn)導(dǎo)過程;蛋白R(shí)DW34848.1、RDW40799.1、VBB79189.1和SEI34914.1參與胞內(nèi)蛋白質(zhì)的合成、修飾和穩(wěn)定等過程。綜合以上結(jié)果可知,菌株CA20赤蘚糖醇產(chǎn)量較高的原因可能與一些重要基因的移碼變異和突變有關(guān),這些基因參與細(xì)胞信號(hào)傳遞、細(xì)胞分裂、細(xì)胞壁合成、蛋白質(zhì)合成及穩(wěn)態(tài)維持。此外,誘變所引起的非同義突變可能帶來對(duì)應(yīng)蛋白活性的改變,這可能是影響細(xì)胞代謝合成赤蘚糖醇的重要因素。

        圖11 菌株CA20和WT5的比較基因組分析

        A:樣本突變?nèi)D,由外至內(nèi)依次為基因組信息、SNP在基因組上的密度分布、Indel在基因組上的密度分布、SV在基因組上的密度分布;B:SNP和Indel的位點(diǎn)數(shù)量;C:位點(diǎn)變化引起的非同義突變(nonsynonymous mutation,NSM)、同義突變(synonymous mutation,SM)和移碼變異(frameshift mutation,F(xiàn)SM)基因數(shù)量;D:染色體結(jié)構(gòu)變異數(shù)量,包括染色體之間的易位(inter-chromosomal translocation,CTX)、插入(insertion,INS)、缺失(deletion,DEL)、倒位(inversion,INV)、染色體內(nèi)部的易位(intra-chromosomal translocation,ITX)。

        表4 SNP和Indel突變所引起的蛋白編碼序列變化

        圖12 移碼變異基因的序列比較分析

        3 討論

        解脂亞羅酵母是目前工業(yè)發(fā)酵生產(chǎn)赤蘚糖醇所使用的唯一菌種,優(yōu)良菌株的分離和選育是降低赤蘚糖醇生產(chǎn)成本的基礎(chǔ)[7]。多年來,基于誘變選育技術(shù),研究人員不斷獲得解脂亞羅酵母優(yōu)良菌株[13,14,20]。然而,對(duì)于誘變引起性狀改變的潛在機(jī)制尚不清楚,不同菌株之間性能差異的原因仍待探索。誘變所引起的基因位點(diǎn)的突變是菌株性狀改變的重要因素。因此,基因組水平的比較分析有助于理解和挖掘新的和菌株優(yōu)良性狀相關(guān)聯(lián)的位點(diǎn)。

        本研究對(duì)赤蘚糖醇高產(chǎn)菌株解脂亞羅酵母CA20進(jìn)行全基因組測(cè)序,結(jié)果表明CA20的基因組大小及GC含量與數(shù)據(jù)庫中的8株解脂亞羅酵母較接近,在20 Mb左右,預(yù)示著他們可能具有較近的進(jìn)化距離。全基因組ANI分析顯示包括CA20在內(nèi)的9個(gè)菌株具有高度同源性,進(jìn)一步驗(yàn)證了這一猜想。Walker等[21]對(duì)解脂亞羅酵母菌株CLIB122、CBS7504、YB567、YB566、YB420、YB419和YB392的基因組進(jìn)行比較分析,發(fā)現(xiàn)這些菌株的基因組高度相似。該結(jié)果與本研究所獲結(jié)果類似。此外,雖然基因組序列高度同源,但全基因組進(jìn)化樹分析表明菌株CA20和菌株H222以及IBT 446具有更近的親緣關(guān)系。菌株H222和IBT 446分離于泥土和奶酪,而其他菌株大都分離于廢水(表1),表明生存環(huán)境對(duì)解脂亞羅酵母的遺傳進(jìn)化具有一定影響。類似結(jié)果也發(fā)現(xiàn)于先前研究中,如Liu等[22]發(fā)現(xiàn)菌株P(guān)O1f的基因組序列雖然和CLIB122高度相似,但PO1f基因組中存在大片段序列的缺失。此外,基因組共線性分析以及基因突變位點(diǎn)分析數(shù)據(jù)表明菌株H222、IBT 446和CA20具有較好的基因組線性關(guān)系。同時(shí),對(duì)比于CA20基因組,H222和IBT 446中SNP和Indel帶來的基因缺失數(shù)量均少于其他菌株。綜合可知,解脂亞羅酵母基因組進(jìn)化相對(duì)保守,不同生存環(huán)境可能是引起基因組序列變化的主要因素。

        在基因組水平,不同解脂亞羅酵母之間的性能差異可能與特有基因的存在有關(guān)。泛基因和核心基因分析表明不同菌株含有各自特有基因,數(shù)量在50~70個(gè)(除菌株CLIB122外)。然而,這些特有基因的功能大部分未得到注釋,其可能在各菌株中發(fā)揮特定作用,具體需要今后更深入的研究。在已注釋的特有基因中,不同菌株中基因的功能和參與的生物過程存在差異,如CA20中較多基因所編碼蛋白具有氧化還原酶活性,參與蛋白轉(zhuǎn)運(yùn)和定位的基因數(shù)量遠(yuǎn)高于其他菌株,預(yù)示著CA20可能具有更強(qiáng)的蛋白質(zhì)合成和代謝能力。此外,對(duì)于碳水化合物的利用能力是評(píng)價(jià)菌株性能的重要指標(biāo)。解脂亞羅酵母具有較廣泛的底物譜,可利用烷烴、烯烴、有機(jī)酸、脂肪酸、甘油三酯、葡萄糖、甘油和果糖等[23]。本研究發(fā)現(xiàn)解脂亞羅酵母基因組中含有豐富的碳水化合物活性酶,包括糖苷水解酶類(GHs)、糖基轉(zhuǎn)移酶類(GTs)、碳水化合物結(jié)合模塊類(CBMs)、碳水化合物酯酶類(CEs)和輔助模塊酶類(AAs),這與其具有較廣泛底物譜相呼應(yīng)。其中,菌株CA20、W29、DSM 3286和CLIB122具有更豐富的GHs、GTs、CBMs和AAs。GHs主要參與纖維素、半纖維素等多糖化合物的降解;CBMs可與其他家族的酶結(jié)合提高其催化活性;AAs與木質(zhì)素的降解相關(guān)[18,24]。因此,這4個(gè)菌株可能具有更強(qiáng)的多糖降解能力。然而,需要指出的是,雖然解脂亞羅酵母基因組中含有豐富的與纖維素降解相關(guān)的GHs,但是其并不能直接利用纖維素[6]。這可能歸因于相應(yīng)糖苷酶未被激活或是相關(guān)代謝途徑中關(guān)鍵元件的缺失[25,26],因此,如果能有效激活和纖維素及半纖維素降解有關(guān)的糖苷酶以及補(bǔ)充缺少的元件,則可加速實(shí)現(xiàn)以富含纖維素的農(nóng)作物廢棄物為原料生產(chǎn)赤蘚糖醇,降低生產(chǎn)成本。另外,值得注意的是,菌株CA20的碳水化合物活性酶數(shù)量(166個(gè))遠(yuǎn)高于其他8個(gè)菌株,其中AAs中的AA1和CEs相對(duì)于其他菌株更為豐富。AA1為漆酶 (laccase),參與催化取代酚、苯胺和芳香族硫醇等酚類物質(zhì)的氧化過程,已被用于去除木質(zhì)纖維素水解液中的酚類物質(zhì),消除其對(duì)馬克斯克魯維酵母()的抑制作用[27]?;蚪M中豐富的AA1預(yù)示著菌株CA20對(duì)酚類物質(zhì)具有較好的耐受能力。CEs可參與半纖維素、果膠和幾丁質(zhì)的降解過程[28,29],菌株CA20中豐富的CE1、CE4和CE9,以及特有的CE10、CE12、CE14和CE16可能和其分離環(huán)境有關(guān),同時(shí)也預(yù)示著其具有更強(qiáng)的底物分解能力。綜合可知,基因組中特異基因的存在及碳水化合物活性酶的多樣性可能是不同解脂亞羅酵母性能差異的主要原因。

        得益于良好的高滲壓耐受性和安全性,解脂亞羅酵母已被廣泛用于赤蘚糖醇的發(fā)酵生產(chǎn)。然而,不同菌株的產(chǎn)量差異明顯[1]。赤蘚糖醇的代謝途徑已得到揭示,除了赤蘚糖-4-磷酸激酶(E4PK)以外,代謝途徑中其他酶的序列可從數(shù)據(jù)庫中下載。本研究對(duì)葡萄糖轉(zhuǎn)運(yùn)、磷酸戊糖途徑及赤蘚糖醇降解等過程中關(guān)鍵酶的序列進(jìn)行比較分析。針對(duì)葡萄糖轉(zhuǎn)運(yùn),先前研究表明解脂亞羅酵母中葡萄糖轉(zhuǎn)運(yùn)蛋白主要有6個(gè)(YHT1-YHT6),其中YHT1和YHT4發(fā)揮主要作用[30,31]。本研究發(fā)現(xiàn),6個(gè)糖轉(zhuǎn)運(yùn)蛋白在9株菌中均高度保守(除了YHT6在PO1f發(fā)生丟失以外)。在赤蘚糖糖醇合成途徑中,除轉(zhuǎn)醛酶外,其他酶均高度保守(圖9)。此外,在赤蘚糖醇降解途徑中,相關(guān)酶同樣高度保守。這些結(jié)果預(yù)示著已知的解脂亞羅酵母均保留完整的赤蘚糖醇代謝與合成潛力,不同菌株間赤蘚糖醇合成能力的差異可能并非來自關(guān)鍵酶的突變或缺失。需要指出的是,本研究所選取的8株菌中,只有菌株W29和PO1f用于赤蘚糖醇合成研究[1,8,31],其他文獻(xiàn)中報(bào)道的赤蘚糖醇高產(chǎn)菌如解脂亞羅酵母M53[20]、解脂亞羅酵母CGMCC7326[32]、解脂亞羅酵母BBE-17及[13,33]和CICC 1675[34]的基因組序列尚未公開。因此,未來通過分析這些高產(chǎn)菌株的基因組差異可進(jìn)一步揭示赤蘚糖醇產(chǎn)量差異的機(jī)制。

        高產(chǎn)菌株和原始菌株基因組序列的比較分析有助于闡明和赤蘚糖醇積累有關(guān)的機(jī)制。先前預(yù)測(cè)誘變可能導(dǎo)致蘚糖醇代謝途徑中關(guān)鍵酶的突變,從而改變酶的活性,進(jìn)而引起產(chǎn)量的變化。然而,本研究發(fā)現(xiàn),誘變并未引起相關(guān)酶編碼序列的變化,預(yù)示著CA20中赤蘚糖醇的代謝受到其他因素調(diào)控。進(jìn)一步分析發(fā)現(xiàn),菌株CA20中5個(gè)基因發(fā)生移碼變異,其中值得關(guān)注的是蛋白激酶SEI32238.1,含有PKc_like 結(jié)構(gòu)域。蛋白激酶主要參與胞內(nèi)信號(hào)傳遞過程,研究表明PKC(protein kinase C)-MAPK (mitogen-activated protein kinase)信號(hào)通路主要參與調(diào)控酵母細(xì)胞細(xì)胞壁的穩(wěn)定性和修復(fù)過程,與細(xì)胞從壓力環(huán)境恢復(fù)生長(zhǎng)過程中肌動(dòng)蛋白細(xì)胞骨架的復(fù)極化密切相關(guān)[35~37]。酵母細(xì)胞代謝合成赤蘚糖醇需要高滲環(huán)境,細(xì)胞壁的穩(wěn)定性與細(xì)胞在高滲環(huán)境中生存密切相關(guān)。因此,蛋白激酶SEI32238.1可能參與調(diào)控細(xì)胞在高滲環(huán)境中的生長(zhǎng)和代謝,進(jìn)而影響赤蘚糖醇的合成。序列比較分析發(fā)現(xiàn)SEI32238.1在其他解脂亞羅酵母菌株中高度保守,間接說明其對(duì)于酵母細(xì)胞代謝生長(zhǎng)的重要性。此外,雖然赤蘚糖醇代謝途徑已得到揭示,但是該途徑的調(diào)控機(jī)制仍有待研究。本研究發(fā)現(xiàn)菌株CA20發(fā)生移碼變異的基因中含有1個(gè)轉(zhuǎn)錄調(diào)控因子(CAG78388.1),該蛋白的功能未知,是否參與調(diào)控胞內(nèi)赤蘚糖醇代謝需要進(jìn)一步試驗(yàn)驗(yàn)證。除移碼變異外,本研究發(fā)現(xiàn)菌株CA20中存在眾多的非同義突變蛋白。雖然這些蛋白的突變位點(diǎn)只有1個(gè),但仍有可能造成蛋白活性的變化,從而引起胞內(nèi)代謝網(wǎng)絡(luò)的改變[38]。值得注意的是,發(fā)生非同義突變的15個(gè)蛋白中,大部分參與細(xì)胞分裂、細(xì)胞壁合成、蛋白質(zhì)合成及穩(wěn)態(tài)維持等過程,表明胞內(nèi)環(huán)境穩(wěn)態(tài)的維持對(duì)細(xì)胞合成赤蘚糖醇具有重要影響。綜合可知,誘變處理引起的非同義突變所帶來的細(xì)胞穩(wěn)定性的提升可能是促進(jìn)細(xì)胞合成赤蘚糖醇的重要因素,其中蛋白激酶SEI32238.1可能發(fā)揮重要調(diào)控作用。

        綜上所述,這些結(jié)果表明:(1)解脂亞羅酵母基因組在進(jìn)化過程中保守,生存環(huán)境的不同是導(dǎo)致不同菌株基因組序列差異的主要因素;(2)基因組中CAZymes數(shù)量差異可能是不同解脂亞羅酵母性能差異的重要因素,而菌株CA20具有更豐富的碳水化合物活性酶,具備更強(qiáng)的工業(yè)應(yīng)用潛力;(3)赤蘚糖醇代謝途徑在不同解脂亞羅酵母中保守,不同菌株產(chǎn)量差異可能并非只來自代謝途徑中有關(guān)酶的突變,同時(shí)與代謝途徑的調(diào)控有關(guān);(4)菌株CA20高產(chǎn)赤蘚糖醇與其細(xì)胞結(jié)構(gòu)及內(nèi)環(huán)境穩(wěn)定性的提升有關(guān),蛋白激酶SEI32238.1可能是重要的調(diào)控因子。未來可通過轉(zhuǎn)錄組及代謝組學(xué)的研究進(jìn)一步闡明解脂亞羅酵母高產(chǎn)赤蘚糖醇的機(jī)制,為優(yōu)良菌株的定向選育提供新思路。

        [1] Liang PX, Cao MF, Li J, Wang QH, Dai ZJ. Expanding sugar alcohol industry: microbial production of sugar alcohols and associated chemocatalytic derivatives., 2023, 64: 108105.

        [2] Liu FM, Zhao XQ, Sha RY, Xia K, Huang J. Advances in microbial production of erythritol., 2022, 20(2): 195–205.劉芳美, 趙學(xué)群, 沙如意, 夏凱, 黃俊. 赤蘚糖醇微生物合成研究進(jìn)展. 生物加工過程, 2022, 20(2): 195–205.

        [3] Erian AM, Sauer M. Utilizing yeasts for the conversion of renewable feedstocks to sugar alcohols-a review., 2022, 346: 126296.

        [4] Daza-Serna L, Serna-Loaiza S, Masi A, Mach RL, Mach-Aigner AR, Friedl A. From the culture broth to the erythritol crystals: an opportunity for circular economy., 2021, 105(11): 4467–4486.

        [5] Chinese Institute of Food Science and Technology. Scientific consensus on erythritol., 2022, 22(12): 405–412.中國(guó)食品科學(xué)技術(shù)學(xué)會(huì). 赤蘚糖醇的科學(xué)共識(shí). 中國(guó)食品學(xué)報(bào), 2022, 22(12): 405–412.

        [6] Liu XY, Yu XJ, He AY, Xia J, He JL, Deng YF, Xu N, Qiu ZY, Wang XY, Zhao PS. One-pot fermentation for erythritol production from distillers grains by the co-cultivation ofand., 2022, 351: 127053.

        [7] Zhang Y, Xu S, Wang N, Chi P, Zhang XY, Cheng HR. Construction and characterization ofstrain with reduced foaming ability., 2022, 62(11): 4165–4175.張悅, 徐碩, 王楠, 池萍, 張馨月, 程海榮. 發(fā)酵產(chǎn)泡性能降低的解脂耶氏酵母菌株的獲得及其評(píng)價(jià). 微生物學(xué)報(bào), 2022, 62(11): 4165–4175.

        [8] Zhang L, Nie MY, Liu F, Chen J, Wei LJ, Hua Q. Multiple gene integration to promote erythritol production on glycerol in., 2021, 43(7): 1277–1287.

        [9] Mirończuk AM, Biegalska A, Dobrowolski A. Functional overexpression of genes involved in erythritol synthesis in the yeast., 2017, 10: 77.

        [10] Liang PX, Li J, Wang QH, Dai ZJ. Enhancing the thermotolerance and erythritol production ofby introducing heat-resistant devices., 2023, 11: 1108653.

        [11] Wang N, Chi P, Zou YW, Xu YR, Xu S, Bilal M, Fickers P, Cheng HR. Metabolic engineering offor thermoresistance and enhanced erythritol productivity., 2020, 13: 176.

        [12] Mirończuk AM, Rakicka M, Biegalska A, Rymowicz W, Dobrowolski A. A two-stage fermentation process of erythritol production by yeastfrom molasses and glycerol., 2015, 198: 445–455.

        [13] Qiu XL, Xu P, Zhao XR, Du GC, Zhang J, Li JH. Combining genetically-encoded biosensors with high throughput strain screening to maximize erythritol production in., 2020, 60: 66–76.

        [14] Liu XY, Yu XJ, Lv JS, Xu JX, Xia J, Wu Z, Zhang T, Deng YF. A cost-effective process for the coproduction of erythritol and lipase withM53 from waste cooking oil., 2017, 103: 86–94.

        [15] Ghezelbash GR, Nahvi I, Emamzadeh R. Improvement of erythrose reductase activity, deletion of by-products and statistical media optimization for enhanced erythritol production frommutant 49., 2014, 69(2): 149–157

        [16] Song B, Li XF, Shi ZY, Li CT, Fu YP, Li Y. Breeding of newstrain by mutation with60Co-γ irradiation., 2019, 59(11): 2155–2164.宋冰, 李雪飛, 史澤宇, 李長(zhǎng)田, 付永平, 李玉. 鈷60誘變選育平菇新菌株的研究. 微生物學(xué)報(bào), 2019, 59(11): 2155–2164.

        [17] Liu FM, Xia K, Peng YT, Zhao XQ, Sha RY, Huang J. Breeding ofstrains with improved erythritol production by combined mutation and optimization of fermentation process., 2023, 37(5): 907–916.劉芳美, 夏凱, 彭艷婷, 趙學(xué)群, 沙如意, 黃俊. 復(fù)合誘變選育高產(chǎn)赤蘚糖醇解脂亞羅酵母及其發(fā)酵工藝優(yōu)化. 核農(nóng)學(xué)報(bào), 2023, 37(5): 907–916.

        [18] Feng JY, He JK, Sun JY, Fu XZ, Yuan JA, Guo HP. Genome sequencing and comparative genome analysis ofGO2, a strain producing bioflo-cculant with lignocellulosic biomass., 2023, 63(2): 786–804.馮嘉茵, 何繼堃, 孫嘉怡, 符學(xué)志, 袁佳驁, 郭海朋. 利用木質(zhì)纖維素類生物質(zhì)產(chǎn)微生物絮凝劑GO2的全基因組測(cè)序及比較基因組學(xué)分析. 微生物學(xué)報(bào), 2023, 63(2): 786–804.

        [19] Xia K, Han CC, Xu J, Liang XL. Toxin-antitoxin HicAB regulates the formation of persister cells responsible for the acid stress resistance in., 2021, 105(2): 725–739.

        [20] Liu XY, Yu XJ, Xia J, Lv JS, Xu JX, Dai BL, Xu XQ, Xu JM. Erythritol production byfrom okara pretreated with the in-house enzyme pools of fungi., 2017, 244(Pt 1): 1089–1095.

        [21] Walker C, Dien B, Giannone RJ, Slininger P, Thompson SR, Trinh CT. Exploring proteomes of robustisolates cultivated in biomass hydrolysate reveals key processes impacting mixed sugar utilization, lipid accumulation, and degradation., 2021, 6(4): e0044321.

        [22] Liu LQ, Alper HS. Draft genome sequence of the oleaginous yeastPO1f, a commonly used metabolic engineering host., 2014, 2(4): e00652–14.

        [23] Park YK, Ledesma-Amaro R. What makeswell suited for industry?, 2023, 41(2): 242–254.

        [24] Silva JP, Ticona ARP, Hamann PRV, Quirino BF, Noronha EF. Deconstruction of lignin: from enzymes to microorganisms., 2021, 26(8): 2299.

        [25] Celińska E, Nicaud JM, Bia?as W. Hydrolytic secretome engineering infor consolidated bioprocessing on polysaccharide resources: review on starch, cellulose, xylan, and inulin., 2021, 105(3): 975–989.

        [26] Ryu S, Hipp J, Trinh CT. Activating and elucidating metabolism of complex sugars in., 2015, 82(4): 1334–1345.

        [27] Moreno AD, Ibarra D, Fernández JL, Ballesteros M. Different laccase detoxification strategies for ethanol production from lignocellulosic biomass by the thermotolerant yeastCECT 10875., 2012, 106: 101–109.

        [28] Sánchez C. Lignocellulosic residues: biodegradation and bioconversion by fungi., 2009, 27(2): 185–194.

        [29] Peng MF, Li PJ, Shan Y, Chen YQ, Yang DJ, Lei LC, Huang ZH, Yu KX. Comparative genome analysis of carbohydrate activity enzymes zymogram ofGuangxi pickle., 2021, 47(4): 68–73.彭明芳, 李培駿, 單楊, 陳玉秋, 楊岱峻, 雷麗嫦, 黃芝輝, 余孔新. 比較基因組揭示廣西酸菜乳桿菌碳水化合物活性酶譜. 食品與發(fā)酵工業(yè), 2021, 47(4): 68–73.

        [30] Lazar Z, Neuvéglise C, Rossignol T, Devillers H, Morin N, Robak M, Nicaud JM, Crutz-Le Coq AM. Characterization of hexose transporters inreveals new groups of sugar porters involved in yeast growth., 2017, 100: 1–12.

        [31] Hapeta P, Szczepańska P, Witkowski T, Nicaud JM, Crutz-Le Coq AM, Lazar Z. The Role of hexokinase and hexose transporters in preferential use of glucose over fructose and downstream metabolic pathways in the yeast., 2021, 22(17): 9282.

        [32] Cheng HL, Wang SQ, Bilal M, Ge XM, Zhang C, Fickers P, Cheng HR. Identification, characterization of two NADPH-dependent erythrose reductases in the yeastand improvement of erythritol productivity using metabolic engineering., 2018, 17(1): 133.

        [33] Qiu XL, Gu Y, Du GC, Zhang J, Xu P, Li JH. Conferring thermotolerant phenotype to wild-typeimproves cell growth and erythritol production., 2021, 118(8): 3117–3127.

        [34] Yang LB, Zhan XB, Zheng ZY, Wu JR, Gao MJ, Lin CC. A novel osmotic pressure control fed-batch fermentation strategy for improvement of erythritol production byfrom glycerol., 2014, 151: 120–127.

        [35] Dickson RC, Sumanasekera C, Lester RL. Functions and metabolism of sphingolipids in., 2006, 45(6): 447–465.

        [36] Caspeta L, Nielsen J. Thermotolerant yeast strains adapted by laboratory evolution show trade-off at ancestral temperatures and preadaptation to other stresses., 2015, 6(4): e00431.

        [37] Li B, Liu N, Zhao XB. Response mechanisms ofto the stress factors present in lignocellulose hydrolysate and strategies for constructing robust strains., 2022, 15(1): 28.

        [38] Caspeta L, Chen Y, Ghiaci P, Feizi A, Buskov S, Hallstr?m BM, Petranovic D, Nielsen J. Altered sterol composition renders yeast thermotolerant., 2014, 346(6205): 75–78.

        Mechanism and evolutionary analysis ofCA20 capable of producing erythritol with a high yield based on comparative genomics

        Kai Xia, Fangmei Liu, Yuqing Chen, Shanshan Chen, Chunying Huang, Xuequn Zhao, Ruyi Sha, Jun Huang

        Combined mutagenesis is widely applied for the breeding of robustused in the production of erythritol. However, the changes of genome after mutagenesis remains unclear. This study aimed to unravel the mechanism involved in the improved erythritol synthesis of CA20 and the evolutionary relationship between differentby comparative genomics analysis. The results showed that the genome sizeofCA20 was 20,420,510 bp, with a GC content of 48.97%. There were 6330 CDS and 649 ncRNA (non-coding RNA) in CA20 genome. Average nucleotide identity (ANI) analysis showed that CA20 genome possessed high similarity (ANI > 99.50%) with otherstrains, while phylogenetic analysis displayed that CA20 was classified together withIBT 446 andH222. CA20 shared 5342 core orthologous genes with the 8 strains while harbored 65 specific genes that mainly participated in the substrate and protein transport processes. CA20 contained 166 genes coding for carbohydrate-active enzymes (CAZymes), which was more than that found in other strains (108-137). Notably, 4, 2, and 13 different enzymes belonging to glycoside hydrolases (GHs), glycosyltransferases (GTs), and carbohydrate esterases (CEs), respectively, were only found in CA20. The enzymes involved in the metabolic pathway of erythritol were highly conserved in, except for transaldolase (TAL1). In addition, the titer and productivity of erythritol by CA20 were 190.97 g/L and 1.33 g/L/h, respectively, which were significantly higher than that of WT5 wherein 128.61 g/L and 0.92 g/L/h were obtained (< 0.001). Five frameshift mutation genes and 15 genes harboring nonsynonymous mutation were found in CA20 compared with that of WT5. Most of these genes were involved in the cell division, cell wall synthesis, protein synthesis, and protein homeostasis maintenance. These findings suggested that the genome ofis conserved during evolution, and the variance of living environment is one important factor leading to genome divergence. The varied number of CAZymes existed inis one factor that contributes to the performance difference. The increased synthesis of erythritol byCA20 is correlated with the improvement of the stability of cell structure and internal environment. The results of this study provide a basis for the directional breeding of robuststrains used in erythritol production.

        ; erythritol; comparative genome; frameshift mutation; protein kinase

        2023-06-08;

        2023-08-11;

        2023-08-23

        浙江科技學(xué)院科研啟動(dòng)基金(編號(hào):F701103L11),研究生科研創(chuàng)新基金項(xiàng)目(編號(hào):2021yjskc11)和國(guó)家大學(xué)生創(chuàng)新訓(xùn)練項(xiàng)目(編號(hào):202211057026)資助[Supported by the Research Start-Up Foundation of Zhejiang University of Science and Technology (No. F701103L11), the Research Innovation Foundation of Postgraduate (No. 2021yjskc11), and the National Training Program for College Students’ Innovation (No. 202211057026)]

        夏凱,博士,講師,研究方向:微生物遺傳與育種。E-mail: xiakai05@zust.edu.cn

        黃俊,博士,教授,研究方向:蛋白質(zhì)分子設(shè)計(jì)和定向進(jìn)化以及合成生物學(xué)。E-mail: huangjun@zust.edu.cn

        10.16288/j.yczz.23-139

        (責(zé)任編委: 高海春)

        国产在线精品一区二区中文| 国产午夜激情视频在线看| 国产一区二区三区av免费| 日本少妇高潮喷水xxxxxxx| 国产又黄又猛又粗又爽的a片动漫 亚洲精品毛片一区二区三区 | 亚洲人成网站色在线入口口| 蜜臀av999无码精品国产专区| 国产精品久久久久久久久鸭| 国产AV高清精品久久| 日韩av水蜜桃一区二区三区 | 日韩国产成人精品视频| 加勒比久草免费在线观看| 精品厕所偷拍一区二区视频| 东北妇女xx做爰视频| 国产精品亚洲А∨天堂免下载| 丰满人妻一区二区三区免费| 久久国内精品自在自线| 老熟妇仑乱视频一区二区| 国产一级免费黄片无码AV| 亚洲小少妇一区二区三区| 国产免费又色又爽粗视频| 91九色中文视频在线观看| 成年女人vr免费视频| 亚洲AV色无码乱码在线观看| 久久免费网站91色网站| 国产区女主播一区在线| 成人欧美一区二区三区1314| 国产aⅴ夜夜欢一区二区三区| 在线播放偷拍一区二区| 男人的天堂av高清在线| 久热综合在线亚洲精品| 亚洲电影久久久久久久9999| 丰满少妇一区二区三区专区| 日本视频一区二区三区一| 亚洲国产另类精品| 91热久久免费精品99| 一本色道88久久加勒比精品| 欧美国产综合欧美视频| 二区三区视频| 国产免费99久久精品| 亚洲av永久无码精品一福利|