胡日查,李偉程,呂瑞瑞,張和平
(內(nèi)蒙古農(nóng)業(yè)大學(xué)乳品生物技術(shù)與工程教育部重點(diǎn)實(shí)驗(yàn)室 農(nóng)業(yè)農(nóng)村部奶制品加工重點(diǎn)實(shí)驗(yàn)室內(nèi)蒙古乳品生物技術(shù)與工程重點(diǎn)實(shí)驗(yàn)室 呼和浩特 010018)
瑞士乳桿菌(Lactobacillus helveticus,L.helveticus)是一種專(zhuān)性同型發(fā)酵乳酸菌(Lactic acid bacteria,LAB),因高蛋白水解活性而被廣泛用于奶酪、發(fā)酵乳飲料等的生產(chǎn),是開(kāi)發(fā)功能性發(fā)酵乳制品的優(yōu)良菌種[1]。瑞士乳桿菌本身具有一定益生特性,其發(fā)酵生產(chǎn)的乳制品含有豐富的生物活性肽,在提高產(chǎn)品營(yíng)養(yǎng)價(jià)值的同時(shí)賦予產(chǎn)品緩解高血壓、調(diào)節(jié)免疫反應(yīng)等益生功能[2]。
隨著第2 代高通量測(cè)序技術(shù)的發(fā)展,測(cè)序所需的物質(zhì)和時(shí)間成本大大降低,使得大規(guī)模微生物基因組測(cè)序成為可能[3]。比較基因組學(xué)(Comparative genomics) 以不同物種或同一物種的不同個(gè)體的全基因組序列相似性為基礎(chǔ),預(yù)測(cè)基因數(shù)量、功能及其表達(dá)機(jī)制[4]。通過(guò)比較基因組學(xué)可識(shí)別物種的保守基因和差異基因,進(jìn)而討論其遺傳背景和表型演化[3,5],而全基因組完成圖可提供更全面的基因組信息,有利于準(zhǔn)確比較基因組分析[6]。瑞士乳桿菌作為重要的發(fā)酵劑菌種,利用比較基因組學(xué)方法解析其基因組信息,對(duì)開(kāi)發(fā)其工業(yè)生產(chǎn)潛力至關(guān)重要。
瑞士乳桿菌H9 和H10 是本團(tuán)隊(duì)分別從中國(guó)西藏發(fā)酵牦牛乳和傳統(tǒng)發(fā)酵乳中分離的瑞士乳桿菌菌株。瑞士乳桿菌H9 蛋白水解活性高,其發(fā)酵乳制品中含有VPP、IPP 等生物活性肽,而瑞士乳桿菌H10 同樣具有高蛋白水解活性,然而其發(fā)酵乳不產(chǎn)生上述寡肽[7]。本團(tuán)隊(duì)已完成對(duì)瑞士乳桿菌H9 和H10 的全基因組測(cè)序[8-9]。本研究以瑞士乳桿菌H9 和H10 基因組及NCBI 數(shù)據(jù)庫(kù)中其它16株瑞士乳桿菌基因組完成圖為研究對(duì)象,利用比較基因組學(xué)方法從基因組層面探究不同瑞士乳桿菌菌株間的遺傳差異,為其進(jìn)一步開(kāi)發(fā)應(yīng)用奠定遺傳學(xué)基礎(chǔ)。
本研究所用18 株瑞士乳桿菌全基因組完成圖均來(lái)自NCBI 數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/genome/?term=lactobacillus%20helveticus),詳情見(jiàn)表1。
本研究參考Goris 等[10]報(bào)道的方法,計(jì)算18株瑞士乳桿菌基因組序列的ANI 值。
利用Prokka(v1.14)[11]軟件進(jìn)行基因預(yù)測(cè),獲得基因功能注釋信息。
采用Roary(v3.13.0)[12]軟件以氨基酸序列相似性大于90%的標(biāo)準(zhǔn)識(shí)別核心基因集(Core genes)和特有基因,其中核心基因?yàn)樗芯旯灿谢?,特有基因指只存在? 個(gè)菌株的基因。
基于核心基因核苷酸序列,采用FastTree(2.1.3)[13]軟件通過(guò)最大似然法(Maximum Likelihood,ML)構(gòu)建系統(tǒng)發(fā)育樹(shù),使用iTol 軟件(http://https://itol.embl.de/)對(duì)系統(tǒng)發(fā)育樹(shù)進(jìn)行展示。
使用 Mauve (v20150226)軟件[14]對(duì)瑞士乳桿菌H9、瑞士乳桿菌H10 和瑞士乳桿菌DPC4571 的基因組序列進(jìn)行共線(xiàn)性分析。
使用R(V3.5.0)軟件中的“pheatmap”程序包繪制熱圖。
通過(guò)Prokka 軟件注釋獲得瑞士乳桿菌H9 和H10 及其它瑞士乳桿菌菌株基因組特征 (表1)。瑞士乳桿菌H9 基因組大小1.87 Mb,不含質(zhì)粒,GC(%)含量為37.02%,預(yù)測(cè)到2 015 個(gè)編碼序列(Coding sequence,CDS),12 個(gè)rRNA 和61 個(gè)tRNA(表1);瑞士乳桿菌H10 基因組由1 條染色體和1 個(gè)質(zhì)粒組成,全基因組大小為2.17 Mb,其中環(huán)狀染色體大小為2.15 Mb,GC(%)含量為36.79%,預(yù)測(cè)到2 237 個(gè)CDS,63 個(gè)tRNA。
乳酸菌在適應(yīng)其富營(yíng)養(yǎng)生存環(huán)境過(guò)程中,缺失多種合成代謝途徑,其基因組趨于縮小[15],瑞士乳桿菌基因組也正經(jīng)歷衰減[16]。所以推測(cè)瑞士乳桿菌H9 基因組較小可能與其對(duì)乳環(huán)境的適應(yīng)性有關(guān)。
構(gòu)建系統(tǒng)發(fā)育分析是研究種群結(jié)構(gòu)和物種進(jìn)化的重要方法,系統(tǒng)發(fā)育樹(shù)可直觀地表現(xiàn)同一群體不同個(gè)體間的遺傳距離與進(jìn)化關(guān)系[17]。為了解瑞士乳桿菌H9 和H10 與其它瑞士乳桿菌菌株之間的遺傳進(jìn)化關(guān)系,本研究以近源物種母雞乳桿菌(Lactobacillus gallinarum)HFD4 作為外群,基于核心基因的核苷酸序列,通過(guò)最大似然法(Maximum Likelihood,ML)構(gòu)建系統(tǒng)發(fā)育樹(shù)。
結(jié)果顯示(圖1),系統(tǒng)發(fā)育樹(shù)可分為4 個(gè)分支,瑞士乳桿菌H9 在距離外群菌株最遠(yuǎn)的分支IV,該分支內(nèi)的全部7 個(gè)菌株均為發(fā)酵乳制品分離株,其中包括工業(yè)發(fā)酵劑菌株瑞士乳桿菌CNRZ32;瑞士乳桿菌H10 和CUAH18 聚類(lèi)于分支II,該分支離外群菌株最近;4 個(gè)分支中人類(lèi)腸道/糞便分離株和發(fā)酵乳制品分離株呈混合聚類(lèi),如除瑞士乳桿菌H10、CUAH18 和R0052 外,其它乳制品分離株均聚類(lèi)于分支III 和分支IV,而3 株俄羅斯人類(lèi)腸道分離株聚類(lèi)于分支III 中的一個(gè)亞分支,發(fā)酵乳制品分離株ROO52 與2 株韓國(guó)人類(lèi)糞便分離株聚類(lèi)于分支I。王曉偉[18]基于245 株瑞士乳桿菌11 個(gè)持家基因序列型利用鄰接法構(gòu)建系統(tǒng)發(fā)育樹(shù)發(fā)現(xiàn),其聚類(lèi)結(jié)果與菌株分離地最小生成樹(shù)一致。關(guān)于分離地與分離源對(duì)瑞士乳桿菌進(jìn)化的影響有待進(jìn)一步研究。
圖1 基于核心基因序列的系統(tǒng)發(fā)育樹(shù)Fig.1 Phylogenetic tree based on core gene sequences
平均核苷酸一致性(Average nucleotide identity,ANI)是用以評(píng)估遺傳多樣性的常用方法。該方法通過(guò)對(duì)基因組進(jìn)行同源序列比對(duì)來(lái)判斷菌株是否為同一個(gè)種或亞種[19]。在比較基因組學(xué)分析中,ANI 可評(píng)估基因組間的多態(tài)性和相似性,一般認(rèn)為ANI 大于95%為同一個(gè)種[20]。Zhong 等[21]通過(guò)計(jì)算兩兩序列之間的ANI 值發(fā)現(xiàn)161 株糞腸球菌不同菌株之間存在遺傳差異。本研究計(jì)算18 株瑞士乳桿菌基因組完成圖(表1)兩兩之間ANI 值,并繪制熱圖。
號(hào)編NCBI地離分GCA_001308285.1疆新國(guó)中GCA_000422165.1-GCA_001746265.1斯羅俄GCA_001702095.1斯羅俄GCA_000015385.1-GCA_002849955.1士瑞GCA_002849935.1士瑞GCA_002849915.1士瑞GCA_000189515.1藏西國(guó)中GCA_000525715.1藏西國(guó)中GCA_004114755.1國(guó)韓GCA_000961015.1疆新國(guó)中GCA_003955865.1國(guó)韓GCA_003610975.1亞利加保GCA_009498395.1藏西國(guó)中GCA_001006025.1疆新國(guó)中GCA_902386585.1斯羅俄GCA_000165775.1大拿加息信本基組因基的菌桿乳士瑞1表General information of Lactobacillus helveticus genomes源離分tRNA rRNA量數(shù)CDS GC/%奶馬酸64 15 2 235 36.81酪奶64 12 2 407 36.93道腸童兒康健64 15 2 187 37.03道腸童兒康健64 15 2 192 37.04酪奶61 12 2 199 37.08清乳63 12 2 305 37.06酪奶62 12 2 395 37.03品制乳63 12 2 214 36.95乳酵發(fā)統(tǒng)傳63 12 2 265 36.79奶牛牦酸61 12 2 015 37.02便糞兒嬰63 12 2 185 36.83乳酵發(fā)61 12 2 255 36.88便糞類(lèi)人63 12 2 193 36.82乳酵發(fā)60 12 2 271 37.09奶酸63 12 2 326 36.92乳酵發(fā)63 12 2 337 36.93道腸類(lèi)人64 15 2 192 37.04乳酵發(fā)61 12 2 288 36.80 Table 1 /Mb小大組2.16 2.23 2.05 2.06 2.08 2.20 2.26 2.05 2.17 1.87 2.16 2.11 2.16 2.08 2.08 2.08 2.06 2.13因基量數(shù)Scaffolds稱(chēng)名株菌1 CAUH18 1 CNRZ32 1 D75 1 D76 1 DPC 4571 2 FAM22155 2 FAM8105 2 FAM8627 2 H10 1 H9 2 IDCC3801 2 KLDS1.8701 3 LH5 1 LH99 1 LZ-R-5 1 MB2-1 1 MGYG-HGUT-02384 1 R0052
結(jié)果如圖2所示,18 株瑞士乳桿菌基因組之間ANI 均大于97.25%,平均ANI 值為98.52%。根據(jù)ANI 值分布,18 株瑞士乳桿菌可分為4 個(gè)類(lèi)群,即類(lèi)群I、類(lèi)群II、類(lèi)群III 和類(lèi)群IV,瑞士乳桿菌H9 和H10 分別屬于類(lèi)群III 和類(lèi)群I,聚類(lèi)結(jié)果與系統(tǒng)發(fā)育樹(shù)基本一致;瑞士乳桿菌H9 與H10 間的ANI 值為98.02%,瑞士乳桿菌H9 與包括工業(yè)發(fā)酵劑菌株瑞士乳桿菌CNRZ32 在內(nèi)的9株發(fā)酵乳制品分離株之間平均ANI 值為99.01%,瑞士乳桿菌H10 與CAUH18 之間的ANI 值最高(99.48%),與其它菌株之間的ANI 值均較低(平均97.99%);人類(lèi)腸道和糞便分離株類(lèi)群(類(lèi)群II和類(lèi)群IV)內(nèi)部菌株間ANI 值極高(平均99.99%),而乳制品分離株類(lèi)群(類(lèi)群I 和類(lèi)群III)內(nèi)部菌株間ANI 值較低(平均98.50%),表明瑞士乳桿菌發(fā)酵乳制品分離株的基因組序列一致性比人類(lèi)腸道/糞便分離株低,推測(cè)瑞士乳桿菌基因組序列多樣性可能與其分離源有關(guān)。
圖2 18 株瑞士乳桿菌的ANI 值熱圖Fig.2 Heatmap of ANI based on the genome sequences of 18 L.helveticus
共線(xiàn)性分析可通過(guò)檢測(cè)不同物種間或同一物種不同個(gè)體基因組間同源序列及其排列順序的一致性來(lái)研究基因組間的相關(guān)性,基因組相關(guān)性越高則其中同源序列一致性越高[22]。瑞士乳桿菌DPC4571 分離自干酪,并于2008年完成全基因組測(cè)序,是第1 株完成全基因組測(cè)序的瑞士乳桿菌菌株[23]。本研究以瑞士乳桿菌DPC4571 菌株基因組序列作為參考,利用Mauve 軟件對(duì)瑞士乳桿菌H9 和H10 基因組進(jìn)行共線(xiàn)性分析。
結(jié)果如圖3所示,與瑞士乳桿菌DPC4571 比較,瑞士乳桿菌H10 有976 kb 的大片段倒置,而瑞士乳桿菌H9 基因組只存在局部倒置,其中主要含有cpoA (α-半乳糖基葡萄糖基二?;视秃厦福?、ItaS1(脂磷壁酸合酶1)等與細(xì)胞膜、細(xì)胞壁合成及tRNA 和rnr(核糖核酸酶R)等tRNA 修飾相關(guān)基因。瑞士乳桿菌H9 基因組中有2 處約17 kb 左右片段缺失,其中主要含有bbmA(糖基水解酶)、cysE(絲氨酸乙酰轉(zhuǎn)移酶)、ymdB(O-乙酰基-ADP-核糖脫乙酰酶)等涉及多糖、氨基酸及能量代謝等過(guò)程相關(guān)基因;瑞士乳桿菌H9 基因組有一處約10 kb 的特有片段,其中主要含有msrB(肽蛋氨酸亞砜還原酶)和deoD(嘌呤核苷磷酸化酶)等與蛋白質(zhì)和核酸的修飾相關(guān)基因;瑞士乳桿菌H10 有一處35.36 kb 特有片段,包含sasA(自適應(yīng)感應(yīng)激酶)、pepDA(二肽酶A)等基因,主要與環(huán)境感應(yīng)和蛋白水解等過(guò)程相關(guān)。
圖3 瑞士乳桿菌基因組序列共線(xiàn)性分析Fig.3 Synteny analysis of L.helveticus genomic sequences
基因片段插入和缺失是LAB 進(jìn)化過(guò)程中的常見(jiàn)現(xiàn)象。LAB 菌株在適應(yīng)其富營(yíng)養(yǎng)環(huán)境過(guò)程中,通過(guò)基因插入和缺失等事件丟失非必須基因和功能,同時(shí)以同源重組和水平基因轉(zhuǎn)移等途徑獲得有利于其適應(yīng)生存環(huán)境的功能基因[15,24]。兩株瑞士乳桿菌均有一定的基因片段插入或缺失現(xiàn)象發(fā)生,提示菌株在進(jìn)化過(guò)程中可能經(jīng)歷了基因重組和水平基因轉(zhuǎn)移等事件[25]。
為比較不同菌株所含基因差異,利用Roary軟件構(gòu)建泛-核心基因集。18 株瑞士乳桿菌的泛基因集包括5 792 個(gè)基因,其中核心基因1 107個(gè),特有基因1 527 個(gè)。
由圖4可知,隨著基因組數(shù)量的增加,核心基因個(gè)數(shù)逐漸減少,且趨于穩(wěn)定,泛基因個(gè)數(shù)持續(xù)增加,表明瑞士乳桿菌基因組具有開(kāi)放性,即隨著基因組數(shù)量的增加,仍有出現(xiàn)新基因的趨勢(shì)[26]。
圖4 泛-核心基因集變化趨勢(shì)圖Fig.4 The trend chart of the size of core-pan genes
在18 株瑞士乳桿菌的1 527 個(gè)特有基因中,除去假定蛋白和插入序列等單元,瑞士乳桿菌H9有5 個(gè)、瑞士乳桿菌H10 有22 個(gè)特有功能基因(表2)。瑞士乳桿菌H9 的特有功能基因主要涉及氨基酸合成(dapH)和能量代謝(dkgA)等途徑,其中dapH 有2 個(gè)拷貝;瑞士乳桿菌H10 的特有功能基因,主要參與氨基酸代謝(Csd、sufS、fbiB、pspA、sdhA)、能量代謝(Hpr、pox5、apbE、nfr1、nfr2)、跨膜轉(zhuǎn)運(yùn)(lutP、lysP、ytrE)等途徑。將糖類(lèi)轉(zhuǎn)化為乳酸是乳酸菌獲取能量的主要途徑[27]。瑞士乳桿菌在其適應(yīng)乳環(huán)境過(guò)程中丟失多種氨基酸的合成代謝途徑相關(guān)基因,依靠其蛋白水解系統(tǒng)降解乳蛋白獲取所需氨基酸[28]。瑞士乳桿菌H10 特有功能基因更多涉及能量代謝和氨基酸代謝,推測(cè)瑞士乳桿菌H9 的營(yíng)養(yǎng)缺陷相對(duì)更嚴(yán)重,瑞士乳桿菌H10 可能具有更強(qiáng)的產(chǎn)酸能力,但需進(jìn)一步研究驗(yàn)證。
表2 瑞士乳桿菌H9 和H10 特有功能基因Table 2 The unique genes of L.helveticus H9 and L.helveticus H10
本研究以瑞士乳桿菌H9 和H10 為例,結(jié)合NCBI 數(shù)據(jù)庫(kù)中其它16 株瑞士乳桿菌全基因組完成圖,基于比較基因組學(xué)分析發(fā)現(xiàn)瑞士乳桿菌不同菌株基因組大小、質(zhì)粒數(shù)量、CDSs、tRNA、rRNA數(shù)量均存在差異;瑞士乳桿菌H9 和H10 基因組大小、質(zhì)粒、CDSs、tRNA 數(shù)量和染色體結(jié)構(gòu)均有差異。系統(tǒng)發(fā)育樹(shù)結(jié)果顯示,瑞士乳桿菌H9 與工業(yè)發(fā)酵劑菌株瑞士乳桿菌CNRZ32 的系統(tǒng)發(fā)育關(guān)系更近,瑞士乳桿菌H10 更接近外群菌株;平均核苷酸一致性聚類(lèi)結(jié)果與系統(tǒng)發(fā)育樹(shù)大致相同,瑞士乳桿菌H9 和H10 聚類(lèi)于不同類(lèi)群,瑞士乳桿菌發(fā)酵乳制品分離株的基因組序列一致性低于人類(lèi)腸道/糞便分離株;與參考菌株瑞士乳桿菌DPC4571 相比,瑞士乳桿菌H9 和H10 均有不同程度的片段插入、缺失和倒置;瑞士乳桿菌H9 和H10 特有功能基因存在差異,瑞士乳桿菌H10 的特有功能基因更多涉及氨基酸和能量代謝。本文通過(guò)比較基因組學(xué)分析發(fā)現(xiàn)瑞士乳桿菌不同菌株基因組之間存在遺傳差異,為后續(xù)對(duì)瑞士乳桿菌的研究和應(yīng)用奠定遺傳學(xué)基礎(chǔ)。