陳良強(qiáng),楊 帆,王和玉,汪地強(qiáng),王 莉
(貴州茅臺(tái)酒股份有限公司技術(shù)中心,貴州仁懷564501)
基于細(xì)菌群落構(gòu)成對(duì)高溫大曲類別的判別分析
陳良強(qiáng),楊帆,王和玉,汪地強(qiáng),王莉
(貴州茅臺(tái)酒股份有限公司技術(shù)中心,貴州仁懷564501)
利用二代測(cè)序技術(shù)對(duì)茅臺(tái)3種典型代表曲的細(xì)菌群落結(jié)構(gòu)進(jìn)行了解析,共發(fā)現(xiàn)580個(gè)不同細(xì)菌,表明茅臺(tái)高溫大曲細(xì)菌群落組成的多樣性和復(fù)雜性。通過(guò)分析樣品中細(xì)菌群落構(gòu)成的特點(diǎn),運(yùn)用偏最小二乘法對(duì)微生物變量進(jìn)行了篩選,并結(jié)合Fisher判別等多元統(tǒng)計(jì)分析方法,建立了基于細(xì)菌群落構(gòu)成的高溫大曲類別的判別模型。該判別模型對(duì)不同類別大曲綜合判別準(zhǔn)確率為96.8%,外部測(cè)試樣品判別準(zhǔn)確率為92.2%,這證實(shí)了大曲微生物群落結(jié)構(gòu)信息與3種典型代表曲具有較強(qiáng)的關(guān)聯(lián)性,所建立的判別模型準(zhǔn)確有效。
高溫大曲; 高通量測(cè)序; 細(xì)菌群落構(gòu)成; 偏最小二乘法; 判別分析
曲是白酒釀造不可或缺的一部分,有著“酒之骨”之稱。醬香型白酒釀造過(guò)程所使用的曲為高溫大曲,其制曲過(guò)程經(jīng)歷低、中、高3個(gè)溫度過(guò)程,形成了豐富的微生物群落結(jié)構(gòu),包括細(xì)菌、酵母與霉菌,其中細(xì)菌數(shù)量最高[1-2]。王曉丹等[3]利用高通量測(cè)序技術(shù)分析了3種不同廠家的成品高溫大曲細(xì)菌群落結(jié)構(gòu),共檢測(cè)出6個(gè)門(mén)49個(gè)屬細(xì)菌,其中以高溫放線菌屬和芽孢桿菌屬為主要優(yōu)勢(shì)細(xì)菌。由于細(xì)菌是高溫大曲的優(yōu)勢(shì)微生物,因而有大量的學(xué)者對(duì)高溫大曲中細(xì)菌的種類和功能進(jìn)行了研究。聶慧芳等[4]從醬香型大曲成品曲中篩選得到2株高產(chǎn)蛋白酶的枯草芽孢桿菌。邱樹(shù)毅等[5-7]對(duì)高溫大曲酸性蛋白酶、糖化酶、纖維素酶、果膠酶和脂肪酶進(jìn)行活力測(cè)定,并對(duì)篩選出的48株細(xì)菌進(jìn)行了不同細(xì)菌的產(chǎn)酶特性分析。趙興秀[8]、朱德文[9]、張榮等[10-11]都對(duì)高溫大曲中產(chǎn)香功能細(xì)菌進(jìn)行了篩選與分離,發(fā)現(xiàn)芽孢桿菌對(duì)大曲中醬香香氣貢獻(xiàn)度大。因此,大曲中細(xì)菌的群落結(jié)構(gòu)組成對(duì)大曲的品質(zhì)和類別起著重要的作用。但在自然界,利用傳統(tǒng)的培養(yǎng)分離技術(shù)所分離得到的微生物只占總數(shù)的1%左右,因此免培養(yǎng)方式可較為全面解析大曲中的微生物群落構(gòu)成。
隨著分子生物學(xué)及其方法的發(fā)展,二代測(cè)序方法是近些年來(lái)發(fā)展比較成熟的DNA測(cè)序技術(shù),可快速實(shí)現(xiàn)大規(guī)模多樣本的微生物群落分析,被廣泛應(yīng)用于土壤、海洋、人體與動(dòng)物腸道菌群組成的對(duì)比及分析[12-15]。
本研究擬根據(jù)對(duì)大曲微生物高通量測(cè)序結(jié)果進(jìn)行數(shù)理統(tǒng)計(jì)分析,應(yīng)用偏最小二乘法對(duì)大曲微生物信息進(jìn)行篩選與優(yōu)化,結(jié)合Fisher判別對(duì)優(yōu)化后的微生物數(shù)據(jù)信息進(jìn)行處理分析,建立高溫大曲類別的判別模型,從而為生產(chǎn)提供一定的指導(dǎo)作用。
1.1材料
樣品來(lái)源于貴州茅臺(tái)酒股份有限公司,其中用于建模的樣品共154個(gè):出倉(cāng)白曲(20個(gè))、出倉(cāng)黃曲(21個(gè))、成品曲(113個(gè));用于外部測(cè)試的樣品51個(gè):出倉(cāng)白曲(7個(gè))、出倉(cāng)黃曲(8個(gè))、成品曲(36個(gè))。
1.2實(shí)驗(yàn)方法
按照參考文獻(xiàn)[2,16]的方法對(duì)樣品DNA進(jìn)行提取與純化,以及PCR擴(kuò)增,所得樣品送深圳華大基因公司454 GS FLX Titanium測(cè)序平臺(tái),采用16S rDNA的高變區(qū)測(cè)序技術(shù),對(duì)各樣品的16S rDNA的可變區(qū)V4—V5的PCR產(chǎn)物進(jìn)行測(cè)序。
對(duì)測(cè)序后的下機(jī)數(shù)據(jù)(reads)進(jìn)行整理和質(zhì)量控制,去除測(cè)序接頭和低質(zhì)量reads后,再進(jìn)行組裝,從而獲得用于后續(xù)分析的序列。同時(shí)采用mothur軟件包按照97%的離散度進(jìn)行聚類,將序列歸為1個(gè)操作分類單元(operational taxonomic unit,OTU),OTU序列經(jīng)與RDP數(shù)據(jù)庫(kù)比對(duì)獲得物種分類的信息[17]。
1.3數(shù)據(jù)分析
利用SIMCA-P軟件進(jìn)行偏最小二乘法(PLS)分析,完成對(duì)微生物變量的篩選與優(yōu)化。根據(jù)優(yōu)化后的微生物變量,運(yùn)用R語(yǔ)言對(duì)高溫大曲類別進(jìn)行Fisher判別。
2.1高溫大曲微生物群落結(jié)構(gòu)組成
利用454高通量測(cè)序技術(shù),對(duì)所有樣品進(jìn)行測(cè)序分析,共獲得580個(gè)微生物種類(微生物編號(hào)為x1、x2、x3、x4、x5……x576、x577、x578、x579、x580)與每種微生物的相對(duì)含量。
2.2微生物變量的篩選
由于高溫大曲中微生物群落組成復(fù)雜,若直接將580個(gè)微生物變量用于大曲類別的判別,將會(huì)造成判別模型的準(zhǔn)確性差和運(yùn)行效率低,因此,必須對(duì)微生物變量進(jìn)行初步篩選,選擇對(duì)樣品質(zhì)量分類貢獻(xiàn)大的微生物變量指標(biāo)用于后續(xù)的分析。偏最小二乘法是一種新型的多元統(tǒng)計(jì)數(shù)據(jù)分析方法,其變量投影重要性指標(biāo)VIP值是反映自變量在解釋因變量作用時(shí)的重要性,因此可以根據(jù)VIP值的大小篩選與優(yōu)化判別模型中自變量的數(shù)量[18-20]。
將獲取微生物變量與樣品信息輸入SIMCA-P軟件,利用偏最小二乘法,對(duì)獲得的微生物變量進(jìn)行篩選與優(yōu)化,根據(jù)變量投影重要性指標(biāo)(VIP)值≥1的原則,進(jìn)行變量篩選。結(jié)果發(fā)現(xiàn)共有12種微生物的VIP值≥1(圖1)。
圖1 VIP≥1的微生物變量
為進(jìn)一步驗(yàn)證這12種微生物在大曲樣品中的代表性,對(duì)該12種微生物在所有樣品中出現(xiàn)的頻率和含量進(jìn)行了統(tǒng)計(jì)分析,結(jié)果見(jiàn)表1。
表1 篩選得到的12種微生物在樣品中的出現(xiàn)頻率和含量
由表1可知,這12種微生物幾乎在所有的樣品中都能檢測(cè)到,且平均總含量占大曲細(xì)菌含量的80.79%,這進(jìn)一步證實(shí)該12種微生物能較為全面代表大曲中微生物的信息,因此將作為后續(xù)分析中判別標(biāo)準(zhǔn)的變量。另一方面,結(jié)合圖1和表1可以發(fā)現(xiàn),有些微生物含量雖然低,但其VIP值≥1,表明高溫大曲中細(xì)菌群落結(jié)構(gòu)的復(fù)雜性。
2.3判別模型的構(gòu)建
通過(guò)R語(yǔ)言的程序包,采用Fisher判別分析方法,以上述12種微生物數(shù)據(jù)為自變量對(duì)3種高溫大曲(白曲、黃曲和成品曲)進(jìn)行判別分析,構(gòu)建高溫大曲類別的判別函數(shù)。
利用交叉驗(yàn)證對(duì)建模樣品進(jìn)行回判,以驗(yàn)證判別效果,結(jié)果見(jiàn)圖2和表2。
圖2 不同類別大曲的判別結(jié)果
表2 建模樣品交叉驗(yàn)證結(jié)果
從表2可以看出,用于建模的樣品共154個(gè):白曲(20個(gè))、黃曲(21個(gè))、成品曲(113個(gè))。該二次判別對(duì)白曲的判別準(zhǔn)確率為17/20=85.0%,對(duì)出倉(cāng)黃曲的判別準(zhǔn)確率為20/21=95.2%,對(duì)成品曲的判別準(zhǔn)確率為112/113= 99.1%,綜合判別準(zhǔn)確率為(17+20+112)/(20+21+113)= 96.8%,表明所建立的判別模型對(duì)大曲質(zhì)量鑒別的判別較為有效。
為了進(jìn)一步驗(yàn)證該判別模型,選擇51個(gè)外部的測(cè)試樣品(白曲7個(gè)、黃曲8個(gè)、成品曲36個(gè))對(duì)模型進(jìn)行測(cè)試,結(jié)果見(jiàn)表3。
表3 外部測(cè)試樣品驗(yàn)證結(jié)果
從表3可以看出,該二次判別對(duì)外部測(cè)試樣品中白曲的判別準(zhǔn)確率為6/7=85.7%,對(duì)黃曲的判別準(zhǔn)確率為7/8=87.5%,對(duì)成品曲的判別準(zhǔn)確率為34/36=94.4%,綜合判別準(zhǔn)確率為(6+7+34)/51=92.2%,該結(jié)果進(jìn)一步表明所建立的判別模型對(duì)3種典型代表曲的判別效果較好。
本研究運(yùn)用二代測(cè)序技術(shù),對(duì)茅臺(tái)高溫大曲細(xì)菌群構(gòu)成進(jìn)行了解析,結(jié)果發(fā)現(xiàn)共有580個(gè)不同細(xì)菌,表明茅臺(tái)大曲細(xì)菌群落組成的復(fù)雜性與多樣性。同時(shí)通過(guò)分析高溫大曲細(xì)菌群落的構(gòu)成特點(diǎn),運(yùn)用偏最小二乘法對(duì)微生物變量進(jìn)行了篩選,并結(jié)合Fisher判別等多元統(tǒng)計(jì)分析方法,建立了基于細(xì)菌群落構(gòu)成的高溫大曲類別的判別模型。該判別模型對(duì)不同類別大曲綜合判別準(zhǔn)確率為96.8%,外部測(cè)試樣品判別準(zhǔn)確率為92.2%,這表明大曲微生物群落結(jié)構(gòu)信息與3種典型代表曲具有較強(qiáng)的關(guān)聯(lián)性,所建立的判別模型準(zhǔn)確有效。
[1]楊代永,范光先,汪地強(qiáng),等.高溫大曲中的微生物研究[J].釀酒科技,2007(5):37-38.
[2]Wang L,Wang YY,Wang D Q,et al.Dynamic changes in the bacterial community in Moutai liquor fermentation process characterized by deep sequencing[J].Journal of the Institute of Brewing,2015,121(4):603-608.
[3]王曉丹,班世棟,周鴻翔,等.貴州省遵義地區(qū)3個(gè)醬香型大曲細(xì)菌群落的比較分析[J].食品科學(xué),2016(37):110-116.
[4]聶慧芳,蔣英麗,沈毅,等.醬香型大曲中高產(chǎn)蛋白酶細(xì)菌的分離鑒定[J].釀酒科技,2015(12):41-44.
[5]王婧,王曉丹,羅曉葉,等.醬香大曲中高產(chǎn)蛋白酶功能細(xì)菌的篩選及鑒定[J].中國(guó)釀造,2015,34(10):43-46.
[6]楊國(guó)華,邱樹(shù)毅,黃永光.醬香大曲中產(chǎn)香細(xì)菌發(fā)酵產(chǎn)蛋白酶的條件優(yōu)化[J].中國(guó)釀造,2011(12):47-50.
[7]王曉丹,胡寶東,班世棟,等.醬香型大曲酶系與大曲中微生物產(chǎn)酶關(guān)系的研究[J].釀酒科技,2015(9):1-7.
[8]趙興秀,何義國(guó),趙長(zhǎng)青,等.產(chǎn)醬香功能菌的篩選及其風(fēng)味物質(zhì)研究[J].食品工業(yè)科技,2016(6).
[9]朱德文,蔣英麗,高鴻,等.醬香型大曲中一株產(chǎn)香芽孢桿菌的分離鑒定[J].釀酒科技,2014(6):39-41.
[10]Zhang R,Wu Q,Xu Y.Aroma characteristics of Moutaiflavour liquor produced with Bacillus licheniformis by solid-state fermentation[J].Letters inApplied Microbiology,2013,57(1):11-18.
[11]Zhang R,Wu Q,Xu Y,et al.Isolation,identification,and quantification of lichenysin,a novel nonvolatile compound in Chinese distilled spirits[J].Journal of Food Science,2014,79 (10):C1907-C1915.
[12]Kong F,Zhao J,Han S,et al.Characterization of the gut microbiota in the red panda(Ailurus fulgens).[J].Plos One,2014,9(2):e87885.
[13]楊帆,陳良強(qiáng),羅汝葉,等.基于箱線圖對(duì)大曲質(zhì)量的判別分析[J].釀酒科技,2015(5):1-3.
[14]Wu X,Zhang H,Chen J,et al.Comparison of the fecal microbiota of dholes high-throughput Illumina sequencing of the V3-V4 region of the 16S rRNAgene[J].Applied Microbiology&Biotechnology,2016:1-10.
[15]王莉,王亞玉,王和玉,等.醬香型白酒窖底泥微生物組成分析[J].釀酒科技,2015(1):12-15.
[16]Tamaki H,Wright C L,Li X,et al.Analysis of 16S rRNA amplicon sequencing options on the Roche/454 nextgeneration titanium sequencing platform[J].Plos One,2011,6 (9):e25263.
[17]Cole1 J R,Wang Q,Cardenas E,et al.The Ribosomal Database Project:improved alignments and new tools for rRNAanalysis.[J].NucleicAcids Research,2009,37:D141-D145.
[18]Maulidiani,Abas F,KhatibA,et al.Comparison of Partial Least Squares andArtificial Neural Network for the prediction of antioxidant activity in extract of Pegaga (Centella)varieties from 1H Nuclear Magnetic Resonance spectroscopy[J].Food Research International,2013,54(1):852-860.
[19]Cuevas F J,Morenorojas J M,Arroyo F,et al.Effect of management(organic vs conventional)on volatile profiles of six plum cultivars(Prunus salicina Lindl.).Achemometric approach for varietal classification and determination of potential markers[J].Food Chemistry,2016,199:479-484.
[20]胡超,湯響林,李杰,等.基于UPLC/QTOF-MS技術(shù)的補(bǔ)骨脂水提物對(duì)大鼠血漿代謝組學(xué)研究[J].中藥藥理與臨床,2016 (1):22-26.
Discriminant Analysis of High-Temperature Daqu Types Based on the Composition of Bacterial Populations
CHEN Liangqiang,YANG Fan,WANG Heyu,WANG Diqiang and WANG Li
(Technical Center of Maotai Co.Ltd.,Renhuai,Guizhou 564501,China)
In the experiment,the bacterial populations in three typical Maotai Daqu were analyzed through next-generation sequencing technology,and 580 kinds of bacteria were detected,which proved the complexity and the diversity of high-temperature Daqu bacterial communities. Through analysis of the characteristics of bacterial poplulations composition in Daqu samples,the microbiological variables were screened by using partial least squares method.Futhermore,the discriminant model of high-temperature Daqu had been established with the combination of multivariate statistical analysis methods such as Fisher discriminant.The discriminant accuracy rate of such model for different Daqu types was 96.8%,and the discriminant accuracy rate of external test samples reached up to 92.2%,which proved that the microbial community structure had strong correlations with the three kinds of typical Daqu and the established discriminant model was accurate and effective.
high-temperature Daqu;high-throughput sequencing;bacterial populations;partial least squares method;discriminant analysis
TS261.1;Q93-3;TS262.3
A
1001-9286(2016)09-0048-03
10.13746/j.njkj.2016183
2016-05-27
陳良強(qiáng)(1987-),男,助理工程師,主要從事釀造微生物代謝產(chǎn)物及功能特性研究,E-mail:chenliangqiang123@126.com.。
楊帆(1983-),男,釀造工程師,主要從事釀造微生物代謝產(chǎn)物及功能特性研究,發(fā)表論文數(shù)篇,E-mail:yangfanmt@189.cn。
優(yōu)先數(shù)字出版時(shí)間:2016-07-26;地址:http://www.cnki.net/kcms/detail/52.1051.TS.20160726.1254.005.html。