林 云,歐陽璐斯,賴燕華,潘曉薇,盧嘉健
(廣東中煙工業(yè)有限責(zé)任公司,技術(shù)中心,廣東廣州 510385)
霉菌屬于真菌類微生物,在自然界中分布十分廣泛。煙草作為一種農(nóng)產(chǎn)品,即使經(jīng)過高溫烘烤,依然會(huì)有霉菌孢子殘留在葉片上。在運(yùn)輸和儲(chǔ)存過程中,如果遇到適合霉菌生長的溫濕度環(huán)境,則很容易出現(xiàn)霉變。霉變會(huì)使煙葉結(jié)構(gòu)被破壞,香氣消失,刺激性增大,并產(chǎn)生苦澀、霉臭味,嚴(yán)重影響煙葉質(zhì)量[1]。以往對(duì)煙葉霉變的質(zhì)量控制手段通常為霉菌計(jì)數(shù),然而霉菌的種類有很多,并不是所有種類的霉菌都具有較大的危害,因此單純的霉菌計(jì)數(shù)并不能對(duì)煙草的食品安全性做出客觀全面的評(píng)估[2]。煙草上常見霉菌分為多個(gè)屬種,如黃曲霉、煙曲霉、黑曲霉和桔青霉等,不同的屬種發(fā)展成最優(yōu)勢(shì)菌群進(jìn)行大量增殖后其危害性有所差異[3]。為了能夠更科學(xué)、系統(tǒng)的進(jìn)行煙葉防霉工作,亟需開發(fā)快速鑒別煙葉上的最優(yōu)勢(shì)菌群種類的方法。
現(xiàn)有的最優(yōu)勢(shì)霉菌種類鑒別方法有形態(tài)學(xué)法、代謝產(chǎn)物檢測(cè)法和rDNA-ITS序列分析法。葛志文等[4]利用形態(tài)學(xué)法對(duì)稻谷儲(chǔ)藏期間主要優(yōu)勢(shì)霉菌進(jìn)行分離和鑒定,發(fā)現(xiàn)主要優(yōu)勢(shì)霉菌為黃曲霉、黑曲霉、白曲霉、灰綠曲霉和產(chǎn)黃青霉。李志賢等[5]利用HPLC-TOF/MS法對(duì)曲霉代謝物中黃曲霉毒素進(jìn)行檢測(cè),建立了一種霉菌有毒代謝物篩選和分類鑒定的方法。岳曉禹等[6]從玉米中分離出一株優(yōu)勢(shì)腐敗霉菌M13,通過形態(tài)特征觀察和rDNA-ITS序列分析,將該菌株鑒定為米曲霉。以上方法都有各自的優(yōu)點(diǎn),但也各有不同的缺陷。其中,形態(tài)學(xué)法存在檢測(cè)周期比較長的問題,一般需要7~10 d,鑒定結(jié)果易受雜菌干擾。代謝產(chǎn)物檢測(cè)法、免疫測(cè)定法和rDNAITS序列分析法則都需要復(fù)雜的前處理步驟,對(duì)實(shí)驗(yàn)人員、試劑、設(shè)備和環(huán)境的要求也相對(duì)較高,且分別存在提取和凈化效果不理想、特異性抗體制備難度大、測(cè)序結(jié)果比對(duì)工作量大等問題[4?18]。
近年來,快速霉菌酵母測(cè)試片作為霉菌快速檢測(cè)技術(shù),在食品領(lǐng)域得到廣泛應(yīng)用,其培養(yǎng)時(shí)間相對(duì)傳統(tǒng)的培養(yǎng)基法大大縮短。但在以往的研究中,快速霉菌酵母測(cè)試片普遍用于霉菌和酵母的計(jì)數(shù),無法直接鑒別霉菌種類[19]。光譜技術(shù)是近年來發(fā)展迅速的分析技術(shù)之一,其中傅里葉變換紅外光譜(Fourier transform infrared spectroscopy,F(xiàn)TIR)、拉曼光譜(Raman spectra,RS)和傅里葉變換近紅外光譜(Fourier transform near infrared spectroscopy,F(xiàn)TNIR)技術(shù)在微生物研究領(lǐng)域取得了一些成果,在食品、制藥等很多行業(yè)中有一定的應(yīng)用[9,20]?,F(xiàn)有基于光譜技術(shù)的霉菌研究有兩類,一類仍停留在利用近紅外技術(shù)預(yù)判霉變程度,并沒有深入到菌種鑒別的層面[21?23];另一類是采集單一種類的干菌粉或孢子懸浮液光譜圖,利用PCA、LDA或PLS-DA等方法建立分類模型[24?26],該類方法僅能掃描純種菌種進(jìn)行鑒別,檢測(cè)時(shí)仍需要進(jìn)行漫長的菌種分離、凍干菌粉制備等前處理步驟,操作過程繁瑣,應(yīng)用場(chǎng)景狹窄,實(shí)用性較低。
鑒于此,本文首次提出一種霉菌酵母測(cè)試片結(jié)合NIR技術(shù)快速鑒別霉變煙葉上最優(yōu)勢(shì)霉菌種類的方法。將霉變煙葉樣本稀釋液用快速霉菌酵母測(cè)試片壓片培養(yǎng),并運(yùn)用近紅外光譜法直接對(duì)測(cè)試片上的菌落及其特征代謝產(chǎn)物進(jìn)行表征。利用離散小波變換對(duì)光譜進(jìn)行預(yù)處理,并利用隨機(jī)森林算法從小波系數(shù)中識(shí)別不同種類最優(yōu)勢(shì)霉菌的特征信息,建立最優(yōu)勢(shì)菌種識(shí)別模型,以期為霉變煙草提供優(yōu)勢(shì)霉菌種類的快速鑒別方法。
復(fù)烤煙 選取147份不同年份、不同產(chǎn)地、不同等級(jí)的復(fù)烤煙葉,由廣東中煙工業(yè)有限責(zé)任公司提供;PetrifilmTM快速霉菌酵母測(cè)試片 美國3M公司;全過濾型均質(zhì)袋 Interscience公司;氯化鈉、乙醇 分析純,國藥集團(tuán)化學(xué)試劑有限公司。
MPA傅立葉變換近紅外光譜儀 德國Bruker公司;BSA224S-CW電子天平 Sartorious公司;KBF恒溫恒濕箱 Binder公司;BA-2S拍打式無菌均質(zhì)器 上海本昂科學(xué)儀器有限公司;Double Biocao RNA/DNA超凈臺(tái) Erlab公司。
1.2.1 霉變煙葉樣品的制備 取復(fù)烤煙葉樣品分別放置在溫度(25±2)℃,濕度(80%±5%)的恒溫恒濕箱中進(jìn)行人工霉變[21],每份樣品之間互相隔開以免交叉污染。煙葉發(fā)霉后,用形態(tài)學(xué)法[4]進(jìn)行菌種鑒別,將每份樣品中最優(yōu)勢(shì)霉菌的屬種信息作為建模的基礎(chǔ)數(shù)據(jù)。
1.2.2 含菌測(cè)試片樣本的制備 在無菌環(huán)境下,將霉變煙葉放入均質(zhì)袋中,按1:9的比例加入滅菌生理鹽水,并放在拍打式無菌均質(zhì)器上拍打1 min,制成10?1的霉變樣品稀釋液。將10?1的霉變樣品稀釋液用滅菌生理鹽水分別稀釋成 10?2、10?3和 10?4濃度,使每份霉變煙葉樣品共獲得四個(gè)梯度的稀釋液[4]。用快速霉菌酵母測(cè)試片對(duì)四個(gè)梯度的稀釋液分別進(jìn)行壓片,于(28±2)℃ 培養(yǎng) 2.5~3 d,如此便能獲得具有不同優(yōu)勢(shì)霉菌種類、不同煙葉成分基底、不同稀釋液濃度信息的含菌測(cè)試片樣本。
1.2.3 近紅外光譜掃描 將含菌測(cè)試片剪成與近紅外專用樣品杯內(nèi)徑匹配的圓形,正面朝下平整的放入近紅外專用樣品杯中并壓上壓樣器,然后將樣品杯放置在近紅外光譜儀的旋轉(zhuǎn)臺(tái)上進(jìn)行光譜掃描。儀器參數(shù)為:光譜采集范圍 4000~12000 cm?1,分辨率8 cm?1,掃描次數(shù) 64 次。
1.2.4 光譜預(yù)處理 由于近紅外光譜儀采集到的數(shù)據(jù)信號(hào)除了待測(cè)成分信息外,還包含了高頻隨機(jī)噪聲、基線漂移和雜散光等無關(guān)信息,因此需要采用數(shù)學(xué)前處理方法減少系統(tǒng)噪聲。光譜的前處理方法有很多種,如導(dǎo)數(shù)(Derivative)、標(biāo)準(zhǔn)正態(tài)變量變換(Standard normal variate transform,SNV)、多元散射校正(Multiple scattering correction,MSC)等[27?28]。在進(jìn)行多方面對(duì)比后,本研究最終采用的數(shù)據(jù)預(yù)處理方法為離散小波變換(Discrete wavelet transformation,DWT)。小波變換是一種高效的信號(hào)處理方法,其實(shí)質(zhì)是把信號(hào)分解成各個(gè)不同尺度和位移的小波,具有傅里葉不存在的多分辨率分析特征。該方法在化學(xué)計(jì)量學(xué)中常被用來進(jìn)行平滑去噪、數(shù)據(jù)壓縮和基線扣除等計(jì)算[29?32]。本研究利用小波變換將傅里葉近紅外光譜數(shù)據(jù)在頻域內(nèi)進(jìn)行多尺度分解,獲得相對(duì)應(yīng)的低頻小波系數(shù)及高頻小波系數(shù)。其中,低頻小波系數(shù)主要顯示信號(hào)的近似分量,高頻系數(shù)則主要顯示為細(xì)節(jié)分量和大部分噪聲分量[21,32]。通過在不同尺度上的分解去噪和重構(gòu)信號(hào),可為建立優(yōu)勢(shì)霉菌種類模型去除干擾信息,提供更加純凈的信號(hào)基礎(chǔ)。
1.2.5 建模方法 隨機(jī)森林(Random forest,RF)是由Leo Breiman于2001年提出的一種將決策樹和Bootstrap重抽樣方法結(jié)合起來的一種分類算法。它用Bagging方法生成有差異的訓(xùn)練集,并在此基礎(chǔ)上引入隨機(jī)選擇屬性。這種“雙隨機(jī)”的策略能讓各個(gè)子分類器之間形成較大的差異,使其具有優(yōu)越的分類性能[30?31]。本研究利用RF算法從小波系數(shù)中識(shí)別不同種類優(yōu)勢(shì)霉菌的特征信息,建立優(yōu)勢(shì)菌種識(shí)別模型。RF分類器訓(xùn)練有兩個(gè)參數(shù)需要優(yōu)化,分別為森林中決策樹數(shù)量(ntree)和決策樹節(jié)點(diǎn)樹數(shù)量(mtry),本研究中 ntree采用 500,mtry取總變量數(shù)的平方根。
采用Matlab 2015和Microsoft Excel 2007進(jìn)行數(shù)據(jù)處理和統(tǒng)計(jì)分析。
由于一份樣品在一定環(huán)境內(nèi)能給霉菌提供的資源有限,當(dāng)某一種霉菌大量增殖,便會(huì)擠占其他霉菌的生態(tài)位,在數(shù)量上和作用上都占領(lǐng)最主導(dǎo)的地位,成為最優(yōu)勢(shì)菌。雖然自然界霉菌種類很多,煙草上能夠檢出的霉菌種類也不少,但在一定的溫濕度條件下,煙草上易于發(fā)展為最優(yōu)勢(shì)菌的霉菌種類并不多[33]。在本研究的147份霉變煙草樣本中,每份樣本檢出的最優(yōu)勢(shì)霉菌覆蓋了3個(gè)屬7個(gè)種,其中屬包括曲霉屬(Aspergillus)、青霉屬(Penicillium)和毛霉屬(Mucor)。曲霉屬覆蓋了4個(gè)種,分別為黃曲霉(Aspergillus flavus)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)和煙曲霉(Aspergillus fumigatus),青霉屬覆蓋了 2個(gè)種,分別為桔青霉(Penicillium citrinum)和產(chǎn)黃青霉(Penicillium Chrysogenum),毛霉屬檢出的是總狀毛霉(Mucor racemosus)。在所有的優(yōu)勢(shì)霉菌樣本中,檢出率最高的為曲霉,其次為青霉,曲霉中又以黃曲霉最常見。
將霉變樣本分別用生理鹽水稀釋成不同的倍數(shù)后用測(cè)試片進(jìn)行壓制和培養(yǎng)。選擇霉菌酵母測(cè)試片作為霉菌培養(yǎng)和光譜掃描的載體的優(yōu)勢(shì)有以下幾點(diǎn):一是其基底背景相對(duì)單純,使得本方法具有一定的泛用性,不僅限于煙草領(lǐng)域,在其他食品領(lǐng)域的應(yīng)用也具有較大的可能性。二是菌種在快速霉菌酵母測(cè)試片的培養(yǎng)時(shí)間比傳統(tǒng)培養(yǎng)基法短,前處理步驟也不包含菌種分離、凍干粉制備等,這能明顯縮短檢測(cè)時(shí)間。三是菌種在測(cè)試片上能夠比干菌粉和孢子懸浮液留下更完整的代謝產(chǎn)物信息,使得最終采集到的光譜信息更加豐富且更具特異性。四是可使霉菌鑒種和計(jì)數(shù)同步進(jìn)行,將計(jì)數(shù)用的測(cè)試片直接進(jìn)行光譜掃描即可預(yù)測(cè)出最優(yōu)勢(shì)菌種類型。同一個(gè)廠商生產(chǎn)的空白霉菌酵母測(cè)試片的基底是相同的,不同的壓片由于霉變樣品煙葉化學(xué)成分、稀釋液倍數(shù)、優(yōu)勢(shì)霉菌種類等各有差異,其呈現(xiàn)出的底色、菌落的大小和密度也不一樣,經(jīng)肉眼判斷無法直接識(shí)別霉菌種類。部分稀釋液由于稀釋倍數(shù)高,制得的壓片含菌過少,甚至是不含菌,不適宜用來掃描建模,因此需要將其剔除。試驗(yàn)最終獲得428份含菌測(cè)試片樣本,樣本的具體信息見表1。
表1 樣本最優(yōu)勢(shì)霉菌種類信息Table 1 Information of the most dominant mold in samples
將428份含菌測(cè)試片樣本用傅里葉近紅外光譜儀進(jìn)行掃描,獲得含有各種信息的傅里葉近紅外光譜數(shù)據(jù)。由于物質(zhì)在近紅外譜區(qū)的吸收主要是包括CH,N-H,O-H,S-H,C=O,C=C在內(nèi)的有機(jī)分子基團(tuán)基頻振動(dòng)的合頻和倍頻振動(dòng)吸收,而不同最優(yōu)勢(shì)霉菌的細(xì)胞、孢子及代謝產(chǎn)物等的化學(xué)組分均有各自的特異性,因此不同的最優(yōu)勢(shì)霉菌在近紅外光譜吸收應(yīng)當(dāng)有所差異。然而,從圖1可以看出,近紅外光譜吸收峰重疊十分嚴(yán)重,多組分復(fù)雜樣品的近紅外光譜不是各組分單獨(dú)光譜的疊加,單純從譜圖中無法直觀的識(shí)別不同最優(yōu)勢(shì)霉菌的差異,因此需要用化學(xué)計(jì)量學(xué)從復(fù)雜的光譜中提取有效信息。
本研究利用DWT對(duì)傅里葉近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理。為了獲得更佳的預(yù)處理效果,需要選擇合適的小波基函數(shù)和分解層數(shù)。和傅里葉變換相比,小波變換有著很多的小波基可選,同一個(gè)信號(hào)在不同的小波基上進(jìn)行展現(xiàn)會(huì)有不同的分解效果。在實(shí)際應(yīng)用中,通常是根據(jù)分解后的最終數(shù)據(jù)和理論效果之間存在的誤差來判斷小波基的合適度[21,32]。常用的小波 基 函 數(shù) 有 Daubechies、Symlets、Coiflets和Biorthogonal等,其中Daubechies小波系簡(jiǎn)稱dbN,其具有較好的正則性,隨著小波分解級(jí)數(shù)的增加,小波函數(shù)的消失矩增大,小波更加光滑,在時(shí)域的緊支撐性降低,在頻域的局部性增加[32]。本研究將428份光譜數(shù)據(jù)中約2/3劃分為訓(xùn)練集,1/3作為測(cè)試集,采用不同的 Daubechies小波系(db1,db2,db3,…,db6)和小波分解層數(shù)(1~6)對(duì)原始光譜進(jìn)行處理,得到不同的小波系數(shù)重構(gòu)光譜。利用RF從不同的小波系數(shù)中識(shí)別最優(yōu)勢(shì)霉菌特征信息,基于訓(xùn)練集構(gòu)建最優(yōu)勢(shì)霉菌鑒別模型,通過10折交叉驗(yàn)證方法考察不同光譜預(yù)處理?xiàng)l件下訓(xùn)練集的分類正確率。
圖2為基于不同小波基函數(shù)和分解層數(shù)所得小波系數(shù)的隨機(jī)森林訓(xùn)練結(jié)果。從圖2可以看出,當(dāng)小波基函數(shù)為db2,分解層數(shù)為3時(shí),模型對(duì)訓(xùn)練集所有樣本的鑒別正確率最高,達(dá)到98.25%,遠(yuǎn)高于直接用原始光譜建模得到的正確率(78.13%)。小波基函數(shù)db2和分解層數(shù)3的組合對(duì)7種不同的最優(yōu)勢(shì)菌鑒別的正確率分別為:黃曲霉100%,黑曲霉100%,米曲霉90.30%,煙曲霉100%,桔青霉100%,產(chǎn)黃青霉91.64%,總狀毛霉100%,除米曲霉外均高于其他小波系數(shù)的鑒別能力,其對(duì)黑曲霉、煙曲霉和產(chǎn)黃青霉的鑒別能力尤其突出,明顯優(yōu)于其他小波系數(shù)。當(dāng)小波基函數(shù)為db3,分解層數(shù)為3時(shí),模型對(duì)米曲霉的鑒別正確率雖略高于db2,但其對(duì)訓(xùn)練集所有樣本的整體鑒別正確率和對(duì)其余6種霉菌單獨(dú)的鑒別正確率均低于db2。因此,本研究最終確定以優(yōu)化后的小波變換(小波基函數(shù)db2,小波分解層數(shù)3)為近紅外光譜預(yù)處理方法。
圖2 基于不同小波基函數(shù)和分解層數(shù)的訓(xùn)練結(jié)果Fig.2 Training results based on different wavelet basis functions and wavelet decomposition layers
為了驗(yàn)證優(yōu)化后的RF模型分類性能,本研究對(duì)測(cè)試集樣本進(jìn)行了預(yù)測(cè),預(yù)測(cè)結(jié)果見表2。從表2可以看出,在143個(gè)測(cè)試集樣本中,僅有1個(gè)最優(yōu)勢(shì)菌為產(chǎn)黃青霉的樣本被誤報(bào),總預(yù)測(cè)正確率達(dá)到99.30%。
表2 基于DWT-RF模型測(cè)試集預(yù)測(cè)結(jié)果Table 2 Predication results of the test set based on DWT-RF
為了進(jìn)一步考察最優(yōu)勢(shì)菌種鑒別模型的有效性,從復(fù)烤煙倉庫和復(fù)烤廠中收集了20個(gè)實(shí)際中已發(fā)霉的復(fù)烤煙和初烤煙樣品作為外部預(yù)測(cè)集進(jìn)行驗(yàn)證。將收集到的樣品制成10-1濃度的稀釋液后用測(cè)試片進(jìn)行壓片,在(28±2)℃恒溫恒濕箱內(nèi)培養(yǎng)3 d后取出,用近紅外光譜儀對(duì)含菌測(cè)試片進(jìn)行掃描并用模型進(jìn)行預(yù)測(cè),對(duì)比數(shù)據(jù)由形態(tài)學(xué)法鑒定。從表3可以看出,最優(yōu)勢(shì)菌種鑒別模型對(duì)實(shí)際中的20個(gè)發(fā)霉煙葉樣品的最優(yōu)勢(shì)霉菌種類鑒別結(jié)果與形態(tài)學(xué)結(jié)果一致,可見本模型能夠?qū)崿F(xiàn)對(duì)實(shí)際發(fā)霉樣品的準(zhǔn)確鑒別。
表3 外部預(yù)測(cè)結(jié)果對(duì)比Table 3 The external prediction results of models
本研究以快速霉菌酵母測(cè)試片作為載體,結(jié)合近紅外光譜技術(shù)建立了一種快速鑒別霉變煙草最優(yōu)勢(shì)霉菌種類的方法,能夠在種的水平下精準(zhǔn)識(shí)別不同的最優(yōu)勢(shì)霉菌。采用DWT對(duì)光譜進(jìn)行預(yù)處理(小波基函數(shù)為db2,小波分解層數(shù)為3),利用RF建立霉變煙草最優(yōu)勢(shì)霉菌種類鑒別模型,訓(xùn)練集鑒別正確率達(dá)98.25%,測(cè)試集預(yù)測(cè)正確率達(dá)99.30%,對(duì)實(shí)際中的20個(gè)霉變煙葉樣品的預(yù)測(cè)結(jié)果與形態(tài)學(xué)鑒定結(jié)果一致,證明模型分類性能良好??焖倜咕湍笢y(cè)試片和近紅外光譜技術(shù)的巧妙結(jié)合,克服了以往研究中快速霉菌酵母測(cè)試片僅能用于微生物計(jì)數(shù)[19]的功能壁壘,同時(shí)省略了以往近紅外鑒別微生物技術(shù)中需要進(jìn)行菌種分離、凍干菌粉制備等繁瑣操作步驟[24?26]。在實(shí)際應(yīng)用中,本方法對(duì)實(shí)驗(yàn)人員要求低,只需利用已建立好的模型對(duì)測(cè)試片的光譜進(jìn)行預(yù)測(cè)便能實(shí)現(xiàn)霉菌種類的快速鑒別,相較于其他實(shí)驗(yàn)室方法,更適合在生產(chǎn)線上進(jìn)行推廣,為煙葉原料和成品卷煙在儲(chǔ)存過程中的質(zhì)量監(jiān)控提供了新的思路。
不同菌種在不同溫濕度環(huán)境中的生長速度不同,未來可調(diào)整不同的溫濕度環(huán)境以進(jìn)行人工霉變實(shí)驗(yàn),從而獲得更多種類的最優(yōu)勢(shì)菌種樣本以擴(kuò)充模型覆蓋范圍。