劉建學 ,馬凱旋 ,韓四海 ,陳浩宇
(1.河南科技大學食品與生物工程學院,河南洛陽 471023;2.河南省食品原料工程技術(shù)研究中心,河南洛陽 471023)
食源性致病菌引起的食源性疾病在食品安全事件中占很大比例,對人類的身心健康和食品衛(wèi)生行業(yè)的發(fā)展造成嚴重影響。其中,大腸桿菌(Escherichia coli,E.coli)、單增李斯特菌(Listeria monocytogenes,LM)、金黃色葡萄球菌 (Staphylococcus aureus)是幾種典型的食源性致病細菌,在我國各省區(qū)乃至全世界檢出率都較高,嚴重時可導(dǎo)致死亡[1]。因此,如何快速高效地檢測食源性致病菌已成為近年來的研究熱點。傳統(tǒng)的微生物檢測方法雖靈敏性高、準確,但試驗操作繁瑣、耗時長、試劑昂貴,不適于實現(xiàn)同時在線和現(xiàn)場的快速檢測[2-3]。
傅里葉變換近紅外光譜分析技術(shù)相比傳統(tǒng)的檢測手段更快速、簡便、環(huán)保,易于實現(xiàn)大批量處理樣品,在各個領(lǐng)域的定量分析得到廣泛應(yīng)用,且在鑒別、定性分析方面也有獨特功能[4-5]。近紅外光譜分析技術(shù)用于食源性致病菌的檢測,其優(yōu)越性在于可避免或減少復(fù)雜的前處理,而且有可能應(yīng)用于活菌的檢出和鑒別[6-8]。路春霞和王磊等人[9-10]利用傅里葉變換中紅外光譜技術(shù)對大腸桿菌O157∶H7、腸炎沙門氏菌等4種致病菌進行了聚類分析,得到了很好的區(qū)分效果。Feng Y Z等人[11]利用可見和近紅外光譜研究大腸桿菌O157∶H7、英諾克李斯特菌(Listeria innocua)的分類鑒別方法;王若男等人[12]利用近紅外光譜對標準菌的種間分類進行初步研究,并證實了在微生物快速鑒定的可行性。
在利用近紅外光譜對細菌進行鑒別分析時,光譜之間存在信息疊加與相互干擾,容易產(chǎn)生誤判,在一定程度上會影響鑒別模型的準確性。貝葉斯判別分析與其他算法相比有著最小的判別錯誤率,考慮了總體各自出現(xiàn)的概率大小,具有計算效率高、精確度高和適用性強的優(yōu)點。主成分分析可消除信息疊加問題和相關(guān)性不大的變量,提取特征變量。目前,利用主成分分析(Principal component analysis,PCA)與貝葉斯判別分析(Bayes discriminantanalysis,BDA) 相結(jié)合作為一種改進的貝葉斯判別分析對食源性致病菌快速鑒別的新型方法尚缺乏相關(guān)報道。因此,試驗采集了大腸埃希氏菌O157∶H7、單增李斯特菌和金黃色葡萄球菌3種典型食源性致病菌的菌體細胞的近紅外透射光譜圖,分別采用主成分分析、貝葉斯判別分析和改進貝葉斯判別分析,通過對比3種方法的判別正確率以確定最優(yōu)的食源性致病菌近紅外光譜判別模型。
菌種:金黃色葡萄球菌、大腸埃希氏菌O157∶H7,中國科學院微生物研究所提供;單增李斯特菌,河南省洛陽市疾病預(yù)防與控制中心提供。
培養(yǎng)基:營養(yǎng)肉湯培養(yǎng)基、營養(yǎng)瓊脂培養(yǎng)基,北京奧博星公司提供。
試劑:0.9%生理鹽水,溴化鉀(光譜純),二次蒸餾水。
VECTOR-33型傅里葉變換紅外光譜儀,德國布魯克公司產(chǎn)品;FD-1D-50型冷凍干燥機,北京比朗實驗設(shè)備有限公司產(chǎn)品;DHP-9272型電熱恒溫培養(yǎng)箱,上海一恒科學儀器有限公司產(chǎn)品;SW-CJ型超凈工作臺,蘇州安凈凈化科技有限公司產(chǎn)品。
1.3.1 細菌培養(yǎng)與干菌體的制備
取-80℃保藏的菌種放置室溫中,無菌操作吸取1 mL于營養(yǎng)肉湯培養(yǎng)基,于37℃條件下,以轉(zhuǎn)速180 r/min振蕩培養(yǎng)12 h;蘸取菌液接種于營養(yǎng)瓊脂培養(yǎng)基,于37℃條件下培養(yǎng)使其復(fù)蘇;挑取純化培養(yǎng)后的單菌落接種于營養(yǎng)肉湯培養(yǎng)基,于37℃條件下,以轉(zhuǎn)速180 r/min振蕩培養(yǎng)12 h;用紫外分光光度計測其OD600,用于估計菌液濃度;將培養(yǎng)后的菌懸液在4℃條件下,以轉(zhuǎn)速5 000 r/min離心10 min高速冷凍離心機分離菌體;用0.9%生理鹽水洗滌2次,再用蒸餾水洗滌1次后放置冷凍干燥機至完全干燥。
1.3.2 樣本的采集
選取典型的單菌落為一個獨立的樣本,共采集80個樣本,為了使所選樣品更具代表性,以隔四取一的方式從80個樣本中選取64個作為訓(xùn)練集樣本,余下16個作為驗證集樣本。訓(xùn)練集樣本重新編號后,1~24代表大腸埃希氏菌O157∶H7(Ⅰ),25~45代表單增李斯特菌(Ⅱ),46~64代表金黃色葡萄球菌(Ⅲ);驗證集樣本重新編號后,1~6代表大腸埃希氏菌O157∶H7(Ⅰ),7~11代表單增李斯特菌(Ⅱ),12~16代表金黃色葡萄球菌(Ⅲ)。
1.3.3 檢測樣品近紅外光譜的采集
采用溴化鉀壓片法制備檢測樣品,將干菌體與溴化鉀完全混合研磨,制成厚度均一的薄片。利用傅里葉變換近紅外光譜儀采集樣品透射光譜,背景為溴化鉀薄片,掃描范圍8 000~4 000 cm-1,分辨率4 cm-1,掃描次數(shù)32次,每個樣品重復(fù)測3次,取其平均光譜作為該樣本的近紅外光譜數(shù)據(jù)儲存,以備建立數(shù)學模型。
1.3.4 光譜數(shù)據(jù)的預(yù)處理
利用The Unscrambler X10.4分析軟件(挪威CAMO公司)對3種致病菌所采集的近紅外光譜進行預(yù)處理[12]:①基線校正,消除基線漂移、傾斜現(xiàn)象;②光譜平滑(平滑點數(shù)為9),消除噪音對信號的干擾,提高信噪比;③矢量歸一化處理,防止因樣品量、厚度不同導(dǎo)致的譜圖測量誤差;④一階導(dǎo)數(shù),強化譜帶特征。
1.3.5 鑒別模型的建立
(1)主成分分析(PCA) 是一種較為成熟的多元統(tǒng)計分析方法,是數(shù)據(jù)壓縮和特征信息提取技術(shù)。運用PCA方法可以減少數(shù)據(jù)維數(shù)、轉(zhuǎn)換原變量,并且不會降低光譜間的差異信息,這類分析方法可在事先未知類別的情況下對光譜數(shù)據(jù)進行分析。
(2) 貝葉斯判別分析(BDA) 是通過計算總體各自出現(xiàn)的概率大小,對未知類別的樣品進行歸類,歸屬于概率最大的一類。具體分析步驟如下:
步驟1:首先計算出訓(xùn)練樣本的先驗概率。假設(shè)有k個p維總體G1,G2,···,Gk,概率密度函數(shù)為f1(x),f2(x),···,fk(x)。樣品x來自總體Gi的先驗概率為 pi(i=1,2,···,k),則有 p1+p2+···+pk=1。
步驟2:再計算出其后驗概率進行判別。已知樣品x來自總體Gi的后驗概率為:
步驟3:預(yù)測樣本類別根據(jù)各類的后驗概率進行比較,歸屬于最大后驗概率所屬的類。
(3)改進貝葉斯判別分析是將主成分分析與貝葉斯判別分析相結(jié)合的一種方法。運用PCA可消除信息疊加問題和屬性間的相關(guān)性,提取特征主成分數(shù),將特征主成分作為BDA模型的最優(yōu)判別因子,建立改進BDA模型。
使用MATLAB R2014a軟件(美國Math Works公司)對數(shù)據(jù)進行無監(jiān)督學習算法PCA與有監(jiān)督學習算法BDA模型的建立。根據(jù)前述1.3.2所選樣本集,提取訓(xùn)練集64個樣本的近紅外光譜,以主成分分析、貝葉斯和改進貝葉斯判別分析等分類方法進行數(shù)據(jù)處理,建立各方法的近紅外光譜鑒別模型。而后利用所建模型對16個驗證集樣本判別,考查模型的準確率。
大腸埃希氏菌O157∶H7、單增李斯特菌和金黃色葡萄球菌在8 000~4 000 cm-1波數(shù)范圍的近紅外透射光譜圖見圖1。
圖1 3種致病菌的近紅外透射光譜圖
由圖1可看出,這3種致病菌對近紅外光譜的吸收峰位差異性很小,并不能通過直接標記吸收峰位置找到致病菌在近紅外區(qū)的特征吸收。為進一步區(qū)分比較3種致病菌的異同,利用The Unscrambler X10.4軟件對3種致病菌的近紅外光譜經(jīng)矢量歸一化處理后進行一階求導(dǎo),以增強光譜的分辨率。
3種致病菌的一階導(dǎo)數(shù)近紅外光譜圖見圖2。
圖2 3種致病菌的一階導(dǎo)數(shù)近紅外光譜圖
選取具有特征波數(shù)6 000~4 000 cm-1的一階導(dǎo)數(shù)近紅外數(shù)據(jù)進行研究分析(圖2)。由圖2可以看出,3種致病菌的一階導(dǎo)數(shù)近紅外圖譜的差異性初步體現(xiàn)出來,但仍無法將3種致病菌很好的區(qū)分。因此需要先進行數(shù)學預(yù)處理,提取特征光譜信息,采用統(tǒng)計學運算并結(jié)合化學計量學分析方法作進一步的數(shù)據(jù)處理。
3種食源性致病菌的光譜數(shù)據(jù)經(jīng)矢量歸一化和一階求導(dǎo)預(yù)處理后,選取6 000~4 000 cm-1波段的數(shù)據(jù)進行PCA分析。
前10個主成分累積貢獻率趨勢見圖3。
圖3 前10個主成分累積貢獻率趨勢
圖3 顯示了前10個主成分的累積貢獻率已達到99.86%。理論上,累積貢獻率達到100%是最佳的狀態(tài),但是此時的模型性能不一定最好。不同主成分方差貢獻率第1個最大,接著依次降低,對定性分析模型的訓(xùn)練和預(yù)測結(jié)果有明顯的影響。若主成分數(shù)過多,則有可能引入過多噪聲干擾,降低信噪比,使模型性能降低。因此,要對主成分因子數(shù)進行優(yōu)化,選擇最佳的主成分和合適的主成分數(shù)來建立模型。從圖3可以看出,前3個主成分的累積貢獻率已經(jīng)非常接近100%,解釋了原始變量98.93%的信息,能全面的對3種致病菌近紅外光譜特性進行分析。
在主成分分析中,對微生物間正確分類起主要貢獻的可能是前2個主成分,也可能是前3個主成分。以PC1,PC2和PC3作為聚類依據(jù),80個致病菌樣品近紅外光譜前2個和前3個主成分的得分如圖4所示。
3種致病菌的PCA聚類分布見圖4。
主成分分析表現(xiàn)的是樣品原始光譜即樣品本身的特征信息,3種致病菌雖然可以正確分類,但是每種菌分布區(qū)域不明顯,尤其是大腸埃希氏菌與金黃色葡萄球菌、單增李斯特菌有重疊,且大腸埃希氏菌分布不集中,出現(xiàn)有異常點,可能是試驗誤差等因素所致??紤]到在采集菌體譜圖的過程中易受到細胞結(jié)構(gòu)、樣品采集量、采集光譜的環(huán)境所造成的影響,在剔除異常樣品后,3種菌得到正確分類,相互間的差異較小。
圖4 3種致病菌的PCA聚類分布圖
為進一步提高食源性致病菌識別分類的準確性和高效性,利用主成分分析對3種致病菌的譜圖數(shù)據(jù)進行降維,作為貝葉斯判別分析的特征變量,建立基于貝葉斯判別分析的食源性致病菌鑒別模型的研究。
運用MATLAB R2014a軟件構(gòu)建3種食源性致病菌BDA模型,分別對64個訓(xùn)練集樣本和16個驗證集未知樣本進行判別預(yù)測。
訓(xùn)練樣本的判別分類結(jié)果見表1,驗證樣本的判別分類結(jié)果見表2。
表1 訓(xùn)練樣本的判別分類結(jié)果
從表1和表2處理結(jié)果來看,該方法所建模型對于訓(xùn)練集樣本誤判14個,驗證集未知樣本誤判4個,判別正確率分別為78%和75%,其結(jié)果并不理想。
表2 驗證樣本的判別分類結(jié)果
為此,將BDA方法改進,即利用前述PCA方法得到的前2個和前3個主成分分別作為BDA模型的判別因子,建立改進BDA模型。用該模型對64個訓(xùn)練樣本進行判別,判別結(jié)果見表1,其中利用前2個主成分和前3個主成分分別作為BDA模型的判別因子,均使得3種食源性致病菌正確歸類,判別正確率為100%,顯然改善了BDA方法,提高了正確判別率。綜合主成分分析的結(jié)果和表1的分析結(jié)果,選擇前2個主成分作為BDA模型的最優(yōu)判別因子,能全面表示樣品近紅外光譜的特征信息,并減少由主成分數(shù)的選擇過多對判別結(jié)果的影響,同時減少了計算機的運算量、節(jié)約運算時間,所構(gòu)建的改進BDA模型的準確性能達到食源性致病菌間分類鑒別的實際要求。
根據(jù)訓(xùn)練好的改進BDA模型對16個未判樣本進行判別,并與BDA判別結(jié)果相比較,由表2可知,改進BDA模型對16個未判樣本的判別正確率為100%,而BDA模型誤判了4個,判別正確率為75%。結(jié)果表明,用改進的BDA模型對3種食源性致病菌進行分類鑒別,其訓(xùn)練集和驗證集的判別正確率均達到100%,從而可以確定6 000~4 000 cm-1波數(shù)范圍是菌體近紅外敏感組分光譜的研究范圍之一。BDA模型判別率低于改進BDA模型,應(yīng)為原始光譜數(shù)據(jù)較多,噪聲信號也隨之較多,且每種菌株的光譜數(shù)據(jù)之間存在信息疊加所導(dǎo)致。同時,BDA方法在建立判別模型時增加了工作量,需要大量的運算時間,由于3種致病菌的近紅外譜圖差異性較小,在貝葉斯判別中通常會以樣本出現(xiàn)的頻率大小作為各總體的先驗概率,引入了一些相關(guān)性不大的變量,對判別分析的精確度造成干擾,繼而出現(xiàn)誤判,PCA則有效地剔除多余變量,保留了特征變量。因此,將PCA作為BDA判別因子建立的改進判別模型是可靠的,是鑒別食源性致病菌能力較優(yōu)的方法。
將貝葉斯判別與主成分分析相結(jié)合,對大腸埃希氏菌O157∶H7、單增李斯特菌和金黃色葡萄球菌等3種典型食源性致病菌進行了有效的快速鑒別方法研究。
(1)經(jīng)光譜預(yù)處理后,利用主成分分析法將近紅外光譜信息進行壓縮、降維,分別采用前2個主成分和前3個主成分進行聚類分析,能夠較好地將3種致病菌分類,但菌種之間有交叉,分類不徹底。
(2)建立了基于近紅外光譜的貝葉斯判別方法,對訓(xùn)練集樣本和未知樣本的判別正確率分別為78%和75%。
(3)建立了基于主成分分析的改進貝葉斯判別方法,以前2個主成分作為BDA模型的2個最優(yōu)判別因子建立改進BDA模型,對64個訓(xùn)練樣本進行判別,其判別正確率達到100%;對16個未知樣品進行驗證,其判別正確率達到100%。可見,改進貝葉斯模型對未知樣品的判別正確率由原來的75%提高到了100%,說明該方法對食源性致病菌種類的判別可行。
[1]Pan W,Zhao J,Chen Q.Classification of foodborne pathogens using near infrared(NIR) laser scatter imaging system with multivariate calibration[J].Scientific Reports,2015 (3):9 524.
[2]Maitri T,Sigurdur O,Jongseok L,et al.Data mining for recognizing patterns in foodborne disease outbreaks[J].Journal of Food Engineering,2010 (2):213-227.
[3]Brandily M L,Monbet V,Bureau B,et al.Identification of foodborne pathogens within food matrices by IR spectroscopy[J].Sensors&Actuators B Chemical,2011(1):202-206.
[4]李娟,梁漱玉.近紅外快速無損檢測食用油品質(zhì)的研究進展 [J].食品與機械,2016,32(11):225-228.
[5]Mandal P K,Biswas A K,Choi K,et al.Methods for rapid detection of foodborne pathogens:An overview[J].American Journal of Food Technology,2011,6 (2):87-102.
[6]Huck-Pezzei V A,Seitz I,Karer R,et al.Alps food authentication,typicality and intrinsic quality by near infrared spectroscopy[J].Food Research International,2014,62(8):984-990.
[7]Vasconcelos H,Saraiva C,Almeida J M M M D.Evaluation of the spoilage of raw chicken breast fillets using fourier transform infrared spectroscopy in tandem with chemometrics[J].Food&Bioprocess Technology,2014,7(8):2 330-2 341.
[8]Sahar A,é.Dufour.Use of Fourier transform-infrared spectroscopy to predict spoilage bacteria on aerobically stored chicken breast fillets[J].Food Science and Technology,2014,56 (2):315-320.
[9]路春霞,劉源,孫曉紅,等.應(yīng)用傅里葉變換紅外光譜區(qū)分鑒定四種食源性致病菌的研究 [J].化學學報,2011,69 (1):101-105.
[10]王磊,唐穎,徐凱,等.食源性致病菌傅里葉變換紅外光譜快速鑒別方法 [J].中國食品學報,2011,11(1):202-207.
[11]Feng Y Z,Downey G,Sun D W,et al.Towards improvement in classification of Escherichia coli,Listeria innocua,and their strains in isolated systems based on chemometric analysis of visible and near-infrared spectroscopic data[J].Journal of Food Engineering,2015(1):87-96.
[12]王若男,岳田利,袁亞宏,等.基于傅里葉變換近紅外光譜的脂環(huán)酸芽孢桿菌種間分類鑒定 [J].光譜學與光譜分析,2015,35(11):3 073-3 077.◇