侯 奇HOU Qi
劉 靜1
管 驍2
(1.上海海事大學(xué)信息工程學(xué)院,上海 201306;2.上海理工大學(xué)醫(yī)療器械與食品學(xué)院,上海 200093)
預(yù)測(cè)微生物學(xué)本質(zhì)上是基于微生物群體對(duì)環(huán)境因素反應(yīng)的可重現(xiàn),利用過(guò)去觀察到的試驗(yàn)數(shù)據(jù)通過(guò)數(shù)學(xué)模型預(yù)測(cè)食物環(huán)境中的微生物行為,并用試驗(yàn)結(jié)果證明模型所得到的誤差不大于微生物試驗(yàn)所帶來(lái)的誤差[1]。由Whiting等[2]提出的基于變量類(lèi)型的分類(lèi)方法將預(yù)測(cè)微生物數(shù)學(xué)模型分為一級(jí)模型、二級(jí)模型和三級(jí)模型,其中二級(jí)模型描述微生物在食品中的生長(zhǎng)情況與環(huán)境條件之間的關(guān)系,代表性模型包括反應(yīng)面模型、平方根模型和多項(xiàng)式模型等,而現(xiàn)有的大多數(shù)二級(jí)模型對(duì)微生物生長(zhǎng)的延滯期、指數(shù)期、穩(wěn)定期和衰亡期并不能同時(shí)進(jìn)行很好地預(yù)測(cè)。
Fujikawa[3]提出的數(shù)學(xué)模型中,以Baranyi模型為基礎(chǔ),通過(guò)環(huán)境各方面的響應(yīng)函數(shù)作為Baranyi參數(shù)的二級(jí)模型,對(duì)指數(shù)期和穩(wěn)定期能夠很好地預(yù)測(cè),但是對(duì)延滯期并不能進(jìn)行有效地?cái)M合。為了提高對(duì)延滯期的預(yù)測(cè)精度,Baranyi[4-5]和 Marc等[6]提出了多種延滯期的模型,但這些模型都太過(guò)針對(duì)性,對(duì)其他階段不能起到良好的預(yù)測(cè)。Huang[7]提出滯后相變系數(shù)模型,它能夠?qū)Ω鱾€(gè)時(shí)期有良好的過(guò)渡效果,但是只有滯后相變系數(shù)取值為25時(shí),其模型才擬合得較好,因此缺少通用泛化性。然而,這些模型中的參數(shù)都是憑經(jīng)驗(yàn)建立,其中很多參數(shù)沒(méi)有實(shí)際意義,并且參數(shù)模型通常需要進(jìn)行校準(zhǔn)避免誤差的不確定性[8-9],因此很難確切地反映環(huán)境因數(shù)對(duì)生長(zhǎng)預(yù)測(cè)的影響。
部分研究者[10]采用人工神經(jīng)網(wǎng)絡(luò)方法(artificial neural networks,ANN)進(jìn)行建模,在存在不確定數(shù)據(jù)和測(cè)量誤差的情況下,基于ANN的模型會(huì)比經(jīng)驗(yàn)?zāi)P彤a(chǎn)生更準(zhǔn)確的預(yù)測(cè),如Xiao[11]、Kodogiannis[12]用ANN來(lái)擬合環(huán)境因數(shù)作為模型中的參數(shù),但其模型實(shí)質(zhì)還是半?yún)?shù)化的預(yù)測(cè)模型,并沒(méi)有很好地利用ANN的優(yōu)點(diǎn)。本研究擬提出一種基于BP&ELMAN神經(jīng)網(wǎng)絡(luò)的非經(jīng)驗(yàn)化模型,以期解決經(jīng)驗(yàn)型模型參數(shù)過(guò)多的問(wèn)題和提高模型預(yù)測(cè)的準(zhǔn)確性。
BP神經(jīng)網(wǎng)絡(luò)的特點(diǎn)是逐步將輸出錯(cuò)誤反向傳播,解決了隱含層連接權(quán)學(xué)習(xí)問(wèn)題。用于輸入輸出模型的大量映射關(guān)系,其學(xué)習(xí)規(guī)則采用最快下降法,以實(shí)現(xiàn)平方的最小誤差和,使得它常用于復(fù)雜問(wèn)題的建模[13],已經(jīng)在圖像、視頻及手寫(xiě)識(shí)別等領(lǐng)域中實(shí)現(xiàn)了其最先進(jìn)的性能,并且可以充分逼近任意復(fù)雜的非線性關(guān)系[14]。
ELMAN網(wǎng)絡(luò)是局部反饋連接的遞歸神經(jīng)網(wǎng)絡(luò),具有動(dòng)態(tài)映射功能,并使系統(tǒng)具有適應(yīng)時(shí)變特性的能力[15],其隱藏層使用一個(gè)具有與典型微生物生長(zhǎng)曲線相似形狀的Sigmoid函數(shù),這讓神經(jīng)網(wǎng)絡(luò)不需要使用大量節(jié)點(diǎn)就可以獲得相應(yīng)微生物生長(zhǎng)曲線[16],關(guān)聯(lián)層通過(guò)聯(lián)接記憶上一個(gè)時(shí)刻的隱層狀態(tài)連同當(dāng)前時(shí)刻的網(wǎng)絡(luò)輸入一起作為隱層的輸入,相當(dāng)于狀態(tài)反饋,便于作時(shí)間類(lèi)預(yù)測(cè)。
根據(jù)試驗(yàn)需求設(shè)計(jì)網(wǎng)絡(luò)具有3個(gè)輸入神經(jīng)元(溫度、pH和Aw),5個(gè)隱藏神經(jīng)元和2個(gè)輸出神經(jīng)元(生長(zhǎng)速率和倍增時(shí)間)的模型,可使網(wǎng)絡(luò)架構(gòu)具有良好的表現(xiàn)。本研究使用的BP網(wǎng)絡(luò)結(jié)構(gòu)圖見(jiàn)圖1。梯度方法用于校正反向傳播算法中的權(quán)重,閾值函數(shù)見(jiàn)式(1):
(1)
式中:
xi——輸入向量(x1,x2,x3)T,x1,x2,x3分別為溫度、pH和Aw;
m——輸入向量的個(gè)數(shù);
wi——權(quán)系數(shù);
θ——閾值;
y——輸出集。
傳遞函數(shù)必須可微,采用Log-Sigmoid函數(shù),其函數(shù)定義見(jiàn)式(2):
(2)
式中:
x——輸入值。
x的范圍是包含整個(gè)實(shí)數(shù)域的,函數(shù)值在0~1,它在分類(lèi)時(shí)比線性函數(shù)更為精確。
由于微生物生長(zhǎng)預(yù)測(cè)是關(guān)于時(shí)間動(dòng)態(tài)化的過(guò)程,ELMAN神經(jīng)網(wǎng)絡(luò)對(duì)歷史狀態(tài)數(shù)據(jù)具有敏感性,增加了網(wǎng)絡(luò)處理動(dòng)態(tài)信息的能力,達(dá)到動(dòng)態(tài)建模的目的,能使預(yù)測(cè)值均勻地分布在實(shí)際值的兩側(cè),適合實(shí)時(shí)系統(tǒng)辨識(shí)的動(dòng)態(tài)遞歸,對(duì)序列問(wèn)題及時(shí)間問(wèn)題有著很好的預(yù)測(cè)效果,綜合BP&ELMAN神經(jīng)網(wǎng)絡(luò)兩者的優(yōu)點(diǎn),本研究提出新的預(yù)測(cè)模型:首先通過(guò)各個(gè)環(huán)境因素作為BP神經(jīng)網(wǎng)絡(luò)的輸入,通過(guò)訓(xùn)練好的BP網(wǎng)絡(luò)得到生長(zhǎng)速率和倍增時(shí)間(表征微生物生長(zhǎng)速率的一個(gè)參數(shù)),其次,通過(guò)BP網(wǎng)絡(luò)輸出的結(jié)果與微生物的初始濃度作為ELMAN神經(jīng)網(wǎng)絡(luò)的輸入,最終得到生長(zhǎng)曲線。它能有效地避免人為計(jì)算的誤差,最大精度地保障環(huán)境因素對(duì)其生長(zhǎng)動(dòng)力學(xué)的影響,其結(jié)構(gòu)流程圖見(jiàn)圖2。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Figure 1 BP neural network structure
圖2 基于神經(jīng)網(wǎng)絡(luò)的微生物預(yù)測(cè)模型Figure 2 Microbial prediction model based on neural network
本研究選取食品主要致病菌之一的李斯特菌為研究對(duì)象,已被證實(shí)肉類(lèi)、蛋類(lèi)、禽類(lèi)、海產(chǎn)品、乳制品、蔬菜等都是李斯特菌的感染源[17-18],能夠檢驗(yàn)預(yù)測(cè)模型,具有廣泛的應(yīng)用范圍,并且本模型能夠適合各種微生物的生長(zhǎng)動(dòng)力學(xué)預(yù)測(cè),并不是單一的針對(duì)李斯特菌所提出的模型,也可以應(yīng)用于沙氏門(mén)菌、大腸桿菌等[19]。本研究微生物生長(zhǎng)的數(shù)據(jù)來(lái)源于Combase數(shù)據(jù)庫(kù),Combase數(shù)據(jù)庫(kù)是2003年由英美兩國(guó)將PMP、FM和Growth Predictor進(jìn)行整合而成的數(shù)據(jù)庫(kù)模型,擁有40 489個(gè)關(guān)于微生物生長(zhǎng)和存活的數(shù)據(jù),并且也是世界上最大的預(yù)測(cè)微生物學(xué)信息數(shù)據(jù)庫(kù)。本研究選取的李斯特菌試驗(yàn)數(shù)據(jù)對(duì)象環(huán)境為溫度1~40 ℃、pH值4.4~7.5、Aw 值0.934~1.000,試驗(yàn)數(shù)據(jù)共120組。
2.3.1 基于BP神經(jīng)網(wǎng)絡(luò)對(duì)生長(zhǎng)速度擬合 通過(guò)隨機(jī)選擇100組試驗(yàn)數(shù)據(jù)集對(duì)BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練,每次仿真隨機(jī)抽取測(cè)試組數(shù)據(jù)20組,重復(fù)進(jìn)行50次仿真以確保模型的穩(wěn)定性。通過(guò)訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行驗(yàn)證,將模型預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)進(jìn)行對(duì)比,得測(cè)試數(shù)據(jù)與實(shí)際值的線性回歸圖見(jiàn)圖3。由圖3可知,其生長(zhǎng)速率和倍增時(shí)間相關(guān)系數(shù)分別達(dá)0.998 6和0.998 3,具有良好的擬合效果。
2.3.2 基于ELMAN神經(jīng)網(wǎng)絡(luò)對(duì)生長(zhǎng)濃度的預(yù)測(cè) 將BP網(wǎng)絡(luò)擬合的生長(zhǎng)速度與初始濃度和倍增時(shí)間作為ELMAN神經(jīng)網(wǎng)絡(luò)的輸入,先通過(guò)100組實(shí)測(cè)數(shù)據(jù)對(duì)ELMAN神經(jīng)網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練,然后通過(guò)20組測(cè)試組數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行仿真測(cè)試,最后得到與時(shí)間相關(guān)的微生物一級(jí)生長(zhǎng)曲線模型。使用李斯特菌在溫度20 ℃,pH 7,Aw 0.997條件下的數(shù)據(jù),對(duì)本研究預(yù)測(cè)模型與經(jīng)典Baranyi模型進(jìn)行預(yù)測(cè),結(jié)果見(jiàn)圖4(a),與之對(duì)應(yīng)的殘差圖見(jiàn)圖5(a);圖4(b)是李斯特菌在溫度19.7 ℃,pH 6.6,Aw 0.987條件下預(yù)測(cè)對(duì)比結(jié)果,與之對(duì)應(yīng)的殘差圖見(jiàn)圖5(b);圖4(c)是李斯特菌在溫度20.5 ℃,pH 7.2,Aw 0.967條件下預(yù)測(cè)對(duì)比結(jié)果,與之對(duì)應(yīng)的殘差圖見(jiàn)圖5(c);圖4(d)是李斯特菌在溫度20.3 ℃,pH 7,Aw 0.981條件下預(yù)測(cè)對(duì)比結(jié)果,與之對(duì)應(yīng)的殘差圖見(jiàn)圖5(d)。通過(guò)圖4和圖5可知,本模型預(yù)測(cè)結(jié)果更符合實(shí)際情況,誤差相對(duì)于Baranyi模型要小,在生長(zhǎng)期到穩(wěn)定期的過(guò)渡階段,預(yù)測(cè)的正確度尤其明顯。
圖3 生長(zhǎng)速率和倍增時(shí)間的預(yù)測(cè)值與實(shí)際值的線性回歸Figure 3 The linear regression of Growth rate and multiplication time of the predicted value and the actual value
圖4 本研究預(yù)測(cè)模型與Baranyi模型對(duì)比結(jié)果Figure 4 Shows the comparison between the model and the Baranyi model
圖5 殘差圖Figure 5 Residual plot
2.3.3 預(yù)測(cè)結(jié)果討論 BP網(wǎng)絡(luò)訓(xùn)練過(guò)程中沒(méi)有過(guò)擬合的情況發(fā)生,網(wǎng)絡(luò)輸出集合的線性回歸相關(guān)系數(shù)接近0.99,說(shuō)明網(wǎng)絡(luò)架構(gòu)已達(dá)到預(yù)期期望。50次重復(fù)試驗(yàn)的預(yù)測(cè)輸出結(jié)果顯示,生長(zhǎng)速率和倍增時(shí)間實(shí)測(cè)數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)的線性回歸相關(guān)系數(shù)處于[0.932 1,0.998 4]和[0.962 0,0.998 3]之間,得到良好擬合效果。從ELMAN網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果可以看出,本研究模型對(duì)微生物生長(zhǎng)的各個(gè)時(shí)期有很好的預(yù)測(cè)效果,并且從其殘差分析的結(jié)果可知,異常點(diǎn)約占總體的5%,在可接受范圍內(nèi)。
本研究選取李斯特菌為研究實(shí)例,利用其試驗(yàn)環(huán)境的溫度、pH值和Aw 值建立BP神經(jīng)網(wǎng)絡(luò)二級(jí)生長(zhǎng)模型,所得模型對(duì)微生物生長(zhǎng)速度和倍增時(shí)間預(yù)測(cè)相關(guān)系數(shù)分別為[0.932 1,0.998 4]和[0.962 0,0.998 3];再將所得到的生長(zhǎng)速度和倍增時(shí)間結(jié)合初始濃度,建立ELMAN神經(jīng)網(wǎng)絡(luò),從而得到與時(shí)間相關(guān)的微生物生長(zhǎng)一級(jí)模型。通過(guò)與其他模型數(shù)據(jù)對(duì)比,本模型數(shù)據(jù)更偏向于實(shí)際環(huán)境下的預(yù)測(cè)結(jié)果,經(jīng)殘差分析結(jié)果可知,異常點(diǎn)約占總體的5%,試驗(yàn)結(jié)果顯示,該模型可以對(duì)微生物生長(zhǎng)的各個(gè)時(shí)期進(jìn)行有效預(yù)測(cè),并解決經(jīng)驗(yàn)型模型參數(shù)化過(guò)多,以及沒(méi)有生物意義的問(wèn)題。由模型對(duì)比知,本模型在生長(zhǎng)期到穩(wěn)定期的預(yù)測(cè)有著更高的準(zhǔn)確性。此外本模型能夠預(yù)測(cè)微生物在更多的環(huán)境條件下的生長(zhǎng)和滅活,由于不限制影響微生物生長(zhǎng)因子的個(gè)數(shù)可大大提高本模型的通用性,可使得微生物預(yù)測(cè)模型能有較好的應(yīng)用空間,可以幫助研究人員對(duì)微生物生長(zhǎng)的動(dòng)態(tài)進(jìn)行分析,以及在復(fù)雜環(huán)境下對(duì)微生物生長(zhǎng)失活進(jìn)行預(yù)測(cè)。
[1] PEREZ-RODRIGUEZ F, VALERO A.Predictive microbiology in foods[M].New York: Springer-Verlag, 2012: 1-10.
[2] WHITING R C, BUCHANAN R L.Predictive food microbiolo-gy[J].Trends in Food Science and Technology, 1994, 4(1): 6-11.
[3] FUJIKAWA H.Application of the new logistic model to microbial growth prediction in food[J].Biocontrol Science, 2011, 16(2): 47-54.
[4] BARANYI J.Comparison of stochastic and deterministic conce-pts of bacterial lag[J].Journal of Theoretical Biology, 1998, 192(3): 403-408.
[5] BARANYI J.Stochastic modelling of bacterial lag phase[J].International Journal of Food Microbiology, 2002, 73(2/3): 203-206.
[6] MARE Le, ELFWING A, BARANYI A, et al.Modelling the variability of lag time and the first generation times of single cells ofE.coli[J].International Journal of Food Microbiology, 2005, 100(1): 13-19.
[7] HUANG Li-han.Optimization of a new mathematical model for bacterial growth[J].Food Control, 2013, 32(1): 283-288.
[8] BALSAC E, ALONSOLONSO A A, BANAGA J R.An iterative identi-fication procedure for dynamic modeling of biochemical networks[J].BioMed Central, 2010, 4(1): 33-46.
[9] FILIPL, BORIS H, MORITZ D.Robust multilobjective optimal control of uncertain (bio)chemical processes[J].Chemical Engineering Science, 2011, 66(20): 4 670-4 682.
[10] GARCIA-GIMENO R M, HERVAS-MARTINEZ C, SILONIZ M, et al.Improving artificial neural networks with a pruning methodology and genetic algorithms for their application in microbial growth prediction in food[J].Food Microbiol, 2002, 72(1/2): 19-30.
[11] XIAO Hai-tao, LI Bai-lin, OU Jie.Predicting the bacterial growth in MAP chilled beef by artificial neural networks[J].Journal of Pure & Applied Microbiology, 2013, 7: 123-129.
[12] KODOGIANNIS V S, PACHIDIS T, KONTOGIANNI E.An intelligent based decision support system for the detection of meat spoilage[J].Engineering Applications of Artificial Intelligence, 2014, 34(3): 23-36.
[13] BASHEER I, HAJMEER M.Artificial neural networks: fundamentals, computing, design, and application[J].Journal of Microbiological Methods, 2000, 43(1): 3-31.
[14] 王學(xué)武, 譚得健.神經(jīng)網(wǎng)絡(luò)的應(yīng)用與發(fā)展趨勢(shì)[J].計(jì)算機(jī)工程與應(yīng)用, 2003, 39(3): 98-100.
[15] LIU Hui, TIAN Hong-qi, LIANG Xi-feng.Wind speed forecasting approach using secondary decomposition algorithm and Elman neural networks[J].Appl.Energy, 2015, 157: 183-194.
[16] PALAEIOS A P, MARIN J M, QUINTO E J, et al.Bayesian modeling of bacterial growth for multiple populations[J].The Annals of Application Statistics, 2014, 8(3): 1 516-1 537.
[17] OHKOCHI M, KOSEKI S, KUNOU M, et al.Growth modeling of Listeria monocytogenes in pasteurized liquid egg[J].J Food Prot, 2013, 76(9): 1 549-1 556.
[18] MEJLHOLM O, GUNVIG A, BORGGAARD C, et al.Predicting growth rates and growth boundary of Listeria monocytogenes-an international validation study with focus on processed and ready-to-eat meat and seafood[J].International Journal of Food Microbiology, 2010, 141(3): 137-150.
[19] ZHOU Kang, ZHONG Kai-cheng, LONG Chao, et al.Development and validation of a predictive model for the growth of salmonella enterica in chicken meat[J].Journal of Food Safety, 2014, 34(4): 326-332.