袁彥彥,王興芬
(北京信息科技大學(xué) 信息管理學(xué)院,北京 100192)
基于SVM的生鮮食品貨架期預(yù)測
袁彥彥,王興芬
(北京信息科技大學(xué) 信息管理學(xué)院,北京 100192)
采用支持向量機(SVM)的方法對零售商生鮮食品的貨架期預(yù)測問題進行了研究,建立了貨架期預(yù)測模型,以速凍水餃為例,在Matlab環(huán)境下對該模型進行了仿真實驗,并與BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測值比較,結(jié)果表明該模型預(yù)測得到的貨架期與實際值有更好的擬合度,提高了預(yù)測的準(zhǔn)確性,為生鮮食品的貨架期預(yù)測提供了新途徑。
支持向量機;生鮮食品;貨架期;預(yù)測
隨著生活水平的提高,人們無論是對食品的品質(zhì)還是安全性,都提出了更高的要求。其中生鮮食品屬于溫度敏感貨物,不可避免地存在著腐敗變質(zhì)的風(fēng)險。貨架期是指貨物能滿足顧客對食品質(zhì)量要求的時間期限,當(dāng)食品自身的某種特性達(dá)到不可接受時,即為該貨物的貨架期終點[1]。近年來,針對生鮮食品貨架期的研究成為食品安全領(lǐng)域的熱點之一,且多以易腐食品為研究對象,在低溫范圍內(nèi)或波動溫度條件下進行實驗,試圖通過可觀測的食品變化的特征指標(biāo),來反映食品的品質(zhì)變化,從而確定生鮮食品的貨架期,但由于低溫導(dǎo)致食品衰敗的機制比較復(fù)雜,構(gòu)建模型所采用的方法大多數(shù)都有一定的適用范圍和對象。而本文采用的SVM方法適用范圍廣、穩(wěn)定性高,用于解決生鮮食品構(gòu)建貨架期預(yù)測模型的問題,不僅能為生鮮貨架期預(yù)測提供新途徑,也可以為生鮮食品的銷售管理提供參考依據(jù)。
在生鮮食品的腐敗過程中,始終伴隨著各種物理化學(xué)反應(yīng)和體內(nèi)微生物的活動,間接或直接地影響著生鮮食品的貨架期,影響生鮮食品貨架期的因素主要可分為感官指標(biāo)、理化指標(biāo)和微生物指標(biāo),其中感官指標(biāo)又包括顏色、風(fēng)味、形態(tài)、質(zhì)地、持水力等;理化指標(biāo)包括溫度、水分含量、PH、酶、TVBN、葉綠素等;微生物指標(biāo)包括特種菌含量、菌落總數(shù)等。根據(jù)這些指標(biāo),當(dāng)前生鮮食品的貨架期預(yù)測模型的構(gòu)建方法主要有微生物學(xué)法、Arrhenius法、神經(jīng)網(wǎng)絡(luò)方法、威布爾危害分析法以及Q10模型[2-17],方法及其特點見表1。
通過上述分析以及文獻的調(diào)研,從指標(biāo)來看,以往研究多以某種特定指標(biāo)比如特種菌、揮發(fā)性鹽基氮,作為建立貨架期的衡量指標(biāo),實驗中食品品質(zhì)指標(biāo)間關(guān)聯(lián)度以及品質(zhì)指標(biāo)與貨架期之間的關(guān)系研究不足,影響了預(yù)測結(jié)果的準(zhǔn)確性[2-8];從貨架期模型的構(gòu)建方法來看,主要是基于特定的研究對象,選用適合的方法構(gòu)建貨架期模型,這樣的模型存在針對性和適用范圍的限制性[2-17],并且在所使用的Arrhenius方法中,因貨架期是伴隨著化學(xué)反應(yīng)發(fā)生的,與溫度有關(guān),大多數(shù)研究者通過實驗獲取該方法中公式的參數(shù)并設(shè)定為常數(shù),但實際上參數(shù)是與溫度存在關(guān)系的,間接地影響結(jié)果的準(zhǔn)確性[18]。而支持向量機方法已經(jīng)在其他領(lǐng)域得到了較廣的應(yīng)用[19-22],且在貨架期預(yù)測模型的研究中采用該方法的研究尚少,本文則采用該方法對生鮮食品貨架期進行研究,構(gòu)建生鮮食品的貨架期預(yù)測模型。
表1 貨架期模型構(gòu)建方法
在統(tǒng)計學(xué)理論和數(shù)學(xué)基礎(chǔ)上發(fā)展起來的支持向量機(Support Vector Machines,SVM)是一種新的機器學(xué)習(xí)方法,適用范圍廣,穩(wěn)定性高,具有較好的“魯棒”性,已非常成功地處理回歸和模式識別等諸多問題,其中支持向量機回歸算法(Support Vector Machines Regression,SVMR)可以解決線性或非線性回歸問題,進行時間序列預(yù)測或非線性建模與預(yù)測。本文采用支持向量機的回歸算法進行預(yù)測,其基本思想是通過非線性變換?,將輸入空間變換到一個高維數(shù)的特征空間,并在這個空間中進行線性回歸,這樣在高緯特征空間的線性回歸就對應(yīng)于低維輸入空間的非線性回歸。主要的操作是通過定義適當(dāng)?shù)暮撕瘮?shù)K(x,y)=?(x)??(y)來實現(xiàn)這個非線性變換。在實際應(yīng)用中,常用的核函數(shù)包括線性核函數(shù)、徑向基核函數(shù)、多項式內(nèi)積核函數(shù)。
根據(jù)SVM回歸理論建立生鮮食品貨架期預(yù)測模型,如圖1所示。
圖1 貨架期預(yù)測的SVM模型
在預(yù)測模型的建立過程中,設(shè)生鮮食品貨架期預(yù)測的指標(biāo)數(shù)據(jù)樣本集為{(yi,xi),i=1,2,...,n},其中x∈Rn,y∈Rn,xi是模型的輸入數(shù)據(jù),表示與生鮮食品腐敗高相關(guān)的因變量指標(biāo),比如風(fēng)味、總體接受性、水分含量、過氧化值、酸價、菌落數(shù)等;yi是預(yù)測模型的輸出數(shù)據(jù),表示作為衡量貨架期的結(jié)果指標(biāo),比如有效積溫、揮發(fā)性鹽基氮、微生物含量等。那么回歸預(yù)測模型用下列方程表示:
式中,w為權(quán)向量,φ(x)為非線性映射函數(shù),b為閾值。
式中 αi、為拉格朗日因子。根據(jù)生鮮食品的指標(biāo)值,由上式即可以對生鮮食品的貨架期進行預(yù)測。
本文仿真實驗數(shù)據(jù)來源于文獻[9],其中數(shù)據(jù)是該文獻作者在-28~-12℃溫度波動下進行實驗以及感官評價獲得的,并且還設(shè)定了將貯藏有效積溫40 332h·℃作為速凍水餃貨架期終點,具體數(shù)據(jù)見表2。在文獻[9]中利用BP神經(jīng)網(wǎng)絡(luò)建立生鮮食品速凍水餃的貨架期預(yù)測模型,通過預(yù)測水餃的有效積溫計算得到水餃距貨架期終點的時間,即剩余貨架期。在Matlab環(huán)境下,對建立的基于SVM的預(yù)測模型進行實驗,并與參考文獻的實驗結(jié)果進行比較,最后為驗證本文所用方法的有效性,又進行了組合指標(biāo)的預(yù)測。
對應(yīng)圖1所示模型,輸入數(shù)據(jù)x即為風(fēng)味、總體接受性、水分含量、亨特白度、酸價和過氧化值,輸出數(shù)據(jù)y即為有效積溫。本次實驗中在Matlab的環(huán)境下進行生鮮食品貨架期的SVM預(yù)測模型的仿真實驗。其步驟為:
(1)按照格式要求準(zhǔn)備數(shù)據(jù)集。同文獻[9]一致,選取表中16組作為訓(xùn)練數(shù)據(jù),其余5組(9、12、13、16、17)數(shù)據(jù)作為測試數(shù)據(jù)。輸出為有效積溫(y),其余為輸入變量。
(2)將模型訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)都進行歸一化處理;然后采用交叉驗證對主要參數(shù)c與g(懲罰參數(shù)c和核函數(shù)參數(shù)g)進行尋優(yōu),精細(xì)化尋優(yōu)后c和g的范圍為2-4到24,步長為3,通過參數(shù)迭代,尋找出使得模型訓(xùn)練誤差值最小的c、g參數(shù)組合,結(jié)果如圖2所示,c值為16,g值為0.203 06,此時交叉驗證的均方誤差(MSE)為0.000 387 62。
表2 各測試指標(biāo)數(shù)值
圖2SVM參數(shù)優(yōu)化3D視圖
(3)利用上面得到的最佳參數(shù)對SVM進行訓(xùn)練,建立預(yù)測模型model,為判斷模型的有效性,首先對訓(xùn)練數(shù)據(jù)進行了回歸預(yù)測,得到的預(yù)測效果較好,然后對測試數(shù)據(jù)集進行測試和預(yù)測,預(yù)測結(jié)果如圖3所示,相關(guān)系數(shù)為0.991 3,MSE為0.01%。
圖3 測試樣本模型預(yù)測結(jié)果
根據(jù)上述預(yù)測結(jié)果,將參考文獻中所用的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型與本文采用的SVM預(yù)測模型以及實際測定值相比較,見表3,其中距貨架期終點積溫=終點積溫-有效積溫預(yù)測值,并計算距貨架期終點積溫的相對誤差。
表3 有效積溫預(yù)測值及驗證
從表3可以我們看出,平均相對誤差SVM模型要比BP神經(jīng)網(wǎng)絡(luò)模型小0.392,且平均絕對誤差也相應(yīng)的小81.6。再對這兩種方法再進行誤差評估,計算兩種預(yù)測模型的有效積溫預(yù)測值與實際值的誤差均方差,得到BP神經(jīng)網(wǎng)絡(luò)的誤差均方差為497.5,而SVM的誤差均方差為228.1,明顯要小于前者。所以基于統(tǒng)計理論和數(shù)學(xué)為基礎(chǔ)的支持向量機回歸模型,要比BP神經(jīng)網(wǎng)絡(luò)的預(yù)測效果更理想。根據(jù)文獻[9]中有效積溫的計算公式(其中K為有效積溫h·℃,T為實測的冷藏溫度℃,C是相對零點,N是冷藏時間),假定測試樣本數(shù)據(jù)是在恒定溫度-15℃下測定,對SVM模型預(yù)測結(jié)果和文獻[9]BP神經(jīng)網(wǎng)絡(luò)模型所預(yù)測結(jié)果分別計算貨架期,并進行比較,見表4。
表4 BP神經(jīng)網(wǎng)絡(luò)與SVM貨架期預(yù)測結(jié)果比較
從預(yù)測值來看,兩種預(yù)測模型所得結(jié)果的平均相對誤差中,SVM要比BP小0.4,雖然兩者的絕對誤差相等,但對其再進行誤差評估,得到BP神經(jīng)網(wǎng)絡(luò)模型的誤差均方差(1.58)要大于SVM的誤差均方誤差(0.836)。
上面所述是將有效積溫作為貨架期的終結(jié)指標(biāo),而過氧化值也是一種檢測食品質(zhì)量和變質(zhì)程度的指標(biāo),產(chǎn)品的衛(wèi)生標(biāo)準(zhǔn)規(guī)定,過氧化值不得大于0.2%,即15.76meq/kg,則利用SVM模型對有效積溫和過氧化值進行組合預(yù)測,不但可以對貨架期進行預(yù)測,還可以起到一定程度的預(yù)警作用。重新隨機選取訓(xùn)練及測試數(shù)據(jù)進行實驗。在進行實驗之前,利用SPSS軟件對預(yù)測指標(biāo)進行簡單相關(guān)性分析,兩者相關(guān)性系數(shù)r=0.94,p<0.01顯著相關(guān),再對其進行偏相關(guān)分析,即在控制其他變量的情況下,分析有效積溫和過氧化值之間的相關(guān)性,結(jié)果見表5。
表5 相關(guān)性分析結(jié)果
結(jié)果表明,兩者相關(guān)系數(shù)r=0.109<0.3,存在弱相關(guān),且p= 0.689>0.05,兩者之間不存在顯著的相關(guān)關(guān)系,最后對有效積溫和過氧化值進行基于SVM模型的組合預(yù)測,結(jié)果見表6。
表6 SVM模型對有效積溫和過氧化值的組合預(yù)測結(jié)果及驗證
從表6可知,SVM模型的預(yù)測結(jié)果中有效積溫的最大相對誤差為5.01%,平均相對誤差為2.706%,過氧化值的最大相對誤差為6.39%,平均相對誤差為3.406%,說明此模型可有效地進行組合預(yù)測貨架期,也說明了預(yù)測模型的實用性和有效性。
SVM使用范圍廣,可以較好地解決小樣本、非線性、高維數(shù)、局部極小值等實際問題且具有良好的推廣價值,本文采用該方法對生鮮食品貨架期預(yù)測進行了研究,建立了模型,且以參考文獻[9]中的速凍水餃為例,利用Matlab對該模型進行仿真實驗,并將結(jié)果與參考文獻[9]所用的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型的預(yù)測結(jié)果進行了比較,結(jié)果顯示本文SVM模型的預(yù)測值與實際值的相對誤差最大為3.1%,比BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果更能接近實際情況,更為理想。最后又通過將速凍水餃的指標(biāo)組合預(yù)測,再次說明了SVM模型的可用性和有效性,以及可以更好地為生鮮食品貨架期管理提供有效的參考依據(jù),并為生鮮食品的貨架期預(yù)測提供新途徑。
[1]胡位歆,金王平,劉東紅.冷鏈?zhǔn)称菲焚|(zhì)(貨架壽命)預(yù)測模型的建立方法[J].中國食物與營養(yǎng),2014,20(5):45-49.
[2]宋晨,劉寶林,王欣,等.冷凍羊肉剩余貨架期預(yù)測模型研究[J].食品科學(xué),2010,31(6):279-282.
[3]Alejandra Tomaca,Rodolfo Horacio Mascheronib,María Isabel Yeannes.Modelling the effect of gamma irradiation on the inactivation and growth kinetics of psychrotrophic bacteria in squid rings during refrigerated storage.Shelf-life predictions[J].Journal of Food Engineering,2013,117(2):211-216.
[4]Stefanie Bruckner,Antonia Albrecht,Brigitte Petersen.A predictive shelf life model as a tool for the improvement of quality management in pork and poultry chains[J].Food control,2013,29(2):451-460.
[5]佟懿,謝晶.鮮帶魚不同貯藏溫度的貨架期預(yù)測模型[J].農(nóng)業(yè)工程學(xué)報,2009,25(6):301-305.
[6]范新光.鮮切西蘭花減壓冷藏保鮮技術(shù)與貨架期預(yù)測模型的研究[D].煙臺:煙臺大學(xué),2014.
[7]李汴生,黃智君,張曉銀,等.冷配送萵筍菜肴的貨架期預(yù)測模型建立與評價[J].現(xiàn)代食品科技,2015,31(3):177-183.
[8]謝晶,張利平,高志立,等.雞毛菜的品質(zhì)動力學(xué)分析及貨架期預(yù)測模型[J].食品科學(xué),2014,35(10):268-272.
[9]潘治利,張卓,黃忠民,等.BP神經(jīng)網(wǎng)絡(luò)結(jié)合有效積溫預(yù)測速凍水餃變溫冷藏貨架期[J].農(nóng)業(yè)工程學(xué)報,2012,28(22):276-281.
[10]Sumit Goyal,Gyanendra Kumar Goyal.Cascade Artificial Neural Network Models for Predicting Shelf Life of Processed Cheese[J].Journal of Advances in Information Technology,2013,4(2):80-83.
[11]Ubonrat Siripatrawan,Pantipa Jantawat.A novel method for shelf life prediction of a packaged moisture sensitive snack using multilayer perceptron neural network[J].Expert Systems with Applications,2008, 34(2):1 562-1 567.
[12]蔡超.酸奶在貯存期間參數(shù)的變化和對貨架壽命預(yù)測模型的研究[D].武漢:華中農(nóng)業(yè)大學(xué),2012.
[13]張麗平,余曉琴,童華榮.Weibull模型在板鴨貨架壽命預(yù)測中的應(yīng)用[J].食品科技,2010,35(2):111-113.
[13]W S Duyvesteyn,E Shimoni,T P Labuza.Determination of the End of Shelf-life for Milk using Weibull HazardMethod[J].LWT-Food Science and Technology,2001,34(3):143-148.
[14]顧海寧.冷卻豬肉貯存中的品質(zhì)變化及貨架期預(yù)測[J].現(xiàn)代食品科技,2013,29(11):2 621-2 626.
[15]劉春芝,許洪高,李紹振,等.柑橘類果汁貨架期研究進展[J].食品科學(xué),2012,33(13):292-298.
[16]S Limbo L,Torri N,Sinelli L,Franzetti E.Casiraghi.Evaluation and predictive modeling of shelf life of minced beef stored in high-oxygen modified atmosphere packaging at different temperatures[J].Meat Science,2010,84(1):129-136.
[17]Wenli Dong,Xue Gong,Jing Dong etc.Oxidation kinetics of hazelnut shelf-life prediction model[J].Applied Mechanics and Materials, 2012,200:466-469.
[18]陳海建,滕克難,等.基于修正Arrhenius方法的SRM藥柱儲存壽命預(yù)估[J].彈簧與制導(dǎo)學(xué)報,2011,31(4):232-235.
[19]聶銘,周冀衡,等.基于MIV-SVM的烤煙評吸質(zhì)量預(yù)測模型[J].中國煙草學(xué)報,2014,20(6):56-62.
[20]秦永寬,黃聲享,趙卿.基于小波消噪和LS-SVM的混沌時間序列預(yù)測模型及其應(yīng)用[J].大地測量與地球動力學(xué),2008,28(6):96-99.
[21]劉俊娥,慕檸嚀,劉丙午.固有模態(tài)SVM預(yù)測模型在零售銷量預(yù)測中的應(yīng)用[J].物流技術(shù),2013,23(11):76-78.
[22]曹秋勤.基于支持向量機的蔬菜質(zhì)量安全預(yù)測及溯源模型的研究與應(yīng)用[D].廣州:華南理工大學(xué),2014.
Study on Fresh Food Shelf Life Forecasting Based on SVM
Yuan Yanyan,Wang Xingfen
(School of Information Management,Beijing University of Information Technology,Beijing 100192,China)
In this paper,we used the support vector machine to forecast the shelf life of the fresh food of a retailer,built the shelf life forecasting model,then in the case of the quick-frozen dumpling,conducted a simulation experiment of the model under the Matlab environment;next we compared the result yielded with that by the BP neural network model and demonstrated that the model established in this paper fitted more closely with the actual value and was thus more accurate.
SVM;fresh food;shelf life;forecasting
TS207;TP399
A
1005-152X(2015)10-0064-04
2015-07-01
北京市教委科技重點項目“電子商務(wù)平臺交易糾紛規(guī)避的若干支撐技術(shù)研究”(KZ201411232036)
袁彥彥(1988-),女,山東臨沂人,北京信息科技大學(xué)信息管理學(xué)院碩士研究生,研究方向:物流工程;王興芬(1968-),女,教授,博士,研究方向:物流管理、電子商務(wù)與WEB安全。
10.3969/j.issn.1005-152X.2015.10.019