崔方超,毛智超,李婷婷,勵(lì)建榮*
(1 渤海大學(xué)食品科學(xué)與工程學(xué)院 生鮮農(nóng)產(chǎn)品貯藏加工及安全控制技術(shù)國(guó)家地方聯(lián)合工程研究中心中國(guó)輕工業(yè)海水魚加工重點(diǎn)實(shí)驗(yàn)室 遼寧錦州121013 2 大連民族大學(xué)生命科學(xué)學(xué)院 遼寧大連 116600)
水產(chǎn)品營(yíng)養(yǎng)豐富,含有大量的蛋白質(zhì)、維生素和礦物質(zhì),是保持人體健康的重要營(yíng)養(yǎng)物質(zhì)。水產(chǎn)品在死后容易受到微生物、內(nèi)源酶以及周圍環(huán)境的影響而導(dǎo)致腐敗變質(zhì)[1]。貨架期是消費(fèi)者判別食品新鮮度和品質(zhì)安全的重要依據(jù)之一[2],因此構(gòu)建一個(gè)準(zhǔn)確的水產(chǎn)品貨架期預(yù)測(cè)模型顯得尤為重要。
在構(gòu)建模型之前,需要選取能夠指示水產(chǎn)品新鮮度的指標(biāo)。在內(nèi)源酶或細(xì)菌降解的作用下,水產(chǎn)品體內(nèi)的揮發(fā)性鹽基氮(TVB-N)會(huì)不斷增加,TVB-N 常被作為評(píng)價(jià)水產(chǎn)品新鮮度的一個(gè)重要指標(biāo)。K 值是腺苷三磷酸(ATP)降解產(chǎn)物次黃嘌呤核苷、次黃嘌呤的和與腺苷三磷酸關(guān)聯(lián)化合物總量的百分比,反映ATP 降解的整個(gè)循環(huán),也是衡量水產(chǎn)品新鮮度的重要指標(biāo)。菌落總數(shù)(TVC)是從微生物角度評(píng)價(jià)水產(chǎn)品新鮮度的一個(gè)重要指標(biāo)。感官評(píng)分是人們對(duì)魚類新鮮度最直觀的打分,也是評(píng)價(jià)水產(chǎn)品新鮮度不可或缺的一個(gè)指標(biāo)[1,3]。本研究采用TVC、TVB-N、K 值、感官評(píng)分等新鮮度指標(biāo)來(lái)預(yù)測(cè)水產(chǎn)品的剩余貨架期。
傳統(tǒng)的貨架期模型一般是基于動(dòng)力學(xué)方法建立的,包括化學(xué)動(dòng)力學(xué)和微生物動(dòng)力學(xué)[2]。雷志方等[4]利用動(dòng)力學(xué)模型并結(jié)合Arrhenius 方程,根據(jù)金槍魚的相關(guān)新鮮度指標(biāo)建立金槍魚的貨架期預(yù)測(cè)模型,結(jié)果表明根據(jù)不同的新鮮度指標(biāo)建立的貨架期預(yù)測(cè)模型的相對(duì)誤差也不同,誤差范圍在20%之內(nèi)。丁婷等[5]研究了不同儲(chǔ)藏溫度下三文魚片中菌落總數(shù)、假單胞菌、乳酸菌等微生物的生長(zhǎng)情況,利用微生物動(dòng)力學(xué)模型結(jié)合Belehradek 方程,建立了三文魚片的貨架期預(yù)測(cè)模型,結(jié)果表明根據(jù)不同的微生物生長(zhǎng)情況建立的貨架期預(yù)測(cè)模型的相對(duì)誤差是不同的,誤差范圍在18.9%之內(nèi)。傳統(tǒng)貨架期模型是基于單一的新鮮度指標(biāo)或單一的微生物生長(zhǎng)情況來(lái)建立貨架期模型,這樣會(huì)導(dǎo)致根據(jù)不同新鮮度指標(biāo)或不同微生物生長(zhǎng)情況所建立的貨架期模型的預(yù)測(cè)精度有所差別,從而使模型的預(yù)測(cè)精度降低,并且只能預(yù)測(cè)對(duì)應(yīng)的一種水產(chǎn)品,不能夠同時(shí)對(duì)多種水產(chǎn)品的貨架期進(jìn)行預(yù)測(cè)。因此,研究一種更準(zhǔn)確、更快速且能夠同時(shí)預(yù)測(cè)多種水產(chǎn)品貨架期的預(yù)測(cè)模型迫在眉睫。
隨著機(jī)器學(xué)習(xí)的發(fā)展,基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型已經(jīng)應(yīng)用于化學(xué)、生物、天氣、工業(yè)、食品等領(lǐng)域。Li 等[6]采用BP 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)生物氣溶膠濃度,結(jié)果表明BP 模型具有較好的預(yù)測(cè)性能,模型的預(yù)測(cè)精度為84.01%。Deng 等[7]采用粒子群算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)模型(Particle swarm optimization-back propagation,PSO-BP)、反向傳播(Back propagation,BP)模型和遺傳算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)(Genetic algorithm-back propagation,GA-BP)模型分別對(duì)云南薩餅中大腸菌群的數(shù)量進(jìn)行預(yù)測(cè),結(jié)果表明PSO-BP 模型的預(yù)測(cè)精度最好,PSO-BP 模型的均方誤差為0.0097。Li等[8]用儲(chǔ)藏溫度、相對(duì)濕度、果皮硬度等9 個(gè)品質(zhì)指標(biāo)來(lái)構(gòu)建鮮食葡萄的貨架期預(yù)測(cè)模型,結(jié)果表明優(yōu)化后的徑向基函數(shù)(Radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)模型比BP 神經(jīng)網(wǎng)絡(luò)模型、Arrhenius 模型的預(yù)測(cè)精度更高,其中Arrhenius 模型的預(yù)測(cè)精度是最差的。Jiang 等[9]利用BP 模型對(duì)羊肉的新鮮度進(jìn)行分類,結(jié)果表明BP 模型具有很好的適用性,總體預(yù)測(cè)精度為93.78%。由此可見,人工神經(jīng)網(wǎng)絡(luò)模型在食品的貨架期預(yù)測(cè)領(lǐng)域上具有良好的應(yīng)用前景。
目前對(duì)于生鮮水產(chǎn)品貨架期的預(yù)測(cè)模型,國(guó)內(nèi)外的大部分學(xué)者還是采用傳統(tǒng)的動(dòng)力學(xué)模型進(jìn)行預(yù)測(cè),基于神經(jīng)網(wǎng)絡(luò)建立的新鮮水產(chǎn)品貨架期模型比較少見。本文中同時(shí)采用BP 神經(jīng)網(wǎng)絡(luò)模型、GA-BP 神經(jīng)網(wǎng)絡(luò)模型、RBF 神經(jīng)網(wǎng)絡(luò)模型、極限學(xué)習(xí)機(jī)(Extreme learning machine,ELM)神經(jīng)網(wǎng)絡(luò)模型和支持向量回歸機(jī)(Support vector machine for regression,SVR)模型對(duì)不同儲(chǔ)藏溫度下4 種水產(chǎn)品的貨架期進(jìn)行同時(shí)預(yù)測(cè),旨在找到一種能夠快速、高精度且同時(shí)預(yù)測(cè)多種水產(chǎn)品貨架期的模型,從而為生鮮水產(chǎn)品的品質(zhì)控制提供一定的理論基礎(chǔ)。
在遼寧省錦州市水產(chǎn)市場(chǎng)挑選新鮮的金槍魚、三文魚、大菱鲆和鯛魚,用帶有碎冰塊的保溫箱低溫保存運(yùn)回實(shí)驗(yàn)室,并立即開展試驗(yàn)。將金槍魚、三文魚、大菱鲆和鯛魚分別去皮,取魚肉切成(150±5)g 的方塊,裝入滅菌后的蒸煮袋內(nèi)封口,于0,4,10 ℃溫度下儲(chǔ)藏。
氧化鎂,河北鎂熙生物有限公司;硼酸,濟(jì)南躍陽(yáng)化工有限公司;鹽酸,上海源葉生物科技有限公司;甲基紅,武漢華翔科潔生物技術(shù)有限公司。
Kjeltec 8400 凱氏氮分析儀,丹麥Foss 公司,1260 Infinity II 安捷倫液相色譜儀,美國(guó)Agilent公司。
1.3.1 理化指標(biāo)及感官評(píng)價(jià) 參考國(guó)標(biāo)GB/T 30762-2018《水產(chǎn)品感官評(píng)價(jià)指南》對(duì)試驗(yàn)水產(chǎn)品的外觀、氣味、質(zhì)地3 方面進(jìn)行評(píng)價(jià)[10],感官評(píng)價(jià)標(biāo)準(zhǔn)如表1 所示。選取15 位實(shí)驗(yàn)室成員按照感官評(píng)價(jià)表對(duì)樣品進(jìn)行綜合打分,取平均分記為樣品的感官評(píng)價(jià)值。
表1 感官評(píng)價(jià)表Table 1 Sensory evaluation table
菌落總數(shù)參照國(guó)標(biāo)GB 4789.2-2016《食品安全國(guó)家標(biāo)準(zhǔn) 食品微生物學(xué)檢驗(yàn) 菌落總數(shù)測(cè)定》的方法進(jìn)行測(cè)定[11]。
揮發(fā)性鹽基氮參照國(guó)標(biāo)GB 5009.228-2016《食品安全國(guó)家標(biāo)準(zhǔn) 食品中揮發(fā)性鹽基氮的測(cè)定》的方法進(jìn)行測(cè)定[12]。
pH 值參考丁婷[13]的方法進(jìn)行測(cè)定,略有修改。準(zhǔn)確稱?。?±0.05)g 均勻絞碎的樣品,放置于燒杯中。加入45 mL 蒸餾水,進(jìn)行均質(zhì)后靜置30 min。然后進(jìn)行過(guò)濾,棄取初濾液,得到上清液用pH 計(jì)測(cè)定。
K 值參考SC/T 3048-2014《魚類鮮度指標(biāo)K值的測(cè)定 高效液相色譜法》中的方法進(jìn)行K 值的測(cè)定[14]。
在不同溫度下儲(chǔ)藏的4 種水產(chǎn)品每隔一定時(shí)間測(cè)定一次理化指標(biāo),試驗(yàn)設(shè)計(jì)如表2 所示。根據(jù)SC/T 3117-2006《生食金槍魚》的要求[15],當(dāng)菌落總數(shù)超過(guò)4 lg(CFU/g),記為金槍魚貨架期的終點(diǎn)。三文魚和鯛魚作為海水魚,常被作為高品質(zhì)魚食用,Rosnes 等[16]在研究中指出高品質(zhì)魚類菌落總數(shù)以6 lg(CFU/g)作為人們可接受的限值,因此當(dāng)菌落總數(shù)達(dá)到6 lg(CFU/g)記為三文魚和鯛魚的貨架期終點(diǎn)。大菱鲆作為淡水魚,根據(jù)國(guó)際食品微生物委員會(huì)的規(guī)定[17],魚類的菌落總數(shù)可接受最高安全限值為7 lg(CFU/g),因此當(dāng)大菱鲆的菌落總數(shù)超過(guò)7 lg(CFU/g)記為貨架期終點(diǎn)。以上總計(jì)共測(cè)得80 組樣本,作為訓(xùn)練樣本使用。另外在0,4,10 ℃下,分別隨機(jī)取4 種水產(chǎn)品3 個(gè)不同時(shí)間段的樣本進(jìn)行理化指標(biāo)的測(cè)定,總計(jì)測(cè)得12 組樣本,作為測(cè)試樣本使用。
表2 試驗(yàn)設(shè)計(jì)表Table 2 Experimental design table
1.3.2 建模方法
1.3.2.1 BP 神經(jīng)網(wǎng)絡(luò) BP 神經(jīng)網(wǎng)絡(luò)是一種多層的前饋型神經(jīng)網(wǎng)絡(luò),其在網(wǎng)絡(luò)訓(xùn)練的過(guò)程中采用誤差反向傳播不斷調(diào)整神經(jīng)元的權(quán)值和閾值,從而滿足期望值[18]。BP 神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層和輸出層構(gòu)成,層與層之間采用全連接的方式,由傳遞函數(shù)傳遞層與層之間的結(jié)果,而同層之間的神經(jīng)元互不相連。在隱藏層中,隱藏層的數(shù)量可以是一層或者多層[19],多層隱藏層雖然提高了模型的泛化能力和預(yù)測(cè)精度,但時(shí)間過(guò)長(zhǎng)。在本文中為了節(jié)省訓(xùn)練時(shí)間,采用單層的隱藏層,單層前饋型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。
圖1 單層前饋型神經(jīng)網(wǎng)絡(luò)拓?fù)鋱DFig.1 Single-layer feedforward neural network topology
1.3.2.2 GA-BP 神經(jīng)網(wǎng)絡(luò) 遺傳算法是一種模擬自然界生物進(jìn)化機(jī)制的一種算法,遵循適者生存、優(yōu)勝劣汰的原則,即在尋優(yōu)過(guò)程中將有用的保留,無(wú)用的剔除[20]。遺傳算法將問(wèn)題參數(shù)編碼為染色體,利用不斷迭代的方式進(jìn)行選擇、交叉和變異等運(yùn)算來(lái)交換種群中染色體的信息,最終生成符合優(yōu)化要求的染色體。
由于初始權(quán)值和閾值對(duì)BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練準(zhǔn)確度影響很大,本文利用遺傳算法的優(yōu)良特性來(lái)不斷迭代尋找BP 神經(jīng)網(wǎng)絡(luò)較優(yōu)的初始權(quán)值和閾值,從而提高BP 神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確性,構(gòu)建成GA-BP 神經(jīng)網(wǎng)絡(luò)。
1.3.2.3 RBF 神經(jīng)網(wǎng)絡(luò) RBF 神經(jīng)網(wǎng)絡(luò)也是多層前饋型網(wǎng)絡(luò)的一種,由輸入層、隱藏層和輸出層構(gòu)成,其隱藏層只有一層[21]。RBF 神經(jīng)網(wǎng)絡(luò)的原理是將徑向基函數(shù)作為隱含層神經(jīng)元的“基”,構(gòu)成隱含層空間[22],這樣輸入層就可以直接映射到隱含層,而不需要“權(quán)”的連接。隱含層空間到輸出層空間的變換是線性的,即網(wǎng)絡(luò)的輸出是隱含層神經(jīng)元的線性加權(quán)和[23]。
1.3.2.4 ELM 神經(jīng)網(wǎng)絡(luò) ELM 神經(jīng)網(wǎng)絡(luò)是單隱含層前饋型神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)在運(yùn)行時(shí)隨機(jī)產(chǎn)生初始權(quán)值和閾值,在訓(xùn)練過(guò)程中并不需要調(diào)整,只需要設(shè)置適宜的隱含層神經(jīng)元數(shù)目和隱含層神經(jīng)元的激活函數(shù)即可獲得最優(yōu)解,該神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)速度快和泛化性能好的優(yōu)點(diǎn)[24]。
1.3.2.5 支持向量回歸機(jī) 支持向量機(jī)(Support vector machine,SVM)是以Brasil 等[25]創(chuàng)建的統(tǒng)計(jì)學(xué)理論為基礎(chǔ)提出的,支持向量回歸機(jī)是在SVM 的基礎(chǔ)上引入了不敏感損失函數(shù)得到的一種回歸擬合的方法。SVR 的基本思想是尋找一個(gè)最優(yōu)的平面,使所有訓(xùn)練樣本離該平面的誤差最小。在SVR 預(yù)測(cè)模型的建立中需要確定輸入向量、輸出向量以及中間層的核函數(shù)。SVR 模型可以很好的解決小樣本及陷入局部最優(yōu)的回歸問(wèn)題。
本文中所有模型的建立和數(shù)據(jù)分析均基于軟件MATLAB 2018b,采用Origin 2021 軟件進(jìn)行繪圖。
通過(guò)試驗(yàn)對(duì)4 種水產(chǎn)品的TVC 值、TVB-N值、pH 值、K 值和感官評(píng)分進(jìn)行測(cè)定,共測(cè)得訓(xùn)練樣本數(shù)據(jù)80 組,測(cè)試樣本數(shù)據(jù)12 組。將所測(cè)得4種水產(chǎn)品的新鮮度指標(biāo)與各自的剩余貨架期指標(biāo)進(jìn)行相關(guān)性分析,結(jié)果如圖2 所示。從圖中可以明顯看出,4 種水產(chǎn)品的TVC 值、TVB-N 值、pH 值和K 值與剩余貨架期呈負(fù)相關(guān)關(guān)系,感官評(píng)分與剩余貨架期呈正相關(guān)關(guān)系。4 種水產(chǎn)品的TVC 值、TVB-N 值、K 值和感官評(píng)分4 個(gè)指標(biāo)與剩余貨架期的相關(guān)性都比較強(qiáng),絕對(duì)值都在0.8 以上,最高可達(dá)0.92。因此可以將TVC 值、TVB-N 值、K值和感官評(píng)分4 個(gè)指標(biāo)作為模型的輸入向量來(lái)預(yù)測(cè)水產(chǎn)品的剩余貨架期。然而,4 種水產(chǎn)品的pH值標(biāo)與剩余貨架期的相關(guān)性反而比較低,絕對(duì)值最低在0.47,最高在0.67。原因可能是由于水產(chǎn)品在死后,機(jī)體在ATP 酶、乳酸菌等產(chǎn)酸微生物的作用下,乳酸含量增加導(dǎo)致pH 值降低;貯藏一段時(shí)間后,機(jī)體內(nèi)蛋白質(zhì)在微生物的作用下開始分解為氨、三甲胺等堿性物質(zhì),使pH 值開始上升,這種現(xiàn)象使pH 值標(biāo)與剩余貨架期的相關(guān)性減弱。因此為了保證模型的準(zhǔn)確性,本研究將pH 值指標(biāo)剔除,不作為模型的輸入向量使用,只將相關(guān)性較高的TVC 值、TVB-N 值、K 值和感官評(píng)分4個(gè)指標(biāo)作為各個(gè)模型的輸入向量使用。
圖2 4 種水產(chǎn)品新鮮度指標(biāo)的相關(guān)性分析圖Fig.2 Correlation analysis chart of four freshness indicators of aquatic products
由于各指標(biāo)的量綱是不同的,為了保證各模型訓(xùn)練的準(zhǔn)確性,需要對(duì)數(shù)據(jù)進(jìn)行量綱統(tǒng)一,即歸一化處理。歸一化處理的方法見式(1)[6]。
式中,X——?dú)w一化后的數(shù)據(jù);X0——原數(shù)據(jù);Xmin——每一列指標(biāo)中的最小值;Xmax——每一列指標(biāo)中的最大值。
2.3.1 BP 神經(jīng)網(wǎng)絡(luò)模型的建立 BP 神經(jīng)網(wǎng)絡(luò)模型的拓?fù)浣Y(jié)構(gòu)對(duì)于其預(yù)測(cè)精度起著重要的作用。將種類、溫度、感官評(píng)分、TVC 值、TVB-N 值、K 值6 個(gè)指標(biāo)作為輸入層單元,將剩余貨架期作為輸出層單元。隱藏層單元數(shù)目的不同,模型的預(yù)測(cè)誤差也會(huì)隨之改變。隱藏層單元數(shù)目一般符合式(2)[20]。
式中,M——輸入層單元數(shù);N——輸出層單元數(shù);n——隱藏層單元數(shù);a——1~10 的常數(shù)。
隱藏層單元數(shù)在3~13 范圍。分別取不同的隱藏層單元數(shù),計(jì)算10 次模型的決定系數(shù)R2,選擇10 次決定系數(shù)平均值最大的一個(gè)隱藏層單元數(shù)。如表3 所示,隱藏層單元數(shù)為9 時(shí),平均決定系數(shù)最大,為0.9711,因此BP 神經(jīng)網(wǎng)絡(luò)模型的隱藏層單元數(shù)設(shè)定為9。
表3 不同隱藏層單元數(shù)目對(duì)應(yīng)的BP 神經(jīng)網(wǎng)絡(luò)決定系數(shù)(R2)Table 3 Determination coefficients(R2)of BP neural network corresponding to different numbers of hidden layer units
BP 網(wǎng)絡(luò)參數(shù)設(shè)置如下:動(dòng)量設(shè)置為0.9,學(xué)習(xí)速率設(shè)置為0.01,網(wǎng)絡(luò)性能目標(biāo)誤差設(shè)置為0.0001,最大訓(xùn)練次數(shù)設(shè)置為1 000,隱藏層傳遞函數(shù)選擇logsig 函數(shù),輸出層的傳遞函數(shù)選擇purelin 函數(shù),訓(xùn)練函數(shù)選擇trainlm 函數(shù)。
2.3.2 GABP 神經(jīng)網(wǎng)絡(luò)模型 BP 神經(jīng)網(wǎng)絡(luò)模型每次訓(xùn)練的權(quán)值和閾值都是隨機(jī)選取的,從而導(dǎo)致BP 神經(jīng)網(wǎng)絡(luò)模型每次預(yù)測(cè)的結(jié)果都是不確定的[26]。為了提高BP 神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度,采用遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)模型的初始權(quán)值和閾值,選取BP 神經(jīng)網(wǎng)絡(luò)模型精度最高時(shí)的初始權(quán)值和閾值。GABP 神經(jīng)網(wǎng)絡(luò)模型的流程圖如圖3所示。
圖3 GABP 神經(jīng)網(wǎng)絡(luò)模型的流程圖Fig.3 Flow chart of GABP neural network model
GABP 神經(jīng)網(wǎng)絡(luò)模型是在BP 神經(jīng)網(wǎng)絡(luò)模型的拓?fù)浣Y(jié)構(gòu)和參數(shù)的基礎(chǔ)上建立的,因此BP 神經(jīng)網(wǎng)絡(luò)模型的拓?fù)浣Y(jié)構(gòu)和參數(shù)保持不變。GABP 神經(jīng)網(wǎng)絡(luò)模型的其它參數(shù)設(shè)置為:群體個(gè)體數(shù)目為40,最大遺傳代數(shù)為50,代溝為0.95,交叉概率為0.7,變異概率為0.01,選擇算子為輪盤選擇函數(shù),交叉算子為單點(diǎn)交叉,變異算子為離散變異函數(shù)。
2.3.3 RBF 神經(jīng)網(wǎng)絡(luò)模型 RBF 神經(jīng)網(wǎng)絡(luò)模型的拓?fù)浣Y(jié)構(gòu)如下:同樣采用種類、溫度、感官評(píng)分、TVC 值、TVB-N 值、K 值作為輸入層單元,將剩余貨架期作為輸出層單元。通過(guò)不斷增加隱藏層單元的數(shù)目,直至滿足目標(biāo)誤差。如圖4 所示,當(dāng)隱藏層單元的數(shù)目為35 時(shí),網(wǎng)絡(luò)性能誤差為8.6141×10-5,滿足網(wǎng)絡(luò)性能誤差目標(biāo)0.0001。
圖4 不同隱藏層單元數(shù)目的RBF 神經(jīng)網(wǎng)絡(luò)性能誤差Fig.4 Performance errors of RBF neural networks with different number of hidden layer units
RBF 神經(jīng)網(wǎng)絡(luò)模型的參數(shù)設(shè)置如下:網(wǎng)絡(luò)性能誤差目標(biāo)為0.0001,徑向基函數(shù)擴(kuò)展速度spread 為1,最大隱藏層神經(jīng)元數(shù)目為100,每次顯示之間所添加的神經(jīng)元數(shù)目為1,隱藏層的徑向基核函數(shù)選擇高斯函數(shù),輸出層函數(shù)為線性函數(shù)。
2.3.4 ELM 神經(jīng)網(wǎng)絡(luò)模型 ELM 神經(jīng)網(wǎng)絡(luò)模型的拓?fù)浣Y(jié)構(gòu)如下:采用種類、溫度、感官評(píng)分、TVC值、TVB-N 值、K 值作為輸入層單元,將剩余貨架期作為輸出層單元。ELM 神經(jīng)網(wǎng)絡(luò)的隱藏層單元數(shù)目一般不大于輸入層樣本數(shù)[24],即在0~80 中間選取。分別選取不同的隱藏層單元數(shù)目,計(jì)算10次該模型的決定系數(shù)R2,選擇10 次決定系數(shù)平均值最大的一個(gè)隱藏層單元數(shù)目。如表4 所示,當(dāng)隱藏層單元數(shù)目為60 時(shí),ELM 圣經(jīng)網(wǎng)絡(luò)模型運(yùn)行10 次的平均決定系數(shù)最大,為0.9867,因此該模型的隱藏層單元數(shù)目應(yīng)選取60。ELM 神經(jīng)網(wǎng)絡(luò)模型的參數(shù)設(shè)置如下:隱含層神經(jīng)元的激活函數(shù)為S 型函數(shù)[27]。
表4 不同隱藏層單元數(shù)對(duì)應(yīng)的ELM 神經(jīng)網(wǎng)絡(luò)決定系數(shù)(R 2)Table 4 Determination coefficients(R2)of ELM neural network corresponding to different numbers of hidden layer units
2.3.5 SVR 預(yù)測(cè)模型 SVR 預(yù)測(cè)模型的拓?fù)浣Y(jié)構(gòu)如下:將種類、溫度、感官評(píng)分、TVC 值、TVB-N值、K 值作為輸入層單元,將剩余貨架期作為輸出層單元,將高斯函數(shù)作為中間層的核函數(shù),高斯函數(shù)見公式(3)[28]。
式中,γ——RBF 核函數(shù)的半徑。
高斯核函數(shù)中的懲罰因子參數(shù)c 和方差參數(shù)g 影響SVR 模型的性能,采用交叉驗(yàn)證法尋找最優(yōu)的參數(shù)c 和g[29],如圖5 可得,最優(yōu)的參數(shù)c 為8,參數(shù)g 為0.5,此時(shí)訓(xùn)練樣本的均方誤差MSE為0.004995,采用最優(yōu)的參數(shù)c 和g 構(gòu)建SVR 預(yù)測(cè)模型。
圖5 參數(shù)c 和參數(shù)g 的尋優(yōu)結(jié)果圖Fig.5 Optimization result graph of parameter c and parameter g
為了更加方便的、全面的觀察模型的精確度,采用了4 個(gè)評(píng)價(jià)指標(biāo)來(lái)進(jìn)行描述:均方誤差(MSE)、平均絕對(duì)誤差(MAE)、平均絕對(duì)百分比誤差(MAPE)、決定系數(shù)(R2)。均方誤差反映了預(yù)測(cè)值和實(shí)際值之間的差異程度。平均絕對(duì)誤差是所有單個(gè)預(yù)測(cè)值與算術(shù)平均值的偏差的絕對(duì)值的平均,避免了誤差相互抵消,可以更加準(zhǔn)確反映實(shí)際預(yù)測(cè)誤差的大小。平均絕對(duì)百分比誤差表示預(yù)測(cè)值和實(shí)際值之間的差異,值越小越好。決定系數(shù)指回歸平方和在離差平方和所占的比例,值越大越好。評(píng)價(jià)指標(biāo)的計(jì)算公式如下[30]。
式中,Yi——剩余貨架期的實(shí)際值,h;yi——剩余貨架期的預(yù)測(cè)值,h;——剩余貨架期實(shí)際值的平均數(shù),h。
將歸一化后的訓(xùn)練樣本作為BP 神經(jīng)網(wǎng)絡(luò)模型、GA-BP 神經(jīng)網(wǎng)絡(luò)模型、RBF 神經(jīng)網(wǎng)絡(luò)模型、ELM 神經(jīng)網(wǎng)絡(luò)模型和SVR 模型的訓(xùn)練數(shù)據(jù),將歸一化后的測(cè)試樣本作為各模型的測(cè)試數(shù)據(jù),按照已設(shè)置好的模型參數(shù)進(jìn)行模型的訓(xùn)練。利用訓(xùn)練好的模型對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè),結(jié)果如圖6 所示。BP 神經(jīng)網(wǎng)絡(luò)模型對(duì)訓(xùn)練樣本和測(cè)試樣本的預(yù)測(cè)精度明顯要低于其他模型。BP 神經(jīng)網(wǎng)絡(luò)模型在對(duì)訓(xùn)練樣本的預(yù)測(cè)中,第16 號(hào)、35 號(hào)、62 號(hào)和80 號(hào)的訓(xùn)練樣本的預(yù)測(cè)誤差比較大;在對(duì)測(cè)試樣本的預(yù)測(cè)中,第1 號(hào)、6 號(hào)和11 號(hào)測(cè)試樣本的預(yù)測(cè)誤差較大。GA-BP 模型很明顯在BP 神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上提高了對(duì)訓(xùn)練樣本和測(cè)試樣本的預(yù)測(cè)精度,對(duì)測(cè)試樣本的預(yù)測(cè)值幾乎與真實(shí)值重合,這也滿足使用遺傳算法來(lái)優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的期望。ELM 神經(jīng)網(wǎng)絡(luò)模型對(duì)訓(xùn)練樣本和測(cè)試樣本的預(yù)測(cè)精度也要優(yōu)于BP 神經(jīng)網(wǎng)絡(luò)模型,對(duì)測(cè)試樣本的預(yù)測(cè)中除了10 號(hào)樣本與真實(shí)值誤差稍大外,其它樣本的預(yù)測(cè)值與真實(shí)值幾乎重合,預(yù)測(cè)精度較高。RBF 神經(jīng)網(wǎng)絡(luò)模型和SVR 模型對(duì)訓(xùn)練樣本、測(cè)試樣本的預(yù)測(cè)精度都很高,能夠很好的同時(shí)預(yù)測(cè)不同溫度下4 種水產(chǎn)品的貨架期。
圖6 各模型對(duì)訓(xùn)練樣本和測(cè)試樣本的預(yù)測(cè)結(jié)果Fig.6 The prediction results of each model for training samples and test samples
從圖7 中可以清楚的看到各個(gè)模型對(duì)測(cè)試樣本的預(yù)測(cè)誤差。BP 神經(jīng)網(wǎng)絡(luò)模型的最大誤差為18.43%,即第1 號(hào)樣本、4 號(hào)樣本的誤差為11.37%,6 號(hào)樣本的誤差為16.72%,11 號(hào)樣本的誤差為14.63%,這符合圖6 的結(jié)果,其它樣本的預(yù)測(cè)誤差均在10%以內(nèi)。GA-BP 神經(jīng)網(wǎng)絡(luò)模型的最大誤差為第10 號(hào)樣本14.63%,其它樣本均在10%以內(nèi)。與BP 神經(jīng)網(wǎng)絡(luò)模型相比,GA-BP 神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度總體上要更為精確。ELM 神經(jīng)網(wǎng)絡(luò)模型的最大誤差為第10 號(hào)樣本15.33%,1 號(hào)樣本的誤差為11.98%,6 號(hào)樣本的誤差均為10.41%,其它樣本的誤差均在9%以內(nèi),總體上略次于GABP 神經(jīng)網(wǎng)絡(luò)模型,而優(yōu)于BP 神經(jīng)網(wǎng)絡(luò)模型,這與圖6 中的信息相吻合。SVR 模型對(duì)測(cè)試樣本的預(yù)測(cè)中,1 號(hào)樣本和2 號(hào)樣本的預(yù)測(cè)誤差為12%,4號(hào)樣本的預(yù)測(cè)誤差為11.34%,其它樣本的預(yù)測(cè)誤差均在8%以內(nèi),總體上要優(yōu)于ELM 神經(jīng)網(wǎng)絡(luò)模型,這也很好地體現(xiàn)了SVR 模型在小樣本預(yù)測(cè)時(shí)的優(yōu)勢(shì)。RBF 神經(jīng)網(wǎng)絡(luò)模型對(duì)測(cè)試樣本的預(yù)測(cè)中,除了第2 號(hào)樣本的預(yù)測(cè)誤差為13%,其它樣本的預(yù)測(cè)誤差均在9%以內(nèi),總體上要優(yōu)于GA-BP 神經(jīng)網(wǎng)絡(luò)模型和ELM 神經(jīng)網(wǎng)絡(luò)模型。
圖7 各模型對(duì)測(cè)試樣本的預(yù)測(cè)誤差率Fig.7 The prediction error rate of each model for test samples
為了能夠更加準(zhǔn)確地評(píng)價(jià)各個(gè)模型的優(yōu)劣,根據(jù)2.5 節(jié)的模型評(píng)價(jià)指標(biāo)公式,用MATLAB 軟件計(jì)算得到各個(gè)模型的評(píng)價(jià)指標(biāo),如表5 所示。各模型MSE、MAE 的大小排列順序?yàn)椋築P 模型>ELM 模 型>GA-BP 模 型>RBF 模 型>SVR 模 型;MAPE 的大小排列順序?yàn)椋築P 模型>ELM 模型>SVR 模型>GA-BP 模型>RBF 模型;R2的大小排列順序?yàn)椋篠VR 模型>RBF 模型>GA-BP 模型>ELM模型>BP 模型。因此,綜合考慮SVR 模型對(duì)4 種水產(chǎn)品貨架期的預(yù)測(cè)精度最好,RBF 神經(jīng)網(wǎng)絡(luò)模型略微次之,BP 神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度最差。
表5 各模型的評(píng)價(jià)指標(biāo)Table 5 Evaluation metrics for each model
通過(guò)對(duì)試驗(yàn)獲得的訓(xùn)練樣本進(jìn)行相關(guān)性分析表明,TVC 值、TVB-N 值、K 值和感官評(píng)分4 個(gè)指標(biāo)與水產(chǎn)品貨架期的相關(guān)性較強(qiáng),絕對(duì)值均在0.8以上,因此可以將以上指標(biāo)作為BP 神經(jīng)網(wǎng)絡(luò)模型、GA-BP 神經(jīng)網(wǎng)絡(luò)模型、RBF 神經(jīng)網(wǎng)絡(luò)模型、ELM 神經(jīng)網(wǎng)絡(luò)模型和SVR 預(yù)測(cè)模型的輸入層單元。5 種模型的預(yù)測(cè)結(jié)果表明,BP 神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度最差,其MSE 為9.5127×10-4,MAE 為0.0197,MAPE 為0.0825,均是5 種模型中最高的;其R2為0.9766,是5 種模型中最低的??傮w上,GA-BP 神經(jīng)網(wǎng)絡(luò)模型的性能較BP 神經(jīng)網(wǎng)絡(luò)模型有全面的提高。ELM 神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度雖優(yōu)于BP 神經(jīng)網(wǎng)絡(luò)模型,但次于GA-BP 神經(jīng)網(wǎng)絡(luò)模型。RBF 神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度要優(yōu)于GABP 神經(jīng)網(wǎng)絡(luò)模型,略微低于SVR 模型,然而當(dāng)樣本數(shù)量較大時(shí)依然可以考慮使用RBF 模型。在本次研究中,SVR 模型的總體性能是最優(yōu)的,其MSE 為2.2971×10-4,MAE 為0.0128,MAPE 為0.0631,R2為0.9944,能夠很好的同時(shí)預(yù)測(cè)金槍魚、三文魚、大菱鲆和鯛魚4 種水產(chǎn)品在0,4,10℃下的貨架期,為水產(chǎn)品的品質(zhì)控制提供了一定的理論基礎(chǔ)。