查靖,葛玲,姚穎,李婷婷,龍白雪,劉鑫漢,2,王武,2*,馬飛,2*
(1.合肥工業(yè)大學(xué) 食品與生物工程學(xué)院,安徽 合肥 230009;2.皖南特色農(nóng)產(chǎn)品加工技術(shù)研究與應(yīng)用中心,安徽 宣城 242000;3.宣城市宣州區(qū)農(nóng)業(yè)農(nóng)村局,安徽 宣城 242000)
揮發(fā)性鹽基氮(total volatile basic nitrogen,TVBN)成分有氨、二甲胺、三甲胺等,是衡量魚肉新鮮度的重要指標(biāo)之一[1]。研究發(fā)現(xiàn),TVB-N 與氨基酸破壞程度顯著正相關(guān),特別是蛋氨酸和酪氨酸的降解,會(huì)在很大程度上改變魚肉顏色和風(fēng)味,造成嚴(yán)重的品質(zhì)劣化[2]。目前,我國(guó)對(duì)TVB-N 值有明確規(guī)定,預(yù)制動(dòng)物性水產(chǎn)品不得超過(guò)30 mg/100 g[3]。雖然臭鱖魚作為鹽漬預(yù)制性水產(chǎn)品不在此標(biāo)準(zhǔn)約束之列,但考慮到TVB-N 對(duì)臭鱖魚新鮮度的影響,開(kāi)展TVB-N 檢測(cè)十分必要。
目前,傳統(tǒng)的TVB-N 檢測(cè)以凱氏定氮法和微量擴(kuò)散法為主,這類方法效率低且對(duì)樣品具有破壞性[4]。隨著科技發(fā)展,比色傳感、高光譜成像和電子鼻等新技術(shù)也被用于肉和肉制品的TVB-N 無(wú)損檢測(cè)中[5-7]。然而,這些方法均存在較多局限性,主要表現(xiàn)為比色傳感存在環(huán)境污染和交叉敏感,高光譜成像存在間接性和數(shù)據(jù)分析復(fù)雜,電子鼻存在設(shè)備昂貴且使用壽命短等問(wèn)題,難以滿足工業(yè)場(chǎng)景應(yīng)用[8-9]。
傅里葉變換紅外光譜(Fourier transform infrared spectroscopy,F(xiàn)T-IR)是根據(jù)分子內(nèi)部原子間的相對(duì)振動(dòng)和分子轉(zhuǎn)動(dòng)等信息來(lái)確定物質(zhì)分子結(jié)構(gòu)[10]。由于FT-IR 靈敏度高,被廣泛應(yīng)用于食品新鮮度識(shí)別[11]、摻假造假識(shí)別[12]、農(nóng)藥殘留檢測(cè)[13]、疾病的快速診斷[14]、環(huán)境氣體監(jiān)測(cè)[15]等領(lǐng)域。這些研究表明基于氣相FT-IR技術(shù)在食品分析領(lǐng)域具有較大應(yīng)用潛力。然而,基于FT-IR 技術(shù)無(wú)損檢測(cè)肉及肉制品中TVB-N 未見(jiàn)文獻(xiàn)報(bào)道。因此,本文以臭鱖魚為研究對(duì)象,探究FT-IR 分析技術(shù)對(duì)臭鱖魚中TVB-N 檢測(cè)的可行性。
機(jī)器學(xué)習(xí)是當(dāng)前工業(yè)現(xiàn)代化背景下的研究熱點(diǎn),被廣泛用于處理大量數(shù)據(jù)和建立與優(yōu)化各種模型。在光譜預(yù)處理上,Savitzky-Golay 平滑(Savitzky-golay smooth,S-GS)在濾除噪聲的同時(shí)可以確保信號(hào)的形狀,小波閾值去噪(wavelet threshold denoising,WTD)能在平滑的同時(shí)較好地保留反映原始信號(hào)特征的尖峰點(diǎn),穩(wěn)健局部加權(quán)回歸(robust locally weighted regression,RLWR)在處理離群值時(shí)更為穩(wěn)健,模擬退火-偏最小二乘(simulated annealing-partial least squares,SAPLS)特征選擇具有跳出局部最小值而搜索全局最小值的特點(diǎn)[16-18]。在回歸分析方面,偏最小二乘回歸(partial least squares regression,PLSR)和支持向量機(jī)(support vector machines,SVM)是兩種經(jīng)典的線性和非線性回歸建模方法。PLSR 通過(guò)將預(yù)測(cè)和觀測(cè)變量投影到新的變量空間,將復(fù)雜光譜變量轉(zhuǎn)化為少數(shù)的潛變量(latent variables,LVs),廣泛應(yīng)用于變量多且高度共線時(shí)構(gòu)建預(yù)測(cè)模型[19];SVM 應(yīng)用了一個(gè)非線性神經(jīng)元的隱藏層、一個(gè)輸出線性神經(jīng)元和一個(gè)專門的學(xué)習(xí)過(guò)程,實(shí)現(xiàn)了全局最優(yōu)值求解和對(duì)未知樣本良好的泛化能力,被廣泛用于回歸和分類等多種機(jī)器學(xué)習(xí)[20]。機(jī)器學(xué)習(xí)的應(yīng)用對(duì)于工業(yè)現(xiàn)代化具有重要現(xiàn)實(shí)意義。
本文使用氣相FT-IR 獲取臭鱖魚揮發(fā)物的紅外光譜,利用移動(dòng)平均(moving average,MA)、S-GS、高斯濾波(gaussian filtering,GF)、RLWR 和WTD 對(duì)光譜進(jìn)行預(yù)處理,采用區(qū)間偏最小二乘(interval partial least squares,iPLS)和SA-PLS 進(jìn)行特征波段選擇,構(gòu)建PLSR 和SVM 檢測(cè)模型,以相對(duì)預(yù)測(cè)誤差(ratio of prediction deviation,RPD)確定較優(yōu)的預(yù)測(cè)模型,以期為研發(fā)臭鱖魚TVB-N 無(wú)損檢測(cè)技術(shù)提供參考。
臭鱖魚:市售,均為同一批發(fā)酵而成產(chǎn)品,質(zhì)量為(400±30)g,冰藏運(yùn)輸至合肥工業(yè)大學(xué)食品與生物工程學(xué)院實(shí)驗(yàn)室;甲基紅、溴甲酚綠、硼酸、鹽酸、氧化鎂、無(wú)水碳酸鈉(均為分析純):國(guó)藥集團(tuán)化學(xué)試劑有限公司;E-switch 鋁箔氣體采樣袋:上海申源科學(xué)儀器有限公司。
IS50 傅里葉變換紅外光譜儀:美國(guó)賽默飛世爾科技公司;LHP-100 恒溫恒濕培養(yǎng)箱:上海三發(fā)科學(xué)儀器有限公司;K9860 全自動(dòng)凱氏定氮儀:濟(jì)南海能儀器股份有限公司;16 m 長(zhǎng)光程氣室:美國(guó)PIKE 技術(shù)公司。
將臭鱖魚分別裝入貯藏袋(材質(zhì):PA/PE 復(fù)合性材料),置于恒溫恒培養(yǎng)濕箱(20 ℃、75%濕度)中進(jìn)行貯藏試驗(yàn)。分別在0、24、48 h 和72 h 取出12 條臭鱖魚樣本,使用氣體采樣袋收集揮發(fā)性氣體。
采用置換法減少氣體池內(nèi)氣體的影響,使用真空泵將氣體池內(nèi)氣體抽出,充入氮?dú)?,重?fù)3 次,在每個(gè)樣本采集前重復(fù)此操作。紅外光譜的譜儀參數(shù)設(shè)置:掃描范圍為4 000~400 cm-1,分辨率0.5 cm-1,掃描頻率為64 次。使用真空泵將氣體池內(nèi)氣體抽出,直至壓力表顯示為-75 kPa,掃描獲取背景光譜。連接氣體采樣袋與氣體池,打開(kāi)進(jìn)氣口閥門和氣體采樣袋閥門,泵入揮發(fā)性氣體,至壓力表顯示為0,在相同條件下獲取樣本揮發(fā)物的紅外光譜,每個(gè)氣體樣本重復(fù)采集3 次,取平均值。共獲取48 個(gè)樣本的光譜,以36 個(gè)樣品作為校正集,用于建立預(yù)測(cè)模型,以12 個(gè)樣品作為測(cè)試集,用于對(duì)建立的數(shù)學(xué)模型進(jìn)行驗(yàn)證。
參考GB 5009.228—2016《食品安全國(guó)家標(biāo)準(zhǔn)食品中揮發(fā)性鹽基氮的測(cè)定》[21]方法檢測(cè)魚肉中的揮發(fā)性鹽基氮。在獲得臭鱖魚揮發(fā)物紅外光譜后,將臭鱖魚各部位肉絞碎,取絞碎魚肉10 g(精確至0.001 g),加入100 mL 超純水,超聲輔助提取15 min,過(guò)濾,采用全自動(dòng)凱氏定氮儀測(cè)定。
1.6.1 平滑
基于窗口的平滑方法主要包括MA、S-GS、GF 和RLWR。MA 是對(duì)光譜的每個(gè)窗口進(jìn)行移動(dòng)平均,這種方法有利于減少數(shù)據(jù)的周期性趨勢(shì);S-GS 是對(duì)光譜的每個(gè)窗口擬合的二次多項(xiàng)式進(jìn)行平滑處理,當(dāng)數(shù)據(jù)快速變化時(shí),這種方法比其他方法更有效;GF 對(duì)每個(gè)窗口進(jìn)行移動(dòng)加權(quán)平均;RLWR 是對(duì)每個(gè)窗口進(jìn)行穩(wěn)健線性回歸,它在處理離群值時(shí)更為穩(wěn)健。通過(guò)改變平滑窗口長(zhǎng)度,分別對(duì)平滑后光譜建立預(yù)測(cè)模型,以預(yù)測(cè)結(jié)果的預(yù)測(cè)均方誤差(root mean square error of prediction,RMSEP)選擇最優(yōu)窗口長(zhǎng)度。
在WTD 中,小波基函數(shù)、閾值類型和小波分解級(jí)別等參數(shù)的選擇均會(huì)對(duì)最終的信號(hào)去噪效果產(chǎn)生很大影響[22]。本文選擇多貝西小波,閾值類型包括硬閾值和軟閾值。通過(guò)改變消失矩、閾值類型和小波分解的級(jí)別,分別對(duì)平滑后光譜建立預(yù)測(cè)模型,以預(yù)測(cè)結(jié)果的RMSEP 選擇合適參數(shù)對(duì)光譜進(jìn)行平滑處理。
1.6.2 特征選擇
SA-PLS 的使用參考文獻(xiàn)[23]的方法,基于初始波段組合,構(gòu)建PLS 模型,以預(yù)測(cè)集R2p及RMSEP 作為SA 的適應(yīng)度函數(shù),通過(guò)Metropolis 準(zhǔn)則以一定概率接受新的解集的思想,在全光譜內(nèi)搜索隨機(jī)變量,以促進(jìn)從局部最小值到全局最小值的移動(dòng)。其參數(shù)設(shè)置分別為子區(qū)間的長(zhǎng)度41 cm-1和數(shù)量5,初始波段組合861~820、921~880、1 162~1 121、2 844~2 803、3 085~3 044 cm-1,初始溫度700,外循環(huán)最大迭代次數(shù)600,鏈長(zhǎng)500,退溫速率0.95。
iPLS 被廣泛用于特征光譜區(qū)間的優(yōu)化選擇[24]。它是將整個(gè)光譜范圍劃分為n 個(gè)等長(zhǎng)的子區(qū)間,通過(guò)建立每個(gè)子區(qū)間的獨(dú)立PLSR 模型,以每個(gè)子模型的交叉驗(yàn)證的均方根誤差作為模型的判斷標(biāo)準(zhǔn)選取最優(yōu)的子區(qū)間組合,本文選擇5 個(gè)長(zhǎng)度為41 cm-1子區(qū)間作為新的光譜變量。
1.6.3 回歸模型
PLSR 是基于多元線性回歸改進(jìn)而來(lái)[25],將復(fù)雜光譜變量轉(zhuǎn)化為少數(shù)的LVs,以LVs 解釋的百分比方差和RMSEP 選擇合適的LVs 數(shù)量,建立TVB-N 預(yù)測(cè)模型。
SVM 是機(jī)器學(xué)習(xí)中伴隨人工神經(jīng)網(wǎng)絡(luò)而出現(xiàn)的熱點(diǎn),涉及到分類和回歸等許多實(shí)際問(wèn)題,參考文獻(xiàn)[26]的方法,采用MATLAB 2020a 中fitrsvm 函數(shù)建模,并使用自動(dòng)超參數(shù)優(yōu)化,找到使五折交叉驗(yàn)證損失最小的超參數(shù),建立TVB-N 預(yù)測(cè)模型。
光譜處理及預(yù)測(cè)模型構(gòu)建通過(guò)MATLAB 2020a 完成。顯著性分析通過(guò)SPSS Statistics 24 完成。圖形繪制采用Origin 2019b。
TVB-N 隨貯藏時(shí)間的變化見(jiàn)圖1。
圖1 TVB-N 隨貯藏時(shí)間的變化Fig.1 Changes in TVB-N over storage time
由圖1 可知,新鮮臭鱖魚中TVB-N 為39.90 mg/100 g,在內(nèi)源酶和微生物的作用下,魚肉中蛋白質(zhì)被分解為堿性含氮物質(zhì)[27],使得貯藏過(guò)程中TVB-N 顯著增加(P<0.05),在24、48 h 和72 h 后分別達(dá)到了56.12、68.31 mg/100 g和86.38 mg/100 g,接近限量標(biāo)準(zhǔn)的3 倍,高含量TVB-N不僅會(huì)降低臭鱖魚的營(yíng)養(yǎng)價(jià)值,食用也會(huì)對(duì)人體健康產(chǎn)生嚴(yán)重危害[28]。因此,實(shí)現(xiàn)臭鱖魚發(fā)酵貯藏過(guò)程TVBN 的在線無(wú)損檢測(cè)對(duì)于消費(fèi)者健康至關(guān)重要。
臭鱖魚在貯藏過(guò)程中釋放的揮發(fā)物產(chǎn)生了大量的特征紅外吸收峰,為去除水汽和二氧化碳吸收的影響,取1 300~780 cm-1和3 300~2 500 cm-1范圍的紅外光譜進(jìn)行分析。臭鱖魚揮發(fā)物紅外光譜見(jiàn)圖2。
圖2 臭鱖魚揮發(fā)物的紅外光譜Fig.2 Infrared spectra of volatiles from stinky mandarin fish
由圖2a 為1 300~780 cm-1范圍的紅外光譜,其中1 200~800 cm-1包含許多窄的吸收峰,這與魚肉釋放的氨有關(guān),特別是在1 078、1 069 cm-1和966 cm-1,是氨的特征吸收峰[29]。圖2b 為3 300~2 500 cm-1范圍的紅外光譜,在3 150~2 750 cm-1產(chǎn)生的特征吸收主要與貯藏過(guò)程產(chǎn)生的胺類物質(zhì)有關(guān)[30],尤其是三甲胺,它是TVB-N 的主要成分,也是被用來(lái)評(píng)估魚變質(zhì)程度的特征化合物,主要由魚肉中氧化三甲胺經(jīng)微生物作用而產(chǎn)生[28,31];在2 650~2 550 cm-1范圍產(chǎn)生的特征吸收主要與甲硫醇相關(guān),由含硫氨基酸在微生物作用下降解產(chǎn)生[32]。這些特征吸收峰與臭鱖魚變質(zhì)密切相關(guān),且吸收峰強(qiáng)度與TVB-N 含量變化呈正相關(guān)。因此,結(jié)合紅外光譜和計(jì)量學(xué)分析對(duì)TVB-N 預(yù)測(cè)具有理論支撐。
采用MA、S-GS、GF 和RLWR 平滑方法,依次改變窗口長(zhǎng)度獲取對(duì)應(yīng)平滑處理后的光譜,并分別建立預(yù)測(cè)模型,其RMSEP 變化如圖3 所示。
圖3 4 種平滑方法在不同窗口長(zhǎng)度下建立的預(yù)測(cè)模型RMSEP 變化Fig.3 Changes in RMSEP of prediction models established by four smoothing methods with different window lengths
由圖3 可知,隨著窗口長(zhǎng)度的變化,MA、S-GS 和GF 對(duì)模型性能的影響均先提高后降低,分別在窗口長(zhǎng)度為17、31 和26 時(shí)模型最佳,RMSEP 分別為7.156 6、7.179 8 和7.150 4;RLWR 對(duì)RMSEP 的影響呈振蕩形式,在窗口長(zhǎng)度為22 時(shí)模型最佳,RMSEP 為5.7689。結(jié)果表明光譜平滑對(duì)于優(yōu)化模型至關(guān)重要。
采用小波閾值去噪對(duì)光譜進(jìn)行平滑處理,平滑光譜建立模型的RMSEP 變化見(jiàn)圖4。
圖4 小波閾值去噪在不同參數(shù)下建立的預(yù)測(cè)模型RMSEP 變化Fig.4 Change in RMSEP of prediction models established by wavelet threshold denoising with different parameters
由圖4 可知,圖4a 和圖4b 分別為硬閾值和軟閾值在不同消失矩和小波分解等級(jí)下,平滑后光譜所建立預(yù)測(cè)模型的RMSEP 變化。當(dāng)閾值類型為軟閾值,小波函數(shù)為db2,平滑等級(jí)為6 時(shí),RMSEP 為6.991 9,優(yōu)于硬閾值(RMSEP=7.107 7)。原因在于軟閾值法將絕對(duì)值大于閾值的小波系數(shù)不完全保留,進(jìn)行收縮處理,使得小波系數(shù)整體連續(xù)性較好,避免附加振蕩信號(hào)產(chǎn)生[33]。
平滑后光譜結(jié)果見(jiàn)圖5。
圖5 原始光譜及平滑后光譜Fig.5 Original spectra and smoothed spectra
由圖5 可知,對(duì)比于原始光譜,5 種平滑方法均有效減少了光譜中雜峰。雖然WTD 在平滑過(guò)程中有效保留光譜中的尖峰,如1 244 cm-1,但其平滑效果并不明顯,而MA、GF、S-GS 和RLWR 有效平滑了在990~930 cm-1和1 090~1 025 cm-1出現(xiàn)的大量雜峰,這也是氨及胺類物質(zhì)的特征吸收波段。結(jié)果表明,光譜平滑處理有效提高了光譜信噪比。
基于原始光譜的PLSR 和SVM 模型對(duì)TVB-N 預(yù)測(cè)結(jié)果見(jiàn)表1。
表1 基于原始光譜的PLSR 和SVM 模型對(duì)TVB-N 檢測(cè)Table 1 Detection of TVB-N by PLSR and SVM models based on raw spectra
表1 總結(jié)了PLSR 和SVM 回歸模型的校正集的R2c、測(cè)試集的RMSEP 和R2p,并以RPD 值評(píng)估模型的魯棒性。當(dāng)RPD 小于1.4 時(shí),認(rèn)為所建模型不可靠;介于1.4~2.0,認(rèn)為所建模型較可靠;RPD 大于2.0,則認(rèn)為所建模型具備較高可靠性,能夠用于模型分析[34]。由表1 可知,構(gòu)建的SVM 預(yù)測(cè)模型R2p為0.870 9,RPD值為2.812 8,PLSR 預(yù)測(cè)模型R2p為0.853 2,RPD 值為2.542 3,模型均具備較高可靠性。良好的預(yù)測(cè)結(jié)果證明了通過(guò)揮發(fā)物的紅外光譜預(yù)測(cè)TVB-N 具有可行性。
平滑后光譜建立預(yù)測(cè)模型結(jié)果如表2 所示。
表2 基于5 種平滑處理方法的PLSR 和SVM 模型對(duì)TVB-N 檢測(cè)Table 2 Detection of TVB-N by PLSR and SVM models based on five smoothing methods
由表2 可知,5 種平滑方法對(duì)于TVB-N 檢測(cè)精度均具有積極影響。其中,RLWR 平滑處理結(jié)果最佳,可能由于該方法在平滑過(guò)程中將異常值賦予較小的權(quán)重。PLSR 預(yù)測(cè)模型R2p和RPD 分別為0.901 0 和3.247 0。因此,平滑對(duì)于提高FT-IR 工業(yè)在線檢測(cè)精度十分重要。
盡管通過(guò)平滑處理減少了無(wú)用光譜信息,但模型的穩(wěn)健性仍具有提升空間。在RLWR 平滑光譜的基礎(chǔ)上,采用iPLS 和SA-PLS 對(duì)光譜進(jìn)行特征波段選擇,減少無(wú)關(guān)光譜變量,提高模型性能和運(yùn)行效率。對(duì)兩種方法各選擇了5 個(gè)長(zhǎng)度為41 cm-1的子區(qū)間,SAPLS 特征選擇結(jié)果(850~809、993~952、1 145~1 104、2 804~2 763、3 123~3 082 cm-1)和iPLS 特征選擇結(jié)果(821~780、944~903、985~944、1 067~1 026、1 108~1 067 cm-1)見(jiàn)圖6。
圖6 特征波段選擇結(jié)果Fig.6 Selection of characteristic wavebands
由圖6 可知,在SA-PLS 選取的5 個(gè)波段中,2 804~2 763、3 123~3 082 與胺的吸收相關(guān),850~809、993~952、1 145~1 104 cm-1與氨吸收相關(guān),而iPLS 只選擇了1 300~780 cm-1范圍內(nèi)的光譜特征,忽略胺類物質(zhì)在3 150~2 750 cm-1特征吸收。從選擇結(jié)果可知,SA-PLS優(yōu)于iPLS,這來(lái)源于SA 具有能跳出局部最小值搜索全局最小值的優(yōu)勢(shì)[35]。
特征波段選擇后光譜的建模結(jié)果見(jiàn)表3。
表3 基于SA-PLS 和iPLS 特征選擇的PLSR 和SVM 模型對(duì)TVB-N 檢測(cè)Table 3 Detection of TVB-N by PLSR and SVM models based on SA-PLS and iPLS for feature selection
由表3 可知,SA-PLS 顯著優(yōu)于iPLS,雖然特征波段選擇減少了重要光譜信息,使得SVM 模型性能降低(R2p=0.886 4,RPD=2.892 2),但變量數(shù)量減少了84.46%,運(yùn)行效率得到顯著提升。RLWR-SA-PLS 模型預(yù)測(cè)結(jié)果R2p和RPD 分別為0.942 8 和4.005 0,模型具有可靠性,且優(yōu)于非線性模型SVM。因此,結(jié)合光譜信息與RLWR-SA-PLS 模型可以高精度檢測(cè)臭鱖魚TVB-N。
TVB-N 是衡量臭鱖魚新鮮度的一項(xiàng)重要指標(biāo),本文利用氣相FT-IR 結(jié)合化學(xué)計(jì)量學(xué)開(kāi)展臭鱖魚TVBN 含量的無(wú)損檢測(cè)技術(shù)研究。基于揮發(fā)物的紅外光譜建立PLSR 和SVM 兩種TVB-N 預(yù)測(cè)模型,模型可靠性較高(SVM,R2p=0.870 9,RPD=2.812 8),證明方案具有可行性;5 種光譜平滑處理結(jié)果表明,RLWR 不僅能有效平滑光譜雜峰,同時(shí)還可以提升模型性能(PLSR,R2p=0.901 0,RPD=3.247 0);在此基礎(chǔ)上,由SAPLS 優(yōu)選的5 個(gè)特征波段(850~809、993~952、1 145~1 104、2 804~2 763、3 123~3 082 cm-1)可實(shí)現(xiàn)TVB-N的高精度預(yù)測(cè)(PLSR,R2p=0.942 8,RPD=4.005 0),RLWR-SA-PLS 實(shí)現(xiàn)了數(shù)據(jù)維度的明顯降低和識(shí)別效率的明顯提升。因此,基于氣相FT-IR 可以實(shí)現(xiàn)臭鱖魚中TVB-N 的無(wú)損檢測(cè),具備工業(yè)在線應(yīng)用可行性。