王文秀,彭彥昆*,孫宏偉,魏文松,鄭曉春
(中國(guó)農(nóng)業(yè)大學(xué)工學(xué)院,國(guó)家農(nóng)產(chǎn)品加工技術(shù)裝備研發(fā)分中心,北京 100083)
生鮮肉作為蛋白質(zhì)的主要來(lái)源,在人們的日常飲食結(jié)構(gòu)中占據(jù)非常重要的地位。2016年我國(guó)肉品的總產(chǎn)量達(dá)8 625萬(wàn) t,整個(gè)肉品行業(yè)發(fā)展?jié)摿薮?。然而,由于肉品本身富含營(yíng)養(yǎng)物質(zhì)和水分,容易被其他微生物入侵而發(fā)生系列變化,導(dǎo)致肉的腐敗變質(zhì),給消費(fèi)者的健康安全造成威脅。因此,對(duì)肉的新鮮度進(jìn)行快速評(píng)價(jià)具有非常重要的現(xiàn)實(shí)意義。
可見-近紅外光譜技術(shù)具有無(wú)損傷、操作簡(jiǎn)單、無(wú)需樣品前處理的優(yōu)點(diǎn),已被證實(shí)可以對(duì)生鮮肉的品質(zhì)安全參數(shù)進(jìn)行快速分析[1-4]。目前,基于光譜技術(shù)對(duì)肉品新鮮度評(píng)價(jià)可以參照GB 2707—2016《鮮(凍)畜、禽產(chǎn)品》預(yù)測(cè)揮發(fā)性鹽基氮值(total volatile basic nitrogen,TVB-N)評(píng)價(jià)新鮮度。也可借助化學(xué)計(jì)量學(xué)方法,直接將光譜信息與新鮮度建立聯(lián)系作出評(píng)價(jià)。馬世榜等[5]利用近紅外光譜結(jié)合支持向量機(jī)(support vector machine,SVM)對(duì)牛肉的新鮮度進(jìn)行定性判別,驗(yàn)證集正確率為88.89%。蔡健榮等[6]利用近紅外光譜對(duì)豬肉中TVB-N進(jìn)行定量分析,預(yù)測(cè)集相關(guān)系數(shù)為0.823 8。然而,由于近紅外光譜數(shù)據(jù)量大,光譜信息復(fù)雜且具有多重共線性,因此不少學(xué)者展開特征波長(zhǎng)篩選的研究。如馬世榜[7]、劉飛[8]等利用無(wú)信息變量消除和連續(xù)投影算法提取有效變量,建立了更為簡(jiǎn)化的TVB-N預(yù)測(cè)模型。這些方法大多通過(guò)多次采樣分析,構(gòu)建多個(gè)子模型,通過(guò)評(píng)價(jià)模型誤差確定最優(yōu)變量組合。然而,不同方法篩選的變量個(gè)數(shù)和分布常常有所不同,部分變量缺乏化學(xué)意義上的響應(yīng)機(jī)理解釋,因此變量?jī)?yōu)選仍是目前近紅外光譜分析面臨的重要問題。
二維相關(guān)光譜通過(guò)將光譜信號(hào)擴(kuò)展到第二維上,可以使原來(lái)一維光譜上的弱峰和重疊峰更加清晰,從而提高光譜分辨率。同時(shí),通過(guò)添加一定的外界擾動(dòng),對(duì)動(dòng)態(tài)光譜進(jìn)行二維相關(guān)計(jì)算,可以解析光譜細(xì)微特征的變化,尋找與微擾相關(guān)的敏感變量[9-11]。目前,已有學(xué)者將二維相關(guān)光譜應(yīng)用在牛奶摻雜鑒別[12]、食用油摻雜檢測(cè)[13]、中藥摻偽[14]、蛋白飼料原料判別[15]、紅棗營(yíng)養(yǎng)成分變化解析[16]等的研究上,表明通過(guò)分析二維相關(guān)光譜特性,可以觀察到各吸收峰隨外部擾動(dòng)的變化關(guān)系以及對(duì)外部擾動(dòng)的敏感程度。結(jié)合本實(shí)驗(yàn)的研究,將所有樣品(從新鮮到腐?。┱w作為待研究體系,以TVB-N為外部擾動(dòng),原始光譜可看作是外擾誘發(fā)的動(dòng)態(tài)光譜。通過(guò)二維光譜計(jì)算,解析同步光譜,觀察外部擾動(dòng)對(duì)不同波長(zhǎng)下動(dòng)態(tài)光譜的影響,可以從機(jī)理上確立與外部擾動(dòng)相關(guān)的敏感波長(zhǎng)。目前將二維相關(guān)近紅外光譜應(yīng)用在生鮮肉新鮮度評(píng)價(jià)的研究尚鮮見報(bào)道。
為探究二維相關(guān)光譜優(yōu)選新鮮度特征變量的可行性,本研究以生鮮豬肉中TVB-N為外界干擾對(duì)光譜進(jìn)行調(diào)制,通過(guò)研究在外部擾動(dòng)存在下體系的變化,解析二維相關(guān)同步光譜和自相關(guān)譜,分析隨外部擾動(dòng)變化的光譜特征信息,確定與TVB-N相關(guān)的特征變量,建立生鮮豬肉的快速判別模型。
冷鮮豬肉背最長(zhǎng)肌購(gòu)買于北京美廉美超市。將其修整為長(zhǎng)×寬×高約8 cm×5 cm×2.5 cm的肉塊,放置在自封袋中運(yùn)輸至無(wú)損檢測(cè)實(shí)驗(yàn)室。將所有樣品按順序編號(hào)后無(wú)積壓放置在4 ℃冰箱中保存,每12 h取出2 個(gè)樣品進(jìn)行光譜采集和理化值測(cè)定,共進(jìn)行15 d,獲得有效樣品58 個(gè)。
自行搭建的實(shí)驗(yàn)用可見-近紅外光譜采集系統(tǒng)主要包括鹵鎢燈光源、AvaSpec-2048光譜儀(荷蘭Avantes公司)、光纖、環(huán)形光導(dǎo)、計(jì)算機(jī)等硬件。光譜范圍為350~1 100 nm,分辨率為0.59 nm。采集光譜前,將儀器預(yù)熱約30 min,然后依次采集參比光譜、暗背景光譜以實(shí)現(xiàn)校正,最后采集樣品的光譜信息。整個(gè)實(shí)驗(yàn)過(guò)程中,保證光纖探頭與待測(cè)物距離一致,每個(gè)樣品采集5 個(gè)不同位置處光譜信息并求取平均值,從而減少實(shí)驗(yàn)誤差。光譜數(shù)據(jù)的獲取和保存通過(guò)光譜儀配套軟件Avasoft完成。
光譜信息采集完成后,參照GB 5009.228—2016《食品中揮發(fā)性鹽基氮的測(cè)定》中的方法對(duì)豬肉樣品中的TVB-N進(jìn)行測(cè)定,并參照文獻(xiàn)[17]將TVB-N小于15 mg/100 g的樣品定義為新鮮肉,將TVB-N介于15~25 mg/100 g之間的樣品定義為次新鮮肉,將TVB-N大于25 mg/100 g的樣品定義為腐敗肉,以此為標(biāo)準(zhǔn)對(duì)豬肉的新鮮度進(jìn)行劃分。
首先基于全波段光譜信息建立豬肉新鮮度的判別模型。由于近紅外光譜采集過(guò)程中常常伴隨基線漂移、雜散光等噪音信號(hào),因此本研究采用標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate,SNV)、歸一化的預(yù)處理方法來(lái)減少干擾信息,并進(jìn)行分析比較。建模采用了SVM判別分析方法,該方法以結(jié)構(gòu)風(fēng)險(xiǎn)最小化為準(zhǔn)則構(gòu)造決策超平面,使不同種類樣品的間隔最大[18]。
以TVB-N為外部微擾,進(jìn)行二維相關(guān)同步光譜解析,尋找與新鮮度評(píng)價(jià)相關(guān)的特征變量。第1步:根據(jù)TVB-N實(shí)測(cè)值,從最小值和最大值之間以均勻濃度梯度共選取10 個(gè)代表性樣品用于二維相關(guān)光譜分析。第2步:提取光譜特征,本研究采用包絡(luò)線去除方法來(lái)擴(kuò)大較弱的特性信息,同時(shí)壓抑背景光譜[19]。第3步:根據(jù)包絡(luò)線去除后的光譜,選擇不同TVB-N對(duì)應(yīng)光譜具有明顯差異的敏感波段。第4步:對(duì)上述敏感波段分別進(jìn)行二維相關(guān)同步光譜分析,獲取其二維同步光譜及自相關(guān)譜。第5步:通過(guò)解析同步譜和自相關(guān)譜,明確與TVB-N變化密切相關(guān)的特征波長(zhǎng)。
基于所選的特征波長(zhǎng),分別從原始、經(jīng)SNV預(yù)處理、歸一化預(yù)處理后的光譜中提取相應(yīng)的光譜數(shù)據(jù)組成新的光譜矩陣,建立優(yōu)化的判別模型。整個(gè)數(shù)據(jù)分析流程圖如圖1所示。上述預(yù)處理和建模過(guò)程在Matlab 2012a平臺(tái)下利用PLS-Toolbox完成,二維光譜解析在薩斯喀徹溫大學(xué)加拿大光源編寫的MIDAS軟件下完成。
圖1 數(shù)據(jù)分析流程圖Fig. 1 Flow chart of data analysis
根據(jù)測(cè)定的TVB-N對(duì)58 個(gè)豬肉樣品的新鮮度進(jìn)行統(tǒng)計(jì)分析,共有14 個(gè)新鮮肉、34 個(gè)次新鮮肉以及10 個(gè)腐敗肉。將所有樣品按照3∶1的比例分為校正集和驗(yàn)證集,校正集有43 個(gè)樣品,驗(yàn)證集有15 個(gè)樣品。將3 類樣品分別賦值為1、2、3,各子集樣品的新鮮度情況如表1所示。
表1 3 種新鮮度豬肉的類別賦值及其在校正集和驗(yàn)證集中分布Table 1 Category assignment of three kinds of pork and their distribution in calibration and prediction set
由于原始光譜信息兩端噪音較大,信噪比低,因此只截取400~1 000 nm波段范圍內(nèi)的光譜用于后續(xù)定性判別分析。從新鮮、次新鮮和腐敗豬肉中各取一個(gè)樣品進(jìn)行光譜信息的對(duì)比分析,其原始一維近紅外光譜如圖2a所示,3 類樣品整體上趨勢(shì)一致,在545~585 nm之間具有明顯差異,該波段范圍與肉中色素的變化有關(guān)[20]。經(jīng)過(guò)SNV和歸一化預(yù)處理后的光譜曲線如圖2b和c所示,2 種預(yù)處理方法均能有效消除基線漂移、光散射等噪音信號(hào),提高光譜分辨率和靈敏度。
圖2 樣品光譜曲線Fig. 2 Spectral curves of samples
為尋找能對(duì)豬肉新鮮度快速評(píng)價(jià)的關(guān)鍵變量,以TVB-N為外部微擾條件,選擇10 條代表性光譜并進(jìn)行包絡(luò)線去除,以增強(qiáng)對(duì)TVB-N變化敏感波段的光譜特征,同時(shí)也增強(qiáng)每條曲線上各個(gè)波段之間光譜信息的對(duì)比性。包絡(luò)線去除前后的光譜曲線對(duì)比如圖3所示,經(jīng)過(guò)包絡(luò)線去除后光譜集中在0~1之間,且在460、590 nm及960 nm波長(zhǎng)處出現(xiàn)明顯的波谷,可見光波段范圍內(nèi)的波谷與肉中肌紅蛋白的濃度和狀態(tài)有關(guān),960 nm波長(zhǎng)處與N—H鍵的二級(jí)倍頻有關(guān)。在進(jìn)行二維相關(guān)光譜分析之前,為盡可能詳盡的挖掘有效變量,避免微弱的特征信息被隱藏,結(jié)合包絡(luò)線去除后的光譜曲線,將不同TVB-N光譜曲線之間具有差異的波段細(xì)分為7 個(gè)子區(qū)間,分別進(jìn)行二維同步光譜解析。這7 個(gè)子區(qū)間分別為400.1~429.4、430.6~494.8、496.0~550.4、555.1~584.0、585.7~680.3、835.9~954.7、955.8~999.5 nm。
圖3 代表性光譜包絡(luò)線去除前后對(duì)比圖Fig. 3 Comparison of representative spectra before and after continuum removal
對(duì)7 個(gè)子區(qū)間分別進(jìn)行二維光譜分析,其三維投影圖和自相關(guān)譜圖分別如圖4、5所示。三維立體圖形的X軸和Y軸為獨(dú)立的變量軸,一般為波長(zhǎng)或波數(shù),本研究中的變量為波長(zhǎng);Z軸為因變量軸,本研究中以相關(guān)強(qiáng)度為Z軸構(gòu)成三維投影圖[21]。同步譜反映了動(dòng)態(tài)光譜信號(hào)隨外部擾動(dòng)發(fā)生變化的協(xié)同程度,它關(guān)于主對(duì)角線對(duì)稱分布,可以從三維同步圖中直觀地觀察到自相關(guān)峰的位置、強(qiáng)度。自相關(guān)峰位于主對(duì)角線上,它的強(qiáng)度反映了該變量處光譜信號(hào)隨外部擾動(dòng)變化的程度[22-28]。結(jié)合自相關(guān)譜圖,在波峰位置處相關(guān)強(qiáng)度大,表明該變量處光譜信號(hào)對(duì)微擾較敏感,即為所要尋找的與新鮮度密切相關(guān)的特征信息。
結(jié)合圖4a、5a,在400.1~429.4 nm波長(zhǎng)范圍內(nèi),主對(duì)角線上411 nm和428 nm波長(zhǎng)處出現(xiàn)微弱的自相關(guān)峰,表明這兩個(gè)波長(zhǎng)下的光譜信號(hào)對(duì)外部微擾敏感,與TVB-N的變化有一定的關(guān)系。根據(jù)Benesch等[29]的研究,415 nm為氧合血紅蛋白的吸收峰,430 nm為脫氧血紅蛋白的吸收峰,本研究中的波長(zhǎng)位置與之稍有偏移,這可能與所用光譜儀器的響應(yīng)有關(guān)。結(jié)合圖4b、5b,在430.6~494.8 nm波長(zhǎng)范圍內(nèi),434、461 nm和490 nm波長(zhǎng)處出現(xiàn)自相關(guān)峰,434 nm為脫氧肌紅蛋白的吸收峰,該處的相關(guān)強(qiáng)度高于461 nm和490 nm,從三維投影圖的顏色參考圖中也可以直觀地看出。結(jié)合圖4c、5c,在496.0~550.4 nm波段范圍內(nèi),508、521 nm和537 nm波長(zhǎng)處出現(xiàn)自相關(guān)峰,且537 nm處的強(qiáng)度高于前二者,表明該位置處對(duì)應(yīng)的官能團(tuán)隨TVB-N變化更加明顯。根據(jù)Liu Yang等[30]的研究,505 nm為高鐵肌紅蛋白的吸收峰,535 nm為氧合肌紅蛋白的吸收峰,本研究的特征變量雖稍有偏移,但仍可將其歸屬為二者的吸收峰。結(jié)合圖4d、5d,在555.1~584.0 nm波段范圍內(nèi),560、569 nm和580 nm處出現(xiàn)自相關(guān)峰,其中580 nm處的強(qiáng)度最高。參考Mancini等[20]研究可知,530~580 nm波段范圍為肌紅蛋白色素的特征波段。結(jié)合圖4e、5e,在585.7~680.3 nm波段范圍內(nèi),595 nm波長(zhǎng)處出現(xiàn)較強(qiáng)的自相關(guān)峰,在620、630 nm和667 nm波長(zhǎng)處出現(xiàn)3 個(gè)相對(duì)弱的自相關(guān)峰。其中,630 nm為硫化肌紅蛋白的吸收峰,這是由于肉在放置過(guò)程中細(xì)菌產(chǎn)生的H2S氣體與肌紅蛋白結(jié)合,形成了硫化肌紅蛋白。結(jié)合圖4f、5f,在835.9~954.7 nm波段范圍內(nèi),937 nm波長(zhǎng)處出現(xiàn)一個(gè)較強(qiáng)的自相關(guān)峰,其與C—H鍵的三級(jí)倍頻有關(guān)。結(jié)合圖4g、5g,在955.8~999.5 nm波段范圍內(nèi),977 nm波長(zhǎng)處出現(xiàn)較弱的自相關(guān)峰,與O—H鍵的一級(jí)倍頻有關(guān)。
圖4 不同波段范圍內(nèi)豬肉樣品的二維相關(guān)同步光譜Fig. 4 2D-correlation spectra of pork samples in different spectral regions
圖5 不同波段范圍內(nèi)的自相關(guān)譜Fig. 5 Autocorrelation spectra in different spectral regions
綜合各個(gè)波段,可以發(fā)現(xiàn)通過(guò)解析二維相關(guān)同步光譜,得到的17 個(gè)特征變量多集中在可見波段。這與肉在貯藏放置過(guò)程中,由于微生物繁殖產(chǎn)生氫過(guò)氧化物,引起肉中色素發(fā)生變化有關(guān)。同時(shí),由于厭氧菌分解蛋白質(zhì)和氨基酸等產(chǎn)生吲哚、甲胺和H2S等物質(zhì),脂肪氧化形成硫代巴比妥酸等物質(zhì),這些均會(huì)促進(jìn)肌紅蛋白的轉(zhuǎn)化和血紅素的氧化[31]。
表2 基于全波段光譜的SVM判別分析模型結(jié)果Table 2 Discrimination results of SVM models based on full-band spectra
首先,基于全波段光譜數(shù)據(jù)建立豬肉新鮮度的SVM判別模型,并比較原始、經(jīng)SNV預(yù)處理和歸一化預(yù)處理光譜的建模效果,如表2所示??梢娀谶@3 類光譜信息,在校正集中分別有6、4、5 個(gè)樣品誤判,驗(yàn)證集中均有1 個(gè)樣品誤判,且均為腐敗樣品被誤判,總體判別正確率為87.93%、91.38%和89.66%,同時(shí)也可看出預(yù)處理對(duì)模型的效果有所改善,預(yù)測(cè)總體正確率有所提高。
然后,利用解析二維相關(guān)光譜得到的17 個(gè)特征變量,建立優(yōu)化的判別分析模型?;谒x特征波長(zhǎng),利用原始光譜信息建立的SVM模型,校正集中次新鮮樣品全部判斷正確,新鮮和腐敗樣品各有1和2 個(gè)誤判,驗(yàn)證集樣品全部判斷正確,總體判別正確率為94.83%。利用SNV預(yù)處理后光譜建立的SVM模型,校正集中新鮮和次新鮮樣品全部判斷正確,腐敗樣品有1 個(gè)誤判,驗(yàn)證集樣品全部判斷正確,總體判別正確率為98.28%。利用歸一化預(yù)處理后光譜信息建立的模型效果與SNV預(yù)處理后建模效果一致,總體判別正確率為98.28%,其校正集和驗(yàn)證集樣品判別結(jié)果如圖6所示,可見除第40號(hào)腐敗樣品被誤判為次新鮮外,其余樣品均判斷正確。同時(shí)也進(jìn)一步驗(yàn)證了光譜的預(yù)處理有助于改善模型,提高模型預(yù)測(cè)效果。優(yōu)化后的判別模型,僅利用了總體變量1.61%(原始變量個(gè)數(shù)為1 059)的特征變量,取得了更佳的模型結(jié)果。這表明通過(guò)二維同步光譜分析選出的17 個(gè)變量,能夠反映與豬肉新鮮度密切相關(guān)的特征信息,表征不同TVB-N的光譜變化,簡(jiǎn)化判別模型,縮短運(yùn)算處理時(shí)間。
圖6 基于歸一化預(yù)處理光譜特征變量的判別模型結(jié)果Fig. 6 Discrimination results using feature variables based on spectra after normalization
以TVB-N為外界干擾,通過(guò)解析二維相關(guān)同步光譜和自相關(guān)譜,共提取到17 個(gè)與新鮮度有關(guān)的特征變量?;谠?、SNV預(yù)處理及歸一化預(yù)處理后的光譜,利用特征波長(zhǎng)對(duì)應(yīng)光譜建立的SVM模型效果優(yōu)于全波段光譜,總體判別正確率為94.83%、98.28%和98.28%。同時(shí)也說(shuō)明,光譜的預(yù)處理有助于改進(jìn)模型效果??梢?近紅外光譜結(jié)合二維相關(guān)分析,可以有效的解析肉在腐敗變質(zhì)過(guò)程中的光譜特征信息變化,確定與新鮮度相關(guān)的敏感變量。該方法簡(jiǎn)單快速,為近紅外光譜特征變量篩選提供了一種新的方法。二維相關(guān)光譜包含信息豐富,選擇的外擾不同得到的譜圖不同,可進(jìn)一步借助化學(xué)計(jì)量學(xué)方法,對(duì)各官能團(tuán)的變化進(jìn)行有效解析,提取特征光譜信息。