(內(nèi)蒙古農(nóng)業(yè)大學(xué)食品科學(xué)與工程學(xué)院,呼和浩特 010018)
雙峰駝乳營(yíng)養(yǎng)豐富,脂肪、乳糖和總干物質(zhì)顯著高于牛乳,尤其降血糖與輔助治療糖尿病的功效被發(fā)現(xiàn)以來(lái),越來(lái)越受關(guān)注并逐步得到產(chǎn)業(yè)化開(kāi)發(fā)[1-4]。駱駝乳風(fēng)味獨(dú)特,但產(chǎn)量低、地域性強(qiáng)、所以供不應(yīng)求,原料乳每千克價(jià)格在80~100元,遠(yuǎn)高于其他乳,從而極易受到摻假、造假和冒充侵害[5-7]。
駝乳品質(zhì)和安全檢測(cè)技術(shù)開(kāi)發(fā)勢(shì)在必行,目前尚無(wú)快速預(yù)測(cè)雙峰駝乳常規(guī)營(yíng)養(yǎng)素的近紅外(NIR)光譜預(yù)測(cè)模型。NIR光譜預(yù)測(cè)食品常量多組分具有綠色、快速、無(wú)損的優(yōu)點(diǎn),其基本原理是用化學(xué)計(jì)量學(xué)軟件將樣品化學(xué)值與NIR光譜數(shù)據(jù)進(jìn)行多變量線(xiàn)性擬合校正,通常采用偏最小二乘(PLS)或主成分線(xiàn)性回歸(PCR)法建立預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)未知樣品常規(guī)組分的快速測(cè)定[8-10]。方雄武等[11]采用NIR透射光譜儀系統(tǒng)建立了牛奶的蛋白質(zhì)、脂肪和乳糖定量分析模型。王明等[12]采用NIR漫反射光譜建立了牛乳中蛋白質(zhì)與脂肪含量的快速檢測(cè)模型,結(jié)果表明NIR光譜技術(shù)可以準(zhǔn)確預(yù)測(cè)牛奶中蛋白質(zhì)與脂肪的含量。祝義偉等[13]采用偏最小二乘回歸(PLS)建立酸奶中非脂乳固體的NIR光譜定量分析模型,并對(duì)模型進(jìn)行驗(yàn)證評(píng)估,預(yù)測(cè)結(jié)果較好。不同動(dòng)乳營(yíng)養(yǎng)成分及黏度等物性不同,NIR光譜特征也有差異[14],因此利用牛乳營(yíng)養(yǎng)素的NIR模型預(yù)測(cè)其他動(dòng)物乳營(yíng)養(yǎng)素含量,尤其預(yù)測(cè)雙峰駝和水牛乳等干物質(zhì)遠(yuǎn)大于牛乳的特種乳成分,可能偏差較大[15-16]。因此有必要評(píng)價(jià)多種家畜乳營(yíng)養(yǎng)成分的通用NIR預(yù)測(cè)模型或?qū)S媚P偷男阅?。本文系統(tǒng)采集內(nèi)蒙古雙峰駝乳主產(chǎn)區(qū)代表性乳樣,以及荷斯坦牛乳和水牛乳,嚴(yán)格檢測(cè)乳樣常規(guī)營(yíng)養(yǎng)素化學(xué)值,建立3種動(dòng)物的通用PLS模型和雙峰駝乳的專(zhuān)用模型,進(jìn)行比較評(píng)價(jià);同時(shí)評(píng)價(jià)一款臺(tái)式寬譜研究型傅里葉變換近紅外光譜儀和一款國(guó)際主流品牌便捷式光柵近紅外光譜儀建模的性能,以期為雙峰駝乳營(yíng)養(yǎng)質(zhì)量快速預(yù)測(cè)提供數(shù)據(jù)參數(shù)和方法學(xué)參考,建立的模型也可在這兩品牌設(shè)備上轉(zhuǎn)移使用,服務(wù)企業(yè)和社會(huì)。
從內(nèi)蒙古主要駱駝飼養(yǎng)地區(qū)采集雙峰駝乳樣品153份,來(lái)自烏海市、阿拉善左旗、呼倫貝爾鄂溫克旗;同時(shí)作為相伴研究分別采集牛乳樣品28份,來(lái)自蘇尼特左旗、呼和浩特市、鄂爾多斯烏審旗、呼倫貝爾鄂溫克旗;水牛乳40份,來(lái)自廣西省南寧市。
脂肪按GB5009.6-2016中的蓋勃法測(cè)定;蛋白質(zhì)按GB5009.5-2016中的凱氏定氮法測(cè)定;乳糖按照GB5413.5-2010中的萊茵-埃農(nóng)氏法測(cè)定;水分與灰分,分別按照GB5009.3-2016和GB5009.4-2016測(cè)定。測(cè)定以上5種營(yíng)養(yǎng)素時(shí),實(shí)驗(yàn)的時(shí)間、地點(diǎn)和溫度等因素都相同,確保了樣品性質(zhì)狀態(tài)的一致性以減小誤差。測(cè)定的化學(xué)值即為NIR光譜分析過(guò)程中的真值。
PE傅立葉變換近紅外(NIR)光譜儀,25℃控溫條件,對(duì)樣品進(jìn)行漫透射光譜掃描,選用波長(zhǎng)范圍1 000~2 500 nm,分辨率為16 cm-1,采集信息點(diǎn)3 000個(gè),每個(gè)樣品不同時(shí)間掃描2次,每次平行掃描3次,即每個(gè)乳樣有6個(gè)光譜數(shù)據(jù)。
VIAVO光柵型微型近紅外(NIR)光譜儀,室溫條件采集乳樣漫反射光譜。掃描光譜波數(shù)范圍為900~1 676 nm,檢測(cè)器為S1-00723,采集信息點(diǎn)125個(gè),每個(gè)樣品2次平行,每次平行掃描3次,即每個(gè)乳樣有6個(gè)光譜數(shù)據(jù)。
用Excel記錄和整理乳樣5種常規(guī)營(yíng)養(yǎng)素化學(xué)化學(xué)值,用IBM-SPSSStatistics20進(jìn)行正態(tài)性檢驗(yàn)(即數(shù)據(jù)集質(zhì)量的檢驗(yàn)),并進(jìn)行描述性統(tǒng)計(jì)和差異檢驗(yàn)。將乳樣化學(xué)值和NIR光譜數(shù)據(jù)對(duì)應(yīng)導(dǎo)入化學(xué)計(jì)量學(xué)軟件Unscrambler X 10.5,以7∶3的比例將樣本集劃分為校正集與驗(yàn)證集,使用導(dǎo)數(shù)(Derivative)、標(biāo)準(zhǔn)正態(tài)變量變換(SNV)和多元散射校正(MSC)對(duì)光譜信息進(jìn)行預(yù)處理,然后將校正樣本集的乳樣5種營(yíng)養(yǎng)素化學(xué)值分別與各種預(yù)處理后的NIR光譜進(jìn)行偏最小二乘法(PLS)多元線(xiàn)性校正(Calibration),建立5種基礎(chǔ)營(yíng)養(yǎng)素的預(yù)測(cè)模型,并用驗(yàn)證集樣本對(duì)預(yù)測(cè)模型進(jìn)行驗(yàn)證。多次組合校正樣本集和驗(yàn)證樣本集,反復(fù)優(yōu)化模型,模型評(píng)價(jià)參數(shù)見(jiàn)表1。
表1 乳常規(guī)營(yíng)養(yǎng)素NIR光譜預(yù)測(cè)模型驗(yàn)證評(píng)價(jià)指標(biāo)
對(duì)3種家畜乳221個(gè)樣品的脂肪、蛋白質(zhì)、乳糖、水分和灰分檢測(cè)結(jié)果進(jìn)行了正態(tài)性檢驗(yàn),結(jié)果總樣本5種營(yíng)養(yǎng)素化學(xué)值符合正態(tài)分布。雙峰駝乳5種常規(guī)營(yíng)養(yǎng)素正態(tài)性檢驗(yàn)結(jié)果見(jiàn)圖1,駝乳脂肪、蛋白質(zhì)、乳糖和水分符合正態(tài)分布,趨降p-p檢驗(yàn)值在±0.05之間,數(shù)據(jù)質(zhì)量很高,駝乳灰分趨降p-p檢驗(yàn)值在±0.09之間,基本符合正態(tài)分布,數(shù)據(jù)質(zhì)量也較高,可用于NIR光譜預(yù)測(cè)模型建立,獲得的描述性統(tǒng)計(jì)參數(shù)可以預(yù)測(cè)我國(guó)雙峰駝乳常規(guī)營(yíng)養(yǎng)含量水平。
雙峰駝乳及相伴研究荷斯坦牛和水牛乳樣品化學(xué)值測(cè)定數(shù)據(jù)描述性統(tǒng)計(jì)見(jiàn)表2、表3和表4,數(shù)據(jù)分布范圍見(jiàn)圖2。雙峰駝和水牛乳脂肪顯著高于荷斯坦牛乳,均值分別是牛乳的1.6和2倍;兩者蛋白質(zhì)含量也顯著高于牛乳,均值是牛乳的1.1(高出10%)和1.4倍;灰分含量也顯著高于牛乳,均值是牛乳的1.3和1.2倍。雙峰駝乳、水牛乳與荷斯坦牛乳的乳糖與水分含量無(wú)顯著差異。
3種動(dòng)物乳脂肪、蛋白和灰分含量數(shù)據(jù)分布范圍見(jiàn)圖2??紤]到數(shù)據(jù)離散范圍(95%置信區(qū)間),3種動(dòng)物乳指標(biāo)波動(dòng)范圍很不同。提示用牛乳營(yíng)養(yǎng)素或多種動(dòng)物通用NIR模型預(yù)測(cè)特種家畜乳營(yíng)養(yǎng)素可能不夠準(zhǔn)確,有必要建立不同家畜乳營(yíng)養(yǎng)素的專(zhuān)用NIR預(yù)測(cè)模型。
圖1 雙峰駝乳5種常規(guī)營(yíng)養(yǎng)素?cái)?shù)據(jù)正態(tài)性檢驗(yàn)
表2 雙峰駝乳營(yíng)養(yǎng)素化學(xué)值測(cè)定結(jié)果描述性統(tǒng)計(jì)表(N=153 g/100g)
表3 荷斯坦牛乳營(yíng)養(yǎng)素化學(xué)值測(cè)定結(jié)果描述性統(tǒng)計(jì)表(N=28 g/100g)
表4 水牛乳營(yíng)養(yǎng)素化學(xué)值測(cè)定結(jié)果描述性統(tǒng)計(jì)表(N=40 g/100g)
圖2 3種家畜乳3種常規(guī)營(yíng)養(yǎng)素?cái)?shù)據(jù)箱式圖
2.3.1 主因子數(shù)的選擇與異常樣本的剔除
模型中的主因子個(gè)數(shù)會(huì)決定模型的穩(wěn)定性,同時(shí)也對(duì)模型內(nèi)部與外部驗(yàn)證參數(shù)的準(zhǔn)確性起一定作用。如圖3所示,當(dāng)因子數(shù)越少時(shí),RMSECV值越大,模型越不穩(wěn)定,因子數(shù)越多,模型的擬合度越高,RMSECV值越低,模型的效果越好。當(dāng)主因子數(shù)為10時(shí)模型的RMSECV值最低,模型的效果為最優(yōu)。所以本實(shí)驗(yàn)選擇主因子數(shù)10來(lái)進(jìn)行模型后續(xù)的建立與優(yōu)化。
圖3 PLS模型主因子與RMSECV關(guān)系圖
在實(shí)驗(yàn)過(guò)程中,由于人為操作的失誤或系統(tǒng)誤差,經(jīng)常會(huì)產(chǎn)生許多異常值(異常乳樣),異常值會(huì)對(duì)PLS回歸校正產(chǎn)生一定的負(fù)面影響。所以剔除異常樣品對(duì)模型的建立以及所建立模型的穩(wěn)定性起到至關(guān)重要的作用。本實(shí)驗(yàn)主要根據(jù)模型的預(yù)測(cè)回歸線(xiàn)與學(xué)生化殘差剔除異常樣本。但剔除“異常值”或“異常樣本”更應(yīng)該驗(yàn)證化學(xué)值是否測(cè)定準(zhǔn)確,有必要進(jìn)行重復(fù)測(cè)定驗(yàn)證。輕易剔除“異常樣本”,模型圖和參數(shù)可能會(huì)很理想,但模型在大量外部驗(yàn)證或?qū)嵺`應(yīng)用中可能會(huì)發(fā)現(xiàn)不夠穩(wěn)健。
2.3.2 3種家畜乳的近紅外通用乳模型
建立優(yōu)化后的牛乳、水牛乳和雙峰駝乳的通用乳模型參數(shù)見(jiàn)表5。通用乳模型中脂肪、乳糖、蛋白質(zhì)、水分的最優(yōu)前處理方式為一階導(dǎo)數(shù)+二階導(dǎo)數(shù)的結(jié)合使用,而灰分的最優(yōu)前處理方式為SNV+MSC處理。
表5 3種家畜乳通用模型最優(yōu)參數(shù)
5種常規(guī)營(yíng)養(yǎng)素的通用乳模型評(píng)價(jià)系數(shù)R2全部大于0.9,除水分外,其余4種常規(guī)營(yíng)養(yǎng)素模型的RMSECV均小于0.5,其中僅有脂肪與水分的RPD>2.4,表明這兩種模型可做近似估計(jì)。乳糖、蛋白質(zhì)和灰分的RPD<2.4,說(shuō)明預(yù)測(cè)模型不理想,需要繼續(xù)優(yōu)化模型,但在優(yōu)化模型的過(guò)程中主因子數(shù)也隨之增多,5種常規(guī)營(yíng)養(yǎng)素PLS模型主因子數(shù)已超過(guò)14個(gè),主因子數(shù)的增多,使模型納入了更多無(wú)效光譜信息,外部驗(yàn)證參數(shù)隨之增高導(dǎo)致模型不穩(wěn)定,故繼續(xù)僵化地優(yōu)化通用乳模型參數(shù)的意義不大。駝乳中干物質(zhì)、蛋白質(zhì)、脂肪及乳糖均高于牛乳,分別是牛乳的1.22倍、1.05倍、1.59倍和1.23倍,且較黏稠,牛乳與駝乳營(yíng)養(yǎng)素含量的不同,導(dǎo)致其光譜信息有差異,所以建立雙峰駝乳的常規(guī)營(yíng)養(yǎng)素快速檢測(cè)模型是有必要的。
2.3.3 雙峰駝乳傅里葉變換NIR光譜儀快速預(yù)測(cè)模型
雙峰駝乳常規(guī)營(yíng)養(yǎng)素模型內(nèi)部驗(yàn)證優(yōu)化參數(shù)見(jiàn)表6。灰分的前處理方式為MSC+SNV的混合處理,主因子數(shù)為9,模型驗(yàn)證系數(shù)為0.93,RPD=3.1642,模型預(yù)測(cè)能力良好。脂肪與水分的前處理方式同為標(biāo)準(zhǔn)正態(tài)變量變換(SNV),脂肪的主因子數(shù)為9,模型驗(yàn)證系數(shù)R2=0.96,RPD>3,水分主因子數(shù)為10,R2=0.99,RPD高達(dá)12.86,說(shuō)明模型可以完美預(yù)測(cè)未知樣品。乳糖與蛋白質(zhì)前處理方式分別為MSC與二階導(dǎo),R2均大于0.92,RPD大于3.35。證明以上方法建立了預(yù)測(cè)性能良好的雙峰駝乳常規(guī)營(yíng)養(yǎng)素快速檢測(cè)模型。
表6 雙峰駝乳臺(tái)式近紅外光譜儀模型內(nèi)部驗(yàn)證參數(shù)
最優(yōu)模型的驗(yàn)證集外部驗(yàn)證參數(shù)見(jiàn)表7。5種營(yíng)養(yǎng)素外部驗(yàn)證相關(guān)系數(shù)R均大于0.9,RSD<10%,表明模型的預(yù)測(cè)能力良好。乳糖R小于0.9但大于0.8,RSD<10%,模型可進(jìn)行預(yù)測(cè)。
2.3.4 雙峰駝乳微型NIR光譜儀快速檢測(cè)模型的建立
微型NIR光譜儀建立優(yōu)化的駝乳常規(guī)營(yíng)養(yǎng)素預(yù)測(cè)模型見(jiàn)表8。5種常規(guī)營(yíng)養(yǎng)素的模型驗(yàn)證系數(shù)R2均大于0.9,RPD均大于2.4但小于3,可在現(xiàn)場(chǎng)或在線(xiàn)使用。微型NIR光譜儀采集的光譜信息點(diǎn)只有125個(gè),而臺(tái)式傅里葉變換NIR光譜儀為3 000個(gè),模型再優(yōu)化也顯然不能超越傅里葉變換NIR光譜儀的效果。
表7 雙峰駝乳臺(tái)式近紅外光譜儀模型外部預(yù)測(cè)參數(shù)
表8 雙峰駝乳微型NIR光譜儀預(yù)測(cè)模型參數(shù)
乳制品質(zhì)量和安全性檢測(cè)原理研究和技術(shù)開(kāi)發(fā)一直是食品檢測(cè)領(lǐng)域的熱門(mén)。而近紅外光譜技術(shù)自被發(fā)現(xiàn)以來(lái),便以迅猛的速度在數(shù)據(jù)分析方面和各個(gè)領(lǐng)域之中得到應(yīng)用。主要原因是近紅外光譜技術(shù)結(jié)果的重復(fù)性與再現(xiàn)性?xún)?yōu)于傳統(tǒng)的常規(guī)分析方法[17]。
水牛乳的脂肪含量顯著高于雙峰駝乳及牛乳,雙峰駝乳的蛋白質(zhì)、脂肪及乳糖含量都高于牛乳[18],營(yíng)養(yǎng)素含量的差距,導(dǎo)致其紅外光譜特征存在較大差異,直接影響近紅外光譜模型的結(jié)果。雖然模型驗(yàn)證系數(shù)R2均大于0.9,但相對(duì)分析誤差RPD只有脂肪與水分大于2.4且未達(dá)到3,表明模型的預(yù)測(cè)能力未達(dá)理想結(jié)果,因此有必要建立單一物種的常規(guī)營(yíng)養(yǎng)素預(yù)測(cè)模型。對(duì)本次實(shí)驗(yàn)采集的153份雙峰駝乳樣品進(jìn)行正態(tài)性檢驗(yàn),脂肪、乳糖、蛋白質(zhì)及灰分p-p值均在±0.05之間,呈正態(tài)性分布,水分p-p值在±0.09之間,說(shuō)明數(shù)據(jù)符合統(tǒng)計(jì)學(xué)規(guī)律。因此表明對(duì)雙峰駝乳建立單一物種的近紅外光譜快速預(yù)測(cè)模型具有可行性。
臺(tái)式傅里葉NIR光譜儀掃描光譜波長(zhǎng)范圍1 000~2 500 nm,可采集3 000個(gè)數(shù)據(jù)點(diǎn),儀器穩(wěn)定。而微型NIR光譜儀掃描光譜波數(shù)范圍為900~1676 nm,只采集125個(gè)數(shù)據(jù)點(diǎn)。結(jié)果表明傅里葉NIR光譜儀建立的快速預(yù)測(cè)模型,模型驗(yàn)證系數(shù)R2均大于0.92,RMSECV均小于0.2,RPD均大于3,外部驗(yàn)證參數(shù)都達(dá)到理想效果,可用傅里葉NIR光譜儀建立穩(wěn)定可靠的近紅外預(yù)測(cè)模型,這是微型NIR光譜儀所不具備的精準(zhǔn)度。微型NIR光譜儀建立的模型,雖然R2都高于0.9,但RPD都未超過(guò)3,RMSECV均大于0.27(灰分除外),模型參數(shù)不理想。需要優(yōu)化模型,在優(yōu)化過(guò)程中發(fā)現(xiàn),125個(gè)數(shù)據(jù)點(diǎn)不足以將模型優(yōu)化到理想程度,但微型NIR光譜儀便攜的優(yōu)點(diǎn)是臺(tái)式傅里葉NIR光譜儀不能達(dá)到的,增加采樣量可將模型優(yōu)化到理想程度,是以后的重點(diǎn)研究方向。
建立的模型可以對(duì)未知樣品進(jìn)行定量和定性的預(yù)測(cè),越來(lái)越多食品分析檢測(cè)過(guò)程中會(huì)利用采集到的數(shù)據(jù)構(gòu)建模型,然后不斷的采集新的檢測(cè)數(shù)據(jù),帶入到已知模型中,對(duì)模型進(jìn)行不斷的優(yōu)化和修正,使模型的準(zhǔn)確度更高[8]。
從內(nèi)蒙古主要駱駝飼養(yǎng)地區(qū)采集的153份雙峰駝乳常規(guī)營(yíng)養(yǎng)素值符合正態(tài)分布,可以估計(jì)雙峰駝乳常規(guī)營(yíng)養(yǎng)素的總體水平。采用NIR光譜建立和優(yōu)化雙峰駝乳5種常規(guī)營(yíng)養(yǎng)素含量的NIR快速預(yù)測(cè)模型。而臺(tái)式傅里葉NIR光譜儀建立的雙峰駝乳快速預(yù)測(cè)模型的預(yù)測(cè)能力優(yōu)于微型便攜式NIR光譜儀建立的模型,但微型NIR光譜儀的便攜與現(xiàn)場(chǎng)應(yīng)用等優(yōu)點(diǎn)是臺(tái)式傅里葉NIR光譜儀所不具備的。