◎ 蔡佳玲,王 旭,蔡 強(qiáng),李武超,諸 寅
(1.浙江清華長三角研究院,浙江 嘉興 314006;2.浙江工業(yè)大學(xué),浙江 杭州 310014;3.嘉興職業(yè)技術(shù)學(xué)院,浙江 嘉興 314036)
隨著經(jīng)濟(jì)的發(fā)展,人民生活水平提高,奶粉品質(zhì)成為老百姓關(guān)注的焦點(diǎn)。奶粉中營養(yǎng)物質(zhì)含量是評(píng)價(jià)乳制品品質(zhì)的重要指標(biāo)。奶粉營養(yǎng)物質(zhì)含量的檢測(cè)方法有很多,以蛋白質(zhì)為例,主要方法有凱氏定氮法、分光光度法、燃燒法、高效液相色譜法、質(zhì)譜法、熒光法和紅外光譜法等。目前,常用的檢測(cè)方法是凱氏定氮法(國家標(biāo)準(zhǔn)),但是存在測(cè)量方法復(fù)雜、檢測(cè)速度慢、檢測(cè)結(jié)果誤差較大的缺點(diǎn)[1]。
傅里葉變換紅外光譜法(FTIR)具有宏觀整體鑒定復(fù)雜體系的優(yōu)點(diǎn)以及無損快速的特點(diǎn),目前多用于藥用動(dòng)、植物等領(lǐng)域的真?zhèn)蝺?yōu)劣鑒別[2-3]。運(yùn)用紅外光譜法結(jié)合支持向量機(jī)回歸和偏最小二乘法建模對(duì)奶粉進(jìn)行質(zhì)量檢測(cè),無需分離提取,步驟簡單、快速,結(jié)果直觀準(zhǔn)確。與傳統(tǒng)檢測(cè)方法相比具有簡單、快速,人員培訓(xùn)成本低,可實(shí)現(xiàn)遠(yuǎn)程分析、在線分析等優(yōu)點(diǎn)。單楊等人對(duì)獲得的奶粉近紅外光譜圖,以小波變換-徑向基神經(jīng)網(wǎng)絡(luò)模型建模,對(duì)蛋白質(zhì)和脂肪進(jìn)行定量分析,蛋白質(zhì)的預(yù)測(cè)集相關(guān)系數(shù)(Rp)和均方根誤差分別為0.994、0.004,脂肪的預(yù)測(cè)集相關(guān)系數(shù)(Rp)和均方根誤差分別為0.990、0.007[4]。張華秀利用近紅外光譜分析技術(shù)結(jié)合Boosting-PLS對(duì)建模牛奶中蛋白質(zhì)、脂肪的含量進(jìn)行快速定量分析,其中蛋白質(zhì)含量定量分析模型的相關(guān)系數(shù)為0.996,預(yù)測(cè)誤差均方根0.315 9[5]。近年來,關(guān)于營養(yǎng)物質(zhì)的檢測(cè)開始細(xì)化。穆同娜、莊勝利等采用近紅外光譜法結(jié)合偏最小二乘法(PLS)建模定量分析嬰幼兒配方奶粉中的總脂肪酸、飽和脂肪酸和不飽和脂肪酸含量,其校正模型相關(guān)系數(shù)(R2)分別為0.933 7、0.937 4、0.902 0,RPD分別為3.63、3.65、2.90[6]。
奶粉:共303種,包含超市和網(wǎng)上的愛他美、蒙牛、合生元、美素佳兒、伊利、惠氏、諾優(yōu)能、雅培、貝因美等國內(nèi)外76種品牌,包括嬰幼兒奶粉、青少年奶粉、學(xué)生奶粉、女士奶粉、中老年奶粉、孕婦奶粉、羊奶粉等。
溴化鉀:德國Merck公司。
Nicolet iS5傅立葉變換紅外光譜儀,美國ThermoFisher公司;FD240電熱鼓風(fēng)干燥箱,德國Binder公司。
樣品經(jīng)低溫烘干、研磨后與KBr混合,研勻壓片,用Nicolet iS5傅立葉變換紅外光譜儀采集中紅外光譜圖,掃描范圍7 800~350 cm-1,峰-峰噪音小于1×10-5,光譜分辨率優(yōu)于0.8 cm-1。
交叉驗(yàn)證是將原始數(shù)據(jù)進(jìn)行分組,一部分作為校正集,另一部分為驗(yàn)證集:用校正集對(duì)模型進(jìn)行訓(xùn)練,再利用驗(yàn)證集測(cè)試模型效果,以相關(guān)系數(shù)、誤差均方根作為模型的性能指標(biāo)[7]。選用Hold-Out方法評(píng)價(jià)模型,將原始數(shù)據(jù)分成校正集和驗(yàn)證集:采用Kennard-Stone算法進(jìn)行區(qū)分,進(jìn)行交叉驗(yàn)證,記錄相關(guān)系數(shù)和均方根誤差評(píng)價(jià)建模效果[7]。
以130個(gè)樣本為校正集,65個(gè)樣本為驗(yàn)證集,第一、第二主成分譜圖計(jì)算數(shù)據(jù)的得分如圖1所示,結(jié)果表明校正集和驗(yàn)證集的分布比較一致。
圖1 校正集與驗(yàn)證集主成分得分分布圖
樣品的中紅外光譜圖除了包含樣品自身信息,還攜帶了很多無關(guān)信息。選擇合適的預(yù)處理方法光譜預(yù)處理能夠減弱無關(guān)信息,降低噪聲,提高建模效果。常用預(yù)處理方法有平滑、傅里葉變換、微分、小波變換、標(biāo)準(zhǔn)正態(tài)變量變換歸一化與標(biāo)準(zhǔn)化、多元散射校正等。分別用上述處理方法單獨(dú)或疊加對(duì)樣品紅外光譜圖進(jìn)行預(yù)處理,并用偏最小二乘法建模,對(duì)比不同方法的預(yù)處理效果,具體流程如圖2所示。
圖2 預(yù)處理方法選擇流程圖
結(jié)果表明,蛋白質(zhì)定量分析用標(biāo)準(zhǔn)正態(tài)變量變換(SNV)結(jié)合提取前14個(gè)主成分預(yù)處理效果最好,相關(guān)系數(shù)R達(dá)到0.961 2,預(yù)測(cè)均方根誤差為0.883 8;脂肪含量定量分析以標(biāo)準(zhǔn)正態(tài)變量變換結(jié)合提取前20個(gè)主成分預(yù)處理效果最好,相關(guān)系數(shù)R達(dá)到0.960 1,預(yù)測(cè)均方根誤差為1.101 4;碳水化合物含量定量分析以小波變換預(yù)處理效果最好,相關(guān)系數(shù)R為0.903 9,預(yù)測(cè)均方根誤差為2.059。
2.3.1 偏最小二乘法
偏最小二乘法(Partial least squares regression,PLS)是最常用的定量分析方法之一。PLS在近紅外光譜乳制品分析中得到廣泛應(yīng)用,趙明富、施玉佳、羅彬彬等人對(duì)牛奶的透射光譜用偏最小二乘法建模定量分析其蛋白質(zhì)和脂肪的含量[8]。呂麗娜等對(duì)牛奶用近紅外光譜以偏最小二乘法建模定量分析牛奶中蛋白質(zhì)和脂肪含量,其中蛋白質(zhì)定量分析模型相關(guān)系數(shù)R為0.921,均方根誤差RMSE為1.02[9]。
偏最小二乘法(PLS)同時(shí)提取自變量、因變量主成分,并考慮了兩者的相關(guān)程度,提取相關(guān)程度最大的主成分。這樣提取了最大變異信息,增加結(jié)果對(duì)原數(shù)據(jù)的解釋能力。
2.3.2 支持向量機(jī)回歸
支持向量機(jī)回歸(Support vector machine regression,SVM)是一種在高維建立分類超平面作為決策曲面,使得正例、反例之間隔離邊緣最大化的非線性回歸方法[10]。
支持向量機(jī)建模效果與參數(shù)選擇有關(guān),研究表明支持向量機(jī)類型選擇、核函數(shù)的選擇對(duì)建模效果影響不大,影響建模效果的關(guān)鍵是核函數(shù)參數(shù)的選擇[11]。
本研究采用epsilon-SVR和徑向基核函數(shù),并以遺傳算法進(jìn)行SVM參數(shù)尋優(yōu)。需篩選的參數(shù)有epsilon-SVR的損失函數(shù)值p、徑向基核函數(shù)γ、epsilon-SVR設(shè)置參數(shù)c。
用支持向量機(jī)方法建模,用遺傳算法篩選支持向量機(jī)參數(shù)得到模型,用模型預(yù)測(cè)驗(yàn)證集得到結(jié)果進(jìn)行評(píng)價(jià)。多次測(cè)試得出最佳結(jié)果,見表1。
表1 3種物質(zhì)遺傳算法結(jié)合支持向量機(jī)回歸建模效果表
結(jié)果顯示,蛋白質(zhì)、脂肪、碳水化合物對(duì)蛋白質(zhì)含量定性分析,SVM預(yù)測(cè)效果好于PLS,而對(duì)脂肪、碳水化合物含量定量分析效果差于PLS。
奶粉的營養(yǎng)成分種類很多,但蛋白質(zhì)、脂肪及碳水化合物占奶粉營養(yǎng)成分總量的85%~95%,對(duì)這3類營養(yǎng)物質(zhì)含量及組分的分析可基本確定奶粉的質(zhì)量[12]。通過比對(duì)實(shí)驗(yàn)確認(rèn)蛋白質(zhì)定量分析模型用標(biāo)準(zhǔn)正態(tài)變量變換結(jié)合提取前14個(gè)主成分進(jìn)行預(yù)處理,用遺傳算法篩選模型參數(shù),用支持向量機(jī)回歸建模效果最好,相關(guān)系數(shù)為0.971 1,預(yù)測(cè)均方根誤差為0.857 1;脂肪定量分析模型用標(biāo)準(zhǔn)正態(tài)變量變換結(jié)合提取前20個(gè)主成分預(yù)處理,用偏最小二乘法建模效果最佳,預(yù)測(cè)集相關(guān)系數(shù)0.960 1,預(yù)測(cè)均方根誤差1.101 4;碳水化合物定量分析模型用小波變換預(yù)處理,偏最小二乘法建模效果最佳,相關(guān)系數(shù)0.903 9,預(yù)測(cè)均方根誤差2.028 4。