張海洋,廖彩淇,楊仁杰,鮑秀君,王威,靳皓,張偉玉
眾所周知,牛奶由于能提供人體生長發(fā)育以及維持人體健康水平所必需的營養(yǎng)成份,如蛋白質、碳水化合物、脂肪等,被稱為“白色血液”,深受廣大消費者的喜愛。
隨著牛奶供給量不斷增加,一些奶制品銷售商為了使“不合格牛奶”轉變?yōu)椤昂细衽D獭?,往往在牛奶中添加一些不屬于牛奶組成的“外來物質”,以獲取最大利潤。因此,發(fā)展一種便捷、精準的檢測方法對于控制乳制品的質量具有重要的意義[1]。
近、中紅外光譜技術,由于其便捷、無需復雜樣品預處理和能實現在線檢測,已被廣泛應用于乳制品的檢測中[2-6]。Lu等在研究摻雜三聚氰胺奶粉近紅外光譜特性的基礎上,基于最小二乘支持向量機實現摻雜奶粉的判別[2]。Lisa等基于中紅外光譜建立了定量分析摻雜三聚氰胺奶粉的偏最小二乘模型,其相關系數高于0.99[3]。李亮等將近紅外光譜與Fisher判別法相結合實現摻假牛奶的定性分析,對未知樣品的識別正確率為94.4%[4]。金垚等將近紅外反射光譜和主成分分析結合起來,對不同品牌牛奶及摻假牛奶進行正確識別[5]。楊仁杰等利用1 562 cm-1與1 464 cm-1吸收峰面積之比實現了牛奶中摻入尿素的定量分析[6],同時建立了基于二維相關近紅外、中紅外譜摻雜牛奶的判別模型[7-10],指出不同品牌牛奶對模型的預測能力有很大影響。目前,國內外文獻基本都是采用單一的光譜技術(近紅外光譜或中紅外光譜)來定性定量分析摻雜牛奶,未見將二者融合用于摻雜牛奶分析的相關報道。
近紅外光譜表征的是分子含氫基團(C—H、N—H、O—H等)倍頻、合頻吸收,而中紅外光譜表征的是分子基頻吸收,二者都提供分子結構和組成狀態(tài)(如蛋白質、氨基酸、淀粉和脂肪等)等信息[11-14]。本文提出一種基于近、中紅外光譜數據融合摻假牛奶的判定方法,以摻雜三聚氰胺牛奶為研究對象,建立了摻雜牛奶的偏最小二乘判別模型,并與單一的近紅外、中紅外光譜判別模型的預測結果進行對比。
試驗采用美國PE公司的傅里葉變換近、中紅外光譜儀。在近紅外波段4 000~10 000 cm-1采集所有樣品的透射光譜;在中紅外波段700~4 000 cm-1采集所有樣品的衰減全反射光譜。光譜分辨率為4 cm-1,每個樣品掃描16次求平均。
從某超市購置伊利和蒙牛兩個品牌純牛奶,分別準備80個伊利和蒙牛純牛奶樣品,準確稱取不同質量的三聚氰胺粉末添加到純牛奶中,配置濃度范圍為0.01~3.00 g/L的摻雜三聚氰胺伊利和蒙牛牛奶各40個。
采用課題組編寫的偏最小二乘算法Matlab代碼,來建立摻雜牛奶的判別模型。
采集了兩個品牌牛奶在700~4 000 cm-1的中紅外衰減全反射光譜和4 000~10 000 cm-1的近紅外透射光譜。研究發(fā)現,在700~900、1 800~4 000、4 000~4 200、4 800~10 000 cm-1區(qū)間不能提供有用的光譜信息,因此,在近紅外波段選擇4 200~4 800 cm-1、中紅外波段選擇900~1 800 cm-1波數范圍內光譜進行分析。圖1a和1b分別給出了伊利和蒙牛兩種純牛奶在4 200~4 800 cm-1和900~1 800 cm-1波段的近、中紅外光譜。由于牛奶主要組分是相同的,所以兩個品牌牛奶在特征峰位置和光譜輪廓上幾乎都是相同的,僅在吸收強度上存在差異。從圖1b上可以看出,純牛奶在 1 744、1 648、1 548、1 248、1 076、1 044 cm-1處存在較強的特征吸收峰,其中1 744 cm-1和1 248 cm-1吸收峰主要來自牛奶中脂肪的特征吸收;1 648 cm-1和1 548 cm-1吸收峰主要來自牛奶中蛋白質的特征吸收;1 076 cm-1和1 044 cm-1吸收峰主要來自牛奶中乳糖的特征吸收[1]。
圖 1 兩品牌純牛奶的近紅外光譜(a)和中紅外光譜(b)
圖2 a和2b分別是摻雜0.02 g/L三聚氰胺兩個品牌牛奶的近、中紅外光譜。與純牛奶的近、中紅外光譜(圖1)相比,非常相似,無法直接判定牛奶中是否摻雜三聚氰胺。為實現摻雜牛奶和純牛奶的有效判別,同時減小不同品牌牛奶對模型預測性能的影響,本文提出并建立了基于近、中紅外光譜數據融合摻雜牛奶的偏最小二乘判別方法。
圖 2 摻雜三聚氰胺牛奶的近紅外光譜(a)和中紅外光譜(b)
首先,分別對80個純牛奶和80個摻雜三聚氰胺的伊利或蒙牛樣品進行分析,每一個品牌的近紅外光譜矩陣A(80×76)和中紅外光譜矩陣B(80×226)進行融合,得到融合近、中紅外光譜矩陣U(80×302)。在此基礎上,建立基于近、中紅外光譜融合單一品牌摻雜牛奶的判別模型。采用馬氏距離法對80個樣品進行異常樣品診斷,未發(fā)現異常樣品存在。根據K-S(Kennard-Stone)法,從總樣品中選取2/3的樣品作為校正集(純牛奶和摻雜三聚氰胺牛奶各27個),余下1/3的樣品作為預測集(純牛奶和摻雜三聚氰胺牛奶各13個)。在判別模型中,純牛奶用類別變量“0”表示,摻雜三聚氰胺牛奶用類別變量“1”表示,當某一樣品預測值大于0.5時,該樣品被歸為摻假類,當某一樣品預測值小于0.5時,該樣品被歸為未摻假(純牛奶)類。
對于PLS-DA模型,主成分數的選擇至關重要。主成分數太多,一些無用的信息會進入模型;主成分數太少,一些有用的信息可能會丟失,所以需要選擇合適的主成分數來進行建模。本文采用交叉驗證均方根誤差(RMSECV)來選擇模型的最佳主成分數。圖3給出了單一品牌伊利、蒙牛牛奶判別模型RMSECV隨主成分數變化的散點圖。從圖3可以看到,對于蒙牛牛奶模型,當主成分數為6的時候,其RMSECV最小;對于伊利牛奶模型,當主成分大于6的時,其RMSECV隨主成分數的增加變化不大。因此,選擇6個主成分分別建立單一品牌伊利、蒙牛牛奶的判別模型。
圖 3PLS-DA模型RMSECV隨主成分的變化曲線
圖4 和圖5分別是基于近、中紅外光譜融合所建的伊利和蒙牛牛奶判別模型對校正集和預測集樣品的預測結果。在圖4、圖5中,樣品No.1~No.27為校正集純牛奶樣品;No.28~No.54為校正集摻雜三聚氰胺牛奶樣品;樣品No.55~No.67為預測集純牛奶樣品;No.68~No.80為預測集摻雜三聚氰胺牛奶樣品。對于伊利牛奶,在校正集54個樣品中,各有1個純牛奶和摻雜三聚氰胺牛奶被誤判,其判別正確率為96.3%,在預測集26個樣品中,僅有1個摻三聚氰胺牛奶被誤判為純牛奶,其判別正確率為96.2%。對于蒙牛牛奶,在校正集和預測集中各有1個摻雜三聚氰胺牛奶被誤判,所建模型對校正集和預測集樣品的判別正確率分別為98.1%和96.2%。
圖 4 伊利牛奶判別模型對校正集和預測集樣品的預測結果
圖 5 蒙牛牛奶判別模型對校正集和預測集樣品的預測結果
為了研究不同品牌牛奶對判別模型預測性能的影響,基于融合近、中紅外光譜矩陣Q(160×302)建立了兩種品牌摻雜牛奶的判別模型。根據RMSECV選擇7個主成分,對108個樣品(兩個品牌:純牛奶和摻雜牛奶各27個)建立兩種品牌摻雜牛奶的判別模型。所建模型對校正集內部樣品的預測結果如圖6所示。
圖 6 兩個品牌牛奶判別模型對校正集樣品預測結果
樣品No.1~No.27為伊利純牛奶樣品;No.28~No.54伊利摻雜牛奶樣品;No.55~No.81為蒙牛純牛奶樣品;No.82~No.108為蒙牛摻雜牛奶樣品。從圖6可以看出,在108個樣品中,共有7個樣品被誤判,其中包括:1個伊利純牛奶,5個伊利摻雜牛奶,1個蒙牛摻雜牛奶,模型對兩品牌牛奶校正集樣品內部預測判別正確率為93.5%。
圖7為所建模型對預測集未知樣品的預測結果,樣品No.1~No.13為伊利純牛奶樣品;No.14~No.26伊利摻雜牛奶樣品;No.27~No.39為蒙牛純牛奶樣品;No.40~No.52為蒙牛摻雜牛奶樣品。從圖7可以看出,在52個樣品中,僅有3個伊利摻雜牛奶被誤判,模型對兩品牌牛奶預測集樣品的判別正確率為94.2%。
圖 7 兩個品牌牛奶判別模型對預測集樣品預測結果
在上述融合近、中紅外光譜數據建模的基礎上,分別基于近紅外光譜矩陣A(80×76)和中紅外光譜矩陣B(80×226)建立了伊利、蒙牛牛奶的判別模型。為了比較模型性能,表1和表2同時給出了單一近紅外光譜、中紅外光譜以及融合近、中紅外光譜所建模型的性能指標。從表1中可以看出,相對于單一近紅外光譜和中紅外光譜,無論是對校正集樣品內部預測,還是對預測集外部未知樣品的預測,融合近、中紅外光譜數據所建立的模型都對伊利牛奶的判定提供更好的結果。從表2可以看出,對于蒙牛牛奶的分析,3個模型提供了相同的判別結果。
表1 3個模型對伊利牛奶判別結果比較
表2 3個模型對蒙牛牛奶判別結果比較
同時,也建立了兩個品牌的近紅外光譜矩陣C(160×76)和中紅外光譜D(160×226)判別模型。同樣為了比較模型性能,表3給出了單一近紅外光譜、中紅外光譜以及融合近、中紅外光譜所建模型對兩個品牌牛奶的判別性能。從表3中可以看出,相對于單一的近紅外光譜和中紅外光譜,基于融合近、中紅外光譜所建的模型能對兩個品牌牛奶提供更好的分析結果。從上述分析可以看出,基于融合近、中紅外光譜數據建模,可以減小不同牛奶品牌對模型預測能力的影響,從而提高模型的判別正確率。
表3 3個模型對兩個品牌牛奶判別結果比較
本文發(fā)展并建立了一種基于近、中紅外光譜數據融合摻假牛奶的判定方法。該方法對伊利、蒙牛和兩個品牌牛奶未知樣品的判別正確率分別為96.2%、96.2%和94.2%,并與單一光譜技術近紅外光譜和中紅外光譜的建模結果進行了比較。研究結果表明,對于單個品牌牛奶模型,所提方法能提供更好的判別正確率;對于兩個品牌牛奶模型,所提方法能減小不同品牌牛奶對模型預測性能的影響,提高了判別正確率。
[1]崔彩路,楊仁杰,朱文碧,等.二維相關紅外譜結合PARAFAC-MLR判別摻雜牛奶[J].天津農學院學報,2015,22(1):19-23.
[2]Lu C H,Xiang B R,Hao G,et al.Rapid detection of melamine in milk powder by near infrared spectroscopy[J].J Near Infrared Spectroscopy,2009,17(2):59-67.
[3]Lisa J M,Alona A,Chernyshova A H,et al.Melamine detection in infant formula powder using near- and mid-infrared spectroscopy[J].Journal of Agricultural and Food Chemistry,2009,57(10):3974-3980.
[4]李亮,丁武.摻有植物性填充物牛奶的近紅外光譜判別分析[J].光譜學與光譜分析,2010,30(5):1238-1242.
[5]金垚,杜斌,智秀娟.NIR技術快速鑒定牛奶品牌與摻假識別[J].食品研究與開發(fā),2016,37(3):178-181.
[6]楊仁杰,劉蓉,徐可欣.基于中紅外光譜檢測牛奶中摻雜尿素[J].光譜學與光譜分析,2011,31(9):2383-2385.
[7]Yang R J,Liu R,Dong G M,et al.Two-dimensional hetero-spectral mid-infrared and near-infrared correlation spectroscopy for discrimination adulterated milk[J].Spectrochimica Acta Part A,2016,157:50-54.
[8]Yang R J,Dong G M,Sun X S,et al.Synchronousasynchronous two-dimensional correlation spectroscopy for the discrimination of adulterated milk[J].Analytical Methods,2015,7(10):4302-4307.
[9]楊仁杰,劉蓉,楊延榮,等.二維相關近紅外譜多維主成分分析摻雜牛奶判別方法研究[J].光學精密工程,2014,22(9):2352-2358.
[10]楊仁杰,楊延榮,劉海學,等.二維相關譜在食品品質檢測中的研究進展[J].光譜學與光譜分析,2015,35(8):2124-2129.
[11]Casale M,Oliveri P,Casolino C,et al.Characterisation of PDO olive oil Chianti Classico by non-selective(UV–visible,NIR and MIR spectroscopy)and selective(fatty acid composition)analytical techniques[J].Analytica Chimica Acta,2012,712:56-63.
[12]Bras L P,Bernardino S A,Lopes J A,et al.Multiblock PLS as an approach to compare and combine NIR and MIR spectra in calibrations of soybean[J].Chemometrics and Intelligent Laboratory Systems,2005,75(1):91–99.
[13]Casale M,Sinelli N,Oliveri P,et al.Chemometrical strategies for feature selection and data compression applied to NIR and MIR spectra of extra virgin olive oils for cultivar identification[J].Talanta,2010,80(5):1832-1837.
[14]Harrington P B,Kister J,Artaud J,et al.Automated principal component-based orthogonal signal correction applied to fused near infrared-mid-infrared spectra of French olive oils[J].Analytical Chemistry,2009,81(17):7160-7169.