吳靜珠, 劉翠玲, 李 慧, 孫曉榮
(北京工商大學(xué) 計(jì)算機(jī)與信息工程學(xué)院, 北京 100048)
我國是食用植物油的消費(fèi)大國. 食用植物油是人們膳食結(jié)構(gòu)中不可缺少的組成部分,其質(zhì)量優(yōu)劣對人體健康有著重要的影響. 花生油、大豆油、菜籽油、芝麻油等是我國人民食用的主要油類品種. 為保護(hù)合法生產(chǎn)經(jīng)營者和消費(fèi)者的利益,食用油摻偽鑒別及品質(zhì)的在線檢測勢在必行. 目前國內(nèi)外檢測食用油品質(zhì)方法主要有氣相色譜、高效液相色譜及篩析色譜法等常規(guī)化學(xué)分析方法,這些方法具有較高的準(zhǔn)確度和可靠性,但需借助于昂貴的設(shè)備和嚴(yán)格的實(shí)驗(yàn)室條件對樣品進(jìn)行復(fù)雜的前處理,且分析速度慢,不能滿足市場快速檢測的需要.
20世紀(jì)70年代迅速發(fā)展起來的近紅外光譜分析技術(shù)是利用近紅外譜區(qū)包含的物質(zhì)信息,用于有機(jī)物質(zhì)定性和定量分析的一種分析技術(shù)[1]. 該方法操作簡單、前處理簡便、檢驗(yàn)成本低, 可進(jìn)行多組分測量,還可以進(jìn)行在線檢測,在農(nóng)產(chǎn)品和食品品質(zhì)分析方面是一種首選技術(shù). 近紅外光譜分析技術(shù)在油脂中的應(yīng)用目前也有一些研究報(bào)道,主要用于油脂的品質(zhì)檢測[2].
本文應(yīng)用近紅外光譜分析技術(shù)分別建立了快速鑒別純橄欖-芝麻-花生油近紅外定性識(shí)別模型,以及測定食用植物油主要脂肪酸(酸棕櫚酸、硬脂酸、油酸)含量的近紅外定量分析模型.
食用油定性鑒別實(shí)驗(yàn)樣品:19個(gè)超市購買的不同品牌不同批次食用植物油樣品,其中純花生油(福臨門、魯花、龍大等)6個(gè),純芝麻油(福臨門等)5個(gè),純橄欖油(多力、PONDS等)8個(gè).
食用油脂肪酸定量分析樣品:59個(gè)樣品及其4種主要脂肪酸含量(棕櫚酸、硬脂酸、油酸)均由中國農(nóng)業(yè)大學(xué)提供. 實(shí)驗(yàn)樣品是由不同品牌、不同批次的食用植物油樣品組成,包括花生油、玉米油、棕櫚油、橄欖油、大豆油、調(diào)和油等. 3種脂肪酸含量按國標(biāo)(氣相色譜法)測定.
實(shí)驗(yàn)采用北京工商大學(xué)計(jì)算機(jī)與信息工程學(xué)院的光譜分析與品質(zhì)檢測研究室購買的VERTEX 70紅外光譜儀(德國Bruker公司)采集近紅外全譜.
光譜波數(shù)范圍:4 000 cm-1~12 500 cm-1. 分辨率:8 cm-1. 每個(gè)樣品重復(fù)掃描次數(shù):32次. 采樣點(diǎn):1 102個(gè). 使用液體光纖探頭采樣,光程:2 mm.
全部樣品未經(jīng)任何化學(xué)處理,將光纖探頭插入裝有樣品的小瓶中,逐一掃描樣品,每次測量前均用石油醚清洗探頭,避免樣品間交叉污染. 植物油樣品近紅外光譜如圖1.
圖1 食用植物油樣品近紅外光譜圖Fig.1 Near-infrared spectrum of edible vegetable oil samples
食用油因其種類不同,營養(yǎng)價(jià)值不同而價(jià)格差異很大. 一些不法商家為追求利潤,常以低價(jià)位的植物油摻兌到高價(jià)位的植物油中來降低生產(chǎn)成本,從中牟取暴利. 摻假食用油不僅影響衛(wèi)生品質(zhì)和營養(yǎng)成分,而且嚴(yán)重危害消費(fèi)者健康. 本實(shí)驗(yàn)重點(diǎn)研究基于近紅外光譜的食用油種類(橄欖油、花生油和芝麻油)的定性識(shí)別.
實(shí)驗(yàn)研究的定性分類是基于樣品的近紅外光譜特征的. 近紅外光譜能反映被測樣品的組成和結(jié)構(gòu)性質(zhì),相同或近似的樣品有著相同或接近的光譜;反之,則其近紅外光譜存在較大的差異. 聚類分析屬于模式識(shí)別方法中的無管理方法之一. 它可以根據(jù)“物以類聚”的道理,在沒有先驗(yàn)知識(shí)的情況下,能合理地按樣品各自的特性來進(jìn)行合理的分類. 實(shí)驗(yàn)將樣品的近紅外光譜與系統(tǒng)聚類法相結(jié)合[3],來建立橄欖-芝麻-花生油定性識(shí)別模型. 其中,hs01~hs06為純花生油樣品,gl01~gl08為純橄欖油樣品,zm0~zm05為純芝麻油樣品. 光譜預(yù)處理采用First Derivate(9 pts)+Vector Normalize. 系統(tǒng)聚類方法較多,本實(shí)驗(yàn)采用OPUS軟件提供的7種不同的聚類方法:singl linkage, average linkage, weighted Av. L inkage, median algorithm, centroid algorithm和Ward’s algorithm. 經(jīng)過比較分析結(jié)果,采用average linkage方法聚類效果較為理想,聚類結(jié)果如圖2.
圖2 聚類結(jié)果Fig.2 Cluster analysis
從圖2中分析可得,只要令類間距大于0.062,小于0.088,則樣品集可以聚類為3類,即芝麻油、花生油和橄欖油. 識(shí)別率為100%. 實(shí)驗(yàn)另外收集6個(gè)不同的植物油樣品即純芝麻油(zm06)、純花生油(hs07)、純橄欖油(gl09)、純大豆油(d0)、純菜籽油(c0)、純棕櫚油(z0)作為預(yù)測集. 預(yù)測結(jié)果如圖3.
從預(yù)測集樣品的預(yù)測結(jié)果可以得出,當(dāng)聚類模型類間距確定在0.062~0.076之間,則純芝麻油(zm06)、純花生油(hs07)、純橄欖油(gl09)均能被正確識(shí)別和歸類,純大豆油(d0)、純菜籽油(c0)、純棕櫚油(z0)則可以被確認(rèn)為不屬于芝麻油、花生油和橄欖油的任一種,所有樣品的預(yù)測率達(dá)到100%. 因此綜合建模和預(yù)測兩者的結(jié)果,可將聚類模型的類間距在0.062~0.076之間,則模型的識(shí)別率和預(yù)測率均可達(dá)100%.
因此基于近紅外光譜的純橄欖-芝麻-花生油聚類模型的建立可以為定性識(shí)別植物油的類別提供一個(gè)快速簡便的檢測方法.
隨著營養(yǎng)學(xué)研究發(fā)展,人們對植物油中脂肪酸認(rèn)識(shí)不斷增加. 中國營養(yǎng)學(xué)會(huì)也推薦膳食中必需脂肪酸攝入理想比值,市場上也出現(xiàn)大量調(diào)和油,為了評估食用植物油營養(yǎng)價(jià)值,研究分析常用食用植物油中脂肪酸組成是很有必要的. 本實(shí)驗(yàn)重點(diǎn)研究基于近紅外光譜的食用油脂肪酸(棕櫚酸、硬脂酸和油酸)含量的定量分析.
近紅外光譜分析技術(shù)中定標(biāo)建模樣品的選擇是,定標(biāo)樣品的選取直接影響所建模型的適用性和準(zhǔn)確性[4]. 實(shí)驗(yàn)采用基于樣品近紅外光譜差異的duplex法劃分定標(biāo)集和預(yù)測集. 按照定標(biāo)集和預(yù)測集樣品個(gè)數(shù)的比例為3∶1劃分,則定標(biāo)集樣品45個(gè),預(yù)測集樣品14個(gè),脂肪酸含量分布如表1. 從表1中可以看出,定標(biāo)集樣品的濃度范圍涵蓋了預(yù)測集樣品的濃度范圍.
圖3 預(yù)測集分析結(jié)果Fig.3 Result of test analysis
表1 定標(biāo)集-預(yù)測集4種脂肪酸含量分布Tab.1 Four fatty acid content in calibration and test
實(shí)驗(yàn)采用偏最小二乘法分別建立了3種脂肪酸含量和其近紅外光譜相關(guān)的近紅外定量分析模型. 每種脂肪酸含量的近紅外模型的建立均經(jīng)過模型優(yōu)化,包括譜區(qū)的選擇以及光譜預(yù)處理方法比較等,采用最佳主成分?jǐn)?shù)nf,交叉校驗(yàn)定標(biāo)標(biāo)準(zhǔn)差RMSECV(root mean square error of cross validation),相關(guān)系數(shù)R,預(yù)測標(biāo)準(zhǔn)差RMSEP(root mean square error of prediction)作為模型的評價(jià)指標(biāo),建模結(jié)果如表2.
表2 3種脂肪酸近紅外定量分析模型Tab.2 four NIR quantitative models of fatty acid
從脂肪酸含量的近紅外定量分析模型的指標(biāo)可以得出,模型的相關(guān)系數(shù)R較高,且RMSECV,RMSEP的值較低,模型具有較好的預(yù)測效果.
因此基于近紅外光譜的3種脂肪酸含量的定量分析模型建立,可以為定量分析植物油脂肪酸含量提供一個(gè)快速簡便的檢測方法.
1)將近紅外光譜分析與系統(tǒng)聚類法相結(jié)合,建立了純橄欖-芝麻-花生油定性識(shí)別模型. 本實(shí)驗(yàn)中對于測試集樣品定性識(shí)別的預(yù)測率可達(dá)100%.
2)建立了食用植物油3種主要脂肪酸(棕櫚酸、硬脂酸和油酸)的近紅外定量分析模型,相關(guān)系數(shù)R分別為0.987,9.986,0.992;交叉校驗(yàn)定標(biāo)標(biāo)準(zhǔn)差RMSECV分別為0.409,0.127,1.71;預(yù)測標(biāo)準(zhǔn)差RMSEP分別為0.596,0.128,1.71. 模型具有較好的預(yù)測效果.
基于上述前期工作的結(jié)果可知,近紅外光譜分析技術(shù)在食用油品質(zhì)快速檢測領(lǐng)域有較好的應(yīng)用前景,后期的深入研究工作可以大有作為.