吳史博 李 超 馬 寧 姚 恒 王萌萌 劉延奇
核桃又名羌桃或胡桃,含有豐富的營養(yǎng)物質(zhì),其含油量為60%~70%。利用現(xiàn)代工藝技術(shù)提取的核桃油,不僅具有其果仁的藥理功效成分[1],還具備調(diào)節(jié)血壓、促進(jìn)新陳代謝、防止血栓形成與擴(kuò)張的獨(dú)特功效[2]。因具有較高的營養(yǎng)價值和利潤,在流通市場,核桃油中摻入菜籽油的現(xiàn)象時常發(fā)生,由低硫苷低芥酸的“雙低”油菜品種加工的菜籽油,因其無原有的刺激性氣味,使得摻入此類菜籽油的核桃油用傳統(tǒng)的感官方法難以辨別。核桃油的國家標(biāo)準(zhǔn)中,僅對核桃油的基本組成、主要物理參數(shù)、質(zhì)量指標(biāo)等進(jìn)行了規(guī)定。雖能定性測量其指標(biāo),判定合格與否,但無法定量摻偽油脂中核桃油和菜籽油含量。因此出于市場監(jiān)管的需要,植物油的質(zhì)量檢測和摻偽鑒別成了急需解決的問題[3-6]。
目前,核桃油摻偽鑒別方法多采用傅里葉變換紅外光譜法[7-8]、近紅外光譜技術(shù)[9]等。近年來測定各品種植物油特征脂肪酸含量[10]并借助于統(tǒng)計學(xué)軟件[11]建立植物油判別分析模型的鑒別方法開始盛行。氣相色譜法作為色譜測量方法中的一種,不僅具有準(zhǔn)確度高、檢出限低等優(yōu)點(diǎn),特別是其在脂肪酸含量鑒別中的應(yīng)用更為廣泛。研究擬采用氣相色譜技術(shù)分析不同比例核桃油、菜籽油摻偽混合物中脂肪酸含量及變化規(guī)律,通過脂肪酸含量結(jié)合不同化學(xué)計量方法[12-19]建立核桃油、菜籽油摻偽混合物的定性和定量摻偽模型并進(jìn)行判別,以期為后續(xù)核桃油中同時摻入多種其他植物油的多元摻偽研究提供依據(jù)。
3種不同品牌核桃油、菜籽油:市售;
混合脂肪酸甲酯標(biāo)準(zhǔn)品:上海安譜實(shí)驗(yàn)科技股份有限公司;
甲醇、異辛烷:色譜純,天津市科密歐化學(xué)試劑有限公司;
無水硫酸鈉:分析純,天津市科密歐化學(xué)試劑有限公司。
氣相色譜儀:Trace 1300型,賽默飛世爾科技公司;
分析天平:XPR106DUH/AC型,梅特勒—托利多儀器有限公司;
旋渦混合器: XW-18A型,上海精科實(shí)業(yè)有限公司;
移液槍:0.5~10 μL,賽默飛世爾科技公司。
1.3.1 樣品制備 將不同品牌的純菜籽油、核桃油按不同體積比混合,利用旋渦振蕩器混勻,分別制備菜籽油摻偽量為0%,20%,40%,60%,80%,100%的6種混合樣本,并系統(tǒng)研究摻偽混合物脂肪酸含量的分布規(guī)律,共配制摻偽混合物72個。
1.3.2 脂肪酸含量分析 對油樣進(jìn)行甲酯化處理后,按GB 5009.168—2016第三法進(jìn)行油脂脂肪酸含量分析。
1.3.3 核桃油、菜籽油混合物的主成分分析 對72個樣品進(jìn)行測試,并建立主成分分析模型。
1.3.4 Bayes判別分析 計算某個觀測對象的先驗(yàn)概率,然后按照一定準(zhǔn)則構(gòu)造一個判別函數(shù),分別計算該樣品落入各子域的概率,所有概率中最大的一類為該觀測對象所屬的類別。將核桃油及摻偽核桃油數(shù)據(jù)代入SPSS Statistics軟件中進(jìn)行Bayes判別分析。
1.3.5 偏最小二乘判別分析(PLS-DA) 在主成分分析基礎(chǔ)上,將純核桃油與混有菜籽油的摻偽核桃油的脂肪酸數(shù)據(jù)代入SIMCA軟件進(jìn)行PLS-DA分析。
1.3.6 基于BP神經(jīng)網(wǎng)絡(luò)模型的判別分析 采用Hold-Out交叉驗(yàn)證法將原始數(shù)據(jù)分為兩組,一組作為訓(xùn)練集,一組作為測試集,利用訓(xùn)練集訓(xùn)練分類器,利用測試集評估模型的性能。通過調(diào)整樣本集的劃分比例(如4∶6,5∶5,6∶4,7∶3,8∶2等)和計算測試集的分類準(zhǔn)確率,最終確定樣本量的80%(樣品數(shù)57個)為訓(xùn)練集,樣本量的20%(樣品數(shù)15個)為測試集。參數(shù)設(shè)置中,權(quán)值閾值范圍為[-1,1],迭代次數(shù)為2 000,通過Matlab軟件進(jìn)行訓(xùn)練和識別。
1.3.7 基于遺傳算法優(yōu)化支持向量機(jī)(SVM-ga)的判別分析 采用Hold-Out交叉驗(yàn)證法將原始數(shù)據(jù)分為訓(xùn)練集(80%,樣本數(shù)57個)和測試集(20%,樣本數(shù)15個),利用訓(xùn)練集挖掘信息和訓(xùn)練分類器,利用測試集評估模型性能和計算準(zhǔn)確率。參數(shù)配置中核函數(shù)類型為徑向基,種群數(shù)為100,迭代次數(shù)為500,核函數(shù)參數(shù)g為1~100,交叉概率為0.7~1.0,變異概率為0~0.2,懲罰參數(shù)C為0~100。在此基礎(chǔ)上,利用Matlab軟件進(jìn)行識別。
前處理后的核桃油和菜籽油經(jīng)氣相色譜測定,其脂肪酸組成及含量如圖1和表1所示。由圖1和表1可知,核桃油的脂肪酸主要由十六碳一烯酸(C16:1)、十八碳酸(C18:0)、十八碳一烯酸(C18:1)、十八碳二烯酸(C18:2)、十八碳三烯酸(C18:3)組成,其中不飽和脂肪酸含量>90%,C18:2的含量最高,其次為C18:1和C18:3。
表1 不同比例核桃油、菜籽油摻偽混合物的脂肪酸含量?
圖1 核桃油、菜籽油脂肪酸含量
由表1可知,在菜籽油和核桃油的脂肪酸含量組成中,C18:1的含量差別最大,菜籽油中的含量約為核桃油的3.5倍,隨著菜籽油添加量的增大,其在摻偽核桃油中的含量也逐漸提高;其次為C18:2,其摻偽油脂的變化規(guī)律與C18:1的相反。其余脂肪酸相對含量較小,且隨菜籽油含量的增加而增加。菜籽油中檢出二十碳一烯酸(C20:1)和二十二碳一烯酸(C22:1),而核桃油中均未檢出。
由表2可知,3個主成分累計貢獻(xiàn)率達(dá)99.49%,能夠較為全面地反映原始變量的綜合信息。由圖2可知,不同比例摻偽核桃油與純核桃油在主成分空間中存在一定的交叉和混亂,但整體上核桃油與摻偽核桃油組間相對獨(dú)立,且組內(nèi)相對集中,說明不同比例摻偽核桃油和純核桃油之間存在較大差異,與表1的結(jié)果相吻合,表明基于以上7種脂肪酸成分進(jìn)行核桃油摻偽鑒別具有較高的可行性。此外,從主成分空間位點(diǎn)可以看出,純核桃油和純菜籽油的差異最為明顯,分布在主成分空間的兩端,隨著菜籽油摻偽量的逐漸提高,其分布位置距離純核桃油越遠(yuǎn),距離純菜籽油越近。因此,主成分分析在直觀區(qū)別純核桃油和摻偽核桃油的基礎(chǔ)上,也可以反映核桃油摻偽比例的高低。整體來看,主成分分析在一定程度上可以定性鑒別核桃油的混偽和摻假,但在定量方面仍無法給予明確的解釋,因此,需在判別分析和模式識別中進(jìn)一步研究。
表2 主成分特征值及累計可信度
圖2 核桃油與摻偽核桃油主成分得分圖
根據(jù)分析所得分類函數(shù)系數(shù),得判別函數(shù)式:
Y1=2.07X1-0.19X2+80.89X3+3 102.63X4-210.70X5-2 840.21,
(1)
Y2=97.32X1+7.06X2+68.95X3+4 147.92X4-169.02X5-2 434.69,
(2)
Y3=185.96X1+15.01X2+55.27X3+4 482.60X4-79.52X5-2 098.48,
(3)
Y4=313.69X1+24.06X2+40.22X3+4 666.08X4+719.07X5-2 128.00,
(4)
Y5=466.80X1+33.00X2+25.87X3+4 933.88X4+1 392.41X5-2 620.33,
(5)
Y6=587.47X1+42.61X2+11.01X3+5 519.95X4+1 881.15X5-3 538.52,
(6)
式中:
Y1、Y2、Y3、Y4、Y5、Y6——純核桃油、20%摻偽核桃油、40%摻偽核桃油、60%摻偽核桃油、80%摻偽核桃油、純菜籽油;
X1——C18:0脂肪酸含量,%;
X2——C18:1脂肪酸含量, %;
X3——C18:2脂肪酸含量,%;
X4——C16:1脂肪酸含量, %;
X5——C20:1脂肪酸含量,%。
將用于驗(yàn)證判別模型的樣品數(shù)據(jù)代入判別式中,求得各類的評分即Y值,Y值最大的即為該記錄所屬的類別。驗(yàn)證結(jié)果顯示,83.33%的樣品歸入正確的分類。
在主成分分析的基礎(chǔ)上,將純核桃油與混有菜籽油的摻偽核桃油的脂肪酸數(shù)據(jù)代入SIMCA軟件進(jìn)行PLS-DA分析。由表3可知,PLS模型共提取到4個主成分,其變量的累計R2Y值和Q2值分別為98.82%,94.78%,說明該模型的擬合效果較好。
表3 基于PLS的解釋變量和預(yù)測變量
隨機(jī)選取核桃油與混有菜籽油的摻偽核桃油樣品借助PLS模型進(jìn)行預(yù)測,結(jié)果(表4)顯示,87.50%的樣品被正確分類。摻偽60%的樣品中有4個分類為40%集合,摻偽80%的樣品中有5個分類為60%集合。錯誤分類主要因?yàn)樵趽絺?0%、40%比例中,C18:3與C16:1的含量相近。摻偽80%,60%比例中,C16:1的含量相近。
表4 PLS判別分類結(jié)果
BP神經(jīng)網(wǎng)絡(luò)中預(yù)測值和真實(shí)值的分布情況見圖3。由表5可知,BP神經(jīng)網(wǎng)絡(luò)算法中訓(xùn)練集的正確率為84.21%,測試集的正確率為80.00%,整體效果欠佳。其中,在訓(xùn)練集中,第6類的9個樣品均被誤判至第5類,其他樣品分類歸屬正確;在測試集中也出現(xiàn)相似的結(jié)果,即第6類的3個樣品均被誤判至第5類,其他樣品分類歸屬正確。說明第5類樣品與第6類樣品的相似度較高,現(xiàn)有的評估模型在梯度搜索過程中識別程度不足,與主成分分析的結(jié)果較為相似。總體來說,BP神經(jīng)網(wǎng)絡(luò)模型對摻偽混合物的鑒別效果欠佳,尤其是第5類和第6類出現(xiàn)較多誤判,該判別方法有待進(jìn)一步調(diào)試和優(yōu)化。
表5 BP神經(jīng)網(wǎng)絡(luò)算法的鑒別效果
SVM-ga算法中預(yù)測值和真實(shí)值的分布情況見圖4。由表6可知,SVM-ga算法中訓(xùn)練集和測試集的正確率均為100%,判別效果理想。說明基于氣相色譜技術(shù)結(jié)合SVM-ga模型可以有效地識別核桃油、菜籽油摻偽混合物的摻假比例。這可能是SVM-ga算法能夠有效地針對混偽摻假問題進(jìn)行概率意義的全局搜索,并可提供混偽摻假方面的獨(dú)立啟發(fā)式,從而保證算法的有效性。
表6 SVM-ga算法的鑒別效果
圖4 SVM-ga算法中預(yù)測值和真實(shí)值的分布情況
試驗(yàn)表明,選擇菜籽油作為摻偽植物油混入核桃油中,其脂肪酸含量會發(fā)生相應(yīng)變化,在主成分分析中,通過構(gòu)建核桃油與摻偽核桃油樣品的主成分分布圖,發(fā)現(xiàn)不同摻偽量的摻偽核桃油樣品分布相對獨(dú)立,說明基于主成分分析的數(shù)據(jù)處理適用于核桃油及其摻偽樣品的判別與分類。在此基礎(chǔ)上,除采用較為常見的Bayes判別分析、PLS-DA判別分析外,嘗試使用基于BP神經(jīng)網(wǎng)絡(luò)模型的判別分析、基于遺傳算法優(yōu)化支持向量機(jī)(SVM-ga)的判別分析方法構(gòu)建模型并進(jìn)行預(yù)測。其中,SVM-ga的判別分析效果更佳,此模式識別方法的建立,可有效識別核桃油、菜籽油摻偽混合物的摻假比例。
氣相色譜結(jié)合化學(xué)計量在核桃油、菜籽油摻偽混合物含量判別分析中取得了一定的效果,其建模方法比較成熟,通過操作軟件就可以在相關(guān)性較強(qiáng)的一系列數(shù)據(jù)中提取主要信息,預(yù)測未知樣品的種類和信息,不僅拓寬了色譜分析等傳統(tǒng)分析方法的應(yīng)用范圍,也為產(chǎn)品的質(zhì)量控制、判別檢驗(yàn)提供了新的途徑和思路。但化學(xué)計量中的判別模型均建立在樣本分析基礎(chǔ)上。樣本量較少,樣品代表性不足是判別模型的最大弊端,模型的準(zhǔn)確性、科學(xué)性還需要更多真實(shí)樣品數(shù)據(jù)進(jìn)行校正。此外,在核桃油二元摻偽混合物進(jìn)行定性、定量研究的基礎(chǔ)上,多元摻偽的判別還有待進(jìn)一步探討。