楊雨菲,劉翠玲*,吳靜珠,孫曉榮
(北京工商大學(xué)計(jì)算機(jī)與信息工程學(xué)院,食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100048)
作為人體的三大營養(yǎng)源之一,食用油脂的品質(zhì)好壞與人體健康有直接的關(guān)系[1]。對于將地溝油、潲水油、工業(yè)油脂等用于食品加工生產(chǎn)從而引發(fā)的食品安全問題,已得到國家有關(guān)部門的高度重視和嚴(yán)厲打擊,但消費(fèi)者往往忽略了食用油脂在儲存及使用過程中,同樣存在著安全隱患。在食用油儲存過程中,由于受到外界(水分、溫度、光照、空氣等)的影響,油脂中不飽和脂肪酸與氧氣發(fā)生氧化反應(yīng),產(chǎn)生一系列過氧化脂質(zhì)。過氧化脂質(zhì)在體內(nèi)積累,還會破壞體內(nèi)細(xì)胞的結(jié)構(gòu)和正常生理功能[2-5]。油脂在儲藏過程中因儲藏條件的不同氧化程度和速度也不同,評價(jià)食用油品的品質(zhì)通常采用過氧化值:新鮮的油脂其過氧化值小于1.2 mmol/kg;過氧化值在1.2~2.4 mmol/kg之間時(shí),感官檢驗(yàn)無異常;過氧化值高于4.0 mmol/kg時(shí),油脂出現(xiàn)辛辣味;過氧化值超過6.0 mmol/kg較多時(shí),人們食用后可出現(xiàn)嘔吐、腹瀉等中毒癥狀[6-8]。
目前,在食用油脂檢測技術(shù)方面,常見的檢測技術(shù)有氣相色譜法、液相色譜法[9-10]、色譜-質(zhì)譜聯(lián)用分析法[11]等,這些方法檢測精度較高,但在樣品提純、萃取等預(yù)處理技術(shù)方面十分復(fù)雜,且后期的檢測條件苛刻,檢測周期較長。近年來,太赫茲光譜技術(shù)因其輻射具有較長的波長和良好的穿透特性而得到了迅速的發(fā)展。同時(shí),太赫茲時(shí)域光譜在反映分子集體振動模式、分子間相互作用方面具有顯著優(yōu)勢,可提供更多關(guān)于被測物分子的動態(tài)信息或鑒別分子類型[12-13];并且與紅外、拉曼檢測技術(shù)相比,太赫茲光譜的探測性能更加靈敏、信噪比更高,可同時(shí)獲得樣本的色散和吸收信息[14-15]。太赫茲技術(shù)可作為拉曼和紅外的互補(bǔ)手段,不僅能獲得分子中官能團(tuán)的振動和轉(zhuǎn)動的結(jié)構(gòu)信息,還可以用于研究分子結(jié)構(gòu)和成分鑒別?;谝陨险撌?,本研究選用太赫茲技術(shù)檢測食用油脂具有很高的理論可行性。
Ung等[16]率先采用太赫茲時(shí)域光譜技術(shù)檢測了加熱和未加熱的花生油,觀測到花生油吸收峰位于1~1.6 THz之間,加熱后的吸收更強(qiáng),應(yīng)用太赫茲技術(shù)論證了溫度變化對油品組分的影響。李利龍等[17]通過比較7 種植物油、2 種調(diào)和油特征吸收參數(shù)吸收峰的差異,驗(yàn)證了脂類有機(jī)大分子對太赫茲輻射具有差異性吸收,具備在太赫茲波段的識別基礎(chǔ),可通過太赫茲技術(shù)進(jìn)行鑒別和定性分析。廉飛宇等[18]采用太赫茲時(shí)域光譜檢測系統(tǒng),探究4 種食用油在波段為0.2~1.6 THz的延遲特性和折射率特性,通過化學(xué)計(jì)量學(xué)方法精準(zhǔn)鑒別出食用油的種類。聶美彤等[19]研究了食用油的衰減全反射式太赫茲時(shí)域光譜特性,其實(shí)驗(yàn)測量結(jié)果與食用油組分含量理論計(jì)算值相吻合,可認(rèn)為太赫茲波段食用油的吸收峰與其脂肪酸分子種類和含量有關(guān)。以上研究成果表明:油脂類有機(jī)大分子對太赫茲輻射具有差異性吸收,具備在太赫茲波段的識別基礎(chǔ),可通過太赫茲技術(shù)進(jìn)行油品鑒別和定性分析。雖然國內(nèi)外眾多研究機(jī)構(gòu)在探索油脂品質(zhì)和問題油脂的檢測方法方面取得了一定的進(jìn)展,但大多將太赫茲技術(shù)用于食用油種類鑒別和組分研究,鮮有用該技術(shù)對儲存期油品新鮮程度和食用性判別的詳細(xì)報(bào)道。因此利用太赫茲光譜技術(shù)分析貯存期不同氧化程度體現(xiàn)食用油脂品質(zhì)的變化情況很有必要。
本研究以常用品種的食用油為原材料,依據(jù)食用油氧化的規(guī)律和標(biāo)準(zhǔn),采用太赫茲時(shí)域光譜技術(shù),建立食用油品質(zhì)評判的定性分析模型,以期為快速無損鑒別食用油氧化品質(zhì)提供參考。
實(shí)驗(yàn)樣本為不同氧化程度的玉米油、大豆油、菜籽油共48 個,由北京糧食科學(xué)研究院提供。本研究將過氧化值小于1.2 mmol/kg的油脂定義為新鮮油;過氧化值在1.2~2.4 mmol/kg之間的油脂定義為可食用油;過氧化值大于2.4 mmol/kg的油脂定義為不宜食用油,每一類油選取16 個樣本作為研究對象。油品均成淺黃色透明狀液體,在宏觀上無明顯差別。
TeraPulse 4000太赫茲脈沖光譜儀 英國劍橋TeraView公司。工作時(shí)儀器參數(shù)設(shè)置如下:Terahertz光源:激光門控光電導(dǎo)體半導(dǎo)體發(fā)射器;激光器:超短脈沖光纖激光器;掃描范圍:0~2 400 ps;快速掃描:30 次/s,光譜分辨率1.2 cm-1;光譜測量范圍在2~133 cm-1(0.06~4 THz)之間,信噪比最高達(dá)到70 dB。
光譜采集由太赫茲脈沖光譜儀配備的單晶硅衰減全反射(attenuated total reflection,ATR)模塊完成。ATR能夠測量固體和液體樣本,具有采樣面積小、樣品量小等優(yōu)點(diǎn),并且樣品制備和采集方式簡單。它的工作范圍在10~120 cm-1左右的電磁頻譜區(qū)域內(nèi),入射角35°。
輔助設(shè)備:JHY-H-1000L型恒溫恒濕試驗(yàn)箱,溫度范圍-40~150 ℃,溫度波動度≤±0.5 ℃,相對濕度20%~98%,本實(shí)驗(yàn)設(shè)置相對濕度為55%。
太赫茲光譜易受溫度影響,在不同溫度下會顯現(xiàn)出不完全相同太赫茲時(shí)域譜信息,所以本研究將食用油樣品放置在溫度和光線恒定的室內(nèi)進(jìn)行實(shí)驗(yàn),環(huán)境溫度為22 ℃,以盡量降低溫度帶來的噪聲影響。由于水對太赫茲波存在極強(qiáng)的吸收,因此實(shí)驗(yàn)的結(jié)果很大程度受實(shí)驗(yàn)環(huán)境濕度的影響,所以實(shí)驗(yàn)過程中,用空氣壓縮機(jī)對TeraPulse 4000光譜儀腔體進(jìn)行持續(xù)吹掃,以去除空氣中水蒸氣對實(shí)驗(yàn)數(shù)據(jù)的影響[20]。
在正式測定之前,要先確保ATR晶體上未放置任何樣品并且干凈無污染,再通過ATR采集空氣得到參考信號,最后依次采集所有樣品的太赫茲衰減全反射光譜。為保證對各樣本有同樣的吸收度,采用移液槍逐一取樣(取樣量統(tǒng)一為600 μL),采集樣本期間,為防止樣本間的交叉污染,每采集完一份樣本,78%乙醇溶液反復(fù)擦拭與樣本有接觸的部位,確保不會有上一樣本的液體殘留再進(jìn)行下一樣本的采集。
1.4.1 光譜數(shù)據(jù)預(yù)處理方法
光學(xué)常數(shù)是表征物質(zhì)宏觀光學(xué)性質(zhì)的重要物理量。在從采集到的太赫茲光譜的時(shí)域波形中提取光學(xué)常數(shù)前,需要利用快速傅里葉變換將參考信號和樣本的時(shí)域光譜進(jìn)行轉(zhuǎn)換,得到對應(yīng)的頻域光譜,進(jìn)而利用頻域信號的幅值和相位(實(shí)部和虛部)信息計(jì)算得到所需的光學(xué)常數(shù)[21]。此外,在獲得信號頻域譜的過程中,為避免信號數(shù)據(jù)開頭和結(jié)尾不連續(xù)造成信號頻譜顯示的失真,必須對信號執(zhí)行一個切趾(加窗)的過程,減少時(shí)域信號截?cái)嗨鶐淼恼`差。切趾函數(shù)的種類多樣,比如Boxcar用于高分辨率,Blackman Harris用于高信噪比[22-23],本研究選擇最常用的Happ Genzel,因?yàn)樗骖櫫诵旁氡群头直媛?。太赫茲光譜分析中常用的光學(xué)常數(shù)是折射率和吸光系數(shù)。折射率是光在真空中的傳播速度與光在該介質(zhì)中的傳播速度之比,可以通過不同樣本在時(shí)域信號上的延遲反映出來;吸收系數(shù)定義為該樣本單位厚度的吸光度。折射率n(ω)和吸收系數(shù)α(ω)計(jì)算如式(1)和(2)所示:
式中:ω為角頻率;d為樣本的厚度;c為太赫茲波在空氣中的傳播系數(shù);所涉及的φ(ω)和ρ(ω)變量為樣本的頻域信號與參考頻域信號作比后的比值函數(shù)所得,φ(ω)為比值函數(shù)的相位,ρ(ω)為比值函數(shù)的幅值[24]。
為了減少光譜的數(shù)據(jù)冗余,同時(shí)降低模型的學(xué)習(xí)時(shí)間,提高建模效率,本實(shí)驗(yàn)研究即對樣品折射率光譜原始數(shù)據(jù)歸一化處理后,用主成分分析(principal component analysis,PCA)法對得到的太赫茲全光譜進(jìn)行分解,選擇其中累計(jì)貢獻(xiàn)率達(dá)到97%以上的PC,以此作為線性模型的輸入[25-26]。
異常樣本的剔除采用置信區(qū)間理論,它是一種由樣本統(tǒng)計(jì)量所構(gòu)建從而得到的總體參數(shù)估計(jì)區(qū)間,代表某一參數(shù)的真實(shí)值具有一定概率落在測量結(jié)果周圍,其給出的是被測參數(shù)測量值的可信程度。置信區(qū)間是在預(yù)先確定好的顯著性水平下計(jì)算出,顯著性水平通常稱為α,絕大多數(shù)情況會將α設(shè)為0.05,置信度為95%,實(shí)驗(yàn)中落在95%置信區(qū)間以外的樣本均視為異常樣本應(yīng)被剔除[27-28]。
1.4.2 歐氏距離匹配法
采用歐氏距離匹配(euclidean distance matching,EDM)法對氧化食用油樣本間的真實(shí)距離進(jìn)行識別和分析,該方法為一種聚類分析方法,同一類樣本間距離最小,可自動聚為一類[29]。
1.4.3 線性判別分析法
線性判別分析(linear discriminant analysis,LDA)是一種判斷個體所屬類別的統(tǒng)計(jì)方法,對待測的訓(xùn)練集樣本進(jìn)行投影,使樣本投影到一條直線上,最終相似樣本的投影點(diǎn)盡可能接近,不同樣本的投影點(diǎn)盡可能遠(yuǎn)離。分類規(guī)則建立后判別測試集樣本,將其投影到同一條直線上,并根據(jù)投影點(diǎn)的位置確定新樣品的類別。該類判別方法屬于一種分類方法,需已知用于建模和預(yù)測模型性能的待測樣本所屬類別[30-31]。
樣本儲存條件及水分含量對其過氧化值的影響如圖1所示,除光照實(shí)驗(yàn)樣本外制備過程均在恒溫恒濕實(shí)驗(yàn)箱中進(jìn)行。
圖1 樣本儲存期品質(zhì)變化規(guī)律Fig.1 Effect of storage conditoins on the quality change of oil samples
由圖1可知,食用油品質(zhì)變化受儲存溫度影響較顯著,100 ℃高溫儲存僅10 h開始過氧化值就已經(jīng)出現(xiàn)逐漸超過國家食用油質(zhì)量標(biāo)準(zhǔn)限值6.0 mmo1/kg,而室溫約30 ℃儲存第40天時(shí)3 類食用油樣本過氧化值均超限定值,冷藏儲存0 ℃則過氧化值變化緩慢,最大變化量僅增加2.36 mmo1/kg;樣本不同的水分含量對過氧化值影響呈現(xiàn)正相關(guān),其中菜籽油受水分影響最為顯著;光照也是影響食用油品質(zhì)的關(guān)鍵因素之一,30 ℃室溫儲存第25天3 類油品過氧化值均超過限定值,而避光存儲則氧化速度緩慢。
采集所獲得的不同氧化程度的食用油樣本的太赫茲時(shí)域光譜,如圖2所示。從圖2A可以看出,由于空氣中水分等檢測環(huán)境的影響,不同樣品的太赫茲信號強(qiáng)度存在細(xì)微的波動,但波形波動相似則說明檢測系統(tǒng)的穩(wěn)定性良好。圖2B為太赫茲時(shí)域光譜局部放大圖,譜圖變化差異主要體現(xiàn)新鮮油太赫茲強(qiáng)度最強(qiáng)、可食用油次之、不宜食用油最弱,分析原因:在不同氧化時(shí)期,食用油內(nèi)部所含成分種類是相同的,而由于不同氧化程度引起的樣本組分微觀化學(xué)結(jié)構(gòu)已經(jīng)發(fā)生變化。
圖2 不同氧化程度的食用油太赫茲時(shí)域譜圖Fig.2 Terahertz time-domain spectra of edible oils with different oxidation degrees
2.3.1 光學(xué)常數(shù)提取
如圖2所示,雖然光譜強(qiáng)度稍有差異,但譜圖總體趨勢相同,因此不易通過時(shí)域譜圖進(jìn)行食用油氧化性的有效研究,需進(jìn)一步對時(shí)域信號進(jìn)行提取光學(xué)常數(shù)處理。對樣本時(shí)域信號太赫茲譜圖做快速傅里葉變換后得到樣品的頻域信號,再對其根據(jù)式(1)、(2)計(jì)算出各樣品的折射率譜圖和吸收系數(shù)譜圖,如圖3所示。
圖3 新鮮樣本和不宜食用樣本光學(xué)常數(shù)圖Fig.3 Refractive index spectra (A) and absorption coefficient spectra (B) of fresh and inedible oil samples
對比圖3A和圖3B可知,不同種類的食用油在10~55 cm-1范圍內(nèi)分布在不同的折射率區(qū)間,故根據(jù)食用油的太赫茲折射率譜圖即可清晰地判別出食用油的種類,但對于食用油氧化程度的研究譜圖無明顯區(qū)分特征,需進(jìn)一步通過建立數(shù)學(xué)模型進(jìn)行判別分析;而食用油的吸收系數(shù)譜圖則無此現(xiàn)象,只有大豆油的吸收系數(shù)變化趨勢較其他兩類油差別較大,對于氧化程度的判別在譜圖上同樣沒有明顯吸收系數(shù)變化規(guī)律。
2.3.2 光譜數(shù)據(jù)降維
對太赫茲折射率譜和吸收系數(shù)譜數(shù)據(jù)分別采用PCA法進(jìn)行提取優(yōu)化,若選取PC數(shù)較少,可能會導(dǎo)致PC分量對樣本特征信息表征不足,建模準(zhǔn)確率不理想;PC選取較多,則容易引入干擾建模準(zhǔn)確率的噪聲信息,同樣對模型準(zhǔn)確率存在影響[32-33]。前7 維PCA結(jié)果如圖4所示,累計(jì)貢獻(xiàn)率分別為98.61%、97.6%均覆蓋了原始數(shù)據(jù)絕大部分的信息量。
圖4 PCA結(jié)果Fig.4 Principal component analysis plots
2.3.3 異常樣本剔除
對樣本折射率譜和吸收系數(shù)譜數(shù)據(jù)進(jìn)行PCA后,兩者前兩維PC累計(jì)可代表原始數(shù)據(jù)的94.44%、88.87%,累計(jì)貢獻(xiàn)率均在85%以上可用于表征樣本特征屬性,故利用前兩維PC數(shù)據(jù)剔除異常樣本,并嘗試對不同氧化程度類別的食用油二維PC空間分布進(jìn)行可視化,結(jié)果如圖5所示。由圖5A可知,折射率譜數(shù)據(jù)47號新鮮油樣本和30號可食用油樣本在了95%的置信區(qū)間外為異常樣本;由圖5B可知,吸收系數(shù)譜數(shù)據(jù)13號不宜食用油樣本和47號新鮮油樣本為異常樣本,以上相應(yīng)樣本應(yīng)被剔除。比較前兩維PC的置信區(qū)間氧化程度樣本類分布情況,樣本在二維平面上分布集中,無明顯分類界線,區(qū)分度較差,因此對于識別食用油氧化程度的研究還需要進(jìn)一步結(jié)合其他機(jī)器學(xué)習(xí)模型進(jìn)行分析。
圖5 二維PC置信區(qū)間分布圖Fig.5 Two-dimensional distribution of first two principal components at confidence intervals
2.4.1 折射率譜建立的判別分析模型
對太赫茲折射率譜建立7 維PC特征下的食用油氧化程度類屬性判別分析,EDM分類結(jié)果如圖6所示。采用全折射率譜數(shù)據(jù)建立的LDA分類結(jié)果如圖7所示。建模集與測試集劃分比例為2∶1,即建模集31 個樣本、預(yù)測集15 個樣本。從圖6可以看出,基于折射率數(shù)據(jù)的分析模型除了1 個新鮮油樣本和1 個可食用油樣本被錯誤的分類成不宜食用油類別外,剩余其他樣本均識別正確,準(zhǔn)確率可達(dá)95.65%。通過比較LDA模型輸出的樣本投影距離,得到建模集判別準(zhǔn)確率為91.85%、預(yù)測集為82.59%。
圖6 折射率譜的EDM聚類結(jié)果圖Fig.6 EDM clustering of refractive index spectra
圖7 折射率譜的LDA分類結(jié)果圖Fig.7 LDA classification of refractive index spectra
對比2 種判別分析方法對食用油折射率譜的建模結(jié)果,EDM法的計(jì)算結(jié)果明顯優(yōu)于LDA算法,因此歐氏EDM法更適于對食用油的折射率譜進(jìn)行分析。分析原因:對于食用油的折射率譜圖表現(xiàn)為不同種類油品的譜圖折射率值存在較大的差別、相同種類油品譜圖折射率值相似,而LDA法為有標(biāo)簽約束的分類方法,因此采用折射率譜數(shù)據(jù)對所有種類的油進(jìn)行新鮮油、可食用油和不宜食用油的分類時(shí)會受到食用油種類差別的影響,歐氏EDM的聚類方法無標(biāo)簽約束更適合分析食用油的折射率譜。
2.4.2 吸收系數(shù)譜建立的判別分析模型
基于太赫茲吸收系數(shù)譜建立的食用油不同氧化程度判別模型中,經(jīng)PCA得到的7 維PC數(shù)作為輸入與EDM法相結(jié)合的建模結(jié)果如圖8所示,LDA分類結(jié)果如圖9所示。建模集與測試集劃分比例約為2∶1,即建模集31 個樣本、預(yù)測集15 個樣本。對于EDM法的分類模型中有7 個食用油樣本識別錯誤,準(zhǔn)確率僅為84.78%,與太赫茲折射率數(shù)據(jù)的分類效果相比建模結(jié)果不理想,未能達(dá)到實(shí)際應(yīng)用要求。對于LDA分類模型中建模集判別準(zhǔn)確率為95.89%、預(yù)測集為86.11%。
圖8 吸收系數(shù)譜的EDM分類結(jié)果圖Fig.8 EDM classification of absorption coefficient spectra
圖9 吸收系數(shù)譜的LDA分類結(jié)果圖Fig.9 LDA classification of absorption coefficient spectra
分析2 種建模方法所得到的結(jié)果,LDA法更適于分析食用油吸收系數(shù)譜數(shù)據(jù),其計(jì)算結(jié)果有較高的判別準(zhǔn)確率。分析原因:食用油的吸收系數(shù)譜圖隨氧化時(shí)間的不同吸收峰位置和強(qiáng)度變化較大,而同種類型的的使用油因氧化時(shí)間不同相似性小,因此在以氧化性為判別目標(biāo)時(shí)采用有標(biāo)簽約束的LDA法有更高的可行性。
綜合食用油折射率譜和吸收系數(shù)譜的2 種模型氧化性分析結(jié)果,如表1所示。線性判別分析法識別吸收系數(shù)譜數(shù)據(jù),準(zhǔn)確率為91.00%,經(jīng)比較兩模型識別準(zhǔn)確率理想,分析效果良好。
表1 食用油氧化性識別模型分析結(jié)果Table 1Analytical results of edible oil oxidation recognition models
本實(shí)驗(yàn)探究儲存條件對食用油品質(zhì)的影響情況,其中溫度、光照和樣本水分含量對過氧化值影響較為顯著。根據(jù)國家標(biāo)準(zhǔn)將因儲存時(shí)間不同而氧化程度不同的油脂分為新鮮油、可食用油和不宜食用油3 類,首先利用太赫茲衰減全反射技術(shù),采集所有實(shí)驗(yàn)樣本的太赫茲時(shí)域光譜圖,經(jīng)數(shù)據(jù)預(yù)處理得到折射率和吸收系數(shù)光學(xué)常數(shù)數(shù)據(jù),然后采用PCA法對數(shù)據(jù)進(jìn)行降維處理,再利用置信區(qū)間剔除異常樣本,最后分別建立了EDM法模型和LDA法模型。結(jié)果表明,基于太赫茲折射率數(shù)據(jù)的定性模型,EDM法模型和LDA法模型的分類正確率分別為95.65%和87.22%,EDM法模型更適用于分析食用油品質(zhì)的太赫茲折射率譜數(shù)據(jù)。而基于太赫茲吸收系數(shù)數(shù)據(jù)的定性模型,LDA模型的分類正確率明顯高于EDM模型的分類正確率,前者為91.00%、后者為84.78%。綜上研究結(jié)果表明,太赫茲時(shí)域光譜技術(shù)作為一種快速無損、綠色環(huán)保的檢測技術(shù),利用其進(jìn)行以氧化性為評判目標(biāo)的食用油品質(zhì)評價(jià)具有一定的可行性;同時(shí)本研究的實(shí)現(xiàn)為探究使用的油的油脂含量、極性組分值等奠定理論基礎(chǔ),并為太赫茲光譜技術(shù)應(yīng)用于油品檢測更廣泛的領(lǐng)域提供分析思路;本實(shí)驗(yàn)研究得到儲藏條件對食用油氧化的影響情況,還為有關(guān)企業(yè)和消費(fèi)者日常使用提供指導(dǎo)。