唐 軍, 王 青, 童 紅, 廖 享, 張正方
新疆大學理化測試中心, 新疆大學物理科學技術學院, 新疆 烏魯木齊 830046
薰衣草精油的衰減全反射紅外光譜辨別分析
唐 軍, 王 青, 童 紅, 廖 享, 張正方
新疆大學理化測試中心, 新疆大學物理科學技術學院, 新疆 烏魯木齊 830046
為建立薰衣草精油品種品質(zhì)的快速辨別分析模型, 采用衰減全反射紅外光譜法測定三個品種共96個薰衣草精油樣品, 對原始光譜數(shù)據(jù)求二階導數(shù), 通過方差計算, 確定1 750~900 cm-1波長段為判別分析用數(shù)據(jù)。 分析結(jié)果表明, 主成分分析(PCA)基本能實現(xiàn)精油品種區(qū)分, 前三個主成分主要代表著酯、 醇和萜類物質(zhì)。 使用68個樣品的校正集建立正交偏最小二乘判別分析(OPLS-DA)模型, 三個品種薰衣草精油的回歸曲線測定系數(shù)分別為0.959 2, 0.976 4, 0.958 8, 驗證集中三個品種精油預測均方根誤差(RMSEP)分別為0.142 9, 0.127 3, 0.124 9, OPLS-DA法建立的模型對校正集和驗證集的判別率和預測率都達到100%, 模型對薰衣草精油品種品質(zhì)有很好的識別能力。 為薰衣草精油品種品質(zhì)提供一個快速、 直觀的方法。
薰衣草精油; 衰減全反射紅外光譜; 主成分分析; 正交偏最小二乘辨別分析
薰衣草精油是重要的天然香料, 在美容、 保健、 醫(yī)藥等領域有著廣泛的應用[1-3]。 新疆伊犁是我國最大的薰衣草種植基地, 也是世界三大產(chǎn)地之一, 因地理位置、 氣候條件適宜, 新疆產(chǎn)精油品質(zhì)好, 但缺乏相關質(zhì)量標準, 大部分以原料方式輸出[4]。 薰衣草精油品質(zhì)的好壞與提取精油的薰衣草品種、 生長地理環(huán)境密切相關外, 還與提取工藝、 后期精制等過程有關[5-6], 目前, 我國的研究工作對于薰衣草精油的化學組成和應用較多, 前期的基礎性研究和質(zhì)量控制研究很少, 非常不利于新疆伊利地區(qū)薰衣草產(chǎn)業(yè)的發(fā)展。 隨著市場上薰衣草精油商業(yè)價值的提升, 鑒別薰衣草精油品質(zhì)變得更加重要, 研究薰衣草精油品種品質(zhì)的快速、 簡單分析技術對于精油的質(zhì)量生產(chǎn)控制就顯得很有必要。
正交偏最小二乘判別分析法(OPLS-DA)是先對數(shù)據(jù)對象先進行正交信號校正(orthogonal signal correction), 然后再以校正后數(shù)據(jù)進行偏最小二乘判別分析, OPLS-DA應用于測量速度快捷方便的衰減全反射(ATR)紅外光譜[7-11]數(shù)據(jù)分析時, 可以將紅外原始吸光度光譜矩陣X中與待測精油類別矩陣Y不相關的部分信息濾除, 生成的結(jié)果清晰、 更易于解釋。 OPLS-DA建模方法已廣泛應用在生物活性組分的辨識、 物質(zhì)化學成分的構(gòu)成與藥理活性間的關系、 代謝組學的數(shù)據(jù)特征篩選等各種多元復雜數(shù)據(jù)分析中[12-15]。 紅外光譜能夠綜合反映出薰衣草精油中各種化學組分, 信息量全面, 但紅外譜峰數(shù)據(jù)相關性高、 冗余度大, 在此通過測定不同品種薰衣草精油的衰減全反射紅外(ATR-FTIR)光譜, 結(jié)合PLS-DA方法進行薰衣草精油不同品種品質(zhì)的判別分析, 建立以紅外光譜為化學特征的薰衣草精油品種指紋圖譜, 可為保證薰衣草精油生產(chǎn)用單方精油的來源提供可靠有效的分析技術, 為薰衣草精油的質(zhì)量控制提供理論支持和一種有效方法。
1.1 材料與儀器
在2013年6月采集三個品種(C-197(2)、 H-701和法國藍)共96個的狹葉薰衣草樣本, 采集部位為盛花期薰衣草干燥花序, 采集地點為新疆伊犁農(nóng)四師71團、 70團、 69團和65團, 各樣本經(jīng)新疆藥物研究所楊偉俊博士鑒定。 對所有采集樣本通過水蒸汽蒸餾提取薰衣草精油作為實驗用樣本, 水蒸汽蒸餾時間為4 h, 得到的精油樣品用無水硫酸鈉干燥后密封于玻璃瓶中, 在-20 ℃冷藏備用。
紅外譜圖測試儀器: VERTEX 70型紅外光譜儀(德國Bruker公司), ATR附件: 美國PIKE公司, 全反射晶體為ZnSe, 單次全反射測量方式, 入射角度為45°。 測量時在ATR附件的ZnSe晶體凹槽上覆蓋精油樣品后加密封蓋, 設定紅外掃描范圍: 4 000~600 cm-1, 譜圖掃描次數(shù)(SCANS): 32, 分辨率(RES): 4 cm-1。
1.2 數(shù)據(jù)處理
使用Bruker儀器公司OPUS6.0軟件對原始光譜數(shù)據(jù)進行基線較正, 再做9點平滑處理, 以濾除各種因素產(chǎn)生的高頻噪聲, 最后對處理過光譜數(shù)據(jù)求二階導數(shù), 將1 750~900 cm-1波長范圍內(nèi)吸光度二階導數(shù)值作為分析對象, 每2 cm-1取一數(shù)據(jù)點, 以96個樣品構(gòu)建出96×425的數(shù)據(jù)分析矩陣, 其中68個為校正集、 28個為驗證集數(shù)據(jù)。 使用校正集建立類別判別回歸模型, 根據(jù)所建立模型計算測試集的分類變量值Yp, 當Yp>0.5, 且偏差<0.5時, 判定類別相同; 當Yp<0.5, 且偏差<0.5時, 判定類別不同; 偏差≥0.5時, 判別不穩(wěn)定。 PCA分析在Matlab 7.5軟件中進行, OPLS-DA分析在Simca-P13.0軟件中完成。
2.1 紅外光譜分析
Fig.1 Mean FTIR spectra of Lavender Oil
2.2 紅外光譜特征的提取
紅外光譜是樣品中全部化學成份的整體表現(xiàn), 對于不同品種的薰衣草精油來說, 分析用紅外波長段的差異性越大, 則表明此波段產(chǎn)生吸收峰的化學成份差異性越大, 會更適合于化學計量學模式判別分析。 方差代表著變量數(shù)據(jù)的差異性大小, 以方差計算值可以看出96個精油樣品在紅外譜上差異吸收波長位置[16], 為此我們以所有精油樣本在測量波長范圍內(nèi)的每一數(shù)據(jù)采集點吸光度值做為xi變量, 求出4 000~600 cm-1波長段的方差值Σ=D(X), 繪制方差曲線圖(圖2), 橫坐標為波數(shù), 縱坐標為方差值, 不同波長下的方差越大, 說明精油紅外譜間的差異性越大, 更能體現(xiàn)出薰衣草精油間品種品質(zhì)的差別, 從圖2可以看出所有品種96個精油樣品的紅外二階導數(shù)光譜在1 750~900 cm-1范圍方差有明顯的差異, 因此將此波段二階導數(shù)光譜作為分析波長段, 并每隔2 cm-1取一分析數(shù)據(jù)點構(gòu)建出96×425的數(shù)據(jù)分析矩陣。
Fig.2 The plot of covariance
2.3 主成分分析
采用Matlab7.5軟件, 對3個品種共96個精油樣本, 以2.2中得到的數(shù)據(jù)矩陣進行PCA分析。 分析結(jié)果顯示前3個主成分的累計可信度為81.85%, 包含原變量80%以上的數(shù)據(jù)信息, 完全能表現(xiàn)出各品種薰衣草精油間的關系。 圖3為96個樣本的主成分分析圖, 從圖中可清晰地分辨出不同品種薰衣草精油樣本的分布情況, 所有樣本分成三個類別集合, 其中法國藍精油樣品聚合度較好, 與H-701和C-197(2)之間的界線明顯, H-701和C-197(2)樣本集合之間也能基本區(qū)分, 在集合邊界間有部分重疊, 說明主成分聚類完全能對法國藍精油進行識別, 而H-701和C-197(2)兩個精油類別距離較近, 集合邊界有重疊, 說明兩種精油間的化學組成比較接近, 通過主成分方法并不能完全辨識這二類精油間的差異。 由此可見, 主成分分析基本可以實現(xiàn)三種類別精油區(qū)分, 原始分析數(shù)據(jù)能夠進一步的用于有監(jiān)督的判別分析中。
2.4 主成分模型載荷分析
以衰減全反射紅外光譜法為基礎, 進一步分析不同品種薰衣草精油之間化合物的差異性, 對精油PCA分析模型進行主成分載荷因子分析, 圖4為1 750~900 cm-1分析波長段前三個主成分載荷因子圖, PC1, PC2和PC3作為PCA模型的主要因子, 其累積貢獻率為81.85%, 因此前三個主成分完全能說明不同品種薰衣草精油中化合物的差異性。 在圖1中一些低靈敏度的吸收峰在圖4中有著比較清晰的顯示。 從圖4中, 可以看出, 對PC1具有較大貢獻率的吸收峰為1 739, 1 370, 1 238, 1 020, 920 cm-1, 在精油中與這些吸收峰密切相關的化合物主要為乙酸芳樟酯、 乙酸薰衣草酯等物質(zhì)。 對PC2貢獻率較大的吸收峰為1 742, 1 382, 1 229, 1 038 cm-1, 在精油中與這些峰密切相關的化合物除了酯類特征吸收峰外, 還有含有—C—O—基團的醇類物質(zhì)。 對PC3貢率較大的吸收峰為1 676, 1 645, 1 450, 1 228, 995, 920 cm-1, 在精油中與這些峰密切相關的主要為含不飽和雙鍵的萜類物質(zhì)。 通過主成分載荷因子分析結(jié)合圖3的主成分載荷
Fig.3 The PCA analysis of lavender essential oil samples 3D and 2D diagram
Fig.4 The loading factors of PCA identification model
分布圖, 可以看出三種不同品種的薰衣草精油的差異主要體現(xiàn)在酯類、 醇類和萜類物質(zhì)上。
2.5 OPLS-DA判別分析模型
正交偏最小二乘辨別(OPLS-DA)分析法可通過對變量空間的投影旋轉(zhuǎn)找出類別判別的潛在變量。 在精油類別OPLS-DA分析過程中, 需要先按照樣本類別特征, 賦予訓練集樣本分類變量值。 按照薰衣草精油的類別品種, 設定類別監(jiān)督變量組Y(表1), 然后對訓練集樣本采用OPLS-DA方法, 以吸光度二階導數(shù)指標的自變量數(shù)據(jù)集X和類別變量Y進行回歸分析, 建立OPLS-DA辨別模型。
Table 1 Variables of different varieties of essential oil sample
建模用訓練集中含68個樣品, 訓練集中C197(2)、 法國蘭、 H701類別精油的OPLS-DA分類變量預測值與真實值的回歸曲線測定系數(shù)分別為0.959 2, 0.976 4, 0.958 8, 訓練集中三個品種精油辨別率都達到100%。 為了對OPLS-DA模型做進一步評價, 預測驗證集中的28個樣品, 模型分析及驗證結(jié)果見表2, 模型對未知樣品預測識別率為100%, 三個品種精油的預測均方根誤差(RMSEP)在0.124 9~0.142 9之間, 說明建立的模型辨別能力良好, 可以達到對薰衣草精油品種辨別分析。
Table 2 Identification efficiency of calibration
對三個品種共96個薰衣草精油樣品的紅外光譜數(shù)據(jù)求二階導數(shù), 通過計算方差選取特征性強的波數(shù)段1 750~900 cm-1做為模式識別分析的原始數(shù)據(jù), 以主成分和正交偏最小二乘法建立薰衣草精油品種鑒別模型。 結(jié)果表明, 主成分分析可清晰地分辨出不同品種薰衣草精油樣本的分布情況, 所有樣本基本分成三個類別集合。 基于此, 將96個樣品分為校正集和驗證集, 選用正交偏最小二乘法建立辨別模型, 對于不同品種模型的R2, RMSEE, RMSEP值都能達到要求, 所建立的OPLS-DA辨別模型對未知樣本的識別率為100%, 預測結(jié)果好。 由此可見, 采用ATR-FTIR測試手段, 利用OPLS-DA的計量學方法可以實現(xiàn)對薰衣草精油品種品質(zhì)的簡單、 快速鑒別, 是一種行之有效的方法。
[1] Fismer K L, Pilkington K. European Journal of Integrative Medicine, 2012, 4(4): 436.
[2] Guyot-Declerck C, Renson S, Bouseta A, et al. Food Chemistry, 2002, 79(4): 453.
[3] Hritcu L, Cioanca O, Hancianu M. Phytomedicine, 2012, 19(6): 529.
[4] WANG Zi-jian(王自健). Northern Horticulture(北方園藝), 2011, (13): 186.
[5] Danh L T, Triet N D A, Han L T N, et al. The Journal of Supercritical Fluids, 2012, 70(10): 27.
[6] WANG Yu-qin, SUN Ya-jun, SHI Xian-er(王玉芹, 孫亞軍, 施獻兒). World Phytomedicines(國外醫(yī)藥植物藥分冊), 2004, 19(1): 5.
[7] CHU Xiao-li(褚小立). Chemometrics Method and Molecular Spectrum Analysis Techniques(化學計量學方法與分子光譜分析技術). BeiJing: Chemical Industry Press(北京: 化學工業(yè)出版社), 2011. 14.
[8] MENG Qing-hua, XIANG Yang(孟慶華, 向 陽). Optics and Precision Engineering(光學精密工程), 2007, 15(10): 1515.
[9] LI Xiao-li, HU Xing-yue, HE Yong(李曉麗, 胡興越, 何 勇). Journal of Infrared and Millimeter Waves(紅外與毫米波學報), 2006, 25(6):417.
[10] Li Y Q, Kong D X, Wu H. Industrial Crops and Products, 2013, (41): 269.
[11] Saji K, Hubert J. Food Chemistry, 2012, 135(1): 213.
[12] ZHANG Hai, ZHAO Jie-wen, LIU Mu-hua(張 海, 趙杰文, 劉木華). Food Science(食品科學), 2005, 26(6): 189.
[13] Ni Wangdong, Steven D. Brown, Anal. Chem., 2009, 81(21): 8962.
[14] Roberto Consonni, Laura Ruth Cagliani, Clelia Cogliati. Journal of Agricultural and Food Chemistry, 2012, 60(18): 4526.
[15] Kishore Kumar Pasikanti, Kesavan Esuvaranathan, Paul C. Ho. Journal of Agricultural and Food Chemistry, 2013, 61(11): 2597.
[16] TANG Jun, WANG Qing, WANG Qiang(唐 軍, 王 青, 王 強). Chinese Traditional and Herbal Drugs(中草藥), 2011, 42(6): 1213.
Discriminant Analysis of Lavender Essential Oil by Attenuated Total Reflectance Infrared Spectroscopy
TANG Jun, WANG Qing, TONG Hong, LIAO Xiang, ZHANG Zheng-fang
Physics and Chemistry Testing Center, College of Physics Science and Technology, Xinjiang University, Urumqi 830046, China
This work aimed to use attenuated total reflectance Fourier transform infrared spectroscopy to identify the lavender essential oil by establishing a Lavender variety and quality analysis model. So, 96 samples were tested. For all samples, the raw spectra were pretreated as second derivative, and to determine the 1 750~900 cm-1wavelengths for pattern recognition analysis on the basis of the variance calculation. The results showed that principal component analysis (PCA) can basically discriminate lavender oil cultivar and the first three principal components mainly represent the ester, alcohol and terpenoid substances. When the orthogonal partial least-squares discriminant analysis (OPLS-DA) model was established, the 68 samples were used for the calibration set. Determination coefficients of OPLS-DA regression curve were 0.959 2, 0.976 4, and 0.958 8 respectively for three varieties of lavender essential oil. Three varieties of essential oil's the root mean square error of prediction (RMSEP) in validation set were 0.142 9, 0.127 3, and 0.124 9, respectively. The discriminant rate of calibration set and the prediction rate of validation set had reached 100%. The model has the very good recognition capability to detect the variety and quality of lavender essential oil. The result indicated that a model which provides a quick, intuitive and feasible method had been built to discriminate lavender oils.
Lavender essential oil; ATR-FTIR; PCA; OPLS-DA
Sep. 13, 2013; accepted Mar. 11, 2014)
2013-09-13,
2014-03-11
國家自然科學基金項目(21265021)資助
唐 軍, 1971年生, 新疆大學理化測試中心, 新疆大學物理科學技術學院高級工程師 e-mail: tangjunwq@163.com
O657.3
A
10.3964/j.issn.1000-0593(2016)03-0716-04