張 華,王晨輝,李 煒,劉 琪,張 媛,秦艷華,朱懷遠,廖惠云
江蘇中煙工業(yè)有限責任公司,南京市建鄴區(qū)興隆大街29號 210019
煙草提取物(含浸膏、凈油和酊劑等)是煙用香精香料的主要原料之一,其中,云南和津巴布韋煙草提取物是卷煙調(diào)香中常用的兩類香原料[1-2]。云南煙草提取物具有沁人心脾、令人愉悅的清甜香,津巴布韋煙草提取物具有甜潤、醇和的自然香韻,在卷煙配方中均具有調(diào)香、調(diào)味和提質(zhì)的功能[3-4]。云南與津巴布韋煙草提取物香氣成分組成較為相似,但相關差異性研究基本處于空白狀態(tài)[5-6]。目前對煙草提取物的研究更多是從香韻角度進行感官評價[7],易受經(jīng)驗、主觀判斷所制約,缺乏客觀量化依據(jù),難以對不同產(chǎn)地煙草提取物信息進行深入研判[8-9]。鑒于云南、津巴布韋及其他產(chǎn)地煙草提取物在卷煙用功能性香基模塊中應用廣泛,需要對其產(chǎn)地、組分及感官功效等進行針對性研究,以便于卷煙企業(yè)開展自主調(diào)香工作[10]。
煙草提取物來源廣泛、成分較為復雜,除了含有易揮發(fā)香味組分外,也含有植物蠟、色素和糖類等難揮發(fā)組分[11-12]。在樣品分析前處理過程中,相較于傳統(tǒng)液液萃取,固相支持液液萃取(Solid-phase supported liquid-liquid extraction,SLE)是一種新型前處理方法。SLE 采用經(jīng)過處理的硅藻土為吸附劑,具有吸水性強、性質(zhì)穩(wěn)定及不存在乳化現(xiàn)象的特點,能夠提高分析結果的重現(xiàn)性及降低前處理過程的損失,已成功應用于醫(yī)藥、食品和環(huán)境等領域的樣品前處理[13-15]。與此同時,近年來非靶向代謝組學手段在食品領域的產(chǎn)地溯源[16-17]、品質(zhì)鑒別[18-19]和摻假鑒別[20-22]等方面應用廣泛,具有明顯技術優(yōu)勢,這為利用物質(zhì)的組分對煙草提取物產(chǎn)地鑒別研究提供了參考[23-24]。為此,本研究中使用SLE-GC-MS 方法,結合非靶向代謝組學分析中常用的化學計量學方法,對云南、津巴布韋及其他產(chǎn)地煙草提取物樣品中揮發(fā)性和半揮發(fā)性組分進行檢測分析,篩選出可用于識別樣品來源的有效指標,構建預測模型實現(xiàn)對未知煙草提取物的產(chǎn)地溯源,旨在為增強天然香原料屬性認知和提升自主調(diào)香核心技術掌控提供技術支撐。
83個國內(nèi)外不同產(chǎn)地煙葉制備的煙草提取物樣品(由鄭州煙草研究院提供,其中,云南煙草提取物12個,津巴布韋煙草提取物22個和其他煙草提取物30個,分別簡稱YN、JBBW和QT,且QT樣品主要包括河南、湖南、巴西和弗吉尼亞等國內(nèi)外煙草提取物),以及用于模型預測的19個不同產(chǎn)地煙草提取物,樣品常溫密封保存。
乙醇(AR 級,國藥集團化學試劑有限公司);二氯甲烷(HPLC 級,美國Tedia 公司);正十七碳烷(標準品,≥99%,比利時Acros 公司);正構烷烴C7~C40(1 000 mg/L的正己烷溶液,上海安譜實驗科技股份有限公司);實驗用水為GB/T 6682—2008 規(guī)定的一級水(電阻率>18.2 MΩ·cm);ProElutLLE 液液萃取柱[5 g/(10 mL),北京迪科馬科技有限公司];離心管(5 mL,PP材質(zhì),美國Corning公司)。
8890-5977B 氣相色譜-質(zhì)譜聯(lián)用儀(美國Agilent 公司);Milli-Q Reference 超純水系統(tǒng)(美國Millipore公司);ME204電子天平(感量0.000 1 g,美國Mettler Toledo 公司);EOFO-945617 數(shù)顯型多管渦旋混合器(美國Talboys公司)。
1.2.1 樣品前處理
1.2.1.1 溶劑萃取
稱取0.2 g煙草提取物樣品于5 mL離心管中,再準確移入50 μL濃度為1 000 μg/mL的正十七碳烷乙醇溶液;然后分別加入1.0 mL純水和1.0 mL乙醇,使用渦旋混勻器于1 500 r/min 條件下分散20 min,得樣品萃取液。
1.2.1.2 固相支持液液萃取
先對ProElut LLE+硅藻土固相萃取柱進行活化,即用10 mL 甲醇去雜質(zhì),排干液體;然后將樣品萃取液全部轉(zhuǎn)入已活化過的固相萃取柱,同時用濃縮瓶接收洗脫液,待上樣溶液全部流入小柱上篩板后,靜置平衡約5 min;隨即用30 mL二氯甲烷分3次對固相萃取柱進行淋洗,并收集所有淋洗液;最后在50 ℃、常壓條件下,將淋洗液濃縮至1 mL左右,再將其轉(zhuǎn)移至2 mL色譜瓶中進行GC-MS分析。分析條件:
色譜柱:HP-5MS 毛細管柱(30 m×250 μm×0.25 μm);載氣:高純氦氣(≥99.999%);進樣口溫度:250 ℃;柱流量:1 mL/min(恒流模式);進樣量:1 μL;分流比:5∶1;程序升溫:電離方式:EI;離子源溫度:230 ℃;電子能量:70 eV;四極桿溫度:150 ℃;掃描模式:全掃描;質(zhì)量掃描范圍:35~550 amu;溶劑延遲:5 min。
1.2.2 定性定量方法
采用組分在質(zhì)譜庫NIST17和FLAVOR2中匹配度≥85%的方法進行定性分析,同時參照文獻[25]的方法計算保留指數(shù)(Retention index,RI),并與文獻資料相關化合物保留指數(shù)進行比對(通過webbook.nist.gov、www.flavornet.org 以及標準譜庫等進行查找),將絕對值相差20以內(nèi)的確定為同一化合物。
采用內(nèi)標法定量,通過內(nèi)標物的峰面積和樣品溶液中各組分的峰面積比值,按公式(1)計算各個組分的相對質(zhì)量濃度:
式中:Ci為待測組分的質(zhì)量濃度,μg/mL;Ai和As為待測組分i 和內(nèi)標化合物的色譜峰面積;V為待測樣品溶液的體積,mL;Ws為加入內(nèi)標化合物的質(zhì)量,μg。本實驗中假定各待測組分i的相對校正因子均為1。
1.2.3 數(shù)據(jù)處理
利用Agilent MassHunter Unknowns Analysis B10.1 軟件解卷積處理質(zhì)譜原始數(shù)據(jù),導出轉(zhuǎn)換為cef 格式文件,再導入到Agilent MassHunter Mass Profiler(MPP)15.1軟件中進行峰識別、峰對齊、過濾(在所有樣品中出現(xiàn)50%以上)等前處理,獲得質(zhì)量高的樣品目標組分數(shù)據(jù)矩陣;利用SIMCA-P 14.1軟件對數(shù)據(jù)矩陣進行中心化和歸一化處理后進行主成分分析(Principal components analysis,PCA)、正交偏最小二乘法判別分析(Orthogonal partial least-squares discrimination analysis,OPLS-DA)和變量重要性投影(Variable importance in the projection,VIP)值分析,并利用SPSS 26.0 軟件進行方差分析,篩選出組間存在顯著性差異的化合物;采用metaboanalyst(http://www.metaboanalyst.ca)在線方式繪制聚類熱圖。
煙草提取物大多呈半流體狀態(tài)且非常黏稠,加香時常采用混合溶劑使樣品基質(zhì)分散,萃取液中含有部分水分,直接進行GC-MS分析會嚴重影響微量香味成分的定量分析。因此,必須進行溶劑轉(zhuǎn)換,即采用含硅藻土的固相萃取柱進行萃取,使用二氯甲烷洗脫出目標組分,而水、色素大分子以及雜質(zhì)顆粒等被保留在SPE柱填料中??紤]到樣品處理過程較為復雜,對樣品分析過程的穩(wěn)定性和數(shù)據(jù)的可靠性進行監(jiān)測,評估分析方法的重復性和穩(wěn)定性。為此,分別以典型云南煙草提取物和津巴布韋煙草提取物為對象,按照上述樣品前處理方法分別隔日進行3次處理,樣品的GC-MS 總離子流色譜圖如圖1所示,計算共有色譜峰相對于內(nèi)標色譜峰質(zhì)量分數(shù)比值的相對標準偏差(RSD),考察分析方法的重復性。依據(jù)匹配度≥85%的原則,云南煙草提取物中共鑒定出151個共有色譜峰,其中,有132個組分質(zhì)量分數(shù)的RSD 介于0.17%~9.26%之間,其余19個組分介于10.52%~18.21%之間;津巴布韋煙草提取物中共鑒定出162個共有色譜峰,其中,有135個組分質(zhì)量分數(shù)的RSD 介于0.24%~9.65%之間,其余17個組分介于11.93%~19.01%之間。以上結果表明,所有組分的RSD 均小于20%,對于微量目標組分的量化分析而言,該方法具有較好的穩(wěn)定性和重復性,所采集的數(shù)據(jù)可用于進一步研究和分析。本研究中通過多元數(shù)據(jù)分析造成的數(shù)據(jù)誤差是由樣品本身差異造成的,而非系統(tǒng)或分析造成的。
圖1 典型云南(a)和津巴布韋(b)煙草提取物的GC-MS總離子流色譜圖Fig.1 GC-MS total ion chromatograms of typical tobacco extracts from Yunnan(a)and Zimbabwe(b)
對3組煙草提取物中揮發(fā)性、半揮發(fā)化合物進行定性分析的結果見表1??芍?組煙草提取物樣品中共鑒定出125個揮發(fā)性、半揮發(fā)性成分,其中除煙堿外,還包括醇類化合物19個、酯類26個、醛類4個、酮類22個、酸類7個、烷烴類19個、烯烴類3個、酚類5個、胺類8個、醚類2個和其他類化合物9個。從化合物官能團分類看,①YN樣品中分離鑒定出的煙堿(64.34%,質(zhì)量分數(shù),下同)、酯類(9.36%)和胺類(9.09%)化合物質(zhì)量分數(shù)較高,三者在YN 樣品中所占比例約為82.79%;酮類(4.74%)、酸類(4.27%)、醇類(3.63%)、烯烴類(1.64%)、其他類(1.18%)和烷烴類(1.04%)等相對較低;酚類(0.37%)和醚類(0.05%)基本上可忽略不計。其中,除質(zhì)量分數(shù)最高的煙堿外,芥酸酰胺(7.21%)、棕櫚酸(3.77%)、東莨菪內(nèi)酯(3.31%)、丙烯酸十二酯(2.59%)、新植二烯(1.57%)和9-羥基-4,7-巨豆二烯-3-酮(1.31%)的相對質(zhì)量分數(shù)均在1%以上。②JBBW樣品中分離鑒定出的煙堿(49.99%)、醇類(16.17%)和酯類(13.18%)化合物的質(zhì)量分數(shù)較高,三者在JBBW 樣品中共約占79.34%;胺類化合物的質(zhì)量分數(shù)也相對較高,達8.87%;其余則是酮類(3.04%)、醛類(2.03%)、酸類(1.99%)、其他類(1.47%)、烯烴類(1.19%)和烷烴類(1.10%)化合物;酚類(0.85%)和醚類(0.07%)的質(zhì)量分數(shù)較低。其中,除質(zhì)量分數(shù)最高的煙堿和溶劑丙二醇(7.96%)外,芥酸酰胺(7.40%)、乳酸乙酯(5.11%)、O-(4-丁基苯甲酰基)-O'-(異丁氧羰基)-1,2-苯二醇(3.61%)、5-羥甲基糠醛(1.99%)、乳酸甲酯(1.88%)、丙烯酸十二烷基酯(1.78%)、棕櫚酸(1.65%)、東莨菪內(nèi)酯(1.51%)、肼基甲酸乙酯(1.31%)、新植二烯(1.15%)和一縮二丙二醇(1.12%)的相對質(zhì)量分數(shù)較高。③QT樣品中煙堿(59.36%)、酯類(12.48%)和胺類(8.07%)化合物的質(zhì)量分數(shù)較高,三者共占約83.62%;醇類(6.83%)化合物的質(zhì)量分數(shù)也相對較高;其余為酮類(4.04%)、酸類(2.36%)、烯烴類(1.73%)、酚類(1.66%)和其他類(1.53%)化合物,醛類(0.90%)、烷烴類(0.89%)和醚類(0.15%)化合物的質(zhì)量分數(shù)極低。其中,除質(zhì)量分數(shù)最高的煙堿外,芥酸酰胺(7.12%)、棕櫚酸乙酯(4.08%)、東莨菪內(nèi)酯(2.93%)、棕櫚酸(1.75%)、丙烯酸十二烷基酯(1.74%)、豆甾醇(1.73%)、新植二烯(1.68%)和α-生育酚(1.38%)的相對質(zhì)量分數(shù)均在1%以上。由以上結果可見,3 組煙草提取物中所鑒定出的揮發(fā)性、半揮發(fā)性化合物的種類和相對質(zhì)量分數(shù)差異明顯,有利于后續(xù)探尋不同組煙草提取物產(chǎn)地鑒別。
表1 不同煙草提取物樣品揮發(fā)性和半揮發(fā)性成分測定結果Tab.1 Results of volatile and semi-volatile components in different tobacco extract samples
表1(續(xù))
表1(續(xù))
表1(續(xù))
2.3.1 主成分和聚類熱圖分析
在對不同煙草提取物揮發(fā)性、半揮發(fā)性成分的相對質(zhì)量分數(shù)總體分析的基礎上,采用無監(jiān)督的PCA 進行分析,結果如圖2所示。根據(jù)PCA 結果,2個PC 成分貢獻率僅占方差的30.4%(其中,PC1 為16.9%,PC2為13.5%),不能反映出樣品的總體特征,而模型的Q2也僅為0.204,遠小于0.5,說明模型并不可靠。3 組煙草提取物樣品大部分均在95%置信橢圓內(nèi),分布較為無序,部分組樣品之間更是交叉在一起,個別樣品還位于95%置信橢圓外,無法反映不同組樣品之間的差異。
圖2 不同煙草提取物的主成分得分圖Fig.2 PCA score plot of different tobacco extracts
熱圖具有能夠直觀展示重大研究對象的表達數(shù)據(jù)量差異變化情況的優(yōu)勢,可縮小主觀判斷的誤差[9]。因此,為分析不同組煙草提取物樣品之間的差異,采用metaboanalyst 在線方式對3 組煙草提取物進行聚類熱圖分析,結果如圖3所示。在熱圖中,每一行代表了一種揮發(fā)性物質(zhì),顏色由藍變紅代表質(zhì)量分數(shù)由低到高,反映出各揮發(fā)性成分在不同煙草提取物中質(zhì)量分數(shù)的差異??芍?,3組煙草提取物樣品分布較為紊亂,部分YN和部分JBBW組內(nèi)樣品分別各自聚集在一起,樣品相互交叉聚合,且與QT 組樣品間隔聚合,說明不同產(chǎn)地煙草提取物揮發(fā)性和半揮發(fā)性成分種類及質(zhì)量分數(shù)變化較為復雜,不具有明顯的組間聚集規(guī)律,這與主成分分析的結果相對應。因此,有必要進一步對不同煙草提取物中揮發(fā)性、半揮發(fā)性組分進行OPLS-DA篩選研究。
圖3 不同煙草提取物的聚類熱圖Fig.3 Cluster heat map of different tobacco extracts
2.3.2 OPLS-DA分析和產(chǎn)地預測
進一步采用OPLS-DA對YN、JBBW和QT樣品進行分析,以考察YN、JBBW和QT樣品之間的差異特征揮發(fā)性成分。OPLS-DA 是一種基于正交偏最小二乘回歸算法的有監(jiān)督模型,能夠?qū)?shù)據(jù)降維并將無關的信號過濾去除,達到準確區(qū)分組間差異的目的,實現(xiàn)復雜數(shù)據(jù)的可視化、判別分析和預測[27]。由模型得分情況(圖4a)可知,基本上所有樣本均在95%置信區(qū)間內(nèi),極個別樣品處于置信區(qū)間附近,JBBW 樣品主要分布在左側(cè)象限,QT 和YN 樣品分別位于右側(cè)象限上下兩端,顯示不同組樣品能夠得到有效區(qū)分。使用有監(jiān)督的OPLS-DA 時容易產(chǎn)生過擬合現(xiàn)象,因此,又采用200次響應的置換檢驗驗證分析模型是否有過擬合現(xiàn)象。如圖4b所示,置換檢驗得到的R2=0.837,Q2=-0.778,Q2于Y 軸的截距是負值,說明此模型沒有過擬合現(xiàn)象,模型預測能力好,可用于后續(xù)的不同樣品組間差異特征揮發(fā)性成分篩選。
OPLS-DA 因子載荷圖可直觀地反映出每一個變量在得分圖上的貢獻[18]。對不同煙草提取物中主要揮發(fā)性和半揮發(fā)性成分進行分析,結果如圖4c 所示。區(qū)別于JBBW 和QT 樣品,A4(絲氨醇)、B4(γ-丁內(nèi)酯)、D1(4-環(huán)戊烯-1,3-二酮)、D7(2,2,5-三甲基-3,4-己二酮)、D9(2,5-二甲基-3-己酮)、H2(菜籽多酚)、F13(1-碘十二烷)、G1(4-乙酰氧基-3-甲氧基苯乙烯)、K7(2-芐基硫基-4-甲氧基苯甲腈)等成分是凸顯YN樣品特征的物質(zhì)組分;區(qū)別于YN和QT樣品,B1(乳酸乙酯)、F19(3-甲基三十一烷)、A7[2-(2-羥基丙氧基)-1-丙醇]、A8(一縮二丙二醇)、B13(5-羥基戊酸2,4-二叔丁基苯酯)等成分是凸顯JBBW樣品特征的組分,以酯類和醇類較為突出;區(qū)別于YN 和JBBW 樣品,H5(α-生育酚)、K1(2-羥基-5-甲基吡啶)、B3(1-羥基-2-丙基乙酸酯)、E2(乙酰丙酸)、D19(6,7-二甲氧基-1,4-二氫-2,3-喹喔啉二酮)、D6[5-(羥甲基)二氫呋喃-2(3H)-酮]和D2(2-吡咯烷酮)等成分是QT組煙草提取物的特征組分。
圖4 不同煙草提取物的OPLS-DA圖Fig.4 OPLS-DA plots of different tobacco extracts
OPLS-DA 模型不僅能夠驗證3 組煙草提取物的分類結果,并且能夠預測未知煙草提取物的類別。本研究中OPLS-DA 模型由每個實際煙草提取物構建,3 組樣品具有良好的分類。在預測之前,先對該模型進行訓練,判斷模型的準確度,結果如表2所示,準確度均為100%,識別率高達100%。說明該模型準確度較高,可用于下一步的樣本預測[20,26]。為了證明該模型的預測能力,除了用于尋找特征差異物和建立分類模型的64個煙草提取物樣品外,又使用19個不同產(chǎn)地的煙草提取物,導入OPLS-DA 模型進行預測,所有不同組預測樣本均沒有出現(xiàn)分類錯誤,模型預測結果與實際樣本產(chǎn)地結果均一致,準確度為100%。進一步表明構建的OPLS-DA模型具有良好的預測能力,能夠?qū)υ颇?、津巴布韋和其他產(chǎn)地煙草提取物進行正確分類,可用于煙草提取物的產(chǎn)地溯源。
表2 OPLS-DA模型預測煙草提取物的分類結果Tab.2 Classification results of tobacco extracts predicted by OPLS-DA model
2.3.3 不同組煙草提取物特征成分比較
變量投影重要性(VIP)可用于篩選對不同煙草提取物有重要影響的關鍵標記物。如圖5所示,51個VIP 值大于1 的揮發(fā)性和半揮發(fā)性化合物在判別中具有重要作用。對VIP 大于1 的變量進行單因素方差分析共篩選出16個特征揮發(fā)性成分,以P<0.01表示極顯著差異的成分,P<0.05 表示顯著差異的成分,其中,在YN、JBBW 和QT 樣品中的相對質(zhì)量分數(shù)差異結果見表3。對比YN和JBBW兩組煙草提取物,A4(絲氨醇)、A8(一縮二丙二醇)、B1(乳酸乙酯)、B4(γ-丁內(nèi)酯)和D1(4-環(huán)戊烯-1,3-二酮)5個成分具有極顯著差異,其中一縮二丙二醇為丙二醇的縮合物,非煙草本身含有的組分;對比YN 和QT樣品,A4(絲氨醇)和B2(2-羥基丙基乙酸酯)具有極顯著性差異;對比JBBW和QT樣品,B1(乳酸乙酯)、F19(3-甲基三十一烷)和K1(2-羥基-5-甲基吡啶)3個成分具有極顯著性差異。結合表3中均值排序,絲氨醇、γ-丁內(nèi)酯和4-環(huán)戊烯-1,3-二酮的P值均小于0.01,且對YN 樣品具有較好的辨別能力,可作為鑒別YN樣品的特征性組分;2-(2-羥基丙氧基)-1-丙醇、乳酸乙酯、間苯二甲酸二(4-辛基)酯和3-甲基三十一烷均對JBBW 樣品具有相對較好的辨別能力,其中乳酸乙酯具有極顯著差異,可作為鑒別JBBW樣品的特征性組分;2-羥基丙基乙酸酯和1-羥基-2-丙基乙酸酯在QT 樣品中質(zhì)量分數(shù)均值高,相比于YN 和JBBW 樣品均具有顯著差異,可作為QT樣品的特征性組分。
圖5 不同煙草提取物樣品特征揮發(fā)性和半揮發(fā)性成分的VIP圖Fig.5 VIP analysis of characteristic volatile and semi-volatile components in different tobacco extract samples
表3 不同煙草提取物樣品特征揮發(fā)性和半揮發(fā)性成分差異比較Tab.3 Comparison of characteristic volatile and semi-volatile components among different tobacco extract samples
①通過固相支持液液萃取-GC-MS 方法,結合化學計量學手段,確定了云南、津巴布韋和其他煙草提取物中共125個揮發(fā)性和半揮發(fā)性成分,其中煙堿的質(zhì)量分數(shù)最高;②PCA和聚類熱圖分析表明,不同組樣品分類不明顯,而OPLS-DA對不同組煙草提取物區(qū)分效果較好,模型訓練和預測的準確度均為100%;③篩選出16個特征揮發(fā)性物質(zhì),其中,云南、津巴布韋和其他產(chǎn)地煙草提取物中分別篩選出3個、1個和2個可有效表征煙草提取物產(chǎn)地的特征組分。相比于常規(guī)采用的感官評價方法,本方法具客觀、準確度高的特點,可為煙草提取物的質(zhì)量鑒別與產(chǎn)地溯源提供方法參考。