蘭作平,廖立敏,劉 宇,余 瑜*
1重慶醫(yī)科大學(xué)藥學(xué)院,重慶400016; 2重慶醫(yī)藥高等專(zhuān)科學(xué)校,重慶400030;3內(nèi)江師范學(xué)院資源與環(huán)境科學(xué)學(xué)院,內(nèi)江641112
全緣葉綠絨蒿揮發(fā)性組分定量結(jié)構(gòu)-色譜保留關(guān)系研究
蘭作平1,2,廖立敏3,劉 宇1,余 瑜1*
1重慶醫(yī)科大學(xué)藥學(xué)院,重慶400016;2重慶醫(yī)藥高等專(zhuān)科學(xué)校,重慶400030;3內(nèi)江師范學(xué)院資源與環(huán)境科學(xué)學(xué)院,內(nèi)江641112
提出頂點(diǎn)及頂點(diǎn)相互作用矢量的概念,并將該矢量用于復(fù)雜樣本的分子結(jié)構(gòu)表征。采用逐步回歸結(jié)合統(tǒng)計(jì)檢測(cè)對(duì)變量進(jìn)行篩選后,再用多元線性回歸建立了定量結(jié)構(gòu)-色譜保留(QSRR)關(guān)系的7變量模型,模型的建模計(jì)算值復(fù)相關(guān)系數(shù)(R)為0.990,標(biāo)準(zhǔn)偏差(SD)為1.325;留一法(LOO)交互檢驗(yàn)復(fù)相關(guān)系數(shù)(RCV)為0.983,標(biāo)準(zhǔn)偏差(SDCV)為1.696。結(jié)果表明該矢量具有較強(qiáng)的分子結(jié)構(gòu)表達(dá)能力,模型具有良好的估計(jì)能力與穩(wěn)定性。
全緣葉綠絨蒿;揮發(fā)性有機(jī)物;結(jié)構(gòu)描述子;定量結(jié)構(gòu)色譜保留相關(guān)
分子結(jié)構(gòu)與色譜保留之間的定量關(guān)系的構(gòu)建,需要引入相應(yīng)的結(jié)構(gòu)描述子。長(zhǎng)期以來(lái),研究者們?cè)谶@方面已經(jīng)做了許多有意義的工作。例如利用分子的幾何結(jié)構(gòu)、拓?fù)湫再|(zhì)及連接特征和各種物化參數(shù)等進(jìn)行結(jié)構(gòu)描述,然后建立QSRR模型來(lái)預(yù)測(cè)化合物的色譜保留值[1,2]。全緣葉綠絨蒿(Meconopsis integrifolia Franch.)又稱(chēng)綠絨蒿,系罌粟科綠絨蒿屬一年生草本植物,分布于甘肅、青海、西藏等省區(qū)。全緣葉綠絨蒿可以應(yīng)用于食品及藥品,具有清熱止咳的功效,藏醫(yī)用其花治療肝熱病和肺熱病。最近官艷麗等[3]采用水蒸氣蒸餾法提取出了全緣葉綠絨蒿花精油,用GC-MS法分離并分析鑒定其成分,最后鑒定出55個(gè)揮發(fā)性化學(xué)成分(表1)。這些化合物包括烷烴、環(huán)烷烴、烯烴、芳烴、醇、酯等,并且還含有N、O、S等雜原子,因此分子的元素組成復(fù)雜及結(jié)構(gòu)跨度大,我們稱(chēng)之為復(fù)雜樣本。本文根據(jù)有機(jī)化合物分子的隱氫圖,提出頂點(diǎn)及頂點(diǎn)相互作用矢量的概念,為驗(yàn)證該矢量在分子結(jié)構(gòu)表征上的普適性,采用由此55種物質(zhì)組成的復(fù)雜樣本進(jìn)行建模研究。借助逐步回歸、多元線性回歸和留一法交互檢驗(yàn)建立了7變量的分子結(jié)構(gòu)與氣相色譜保留值之間的相關(guān)模型(QSRR),取得較好的結(jié)果,可望為天然藥物及精細(xì)化工產(chǎn)品的色譜行為提供有益參考。
表1 55個(gè)化合物及其保留時(shí)間Table 1 Fifty-five components and their retention times
3 9 E i c o s a n e C 20 H 42 2 4.2 3 2 3.8 0 1 -0.4 2 9 2 3.7 7 8 -0.4 5 2 4 0 M e t h y l l i n o l e a t e C 19 H 34 O 2 2 6.3 6 2 7.1 2 0 0.7 6 0 2 7.1 5 5 0.7 9 5 4 1 M e t h y l l i n o l e n a t e C 19 H 32 O 2 2 6.4 4 2 7.6 3 6 1.1 9 6 2 7.6 9 3 1.2 5 3 4 2 M e t h y l s t e a r a t e C 19 H 38 O 2 2 6.8 9 2 5.9 9 8 -0.8 9 2 2 5.9 6 3 -0.9 2 7 4 3 L i n o l e i c a c i d C 18 H 32 O 2 2 7.4 0 2 8.0 3 8 0.6 3 8 2 8.0 8 8 0.6 8 8 4 4 L i n o l e n i c a c i d C 18 H 30 O 2 2 7.6 0 2 8.5 5 3 0.9 5 3 2 8.6 3 0 1.0 3 0 4 5 E t h y l l i n o l e a t e C 20 H 36 O 2 2 7.7 3 2 9.1 5 3 1.4 2 3 2 9.2 3 8 1.5 0 8 4 6 E h t y l l i n o l e n a t e C 20 H 34 O 2 2 7.9 1 2 9.6 6 8 1.7 5 8 2 9.7 8 0 1.8 7 0 4 7 S t e a r i c a c i d C 18 H 36 O 2 2 8.1 0 2 6.9 1 8 -1.1 8 2 2 6.8 2 8 -1.2 7 2 4 8 D o c o s a n e C 22 H 46 2 8.6 2 2 7.5 6 8 -1.0 5 2 2 7.5 0 2 -1.1 1 8 4 9 1 -D o c o s e n e C 22 H 44 2 8.8 9 2 7.5 6 8 -1.3 2 2 2 7.4 8 5 -1.4 0 5 5 0 T r i c o s a n e C 23 H 48 3 0.6 4 2 9.4 5 7 -1.1 8 3 2 9.3 7 0 -1.2 7 0 5 1 3 -M e t h y t r i c o s a n e C 24 H 50 3 1.6 3 2 9.2 4 5 -2.3 8 5 2 9.0 8 7 -2.5 4 3 5 2 T e t r a c o s a n e C 24 H 50 3 2.0 0 3 1.3 4 8 -0.6 5 2 3 1.2 9 1 -0.7 0 9 5 3 P e n t a c o s a n e C 25 H 52 3 3.2 5 3 3.2 4 2 -0.0 0 8 3 3.2 4 1 -0.0 0 9 5 4 H e p t a c o s a n e C 27 H 56 3 5.2 0 3 7.0 3 5 1.8 3 5 3 7.3 1 3 2.1 1 3 5 5 O c t a c o s a n e C 28 H 58 3 8.6 0 3 8.9 3 5 0.3 3 5 3 8.9 9 6 0.3 9 6
在有機(jī)化合物分子的隱氫圖中,每一個(gè)非氫原子即為分子頂點(diǎn)。我們認(rèn)為整個(gè)有機(jī)物分子的性質(zhì)與分子頂點(diǎn)本身及頂點(diǎn)之間的相互作用存在密切關(guān)系,而分子中的非骨架氫原子對(duì)整個(gè)分子性質(zhì)的影響可以忽略不計(jì)。并且不同類(lèi)型的分子頂點(diǎn)及頂點(diǎn)之間的相互作用對(duì)分子性質(zhì)的貢獻(xiàn)不同,同類(lèi)型的分子頂點(diǎn)及頂點(diǎn)之間的相互作用對(duì)分子性質(zhì)的貢獻(xiàn)具有加和性。因此我們首先需將分子內(nèi)的非氫原子進(jìn)行分類(lèi),分子內(nèi)的非氫原子依據(jù)其所連接的其它非氫原子數(shù)分為A1、A2、A3、A4四類(lèi),分別表示與1、2、3、4個(gè)其它非氫原子相連,如與兩個(gè)非氫原子相連的仲碳原子屬于A2原子類(lèi)型。
對(duì)于分子頂點(diǎn)本身對(duì)分子性質(zhì)的貢獻(xiàn)。本文引入了Hall和Kier[4]所提出的原子固有狀態(tài)(I),并對(duì)文獻(xiàn)的計(jì)算方法進(jìn)行了一定的修正,得到了所謂的分子頂點(diǎn)矢量,用于表征分子頂點(diǎn)自身的狀態(tài)對(duì)分子性質(zhì)的影響。其計(jì)算式如下:
上式中,xi表示分子中頂點(diǎn)原子類(lèi)型為i的所有頂點(diǎn)原子的貢獻(xiàn)值,νi是頂點(diǎn)原子類(lèi)型為i的原子價(jià)電層的電子數(shù);ni為該原子價(jià)電層所屬的主量子數(shù)是該原子參與成σ和π鍵的總電子數(shù)為成σ鍵的電子數(shù)。如單個(gè)CSP、、在分子中的頂點(diǎn)貢獻(xiàn)值分別是2.5000、1.6667、1.2500。根據(jù)頂點(diǎn)原子的分類(lèi),分子中最多含四類(lèi)原子,則每個(gè)分子將最終得到四個(gè)頂點(diǎn)矢量,分別記為x1、x2、x3和x4。
對(duì)于分子頂點(diǎn)間的相互作用對(duì)分子性質(zhì)的貢獻(xiàn)。頂點(diǎn)之間的相互作用與頂點(diǎn)原子電性及相隔距離密切相關(guān)。一般而言,依據(jù)庫(kù)侖定律,電性越大、距離越小,相互作用就越大。本文借鑒文獻(xiàn)[5-8]的表征方法來(lái)表征分子頂點(diǎn)間的相互作用對(duì)分子性質(zhì)的貢獻(xiàn),即化合物分子中四類(lèi)頂點(diǎn)原子發(fā)生相互作用可以組合出以下幾種方式:m11、m12、m13、m14、m22、m23、m24、m33、m34、m44,分別記為x5、x6、x7、x8、x9、x10、x11、x12、x13、x14十個(gè)頂點(diǎn)相互作用矢量。各元素可按下式計(jì)算:
Z為頂點(diǎn)原子相對(duì)于C原子的相對(duì)電負(fù)性,如O的相對(duì)電負(fù)性為3.44/2.55=1.3490;rij是原子i、j之間的相對(duì)距離(即所經(jīng)最短途徑相對(duì)于碳碳單鍵的相對(duì)鍵長(zhǎng)之和),n和l為原子所屬類(lèi)型。
這樣對(duì)于每一個(gè)有機(jī)化合物分子,將有十四個(gè)變量來(lái)描述其結(jié)構(gòu)信息。與文獻(xiàn)[5-8]相比,像CH4、NH3等只有單個(gè)頂點(diǎn)的分子結(jié)構(gòu)信息將可以得到表達(dá)。將樣本分子的頂點(diǎn)原子按原子屬性及連接方式輸入到自編C語(yǔ)言程序加以處理,得到所有樣本分子的十四個(gè)矢量值。
由于變量數(shù)較多,并且變量之間可能存在著共線性,因此對(duì)變量進(jìn)行篩選并且使樣本數(shù)/變量數(shù)符合N/n≧5的經(jīng)驗(yàn)規(guī)則,尋找最佳變量組合就顯得尤為必要。本文采用SPSS統(tǒng)計(jì)處理軟件對(duì)變量作逐步回歸(SMR)分析。為控制模型穩(wěn)定性和消除變量間共線性影響,對(duì)每步變量計(jì)算方差膨脹因子(VIF)[9]。VIF定義為:VIF=(1-r2)-1,式中r為某自變量與其他變量相關(guān)程度(經(jīng)自由度校正)。VIF為1.0,表示各變量間無(wú)相關(guān)性;VIF值在1.0~10.0間,表示變量間無(wú)明顯共線性,相關(guān)方程可接受;VIF值大于10,相關(guān)方程不可靠。
逐步回歸(SMR)分析發(fā)現(xiàn)當(dāng)7個(gè)變量入選模型時(shí),建模復(fù)相關(guān)系數(shù)R、標(biāo)準(zhǔn)偏差SD、留一法交互檢驗(yàn)復(fù)相關(guān)系數(shù)RCV及標(biāo)準(zhǔn)偏差SDCV同時(shí)達(dá)到理想值,此時(shí)變量之間也不存在明顯共線性(VIF最大值為9.90),并且符合N/n≧5的經(jīng)驗(yàn)規(guī)則。7變量模型如下:
模型擬合:n=55,m=7,R=0.990,SD= 1.325,F(xiàn)M1=324.673;
LOO檢驗(yàn):RCV=0.983,SDCV=1.696,F(xiàn)CV= 195.533
圖1 模型估計(jì)及預(yù)測(cè)值與實(shí)驗(yàn)值相關(guān)圖Fig.1 Plot of estimated values and predicted values vs.experimental values
化合物的色譜保留時(shí)間與頂點(diǎn)間的相互作用存在良好的線性關(guān)系[8,10],而本研究中頂點(diǎn)矢量及頂點(diǎn)相互作用矢量在模型中均有體現(xiàn),并且發(fā)現(xiàn)在逐步回歸中x11首先被引入模型,說(shuō)明化合物的色譜保留時(shí)間的確也受到分子頂點(diǎn)自身所處狀態(tài)的影響。而上述模型對(duì)所有樣本在文獻(xiàn)所述條件下的氣相色譜保留時(shí)間進(jìn)行了估計(jì)和預(yù)測(cè),結(jié)果列于表1的Cal及Pre(cv)欄。模型估計(jì)值及留一法交互檢驗(yàn)值對(duì)實(shí)驗(yàn)值作圖及殘差分布分別見(jiàn)圖1及圖2。
圖2 模型估計(jì)及預(yù)測(cè)誤差分布圖Fig.2 Plot of estimated and predicted residuals scattered
由圖1可以看出,幾乎所有樣本點(diǎn)都落在45°的對(duì)角線上或附近,由圖2容易發(fā)現(xiàn)大部分樣本點(diǎn)的估計(jì)與留一法檢驗(yàn)誤差落在2SD(圖中虛線)以內(nèi)。在模型擬合中只有1個(gè)樣本點(diǎn)(1.8%)、留一法交合檢驗(yàn)中只有4個(gè)樣本點(diǎn)(7.3%)落在2SD外,說(shuō)明模型的具有良好的穩(wěn)定性和預(yù)測(cè)能力,估計(jì)的準(zhǔn)確性較高。需要進(jìn)一步說(shuō)明的是,本文所研究的樣本為來(lái)自天然產(chǎn)物的復(fù)雜樣本體系,分子結(jié)構(gòu)跨度大(包括烷烴、環(huán)烷烴、烯烴、醇、酸和酯等,并且還含有N、O等雜原子)。對(duì)于這樣復(fù)雜的樣本,本文所取得的結(jié)果應(yīng)是滿意的。
化合物在色譜柱上的保留行為與它們同固定相之間的相互作用有關(guān)。當(dāng)固定相一定時(shí),這種相互作用的程度大小將直接與化合物的組成、化學(xué)結(jié)構(gòu)、鍵合狀態(tài)和電性特征相關(guān)。從本文的研究結(jié)果可以看出,提出的頂點(diǎn)及頂點(diǎn)相互作用矢量能很好地表征化合物的組成、化學(xué)結(jié)構(gòu)、鍵合狀態(tài)和電性特征。描述參數(shù)取值完全來(lái)自分子本身,具有計(jì)算過(guò)程簡(jiǎn)單,結(jié)果精度高等優(yōu)點(diǎn)。本文取得的良好結(jié)果對(duì)于天然藥物中揮發(fā)性有機(jī)化合物等復(fù)雜樣本的QSRR研究具有一定的參考價(jià)值。
1 Zhou P(周鵬),Mei H(梅虎),Tian FF(田菲菲),et al.Novel generalized correlative index used to carry out research in Quantitative Structure-retention Relationship for some persistent organic pollutants.Chin J Anal Chem(分析化學(xué)), 2006,34:1096-1100.
2 Zhang T(張婷),Liang YZ(梁逸曾),Zhao CX(趙晨曦),et al.Prediction of temperature-programmed retention indices from molecule structures.Chin J Anal Chem(分析化學(xué)),2006,34:1607-1610.
3 Guan YY(官艷麗),Dawa ZM(達(dá)娃卓瑪),Gesang SL(格桑索朗),et al.Study on essential oil from flowers of Meconopsis integrifolia.Chin Pharm J(中國(guó)中藥雜志),2007,42:539-540.
4 Hall LH,Kier LB.Electrotopological state index for atom types:a novel combination of electronic,topological,and valence state information.J Chem Inf Comput Sci,1995,35: 1039-1045.
5 Liu SS,Yin CS,Cai SX,et al.Molecular structural vector description and retention index of polycyclic aromatic hydrocarbons.Chem Intell,2002,61:3-15.
6 Sun LL,Zhou Y,Li GR,et al.Molecular electronegativitydistance vector(MEDV-4):a two-dimensional QSAR method for the estimation and prediction of biological activities of estradiol derivatives.J Mol St-Th,2004,679:107-113.
7 Zhou Y,Sun LL,Mei H,et al.Estimation and prediction of relative retention indices of polychlorinated naphthalenes in GC with molecular electronegativity distance vector.Chromatographia,2006,64:565-570.
8 Liao LM,Mei H,Li JF,et al.Estimation and prediction on retention times of components from essential oil of Paulownia tomentosa flowers by molecular electronegativity-distance vector(MEDV).J Mol St-Th,2008,850:1-8.
9 Sutter JM,Peterson TA,Juts PC.Prediction of gas chromatographic retention indices of alkylbenzenes.Anal Chim Acta,1997,342:113-122.
10 Liao LM(廖立敏),Mei H(梅虎),Li JF(李建鳳),et al.Prediction on retention times of components from essential oil of Tilia mongolica leaves by H-MEDV.Nat Prod Res Dev(天然產(chǎn)物研究與開(kāi)發(fā)),2008,20:47-51.
Quantitative Structure-Retention Relationship(QSRR)of Volatile Constituents of Meconopsis integrifolia Franch
LAN Zuo-ping1,2,LIAO Li-min3,LIU Yu1,YU Yu1*1College of Pharmacy Chongqing Medical University,Chongqing 400016;2Chongqing Pharmaceutical College,Chongqing 400030,China;3College of Resource and Environment Science,Neijiang Normal University,Neijiang 641112,China
The concept of vectors of vertexes and their interaction were proposed to characterize the molecular structure of complicated samples.Through stepwise multiple regression(SMR),a model with 7 variables could be obtained by multiple linear regression(MLR).The correlation coefficient(R)of the model was 0.990 and the standard deviation(SD) was 1.325.Then the model was evaluated by the cross validation with the leave-one-out(LOO)procedure and the correlation coefficient(RCV)of 0.983 and standard deviations(SDCV)of 1.696 were obtained.The results showed that the vectors were superior in molecular structural characterization.The stability and predictability of the model was satisfactory.
Meconopsis integrifolia Franch;volatile organic compounds(VOC);structural descriptor;quantitative structure-retention relationship(QSRR)
1001-6880(2011)06-1091-05
2010-06-07 接受日期:2010-12-06
重慶市衛(wèi)生局醫(yī)學(xué)科研資助項(xiàng)目(2009-2-134);四川省教育廳青年基金項(xiàng)目(09ZB036)
*通訊作者 Tel:86-23-68485983;E-mail:yuyu3519@163.com.
O657.7
A