劉長(zhǎng)寧, 馮長(zhǎng)君
(徐州工程學(xué)院化學(xué)化工學(xué)院,江蘇徐州 221111)
氯代芳烴生物降解性的QSBR研究
劉長(zhǎng)寧, 馮長(zhǎng)君
(徐州工程學(xué)院化學(xué)化工學(xué)院,江蘇徐州 221111)
基于分子拓?fù)淅碚撚?jì)算了12種氯代芳烴的電性距離矢量(MD)。利用最佳變量子集回歸,建立了這些化合物的好氧生物降解指標(biāo)(Km)的最佳二元QSBR模型,傳統(tǒng)的判定系數(shù)(R2)為0.950,逐一剔除法(LOO)的交互驗(yàn)證系數(shù)()為0.902。結(jié)果表明,該模型具有良好的穩(wěn)健性和預(yù)測(cè)能力。根據(jù)進(jìn)入該模型的2個(gè)電性距離矢量(M25,M21)可知,影響氯代芳烴生物降解性的主要因素是—C—,—OH,—Cl等結(jié)構(gòu)碎片。
氯代芳烴; 電性距離矢量; 生物降解性; 定量結(jié)構(gòu)-生物降解相關(guān)性
生物降解即為需氧微生物對(duì)天然物、農(nóng)藥及其他有毒化合物的破壞或礦化作用。由于測(cè)定污染物生物降解指標(biāo)實(shí)驗(yàn)麻煩及再現(xiàn)性差,并且進(jìn)入環(huán)境中的有機(jī)污染物種類繁多、數(shù)量龐大,通過實(shí)驗(yàn)測(cè)定全部污染物的生物降解性,顯然受人力、物力及時(shí)間限制,難以實(shí)現(xiàn)。因此,最早用于藥物的定量構(gòu)效關(guān)系(Quantitative Structure-Activity Relationships,QSAR)研究方法[1-4],被移植用來研究污染物的生物降解性而形成物質(zhì)的定量結(jié)構(gòu)-生物降解相關(guān)性(Quantitative Structure-Biodegrad Ability Relationship,QSBR)模型[5-8]。利用QSBR模型不僅在預(yù)測(cè)有機(jī)物生物降解特性,而且對(duì)于深入認(rèn)識(shí)有機(jī)物生物降解規(guī)律,揭示有機(jī)物生物降解機(jī)理等方面均已顯示出巨大的潛力[6,8]。氯代芳香化合物廣泛存在于工業(yè)廢水中,屬于有毒難降解的持久性有機(jī)污染物。本文以典型的氯代芳烴為研究對(duì)象,基于劉樹深等[9-11]的電性距離矢量(Molecular electronegativity distance vector,簡(jiǎn)記MD)探討其生物降解性能與化學(xué)結(jié)構(gòu)的相關(guān)性[12],以揭示生物降解機(jī)理,為該類有機(jī)物的生物降解性能預(yù)測(cè)及有效控制提供一定的理論參考。
1.1 氯代芳烴的分子結(jié)構(gòu)與生物降解指標(biāo)
氯代芳烴包括氯苯、氯酚及氯甲苯3類共12種[12],具體見表1。其中氯苯、鄰二氯苯、間二氯苯、對(duì)二氯苯、1,2,4-三氯苯、鄰氯酚、間氯酚、對(duì)氯酚、2,4-二氯酚為美國(guó)環(huán)保局(EPA)所列優(yōu)先控制污染物[13]。
描述有機(jī)物生物降解性能的指標(biāo)有BOD5、 BOD5/COD、動(dòng)力學(xué)常數(shù)或降解速率等,其中動(dòng)力學(xué)常數(shù)具有不受濃度、處理工況等條件的影響,是用于QSBR研究的最為理想的參數(shù)。因此本研究以文獻(xiàn)[12]選定的好氧降解速率常數(shù)(K)作為描述參數(shù)(見表1),其單位是dm-3·(g·h)-1。氯代芳烴的生物降解反應(yīng)是以分子為單位參加的,因此,好氧降解速率常數(shù)應(yīng)以“dm-3·(mol·h)-1”為單位更為合理。為了便于建模,數(shù)據(jù)不宜太小,故以“dm-3·(μmol·h)-1”為單位,相應(yīng)的降解速率常數(shù)記為“Km”,見表1。
表1 氯代芳烴的電性距離矢量(MD)及其好氧生物降解速率常數(shù)(Km)Table 1 The aerobic biodegradability(Km)and molecular electronegativity distance vector(MD)for chlorinated aromatic compounds
1.2 電性距離矢量的計(jì)算
劉樹深等[9-11]考察了多種著名拓?fù)渲笖?shù)的局限,提出能夠較為全面反映分子的拓?fù)?、幾何及電性特征的電性距離矢量。分子電性距離矢量是根據(jù)分子中每一個(gè)非氫原子在分子中的拓?fù)洵h(huán)境和成鍵電子信息進(jìn)行計(jì)算得到的一組數(shù)值,也就是說分子中的所有非氫原子的電性特征和拓?fù)涮卣鞯南嗷プ饔眯纬呻娦跃嚯x矢量,其計(jì)算過程如下:
首先將有機(jī)物分子中非氫原子分為13種原子類型(Wi),Wi定義為:
式中:Zvi為非氫原子i的價(jià)電子數(shù),Ji為非氫原子i在分子中所連接的其它非氫原子的數(shù)目。定義每種非氫原子i的固有屬性Ii為:
式中:ni是非氫原子i的最大主量子數(shù);δi,δvi為非氫原子i的特征值。據(jù)此定義非氫原子i的相對(duì)電性(qi):
式中:dij為兩非氫原子i與j間的拓?fù)渚嚯x,即相距最短的化學(xué)鍵數(shù)。非氫原子間的電性作用構(gòu)成電性距離矢量(MD):
本文化合物中只有第1,2,3,9,13等5種原子類型,它們兩兩相互作用可以形成15種電性距離矢量。部分電性距離矢量見表1。
1.3 統(tǒng)計(jì)回歸方法
首先采用MINITAB軟件中的最佳子集回歸(Leaps-and-Bounds regression)程序進(jìn)行壓縮變量及選擇最佳變量組合,建立相應(yīng)QSBR模型。然后應(yīng)用逐一剔除法對(duì)所建模型的預(yù)測(cè)能力及穩(wěn)健度進(jìn)行檢驗(yàn),以交叉驗(yàn)證相關(guān)系數(shù)()予以評(píng)價(jià)。
2.1 氯代芳烴的QSBR模型的建立
將氯代芳烴的生物降解指標(biāo)及電性距離矢量輸入MINITAB統(tǒng)計(jì)軟件,經(jīng)其中的最佳變量子集回歸及留一法交叉驗(yàn)證構(gòu)建的QSBR模型見表2。其中R2,,,S,F(xiàn)分別為判定系數(shù)、修正判定系數(shù)(以消除自變量個(gè)數(shù)及樣本容量對(duì)判定系數(shù)的影響)、交叉驗(yàn)證系數(shù)、估計(jì)標(biāo)準(zhǔn)誤差、Fischer檢驗(yàn)值。
表2 電性距離矢量與生物降解指標(biāo)的最佳變量子集回歸結(jié)果Table 2 The results of MDand Kmwith leapsand-bounds regression
由表2可見,隨著模型中變量數(shù)增多,除R2持續(xù)增大外,,,F(xiàn),S均在第二個(gè)模型處出現(xiàn)轉(zhuǎn)折,即此數(shù)學(xué)模型最優(yōu)。在多元回歸分析中,為使所得預(yù)測(cè)模型具有較高的可信度,一般遵循如下經(jīng)驗(yàn)規(guī)則:N/M≥5[16],此處,N是樣本容量;M是引進(jìn)回歸模型中自變量的個(gè)數(shù)。本研究的樣本容量N=12,M≤2。因此本文最終選用如下最佳二元數(shù)學(xué)模型:
2.2 模型質(zhì)量的檢驗(yàn)
Fischer檢驗(yàn)值是衡量整個(gè)回歸關(guān)系的顯著性。在顯著性α=0.05條件下,該模型的F臨界值為:F0.05(2,9)=4.26。模型(5)的F值遠(yuǎn)大于4.26,表明有95%的把握判定此回歸關(guān)系是顯著的。一般認(rèn)為,具有良好預(yù)測(cè)能力的QSAR模型,其判定系數(shù)R2≥0.8[14]。本文模型的R2=0.950,說明該模型具有良好的預(yù)測(cè)能力。按此模型給出的計(jì)算值(見表1的“Km.cal.”)與其實(shí)驗(yàn)值較為吻合,因該模型的R2=95.0%,只有近5.0%的剩余偏差(由隨機(jī)因素引起)未被揭示。另外,用變異膨脹因子(variance inflation factors,VIF)評(píng)價(jià)模型中各自變量的多重相關(guān)性[15],VIF的定義式為:
式中R2為自變量X中某一變量與余下變量的判定系數(shù)。如VIF=1,表明各自變量間完全不相關(guān);當(dāng)VIF<5時(shí),說明變量間沒有明顯的自相關(guān)性,所建模型是穩(wěn)定的;當(dāng)VIF>5時(shí),說明變量間存在明顯的共線性,所建模型一般不能用于估算與預(yù)測(cè)。模型(5)中M25,M21的VIF均為1.161,非常接近于1,表明兩者之間幾乎不相關(guān),證明該模型中不存在共線性,是高度穩(wěn)定的。又根據(jù)R2cv=0.902>0.5[16],可知該模型具有良好的穩(wěn)健性與預(yù)測(cè)能力。
以好氧降解速率常數(shù)(K,dm-3·(g·h)-1)作為因變量,經(jīng)LBR法得最佳二元數(shù)學(xué)模型的R2=0.934。與模型(5)比較,其相關(guān)性有所下降。究其原因是氯代芳烴的生物降解只是在分子中某些活性部位上發(fā)生,并不是整個(gè)分子都參與作用。因此,以Km代替K,更接近于真實(shí)情況。
2.3 模型(5)的構(gòu)效分析
根據(jù)分子電性距離矢量理論可知,與M21描述子相關(guān)的分子結(jié)構(gòu)基團(tuán)是第二原子類型碳原子(—C—)與第九原子類型即羥基中氧原子(—OH),M25反映第二原子類型碳原子(—C—)與第十三原子類型鹵原子(—X)相互作用。由表1可見,分子中包含羥基越多,其與—C—間相互作用越大,M21值越大;M25與分子中所含氯原子數(shù)正相關(guān),并按鄰、間、對(duì)-同分異構(gòu)體順序遞增。
有機(jī)物的生物氧化過程是微生物從有機(jī)物分子中奪取電子的過程。因此,在分子反應(yīng)中心上的電荷特性是影響有機(jī)物好氧生物降解性能的重要因素。羥基和甲基是供電子基,在氯代芳烴分子中引入羥基或甲基,將使苯環(huán)上電子云密度增加,利于微生物獲取電子而破壞苯環(huán),顯示良好的生物降解性能。即分子中羥基越多,M21值越大,該分子越易降解,相應(yīng)Km值越大。因此,模型(5)中M21前系數(shù)大于0,兩者是一致的。于芳烴分子中引入吸電子基氯原子,將使苯環(huán)上電子云密度下降,微生物難于獲得電子,其生物降解性減弱。對(duì)于同分異構(gòu)體,表現(xiàn)出鄰位>間位>對(duì)位的降解性能逐漸下降的規(guī)律。另外分子中氯原子越多,M25值越大,該分子苯環(huán)上電子密度越小,難于降解,相應(yīng)Km值越小。所以模型(5)中M25前系數(shù)小于零,兩者呈現(xiàn)負(fù)相關(guān)。
模型(5)的削減誤差比例(R2)為95.0%,不僅表明M21,M25與常數(shù)項(xiàng)共同揭示了影響氯代芳烴好氧生物降解性能的本質(zhì)因素,而且證明氯代芳烴好氧生物降解機(jī)理中包含微生物自苯環(huán)上獲取電子的過程。
(1)模型(5)的傳統(tǒng)判定系數(shù)(R2)為0.950,交互驗(yàn)證系數(shù)()為0.902及VIF=1.161,表明該模型具有統(tǒng)計(jì)學(xué)意義,以及良好的穩(wěn)健性、預(yù)測(cè)能力。
(2)根據(jù)進(jìn)入該模型的電性距離矢量M21,M25可知,影響氯代芳烴好氧生物降解性的主要因素是其分子中—OH,—Cl,—C—等結(jié)構(gòu)碎片。
[1] 馮長(zhǎng)君.3-取代硫基-5-(2-羥基苯基)-4H-1,2,4-三唑類化合物抑菌活性的定量構(gòu)效關(guān)系和結(jié)構(gòu)修飾的理論研究[J].化學(xué)學(xué)報(bào),2012,70(4):512-518.
[2] 馮長(zhǎng)君,沐來龍,楊偉華,等.用拓?fù)渲笖?shù)和神經(jīng)網(wǎng)絡(luò)研究有機(jī)污染物的生物富集因子[J].化學(xué)學(xué)報(bào),2008,66(19):2093-2098.
[3] 馮長(zhǎng)君,唐自強(qiáng),楊偉華,等.有機(jī)物在魚體中生物富集因子的預(yù)測(cè)[J].石油化工高等學(xué)校學(xué)報(bào),2009,22(1):31-36.
[4] 陳艷,堵錫華.基于分子電性距離矢量預(yù)測(cè)PBTAs的熱力學(xué)性質(zhì)[J].石油化工高等學(xué)校學(xué)報(bào),2009,22(4):29-33.
[5] 馮長(zhǎng)君,堵錫華,沐來龍.用新型連接性指數(shù)與神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)取代苯酚和取代苯甲酸生物降解性[J].南京理工大學(xué)學(xué)報(bào),2009,33(5):700-706.
[6] 陸光華,趙元慧,湯潔.有機(jī)化學(xué)品的生物降解性及構(gòu)效關(guān)系[J].化學(xué)通報(bào),2002,65(2):113-118.
[7] 毛亮,高士祥,張愛茜,等.電拓?fù)錉顟B(tài)指數(shù)在有機(jī)污染物理化性質(zhì)和毒理學(xué)性質(zhì)預(yù)測(cè)中的應(yīng)用[J].化學(xué)通報(bào),2008,71(2):118-122.
[8] 馮長(zhǎng)君.茶葉上農(nóng)藥生物降解性的電性距離矢量預(yù)測(cè)[J].南京理工大學(xué)學(xué)報(bào),2011,35(5):722-725.
[9] Shu-Shen Liu,Chun-Sheng Yin,Zhi-Liang Li,et al.QSAR study of steroid benchmark and dipeptides based on MEDV-13[J].J.chem.inf.comput.sci.,2001,41:321-329.
[10] Liu Shu-Shen,Yin Chun-Sheng,Wang Lian-Sheng.Combined MEDV-GA-MLR method for QSAR of three panels of steroids,dipeptides,and COX-2 inhibitors[J].J.chem.inf.comput.sci.,2002,42:749-756.
[11] 張亞輝,劉征濤,劉樹深,等.MEDV描述子預(yù)測(cè)取代芳烴類化合物的藻毒性[J].環(huán)境科學(xué)研究,2009,22(7):823-827.
[12] 瞿福平,張曉健,何苗,等.氯代芳香化合物生物降解性能與其化學(xué)結(jié)構(gòu)的相關(guān)性[J].環(huán)境科學(xué),1998,19(6):26-28.
[13] 周文敏,寇洪如,王湘君.環(huán)境優(yōu)先污染物[M].北京:中國(guó)環(huán)境科學(xué)出版社,1989:11-16.
[14] 張?bào)K,申鵬,陸濤,等.黃酮類化合物抑制MMP-9的定量結(jié)構(gòu)-活性關(guān)系和結(jié)構(gòu)修飾的理論研究[J].化學(xué)學(xué)報(bào),2011,69(4):383-392.
[15] 馮長(zhǎng)君.手性有機(jī)酸保留指數(shù)的手性指數(shù)及原子類型電拓?fù)渲笖?shù)模型[J].物理化學(xué)學(xué)報(bào),2010,26(1):193-198.
[16] Hawkins D M,Basak S C.Assessing model fit by cross-validation[J].J.chem.inf.comput.sci.,2003,43:579-586.
(Ed.:YYL,CP)
Prediction of the Aerobic Biodegradability of Chlorinated Aromatic Compounds Using QSBR
LIU Chang-ning,F(xiàn)ENG Chang-jun
(School of Chemistry &Chemical Engineering,Xuzhou Institute of Technology,Xuzhou Jiangsu 221111,P.R.China)
11 July 2012;revised 4 September 2012;accepted 10 September 2012
The molecular electronegativity distance vector(MD)of chlorinated aromatic molecules were calculated based on the molecular topological theory.The optimal two-parameter(M25,M21)QSAR model of aerobic biodegradability(Km,dm-3·(μmol·h)-1)for 12 above compounds was set up by leaps-and-bounds regression(LBR).The traditional correlation coefficient(R2)and the cross-validation correlation coefficient()of leave-one-out(LOO)are 0.950 and 0.902,respectively.The result demonstrates that the model is better reliable and has good predictive ability from the point of view of statistics.Form the two parameters(M25,M21)of the model,it can be seen that the molecular structure characteristics of two-dimensional(such as the structural fragment—OH,—C—,—Cl)are the decisive factors to affect the aerobic biodegradability.
Chlorinated aromatic compound;Electronegativity distance vector;Aerobic biodegradability;Quantitative structure-biodegrad ability relationship(QSBR)
.Tel.:+86-516-85608039;e-mail:fengcj@xzit.edu.cn
TE65;X172;O6-051
A
10.3969/j.issn.1006-396X.2012.05.002
1006-396X(2012)05-0006-04
2012-07-11
劉長(zhǎng)寧(1975-),男,江蘇徐州市,講師,碩士。
國(guó)家自然科學(xué)基金(21075138);徐州市科技局基金(XZZD1104);賈汪區(qū)科技局基金(XM10A05)。