摘 要:運(yùn)用常見的取代基結(jié)構(gòu)參數(shù)對(duì)化合物表征,進(jìn)行苯胺類化合物生物毒性的QSAR研究;利用化學(xué)計(jì)量學(xué)建模,并由所得模型結(jié)果進(jìn)行了苯胺類化合物
以苯胺類化合物對(duì)小鼠的日服毒性半數(shù)致死量LD50作為生物毒性指標(biāo),提取29種苯胺類化合物的取代基結(jié)構(gòu)參數(shù)及1種分子指示變量作為分子結(jié)構(gòu)描述符。利用SPSS軟件建模,并由所得模型結(jié)果進(jìn)行了苯胺類化合物結(jié)構(gòu)與生物毒性關(guān)系的理論解釋。
苯胺類化合物的結(jié)構(gòu)為:
不同的苯胺類化合物具有相同的部分,也有不同的取代基結(jié)構(gòu),即不同的苯胺類化合物結(jié)構(gòu)不盡一樣。常見的取代基團(tuán)有-CH3,-Et,-NO2,-Cl等,這些取代基的類型、位置及數(shù)目會(huì)影響化合物的毒性。影響化合物毒性的電子效應(yīng)類型參數(shù),包括基團(tuán)電負(fù)性效應(yīng)參數(shù)σx,極化效應(yīng)參數(shù)σα,場(chǎng)效應(yīng)參數(shù)σF,共軛效應(yīng)參數(shù)σR,取基團(tuán)立體效應(yīng)參數(shù)L和疏水參數(shù)π,其值見表1。
依據(jù)表1,每種苯胺類化合物有5中不同取代位置和6種取代基結(jié)構(gòu)。
苯胺類化合物的生物毒性與其結(jié)構(gòu)參數(shù)有關(guān),為了從整體上考慮對(duì)生物毒性影響,在研究中設(shè)置指示變量I。
有的變量相關(guān)性較大,這里采取加權(quán)線性組合定義新變量,可以得到下式:
σF=0.4×σF1+0.24×σF3+0.3×σF4 (1)
以篩選出的取代基結(jié)構(gòu)參數(shù)π1、π2、σF1、σF3、σF4、σR2及分子指示變量I與苯胺的生物毒性數(shù)據(jù)進(jìn)行多元回歸建模。取29種苯胺類化合物中的26個(gè)樣品回歸建模,余下的3個(gè)樣品作為回歸模型的獨(dú)立檢測(cè)集。
采用SPSS統(tǒng)計(jì)軟件進(jìn)行回歸建模。
原始數(shù)據(jù)建立的QSPR模型為:
lg(1/LD50)=2.575-0.426π2-2.284σR2-1.078σF+0.218I (2)
(R=0.966,R2=0.933,SE=0.058921,F(xiàn)=65.115,sig=0.000,n=26)
(其中σF是按1式定義的新取代基參數(shù))。
為了避免由于各變量的量綱不同對(duì)建立的模型影響,所以對(duì)篩選后變量進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,即
XZ=■ (3)
數(shù)據(jù)標(biāo)準(zhǔn)化后,建立的QSPR模型為:
lg(1/LD50)=-0.467π2-0.556σR2-0.616σF+0.695I (4)
(R=0.966,R =0.933,SE=0.058921,F(xiàn)=65.115,sig=0.000,n=26)
以上模型中,R:相關(guān)系數(shù),SE:標(biāo)準(zhǔn)誤差,F(xiàn):檢驗(yàn)值,sig:檢驗(yàn)概率,n:樣本化合物數(shù)目。
QSPR模型的驗(yàn)證的內(nèi)部檢驗(yàn):
R值較大,R=0.969, F 值較大(F=65.115)通過檢驗(yàn)(sig=0.000),標(biāo)準(zhǔn)偏差較小,SE=0.058921,說明進(jìn)入方程的結(jié)構(gòu)參數(shù)與苯胺類化合物生物毒性顯著相關(guān),回歸方程整體上有意義。從表2可以得到,通過t檢驗(yàn)值檢驗(yàn),表明回歸方程的各個(gè)系數(shù)是有意義的。從圖1可以看出,苯胺類化合物生物毒性實(shí)驗(yàn)值和預(yù)測(cè)值基本在直線上或直線兩側(cè)附近波動(dòng),說明實(shí)驗(yàn)值和預(yù)測(cè)值較為接近,模型有良好的穩(wěn)健性和預(yù)測(cè)性,模型的預(yù)測(cè)計(jì)算值及殘差見定義均方誤差函數(shù)MSE:
(5)
方差膨脹因子值越大,自變量之間存在共線性的可能越大。一般認(rèn)為,當(dāng)VIF>5時(shí),可以認(rèn)為變量之間存在共線性問題。由表3知,該模型自變量的VIF值在1到4之間,說明自變量之間的相關(guān)性不大。
通過對(duì)苯胺類化合物生物毒性QSAR模型評(píng)價(jià),表明所建的回歸模型穩(wěn)定可靠,方程的所有系數(shù)是有意義的,可用于苯胺類化合物生物毒性的預(yù)測(cè)和生物毒性理論解釋。
由(2)、(4)式可以看出,生物毒性lg(1/LD50)與I 呈正相關(guān),與π2、σR2和σF呈負(fù)相關(guān)。如果苯胺類化合物具有較大I值,較小的π2、σR2和σF值,那么可以預(yù)測(cè)出該化合物具有較高的生物毒性。
由標(biāo)準(zhǔn)回歸系數(shù)可知,除分子指示變量I(0.695)外,呈負(fù)相關(guān)的新定義的取代基結(jié)構(gòu)參數(shù)σF(見1式)的標(biāo)準(zhǔn)回歸系數(shù)(-0.616)最大(取絕對(duì)值),即表明它對(duì)苯胺類化合物的生物毒性影響很大。取代基疏水參數(shù)π、場(chǎng)效應(yīng)參數(shù)σF和共軛效應(yīng)參數(shù)σR等結(jié)構(gòu)參數(shù)對(duì)應(yīng)電子效應(yīng)的綜合影響,才產(chǎn)生了大小不同的生物毒性。
參考文獻(xiàn)
[1]許祿,吳亞平,苯酚類化合物的三維定量構(gòu)效關(guān)系研究[J].計(jì)算機(jī)與應(yīng)用化學(xué),2000(17):14-17.
[2]戴益民,等.應(yīng)用多維標(biāo)度法預(yù)測(cè)硝基苯化合物的生物毒性[J].長(zhǎng)沙理工大學(xué)學(xué)報(bào),2008,5(1):59-62.
[3]曹晨忠.有機(jī)化學(xué)中的取代基效應(yīng)[M].北京:科學(xué)出版社,2003.