余訓(xùn)爽
(長(zhǎng)江大學(xué) 化學(xué)與環(huán)境工程學(xué)院,湖北 荊州 434023)
隨著人類(lèi)社會(huì)對(duì)有機(jī)化合物需求的增大,它們給環(huán)境造成的危害或壓力隨之增加。每年新增的有機(jī)化合物種類(lèi)繁多,有機(jī)化合物進(jìn)入環(huán)境之前不可能逐一進(jìn)行理化性質(zhì)/生物活(毒)性的測(cè)定,如能從現(xiàn)有的實(shí)驗(yàn)數(shù)據(jù)探討科學(xué)的、精確的、可靠的方法預(yù)測(cè)新化合物的生物活(毒)性(QSAR),從而進(jìn)行環(huán)境風(fēng)險(xiǎn)評(píng)價(jià),這樣不僅方便、經(jīng)濟(jì),也可避免實(shí)際測(cè)定時(shí)帶來(lái)的二次污染。研究表明:QSAR在預(yù)測(cè)化合物生物活(毒)性方面扮演重要角色,成為環(huán)境、生命、毒理學(xué)等學(xué)科研究中的一個(gè)前沿領(lǐng)域[1-5]。在研究中,正辛醇/水分配系數(shù)(lgKOW)是最常見(jiàn)、最重要的理化參數(shù)。它反映有機(jī)物的親脂性。根據(jù)實(shí)驗(yàn)測(cè)得的經(jīng)驗(yàn)參數(shù)(辛醇-水分配系數(shù)、水中溶解度等)與相應(yīng)的性質(zhì)(如生物毒性、光解活性等)建立定量關(guān)系式。逐一測(cè)定各個(gè)有機(jī)化合物的理化參數(shù),現(xiàn)實(shí)是不可能的;另外實(shí)驗(yàn)數(shù)據(jù)存在一定的誤差,用失真的數(shù)據(jù)直接建模,預(yù)測(cè)時(shí)可能會(huì)導(dǎo)致預(yù)測(cè)結(jié)果失敗。改變傳統(tǒng)處理系統(tǒng)信息方法,還以數(shù)據(jù)本來(lái)面目,從而提高模型的預(yù)測(cè)能力,是從事QSAR工作者必須考慮的問(wèn)題。
灰色系統(tǒng)理論以 “部分信息已知、部分信息未知”的 “小樣本”、“貧信息”為研究對(duì)象,通過(guò)對(duì)“部分”已知的系統(tǒng)信息進(jìn)行處理、分析、量化和建模[6]。從而實(shí)現(xiàn)處理數(shù)據(jù)不多的灰信息來(lái)揭示系統(tǒng)信息的特征和變化規(guī)律。本文將運(yùn)用灰色理論對(duì)12種氯代苯的生物活(毒)性與其結(jié)構(gòu)參數(shù)的定量構(gòu)效關(guān)系進(jìn)行研究。
GM(1,1)模型是1階的、單變量的模型。本文依據(jù)連續(xù)非等時(shí)空距 GM(1,1)灰色模型[5,7]建立灰色預(yù)測(cè)模型。其具體步驟如下:
設(shè)系統(tǒng)某行為特征的自變量x(k)和觀測(cè)值y(k)為:
相應(yīng)的1-AGO生成序列[6]為:
GM(1,1)模型的響應(yīng)函數(shù)為:
式(2)為GM(1,1)灰色預(yù)測(cè)模型的具體計(jì)算公式,且參數(shù)-a和b分別為模型的發(fā)展系數(shù)和灰色作用量,其值由最小二乘法求出。式(2)的還原值如下:
模型精度一般由均方差比值C和小誤差概率p共同確定:
其計(jì)算方法和模型精度等級(jí)參考文獻(xiàn) [6]。模型精度等級(jí)分為Ⅳ級(jí),Ⅰ級(jí)最好,Ⅳ級(jí)最差。
氯代苯分子的20℃、15min條件下使發(fā)光菌發(fā)光強(qiáng)度減少1/2時(shí)的濃度EC50(mol/L)、大型蚤的24h半致死濃度LC50值取自文獻(xiàn) [8]、-lgKOW(正辛醇-水分配系數(shù))、-lgSW(水中的溶解度)、表面積(100nm2)TSA、分子體積(100 nm3)V、摩爾質(zhì)量(g/mol)M 和摩爾體積Vm(mL/mol)來(lái)自文獻(xiàn) [9]。相關(guān)數(shù)據(jù)及灰色綜合關(guān)聯(lián)度(ρ)計(jì)算[6]結(jié)果見(jiàn)表1。
灰色綜合關(guān)聯(lián)度的大小不僅反映了Y(0)與X(0)相關(guān)的程度,同時(shí)也反映出Y(0)隨X(0)變化速率的接近程度。由表1可知-lgEC50或-lgLC50與-lgKOW的ρ最大,故將-lgKOW選擇為氯代苯分子結(jié)構(gòu)與生物活(毒)分析的灰變量。
將表1中9個(gè)或11個(gè)氯代苯分子的-lgEC50和-lgLC50分別與-lgKOW建模,其GM(1,1)灰色預(yù)測(cè)模型如下:
-lgEC50的灰色模型:
式(4)中,N、R2、SE、F和P依次為灰方程的樣本數(shù)、判定系數(shù)、標(biāo)準(zhǔn)偏差、Fischer檢驗(yàn)值和P顯著性水平(下同)。
-lgLC50的灰色模型:
按式(4)和式(5)分別計(jì)算12多氯代苯-lgEC50或-lgLC50值、誤差和平均值,以及文獻(xiàn)的預(yù)測(cè)值、誤差和平均值與實(shí)驗(yàn)值的比較列于表2中。
表1 氯代苯的化學(xué)結(jié)構(gòu)參數(shù)及灰色綜合關(guān)聯(lián)度Table1 Chemical structure parameters andρof chlorinated benzenes
表2 氯代苯的-lgEC50或-lgLC50的計(jì)算值(或預(yù)測(cè)值)Table2 Calculated value-lgEC50or-lgLC50of chlorinated benzenes(predicted value)
由表2中數(shù)據(jù)分別計(jì)算灰色模型(4)和(5)的S1、S2、均方差比值C和小誤差概率p,計(jì)算結(jié)果見(jiàn)表2。由表2可見(jiàn),灰色模型(4)和(5)均為Ⅰ級(jí)(優(yōu)秀)。
本文灰色模型的F值>105,P=0.05水平上的顯著性檢驗(yàn)<0.0005(本文P=0.0000),且都為單變量模型,因此模型從統(tǒng)計(jì)學(xué)的意義上講也是成立的,模型真實(shí)可靠。采用式(4)預(yù)測(cè)了不在灰色集中的1,3-二氯苯、1,3,5-三氯苯和五氯苯 的-lgEC50值,分 別 為 4.27(4.24)、4.58(4.55)和5.81(5.69),其預(yù)測(cè)結(jié)果與括號(hào)中的實(shí)驗(yàn)值吻合程度好。因此,該灰色模型具有良好的預(yù)測(cè)能力和可靠性。
根據(jù)表2的數(shù)據(jù)分別計(jì)算本文和文獻(xiàn) [8]的誤差,其結(jié)果見(jiàn)表3。
表3 誤差分析Table3 Error analysis
由表3可見(jiàn),本文所建模型的誤差均好于文獻(xiàn)[8],可見(jiàn)建立的灰色模型優(yōu)于文獻(xiàn) [8]的線性回歸模型。
借助灰色系統(tǒng)理論來(lái)研究有毒化合物的生物活(毒)性預(yù)測(cè),具有一定探索的性質(zhì),有待更加深入、更具體地研究。其次,目前大量有毒化合物的結(jié)構(gòu)參數(shù)(如-lgKOW)被發(fā)表,為建立灰色模型預(yù)測(cè)有毒化合物的生物活(毒)性提供了方便,從而為判斷有毒化合物的環(huán)境歸宿和風(fēng)險(xiǎn)性評(píng)價(jià)有重要指導(dǎo)意義。
[1]王連生,韓朔睽.有機(jī)污染化學(xué)進(jìn)展 [M].北京:化學(xué)工業(yè)出版社,1998:7-154.
[2]解靜芳,郭煒?shù)h.色譜保留指數(shù)在預(yù)測(cè)氯苯類(lèi)和氯酚類(lèi)化合物對(duì)戈卑魚(yú)LC50中的應(yīng)用 [J].環(huán)境與健康雜志,2005,22(6):441-444.
[3]堵錫華.修正的分子連接性指數(shù)mL用于氯代苯、醇、酯的QSAR/QSRR研究 [J].分析測(cè)試學(xué)報(bào),2003,22(5):18-22.
[4]秦正龍.鹵代芳烴對(duì)水生生物急性毒性的定量構(gòu)效關(guān)系研究 [J].環(huán)境污染治理技術(shù)與設(shè)備,2005,6(1):50-53.
[5]謝武明,胡勇有,劉煥彬,等.持久性有機(jī)污染物的環(huán)境問(wèn)題與研究進(jìn)展 [J].中國(guó)環(huán)境監(jiān)測(cè),2004,20(2):58-61.
[6]劉思峰,黨輝國(guó),方志耕,等.灰色系統(tǒng)理論及其應(yīng)用:第五版 [M].北京:科學(xué)出版社,2010.
[7]張 旭,謝修銀.持久性有機(jī)污染物多氯聯(lián)苯(PCBs)生物毒性的灰色理論研究 [J].長(zhǎng)江大學(xué)學(xué)報(bào):自然科學(xué)版,2009,6(1):41-43.
[8]周享春,趙元力,余訓(xùn)民.用氯代苯、烷基酚和醇類(lèi)化合物氣相色譜保留指數(shù)預(yù)測(cè)其生物活(毒)性 [J].北京工商大學(xué)學(xué)報(bào):自然科學(xué)版,2004,22(4):9-14.
[9]楊海浪.W*對(duì)氯代苯類(lèi)分子理化參數(shù)的應(yīng)用研究[J].武漢科技學(xué)院學(xué)報(bào),2004,17(3):67-71.