堵錫華,王超
徐州工程學(xué)院 化學(xué)化工學(xué)院,徐州 221111
?
神經(jīng)網(wǎng)絡(luò)法應(yīng)用于酚類(lèi)化合物對(duì)青?;【拘缘念A(yù)測(cè)
堵錫華,王超
徐州工程學(xué)院 化學(xué)化工學(xué)院,徐州 221111
青海弧菌對(duì)有毒酚類(lèi)化合物具有強(qiáng)烈的敏感性,為建立酚類(lèi)衍生物對(duì)青?;【拘缘亩拷Y(jié)構(gòu)-活性相關(guān)性(QSAR)模型,分析了16種酚類(lèi)衍生物的分子結(jié)構(gòu)與對(duì)青?;【拘灾g的相關(guān)關(guān)系,計(jì)算了酚類(lèi)衍生物的分子連接性指數(shù)和分子形狀指數(shù),并優(yōu)化篩選了分子連接性指數(shù)的1階路徑指數(shù)(1χ)和分子形狀指數(shù)的2階特征指數(shù)(K2)及1階和2階指數(shù)乘積值(K4),用這3種指數(shù)與對(duì)青?;【亩拘赃M(jìn)行多元回歸分析,多元回歸方程的決定系數(shù)R2=0.971。為進(jìn)一步提高預(yù)測(cè)精度,將這3種分子結(jié)構(gòu)參數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入變量,毒性值作為輸出變量,采用3:2:1的網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)反向傳播(BP)神經(jīng)網(wǎng)絡(luò)法獲得滿意的QSAR預(yù)測(cè)模型,總的相關(guān)系數(shù)r為0.996,計(jì)算得到的毒性預(yù)測(cè)值與實(shí)驗(yàn)值較為吻合,平均相對(duì)誤差僅為1.98%,結(jié)果表明該模型具有良好的預(yù)測(cè)酚類(lèi)衍生物毒性的能力,可以看出神經(jīng)網(wǎng)絡(luò)方法對(duì)酚類(lèi)化合物發(fā)光菌毒性預(yù)測(cè)比多元線性回歸方法的統(tǒng)計(jì)學(xué)意義更加明顯。
酚類(lèi)衍生物;青海弧菌;分子連接性指數(shù);分子形狀指數(shù);定性結(jié)構(gòu)-活性相關(guān)性
Received 5 February 2016 accepted 27 June 2016
酚類(lèi)化合物主要來(lái)源于化工精細(xì)化學(xué)品生產(chǎn)過(guò)程中的三廢排放,它具有中等強(qiáng)度的毒性,會(huì)對(duì)人身造成一定的傷害,故部分酚類(lèi)化合物早已被美國(guó)和歐盟列入優(yōu)先監(jiān)測(cè)控制污染物的黑名單[1],我國(guó)也將多種酚類(lèi)化合物確定為優(yōu)先控制重點(diǎn)有機(jī)污染物[2]。正因?yàn)榉宇?lèi)化合物對(duì)生物體具有毒性,有“三致”作用,故引起世界各國(guó)科學(xué)家對(duì)該類(lèi)化合物的高度重視,眾多科研工作者對(duì)酚類(lèi)化合物的毒性或活性也進(jìn)行了卓有成效的研究,取得了較多的成果。但由于酚類(lèi)化合物種類(lèi)繁多,其毒性無(wú)法一一通過(guò)實(shí)驗(yàn)進(jìn)行測(cè)定,利用定量結(jié)構(gòu)-活性相關(guān)性(QSAR)研究方法對(duì)其進(jìn)行毒性預(yù)測(cè)不失為一種有效的方法,該方法在生物化學(xué)、藥物化學(xué)、環(huán)境化學(xué)等方面已得到廣泛應(yīng)用[3-5],利用該法可以預(yù)測(cè)有機(jī)化合物的物化性質(zhì)、毒性及其環(huán)境效應(yīng)等方面的一些重要參數(shù)[6-7],很多科研工作者為此進(jìn)行了有益的嘗試[8-10],取得了令人矚目的成果。
青海弧菌是朱文杰教授[11]分離得到的一種新型淡水發(fā)光細(xì)菌,將該發(fā)光細(xì)菌應(yīng)用于毒性檢測(cè)具有更為快速、簡(jiǎn)便和高效的優(yōu)點(diǎn)[12],故被廣泛用于生物毒性測(cè)試研究[13-14],該法能更好地對(duì)淡水污染物進(jìn)行毒性評(píng)價(jià)[15]。雖然目前對(duì)酚類(lèi)化合物進(jìn)行毒性研究的成果較多,但利用人工神經(jīng)網(wǎng)絡(luò)(ANN)方法對(duì)此研究的較為少見(jiàn),為此本文在前面工作[16-17]基礎(chǔ)上,應(yīng)用神經(jīng)網(wǎng)絡(luò)研究方法,利用文獻(xiàn)[18]的方法測(cè)定的16個(gè)酚類(lèi)化合物對(duì)青?;〖?xì)菌Q67的毒性pEC50(相對(duì)發(fā)光率為50%時(shí),對(duì)應(yīng)化合物摩爾濃度(mol·L-1)的負(fù)對(duì)數(shù)),建立了分子結(jié)構(gòu)與毒性值之間的關(guān)系模型,取得了明顯優(yōu)于文獻(xiàn)[18]的研究結(jié)果,本法對(duì)研究酚類(lèi)污染物毒性效應(yīng)及環(huán)境風(fēng)險(xiǎn)評(píng)價(jià)有重要意義。
1.1 酚類(lèi)化合物毒性數(shù)據(jù)
16種酚類(lèi)化合物見(jiàn)表1,其對(duì)青?;【亩拘詳?shù)據(jù)(pEC50)來(lái)源于文獻(xiàn)[18]。
1.2 分子連接性指數(shù)與分子形狀指數(shù)的建立
應(yīng)用Chem3D 9.0軟件繪制出16個(gè)酚類(lèi)化合物的分子結(jié)構(gòu)圖,然后使用MATLAB自編程序[19]計(jì)算分子連接性指數(shù)和分子形狀屬性指數(shù)[20],用MINITAB軟件進(jìn)行最佳變量子集回歸分析,對(duì)2類(lèi)指數(shù)進(jìn)行優(yōu)化篩選,結(jié)果見(jiàn)表2,從表2可以看出,只有選取分子連接性指數(shù)中的1χ和分子形狀指數(shù)的K2和K4(因樣本只有16個(gè)分子,故變量不能超過(guò)3個(gè)),1χ表示分子連接性指數(shù)中的1階路徑指數(shù),K2表示2階形狀特征指數(shù),K4表示1階和2階形狀特征指數(shù)的乘積值,將這3個(gè)分子結(jié)構(gòu)描述符作為變量與酚類(lèi)化合物的毒性數(shù)據(jù)進(jìn)行回歸分析時(shí),結(jié)構(gòu)參數(shù)與毒性之間的相關(guān)性能達(dá)到最佳,而且得到的FIT值最大,說(shuō)明此模型越穩(wěn)定,預(yù)測(cè)能力也越強(qiáng)。
1.3 多元回歸模型的建構(gòu)
將文獻(xiàn)[18]中列出的16種酚類(lèi)化合物對(duì)青海弧菌的毒性值pEC50與優(yōu)化篩選的3種結(jié)構(gòu)參數(shù)1χ、K2和K4進(jìn)行多元回歸相關(guān)分析,得到三元回歸方程為:
pEC50=1.3011χ-2.452 K2+3.359 K4+1.790
(1)
該方程的決定系數(shù)R2為0.971,利用式(1)預(yù)測(cè)其對(duì)青?;【拘灾?,所得預(yù)測(cè)值(1)也列于表1,它與實(shí)驗(yàn)值之間的平均相對(duì)誤差(1)為4.10%,基本符合要求,但對(duì)2,6-二氯苯酚和3-氯苯酚2個(gè)分子的預(yù)測(cè)誤差均超過(guò)10%,說(shuō)明酚類(lèi)化合物結(jié)構(gòu)參數(shù)與毒性之間并不完全是線性關(guān)系。
1.4 神經(jīng)網(wǎng)絡(luò)模型的建構(gòu)
為了進(jìn)一步提高預(yù)測(cè)酚類(lèi)化合物對(duì)青?;【拘缘臏?zhǔn)確性,并與多元回歸分析方法進(jìn)行預(yù)測(cè)精度比較,用神經(jīng)網(wǎng)絡(luò)方法進(jìn)一步進(jìn)行研究,以多元回歸分析方法的3種分子結(jié)構(gòu)參數(shù)作為人工神經(jīng)網(wǎng)絡(luò)(ANN)方法的輸入層變量,將酚類(lèi)化合物對(duì)青海弧菌的毒性值作為輸出層變量,隱含層H值則按照許祿等[21]的建議規(guī)則經(jīng)計(jì)算取2,因此人工神經(jīng)網(wǎng)絡(luò)法的網(wǎng)絡(luò)結(jié)構(gòu)采用3:2:1,為避免過(guò)度擬合,這里將16個(gè)酚類(lèi)化合物樣本數(shù)據(jù)分成3組:訓(xùn)練集(每5個(gè)數(shù)據(jù)作為1組,取其中第1、3、4個(gè)數(shù)據(jù),依次類(lèi)推)、測(cè)試集(每組的第2個(gè)數(shù)據(jù))和驗(yàn)證集(每組的第5個(gè)數(shù)據(jù)),由此得到的人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型總的相關(guān)系數(shù)r=0.9958,訓(xùn)練集的相關(guān)系數(shù)r=0.9943、測(cè)試集的相關(guān)系數(shù)r=0.9998、驗(yàn)證集的相關(guān)系數(shù)r=0.9999,利用該神經(jīng)網(wǎng)絡(luò)模型計(jì)算得到的酚類(lèi)化合物對(duì)青?;【拘缘念A(yù)測(cè)值(2)也列于表1中,該預(yù)測(cè)值(2)與實(shí)驗(yàn)值吻合度較為理想,兩者的平均相對(duì)誤差(2)僅為1.98%,而文獻(xiàn)[18]利用CoMFA方法所得結(jié)果的平均相對(duì)誤差為6.18%、利用CoMSIA方法所得結(jié)果的平均相對(duì)誤差為7.19%,本法結(jié)果明顯優(yōu)于文獻(xiàn),所以這里可以看出,神經(jīng)網(wǎng)絡(luò)方法比多元回歸方法的預(yù)測(cè)精度有較大的提高,所建立模型的相關(guān)性明顯優(yōu)于多元回歸分析方法,模型的權(quán)重和偏置見(jiàn)表3。
表1 酚類(lèi)化合物對(duì)青?;【拘缘念A(yù)測(cè)結(jié)果
表2 pEC50與1χ、K1、K2、K4的最佳變量子集回歸結(jié)果
表3 BP-ANN模型的權(quán)重和偏置
表4 Jackknifed決定系數(shù)的檢驗(yàn)
2.1 模型穩(wěn)健性與預(yù)測(cè)能力的檢驗(yàn)
2.2 模型分析
通過(guò)計(jì)算分子的連接性指數(shù)和形狀指數(shù),利用這2類(lèi)指數(shù)的其中3種指數(shù)與16種苯酚類(lèi)化合物對(duì)青?;【亩拘灾颠M(jìn)行相關(guān)性分析,建立了相關(guān)性良好的預(yù)測(cè)苯酚類(lèi)化合物對(duì)青?;【拘缘腝SAR模型,利用模型得到的毒性預(yù)測(cè)值與實(shí)驗(yàn)值較為吻合,兩者的平均相對(duì)誤差僅為1.98%。對(duì)取代苯酚的分子結(jié)構(gòu)與其生物毒性進(jìn)行分析發(fā)現(xiàn),苯酚的鄰位和間位包括對(duì)位,引入基團(tuán)的體積越小,則毒性越大;體積越大,其毒性反而越小。此外間位和對(duì)位引入基團(tuán)的正電性越強(qiáng),毒性越大[18],從與神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果可以看出,預(yù)測(cè)毒性相對(duì)誤差最大的只有間硝基苯酚分子,相對(duì)誤差為5.16%,這可能與該分子中的硝基處于間位位置,此位置的基團(tuán)越大,毒性值反而相對(duì)偏小,與硝基處于對(duì)位的對(duì)硝基苯酚相比,可能硝基又受苯環(huán)上羥基的影響,毒性值明顯小于對(duì)硝基苯酚,故導(dǎo)致預(yù)測(cè)誤差偏大;通過(guò)考察文獻(xiàn)和預(yù)測(cè)的毒性數(shù)據(jù)可以看出,總的來(lái)說(shuō),當(dāng)酚的苯環(huán)上連接基團(tuán)的體積越大、或連接的基團(tuán)越多,酚類(lèi)化合物的毒性越大,特別是吸電子基團(tuán)的存在,會(huì)使苯環(huán)上的負(fù)電荷減小,化合物的毒性會(huì)增大;而分子連接性指數(shù)和分子形狀指數(shù)則能很好的反映酚類(lèi)化合物分子的空間結(jié)構(gòu)特性,故指數(shù)與毒性之間能顯示很好的關(guān)聯(lián)性。
綜上可知:
(2)神經(jīng)網(wǎng)絡(luò)在構(gòu)建酚類(lèi)化合物的毒性預(yù)測(cè)模型中,具有較強(qiáng)的糾錯(cuò)能力,可對(duì)多元回歸模型進(jìn)行有效地校正,使標(biāo)準(zhǔn)誤差明顯降低,能夠證明1χ、K2、K4與毒性之間具有良好的非線性關(guān)系,而不是線性關(guān)系。
故本研究建構(gòu)的QSAR模型對(duì)酚類(lèi)化合物的毒性研究具有指導(dǎo)作用。
[1] 莫凌云, 劉海玲, 劉樹(shù)深, 等. 5種取代酚化合物對(duì)淡水發(fā)光菌的聯(lián)合毒性[J]. 生態(tài)毒理學(xué)報(bào), 2006, 1(3): 259-264
Mo L Y, Liu H L, Liu S S, et al. Joint toxicity of 5 substituted phenols to freshwater photobacteria [J]. Asian Journal of Ecotoxicology, 2006, 1(3): 259-264 (in Chinese)
[2] 周文明, 傅德黔, 孫宗光. 中國(guó)水中優(yōu)先控制污染物黑名單的確定[J]. 環(huán)境科學(xué)研究, 1991, 4(6): 9-12
Zhou W M, Fu D Q, Sun Z G. Determination of black list of China's priority pollutants in water [J]. Research of Enviromental Sciences, 1991, 4(6): 9-12 (in Chinese)
[3] Su L, Zhang X, Yuan X, et al. Evaluation of joint toxicity of nitroaromatic compounds and copper to photobacterium phosphoreum and QSAR analysis [J]. Journal of Hazardous Materials, 2012, 241: 450-455
[4] Gu C, Ju X, Jiang X, et al. Improved 3D-QSAR analyzes for the predictive toxicology of polybrominated diphenyl ethers with CoMFA/CoMSIA and DFT [J]. Ecotoxicology and Environmental Safety, 2010, 73(6): 1470-1479
[5] Kar S, Roy K. QSAR modeling of toxicity of diverse organic chemicals to Daphnia magna using 2D and 3D descriptors [J]. Journal of Hazardous Materials, 2010, 177(1-3): 344-351
[6] 堵錫華, 王曉輝, 馮長(zhǎng)君. 1-取代-2-氨基苯并咪唑化合物毒性的密度泛函理論研究[J]. 生態(tài)毒理學(xué)報(bào), 2014, 9(6): 1204-1209
Du X H, Wang X H, Feng C J. Density functional theory study on the toxicity of 1-replaced-2-amino benzimidazole compounds [J]. Asian Journal of Ecotoxicology, 2014, 9(6): 1204-1209 (in Chinese)
[7] 程艷, 陳會(huì)明, 于文蓮, 等. QSAR技術(shù)對(duì)高關(guān)注化學(xué)物質(zhì)生態(tài)環(huán)境毒理風(fēng)險(xiǎn)預(yù)測(cè)[J]. 環(huán)境科學(xué)研究, 2009, 22(7): 817-822
Chen Y, Chen H M, Yu W L, et al. Eco-environmental toxicity risk prediction for substances of very high concern with QSAR approach [J]. Research of Environmental Sciences, 2009, 22(7): 817-822 (in Chinese)
[8] 張輝, 李娜, 馬梅, 等. 15種取代酚對(duì)淡水發(fā)光菌Q67的毒性及定量構(gòu)效分析[J]. 生態(tài)毒理學(xué)報(bào), 2012, 7(4): 373-380
Zhang H, Li N, Ma M, et al. Quantitative structure-activity relationship for toxicity of fifteen substituted phenols to Vibrio qinghaiensis sp. -Q67 [J]. Asian Journal of Ecotoxicology, 2012, 7(4): 373-380 (in Chinese)
[9] Argese E, Bettiol C, Giurin G, et al. Quantitative structure-activity relationships for the toxicity of chlorophenols to mammalian submitochondrial particles [J]. Chemosphere, 1999, 38: 2281-2292
[10] 廖立敏, 卿東紅, 李建鳳, 等. 烴基酚類(lèi)化合物結(jié)構(gòu)與毒性關(guān)系研究[J]. 環(huán)境化學(xué), 2011, 30(2): 495-499
Liao L M, Qing D H, Li J F, et al. Quantitative structure-toxicity relationship study of alkylphenols [J]. Environmental Chemistry, 2011, 30(2): 495-499 (in Chinese)
[11] 朱文杰, 汪杰, 陳曉耘, 等. 發(fā)光細(xì)菌一新種-青海弧菌[J]. 海洋與湖沼, 1994, 25(3): 273-280
Zhu W J, Wang J, Chen X Y, et al. A new species of luminous bacteria Vibrio qinghaiensis SP. Nov. [J]. Oceanologia Et Limnologia Sinaca, 1994, 25(3): 273-280 (in Chinese)
[12] 朱文杰. 一種新型的環(huán)境污染檢測(cè)方法[J]. 化學(xué)世界, 2009, 4: 247-250
Zhu W J. A new method of the environmental toxicity assay [J]. Chemical World, 2009, 4: 247-250 (in Chinese)
[13] 姜丹, 周建國(guó), 李娜, 等. 有機(jī)磷酸酯對(duì)青?;【鶴67毒性的構(gòu)效關(guān)系[J]. 生態(tài)毒理學(xué)報(bào), 2014, 9(1): 71-80
Jiang D, Zhou J G, Li N, et al. Quantitative structure-activity relationships between acute toxicity of organophosphates and Vibrio qinghaiensis sp. -Q67 [J]. Asian Journal of Ecotoxicology, 2014, 9(1): 71-80 (in Chinese)
[14] 張瑾, 劉樹(shù)深, 王成林, 等. 離子液體與廢水對(duì)青?;【鶴67的混合毒性研究[J]. 環(huán)境科學(xué)學(xué)報(bào), 2013, 33(3): 850-855
Zhang J, Liu S S, Wang C L, et al. Combined toxicity of ionic liquids and industrial wastewater on Vibrio qinghaiensis sp. -Q67 [J]. Acta Scientiae Circumstantiae, 2013, 33(3): 850-855 (in Chinese)
[15] 李曉, 李娜, 饒凱鋒, 等. 苯并噻唑類(lèi)污染物對(duì)青?;【鶴67毒性效應(yīng)[J]. 生態(tài)毒理學(xué)報(bào), 2015, 10(2): 167-172
Li X, Li N, Rao K F, et al. Toxicities of benzothiazole and benzothiazole derivatives (BTs) to Vibrio qinghaiensis sp. -Q67 [J]. Asian Journal of Ecotoxicology, 2015, 10(2): 167-172 (in Chinese)
[16] Du X H, Zhuang W C, Shi X Q, et al. Research on thermodynamic properties of polybrominated diphenylamine by neural network [J]. Chinese Journal of Chemical Physics, 2015, 28(1): 59-64.
[17] 堵錫華. 用新的路徑定位指數(shù)和神經(jīng)網(wǎng)絡(luò)研究多溴聯(lián)苯醚理化性質(zhì)[J]. 化工學(xué)報(bào), 2014, 65(4): 1169-1178
Du X H. Physicochemical property of polybrominated diphenyl ethers by new path location index and neural network [J]. CIESC Journal, 2014, 65(4): 1169-1178 (in Chinese)
[18] 王甫洋, 張學(xué)勝, 劉輝. 幾種酚衍生物對(duì)青海弧菌Q67毒性的3D-QSAR研究[J]. 環(huán)境科學(xué)學(xué)報(bào), 2012, 32(11): 2884-2890
Wang F Y, Zhang X S, Liu H. 3D-QSAR study on the toxicities of phenol derivatives to Vibrio-qinghaiensis sp. -Q67 [J]. Acta Scientiae Circumstantiae, 2012, 32(11): 2884-2890 (in Chinese)
[19] 張婷, 梁逸曾, 趙晨曦, 等. 基于分子結(jié)構(gòu)預(yù)測(cè)氣相色譜程序升溫保留指數(shù)[J]. 分析化學(xué), 2006, 34(11): 1607-1610
Zhang T, Liang Y Z, Zhao C X, et al. Prediction of temperature-programmed retention indices from molecule structures [J].Chinese Journal of Analytical Chemistry, 2006, 34(11): 1607-1610 (in Chinese)
[20] Kier L B, Hall L H. Molecular Connectivity in Chemistry and Drug Research [M]. New York: Academic Press, 1976: 82
[21] 許祿, 邵學(xué)廣. 化學(xué)計(jì)量學(xué)方法[M]. 北京: 科學(xué)出版社, 2004: 441
Xu L, Shao X G. Methods of Chemometrics [M]. Beijing: Science Press, 2004: 441 (in Chinese)
Prediction of the Toxicity of Phenol Derivatives to Vibrio-qinghaiensis by Neural Network Method
Du Xihua, Wang Chao*
School of Chemistry and Chemical Engineering, Xuzhou Institute of Technology, Xuzhou 221111, China
Vibrio-qinghaiensis is very sensitive to toxic phenol derivatives. In order to establish quantitative structure-activity model (QSAR) of phenol derivatives to Vibrio-qinghaiensis, the relationship between molecular structure of 16 kinds of phenol derivatives and the toxicity to Vibrio-qinghaiensis was analyzed. Moreover, the molecular connectivity indices and spatial shape indices of phenol derivatives were calculated. The molecular connectivity index,1χ, and spatial shape indices, K2and K4, were screened. Then, multi-linear method was applied in analyzing the three indices and the toxicity to Vibrio-qinghaiensis. The determination coefficient R2was 0.971. In order to improve accuracy, the three indices were used as input variables of neural network and the toxicity was used as output variable, the 3:2:1 network structure was adopted and back propagation (BP) neural network method was used to establish a satisfying QSAR model. The total correlation coefficient r was 0.996. The predicted values were very close to experimental values, and the relative mean error was 1.98%, which showed that the model had good predictive ability of the toxicity of phenol derivatives. Futhermore, neural network method had more obvious statistical significance than multi-linear method.
phenol derivatives; Vibrio-qinghaiensis; molecular connectivity index; molecular shape index; quantitative structure - activity model
國(guó)家自然科學(xué)基金項(xiàng)目(No.21472071,No.21473081)
堵錫華(1963—),教授,研究方向?yàn)榄h(huán)境污染物構(gòu)效學(xué)研究,E-mail: 12dxh@sina.com
*通訊作者(Corresponding author), E-mail: wangc@jsnu.edu.cn
10.7524/AJE.1673-5897.20160205003
2016-02-05 錄用日期:2016-06-27
1673-5897(2016)4-090-05
X171.5
A
簡(jiǎn)介:王超(1960-),男,理學(xué)博士,教授,主要研究方向?yàn)閼?yīng)用電化學(xué)。
堵錫華, 王超. 神經(jīng)網(wǎng)絡(luò)法應(yīng)用于酚類(lèi)化合物對(duì)青?;【拘缘念A(yù)測(cè)[J]. 生態(tài)毒理學(xué)報(bào),2016, 11(4): 90-94
Du X H, Wang C. Prediction of the toxicity of phenol derivatives to Vibrio-qinghaiensis by neural network method [J]. Asian Journal of Ecotoxicology, 2016, 11(4): 90-94 (in Chinese)