李媛媚, 周彥伊, 王 志, 開振鵬
有機氟化合物急性毒性全息定量構效關系
李媛媚,周彥伊,王志,開振鵬
(上海應用技術學院化學與環(huán)境工程學院,上海201418)
運用分子全息定量構效關系(HQSAR)方法研究有機氟化合物對大鼠和小鼠的急性毒性.選擇對小鼠毒性為研究對象,碎片長度為4~7,碎片區(qū)分參數(shù)為原子類型、化學鍵類型、氫原子、氫鍵給體和受體時,得到最佳模型(r2=0.978,q2=0.821).選擇對大鼠毒性為研究對象,碎片長度為4~7,碎片區(qū)分參數(shù)為原子類型、連接性、氫原子和手性時,得到最佳模型(r2=0.908,q2=0.605).研究結果表明,所建模型具有良好的擬合效果和較高的預測能力.
有機氟化合物;全息定量構效關系;毒性預測
有機氟化合物由于其獨特的性質,已深入到生命科學、醫(yī)藥科學、材料科學等諸多學科,并在工業(yè)、醫(yī)學、航空航天以及國防等眾多領域得到廣泛應用[1].隨著對有機氟化合物研究的深入,其毒性也越來越受到人們關注.由于有機氟化合物具有高能量C—F共價鍵,難以水解、光解、被微生物降解或被動物體代謝,因此,其在環(huán)境中具有持久存在的特點,并可通過食物鏈蓄積[2].
化合物毒性實驗周期長、費用大,且很難得到準確可靠的結果,無法通過實驗方法得到所有化合物存在的風險.目前,國內學者和專家在有機化合物毒性評估方面越來越多地使用定量構效關系(Quantitative Structure-activity Relationship,QSAR)方法[3-7].1996年,陳曦等[8]研究過計算機技術在有機氟農藥構效關系中的應用;2003年,Martin等[9]對全氟酸在虹鱒魚組織的生物富集分布進行了探討;2009年,李秀菊[10]也對氟苯衍生物做了QSAR和定量構性關系(Quantitative Structure-property Relationship,QSPR)的研究,討論了氟苯衍生物對環(huán)境的影響和對人體健康的危害.全息定量構效關系(Hologram Quantitative Structure-activity Relationship,HQSAR)[11]是一種新型的QSAR方法. 在HQSAR研究中,小分子的結構被碎分為各種潛在的分子碎片,這些分子碎片的種類和數(shù)量信息經過編碼,成為分子的指紋信息(全息),并作為HQSAR的描述符進行統(tǒng)計分析.采用不同顏色對分子的各原子進行編碼,以反映各原子對生物活性的貢獻大小,從而可以快速指導新配體的合成,這是HQSAR最大的優(yōu)點[12-14].本文利用HQSAR方法建立了有機氟化合物結構與對大鼠和小鼠的急性毒性的定量構效關系,為有機氟化合物毒性預測提供了新的QSAR模型.
1.1數(shù)據(jù)的收集
所有有機氟化合物的結構和毒性數(shù)據(jù)均通過查找化合物毒性數(shù)據(jù)庫[http://chem.sis.nlm.nih. gov/chemidplus/]和文獻[15]得到,見表1、2.
表1 有機氟化合物對小鼠毒性的pIC50實驗值和預測值Tab.1 Organic fluorine compounds pIC50experimental and predictive value of toxicityin mice
續(xù)表1(Continuing table 1)
續(xù)表1(Continuing table 1)
表2 有機氟化物對大鼠毒性的p IC50實驗值和預測值Tab.2 Organic fluorine compounds p IC50experimental and predictive value of toxicity in rat
續(xù)表2(Continuing table 2)
續(xù)表2(Continuing table 2)
1.2數(shù)據(jù)結構的搭建和幾何優(yōu)化
所有化合物分子結構均用Sybyl X2.1軟件構建,通過Minimize模塊優(yōu)化.采用Powell能量梯度法,選取Tripos力場,加Gasteiger-Huckel電荷,收斂梯度設為0.21 kJ·(mol·nm)-1,迭代10 000次,得到化合物分子的最低能量構象.
1.3有機氟化合物HQSAR模型的建立與優(yōu)化
HQSAR計算及偏最小二乘回歸分析(PLS)均采用Tripos公司的Sybyl X2.1分子軟件包完成.
在研究小鼠的模型中,本文在63種多氟化合物中隨機選擇了7種化合物作為測試集;而在研究大鼠的模型中,在54中多氟化合物中隨機選擇了7種化合物作為測試集,并且測試集的結構和活性差異性與訓練集相當;默認的分子全息長度(HL)分別為53、59、61、71、83、97、151、199、257、307、353、401,通過對碎片區(qū)分參數(shù)和碎片大小的改變來優(yōu)化.碎片區(qū)分參數(shù)是表示分子全息中所映射的拓撲結構參數(shù),分為原子類型(A),化學鍵類型(B),連接性(C),氫原子(HA),手性(Ch),氫鍵給體和受體(DA).其中,原子類型用來區(qū)分原子的種類;區(qū)分原子間所形成的的化學鍵差異則利用化學鍵類型;連接性可以區(qū)分碎片內部原子雜化狀態(tài);手性可以顯示碎片中的原子手性以及化學鍵的立體化學信息;氫鍵給體和受體用來顯示碎片的氫鍵給體或受體情況.建立不同的碎片參數(shù)組合,選取不同碎片長度(2~5、3~6、4~7、5~8、6~9、7~10),構建HQSAR模型.
2.1小鼠HQSAR模型結果分析
2.1.1全息長度的確定
系統(tǒng)給出的可選全息長度為53~401范圍內預定的12個素數(shù):53、59、61、71、83、97、151、199、257、307、353、401,本文將12個全息長度全部選定進行計算.
2.1.2分子碎片參數(shù)的組合
本文嘗試了在默認長度(4~7)時,有31種碎片區(qū)分參數(shù)的組合方式,結果見表3,最好的結果是A/B/HA/DA組合,選為小鼠HQSAR模型建立的參數(shù)組合.
Tab.3 表H3Q SA小R鼠 a碎nal片ysi類s 型of的 fraHgQmSeA ntR ty分pe析 in mice
2.1.3分子碎片長度的確定
分子碎片長度表示全息指紋中所含碎片的原子個數(shù),代表不同的分子結構信息,分子全息的產生可以在不同碎片長度下進行[16-17].在確定了最優(yōu)分子碎片參數(shù)組合(A/B/HA/DA)后,改變碎片長度進行計算,以找到最優(yōu)的分子碎片長度,結果見表4.由表可見,4~7為該模型最優(yōu)的分子碎片長度.
2.1.4氟化合物對小鼠毒性的HQSAR模型
利用上述實驗中得出的最優(yōu)參數(shù),運用PLS方法,得到有機氟化合物對小鼠毒性的HQSAR模型.通過可視化的模型貢獻圖來指示分子中片段對多氟化合物毒性大小的影響,見圖1.由圖可見,在小鼠模型中,氟原子和氮原子同時存在時對化合物毒性貢獻最大,當苯環(huán)連接三氟甲基和氨基時,毒性增加尤其明顯.
表4 小鼠碎片長度的HQSAR分析Tab.4 HQSAR analysis of fragment size in mice
圖1 小鼠最優(yōu)HQSAR模型活性貢獻圖Fig.1 Contribution map of optimal HQSAR model in mice
2.2大鼠HQSAR模型結果分析
2.2.1全息長度的確定
與上文一樣,將12個全息長度全部選定進行大鼠HQSAR的計算.
2.2.2分子碎片參數(shù)的組合
本文嘗試了在默認長度(4~7)時,28種碎片區(qū)分參數(shù)的組合方式,結果見表5,最好的結果是A/C/HA/Ch組合,選為大鼠HQSAR模型建立的參數(shù)組合.
2.2.3分子碎片長度的確定
在確定了最優(yōu)分子碎片參數(shù)組合(A/C/HA/Ch)后,改變碎片長度進行計算,以找到最優(yōu)的分子碎片長度,見表6.由表可見,4~7為該模型最優(yōu)的分子碎片長度.
表5 大鼠碎片類型的HQSAR分析Tab.5 HQSAR analysis of fragment type in rat
表6 大鼠不同碎片長度的HQSAR分析Tab.6 HQSAR analysis of fragment size in rat
2.2.4氟化合物對大鼠毒性的HQSAR模型
在大鼠模型中,與氮原子相連的氫原子被氟原子取代時對化合物毒性貢獻最大,三氟甲基與苯環(huán)相連毒性也較大可視化活性模型貢獻圖見圖2.苯環(huán)上的氯原子對毒性無影響,這說明在今后對有機氟化合物的設計上,可以在苯環(huán)上引入氯原子.
圖2 大鼠最優(yōu)HQSAR模型活性貢獻圖Fig.2 Contribution map of optimal HQSAR model in rat
2.3利用HQSAR模型進行毒性預測
2.3.1HQSAR模型毒性預測能力驗證
利用所建立的小鼠HQSAR模型,預測了用于建模的所有有機氟化合物的毒性和其他已知毒性實驗值的2個化合物(見表1);并將預測值與實驗值進行線性回歸,R2=0.809 4,見圖3.同樣,利用所建立的大鼠HQSAR模型,預測了訓練集的所有有機氟化合物的毒性和其他已知毒性實驗值的3個化合物(見表2);并將預測值與實驗值進行線性回歸,R 2=0.886 2,見圖3.可以發(fā)現(xiàn),實驗值與預測值相比相差不大,說明實驗構建的模型具備良好的預測能力.
圖3 有機氟化合物毒性pIC50的實驗值與預測值線性關系Fig.3 Linear relationship between organic fluorine compounds toxicity pIC50experimental value and predictive value
2.3.2利用HQSAR模型預測未知毒性
本文利用此模型對已知結構的未知毒性的有機氟化合物進行毒性預測,對有機氟化工常用的梭曼和甲基磺酰氟也進行了毒性預測.
由訓練集和預測集的預測結果和所有63個化合物的毒性實測值和預測值的線性擬合圖(見圖3)發(fā)現(xiàn),實驗值與預測值相比相差不大,說明實驗構建的模型具備良好擬合效果和較高預測能力.
對已知pIC50值的多氟化合物進行預測,結果顯示,得到的實驗值與預測值相比相差不大,說明實驗構建的模型具備良好擬合效果和較高預測能力.再利用此模型對已知結構的未知毒性多氟化合物進行毒性預測(見表2),本文對(3,3,3-三氟丙基)二氯甲基硅烷、三氟乙酸乙酯進行了毒性預測.
本文用分子HQSAR方法分別對小鼠和大鼠進行研究,其中HQSAR模型中,分別利用63種和54種多氟化合物的毒性數(shù)據(jù)對大鼠和小鼠兩種物種構建模型,經過研究不同碎片區(qū)分參數(shù)以及碎片大小對模型質量的影響,尋找最優(yōu)模型,并對其預測能力進行評估.
(1)在選擇小鼠作為研究對象進行HQSAR研究時,最佳模型的r2=0.978,q2=0.821,SEP=0.660,SEE=0.459,最佳主成分數(shù)為6;在大鼠作為研究對象進行HQSAR研究時,最佳模型的r2=0.908,q2=0.605,SEP=1.478,SEE=1.113.
(2)得到大鼠和小鼠的HQSAR最優(yōu)模型后,對已知毒性數(shù)據(jù)和結構的多氟化合物進行毒性預測來驗證所建HQSAR的預測能力,通過實驗值與預測值的比較,發(fā)現(xiàn)兩者相差不大,說明本試驗中所建模型具備很好的預測能力和可靠性.
(3)在最優(yōu)HQSAR的條件下,通過對原子著色查看每個原子對化合物毒性的貢獻率查看,在小鼠模型中氟原子和氮原子同時存在時對化合物毒性貢獻最大,且當苯環(huán)上的碳與三氟甲基以及氨基相連時貢獻率增大.這說明在今后對化合物的設計上,應該避免此類情況,這樣能明顯降低化合物的毒性;在大鼠模型中與氮原子相連的氫原子被氟原子取代時對化合物毒性貢獻最大,三氟甲基與苯環(huán)相連貢獻率也較大,苯環(huán)上的氯原子對毒性無影響,說明在今后對化合物的設計上,應該在苯環(huán)上引入氯原子,這樣對化合物的毒性影響不大.
[1]Thayer A M.Fabulous flurine[J].C&E News,2006,84(23):29-30.
[2]Tomy G T,Budakowski W,Halldorson T,et al.Fluorinated organic compounds in an eastern Arctic marine food web[J].Environ Sci Technol,2004,38 (24):6475-6481.
[3]劉征濤.生態(tài)毒理學研究中分子構效相關的應用[J].環(huán)境科學,2001,14(1):53-56.
[4]高潔喜,沈英娃,曹洪法.中國生態(tài)毒理學研究現(xiàn)狀[J].環(huán)境科學研究,1997,10(3):54-58.
[5]白迺彬.定量構效關系(QSAR)在環(huán)境化學中的進展與方法[J].環(huán)境科學,1990,11(2):47-52.
[6]郭新竹,寧正祥.定量結構-活性相關法及其在食品研究中的應用前景[J].食品科學,2001,22(12):34-38.
[7]張小廣,李紹軍,劉漫丹.混合蟻群算法及其用于有機毒性的QSAR研究[J].計算機與應用化學,2009,26(5):23-28.
[8]陳曦,王麗君,林學圃,等.計算機技術在有機氟農藥構效關系研究中的應用[J].農藥,1996,35(11):16-17.
[9]Martin J W,Mabury S A,Solomon K R,et al. Bioconcentration and tissue distribution of perfluorinated acids in rainbow trout(oncorhynchus mykiss)[J].Environmental Toxicology and Chemistry,2003,22(1):196-204.
[10]李秀菊.部分農藥和氟苯衍生物的QSAR/QSPR研究[D].贛州:江西理工大學,2009.
[11]朱少敏.苯的衍生物的HQSAR研究[J].南京大學學報,2005,28(2):67-70.
[12]Winker D,Burden F.Holopraphic QSAR of benzodia-zepines[J].Quantiative Structure-activity Relationships,1998,7:224-231.
[13]Trossini G H G,Maltarollo V G,Schmidt T J. Hologram QSAR studies of antiprotozoal activities of sesquiterpene lactones[J].Molecules,2014,19(7):10546-10562.
[14]Tong W,Lowis D R,Perkins R,et al.Evaluation of quantitative structure-activity relationship methods for large-scale prediction of chemicals binding to the estrogen receptor[J].Journal of Chemical Information and Computer Sciences,1998,38(4):669-682.
[15]Bhhatarai B,Gramatica P.Per-and polyfluoro toxicity(LC50inhalation)study in rat and mouse using QSAR modeling[J].Chemical Research in Toxicology,2010,23(3):528-539.
[16]李華,張華北.3-吡啶基醚類化合物的分子全息QSAR研究[J].化學學報,2005,63(11):1018-1022.
[17]Ugarkar A G,Ambre P K,Coutinho E C,et al. Extracting structural requirements for activity of GPR119 agonists:a hologram quantitative structure activity relationship(HQASR)study[J].Can J Chem,2014,92(7):670-676.
(編輯呂丹)
HQSAR on the Acute Toxicity of Organic Fluorine Compounds
LI Yuanmei,ZHOU Yanyi,WANG Zhi,KAI Zhenpeng
(School of Chemical and Environmental Engineering,Shanghai Institute of Technology,Shanghai 201418,China)
Organic fluorine compounds and their acute toxicities on rat and mice were studied by the molecular hologram quantitative structure activity relationship(HQSAR).The optimal model(r2= 0.978,q2=0.821)for mice,the fragment size was 4-7,the fragment distinction parameters were atom types,bond type,hydrogen atom,hydrogen bond donor and receptor.The fragment size was set as 4-7 and the fragment distinction parameters were set as atom types,connectivity,hydrogen atom and chirality in the optimal model(r2=0.908,q2=0.605)for rat.The highly predictable and statistically meaningful HQSAR models were obtained,which proved usefulness in the acute toxicity prediction of organic fluorine compounds.
organic fluorine compounds;hologram quantitative structureactivity relationship(HQSAR); to xicity prediction
R 914.5
A
1671-7333(2015)03-0212-09
10.3969/j.issn.1671-7333.2015.03.002
2014-10-29
國家自然科學基金青年基金資助項目(21402122);上海應用技術學院引進人才基金資助項目(YJ2013-52)
李媛媚(1991-),女,碩士生,主要研究方向為新農藥創(chuàng)制.E-mail:lymkitty@126.com
開振鵬(1981-),男,講師,博士,主要研究方向為計算機輔助藥物設計、多肽、無脊椎動物生理生化.E-mail:kaizp@sit.edu.cn