童偉達(dá)
(美國(guó)食品藥品監(jiān)督管理局,美國(guó)國(guó)家毒理研究中心,生物信息學(xué)與生物統(tǒng)計(jì)學(xué)研究部,美國(guó)杰佛遜72079)
內(nèi)分泌干擾物層級(jí)篩選中的定量構(gòu)效關(guān)系
童偉達(dá)
(美國(guó)食品藥品監(jiān)督管理局,美國(guó)國(guó)家毒理研究中心,生物信息學(xué)與生物統(tǒng)計(jì)學(xué)研究部,美國(guó)杰佛遜72079)
大量的科學(xué)研究、監(jiān)管和大眾媒體一直關(guān)注于內(nèi)分泌干擾物,它們主要是能夠模仿天然激素功能的合成化學(xué)物質(zhì)。法律要求開發(fā)一種程序,用以篩選和測(cè)試水和食品添加劑中是否含有潛在內(nèi)分泌干擾物。根據(jù)法規(guī),大量的化學(xué)品將會(huì)接受各種體外和體內(nèi)的實(shí)驗(yàn)用以測(cè)試其潛在荷爾蒙的活性,例如雌激素活性。因此,需要對(duì)這些化學(xué)物質(zhì)進(jìn)行分層篩選,以降低測(cè)試成本及加快篩選和測(cè)試的速度。在已經(jīng)開發(fā)的內(nèi)分泌干擾物知識(shí)數(shù)據(jù)庫(kù)(EDKB)項(xiàng)目中,將實(shí)驗(yàn)和建模進(jìn)行了整合,以便于更加高效地進(jìn)行優(yōu)先級(jí)的設(shè)置。
內(nèi)分泌干擾物;知識(shí)庫(kù);定量構(gòu)效關(guān)系;雌激素活性
通過實(shí)驗(yàn)研究發(fā)現(xiàn),大量的環(huán)境化學(xué)物質(zhì),被稱為內(nèi)分泌干擾物(EDCs),可能是通過模仿天然激素而擾亂動(dòng)物、野生物和人類的內(nèi)分泌功能的。目前,科學(xué)界、政府監(jiān)管部門和公眾對(duì)于環(huán)境中的EDCs對(duì)人類及野生物產(chǎn)生不利影響這一情況給予越來越多的關(guān)注[1]。EDCs對(duì)動(dòng)物及野生物產(chǎn)生的不良影響已在實(shí)驗(yàn)中被發(fā)現(xiàn),它對(duì)于人類的潛在影響包括:生殖和發(fā)育毒性、致癌作用、免疫毒性和神經(jīng)毒性等。EDCs可通過多種機(jī)制發(fā)揮不利影響,其中尤以雌激素受體(ER)介導(dǎo)毒性機(jī)制的影響最大。
圍繞EDCs科學(xué)性的辯論爭(zhēng)議,部分原因是有些人懷疑EDCs是高產(chǎn)量且對(duì)經(jīng)濟(jì)有重要影響的化學(xué)物質(zhì),如雙酚A(PBA)和鄰苯二甲酸鹽。這樣的擔(dān)憂導(dǎo)致了政府的監(jiān)管行為,且研究范圍已擴(kuò)展到整個(gè)歐洲、日本和北美。美國(guó)國(guó)會(huì)于1996年授權(quán)環(huán)境保護(hù)署(EPA)制定相關(guān)戰(zhàn)略以篩選和測(cè)試從飲用水、食品添加劑及其他物質(zhì)中發(fā)現(xiàn)的大量化學(xué)物質(zhì)(超過58 000種化學(xué)制品)對(duì)內(nèi)分泌干擾的可能性[2]。
優(yōu)先級(jí)設(shè)置的目的是為了對(duì)大量的化學(xué)物質(zhì)按照最重要到最不重要的順序排序以用于其他更多的資源密集型的評(píng)價(jià)。有許多的標(biāo)準(zhǔn)可用于這個(gè)目的,例如產(chǎn)量、在環(huán)境中的持久性及生命周期、人類接觸水平等。實(shí)驗(yàn)需要的58 000種化學(xué)物質(zhì)中,大多數(shù)沒有生物數(shù)據(jù)。計(jì)算方法如定量構(gòu)效關(guān)系(QSAR方法)可以為優(yōu)先級(jí)設(shè)置提供第一手的生物效應(yīng)信息。定量構(gòu)效關(guān)系已在分子設(shè)計(jì)與藥物發(fā)現(xiàn)領(lǐng)域中被證明是成功的[3],特別是對(duì)受體結(jié)合活性的預(yù)測(cè),可用于評(píng)估未經(jīng)測(cè)試的化學(xué)物質(zhì)以提供在優(yōu)先級(jí)設(shè)定中所需的生物數(shù)據(jù)[4]。
考慮到需要一個(gè)具備訪問地址的信息系統(tǒng),同時(shí)該系統(tǒng)專注于整合大量源自實(shí)驗(yàn)的內(nèi)分泌干擾物數(shù)據(jù),包括雌激素、雄激素及其他內(nèi)分泌物等,美國(guó)食品與藥物管理局(FDA)所管轄的國(guó)家毒理學(xué)研究中心(NCTR)開發(fā)了內(nèi)分泌干擾物知識(shí)數(shù)據(jù)庫(kù)(EDKB)項(xiàng)目[5]。對(duì)于不同實(shí)驗(yàn)結(jié)果的收集使得對(duì)大量化學(xué)物質(zhì)進(jìn)行比較研究變?yōu)榭赡?同時(shí)為定量構(gòu)效關(guān)系模型的發(fā)展提供了基礎(chǔ),從而對(duì)潛在內(nèi)分泌干擾物的優(yōu)先級(jí)排序提供實(shí)驗(yàn)驗(yàn)證。
自1997年以來EDKB一直在線,且被政府、學(xué)術(shù)界及私營(yíng)部門所使用(見圖1,其中“05上”、“05下”分別表示2005年上半年和2005年下半年,余類推)。該數(shù)據(jù)庫(kù)是免費(fèi)且完全公開的,其網(wǎng)址為http://edkb.fda.gov/webstart/edkb/index.html。
圖1 內(nèi)分泌干擾物知識(shí)數(shù)據(jù)庫(kù)的用戶使用歷史圖Fig.1 User history of the EDKB database
EDKB項(xiàng)目的啟動(dòng)是為了幫助解決對(duì)EDCs的監(jiān)管問題。在線數(shù)據(jù)庫(kù)涉及的的化學(xué)品,涵蓋了范圍廣泛的被政府監(jiān)管的產(chǎn)品包括殺蟲劑、化學(xué)廢物、有毒金屬、食品添加劑等。
同時(shí)具備搜索化學(xué)結(jié)構(gòu)和生物活性功能的EDKB,對(duì)于監(jiān)管和研究是必不可少的。其他國(guó)家政府也已經(jīng)實(shí)施了類似的戰(zhàn)略,啟動(dòng)了諸如Tox21和ToxCast項(xiàng)目,用于為美國(guó)和其他國(guó)家的監(jiān)管部門提供研究較少的重要物質(zhì)的生物活性簡(jiǎn)況[6]。值得注意的是,雖然Tox21和ToxCast計(jì)劃旨在提供豐富的化學(xué)毒性信息,但是它們不像EDKB,不提供EDCs的特定領(lǐng)域知識(shí)。
構(gòu)效分析的基本假設(shè)是根據(jù)物質(zhì)的結(jié)構(gòu)預(yù)測(cè)它的化學(xué)生物活動(dòng)[7]?;瘜W(xué)結(jié)構(gòu)能夠通過所謂的分子描述符進(jìn)行定量表征。一種化學(xué)物質(zhì)的分子描述符可以由計(jì)算方式確定,該方式比體內(nèi)或體外實(shí)驗(yàn)方式更快捷和高效。經(jīng)過統(tǒng)計(jì)驗(yàn)證的QSAR模型能夠替代費(fèi)時(shí)、費(fèi)力的化學(xué)合成和生物評(píng)價(jià)方式來預(yù)測(cè)一種新型化學(xué)物的生物活性。如果運(yùn)用得當(dāng),定量構(gòu)效關(guān)系可以節(jié)省大量的時(shí)間、金錢和人力資源。當(dāng)被應(yīng)用于大量的化學(xué)物的時(shí)候,QSAR的優(yōu)先級(jí)設(shè)置可更高效。當(dāng)幾個(gè)端點(diǎn)同時(shí)分析時(shí),其高效率的優(yōu)勢(shì)更加明顯。
開發(fā)QSAR模型的第一步是獲取一個(gè)已知其活性的化學(xué)物質(zhì)訓(xùn)練數(shù)據(jù)集;其次,計(jì)算出代表單個(gè)化學(xué)物質(zhì)的分子結(jié)構(gòu)(即疏水性,結(jié)構(gòu)性片段,帶電的表面面積,氫鍵數(shù)量,溶解度等的數(shù)值)的描述符;然后,通過采用不同的統(tǒng)計(jì)方法來評(píng)估訓(xùn)練數(shù)據(jù)集的描述符與活性之間的相關(guān)性以確定最具有統(tǒng)計(jì)學(xué)意義的顯著關(guān)系(QSAR模型);最后,需要一個(gè)適當(dāng)?shù)尿?yàn)證來確保該模型對(duì)于不在數(shù)據(jù)集中的化學(xué)物質(zhì)仍然具有預(yù)測(cè)能力。經(jīng)過充分驗(yàn)證后,模型便可用來預(yù)測(cè)未經(jīng)檢驗(yàn)的潛在內(nèi)分泌干擾物的活性。
Tong等[8-12]已經(jīng)開發(fā)了一些用以配體結(jié)合的雌激素受體的QSAR模型。我們則采取了一個(gè)循環(huán)的過程(圖2)將實(shí)驗(yàn)和QSAR模型融為一體。這一過程以一組化學(xué)物質(zhì)的初始數(shù)據(jù)集運(yùn)行為起點(diǎn),而該數(shù)據(jù)集來源于與QSAR模型相關(guān)的文獻(xiàn)。接下來,初步的QSAR模型被用于定義潛在的一組化學(xué)物質(zhì),這將有利于進(jìn)一步提高模型的穩(wěn)健性和預(yù)測(cè)能力。當(dāng)對(duì)新的化學(xué)物質(zhì)進(jìn)行了實(shí)驗(yàn)分析后,新數(shù)據(jù)將用于優(yōu)化并改善QSAR模型。該過程中包含內(nèi)外部檢驗(yàn),而不同檢驗(yàn)都對(duì)該模型的預(yù)測(cè)能力提供不同的置信水平。圖3[13]舉例描述了一個(gè)同時(shí)具備化學(xué)物質(zhì)結(jié)構(gòu)多樣性及大范圍生物活性的雌激素結(jié)合訓(xùn)練數(shù)據(jù)集。
圖2 利用國(guó)立毒理學(xué)研究中心運(yùn)用的循環(huán)過程發(fā)展預(yù)測(cè)雌激素受體結(jié)合的QSAR模型Fig.2 Depiction of the recursive process used by NCTR to develop QSAR models for predicting estrogen receptor binding
圖3 232種化學(xué)物質(zhì)根據(jù)國(guó)立毒理學(xué)研究中心實(shí)驗(yàn)的化學(xué)分類和結(jié)合活性的分布圖Fig.3 The distribution of chemical classes and binding activity for 232 chemicals assayed by NCTR
在此過程中,特別強(qiáng)調(diào)模型的檢驗(yàn)步驟,以確保該模型以優(yōu)先設(shè)置為目的的預(yù)測(cè)能力。具體來說,該模型首先用缺1交叉檢驗(yàn)法進(jìn)行驗(yàn)證。在該方法中,集合中的每個(gè)化學(xué)物質(zhì)被系統(tǒng)性地從數(shù)據(jù)集中排除一次,之后,通過數(shù)據(jù)集中的其余化學(xué)品獲得的模型,預(yù)測(cè)其自身的活性。這種內(nèi)部檢驗(yàn)方法在訓(xùn)練數(shù)據(jù)集范圍內(nèi)評(píng)估了推斷能力。有時(shí)候,我們采用缺N交叉驗(yàn)證,以實(shí)現(xiàn)更強(qiáng)大的內(nèi)部驗(yàn)證;類似于缺1法,當(dāng)將數(shù)據(jù)集隨意地分成N組后,可以系統(tǒng)性地隨機(jī)排除一組化學(xué)物質(zhì)。當(dāng)額外的數(shù)據(jù)可用時(shí),該模型被用于預(yù)測(cè)不在訓(xùn)練數(shù)據(jù)集中的已知其活性(實(shí)驗(yàn)組)的數(shù)據(jù)。這種外部驗(yàn)證用于評(píng)估該模型對(duì)于未經(jīng)測(cè)試的化學(xué)物質(zhì)的預(yù)測(cè)力。
每次模型受到挑戰(zhàn),結(jié)果可進(jìn)一步確認(rèn)其有效性、限制性或可離群值的預(yù)測(cè)。反過來,該模型的失敗會(huì)提供重要的信息。這可能包括對(duì)于新數(shù)據(jù)需要的識(shí)別,該數(shù)據(jù)庫(kù)以對(duì)活性、對(duì)結(jié)構(gòu)的依賴性的合理理解為基礎(chǔ)。另外,它可以幫助闡明哪種機(jī)制在一個(gè)特定的化學(xué)反應(yīng)中可能起的重要作用,例如,描述從拮抗劑到興奮劑,或界定新陳代謝是重要的。無論模型失敗的原因在哪,本質(zhì)來講,研究的假設(shè)應(yīng)當(dāng)有助于催生新的數(shù)據(jù)和改善訓(xùn)練數(shù)據(jù)集,并有利于改進(jìn)生物模型。
內(nèi)分泌干擾物對(duì)人類和野生動(dòng)物存在潛在的不利影響。模擬雌激素并與雌激素受體結(jié)合的可能性可通過計(jì)算的方式如QSAR方法進(jìn)行預(yù)測(cè)。QSAR方法可以作為優(yōu)先級(jí)設(shè)置的工具,確定需要通過實(shí)驗(yàn)來評(píng)估的化學(xué)物質(zhì)。即便如此,需要注意的是任何模型的預(yù)測(cè),本質(zhì)上都不會(huì)比用于建模的實(shí)驗(yàn)數(shù)據(jù)好。而任何用以產(chǎn)生訓(xùn)練數(shù)據(jù)集數(shù)據(jù)的實(shí)驗(yàn)分析的限制,同樣也會(huì)影響模型的預(yù)測(cè)性。
參考文獻(xiàn):
[1]KAVLOCK R J,DASTON G P,DEROSA C,et al.Research needs for the risk assessment of health and environmental effects of endocrine disruptors:a report of the U.S.EPA-sponsored workshop[J].Environ Health Perspect,1996,104(Sup 4):715-740.
[2]US-Congress.The safe drinking water act[M].California, USA:USC,1996.
[3]HANSCH C,LEO A.Exploring QSAR—Fundamentals and applications in chemistry and biology[M].Washington,DC:The American Chemical Society,1995.
[4]WALKER J D,GRAY D A.Handbook on quantitative structure activity relationships(QSARs)for predicting effects of chemicals on environmental-human health interactions[M].Walker JD Pensacola,FL.:SETAC Press,2001.
[5]DING D,XU L,FANG H,et al.The EDKB:An established knowledge base for endocrine disrupting chemicals [J].BMC Bioinformatics,2010,11(Sup 6):S5.
[6]KLEINSTREUER N C,DIX D J,HOUCK K A,et al. In vitro perturbations of targets in cancer hallmark processes predict rodent chemical carcinogenesis[J].Toxicol Sci,2013,131(1):40-55.
[7]JOHNSON M,MAGGIORA G M.Concepts and applications of molecular similarity[M].New York:Wiley,1990.
[8]TONG W,PERKINS R,STRELITZ R,et al.Quantitative structure-activity relationships(QSARs)for estrogen binding to the estrogen receptor:predictions across species[J]. Environ Health Perspect,1997,105(10):1116-1124.
[9]TONG W,PERKINS R,XING L,et al.QSAR models for binding of estrogenic compounds to estrogen receptor alpha and beta subtypes[J].Endocrin,1997,138(9):4022-4025.
[10]TONG W,LOWIS D R,PERKINS R,et al.Evaluation of quantitative structure-activity relationship methods for large-scale prediction of chemicals binding to the estrogen receptor[J].JChemInfComputSci,1998,38(4):669-677.
[11]TONG W,XIE Q,HONG H,et al.Assessment of prediction confdence and domain extrapolation of two structureactivity relationship models for predicting estrogen receptor binding activity[J].Environ Health Perspect,2004, 112(12):1249-1254.
[12]TONG W,HONG H,FANG H,et al.Decision forest:combining the predictions of multiple independent decision tree models[J].J Chem Inf Comput Sci,2003,43(2):525-531.
[13]FANG H,TONG W,SHI L,et al.Structure activity relationship for a large diverse set of natural,synthetic and environmentalchemicals[J].ChemResToxicol,2001,14(3): 280-294.
Quantitative Structure-Activity Relationships(QSARs)for Priority Setting of Endocrine Disrupting compounds(EDCs)
TONG Wei-da
(U.S.Food and Drug Administration,National Center for Toxicological Research(NCTR),Division of Bioinformatics and Biostatistics,Jefferson,AR 72079,USA)
Considerable scientifc,regulatory and popular press attention has been devoted to the Endocrine Disrupting Chemicals (EDCs)which are predominantly synthetic chemicals with an ability of mimicking the functions of natural hormones.The legislation requires development of a screening and testing program for potential EDCs in drinking water and food additives.Under the legislation, a large number of chemicals will undergo various in vitro and in vivo assays for their potential hormonal activities such as estrogenicity. There is a crucial need to set priority for these chemicals to reduce the cost and speed the screening and testing process.We have developed an Endocrine Disruptor Knowledge Base(EDKB)project where experimentation and modeling were integrated to assist the priority setting process.
endocrine disrupting chemicals(EDCs);knowledge base;quantitative structure-activity relationships(QSARs);estrogenicity
X503
A
童偉達(dá),博士,美國(guó)食品與藥品監(jiān)督管理局國(guó)家毒理研究中心(FDA/NCTR)生物信息學(xué)與生物統(tǒng)計(jì)學(xué)系主任,兼任阿肯色大學(xué)小石城分校(UALR)教授。童博士已發(fā)表200多篇論文,被引用6 000多次,H指數(shù)為42。他所帶領(lǐng)的部門承擔(dān)發(fā)展生物信息學(xué)方法與標(biāo)準(zhǔn)來支持FDA在藥物、醫(yī)療器械等方面的研究與管理,并推動(dòng)管理的科學(xué)性與個(gè)體化醫(yī)療。團(tuán)隊(duì)中最具代表性的項(xiàng)目有:(1)開發(fā)了FDA生物信息學(xué)系統(tǒng),ArrayTrackTM套件,以支持FDA對(duì)藥物基因組學(xué)的研究與評(píng)審;(2)所引領(lǐng)的芯片質(zhì)量控制協(xié)會(huì)(MAQC)為轉(zhuǎn)化科學(xué)以及個(gè)體化醫(yī)療提供標(biāo)準(zhǔn);(3)基于藥物安全性研究開發(fā)了肝毒性知識(shí)庫(kù)(LTKB)等。童博士的研究工作中采用大量腫瘤細(xì)胞體外藥敏篩選、基因組學(xué)、生物信息學(xué)等技術(shù)和手段。
1001-4543(2014)03-0183-05
2014-05-15
童偉達(dá)(1961–),男,上海人,教授,博士,主要研究方向?yàn)樯镄畔W(xué)方法與標(biāo)準(zhǔn)。電子郵箱wtong@nctr.fda.gov。
免責(zé)聲明:本文中提出的觀點(diǎn)并不一定反映美國(guó)食品藥品監(jiān)督管理局目前或未來的觀點(diǎn)或政策。任何提及的商業(yè)產(chǎn)品只是一種說明,并不能作為認(rèn)可。
上海第二工業(yè)大學(xué)學(xué)報(bào)2014年3期