雷蕾 王新洲 張黎 楊策 亢力 朱永亮 錢(qián)向平 葉祖光
摘要:目的 探討計(jì)算機(jī)毒性預(yù)測(cè)技術(shù)和方法,為中藥安全性評(píng)價(jià)提供新的途徑。方法 采用Mold2軟件(version 2.0.0)對(duì)7409個(gè)中藥化學(xué)成分進(jìn)行分子描述符計(jì)算,初步篩選后采用隨機(jī)森林算法進(jìn)行定量構(gòu)效關(guān)系(QSAR)模型構(gòu)建,篩選出最優(yōu)預(yù)測(cè)模型,并對(duì)2010年版《中華人民共和國(guó)藥典》所載83個(gè)有毒中藥中有化學(xué)成分單體結(jié)構(gòu)報(bào)道的60種中藥(1692個(gè)化學(xué)成分)進(jìn)行急性毒性的預(yù)測(cè)。結(jié)果 經(jīng)篩選,最終得到數(shù)據(jù)7409條。當(dāng)描述符集合為52個(gè)時(shí),隨機(jī)森林算法建模模型準(zhǔn)確度和Kappa值較高,分別為0.712和0.436;根據(jù)最優(yōu)分子描述符集(52個(gè))表征的化學(xué)空間距離將化合物聚類(lèi)分為3類(lèi),第1類(lèi)化合物最優(yōu)模型的準(zhǔn)確度和Kappa值分別為0.666和0.476,第2類(lèi)化合物最優(yōu)模型的準(zhǔn)確度和Kappa值分別為0.804和0.381,第3類(lèi)化合物最優(yōu)模型的準(zhǔn)確度和Kappa值分別為0.709和0.373。預(yù)測(cè)60種中藥(1692個(gè)化學(xué)成分)中含劇毒化合物0個(gè)、高毒化合物2個(gè)、中毒化合物172個(gè)和低毒化合物1518個(gè)。結(jié)論 采用QSAR模型對(duì)中藥化學(xué)成分進(jìn)行急性毒性預(yù)測(cè)研究可為聯(lián)合用藥和進(jìn)一步實(shí)驗(yàn)研究提供參考。
關(guān)鍵詞:定量構(gòu)效關(guān)系;預(yù)測(cè)模型;急性毒性;中藥化學(xué)成分;大鼠
DOI:10.3969/j.issn.1005-5304.2016.01.010
中圖分類(lèi)號(hào):R2-05;R285.5 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1005-5304(2016)01-0043-04
QSAR Study on Toxicity of Chemical Components of Chinese Materia Medica and Acute Toxicity of Rats LEI Lei1, WANG Xin-zhou2, ZHANG Li1, YANG Ce1, KANG Li1, ZHU Yong-liang2, QIAN Xiang-ping2, YE Zu-guang3 (1. Institute of Information on TCM, China Academy of Chinese Medical Sciences, Beijing 100700, China; 2. Suzhou Neupharma Co. Ltd., Suzhou 215123, China; 3. Institute of Chinese Materia Medica, China Academy of Chinese Medical Sciences, Beijing 100700, China)
Abstract: Objective To study computer toxicity prediction technology and predict the acute toxicity of Chinese materia medica; To provide a new way and method for safety evaluation of traditional Chinese medicine. Methods First, Mold2 software (version 2.0.0) was used to calculate molecular descriptors of 7409 chemical components. After preliminary screening of molecular descriptors, quantitative structure-activity relationship (QSAR) models were built up with Random Forest (RF) for screening the optimum prediction model. From the 83 kinds of toxic Chinese materia medica in Chinese Pharmacopoeia (2010 edition), acute toxicity of 60 kinds of Chinese materia medica reported from monomer structure (1692 chemical components) were under prediction. Results Totally 7409 pieces of data were obtained. When the descriptors were 52, RF modeling accuracy and Kappa were the highest, 0.712 and 0.436 respectively. Compound clusters were divided into 3 types according to optimum molecule descriptors (52). The accuracy and Kappa of the optimum model for the first type of compounds were 0.666 and 0.476 respectively; the accuracy and Kappa of the optimum model for the second type of compounds were 0.804 and 0.381 respectively; the accuracy and Kappa of the optimum model for the third type of compounds were 0.709 and 0.373 respectively. It was predicted that 60 kinds of Chinese materia medica containing 0 violent toxic compound, 2 high toxic compounds, 172 medium toxic compounds and 1518 low toxic compound. Conclusion QSAR model for prediction study on acute toxicity of chemical components of Chinese mareria medica can provide references combination medication and experimental studies.
Key words: quantitative structure-activity relationship; prediction model; acute toxicity; chemical components of Chinese materia medica; rats
急性毒性是指機(jī)體(人或動(dòng)物)一次(或24 h內(nèi)多次)接觸外來(lái)化合物之后所引起的中毒效應(yīng)。一般而言,進(jìn)行藥物毒理學(xué)研究時(shí)常首先進(jìn)行急性毒性實(shí)驗(yàn),從而對(duì)藥物毒性有初步了解,為下一步深入毒理學(xué)研究提供基礎(chǔ)數(shù)據(jù)。但是,急性毒性實(shí)驗(yàn)耗資多,動(dòng)物損耗大,根據(jù)毒理學(xué)當(dāng)前的3R(Reduction、Replacement、Refinement)趨勢(shì)[1-2],本研究旨在建立計(jì)算機(jī)毒性預(yù)測(cè)技術(shù)和方法,預(yù)測(cè)中藥的急性毒性,以代替常規(guī)的動(dòng)物實(shí)驗(yàn)。本文使用定量構(gòu)效關(guān)系(quantitative structure-activity relationship,QSAR)方法建立中藥化學(xué)成分對(duì)大鼠的急性毒性預(yù)測(cè)模型,并對(duì)部分有毒中藥可能的急性毒性進(jìn)行預(yù)測(cè),為中藥安全性評(píng)價(jià)提供新的途徑和方法。
1 資料與方法
1.1 數(shù)據(jù)來(lái)源
計(jì)算機(jī)檢索化學(xué)物質(zhì)毒性數(shù)據(jù)庫(kù)(Registry of Toxic Effects of Chemical Substances,RTECS,http:// www.cdc.gov/niosh/rtecs/default.html)和中藥化學(xué)數(shù)據(jù)庫(kù)(TCMD)2009版(http://www.caigou.com.cn/c53722/ product_683110.shtml)。檢索策略:①搜集急毒數(shù)據(jù)的實(shí)驗(yàn)條件限定為check;②實(shí)驗(yàn)動(dòng)物為大鼠(rat)[3];③給藥途徑為口服(oral或orl);④毒性終點(diǎn)為半數(shù)致死量(LD50)[4]。
1.2 研究方法
1.2.1 數(shù)據(jù)預(yù)處理 化合物原始數(shù)據(jù)篩選:①去冗;②去除不確切數(shù)值;③統(tǒng)一毒性終點(diǎn)單位(mg/kg);④根據(jù)Lipinsk's 5規(guī)則,限定分子量為1000以?xún)?nèi);⑤去除非有機(jī)物;⑥去除有機(jī)金屬化合物;⑦去除各類(lèi)鹽。
按照中國(guó)的相關(guān)急性毒性分級(jí)標(biāo)準(zhǔn)[5],并參考文獻(xiàn)[6]方法將大鼠經(jīng)口LD50值分為4個(gè)級(jí)別:劇毒(<5 mg/kg)、高毒(5~50 mg/kg)、中毒(50~500 mg/kg)和低毒(>500 mg/kg)。
1.2.2 描述符的計(jì)算和挑選 采用美國(guó)國(guó)家毒理研究中心生物信息中心開(kāi)發(fā)的Mold2軟件(version 2.0.0),可對(duì)每個(gè)化合物的2D結(jié)構(gòu)計(jì)算777個(gè)分子描述符。
在建立QSAR模型時(shí),對(duì)描述的挑選是非常重要的。(1)使用R軟件對(duì)777個(gè)2D描述符首先剔除了超過(guò)總數(shù)90%的計(jì)算值為恒定值的描述符;在此基礎(chǔ)上除去兩兩相關(guān)系數(shù)高于0.9的2個(gè)描述符中的1個(gè),確保描述符之間沒(méi)有嚴(yán)重的依賴(lài)關(guān)系;然后對(duì)余下的描述符間存在的多元相關(guān)性的進(jìn)行剔除。(2)分子描述符篩選步驟:①利用Bootstrap重采樣方法將數(shù)據(jù)分成訓(xùn)練集和測(cè)試集2類(lèi);②基于訓(xùn)練集數(shù)據(jù),利用所有的描述符,構(gòu)建預(yù)測(cè)模型,并對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè)評(píng)價(jià),同時(shí)基于預(yù)測(cè)結(jié)果對(duì)參與構(gòu)建模型的變量進(jìn)行評(píng)價(jià)并排序;③選取不同個(gè)數(shù)的最重要描述符,并基于訓(xùn)練集數(shù)據(jù)利用隨機(jī)森林算法構(gòu)建模型,利用Leave-10%-out交叉驗(yàn)證方法進(jìn)行比較,選擇最優(yōu)模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè)評(píng)價(jià);④重復(fù)前3個(gè)步驟,統(tǒng)計(jì)分析不同數(shù)目最重要描述符所構(gòu)建模型的預(yù)測(cè)情況,并決定最優(yōu)描述符集。
1.2.3 建立預(yù)測(cè)模型 建立“分類(lèi)定量結(jié)構(gòu)毒性關(guān)系模型法”,即首先根據(jù)最優(yōu)化學(xué)描述符集表征的化學(xué)空間對(duì)訓(xùn)練集的化合物使用層次聚類(lèi)方法進(jìn)行聚類(lèi)研究,然后針對(duì)每一類(lèi)化合物分別建立QSAR模型。本研究對(duì)每一類(lèi)化合物分別使用隨機(jī)森林算法、主成分分析方法和逐步線性回歸方法構(gòu)建QSAR模型,對(duì)模型的準(zhǔn)確度進(jìn)行比較,選出最優(yōu)模型。采用準(zhǔn)確度[7]和Kappa值[8]2個(gè)參數(shù)來(lái)評(píng)價(jià)模型的優(yōu)劣。
1.2.4 對(duì)有毒中藥包含的化學(xué)成分進(jìn)行預(yù)測(cè) 使用構(gòu)建的最優(yōu)QSAR模型對(duì)2010年版《中華人民共和國(guó)藥典》所載83個(gè)有毒中藥中有化學(xué)成分單體結(jié)構(gòu)報(bào)道的60種中藥(1692個(gè)化學(xué)成分)進(jìn)行急性毒性預(yù)測(cè)。
2 結(jié)果
2.1 數(shù)據(jù)檢出情況
經(jīng)過(guò)檢索,從RTECS數(shù)據(jù)庫(kù)中獲得16 076條數(shù)據(jù),從2009版TCMD數(shù)據(jù)庫(kù)中獲得取得30條數(shù)據(jù)。經(jīng)篩選,最終得到數(shù)據(jù)7409條。
2.2 描述符的篩選結(jié)果
使用Mold2軟件對(duì)7409個(gè)化學(xué)成分的分子描述符進(jìn)行計(jì)算,然后根據(jù)“1.2.2”項(xiàng)中方法進(jìn)行初步篩選,得到276個(gè)分子描述符。隨后,使用隨機(jī)森林算法隨機(jī)選取不同數(shù)量的分子描述符集合進(jìn)行模型構(gòu)建,并計(jì)算模型的準(zhǔn)確度和Kappa值。如圖1所示,當(dāng)描述符集合為52個(gè)時(shí),隨機(jī)森林算法建模模型準(zhǔn)確度和Kappa值最高,分別為0.712和0.436,因此這52個(gè)分子描述符集合為最優(yōu)分子描述符。
圖1 選取不同描述符集合時(shí)預(yù)測(cè)模型的準(zhǔn)確度和Kappa值
2.3 建立分類(lèi)定量構(gòu)效關(guān)系預(yù)測(cè)模型
根據(jù)最優(yōu)分子描述符集(52個(gè))表征的化學(xué)空間距離,采用層次聚類(lèi)方法將7409個(gè)化合物聚類(lèi)分為3類(lèi)。第1類(lèi)為2803個(gè)化合物,第2類(lèi)為1687個(gè)化合物,第3類(lèi)為2919個(gè)化合物。
對(duì)于每一類(lèi)化合物,均采用隨機(jī)森林算法,并從52個(gè)分子描述符中隨機(jī)選取不同數(shù)量分子描述符,分別構(gòu)建預(yù)測(cè)模型,通過(guò)計(jì)算模型的準(zhǔn)確度和Kappa值來(lái)確定分類(lèi)后最優(yōu)模型。可以看出,第1類(lèi)化合物最優(yōu)模型準(zhǔn)確度和Kappa值分別為0.666和0.476(見(jiàn)圖2),第2類(lèi)化合物最優(yōu)模型準(zhǔn)確度和Kappa值分別為0.804和0.381(見(jiàn)圖3),第3類(lèi)化合物最優(yōu)模型準(zhǔn)確度和Kappa值分別為0.709和0.373(見(jiàn)圖4)。
2.4 對(duì)中藥化學(xué)成分急性毒性的預(yù)測(cè)
對(duì)60種中藥(1692個(gè)化學(xué)成分)進(jìn)行急性毒性預(yù)測(cè),其中第1類(lèi)化合物1311個(gè)、第2類(lèi)化合物102個(gè)、第3類(lèi)化合物279個(gè)。預(yù)測(cè)結(jié)果為劇毒化合物0個(gè)、高毒化合物2個(gè)(0.1%)、中毒化合物172個(gè)(10.2%)和低毒化合物1518個(gè)(89.7%)。包含高毒或中等毒成分較多的中藥有白果、艾葉、川烏、半夏、馬錢(qián)子、吳茱萸等,包含低毒成分較多的中藥有巴豆、白果、川烏、九里香、京大戟等。
2.5 文獻(xiàn)驗(yàn)證
通過(guò)文獻(xiàn)進(jìn)一步驗(yàn)證QSAR模型的準(zhǔn)確度,即從預(yù)測(cè)結(jié)果中找出目前有文獻(xiàn)報(bào)道的結(jié)果進(jìn)行比較。結(jié)果表明,在預(yù)測(cè)的1692個(gè)化合物中,有文獻(xiàn)報(bào)道的15個(gè),其中與預(yù)測(cè)結(jié)果一致的10個(gè),一致比例為66.7%。
3 討論
目前,以計(jì)算機(jī)為輔助手段的計(jì)算毒理學(xué)已經(jīng)被廣泛應(yīng)用于新藥毒性評(píng)價(jià),來(lái)預(yù)測(cè)藥物在人體內(nèi)可能的代謝產(chǎn)物及毒性。計(jì)算機(jī)毒性預(yù)測(cè)能夠在藥物研究早期階段剔除先導(dǎo)化合物中存在毒性的化合物,是縮短藥物開(kāi)發(fā)時(shí)間和降低經(jīng)費(fèi)開(kāi)支的有效途徑之一[9-10]。我國(guó)計(jì)算毒理學(xué)的研究發(fā)展較快,張氏等[11]建立了取代芳烴類(lèi)化合物環(huán)境綠藻的毒性(48 h半抑制濃度)與其分子結(jié)構(gòu)之間的結(jié)構(gòu)-毒性定量關(guān)系模型。高氏等[12]應(yīng)用人工神經(jīng)網(wǎng)絡(luò)技術(shù)構(gòu)建的QSAR模型對(duì)松花江水中的有機(jī)化學(xué)品的毒性進(jìn)行了預(yù)測(cè)。
隨著中醫(yī)藥現(xiàn)代化和國(guó)際化進(jìn)程,中藥嚴(yán)重不良反應(yīng)事件屢見(jiàn)不鮮。如20世紀(jì)90年代含馬兜鈴酸成分中藥腎毒性事件[13]、21世紀(jì)初的魚(yú)腥草注射劑過(guò)敏致死事件[14]、千里光不良反應(yīng)事件[15]等,中藥的安全性研究受到重視,成為熱門(mén)領(lǐng)域。急性毒性的測(cè)定是中藥安全性評(píng)價(jià)的重要方面,中藥及其化學(xué)成分的急性毒性報(bào)道也越來(lái)越多[16-18]。
本研究采用的RTECS數(shù)據(jù)庫(kù)收集化合物23 033種,其中8000種成分有藥理數(shù)據(jù)。涉及中藥藥用植物6735種,參考文獻(xiàn)5507篇(截至2005年),200種細(xì)胞水平抗癌模型,包括細(xì)胞因子網(wǎng)絡(luò)調(diào)節(jié)機(jī)制抗炎模型、各種抗氧化模型、酶抑制劑模型、NO抑制劑模型等。本研究基于該數(shù)據(jù)構(gòu)建了QSAR模型,采用先分類(lèi)后構(gòu)建預(yù)測(cè)模型的方法,首先使用層次聚類(lèi)方法,根據(jù)最優(yōu)分子描述符集(52個(gè))表征的化學(xué)空間距離將7409個(gè)化合物聚類(lèi)分為3類(lèi),然后使用隨機(jī)森林算法針對(duì)3類(lèi)分別建立預(yù)測(cè)模型,模型的準(zhǔn)確度分別為0.666、0.804和0.709。在對(duì)60種有毒中藥包含的1692個(gè)化學(xué)成分進(jìn)行預(yù)測(cè)時(shí),先對(duì)化學(xué)成分進(jìn)行歸類(lèi),然后使用相應(yīng)的預(yù)測(cè)模型進(jìn)行預(yù)測(cè)。結(jié)果表明,預(yù)測(cè)的中藥化學(xué)成分的急性毒性低毒化合物占89.7%,中毒化合物占10.2%,高毒化合物占0.1%,無(wú)劇毒化合物。從中藥整體的化合物急性毒性分布圖可直觀看出,多數(shù)中藥含有的都是急性毒性低毒性化合物,但也不乏中毒和高毒化合物所占比例較高的中藥,如川烏、半夏等,表明在用藥過(guò)程中引起急性毒性的可能性較大。從文獻(xiàn)報(bào)道的情況看,關(guān)于中藥及其化學(xué)成分的急性毒性研究還比較少,研究結(jié)果可以為其提供參考。由于QSAR模型的準(zhǔn)確度和訓(xùn)練集化學(xué)成分直接相關(guān),隨著中藥化學(xué)成分急性毒性研究的增加,訓(xùn)練集的不斷豐富,預(yù)測(cè)模型的準(zhǔn)確度會(huì)有所提高。
參考文獻(xiàn):
[1] FLECKNELL P. Replacement, reduction and refinement[J]. ALTEX, 2002,19(2):73-78.
[2] GRUBER FP, Hartung T. Alternatives to animal experimentation in basic research[J]. ALTEX,2004,21(Suppl1):3-31.
[3] 郝光榮.實(shí)驗(yàn)動(dòng)物學(xué)[M].上海:第二軍醫(yī)大學(xué)出版社,2004:101-110.
[4] 趙軍寧,葉祖光.中藥毒性理論與安全性評(píng)價(jià)[M].北京:人民衛(wèi)生出版社,2012:274.
[5] 尹松年.工業(yè)化學(xué)品毒性鑒定規(guī)范及實(shí)驗(yàn)方法[M].北京:人民衛(wèi)生出版社,1998:124.
[6] 農(nóng)業(yè)部.農(nóng)藥登記毒理學(xué)試驗(yàn)方法:GB 15670-1995[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,1996:207-217.
[7] 孫燕,臧傳新,任廷革,等.支持向量機(jī)方法在《傷寒論》方分類(lèi)建模中的應(yīng)用[J].中國(guó)中醫(yī)藥信息雜志,2007,14(1):101-102.
[8] 孫西慶.腦血辨證之腦病證候與頭風(fēng)病證候?qū)Ρ确治鯷J].中國(guó)中醫(yī)藥信息雜志,2008,15(6):21-24.
[9] VALERIO L G Jr. In silico toxicology for the pharmaceutical sciences[J]. Toxicology and Applied Pharmacology,2009,241(3):356-370.
[10] 朱永亮,葉祖光.計(jì)算毒理學(xué)與中藥毒性預(yù)測(cè)的研究進(jìn)展[J].中國(guó)新藥雜志,2011,20(24):2424-2429.
[11] 張亞輝,劉征濤,劉樹(shù)深,等.MEDV描述子預(yù)測(cè)取代芳烴類(lèi)化合物的藻毒性[J].環(huán)境科學(xué)研究,2009,22(7):823-827.
[12] 高大文,王鵬.松花江水中有機(jī)化學(xué)品的生物毒性預(yù)測(cè)[J].哈爾濱商業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,20(5):549-551.
[13] LORD G M. Nepyhropathy caused by Chinese herbs in the UK[J]. Lancet,1999,354:481.
[14] 郭瑩.魚(yú)腥草等7種注射劑暫停使用[N].人民日?qǐng)?bào),2006-06-02(2).
[15] 梁愛(ài)華,葉祖光.千里光屬植物的毒性研究進(jìn)展[J].中國(guó)中藥雜志, 2006,31(2):93.
[16] 艾霞,徐恩亞.中藥川貝對(duì)小鼠急性毒性和致突變性的研究[J].安徽農(nóng)業(yè)科學(xué),2014,42(9):2615-2616.
[17] 艾麗萍,高順.中藥羅漢果對(duì)小鼠急性毒性和致突變性研究[J].安徽農(nóng)業(yè)科學(xué),2014,42(3):774-775.
[18] 陳敏,易文燕,俸婷婷,等.川楝子正丁醇部位對(duì)小白鼠的急性毒性[J].貴州農(nóng)業(yè)科學(xué),2015,43(1):108-110.
(收稿日期:2015-04-27)
(修回日期:2015-06-12;編輯:向宇雁)