雷蕾,王新洲,張黎,楊策,亢力,朱永亮,錢向平,葉祖光
1.中國中醫(yī)科學院中醫(yī)藥信息研究所,北京 100700;2.蘇州潤新生物科技有限公司,江蘇 蘇州 215123;3.中國中醫(yī)科學院中藥研究所,北京 100700
中藥化學成分對大鼠急性毒性的定量構效關系研究
雷蕾1,王新洲2,張黎1,楊策1,亢力1,朱永亮2,錢向平2,葉祖光3
1.中國中醫(yī)科學院中醫(yī)藥信息研究所,北京 100700;2.蘇州潤新生物科技有限公司,江蘇 蘇州 215123;3.中國中醫(yī)科學院中藥研究所,北京 100700
目的 探討計算機毒性預測技術和方法,為中藥安全性評價提供新的途徑。方法 采用Mold2軟件(version 2.0.0)對7409個中藥化學成分進行分子描述符計算,初步篩選后采用隨機森林算法進行定量構效關系(QSAR)模型構建,篩選出最優(yōu)預測模型,并對2010年版《中華人民共和國藥典》所載83個有毒中藥中有化學成分單體結構報道的60種中藥(1692個化學成分)進行急性毒性的預測。結果 經(jīng)篩選,最終得到數(shù)據(jù)7409條。當描述符集合為52個時,隨機森林算法建模模型準確度和Kappa值較高,分別為0.712和0.436;根據(jù)最優(yōu)分子描述符集(52個)表征的化學空間距離將化合物聚類分為3類,第1類化合物最優(yōu)模型的準確度和Kappa值分別為0.666和0.476,第2類化合物最優(yōu)模型的準確度和Kappa值分別為0.804和0.381,第3類化合物最優(yōu)模型的準確度和Kappa值分別為0.709和0.373。預測60種中藥(1692個化學成分)中含劇毒化合物0個、高毒化合物2個、中毒化合物172個和低毒化合物1518個。結論 采用QSAR模型對中藥化學成分進行急性毒性預測研究可為聯(lián)合用藥和進一步實驗研究提供參考。
定量構效關系;預測模型;急性毒性;中藥化學成分;大鼠
Key words: quantitative structure-activity relationship; prediction model; acute toxicity; chemical components of Chinese materia medica; rats
急性毒性是指機體(人或動物)一次(或24 h內(nèi)多次)接觸外來化合物之后所引起的中毒效應。一般而言,進行藥物毒理學研究時常首先進行急性毒性實驗,從而對藥物毒性有初步了解,為下一步深入毒理學研究提供基礎數(shù)據(jù)。但是,急性毒性實驗耗資多,動物損耗大,根據(jù)毒理學當前的3R(Reduction、Replacement、Refinement)趨勢[1-2],本研究旨在建立計算機毒性預測技術和方法,預測中藥的急性毒性,以代替常規(guī)的動物實驗。本文使用定量構效關系(quantitative structure-activity relationship,QSAR)方法建立中藥化學成分對大鼠的急性毒性預測模型,并對部分有毒中藥可能的急性毒性進行預測,為中藥安全性評價提供新的途徑和方法。
1.1 數(shù)據(jù)來源
計算機檢索化學物質(zhì)毒性數(shù)據(jù)庫(Registry of Toxic Effects of Chemical Substances,RTECS,http:// www.cdc.gov/niosh/rtecs/default.html)和中藥化學數(shù)據(jù)庫(TCMD)2009版(http://www.caigou.com.cn/c53722/ product_683110.shtml)。檢索策略:①搜集急毒數(shù)據(jù)的實驗條件限定為check;②實驗動物為大鼠(rat)[3];③給藥途徑為口服(oral或orl);④毒性終點為半數(shù)致死量(LD50)[4]。
1.2 研究方法
1.2.1 數(shù)據(jù)預處理 化合物原始數(shù)據(jù)篩選:①去冗;②去除不確切數(shù)值;③統(tǒng)一毒性終點單位(mg/kg);④根據(jù)Lipinsk's 5規(guī)則,限定分子量為1000以內(nèi);⑤去除非有機物;⑥去除有機金屬化合物;⑦去除各類鹽。
按照中國的相關急性毒性分級標準[5],并參考文獻[6]方法將大鼠經(jīng)口LD50值分為4個級別:劇毒(<5 mg/kg)、高毒(5~50 mg/kg)、中毒(50~500 mg/kg)和低毒(>500 mg/kg)。
1.2.2 描述符的計算和挑選 采用美國國家毒理研究中心生物信息中心開發(fā)的Mold2軟件(version 2.0.0),可對每個化合物的2D結構計算777個分子描述符。
在建立QSAR模型時,對描述的挑選是非常重要的。(1)使用R軟件對777個2D描述符首先剔除了超過總數(shù)90%的計算值為恒定值的描述符;在此基礎上除去兩兩相關系數(shù)高于0.9的2個描述符中的1個,確保描述符之間沒有嚴重的依賴關系;然后對余下的描述符間存在的多元相關性的進行剔除。(2)分子描述符篩選步驟:①利用Bootstrap重采樣方法將數(shù)據(jù)分成訓練集和測試集2類;②基于訓練集數(shù)據(jù),利用所有的描述符,構建預測模型,并對測試集數(shù)據(jù)進行預測評價,同時基于預測結果對參與構建模型的變量進行評價并排序;③選取不同個數(shù)的最重要描述符,并基于訓練集數(shù)據(jù)利用隨機森林算法構建模型,利用Leave-10%-out交叉驗證方法進行比較,選擇最優(yōu)模型對測試集數(shù)據(jù)進行預測評價;④重復前3個步驟,統(tǒng)計分析不同數(shù)目最重要描述符所構建模型的預測情況,并決定最優(yōu)描述符集。
1.2.3 建立預測模型 建立“分類定量結構毒性關系模型法”,即首先根據(jù)最優(yōu)化學描述符集表征的化學空間對訓練集的化合物使用層次聚類方法進行聚類研究,然后針對每一類化合物分別建立QSAR模型。本研究對每一類化合物分別使用隨機森林算法、主成分分析方法和逐步線性回歸方法構建QSAR模型,對模型的準確度進行比較,選出最優(yōu)模型。采用準確度[7]和Kappa值[8]2個參數(shù)來評價模型的優(yōu)劣。
1.2.4 對有毒中藥包含的化學成分進行預測 使用構建的最優(yōu)QSAR模型對2010年版《中華人民共和國藥典》所載83個有毒中藥中有化學成分單體結構報道的60種中藥(1692個化學成分)進行急性毒性預測。
2.1 數(shù)據(jù)檢出情況
經(jīng)過檢索,從RTECS數(shù)據(jù)庫中獲得16 076條數(shù)據(jù),從2009版TCMD數(shù)據(jù)庫中獲得取得30條數(shù)據(jù)。經(jīng)篩選,最終得到數(shù)據(jù)7409條。
2.2 描述符的篩選結果
使用Mold2軟件對7409個化學成分的分子描述符進行計算,然后根據(jù)“1.2.2”項中方法進行初步篩選,得到276個分子描述符。隨后,使用隨機森林算法隨機選取不同數(shù)量的分子描述符集合進行模型構建,并計算模型的準確度和Kappa值。如圖1所示,當描述符集合為52個時,隨機森林算法建模模型準確度和Kappa值最高,分別為0.712和0.436,因此這52個分子描述符集合為最優(yōu)分子描述符。
圖1 選取不同描述符集合時預測模型的準確度和Kappa值
2.3 建立分類定量構效關系預測模型
根據(jù)最優(yōu)分子描述符集(52個)表征的化學空間距離,采用層次聚類方法將7409個化合物聚類分為3類。第1類為2803個化合物,第2類為1687個化合物,第3類為2919個化合物。
對于每一類化合物,均采用隨機森林算法,并從52個分子描述符中隨機選取不同數(shù)量分子描述符,分別構建預測模型,通過計算模型的準確度和Kappa值來確定分類后最優(yōu)模型??梢钥闯?,第1類化合物最優(yōu)模型準確度和Kappa值分別為0.666和0.476(見圖2),第2類化合物最優(yōu)模型準確度和Kappa值分別為0.804和0.381(見圖3),第3類化合物最優(yōu)模型準確度和Kappa值分別為0.709和0.373(見圖4)。
2.4 對中藥化學成分急性毒性的預測
對60種中藥(1692個化學成分)進行急性毒性預測,其中第1類化合物1311個、第2類化合物102個、第3類化合物279個。預測結果為劇毒化合物0個、高毒化合物2個(0.1%)、中毒化合物172個(10.2%)和低毒化合物1518個(89.7%)。包含高毒或中等毒成分較多的中藥有白果、艾葉、川烏、半夏、馬錢子、吳茱萸等,包含低毒成分較多的中藥有巴豆、白果、川烏、九里香、京大戟等。
2.5 文獻驗證
通過文獻進一步驗證QSAR模型的準確度,即從預測結果中找出目前有文獻報道的結果進行比較。結果表明,在預測的1692個化合物中,有文獻報道的15個,其中與預測結果一致的10個,一致比例為66.7%。
圖3 第2類化合物QSAR模型的準確度和Kappa值
圖4 第3類化合物QSAR模型的準確度和Kappa值
目前,以計算機為輔助手段的計算毒理學已經(jīng)被廣泛應用于新藥毒性評價,來預測藥物在人體內(nèi)可能的代謝產(chǎn)物及毒性。計算機毒性預測能夠在藥物研究早期階段剔除先導化合物中存在毒性的化合物,是縮短藥物開發(fā)時間和降低經(jīng)費開支的有效途徑之一[9-10]。我國計算毒理學的研究發(fā)展較快,張氏等[11]建立了取代芳烴類化合物環(huán)境綠藻的毒性(48 h半抑制濃度)與其分子結構之間的結構-毒性定量關系模型。高氏等[12]應用人工神經(jīng)網(wǎng)絡技術構建的QSAR模型對松花江水中的有機化學品的毒性進行了預測。
隨著中醫(yī)藥現(xiàn)代化和國際化進程,中藥嚴重不良反應事件屢見不鮮。如20世紀90年代含馬兜鈴酸成分中藥腎毒性事件[13]、21世紀初的魚腥草注射劑過敏致死事件[14]、千里光不良反應事件[15]等,中藥的安全性研究受到重視,成為熱門領域。急性毒性的測定是中藥安全性評價的重要方面,中藥及其化學成分的急性毒性報道也越來越多[16-18]。
本研究采用的RTECS數(shù)據(jù)庫收集化合物23 033種,其中8000種成分有藥理數(shù)據(jù)。涉及中藥藥用植物6735種,參考文獻5507篇(截至2005年),200種細胞水平抗癌模型,包括細胞因子網(wǎng)絡調(diào)節(jié)機制抗炎模型、各種抗氧化模型、酶抑制劑模型、NO抑制劑模型等。本研究基于該數(shù)據(jù)構建了QSAR模型,采用先分類后構建預測模型的方法,首先使用層次聚類方法,根據(jù)最優(yōu)分子描述符集(52個)表征的化學空間距離將7409個化合物聚類分為3類,然后使用隨機森林算法針對3類分別建立預測模型,模型的準確度分別為0.666、0.804和0.709。在對60種有毒中藥包含的1692個化學成分進行預測時,先對化學成分進行歸類,然后使用相應的預測模型進行預測。結果表明,預測的中藥化學成分的急性毒性低毒化合物占89.7%,中毒化合物占10.2%,高毒化合物占0.1%,無劇毒化合物。從中藥整體的化合物急性毒性分布圖可直觀看出,多數(shù)中藥含有的都是急性毒性低毒性化合物,但也不乏中毒和高毒化合物所占比例較高的中藥,如川烏、半夏等,表明在用藥過程中引起急性毒性的可能性較大。從文獻報道的情況看,關于中藥及其化學成分的急性毒性研究還比較少,研究結果可以為其提供參考。由于QSAR模型的準確度和訓練集化學成分直接相關,隨著中藥化學成分急性毒性研究的增加,訓練集的不斷豐富,預測模型的準確度會有所提高。
[1] FLECKNELL P. Replacement, reduction and refinement[J]. ALTEX, 2002,19(2):73-78.
[2] GRUBER FP, Hartung T. Alternatives to animal experimentation in basic research[J]. ALTEX,2004,21(Suppl1):3-31.
[3] 郝光榮.實驗動物學[M].上海:第二軍醫(yī)大學出版社,2004:101-110.
[4] 趙軍寧,葉祖光.中藥毒性理論與安全性評價[M].北京:人民衛(wèi)生出版社,2012:274.
[5] 尹松年.工業(yè)化學品毒性鑒定規(guī)范及實驗方法[M].北京:人民衛(wèi)生出版社,1998:124.
[6] 農(nóng)業(yè)部.農(nóng)藥登記毒理學試驗方法:GB 15670-1995[S].北京:中國標準出版社,1996:207-217.
[7] 孫燕,臧傳新,任廷革,等.支持向量機方法在《傷寒論》方分類建模中的應用[J].中國中醫(yī)藥信息雜志,2007,14(1):101-102.
[8] 孫西慶.腦血辨證之腦病證候與頭風病證候對比分析[J].中國中醫(yī)藥信息雜志,2008,15(6):21-24.
[9] VALERIO L G Jr. In silico toxicology for the pharmaceutical sciences[J]. Toxicology and Applied Pharmacology,2009,241(3):356-370.
[10] 朱永亮,葉祖光.計算毒理學與中藥毒性預測的研究進展[J].中國新藥雜志,2011,20(24):2424-2429.
[11] 張亞輝,劉征濤,劉樹深,等.MEDV描述子預測取代芳烴類化合物的藻毒性[J].環(huán)境科學研究,2009,22(7):823-827.
[12] 高大文,王鵬.松花江水中有機化學品的生物毒性預測[J].哈爾濱商業(yè)大學學報(自然科學版),2004,20(5):549-551.
[13] LORD G M. Nepyhropathy caused by Chinese herbs in the UK[J]. Lancet,1999,354:481.
[14] 郭瑩.魚腥草等7種注射劑暫停使用[N].人民日報,2006-06-02(2).
[15] 梁愛華,葉祖光.千里光屬植物的毒性研究進展[J].中國中藥雜志, 2006,31(2):93.
[16] 艾霞,徐恩亞.中藥川貝對小鼠急性毒性和致突變性的研究[J].安徽農(nóng)業(yè)科學,2014,42(9):2615-2616.
[17] 艾麗萍,高順.中藥羅漢果對小鼠急性毒性和致突變性研究[J].安徽農(nóng)業(yè)科學,2014,42(3):774-775.
[18] 陳敏,易文燕,俸婷婷,等.川楝子正丁醇部位對小白鼠的急性毒性[J].貴州農(nóng)業(yè)科學,2015,43(1):108-110.
QSAR Study on Toxicity of Chemical Components of Chinese Materia Medica and Acute Toxicity of Rats
LEI Lei1, WANG Xin-zhou2, ZHANG Li1, YANG Ce1, KANG Li1, ZHU Yong-liang2,
QIAN Xiang-ping2, YE Zu-guang3(1. Institute of Information on TCM, China Academy of Chinese Medical Sciences, Beijing 100700, China; 2. Suzhou Neupharma Co. Ltd., Suzhou 215123, China; 3. Institute of Chinese Materia Medica, China Academy of Chinese Medical Sciences, Beijing 100700, China)
Objective To study computer toxicity prediction technology and predict the acute toxicity of Chinese materia medica; To provide a new way and method for safety evaluation of traditional Chinese medicine. Methods First, Mold2 software (version 2.0.0) was used to calculate molecular descriptors of 7409 chemical components. After preliminary screening of molecular descriptors, quantitative structure-activity relationship (QSAR) models were built up with Random Forest (RF) for screening the optimum prediction model. From the 83 kinds of toxic Chinese materia medica in Chinese Pharmacopoeia (2010 edition), acute toxicity of 60 kinds of Chinese materia medica reported from monomer structure (1692 chemical components) were under prediction. Results Totally 7409 pieces of data were obtained. When the descriptors were 52, RF modeling accuracy and Kappa were the highest, 0.712 and 0.436 respectively. Compound clusters were divided into 3 types according to optimum molecule descriptors (52). The accuracy and Kappa of the optimum model for the first type of compounds were 0.666 and 0.476 respectively; the accuracy and Kappa of the optimum model for the second type of compounds were 0.804 and 0.381 respectively; the accuracy and Kappa of the optimum model for the third type of compounds were 0.709 and 0.373 respectively. It was predicted that 60 kinds of Chinese materia medica containing 0 violent toxic compound, 2 high toxic compounds, 172 medium toxic compounds and 1518 low toxic compound. Conclusion QSAR model for prediction study on acute toxicity of chemical components of Chinese mareria medica can provide references combination medication and experimental studies.
10.3969/j.issn.1005-5304.2016.01.010
R2-05;R285.5
A
1005-5304(2016)01-0043-04
2015-04-27)
(
2015-06-12;編輯:向宇雁)
國家自然科學基金(81173652)
葉祖光,E-mail:yezuguang@sina.com