劉志強, 王博龍
(宜春學院化學與生物工程學院, 江西 宜春336000)
中藥是指在傳統(tǒng)中醫(yī)藥理論、 辨證施治指導下, 用于預防和治療疾病的一類藥物[1-2]。 中醫(yī)藥在醫(yī)藥產(chǎn)業(yè)、 替代醫(yī)學等眾多領域發(fā)揮著不可替代的作用, 但因其化學成分復雜、 藥理作用機制不甚明確, 又受中藥材品種、 產(chǎn)地和制劑加工技術等因素的影響, 使得其在藥理研究、 質(zhì)控監(jiān)管以及現(xiàn)代化、 國際化發(fā)展中面臨巨大阻礙[3-4]。 傳統(tǒng)的藥理實驗為證明藥物對某個疾病的線性因果關系, 通常是設置對照試驗、 施加單一藥物因素, 研究其對某個靶蛋白的高親和力、 高特異性相互作用, 以揭示藥物對疾病的作用機制[5]。 但這與中醫(yī)藥辨證論治、 整體觀、 系統(tǒng)觀的醫(yī)療理念, 以及中藥“多組分、 多靶點、 多通路” 系統(tǒng)作用機制的研究理念是相悖的。 而且, 現(xiàn)代醫(yī)學研究表明腫瘤、心血管系統(tǒng)疾病、 神經(jīng)精神系統(tǒng)等諸多疾病是由多種遺傳、非遺傳因素, 多個靶點、 通路引起的復雜性疾病, 傳統(tǒng)的“一個靶點, 一種疾病, 一個藥物” 的研究模式, 已很難系統(tǒng)、 整體地闡明中藥藥效物質(zhì)基礎及其對復雜疾病的藥理作用機制[6-7]。
2007 年, Hopkins[8]首次提出了網(wǎng)絡藥理學的概念,2011 年, 李梢[9]又提出了網(wǎng)絡靶標等概念。 網(wǎng)絡藥理學等新理念相繼提出, 為中藥研究帶來了新的技術與方法, 其系統(tǒng)性、 整體性的研究理念與中藥復方多組分、 多功效、協(xié)同作用等特點是不謀而合的。 目前, 網(wǎng)絡藥理學在中藥藥理機制研究、 新藥發(fā)現(xiàn)、 藥物重新定位、 老藥新用以及不良反應、 毒副作用研究等方面取得了良好成效[10-11]。 張尊建等[12]運用代謝組學技術在疾病診斷、 網(wǎng)絡靶標發(fā)現(xiàn)方面取得顯著成效; 程肖蕊等[13]發(fā)現(xiàn)網(wǎng)絡藥理學實驗技術具有高通量、 可定量、 快速、 靈敏、 準確等特點, 除基因組、蛋白質(zhì)、 代謝組等組學外, 高通量/高內(nèi)涵技術、 雙高通量技術基因表達測序技術和分子相互作用技術在網(wǎng)絡藥理學研究中也有較好的應用前景。 中藥成分挖掘及靶標預測是網(wǎng)絡藥理學研究的基礎工作, 運用公共的中藥化學數(shù)據(jù)庫、 靶標數(shù)據(jù)庫、 基因組數(shù)據(jù)庫、 知識發(fā)現(xiàn)工具, 化合物-蛋白互作網(wǎng)絡及一站式中藥網(wǎng)絡藥理學分析平臺, 挖掘中藥藥效成分、 預測其潛在功能靶標, 構建“藥物-靶點-疾病” 網(wǎng)絡,闡明其“多組分、 多靶點、 多途徑” 的藥理機制, 已成為中藥網(wǎng)絡藥理學研究中必不可少的內(nèi)容。 鑒于中藥成分挖掘與靶標預測技術在網(wǎng)絡藥理學領域的重要性, 現(xiàn)就其常用的技術方法原理及在中藥研究中的應用情況進行總結。
中藥藥效物質(zhì)基礎是其所含有的有效化學成分, 但其所含成分十分復雜, 有效成分與非有效成分難以區(qū)分。 因此, 研究中藥有效成分的提取分離方法、 構建中藥化學成分數(shù)據(jù)庫, 對中藥網(wǎng)絡藥理學研究有重要意義[14]。 近年來, 國內(nèi)外許多科研院所、 課題組已成功建設了一批數(shù)據(jù)多元化、 涉及內(nèi)容廣的中藥、 天然藥物化學成分數(shù)據(jù)庫,并廣泛應用于中藥、 中藥及方劑的網(wǎng)絡藥理學研究。 目前常用的中藥、 天然化學成分數(shù)據(jù)庫, 見表1, 包括TCMSP[15]、 TCMID[16]、 TCMD[17]、 TCM@ TAIWAN[18]、 Herb-BioMap[19]、 HIT[20]、 TCMGeneDIT、 CHCD、 BPCD 等[18,21]。
TCMSP、 TCMID 是應用較多的2 個中藥化學數(shù)據(jù)庫與網(wǎng)絡藥理學分析平臺。 TCMSP 是由西北農(nóng)林科技大王永華團隊研發(fā)的一款系統(tǒng)藥理學分析服務器, 其通過文獻挖掘和數(shù)據(jù)庫整合, 得到500 味常用中藥、 30 069 個中藥化合物的藥物代謝動力學、 藥物化學和藥物-靶標蛋白網(wǎng)絡-疾病網(wǎng)絡的基本信息[15]。 TCMSP 構建的中藥化學分子庫較為全面, 在納入皂苷類中藥化合物時, 還特意區(qū)分加入了皂苷去糖形式的化合物, 編號M11043 的人參皂苷Rh2與編號為MM11044 的人參皂苷Rh2-qt 就因一個糖基的差別(圖1、 表2), 而造成化學參數(shù)的巨大差別。 TCMSP 特別將兩者區(qū)分, 分別納入, 使其中藥化學庫更加準確全面。
表1 中藥化學成分數(shù)據(jù)庫
圖1 人參皂苷化合物結構
表2 TCMSP 與TCMID 數(shù)據(jù)庫對比
TCMID 數(shù)據(jù)庫通過整合HIT、 TCM@ TAIWAN 等數(shù)據(jù)庫及文本挖掘等方法收集中藥化合物信息, 并利用STITCH、 HIT 數(shù)據(jù)庫、 文本檢索等方式預測化合物靶標,利用HPRD 構建蛋白互作網(wǎng)絡, 構建的一款中藥綜合數(shù)據(jù)庫[16]。 以中藥成分阿魏酸為例比較TCMSP、 TCMID 提供的信息功能, 見表3。 TCMSP 數(shù)據(jù)庫提供了包括中藥分子氫受體、 供體、 血腦屏障通透性等藥化、 藥動學參數(shù), 及其對應的潛在靶點、 疾病和中藥來源, 還包含一個mol2 格式三維結構文件, 就單一中藥化學成分信息而言, 比TCMID 數(shù)據(jù)庫內(nèi)容更加全面。 但TCMSP 數(shù)據(jù)庫總體上收錄的中藥品種不多, 浮小麥、 血竭、 五靈脂等常用藥均未收錄, 也不包含中藥方劑的信息, 因此實際運用中應綜合考慮TCMSP、 TCMID 數(shù)據(jù)庫。
TCMD 是由創(chuàng)騰科技公司和中科院過程工程研究所分子設計課題組聯(lián)合開發(fā)的綜合性中藥化學數(shù)據(jù)庫, 包含6 735種植物、 23 033 個中藥化合物, 每個中藥化合物含有CAS 號、 分子式、 來源、 藥理活性、 物理化學性質(zhì)等11 項數(shù)據(jù)[17]; TCM@TAIWAN 是由臺灣中國醫(yī)科大學研發(fā)的一款中藥篩選平臺, 收錄有352 味中藥的37 170 個化合物[18]。 2018 年, 霍曉乾等[22]在研究大黃利膽片網(wǎng)絡藥理機制時, 利用TCMD、 TCM@ TAIWAN 兩個數(shù)據(jù)庫收集到大黃利膽片中229 種大黃成分、 254 種余甘子成分以及21種手掌參成分, 并運用靶標預測技術、 蛋白互作網(wǎng)絡、 聚類分析技術, 闡釋了大黃利膽片在對免疫系統(tǒng)的綜合調(diào)節(jié)和對機體的營養(yǎng)代謝調(diào)節(jié)等方面發(fā)揮協(xié)同作用的配伍機制。
HerbBioMap 是一套集成數(shù)據(jù)庫, 搜錄整合了包括中藥信息數(shù)據(jù)、 中藥成分數(shù)據(jù)、 中藥藥對信息、 方劑信息數(shù)據(jù)、證候等多種信息數(shù)據(jù), 包含636 種常用中藥及10 838 種中藥成分等的基本信息[19]。 李梢團隊曾利用該數(shù)據(jù)庫, 成功揭示了葛根芩連方治療2 型糖尿病的網(wǎng)絡藥理機制[23]。HIT 則是收集Pubmed 數(shù)據(jù)庫中藥成分及其靶點信息, 并與TTD 靶點庫、 DrugBank 藥物數(shù)據(jù)庫、 UniProt 等數(shù)據(jù)庫整合連接組建的中藥成分靶標數(shù)據(jù)庫, 但該數(shù)據(jù)庫存在化學成分數(shù)據(jù)量 少、 信息不 足 等 缺點。 同 樣, TCMGeneDIT、CHCD、 BPCD 3 個數(shù)據(jù)庫也因其收錄的信息少、 相關報道不多, 在網(wǎng)絡藥理學研究中應用較少。
高效、 準確地預測中藥及其藥效成分潛在靶標是中藥網(wǎng)絡藥理學研究中的一個關鍵問題, 隨著藥物-靶標預測技術的發(fā)展, 許多舊的靶標服務器、 靶標預測工具已經(jīng)停止運行, 但越來越多的新的靶標預測工具已開始用于中藥網(wǎng)絡藥理學研究[24]。 靶標預測方法主要包括數(shù)據(jù)挖掘、 知識發(fā)現(xiàn)工具應用、 化合物-蛋白質(zhì)相互作用網(wǎng)絡構建、 藥效團模型匹配、 正反分子對接技術、 藥物-靶標相似性算法等,幾種方法各有利弊, 具體還要結合實際情況綜合分析利用[25]。 2016 年, 霍夢琪等[26]在研究川芎嗪治療冠心病的網(wǎng)絡機制時, 綜合運用疾病化學生物數(shù)據(jù)庫Chemprot、 化合物-蛋白相互作用分析平臺STITCH 4.0、 藥效團虛擬篩選等三種靶標預測方法, 發(fā)現(xiàn)川芎嗪能作用于白細胞介素8、過氧化物酶體增殖物激活受體γ、 血紅素加氧酶1 等10 種潛在靶標, 通過調(diào)節(jié)免疫、 炎癥反應、 細胞凋亡信號通路調(diào)控及血液循環(huán)等7 種途徑發(fā)揮治療冠心病的效果。 目前常用的靶標預測工具見表3, 包括網(wǎng)絡藥理學分析數(shù)據(jù)庫(TCMSP、 TCMID 等數(shù)據(jù)庫的檢索挖掘)、 Arrowsmith 知識發(fā)現(xiàn)工具[27]、 STITCH[28]、 ChEMBL[29]等化合物靶標分析平 臺; PharmMapper[30]、 DRAR-CPI[31]、 idTarget[32]、 HTDocking[33]等反向分子對接服務器; AutoDock Vina[34]、 Discovery studio[35]等 分 子 對 接 軟 件; drugCIPHER[36]、BATMAN-TCM[37]、 TargetHunter[38]等靶標預測工具。
表3 靶標預測工具
2.1 靶標數(shù)據(jù)挖掘 TCMSP、 TCMID 等數(shù)據(jù)庫在提供中藥成分信息時也提供了部分其潛在靶點信息, 但這些數(shù)據(jù)庫仍存在對應靶標不全等情況, 人參皂苷Rh2、 天麻素等重要活性成分的靶點信息, TCMSP 數(shù)據(jù)庫就未能提供。 因此在研究化合靶標信息時, 還需要綜合考慮多種數(shù)據(jù)庫和挖掘工具來收集其潛在靶點。 Arrowsmith 芝加是哥大學Swanson 教授[27]研制的基于非相關文獻的知識發(fā)現(xiàn)工具,為研究中藥靶標及其藥理毒副機制提供了新思路。 2017年, 王仁杰等[39]通過構建龍血竭A 集合和缺血性腦卒中C集合, 運用Arrowsmith 工具發(fā)現(xiàn)兩者密切關聯(lián)的B 集合中含有環(huán)氧合酶-2、 一氧化氮合酶、 電壓門控性鉀通道等5個靶標, 推測以上靶點可能是龍血竭治療缺血性腦卒中關鍵因素。 STITCH、 ChEMBL 化合物靶標作用平臺是用于預測已知的化合物和蛋白質(zhì)相互作用關系的平臺, STITCH 服務器能通過置信度打分精確化合物與蛋白質(zhì)相互作用的關系強度, 以川芎嗪為例, 設置相互作用蛋白為“Homo sapiens” (智人), score 為“medium confidence 0.400”, 發(fā)現(xiàn)川芎嗪能對應CFTR、 TNF、 IL8、 HIF1A 四個潛在靶標(圖2)。 2014 年, 任真真等[54]以三七皂苷為研究對象, 利用STITCH、 ChEMBL 平臺和藥效團模型匹配方法, 并通過蛋白互作、 MCODE 聚類分析發(fā)現(xiàn)三七皂苷有189 個潛在靶點, 藥效作用與環(huán)磷酸腺苷代謝、 血管伸縮、 血液凝固等生物過程密切相關。 此外一些化學、 藥物數(shù)據(jù)庫, 如Pub-Chem[55]、 DrugBank[56]等也可以挖掘一些天然化學成分的藥物及其靶標信息。
圖2 STITCH 平臺的川芎嗪潛在靶標
2.2 反向分子對接與藥效團匹配 正反分子對接技術、 藥效團模型匹配是中藥化合物靶標預測中不可或缺的重要工具。 早期的反分子對接軟件, 如新加坡國立大學的INVDOCK[57]、 蔣華良團隊的Tarfis Dock[58]等, 在藥物靶標預測研究中均獲得了良好的應用效果[59-60]。 在此基礎上,蔣華良等推出了新一款藥效團匹配反向找靶工具Pharm-Mapper, 該服務器整合了Target Bank、 Drug Bank、 Binding DB 和PDTD 四大數(shù)據(jù)庫, 能快速獲得藥物的潛在靶點信息。 2018 年, 李靜等[61]運用PharmMapper 成功預測款冬花止咳化痰主要活性成分的作用靶點, 并探討了其多成分-多靶點-多通路的作用機制。 DRAR-CPI 是上海交通大學Bio-X研究所楊輪等采用DOCK 中的算法, 通過重疊球體定義受體分子潛在結合位點, 將藥物分子與多個蛋白結合位點進行反向?qū)拥姆掌鳎?主要用于藥物-靶蛋白相互作用的模擬研究, 該服務器規(guī)定Z′-score<-0.5 時化合物與靶點有潛在結合的可能性, 以川芎嗪為例, Z′-score<-0.5 的潛在靶標(同一靶標、 不同結合方式的, 仍按一個靶標計算,1T40_ 2 與1T40_ 1 為一個靶標) 共計101 個, 排名第二的靶標為與凝血密切相關的凝血因子X (PDB ID: 1FOR),其Z′-score =-2.31562, 見 圖3。 國 立 臺 灣 大 學 研 發(fā) 的idTarget 服務器是一款含7 864 個靶點的預測服務器, 也常用于中藥化合物靶標預測, 但其運算速度較慢且2017 年12月維護后一直未能恢復運行, 與以上服務器相比不具優(yōu)勢。HTDocking 是一款基于二維結構和靶蛋白特征的反向?qū)臃掌鳎?白雨等[51]用HTDocking 和PharmMapper 預測羅格列酮復方的靶標, 發(fā)現(xiàn)基于三維結構的PharmMapper 可能比二維結構式HTDocking 預測結果更有效。 對比以上幾款反向分子對接、 藥效團匹配服務器, PharmMapper 和DRAR-CPI 的綜合性能可能更佳。
圖3 川芎嗪與凝血因子X 反向分子對接
2.3 分子對接技術 除了現(xiàn)有的反向分子對接技術服務器、 分析平臺外, 還可以在靶標數(shù)據(jù)庫、 疾病基因組數(shù)據(jù)庫挖掘與某個疾病相關的靶標、 基因, 構建疾病對應的靶標庫, 利用分子對接軟件進行靶標預測。 AutoDock vina 是Molecular Graphics 實驗室開發(fā)的一款免費軟件, 與該實驗室早期產(chǎn)品AutoDock 相比, Vina 摒棄了拉馬克遺傳算法,回歸了梯度優(yōu)化尋找最小點, 精度更高、 運算速度也更快;Discovery studio (DS) 是Accelrys 的一款藥物輔助設計軟件, 其對接程序采用特征性算法, 在運輸速度、 精度上優(yōu)于Vina 軟件, 但由于Vina 屬于開發(fā)型軟件, DS 為收費軟件, 兩者在推廣使用上互有利弊。 史海龍等[62]在PDTD 藥物靶標數(shù)據(jù)庫收集了36 個抗腫瘤靶標, 利用AutoDock vina軟件將土貝母皂苷甲與抗腫瘤靶標分子對接, 發(fā)現(xiàn)土貝母皂苷甲可能通過抑制酪蛋白激酶Ⅱ、 金屬基質(zhì)蛋白酶-8、胸苷酸合成酶以及微管蛋白等的活性, 發(fā)揮抗腫瘤作用。除AutoDock vina、 DS 軟件外, Surflex、 DOCK、 iGemdock等軟件也常用于靶標預測工作, 實際運用中也各有利弊。分子對接軟件在研究化合物與潛在靶點相互作用時, 比反向分子對接服務器更為細致, 例如用AutoDock vina 探索川芎嗪與凝血因子X (PDB ID: 1FOR) 的相互作用情況, 見圖4, 發(fā)現(xiàn)兩者相互作用的親和力為-5.3 kcal/mol, 能與結合的GLU-97、 THR-98、 TYR-99 等17 個0.4 nm 以內(nèi)氨基酸殘基相互作用, 但分子對接軟件通過自建靶點庫預測靶標的方法, 與反向分子對接服務器相比, 存在靶標少等缺點, 實際運用中應綜合權衡考慮。
圖4 川芎嗪與凝血因子X 分子對接
2.4 相似性靶標預測 利用藥物-靶標相似性算法尋找中藥化合物潛在靶標, 也是常用的靶標預測方法之一。 李梢等[36]構建的drugCIPHER 是一款利用相似性線性回歸模型,并結合藥理空間和基因組空間關聯(lián)算法的靶標預測工具,在預測葛根芩連方治療2 型糖尿病的網(wǎng)絡藥理機制時, 表現(xiàn)了良好的預測性能[23]。 BATMAN-TCM 服務器是由劉中揚等組建開發(fā)的一款一站式網(wǎng)絡藥理學平臺, 其靶標尋找方式是基于Perlman 等[25]的SITAR 概念, 利用藥物之間的結構、 副作用、 ACT 分類系統(tǒng)、 藥物誘導基因表達、 化合物相互作用分數(shù)的相似性。 以及靶點之間氨基酸序列、 蛋白互作網(wǎng)絡接近中心性、 GO 功能富集的相似性, 利用邏輯回歸、 “棄一法交叉驗證” 構建的一種靶點預測工具, 曾預測了芪參顆粒治療冠心病的多靶點藥理機制, 并在實驗驗證中得到了很好的證實[63]。 TargetHunter 是一款能根據(jù)化合物2D 結構相似性, 整合ChEMBL、 文獻、 PubMed 信息, 反向挖掘化合物靶標的服務器。
2.5 藥物靶標數(shù)據(jù)庫 生物信息學、 分子生物學的發(fā)展,促生了許多藥物、 蛋白質(zhì)、 基因組數(shù)據(jù)庫的產(chǎn)生, 正是在這些數(shù)據(jù)庫的基礎上, 新一代靶標預測工具才能層出不窮,日漸應用于網(wǎng)絡藥理學的研究。 同時, 各種組學技術、 網(wǎng)絡藥理學、 系統(tǒng)藥理學的發(fā)展, 也對藥物、 蛋白質(zhì)、 基因組數(shù)據(jù)庫提出了更高的要求, 進一步推進了數(shù)據(jù)庫的構建與發(fā)展。 信息比較全面的藥物靶點、 基因組數(shù)據(jù)庫包括TTD[64]、 GeneCards[65]、 CTD[66]、 DrugBank[56]、 OMIM[67]、PDB[68]、 Uniprot[69]、 Binding DB[70]等, 見表4。
表4 藥物靶點、 基因組數(shù)據(jù)庫
網(wǎng)絡藥理學分析平臺、 中藥數(shù)據(jù)庫、 靶標預測技術的構建發(fā)展, 為研究中藥藥效物質(zhì)基礎及作用機制, 闡明其療效好、 安全性高、 多組分、 多靶點的作用特點帶來了新的思路和策略, 也為中藥現(xiàn)代化與國際化現(xiàn)代化發(fā)展指明了新的方向[71-72]。 傳統(tǒng)的研究方法主要依靠藥化、 藥理實驗, 存在通量低、 精度不高、 周期長、 費用大等問題, 利用生物信息學、 計算機技術與實驗相結合的方法研究中藥的藥效成分、 潛在作用靶點, 突破了傳統(tǒng)研究的不足, 更加快速靈活, 準確率更高, 目前已廣泛應用于中藥網(wǎng)絡藥理學研究。
但現(xiàn)存的一些中藥網(wǎng)絡藥理學分析平臺、 中藥成分數(shù)據(jù)庫、 靶標預測技術仍有一定不足, 有待發(fā)展。 中藥成分數(shù)據(jù)庫提供的化學成分信息, 多為體外分離提取的成分,未涉及體內(nèi)藥代動力學、 血清藥化學領域內(nèi)容, 但中藥真正發(fā)揮藥效作用物質(zhì)是其血中移行成分[73]。 秦建平[74]利用UPLC-Q-TOF-MS 技術, 推斷出天舒膠囊中24 種血中移行成分, 其中13 種為原型成分, 11 種為非原型成分。 若僅以中藥體外分離成分為研究對象, 進行靶標分析、 網(wǎng)絡藥理學研究, 難免會與藥物實際效果產(chǎn)生一定偏差。 李圣耀等[75]通過挖掘清心解瘀方中入血成分, 利用BATMANTCM 平臺進行網(wǎng)絡藥理研究, 發(fā)現(xiàn)清心解瘀方能治療多種心血管疾病, 并對慢性阻塞性肺病、 抑郁也有一定藥理作用, 與其實際適應癥基本相符。
藥物-靶點預測技術是網(wǎng)絡藥理學研究的核心內(nèi)容之一, 但不論是數(shù)據(jù)挖掘、 藥靶相似性算法, 還是正反向分子對接技術, 都存在諸多問題, 如數(shù)據(jù)挖掘時藥物命名復雜, 數(shù)據(jù)源信息假陽性誤差; 相似性算法精度不高, 藥物與靶點關聯(lián)性差; 反向找靶標預測工具所依賴的靶標數(shù)據(jù)庫信息不全或假陽性, 靶蛋白三維結晶精度不高, 模擬分析與體內(nèi)實際情況差距大[76-77]。 因此, 開發(fā)新一代高標準、 高精度、 高智能化的中藥化學數(shù)據(jù)庫、 靶標預測工具,綜合使用多種成分、 靶標挖掘技術, 并結合相關實驗驗證,是今后中藥網(wǎng)絡藥理學研究的主要發(fā)展方向之一。