葉先文 ,鄧亞羚,任洪民,夏瀾婷,楊 明,陳宇帆,張金蓮*,余亦婷
(1.江西中醫(yī)藥大學藥學院,江西 南昌 330004;2.江西中醫(yī)藥大學現(xiàn)代中藥制劑教育部重點實驗室,江西 南昌 330004;3.贛州市人民醫(yī)院,江西 贛州 341000)
白芍為毛茛科植物芍藥Paeonia lactifloraPall.的干燥根,具有養(yǎng)血調(diào)經(jīng)、柔肝止痛、平抑肝陽等功效,臨床常用于治療月經(jīng)不調(diào)、脅痛、腹痛等癥[1],為補血常用藥。白芍主要化學成分有芍藥苷、芍藥內(nèi)酯苷、沒食子酸等[2]。
網(wǎng)絡藥理學是一門新興的藥理學探究技術,其分子對接及探究藥物與靶點之間關系的方法符合傳統(tǒng)中醫(yī)治療及辨證論治的理念[3]。本文利用各種在線數(shù)據(jù)庫資源,通過網(wǎng)絡藥理學的研究方法(圖1),結合TCMSP 等數(shù)據(jù)庫預測藥效成分靶點,使用Cytoscape 3.6.1 軟件建立關于白芍治療貧血的藥物-成分-靶點-通路-疾病網(wǎng)絡。
1.1 白芍化學成分數(shù)據(jù)來源 TCMSP (http://lsp.nwu.edu.cn/index.php) 是一個獨特的中草藥系統(tǒng)藥理學臺,能夠搜索藥物、靶點和疾病之間的關系,該數(shù)據(jù)庫提供口服生物利用度(OB)、類藥性(DL)、血腦屏障(BBB)等天然化合物的藥代動力學特性[4]。本文以“白芍” 為關鍵詞進行搜索,對搜索成分的結構以Mol2 格式進行保存,通過Chemspider(http://www.chemspider.com/)及Scifinder(https://www.cas.org/prod ucts/scifinder) 對其結構進行驗證。
1.2 貧血相關靶點獲取 GeneCards 是一個可搜索的、免費的、綜合的數(shù)據(jù)庫,給用戶提供注釋和預測人類基因的全面信息,它自動集成了來自約150 個web 源的以基因為中心的數(shù)據(jù),包括基因組、轉錄組、蛋白質(zhì)組、遺傳學、臨床和功能信息[5]。DisGeNET、Pubmed 同樣可對疾病基因進行搜索,以 “Anemia” 為關鍵詞,數(shù)據(jù)庫類型為“Gene”,物種限定為“Homo sapiens”,對“貧血” 相關基因進行搜索。
1.3 數(shù)據(jù)預處理
1.3.1 白芍生物活性成分篩選 目前活性成分常采用生物口服利用度OB >30% 和類藥性DL >0.18 的規(guī)則進行篩選[6],將結果以Excel 格式保存。
圖1 網(wǎng)絡藥理學研究思路
1.3.2 白芍生物活性成分-靶點預測 基于配體預測,通過Swiss TargrtPrediction (http://www.swisstargetprediction.ch/) (P>0.5)、Stitch (http://stitch.embl.de/) 預測靶點,收集DrugBank (https://www.drugbank.ca/) 的靶點。Swiss TargrtPredict[7]通過二維和三維相似度,與一個包含28 萬個化合物的文庫進行了比較,進而對小分子靶點進行預測,這些化合物對5 種不同生物體的二千多個目標物都有效。Stitch[8]可以根據(jù)單個蛋白質(zhì)名稱、多個名稱或氨基酸序列,隨機選擇至少具有4 個預測鏈接的蛋白質(zhì),預測鏈接的可信度中等或更好。DrugBank[9](藥物庫數(shù)據(jù)庫)是一個全面的、可免費訪問的在線數(shù)據(jù)庫,包含有關藥物和藥物靶標的信息。通過上述數(shù)據(jù)庫,將成分-靶點整理成Excel 表格。
1.3.3 預測靶點的標準化 UniProt[10](https://www.uniprot.org/) 為科學界提供全面、高質(zhì)量和可自由獲取的蛋白質(zhì)序列和功能信息資源。通用蛋白質(zhì)資源(UniProt) 是一種蛋白質(zhì)序列和注釋數(shù)據(jù)的綜合資源,它是UniProt 知識庫(UniProtKB)、UniProt 引用集群(UniRef) 和UniProt 歸檔(UniParc) 的集合。將預測的靶標蛋白通過UniProt 轉化為基因名稱,物種限制為“Human”,建立蛋白-基因文檔。
1.4 PPI 網(wǎng)絡構建 機體內(nèi)在的生物過程并不是由單一信號調(diào)控的,一個基因/蛋白的表達和功能往往受多個基因的影響[11],PPI 網(wǎng)絡是靶標蛋白之間的相互作用網(wǎng)絡[12]。為探索白芍治療貧血的作用機制,將獲得的靶點上傳于String Version:11.0 (https://string-db.org/),構建了PPI 網(wǎng)絡。String 結合不同證據(jù)通道的概率計算綜合得分,并對隨機交互的概率進行校正,最低評分為0.4 時為中等可信度,0.7 表示高可信度,0.9 表示最高可信度[13],本研究選用了評分為0.4 的PPI 網(wǎng)絡,即中等可信度網(wǎng)絡。
1.5 GO 和KEGG 通路的富集分析 WebGestalt (http://www.webgestalt.org/option.php) 是一個功能豐富的Web分析工具。它于2019 年1 月14 日更新,涵蓋354 個數(shù)據(jù)庫,支持12 種生物,321 251 種功能分類。它能夠分析數(shù)據(jù)庫中沒有的基因或來自實驗的生物的數(shù)據(jù)。該平臺可將蛋白質(zhì)功能分為生物過程(BP)、細胞組分(CC)、分子功能(MF) 等,本研究中,選擇BP、CC 和MF 進行富集顯示[14]。Cytoscape3.6.1 (https://cytoscape.org/) 是 一個開源軟件平臺,能夠?qū)Ψ肿娱g相互作用網(wǎng)絡和生物通路集成這些網(wǎng)絡的注釋、基因表達譜等狀態(tài)數(shù)據(jù)進行可視化處理,該軟件插件ClueGO 可對關鍵靶點進行生物過程GO及通路分析,將結果以png 及xls 格式保存。
1.6 分子對接驗證 Discovery Studio 軟件是一款包含生物大分子三維結構預測與模擬、藥物設計等領域的軟件,被廣泛運用于小分子配體與生物大分子間相互作用的表征、同源建模、分子力學計算等方面,通過該軟件可進行分子對接驗證[15-16]。
1.7 藥物-成分-靶點-通路-疾病網(wǎng)絡構建 將上述試驗獲得的藥物-成分、靶點-通路等網(wǎng)絡導入Cytoscape 中,利用“Tool” 功能項下的“merge” 功能進行網(wǎng)絡合并,得到藥物-成分-靶點-通路-疾病網(wǎng)絡。
2.1 白芍化學成分及活性成分篩選 通過TCMSP 數(shù)據(jù)庫進行化學成分收集,共85 種成分,符合OB>30%、DL>0.18 的有13 種。文獻表明,芍藥苷和芍藥內(nèi)酯苷為白芍治療貧血的物質(zhì)基礎[17],沒食子酸具有抗炎抗氧化、抗腫瘤等作用[18],因此將15 種成分作為候選活性物質(zhì)(表1),通過Scifinder 和Chemspider 對其結構進行驗證。
表1 白芍候選成分
2.2 白芍活性成分-靶點構建 通過Swiss TargetPrediction(P>0.5)、Stitch 預測的靶點個數(shù)分別為80、30,DrugBank中搜集的靶點91 個,paeoniflorin_ qt 所預測靶點的P值均小于0.5,故不考慮此成分及靶點。去除重復項,獲得靶點161 個,將靶點導入Cytoscape 中,獲得成分-靶點圖(圖1A)。
2.3 貧血-靶 點 PPI 網(wǎng)絡構建通過 GeneCards、DisGeNET、Pubmed 分別獲取貧血相關基因4 278、489、545 個,合并去重復得4 864 個,構建疾病-靶點網(wǎng)絡(圖1B)。上傳成分-靶點、疾病-靶點于Venny2.1 (https://string-db.org/) 網(wǎng)絡在線服務器中,獲得共有靶點96 個(圖1C)。將共有靶點導入String Version:11.0 (https://string-db.org/),構建評分0.4 的PPI 網(wǎng)絡(圖1D),去除不滿足評分的靶點,該網(wǎng)絡有靶蛋白94 個。通過DisGeNET[19](http://www.disgenet.org/),對獲得的14 個核心靶蛋白進行了屬性整理(表2),發(fā)現(xiàn)這些靶點的類別可分為激酶、信號因子、轉移酶、水解酶、蛋白酶等。在PPI網(wǎng)絡中,IL6 (54)、TP53 (47)、TNF (40)、CASP3(38)、MAPK8 (36) 為度值排前五的靶蛋白,可能是治療貧血的關鍵靶點。
2.4 GO 功能和KEGG 通路富集分析
2.4.1 GO 功能富集 提取核心交互靶點14 個,通過WebGestalt 進行生物功能富集,得到43 個GO 富集結果(圖1F),在BP 中,以代謝過程(metabolic process;14/14)、應激反應(response to stimulus;14/14)、生物調(diào)節(jié)(biological regulation;14/14) 最為顯著;在CC 中,以膜封閉腔(membrane-enclosed lumen;11/14)、膜(membrane;10/14) 最為顯著;在MF 中,蛋白質(zhì)結合(protein binding;14/14)、離子結合(ion binding;9/14) 可能是關鍵的分子功能。除此之外,還通過ClueGO 插件對其進行了更加深入的GO 生物功能分析 (表3),認為負調(diào)控脂質(zhì)儲存(negative regulation of lipid storage)、正調(diào)控急性炎癥反應(positive regulation of acute inflammatory response)、正調(diào)控DNA 模板轉錄(positive regulation of DNA-templated transcription)、RNA 聚合酶 II 轉 錄 pri-miRNA (pri-miRNA transcription by RNA polymerase II) 為顯著的生物過程。
表2 共有靶點屬性
表3 生物功能富集
2.4.2 KEGG 通路富集 對14 個核心靶點進行了通路富集,獲得了顯著的前10 個通路(圖1G),IL-17 信號通路(IL-17 signaling pathway)、糖尿病并發(fā)癥AGE-RAGE 信號通 路 (AGE-RAGE signaling pathway in diabetic complications)、TNF 信號通路(TNF signaling pathway) 可能為關鍵通路,百日咳(Pertussis)、乙型肝炎(Hepatitis B) 也可能影響貧血的發(fā)生發(fā)展,詳細信息見表4,IL-17信號通路圖見圖2。
表4 KEGG 信號通路富集
圖2 IL-17 信號通路
2.5 分子對接驗證 采用Discovery Studio 2016 的LibDock模塊,基于白芍活性成分進行分子對接驗證,以成分-核心靶點對接打分構建熱圖(圖3)。熱圖分析發(fā)現(xiàn),除本文預測的成分-核心靶點之間具有較好的結合能力外,其他活性成分與核心靶點也有較好的結合能力。
2.6 藥物-成分-靶點PPI-通路-疾病網(wǎng)絡構建 通過Cytoscape 構建藥物-成分-靶點PPI-通路-疾病網(wǎng)絡(圖4),包括36 個節(jié)點,186 條邊,從左至右依次表示白芍、成分、靶點、通路、貧血。在構建網(wǎng)絡圖中,11α,12α-環(huán)氧-3β-23-二羥基-30-去甲齊墩果-20-烯-28,12β-內(nèi)酯、苯甲酰芍藥苷、白樺脂酸、芍藥苷元、丹皮酚原苷未與核心靶點對接,所以不在圖中顯示。
本文通過TCMSP 獲得白芍化學成分85 種,OB 和DL值篩選出活性成分15 種,基于該活性成分預測靶點161個,與疾病基因配對且符合評分0.4 的PPI 網(wǎng)絡的靶點94個,通過“DC>2×度值” 篩選出核心靶點14 個,分子對接結果顯示,多數(shù)白芍活性成分與核心靶點具有較好的結合能力。我們對其中的靶點進行了文獻檢索,TP53 在癌癥治療方面有廣泛的研究[20-21],參與了多種細胞死亡通路,且可作為信號中心評估神經(jīng)元損傷情況[22];MAPK8 能夠通過激活MAPK 信號通路,促進細胞增殖,抑制膠質(zhì)瘤細胞凋亡[23],且MAPK 通路參與了再生性障礙貧血的治療[24-25];TNF 和IL6 參與了慢性病貧血/缺鐵性貧血的發(fā)生和發(fā)展[26],且TNF 表達可反映再生障礙性貧血患者疾病程度[27],白芍可通過IL3 和TNF 對環(huán)磷酰胺致血虛小鼠起到緩解作用[28],這些靶蛋白可能為白芍治療貧血的關鍵靶點,提示細胞-神經(jīng)網(wǎng)絡可能是關鍵途徑。
圖3 成分-核心靶點對接打分熱圖
在43 個GO 富集中,多為細胞增殖與凋亡、能量代謝、應激反應等。負調(diào)控脂質(zhì)儲存(negative regulation of lipid storage) 可能為白芍治療貧血的關鍵生物過程,研究表明,患有貧血和缺鐵性貧血的老人血脂較正常人顯著降低[29],貧血患者的脂蛋白水平明顯低于非貧血患者,且與貧血的嚴重程度成正比,貧血類型對血脂無明顯影響[30]。貧血可能通過改變巨噬細胞功能增加腸道炎癥和屏障破壞[31],炎癥誘導的細胞因子和鐵穩(wěn)態(tài)的主調(diào)節(jié)因子阻礙了腸道鐵的吸收,并導致網(wǎng)狀內(nèi)皮細胞鐵潴留,導致鐵限制紅細胞生成。此外,縮短紅細胞半衰期,抑制促紅細胞生成素對貧血的反應,以及炎癥介質(zhì)抑制紅細胞分化,這些都進一步促進了炎癥性貧血的特異性模式[32]。細胞循環(huán)參與了貧血的過程,表明在基因調(diào)控上,正調(diào)控DNA 模板轉錄(positive regulation of DNA-templated transcription)、RNA聚合酶II 轉錄pri-miRNA (pri-miRNA transcription by RNA polymerase II) 也可能為關鍵的基因調(diào)控途徑[33]。
在10 個 KEGG 通路中,IL-17 信號通路 (IL-17 signaling pathway)、糖尿病并發(fā)癥AGE-RAGE 信號通路(AGE-RAGE signaling pathway in diabetic complications)、TNF 信號通路(TNF signaling pathway) 可能為關鍵通路。晚期糖基化終產(chǎn)物是由蛋白質(zhì)、脂類和核酸在非酶糖基化和氧化過程中產(chǎn)生的一組復雜化合物,AGE 和RAGE 的相互作用會導致氧化應激、炎癥反應和血栓形成,從而參與血管老化和損 傷[34]。IL-17 信號通路[35](IL-17 signaling pathway)、腫瘤壞死因子信號通路[36](TNF signaling pathway) 等也與貧血有關。不僅如此,百日咳(Pertussis)[37]、乙型肝炎(Hepatitis B)[38]等疾病也可能參與了貧血的發(fā)生發(fā)展。
圖4 藥物-成分-靶點-通路-疾病網(wǎng)絡
綜上所述,通過網(wǎng)絡藥理學方法,初步探討了白芍治療貧血的潛在物質(zhì)基礎及可能的作用機制。本文雖通過TCMSP 得到白芍的化學成分,但這些數(shù)據(jù)并不完全,后期應通過UPLC、UPLC-Q-TOF-MS 等方法對白芍成分進行檢測,以期得到更全面的化學信息。