郭斌 張皓旻 楊波 賀培鳳 盧學(xué)春
[摘要]目的 利用文獻(xiàn)數(shù)據(jù)文本挖掘技術(shù)結(jié)合生物信息學(xué)分析方法,從基因表達(dá)譜角度探索鹿茸的生物學(xué)功效。方法 首先對中國知網(wǎng)、萬方數(shù)據(jù)庫和維普數(shù)據(jù)庫三個常用的中文數(shù)據(jù)庫中關(guān)于鹿茸的基因表達(dá)調(diào)控作用的相關(guān)文獻(xiàn)進(jìn)行挖掘,提取基因表達(dá)數(shù)據(jù),進(jìn)行數(shù)據(jù)清洗、標(biāo)準(zhǔn)化。其次,通過Cytoscape制作蛋白相互作用網(wǎng)絡(luò),再利用自主研發(fā)的“疾病-基因-化合物”分析平臺進(jìn)行關(guān)聯(lián)分析,得到鹿茸的適應(yīng)證和禁忌證。使用DAVID工具對鹿茸基因表達(dá)數(shù)據(jù)進(jìn)行KEGG通路功能富集分析,篩選出相應(yīng)的生物學(xué)通路及靶點。最后,通過查閱鹿茸藥理學(xué)作用相關(guān)古籍、文獻(xiàn)驗證本方法的準(zhǔn)確性。結(jié)果 本文共挖掘到鹿茸相關(guān)調(diào)控基因30個,其中上調(diào)基因21個,下調(diào)基因9個;制作出鹿茸相關(guān)調(diào)控基因蛋白互作網(wǎng)絡(luò);關(guān)聯(lián)分析找到十幾種鹿茸的適應(yīng)證和禁忌證;KEGG通路富集分析找到鹿茸在抗腫瘤、抗感染、提高免疫力三個功效方面的作用通路及靶點。結(jié)論 文本挖掘結(jié)合生物信息學(xué)方法是一種研究中藥藥理機制及功效的新方法。
[關(guān)鍵詞]文本挖掘;鹿茸;基因表達(dá)譜;生物學(xué)功效;臨床生物信息學(xué)
[中圖分類號] R915 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1674-4721(2018)7(b)-0016-05
[Abstract] Objective To explore the biological efficacy of Pilose Antler using the method of literature data mining combined with bioinformatics analysis method from the view of gene expression profiles. Methods Firstly, text mining technology was used to explore literatures on gene expression regulation of Pilose Antler from CNKI, Wanfang and CQVIP Data. Gene expression data were extracted, duplicates were removed, and then the gene names were normalized. Secondly, Cytoscape was used to make the protein-protein interaction network. Then the association analysis was used to get the indications and contraindications of disease treatment by the "disease-gene-compound" analysis platform developed by our team. Next, DAVID online analysis tools was used to enrich and analyze the KEGG pathway functions and screen out the corresponding biological pathways and targets. At last, the accuracy of this method was tested and verified by referring to the ancient books and literature on the pharmacological effects of Pilose Antler. Results In this paper, 30 antler-related regulatory genes were extracted, of which 21 were up-regulated and 9 were down-regulated; the protein-protein interaction network of antler-related genes was produced; the association analysis found more than a dozen species indications and contraindications of Pilose Antler; KEGG pathway enrichment analysis found the pathways and targets of Pilose Antler in three functions of anti-tumor, anti infection and enhancing immunity. The feasibility of this method was verified by consulting pharmacological literature. Conclusion Text mining combined with bioinformatics analysis is a new method to explore pharmacological mechanisms and efficiencies of traditional Chinese medicine.
[Key words] Text mining; Pilose Antler; Gene expression profiles; Biological efficacy; Clinical bioinformatics
鹿茸作為珍貴的動物藥材始載于《神農(nóng)本草經(jīng)》,系鹿科動物梅花鹿或馬鹿的雄鹿未骨化密生絨毛的幼角(《中國藥典》2005年版一部),是有史記載應(yīng)用極為悠久的珍貴藥材之一?!侗静菥V目》謂鹿茸能夠“生精補髓,養(yǎng)血益陰,強筋健骨,治一切虛損、耳聾、目暗、眩暈虛痢?!逼浏熜Т_切,在中醫(yī)臨床中占有重要地位[1]。目前,有很多應(yīng)用基礎(chǔ)醫(yī)學(xué)方法所做的鹿茸對基因表達(dá)影響的研究[2-5],而文本挖掘(text mining,TM)作為數(shù)據(jù)挖掘面向文本數(shù)據(jù)的延伸,已成為數(shù)據(jù)挖掘技術(shù)中一個非常重要的研究領(lǐng)域[6],在醫(yī)學(xué)文本數(shù)據(jù)領(lǐng)域的應(yīng)用也越來越廣泛。本文將從收集的文獻(xiàn)數(shù)據(jù)入手,利用相關(guān)數(shù)據(jù)庫對提取的數(shù)據(jù)進(jìn)行聚類分析,從藥物基因組學(xué)角度討論鹿茸及其主要成分對人體的表觀調(diào)控作用,有利于進(jìn)一步了解鹿茸的作用機制,發(fā)現(xiàn)鹿茸的新作用,指導(dǎo)鹿茸在臨床上的精準(zhǔn)用藥,為中醫(yī)藥的研究提供了新思路、新方法,從而促進(jìn)中藥的研究發(fā)展。
1 資料與方法
1.1 數(shù)據(jù)集成
對中國知網(wǎng)、萬方數(shù)據(jù)知識服務(wù)平臺現(xiàn)有關(guān)于鹿茸的基因表達(dá)調(diào)控作用相關(guān)文獻(xiàn)進(jìn)行挖掘,得到鹿茸對基因表達(dá)的調(diào)控數(shù)據(jù),然后進(jìn)行數(shù)據(jù)清洗,去掉重復(fù)項,再利用NCBI Gene數(shù)據(jù)庫對基因名稱進(jìn)行標(biāo)準(zhǔn)化。
1.2 網(wǎng)絡(luò)圖可視化分析
利用Cytoscape軟件對鹿茸調(diào)控基因相關(guān)作用蛋白進(jìn)行聚類分析,制作蛋白互作網(wǎng)絡(luò)。
1.3 關(guān)聯(lián)分析
利用本團隊研發(fā)的“疾病-基因-化合物”分析平臺進(jìn)行關(guān)聯(lián)分析,得到疾病治療的適應(yīng)證和禁忌證。該平臺根據(jù)疾病對人基因的表達(dá)變化以及化合物對基因的表達(dá)變化之間的關(guān)系進(jìn)行關(guān)聯(lián)分析,實現(xiàn)以藥找病、以病找藥。目前該平臺使用已經(jīng)趨于成熟,利用該平臺可以發(fā)現(xiàn)藥物的全新作用,團隊已有類似的研究[7]。
1.4 聚類分析
使用DAVID(the Database for Annotation,Visualization and Integrated Discovery)在線分析工具通過超幾何分布方法對標(biāo)準(zhǔn)化后的鹿茸基因表達(dá)數(shù)據(jù)進(jìn)行KEGG通路功能富集分析,篩選出鹿茸相應(yīng)的生物學(xué)通路及靶點。
1.5 文獻(xiàn)驗證
查閱鹿茸藥理學(xué)作用相關(guān)古籍、文獻(xiàn),驗證本方法的準(zhǔn)確性。
2 結(jié)果
2.1 鹿茸相關(guān)表達(dá)調(diào)控基因
本文共挖掘到相關(guān)調(diào)控基因30個,其中上調(diào)基因21個,下調(diào)基因9個(表1)。
2.2 蛋白互作網(wǎng)絡(luò)分析
鹿茸相關(guān)調(diào)控基因的蛋白互作網(wǎng)絡(luò)分析結(jié)果如圖1所示,其中“●”代表上調(diào)基因,“◆”代表下調(diào)基因。
2.3 鹿茸的適應(yīng)證和禁忌證
通過進(jìn)行化合物-基因-疾病關(guān)聯(lián)分析,找到十幾種鹿茸的適應(yīng)證和禁忌證,其中主要的疾病列表見表2。
2.4 鹿茸主要作用通路
經(jīng)KEGG通路富集分析發(fā)現(xiàn)了鹿茸的主要作用通路及作用靶點,包括腫瘤、感染、免疫三大方面。腫瘤相關(guān)通路:結(jié)直腸癌通路、小細(xì)胞肺癌通路(圖2)、慢性粒細(xì)胞白血病通路等;感染相關(guān)通路:乙型肝炎通路(圖3)、肺結(jié)核通路、幽門螺桿菌感染中的上皮細(xì)胞信號轉(zhuǎn)導(dǎo)通路等;免疫相關(guān)通路:T細(xì)胞受體信號通路(圖4)、B細(xì)胞受體信號通路、Toll樣受體信號通路等。還發(fā)現(xiàn)一些經(jīng)典通路:p53信號通路(圖5)、NF-κB信號通路、MAPK信號轉(zhuǎn)導(dǎo)通路等。圖2~5中的“☆”為作用靶點。
2.5 查閱鹿茸藥理學(xué)相關(guān)古籍文獻(xiàn)驗證本方法的準(zhǔn)確性
眾多綜述都表明,鹿茸多肽是鹿茸的主要活性成分,具有保護(hù)神經(jīng)、調(diào)節(jié)血糖、促進(jìn)生殖功能、保護(hù)軟骨組織、增強免疫力、保護(hù)心肌細(xì)胞和血管內(nèi)皮細(xì)胞、預(yù)防急性肝損傷、抗炎及抑制腫瘤細(xì)胞生長的作用[8-9]。還有很多通過實驗研究的鹿茸藥理學(xué)文獻(xiàn)結(jié)果驗證了本方法的可行性[10-12]。
3 討論
中醫(yī)藥治療疾病有幾千年歷史,由于作用機制并不明確,且個體差異過大,重復(fù)性和可靠性備受質(zhì)疑。但對疑難疾病的診治有確切病例,不可用西醫(yī)觀點輕易否定,需要從現(xiàn)代科學(xué)角度,結(jié)合中醫(yī)的特點加以探討。然而中醫(yī)藥關(guān)于組學(xué)的影響較少,最多以成分研究為主,且關(guān)注單個或某1~2個基因,從大數(shù)據(jù)組學(xué)角度,缺乏數(shù)據(jù)。相關(guān)研究,如基因測序、基因芯片,價格昂貴,時間,人力、物力和財力受限,而伴隨生物醫(yī)學(xué)技術(shù)的不斷發(fā)展,利用生物信息學(xué)的方法,從表觀基因組學(xué)層面對中藥作用機制進(jìn)行研究,快速、有效、目的性強,具有探討的必要。
鹿茸用于醫(yī)療保健的歷史悠久,應(yīng)用廣泛,主要用于全身衰弱、強壯筋骨、年老或久病體虛及病后恢復(fù)。以往文獻(xiàn)報道其還有抗腫瘤、抗感染、增強免疫力的作用,本方法的研究也進(jìn)一步證實了鹿茸的這些作用??鼓[瘤作用方面,p53通路具有腫瘤抑制作用,調(diào)節(jié)各種各樣基因的表達(dá),包括細(xì)胞凋亡,生長抑制,抑制細(xì)胞周期進(jìn)程,分化和加速DNA 修復(fù),基因毒性和細(xì)胞應(yīng)激后的衰老[13],而p21、Bax、CASP3等作為鹿茸在p53通路的作用靶點,完全可以通過結(jié)合進(jìn)一步的臨床實驗研究,二次開發(fā),研發(fā)新的疾病治療方案??垢腥痉矫?,鹿茸多肽可能是通過表皮生長因子和表皮生長因子的信號傳導(dǎo)通路來保護(hù)成骨細(xì)胞免受炎癥和氧化損傷[14]。潘風(fēng)光等[15]的實驗顯示鹿茸多肽可促進(jìn)T、B 淋巴細(xì)胞的增殖和活化巨噬細(xì)胞分泌白細(xì)胞介素12,從而提高機體的免疫力,鹿茸還可以通過上調(diào)負(fù)責(zé)肌肉收縮的基因來提高肌肉收縮力量,增強抗疲勞的能力[16]。這些文獻(xiàn)的研究證明了本文利用TM技術(shù)和生物信息學(xué)方法研究鹿茸生物學(xué)功效的研究方法是正確的,而且本文的研究方法適用于對鹿茸生物學(xué)功效的機制研究。
TM是指利用計算機,通過自動抽取和關(guān)聯(lián)來自不同文本資源的信息,發(fā)現(xiàn)新的、以往未知的信息,顯示其隱含的意義。TM的主要步驟包括信息檢索、命名實體識別、信息抽取、知識發(fā)現(xiàn)和可視化表達(dá),研究人員針對每一步驟都開發(fā)出了相應(yīng)的數(shù)據(jù)庫與軟件工具,并免費提供使用[17]。目前生物醫(yī)學(xué)TM已經(jīng)進(jìn)入應(yīng)用階段,越來越多的生物醫(yī)學(xué)領(lǐng)域的專業(yè)人員開始應(yīng)用TM方法來解決實際的生物學(xué)和臨床問題。將TM應(yīng)用于中醫(yī)藥領(lǐng)域,可以從大量的中醫(yī)藥古籍文獻(xiàn)中發(fā)現(xiàn)隱含的知識,供中醫(yī)臨床研究和中藥復(fù)方研發(fā)等,為中醫(yī)藥研究提供新的思路和方法。
生物信息學(xué)方法主要針對基因芯片數(shù)據(jù)、二代測序數(shù)據(jù)進(jìn)行分析,揭示大量而復(fù)雜的生物數(shù)據(jù)所賦有的生物學(xué)奧秘[18],但基因測序、基因芯片,價格昂貴,人力、物力和財力受限,臨床醫(yī)學(xué)研究和轉(zhuǎn)化方面應(yīng)用相對不足[19],而利用TM方法可以從大量的文獻(xiàn)中挖掘出研究所需的基因組學(xué)大數(shù)據(jù)信息,從而構(gòu)建研究相關(guān)的二級數(shù)據(jù)庫。將生物信息學(xué)分析方法與文獻(xiàn)數(shù)據(jù)TM相結(jié)合,可以對中藥基因組學(xué)進(jìn)行分析,從基因組大數(shù)據(jù)角度深入研究中藥藥理機制及功效,使中藥研究也步入精準(zhǔn)醫(yī)學(xué)時代[20]。
本研究在對中藥鹿茸的研究中運用生物信息學(xué)的方法,以鹿茸的表觀調(diào)控機制為研究內(nèi)容,利用TM得到的鹿茸藥物基因組學(xué)數(shù)據(jù),借助專業(yè)的基因數(shù)據(jù)庫,對所收集的基因表達(dá)數(shù)據(jù)進(jìn)行處理、分析,實現(xiàn)對文獻(xiàn)研究的鹿茸主要藥理作用的進(jìn)一步驗證,從基因表達(dá)譜角度對鹿茸的作用機制做出解釋,建立了一種探索中藥的藥理作用機制、發(fā)現(xiàn)其藥效作用機制的新方法。由于中醫(yī)藥數(shù)據(jù)復(fù)雜多樣、TM技術(shù)具有局限性等致使數(shù)據(jù)缺失、不全,所以還有很多潛在的作用機制尚未發(fā)現(xiàn)。但是,這無疑也為中醫(yī)藥的研究提供了新的思路和方法,利用TM結(jié)合生物信息學(xué)分析方法,從大數(shù)據(jù)組學(xué)角度更深入立體地研究疾病和藥物,有利于中醫(yī)藥的二次開發(fā),為臨床應(yīng)用提供參考,促進(jìn)中醫(yī)藥的現(xiàn)代化。
[參考文獻(xiàn)]
[1]嚴(yán)銘銘.人參鹿茸中蛋白多肽的純化及活性研究[D].長春:長春中醫(yī)藥大學(xué),2007.
[2]黃曉巍,徐巖,韓冬,等.鹿茸多肽介導(dǎo)心肌干細(xì)胞分化對終末心肌分化基因ANP和MLC-2v表達(dá)的影響[J].吉林大學(xué)學(xué)報(醫(yī)學(xué)版),2018,44(2):249-253,464.
[3]王大濤.鹿茸干細(xì)胞的鑒定以及鹿茸再生關(guān)鍵調(diào)控基因的篩選[D].北京:中國農(nóng)業(yè)科學(xué)院,2017.
[4]張偉,劉佳,董振,李春義.利用qRT-PCR技術(shù)篩選鹿茸生長中心細(xì)胞與鹿茸干細(xì)胞內(nèi)參基因[J].農(nóng)業(yè)生物技術(shù)學(xué)報,2017,25(5):851-860.
[5]李朝政,許佳明,王燁,等.鹿茸多肽誘導(dǎo)心肌干細(xì)胞分化作用及對心肌細(xì)胞特征性MHC基因表達(dá)的影響[J].吉林中醫(yī)藥,2014,34(8):825-828.
[6]唐永華.大數(shù)據(jù)的高性能技術(shù)在文本挖掘中的應(yīng)用探究[J].電子世界,2018,(3):69-70.
[7]盧學(xué)春,朱宏麗,遲小華.氨磷汀作用的研究進(jìn)展[J].中國藥物應(yīng)用與監(jiān)測,2008,5(1):48-51.
[8]楊光旭,魏雪苗,范紅艷,等.鹿茸多肽藥理學(xué)活性的研究進(jìn)展[J].吉林醫(yī)藥學(xué)院學(xué)報,2017,38(2):126-129.
[9]王楠,高曉霞,代子彥,等.鹿茸藥效物質(zhì)基礎(chǔ)、藥理作用、臨床應(yīng)用及質(zhì)量控制的研究進(jìn)展[J].中草藥,2017,48(22):4784-4790.
[10]牛維,孫志濤,曹學(xué)偉,等.單味藥鹿茸調(diào)控大鼠骨關(guān)節(jié)炎軟骨組織Smad2、3表達(dá)的研究[J].中國中西醫(yī)結(jié)合雜志,2014,34(2):209-213.
[11]張洪長,張瑩,劉明昕,等.鹿茸多肽對人骨髓間充質(zhì)干細(xì)胞BMP-2和Runx2表達(dá)的影響[J].吉林大學(xué)學(xué)報(醫(yī)學(xué)版),2015,41(3):491-495.
[12]周群.鹿茸多肽對促神經(jīng)母細(xì)胞瘤細(xì)胞增殖及抑制其凋亡的相關(guān)實驗研究[D].長春:長春中醫(yī)藥大學(xué),2013.
[13]趙宇平,王慧,楊光,等.基于文本挖掘技術(shù)探索青蒿的藥理作用規(guī)律[J].中國中藥雜志,2016,41(16):3072-3077.
[14]Yang C,Cai W,Wen H,et al.Pilose antler peptide protects osteoblasts from inflammatory andoxidative injury through EGF/EGFR signaling[J].Int J Biol Macromol,2017,99(1):15-20.
[15]潘風(fēng)光,孫威,周玉,等.梅花鹿鹿茸活性多肽的提取及免疫功效的初步研究[J].中國生物制品學(xué)雜志,2007,20(9):669-673.
[16]Chen JC,Hsiang CY,Lin YC,et al.Deer antler extract improves fatigue effect through altering the expression of genes related to muscle strength in skeletal muscle of mice[J].Evid Based Complement Alternmat Med,2014,2014:540-580.
[17]崔雷.生物醫(yī)學(xué)文本挖掘:步驟與工具[J].中華醫(yī)學(xué)圖書情報雜志,2017,26(3):1-5.
[18]孫強.高通量測序數(shù)據(jù)中病毒基因組的生物信息學(xué)分析方法探索[D].北京:中國人民解放軍軍事醫(yī)學(xué)科學(xué)院,2017.
[19]郭奕斌.基因診斷中測序技術(shù)的應(yīng)用及優(yōu)缺點[J].遺傳,2014,36(11):1121-1130.
[20]陳健,陳啟龍,蘇式兵.中醫(yī)藥精準(zhǔn)醫(yī)療的思考與探索[J].世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化,2016,18(4):557-562.
(收稿日期:2018-03-30 本文編輯:許俊琴)