摘 要 Alzheimers disease是生活中最為常見(jiàn)的老年癡呆癥狀,尤其是近些年來(lái),患者人數(shù)在不斷的攀升,給社會(huì)造成了巨大的負(fù)擔(dān),然而目前的醫(yī)學(xué)研究人員并不清楚其發(fā)病機(jī)制。本文所使用的數(shù)據(jù)來(lái)自于NCBIgene數(shù)據(jù)庫(kù)、北京大學(xué)生物醫(yī)學(xué)信息學(xué)院開(kāi)發(fā)的TransmiR(http://cmbi.bjmu.edu.cn/transmir)數(shù)據(jù)庫(kù)等數(shù)據(jù)平臺(tái)。本文采用文本挖掘的方法首先從相關(guān)已知數(shù)據(jù)庫(kù)中搜集了與病癥有關(guān)的異常表達(dá)數(shù)據(jù)和相關(guān)表達(dá)數(shù)據(jù),并進(jìn)行了數(shù)據(jù)整理,通過(guò)試驗(yàn)證實(shí)構(gòu)建調(diào)控網(wǎng)絡(luò),最后構(gòu)建了阿爾默海茨病的異常表達(dá)網(wǎng)絡(luò)以及相關(guān)表達(dá)網(wǎng)絡(luò)。
【關(guān)鍵詞】阿爾默海茨病 文本挖掘 老年癡呆 miRNA 轉(zhuǎn)錄因子
阿爾茨海默?。ˋD)是一種起病隱匿的進(jìn)行性發(fā)展的神經(jīng)系統(tǒng)退行性疾病。臨床上以記憶障礙、失語(yǔ)、失用、失認(rèn)、視空間技能損害、執(zhí)行功能障礙以及人格和行為改變等全面性癡呆表現(xiàn)為特征,病因迄今未明。65歲以前發(fā)病者,稱(chēng)早老性癡呆;65歲以后發(fā)病者稱(chēng)老年性癡呆。如今,阿爾茨海默病已經(jīng)成為一個(gè)世界性的公共衛(wèi)生問(wèn)題,由于人口老齡化情況嚴(yán)重,使得阿爾茨海默病的發(fā)病率和患者人數(shù)成倍增加。據(jù)當(dāng)前數(shù)據(jù)統(tǒng)計(jì),世界范圍內(nèi)阿爾茨海默病患者大概有三千多萬(wàn),預(yù)計(jì)到2050年,阿爾茨海默病患者是現(xiàn)在人數(shù)的三倍還要多。這些都給我國(guó)社會(huì)的發(fā)展帶來(lái)了沉重的負(fù)擔(dān)。因此,如何有效的對(duì)其預(yù)防和治療,成為我國(guó)面臨重要的健康問(wèn)題。由于近年來(lái),科學(xué)技術(shù)的快速發(fā)展,使得網(wǎng)絡(luò)大數(shù)據(jù)在醫(yī)學(xué)上也得到了廣泛的應(yīng)用,因此本文就利用計(jì)算方法構(gòu)建阿爾茨海默病差異表達(dá)網(wǎng)絡(luò)以及相關(guān)表達(dá)網(wǎng)絡(luò),并從中挖掘隱藏的miRNA與阿爾茨海默病的關(guān)聯(lián)信息。
1 數(shù)據(jù)搜集
文中的基因數(shù)據(jù)來(lái)自DisGeNET (v4.0) ,MalaCards,Phenopeda和PubMed (http://www.ncbi.nlm.nih.gov/pubmed) 數(shù)據(jù)庫(kù)。miRNA數(shù)據(jù)來(lái)自HMDD (v2.0) ,miR2Disease,PhenomiR和PubMed數(shù)據(jù)庫(kù)。轉(zhuǎn)錄因子-miRNA數(shù)據(jù)來(lái)自TransmiR(version 1.2)數(shù)據(jù)庫(kù)。轉(zhuǎn)錄因子-基因數(shù)據(jù)來(lái)自TRANSFAC (v 11.4)和ORegAnno數(shù)據(jù)庫(kù)。miRNA宿主基因來(lái)自National Center for Biotechnology Information (NCBI) (http://www.ncbi.nlm.nih.gov/gene/)數(shù)據(jù)庫(kù)。miRNA-基因數(shù)據(jù)來(lái)自Tarbase(v 7.0) ,miRTarBase (v 6)和miRecords (v 4)數(shù)據(jù)庫(kù)。
2 網(wǎng)絡(luò)的構(gòu)建
試驗(yàn)調(diào)控網(wǎng)絡(luò)的數(shù)據(jù)包括以下幾種:轉(zhuǎn)錄因子miRNA(TFs→miRNAs),轉(zhuǎn)錄因子基因(TFs→genes),miRNA基因(miRNAs→genes),miRNA(miRNA)以及宿主基因(host gene)。本文就是通過(guò)這些試驗(yàn)數(shù)據(jù)來(lái)構(gòu)造的轉(zhuǎn)錄因子和miRNA的聯(lián)合調(diào)控網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)稱(chēng)為試驗(yàn)認(rèn)證調(diào)控網(wǎng)絡(luò)。
文章在轉(zhuǎn)錄因子、miRNA和基因的關(guān)聯(lián)數(shù)據(jù)以及試驗(yàn)認(rèn)證調(diào)控網(wǎng)絡(luò)基礎(chǔ)上構(gòu)造了阿爾茨海默病的相關(guān)網(wǎng)絡(luò)。首先將節(jié)點(diǎn)映射到認(rèn)證網(wǎng)絡(luò)中,其次提取出相關(guān)聯(lián)的認(rèn)證數(shù)據(jù)來(lái)構(gòu)造一個(gè)相關(guān)調(diào)控網(wǎng)絡(luò),最后結(jié)合網(wǎng)絡(luò)和其他沒(méi)有出現(xiàn)在上述網(wǎng)絡(luò)中的轉(zhuǎn)錄因子、基因和miRNA一起構(gòu)成一個(gè)網(wǎng)絡(luò)。
繼續(xù)使用相似的方法構(gòu)造了阿爾茨海默病的異常表達(dá)網(wǎng)絡(luò)。把異常數(shù)據(jù)(阿爾茨海默病的轉(zhuǎn)錄因子、miRNA和基因)映射到認(rèn)證網(wǎng)絡(luò)中,從而提取出試驗(yàn)數(shù)據(jù)來(lái)構(gòu)建異常表達(dá)的網(wǎng)絡(luò),最后也是結(jié)合網(wǎng)絡(luò)以及其他沒(méi)有出現(xiàn)在此網(wǎng)絡(luò)中的轉(zhuǎn)錄因子、miRNA和基因再構(gòu)成網(wǎng)絡(luò)。本文中使用cytoscape軟件把網(wǎng)絡(luò)可視化。
3 相關(guān)表達(dá)網(wǎng)絡(luò)的構(gòu)建
如圖1所示為阿爾茨海默病的相關(guān)表達(dá)網(wǎng)絡(luò)。其中包括了異常調(diào)節(jié)和非異常調(diào)節(jié)元素,顯然,相關(guān)表達(dá)網(wǎng)絡(luò)包括了異常網(wǎng)絡(luò)。試驗(yàn)結(jié)果顯示14個(gè)宿主基因沒(méi)有差異表達(dá),它們有可能參與了阿爾茨海默病的相關(guān)過(guò)程。異常網(wǎng)絡(luò)在一定程度上揭示了阿爾茨海默病的發(fā)病機(jī)制。相關(guān)網(wǎng)絡(luò)不僅可以在一定程度上顯示出阿爾茨海默病出現(xiàn)的調(diào)控機(jī)制,還可以說(shuō)明該病癥的預(yù)防和治療策略。
圖1為阿爾茨海默病相關(guān)表達(dá)網(wǎng)絡(luò)。紅色節(jié)點(diǎn)代表差異表達(dá)的轉(zhuǎn)錄因子、miRNA和靶基因;藍(lán)色節(jié)點(diǎn)代表非差異表達(dá)以相關(guān)的轉(zhuǎn)錄因子、miRNA和靶基因;白色代表miRNA的宿主基因;圓型代表靶基因;三角形代表轉(zhuǎn)錄因子;園矩形代表宿主基因;菱形代表miRNA。
本文手動(dòng)從阿爾茨海默病的相關(guān)網(wǎng)絡(luò)中提取關(guān)鍵網(wǎng)絡(luò)基序。其中由阿爾茨海默病的相關(guān)表達(dá)網(wǎng)絡(luò)中的宿主基因、miRNA和靶基因組成的共有10種關(guān)鍵網(wǎng)絡(luò)基序。其中包括反饋環(huán)基序,此基序是癌癥關(guān)鍵調(diào)控基序。異常表達(dá)網(wǎng)絡(luò)中包含了45個(gè)3節(jié)點(diǎn)關(guān)鍵網(wǎng)絡(luò)基序,15個(gè)4節(jié)點(diǎn)基序以及26個(gè)反饋環(huán)基序。而相關(guān)表達(dá)網(wǎng)絡(luò)中包含75個(gè)3節(jié)點(diǎn)關(guān)鍵網(wǎng)絡(luò)基序,75個(gè)4節(jié)點(diǎn)基序,31個(gè)反饋環(huán)基序。
4 調(diào)控網(wǎng)絡(luò)的構(gòu)建
最后獲得了38個(gè)預(yù)測(cè)轉(zhuǎn)錄因子。其中轉(zhuǎn)錄因子E2F1,NFKB1 和E2F4是異常表達(dá)基因,TCF3 和非異常表達(dá)基因有關(guān)。圖二顯示出4種轉(zhuǎn)錄因子在阿爾茨海默病的相關(guān)網(wǎng)絡(luò)中的調(diào)控關(guān)系。E2F1 在57個(gè)靶基因之間調(diào)節(jié),其中13個(gè)基因是異常表達(dá)的,其他的都是非異常表達(dá)。E2F1 在10個(gè)miRNA之間調(diào)節(jié),其中9個(gè)miRNA為異常表達(dá),1個(gè)miRNA非異常表達(dá)。與此同時(shí),5個(gè)轉(zhuǎn)錄因子調(diào)節(jié)E2F1 ,6個(gè)miRNA也指向了E2F1 。E2F1 的靶基因和這些miRNA構(gòu)成了38個(gè)反饋環(huán)和6個(gè)前饋環(huán)。E2F4在79個(gè)靶基因之間調(diào)節(jié),其中21個(gè)基因是差異表達(dá),其他的基因都是非差異表達(dá),與此同時(shí)SMARCA4 調(diào)節(jié)了E2F4。NFKB1調(diào)節(jié)了8個(gè)miRNA,它們都是差異表達(dá),5個(gè)轉(zhuǎn)錄因子(E2F1, E2F4, GATA2,RBL2 and SMARCA4)調(diào)節(jié)NFKB1,9個(gè)miRNA調(diào)節(jié)NFKB1,NFKB1的靶基因和6個(gè)miRNA構(gòu)成了6個(gè)反饋環(huán)。TCF3調(diào)節(jié)3個(gè)靶基因(GLI1, VPREB1 and NR0B2),它們都是非差異表達(dá),4個(gè)轉(zhuǎn)錄因子(E2F1, E2F4, RBL2 and SMARCA4)調(diào)節(jié)TCF3,2個(gè)miRNA(miR-145 and miR-17)調(diào)節(jié)TCF3。endprint
圖2為阿爾茨海默病調(diào)控網(wǎng)絡(luò)中E2F1,NFKB1, E2F4 and TCF3的調(diào)節(jié)關(guān)系圖。紅色節(jié)點(diǎn)代表差異表達(dá)的轉(zhuǎn)錄因子、miRNA和靶基因,藍(lán)色節(jié)點(diǎn)代表非差異表達(dá)以及相關(guān)的轉(zhuǎn)錄因子、miRNA和靶基因,圓形代表靶基因,三角形代表轉(zhuǎn)錄因子,菱形代表miRNA。
5 結(jié)論
醫(yī)學(xué)工作者通過(guò)多次的重復(fù)實(shí)驗(yàn),發(fā)現(xiàn)一些與阿爾茨默病有關(guān)的基因和miRNA,根據(jù)大量的研究發(fā)現(xiàn),阿爾茨默病的發(fā)生不是由單一的或者幾個(gè)基因和miRNA造成的。我們可以知道,基因和miRNA可以相互調(diào)控,建立調(diào)控網(wǎng)絡(luò),可以將它們之間的控制關(guān)系清晰的展現(xiàn)出來(lái)。轉(zhuǎn)錄因子,miRNA還有宿主基因都在疾病中占據(jù)重要的作用它們可以共同合作調(diào)控基因表達(dá)。
參考文獻(xiàn)
[1]Xiao F1,Zuo Z,Cai G,et al. miRecords: an integrated resource for microRNA-target interactions [J]. Nucleic Acids Res,2009,37(Database issue):D105-D110.
[2]Havelange V,Stauffer N,Heaphy CC, et al.Functional implications of microRNAs in acute myeloid leukemia by integrating microRNA and messenger RNA expression profiling [J].Cancer,2011,117(20):4696-4706.
[3]劉靜,抑癌基因p14ARF對(duì)慢性粒細(xì)胞白血病細(xì)胞增殖、細(xì)胞周期及凋亡的影響機(jī)制研究[J].中國(guó)醫(yī)藥導(dǎo)報(bào),2012,9(35).
[4]蘇乃芳,轉(zhuǎn)錄因子和microRNA組成的基因調(diào)控網(wǎng)絡(luò)的生物信息學(xué)分析[D].北京:北京大學(xué)數(shù)學(xué)科學(xué)學(xué)院,2013.
[5]Dohi O1,Yasui K,Gen Y,et al. Epigenetic silencing of miR-335 and its host gene MEST in hepatocellular carcinoma [J].Int J Oncol,2013,42(02):411-418.
[6]Shannon P,Markiel A,Ozier O,Baliga NS,Wang JT,Ramage D,Amin N, Schwikowski B,IdekerT.Cytoscape:a software environment for integrated models of biomolecular interaction networks.Genome Research 2003 Nov;13(11):2498-504.
作者簡(jiǎn)介
邢翀(1980-),女,吉林省長(zhǎng)春市人。吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院博士畢業(yè),副教授。研究方向?yàn)橹悄苡?jì)算。
作者單位
長(zhǎng)春金融高等專(zhuān)科學(xué)校信息技術(shù)學(xué)院 吉林省長(zhǎng)春市 130028endprint