吳家炎 袁振光 陳依敏
【摘 要】 目的:采用生物信息學(xué)的方法來分析冠心病相關(guān)的基因,通路,轉(zhuǎn)錄因子和miRNA。方法:從公共基因芯片數(shù)據(jù)庫GEO下載冠心病基因表達(dá)譜數(shù)據(jù),篩選出差異表達(dá)基因(DEGs),并對差異基因進(jìn)行GO、KEGG以及PPI網(wǎng)絡(luò)分析。最后利用Webgestalt預(yù)測CHD相關(guān)的miRNA以及轉(zhuǎn)錄因子,并構(gòu)建miRNA-TF-gene調(diào)控網(wǎng)絡(luò)。結(jié)果:共篩選出1449個DEGs。GO功能分析發(fā)現(xiàn)DEGs主要參與炎癥反應(yīng)、細(xì)胞 - 細(xì)胞信號傳導(dǎo)、神經(jīng)肽信號通路等生物學(xué)過程。KEGG通路富集分析發(fā)現(xiàn)DEGs參與神經(jīng)活性配體 - 受體相互作用、蛋白質(zhì)的消化和吸收、維生素的消化吸收等通路。并且篩選出20個與冠心病發(fā)病相關(guān)的基因,特別是發(fā)現(xiàn)了少有文獻(xiàn)報(bào)道的POMC、MYOD1等基因。最后我們還預(yù)測了與CHD相關(guān)的7個轉(zhuǎn)錄因子和3個miRNA。結(jié)論:通過生物信息學(xué)對基因芯片數(shù)據(jù)的分析,我們得到了冠心病相關(guān)的基因、通路、miRNA以及轉(zhuǎn)錄因子,為冠心病的精準(zhǔn)治療提供了新思路。
【關(guān)鍵詞】 冠心??;生物信息學(xué);差異表達(dá)基因 ;miRNA;轉(zhuǎn)錄因子
【中圖分類號】 R249 【文獻(xiàn)標(biāo)志碼】A 【文章編號】1005-0019(2018)17-001-01
冠狀動脈粥樣硬化性心臟?。╟oronary heart disease,CHD) 是由于冠狀動脈粥樣硬化使管腔狹窄或阻塞導(dǎo)致心肌缺血、缺氧而引起的心臟病,簡稱為冠心病,是 21 世紀(jì)威脅人類健康的主要疾病之一 [1]。冠心病的發(fā)生和發(fā)展是在遺傳因素和環(huán)境因素基礎(chǔ)上,多重危險(xiǎn)因素共同作用導(dǎo)致的[2]。高血壓、糖尿病等疾病,以及過度肥胖、不良生活習(xí)慣如吸煙等是誘發(fā)該病的主要因素。冠心病是全球死亡率最高的疾病之一[3],目前對冠心病發(fā)病的遺傳因素還不清楚,對其基因方面的研究相對不足。
近年來,生物信息學(xué)發(fā)展迅速,為疾病在基因方面的研究提供了非常廣闊的平臺。生物信息學(xué)(Bioinformatics)是在生命科學(xué)的研究中,以計(jì)算機(jī)為工具對生物信息進(jìn)行儲存、檢索和分析的科學(xué)。它是當(dāng)今生命科學(xué)和自然科學(xué)的重大前沿領(lǐng)域之一,同時也是21世紀(jì)自然科學(xué)的核心領(lǐng)域之一。本文從GEO 數(shù)據(jù)庫下載冠心病相關(guān)基因表達(dá)譜數(shù)據(jù),為在基因?qū)哟紊涎芯抗谛牟〉陌l(fā)生發(fā)展及其精準(zhǔn)治療提供了新思路。
1 材料與方法
1.1 材料來源 利用美國國立生物技術(shù)信息中心NCBI平 臺 下 的GEO 數(shù)據(jù)庫進(jìn)行芯片篩選,目標(biāo)芯片需滿足如下篩選標(biāo)準(zhǔn):①人類標(biāo)本,排除細(xì)胞株和動物;②入選芯片需具有冠心病信息;③需為基因表達(dá)芯片,各探針具有歸一化的表達(dá)值; 經(jīng)篩選及芯片質(zhì)量分析,我們選取了6個樣本:冠心病CHD3例和健康對照組3例。
1.2 方法
1.2.1 差異基因篩選 下載CEL格式原始數(shù)據(jù),利用R軟件包affy進(jìn)行讀取,采用RMA方法進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化預(yù)處理(包括Background correction, Normalization, Expression calculation),利用平臺注釋文件對探針進(jìn)行注釋,去除沒有匹配到基因的探針;對于不同探針映射到同一基因,我們?nèi)〔煌结樀木底鳛檫@個基因最終的表達(dá)值?;赗包limma篩選差異表達(dá)基因,采用矯正T檢驗(yàn)計(jì)算基因表達(dá)顯著性P值,BH方法矯正P值。每個差異表達(dá)基因,要求P<0.05。
1.2.2 差異表達(dá)基因功能分析 使用常用的富集分析工具DAVID分析差異表達(dá)基因參與的GO(gene ontology) 功能和KEGG(Kyoto encyclopedia of genes and genomes) 通路。參數(shù)富集基因個數(shù)count>=2,超幾何檢驗(yàn)顯著性閾值P <0.05。
1.2.3 差異表達(dá)基因的PPI網(wǎng)絡(luò)分析 使用STRING數(shù)據(jù)庫預(yù)測分析所有差異表達(dá)基因的差異蛋白的PPI網(wǎng)絡(luò),PPI網(wǎng)絡(luò)可揭示蛋白之間的互作關(guān)系。構(gòu)建網(wǎng)絡(luò)軟件為Cytoscape。并統(tǒng)計(jì)節(jié)點(diǎn)degree值,觀察節(jié)點(diǎn)之間的連接情況。
1.2.4 miRNA-TF-gene調(diào)控網(wǎng)絡(luò) 利用webgestalt網(wǎng)站分別對差異基因進(jìn)行轉(zhuǎn)錄因子TF富集預(yù)測和miRNA富集預(yù)測。取富集結(jié)果顯著的TF和miRNA。并整理TF-gene和miRNA-gene關(guān)系對,構(gòu)建miRNA-TF-gene調(diào)控網(wǎng)絡(luò)。
2 結(jié)果
2.1 差異表達(dá)基因篩選結(jié)果 最終我們共篩選出1449個差異基因,與對照組相比,冠心病樣品組得到726個上調(diào)基因,723個下調(diào)基因。
2.2 GO功能和KEGG通路富集分析 通過G0功能分類體系對差異基因進(jìn)行注釋后發(fā)現(xiàn),顯著富集的生物過程GO富集分析發(fā)現(xiàn)DEGs主要參與炎癥反應(yīng)、細(xì)胞-細(xì)胞信號轉(zhuǎn)導(dǎo)、
神經(jīng)肽信號通路、G蛋白偶聯(lián)受體-環(huán)核苷酸通路、G蛋白偶聯(lián)受體-蛋白信號通路的正調(diào)控等生物學(xué)過程。以KEGG數(shù)據(jù)庫中的pathway為基本單位,向背景基因組映射,明確差異基因所參與的主要代謝途徑和細(xì)胞轉(zhuǎn)導(dǎo)通路,結(jié)果表明差異基因顯著富集于神經(jīng)活性配體-受體相互作用、蛋白質(zhì)的消化和吸收、黑素瘤、維生素的消化吸收、甘氨酸、絲氨酸和蘇氨酸代謝、脂肪的消化吸收等具有統(tǒng)計(jì)學(xué)意義的通路。
2.3 PPI網(wǎng)絡(luò)分析 結(jié)合PPI數(shù)據(jù)庫,分別對上調(diào)差異基因和下調(diào)差異基因構(gòu)建網(wǎng)絡(luò)圖,得到的PPI網(wǎng)絡(luò)。上調(diào)ppi網(wǎng)絡(luò)包括392個節(jié)點(diǎn),下調(diào)ppi網(wǎng)絡(luò)包括419個節(jié)點(diǎn)。上調(diào)基因按照節(jié)點(diǎn)度大小排名的top 20 ,見表1。此處插入表12.4 miRNA-TF-gene調(diào)控網(wǎng)絡(luò):通過Webgestalt,我們找到富集結(jié)果排名前七的轉(zhuǎn)錄因子TF:PAX8、EVI1、AR、NRSF、GATA、IK1、MYOD,以及排名前三的miRNA:MIR-26A/B,MIR-29A/B/C,MIR-122A。整理相應(yīng)的TF和miRNA的靶基因,構(gòu)建miRNA-TF-gene調(diào)控網(wǎng)絡(luò),見圖1。
3 討論
目前對冠心病的發(fā)病機(jī)制,還不是特別的清楚。根據(jù)文獻(xiàn)報(bào)道,炎癥反應(yīng)對冠狀動脈形成粥樣硬化具有重要的作用。Luczak[4]FanWH[5]楊海燕[6]等研究表明,慢性炎癥反應(yīng)導(dǎo)致細(xì)胞產(chǎn)生黏附分子,是動脈粥樣硬化的始動環(huán)節(jié);同時炎癥指標(biāo)可用來預(yù)測心血管疾病的發(fā)生。但是目前在基因水平上對該病的了解還是非常的有限,因此本研究對正常人和冠心病患者的表達(dá)譜進(jìn)行差異基因篩選,共篩選出1449個差異基因。利用string 在線軟件對1449個差異基因編碼蛋白進(jìn)行蛋白質(zhì)互相作用關(guān)系網(wǎng)絡(luò)分析,按節(jié)點(diǎn)度大小篩選出排名前20的上調(diào)基因:POMC、FPR2、MYOD1、GATA1、C3、GRM4、DRD4、SSTR5、PYY、FGF13、RGS6、CXCR1、、CCR10、SSTR4、CNR2、GALR3、APLN、NPBWR1、CDX2、PTGDR2。
對以上基因進(jìn)行文獻(xiàn)挖掘,我們發(fā)現(xiàn)已有大量的文獻(xiàn)報(bào)道APLN、CXCR1、C3、FPR2與冠心病的發(fā)生、發(fā)展的機(jī)制以及預(yù)后關(guān)系密切 ;NR2、PYY、NPBWR1、PTGDR2與冠心病發(fā)生的危險(xiǎn)因素有關(guān),比如:糖尿病、高血壓、肥胖;POMC、MYOD1等至今少有跟冠心病相關(guān)的報(bào)道。Guang Yang等研究表明,載脂蛋白C3單核苷酸多態(tài)性增加了冠心病的發(fā)生風(fēng)險(xiǎn)[7] ;Ye zhang等認(rèn)為CXCR1通過抑制內(nèi)皮細(xì)胞轉(zhuǎn)移,使冠心病發(fā)生的風(fēng)險(xiǎn)增加[8];CAPLN是APJ受體的內(nèi)源性肽配體,已經(jīng)成為心血管系統(tǒng)的新型調(diào)節(jié)劑,APLN的缺乏使血管和內(nèi)皮祖細(xì)胞生成減少,從而體內(nèi)心肌血管生成受損,同時也會增加對缺血性損傷的易感性,這也增加了冠心病發(fā)作的風(fēng)險(xiǎn)[9]。值得一提的是,我們發(fā)現(xiàn)POMC、MYOD1等基因與冠心病之間的關(guān)系報(bào)道較少。MyoD1基因,別名MYF3,是一種蛋白質(zhì)編碼基因。Davis等人在1987年通過與小鼠MyoD1探針的弱交叉雜交分離出3種不同的人肌源性因子MYF3,MYF4和MYF5的cDNA,證明MYF3是小鼠MyoD1的人類同系物。Weintraub等人在1991年研究發(fā)現(xiàn)MyoD1僅在骨骼肌及其前體中表達(dá),在非肌肉細(xì)胞中,基因被特定基因所抑制。但這與冠心病的發(fā)生發(fā)展還需進(jìn)一步的研究。
值得一提是,我們還利用Webgestalt和Cytoscape構(gòu)建了miRNA-TF-gene調(diào)控網(wǎng)絡(luò)。Webgestalt的富集結(jié)果中,我們得到與CHD關(guān)系最為密切的7個轉(zhuǎn)錄因子:PAX8、EVI1、AR、NRSF、GATA、IK1、MYOD,以及3個miRNA:MIR-26A/B,MIR-29A/B/C,MIR-122A。
總之,通過生物信息學(xué)方法對冠心病芯片進(jìn)行數(shù)據(jù)挖掘,我們得到了冠心病患者和正常健康人之間的差異表達(dá)基因。對這些差異表達(dá)基因的進(jìn)一步篩選得到包括MYOD1和POMC在內(nèi)的20個關(guān)鍵基因;同時我們發(fā)現(xiàn)炎癥反應(yīng)、維生素的消化吸收等過程和神經(jīng)活性配體 - 受體相互作用等通路;最后我們進(jìn)一步研究發(fā)現(xiàn)了一些與CHD相關(guān)的轉(zhuǎn)錄因子和miRNA:PAX8、EVI1、AR、MIR-26A/B、MIR-29A/B/C,MIR-122A。這些基因,轉(zhuǎn)錄因子和miRNA可能在CHD的發(fā)病機(jī)制中發(fā)揮重要的作用,但是具體的作用機(jī)制還需要進(jìn)一步的實(shí)驗(yàn)來探討,這對于CHD以后的精準(zhǔn)治療具有一定的臨床意義
參考文獻(xiàn)
[1] 楊天,王莉娜,智宏,等. 冠心病合并糖尿病與單純冠心病危險(xiǎn)因素及臨床特點(diǎn)比較研究[J]. 南京醫(yī)科大學(xué)學(xué)報(bào)(自然科學(xué)版),2014(09):1218-1223.
[2] 高閱春,何繼強(qiáng),姜騰勇,等. 冠心病患者冠狀動脈病變嚴(yán)重程度與冠心病危險(xiǎn)因素的相關(guān)分析[J]. 中國循環(huán)雜志,2012(03):178-181.
[3] 謝睿彬,張小新,蘇華,等. 不同類型冠心病介入治療的研究進(jìn)展[J]. 中國醫(yī)學(xué)創(chuàng)新,2013(15):158-159.
[4] Luczak S E, Smits S H, Decker C, et al. The Chlamydia pneumoniae Adhesin Pmp21 Forms Oligomers with Adhesive Properties[J]. J Biol Chem,2016,291(43):22806-22818.
[5] Fan W H, Liu D L, Xiao L M, et al. Coronary heart disease and chronic periodontitis: is polymorphism of interleukin-6 gene the common risk factor in a Chinese population?[J]. Oral Dis,2011,17(3):270-276.
[6] 楊海燕,毛靜飛,吳常裕,等. 肺炎衣原體感染及炎癥反應(yīng)與冠心病的關(guān)系[J]. 中華醫(yī)院感染學(xué)雜志,2017(23):5352-5356.
[7] Yang G, Lei M M, Yu C L, et al. Apolipoprotein A5 and apolipoprotein C3 single nucleotide polymorphisms are correlated with an increased risk of coronary heart disease: a case-control and meta-analysis study[J]. Lipids Health Dis,2015,14:113.
[8] Zeng Y, Shen Y, Huang X L, et al. Roles of mechanical force and CXCR1/CXCR2 in shear-stress-induced endothelial cell migration[J]. Eur Biophys J,2012,41(1):13-25.
[9] Wang W, Mckinnie S M, Patel V B, et al. Loss of Apelin exacerbates myocardial infarction adverse remodeling and ischemia-reperfusion injury: therapeutic potential of synthetic Apelin analogues[J]. J Am Heart Assoc,2013,2(4):e249.