李 雪,馮彥超,牟華明,樂 暾
冠心病是指冠狀動脈粥樣硬化引起冠狀動脈狹窄或閉塞,導致心肌缺血缺氧或心臟壞死,通過各種作用機制導致一系列不良后果,甚至出現心臟性猝死。目前,冠心病已嚴重威脅到中老年人群的健康[1]。近年來,基因表達譜數據快速增長,利用生物信息學方法對基因表達譜數據進行深入挖掘成為新的研究熱點,既往對冠心病的基因研究多聚集在微小RNAs(microRNAs)上,已有研究證實,冠心病的病理生理過程與microRNAs密切相關[2],但對冠心病病人表達的其他基因認識不足且其他基因是否為冠心病的新型治療靶點研究較少。本研究使用GEO數據庫尋找冠心病病人相關基因芯片、繪制Venn圖尋找共同表達的差異基因,運用京都基因與基因組百科全書(KEGG)、STRING等數據庫尋找共同差異表達基因之間的聯系,進一步尋找冠心病的特征性基因,以期為冠心病早期診斷及特異性靶向治療提供依據。
進入GEO數據庫(www.ncbi.nlm.nih.gov/geo),在輸入框中輸入“coronary disease” AND “coronary heart disease”,檢索現有的冠心病基因芯片數據集,獲取兩個數據集GSE71226、GSE98583。GSE71226以外周血為研究組織,共納入6名研究對象,其中3例為冠心病病人,3名為正常人;GSE98583以全血為研究組織,共納入18名研究對象,6例為單支血管病變的冠心病病人,6例為三支血管病變的冠心病病人,6名為無血管病變的正常人。
2.1 差異表達基因的分析 利用GEO數據庫的GEO2R在線分析工具尋找差異表達基因。將GSE71226中的3例冠心病病人樣本作為試驗組,3名正常人樣本作為對照組;GSE98583中的12例存在血管病變的病人樣本作為試驗組,6名無血管病變的正常人樣本作為對照組,分析兩個基因集差異表達基因。將從GEO數據庫檢索到的且差異倍數≥1、P<0.05的基因作為差異表達基因。詳見表1、表2。
表1 GSE98583中的部分差異表達基因
表2 GSE71226中的部分差異表達基因
2.2 共同表達差異基因的分析 將兩個芯片中(GSE71226、GSE98583)選擇的差異表達基因進行Venn圖分析,尋找共同表達差異基因,存儲后以供分析。詳見圖1。
圖1 共同表達差異基因Venn圖
2.3 基因本體(GO)富集分析 利用DAVID網站將共同表達差異基因進行GO富集分析,GO分析發(fā)現共同表達差異基因功能主要集中在以下幾個方面:1990440 RNA聚合酶Ⅱ啟動子轉錄對內質網應激的正調控(positive regulation of transcription from RNA polymerase Ⅱ promoter in response to endoplasmic reticulum stress);0021549小腦發(fā)育(cerebellum development);0005783內質網(endoplasmic reticulum);0070062胞外小體(extracellular exosome);0005615胞外間隙(extracellular space);0005654核質(nucleoplasm);0005515蛋白質結合(protein binding);0019838生長因子結合(growth factor binding);0004872受體活性(receptor activity)。詳見表3。
表3 共同差異基因GO富集分析
2.4 KEGG通路分析 利用DAVID網站將共同表達差異基因進行KEGG通路分析,發(fā)現了1條關鍵途徑,即酪氨酸激酶-信號轉導子和轉錄激活子(Janus kinase-signal transducer and activator of transcription,JAK-STAT)信號轉導途徑(P<0.05)。詳見表4、圖2。
表4 共同差異基因KEGG通路分析
圖2 JAK-STAT信號通路(五星位置為本研究中蛋白)
2.5 蛋白-蛋白相互作用(PPI)網絡分析 通過STRING網站對共同表達差異基因行PPI網絡分析,發(fā)現IL6ST與SOCS1聯系較緊密。詳見圖3。
圖3 共同差異基因PPI網絡
冠心病是一種常見的慢性疾病,若不及時診治,病人生命安全及生活質量將受到嚴重的影響[3-4]。有研究顯示,冠心病已成為因病死亡的首要原因[5],評估部分心血管危險因素在疾病預防和預后方面起重要作用,但完全預測復發(fā)事件略顯不足[6-7]。一些分子標志和血清炎癥標志物雖然在這方面獲得了越來越多的關注,僅適當增加了預測能力[8]。因此,尋找敏感的疾病標志物以揭示疾病的初始失調和潛在機制是目前研究需解決的問題。
本研究通過生物信息學方法,篩選GEO數據庫中現有的芯片數據,獲得兩個有關冠心病的基因集,與正常人進行對照,對兩個基因集取交集,獲得50個共同表達差異基因,進一步對共同表達差異基因進行相關分析,對冠心病病人體內差異基因進一步分析。通過對共同表達差異基因進行GO富集分析,發(fā)現有統計學意義的是小腦發(fā)育、內質網、胞外小體這一系列功能;通過進行KEGG通路分析,發(fā)現有統計學意義的是JAK-STAT信號通路,該通路中部分成員在心肌中表達[9]。相較于其他信號通路,該通路涉及多個病理生理過程[10],且對心肌血管的生成及缺血心肌的保護也有一定作用[11]。通過分析發(fā)現,IL6ST、PIAS2、SOCS1這3個冠心病基因參與該通路,相關研究證實,SOCS1通過升高體內促炎細胞因子水平進而參與冠心病發(fā)病[12]。關于IL6ST及PIAS2與冠心病之間的關系未見相關研究。
目前醫(yī)療診治手段不能完全治愈冠心病,雖然部分病人行經皮冠狀動脈介入術治療,但術后需長期口服藥物治療。介入治療雖然可有效開通部分血管,但無法逆轉其生物學進程。部分病人術后出現冠狀動脈再狹窄現象,導致病人再次選擇介入術開通血管或其他有效治療方法,從而增加醫(yī)療開支[13]。有研究表明,動脈粥樣硬化的發(fā)生與JAK-STAT通路介導的炎癥反應有關[14]。本研究未對該信號通路涉及冠心病的基因進行研究,通過基因芯片方法,尋找出IL6ST、PIAS2及SOCS1這3個基因,該結果為早期診斷冠心病提供可能,并成為潛在治療靶點,通過對上述3個基因的提前檢測,可減少病人后續(xù)的醫(yī)療費用并提高后期的生活質量。