翟 斌,韓 梅,蒙莉萍,張鈺坤,姚炎燚
1.內蒙古自治區(qū)包頭市第八醫(yī)院檢驗科,內蒙古包頭 014040;2.內蒙古迪安豐信醫(yī)療科技有限責任公司,內蒙古呼和浩特 010000;3.內蒙古自治區(qū)包頭市第八醫(yī)院院長辦公室,內蒙古包頭 014040
冠心病(CHD)是心血管疾病中最常見的一種類型,發(fā)病率和病死率逐年上升且已經超過大多數腫瘤性疾病。有研究表明,高脂血癥、糖尿病、高血壓和吸煙是CHD高發(fā)的危險因素,且隨著年齡的增加,CHD發(fā)病率也顯著提高[1]。當冠狀動脈發(fā)生粥樣硬化,會引起管腔狹窄或閉塞,造成心肌缺血、缺氧性損傷或壞死。CHD的發(fā)生是由不同因素所致,病因尚不完全清楚,目前較多研究表明,脂質代謝異常和激活的炎癥反應在CHD中起關鍵作用[2-3]。近年來,許多研究發(fā)現,炎癥因子參與和調控著CHD的發(fā)生、發(fā)展過程,臨床檢測指標,如同型半胱氨酸(Hcy)、超敏C反應蛋白(hs-CRP)、白細胞介素等已經成為診斷CHD的關鍵指標被廣泛研究[4-5]。本研究旨在通過生物信息學分析技術從GEO數據庫下載CHD基因表達芯片數據,對差異表達基因進行分析,揭示CHD發(fā)生中涉及的相關生物過程和參與的信號通路,了解生物標志物潛在的分子機制,結合臨床檢測指標綜合分析并對相關基因進行驗證,為CHD的診斷與預防提供新的思路。
1.1基因微陣列數據的獲取 以“Coronary Heart Disease”為關鍵詞在GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/)進行檢索獲得樣本的基因表達芯片,下載GSE71226和GSE66360兩個數據集。其中GSE71226包括3例CHD患者樣本和3例健康對照樣本;GSE66360包括21例CHD患者樣本和22例健康對照樣本的基因表達矩陣,實驗平臺均來自Affymetrix Human Genome U133 Plus 2.0 Array。
1.2方法
1.2.1原始數據預處理及差異表達基因的挖掘 下載原始數據,利用R語言對芯片數據進行差異表達分析(以P<0.05,|logFC|≥0.5為篩選條件)和聚類分析,獲得差異表達基因。
1.2.2共有差異表達基因Venn分析 通過TBtools軟件對兩個數據集的共有差異表達基因進行分析,得到交叉表達基因Venn圖及共有基因列表信息。
1.2.3基因本體(GO)和京都基因與基因組百科全書(KEGG)分析 GO分析是高通量基因數據功能分析最常用的方法,研究目標基因在細胞組分、分子功能和生物過程3個層面的功能作用。KEGG分析包含了多種生物化學通路,可以更清楚地了解目標基因參與人體哪些通路。通過將待分析基因列表上傳至DAVID生物信息學資源數據庫,即可關聯到基因相關功能注釋和通路富集情況,將結果下載為文本文件,使用R語言(ggplot)對結果進行可視化處理。
1.2.4基因富集(GSEA)分析 GSEA分析對基因表達量矩陣進行計算,分析基因集合,可以更全面地分析基因的富集情況。下載兩個數據集的基因表達原始數據并進行整理,使用GSEA線上軟件(https://www.omicshare.com/tools/Home/)進行可視化分析,篩選條件為P<0.01,錯誤發(fā)現的比率(FDR)<25%。
1.2.5蛋白質互作網絡(PPI)分析 PPI分析使用STRING(https://cn.string-db.org/)在線軟件。將基因列表上傳即可展示PPI分析結果,下載數據后通過Cytoscpe插件篩選Hub基因,并對PPI圖進行可視化。采用GeneMINIA在線分析軟件對Hub基因進行基因功能預測。
1.2.6臨床指標檢測 根據心血管病學分會介入心臟病學組制訂的CHD診斷標準,選取包頭市第八醫(yī)院收治的CHD患者74例[平均年齡(57.53±5.37)歲]和健康體檢者71例[平均年齡(52.44±8.43)歲]。排除標準:并發(fā)自身免疫性疾病和急/慢性感染性疾病;合并惡性腫瘤、腎功能不全和肝膽疾病;近1個月服用過糖皮質激素和免疫抑制劑。檢測指標包括白細胞計數(WBC)、中性粒細胞計數(NEUT#)、淋巴細胞計數(LYMPH#)、單核細胞計數(MONO#)、紅細胞計數(RBC)、血紅蛋白(Hb)、血小板計數(PLT)、hs-CRP、總膽紅素(TBIL)、總膽固醇(TC)、甘油三酯(TG)和Hcy。本研究獲得包頭市第八醫(yī)院倫理委員會審批,所有研究對象知情并同意參與本研究。
1.2.7蛋白印記法(Western blot)檢測大鼠Toll樣受體(TLR)4、共濟失調毛細血管擴張突變(ATM)蛋白表達 選取清潔級SD大鼠15只,體質量220~250 g。隨機抽取9只每天給予高脂飼料連續(xù)喂養(yǎng)6周后,腹腔注射垂體后葉素30 μg/kg,連續(xù)3次,間隔24 h,建立CHD大鼠模型,選取建模成功的CHD模型6只,其余6只作為對照組。取大鼠心肌組織100 mg加入適量放射免疫沉淀測定(RIPA)裂解液提取蛋白,使用試劑盒進行蛋白定量。將蛋白溶液與緩沖液進行混合并煮沸,短暫離心后根據目標蛋白相對分子質量配制不同濃度分離膠,設置電泳時間,電泳后的樣本轉移至聚偏二氟乙烯膜(PVDF)上,按照順序放置于轉印夾低溫轉印150 min;取出PVDF用Tris緩沖液(TBS)清洗1 min,快速轉移至一抗中,4 ℃孵育過夜,次日取出用加吐溫20的TBS(TBST)清洗10 min,共3次,移入熒光二抗中避光孵育2 h,移出用TBST清洗10 min,共3次,隨后進行X光顯影檢測。
2.1差異基因的篩選 為尋找CHD相關差異表達基因,進一步分析疾病發(fā)生中基因的相互作用,以P<0.05,|LogFC|≥0.5為篩選條件進行分析。GSE71226中共鑒定出3 348個差異基因,其中包括1 509個上調基因,1 839個下調基因;GSE66360共鑒定出2 820個差異基因,其中包括1 724個上調基因,1 096個下調基因。
2.2共有差異表達基因的Venn分析 為找到CHD患者具有顯著差異的共表達基因,通過Venn分析將兩個數據集的差異表達基因進行篩選,結果顯示,兩個數據集有458個共有差異表達基因,其中上調基因171個,下調基因287個。見圖1。
注:A為上調基因;B為下調基因。
2.3GO和KEGG分析 為了解兩個數據集中CHD患者共有差異表達基因的生物學功能,對458個共有差異表達基因進行了GO分析,結果顯示,CHD中共有差異表達基因主要參與的生物學功能包括RNA聚合酶Ⅱ啟動子轉錄調控和DNA模板化;所屬的細胞成分主要包括細胞核、細胞質等;其分子功能主要為蛋白質結合、金屬離子結合。KEGG分析顯示,共有差異表達基因顯著富集的信號通路包括單純皰疹病毒Ⅰ型感染、破骨細胞分化、花生四烯酸代謝通路、核因子(NF)-κB信號通路等,表明這些基因主要參與一些病毒感染、炎癥和免疫相關代謝通路。見表1。
表1 部分共有差異表達基因KEGG通路分析
2.4GSEA富集分析 為進一步分析CHD差異表達基因可能參與的信號通路,對兩個數據集的基因表達譜進行GSEA分析,結果顯示,兩個數據集差異表達基因主要富集于Toll樣受體信號通路、炎癥反應、白細胞遷移和花生四烯酸代謝通路等,表明CHD中差異表達基因主要在炎癥反應中富集,并表現為負反饋調節(jié),與KEGG分析結果一致。
2.5PPI分析 為篩選CHD中的關鍵基因,對458個共有差異表達基因進行PPI分析,使用MCODE插件對PPI圖進行聚類(node score cut-off =0.2,K-core=2),通過K-means聚類算法將得分排序,篩選出前兩條基因簇。見圖2。使用Cytohubba插件以MCC算法篩選出20個關鍵基因。上調基因包括細胞因子信號傳導抑制因子3(SOCS3)、白細胞介素1受體拮抗劑(IL1RN)、整合素αM(ITGAM)、CXC基序趨化因子受體1(CXCR1)、雙特異性磷酸酶1(DUSP1)、Fc γ受體ⅡA(FCGR2A)、甲酰肽受體2(FPR2)、含7A的C型凝集素結構域(CLEC7A)、細胞因子信號傳導抑制因子1(SOCS1)等,下調基因包括前列腺素-過氧化內合酶2(PTGS2)、磷酸酶和張力素同系物(PTEN)、過氧化物酶體增殖物激活受體ɑ(PPARA)、TLR8、TLR4、基質金屬蛋白酶9(MMP9)、GATA結合蛋白3(GATA3)、ATM基因、維甲酸誘導基因Ⅰ(DDX58)、白細胞介素1受體Ⅱ型(IL1R2)、人抑瘤素M(OSM)等。這提示這些基因的異常表達可能與CHD的發(fā)生與發(fā)展有著密切關聯。使用GeneMINIA軟件對Hub基因互作關系進行分析,結果顯示,TLR4、ATM基因和亞甲基四氫葉酸還原酶(MTHFR)基因相互作用明顯,表明其可能在CHD的發(fā)生中共同參與調控。
注:A為基因簇1(score:5.8);B為基因簇2(score:4.0)。
2.6臨床檢測指標結果 CHD患者MONO#、hs-CRP、TC、Hcy水平均明顯高于健康對照者,LYMPH#、Hb水平均明顯低于健康對照者,差異均有統計學意義(P<0.05)。見表2。
表2 CHD患者與健康對照者臨床檢測指標水平比較
2.7TLR4、ATM在CHD大鼠心肌組織中的表達水平 與健康大鼠心肌組織比較,CHD大鼠心肌組織TLR4、ATM蛋白表達水平顯著下調,差異均有統計學意義(P<0.05)。見表3。
表3 TLR4、ATM在CHD大鼠心肌組織和健康大鼠心肌組織中蛋白表達水平比較
我國心血管疾病的死亡人數仍在快速增長,患病人群以老年人為主,伴有并發(fā)癥多和病死率高的風險。冠狀動脈造影術不僅給患者帶來痛苦,還要承擔昂貴的醫(yī)療費用[6]。CHD發(fā)生機制復雜,尚無確切闡述,但已有大量實驗證實,動脈粥樣硬化與血管壁炎癥及脂質代謝紊亂密切相關[3,7]。本研究通過生物信息學分析技術,篩選CHD差異表達基因,探究其發(fā)生、發(fā)展中參與的生物過程,結合臨床檢測指標綜合分析,對核心基因進行驗證,旨在為疾病的早期診斷提供思路。
NF-κB是細胞中對免疫與炎癥進行調節(jié)的重要因子,具有促進炎性細胞因子活化、調節(jié)細胞增殖的作用[8]。TLR4是Toll樣受體家族在炎癥反應中一類高度保守的模式識別受體,其與特異性配體結合后通過激活一系列下游蛋白質級聯反應將刺激信號傳遞到細胞核,激活免疫應答基因,如NF-κB,進而誘導與炎癥反應相關的各種細胞因子和黏附分子的表達[9]。本研究臨床指標中檢測到Hcy、hs-CRP、TC水平在CHD患者中顯著升高。C反應蛋白(CRP)是機體受到感染或組織損傷后血漿中急劇上升的一種急性蛋白質,是經典補體途徑的激活劑[10]。PANG等[11]發(fā)現,Hcy通過刺激CRP來啟動血管平滑肌細胞的炎癥反應,而CRP通過NMDAr-ROS-ERK1/2/p38-NF-κB信號通路介導炎癥反應、刺激內皮細胞表達黏附分子、抑制NO的產生而損傷內皮細胞,從而促進動脈粥樣硬化的進展。血脂異常在CHD中起著關鍵作用,機體內TC水平過高也是導致動脈粥樣硬化的重要因素。XIAO等[12]發(fā)現,TC水平也與TLR4/NF-κB通路的激活有關。
本研究在對Hub基因互作關系研究中發(fā)現,TLR4、ATM與MTHFR存在相互作用關系[13]。MTHFR基因是Hcy代謝的關鍵酶,其677位容易發(fā)生突變從而導致該酶活性降低,Hcy代謝能力受阻,導致體內Hcy水平升高[14]。同時,MTHFR基因可通過損傷患者內皮細胞使血管彈性降低,從而促進冠狀動脈斑塊形成[15]。ATM蛋白屬于磷脂酰肌醇3-OH家族成員,是細胞管家基因,在DNA修復和細胞凋亡中起著至關重要的作用[16]。動脈粥樣硬化常伴隨氧化應激程度升高,其特征是血管壁中的脂質和蛋白質氧化,血管內皮細胞損傷。動脈粥樣硬化發(fā)生的氧化應激和DNA損傷均已被證明能激活ATM基因[17-18]。本研究KEGG分析發(fā)現,ATM基因也參與了NF-κB信號通路的調控,通過調節(jié)細胞因子而發(fā)揮作用。氧化激活的ATM激酶具有促細胞增殖作用,通過磷酸化下游底物,參與多條相關通路以維持氧化還原穩(wěn)態(tài)、調控代謝功能和增強信號通路[19]。本研究在CHD大鼠心肌組織Western blot實驗中發(fā)現,TLR4和ATM蛋白在心肌組織中低表達(P<0.05),提示在CHD發(fā)生過程中這兩個基因參與了調控,證實了本研究結果,因此,這兩個基因有望成為CHD的候選標志物。
綜上所述,CHD的發(fā)生與發(fā)展伴隨著炎癥反應和脂質代謝異常。TLR4、ATM參與的生物過程在動脈粥樣硬化發(fā)生過程中起著重要作用,通過對CHD患者有顯著差異表達的指標與差異表達基因參與的通路進行綜合分析,了解CHD關鍵指標檢測的重要性,為高危人群的篩查及診斷提供思路。本研究還具有一定的局限性:首先,樣本量較小導致一些檢測指標差異不明顯;其次,針對核心基因的驗證實驗還不夠完善。后續(xù)將通過更加完善的研究對CHD的發(fā)生機制進行探索,為疾病的診斷和預防提供更有意義的指導。