苗文清 ,王 宇 ,趙曉麗 ,田倪妮 ,尤麗英
(1)昆明市第一人民醫(yī)院 心血管內(nèi)科;2)全科醫(yī)學(xué)科;3)檢驗(yàn)科,云南 昆明 650011)
中國社會及人民生活方式變化,心血管患病率顯著上升,心血管病致死率在總死亡中仍居首位[1]。急性心肌梗死[2](acute myocardial infarction,AMI)死亡率高,預(yù)后差,對生活質(zhì)量有較大影響,社會及家庭經(jīng)濟(jì)負(fù)擔(dān)嚴(yán)重。該病的發(fā)生、發(fā)展都與動脈粥樣硬化有關(guān),Knorr M 研究發(fā)現(xiàn)[3]單核細(xì)胞在冠心病和動脈粥樣硬化斑塊的出現(xiàn)及進(jìn)展中有著重要的作用,冠心病(coronary artery disease,CAD)的早期階段,血循環(huán)中的單核細(xì)胞被吸引、吸附在動脈粥樣硬化斑塊的內(nèi)皮細(xì)胞上,外周血單核細(xì)胞(peripheral blood mononuclear cells,PBMCs)轉(zhuǎn)化為巨噬細(xì)胞(Macrophage)進(jìn)入血管壁,吞噬脂質(zhì)轉(zhuǎn)化為泡沫細(xì)胞,形成脂斑和脂紋,促進(jìn)動脈粥樣硬化斑塊的演化。檢測外周循環(huán)血中單核細(xì)胞的差異基因,可能找到動脈粥樣硬化冠心病新的診斷標(biāo)記物、初步探索斑塊形成分子機(jī)制或者藥物基因干預(yù)靶點(diǎn)。
人類的全基因組測序完成,成為高通量測序(high-throughput sequencing,HTS)的里程碑。高通量測序下的轉(zhuǎn)錄組學(xué),是對特定條件下細(xì)胞或者組織內(nèi)全部轉(zhuǎn)錄本同時(shí)進(jìn)行測序,可以反映生物體在不同狀態(tài)下,不同基因的表達(dá)水平和調(diào)控模式[4]。本研究采用高通量測序技術(shù),對冠心病急性心肌梗死患者及冠脈正常人群,外周循環(huán)血中單核細(xì)胞基因lncRNA/mRNA/circRNA 的全基因組水平表達(dá)譜分析。應(yīng)用GO 富集分析及KEGG 富集分析,探索差異表達(dá)的mRNA 與差異表達(dá)的lncRNA 及circRNA 之間可能的生物功能聯(lián)系;運(yùn)用通路網(wǎng)絡(luò)分析探究通路之間可能的相互作用關(guān)系。
本研究經(jīng)昆明市第一人民醫(yī)院倫理委員會批準(zhǔn)(倫理號:YLS2020-170)。分組人群定義:根據(jù)世界衛(wèi)生組織急性心肌梗死定義,確診為急性心肌梗死,且冠脈造影證實(shí)冠脈狹窄達(dá)95%~100% 為心肌梗死人群;冠脈造影檢查血管腔無狹窄為冠脈正常人群[2]。納入標(biāo)準(zhǔn):經(jīng)冠脈造影影像學(xué)檢查及樣本質(zhì)量控制,篩選2020 年9月至2021 年9 月在昆明市第一人民醫(yī)院接受冠脈造影檢查的患者4 例,其中造影正常2 例(對照組,CG)、急性心肌梗死2 例(心梗組,EG)。排除標(biāo)準(zhǔn):研究排除風(fēng)心病、心肌病、心功能不全等其他器質(zhì)性心臟病者;嚴(yán)重肝腎功能損害、嚴(yán)重感染、惡性腫瘤患者;免疫系統(tǒng)及結(jié)締組織病患者;血液系統(tǒng)疾病患者;甲狀腺功能亢進(jìn)(或減退)、庫欣綜合征等代謝性疾病患者;使用肝素或靜脈溶栓后患者。
1.2.1 外周血RNA 抽提、質(zhì)量控制、基因組測序入選患者于冠脈造影前,使用肝素制劑前,采集外周血(4~5 mL)并及時(shí)分離提取單核細(xì)胞,并提取外周血單核細(xì)胞總RNA,見表1。
表1 4 樣本總RNA 檢測質(zhì)控?cái)?shù)據(jù)Tab.1 Total RNA test quality control data of 4 samples
1.2.2 質(zhì)量控制、基因組測序測序使用DNBSEQ平臺,測序長度為PE100。數(shù)據(jù)分析之前需要去除低質(zhì)量、接頭污染等確保結(jié)果準(zhǔn)確、可靠,見表2。
表2 過濾后質(zhì)量(Reads 過濾)Tab.2 Reads quality statistics after filtering(Reads filtering)
1.2.3 參考物種物種名:Homo_sapiens、來源:NCBI、參考基因組版本:GCF_000001405.39_GRCh38.p13。將過濾后的序列比對到人類參考基因組上(本文參考比對GCF_000001405.39_GRCh38.p13)。
1.2.4 基因表達(dá)量分析差異基因表達(dá)量分析方法 Bowtie2 軟件將clean reads 比對到參考序列,RSEM 軟件計(jì)算基因和轉(zhuǎn)錄本的表達(dá)量,RSEM是通過建立起reads 產(chǎn)生的模型,運(yùn)用最大似然方法確定如何分配reads 到不同的轉(zhuǎn)錄本,采用鏈特異性模式,區(qū)分reads 來源于正負(fù)鏈,從而實(shí)現(xiàn)更精準(zhǔn)地定量。標(biāo)準(zhǔn)化處理基因的表達(dá)量。RSEM 使用的標(biāo)準(zhǔn)化方法是FPKM。FPKM 具體計(jì)算公式如下:使用軟件信息:
Bowtie2(版本:v2.2.5)官網(wǎng):http://bowtie-bio.sourceforge.net/bowtie2/index.shtml
RSEM(版本:v1.2.12)官網(wǎng):http://deweylab.biostat.wisc.edu/rsem
1.2.5 差異基因檢測 差異基因分析方法運(yùn)用泊松分布原理的PossionDis 方法,A 基因?qū)?yīng)x,每個(gè)基因的表達(dá)量只占一小部分,x 服從泊松分布:
樣本1 比對總數(shù)為N1,樣本2 比對總數(shù)為N2;樣本1 比對A 的總數(shù)為x,樣本2 比對A 的總數(shù)為y,A 在兩個(gè)樣本中表達(dá)量相等的概率計(jì)算由公式得:
P-value 的域值由FDR(False Discovery Rate)決定。統(tǒng)計(jì)時(shí)FDR 不能超過0.05。差異倍數(shù)越大則FDR 值越小,表明表達(dá)差異越顯著?;虿町惐磉_(dá)為 FDR ≤0.001,差異倍數(shù)大于2 倍。
1.2.6 富集分析可分析了解某個(gè)特定基因集在某個(gè)代謝通路、分子功能或參與的生物學(xué)過程中是否發(fā)生顯著富集。
分析方法(KEGG enrichment analysis 和GO enrichment analysis)
探索基因的生物學(xué)功能使用KEGG Pathway富集分析。以 KEGG Pathway 為單位,最終Q value ≤0.05 的Pathway 為顯著富集。繪制KEGG分析氣泡圖。
GO 富集分析后可了解候選基因與哪些生物學(xué)功能顯著相關(guān)。候選基因向Gene Ontology 數(shù)據(jù)庫(http://www.geneontology.org/)映射,評價(jià)顯著富集的差異基因。使用R 的基礎(chǔ)函數(shù)phyper(https://stat.ethz.ch/R-manual/R-devel/library/stats/html/Hypergeometric.html)計(jì)算P value。然后對P value 進(jìn)行多重檢驗(yàn)較正,校正軟件包是q value(https://bioconductor.org/packages/release/bioc/ht ml/qvalue.html)。以Q value(校正P value)<=0.05為閾值。繪制GO 分析氣泡圖,見圖1。
圖1 4 樣本表達(dá)量箱線圖Fig.1 Boxplot of expression levels of 4 samples
1.2.7 箱線圖顯示不同4 個(gè)樣品中基因表達(dá)水平的分布情況,可以觀察到數(shù)據(jù)分布的分散程度。
使用軟件:用DESeq2 軟件分析差異基因,|log2FC| >=1,Q value(校正的P value)<=0.05 有顯著性差異基因。使用R 軟件中的 phyper 函數(shù)進(jìn)行富集分析,計(jì)算Pvalue,然后對 P value 進(jìn)行FDR 校正得到 Q value,通常 Q value <=0.05 的功能視為顯著富集。P<=0.05 為差異有統(tǒng)計(jì)學(xué)意義。
4 個(gè)樣本患者基線資料:一般情況、既往病史、血生化、心臟彩超、血常規(guī)結(jié)果,見表3。
表3 高通量測序4 個(gè)樣本患者基線資料Tab.3 Baseline data of 4 patients whose samples received high-throughput sequencing
2 組患者(EG 組與CG 組)差異基因表達(dá),根據(jù)DESeq2 |log2FC| >=1,Q value <=0.05,up 紅色為上調(diào)基因,down 綠色為下調(diào)基因,No-DEGS 灰色為無差異基因,火山圖見圖2。差異基因數(shù)量統(tǒng)計(jì),見表4,圖3。前10 個(gè)差異表達(dá)的mRNA,見表5,圖4。前6個(gè)差異表達(dá)的lncRNA,見表6、圖5。前2 個(gè)差異表達(dá)的circRNA,見表7、圖6。
表5 差異表達(dá)前10 個(gè)mRNATab.5 Top 10 differentially expressed mRNA
表6 差異表達(dá)前6 個(gè)lncRNATab.6 The top 6 differentially expressed lncRNA
表7 差異表達(dá)前2 個(gè)circRNATab.7 The top 2 differentially expressed circRNA
圖3 差異基因數(shù)量統(tǒng)計(jì)Fig.3 Number statistics of differential genes
圖4 差異表達(dá)前10 個(gè)mRNA 表達(dá)量Fig.4 mRNA expression levels of the top 10 differentially expressed
圖5 差異表達(dá)前6 個(gè)LncRNA 表達(dá)量Fig.5 lncRNA expression levels of the top 6 differentially expressed
圖6 差異表達(dá)前2 個(gè)circRNA 表達(dá)量Fig.6 circRNA expression levels of the top 2 differentially expressed
表4 差異基因數(shù)量統(tǒng)計(jì)Tab.4 Number statistics of differential genes
圖2 差異基因表達(dá)火山圖Fig.2 Volcanic map of differential gene expression
KEGG(通路富集分析、疾病富集分析、分子富集分析)分析差異基因,顯示如下氣泡圖。KEGG 通路富集分析中,有6 條通路有顯著富集,分別為staphylococcus aureus infection、transcriptional misregulation in cancer、PI3K-Akt signaling pathway、allograft rejection、primary immunodeficiency and amcebiasis,KEGG疾病富集分析,僅有1種疾病顯著富集相關(guān),為miyoshimyopathy,KEGG分子富集分析,發(fā)現(xiàn)有2個(gè)分子有顯著富集,分別為 sulfoglucolipids biosynthesis,ceramide and polyamine biosynthesis,arginine,見圖7~9。
圖7 KEGG-pathway 富集分析Fig.7 KEGG-Pathway enrichment analysis
對差異基因進(jìn)行 GO 細(xì)胞組成(celler component)、GO細(xì)胞功能(molecular function)、GO 生物過程(biological process)分子富集分析顯示如下氣泡圖。其中對細(xì)胞組成進(jìn)行GO 富集分析,有16 個(gè)顯著富集的細(xì)胞組成,分別為:specific granule lumen、extracellular region、tertiary granule lumen、azurophll granule lumen、ectracellular space、ectracellular exosome、integral component of plasma membrane、tertiary granule membrane、plasmamembrane、specific granule、specific granule membrane、azurophil granule、phagocytic vesicle lumen、Collagen-containing extracellular matrix、extracellular matrix and membrane,對細(xì)胞功能進(jìn)行GO 細(xì)胞功能富集分析,有6 個(gè)有顯著富集的細(xì)胞功能,分別為:RAGE receptor binding、small molecule binding、serine-type endopeptidase activity、lipopolysaccharide binding、peptide antigen binding and calclum-dependent phospholldpid,對生物過程進(jìn)行GO 生物過程富集分析,全部都有顯著富集,見圖10~12。
圖10 GO-CC 富集分析Fig.10 GO-cc enrichment analysis
圖8 KEGG-diseasey 富集分析Fig.8 KEGG-disease enrichment analysis
圖9 KEGG-module 富集分析Fig.9 KEGG-module enrichment analysis
冠狀動脈粥樣硬化性心臟病是一種多因素為誘因,發(fā)病機(jī)制復(fù)雜的全球病死率最高的慢性疾病之一[5]。據(jù)WHO 最新報(bào)道,全球每年有一千七百九十萬人死于心血管疾病,其中約七百四十萬人死于冠心病[6]。急性心肌梗死是冠狀動脈粥樣硬化中的嚴(yán)重類型,此類患者死亡率、致殘率及合并癥發(fā)生率極高,社會、經(jīng)濟(jì)及家庭負(fù)擔(dān)重。因此針對此嚴(yán)重冠心病類型的研究在臨床工作中有著極其重要的價(jià)值。RNAs 在心血管疾病[7]中的運(yùn)用和研究已成為國、內(nèi)外近期研究的熱點(diǎn),對其功能及作用機(jī)制的探討目前呈上升趨勢。本研究針對AMI 患者與正常對照患者外周動脈血中循環(huán)RNAs 的差異表達(dá)分析。發(fā)現(xiàn)此兩類患者有明顯差異表達(dá)的mRNA、lncRNA 及circRNA,如上結(jié)果所示。本研究篩選出明顯差異表達(dá)的10個(gè)mRNA,6 個(gè)lncRNA,2 個(gè)circRNA。目前研究[8]顯示:非編碼RNA 參與多個(gè)生物學(xué)和病理學(xué)過程,LncRNA 和circRNA 通過不同的機(jī)制影響和調(diào)控著mRNA[9]。Salmena 等[10]于2011 年提出競爭性內(nèi)源性RNA(competitive endogenous RNA)假說。假說[10]認(rèn)為:LncRNA、circRNA、mRNA等轉(zhuǎn)錄物通過miRNA 結(jié)合位點(diǎn)競爭性結(jié)合miRNA;構(gòu)成ceRNA 調(diào)控網(wǎng)絡(luò)保持一種平衡穩(wěn)態(tài)。有研究[11]提示:lncRNA 在疾病或健康狀態(tài)下都會對不同的生物學(xué)過程起著重要調(diào)控作用;但目前對LncRNA 調(diào)控基因表達(dá)和細(xì)胞信號通路[12]的機(jī)制仍然不明;在病理刺激或在血管疾病狀態(tài)[13-14]下部分lncRNA 有功能學(xué)變化;LncRNA具有調(diào)控內(nèi)皮功能、調(diào)節(jié)血管平滑肌、調(diào)控血管重構(gòu)[15]等生物學(xué)功能;LncRNA 可激活白細(xì)胞、巨噬細(xì)胞,影響膽固醇代謝[16-18];因此,認(rèn)識lncRNA 在血管疾病中的功能及調(diào)控方式,能提供以lncRNA 為基礎(chǔ)的新型生物學(xué)標(biāo)記物。
圖11 GO-F 富集分析Fig.11 GO-F enrichment analysis
本研究對差異基因進(jìn)行KEGG pathway enrichment analysis,KEGG disease enrichment analysis and KEGG molecular enrichment analysis。在KEGG 通路富集分析中涉及PI3K-Akt 信號通路、細(xì)菌感染[19]、癌癥的轉(zhuǎn)錄失調(diào)、移植排斥反應(yīng)、免疫缺陷[20]等;為進(jìn)一步進(jìn)行相關(guān)通路的研究提供依據(jù)和方向;KEGG 疾病富集分析,涉及為肌病相關(guān),可能與血管平滑肌改變有關(guān)[21];KEGG 分子富集分析,提示與脂類生物合成,神經(jīng)酰胺和多胺類生物合成[22]等有關(guān)。通過對KEGG 相關(guān)富集分析的研究,可為下一步功能學(xué)研究提供方向。
圖12 GO-P 富集分析Fig.12 GO-P enrichment analysis
本研究對差異基因進(jìn)行GO 細(xì)胞組成、GO 細(xì)胞功能、GO 生物過程分子富集分析。在GO 細(xì)胞組成中細(xì)胞外區(qū)、細(xì)胞外腔、胞漿腔、細(xì)胞外間隙、細(xì)胞外體、質(zhì)膜、特異性顆粒、嗜酸性粒細(xì)胞、吞噬泡腔、細(xì)胞外基質(zhì)和膜均有顯著富集;GO 細(xì)胞功能富集分析有6 個(gè)顯著富集的細(xì)胞功能,分別為:E 受體結(jié)合、小分子結(jié)合、絲氨酸型內(nèi)肽酶活性、脂多糖結(jié)合、肽抗原結(jié)合和鈣依賴性磷脂;GO 生物過程富集分析,20 條生物過程全部都有顯著富集,推測多項(xiàng)生物學(xué)過程參與其中,可能多因素共同影響冠狀動脈粥樣硬化的發(fā)生與發(fā)展及急性血栓事件。
本研究創(chuàng)新點(diǎn)利用高通量二代測序而不是芯片篩選差異表達(dá)RNAs,能發(fā)現(xiàn)更多未知的與冠心病相關(guān)的RNAs。RNAs(lncRNA、CircRNA)為目前研究熱點(diǎn),對于RNAs 與臨床相結(jié)合的研究科研價(jià)值非常大。本研究篩選出顯著差異表達(dá)的10 個(gè)mRNA,6 個(gè)lncRNA,2 個(gè)circRNA。因目前入選病例少,雖有一定的提示,但仍需進(jìn)一步擴(kuò)大樣本量進(jìn)行驗(yàn)證性試驗(yàn)。對于篩選出的相關(guān)差異性RNA 需進(jìn)一步完善qRT-PCR 的驗(yàn)證實(shí)驗(yàn)及相關(guān)功能驗(yàn)證,并對其中特異性lncRNA 或circRNA 及相關(guān)靶基因作為新型生物學(xué)標(biāo)記物進(jìn)行臨床評估并分析基因作用機(jī)制。