楊馨悅,葉嘉民,楊 帆,馬文韜,何彩云,羅淞元,劉繼濤,羅建方
[1.華南理工大學(xué)醫(yī)學(xué)院,廣州 510006;2.廣東省心血管病研究所心內(nèi)科廣東省人民醫(yī)院(廣東省醫(yī)學(xué)科學(xué)院),廣州 510080;3.廣東省人民醫(yī)院(廣東省醫(yī)學(xué)科學(xué)院)急危重癥醫(yī)學(xué)科,廣州 510080]
主動(dòng)脈瘤是一種危及生命的心血管疾病,通常定義為主動(dòng)脈直徑擴(kuò)張超過正常直徑的50%[1]。根據(jù)其解剖位置的不同,主動(dòng)脈瘤通常分為胸主動(dòng)脈瘤(thoracic aortic aneurysm,TAA)和腹主動(dòng)脈瘤(abdominal aortic aneurysm,AAA)[2]。主動(dòng)脈瘤患者沒有明顯癥狀,體內(nèi)動(dòng)脈瘤常呈進(jìn)行性擴(kuò)張,最終導(dǎo)致主動(dòng)脈破裂并帶來超過80%的病死率[3]。目前主動(dòng)脈瘤的治療措施有限,只能進(jìn)行晚期手術(shù)干預(yù),包括主動(dòng)脈腔內(nèi)修復(fù)術(shù)和外科主動(dòng)脈置換術(shù)[4]。因此,通過深入研究主動(dòng)脈瘤的發(fā)病機(jī)制,尋找潛在的生物標(biāo)志物,將有助于更加方便快速地診斷主動(dòng)脈瘤。同時(shí),可以為主動(dòng)脈瘤的治療提供新的分子治療策略,在主動(dòng)脈瘤進(jìn)展早期針對(duì)性地進(jìn)行藥物干預(yù),最大限度降低患者病死率。主動(dòng)脈瘤病理特征包括炎癥細(xì)胞浸潤,平滑肌細(xì)胞凋亡和細(xì)胞外基質(zhì)降解等[5]。已有研究探索了影響主動(dòng)脈瘤進(jìn)展的基因表達(dá)。一些研究發(fā)現(xiàn)細(xì)胞因子可以作為主動(dòng)脈瘤的生物標(biāo)志物,例如腫瘤壞死因子、干擾素-γ 和轉(zhuǎn)化生長因子-1β[6]。而血液循環(huán)中巨噬細(xì)胞遷移抑制因子水平與初始AAA 直徑大小呈正相關(guān)[7]。骨保護(hù)素也在AAA 擴(kuò)張過程中表達(dá)量增加,可能用于預(yù)測(cè)AAA 進(jìn)展[8]。然而,Karlsson 等[9]在臨床研究中發(fā)現(xiàn),許多潛在的生物標(biāo)志物并不能很好地預(yù)測(cè)主動(dòng)脈瘤的擴(kuò)張。近年來,生物信息學(xué)分析已成為探討疾病發(fā)病機(jī)制的重要方式之一,多種測(cè)序技術(shù)從轉(zhuǎn)錄組水平揭示了疾病的基因表達(dá)譜[10]。本研究通過生物信息學(xué)技術(shù),綜合分析正常樣本與主動(dòng)脈瘤樣本的基因芯片與單細(xì)胞測(cè)序結(jié)果。本研究通過機(jī)器學(xué)習(xí)篩選出4 個(gè)潛在的診斷標(biāo)志物基因,并通過免疫浸潤分析發(fā)現(xiàn)了與主動(dòng)脈瘤發(fā)生、發(fā)展相關(guān)的可能機(jī)制與治療靶點(diǎn)。
本研究的分析流程如圖1A 所示。通過Gene Expression Omnibus(GEO)數(shù)據(jù)庫(https://www.nc?bi.nlm.nih.gov/geo/)下載所需的數(shù)據(jù)集:GSE165470、GSE98278、GSE57691、GSE7084、GSE5180、GSE47?472、GSE52093、GSE9106和GSE166676。其中GSE?165470 數(shù)據(jù)集包含10 例AAA 樣本;GSE98278 包含79 例AAA 樣本;GSE57691 包含49 例AAA 樣本,10 例正常腹主動(dòng)脈樣本;GSE7084 包含2 例AAA樣本,2 例正常腹主動(dòng)脈樣本;GSE5180 包含12 例TAA 樣本;GSE47472 包含14 例AAA 樣本,8 例正常腹主動(dòng)脈樣本;GSE52093 包含5 例正常胸主動(dòng)脈樣本;GSE9106 包括36 例正常對(duì)照者外周血樣本和58 例TAA 外周血樣本;GSE166676 數(shù)據(jù)集為單細(xì)胞測(cè)序數(shù)據(jù),包含3 例正常腹主動(dòng)脈樣本,3 例AAA 樣本。通過背景校正處理每個(gè)數(shù)據(jù)集,使用“sva”R 軟件包(版本3.42.0)的ComBat 函數(shù)去除批次效應(yīng),將數(shù)據(jù)合并和歸一化。
使用“l(fā)imma”R 軟件包(版本3.50.0)鑒定差異表達(dá)基因(differentially expressed genes,DEGs),P<0.05 和|log2Fold change(LogFC)|>1.5 被認(rèn)為具有統(tǒng)計(jì)學(xué)意義。通過R(www.r-project.org)生成了熱圖和火山圖。
利用“ClusterProfiler”R 軟件包(版本4.2.1)探索了差異表達(dá)基因(differentially expressed genes,DEGs)涉及的基因本體論(Gene Ontology,GO)分析和京都基因和基因組百科全書(Kyoto Encyclo?pedia of Genes and Genomes,KEGG)分析。將P<0.05 設(shè)置為篩選條件出重要的GO 術(shù)語和KEGG通路。
通過“ClusterProfiler”R 軟件包(版本4.2.1)探索了基因表達(dá)矩陣中的基因集富集分析(Gene set enrichment analysis,GSEA),選擇“c2.cp.kegg.v7.4.symbols.gmt”作為參考基因集。假發(fā)現(xiàn)率<0.25 和P<0.05 為顯著富集。
使用“glmnet”R 軟件包(版本4.1-3),通過LASSO 回歸算法來篩選主動(dòng)脈瘤的診斷標(biāo)志物,使用“pROC”R 軟件包(版本1.18.0)生成受試者工作特征曲線(receiver operating characteristic curve,ROC)用來驗(yàn)證AAA 的診斷價(jià)值。計(jì)算曲線下面積(the area under the curve,AUC),生成ROC。
使用“IOBR”R 軟件包,選擇了quanTIseq 算法計(jì)算了每個(gè)樣本的10 種免疫浸潤細(xì)胞評(píng)分。推斷的10 種細(xì)胞類型包括B 細(xì)胞、M1 型巨噬細(xì)胞、M2 型巨噬細(xì)胞、單核細(xì)胞、中性粒細(xì)胞、自然殺傷細(xì)胞、CD4+T 細(xì)胞、CD8+T 細(xì)胞、Treg 細(xì)胞和樹突狀細(xì)胞。繪制相關(guān)性熱圖,可視化10 種免疫細(xì)胞浸潤的相關(guān)性。用“cor.test”函數(shù)對(duì)診斷標(biāo)記物和浸潤的免疫細(xì)胞進(jìn)行Spearman 相關(guān)分析。
利用“Seurat”R 軟件包(版本4.0.6)篩選出基因數(shù)量200~5 000 和線粒體基因占比<20%的細(xì)胞進(jìn)行下一步研究。隨后利用“Seurat”R 軟件包對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。隨后采用“Seurat”R 軟件包的“RunPCA”函數(shù)進(jìn)行降維分析和UMAP 聚類。
使用SPSS 軟件23.0 版對(duì)所有數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。計(jì)量資料以()表示,組間比較采用獨(dú)立樣本t檢驗(yàn)。以P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
從GEO 數(shù)據(jù)庫下載所需數(shù)據(jù)集的原始表達(dá)譜。將數(shù)據(jù)集GSE165470、GSE57691、GSE98278、GSE7084 和GSE5180 設(shè)置為訓(xùn)練集,將數(shù)據(jù)集GSE47472、GSE52093 設(shè)置為驗(yàn)證集(圖1A)。為了消除不同測(cè)序平臺(tái)和不同處理批次的批次效應(yīng),使用了ComBat 函數(shù)來去除數(shù)據(jù)集間的批次影響,結(jié)果顯示,在訓(xùn)練集的UMAP 圖中,5 個(gè)數(shù)據(jù)集的樣本被明顯分開;而去除批次效應(yīng)后,5個(gè)數(shù)據(jù)集樣本混合在一起,這說明批次效應(yīng)被消除(圖1B)。將訓(xùn)練集數(shù)據(jù)合并和歸一化后,以|Log2FC|>1.5 為閾值,發(fā)現(xiàn)正常組和主動(dòng)脈瘤組有2 006 個(gè)GEGs,其中807 個(gè)DEGs 在主動(dòng)脈瘤組高表達(dá),1 199 個(gè)DEGs 在主動(dòng)脈瘤組低表達(dá)(圖1C-E)。
圖1 數(shù)據(jù)收集和DEGs 的分析圖(A:研究分析流程;B:基因表達(dá)數(shù)據(jù)集的UMAP 圖,各顏色代表來自不同數(shù)據(jù)集的樣本;C:訓(xùn)練集中正常組和主動(dòng)脈瘤組DEGs 的熱圖和聚類分析,紅色為高表達(dá)水平,藍(lán)色為低表達(dá)水平;D:訓(xùn)練集中正常組和主動(dòng)脈瘤組DEGs 的火山圖,紅色為表達(dá)上調(diào);藍(lán)色為表達(dá)下調(diào);黑色為表達(dá)無差異;E:訓(xùn)練集中正常組和主動(dòng)脈瘤組DEGs 的數(shù)量統(tǒng)計(jì)圖,紅色為表達(dá)上調(diào),藍(lán)色為表達(dá)下調(diào))
為了研究鑒定出的DEGs 在動(dòng)脈瘤中的生物學(xué)功能,我們進(jìn)行了GO 富集分析和KEGG 通路富集分析。在GO 富集分析中,DEGs 顯著富集了細(xì)胞增殖、細(xì)胞表面受體信號(hào)通路、細(xì)胞黏附、細(xì)胞激活和白細(xì)胞激活等生物過程(biological process,BP),囊泡、質(zhì)膜部分、胞質(zhì)、質(zhì)膜的組成部分和胞質(zhì)囊泡等細(xì)胞組分(cellular component,CC),還顯著富集了細(xì)胞骨架蛋白結(jié)合、氧化還原酶活性、酶結(jié)合、信號(hào)受體結(jié)合和細(xì)胞外基質(zhì)結(jié)構(gòu)成分等分子功能(molecular function,MF)(圖2A-B)。同時(shí),在KEGG 通路富集分析中,發(fā)現(xiàn)DEGs 主要參與Th1 和Th2 細(xì)胞分化、細(xì)胞因子和細(xì)胞因子受體相互作用、趨化因子信號(hào)通路等免疫相關(guān)信號(hào)通路(圖2C-D),這說明免疫反應(yīng)在主動(dòng)脈瘤的發(fā)生、發(fā)展中發(fā)揮重要作用。進(jìn)一步對(duì)典型的免疫反應(yīng)相關(guān)通路進(jìn)行了GSEA 分析發(fā)現(xiàn),細(xì)胞因子和細(xì)胞因子受體相互作用、趨化因子信號(hào)通路兩個(gè)通路在主動(dòng)脈瘤組中顯著富集(圖2E)。
圖2 DEGs 的功能和通路富集分析圖[A-B:訓(xùn)練集中DEGs 的GO 富集分析柱狀圖(A)和氣泡圖(B);C-D:訓(xùn)練集中DEGs 的KEGG 基因集富集分析柱狀圖(C)和氣泡圖(D);E:訓(xùn)練集中DEGs 的GSEA 富集圖]
通過使用LASSO 回歸算法,從DEGs 中識(shí)別出35 個(gè)基因可能與主動(dòng)脈瘤發(fā)病顯著相關(guān)(圖3A)。在驗(yàn)證集中進(jìn)一步驗(yàn)證了這35 個(gè)基因的表達(dá)情況(圖3B)發(fā)現(xiàn),在訓(xùn)練集和驗(yàn)證集中,CXCL5和TGM3都在主動(dòng)脈瘤組中高表達(dá),并且差異顯著;同時(shí),BTC和ITGA10都在主動(dòng)脈瘤組中表達(dá)減少,并且有顯著差異性(圖3C-D)。提示CXCL5、TGM3、BTC和ITGA10可能參與主動(dòng)脈瘤的發(fā)病。
圖3 發(fā)病相關(guān)基因的篩選圖(A:LASSO 回歸算法分析訓(xùn)練集中DEGs,篩選發(fā)病相關(guān)基因;B:維恩圖展示訓(xùn)練集和驗(yàn)證集中發(fā)病相關(guān)基因的交集;C:小提琴圖展示訓(xùn)練集中篩選發(fā)病相關(guān)基因的表達(dá)量;D:小提琴圖展示驗(yàn)證集中篩選發(fā)病相關(guān)基因的表達(dá)量)
ROC 曲線分析進(jìn)一步檢驗(yàn)所選主動(dòng)脈瘤發(fā)病相關(guān)基因的診斷效能顯示,在訓(xùn)練集和驗(yàn)證集中,4 個(gè)基因均能很好地區(qū)分主動(dòng)脈瘤組織與正常主動(dòng)脈組織。所有基因的AUC 均大于0.7,說明這些基因?qū)χ鲃?dòng)脈瘤診斷的敏感度和特異度都很高(圖4A-B)。然而,在臨床應(yīng)用中獲取主動(dòng)脈組織較難,所以需要進(jìn)一步探討所選的基因是否在外周血中也具有良好的診斷效能。數(shù)據(jù)集GSE9106分析發(fā)現(xiàn),TGM3在主動(dòng)脈瘤組外周血中高表達(dá)且差異顯著,并且AUC=0.686,表明外周血TGM3能很好地區(qū)分主動(dòng)脈瘤患者和正常人(圖4C-D)。通過機(jī)器學(xué)習(xí)分析訓(xùn)練集并聯(lián)合訓(xùn)練集驗(yàn)證發(fā)現(xiàn),主動(dòng)脈組織中CXCL5、TGM3、BTC和ITGA10具有良好的診斷效能。通過外周血數(shù)據(jù)集發(fā)現(xiàn)TGM3可以作為主動(dòng)脈瘤的血液循環(huán)生物標(biāo)志物。
圖4 潛在診斷標(biāo)志物的驗(yàn)證圖(A:訓(xùn)練集中4 個(gè)候選基因的診斷效能驗(yàn)證ROC 圖;B:驗(yàn)證集中4 個(gè)候選基因的診斷效能驗(yàn)證ROC 圖;C:小提琴圖展示外周血中,正常組和主動(dòng)脈瘤組TGM3 的表達(dá)量;D:外周血集中TGM3 的診斷效能驗(yàn)證ROC 圖)
KEGG 通路富集和GSEA 富集發(fā)現(xiàn),免疫反應(yīng)相關(guān)通路在主動(dòng)脈瘤發(fā)生、發(fā)展中發(fā)揮重要作用。為了進(jìn)一步研究免疫反應(yīng)在主動(dòng)脈瘤中的作用,我們用quanTIseq 算法對(duì)正常主動(dòng)脈組和主動(dòng)脈瘤組中的10 種免疫細(xì)胞進(jìn)行了評(píng)估(圖5A)。10 種免疫細(xì)胞的相關(guān)性熱圖顯示,M1 型巨噬細(xì)胞和中性粒細(xì)胞、NK 細(xì)胞呈顯著正相關(guān);CD4+T 細(xì)胞和單核細(xì)胞、NK 細(xì)胞也呈正相關(guān)(圖5B)。為了尋找可能的主動(dòng)脈瘤治療靶點(diǎn),進(jìn)一步分析了CXCL5、TGM3、BTC和ITGA10與免疫細(xì)胞的相關(guān)性,結(jié)果發(fā)現(xiàn)CXCL5基因與M1 型巨噬細(xì)胞含量呈顯著正相關(guān)(圖5C)。為了進(jìn)一步探討CXCL5來源,分析了人類AAA 的單細(xì)胞測(cè)序數(shù)據(jù)。UMAP聚類分析得到8 種細(xì)胞,包括:巨噬細(xì)胞(第7、8、9 簇),單核細(xì)胞(第5 簇),T 細(xì)胞(第0、11 簇),B細(xì)胞(第2、12、14、16 簇),NK 細(xì)胞(第4、6 簇),內(nèi)皮細(xì)胞(第13 簇),成纖維細(xì)胞(第10 簇)和平滑肌細(xì)胞(第1、3、15 簇)(圖5D)。我們?cè)趩渭?xì)胞測(cè)序數(shù)據(jù)中發(fā)現(xiàn)CXCL5主要由巨噬細(xì)胞表達(dá)(圖5E),與基因芯片分析結(jié)果相一致。提示巨噬細(xì)胞可能通過增加CXCL5表達(dá)來促進(jìn)主動(dòng)脈瘤的形成。免疫細(xì)胞浸潤分析和單細(xì)胞測(cè)序分析相結(jié)合發(fā)現(xiàn)巨噬細(xì)胞高表達(dá)CXCL5,這可能是主動(dòng)脈瘤的發(fā)病機(jī)制之一。
圖5 免疫細(xì)胞浸潤分析圖(A:訓(xùn)練集DEGs 中,正常組和主動(dòng)脈瘤組11 種免疫細(xì)胞的直方圖;B:訓(xùn)練集DEGs 中,正常組和主動(dòng)脈瘤組11 種免疫細(xì)胞的相關(guān)性熱圖,每格中的數(shù)字代表水平和垂直坐標(biāo)上的兩種免疫細(xì)胞相關(guān)系數(shù);C:散點(diǎn)圖顯示CXCL5 表達(dá)量與M1 型巨噬細(xì)胞呈正相關(guān);D:正常人與AAA 患者腹主動(dòng)脈單細(xì)胞測(cè)序的UMAP 降維圖;E:特征圖展示CXCL5 的表達(dá)水平和分布,圖形代表巨噬細(xì)胞)
現(xiàn)在的臨床技術(shù)已能夠治療擴(kuò)張的主動(dòng)脈瘤,延長患者的生存時(shí)間,但是目前的手術(shù)治療僅適用于直徑較大的動(dòng)脈瘤,且存在一系列的并發(fā)癥[11]。因此,通過探索主動(dòng)脈瘤的發(fā)病機(jī)制尋求可能的治療靶點(diǎn)非常必要。本研究利用生物信息學(xué)技術(shù)綜合分析了主動(dòng)脈瘤發(fā)病過程中的關(guān)鍵基因和生物學(xué)過程。在GO 分析中,GEGs 參與了細(xì)胞增殖與白細(xì)胞激活等生物過程。既往研究已發(fā)現(xiàn),在主動(dòng)脈瘤發(fā)病過程中,免疫細(xì)胞大量增殖并激活[12]。同時(shí),DEGs 還富集了細(xì)胞外基質(zhì)結(jié)構(gòu)成分等分子功能。細(xì)胞外基質(zhì)降解是主動(dòng)脈瘤的重要病理特征之一,DEGs 可能通過影響細(xì)胞外基質(zhì)結(jié)構(gòu)而使主動(dòng)脈結(jié)構(gòu)薄弱、更易擴(kuò)張與破裂[13]。本研究還發(fā)現(xiàn)兩組間的DEGs 在KEGG 分析中主要富集了T 細(xì)胞分化、細(xì)胞因子、趨化因子等相關(guān)的免疫信號(hào)通路。這一結(jié)果印證了既往其他主動(dòng)脈瘤研究的結(jié)論。研究發(fā)現(xiàn),在人類主動(dòng)脈瘤血管壁中干擾素-γ 含量增加,而干擾素-γ 促進(jìn)CD4+T 細(xì)胞向Th1 細(xì)胞分化[14]。同時(shí),白細(xì)胞介素-1β 和腫瘤壞死因子-α 等細(xì)胞因子,也在主動(dòng)脈瘤組織中高表達(dá)。而抑制趨化因子CXCL4已被證明可以抑制AAA 進(jìn)展[15]。
為了探索主動(dòng)脈瘤潛在的診斷標(biāo)志物和治療靶點(diǎn),我們通過機(jī)器學(xué)習(xí)的方法來協(xié)助篩選目的基因。LASSO 回歸是機(jī)器學(xué)習(xí)中的一種方法,主要用于特征變量的篩選和最佳分類模型的建立[16]。通過使用驗(yàn)證集進(jìn)一步驗(yàn)證所選基因,最后確定了CXCL5、TGM3、BTC和ITGA10是主動(dòng)脈瘤發(fā)病相關(guān)基因,并且TGM3可以作為主動(dòng)脈瘤的循環(huán)診斷標(biāo)志物之一。然而,在主動(dòng)脈瘤患者外周血中,CXCL5、BTC和ITGA10基因沒有明顯的差異,這可能是因?yàn)檫@3 種基因主要在主動(dòng)脈組織中發(fā)揮生物學(xué)功能,未被分泌到外周血中,因此不能作為循環(huán)標(biāo)志物。目前主動(dòng)脈瘤主要通過影像學(xué)檢查診斷,但是因?yàn)橹鲃?dòng)脈瘤起病隱匿、通常沒有明顯癥狀,所以診斷率較低[17]。循環(huán)標(biāo)志物檢測(cè)便捷,可協(xié)助篩選出主動(dòng)脈瘤高危人群,有助于更加方便快速地診斷主動(dòng)脈瘤[18]。因此,本研究提供了一種主動(dòng)脈瘤輔助的臨床診斷策略。TGM3,也稱為轉(zhuǎn)谷氨酰胺酶3,可催化異肽鍵的形成[19]。TGM3已被報(bào)道是多種不同類型腫瘤中的調(diào)節(jié)蛋白,并可作為腫瘤的預(yù)后生物標(biāo)記物[20]。本研究結(jié)果發(fā)現(xiàn),TGM3也可作為主動(dòng)脈瘤的循環(huán)診斷標(biāo)志物,但是TGM3的診斷效能需要更多臨床證據(jù)的支持。
CXCL5又稱為中性粒細(xì)胞激活肽,屬于CXC型趨化因子家族[21]。既往研究已經(jīng)發(fā)現(xiàn),使用他汀類藥物治療腹主動(dòng)脈瘤時(shí),CXCL5水平也會(huì)隨之下降[22]。IgE 刺激小鼠AAA 加劇,在此過程中,CXCL5表達(dá)升高[23]。本研究結(jié)果與之前的研究一致,發(fā)現(xiàn)CXCL5在主動(dòng)脈瘤患者疾病組織中高表達(dá);免疫浸潤分析發(fā)現(xiàn),CXCL5與M1 型巨噬細(xì)胞含量正相關(guān)。然而免疫浸潤分析只是一種推測(cè)方法,與疾病譜中實(shí)際的的基因表達(dá)可能有所區(qū)別。因此,我們分析了AAA 患者的單細(xì)胞測(cè)序數(shù)據(jù)。單細(xì)胞測(cè)序可以在單個(gè)細(xì)胞水平上,對(duì)轉(zhuǎn)錄組信息進(jìn)行高通量測(cè)序[24]。通過單細(xì)胞測(cè)序數(shù)據(jù),我們確定了巨噬細(xì)胞是CXCL5的主要來源。在免疫反應(yīng)中,CXCL5會(huì)招募免疫細(xì)胞浸潤至疾病部位[25]。特別地,CXCL5可以與中性粒細(xì)胞表面受體CXCR1 或CXCR2 結(jié)合,招募并激活中性粒細(xì)胞[26]。而中性粒細(xì)胞已被證明是小鼠主動(dòng)脈瘤形成的重要始動(dòng)因素之一[27]。中性粒細(xì)胞發(fā)揮吞噬、氧化等作用,還可分泌中性粒細(xì)胞細(xì)胞外網(wǎng)狀陷阱以損傷動(dòng)脈壁,促進(jìn)主動(dòng)脈瘤形成[28]。因此,我們推斷,巨噬細(xì)胞分泌CXCL5,促進(jìn)中性粒細(xì)胞浸潤至血管壁,協(xié)同作用使主動(dòng)脈擴(kuò)張,形成主動(dòng)脈瘤。本研究的免疫細(xì)胞相關(guān)性熱圖也支持這一結(jié)論:巨噬細(xì)胞與中性粒細(xì)胞呈正相關(guān)。在未來的研究中,我們將進(jìn)一步通過患者標(biāo)本與小鼠實(shí)驗(yàn),驗(yàn)證這個(gè)假說。