李晴晴, 李小霞, 趙 燚, 張毓洪, 常曉玉,2
(1.寧夏醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,銀川 750004; 2.寧夏醫(yī)科大學(xué)學(xué)報(bào)編輯部,銀川 750004)
腦卒中是一種急性腦血管疾病,是由于腦部血管突然破裂或因血管阻塞導(dǎo)致血液不能流入大腦而引起腦組織損傷的一種疾病,包括缺血性腦卒中和出血性腦卒中,具有發(fā)病率高、致殘率高、病死率高和復(fù)發(fā)率高的特點(diǎn)[1]。調(diào)查顯示,中國(guó)腦卒中患病率隨著年齡增長(zhǎng)而升高且城市高于農(nóng)村,2020 年總體患病率達(dá)到2.6%,成為我國(guó)第二位死亡原因,也是中國(guó)成年人殘疾的首要原因[2]。目前公認(rèn)的治療腦卒中最有效的方法是溶栓治療,但發(fā)病后4.5 h 內(nèi)的治療時(shí)間窗口狹窄且出血風(fēng)險(xiǎn)高,IS 患者的溶栓率非常低,預(yù)后差[3]。因此,確定有效治療腦卒中的分子靶點(diǎn)和明確腦損傷的機(jī)制尤為重要。
研究[4]表明,IS 約占全部腦卒中的80%,心源性栓塞性卒中屬于IS 的一種。IS 是一種多因素、多機(jī)制及多通路介導(dǎo)的疾病,其發(fā)病機(jī)制和關(guān)鍵基因尚不明確。有研究[5]表明,PTGS2 基因可能與小血管閉塞的IS 亞型有關(guān);PITX2 和ZFHX3 基因以及另外2 個(gè)相關(guān)基因ZNF566 和PDZK1IP1的單核苷酸多態(tài)性會(huì)增加腦卒中的患病風(fēng)險(xiǎn),不同表觀遺傳機(jī)制(如DNA 甲基化、組蛋白修飾、非編碼RNA 等)可能誘導(dǎo)對(duì)腦缺血的不同損傷反應(yīng)[6]。因此,對(duì)腦卒中風(fēng)險(xiǎn)位點(diǎn)的了解可增加找到新的抗血栓藥物治療靶點(diǎn)的可能性。而生物信息學(xué)分析可以利用高通量基因測(cè)序技術(shù)分析生物體的基因組、轉(zhuǎn)錄組和蛋白質(zhì)組信息,從各個(gè)分子水平揭示疾病發(fā)生和發(fā)展的機(jī)制。本研究利用生物信息學(xué)方法選取IS 患者和正常人外周血標(biāo)本全基因組表達(dá)的mRNA 芯片數(shù)據(jù)篩選IS 差異表達(dá)基因(differentially expressed genes,DEGs),分析其功能和信號(hào)通路,然后構(gòu)建一個(gè)基因網(wǎng)絡(luò)圖,并篩選關(guān)鍵基因靶點(diǎn),以期為臨床診斷和治療提供理論基礎(chǔ)。
從美國(guó)國(guó)家生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)(https://www.ncbi.nlm.nih.gov/)基因表達(dá)綜合數(shù)據(jù)庫(kù)(gene expression omnibus,GEO),以“stroke”為檢索詞、“homo sapiens”為限定種屬、“expression profiling by array”為限定類型,檢索相關(guān)基因表達(dá)譜數(shù)據(jù)。納入標(biāo)準(zhǔn):1) 數(shù)據(jù)集是全基因組mRNA 芯片數(shù)據(jù);2)數(shù)據(jù)樣本來(lái)源于IS 患者和正常人外周血標(biāo)本;3)獨(dú)立數(shù)據(jù)集的標(biāo)本量必須>20。
利用GEO 數(shù)據(jù)庫(kù)選定符合限定條件的芯片,下載基因原始數(shù)據(jù)的表達(dá)矩陣和檢測(cè)平臺(tái)信息。使用R 4.3.0 軟件,利用DESeq2 包、edgeR 包和limma 包分別進(jìn)行差異分析,DEGs 的篩選條件是P<0.05 且|log2FC|>0.5,其中差異倍數(shù)(fold change, FC)代表IS 患者與健康對(duì)照人群兩者DEGs 的差值倍數(shù)。由于不同數(shù)據(jù)集的樣本來(lái)源、采集時(shí)間等實(shí)驗(yàn)過(guò)程中的某些差異產(chǎn)生了影響研究結(jié)果的協(xié)變量(箱式圖顯示兩個(gè)數(shù)據(jù)集的表達(dá)量不一致),故使用limma 包中的removeBatch-Effect 函數(shù)去除在基因表達(dá)數(shù)據(jù)中的批次效應(yīng)。利用微生信(http://www.bioinformatics.com.cn/)在線分析平臺(tái)進(jìn)行Venn 分析和可視化分析。
利用R 語(yǔ)言clusterProfiler 包(4.8.1 版本)對(duì)DEGs 進(jìn)行GO 功能和KEGG 信號(hào)通路富集分析,然后利用GO plot 包和ggplot 2 包進(jìn)行富集結(jié)果的可視化。GO 功能富集分析包括生物過(guò)程(biological process,BP)、細(xì)胞組成(cellular component,CC)和分子功能(molecular function,MF)。
將DEGs 導(dǎo)入在線軟件STRING 11.5(http://www.string-db.org/),對(duì)IS 發(fā)病相關(guān)基因表達(dá)產(chǎn)物構(gòu)建PPI 網(wǎng)絡(luò)。通過(guò)Cytoscape 3.9.1 軟件分析結(jié)果制作可視化蛋白互作網(wǎng)絡(luò)模型,并應(yīng)用MCODE 插件篩選其中關(guān)聯(lián)性強(qiáng)的蛋白互作模塊,再利用cytoHubba 插件并依據(jù)平均度(degree)大小確定PPI 網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)。
取一個(gè)數(shù)據(jù)集進(jìn)行LASSO 回歸分析建模,所得基因與前面PPI 網(wǎng)絡(luò)分析的Hub 基因進(jìn)行交集得到關(guān)鍵的幾個(gè)基因,最后利用ROC 曲線評(píng)估這些關(guān)鍵基因在IS 中的診斷價(jià)值。
將P<0.05 且FDR<0.05 作為GO 功能富集分析差異有統(tǒng)計(jì)學(xué)意義的信號(hào)通路;將P<0.05作為KEGG 信號(hào)通路富集分析差異有統(tǒng)計(jì)學(xué)意義的信號(hào)通路。LASSO 回歸分析篩選IS 差異基因。通過(guò)ROC 曲線分析驗(yàn)證關(guān)鍵基因預(yù)測(cè)IS 的準(zhǔn)確閾值。
根據(jù)納入標(biāo)準(zhǔn),選定符合條件的3 個(gè)GEO數(shù)據(jù)庫(kù)(GSE22255[7]、GSE58294[8]和GSE16561[9])共195 個(gè)樣本,采用GPL570 和GPL6883 平臺(tái)檢測(cè)。共納入128 個(gè)IS 患者和67 個(gè)健康對(duì)照人群外周血標(biāo)本,其中95 例男性、100 例女性,見表1。
表1 納入標(biāo)本的基本資料
GSE22255 和GSE58294 數(shù)據(jù)集去除批次效應(yīng)后合并(圖1A、圖1B),得到一個(gè)含有89 個(gè)IS組和43 個(gè)對(duì)照組的新數(shù)據(jù)集。再分別利用DESeq2 包、edgeR 包和limma 包,以P <0.05 且|log2FC|>0.5 為條件進(jìn)行DEGs 的篩選(圖1C、圖1D、圖1E)。DESeq2 包獲得409 個(gè)上調(diào)基因和211 個(gè)下調(diào)基因,edgeR 包獲得171 個(gè)上調(diào)基因和109 個(gè)下調(diào)基因,limma 包獲得556 個(gè)上調(diào)基因和298 個(gè)下調(diào)基因,取三者的交集得到196 個(gè)DEGs(155 個(gè)上調(diào)基因和41 個(gè)下調(diào)基因),見圖1F、圖1G。
圖1 差異基因的篩選
結(jié)果顯示,共獲得179 個(gè)差異顯著的GO 條目,包括133 個(gè)BP 條目、41 個(gè)CC 條目和5 個(gè)MF 條目(P<0.05 且FDR<0.05)。GO 功能富集分析弦圖顯示,BP 中GO 條目最多的是應(yīng)激反應(yīng),CC 中GO 條目最多的是內(nèi)膜系統(tǒng),MF 中GO 條目最多的是模式識(shí)別受體活化(圖2A)。GO 功能分析太極圖,顯示DEGs 在總的GO 功能富集分析中基因富集最多的8 條GO 條目(4 條在BP中,4 條在CC 中)(圖2B)??芍珼EGs 介導(dǎo)的生物過(guò)程主要集中在應(yīng)激反應(yīng)以及對(duì)刺激反應(yīng)的調(diào)節(jié)等;在細(xì)胞組分方面,DEGs 主要分布在子宮內(nèi)膜系統(tǒng)、囊泡等;在分子功能方面,DEGs 主要富集在模式識(shí)別受體活性、NAD+核苷酶活性等。KEGG 信號(hào)通路富集分析結(jié)果表明差異顯著的途徑有15 條,氣泡圖僅顯示有顯著意義的前10條路徑(P<0.05)。由圖2C 可知,DEGs 主要參沙門氏菌感染、NOD 樣受體信號(hào)通路、造血細(xì)胞譜系等信號(hào)通路;并且,由多個(gè)DEGs 調(diào)控同一條信號(hào)傳導(dǎo)通路,來(lái)介導(dǎo)疾病的發(fā)生過(guò)程。
圖2 DEGs 的GO 功能和KEGG 途徑富集分析
結(jié)果顯示,共180 個(gè)節(jié)點(diǎn)的PPI 拓?fù)鋱D,含168 條邊,degree 為1.87,見圖3A。使用Cytoscape軟件繪制蛋白互作網(wǎng)絡(luò)模型(含94 個(gè)節(jié)點(diǎn),153條邊),見圖3B。選用Cytoscape 的MCODE 插件篩選PPI 網(wǎng)絡(luò)中的核心模塊,所得功能模塊最大的一個(gè)子網(wǎng)絡(luò)由6 個(gè)節(jié)點(diǎn)、12 條邊組成,score 為4.8,該模塊即PPI 網(wǎng)絡(luò)中緊密聯(lián)系的區(qū)域,見圖3C?;赾ytoHubba 插件,并根據(jù)degree 大小確定PPI 網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn),得到排名前10 的樞紐基因(Hub 基因),見圖3D。其中,排名前3 位的Hub 基因是基質(zhì)金屬蛋白酶9(matrix metallopeptidase 9,MMP9)、趨化因子受體7(C-C chemokine receptor 7,CCR7)、CD19 分子(CD19 molecule,CD19),MMP9 的degree(degree=18)高于其他蛋白節(jié)點(diǎn)。
GSE16561 數(shù)據(jù)集經(jīng)DESeq2 包、edgeR 包和limma 包取交集所得的104 個(gè)DEGs 與前面所得的196 個(gè)DEGs 取交集得16 個(gè)DEGs,見圖4A、4B。在GSE16561 數(shù)據(jù)集中,用R 語(yǔ)言的glmnet包對(duì)上述16 個(gè)DEGs 進(jìn)行LASSO 回歸分析,其中風(fēng)險(xiǎn)評(píng)分使用回歸系數(shù)(coef)乘以基因表達(dá)值(exp)再進(jìn)行相加,保留其中11 個(gè)基因時(shí)為最佳模型(圖4C 和圖4D)。這11 個(gè)差異基因?qū)S 總的ROC 診斷準(zhǔn)確率為100%(圖4E)。將這11 個(gè)差異基因與PPI 網(wǎng)絡(luò)分析得到的10 個(gè)Hub 基因取交集最終得到4 個(gè)關(guān)鍵基因(圖4F)。為驗(yàn)證這4 個(gè)關(guān)鍵基因預(yù)測(cè)IS 的準(zhǔn)確率,構(gòu)建了ROC曲線。CCR7、MMP9、Bcl2-相關(guān)蛋白A1(BCL2A1)和淋巴細(xì)胞抗原96(LY96)基因診斷IS 的準(zhǔn)確率分別為85.0%、85.7%、70.5%、80.9%(圖4G),進(jìn)一步證實(shí)了這4 個(gè)基因具備預(yù)測(cè)IS 的特異度和靈敏度。并且在GSE16561 數(shù)據(jù)集中,CCR7 基因也屬于下調(diào)基因,MMP9、BCL2A1 和LY96 基因的表達(dá)同樣上調(diào)。
圖4 IS 關(guān)鍵基因診斷價(jià)值的驗(yàn)證
本研究通過(guò)生物信息分析結(jié)果顯示,CCR7、MMP9、BCL2A1 和LY96 基因在IS 患者的外周血中表達(dá)差異均有統(tǒng)計(jì)學(xué)意義,并且MMP9、BCL2A1和LY96 基因高度表達(dá),可推測(cè)上述高表達(dá)的基因與IS 的發(fā)生率有關(guān)。同時(shí),MMP9、BCL2A1 和LY96 基因編碼的蛋白互作網(wǎng)絡(luò)富集明顯;共同參與涉及細(xì)胞表面受體、應(yīng)激反應(yīng)等信號(hào)通路。
MMP9 是目前研究最多的分泌型內(nèi)肽酶之一,參與細(xì)胞外基質(zhì)的局部蛋白水解、白細(xì)胞遷移和免疫反應(yīng)等。MMP9 水平的升高與腫瘤患者的不良預(yù)后呈正相關(guān),是乳腺癌、結(jié)直腸癌等腫瘤的潛在生物標(biāo)志物[10-11]。 Wu 等[12]通過(guò)生物信息學(xué)和微陣列技術(shù),鑒定MMP9 為急性心肌梗死的診斷標(biāo)志物,且MMP9 與中性粒細(xì)胞、單核細(xì)胞、靜息NK 細(xì)胞、γ-δ-T 細(xì)胞、CD4 記憶靜息T細(xì)胞等免疫細(xì)胞均相關(guān)。 Li 等[13]利用定量逆轉(zhuǎn)錄PCR 和蛋白質(zhì)印跡法證實(shí)了MMP9 是骨關(guān)節(jié)炎的潛在生物標(biāo)志物。MMP9 也是IS 的重要調(diào)節(jié)因子。相關(guān)研究[14-16]表明,腦缺血時(shí)MMP9 表達(dá)升高,上調(diào)的MMP9 通過(guò)降解細(xì)胞外基質(zhì)破壞腦微血管的結(jié)構(gòu)完整性和血腦屏障,導(dǎo)致繼發(fā)性腦水腫和腦損傷,而在敲除了小鼠的MMP9 或使用MMP9 抑制劑后,可減輕腦水腫。因此,MMP9有望成為治療IS 的靶點(diǎn)。Yang 等[17]利用微陣列技術(shù)發(fā)現(xiàn)了在IS 患者中表達(dá)顯著上調(diào)的多個(gè)生物標(biāo)志物分子,MMP9 可能成為腦卒中患者診斷和預(yù)后的新分子靶點(diǎn)。后續(xù)仍需更多的實(shí)驗(yàn)研究來(lái)驗(yàn)證IS 中MMP9 的作用。
BCL2A1 是BCL2 家族的成員,凋亡過(guò)程由BCL2 家族蛋白控制,BCL2A1 可通過(guò)隔離促凋亡的BCL2 蛋白來(lái)發(fā)揮其抗凋亡功能[18]。BCL2A1 主要參與血管內(nèi)皮細(xì)胞凋亡和動(dòng)脈粥樣硬化斑塊的形成,其蛋白表達(dá)增加與銀屑病表皮增生相關(guān)[19]。研究[20]發(fā)現(xiàn),BCL2A1 可以同時(shí)預(yù)測(cè)結(jié)腸腺癌患者對(duì)化療和免疫治療的靈敏度,可能成為新的潛在化療和免疫治療靶點(diǎn)。但BCL2A1 作為IS 靶基因的相關(guān)報(bào)道較少,BCL2A1 在IS 中的作用機(jī)制尚不明確。本研究基于生物信息學(xué)理論發(fā)現(xiàn),與對(duì)照組相比,BCL2A1 在IS 患者中高表達(dá),其參與影響NF-κB 信號(hào)通路和癌癥中的轉(zhuǎn)錄失調(diào),可能在造血細(xì)胞對(duì)外部信號(hào)的反應(yīng)和延緩白介素3(IL-3)剝奪誘導(dǎo)的細(xì)胞凋亡中起作用。而細(xì)胞凋亡在腦缺血中起主導(dǎo)作用,是腦缺血損傷后缺血半影區(qū)產(chǎn)生的主要病理生理機(jī)制之一[21],因此推測(cè)在IS 發(fā)生后,BCL2A1 可能通過(guò)影響造血系統(tǒng)和抑制細(xì)胞凋亡來(lái)減緩IS 的病情進(jìn)展,建議BCL2A1 可作為IS 患者的潛在診斷和治療靶點(diǎn),其相關(guān)機(jī)制值得進(jìn)一步探討。
LY96 是免疫細(xì)胞識(shí)別脂多糖微生物結(jié)構(gòu)成分的重要輔因子,與模式識(shí)別受體(pattern recognition receptors,PRRs)的關(guān)鍵成分Toll 樣受體4(toll-like receptor4,TLR4)形成復(fù)合體,介導(dǎo)固有免疫應(yīng)答[22]。LY96 的高表達(dá)已被證實(shí)與持續(xù)的促炎免疫反應(yīng)相關(guān),并可能參與修復(fù)腸道屏障功能破壞和調(diào)節(jié)菌群失調(diào)[23]。研究[9]表明,包含LY96 在內(nèi)的一組免疫相關(guān)基因在IS 中高表達(dá),并與外周血免疫系統(tǒng)功能高度相關(guān)[9]。腦卒中誘導(dǎo)的免疫抑制和隨后的感染是患者死亡的主要原因[24]。腦卒中后免疫細(xì)胞凋亡的增加可能導(dǎo)致免疫抑制[25]。免疫細(xì)胞浸潤(rùn)可介導(dǎo)神經(jīng)元凋亡,加重缺血性損傷[26]。因而,IS 的發(fā)生是多因素共同作用的結(jié)果,而細(xì)胞凋亡與免疫反應(yīng)是其發(fā)生和發(fā)展中的重要環(huán)節(jié)。在本研究中,LY96 也在IS患者中高表達(dá),主要參與脂多糖免疫受體活性、Toll 樣受體結(jié)合等信號(hào)通路,其可能通過(guò)與TLR4 的協(xié)同作用介導(dǎo)對(duì)細(xì)菌脂多糖的先天免疫反應(yīng)。因此推測(cè)IS 發(fā)生后誘導(dǎo)免疫抑制,隨后LY96 通過(guò)促進(jìn)先天免疫反應(yīng)來(lái)減緩IS 的發(fā)生,建議LY96 也可以作為IS 患者的潛在診斷和治療靶點(diǎn),其相關(guān)機(jī)制值得進(jìn)一步探討。
綜上所述,IS 患者的外周血發(fā)病過(guò)程中有多個(gè)基因表達(dá)發(fā)生了顯著變化,最終篩選出來(lái)的MMP9、BCL2A1 和LY96 基因可能與IS 的發(fā)生有關(guān)聯(lián),可以作為今后對(duì)IS 干預(yù)的新研究靶點(diǎn)。但這些基因在IS 發(fā)病中的具體作用機(jī)制還未明確,以及本研究數(shù)據(jù)主要基于數(shù)據(jù)庫(kù)生物信息分析得出,上述結(jié)論還需進(jìn)行更深入的實(shí)驗(yàn)研究。