安 敏,楊曉玲,馬 亮,付少杰,馬福哲*
(1.唐山職業(yè)技術(shù)學(xué)院附屬醫(yī)院 腎內(nèi)科,河北 唐山063000;2.唐山職業(yè)技術(shù)學(xué)院附屬醫(yī)院 內(nèi)分泌科,河北 唐山063000;3.吉林大學(xué)第一醫(yī)院 腎病內(nèi)科,吉林 長(zhǎng)春130012)
隨著人們生活方式以及飲食習(xí)慣的改變,糖尿病的發(fā)病率逐年增高,而糖尿病腎病(diabetic kidney disease,DKD)作為糖尿病的主要微血管并發(fā)癥,也已成為終末期腎臟病(end-stage renal disease,ESRD)的首要原因[1]。ESRD患者需要進(jìn)行腎移植或長(zhǎng)期的腎臟替代治療,生活質(zhì)量嚴(yán)重下降[2]。DKD早期癥狀隱匿,臨床上易被忽視,疾病被發(fā)現(xiàn)時(shí)常已進(jìn)展至中晚期,這是導(dǎo)致DKD患者預(yù)后不佳的原因之一。目前對(duì)DKD的治療尚缺乏特異性的手段,主要是通過(guò)積極控制血壓、血糖以及改善生活方式等對(duì)癥治療,且疾病一旦進(jìn)展至中晚期則不可逆轉(zhuǎn)[3]。因此早期診斷和及時(shí)干預(yù)對(duì)延緩DKD患者的腎功能衰竭以及ESRD的發(fā)生具有重要意義。
加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted correlation network analysis,WGCNA) 是一種將基因數(shù)據(jù)轉(zhuǎn)換為共表達(dá)模塊,從而探索基因與給定特征之間相關(guān)性的生物信息學(xué)方法[4]。近年來(lái)WGCNA分析已被廣泛應(yīng)用于對(duì)各種疾病生物標(biāo)志物的鑒定,并展現(xiàn)出良好的潛力[4-5],但在DKD新型標(biāo)志物鑒定方面的研究尚十分缺乏。因此本研究旨在通過(guò)對(duì)基因綜合表達(dá)(gene expression omnibus,GEO)數(shù)據(jù)庫(kù)進(jìn)行挖掘,鑒定出DKD的差異表達(dá)基因(differentially expressed genes,DEGs),構(gòu)建加權(quán)基因共表達(dá)網(wǎng)絡(luò),篩選出DKD的診斷標(biāo)志物,并探究標(biāo)志物與免疫細(xì)胞浸潤(rùn)之間的關(guān)系,以期為DKD的臨床診療以及藥物研發(fā)提供新的線(xiàn)索。
從GEO數(shù)據(jù)庫(kù)[6](http://www.ncbi.nlm.nih.gov/geo/)獲取包含有DKD患者以及健康對(duì)照的腎小球微陣列數(shù)據(jù)集(GSE30528,GSE96804,GSE99339)作為訓(xùn)練集,其中共有DKD患者64例和健康對(duì)照44例。獲取共包含有DKD患者33例和健康對(duì)照67例的數(shù)據(jù)集(GSE47185,GSE30122)作為驗(yàn)證集。使用R語(yǔ)言SVA包對(duì)各數(shù)據(jù)集進(jìn)行批次校正后合并。使用R語(yǔ)言中的“l(fā)imma”包對(duì)訓(xùn)練集中DKD患者以及健康對(duì)照腎小球中各基因mRNA的表達(dá)水平進(jìn)行差異分析,以|log2差異倍數(shù)|>1以及矯正后的P值<0.05為篩選標(biāo)準(zhǔn),從而鑒定出DEGs。
使用R語(yǔ)言中的“WGCNA”包構(gòu)建WGCNA網(wǎng)絡(luò)。首先對(duì)訓(xùn)練集的基因表達(dá)數(shù)據(jù)進(jìn)行聚類(lèi)分析,根據(jù)基因間的無(wú)標(biāo)度拓?fù)鋽M合指數(shù)(R2)以及平均連接度,確定軟閾值β為3,使各基因調(diào)控關(guān)系符合無(wú)尺度分布。通過(guò)構(gòu)建共表達(dá)網(wǎng)絡(luò)繪制模塊聚類(lèi)樹(shù)狀圖,并將所有基因分為10個(gè)模塊,使用Pearson法分析基因間的相關(guān)性,獲得關(guān)系矩陣,選擇相關(guān)性最高的模塊作為關(guān)鍵基因模塊。
將WGCNA分析獲得的關(guān)鍵模塊基因與DEGs取交集,篩選出重疊基因作為關(guān)鍵DEGs,它們可能與DKD的發(fā)生發(fā)展高度相關(guān)。使用R語(yǔ)言 “clusterProfiler”包對(duì)關(guān)鍵DEGs分別進(jìn)行基因本體論功能(Gene Ontology,GO)及基因組百科全書(shū)通路(Kyoto Encylopaedia of Genes and Genomes,KEGG)富集分析,矯正后的P值<0.05被認(rèn)為具有統(tǒng)計(jì)意義。
將關(guān)鍵DEGs導(dǎo)入STRING數(shù)據(jù)庫(kù)進(jìn)行蛋白互作(protein-protein interaction,PPI)分析,并構(gòu)建PPI網(wǎng)絡(luò)。將PPI信息導(dǎo)入Cytoscape3.9.1內(nèi),計(jì)算網(wǎng)絡(luò)的拓?fù)鋵W(xué)參數(shù),并利用cytoHubba插件進(jìn)一步篩選出核心基因。
利用訓(xùn)練集中DKD和對(duì)照組樣本的微陣列數(shù)據(jù),根據(jù)每個(gè)核心基因的表達(dá)量分別繪制受試者操作特征(Receiver Operating Characteristic,ROC)曲線(xiàn)。為便于臨床應(yīng)用,將核心基因表達(dá)量納入多因素Logistic回歸分析,構(gòu)建診斷模型,并繪制模型的校準(zhǔn)曲線(xiàn)以及決策曲線(xiàn)。將訓(xùn)練集中ROC曲線(xiàn)下的面積(Area Under Curve,AUC)大于0.9的基因篩選出來(lái)作為DKD診斷潛在的生物標(biāo)志物,并使用驗(yàn)證集數(shù)據(jù)再次繪制ROC曲線(xiàn)對(duì)其診斷效能進(jìn)行再次驗(yàn)證。ROC曲線(xiàn)、校準(zhǔn)曲線(xiàn)以及決策曲線(xiàn)分別是由R語(yǔ)言中的“pROC”,“rms”以及“rmda”包繪制。
為了進(jìn)一步探究與生物標(biāo)志物可能的相關(guān)機(jī)制,將DKD樣本根據(jù)標(biāo)志物基因表達(dá)量中位值劃分為高低表達(dá)兩組,進(jìn)行基因集富集分析(Gene Set Enrichment Analysis,GSEA)。從分子特征數(shù)據(jù)庫(kù)MSigDB中下載“c2.cp.kegg.symbols.gmt”的基因集,利用 GSEA算法來(lái)進(jìn)行分析,矯正后的P值<0.05被認(rèn)為富集出的結(jié)果具有統(tǒng)計(jì)學(xué)意義。
采用CIBERSORT算法對(duì)DKD以及對(duì)照組腎組織中22種免疫細(xì)胞浸潤(rùn)的特征進(jìn)行分析。使用R語(yǔ)言中的“ggplot2”包對(duì)免疫細(xì)胞浸潤(rùn)矩陣的主成分分析進(jìn)行聚類(lèi),使用 R語(yǔ)言中的“vioplot”繪制小提琴圖,將DKD患者和對(duì)照組樣本腎組織間免疫細(xì)胞浸潤(rùn)的差異可視化。R語(yǔ)言中的Spearman等級(jí)相關(guān)分析被用來(lái)進(jìn)一步分析生物標(biāo)志物的表達(dá)與免疫細(xì)胞浸潤(rùn)間的關(guān)系,并使用R語(yǔ)言中的“ggstatsplot”和“ggplot2”包將生物標(biāo)志物的表達(dá)與免疫細(xì)胞浸潤(rùn)間的關(guān)系可視化。
從訓(xùn)練集的64例DKD患者腎小球組織以及44例健康對(duì)照腎小球組織中共篩選出87個(gè)DEGs,其中在DKD腎小球中上調(diào)表達(dá)的DEGs有39個(gè),下調(diào)表達(dá)的有48個(gè),見(jiàn)圖1。
圖1 DKD患者腎小球組織中的DEGs的鑒定
使用R語(yǔ)言中的“WGCNA”包對(duì)訓(xùn)練集的基因表達(dá)數(shù)據(jù)進(jìn)行聚類(lèi)分析,選擇3作為軟閾值β,以符合無(wú)尺度網(wǎng)絡(luò)分布,見(jiàn)圖2A。利用構(gòu)建共表達(dá)網(wǎng)絡(luò)繪制模塊聚類(lèi)樹(shù)狀圖,表達(dá)數(shù)據(jù)相似的基因被聚類(lèi)在一起形成一個(gè)分支,見(jiàn)圖2B。使用Pearson法分析基因模塊與臨床特性的相關(guān)性,繪制模塊-臨床特性關(guān)聯(lián)圖,結(jié)果發(fā)現(xiàn)粉橙色基因模塊相關(guān)系數(shù)最大為0.67,且P值最小為2E-15,見(jiàn)圖2C。提示該模塊聚類(lèi)的基因與DKD的發(fā)生發(fā)展最為密切,因此挑選粉橙色基因模塊為關(guān)鍵基因模塊。
圖2 WGCNA聚類(lèi)分析
將WGCNA分析獲得的關(guān)鍵模塊基因與DEGs取交集,篩選出14個(gè)重疊基因作為關(guān)鍵DEGs,可能與DKD的發(fā)生發(fā)展高度相關(guān),見(jiàn)圖3A。關(guān)鍵DEGs的GO富集分析結(jié)果提示,關(guān)鍵DEGs主要富集于白細(xì)胞趨化、趨化因子結(jié)合等條目,見(jiàn)圖3B;KEGG富集分析結(jié)果提示,主要富集于白細(xì)胞介素17 信號(hào)通路、腫瘤壞死因子信號(hào)通路等通路,見(jiàn)圖3C。
圖3 關(guān)鍵DEGs的篩選及GO、KEGG富集分析
將關(guān)鍵DEGs導(dǎo)入STRING數(shù)據(jù)庫(kù),進(jìn)行PPI分析,構(gòu)建出1個(gè)含有14個(gè)節(jié)點(diǎn),48條邊的PPI網(wǎng)絡(luò),見(jiàn)圖4A。將網(wǎng)絡(luò)信息導(dǎo)入Cytoscape3.9.1內(nèi),計(jì)算拓?fù)鋵W(xué)參數(shù),并借助cytoHubba插件使用“MCC”法對(duì)網(wǎng)絡(luò)進(jìn)一步篩選,獲得10個(gè)打分最高基因,見(jiàn)圖4B,將打分最高的5個(gè)基因篩選為核心基因,它們是PTGS2,FOS,FOSB,EGR1,DUSP1。
圖4 構(gòu)建關(guān)鍵差異表達(dá)基因的PPI網(wǎng)絡(luò)
通過(guò)對(duì)訓(xùn)練集繪制ROC曲線(xiàn)對(duì)核心基因進(jìn)行分析,結(jié)果發(fā)現(xiàn)5個(gè)核心基因的AUC均大于0.8,而DUSP1和FOSB的AUC大于0.9,提示在區(qū)分DKD以及正常樣本方面均表現(xiàn)出良好的診斷能力,見(jiàn)圖5A。隨后,將5個(gè)核心基因表達(dá)量納入多因素Logistic線(xiàn)性回歸構(gòu)建診斷模型,并繪制模型的決策曲線(xiàn)以及校準(zhǔn)曲線(xiàn),分別見(jiàn)圖5B和圖5C。對(duì)校準(zhǔn)曲線(xiàn)進(jìn)行Hosmer-Lemeshow擬合優(yōu)度檢驗(yàn),結(jié)果表明理想曲線(xiàn)與校準(zhǔn)曲線(xiàn)的差異不具有統(tǒng)計(jì)學(xué)意義(χ2=5.371,P=0.719),提示模型具有較高的校準(zhǔn)度,其預(yù)測(cè)概率與實(shí)際接近。由列線(xiàn)圖可知DUSP1以及FOSB的基因表達(dá)水平對(duì)是否發(fā)生DKD的影響最大,因此將DUSP1和FOSB篩選為DKD的潛在生物標(biāo)志物,并在驗(yàn)證集中對(duì)它們的表達(dá)情況進(jìn)行進(jìn)一步驗(yàn)證,并分別繪制它們的ROC曲線(xiàn),見(jiàn)圖6。在驗(yàn)證集中DUSP1和FOSB的AUC也均大于0.75,進(jìn)一步驗(yàn)證了作為DKD診斷標(biāo)志物的診斷潛力。
圖5 核心基因在訓(xùn)練集中的ROC曲線(xiàn)及診斷列線(xiàn)圖
圖6 診斷標(biāo)志物在驗(yàn)證集中的差異表達(dá)情況及ROC曲線(xiàn)
為了進(jìn)一步探究與新鑒定出的生物標(biāo)志物可能相關(guān)的機(jī)制,根據(jù)標(biāo)志物基因表達(dá)量的中位值,將DKD樣本劃分為高表達(dá)和低表達(dá)組,并進(jìn)行GSEA富集分析。結(jié)果發(fā)現(xiàn)隨著DUSP1表達(dá)的增加,β丙氨酸代謝、脂肪酸代謝、色氨酸代謝等通路被抑制,見(jiàn)圖7A。而隨著FOSB表達(dá)的增加,色氨酸代謝、脂肪酸代謝、丁酸代謝等通路被抑制,見(jiàn)圖7B。
圖7 兩個(gè)診斷標(biāo)志物的GSEA富集分析
免疫浸潤(rùn)結(jié)果發(fā)現(xiàn),相較正常對(duì)照組,M2巨噬細(xì)胞、γδT細(xì)胞、記憶B細(xì)胞、靜止的樹(shù)突狀細(xì)胞等在DKD腎小球組織中浸潤(rùn)顯著增加,而輔助性T細(xì)胞、中性粒細(xì)胞以及活化的肥大細(xì)胞在DKD腎小球組織中浸潤(rùn)顯著減少,見(jiàn)圖8A。進(jìn)一步對(duì)DUSP1以及FOSB兩個(gè)標(biāo)志物的表達(dá)與腎組織中免疫細(xì)胞浸潤(rùn)的關(guān)系進(jìn)行相關(guān)性分析,結(jié)果發(fā)現(xiàn)DUSP1的表達(dá)與漿細(xì)胞、γδT細(xì)胞以及活化的CD4陽(yáng)性的記憶T細(xì)胞的浸潤(rùn)呈負(fù)相關(guān),見(jiàn)圖8B;FOSB的表達(dá)與M1巨噬細(xì)胞浸潤(rùn)呈負(fù)相關(guān),見(jiàn)圖8C。
圖8 免疫浸潤(rùn)分析及診斷標(biāo)志物與免疫細(xì)胞浸潤(rùn)相關(guān)性分析
研究顯示,我國(guó)糖尿病患者已高達(dá)1.14億,且糖尿病導(dǎo)致的腎臟損害已超過(guò)慢性腎小球腎炎成為我國(guó)慢性腎臟病的首要病因[7]。目前DKD的早期診斷主要依賴(lài)于對(duì)尿蛋白的檢測(cè),但DKD的早期階段的尿蛋白可以是陰性的[8]。因此發(fā)掘新的具有良好診斷效能的標(biāo)志物,有助于DKD的早期診斷并改善患者的預(yù)后。本研究利用WGCNA分析確定了DUSP1和FOSB為DKD的潛在診斷標(biāo)志物,并聯(lián)合GSEA以及免疫浸潤(rùn)分析,進(jìn)一步了解與它們表達(dá)相關(guān)的可能機(jī)制。結(jié)果發(fā)現(xiàn)DUSP1和FOSB對(duì)DKD具有良好的診斷效能,并且可能成為治療DKD的潛在靶點(diǎn),為DKD的診斷及治療提供了新思路。
DUSP1是一種組蛋白磷酸酶,可以特異性地調(diào)節(jié)絲裂原活化蛋白激酶(Mitogen-Activated Protein Kinase,MAPK)的活性,從而發(fā)揮多種生物學(xué)功能[9]。本研究發(fā)現(xiàn)DUSP1在DKD腎小球組織中是低表達(dá)的。有研究報(bào)道lncRNA NR_038323可以通過(guò)靶向DUSP1抑制p38MAPK信號(hào)通路,在HK-2近端小管細(xì)胞系中發(fā)揮抗纖維化作用[10]。同時(shí),DUSP1過(guò)表達(dá)可通過(guò)調(diào)節(jié)線(xiàn)粒體自噬減輕腎小管損傷,阻斷線(xiàn)粒體裂變因子相關(guān)的線(xiàn)粒體過(guò)度裂變[11]。此外,在T細(xì)胞中抑制DUSP1的表達(dá)可能有利于多發(fā)性硬化自身免疫性疾病的治療[12]。提示DUSP1有潛力成為包括DKD在內(nèi)一些疾病的治療靶點(diǎn)。
FOSB是FOS家族的一員,屬于原癌基因的一種,其與Jun蛋白家族組成異源二聚體轉(zhuǎn)錄因子復(fù)合物AP-1,在腫瘤的進(jìn)展中發(fā)揮著重要作用[13]。FOSB的表達(dá)增加可以抑制細(xì)胞的凋亡并促進(jìn)細(xì)胞的增殖[14]。既往有研究表明,FOSB可作為IgA腎病的診斷標(biāo)志物[15]。也有研究表明,MicroRNA-27a-3p可以靶向FOSB從而調(diào)節(jié)IgA腎病的炎癥以及纖維化水平[16],但其在DKD中的相關(guān)研究尚少見(jiàn)。
近年來(lái),越來(lái)越多的研究發(fā)現(xiàn)免疫紊亂在DKD的發(fā)病中發(fā)揮重要作用[17]。本研究也發(fā)現(xiàn),在DKD腎小球中存在免疫細(xì)胞的異常浸潤(rùn),且 DUSP1的表達(dá)與漿細(xì)胞、γδT細(xì)胞以及活化的CD4陽(yáng)性的記憶T細(xì)胞的浸潤(rùn)呈負(fù)相關(guān),FOSB的表達(dá)與M1巨噬細(xì)胞的浸潤(rùn)呈負(fù)相關(guān)。提示DUSP1和FOSB可能參與對(duì)腎臟免疫細(xì)胞浸潤(rùn)的調(diào)控,從而對(duì)DKD的發(fā)生及發(fā)展產(chǎn)生影響。但是,這一推斷需進(jìn)行更多的實(shí)驗(yàn)來(lái)進(jìn)行驗(yàn)證。
綜上所述,本研究發(fā)現(xiàn)DUSP1和FOSB對(duì)DKD具有良好的診斷效能,并且與DKD腎小球免疫細(xì)胞的浸潤(rùn)相關(guān),有望成為DKD的新型診斷標(biāo)志物以及治療靶點(diǎn)。但本研究為生物信息學(xué)研究,具有一定局限性,需要更進(jìn)一步的臨床驗(yàn)證。
中國(guó)實(shí)驗(yàn)診斷學(xué)2023年11期