高松林,覃 雁,張 鵬,謝蘭芳,徐 哲,梁 菲,黃貴華
1.廣西中醫(yī)藥大學(xué),廣西 南寧 530000
2.柳州市中醫(yī)醫(yī)院,廣西 柳州 545000
3.廣西中醫(yī)藥大學(xué)第一附屬醫(yī)院,廣西 南寧 530000
潰瘍性結(jié)腸炎(ulcerative colitis,UC)是一種以結(jié)腸、直腸炎癥為特征的慢性非特異性炎癥性疾病[1]。UC 是炎癥性腸病(inflammatory bowel disease,IBD)的一種,在過(guò)去的30 年里,IBD 在我國(guó)的年發(fā)病率逐漸上升,達(dá)到3.01/10 萬(wàn),年患病率為47.06/10 萬(wàn)[2]。2023 年全世界UC 的患病率估計(jì)為500 萬(wàn)例,并且發(fā)病率呈上升趨勢(shì)[3]。UC 根據(jù)內(nèi)鏡下表現(xiàn)和臨床癥狀可分為活動(dòng)期和緩解期,活動(dòng)期UC 患者常有腹痛、腹瀉、黏液膿血便等典型臨床癥狀,是臨床治療的重點(diǎn)和難點(diǎn)[4]。UC 是結(jié)直腸癌的高風(fēng)險(xiǎn)致病因素之一,UC 患者發(fā)生結(jié)直腸癌的風(fēng)險(xiǎn)是普通人群的2~3 倍[5-6]。目前,活動(dòng)期UC 的治療方案旨在調(diào)節(jié)免疫系統(tǒng)和腸道炎癥以緩解癥狀,主要使用柳氮磺吡啶、糖皮質(zhì)激素、免疫抑制劑和其他生物制劑進(jìn)行治療,但是療效有限、副作用明顯、復(fù)發(fā)率高或價(jià)格昂貴[7-10]。因此,迫切需要發(fā)現(xiàn)新的、更安全的和更有效的藥物。
銅是維持人體健康的重要微量元素,細(xì)胞內(nèi)銅濃度保持在一個(gè)相對(duì)較低的范圍內(nèi),適度增加可引起細(xì)胞毒性,甚至導(dǎo)致細(xì)胞死亡[11-12]。銅死亡是一種由銅過(guò)量引發(fā)的新型細(xì)胞死亡方式,在這個(gè)過(guò)程中銅離子直接與線粒體呼吸中三羧酸循環(huán)中的脂肪?;M分結(jié)合,導(dǎo)致脂肪?;鞍拙奂丸F硫簇蛋白丟失,引起蛋白質(zhì)毒性應(yīng)激,最終導(dǎo)致細(xì)胞死亡[13]。UC 患者中血清銅較正常人明顯升高[14]。銅代謝中含結(jié)構(gòu)域Murr1 蛋白(copper metabolism Murr1 domain,COMMD)1 是COMMD 蛋白家族中第1 個(gè)確定的成員,對(duì)銅穩(wěn)態(tài)起著重要的作用,COMMD1 的缺失會(huì)導(dǎo)致肝細(xì)胞銅累積[15-16]。COMMD1 的表達(dá)或功能降低可能與UC 的發(fā)病機(jī)制有關(guān)[17]。COMMD1 是核因子-κB(nuclear factor kappa B,NF-κB)的負(fù)性調(diào)節(jié)因子,在控制腸道炎癥和抑制結(jié)腸炎相關(guān)癌癥的進(jìn)展方面具有重要作用[18]。多篇研究報(bào)道銅死亡在類風(fēng)濕性關(guān)節(jié)炎、系統(tǒng)性紅斑狼瘡、銀屑病等多種免疫系統(tǒng)疾病中發(fā)揮著重要的作用,UC 與這些疾病具有類似的發(fā)病機(jī)制[19-22]。目前尚缺乏活動(dòng)期UC 中銅死亡相關(guān)的研究,本研究通過(guò)生物信息學(xué)方法探討活動(dòng)期UC 中銅死亡相關(guān)基因的潛在調(diào)控機(jī)制和診斷生物標(biāo)志物,并預(yù)測(cè)可以通過(guò)調(diào)節(jié)銅死亡治療活動(dòng)期UC 的中藥,旨在為活動(dòng)期UC 的診斷和個(gè)性化治療提供新思路。
從GEO 數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/geo)下載活動(dòng)期UC 的表達(dá)數(shù)據(jù)集(GSE11223、GSE87466、GSE87473 和GSE92415)。GSE11223 數(shù)據(jù)集中有132 個(gè)結(jié)腸樣本,包括63 例活動(dòng)期UC 患者樣本和69 例健康受試者樣本(對(duì)照),作為訓(xùn)練集。GSE87466 和GSE92415 數(shù)據(jù)集均有87 例活動(dòng)期UC 患者樣本和21 例健康受試者樣本,GSE87473有106 例活動(dòng)期UC 患者樣本和21 例健康受試者樣本,三者作為驗(yàn)證集。使用“l(fā)imma” R 包對(duì)GSE11223、GSE87466、GSE87473 和GSE92415 數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,包括注釋和校正。從已發(fā)表的文獻(xiàn)中獲取與銅死亡相關(guān)的基因(cuproptosis-related genes,CRG),獲得了19 個(gè)基因[23-25]。技術(shù)路線流程如圖1 所示。
圖1 技術(shù)路線流程Fig.1 Technical route flow
以P<0.05 為篩選條件,運(yùn)用“l(fā)imma” R 包和Wilcox 檢驗(yàn)分析GSE11223 數(shù)據(jù)集中活動(dòng)期UC 和對(duì)照組中差異表達(dá)的銅死亡相關(guān)基因(differentially expressed cuproptosis-related genes,DECRGs)。運(yùn)用“pheatmap”和“ggpubr” R 包對(duì)結(jié)果進(jìn)行可視化。為了解銅死亡基因調(diào)節(jié)因子之間的相關(guān)性,運(yùn)用“corrplot”和“circlize” R 包對(duì)DECRGs 進(jìn)行相關(guān)性分析并展示。
運(yùn)用CIBERSORT 算法計(jì)算活動(dòng)期UC 組和對(duì)照組中的免疫細(xì)胞浸潤(rùn)程度,P<0.05 表示具有統(tǒng)計(jì)學(xué)意義,應(yīng)用“ggpubr” R 包構(gòu)建箱線圖。應(yīng)用“l(fā)imma”和“corrplot” R 包分析DECRGs 和免疫細(xì)胞之間的相關(guān)性,并運(yùn)用“ggplot2” R 包繪制相關(guān)性熱圖。
“ConsensusClusterPlus”軟件包用于計(jì)算無(wú)監(jiān)督聚類的數(shù)量及其穩(wěn)定性[26]。為了分析活動(dòng)期UC 患者中與DECRGs 相關(guān)的潛在亞型,根據(jù)DECRGs 的表達(dá)量運(yùn)用“ConsensusClusterPlus” R 包進(jìn)行無(wú)監(jiān)督共識(shí)聚類分析,使用k-means 算法將63 個(gè)活動(dòng)期UC 樣本分類為集群,k值定義為從1 到9 以生成不同的子類型。通過(guò)判斷不同k值下的共識(shí)聚類、矩陣?yán)鄯e分布函數(shù)(uniform clustering cumulative distribution function,CDF)曲線和一致性聚類得分,得到最可靠的聚類分析結(jié)果。使用主成分分析(principal component analysis,PCA)對(duì)分型的結(jié)果進(jìn)行評(píng)估,使用R 包“ggpubr”比較不同亞型中DECRGs 的基因表達(dá)譜,P<0.05 代表具有顯著性,運(yùn)用R 包作圖進(jìn)行可視化。
應(yīng)用CIBERSORT 算法和“l(fā)imma”“reshape2”“ggpubr”等R 包對(duì)不同亞型進(jìn)行免疫浸潤(rùn)分析,比較不同亞型之間免疫細(xì)胞浸潤(rùn)的差異,并以熱圖和箱型圖進(jìn)行展示。
GSVA 是一種通過(guò)表達(dá)譜計(jì)算基因集富集的非參數(shù)、無(wú)監(jiān)督方法,用于識(shí)別各種樣本群體中生物過(guò)程和途徑之間的差異[27]。運(yùn)用“GSVA”和“GSEABase” R 包進(jìn)行GSVA 富集分析,以闡明不同亞型之間基因富集集的差異。從MSigDB 數(shù)據(jù)庫(kù)下載“c2.cp.kegg.v7.4.symbols”文件,運(yùn)用“l(fā)imma”包比較不同亞型之間的GSVA 評(píng)分來(lái)識(shí)別基因差異表達(dá)的途徑,P<0.05 作為判斷差異有統(tǒng)計(jì)學(xué)意義的標(biāo)準(zhǔn)。
基于DECRGs 分型后的基因表達(dá)文件,使用“WGCNA” R 包對(duì)活動(dòng)期UC 疾病基因表達(dá)矩陣中波動(dòng)最大的前25%的基因進(jìn)行WGCNA,篩選分型后GSE11223 數(shù)據(jù)集的核心模塊和基因。使用pickSoftThreshold 函數(shù)獲得相鄰函數(shù)中加權(quán)參數(shù)的最佳值,并用作后續(xù)網(wǎng)絡(luò)構(gòu)建的軟閾值。隨后建立加權(quán)鄰接矩陣,并將其轉(zhuǎn)換為拓?fù)渲丿B矩陣(topological overlap matrix,TOM),并通過(guò)基于1-TOM 相異矩陣的分層聚類創(chuàng)建基因模塊,找出模塊間的相似性,將相關(guān)檢驗(yàn)P值最小的模塊確定為活動(dòng)性UC 分型基因的關(guān)鍵基因模塊。
結(jié)合“caret”“randomForest”“kernlab”“ggplot2”和“xgboost” R 包構(gòu)建隨機(jī)森林(random forest,RF)、支持向量機(jī)(support vector machine,SVM)、極限梯度上升(eXtreme gradient boosting,XGB)模型和廣義線性模型(generalized linear models,GLM)4 種機(jī)器學(xué)習(xí)模型。提取了WGCNA 中核心基因的表達(dá)量,并用4 種模型對(duì)結(jié)果進(jìn)行了預(yù)測(cè)。通過(guò)繪制殘差箱線圖、累積殘差分布圖和接收器工作特性(receiver operating characteristic,ROC)曲線來(lái)評(píng)價(jià)模型的準(zhǔn)確性,以確定最佳機(jī)器學(xué)習(xí)模型。對(duì)每個(gè)模型基因進(jìn)行重要性評(píng)分,篩選重要性排名前5 的基因作為活動(dòng)期UC 疾病的特征基因。
提取最佳機(jī)器學(xué)習(xí)模型中5 個(gè)疾病特征基因的表達(dá)量,使用“rms”和“rmda” R 包構(gòu)建列線圖對(duì)每個(gè)特征基因進(jìn)行評(píng)分,最后基于綜合評(píng)分評(píng)估患者患病的概率。通過(guò)校準(zhǔn)曲線評(píng)估預(yù)期概率和實(shí)際結(jié)果之間的一致程度,使用決策曲線評(píng)估列線圖的臨床實(shí)用性和優(yōu)勢(shì)。根據(jù)最佳機(jī)器學(xué)習(xí)模型中疾病特征基因的表達(dá)量,在GSE87466、GSE87473 和GSE92415 3 個(gè)數(shù)據(jù)集上進(jìn)行驗(yàn)證,繪制ROC 曲線驗(yàn)證預(yù)測(cè)結(jié)果。
運(yùn)用“l(fā)imma”“corrplot”和“circlize” R 包分析疾病特征基因和DECRGs 之間的表達(dá)相關(guān)性。
將 DECRGs 和活動(dòng)期 UC 特征基因輸入Coremine Medical 數(shù)據(jù)庫(kù)(https://www.coremine.com/),以P<0.05 為閾值檢索對(duì)應(yīng)的中藥。將檢索到的中藥根據(jù)《中國(guó)藥典》2020 年版對(duì)中藥名稱進(jìn)行規(guī)范化,未收錄的中藥不進(jìn)行統(tǒng)計(jì),再導(dǎo)入中醫(yī)傳承計(jì)算平臺(tái)(V3.5)中進(jìn)行分析。
通過(guò)Wilcox 檢驗(yàn)確定活動(dòng)期UC 組中有11 個(gè)CRG 的表達(dá)與對(duì)照組中的表達(dá)差異顯著。NOD 樣受體熱蛋白結(jié)構(gòu)域相關(guān)蛋白3(NOD-like receptor thermal protein domain associated protein 3,NLRP3)在活動(dòng)期UC 患者樣本中顯著上調(diào),而核轉(zhuǎn)錄因子E2 相關(guān)因子2(nuclear factor erythroid 2-like-2,NFE2L2)、溶質(zhì)載體家族31 成員1(solute carrier family 31 member 1,SLC31A1)、鐵氧還蛋白1(ferredoxin 1,F(xiàn)DX1)、硫辛酸合成酶(lipoic acid synthase,LIAS)、二氫硫辛酰胺脫氫酶(dihydrolipoyl dehydrogenase,DLD)、二氫硫辛酰轉(zhuǎn)乙?;福╠ihydrolipoyl acetyltransferase,DLAT)、丙酮酸脫氫酶E1 α1 亞基(pyruvate dehydrogenase E1 subunit alpha 1,PDHA1)、谷氨酰胺酶(glutaminase,GLS)、二氫硫辛胺支鏈轉(zhuǎn)?;窫2(dihydrolipoamide branched chain transacylase E2,DBT)和甘氨酸裂解系統(tǒng)H 蛋白(glycine cleavage system protein H,GCSH)在活動(dòng)期UC 患者樣本中顯著下調(diào)(P<0.05)(圖2-A、B)。隨后,對(duì)這些基因進(jìn)行了相關(guān)性分析發(fā)現(xiàn)PDHA1與LIAS、DLAT,DBT與PDHA1,DLD與GCSH、DLAT、PDHA1、DBT,NFE2L2與PDHA1、DBT、DLD,F(xiàn)DX1與DLAT、PDHA1、SLC31A1、DBT、DLD、NFE2L2呈顯著的正相關(guān)(圖3)。NLRP3與其他基因呈負(fù)相關(guān),其中與DBT負(fù)相關(guān)性最顯著。
圖2 活動(dòng)期UC 中的DECRGsFig.2 DECRGs in active UC
圖3 DECRGs 間的相關(guān)性分析Fig.3 Correlation analysis of DECRGs
為了研究活動(dòng)期UC 的免疫微環(huán)境,使用CIBERSORT 算法評(píng)估活動(dòng)期UC 組與對(duì)照組之間的免疫細(xì)胞浸潤(rùn)水平(圖4-A)。與對(duì)照組相比,活動(dòng)期UC 組激活的記憶性CD4+T 細(xì)胞(T cells CD4 memory activated)、靜息NK 細(xì)胞(NK cells resting)、M0 巨噬細(xì)胞(macrophages M0)、激活的肥大細(xì)胞(dendritic cells activated)和中性粒細(xì)胞(neutrophils)上調(diào);靜息記憶性CD4+T 細(xì)胞(T cells CD4 memory resting)、激活的NK 細(xì)胞(NK cells activated)、M2巨噬細(xì)胞(macrophages M2)、激活的樹(shù)突狀細(xì)胞(dendritic cells activated)下調(diào)(圖4-B)。
圖4 DECRGs 免疫浸潤(rùn)相關(guān)性分析Fig.4 Correlation analysis of immune infiltration in DECRGs
對(duì)免疫細(xì)胞與NLRP3、NFE2L2、SLC31A1、FDX1、LIAS、DLD、DLAT、PDHA1、GLS、DBT和GCSH進(jìn)行相關(guān)性分析,發(fā)現(xiàn)初始B 細(xì)胞(B cells naive)與LIAS,M1 巨噬細(xì)胞(macrophages M1)與DLD、GCSH,M2 巨噬細(xì)胞與GCSH,激活的肥大細(xì)胞、靜息NK 細(xì)胞與DLD,γδT 細(xì)胞(T cells gamma delta)與FDX1、GLS呈正相關(guān);M0 巨噬細(xì)胞與DLAT、FDX1、LIAS,中性粒細(xì)胞與LIAS,激活的NK 細(xì)胞與DLD,漿細(xì)胞(plasma cells)與LIAS,靜息記憶性CD4+T 細(xì)胞與NLRP3呈負(fù)相關(guān)(P<0.01)(圖4-C)。
根據(jù)DECRGs 的表達(dá)量對(duì)活動(dòng)期UC 患者進(jìn)行共識(shí)聚類分型,通過(guò)綜合分析共識(shí)聚類、CDF 曲線和一致性聚類得分的結(jié)果發(fā)現(xiàn),k=2 時(shí)分類最佳(圖5-A、B、C、E)。因此,活動(dòng)期UC 組的63 例患者被分為C1 和C2 2 個(gè)亞組。PCA 顯示C1 和C2樣本之間具有明顯的差異,分類效果較好(圖5-D)。圖5-F 顯示了活動(dòng)期UC 組中2 種亞型中DECRGs表達(dá)水平的熱圖。在C1 和C2 之間觀察到不同的CRG 表達(dá)譜,NFE2L2、SLC31A1、FDX1、LIAS、DLD、DLAT、PDHA1、GLS、DBT和GCSH在C1中的表達(dá)高于C2,NLRP3在C2 中的表達(dá)高于C1(圖5-G)。
圖5 共識(shí)聚類分型情況Fig.5 Consensus clustering classification
22 種免疫細(xì)胞在不同亞組之間的相對(duì)百分比見(jiàn)圖6-A。與C1 相比,C2 中M0 巨噬細(xì)胞數(shù)量更高(圖6-B)。GSVA 用于評(píng)估不同亞組之間的生物學(xué)功能差異,高親和性免疫球蛋白E 受體(highaffinity immunoglobulin E receptor,F(xiàn)cεRI)信號(hào)通路、趨化因子信號(hào)通路、T 細(xì)胞受體信號(hào)通路等通路在C1 亞組中上調(diào)。此外,丁酸代謝、萜類骨架的生物合成、脂肪酸代謝和組氨酸代謝等途徑在C2 亞組中上調(diào)(圖6-C)。
圖6 亞型間DECRGs 相關(guān)免疫浸潤(rùn)分析和GSVA 分析Fig.6 Analysis of DECRGs related immune infiltration and GSVA among subtypes
應(yīng)用WGCNA 算法根據(jù)活動(dòng)期UC 分型基因建立加權(quán)基因共表達(dá)網(wǎng)絡(luò),以識(shí)別與DECRGs 聚類密切相關(guān)的關(guān)鍵基因模塊。共有9 個(gè)重要的共表達(dá)模塊,藍(lán)色模塊與C1 呈最強(qiáng)的正相關(guān)(相關(guān)系數(shù)r=0.85,P= 2×10?18),與C2 呈最強(qiáng)的負(fù)相關(guān)(r=0.85,P= 2×10?18),見(jiàn)圖7。以“geneSig Filter=0.5,moduleSig Filter=0.8”為條件,經(jīng)Wilcox 檢驗(yàn)且P<0.05 表示有統(tǒng)計(jì)學(xué)意義,從藍(lán)色模塊篩選出234 個(gè)核心基因。
圖7 分型WGCNA 確定活動(dòng)期UC 相關(guān)模塊和核心基因Fig.7 WGCNA of genotyping to determine active UC related modules and core genes
為了進(jìn)一步識(shí)別具有高診斷價(jià)值的關(guān)鍵標(biāo)志物,基于藍(lán)色模塊234 個(gè)核心基因,建立了4 個(gè)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練。從殘差箱線圖可以看出GLM、XGB和SVM 的殘差在0~0.125,RF 的殘差在0.125~0.250(圖8-A)。從累積殘差分布圖得出的結(jié)論與上述結(jié)果一致(圖8-B)。ROC 曲線中XGB 模型的曲線下面積為0.911(圖8-C),大于GLM、RF 和SVM,故XGB 模型是最佳機(jī)器學(xué)習(xí)模型。中胚層特異性轉(zhuǎn)錄基因(mesoderm-specific transcript,MEST)、跨膜蛋白98(transmembrane protein 98,TMEM98)、晶狀體蛋白λ1(crystallin lambda 1,CRYL1)、染色體14開(kāi)放閱讀框(chromosome 14 open reading frame 147,C14orf147)和跨膜蛋白141(transmembrane protein 141,TMEM141)是XGB 模型中重要性得分最高的前5 位基因(圖8-D)。
圖8 活動(dòng)期UC 機(jī)器學(xué)習(xí)模型的構(gòu)建Fig.8 Construction of active UC machine learning model
選擇XGB 模型重要性得分最高的前5 位基因作為疾病特征基因,并構(gòu)建列線圖以預(yù)測(cè)活動(dòng)期UC 的發(fā)病風(fēng)險(xiǎn)(圖9-A)。校準(zhǔn)曲線顯示實(shí)線和虛線在圖中彼此很接近,表明模型預(yù)測(cè)能力較好(圖9-B)。決策曲線紅線表示的模型遠(yuǎn)離全部(all)曲線,再次表明模型效果較好(圖9-C)。以3 個(gè)驗(yàn)證數(shù)據(jù)集GSE87466、GSE87473 和GSE92415 從外部來(lái)驗(yàn)證模型的預(yù)測(cè)能力,結(jié)果發(fā)現(xiàn)模型的準(zhǔn)確率可以達(dá)到91.7%、95.7%和94.9%(圖9-D~F)。
圖9 活動(dòng)期UC 機(jī)器學(xué)習(xí)模型的驗(yàn)證Fig.9 Verification of machine learning model of active UC
相關(guān)性分析顯示,NLRP3與疾病特征基因存在著較強(qiáng)的負(fù)相關(guān)性,其他DECRGs 中的1個(gè)或者多個(gè)基因與5 個(gè)疾病特征基因有較強(qiáng)的正相關(guān)性,它們之間可能存在著相互調(diào)控作用,見(jiàn)圖10。
圖10 DECRGs 與5 個(gè)疾病特征基因間的相關(guān)性分析Fig.10 Correlation analysis between DECRGs and five disease characteristic genes
共篩選出338 味中藥,其中《中國(guó)藥典》2020年版收錄206 味藥,根據(jù)中醫(yī)傳承計(jì)算平臺(tái)(V3.5)對(duì)這206 味藥進(jìn)行出現(xiàn)頻次統(tǒng)計(jì)、四氣五味、歸經(jīng)統(tǒng)計(jì),根據(jù)第10 版《中藥學(xué)》進(jìn)行功效類別統(tǒng)計(jì)。白術(shù)、丹參、莪術(shù)、紫草、桑葉、青風(fēng)藤、桑枝均出現(xiàn)在3 個(gè)銅死亡基因中,可見(jiàn)其在調(diào)節(jié)銅死亡治療活動(dòng)期UC 中發(fā)揮著重要的作用。四氣以溫、寒和平為主,五味以苦、甘、辛為主,主歸肝、脾經(jīng),肺經(jīng)和胃經(jīng)次之(圖11)。中藥功效以清熱類、補(bǔ)虛類和活血化瘀類為主,清熱類中以清熱解毒藥和清熱燥濕最多(表1)。
表1 中藥功效分類統(tǒng)計(jì)Table 1 Classified statistics of efficacy of traditional Chinese medicines
圖11 中藥的四氣、五味和歸經(jīng)統(tǒng)計(jì)Fig.11 Statistics of four qi, five flavor and meridian tropism of traditional Chinese medicines
UC 是一種炎癥性腸病,近年來(lái)UC 的發(fā)病率和患病率逐漸上升,給我國(guó)的醫(yī)療系統(tǒng)帶來(lái)了重大的負(fù)擔(dān)和挑戰(zhàn)[28-29]。然而,UC 確切的機(jī)制尚不清楚,多種因素參與了UC 的發(fā)病機(jī)制,包括免疫反應(yīng)紊亂、腸屏障損傷、遺傳易感性、腸道生態(tài)失調(diào)和環(huán)境應(yīng)激[30-31]。UC 不易治愈,復(fù)發(fā)率高,與結(jié)腸癌的發(fā)生密切相關(guān),雖然有許多藥物可用于抑制結(jié)腸炎,但常規(guī)治療具有一定的局限性和嚴(yán)重的不良反應(yīng)[32]。銅死亡參與多種免疫系統(tǒng)疾病的發(fā)生和進(jìn)展[33-34],然而,目前尚缺乏銅死亡在活動(dòng)期UC 中的研究。
本研究通過(guò)比較CRG 在活動(dòng)期UC 組和對(duì)照組結(jié)腸中的表達(dá),發(fā)現(xiàn)與正常人群相比,有11 個(gè)CRGs 在活動(dòng)期UC 結(jié)腸中的表達(dá)異常,活動(dòng)期UC患者的NLRP3顯著上調(diào),其他的DECRGs 均下調(diào),表明DECRGs 在活動(dòng)期UC 的發(fā)展中起重要作用?;顒?dòng)期UC 患者和小鼠模型中均檢測(cè)到NLRP3 水平升高[35-36]。Zhang 等[37]通過(guò)對(duì)56 例UC 患者和274 例對(duì)照組進(jìn)行基因分型發(fā)現(xiàn)rs10754558 和rs10925019 在中國(guó)漢族人群中與UC 的易感性顯著相關(guān),這表明NLRP3可能在UC 的發(fā)病機(jī)制中起重要作用。通過(guò)對(duì)這些基因進(jìn)行了相關(guān)性分析發(fā)現(xiàn)活動(dòng)期UC 中DECRGs 之間存在著顯著的相關(guān)性,NLRP3與其他DECRGs 均呈負(fù)相關(guān),其中與DBT負(fù)相關(guān)性最顯著。活動(dòng)期UC 和對(duì)照組之間的免疫細(xì)胞浸潤(rùn)結(jié)果顯示,活動(dòng)期UC 患者中激活的記憶性CD4+T 細(xì)胞、靜息NK 細(xì)胞、M0 巨噬細(xì)胞、激活的肥大細(xì)胞和中性粒細(xì)胞上調(diào),與以往研究結(jié)果一致[38-43]。同時(shí),DECRGs 與免疫浸潤(rùn)細(xì)胞的相關(guān)性分析顯示M1 巨噬細(xì)胞與DLD、GCSH呈正相關(guān),M0 巨噬細(xì)胞與DLAT、FDX1、LIAS呈顯著的負(fù)相關(guān),這些結(jié)果表明DECRGs 可能與活動(dòng)期UC 進(jìn)展和免疫浸潤(rùn)有關(guān)。
此外,基于DECRGs 使用無(wú)監(jiān)督聚類分析將63例活動(dòng)期UC 患者分為2 個(gè)亞型,以更好地了解CRG 的表達(dá)模式。在不同的亞型中DECRGs 的表達(dá)存在差異,其中在C2 亞型中NLRP3的表達(dá)高于C1 亞型,其他DECRGs 的表達(dá)均低于C1 亞型。NLRP3 是核苷酸結(jié)合域樣受體家族的一員,被激活后與凋亡相關(guān)斑點(diǎn)樣蛋白(apoptosis-associated speck-like protein containing a CARD,ASC)和效應(yīng)分子半胱氨酸蛋白酶-1 前體(pro-caspase-1)組成NLRP3 炎性小體[44]。NLRP3 炎癥小體是炎癥反應(yīng)系統(tǒng)的重要組成部分和腸道內(nèi)穩(wěn)態(tài)的重要調(diào)節(jié)因子,其異常激活后通過(guò)釋放炎性細(xì)胞因子、損傷腸上皮細(xì)胞、破壞腸黏膜屏障,誘導(dǎo)參與UC 的發(fā)生發(fā)展的炎癥級(jí)聯(lián)反應(yīng)[45-46]。NFE2L2 是一種重要的傳感器蛋白,可能通過(guò)調(diào)節(jié)促炎細(xì)胞因子和誘導(dǎo)II期解毒酶在預(yù)防UC 方面發(fā)揮潛在的重要作用[47]。FDX1 是銅離子載體誘導(dǎo)細(xì)胞死亡的關(guān)鍵調(diào)節(jié)因子,也是細(xì)胞蛋白脂?;纳嫌握{(diào)節(jié)因子,通過(guò)結(jié)合LIAS 促進(jìn)其與脂酰載體蛋白GCSH 的功能性結(jié)合來(lái)直接調(diào)節(jié)蛋白質(zhì)脂?;痆48]。FDX1 表達(dá)與腫瘤細(xì)胞靜止和炎癥呈正相關(guān),與腫瘤侵襲呈負(fù)相關(guān),F(xiàn)DX1 的高表達(dá)在抑制結(jié)腸腫瘤中起著至關(guān)重要的作用[49]。PDHA1 是葡萄糖代謝過(guò)程中必不可少的成分,其失活被認(rèn)為與腫瘤中的代謝重編程和乳酸過(guò)量產(chǎn)生有關(guān)[50]。NLRP3 炎癥小體的激活需要乳酸發(fā)酵[51]。不同亞型的免疫學(xué)分析顯示C2 亞型中M0巨噬細(xì)胞數(shù)量更高。在不同誘導(dǎo)因子的作用下,巨噬細(xì)胞可分為M1 和M2 極化型,在UC 患者中巨噬細(xì)胞極化表型以M1 型為主,誘導(dǎo)局部炎癥反應(yīng),加重腸道炎癥和黏膜屏障損傷[52]??梢?jiàn),C2 亞型可能比C1 亞型的預(yù)后更差。GSVA 分析表明,C1 亞型在FcεRI 信號(hào)通路、趨化因子信號(hào)通路、T 細(xì)胞受體信號(hào)通路等通路中富集。C2 亞型在丁酸代謝、萜類骨架的生物合成、脂肪酸代謝和組氨酸代謝等途徑中顯著富集。
近年來(lái),WGCNA 算法和機(jī)器學(xué)習(xí)模型越來(lái)越多地用于UC 相關(guān)基因的篩選和疾病患病率的預(yù)測(cè)[53-56],但均未涉及到活動(dòng)期UC。本研究運(yùn)用WGCNA 篩選出234 個(gè)與DECRGs 聚類密切相關(guān)的核心基因,通過(guò)4 種機(jī)器學(xué)習(xí)發(fā)現(xiàn),XGB 模型是最佳機(jī)器學(xué)習(xí)模型,MEST、TMEM98、CRYL1、C14orf147和TMEM141是活動(dòng)期UC 的特征基因。然后,構(gòu)建了列線圖模型,使用MEST、TMEM98、CRYL1、C14orf147和TMEM141診斷活動(dòng)期UC,GSE87466、GSE87473 和GSE92415 數(shù)據(jù)集用于評(píng)價(jià)5 個(gè)基因的預(yù)測(cè)效能,ROC 結(jié)果表明該模型具有良好的預(yù)測(cè)性能和一定的臨床應(yīng)用價(jià)值,可作為活動(dòng)期UC 的診斷生物標(biāo)志物。
通過(guò)預(yù)測(cè)疾病特征基因和DECRGs 的中藥,總結(jié)發(fā)現(xiàn)調(diào)控DECRGs 治療活動(dòng)期UC 的中藥功效以清熱類、補(bǔ)虛類、活血化瘀類為主,清熱類中以清熱解毒藥和清熱燥濕藥最多,體現(xiàn)了活動(dòng)期UC 以脾胃虛弱為本,濕熱毒瘀蘊(yùn)結(jié)為標(biāo),與活動(dòng)期UC常見(jiàn)的大腸濕熱、熱毒熾盛等證型相符[57-59]。四氣以溫、寒和平為主,五味以苦、甘、辛為主,甘溫健脾能補(bǔ)益脾胃,苦寒燥濕能清脾胃、大腸濕熱,辛能散能行,可調(diào)氣行血以通腸腑。歸經(jīng)方面主歸肝、脾、肺、胃經(jīng),與疾病的歸經(jīng)基本相同[60],體現(xiàn)了微觀銅死亡基因調(diào)節(jié)活動(dòng)期UC 層面與宏觀整體調(diào)節(jié)層面的方向相符。頻次統(tǒng)計(jì)顯示白術(shù)、丹參、莪術(shù)、紫草、桑葉、青風(fēng)藤、桑枝在銅死亡基因預(yù)測(cè)中出現(xiàn)的頻次最高,可見(jiàn)它們?cè)谄渲邪l(fā)揮著重要的作用。白術(shù)多糖和揮發(fā)油可以通過(guò)調(diào)節(jié)腸道菌群的組成和宿主代謝來(lái)治療UC[61-63]。丹參提取物能夠通過(guò)抑制Toll 樣受體4(toll-like receptor 4,TLR4)/磷脂酰肌醇-3-羥激酶(phosphatidylinositol-3-hydroxykinase,PI3K)/蛋白激酶B(protein kinase B,Akt)/哺乳動(dòng)物雷帕霉素靶蛋白(mammalian target of rapamycin,mTOR)信號(hào)通路改善UC 的炎癥[64]。莪術(shù)提取物中的姜黃素可以通過(guò)抑制炎癥介質(zhì)和細(xì)胞因子、清除氧自由基等過(guò)程發(fā)揮免疫調(diào)節(jié)和抗炎作用治療UC[65]。紫草素及其衍生物通過(guò)抑制NLRP3 炎癥小體和NF-κB 信號(hào)通路的激活,減輕結(jié)腸上皮緊密連接的破壞,從而改善UC 的炎癥和黏膜屏障損傷[66]。
綜上所述,本研究通過(guò)生物信息學(xué)揭示了銅死亡相關(guān)基因在活動(dòng)期UC 中的表達(dá)模式。通過(guò)機(jī)器學(xué)習(xí),確定了MEST、TMEM98、CRYL1、C14orf147和TMEM141是參與活動(dòng)期UC 發(fā)病機(jī)制的核心基因,可作為活動(dòng)期UC 的診斷生物標(biāo)志物。本研究還建立了1 個(gè)預(yù)測(cè)模型,可以準(zhǔn)確評(píng)估活動(dòng)期UC的患病風(fēng)險(xiǎn)。本研究系統(tǒng)地評(píng)估了活動(dòng)期UC 與銅死亡之間的關(guān)系,并預(yù)測(cè)了能夠調(diào)節(jié)銅死亡治療活動(dòng)期UC 的中藥,這不僅有助于提高對(duì)活動(dòng)期UC銅死亡的認(rèn)識(shí),也有利于活動(dòng)期UC 的診斷和治療。
利益沖突所有作者均聲明不存在利益沖突