亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        加權(quán)基因共表達(dá)網(wǎng)絡(luò)與機(jī)器學(xué)習(xí)算法確定宮頸癌中免疫浸潤(rùn)相關(guān)的基因簽名與預(yù)后分析①

        2021-08-23 05:12:12方萌趙晗池晴佳江漢大學(xué)醫(yī)學(xué)院武漢430056
        中國(guó)免疫學(xué)雜志 2021年15期
        關(guān)鍵詞:分析模型

        方萌 趙晗池 晴佳(江漢大學(xué)醫(yī)學(xué)院,武漢430056)

        宮頸癌(cervical cancer,CC)是世界上第四大最常見(jiàn)的女性癌癥。近年來(lái),其發(fā)病率呈現(xiàn)年輕化趨勢(shì)[1]。盡管已經(jīng)證實(shí)CC是由HR-HPV(HPV16和18)持續(xù)感染引起的[2]。然而,CC的高復(fù)發(fā)率和異質(zhì)性導(dǎo)致其預(yù)后較差。因此,開發(fā)新的診斷和預(yù)后生物標(biāo)記非常迫切。MicroRNA(miRNA)的異常表達(dá)被認(rèn)為是各種癌癥發(fā)展的關(guān)鍵因素[3]。作為miR?NA家族的成員,miR-141-3p影響多種癌癥進(jìn)展,并且在CC的發(fā)生和發(fā)展過(guò)程中發(fā)揮著重要作用[4-5]。已有研究報(bào)道m(xù)iR-141-3p通過(guò)靶向單個(gè)基因影響CC細(xì)胞的生長(zhǎng)和侵襲[6]。但在CC的預(yù)后預(yù)測(cè)方面,基于預(yù)后模型的多基因簽名比單基因的準(zhǔn)確度更高??紤]到免疫微環(huán)境對(duì)腫瘤發(fā)生發(fā)展的關(guān)鍵作用,深入簽名基因的免疫浸潤(rùn)有可能幫助改善CC的預(yù)后預(yù)測(cè)。先前研究尚未探索miR-141-3p的靶基因與免疫微環(huán)境之間的相關(guān)性。因此,全面分析miR-141-3p的靶基因與總體生存率之間的相關(guān)性,建立可靠的免疫相關(guān)的多基因簽名以準(zhǔn)確預(yù)測(cè)CC病人的生存至關(guān)重要。機(jī)器學(xué)習(xí)在快速、準(zhǔn)確的確定基因標(biāo)記物中起到了重要作用[7-9]。并且,諾謨圖比普通的風(fēng)險(xiǎn)評(píng)分模型擁有更好的預(yù)后預(yù)測(cè)能力。在以往的研究中,已結(jié)合實(shí)驗(yàn)和生物信息學(xué)方法來(lái)研究肝癌與其他疾病的預(yù)后標(biāo)記物與免疫調(diào)節(jié)分子機(jī)制[10-12]。本文通過(guò)TCGA數(shù)據(jù)庫(kù)分析miR-141-3p在CC中的預(yù)后性能。使用WGCNA、COX回歸、LASSO COX回歸建立并驗(yàn)證了與免疫浸潤(rùn)相關(guān)的多基因簽名與諾謨圖,以預(yù)測(cè)患者的生存。

        1 材料與方法

        1.1 數(shù)據(jù)預(yù)處理CC(TCGA數(shù)據(jù)庫(kù)中簡(jiǎn)寫為CESC)的mRNA,miRNA表達(dá)數(shù)據(jù)和臨床數(shù)據(jù)可從TCGA數(shù)據(jù)庫(kù)(https://tcga-data.nci.nih.gov/tcga/)下載。表達(dá)數(shù)據(jù)進(jìn)行l(wèi)og2轉(zhuǎn)換和歸一化處理,排除無(wú)隨訪消息或<1 d的時(shí)間臨床數(shù)據(jù)。

        1.2 miR-141-3p靶基因的篩選使用miRWalk2.0(http://zmf.umm.uni-heidelberg.de/apps/zmf/mir?walk2/)中的12個(gè)數(shù)據(jù)庫(kù)(Microt4,miRWalk,mirbridge,miRanda,miRDB,miRMap,Pictar2,PITA,MiRNAMap,RNAhybrid,RNA22和Targetscan)來(lái)確定miR-141-3p的靶基因。然后,使用R語(yǔ)言中的“l(fā)imma”程序包分析CESC數(shù)據(jù)。以FDR<0.01,|log2FC|≥2為閾值篩選差異表達(dá)基因(DEGs)。最后,通過(guò)Venn Plot分析DEGs與預(yù)測(cè)基因之間的重疊基因(候選基因)。

        1.3 加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析通過(guò)R軟件中的“WGCNA”軟件包分析候選基因的表達(dá)和臨床文件。通過(guò)計(jì)算基因?qū)χg的Pearson相關(guān)性,模塊特征基因與性狀(包括疾病狀態(tài))的相關(guān)性,確定與預(yù)后相關(guān)的基因模塊。

        1.4 基于LASSO COX回歸的風(fēng)險(xiǎn)預(yù)測(cè)模型通過(guò)單變量Cox回歸分析探討了每個(gè)模塊基因?qū)傮w生存的影響。將P<0.05和與生存相關(guān)的模塊基因整合到機(jī)器學(xué)習(xí)算法(LASSO回歸)中,以鑒定預(yù)后風(fēng)險(xiǎn)特征。使用R包“timeROC”繪制tROC曲線,預(yù)測(cè)1年、3年和5年總體生存。

        1.5 基于支持向量機(jī)免疫細(xì)胞浸潤(rùn)基于支持向量機(jī)的CIBERSORT算法用于計(jì)算每個(gè)患者中22個(gè)免疫細(xì)胞的比例。通過(guò)wilcoxon檢驗(yàn)評(píng)估了高危和低?;颊咧g免疫細(xì)胞浸潤(rùn)的差異(P<0.05)。TIMER用于分析簽名基因與免疫細(xì)胞浸潤(rùn)之間的相關(guān)性。

        1.6 基因集富集分析通過(guò)“clusterprofiler”軟件包(Perm=1 000,minGSSize=100和P.value=0.01)分析了高危和低危患者之間的信號(hào)通路多樣性?!發(fā)imma”程序包用于計(jì)算基因的logFC值。

        2 結(jié)果

        2.1 miR-141-3p的臨床價(jià)值miR-141-3p在腫瘤組織中的表達(dá)顯著上調(diào)(P=0.003 2,圖1A)。ROC曲線表明miR-141-3p的表達(dá)可以很好地將腫瘤與正常樣品區(qū)分開(AUC=0.871 19,圖1B)。以303個(gè)腫瘤組織中miR-141-3p的平均值作為臨界值,將所有患者分為低表達(dá)和高表達(dá)患者。排除生存時(shí)間缺或生存時(shí)間為0的情況得到的患者樣本為280個(gè)。生存分析結(jié)果表明,miR-141-3p的低表達(dá)可顯著改善患者的預(yù)后,而高表達(dá)對(duì)應(yīng)不良的預(yù)后(P=0.022 0,圖1C)。tROC曲線分析表明,miR-141-3p對(duì)患者的預(yù)后具有很強(qiáng)的預(yù)測(cè)能力。1年、3年和5年的AUC分別為0.762、0.715和0.741(圖1D)。

        圖1 miR-141-3p的臨床價(jià)值Fig.1 Clinical value of miR-141-3p

        2.2 鑒定預(yù)后相關(guān)基因模塊miR-141-3p靶基因包含1 485個(gè)交集基因(圖2A)。選擇軟閾值=5以符合無(wú)標(biāo)度網(wǎng)絡(luò)法則(圖2B)?;诨蚝蜆颖緮?shù)據(jù)的層次聚類建立的網(wǎng)絡(luò)熱圖(圖2C)。在9個(gè)模塊和多個(gè)臨床表型參數(shù)的相關(guān)分析結(jié)果中,發(fā)現(xiàn)黃色模塊同時(shí)與T.stage(cor=0.28,P=1e-06),N.stage(cor=-0.23,P=5e-05)和AJCC階段(cor=0.22,P=2e-04)具有很強(qiáng)的相關(guān)性(圖2D)。因此,確定黃色模塊為與CC預(yù)后相關(guān)的功能性miR-141-3p下游基因集。

        圖2 WGCNA分析Fig.2 WGCNA analysis

        2.3 風(fēng)險(xiǎn)預(yù)測(cè)模型與諾謨圖隨機(jī)將280例CC患者的樣本分為訓(xùn)練集(n=140)和驗(yàn)證集(n=140)。通過(guò)單變量COX回歸確定了與訓(xùn)練集中的患者OS顯著相關(guān)的31個(gè)基因(P<0.05)。利用LASSO回歸進(jìn)一步優(yōu)化結(jié)果,最后有5個(gè)靶標(biāo)顯著影響患者的生存率(表1,圖3A)?;贚ASSO COX分析的結(jié)果,建立了5個(gè)靶標(biāo)簽名風(fēng)險(xiǎn)預(yù)后模型。模型公式為:RS=0.012 1×FOXA1+0.007 7×DMBX1+0.149 3×TMEM98+0.014 2×RHPN1+0.026 4×SRMS基 于 訓(xùn)練集的生存分析表明,與高風(fēng)險(xiǎn)相比,低風(fēng)險(xiǎn)可以顯著改善患者的預(yù)后(P=0.000 54)。tROC曲線分析表明,該風(fēng)險(xiǎn)預(yù)后模型具有顯著的預(yù)后預(yù)測(cè)效果,其1年、3年和5年AUC分別為0.810、0.821和0.679(圖3B)。此外,基于驗(yàn)證集K-M曲線分析(P=0.000 86)和tROC分析也證實(shí)了上述結(jié)果(圖3C)。

        表1 與OS相關(guān)的5個(gè)預(yù)后靶標(biāo)Tab.1 5 prognostic targets related to OS

        圖3 風(fēng)險(xiǎn)預(yù)測(cè)模型構(gòu)建與驗(yàn)證Fig.3 Risk prediction model construction and verification

        通過(guò)單變量和多變量COX回歸評(píng)估了患者的風(fēng)險(xiǎn)評(píng)分和多種臨床特征。分析顯示,在訓(xùn)練和驗(yàn)證組中,風(fēng)險(xiǎn)評(píng)分和AJCC分期與患者的OS顯著相關(guān)(表2)。通過(guò)組合風(fēng)險(xiǎn)評(píng)分和AJCC分期而建立的諾謨圖(C-index=0.83,圖4A)在預(yù)測(cè)患者生存率方面明顯優(yōu)于單獨(dú)使用風(fēng)險(xiǎn)評(píng)分(C-index=0.77)和AJCC分期(C-index=0.70)。基于訓(xùn)練集的研究發(fā)現(xiàn)。1年、3年和5年OS預(yù)測(cè)表明,由諾謨圖預(yù)測(cè)的生存率與最佳預(yù)測(cè)性能非常匹配(圖4B)。與以上結(jié)果一致,諾謨圖(C-index=0.68,圖4C)與預(yù)后因素風(fēng)險(xiǎn)評(píng)分(C-index=0.67)和AJCC分期(C-index=0.56)相比,具有更好的預(yù)后和預(yù)測(cè)能力(驗(yàn)證集)。同時(shí),校準(zhǔn)曲線還驗(yàn)證了驗(yàn)證集中諾謨圖的預(yù)后預(yù)測(cè)性能(圖4D)。

        表2 預(yù)后信息的單因素和多因素分析Tab.2 Univariate and multivariate analyses of prognostic informations

        圖4 建立預(yù)后模型的諾謨圖Fig.4 Establishment of nomogram of prognostic model

        2.4 低危和高危人群免疫細(xì)胞浸潤(rùn)和GSEA通路差異基于CIBERSORT的280個(gè)腫瘤樣品中22個(gè)免疫細(xì)胞的浸潤(rùn)率(圖5A、B)。CD4+T細(xì)胞,巨噬細(xì)胞M0和M2是腫瘤微環(huán)境中3個(gè)最豐富的免疫細(xì)胞。有趣的是,巨噬細(xì)胞和T細(xì)胞的浸潤(rùn)率最大,約占免疫細(xì)胞的65%。在TCGA訓(xùn)練集中,高危和低?;颊咧g存在5種類型(P<0.05)的免疫細(xì)胞浸潤(rùn)差異(圖5C)。根據(jù)TCGA驗(yàn)證集,在不同風(fēng)險(xiǎn)組中存在6種類型(P<0.05)的免疫細(xì)胞浸潤(rùn)差異(圖5D)。并且通過(guò)TIMER獲得了預(yù)后標(biāo)志介導(dǎo)的免疫浸潤(rùn)變化(圖6)。結(jié)果表明,樹突狀細(xì)胞的浸潤(rùn)與5個(gè)基因在預(yù)后標(biāo)志物中的表達(dá)顯著相關(guān)?;谌蚪MGSEA分析,在高危和低?;颊咧蝎@得了6條重要的KEGG通路(圖7)。

        圖5 基于CIBERSORT算法分析22種免疫細(xì)胞浸潤(rùn)Fig.5 Analysis of 22 immune cells infiltration according to CIBERSORT algorithm

        圖6 基于TIMER的5種預(yù)后基因表達(dá)與腫瘤浸潤(rùn)性免疫細(xì)胞的相關(guān)性分析Fig.6 Correlation analysis between 5 prognostic gene expression and tumor infiltrating immune cells based on TIMER

        圖7 GSEA獲得了高危組和低危組間存在差異的6條通路Fig.7 GSEA obtained 6 pathways with differences be?tween high-risk group and low-risk group

        3 討論

        首先通過(guò)TCGA數(shù)據(jù)集挖掘了miR-141-3p的臨床價(jià)值。結(jié)果表明,miR-141-3p在CC組織中的表達(dá)明顯上調(diào),與LI等[6]的研究一致。miR-141-3p高表達(dá)水平表明CC患者生存期較差。tROC曲線表明,miR-141-3p的表達(dá)對(duì)患者的預(yù)后具有強(qiáng)大的預(yù)測(cè)能力。然后,對(duì)miR-141-3p的潛在靶標(biāo)進(jìn)行了全面分析。WGCNA指出目標(biāo)基因模塊與T.Stage,N.stage和AJCC階段顯著相關(guān)。

        越來(lái)越多的研究表明,基因標(biāo)記在預(yù)測(cè)腫瘤的預(yù)后中起著重要的作用[13-15]。迄今為止,還未有研究通過(guò)將WGCNA和LASSO Cox回歸方法相結(jié)合以鑒定miR-141-3p的預(yù)后靶基因標(biāo)志物來(lái)提高CC預(yù)后的預(yù)測(cè)。在本次研究中,通過(guò)對(duì)miR-141-3p的候選基因進(jìn)行了WGCNA和LASSO Cox回歸確定了5個(gè)與預(yù)后相關(guān)的靶基因。在以前的報(bào)道中,F(xiàn)OXA1、DMBX1、TMEM98、RHPN1和SRMS與CC細(xì)胞遷移發(fā)展顯著相關(guān)[16-20]。

        作為一種機(jī)器學(xué)習(xí)算法,LASSO COX已有大量研究[21-23]。對(duì)于生存數(shù)據(jù),最常用的統(tǒng)計(jì)模型是Cox比例風(fēng)險(xiǎn)回歸模型[24]。而其他傳統(tǒng)機(jī)器學(xué)習(xí)算法如隨機(jī)森林、人工神經(jīng)網(wǎng)絡(luò)、貝葉斯算法并沒(méi)有專門開始針對(duì)生存數(shù)據(jù)的模塊。本研究的重點(diǎn)是預(yù)測(cè)CC患者的總體生存。作為機(jī)器學(xué)習(xí)算法的LAS?SO COX算法能夠識(shí)別潛在的風(fēng)險(xiǎn)因素,評(píng)估預(yù)測(cè)、擬合優(yōu)度,以及結(jié)果的臨床相關(guān)性[25]。故本文采用LASSO COX回歸作為機(jī)器學(xué)習(xí)算法。LASSO COX模型的優(yōu)點(diǎn)在于可以直接解釋患病風(fēng)險(xiǎn)和生存之間的關(guān)系。另一方面,機(jī)器學(xué)習(xí)技術(shù)是無(wú)假設(shè)和數(shù)據(jù)自適應(yīng),這意味著它們可以有效地用于對(duì)復(fù)雜數(shù)據(jù)進(jìn)行建模。當(dāng)然,LASSO COX算法也存在一定的局限。例如,該算法要求輸入數(shù)據(jù)進(jìn)行適當(dāng)?shù)奶幚恚⑶矣?jì)算過(guò)程中會(huì)對(duì)參數(shù)進(jìn)行適當(dāng)?shù)恼{(diào)整,以避免算法性能下降[26]。

        研究表明,多基因簽名在預(yù)測(cè)腫瘤的預(yù)后中起著至關(guān)重要的作用。LIANG等[27]提出了一種3-miRNA簽名,用于CC的獨(dú)立預(yù)后預(yù)測(cè)。XIE等[28]還確定了1個(gè)8基因簽名來(lái)預(yù)測(cè)CC患者的預(yù)后。此外,LI等[29]使用組蛋白家族基因簽名來(lái)預(yù)測(cè)CC患者的生存。同樣,DING等[30]提出了1個(gè)3基因簽名,以通過(guò)Cox回歸改善CC的生存預(yù)測(cè)。先前的研究使用單變量Cox回歸分析方法來(lái)預(yù)測(cè)CC患者的生存。但當(dāng)前對(duì)CC預(yù)后簽名的研究用到的算法不夠深入,對(duì)簽名基因的免疫浸潤(rùn)角色也極少關(guān)注。本文通過(guò)結(jié)合WGCNA、LASSO Cox回歸以及支持向量機(jī)算法得到的5個(gè)基因簽名和諾謨圖,有效改善了CC預(yù)后的預(yù)測(cè)。WGCNA使用無(wú)監(jiān)督聚類來(lái)識(shí)別基因模塊,默認(rèn)方法是分層聚類。分層聚類是一種用于確定多維空間中相似數(shù)據(jù)點(diǎn)聚類的常用方法,它可以使用動(dòng)態(tài)樹切割方法來(lái)確定模塊[31-32]。動(dòng)態(tài)樹切割方法成功地識(shí)別了使用靜態(tài)切割方法無(wú)法識(shí)別的分支,產(chǎn)生預(yù)后相關(guān)的基因簇。為了結(jié)果的準(zhǔn)確性,本實(shí)驗(yàn)進(jìn)一步通過(guò)單變量COX回歸分析基因簇以獲得與總體生存相關(guān)的基因,利用LASSO COX算法則解決了肝癌從高維數(shù)據(jù)獲得的預(yù)測(cè)模型可能具有過(guò)擬合的風(fēng)險(xiǎn),構(gòu)建了預(yù)后的特征?;陲L(fēng)險(xiǎn)評(píng)分和臨床特征,通過(guò)多變量COX回歸建立了諾謨圖。而研究結(jié)果也證實(shí),諾謨圖在預(yù)測(cè)患者生存率方面明顯優(yōu)于單獨(dú)使用風(fēng)險(xiǎn)評(píng)分(C-index=0.77)和AJCC分期(C-index=0.70)。因而,基于預(yù)后簽名的風(fēng)險(xiǎn)評(píng)分顯示出生存預(yù)測(cè)具備潛在優(yōu)勢(shì)。

        確定5個(gè)基因的特征后,構(gòu)建5個(gè)基因的預(yù)后模型并研究其預(yù)后價(jià)值。發(fā)現(xiàn)訓(xùn)練組和驗(yàn)證組的高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)水平的預(yù)后顯著不同。所有高危人群的OS均低于低危人群。tROC分析表明5個(gè)基因簽名具有很強(qiáng)的預(yù)測(cè)能力。腫瘤的進(jìn)展不僅受腫瘤本身特征的影響,而且還受腫瘤微環(huán)境的影響。值得注意的是本實(shí)驗(yàn)的預(yù)后標(biāo)志與腫瘤微環(huán)境的免疫浸潤(rùn)水平顯著相關(guān)。根據(jù)CIBERSORT分析,發(fā)現(xiàn)在不同的風(fēng)險(xiǎn)組中,B細(xì)胞,漿細(xì)胞和巨噬細(xì)胞M1、M2具有較大的豐度差異。此外,GSEA還揭示了高風(fēng)險(xiǎn)組與低風(fēng)險(xiǎn)組相比有6種不同的免疫狀態(tài)。因此,研究結(jié)果可為CC患者更好的治療提供依據(jù)。

        總之,綜合運(yùn)用加權(quán)基因共表達(dá)網(wǎng)絡(luò)、COX回歸、LASSO回歸算法,開發(fā)并驗(yàn)證了基于miR-141-3p的預(yù)后靶基因的新型5個(gè)基因簽名(FOXA1、DMBX1、TMEM98、RHPN1和SRMS),并進(jìn)行了預(yù)后分析。結(jié)果顯示,與免疫浸潤(rùn)相關(guān)的5個(gè)基因簽名可以顯著改善CC患者的預(yù)后。因此,本次研究提出的5個(gè)基因簽名與諾謨圖有潛力為CC患者提供預(yù)后評(píng)估工具。

        猜你喜歡
        分析模型
        一半模型
        隱蔽失效適航要求符合性驗(yàn)證分析
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        中西醫(yī)結(jié)合治療抑郁癥100例分析
        在線教育與MOOC的比較分析
        国产一起色一起爱| 国产超碰人人爽人人做人人添 | 中文字幕日韩高清乱码| 和少妇人妻邻居做爰完整版| 日本女优中文字幕在线播放| 国产精品二区一区二区aⅴ污介绍| 国产99久久精品一区二区| 亚州精品无码人妻久久| 亚洲中文有码一区二区| 成人大片免费观看视频| 天天狠天天添日日拍| 国产成人综合久久精品推| 亚洲一区二区三区在线中文| 按摩师玩弄少妇到高潮av| 日韩国产精品无码一区二区三区| 最新亚洲人成无码网www电影| 尤物蜜芽福利国产污在线观看| 特级黄色大片性久久久| 又粗又黄又猛又爽大片app| 两个人看的www高清视频中文| 日本国产一区二区三区在线观看| 久久精品国产亚洲av网站 | 日韩精品免费视频久久| 国产av夜夜欢一区二区三区| 国产精品毛片完整版视频| 在线免费毛片| 久久夜色精品国产九色| av剧情演绎福利对白| 国内精品久久久久影院一蜜桃| 久久精品国产亚洲av成人| 中文字幕乱码中文乱码毛片| 偷拍综合在线视频二区日韩| 中文字幕无码毛片免费看| 久久久久成人亚洲综合精品| 亚洲天堂av免费在线| 久久综合伊人77777麻豆| 乱码丰满人妻一二三区| 精品无码久久久久久久动漫| 国产激情视频免费观看| 91自拍视频国产精品| 国产麻豆md传媒视频|