亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于不同數(shù)據(jù)庫來源數(shù)據(jù)的胃癌長鏈非編碼RNA預(yù)后預(yù)測模型構(gòu)建

        2020-11-12 13:41:34周新童黨勝春
        中國普通外科雜志 2020年10期
        關(guān)鍵詞:生存率胃癌樣本

        周新童,黨勝春

        (1.蘇州大學(xué)附屬張家港醫(yī)院 普通外科,江蘇 張家港 215600;2.江蘇大學(xué)附屬醫(yī)院 普通外科,江蘇 鎮(zhèn)江 212001)

        胃癌是全球五大惡性腫瘤之一,其病死率在所有癌癥中居第2位[1]。中國是胃癌的高發(fā)病區(qū),發(fā)病患者數(shù)大約占全世界的一半[2]。由于其發(fā)病隱匿,病情進展較快,5年生存率25%~30%[3]。隨著近幾年診斷及治療水平的進步,早期患者的生存率已經(jīng)得到明顯提高,但進展期胃癌患者生存率依舊很低[4-6]。因此,建立良好的診斷和預(yù)后篩選評估體系,對胃癌的診治尤為重要。

        在過去的幾十年里,人們在胃癌的分子機制研究方面取得了非常大的突破[7-9]。然而,目前尚無能用于胃癌治療及預(yù)后評估的分子標志物。長鏈非編碼RNA(long non-coding RNA,lncRNA)是一類長度超過200個核苷酸的RNA,其本身并不具備編碼蛋白質(zhì)的功能[10]。近年來研究顯示,lncRNA在基因組中廣泛分布,參與調(diào)節(jié)染色質(zhì)修飾及基因表達等重要生理過程[11-13]。lncRNA在腫瘤的早期診斷和預(yù)后評估方面的價值也逐漸的被挖掘出來[14-16]。

        近幾年來,越來越多的人嘗試利用公共數(shù)據(jù)庫,比如從癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫中獲得大樣本數(shù)據(jù)進行研究[17-19]。然而,單一的TCGA數(shù)據(jù)庫使用存在著一些問題,比如正常對照樣本的匱乏(TCGA中僅有32例胃癌樣本存在癌旁對照信息)。此外,筆者發(fā)現(xiàn),基因型-組織表達數(shù)據(jù)庫(Genotype-Tissue Expression,GTEx)中保存有大量可作為正常對照的樣本信息。

        本研究擬將TCGA數(shù)據(jù)庫中胃癌患者和GTEx數(shù)據(jù)庫中正常人胃黏膜的轉(zhuǎn)錄組數(shù)據(jù)聯(lián)合起來,構(gòu)建一個由10種lncRNA組成的模型(10-lncRNA預(yù)后模型),作為一種新的判斷胃癌患者預(yù)后狀態(tài)的指標。隨后,通過基因表達匯編數(shù)據(jù)庫(Gene Expression Omnibus,GEO),引入一個獨立的數(shù)據(jù)集(GSE62254),驗證該預(yù)后模型的穩(wěn)健性[20]。

        1 資料與方法

        1.1 數(shù)據(jù)下載

        從TCGA官方網(wǎng)站(https://portal.gdc.cancer.gov/repository)下載獲取胃癌的轉(zhuǎn)錄組測序數(shù)據(jù)集,其中胃癌患者的樣本375例,對照組樣本32例,同時下載相應(yīng)的臨床資料。在進行預(yù)后分析及研究風(fēng)險值(Risk Score)與臨床資料的關(guān)系時,剔除臨床信息不全的樣本,共剩余317例。從GTEx官方網(wǎng)站(https://gtexportal.org)下載獲取正常人的胃黏膜樣本轉(zhuǎn)錄組測序數(shù)據(jù),共計194例。在篩選差異表達lncRNA時,將32例對照組樣本以及 194例正常胃黏膜樣本合并,作為對照組與375例癌組織樣本進行差異分析。從GEO官方網(wǎng)站(https://ncbi.nlm.nih.gov/geo)下載獲取GSE62254數(shù)據(jù)集,共計300例,同獲取該數(shù)據(jù)集的臨床樣本文件。

        1.2 數(shù)據(jù)處理

        將下載好的TCGA和GTEx的轉(zhuǎn)錄組數(shù)據(jù)合并,取與GSE62254共有的LncRNA,共計1250個。最終獲得的TCGA+GTEx矩陣有1250行×601列(lncRNA×樣本名),此矩陣將作為建模組用于后續(xù)構(gòu)建預(yù)后模型;GEO矩陣有1250行×300列,此矩陣將作為驗證組用于對模型進行驗證。

        1.3 篩選差異表達lncRNA

        首先通過R軟件中的edgeR包對數(shù)據(jù)進行標準化,并使用sva包的combat函數(shù)對數(shù)據(jù)進行批次校正,之后使用經(jīng)驗貝葉斯估計,計算癌組織和對照組樣本的差異顯著性。通過Benjamini &Hochberg方法對P值進行校正,篩選出差異倍數(shù)(fold change,F(xiàn)C)>4,且校正后的P值(false discovery rate,F(xiàn)DR)<0.01的基因。

        1.4 構(gòu)建預(yù)后模型

        將上述篩選出的lncRNA與TCGA 下載的生存數(shù)據(jù)進行合并,首先采用單因素Cox回歸進行生存分析,篩選出P值<0.05的lncRNA。隨后進行多因素Cox回歸分析,分析方法為向前-向后法,通過赤池信息量準則(Akaike information criterion,AIC),選出AIC值最小,即最優(yōu)化的預(yù)后模型[21-22],并得到模型中各lncRNA的比例系數(shù)β,以此計算風(fēng)險值(risk score),計算公式為:Risk Score=β1X1+β2X2+…+βnXn,其中β表示各lncRNA相關(guān)系數(shù),X表示lncRNA表達量。

        根據(jù)計算出來的各個樣本風(fēng)險值,以中位數(shù)為界把胃癌患者分為高風(fēng)險及低風(fēng)險組,并且用R軟件中的pheatmap包將風(fēng)險值可視化。使用survivalROC包繪制時間依賴性ROC曲線并計算曲線下面積(area under curve,AUC)。

        1.5 統(tǒng)計學(xué)處理

        本研究所使用的數(shù)據(jù)處理統(tǒng)計軟件為R軟件(版本3.4.0)和SPSS(版本19.0),各項分析均為雙側(cè)檢驗,所有統(tǒng)計檢驗結(jié)果的P<0.05被認為具有統(tǒng)計學(xué)意義。通過單因素及多因素Cox回歸分析,篩選與胃癌預(yù)后獨立相關(guān)的危險因素。預(yù)后風(fēng)險值以中位數(shù)(四分位數(shù)間距)[M(IQR)]表示,其與臨床的相關(guān)性分析使用Wilcoxon秩和檢驗進行兩組間比較,多組間比較選用Kruskal-Wallis檢驗。生存分析結(jié)果通過Kaplan-Meier曲線來展示,差異顯著性采用Log-rank法檢驗。

        2 結(jié) 果

        2.1 胃癌lncRNA表達矩陣的建立、差異分析

        合并后的實驗組(TCGA+GTEx)矩陣進行差異分析,共篩選出288個差異表達lncRNA(FDR< 0.01,|Log2FC|>2),其中236個上調(diào)表達,52個下調(diào)表達,繪制火山圖,見圖1。

        圖1 建模組(TCGA+GTEx)矩陣中的差異表達lncRNA(紅色代表上調(diào)lncRNA,綠色代表下調(diào)lncRNA)Figure1 The differentially expressed lncRNAs in modeling cohort (TCGA+GTEx) matrix (the red nodes presenting the up-regulated lncRNAs,and the green nodes indicating down-regulated lncRNAs)

        2.2 預(yù)后模型的構(gòu)建

        首先對上述的lncRNA進一步篩選,使用單因素Cox回歸分析,確定與胃癌患者的總體生存相關(guān)的28個lncRNA(均P<0.05),用于預(yù)后模型的構(gòu)建。通過多因素Cox回歸分析來構(gòu)建模型,當納入的lncRNA個數(shù)為10個時,模型具有最小的AIC值:1 451.36,此時模型的擬合程度最優(yōu)。這10個lncRNA分別是MEG3(P=0.039)、DNAJC9-AS1(P=0.01)、ACTA2-AS1(P=0.122)、C15orf54(P=0.024)、LINC01210(P<0.01)、OVAAL(P=0.078)、POU6F2-AS2(P=0.07)、ERICH3-AS1(P<0.001)、LINC00326(P=0.084)、LINC01526(P=0.078)。最終預(yù)后模型:風(fēng)險值=(MEG3表達值×0.174)+(DNAJC9-AS1表達值×(-0.212))+(ACTA2-AS1表達值×0.112)+(C15orf54表達值×0.140)+(LINC01210表達值×(-0.178))+(OVAAL表達值×0.104)+(POU6F2-AS2表達值×0.076)+(ERICH3-AS1表達值×0.269)+(LINC00326表達值×0.098)+(LINC01526表達值×0.162)。在下文驗證組(GSE62254)中同樣依據(jù)此公式計算風(fēng)險值。

        2.3 預(yù)后模型的風(fēng)險值評估

        根據(jù)公式所計算出預(yù)后風(fēng)險值的中位數(shù),將樣本分為高及低風(fēng)險組,并對結(jié)果進行可視化展示(圖2),同時,繪制高及低風(fēng)險組的Kaplan-Meier曲線,并進行Log-rank檢驗,分析顯示,高風(fēng)險組的總體生存率明顯低于低風(fēng)險組,高及低風(fēng)險組5年總體生存率差異存在統(tǒng)計學(xué)意義[(18.6±6.2)% vs.(57.6±6.4)%,P<0.001](圖3A)。另外,高風(fēng)險組無病生存率明顯低于低風(fēng)險組,高及低風(fēng)險組5年無病生存率差異有統(tǒng)計學(xué)意義[(34.0±8.8)% vs.(61.4±6.6)%,P<0.01](圖3B)。繪制時間依賴性ROC曲線(圖4),結(jié)果顯示,該預(yù)后模型的AUC(0.700)明顯大于性別(0.542)、年齡(0.586)、T分期(0.564)、N分期(0.576)、M分期(0.532)、TNM分期(0.606)、分化程度(0.563)等指標,提示該預(yù)后模型對于評估胃癌患者的預(yù)后有一定準確性。

        圖3 建模組中高及低風(fēng)險組患者Kaplan-Meier 曲線 A:總體生存曲線;B:無病生存率的曲線Figure3 Kaplan-Meier curves for patients in high-risk and low-risk groups of modeling cohort A:Overall survival curves;B:Diseasefree survival curves

        圖4 各種臨床指標以及預(yù)后風(fēng)險值的時間依賴性ROC曲線以及AUC值Figure4 Time-dependent ROC curves and AUC values for various clinical characteristics and risk score

        2.4 篩選影響胃癌生存預(yù)后的獨立危險因素

        通過單因素Cox回歸分析尋找與胃癌患者生存預(yù)后有關(guān)的因素,并繪制森林圖,結(jié)果顯示年齡較高(>60歲)、腫瘤T分期較晚、N分期較晚、TNM分期較晚、風(fēng)險值較高的患者預(yù)后較差(均P<0.05)(圖5A)。隨后進一步將上述陽性指標納入多因素Cox回歸分析,結(jié)果顯示年齡和風(fēng)險值是胃癌患者的獨立危險因素(均P<0.001)(圖5B)。

        2.5 預(yù)后模型與臨床因素的關(guān)系

        分析顯示,預(yù)后風(fēng)險值與胃癌患者的T分期、腫瘤分化程度明顯有關(guān)(均P<0.05),而與性別、年齡、N分期、M分期、TNM分期之間無明顯關(guān)系(均P>0.05)(表1)。

        圖5 各臨床指標以及預(yù)后風(fēng)險值對總體生存時間影響的森林圖 A:單因素Cox回歸分析;B:多因素Cox回歸分析Figure5 Forest plots of the impact of clinical characteristics and risk score on overall survival time A:Univariate Cox regression analysis;B:Multivariate Cox regression analysis

        表1 胃癌的臨床病理特征與風(fēng)險值的關(guān)系Table1 Relations of clinicopathologic features with risk score in gastric cancer

        2.6 預(yù)后模型的驗證

        按照公式計算驗證組(GSE62254)中的風(fēng)險值,并與其臨床資料合并,繪制Kaplan-Meier曲線,分析顯示,高風(fēng)險組的總體生存率明顯低于低風(fēng)險組,高及低風(fēng)險組5年總體生存率存在明顯差異[(45.3±4.0)% vs.(59.2±4.0)%,P<0.01](圖6A)。另外,高風(fēng)險組無病生存率顯著低于低風(fēng)險組,高及低風(fēng)險組5年無病生存率存在明顯差異[(42.2±4.4)% vs.(60.1±4.5)%,P<0.01](圖6B)。隨后進行的單因素(P<0.01)和多因素(P=0.019)Cox回歸分析表明,風(fēng)險值仍為獨立預(yù)后因素。驗證結(jié)果提示,該預(yù)后模型在不同環(huán)境下均具有良好的預(yù)測效能。

        圖6 驗證組(GSE62254)中高及低風(fēng)險組患者Kaplan-Meier 曲線 A:總體生存曲線;B:無病生存曲線Figure6 Kaplan-Meier curves for patients in high-and low-risk groups of the validation cohort (GSE62254) A:Overall survival curves;B:Disease-free survival curves

        3 討 論

        過去,人們一直認為lnc RNA是轉(zhuǎn)錄過程中的廢棄產(chǎn)物。隨著研究的深入,lncRNA已經(jīng)被發(fā)現(xiàn)參與許多基本的生物學(xué)過程,例如調(diào)節(jié)細胞周期、細胞凋亡和DNA損傷修復(fù)[23-24]。為了探索可用于胃癌的預(yù)后風(fēng)險判斷的lncRNA,我們通過挖掘高通量測序數(shù)據(jù),構(gòu)建出能夠用于評估患者生存狀態(tài)的10-lncRNA預(yù)后模型。

        通過使用10-lncRNA預(yù)后模型,可以觀察到高及低風(fēng)險的患者的生存曲線存在著明顯的分離。與高風(fēng)險評分患者相比,低風(fēng)險評分患者的生存時間顯著延長。單因素和多因素Cox回歸分析顯示,10-lncRNA預(yù)后模型與疾病預(yù)后獨立相關(guān)。風(fēng)險值與T分期及腫瘤分化程度有關(guān),而與N分期及M分期無關(guān),提示10-lncRNA預(yù)后模型能夠用于判斷患者預(yù)后的具體機制可能涉及腫瘤的生長及分化,而非遷移及侵襲等生理學(xué)過程。

        關(guān)于這10種lnc RNA的特征,其中5個(DNA J 9-AS1、C15orf54、ERICH3-AS1、LINC00326及LINC01526)迄今為止還沒有相關(guān)的研究報道,筆者首先報道其表達水平與預(yù)后之間關(guān)系的研究。另外5個lncRNA,其中母體表達基因3(maternally expressed gene 3,MEG3)在不同的癌細胞(例如乳腺癌、肝癌、結(jié)直腸癌及胃癌)中通過調(diào)節(jié)主要的抑癌基因P53和Rb來發(fā)揮抗腫瘤的作用[25]。而ACTA2-AS1的一個轉(zhuǎn)錄本的低表達顯著促進了肝癌細胞的增殖、細胞周期進程、遷移和侵襲[26]。在卵巢癌中,LINC01210的較高表達與卵巢癌患者較差的總體生存和無病生存相關(guān)[27]。在大腸癌和黑色素瘤中,OVAAL與絲氨酸/蘇氨酸蛋白激酶3(STK3)的相互作用增強了STK3與RAF-1之間的結(jié)合,最終導(dǎo)致RAF/MEK/ERK通路的激活,從而促進了癌細胞的增殖和存活[28]。最后一個lncRNA,POU6F2-AS2參與了電離輻射后食管癌細胞DNA損傷修復(fù)并調(diào)節(jié)細胞的存活[29],且在結(jié)腸癌中具有促進腫瘤增殖和耐藥的作用[30]。

        目前,對于胃癌患者來說,仍然還未有能夠有效判斷預(yù)后的工具。如本研究所示,使用較少量的lncRNA(10個)便可以預(yù)測胃癌患者的預(yù)后,這為臨床醫(yī)生提供了寶貴而可行的參考。當然本研究還存在局限性,由于高通量測序數(shù)據(jù)具有一定的誤差及背景噪音[31],本研究雖然在分析前已對數(shù)據(jù)進行標準化及批次校正,且通過獨立驗證組初步驗證了模型的穩(wěn)健性,但結(jié)果仍需臨床和基礎(chǔ)實驗來進一步的研究證實。

        總之,本研究構(gòu)建了與胃癌患者生存相關(guān)的10-lncRNA預(yù)后模型,并對模型的預(yù)測效能進行了驗證。未來需要更多細胞、動物功能學(xué)實驗來探索這些lncRNA的作用。

        猜你喜歡
        生存率胃癌樣本
        用樣本估計總體復(fù)習(xí)點撥
        “五年生存率”不等于只能活五年
        人工智能助力卵巢癌生存率預(yù)測
        推動醫(yī)改的“直銷樣本”
        “五年生存率”≠只能活五年
        隨機微分方程的樣本Lyapunov二次型估計
        HER2 表達強度對三陰性乳腺癌無病生存率的影響
        癌癥進展(2016年12期)2016-03-20 13:16:14
        村企共贏的樣本
        P53及Ki67在胃癌中的表達及其臨床意義
        胃癌組織中LKB1和VEGF-C的表達及其意義
        蜜臀一区二区av天堂| 亚洲av无码电影网| 亚洲无码一二专区| 手机免费日韩中文字幕| 精品人妻一区二区三区视频| 中国老熟妇506070| 国产免费又色又爽又黄软件| 亚洲精品国产二区三区在线| 色婷婷亚洲一区二区三区在线| 亚洲人成网站色7799| 国产精品麻豆成人av电影艾秋 | 麻豆高清免费国产一区| 神马不卡一区二区三级| 视频一区二区三区国产| 午夜精品久久久久久久久| 中文字幕久无码免费久久| 精品九九视频| 久久精品国产亚洲av豆腐| 97久久国产亚洲精品超碰热| 国产内射在线激情一区| 国产成人福利在线视频不卡| 在线观看免费不卡网站| 中文字幕无线码免费人妻| 欧美午夜精品久久久久免费视| 亚洲高清在线观看免费视频| 亚洲国产丝袜久久久精品一区二区| 亚洲伊人一本大道中文字幕| 国产小毛片| 亚洲黄色大片在线观看| 无套熟女av呻吟在线观看| a级国产乱理论片在线观看| 日韩毛片久久91| 91九色熟女潮喷露脸合集| 成在线人免费视频| 日韩第四页| 亚洲第一页在线观看视频网站| 永久免费毛片在线播放| 亚洲日韩精品欧美一区二区一| 亚洲美女国产精品久久久久久久久| 加勒比东京热一区二区| 激情内射日本一区二区三区|