亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        腎透明細胞癌病理分級相關(guān)基因的WGCNA篩選

        2021-08-03 14:12:14宋章興崔應(yīng)東李時軍譚威向圣坎向奎
        現(xiàn)代泌尿生殖腫瘤雜志 2021年1期
        關(guān)鍵詞:數(shù)據(jù)庫分析

        宋章興 崔應(yīng)東 李時軍 譚威 向圣坎 向奎

        腎細胞癌(renal cell carcinoma, RCC)是成人腎腫瘤最常見的惡性腫瘤,占所有成人腎腫瘤的90%以上,大約1/3的RCC患者診斷明確時已經(jīng)有遠處轉(zhuǎn)移,盡管目前的檢測和治療取得了很大的進展,但RCC的總體生存率仍然很低[1]。腎透明細胞癌(clear cell renal cell carcinoma, ccRCC)占RCC的75%~85%,是其最常見的亞型,ccRCC通常對放化療有抵抗性,靶向療法因其靶點特異性和低毒性而被采用,可能成為非手術(shù)治療的最佳選擇[2-3]。目前發(fā)現(xiàn)的可以預測ccRCC治療效果和臨床預后的生物標志物,包括VHL、VEGF、CAIX和HIF1α/2α突變[4]。ccRCC的致癌機制可能涉及多因子、多基因協(xié)同的復雜過程,包括多種致癌基因或腫瘤抑制因子失控等[5]。因此,迫切需要鑒定出可以預測ccRCC患者疾病階段和臨床結(jié)果的新型分子生物標志物,從而有助于了解其發(fā)病機制并提供個性化治療。加權(quán)基因共表達網(wǎng)絡(luò)分析(weighted gene co-expression network analysis, WGCNA)算法可以構(gòu)建自由尺度的基因共表達網(wǎng)絡(luò),以探索不同基因集之間或基因集與臨床特征之間的關(guān)系[6]。本研究中,采用WGCNA分析ccRCC患者臨床特征和基因芯片數(shù)據(jù),構(gòu)建共表達網(wǎng)絡(luò)篩選與ccRCC病理分級相關(guān)的核心基因,以期為ccRCC的診斷和預后提供新的生物標志物或治療靶點。

        對象與方法

        一、基因表達數(shù)據(jù)集

        從基因綜合表達(Gene Expression Omnibus, GEO)數(shù)據(jù)庫下載芯片數(shù)據(jù)集,基于芯片平臺為GPL10558的GSE40435(2013 捷克)作為訓練集進行WGCNA的構(gòu)建,該數(shù)據(jù)集包括101例癌組織及配對的癌旁組織,臨床特征包括年齡、性別、病理分級。芯片基于芯片平臺為GPL570的數(shù)據(jù)集GSE73731(2017 美國)作為測試集,該數(shù)據(jù)集包括265例癌組織,臨床特征包括年齡、病理分期、病理分級?;诎┌Y和腫瘤基因圖譜(The Cancer Genome Atlas, TCGA)數(shù)據(jù)庫可視化分析工具GEPIA中的623例樣本,其中523例ccRCC及100例癌旁組織數(shù)據(jù)作為獨立的第二個測試集[7]。

        二、數(shù)據(jù)整理和基本信息

        本研究中的GEO數(shù)據(jù)集采用R軟件Affy包讀取原始CEL文件,采用RMA算法對數(shù)據(jù)進行背景過濾、歸一化、標準化處理后得到表達矩陣,再進行后續(xù)處理;GSE40435訓練集篩除臨床數(shù)據(jù)中為空值的樣本,同時保證GSE73731測試集病理分級的數(shù)據(jù)無空值。GSE40435訓練集及GSE73731測試集進行標準化等處理,提取相關(guān)重要臨床數(shù)據(jù)。GSE40435訓練集包括101例癌組織及配對的癌旁組織,101例癌組織樣本的臨床信息:年齡為(64.11±9.22)歲,其中男59例、女52例;病理分級為1級22例,2級47例,3級24例,4級8例。GSE73731測試集包括265例癌組織,其中256例癌組織包含完整數(shù)據(jù)的病理分級:1級22例,2級90例,3級95例,4級49例。

        三、統(tǒng)計學分析

        2.差異基因分析:訓練集GSE40435的表達矩陣,通過計算樣本之間的Pearson相關(guān)系數(shù)進行聚類分析,去除離群樣本后,采用R軟件limma包分析ccRCC與癌旁組織獲得差異表達基因(differentially expressed genes, DEGs),篩選條件為校正后的P值,即錯誤發(fā)生率(false discovery rates, FDR)<0.05和對數(shù)化表達倍數(shù)(︱log2FC︱)≥0.585。

        3.WGCNA的構(gòu)建:使用R軟件包WGCNA包,通過一步法構(gòu)建DEGs的加權(quán)基因共表達網(wǎng)絡(luò)。通過計算基因間的Pearson相關(guān)系數(shù)確定最佳的軟閾值β,從而使網(wǎng)絡(luò)更逼近無尺度網(wǎng)絡(luò)。然后通過計算把鄰接矩陣轉(zhuǎn)化為拓撲重疊矩陣(TOM),并計算基因間的相異度dissTOM=1-TOM,進行層次聚類。最后使用動態(tài)剪切的方法合并相似模塊。

        4.核心基因的篩選:模塊與臨床特征關(guān)聯(lián)后,通過計算模塊顯著性(module-significance, MS)確定顯著性模塊,MS值越高,提示該模塊越重要。以顯著性模塊中模塊身份(module membership, MM)>0.8及基因顯著性(gene significance, GS)>0.2為篩選條件篩選基因。構(gòu)建顯著性模塊內(nèi)基因的蛋白互作網(wǎng)絡(luò)(protein-protein interaction, PPI),顯著性模塊內(nèi)的基因?qū)隨TRING數(shù)據(jù)庫構(gòu)建PPI網(wǎng)絡(luò),同時采用Cyctoscape軟件進行可視化,設(shè)置基因間的連接度>10為篩選基因的條件。網(wǎng)格網(wǎng)絡(luò)篩選基因的共有基因最終確定為核心基因。

        四、核心基因的驗證

        使用驗證數(shù)據(jù)集GSE73731的表達矩陣及臨床特征進行線性回歸分析,驗證核心基因的表達水平與ccRCC之間的關(guān)系。使用TCGA可視化分析工具GEPIA中的623例樣本(包含523例ccRCC及100例癌旁組織)數(shù)據(jù)驗證核心基因在ccRCC中的表達水平、病理分期及預后情況。進一步采用人類蛋白質(zhì)表達圖譜,利用免疫組化分析核心基因在正常腎組織和癌組織的蛋白水平。

        五、基因富集分析(gene set enrichment analysis, GSEA)

        以GSEA官網(wǎng)MSigDB數(shù)據(jù)庫中的h.all.v6.2.symbols.gmt [Hallmarks] 數(shù)據(jù)集作為功能基因集,置換次數(shù)為1 000次,設(shè)定P<0.05、FDR<0.25的基因集作為顯著富集基因集,分析核心基因可能相關(guān)的生物學功能。

        結(jié) 果

        一、DEGs的篩選

        GSE40435訓練集通過去離群后發(fā)現(xiàn)GSM994069、GSM994041、GSM993996、GSM994065明顯偏離,踢除離群樣本后,GSE40435訓練集最終納入194例(癌組織97例,癌旁組織97例)樣本進行差異基因分析,見圖1。通過設(shè)置的篩選條件,得到2 546個DEGs,其中1 207個基因上調(diào),1 339個基因下調(diào)。

        圖1 在GSE40435訓練集的去離群

        二、加權(quán)基因共表達網(wǎng)絡(luò)構(gòu)建及顯著性模塊確定

        對GSE40435訓練集中2 546個DEGs進行構(gòu)建共表達網(wǎng)絡(luò)。導入97例癌組織臨床信息,與2 546個DEGs表達譜矩陣進行聚類分析,以用于后續(xù)分析,見圖2A。選擇β=9(R2=0.91)最為軟閾值(圖2B、2C)。確定軟閾值后,采用動態(tài)剪切法,獲得9個模塊,見圖3A。進一步分析各模塊的特征向量基因(module eigengene, ME)及MS,發(fā)現(xiàn)紅色模塊包括86個基因,與ccRCC中的病理分級相關(guān)性最高(R2=0.56),紅色模塊的MS也是最高的,確定為顯著性模塊,見圖3B、3C。

        A:去離群后腫瘤樣本及對應(yīng)臨床特征聚類樹,圖中顏色深淺代表數(shù)字對應(yīng)的臨床信息分類取值大??;B:不同軟閾值對應(yīng)的R2,確定β=9為軟閾值;C:不同軟閾值對應(yīng)的基因鄰接系數(shù)的均值圖2 WGCNA樣本與表型聚類及軟閾值的確定

        A:模塊合并后WGCNA聚類樹;B:基因模塊ME與臨床特征的相關(guān)性,顏色越深表示相關(guān)性越大,相關(guān)系數(shù)為正表示正相關(guān),為負表示負相關(guān);C:各模塊MS分布柱狀圖圖3 WGCNA網(wǎng)絡(luò)構(gòu)建及模塊識別

        三、核心基因的確定

        在紅色模塊中,通過︱MM︱>0.8和︱GS︱>0.2篩選得到17個備選核心基因。同時把該模塊中的86個基因?qū)隨TRING數(shù)據(jù)庫,進行PPI網(wǎng)絡(luò)構(gòu)建,以連接度>10篩選得到14個備選核心基因,取二者的交集獲得TOP2A、PTTG1、PRC1、UHRF1這4個基因為最終的核心基因,見表1。

        表1 篩選關(guān)鍵基因

        四、核心基因的驗證

        使用GSE73731測試集及GEPIA數(shù)據(jù)庫分析各核心基因與ccRCC病理分級及病理分期的關(guān)系,結(jié)果顯示各核心基因與ccRCC病理分級及分期呈正相關(guān),驗證了訓練集的分析,見圖4。使用GEPIA數(shù)據(jù)集中的623例樣本(其中523例ccRCC及100例癌旁組織)數(shù)據(jù)驗證核心基因在ccRCC的表達水平及預后情況,結(jié)果顯示各核心基因在癌組織中表達顯著升高,同時各核心基因高表達則OS及無病生存期(disease free survival, DFS)均較差,見圖5。人類蛋白質(zhì)表達圖譜分析結(jié)果顯示TOP2A與UHRF1在癌組織中呈中強度表達,PTTG1與PRC1在癌組織中呈高強度表達,見圖6。

        A:GSE73731測試集及GEPIA數(shù)據(jù)庫分析核心基因與ccRCC病理分級的關(guān)系;B:GEPIA數(shù)據(jù)庫分析核心基因與ccRCC分期的表達水平及預后情況圖4 核心基因與ccRCC病理分級及分期的關(guān)系

        A:GEPIA數(shù)據(jù)庫分析核心基因在ccRCC的表達水平;B:GEPIA數(shù)據(jù)庫分析核心基因在ccRCC的OS;C:GEPIA數(shù)據(jù)庫分析核心基因在ccRCC的DFS圖5 GEPIA數(shù)據(jù)集驗證核心基因在ccRCC的表達水平及預后情況

        圖6 人類蛋白質(zhì)表達圖譜分析各核心基因在腎組織和癌組織中的蛋白水平

        五、核心基因的GSEA分析

        核心基因以GSEA官網(wǎng)MSigDB數(shù)據(jù)庫中的h.all.v6.2.symbols.gmt [Hallmarks] 數(shù)據(jù)集進行分析,結(jié)果提示,核心基因主要富集了E2F、有絲分裂紡錘體信號通路及G2M檢查點等生物學過程,提示核心基因可能通過以上生物學過程促進腫瘤細胞增殖,影響患者臨床及預后,見表2。

        表2 核心基因的GSEA分析

        討 論

        ccRCC預后差,給患者帶來巨大的負擔。在精確的醫(yī)學時代,迫切需要更好的生物標志物用于癌癥的預后和進展,從而可以提高患者早期診斷及治療的決策能力。WGCNA已被廣泛應(yīng)用于尋找與不同癌癥類型的臨床特征相關(guān)的核心基因[8-9]。 WGCNA相較于單獨的差異基因分析,可以對基因之間的高度互連網(wǎng)絡(luò)進行整體分析,同時識別基因或模塊簇與樣本外部特征之間的關(guān)系[10]。因此在本研究中,我們使用了該方法進行綜合分析來篩選ccRCC進展和預后相關(guān)的生物標志物。

        本研究利用WGCNA識別出紅色模塊(包括86個基因)與ccRCC的病理分級相關(guān)性最高(R2=0.56),確定紅色模塊為顯著性模塊,進一步結(jié)合PPI網(wǎng)絡(luò),挖掘出TOP2A、PTTG1、PRC1、UHRF1這4個核心基因。GSE73731測試集及GEPIA數(shù)據(jù)庫驗證了核心基因與ccRCC的病理分級及分期呈正相關(guān)。GEPIA數(shù)據(jù)庫驗證了核心基因在ccRCC中高表達,同時初步探討了核心基因?qū)cRCC預后的影響,發(fā)現(xiàn)高表達核心基因組的ccRCC預后差。TOP2A稱作DNA拓撲異構(gòu)酶Ⅱα,該基因編碼為DNA拓撲異構(gòu)酶,是一種在轉(zhuǎn)錄過程中控制和改變DNA拓撲狀態(tài)的酶。這種核酶參與了諸如染色體濃縮、染色單體分離和DNA轉(zhuǎn)錄和復制過程。Liu等[11]報道MDM4和TOP2A相互結(jié)合,并在翻譯后水平相互上調(diào),導致TOP2A蛋白穩(wěn)定,抑制p53,促進腫瘤細胞增殖,結(jié)果揭示了MDM4和TOP2A的新功能以及它們在腫瘤發(fā)生中的相互作用,提示抑制MDM4-TOP2A的相互作用可能是一種同時特異性地針對TOP2A和MDM4癌癥治療的新策略。Zhang等[12]研究發(fā)現(xiàn)LncRNA SNHG3通過上調(diào)TOP2A促進ccRCC的增殖和遷移,初步表明了TOP2A在ccRCC中可能的作用。PTTG1稱作垂體腫瘤轉(zhuǎn)化基因1,該基因編碼的蛋白是酵母securin蛋白的同源物,可阻止separins促進姐妹染色單體分離,作為一種細胞周期后期促進復合物(APC)底物,可與separin結(jié)合直至激活APC。PTTG1產(chǎn)物具有體外轉(zhuǎn)化活性和體內(nèi)致瘤活性,并且該基因在各種腫瘤中高表達[13]。Wei等[14]通過轉(zhuǎn)移組及非轉(zhuǎn)移組ccRCC的差異基因分析,發(fā)現(xiàn)PTTG1在ccRCC組織中表達上調(diào),且與預后相關(guān)。Hu等[15]報道MicroRNA-329介導的PTTG1下調(diào)使絲裂原激活蛋白激酶(MAPK)信號通路失活,抑制了膽管癌細胞的增殖和腫瘤生長,為膽管細胞癌的靶向治療提供依據(jù)。PRC1稱作細胞分裂蛋白調(diào)節(jié)劑1,該基因編碼參與胞質(zhì)分裂的蛋白質(zhì),在有絲分裂的S和G2/ M階段以高水平存在,但是當細胞退出有絲分裂并進入G1階段時,其水平急劇下降。Liao等[16]報道,PRC1基因沉默可能通過抑制Wnt/β-catenin途徑使細胞增殖和侵襲能力降低,G0/G1期延長,S期和G2/M期縮短,從而抑制視網(wǎng)膜母細胞瘤細胞的增殖和血管生成。Wu等[17]發(fā)現(xiàn)PRC1通過P53/PRC1/EGFR信號通路調(diào)控口腔鱗癌細胞增殖和細胞周期參與口腔鱗癌的發(fā)生、發(fā)展,為口腔鱗癌的靶向治療提供了依據(jù)。UHRF1稱作靶向泛素樣含PHD和環(huán)指域1,該基因編碼環(huán)指域E3型泛素連接酶亞家族的成員,與特定的DNA序列結(jié)合,并招募組蛋白去乙酰化酶來調(diào)節(jié)基因表達,在調(diào)控細胞周期及p53 依賴性 DNA 損傷檢查點中發(fā)揮作用。Lu等[18]研究提示UHRF1通過誘導細胞增殖促進黑色素瘤的進展,并與黑色素瘤患者的不良預后相關(guān)。Ma等[19]發(fā)現(xiàn)UHRF1調(diào)控ccRCC p53泛素化和p53依賴性細胞凋亡,促進ccRCC的進展。以上相關(guān)研究支持挖掘的4個核心基因可能在ccRCC進展及預后中的作用,TOP2A、PTTG1、UHRF1在ccRCC的相關(guān)研究主要也是基于生物信息學分析,表明對ccRCC的進展存在重要作用,但具體的機制仍不十分明了,PRC1對ccRCC的作用尚未見報道。本研究進一步對這4個核心基因進行人類蛋白質(zhì)表達圖譜分析,提示TOP2A、PTTG1、PRC1、UHRF1在癌組織的蛋白水平較腎組織高表達,同時GSEA分析其機制可能通過E2F、有絲分裂紡錘體信號通路及G2M檢查點參與ccRCC的生物學過程。

        本研究通過WGCNA及PPI網(wǎng)絡(luò)的方法識別并驗證與ccRCC進展和預后相關(guān)的4個核心基因(TOP2A、PTTG1、PRC1、UHRF1),其可能作為ccRCC的候選生物標志物。

        猜你喜歡
        數(shù)據(jù)庫分析
        隱蔽失效適航要求符合性驗證分析
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        數(shù)據(jù)庫
        財經(jīng)(2017年15期)2017-07-03 22:40:49
        數(shù)據(jù)庫
        財經(jīng)(2017年2期)2017-03-10 14:35:35
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        數(shù)據(jù)庫
        財經(jīng)(2016年15期)2016-06-03 07:38:02
        數(shù)據(jù)庫
        財經(jīng)(2016年3期)2016-03-07 07:44:46
        數(shù)據(jù)庫
        財經(jīng)(2016年6期)2016-02-24 07:41:51
        中西醫(yī)結(jié)合治療抑郁癥100例分析
        在線教育與MOOC的比較分析
        亚洲精品久久久av无码专区| 青青草免费在线视频导航| 日日噜噜噜夜夜狠狠久久蜜桃| 欧美牲交a欧美牲交| 国产高清一区二区三区视频| 手机看片福利盒子久久青| 日本熟女人妻一区二区三区| 亚洲第一幕一区二区三区在线观看| 香港三日本三级少妇三级视频| 国产精品99久久免费| 亚洲va中文字幕欧美不卡| 亚州中文热码在线视频| 影视av久久久噜噜噜噜噜三级| 国产真人无遮挡作爱免费视频 | 91九色成人蝌蚪首页| 啦啦啦www播放日本观看| 综合精品欧美日韩国产在线| 一区二区免费国产a在亚洲| 国产精品一区二区三区在线免费| 国产无遮挡又黄又爽在线观看 | 国产激情自拍在线视频| 中文字幕乱码一区av久久不卡| 色婷婷精品| 亚洲蜜桃视频在线观看| 国产亚洲超级97免费视频| 久久久久久亚洲精品中文字幕| 无码天堂亚洲国产av麻豆| 日本一区二区三区激视频| 欧美丰满熟妇xxxx性ppx人交| 黄色视频在线免费观看| 国产精品不卡无码AV在线播放| 亚洲中文字幕高清av| 国模无码一区二区三区不卡| 成人精品一级毛片| 精品黄色一区二区三区| 久久国产成人精品av| 又粗又大又黄又爽的免费视频| 精品国产日韩无 影视| 在线播放草猛免费视频| 亚洲人成影院在线观看| 国产在线精品福利大全|