亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于生物信息學的結直腸癌樞紐基因與預后相關基因篩選

        2021-11-30 12:58:02李飛秦強強谷戰(zhàn)峰張?zhí)煜?/span>申思周麗張樂莎
        中華結直腸疾病電子雜志 2021年5期
        關鍵詞:樞紐直腸癌通路

        李飛 秦強強 谷戰(zhàn)峰 張?zhí)煜?申思 周麗 張樂莎

        結直腸癌是一種常見消化道惡性腫瘤,2020年全球癌癥統(tǒng)計數(shù)據(jù)[1]顯示結直腸癌新增病例250萬,新增死亡90萬,其發(fā)病率和死亡率居于腫瘤第三位和第二位[1]。近30年來,得益于以全結腸系膜切除術(CME)和靶向治療等為代表的一大批新型治療方法的出現(xiàn),結直腸癌患者5年生存率已有較明顯提高。但目前中國結直腸癌發(fā)病率和死亡率仍呈上升趨勢并有年輕化傾向[2]。現(xiàn)有文獻[3]表明包括遺傳、環(huán)境和營養(yǎng)在內(nèi)的多種因素參與結直腸癌的發(fā)生與發(fā)展,但其具體分子機制仍不清楚。結直腸癌現(xiàn)有的常用檢測方法有結腸鏡、電子計算機斷層掃描(CT)、大腸潛血試驗(FOBT)、糞便免疫學測試(FIT)等。其中最具代表性的結腸鏡檢查雖具較高特異度和靈敏度,但它為侵入性檢查且價格高,檢測前準備也較為苛刻,故患者接受性差。同時結直腸癌常以出血為臨床表現(xiàn),因癥狀無特異性,70%結直腸癌出血患者第一次就診時被誤診為痔出血、息肉出血等。另外,現(xiàn)有以癌胚抗原(CEA)為代表的一類生物標志物特異度和敏感度并不理想[4],部分患者初次診斷即為中晚期,這是導致患者預后不良的一個重要因素。目前臨床上對結直腸癌進行治療和預后評價主要依據(jù)腫瘤TNM分期,該分期系統(tǒng)僅僅包含了腫瘤范圍、區(qū)域淋巴結、遠處轉(zhuǎn)移三個宏觀預測因素且未考慮患者個體特異性[5]。對于具體基因和信號通路研究還不充分,故利用生物信息學篩選高靈敏度和特異度生物標志物用于篩查、診療和預后預測就顯得非常有必要。生物信息學是一門新興學科,它結合生物學、數(shù)學和信息技術,使分析大型且復雜的分子數(shù)據(jù)集成為可能[6],本研究從基因表達綜合數(shù)據(jù)庫(GEO)篩選并下載數(shù)據(jù)集,通過比較腫瘤組織與相鄰部位正常組織樣本的基因表達譜篩選出差異表達基因(DEGs)。利用生物信息學方法分析出樞紐基因并使用GEPIA網(wǎng)站進行在線驗證與預后分析,進而從分子角度探究結直腸癌發(fā)生與發(fā)展機制,為結直腸癌診療、預后預測及靶向藥物研究提供理論依據(jù)。

        材料與方法

        一、基因芯片數(shù)據(jù)集來源

        登錄美國國家生物技術信息中心旗下GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/),并以colorectal cancer為關鍵詞進行檢索,篩選標準為:(1)數(shù)據(jù)集需來源于同一平臺;(2)樣本需包括結直腸癌組織與同一患者正常結直腸組織;(3)樣本總量不小于20;(4)樣本來源于“homo sapines”。共篩選出3套結直腸癌數(shù)據(jù)集(GSE110224、GSE41328、GSE22598),三套數(shù)據(jù)集均基于GPL570平臺且為Affymetrix Human Genome U133 Plus 2.0 Array芯片。數(shù)據(jù)集GSE110224包含17個正常組織樣本與17個結直腸腺癌樣本,數(shù)據(jù)集GSE41328包含10個正常組織樣本與10個結直腸腺癌樣本,數(shù)據(jù)集GSE22598由17個正常組織樣本與17個結直腸癌樣本構成。

        二、數(shù)據(jù)均一化與差異表達基因篩選

        利用R語言4.0.3通過R軟件“affy”包將原始表達數(shù)據(jù)批間差去除,隨后進行背景校正,標準化處理,使用“l(fā)imma”包篩選結直腸癌組織與正常組織差異表達基因,篩選條件:(1)校正后P值<0.05;(2)|log2FC|>1,其中l(wèi)og2FC>1為上調(diào)基因,log2FC<-1為下調(diào)基因。對三組數(shù)據(jù)集中均上調(diào)或者下調(diào)的基因取交集后使用R軟件4.0.3“ggplot2”包繪制火山圖。

        三、差異基因富集與通路分析

        DAVID數(shù)據(jù)庫[7](https://david.ncifcrf.gov)集基因注釋、可視化與綜合發(fā)現(xiàn)為一體,是進行高通量基因功能分析的重要數(shù)據(jù)庫。GO分析常用于功能富集研究,包含生物學過程(biological process,BP)、分子功能(molecular function,MF)和細胞組分(cellular component,CC)3類[7]。京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)包含關于基因組生物途徑和系統(tǒng)功能信息,可對基因功能進行系統(tǒng)分析。本研究使用DAVID數(shù)據(jù)庫通過對差異基因進行注釋并對其編碼蛋白進行GO與KEGG分析,認為P<0.05具有統(tǒng)計學意義。

        四、蛋白質(zhì)相互作用網(wǎng)絡構建與樞紐基因篩選

        STRING數(shù)據(jù)庫(http://string-db.org)涵蓋了多種生物相關蛋白質(zhì)—蛋白質(zhì)關聯(lián)數(shù)據(jù),每個節(jié)點都代表一個基因、蛋白質(zhì)或者分子,其間連線代表相互作用關系,可用于判斷結直腸癌中差異表達基因編碼蛋白質(zhì)間相互作用。本研究將差異基因?qū)隨TRING數(shù)據(jù)庫構建差異表達基因蛋白質(zhì)—蛋白質(zhì)相互作用網(wǎng)絡(PPI),以綜合分數(shù)(combined score)>0.4為篩選條件。所得結果導入Cytoscape v3.7.2軟件進行可視化[7]。具有較高連通度(degree)的節(jié)點往往在對于該網(wǎng)絡的穩(wěn)定有著重要作用,因此使用Cytohubba插件篩選出PPI網(wǎng)絡中連通度排名前10的基因并確定為樞紐基因。

        五、樞紐基因驗證與預后分析

        GEPIA(http://gepia.cancer-pku.cn)數(shù)據(jù)庫是由北京大學研制的在線分析網(wǎng)站,包含來源于TCGA的9 736個腫瘤組織與726個正常組織,以及GTEx數(shù)據(jù)庫8 000余例正常組織數(shù)據(jù)。本研究包含其中300余例結直腸癌數(shù)據(jù)與712例正常組織數(shù)據(jù)[8-9]。通過GEPIA網(wǎng)站以樞紐基因相對表達量中位數(shù)為界值,根據(jù)差異基因mRNA表達量將患者分為高表達與低表達組進行組間比較,驗證所篩選樞紐基因在正常組織與結直腸癌組織中表達差異與患者整體預后情況,認為檢驗值P<0.05為差異具有統(tǒng)計學意義。

        結 果

        一、結直腸癌差異基因表達

        對GSE110224、GSE41328、GSE22598三組數(shù)據(jù)集進行標準化處理,處理結果顯示三個數(shù)據(jù)集各樣本表達量處于同一水平,表明其標準化特征良好。對三組數(shù)據(jù)集使用“l(fā)imma”包篩選結直腸癌組織與正常大腸黏膜組織差異表達基因,共篩選出差異表達基因366個,其中明顯上調(diào)基因128個,明顯下調(diào)基因238個。樣本均一化結果(圖1)與火山圖(圖2)如圖所示。

        圖1 數(shù)據(jù)集均一化處理。1A:GSE41328數(shù)據(jù)集均一化前;1B:GSE22598數(shù)據(jù)集均一化前;1C:GSE110224均一化前;1D:GSE41328數(shù)據(jù)集均一化后;1E:GSE22598數(shù)據(jù)集均一化后;1F:GSE100224數(shù)據(jù)集均一化后

        圖2 差異表達基因火山圖

        二、差異表達基因的GO與KEGG分析

        利用DAVID網(wǎng)站對366個差異表達基因進行GO富集分析與KEGG富集分析。GO分析結果表明差異表達基因主要參與蛋白水解、細胞黏附、細胞增殖的正性調(diào)節(jié)、炎癥反應等生物學過程(圖3A);主要定位于細胞外間隙、胞外區(qū)、蛋白質(zhì)細胞外基質(zhì)等細胞成分(圖3B);主要參與鋅離子結合、鈣離子結合、受體結合等分子功能(圖3C)。此外KEGG分析顯示差異表達基因主要富集于細胞因子受體相互作用、趨化因子信號通路、PI3K-Akt通路等相關信號通路(圖3D)。

        圖3 差異表達基因的GO分析與KEGG分析信號。3A:通路1:生物學過程;3B:通路2:細胞組分;3C:通路3:分子功能;3D:KEGG信號通路富集圖

        三、PPI網(wǎng)絡分析與樞紐基因鑒定

        通過STRING數(shù)據(jù)庫預測差異表達基因間相互作用,并將所得結果導入Cytoscape v3.7.2以構建蛋白質(zhì)—蛋白質(zhì)相互作用網(wǎng)絡,得到一個包含282個節(jié)點和742條邊的PPI網(wǎng)絡。隨后基于軟件中Cytohubba插件篩選出連通度(具有較高聯(lián)通度的節(jié)點意味著對維護整個網(wǎng)絡的穩(wěn)定更加重要)排名前10位樞紐基因,分別為CXCL8、CXCL1、SPP1、 CXCL12、 COL1A1、 SOX9、 MMP3、COL1A2、CD44和CXCL5。除CXCL12下調(diào)外,其余均為上調(diào)(表1)。

        表1 10個樞紐基因

        四、樞紐基因驗證與生存分析

        通過GEPIA(http://gepia.cancer-pku.cn)網(wǎng)站驗證所篩選差異表達基因在正常人與結直腸癌患者中表達量,驗證結果與GEO來源數(shù)據(jù)分析結果相一致。即在腫瘤組織中CXCL8、CXCL1、SPP1、COL1A1、 SOX9、 MMP3、 COL1A2、 CXCL5、CD44表達水平均較正常組織上調(diào),CXCL12在腫瘤組織中較正常組織表達下調(diào)。除COL1A1和COL1A2以外的8個基因差異均具有統(tǒng)計學意義(LogrankP<0.05)(圖4)。通過預后分析得出CXCL8、SPP1和COL1A2對于結直腸癌患者整體生存率、無病生存率均有影響(圖5),提示其表達差異與患者預后相關。綜合以上結果,顯著性差異驗證一致且與結直腸癌預后相關的基因為CXCL8和SPP1。

        圖4 樞紐基因在正常組織與腫瘤組織中的表達情況。T:Tumor,以紅色表示;N:Normal,以灰色表示。COAD: Colon adenocarcinoma, 結 腸 癌 ; READ:Rectum adenocarcinoma,直腸癌

        圖5 預后相關基因與患者生存率的關系

        討 論

        隨著醫(yī)學研究進入大數(shù)據(jù)時代以及多組學技術的發(fā)展,基于表達譜芯片和轉(zhuǎn)錄組測序的生物信息學分析在癌癥發(fā)生發(fā)展機制探究、診斷和分型中應用越來越多[10]。其中不乏應用TCGA和GEO數(shù)據(jù)庫進行分析的研究。GEO數(shù)據(jù)庫為美國基因表達綜合數(shù)據(jù)庫,和癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫都是常用于進行生物信息學分析的數(shù)據(jù)庫,且后者包含較為全面的癌癥基因表達譜、突變基因譜,并配有相關臨床信息,是目前最大的癌癥基因信息數(shù)據(jù)庫[11]。本研究對篩選出的GEO數(shù)據(jù)庫中的三組結直腸癌表達譜基因芯片經(jīng)過批間差去除、背景校正和標準化處理后,利用R軟件對結直腸癌組織與正常組織進行分析篩選,得到366個差異表達基因,包括顯著上調(diào)基因128個,顯著下調(diào)基因238個。對差異基因進行GO富集分析發(fā)現(xiàn),差異基因主要參與的生物學過程有蛋白水解、細胞增殖的正性調(diào)節(jié)、炎癥反應等,差異基因主要定位于細胞外間隙、蛋白質(zhì)細胞外基質(zhì)等細胞成分。分子功能上與增強鋅離子結合、鈣離子結合作用相關。KEGG通路分析顯示差異基因主要參與細胞因子受體相互作用通路、PI3K-Akt信號通路、趨化因子信號通路,表明炎癥反應在結直腸癌中具有重要作用。

        基于PPI網(wǎng)絡篩選出的10個樞紐基因為CXCL8、CXCL1、 SPP1、 COL1A1、 SOX9、 MMP3、COL1A2、CXCL5、CD44,其中COL1A1、COL1A2兩個基因在GEPIA驗證差異表達時不顯示具有統(tǒng)計學意義,可能跟這兩種基因的基礎水平表達量較高有關[10]。CXCL8是CXC家族典型趨化因子,具有負責招募和激活炎癥細胞如中性粒細胞到炎癥部位作用,CXCL8募集N2型TANs(腫瘤相關中性粒細胞),后者分泌的1型精氨酸酶通過抑制T細胞受體表達,減弱抗原特異性T細胞應答和募集T調(diào)節(jié)細胞從而引起免疫抑制,使機體免疫功能降低促進結直腸癌發(fā)生和發(fā)展;另一方面CXCL8也可通過下游胞內(nèi)信號磷脂酰肌醇激酶誘導底物蛋白激酶B磷酸化,從而在調(diào)節(jié)腫瘤細胞存活、血管生成和遷移中發(fā)揮關鍵作用[12]。由此看來CXCL8在結直腸癌發(fā)生中可能為危險性因素,但我們的結果顯示CXCL8在結腸癌患者中高表達,其下調(diào)為預后不良的表現(xiàn),提示為保護性因素。對此我們認為有進一步驗證的必要。另一趨化因子CXCL5可激活CXCR2 中 ERK/Elk-1/Snail途徑和 AKT/GSK3β/βcatenin途徑誘導上皮—間充質(zhì)轉(zhuǎn)化,并通過AKT/GSK3β/β-catenin/MMP7途徑侵入CXCR2,導致腫瘤細胞遷移和侵襲[13]。CD44具有維持結直腸癌干細胞活性的功能,高表達CD44意味著預后不良[14]。COL1A1是Ⅰ型膠原a1,可通過WNT/平面細胞極性(PCP)途徑激活三條通路Rac1-GTP、p-JNK、RhoA-GTP從而發(fā)揮不同作用,其中Rho GTPases和JNK途徑將信號從細胞表面Frizzled和ROR2/RYK共受體傳遞到細胞核是腫瘤細胞轉(zhuǎn)移的重要過程[15],因此,COL1A1可能參與了結直腸癌的轉(zhuǎn)移過程。另一膠原COL1A2為Ⅰ型膠原a2,則通過調(diào)控細胞外基質(zhì)(extracellular matrix,ECM)相關功能參與結直腸癌發(fā)生和轉(zhuǎn)移,ECM是腫瘤微環(huán)境中最主要成分,其中Ⅰ型膠原在ECM中含量豐富,作為Ⅰ型膠原的一種,COL1A2可促進上皮—間充質(zhì)轉(zhuǎn)化從而增強腫瘤細胞對細胞凋亡抵抗,促進腫瘤細胞逃脫衰老過程[16];體外實驗[13]結果也顯示Ⅰ型膠原培養(yǎng)基上生長的結直腸癌細胞可通過誘導Cdx2瞬時轉(zhuǎn)錄下調(diào)導致分化受到抑制,這與COL1A2高表達患者預后不良相關。ECM與結直腸癌生物學行為密切相關,MMP3具有蛋白水解作用,能水解ECM,有利于結直腸癌細胞在降解的基質(zhì)間隙及基底膜缺損處生長,同時其降解產(chǎn)物有化學趨化性并促進血管生成促進結直腸癌的侵襲和轉(zhuǎn)移。失控的細胞增殖是結直腸癌細胞一種顯著的生物學行為,體外研究[17]表明,上調(diào)的長鏈非編碼RNA MALAT1通過下游靶基因miR-145使SOX9抑制作用減弱,導致SOX9表達上調(diào),上調(diào)的SOX9使結直腸癌細胞分裂周期中停滯在G1期細胞比例減少,促進結直腸癌細胞增殖、遷移和侵襲。有報道[18]稱,腸道中慢性炎癥會增加結直腸癌的患病風險,在Rictor特異性缺失的結直腸癌患者中巨噬細胞對mTORC2抑制作用減弱,使骨橋蛋白SPP1分泌,導致炎癥性結直腸癌的發(fā)生。

        隨后的研究中,我們使用GEPIA網(wǎng)站(包含TCGA數(shù)據(jù)庫)對10個樞紐基因進行預后分析,發(fā)現(xiàn)CXCL8的低表達和SPP1、COL1A2的高表達與預后不良相關。關于結直腸癌,Chen等[17]曾應用TCGA和GEO數(shù)據(jù)庫分析得出了207個結直腸癌差異表達基因,其中CXCL家族基因有四個亞型屬于樞紐基因,而Gong等[18]也類似地發(fā)現(xiàn)CXCL家族的四個亞型與結直腸癌的預后相關。這些發(fā)現(xiàn)都與本文結論一致。本文也提出了COL1A兩種亞型作為關鍵基因,其中COL1A2雖然GEPIA驗證差異一致性中未顯示出統(tǒng)計學意義,但與預后顯著相關,在未來的研究中尚需進一步確認。

        本研究為結直腸癌預后模型構建提供新的分子,從而進一步為結直腸癌診療與預后篩選提供理論依據(jù)。本研究也存在不足之處,結果雖經(jīng)過不同網(wǎng)站和已有文獻驗證,但由于缺少具體實驗數(shù)據(jù),部分基因在結直腸癌發(fā)生發(fā)展以及預后等不同階段作用未知,因此本研究中所涉及的分子及其機制仍需進一步分子生物學實驗進行驗證。

        由于目前較多為單基因和針對二代測序進行的分析,廣泛的探索性數(shù)據(jù)非常有限[19],今后的生物信息分析可能會向多基因模塊發(fā)展。諸如加權基因共表達網(wǎng)絡分析(WGCNA),通過對復雜的基因相互作用網(wǎng)絡進行系統(tǒng)生物學方法分析,考慮同時評估所有基因的表達,以揭示共同表達(也可能是共同調(diào)節(jié))的基因集群(模塊)的變化,這樣就可以認為是一種調(diào)控機制發(fā)生了改變而誘導出病因[20]。此外,基因水平分析得出的生物標記物也有一定局限性,由于基因轉(zhuǎn)錄和翻譯水平的變化,使得僅使用基因組生物標記物是不夠的,加之非遺傳性因素的影響,可以考慮使用轉(zhuǎn)錄組分析來定義新的生物標記物對靶向藥物的反應[21],并且多種RNA生物標志物的組合可以提高診斷和預后的敏感度和特異度[22]。

        猜你喜歡
        樞紐直腸癌通路
        樞紐的力量
        淮安的高鐵樞紐夢
        商周刊(2019年18期)2019-10-12 08:50:56
        樞紐經(jīng)濟的“三維構建”
        當代陜西(2018年12期)2018-08-04 05:49:06
        腹腔鏡下直腸癌前側切除術治療直腸癌的效果觀察
        直腸癌術前放療的研究進展
        COXⅠ和COX Ⅲ在結直腸癌組織中的表達及其臨床意義
        Kisspeptin/GPR54信號通路促使性早熟形成的作用觀察
        proBDNF-p75NTR通路抑制C6細胞增殖
        GRP及GRPR在結直腸癌中的表達及意義
        通路快建林翰:對重模式應有再認識
        国产精品乱一区二区三区| 在厨房拨开内裤进入毛片| 精品偷拍被偷拍在线观看| 午夜福利电影| 国产自精品在线| 日本一区二区三区爱爱视频| 亚洲精品国精品久久99热| 国产乱人伦精品一区二区| 午夜不卡亚洲视频| 久久婷婷综合色一区二区| 凹凸国产熟女精品视频app| 女人大荫蒂毛茸茸视频| 国产精品国产午夜免费福利看| 久久精品一区一区二区乱码 | 色老汉亚洲av影院天天精品| 中文字幕一区二区综合| 久久久噜噜噜久久| 日本精品一区二区三区在线视频| 无码AⅤ最新av无码专区| 视频女同久久久一区二区| 国产精品9999久久久久仙踪林| 欧洲-级毛片内射| 久久亚洲精品成人AV无码网址| 婚外情长久的相处之道| 亚洲国产成人久久综合| 99视频这里有精品| av在线手机中文字幕| 久久久国产精品无码免费专区| 97se亚洲精品一区| 国内精品久久久久久久久蜜桃| 精品久久人妻av中文字幕| 中文字幕日韩精品一区二区三区| 欧美亚州乳在线观看| 亚洲第一页综合av免费在线观看| 偷拍一区二区视频播放器| 国产福利酱国产一区二区| 三级全黄的视频在线观看| 顶级高清嫩模一区二区| 亚洲av永久无码精品三区在线 | 国内精品久久久久久久久久影院| 久久久亚洲日本精品一区|