王鵬宇, 胡圣晨, 陳浙南, 王 彥, 姜 瑩
(1.牡丹江醫(yī)學(xué)院,黑龍江省牡丹江市157000;2.南華大學(xué)附屬第一醫(yī)院,湖南省衡陽市421000)
結(jié)直腸癌(colorectal cancer,CRC)是最常見的惡性腫瘤之一[1]。目前治療方式仍以手術(shù)及放化療為主,靶向治療逐漸進入臨床并取得一定療效,但易出現(xiàn)耐藥現(xiàn)象,晚期CRC患者預(yù)后仍未得到明顯改善。因此尋找新的診斷及治療靶點尤為重要。對CRC相關(guān)基因的研究有利于對關(guān)鍵基因進行鑒定或找到新的靶點,以提高CRC的篩查效率、改善晚期CRC患者的預(yù)后。
TRIM(tripatite motif)蛋白家族是參與泛素化過程的E3連接酶,介導(dǎo)泛素從E2結(jié)合酶到特定靶點上的轉(zhuǎn)移[2]。TRIM44蛋白作為家族成員與細胞增殖、DNA修復(fù)、信號轉(zhuǎn)導(dǎo)以及轉(zhuǎn)錄等各種生理學(xué)過程密切相關(guān)[3]。最初研究發(fā)現(xiàn)TRIM44可能在神經(jīng)元細胞的分化和成熟過程中起作用,調(diào)節(jié)TRIM17的活動,是PAX6表達的負調(diào)控因子[4]。目前研究指出TRIM44蛋白在多種腫瘤的發(fā)病過程中起著重要作用,可通過Wnt/β-catenin[5]、Akt/p21/p27[6]、mTOR[7-10]、NF-κB[11-12]等信號通路在甲狀腺癌、神經(jīng)膠質(zhì)細胞癌、肺癌、肝癌等多種癌癥中發(fā)揮作用,使得TRIM44在腫瘤中的研究逐漸得到重視。
本研究對多個數(shù)據(jù)庫進行挖掘,旨在闡明TRIM44在CRC中的表達及意義,為進一步實驗研究奠定理論基礎(chǔ)。
結(jié)直腸癌的原始數(shù)據(jù)從TCGA(https://portal.gdc.cancer.gov/)數(shù)據(jù)庫下載,檢索條件如下:文件數(shù)據(jù)類型:轉(zhuǎn)錄組分析;數(shù)據(jù)類型:基因表達定量;工作流程類型:HTSeq-FPKM;樣本主要位點:Colon;方案:TCGA-COAD TCGA-READ(TCGA Project)。
免疫浸潤的原始數(shù)據(jù)來源于GEO數(shù)據(jù)庫大腸癌基因表達譜研究(GSE113513)中的基于Affymetrix人類基因表達陣列平臺(GPL15207)的28個組織芯片。
利用Active Perl(5.28.1Build 2801)編寫的腳本將count數(shù)據(jù)(正常樣本量32、腫瘤樣本量375)與人類基因組注釋文件(gtf)進行合并生成單基因樣本的mRNA表達矩陣,然后利用R for Windows 4.0.3編寫的腳本進行結(jié)腸癌(COAD)與直腸癌(READ)的散點差異分析以及配對差異分析。
通過GEPIA數(shù)據(jù)庫中基于TCGA和GTEx的8 587個正常組織樣本,9 736個腫瘤組織樣本的RNA測序表達數(shù)據(jù),分析TRIM44在31種腫瘤中的差異表達。隨后,通過Oncomine數(shù)據(jù)庫顯示CRC臨床標(biāo)本中過度表達或DNA拷貝數(shù)量較多的基因,設(shè)置基因TRIM44[P=all,倍數(shù)變化=1.5,閾值(按基因排序)=all,數(shù)據(jù)類型=all],篩選出CRC數(shù)據(jù),并設(shè)置分析類型為癌-常分析、數(shù)據(jù)類型為mRNA,再加入限制條件生存狀態(tài),得到來自12個數(shù)據(jù)庫的675個正常樣本與53例腫瘤樣本,對其在不同腫瘤組織中的差異表達情況進行排序。
利用Oncolnc交互式探索生存相關(guān)性并下載與mRNA表達數(shù)據(jù)耦合的臨床數(shù)據(jù)。以P<0.05判定差異有顯著性,進行Kaplan-Meier分析并創(chuàng)建生存圖。
基于LinkedOmics數(shù)據(jù)庫中來自32種TCGA癌癥類型的數(shù)據(jù)與臨床蛋白質(zhì)組學(xué)腫瘤分析協(xié)會(CPTAC)生成的基于質(zhì)譜的蛋白質(zhì)組學(xué)數(shù)據(jù)。查看TRIM44在CRC中的基因共表達情況,選擇癌癥隊列為COADREAD,設(shè)置搜索數(shù)據(jù)庫與目標(biāo)數(shù)據(jù)均為樣本隊列TCGA_COADREAD(樣本隊列:TCGA_COADREAD,研究機構(gòu):UNC,數(shù)據(jù)類型:RNAseq,平臺:HiSeq RNA,數(shù)據(jù)日期:01/28/2016,研究機構(gòu):BI,分析層面:Gene),進行Spearman相關(guān)性檢驗。
導(dǎo)出LinkedOmics數(shù)據(jù)庫中上述共表達數(shù)據(jù),分別篩選與TRIM44正相關(guān)或負相關(guān)的前50個基因,導(dǎo)入David進行GO功能分析與KEGG通路富集分析,篩選最具代表性的前5個通路依次制表。
使用TIMER網(wǎng)絡(luò)分析工具,設(shè)置檢索基因TRIM44,限制癌癥類型為COAD與READ,探究TRIM44在CRC中B細胞、CD8+T細胞、CD+T細胞、巨噬細胞、中性粒細胞與樹突狀細胞的免疫浸潤情況,以P<0.05判定差異有顯著性。
利用GEO芯片數(shù)據(jù)庫篩選符合研究條件的樣本,并下載來自GSE113513的矩陣數(shù)據(jù)與平臺文件GPL15207。利用perl進行ID轉(zhuǎn)換分類排序,利用Rlimma包將數(shù)據(jù)正?;?,運行CIBERSORT輸出結(jié)果并利用perl對其進行過濾(以P<0.05為標(biāo)準(zhǔn)篩選)。然后使用R pheatmap、corrplot、vioplot包與一些自定義函數(shù)進行結(jié)果的可視化與再分析,并在GEPIA查看免疫細胞相關(guān)基因與TRIM44的共表達情況。
通過R軟件4.0.3版進行分析。除非另有說明,默認P<0.05具有統(tǒng)計學(xué)意義。
通過GEPIA數(shù)據(jù)庫分析TRIM44在31項腫瘤中的表達水平,獲得所有腫瘤樣品和正常組織配對的基因表達譜,單基因分析結(jié)果顯示,TRIM44在腫瘤表達的差異性較大,其中在CRC組織中呈現(xiàn)高表達(圖1A),COAD組織較正常組織TRIM44表達高出約20%,READ組織較正常組織TRIM44表達高出約26%。隨后,通過Oncomine分析TRIM44在腫瘤中的表達情況,從癌-常對比中,可看出TRIM44在CRC中的表達較正常組織較高,并在癌-癌對比中和癌癥組織學(xué)與多癌癥對比中顯示出明顯差異(圖1B)。對TCGA數(shù)據(jù)庫提取的數(shù)據(jù)進行R語言分析,結(jié)果顯示TRIM44在COAD的腫瘤組織與正常組織表達有明顯差異(P<0.001),配對差異分析顯示,COAD組織中TRIM44高表達(P<0.05)(圖1C)。READ樣本量少,癌-常差異表達(P=0.561)和配對差異分析(P=0.333)均無統(tǒng)計學(xué)意義(圖1D)。
圖1 TRIM44的差異表達情況A為GEPIA數(shù)據(jù)庫;B為Oncomine數(shù)據(jù)庫;C和D為TCGA數(shù)據(jù)庫。
通過使用Oncolnc工具分析TRIM44 mRNA表達與CRC患者預(yù)后的關(guān)系,從TRIM44 Cox回歸結(jié)果發(fā)現(xiàn),22例(5%)COAD腫瘤組織低表達與22例(5%)COAD組織高表達患者預(yù)后差異有顯著性(P<0.05)(圖2)。23例(15%)READ腫瘤組織低表達與23例(15%)READ腫瘤組織高表達患者預(yù)后差異有顯著性(P<0.05)(圖2)。TRIM44 mRNA高表達COAD患者其總體生存率要低于低表達COAD患者,而TRIM44 mRNA高表達READ患者其總體生存率要高于低表達READ患者。
基因的共表達反映了構(gòu)成功能關(guān)系的常見遺傳風(fēng)險因素,因此本文研究了在結(jié)腸中TRIM44與其他基因表達的共存情況。利用LinkedOmics在CRC中檢查了其他基因與TRIM44的共表達情況(圖3A)。Spearman相關(guān)系數(shù)檢驗結(jié)果顯示,19 828個基因條目中,ASXL2、TAOK1、REST、KIAA0754、FAM168A、TGFBRAP1、PARD3B、RAD54L2、STRN等基因與TRIM44表達呈正相關(guān),MRPL55、KRTCAP2、C9orf142、BLOC1S1、PSMG3、CHCHD1、FAM128B、NDUFC1、WIBG等基因與TRIM44表達呈負相關(guān)(圖3B)。
圖2 TRIM44表達與COAD和READ患者生存預(yù)后的相關(guān)性分析
圖3 TRIM44共表達基因的相關(guān)性分析A為TRIM44共表達基因差異分析;B為TRIM44共表達正相關(guān)和負相關(guān)基因。
選取與TRIM44正相關(guān)或負相關(guān)的前50個基因進行GO分析,結(jié)果如表1所示,TRIM44相關(guān)基因主要富集于以DNA為模板的轉(zhuǎn)錄調(diào)控、RNA聚合酶Ⅱ啟動子的轉(zhuǎn)錄、蛋白磷酸化、絲氨酸/蘇氨酸的活性等通路。KEGG通路富集分析顯示,TRIM44可能參與調(diào)節(jié)干細胞多能性信號通路并與病毒的致癌作用相關(guān)。
表1 GO功能和KEGG通路分析
從TIMER數(shù)據(jù)庫分析TRIM44表達是否與腫瘤免疫浸潤水平相關(guān)。圖4結(jié)果顯示,TRIM44表達在COAD中與腫瘤純度無顯著相關(guān)性(P=0.489),與CD8+T細胞(P<0.001)、CD4+T細胞(P<0.001)、巨噬細胞(P<0.001)、中性粒細胞(P<0.001)和樹突狀細胞(P<0.001)的浸潤水平顯著相關(guān),與B細胞(P<0.05)浸潤水平相關(guān)。TRIM44表達在READ中與腫瘤純度無顯著相關(guān)性(P=0.306),與CD8+T細胞(P<0.001)、巨噬細胞(P<0.05)、中性粒細胞(P<0.001)和樹突狀細胞(P<0.001)的浸潤水平顯著相關(guān),與B細胞(P<0.05)浸潤水平相關(guān)。
圖4 基于TIMER數(shù)據(jù)庫的免疫浸潤分析結(jié)果
GSE113513芯片樣本中免疫細胞比例顯示出單核細胞、M0細胞浸潤較多(圖5A),結(jié)直腸癌及正常組織樣本中免疫細胞分布多集中在肥大細胞、M0細胞和M2細胞(圖5B)。結(jié)直腸癌組織樣本免疫細胞矩陣顯示M0與M2細胞之間相關(guān)性較高(圖5C)。
圖5 GSE113513芯片樣本中免疫組化分析結(jié)果A為GSE113513芯片樣本中免疫細胞比例;B為結(jié)直腸癌及正常樣本中免疫細胞分布;C為結(jié)直腸癌組織樣本免疫細胞相關(guān)性。
小提琴圖顯示M0細胞(P<0.05)與M2細胞(P<0.05)在CRC組織中差異有顯著性(圖6A)。GEPIA數(shù)據(jù)庫中TRIM44與M0相關(guān)基因CCL2(P<0.001)、CD68(P<0.001)、IL-10(P<0.001)以及M2相關(guān)基因CD163(P<0.001)、VSIG4(P<0.001)、MS4A4A(P<0.001)顯著相關(guān)(圖6B)。
圖6 GSE113513芯片樣本中免疫組化分析結(jié)果A為結(jié)直腸癌及正常組織中免疫細胞差異分析,其中藍色為正常組織,紅色為結(jié)直腸癌;B為TRIM44與M0相關(guān)基因(CCL2、CD68、IL-10)以及M2相關(guān)基因(CD163、VSIG4、MS4A4A)的相關(guān)性分析。
隨著生活水平的改善,居民飲食比例出現(xiàn)了很大改變,動物蛋白及脂肪攝入的增加使得結(jié)直腸癌的發(fā)病率和死亡率逐漸上升。2020年,CRC死亡人數(shù)估計約5.3萬,其中50歲以下約3 640人,占7%[13]。近年來,新確診患者年齡年輕化,超過50%患者可歸因于可改變風(fēng)險因素,通過篩查和監(jiān)測來進一步預(yù)防,并且在年輕患者中進行更加及時的診斷,尤為重要。目前,篩查CRC最有效的手段包括高靈敏度糞便檢測或電子結(jié)直腸鏡檢查,但是目前受限于檢測條件與患者依從性,篩查效率與可行性不高,迫切需要尋找新的篩查與判斷預(yù)后的基因靶點。目前研究表明TRIM44在多腫瘤中有較高表達,主要通過Akt/mTOR信號通路發(fā)揮作用[8]。REN等[14]研究表明ELFN1-AS1通過調(diào)節(jié)miR-4644/TRIM44軸促進CRC的增殖、遷移,可作為CRC的預(yù)后指標(biāo)。Sun等[15]認為LINC00265通過調(diào)節(jié)miR-216b-5p/TRIM44軸促進大腸癌的糖酵解和乳酸生成。TRIM44在CRC中相關(guān)機制漸呈體系,并已有學(xué)者利用靶向TRIM44來抑制上皮-間質(zhì)轉(zhuǎn)化減弱膠質(zhì)母細胞瘤的增殖和轉(zhuǎn)移[16]。因此通過多數(shù)據(jù)庫宏觀查看TRIM44在CRC中的表達可找到相關(guān)機制共性,也可進一步證實相關(guān)結(jié)果的準(zhǔn)確性。
不同于既往體外培養(yǎng)和流式細胞術(shù)等技術(shù)分析腫瘤的模式,多數(shù)據(jù)庫的挖掘分析利于規(guī)避小樣本量與地理環(huán)境等差異導(dǎo)致的不可控變量的影響,可作為臨床實驗的前瞻研究與重要補充。本研究首先分析TCGA數(shù)據(jù)庫中CRC,探究其癌-常差異表達,并利用GEPIA、Oncomine數(shù)據(jù)查看TRIM44在CRC中的表達情況,發(fā)現(xiàn)TRIM44在CRC中高表達。TCGA數(shù)據(jù)分析中,READ由于入選TCGA數(shù)據(jù)中正常組織樣本較少,計算統(tǒng)計檢驗量時偏倚較大,著重關(guān)注COAD與READ混合樣本產(chǎn)生的結(jié)果利于彌補樣本量少的問題。Oncolnc結(jié)果顯示,CRC患者中TRIM44表達與預(yù)后相關(guān)。通過挖掘LinkedOmics數(shù)據(jù)庫得到CRC中19 828個基因與TRIM44的Spearman相關(guān)系數(shù),對正相關(guān)前50個基因與負相關(guān)前50個基因進行了GO與KEGG通路富集分析,發(fā)現(xiàn)TRIM44相關(guān)基因主要富集于以DNA為模板的轉(zhuǎn)錄調(diào)控、RNA聚合酶Ⅱ啟動子的轉(zhuǎn)錄、蛋白磷酸化、絲氨酸/蘇氨酸的活性等通路,顯示出TRIM44可能參與調(diào)節(jié)干細胞多能性的信號通路,并與病毒的致癌作用密切相關(guān)。TIMER數(shù)據(jù)庫分析結(jié)果顯示,TRIM44在CRC中與巨噬細胞顯著相關(guān)。GEO芯片結(jié)果顯示M0和M2細胞可能參與CRC細胞的增殖,利用GEPIA探究M0和M2基因與TRIM44的相關(guān)性,發(fā)現(xiàn)TRIM44與巨噬細胞在CRC中顯著相關(guān)。以往體外實驗表明,腫瘤相關(guān)免疫細胞分泌的炎性因子如CCL2、IL-1α等和極化后的M2型巨噬細胞分泌的細胞因子,可促進CRC細胞增殖和腫瘤生長[17]。因為GO分析中TRIM44還在轉(zhuǎn)錄調(diào)控、蛋白質(zhì)加工等方面發(fā)揮作用,推測TRIM44通過調(diào)控CRC細胞中某成分的表達或作用,募集巨噬細胞進入腫瘤免疫微環(huán)境激活CCL2基因進而促CRC腫瘤細胞增殖。
本研究通過生物信息學(xué)方法分析發(fā)現(xiàn),TRIM44高表達于結(jié)直腸癌組織,可作用于M0和M2巨噬細胞,影響轉(zhuǎn)錄調(diào)控、蛋白磷酸化及絲氨酸/蘇氨酸代謝活性,對結(jié)直腸癌的發(fā)病進行調(diào)控,且與患者預(yù)后相關(guān),有望成為結(jié)直腸癌早期診斷與臨床治療的診斷標(biāo)志物與治療靶點,為接下來的實驗研究提供理論基礎(chǔ),但本研究基于生物信息學(xué)分析,有關(guān)結(jié)論仍需通過大樣本臨床研究加以驗證。