姚健楠 高天博 段 凌 劉 健 蔣玉良 安廣宇 葛 洋*
(1.首都醫(yī)科大學附屬北京朝陽醫(yī)院腫瘤科,北京100020; 2.首都醫(yī)科大學附屬北京朝陽醫(yī)院醫(yī)學研究中心,北京 100020)
結(jié)直腸癌是全球第3位常見的惡性腫瘤,在腫瘤相關(guān)死亡病因中位于第3位[1]。雖然近年來在結(jié)直腸癌預防、早期篩查和治療方面取得了一定進展,但對于病因和發(fā)病機制仍然知之甚少[2-3]。多項研究[4-6]顯示異常O-型糖基化與結(jié)直腸癌有關(guān)。筆者前期研究[7-9]表明:結(jié)直腸癌中異常O-型糖基化的發(fā)生促進腫瘤形成并調(diào)節(jié)惡性表型,所合成的截短的O-聚糖-Tn抗原,可通過激活上皮-間質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition, EMT)促進結(jié)直腸癌的轉(zhuǎn)移[9]。前期一系列細胞表型及動物模型實驗均證實異常O-型糖基化促進結(jié)腸癌發(fā)生發(fā)展,而修復異常O-型糖基化可明顯降低惡性生物學行為能力[7-9]。O-型糖基化是一種常見且重要的翻譯后修飾[10-11]。O-聚糖可通過調(diào)節(jié)蛋白質(zhì)的結(jié)構(gòu)、穩(wěn)定性及功能在許多生理和病理過程中發(fā)揮不同的作用[11-14]。黏蛋白型O聚糖是O-型糖蛋白的主要亞群,在消化道黏膜上皮中起屏障作用[13, 15-17],研究[18-19]證實,Core 1型O-聚糖表達缺失會導致小鼠自發(fā)性結(jié)腸炎相關(guān)腫瘤發(fā)生。異常O-型糖基化表達Tn抗原而非正常合成的T抗原,因此Tn抗原表達是異常O-型糖基化的標志[20]。正常O-型糖基化必需T合酶催化及其特異性分子伴侶Cosmc[14, 20-21],因此T合酶或Cosmc的分子突變、功能異常均會導致O-型糖基化異常并阻礙O-型糖蛋白合成[22]。在結(jié)直腸癌中,許多基因mRNA表達有著預測預后及療效的重要價值[23-25],然而應用現(xiàn)有轉(zhuǎn)錄組學數(shù)據(jù)庫卻無法得到由O-型糖基化直接調(diào)控的基因和通路。
本研究選用人結(jié)腸癌LS174T Tn(+)細胞系作為親本細胞,該細胞T-合酶的分子伴侶Cosmc基因突變導致了異常O-型糖基化發(fā)生,以Tn抗原陽性表達為分子標志。此前筆者已通過Cosmc質(zhì)粒轉(zhuǎn)染技術(shù)構(gòu)建了Cosmc穩(wěn)定轉(zhuǎn)染細胞系LS174T Tn(+)+wtCosmc,恢復了Cosmc正常表達,原本異常受阻的O-型糖基化過程得到糾正,Tn抗原不表達。與此同時作為對照組,穩(wěn)定轉(zhuǎn)染空白質(zhì)粒的細胞系LS174T Tn(+)+Con的Tn抗原仍表達[8]。為探索O-型糖基化這一經(jīng)典的翻譯后修飾過程能否調(diào)控相關(guān)基因表達,本研究應用Agilent mRNA表達譜基因芯片技術(shù),檢測了LS174T Tn(+)+wtCosmc細胞和LS174T Tn(+)+Con細胞基因表達譜。數(shù)據(jù)經(jīng)質(zhì)檢及標準化后,針對差異性表達基因(differentially expressed genes,DEGs)進行非監(jiān)督層次聚類、基因本體(gene ontology,GO)分析和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集,使之定位在相關(guān)生物學過程和細胞通路上,并通過蛋白網(wǎng)絡數(shù)據(jù)庫分析其相互作用,探討結(jié)直腸癌進展的分子機制并提供新的治療靶點。
人結(jié)直腸癌細胞系LS174T(Tn陽性)由Emory大學Tongzhong Ju教授(美國亞特蘭大)贈予。以DEME完全培養(yǎng)基[10%(體積分數(shù))FBS和1%(質(zhì)量分數(shù))青鏈霉素]在37 ℃、5%(體積分數(shù)) CO2培養(yǎng)箱中進行培養(yǎng)。以人野生型Cosmc基因表達載體(GV367-EGFP-Cosmc,上海吉凱公司)穩(wěn)定轉(zhuǎn)染LS174 Tn陽性細胞作為實驗組[LS174T Tn(+)+wtCosmc],同時用空白載體(GV367-EGFP-Mock,上海吉凱公司)穩(wěn)定轉(zhuǎn)染細胞作為對照組[LS174T Tn(+)+Con]。
基因芯片檢測及數(shù)據(jù)分析流程如圖1。
圖1 基因芯片檢測及數(shù)據(jù)分析流程圖
使用TRIzol(Invitrogen公司,美國)提取細胞總RNA,用NanoDrop ND-2000(Thermo Scientific公司,美國)定量,經(jīng)Agilent Bioanalyzer 2100(Agilent Technologies公司,美國)檢測樣品總RNA的完整性。
確認所提取的樣本總RNA(每個細胞3組重復,共6個樣本)質(zhì)檢合格后,按照Agilent SurePrint G3 Human Gene Expression v2(上海歐易公司)芯片標準流程,將總RNA反轉(zhuǎn)錄成雙鏈cDNA,用Cyanine-3-CTP(Cy3)標記堿基合成cRNA,再將cRNA與芯片雜交。洗脫后應用Agilent Scanner G2505C(Agilent Technologies公司,美國)掃描芯片,得到原始圖像。
采用Feature Extraction軟件(version 10.7.1.1, Agilent Technologies公司,美國)處理芯片原始圖像,提取原始數(shù)據(jù),將每個芯片的原始數(shù)據(jù)導入Genespring軟件(version 13.1, Agilent Technologies公司,美國),對原始數(shù)據(jù)進行標準化(得到原始信號值、標準化信號值、檢出情況及詳細注釋信息)和分析處理。
圖2 DEGs篩選
應用t檢驗對實驗組LS174T Tn(+)+wtCosmc和對照組LS174T Tn(+)+Con的標準化數(shù)據(jù)進行兩兩比較:將過濾得到的具有生物學重復的全部差異基因繪制出火山圖(volcano plot)。將P值用錯誤發(fā)現(xiàn)率 (false discovery rate,F(xiàn)DR) 來校正多重測試的差異。篩選標準為上調(diào)或下調(diào)倍數(shù)變化(fold change, FC)絕對值≥ 2.0且FDRP值≤ 0.05。應用R語言對差異基因進行聚類,繪制熱圖。
對篩選得到的DEGs通過Wegstalt 在線分析平臺(http://www.webgestalt.org/)用基因通路富集(gene set enrichment analysis, GESA)方法進行GO富集分析和KEGG通路分析,分別排列出最密切的正相關(guān)和負相關(guān)的20條信號通路。
應用在線工具STRING(https://string-db.org/)對差異性表達基因所表達的蛋白之間可能存在的相互作用加以探索,并繪制出蛋白-蛋白互作網(wǎng)絡示意圖(protein-protein interaction network, PPI)。
如前所述,通過Agilent mRNA表達譜基因芯片檢測技術(shù)得到了實驗組及對照組的基因表達譜數(shù)據(jù),在兩組的表達譜基因芯片標準化數(shù)據(jù)的差異比較中,將全部有生物學重復數(shù)據(jù)(即應用t檢驗得到的)的基因繪制出火山圖(圖2A),從中篩選出差異性表達基因譜。對于不存在生物學重復樣本的數(shù)據(jù),則僅利用FC值篩選,標準為FC絕對值≥2.0。本研究得到表達上調(diào)基因502個,表達下調(diào)基因972個,即差異基因共計1 474個,差異性表達基因譜以熱圖的形式展示(圖2B)。
為對差異性表達基因所影響的生物學功能進行描述,本研究對上述差異性表達基因譜所包含的1 474個基因進行了GO富集分析,包括所參與的生物學過程(biological process, BP)、在細胞中的定位(cellular component, CC)及分子功能(molecular function, MF)。圖3列出正負相關(guān)最密切的20個重要結(jié)果,為研究重點。在BP中,可富集到:①有絲分裂細胞周期負反饋;②細胞周期G1/S期轉(zhuǎn)變調(diào)節(jié);③蛋白質(zhì)分解代謝、自磷酸化等過程的調(diào)控等。在CC中,差異性表達基因主要富集到細胞質(zhì)膜及胞外基質(zhì)組分上。MF中:①調(diào)節(jié)蛋白質(zhì)酪氨酸激酶活性;②mRNA結(jié)合、組蛋白結(jié)合;③SMAD蛋白聯(lián)結(jié);④RNA聚合酶Ⅱ轉(zhuǎn)錄因子結(jié)合;⑤細胞黏附分子結(jié)合、核苷酸結(jié)合等功能。
圖3 GO富集分析結(jié)果
圖4 對差異性表達基因進行KEGG Pathway富集結(jié)果
應用KEGG數(shù)據(jù)庫對DEGs進行了GESA,根據(jù)每個Pathway條目中差異性表達基因富集結(jié)果中最密切正負相關(guān)的20位Pathway條目繪制出條形圖,圖4示:DEGs(O-型糖基化相關(guān)基因譜)主要被富集在以下相關(guān)Pathway上:①腫瘤轉(zhuǎn)錄失調(diào);②環(huán)磷酸腺苷(cyclic adenosine monophosphate,cAMP)信號通路;③絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)信號通路;④轉(zhuǎn)化生長因子-β(transforming growth factor-β, TGF-β)信號通路;⑤T細胞受體信號通路;⑥胞外基質(zhì)受體相互作用;⑦自然殺傷細胞介導的細胞毒性反應;⑧白細胞穿透內(nèi)皮細胞發(fā)生遷移等。
為進一步探索O-型糖基化相關(guān)基因譜與腫瘤發(fā)生可能存在的關(guān)系及分子機制,筆者又應用R語言heatplot軟件包將差異性表達基因富集經(jīng)典通路結(jié)果以熱圖形式展示(圖5)??梢姡篛-型糖基化與磷脂酰肌醇-3激酶(phosphatidylinositol 3-kinase,PI3K)、 TGF-β和Wnt三條腫瘤信號通路密切相關(guān)。
為研究DEGs翻譯得到的各種蛋白間的相互作用,筆者應用在線STRING軟件(https://string-db.org/,V9.0)對差異性表達基因譜進行了蛋白網(wǎng)絡分析。將全部DEGs名稱上傳至STRING數(shù)據(jù)庫,得到差異性表達基因譜中編碼基因可翻譯合成的蛋白之間的相互作用關(guān)系(圖6),可看到黏蛋白家族MUC1、MUC4、MUC17等之間的相互作用關(guān)系存在較高的置信度(Confidence≥0.9)。
圖6 差異性表達基因合成的蛋白之間的相互關(guān)系網(wǎng)絡
結(jié)直腸癌是一種常見的惡性腫瘤,具有一定的復發(fā)風險和轉(zhuǎn)移潛能[26-27]。 盡管近十年來結(jié)直腸癌的放射治療(以下簡稱放療)、化學藥物治療(以下簡稱化療)和靶向治療等方面均取得新進展,但發(fā)生率和病死率仍居高不下[28-30]?,F(xiàn)如今基因組學在結(jié)直腸癌的診斷和治療中發(fā)揮著越來越重要的作用[31],但人們對個體遺傳改變及其潛在機制仍然知之甚少。因此尋找關(guān)鍵基因和信號通路有助于發(fā)現(xiàn)疾病的診治靶點。O-型糖基化是重要的翻譯后修飾過程,已被證實與結(jié)直腸癌的發(fā)生發(fā)展密切相關(guān)[7-9, 14, 18]。因此由O-型糖基化引起的分子事件和生物學功能改變值得充分研究。
本研究通過基因表達譜芯片檢測技術(shù)篩選得到1 474個DEGs,包括502個上調(diào)基因和972個下調(diào)基因,它們可被視作O-型糖基化直接相關(guān)基因。通過GO富集可知,DEGs主要調(diào)控細胞外基質(zhì)組織和生長因子活性等生物過程。KEGG富集顯示DEGs主要富集于多種與腫瘤相關(guān)的途徑,如PI3K、TGF-β和Wnt信號通路。據(jù)報道[32-35]這3種經(jīng)典信號通路在結(jié)直腸癌中促進了不同的生理過程。Wnt通路通過影響細胞生長、增生和分化等生命活動參與結(jié)直腸癌的發(fā)生和發(fā)展,該通路的過度激活將導致腸道病變,Wnt通路的異常激活是導致結(jié)直腸癌發(fā)生、發(fā)展的主要原因,且參與了EMT,促進了腫瘤的進展和轉(zhuǎn)移。同樣,TGF-β超家族分子通過跨膜受體和胞質(zhì)內(nèi)信號轉(zhuǎn)導分子Smad進行信號轉(zhuǎn)導,調(diào)節(jié)細胞的增生、分化和凋亡。許多生長因子和激素通過其受體激活PI3K,PI3K可以使肌醇環(huán)上的3位羥基磷酸化,磷酸化的肌醇脂可招募和激活許多信號通路分子,促進細胞增生、細胞遷移和細胞存活。研究[33]證明 TGF-β 和 PI3K信號通路共同參與調(diào)節(jié)細胞的增生、凋亡以及遷移等過程,且TGF-β能夠誘導EMT表型使得腫瘤更具有侵襲和轉(zhuǎn)移能力。因此抑制上述3個經(jīng)典通路中的相關(guān)成員可為治療結(jié)直腸癌提供新的潛在通路靶點。然而,與其他基因表達譜數(shù)據(jù)分析共有的瓶頸[36-38]為,關(guān)鍵基因和與O-型糖基化直接密切相關(guān)的下游通路無法精確定位,仍需進一步研究探索。在蛋白網(wǎng)絡分析結(jié)果中,黏蛋白家族MUC1、MUC4、MUC17等之間的相互作用關(guān)系存在較高的置信度。其中,MUC4可作用于上皮細胞增生、分化并誘導ERBB2特異性磷酸化[39]。趨化因子受體CXCR4以及其他G蛋白耦聯(lián)受體家族CXCL1、GPSM1、DRD4、DRD2等同樣是介導腫瘤血管形成、轉(zhuǎn)移、活化的關(guān)鍵分子[40]。以上關(guān)鍵基因均可作為后續(xù)研究腫瘤O-型糖基化修飾分子機制的重要靶點。
O-型糖基化是一種翻譯后修飾過程[14, 41],就基因轉(zhuǎn)錄組學水平而言,O-型糖基化并不會直接影響基因轉(zhuǎn)錄水平。DEGs的出現(xiàn)可能是由于異常合成O-型糖基化蛋白導致負反饋機制發(fā)生,此外,異常O-型糖基化導致關(guān)鍵分子失活,可能干擾其他基因核酸合成過程,但這些假設尚不明確,仍待進一步探討。
本研究是首次使用轉(zhuǎn)錄組學技術(shù)預測O-型糖基化相關(guān)DEGs的研究,通過對芯片數(shù)據(jù)的篩選和分析,獲得的DEGs為受O-型糖基化調(diào)控的下游基因,它們所對應富集的信號通路和生物學功能都是我們后續(xù)研究所需密切關(guān)注的目標。