蔣 崚 覃 芳 鄭 軍
(三峽大學(xué) 第一臨床醫(yī)學(xué)院[宜昌市中心人民醫(yī)院] 普外科, 湖北 宜昌 443003)
結(jié)直腸癌(colorectal cancer, CRC)是全球第三大常見(jiàn)腫瘤,其預(yù)后與早期診斷及治療有關(guān),早期診斷時(shí)5年生存率為90%,遠(yuǎn)處轉(zhuǎn)移發(fā)生率低于10%[1-2]。CRC發(fā)病機(jī)制較為復(fù)雜,通過(guò)識(shí)別生物標(biāo)志物對(duì)CRC的發(fā)生發(fā)展過(guò)程及發(fā)病機(jī)制研究具有指引作用,對(duì)早期診斷具有十分重要的意義。同時(shí),根據(jù)CRC相關(guān)的預(yù)后標(biāo)志物,選擇“個(gè)性化”治療策略具有十分廣闊的前景。
基因芯片可用于快速檢測(cè)樣品中所有基因的表達(dá)信息,尤其是差異基因(differentially expressed genes, DEGs)表達(dá)篩選。隨著基因芯片的廣泛使用,已經(jīng)有大量的核心芯片數(shù)據(jù)存儲(chǔ)在NCBI-GEO(NCBI-Gene Expression Omnibus)的公共數(shù)據(jù)庫(kù)中[3]。然而,由于獨(dú)立研究中的組織或樣品差異性,結(jié)果總是有限或不一致,或者結(jié)果僅來(lái)自單個(gè)隊(duì)列研究。通過(guò)結(jié)合表達(dá)譜分析技術(shù)的整合生物信息學(xué)方法可以解決這些問(wèn)題。
本研究擬從數(shù)據(jù)庫(kù)NCBI-GEO下載原始微陣列數(shù)據(jù)集,運(yùn)用生物信息學(xué)方法篩選與CRC相關(guān)的關(guān)鍵基因,并進(jìn)行熒光定量聚合酶鏈?zhǔn)椒磻?yīng)(quantitative polymerase chain reaction, qPCR)驗(yàn)證,以期為CRC的早期診斷和治療提供更準(zhǔn)確、實(shí)用和可靠的生物標(biāo)志物。
Trizol裂解液購(gòu)自于美國(guó)Invitrogen公司。反轉(zhuǎn)錄試劑盒“PrimeScriptTMRT reagent Kit (Perfect Real Time)”和SYBR?Green購(gòu)自寶日醫(yī)生物技術(shù)(北京)有限公司。qPCR引物采用Primer bank(https://pga.mgh.harvard.edu/primerbank/)在線設(shè)計(jì)生成,并在NCBI-BLAST(https://blast.ncbi.nlm.nih.gov/Blast.cgi)在線驗(yàn)證,引物由生工生物工程(上海)股份有限公司合成。
1.2.1 微陣列數(shù)據(jù)信息和差異基因鑒定
從NCBI-GEO (https://www.ncbi.nlm.nih.gov/geo)下載獲得數(shù)據(jù)GSE44076、GSE28000和GSE75970的CRC和癌旁粘膜組織基因表達(dá)譜[4-6]。將高通量功能基因組表達(dá)的原始數(shù)據(jù)整合用于分析,CEL格式數(shù)據(jù)在NCBI網(wǎng)站GEO DataSets中處理。使用R軟件分析和讀取表達(dá)值。用t檢驗(yàn)鑒定DEGs,DEGs表達(dá)P<0.05和logFC>1作為差異有統(tǒng)計(jì)學(xué)意義的標(biāo)準(zhǔn)。使用在線網(wǎng)站制作韋恩圖(http: //bioinformatics.psb.ugent.be/webtools/Venn/)。
1.2.2 基因功能和途徑富集
DEG的功能和途徑富集采用在線數(shù)據(jù)庫(kù)分析。功能注釋生物信息學(xué)微陣列分析(functional annotation bioinformatics microarray analysis, DAVID)網(wǎng)站(https://david.ncifcrf.gov)具有基因注釋和提供基因生物學(xué)意義的功能?;虮倔w(gene ontology, GO)分析和途徑富集分析使用KEGG(http://www. genome.jp/kegg)、Biocarta(http://biocyc.org)和Reactome(http://www.reactome.org)。
1.2.3 蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)分析
首先,在線數(shù)據(jù)庫(kù)STRING(http://string-db.org)用于開發(fā)DEGs編碼的蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)(protein-protein interaction network,PPI)。 其次,利用Cytoscape軟件構(gòu)建蛋白質(zhì)相互作用關(guān)系網(wǎng)絡(luò),分析篩選出的DEGs編碼蛋白在CRC中的相互作用關(guān)系。 第三,使用Network Analyzer插件計(jì)算節(jié)點(diǎn)度,即用于過(guò)濾PPI關(guān)鍵基因的連接數(shù)。中心節(jié)點(diǎn)中相應(yīng)的蛋白質(zhì)可能是核心蛋白質(zhì)和具有重要生理調(diào)節(jié)功能的關(guān)鍵候選基因。
1.2.4 qPCR驗(yàn)證
收集CRC患者癌組織及其癌旁組織共5組(收集于三峽大學(xué)第一臨床醫(yī)學(xué)院胃腸外科),患者均為首次確診,術(shù)后病理分期均為Ⅲ期,研究方案通過(guò)醫(yī)院醫(yī)學(xué)倫理委員會(huì)審查及批準(zhǔn)。采用Trizol法提取組織總mRNA,逆轉(zhuǎn)錄試劑盒轉(zhuǎn)為cDNA,檢測(cè)RNA濃度、純度和完整性后逆轉(zhuǎn)錄成cDNA。通過(guò)實(shí)時(shí)熒光定量PCR擴(kuò)增檢測(cè)目的基因的表達(dá),反應(yīng)體系為20 μL。本研究所用引物序列如下:
CXCL1:上游5’-AGGGAATTCACCCCAAGAA C-3’,下游5’-TAACTATGGGGGATGCAGGA-3’;
BUB1:上游5’-AAATGACCCTCTGGATGTTTGG-3’,下游5’-GCATAAACGCCCTAATTTAAGCC-3’;
CCL19:上游5’-CTGCTGGTTCTCTGGACTTC C-3’,下游5’-AGGGATGGGTTTCTGGGTCA-3’;
CDK1:上游5’-AAACTACAGGTCAAGTGGTAGCC-3’,下游5’-TCCTGCATAAGCACATCCTGA-3’;
GAPDH:上游5’-GAAGGTGAAGGTCGGAGT C-3’,下游5’-GAAGATGGTGATGGGATTTC-3’。
熒光定量PCR系統(tǒng)為AppliedBiosystems?7300,以GAPDH為內(nèi)參,數(shù)據(jù)采用StepOne Software v 2.3分析。
qPCR數(shù)據(jù)采用軟件SPSS 22.0進(jìn)行統(tǒng)計(jì)分析,基因表達(dá)量采用均數(shù)±標(biāo)準(zhǔn)差表示。P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
從3個(gè)數(shù)據(jù)集中共下載了8 034個(gè)DGEs,見(jiàn)表1。在整合生物信息學(xué)分析后,鑒定出總共98個(gè)DEGs,韋恩圖見(jiàn)圖1。CRC組織與癌旁組織相比,共有65個(gè)上調(diào)基因和33個(gè)下調(diào)基因。差異性表達(dá)最顯著的前10個(gè)基因見(jiàn)表2。
表1 3個(gè)數(shù)據(jù)集基本信息
表2 結(jié)直腸癌差異性表達(dá)最顯著的前10個(gè)基因
圖1 3個(gè)數(shù)據(jù)集整合韋恩圖
DEGs的GO分析分為3個(gè)功能組:分子功能、生物過(guò)程和細(xì)胞組分(圖2)。在分子功能組中,上調(diào)基因主要富集在結(jié)合、受體結(jié)合、蛋白結(jié)合通路,下調(diào)基因主要富集在結(jié)合蛋白通路。在生物過(guò)程組中,上調(diào)基因主要富集于單一生物過(guò)程、單一生物細(xì)胞過(guò)程、細(xì)胞增殖過(guò)程和有絲分裂細(xì)胞周期過(guò)程;下調(diào)基因主要富集在單一生物過(guò)程、單一生物細(xì)胞過(guò)程、有絲分裂細(xì)胞周期過(guò)程。在細(xì)胞成分組中,上調(diào)基因主要富集于細(xì)胞外空間、細(xì)胞外區(qū)域通路;下調(diào)基因主要富集在細(xì)胞組分、膜結(jié)合細(xì)胞器、細(xì)胞器。這些結(jié)果表明,大多數(shù)DEGs在單個(gè)生物體、結(jié)合、細(xì)胞組分和有絲分裂細(xì)胞周期中富集。
圖2 腫瘤組織中差異基因的GO分析
采用STRING做PPI分析,Cytoscape軟件篩選關(guān)鍵基因,共選出4個(gè)關(guān)鍵基因,如圖3藍(lán)色所示,分別為:CXCL1、BUB1、CCL19、CDK1。
圖3 蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)
如圖4所示,CRC患者癌組織與癌灶旁2 cm粘膜組織相比,CXCL1,BUB1和CDK1的表達(dá)升高,CCL19表達(dá)降低,差異均有統(tǒng)計(jì)學(xué)意義(均P<0.05)。
注:與CRC癌旁2 cm粘膜組織相比,*P<0.05圖4 CRC癌組織與癌旁組織中關(guān)鍵基因的表達(dá)
近年來(lái),關(guān)于CRC分子機(jī)制的研究越來(lái)越多,深入了解基因調(diào)控在CRC發(fā)生發(fā)展中的作用,需要大數(shù)據(jù)的綜合分析。通過(guò)生物信息學(xué)對(duì)相關(guān)基因分析的方法已成為一種基因譜大數(shù)據(jù)集分析的重要途徑。從NCBI-GEO下載獲得3個(gè)數(shù)據(jù)集,使用R軟件分析和讀取表達(dá)值,用t檢驗(yàn)鑒定篩選出DEGs。本研究通過(guò)DEGs的功能和途徑富集采用分析,發(fā)現(xiàn)大多數(shù)DEGs在單個(gè)生物體、結(jié)合、細(xì)胞組分和有絲分裂細(xì)胞周期中富集。采用STRING作PPI分析,Cytoscape軟件進(jìn)一步篩選這些關(guān)鍵基因,得到CXCL1、BUB1、CDK1和CCL19共4個(gè)關(guān)鍵基因。
CXCL1最初在黑色素瘤中發(fā)現(xiàn),在巨噬細(xì)胞、嗜中性粒細(xì)胞中也有表達(dá)。CXCL1是炎性疾病和感染性疾病的有效趨化因子,通過(guò)T淋巴細(xì)胞募集到炎癥部位,促進(jìn)腫瘤生長(zhǎng)[7]。CXCL1的表達(dá)與腫瘤進(jìn)展密切相關(guān),如腫瘤細(xì)胞的生長(zhǎng)、增殖、轉(zhuǎn)移和腫瘤血管生成[8]。研究發(fā)現(xiàn)[9],CXCL1不僅能從人類惡性腫瘤細(xì)胞中釋放出來(lái),還可從腫瘤微環(huán)境中的樹突狀細(xì)胞中分泌。腫瘤相關(guān)的樹突狀細(xì)胞表達(dá)高水平的CXCL1,其通過(guò)增加腫瘤干細(xì)胞樣特性來(lái)增加腫瘤發(fā)生和化療耐藥潛力。此外,腫瘤相關(guān)樹突細(xì)胞衍生的CXCL1也增強(qiáng)腫瘤遷移,并促進(jìn)上皮-間充質(zhì)轉(zhuǎn)化。這些研究結(jié)果表明,腫瘤相關(guān)樹突狀細(xì)胞衍生的CXCL1可能促進(jìn)CRC的進(jìn)展。
BUB1基因的過(guò)度表達(dá)與腫瘤細(xì)胞增殖有關(guān)[9]。過(guò)表達(dá)BUB1的轉(zhuǎn)基因小鼠可發(fā)生各種自發(fā)性腫瘤(CRC、乳腺癌、胃癌、肝癌等),并加速myc誘導(dǎo)的淋巴瘤形成[10]。BUB1在人多種惡性腫瘤中高表達(dá),包括胃癌[9]、CRC[11],并且與不良預(yù)后有關(guān)。
趨化因子可以吸引并活化細(xì)胞到體內(nèi)特定位置。新近研究發(fā)現(xiàn),其配體CCL19參與人類惡性腫瘤細(xì)胞之間的相互作用[12]。CCL19通過(guò)與CCR7結(jié)合,介導(dǎo)細(xì)胞生長(zhǎng)、轉(zhuǎn)移等生物學(xué)行為[13],還可在肺癌和卵巢癌中調(diào)節(jié)抗腫瘤反應(yīng)[14-15]。類似的研究表明,CCL19抑制腫瘤的發(fā)生、轉(zhuǎn)移和血管生成,CCL19的表達(dá)與CRC患者的預(yù)后可能相關(guān)[16]。
腫瘤的進(jìn)展與細(xì)胞周期的錯(cuò)誤調(diào)節(jié)和異常細(xì)胞信號(hào)通路轉(zhuǎn)導(dǎo)密切相關(guān)[17]。在細(xì)胞周期過(guò)程中,DNA被外源和內(nèi)源因子連續(xù)破壞,當(dāng)檢測(cè)到DNA損傷時(shí),細(xì)胞周期可以通過(guò)激活DNA損傷檢查點(diǎn)來(lái)阻止[18]。DNA損傷檢查點(diǎn)的功能是在進(jìn)入有絲分裂或誘導(dǎo)細(xì)胞凋亡之前進(jìn)行DNA修復(fù),否則受損的遺傳物質(zhì)積累可能導(dǎo)致細(xì)胞最終癌變[19]。細(xì)胞周期中的主要DNA損傷檢查點(diǎn)包括G1/S期、S期和G2/M期檢查點(diǎn),其中G2/M期檢查點(diǎn)是最重要的一個(gè)DNA修復(fù)保護(hù)屏障,決定細(xì)胞是否進(jìn)行有絲分裂或凋亡。G2/M期阻滯是細(xì)胞進(jìn)入有絲分裂前, DNA損傷修復(fù)最重要的細(xì)胞周期保護(hù)屏障[20]。CDK1蛋白是核心因子,在細(xì)胞周期G2/M期調(diào)控網(wǎng)絡(luò)中發(fā)揮關(guān)鍵作用。在許多人類惡性腫瘤組織中檢測(cè)到CDK1蛋白的表達(dá)上調(diào),包括喉癌、食道癌、肺癌、肝細(xì)胞癌、CRC、腎癌和卵巢癌,且與惡性腫瘤的預(yù)后密切相關(guān)[21]。
本研究通過(guò)生物信息學(xué)的方法篩選出了CRC中的4個(gè)關(guān)鍵基因(CXCL1、BUB1、CCL19、CDK1),并在癌組織和癌旁組織樣本中通過(guò)qPCR進(jìn)行了驗(yàn)證,發(fā)現(xiàn)癌組織中CXCL1、BUB1和CDK1的表達(dá)升高,CCL19表達(dá)降低,4個(gè)關(guān)鍵基因RNA水平表達(dá)變化趨勢(shì)與生物信息學(xué)分析一致。但這些基因在 CRC中的功能及其分子機(jī)制有待進(jìn)一步研究。
綜上所述,本研究利用多個(gè)隊(duì)列分析數(shù)據(jù)集和生物信息學(xué)分析,發(fā)現(xiàn)在CRC組織中存在4個(gè)主要關(guān)鍵基因CXCL1、BUB1、CCL19、CDK1。這些候選基因可能是CRC早期診斷的監(jiān)測(cè)指標(biāo)及治療靶點(diǎn)。