郭永東,靳晶,郭甜甜,李利敏,賀宇彤
河北醫(yī)科大學第四醫(yī)院腫瘤研究所,石家莊050000
近年來,隨著發(fā)病率和病死率的上升,惡性腫瘤已經(jīng)成為威脅人類生命健康的重要原因。食管癌是臨床常見的消化系統(tǒng)惡性腫瘤,根據(jù)世界衛(wèi)生組織(WHO)公布的最新數(shù)據(jù)顯示,全球食管癌新發(fā)病例約57.2萬例,分別居惡性腫瘤發(fā)病和病死順位的第11和第8位[1]。中國是食管癌的高發(fā)國家,2015年,食管癌新發(fā)病例47.79萬例,病死37.50萬例[2]。食管鱗狀細胞癌(esophageal squamous cell carcinoma,ESCC)是食管癌的主要組織亞型,占全部食管癌的91%[3]。隨著診療技術(shù)的發(fā)展,食管癌患者的生存率明顯改善,但食管癌患者缺乏早期的臨床癥狀,多數(shù)患者確診時已處于臨床晚期,預后較差,5年生存率不足21%[4]。
ESCC是多階段綜合性作用的結(jié)果,影響其發(fā)生發(fā)展的因素較多,吸煙、飲酒及飲食等多種外部因素和基因驅(qū)動、基因突變等內(nèi)部因素的綜合作用是導致ESCC的發(fā)生發(fā)展主要原因[5],研究發(fā)現(xiàn),多種基因可作為食管癌的分子標志物,促進食管癌的發(fā)生發(fā)展[6-8];還有多種抑癌基因可抑制食管癌的發(fā)生和發(fā)展[9-12]。目前,臨床缺少基因集作為ESCC診斷的生物標志物的研究,因此,深入的研究探討ESCC發(fā)生的影響因素和潛在分子標志物基因集,有助于ESCC的早期預防、精確診斷和靶向治療?;蚪M學、蛋白組學和轉(zhuǎn)錄組學等的研究可為發(fā)現(xiàn)ESCC的特異性生物標志物提供方向。基因表達綜合數(shù)據(jù)庫(gene expression omnibus,GEO)是由美國國立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)創(chuàng)建并維護的基因表達數(shù)據(jù)庫,收錄了多個國家研究機構(gòu)提交的高通量測序表達數(shù)據(jù),可以為眾多的研究提供方向。本研究從GEO數(shù)據(jù)庫中下載獲得兩組研究機構(gòu)的ESCC測序數(shù)據(jù),應用生物信息學方法篩選鑒定出具有特異性篩查和潛在治療靶標的基因集作為ESCC患者的分子標志物,以期為ESCC患者的早期預防、精確診斷和治療提供有價值的分子標志物,現(xiàn)報道如下。
本研究從GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/)中下載得到 GSE17351[13]和 GSE20347[14]的基因表達芯片數(shù)據(jù),將下載所得芯片探針名稱根據(jù)平臺注釋進行基因名轉(zhuǎn)換,且進行標準化處理[15]。若存在多個探針對應一個基因名的情況,則取其表達量最大的作為此基因的表達值(表1)。差異基因的篩選由微陣列數(shù)據(jù)的線性模型(linear models for microarray data,limma)[15]軟件完成,以log2FC≥2,P<0.05作為差異基因篩選的截斷值標準。將兩個數(shù)據(jù)集所得上下調(diào)基因由韋恩圖[16]取交集,進行后續(xù)分析,熱圖和火山圖由heatmaply軟件[17]繪制。
表1 數(shù)據(jù)信息
應用 DAVID(https://david.ncifcrf.gov/)在線數(shù)據(jù)庫對所獲得上下調(diào)差異基因進行基因本體(gene ontology,GO)/京都基因和基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路分析,GO分析包括生物過程、分子功能和細胞成分,數(shù)據(jù)可視化由R包clusterprofile[18]完成。
用于相互作用基因庫檢索工具(search tool for the retrieval of interacting genes,STRING)(https://string-db.org/)數(shù)據(jù)庫是一個搜索已知蛋白質(zhì)之間和預測蛋白質(zhì)之間相互作用的數(shù)據(jù)庫。本研究應用檢索基因/蛋白質(zhì)相互作用基因庫檢索工具STRING對差異性表達基因構(gòu)建蛋白質(zhì)-蛋白質(zhì)交互作用關(guān)系(protein-protein interaction,PPI)網(wǎng)絡,然后導入cytoscape[19]進行量化及后續(xù)操作,結(jié)合得分≥0.6、節(jié)點數(shù)≥4為差異有統(tǒng)計學意義。
腫瘤基因組圖譜計劃是由美國國家癌癥研究所(national cancer institute,NCI)和美國國立衛(wèi)生研究院(national institute of health,NIH)下屬的國家人類基因組研究所(national human genome research institute,NHGRI)于 2006年聯(lián)合啟動的項目,目的在于對導致腫瘤的主要基因組進行研究分類,創(chuàng)建一個完整的腫瘤基因組圖譜,為廣大研究者提供公開可用的數(shù)據(jù)集,來幫助改進診斷方法,治療技術(shù),以期達到早發(fā)現(xiàn)、精準抗腫瘤的目的。腫瘤基因組圖譜計劃的目的是研究個人的基因組變異如何影響基因表達、導致生物學差異(人體組織和細胞的健康狀態(tài)和患病狀態(tài))。在蛋白交互網(wǎng)絡中有統(tǒng)計學意義的基因且顯著性富集于GO及KEGG通路中的基因集在腫瘤基因組圖譜(the cancer genome atlas,TCGA)和基因型組織表達(the genotype-tissue expression,GTEx)數(shù)據(jù)庫中進行基因表達的驗證。
采用R 3.5.0軟件對所-有數(shù)據(jù)進行統(tǒng)計分析,計量資料以均數(shù)±標準差(±s)表示,組間比較采用單因素方差分析;以P<0.05為差異有統(tǒng)計學意義。
對下載數(shù)據(jù)進行質(zhì)量控制后,GSE17351共有542個差異基因(上調(diào)基因196個,下調(diào)基因346個),GSE20347共有594個差異基因(上調(diào)基因242個,下調(diào)基因352個)(圖1)。分別對GSE17351和GSE20347的差異性表達上下調(diào)基因取交集,所得上調(diào)基因59個,下調(diào)基因91個(圖2),進行后續(xù)分析。
圖1 食管鱗狀細胞癌組織和癌旁組織中GSE17351和GSE20347的差異基因
圖2 藍色為GSE17351,黃色為GSE20347
GO富集分析結(jié)果顯示,生物過程主要富集于核分裂、膠原分解代謝過程、細胞外基質(zhì)組織、角化和表皮細胞分化等;分子功能主要富集于金屬內(nèi)肽酶活性、單加氧酶活性和結(jié)構(gòu)分子活動等;細胞成分主要富集于微管、驅(qū)動蛋白復合物及細胞外泌體等(表2、表3)。KEGG通路分析結(jié)果顯示,上調(diào)基因主要參與白細胞介素-17(interleukin-17,IL-17)信號通路、腫瘤中的微小RNA(microRNA,miRNA)、腫瘤中的轉(zhuǎn)錄失調(diào)、核因子-κB(nuclearfactor-κB,NF-κB)信號通路,下調(diào)基因主語參與藥物代謝-細胞色素P450、花生四烯酸代謝和化學致癌作用等通路途徑(圖3)。
表2 差異性表達上調(diào)基因的GO分析
表3 差異性表達下調(diào)基因的GO分析
圖3 KEGG通路富集分析
基于STRING數(shù)據(jù)庫,59個上調(diào)基因和91個下調(diào)基因的蛋白互作網(wǎng)絡圖由cytoscape軟件繪制。在此蛋白互作網(wǎng)絡中富含脯氨酸小蛋白(small proline-rich protein,SPRR3)、甲狀腺激素受體相互作用因子13(thyroid hormone receptor interacting protein 13,TRIP13)和基質(zhì)金屬蛋白酶 3(matrix metalloproteinase 3,MMP3)基因結(jié)合得分均大于0.90分。(圖4)
圖4 蛋白互作網(wǎng)絡分析
綜合TCGA和GTEx中的食管癌數(shù)據(jù),可得到食管癌組織182例,正常食管組織286例,綜合其測序數(shù)據(jù)進行SPRR3、TRIP13和MMP3基因表達量的驗證,結(jié)果顯示,食管癌組織中SPRR3mRNA的相對表達量明顯低于正常組織,MMP3、TRIP13mRNA的相對表達量均明顯高于正常組織,差異均有統(tǒng)計學意義(P<0.01)。(表4)
表4 TCGA和GTEx數(shù)據(jù)庫中SPRR 3、TRIP13、MMP 3 mRNA相對表達量的比較(±s)
表4 TCGA和GTEx數(shù)據(jù)庫中SPRR 3、TRIP13、MMP 3 mRNA相對表達量的比較(±s)
組織正常組織(n=286)食管癌組織(n=182)t值P值SPRR3 mRNA 14.32±0.13 10.95±3.15 4.400 0.000 MMP3 mRNA 3.76±0.19 5.58±1.79 4.140 0.000 TRIP13 mRNA 6.64±0.28 8.60±0.65 11.350 0.000
食管癌是一種常見的上消化道惡性腫瘤,惡性程度較高,缺乏早期診斷的特異性生物標志物,多數(shù)患者確診時已經(jīng)處于晚期,預后較差[20],食管癌是中國甚至全球發(fā)病率和病死率最高的上消化道惡性腫瘤[1]。因此,探索研究食管癌,特別是ESCC發(fā)生發(fā)展的分子機制尤為重要,尋找特異性的生物標志物對食管癌的早期診斷及精確治療具有重要意義。
Jiang等[21]研究發(fā)現(xiàn),血清miRNA-218的表達可以作為食管癌患者早期診斷和臨床評估的分子標志物。Liu等[22]研究發(fā)現(xiàn),TPX2微管成核因子(TPX2 microtubule nucleation factor,TPX2)基因的表達與ESCC患者的惡性程度呈正相關(guān),TPX2基因的表達越高,惡性程度越強。Otsuka等[23]研究發(fā)現(xiàn),鋅指蛋白 750(zinc finger protein 750,ZNF750)基因的低表達與ESCC患者的預后差密切相關(guān),因此認為,ZNF750基因可以作為ESCC患者預后的可靠生物標志物。Jin等[24]研究發(fā)現(xiàn),TAC1基因的甲基化與食管癌患者的預后差明顯相關(guān);Zhang等[25]研究發(fā)現(xiàn),SPRR3基因可以促進腫瘤細胞凋亡而減弱ESCC細胞的致瘤性;TRIP13基因可以調(diào)節(jié)前列腺癌細胞的增殖、遷移和侵襲,發(fā)揮原癌基因的作用,TRIP13高表達與預后差明顯相關(guān)[26],而TRIP13在ESCC的研究較少;MMP3基因在ESCC中作為原癌基因發(fā)揮作用,促進ESCC細胞的增殖和遷移,還可誘導N-精氨酸二元轉(zhuǎn)化酶1(NRD convertase 1,NRD1)基因促進ESCC的發(fā)生和發(fā)展[27-29]。
目前,研究多著眼于某一個單獨基因,進而探討其對腫瘤發(fā)生發(fā)展的作用機制研究,以期作為特異性的腫瘤診斷治療的生物標志物,由于人體基因的數(shù)量和其復雜性,使單一基因作為腫瘤診斷治療的生物標志物顯得有所不足。關(guān)于多個基因組成一個基因集作為ESCC診斷治療的生物標志物的研究較少,本研究應用生物信息學方法獲得SPRR3、TRIP13和MMP3基因組成的一個基因集,作為ESCC早期診斷和精準治療的生物標志物,旨在為ESCC的預防和治療提供新的方向和策略。
綜上所述,SPRR3、TRIP13和MMP3基因集可作為分子標志物,為食管鱗狀細胞癌的診斷和治療提供一定方向。