于 珍, 吳 靜, 張 磊, 劉樹業(yè)
于珍, 吳靜, 張磊, 劉樹業(yè), 天津市第三中心醫(yī)院檢驗科, 天津市重癥疾病體外生命支持重點實驗室, 天津市人工細胞工程技術(shù)研究中心, 天津市肝膽疾病研究所 天津市 300170
于珍, 博士, 主要從事消化系統(tǒng)腫瘤的靶向治療研究.
膽管癌是一種異質(zhì)程度極高的惡性腫瘤, 多原發(fā)于膽管上皮細胞. 其發(fā)病率逐年增加, 患者5年生存率較低, 小于10%. 膽管癌侵襲性強, 其發(fā)生可能與膽汁淤積、感染及炎癥相關(guān), 但具體的分子發(fā)病機制尚不完全清楚. 膽管癌的早期癥狀隱匿, 不易發(fā)現(xiàn), 多數(shù)患者確診時已是晚期. 對于晚期膽管癌患者而言, 治療方法有限, 預(yù)后較差. 使用標(biāo)準(zhǔn)化療方案(吉西他濱和順鉑)治療的患者中位總生存期仍不到1年. 靶向治療可有助于改善晚期腫瘤患者的治療效果, 提高患者生活質(zhì)量, 因而獲得廣泛關(guān)注. 而目前, 用于膽管癌的靶向分子療法尚未見批準(zhǔn). 開發(fā)有前景的分子靶點, 對于提高膽管癌靶向治療的應(yīng)用前景至關(guān)重要.隨著高通量測序技術(shù)的不斷完善和發(fā)展, 利用生物信息學(xué)技術(shù)挖掘膽管癌基因組潛在分子靶點成為可能. 本研究中, 我們利用基因表達綜合(gene expression omnibus, GEO)數(shù)據(jù)庫中的2組膽管癌表達譜芯片數(shù)據(jù)進行一系列生物信息學(xué)分析, 獲得膽管癌與正常組織的差異表達基因, 探討樞紐基因在膽管癌發(fā)生發(fā)展中的作用, 為膽管癌的靶向治療提供潛在分子靶點.
圖 1 差異基因火山圖. A: GSE26566差異基因火山圖; B: GSE45001差異基因火山圖.
1.1 材料 膽管癌數(shù)據(jù)集來源于GEO數(shù)據(jù)庫, 編號分別為GSE26566和GSE45001. GSE26566包含104例膽管癌組織樣本和6例正常膽管組織樣本. GSE45001包括10個膽管癌組織樣本和10例非腫瘤組織樣本.
1.2 方法
1.2.1 差異表達基因篩選: 2組原始數(shù)據(jù)集采用GEO2R (http://www.ncbi.nlm.nih.gov/geo/geo2r/)在線分析工具進行數(shù)據(jù)處理, 處理后數(shù)據(jù)進行差異基因篩選. 調(diào)整后的P值(adj.P)<0.05和|logFC|>1.5作為納入標(biāo)準(zhǔn). 運用SangerBox在線軟件作火山圖. 用Venny 2.1.0對上述2個數(shù)據(jù)集的差異基因繪制Venn圖取交集.
1.2.2 差異基因功能分析: 使用DAVID(http://david.ncifcrf.gov)在線分析對篩選出來的158個差異基因進行GO富集分析, 包括生物學(xué)過程(biological process, BP)、細胞組分和定位(cellular component, CC)以及分子功能(molecular function, MF), 同時進行KEGG信號通路分析.設(shè)置<0.05.
1.2.3 蛋白質(zhì)互作網(wǎng)絡(luò)與樞紐基因分析: 使用STRING 11.5數(shù)據(jù)庫(https://sring-db.org/)預(yù)測膽管癌差異基因編碼蛋白間的蛋白質(zhì)互作網(wǎng)絡(luò)(protein protein interaction network, PPI). 通過Cytoscape 3.7.0軟件MCODE插件獲得PPI中最顯著的核心模塊, 設(shè)置參數(shù)degree cutoff = 2、node score cutoff = 0.2、k-score = 2及max.depth = 100.利用CytoHubba插件Degree算法篩選出核心模塊中前10位有較高連接度的樞紐基因.
1.2.4 樞紐基因表達驗證: 使用GEPIA數(shù)據(jù)庫(https://gepia.cancer-pku.cn/)對樞紐基因的mRNA在膽管癌組織及正常組織中實際表達水平進行驗證.
采用Wilcoxon檢驗分析膽管癌組織和正常組表達數(shù)據(jù).<0.05差異有統(tǒng)計學(xué)意義.
2.1 差異表達基因篩選結(jié)果 經(jīng)GEO2R分析, 分別從數(shù)據(jù)集GSE26566和GSE45001中提取到差異基因433個和1660個, 繪制火山圖(圖1), 其中綠色為下調(diào)基因、紅色為上調(diào)基因. 取2個數(shù)據(jù)集差異表達基因的交集, 制作Venn圖(圖2), 得到相同差異表達基因158個, 其中上調(diào)基因53個, 下調(diào)基因105個.
2.2 差異基因GO分析和KEGG分析 GO富集分析結(jié)果顯示這些差異基因主要參與細胞對鋅離子反應(yīng)、增長的負調(diào)控, 并且參與細胞粘附、代謝以及蛋白質(zhì)聚合等生物過程; 主要細胞成分位于外泌體、胞外區(qū)、彈性纖維、細胞器膜基質(zhì)及細胞外基質(zhì); 主要分子功能與結(jié)合肝素、半胱氨酸型內(nèi)肽酶抑制劑活性、蛋白質(zhì)同源二聚化、受體結(jié)合及磷酸吡哆醛結(jié)合等相關(guān)(表1). KEGG信號通路分析顯示, 這些差異基因主要參與礦物質(zhì)吸收、碳代謝、丙酸代謝、代謝途徑、PPAR信號通路、脂肪酸降解、細胞色素P450對異生物質(zhì)的代謝、化學(xué)致癌、ECM-受體相互作用和糖酵解/糖異生等通路(表2).
表 1 膽管癌差異基因的GO富集分析
條目 通路 基因數(shù) P值hsa04978 礦物質(zhì)吸收 7 2.01E-05 hsa01200 碳代謝 9 1.05E-04 hsa00640 丙酸代謝 5 4.41E-04 hsa01100 代謝途徑 30 5.77E-04 hsa03320 PPAR信號通路 6 0.001749 hsa00071 脂肪酸降解 5 0.002098 hsa00980 細胞色素P450對異生素的代謝 6 0.002715 hsa05204 化學(xué)致癌 6 0.003812 hsa04512 ECM-受體相互作用 6 0.005455 hsa00010 糖酵解/糖異生 5 0.01122
圖 2 GSE26566和GSE45001差異基因Venn圖.
2.3 蛋白互作網(wǎng)絡(luò)與樞紐基因分析 除去游離的蛋白節(jié)點, 共有130個蛋白質(zhì)節(jié)點連接形成382條復(fù)雜的PPI網(wǎng)絡(luò)(圖3).最顯著模塊由17個重要節(jié)點及127條邊的網(wǎng)絡(luò)構(gòu)成(圖4). 通過Cytohubba插件Degree算法確認樞紐基因, 結(jié)果如圖5, 顯示樞紐基因分別為NUSAP1, TOP2A, RAD51AP1, MCM4, KIAA0101, CDCA5, TYMS, ZWINT, 皆為上調(diào)基因.
2.4 樞紐基因轉(zhuǎn)錄表達水平驗證 通過GEPIA數(shù)據(jù)庫驗證8個樞紐基因mRNA的表達水平. 如圖6所示, 膽管癌組織中NUSAP1, TOP2A, RAD51AP1, MCM4, KIAA0101, CDCA5, TYMS和ZWINT的表達較正常組織均顯著增加.
膽管癌是僅次于肝細胞癌的第二大常見肝臟原發(fā)性惡性腫瘤, 也是膽道最常見的惡性腫瘤, 根據(jù)解剖位置可分為肝內(nèi)膽管癌、肝門周圍膽管癌和遠端膽管癌. 膽管癌發(fā)病早期癥狀隱匿, 晚期惡性程度高, 預(yù)后差, 所以尋找有助于治療膽管癌的分子靶點至關(guān)重要.
圖 3 共同差異基因的蛋白質(zhì)互作網(wǎng)絡(luò)圖.
圖 4 蛋白質(zhì)互作網(wǎng)絡(luò)圖中的核心網(wǎng)絡(luò)圖.
本研究中, 我們使用GEO2R分析了GEO數(shù)據(jù)庫GSE26566和GSE45001兩組數(shù)據(jù)集.獲得差異基因158個, 其中上調(diào)基因53個, 下調(diào)基因105個. 通過DAVID在線工具對共同差異基因做GO富集分析, 結(jié)果顯示差異基因主要參與細胞對鋅離子反應(yīng)、細胞增殖的調(diào)控及細胞粘附、代謝等生物過程, 富集于外泌體、胞外區(qū)、彈性纖維等區(qū)域, 主要分子功能與結(jié)合肝素、半胱氨酸型內(nèi)肽酶抑制劑活性、蛋白質(zhì)同源二聚化、受體結(jié)合及磷酸吡哆醛結(jié)合等相關(guān). KEGG信號通路分析表明, 差異基因主要參與礦物質(zhì)吸收、代謝、PPAR信號通路及脂肪酸降解等過程.
圖 5 樞紐基因模塊.
經(jīng)Cytoscape軟件篩選, 本研究共得到8個樞紐基因, 分別是NUSAP1, TOP2A, RAD51AP1, MCM4, KIAA0101, CDCA5, TYMS, ZWINT, 皆為上調(diào)基因. 經(jīng)驗證, 這8個樞紐基因在膽管癌組織中的表達較正常組織高. NUSAP1編碼核仁和紡錘體相關(guān)蛋白, 參與調(diào)節(jié)紡錘體的組裝和維持正常的胞質(zhì)分裂, 因此是細胞有絲分裂和增殖的重要調(diào)節(jié)因子. 研究發(fā)現(xiàn), NUSAP1在多種腫瘤中存在過表達, 包括肝癌、肺腺癌和腎細胞癌. 另外, NUSAP1的上調(diào)與黑色素瘤和口腔鱗狀細胞癌的惡性進展有關(guān). 因此, NUSAP1可能是一個潛在的治療靶點.DNA拓撲異構(gòu)酶Ⅱ-α(TOP2A)基因參與調(diào)節(jié)核酸空間結(jié)構(gòu)的動態(tài)變化, 其表達與腫瘤侵襲、復(fù)發(fā)以及不同癌癥的預(yù)后相關(guān), 包括乳腺癌、睪丸畸胎瘤、膀胱移行細胞癌、腦膜瘤、神經(jīng)膠質(zhì)瘤、肝癌和子宮內(nèi)膜癌. RAD51AP1(RAD51-associated protein 1)基因編碼一種DNA結(jié)合蛋白, 在RAD51介導(dǎo)的同源重組中至關(guān)重要. Obama等研究表明, RAD51AP1參與肝內(nèi)膽管癌的細胞增殖和DNA修復(fù), 其沉默有助于抑制膽管癌細胞的生長. MCM4是微染色體維持蛋白家族的成員之一, 具有復(fù)制解旋酶活性, 參與DNA復(fù)制和DNA解旋. 有研究顯示, MCM4的高表達會增加多種腫瘤發(fā)病風(fēng)險, 如肝癌、食管癌、乳腺癌等. KIAA0101編碼一種保守的增殖細胞核抗原結(jié)合蛋白, 與DNA聚合酶競爭結(jié)合以調(diào)節(jié)DNA復(fù)制和損傷修復(fù). 據(jù)報道, KIAA0101基因在乳腺癌和非小細胞肺癌組織中存在表達上調(diào), 敲低KIAA0101基因可抑制乳腺癌細胞的生長, 另外KIAA0101高表達也與非小細胞肺癌患者術(shù)后復(fù)發(fā)相關(guān). 細胞分裂周期相關(guān)蛋白5(CDCA5), 也稱為Sororin, 在確保姐妹染色單體的準(zhǔn)確分離方面發(fā)揮著關(guān)鍵作用. 最近的研究表明, CDCA5的高表達與多種癌癥的腫瘤發(fā)生和組織侵襲相關(guān), 包括口腔鱗狀細胞癌、非小細胞肺癌、尿路上皮細胞癌和胃癌. TYMS編碼胸苷酸合酶, 通過催化dUMP的甲基化產(chǎn)生dTMP, 在DNA復(fù)制中發(fā)揮重要作用. TYMS的高表達與許多實體瘤的發(fā)生存在關(guān)聯(lián), 包括肺癌、乳腺癌、胃癌、結(jié)腸直腸癌和腎細胞癌等. ZWINT編碼一種調(diào)控著絲點分裂的動粒蛋白, 在維持有絲分裂周期過程中起著至關(guān)重要的作用. 越來越多的證據(jù)表明, ZWINT 在許多人類癌癥中通常高度表達, 并且與預(yù)后不良和早期復(fù)發(fā)有關(guān).
圖 6 樞紐基因在腫瘤組織和正常組織中的表達驗證.
本研究通過生物信息學(xué)方法從膽管癌組織中篩選出8個樞紐基因, 與正常組織相比, NUSAP1, TOP2A, RAD51AP1, MCM4, KIAA0101, CDCA5, TYMS, ZWINT在膽管癌中的表達均上調(diào). 結(jié)果提示, 這8個樞紐基因可能在膽管癌的發(fā)生發(fā)展中起到關(guān)鍵作用, 為膽管癌的靶向治療提供了理論基礎(chǔ), 但這些基因在膽管癌中的具體機制和作用仍需要進一步實驗驗證.
文章亮點
膽管癌是膽道常見的惡性腫瘤, 預(yù)后不佳. 靶向治療是改善膽管癌治療效果的重要手段, 探索新的分子靶點對于膽管癌靶向治療的研究十分必要.
尋找影響膽管癌發(fā)生和進展的樞紐基因?qū)τ陂_發(fā)膽管癌靶向治療的靶點具有重要意義.
通過生物信息學(xué)方法探索膽管癌靶向治療的潛在分子靶點.
利用GEO數(shù)據(jù)庫分析2組膽管癌數(shù)據(jù)集, 得到共同差異表達基因. 通過GO富集分析與KEGG通路分析共同差異基因主要參與的生物學(xué)過程與信號通路. 基于String數(shù)據(jù)庫構(gòu)建蛋白質(zhì)互作網(wǎng)絡(luò)圖, 經(jīng)過Cytoscape軟件篩選樞紐基因, 通過GEPIA數(shù)據(jù)庫驗證樞紐基因在膽管癌與正常組織中的表達量.
2組膽管癌數(shù)據(jù)集共包含158個共同差異表達基因. GO富集分析及KEGG通路分析結(jié)果顯示, 差異基因主要參與細胞對鋅離子反應(yīng), 細胞增殖與粘附等生物學(xué)過程, 涉及礦物質(zhì)吸收、代謝、PPAR信號通路及脂肪酸降解等信號通路. 最終篩選得到了8個上調(diào)的樞紐基因, 在膽管癌組織中表達量顯著高于正常組織.
本研究通過生物信息學(xué)方法獲得了與膽管癌發(fā)生與進展息息相關(guān)的8個樞紐基因, 分別為NUSAP1, TOP2A, RAD51AP1, MCM4, KIAA0101, CDCA5, TYMS, ZWINT, 可能為膽管癌靶向治療的潛在分子靶點.
這8個樞紐基因?qū)δ懝馨┑挠绊懞蜋C制需進一步通過實驗驗證, 有望為膽管癌靶向治療分子靶點的開發(fā)提供新思路.