陳煒康,潘青,張瑜紅,冼磊
(1.廣西醫(yī)科大學(xué),廣西壯族自治區(qū) 南寧 530021;2.廣西醫(yī)科大學(xué) 第一附屬醫(yī)院,廣西壯族自治區(qū) 南寧 530021;3.廣西醫(yī)科大學(xué)第二附屬醫(yī)院,廣西壯族自治區(qū) 南寧 530007)
肺癌仍然是全世界癌癥相關(guān)死亡的主要原因,肺癌所有階段的平均5年生存率只有16%,根據(jù)流行病學(xué)估算未來幾十年這種趨勢還將進(jìn)一步增加[1]。由于早期肺癌無癥狀,大多數(shù)病例被發(fā)現(xiàn)時已經(jīng)是晚期,晚期肺癌患者預(yù)后不良,5年相對生存期估計為5.2%[2]。相反,局限性肺癌患者的5年相對生存率為57.4%。因此,早期發(fā)現(xiàn)肺癌(在發(fā)生遠(yuǎn)處轉(zhuǎn)移之前)將顯著降低肺癌死亡率。由于患者在發(fā)現(xiàn)肺癌時所處的分型和階段對患者的生存預(yù)后非常關(guān)鍵[3]。因此,為了早期診斷肺癌,人們付出了巨大的努力。
食管癌:食管癌是世界上的八大常見惡性腫瘤之一,在腫瘤相關(guān)死亡中排行第六位[4]。同時,食管癌的發(fā)生率正在逐年攀升[5]。并且不同地區(qū)發(fā)生率有較大不同。食管癌有食管鱗狀細(xì)胞癌和食管腺癌兩種主要的病理類型[4]。食管癌的發(fā)病機(jī)制非常復(fù)雜,食管鱗狀細(xì)胞癌的主要原因是反流性胃炎和Barrett 食管等[6],而食管腺癌由多種機(jī)制引起,暫不清楚具體機(jī)制。目前已被證明食管癌進(jìn)展過程中的重要分子機(jī)制有激素滅活、腫瘤抑制基因的抑制、基因突變等[7]。
肺癌和食管癌都是常見的惡性腫瘤,同時也是我國癌癥相關(guān)死亡的主要癌癥。這兩種腫瘤有很多相似之處,如鱗狀細(xì)胞癌是主要的組織病理學(xué)類型,吸煙、飲酒是主要風(fēng)險因素[8-9]。肺和食道惡性病變同時發(fā)生也不罕見,食管癌血性轉(zhuǎn)移通常較早累計肺部。較多證據(jù)表明肺癌和食管癌有很多遺傳學(xué)上的相關(guān)性,例如都和Casp 和Cyp2a6 基因有關(guān)[10-11]。雖然已有研究證實了肺癌與食管癌之間的關(guān)聯(lián),但相關(guān)的病因?qū)W和遺傳學(xué)研究還很有限,需要進(jìn)一步的研究。
在本研究中,從gene expression Omnibus (GEO)數(shù)據(jù)庫下載了一個肺癌基因表達(dá)譜和一個食管癌基因表達(dá)譜。GEO 是一個提供可靠遺傳信息的免費綜合數(shù)據(jù)庫。在肺癌和食管癌數(shù)據(jù)集中,通過比較正常和疾病樣本的基因表達(dá)水平來確定差異表達(dá)基因(DEGs)。然后比較這兩種疾病的差異表達(dá)基因,得到它們的共同基因。我們通過基因本體論(GO)、京都基因和基因組百科全書(KEGG)和蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò)分析,確定了在這兩種疾病中同時具有重要功能的關(guān)鍵基因。
肺癌、食管癌和正常對照的微陣列數(shù)據(jù)集下載于Gene Expression Omnibus (GEO) 數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov / geo)。60例肺癌患者和60例健康對照標(biāo)本的基因表達(dá)譜被納入GSE19804數(shù)據(jù)集。在GSE57130 數(shù)據(jù)集中,24例食管癌患者和12例健康對照標(biāo)本被納入分析。
利用R 語言中“l(fā)imma”包,以|log2FC| >1 和校正P<0.05 為標(biāo)準(zhǔn)分別篩選肺癌和食管癌與正常對照樣本之間的差異表達(dá)基因[12]。分別鑒定出兩種疾病的DEGs 后,鑒定出同時在兩種疾病中都差異表達(dá)的基因用于后續(xù)研究。
GO(Gene Ontology)[13]是 基 因 本 體 聯(lián) 合會(Gene Ontology Consortium)所建立的數(shù)據(jù)庫,旨在建立一個適用于各種物種的,對基因和蛋白功能進(jìn)行限定和描述的,并能隨著研究不斷深入而更新的語義詞匯標(biāo)準(zhǔn),適用于各個物種,包括分子功能(MF)、生物過程(BP)和細(xì)胞成分(CC)三個部分。在P<0.05 的條件下,利用R 語言中的ggplot2 對肺癌和食管癌共同的DEGs 進(jìn)行GO 和KEGG[14]通路富集分析。
我們使用蛋白質(zhì)搜索工具STRING 11.5 (https://string-db.org/) 繪制了一個PPI 網(wǎng)絡(luò)圖來探索共同差異表達(dá)基因之間的相互關(guān)系。交互作用所需的最低得分的統(tǒng)計顯著性標(biāo)準(zhǔn)是中等置信度(0.400)。最后將結(jié)果導(dǎo)入《Cytoscape 3.8.2》(https://cytoscape.org)[15],利用插件cytoHubba篩選關(guān)鍵基因。在網(wǎng)絡(luò)中,節(jié)點和線分別代表蛋白質(zhì)和蛋白質(zhì)-蛋白質(zhì)之間的相互作用[16]。功能齊全的插件cytoHubba 可以在(http://hub.iis.sinica.edu.tw/cytohubba/)下載。
我們利用SPSS 20.0 (SPSS, Inc, Chicago, IL, USA)軟件建立關(guān)鍵基因的受試者工作特征(receiver operating characteristic, ROC)曲線和曲線下面積(area under curve, AUC)來進(jìn)一步分析篩選出的關(guān)鍵基因是否具有可靠性?;虻脑\斷價值P<0.05 認(rèn)為差異具有統(tǒng)計學(xué)意義。
圖1 顯示了本研究的流程示意圖。我們將肺癌數(shù)據(jù)集(GSE19804) 中的60例肺癌患者和60例健康對照樣本的基因表達(dá)譜進(jìn)行比較得到了1176 個DEGs。同樣方法,我們將食管癌數(shù)據(jù)集(GSE57130)中24例食管癌患者和12例健康對照標(biāo)本進(jìn)行比較鑒定出了1640 個DEGs。最后通過聚類分析發(fā)現(xiàn)在兩種疾病中同時存在的DEGs有194 個(圖4)
圖1 數(shù)據(jù)分析流程圖
圖2 肺癌的熱圖 Group 1-對照組; Group 2- 肺癌
圖3 食管癌的熱圖 Group 1-對照組; Group 2- 食管癌
圖4 肺癌和食管癌的韋恩圖
圖5 為兩種疾病共同的194 個差異基因的GO和KEGG 通路分析結(jié)果。BP 分析結(jié)果:泌尿生殖系統(tǒng)的發(fā)生發(fā)展、白細(xì)胞游走、抗生素耐藥性、細(xì)胞外基質(zhì)等結(jié)構(gòu)的形成等;CC 分析結(jié)果主要包括:內(nèi)質(zhì)網(wǎng)、彈力纖維、膠原蛋白、細(xì)胞外基質(zhì)、細(xì)胞間連接成分等;MF 分析結(jié)果包括:抗氧化活性、過氧化物酶活性、RAGE 受體活動、細(xì)胞骨架的結(jié)構(gòu)成分的形成、細(xì)胞粘附分子結(jié)合等功能;通路分析結(jié)果有:IL ?17 信號通路、TGF ?β 信號通路、以及與細(xì)胞粘附分子、白細(xì)胞遷移、動脈粥樣硬化相關(guān)的信號通路。
圖5 GO 和KEGG 通路富集分析。(A) BP. (B) CC. (C) MF. (D) KEGG
我們利用PPI 網(wǎng)絡(luò)將關(guān)鍵基因與普通基因區(qū)分 開 來。如 圖6 所 示,CDKN3、CCNB2、BUB1、TOP2A、TYMS 和CENPF 與其他蛋白的相互作用更多。它們是蛋白質(zhì)相互作用網(wǎng)絡(luò)中最重要的節(jié)點。
為了確定上述分析中的前6 個關(guān)鍵基因是否具有診斷價值,我們構(gòu)建了ROC 曲線,并分別計算了曲線下面積( AUC)。圖7 顯示肺癌患者與對照組CDKN3、CCNB2、BUB1、TOP2A、TYMS 和CENPF的AUC 分 別為:0.859、0.904、0.876、0.942、0.879 和0.906。圖8 顯示食管癌患者與正常對照組CDKN3、CCNB2、BUB1、TOP2A、TYMS 和CENPF 的AUC 分別為:1.000、0.933、1.000、1.000、1.000、1.000。這六個關(guān)鍵基因在兩種疾病數(shù)據(jù)集中經(jīng)過驗證后AUC都遠(yuǎn)大于0.5,提示這些基因診斷價值較高。
圖7 肺癌中前6 個關(guān)鍵基因的ROC 曲線分析
圖8 食管癌中前6 個關(guān)鍵基因的ROC 曲線分析
肺癌和食管癌都是我國發(fā)病率較高的癌癥。兩種癌癥都因為早期癥狀不明顯,導(dǎo)致臨床上絕大多數(shù)患者首診時已為晚期,經(jīng)積極治療,5年生存率仍然非常低。既往有大量研究表明,肺癌和食管癌術(shù)后肺部并發(fā)癥均多見,且患者術(shù)后肺部并發(fā)癥為患者死亡的主要原因[17,18]。因此,進(jìn)一步深入了解肺癌和食管癌的分子機(jī)制,尋找適用于早期診斷的分子指標(biāo)以及治療靶點是目前肺癌和食管癌研究的方向[19]。
在本研究中,我們發(fā)現(xiàn)肺癌和食管癌之間共有194 個共同的差異基因,將其中6 個關(guān)鍵基因(CDKN3、CCNB2、BUB1、TOP2A、TYMS 和CENPF)在肺癌和食管癌患者中的診斷價值進(jìn)行了評估。這些關(guān)鍵基因可能在肺癌和食管癌的發(fā)生發(fā)展中發(fā)揮關(guān)鍵作用。
CDKN3:細(xì)胞周期素依賴性激酶抑制劑3(CDKN3)在細(xì)胞周期和增殖中起關(guān)鍵作用[20,21]。CDKN3 通過與細(xì)胞周期蛋白結(jié)合發(fā)揮其功能,從而導(dǎo)致CDK1 和CDK2 蛋白去磷酸化并抑制細(xì)胞周期進(jìn)程[22]。CDKN3 的表達(dá)及其致癌作用已在各種類型的癌癥中得到廣泛研究[23]。Zang 等人已經(jīng)證明,CDKN3 在肺腺癌中高水平表達(dá),并且與較差的生存結(jié)果相關(guān)[24]。既往有體內(nèi)和體外實驗研究發(fā)現(xiàn),miR-181d-5p 通過Akt 信號通路失活抑制CDKN3 基因而產(chǎn)生對非小細(xì)胞肺癌的抑制作用,從而為非小細(xì)胞肺癌的治療提供了新的治療策略[25]。Zhao Xiao 等人的研究發(fā)現(xiàn)與正常組織相比,CDKN3 基因在肺腺癌(ADC)和鱗狀細(xì)胞癌(SCC)中表達(dá)上調(diào)[24]。之前的一項研究報道顯示CDKN3通過激活A(yù)KT 信號通路來調(diào)節(jié)食道鱗狀細(xì)胞癌(ESCC)的進(jìn)展且CDKN3 可以作為ESCC 治療的潛在有效治療靶點[26]。
CCNB2:細(xì)胞周期蛋白B2 (Cyclin B2, CCNB2)是細(xì)胞周期蛋白家族的一員,它調(diào)控細(xì)胞周期蛋白依賴性激酶(Cyclin dependent kinases, CDKs)的活性,不同的細(xì)胞周期蛋白在細(xì)胞周期的特定階段在空間和時間上發(fā)揮作用[27]。CCNB2 通常通過激活CDK1 激酶來觸發(fā)G2/M 進(jìn)程轉(zhuǎn)化[28]。此外,血清循環(huán)中CCNB2 mRNA 的表達(dá)水平在癌癥患者中增加,并與癌癥分期和轉(zhuǎn)移狀態(tài)相關(guān)[29]。既往有研究發(fā)現(xiàn),CCNB2 蛋白的過表達(dá)與非小細(xì)胞肺癌的臨床進(jìn)展和預(yù)后不良相關(guān)[30]。此外,Ma Xiao 等人發(fā)現(xiàn)CCNB2 是肺腺癌癌變和發(fā)展的中樞基因,可作為肺腺癌的潛在生物標(biāo)志物和靶點[31]。目前CCNB2 與食管癌的研究較少,這將可以作為后續(xù)的研究方向。
BUB1:BUB1 是一種保守的絲氨酸/蘇氨酸有絲分裂激酶[32]。已發(fā)現(xiàn)該酶除了在紡錘體裝配檢驗點(SAC)信號傳導(dǎo)中有作用,同時,Bub1 還促進(jìn)染色體排列,后期促進(jìn)復(fù)合物/環(huán)體(APC/C)激活等[33]。既往已有研究表明該基因與肺癌和食管癌都有關(guān)聯(lián),如:Chen Xiuwen 等人發(fā)現(xiàn)小細(xì)胞肺癌組織與配對的相鄰非癌組織相比BUB1 基因表達(dá)上調(diào)[34],同時姚伶俐等人發(fā)現(xiàn)Bub1 基因及其蛋白、Mad2 蛋白低表達(dá)與食管癌發(fā)生的關(guān)系密切,Bub1低表達(dá)在食管癌的發(fā)展和轉(zhuǎn)移中具有重要作用[35]。
TOP2A:拓?fù)洚悩?gòu)酶IIα(TOP2A),是一種核蛋白,分子量約為170 kDa,在DNA 合成、RNA 轉(zhuǎn)錄和有絲分裂的染色體分離中有重要作用。Grenda Anna 等人認(rèn)為TOP2A 基因的多態(tài)性可能與非小細(xì)胞肺癌患者化療毒性和生存預(yù)測因素有關(guān)[36]。Du Xiaomei 等人通過實驗發(fā)現(xiàn),TOP2A 基因在人肺腺癌細(xì)胞中表達(dá)上調(diào),并通過生物信息學(xué)分析支持該發(fā)現(xiàn)。Zhang Shuyao 等人發(fā)現(xiàn),TOP2A 基因在食管癌組織中高度表達(dá)[37]。
TYMS:胸苷酸合酶(TYMS)是DNA 合成中的關(guān)鍵酶,其編碼的胸苷酸成酶(TS)是嘧啶核苷酸合成的限速酶,是腫瘤生長的重要因子。Feng Wei等人的研究證實,TYMS 中rs3819102 基因多態(tài)性可能增加對環(huán)境因素的敏感性,并增加患肺癌的風(fēng)險[38]。也有人發(fā)現(xiàn)TYMS 的表達(dá)量與肺腺癌患者以鉑類為基礎(chǔ)的化療治療的存活率下降有關(guān)[39]。Arakawa Yasuhiro 等人發(fā)現(xiàn)TYMS 多態(tài)性的存在可以幫助識別食管鱗狀細(xì)胞癌患者5 - 氟尿嘧啶(DCF)化療期間出現(xiàn)的嚴(yán)重低鈉血癥[40]。
CENPF:著絲粒蛋白F(Centromere Protein F, CENPF)是一種分子量為367 kDa 的核定位蛋白.近幾年的研究表明,CENPF 可能參與細(xì)胞周期的調(diào)控。它在有絲分裂前期開始增加,在有絲分裂期定位于動粒,末期開始迅速降解[41]。肺腺癌組織中CENPF mRNA 表達(dá)顯著升高(P<0.001)同時CENPF 上調(diào)與肺腺癌患者的病理分期、無復(fù)發(fā)生存率(RFS)以及總生存率(OS)顯著正相關(guān)[42]。Su Peng 等人的實驗表明CENPF 基因在食管癌組織中高度表達(dá)[43]。
本研究使用GEO 下載了1 個肺癌數(shù)據(jù)集和1個食管癌數(shù)據(jù)集。然后將肺癌和食管癌患者的數(shù)據(jù)集與正常樣本進(jìn)行比較,得到DEGs。最后,對這些差異基因進(jìn)行聚類分析,得到194 個交集基因。通過GO 和KEGG 富集分析,我們獲得了與細(xì)胞周期相關(guān)的富集結(jié)果。通過構(gòu)建PPI 網(wǎng)絡(luò),篩選出了CDKN3、CCNB2、BUB1、TOP2A、TYMS 和CENPF等6 個關(guān)鍵基因。最后通過SPSS 軟件驗證其診斷價值。我們的發(fā)現(xiàn)闡明了肺癌和食管癌的進(jìn)展,也為這兩種疾病的診斷和治療提供了新的思路。
本研究有一定的局限性。首先,雖然關(guān)鍵基因被證明能夠預(yù)測肺癌和食管癌兩種疾病的進(jìn)展,但沒有進(jìn)行相關(guān)實驗來證實這些結(jié)果。我們的研究小組正在進(jìn)行體外和體內(nèi)的研究來驗證這些基因。其次,由于我們只選擇了兩個數(shù)據(jù)集,樣本量相對較小,結(jié)果可能并不適用于所有的人群。需要一個包含更多物種和種群的大樣本研究來進(jìn)行比較。
注:數(shù)據(jù)可用性:本研究的數(shù)據(jù)來自公共數(shù)據(jù)庫GEO,沒有創(chuàng)建任何新的數(shù)據(jù)集。目前的研究遵循GEO 數(shù)據(jù)訪問政策和發(fā)布指南。