黃勛功 馮 旭 涂順珂
(廣西醫(yī)科大學第一附屬醫(yī)院心胸外科,廣西南寧市 530021)
肺癌是全球最常見的癌癥之一,早期診斷是肺癌治療過程中最關(guān)鍵的部分,但晚期患者占肺癌人群的比例依然很高,因此,對患者進行早期診斷及預后監(jiān)測至關(guān)重要[1]。近年來,諸多研究發(fā)現(xiàn)多個基因與肺癌的發(fā)生、發(fā)展及預后相關(guān),基因靶向治療可有效識別腫瘤細胞及正常細胞,在發(fā)揮抗腫瘤作用的同時減少對正常細胞的損傷,這使其成為研究的重點。目前,肺腺癌約占全部肺癌的45%,在女性和抽煙者中發(fā)病率較高,但其具體的分子機制尚未完全清楚,因此,揭示潛在關(guān)鍵基因?qū)Ψ蜗侔┑姆乐魏皖A后評估非常重要[2]。G蛋白偶聯(lián)受體116(G-protein coupled receptor 116, GPCR116)屬于G蛋白偶聯(lián)受體家族,該受體在維持肺表面活性物質(zhì)穩(wěn)態(tài)中起著關(guān)鍵作用,GPCR116丟失會引起肺氣腫樣病變[3]。有研究顯示,GPCR116具有調(diào)節(jié)血管內(nèi)皮的功能,其功能的缺失會導致腦血管滲漏風險顯著增加[4]。此外,還有研究報道GPCR116可以預測胃癌和結(jié)直腸癌的不良預后[5-6]。然而,GPCR116基因在肺腺癌中的作用尚不清楚,本研究旨在探討GPCR116基因與肺腺癌發(fā)生、發(fā)展的相關(guān)性及其作用機制。現(xiàn)報告如下。
1.1 數(shù)據(jù)來源 從高通量功能基因組(Gene Expression Omnibus, GEO)數(shù)據(jù)庫(www.ncbi. nlm.nih. gov/geo)下載GSE68465數(shù)據(jù)集,該數(shù)據(jù)集包含442例肺腺癌組織樣本和20例正常組織樣本的mRNA數(shù)據(jù)和基本臨床資料(包括T分期、N分期、年齡、性別、吸煙史等)[7]。
1.2 數(shù)據(jù)分析 利用R語言對基因名進行注釋,用“l(fā)imma”和“impute”工具包對其相應的基因表達量進行補缺矯正[8-9]。通過Wilcoxon秩和檢驗分析數(shù)據(jù)集中的正常組織與癌組織樣本GPCR116表達量之間的差異。篩選出腫瘤患者,按照其中位值(20.438 865)將腫瘤患者分為高表達組和低表達組,使用R語言中的“survival”行Kaplan-Meier生存分析。使用R語言對GPCR116行單因素和多因素Cox回歸,分析臨床特征與肺腺癌患者預后的關(guān)系。使用R語言中的Kruskal-Wallis檢驗,探究GPCR116基因表達量與各臨床特征的相關(guān)性。
1.3 基因集富集分析 運用基因集富集分析(Gene Set Enrichment Analysis, GSEA)軟件4.2.3版輸入GPCR116高表達組和低表達組的數(shù)據(jù)集文件和表型數(shù)據(jù)文件,選擇c2.cp.kegg.v7.5.1.symbols.gmt [Curated]作為參考基因集,將P<0.05、錯誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)<0.25的基因集作為顯著富集的基因集。
1.4 識別差異表達基因 根據(jù)GPCR116基因表達量對腫瘤樣本數(shù)據(jù)進行重新排序,按照各基因表達中位值進行分組,使用R語言分析并輸出同時滿足|(log2FC)|>1且P<0.05的差異表達基因(differentially expressed genes, DEGs) ,使用R語言繪制火山圖,并使用R語言中的“pheatmap”對上調(diào)與下調(diào)最顯著的20個DEGs繪制差異基因熱圖。
1.5 GO功能富集和KEGG通路富集分析 使用R語言中的“clusterProfiler”進行基因本體論(Gene Ontology,GO)富集分析及京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析,滿足將P<0.05、最小富集差異基因計數(shù)為5、富集基因占整條通路所有基因的最小占比為0.05的基因作為顯著性基因富集。
1.6 相關(guān)性分析 挑選出上調(diào)與下調(diào)最顯著的DEGs各20個,利用R語言中的“corrplot”工具包分析GPCR116基因與這40個DEGs之間的相關(guān)性。
1.7 構(gòu)建PPI網(wǎng)絡并篩選關(guān)鍵基因 使用在線分析數(shù)據(jù)庫 STRING(http: //string-db.org /cgi /input.pl)構(gòu)建蛋白互作(protein-protein interaction,PPI)網(wǎng)絡,設定最小互作評分>0.15。使用Cytoscape 3.9.1的插件CytoHubba中的5種拓撲分析算法(EcCentricity、Closeness、Radiality、Betweeness、Stress)分別計算PPI網(wǎng)絡中DEGs的表達量并進行排列,取交集,篩選得到關(guān)鍵基因。
2.1 GPCR116基因在肺腺癌組織中的表達情況 與正常組織相比,GPCR116基因在肺腺癌組織中的表達量明顯升高,差異有統(tǒng)計學意義(P<0.05),見圖1。
圖1 GPCR116在正常組織和肺腺癌組織中的表達
2.2 GPCR116基因表達量與肺腺癌患者預后的關(guān)系 生存分析結(jié)果顯示,低表達組5年生存率為0.451(0.380~0.536),高表達組的5年生存率可達 0.651(0.578~0.733),高表達組預后較好,差異有統(tǒng)計學意義(P<0.05),見圖2。單因素和多因素Cox回歸分析結(jié)果均顯示,GPCR116表達量是肺腺癌患者預后的獨立影響因素(均P<0.05),見表1。
圖2 GPCR116基因表達量與肺腺癌患者預后關(guān)系的Kaplan-Meier生存分析
表1 GPCR116基因表達量與肺腺癌患者預后關(guān)系的單因素及多因素Cox回歸分析
2.3 GPCR116基因表達量與臨床特征的相關(guān)性分析 GPCR116基因的表達量與T分期、N分期及吸煙史相關(guān)(均P<0.05),見圖3。
圖3 GPCR116基因表達量與臨床特征的相關(guān)性
2.4 GPCR116基因的GSEA富集分析 GPCR116基因高表達組主要富集在溶酶體,低表達組主要富集在細胞周期、P53信號通路、錯配修復、卵母細胞減數(shù)分裂等信號通路中,見表2;可視化分析得到的富集分析圖見圖4。
表2 GPCR116基因GSEA富集分析表達通路
圖4 GPCR116基因GSEA富集分析圖
2.5 差異基因的火山圖與熱圖 共篩選出DEGs 235個,包括下調(diào)基因103個,上調(diào)基因132個。DEGs的火山圖見圖5,由最顯著的40個DEGs繪制得到的差異基因熱圖見圖6。
圖5 DEGs火山圖
圖6 DEGs熱圖
2.6 差異基因GO分析和KEGG通路富集分析 GO富集分析結(jié)果顯示:DEGs的生物過程主要涉及細胞核分裂、細胞器裂變、有絲分裂細胞周期相變等,見表3。KEGG通路富集分析結(jié)果顯示:DEGs主要在人類T細胞白血病病毒1感染、細胞周期、類風濕性關(guān)節(jié)炎等信號通路中富集,見表4。
表3 DEGs的GO功能富集分析結(jié)果(生物過程,前5個)
表4 DEGs的KEGG通路富集分析結(jié)果(前5個)
2.7 相關(guān)性分析 GPCR116基因的表達量與13個顯著性差異基因的表達量呈正相關(guān),包括HSD17B6、CYP2B7P、RNASE1等;與20個顯著性差異基因的表達量呈負相關(guān),包括TMEM158、MCM10、NDC80等。見圖7。
圖7 GPCR116基因的表達量與上調(diào)和下調(diào)最顯著的40個差異基因表達量的相關(guān)性
2.8 PPI網(wǎng)絡構(gòu)建及關(guān)鍵基因篩選 PPI網(wǎng)絡共包含40個節(jié)點、129條連線,其中SFTPC、SFTPB、SFRPD、HOPX、WIF1與GPCR116基因均呈正相關(guān)(見圖8)。5種拓撲分析算法分別計算出前20位基因,取交集得到10個關(guān)鍵基因,分別為NKX2-1、SFTPB、SFTPC、SCGB1A1、PITX1、FOXM1、MYBL2、CDCA3、TFF1、WIF1。
圖8 與GPCR116基因相關(guān)的PPI網(wǎng)絡(共預測40個功能蛋白)
肺腺癌是一種高度惡性的異質(zhì)性疾病,采用生物標志物預測患者預后并尋找關(guān)鍵的治療靶點或?qū)⒊蔀槲磥硌芯康闹攸c。本研究探討了GPCR116基因預測肺腺癌預后的價值,并利用富集分析和PPI網(wǎng)絡探究GPCR116基因可能的作用機制,然后篩選肺腺癌的潛在治療靶點,旨在為闡明GPCR116基因與肺腺癌的相關(guān)性及其作用機制提供參考。
G蛋白偶聯(lián)受體是參與信號傳遞的最大細胞表面分子家族,在腫瘤生長和轉(zhuǎn)移中發(fā)揮重要作用。已有研究表明,惡性細胞常影響G蛋白偶聯(lián)受體的正常功能[10]。GPCR116基因作為G蛋白偶聯(lián)受體家族中的一員,其在不同類型的腫瘤中發(fā)揮作用。本研究結(jié)果顯示,GPCR116基因在肺腺癌組織中低表達是肺腺癌預后較差的預測指標。GSEA富集的多個通路與腫瘤的進展相關(guān),例如:P53是人類癌癥中最常見的腫瘤抑制基因,它的缺失或突變可導致免疫逃避和癌癥進展[11];錯配修復可保護DNA,抑制突變,修復的缺失與癌變進展關(guān)系密切[12];細胞周期檢查點為DNA復制的監(jiān)控機制,可防止細胞分裂過程中遺傳錯誤的積累,檢查點缺陷是細胞癌變的前提[13];溶酶體中的溶酶體蛋白可使癌細胞凋亡從而發(fā)揮抑癌作用,也可為降解的ECM蛋白入侵癌細胞提供營養(yǎng)和能量,從而促進腫瘤的侵襲、生長[14]。由此預測,GPCR116基因可能參與肺腺癌細胞的自噬過程,其低表達可能促進了肺腺癌的發(fā)生、發(fā)展。
差異基因的GO功能富集分析與KEGG通路富集分析結(jié)果顯示,差異基因富集的功能與通路在肺腺癌的發(fā)生、發(fā)展中起重要作用。GPCR116基因與其中的多個基因發(fā)揮交互作用,PPI網(wǎng)絡預測的40個功能蛋白中,多種蛋白被證實與肺癌相關(guān),例如:HOPX可誘導非小細胞肺癌細胞衰老、凋亡,發(fā)揮抑制腫瘤活性的作用[15-16];SFTPD可抑制EGFR突變型非小細胞肺癌細胞的生長和運動[17];WIF1可通過抑制Wnt/β-連環(huán)蛋白信號傳導來抑制非小細胞肺癌細胞的增殖并誘導其凋亡[18];CDC45參與DNA復制并維護基因組穩(wěn)定,CDC45功能缺失會促進腫瘤的發(fā)生[19-20]。由此可以預測,GPCR116基因可能通過正向調(diào)節(jié)HOPX、WIF1、SFTPD來誘導肺腺癌細胞衰老、凋亡,抑制肺腺癌細胞的增殖、黏附和侵襲。
本研究得到10個關(guān)鍵基因(NKX2-1、SFTPB、SFTPC、SCGB1A1、PITX1、FOXM1、MYBL2、CDCA3、TFF1、WIF1),其中SFTPC、SCGB1A1、PITX1、FOXM1、MYBL2、CDCA3、WIF1這7個基因在肺癌中的作用已明確[21-23]。但SFTPB、TFF1、NKX2-1這3個關(guān)鍵基因的作用尚不明確,可能與患者的預后相關(guān),或可作為潛在的治療靶點。例如,SFTPB可用于肺腺癌的前期篩查和預后評估[24];TFF-1在某些肺癌細胞中過度表達,可驅(qū)動腫瘤抑制[25];NKX2-1可通過抑制細胞外調(diào)節(jié)蛋白激酶的活性來控制肺癌進展[26]。本研究篩選出的關(guān)鍵基因有助于肺癌的診斷與治療,但其具體的作用還有待進一步研究。
綜上所述,GPCR116基因在肺腺癌組織中顯著高表達,且其表達量與肺腺癌患者的預后相關(guān),可作為肺腺癌患者預后的預測因素。P53信號通路、錯配修復、溶酶體蛋白等通過調(diào)控GPCR116基因的表達而在肺腺癌的發(fā)生、發(fā)展中發(fā)揮重要作用。本文篩選出的10個關(guān)鍵基因,或可為揭示肺腺癌的一些潛在致病機制提供參考。