陳雅婧 賈宇臣 鄭源強(qiáng) 石艷春
(內(nèi)蒙古醫(yī)科大學(xué)內(nèi)蒙古自治區(qū)分子生物學(xué)重點(diǎn)實(shí)驗(yàn)室,呼和浩特010058)
肺癌是我國(guó)最常見的癌癥,其發(fā)病率和死亡率均較高[1]。肺癌主要被分為小細(xì)胞肺癌和非小細(xì)胞肺癌,非小細(xì)胞肺癌比例較高,約占肺癌的80%以上,其中鱗狀細(xì)胞肺癌(Squamous cell cancer,SCC)是非小細(xì)胞肺癌的主要病理類型之一。肺癌的早期臨床癥狀不明顯,缺乏特異性臨床表現(xiàn),因此多數(shù)患者確診時(shí)已發(fā)展至中晚期[2]。目前臨床上所用的單一腫瘤標(biāo)志物檢出率不高,聯(lián)合使用多種腫瘤標(biāo)志物則會(huì)增加假陽(yáng)性率和檢測(cè)成本。因此進(jìn)一步探索新的可靠的分子標(biāo)志物對(duì)于肺鱗癌的診斷和治療意義重大。本研究擬通過分析GEO數(shù)據(jù)庫(kù)中肺鱗癌相關(guān)芯片數(shù)據(jù),篩選差異表達(dá)基因并對(duì)差異表達(dá)基因進(jìn)行分析,為研究肺鱗癌的診斷和治療靶點(diǎn)提供理論依據(jù)。
1.1材料 從GEO數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)下載編號(hào)為GSE3268[3]的肺鱗癌芯片數(shù)據(jù)集,包含10例樣本,其中肺鱗癌組織及正常肺組織樣本各5例。
1.2方法
1.2.1數(shù)據(jù)預(yù)處理及差異表達(dá)基因篩選 將GSE3268的芯片數(shù)據(jù)集原始文件導(dǎo)入R語(yǔ)言軟件中,利用R語(yǔ)言limma包[4]對(duì)原始芯片數(shù)據(jù)進(jìn)行歸一化處理并分析差異表達(dá)基因,應(yīng)用貝葉斯檢驗(yàn)方法進(jìn)行多重檢驗(yàn)校正,篩選符合條件的差異表達(dá)基因(Differentially expressed genes,DEGs)并繪制基因表達(dá)熱圖和火山圖,差異表達(dá)基因的篩選條件為|log FC|>1且FDR<0.05。
1.2.2差異表達(dá)基因GO分析與KEGG富集分析 通過R語(yǔ)言的cluster-Profiler包[5]對(duì)篩選出的差異表達(dá)基因進(jìn)行基因本體(Gene ontology,GO)富集分析和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路分析。P<0.05為富集的篩選閾值。
1.2.3核心蛋白篩選 利用蛋白互作數(shù)據(jù)庫(kù)(https://string-db.org/)對(duì)差異基因進(jìn)行蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)分析(PPI 分析),進(jìn)而通過Cytoscape篩選核心基因。
1.2.4核心蛋白驗(yàn)證 通過GEPIA數(shù)據(jù)庫(kù)(http://GEPIA.cancer-pku.cn/)[6]對(duì)篩選出的核心基因在肺鱗癌和正常組織中的表達(dá)情況進(jìn)行驗(yàn)證。
2.1差異表達(dá)基因篩選結(jié)果 對(duì)肺鱗癌組織及正常組織基因芯片數(shù)據(jù)進(jìn)行預(yù)處理并通過R軟件篩選得到734個(gè)差異表達(dá)基因,與正常組織相比,肺鱗癌組織中有290個(gè)基因上調(diào),444個(gè)基因下調(diào)(圖1)。
2.2差異基因功能、通路富集 為了解差異基因的功能及其所富集的通路,對(duì)差異基因進(jìn)行GO和KEGG分析。經(jīng)分析發(fā)現(xiàn)差異基因主要參與的生物過程包括細(xì)胞外結(jié)構(gòu)組織、體液水平調(diào)節(jié)、中性粒細(xì)胞介導(dǎo)的免疫應(yīng)答、氧化應(yīng)激、中性粒細(xì)胞脫顆粒等(圖2A)。差異表達(dá)基因主要富集在血流剪切應(yīng)力與動(dòng)脈粥樣硬化、補(bǔ)體系統(tǒng)、細(xì)胞周期、細(xì)胞黏附、P53信號(hào)通路、吞噬體、DNA復(fù)制等KEGG信號(hào)通路(圖2B)。
圖1 差異表達(dá)基因Fig.1 Heatmap and volcano map of DEGsNote: A.Heatmap of DEGs;B.Volcano map of DEGs. Red spots represent the DEGs.
圖2 差異表達(dá)基因GO和KEGG通路富集分析Fig.2 GO and KEGG analysis of DEGsNote: A.The first 20 significant enriched GO terms of DEGs;B.The first 20 significant enriched pathways.
2.3篩選差異表達(dá)基因編碼核心蛋白質(zhì) 通過STRING在線軟件進(jìn)行分析,了解差異表達(dá)基因編碼蛋白質(zhì)之間的相互作用,并通過Cytoscape按照節(jié)點(diǎn)數(shù)篩選出以下關(guān)鍵基因:PCNA、FOS、PTPRC、MMP9、CDK1、CCL2、IL-6、GMPS、CCNB1、TOP2A(圖3)。
2.4核心基因驗(yàn)證 通過GEPIA分析核心基因發(fā)現(xiàn),PCNA、MMP9、CDK1、GMPS、CCNB1、TOP2A在肺鱗癌中表達(dá)增高,F(xiàn)OS、PTPRC、CCL2、IL-6在癌組織中表達(dá)降低,且差異均有統(tǒng)計(jì)學(xué)意義(圖4)。
圖3 核心基因篩選結(jié)果Fig.3 Result of critical genes screeningNote: Upregulated genes are displayed in red and downregulated genes in blue.
本研究通過分析GSE3268芯片數(shù)據(jù)集,篩選得到734個(gè)差異表達(dá)基因,其中290個(gè)基因在SCC中上調(diào),444個(gè)基因在SCC中下調(diào)。通過GO分析發(fā)現(xiàn)差異基因主要參與的生物過程包括細(xì)胞外結(jié)構(gòu)組織、體液水平調(diào)節(jié)、中性粒細(xì)胞介導(dǎo)的免疫應(yīng)答、氧化應(yīng)激、中性粒細(xì)胞脫顆粒等。差異表達(dá)基因主要富集在血流剪切應(yīng)力與動(dòng)脈粥樣硬化、補(bǔ)體系統(tǒng)、細(xì)胞周期、細(xì)胞黏附、P53信號(hào)通路、吞噬體、DNA復(fù)制等KEGG信號(hào)通路。通過蛋白互作分析并篩選得到以下核心基因:PCNA、FOS、PTPRC、MMP9、CDK1、CCL2、IL-6、GMPS、CCNB1、TOP2A 。驗(yàn)證以上核心基因的表達(dá)水平發(fā)現(xiàn)PCNA、MMP9、CDK1、GMPS、CCNB1、TOP2A在肺鱗癌中表達(dá)增高,F(xiàn)OS、PTPRC、CCL2、IL-6在癌組織中表達(dá)降低。
在篩選出的核心基因中PTPRC、CDK1、CCNB1、TOP2A、PCNA、FOS、GMPS與細(xì)胞增殖密切相關(guān)。PTPRC是酪氨酸磷酸酶受體C,是酪氨酸磷酸酶家族(PTP)成員,而PTPs是有絲分裂周期的信號(hào)分子。CDK1是細(xì)胞周期蛋白依賴性激酶1,CCNB1是細(xì)胞周期蛋白B1,二者也參與有絲分裂過程,同時(shí)還是β-catenin的下游靶點(diǎn)[7]。Wnt/β-catenin通路可能通過參與上皮間質(zhì)轉(zhuǎn)化(EMT)而調(diào)節(jié)肺鱗癌的轉(zhuǎn)移和侵襲,此外該通路也能維持腫瘤干細(xì)胞的多能性。腫瘤干細(xì)胞是腫瘤增殖、轉(zhuǎn)移和藥物抵抗的主要原因。TOP2A是DNA拓?fù)洚悩?gòu)酶,有研究表明TOP2A參與多種腫瘤的發(fā)生發(fā)展及預(yù)后[8-10]。PCNA是增殖細(xì)胞核抗原,也是DNA聚合酶輔助因子,PCNA能夠與CDK家族成員相互作用調(diào)節(jié)DNA復(fù)制[11],由于PCNA與細(xì)胞增殖緊密相關(guān),而細(xì)胞增殖影響腫瘤的發(fā)生發(fā)展,因此PCNA在腫瘤的發(fā)展過程中具有重要作用[12]。此外,TOP2A和PCNA均參與調(diào)控DNA的合成和復(fù)制過程[13,14]。FOS在細(xì)胞的增殖中也發(fā)揮重要作用,它是激活蛋白1(AP1)復(fù)合物的重要組分,同時(shí)還會(huì)影響細(xì)胞的分化和DNA損傷修復(fù)。有研究報(bào)道FOS異常會(huì)影響上皮血管瘤的血管生成進(jìn)而影響腫瘤進(jìn)展[15],但它在其他腫瘤中的研究較少。GMPS是鳥嘌呤核苷酸合成酶,對(duì)正常細(xì)胞和腫瘤細(xì)胞的增殖和DNA復(fù)制均至關(guān)重要,GMPS在P53抑制細(xì)胞增殖的過程中也發(fā)揮重要作用[16]。
核心基因CCL2和IL-6都是腫瘤微環(huán)境中較常見的細(xì)胞因子,與腫瘤的進(jìn)展和轉(zhuǎn)移相關(guān)。趨化因子CCL2也稱為單核細(xì)胞趨化蛋白1,腫瘤細(xì)胞能通過增高CCL2的表達(dá)而影響炎性細(xì)胞的招募,而炎性細(xì)胞又能進(jìn)一步分泌細(xì)胞因子和其他促腫瘤生長(zhǎng)和存活的因子[17],但也有報(bào)道CCL2能增強(qiáng)中性粒細(xì)胞介導(dǎo)的抗腫瘤活性,CCL2缺失有利于腫瘤的早期發(fā)展[18]。有文獻(xiàn)報(bào)道IL-6高表達(dá)與肺癌的發(fā)展和預(yù)后不良有關(guān)[19],也有文獻(xiàn)表明通過阻斷IL-6不僅能夠直接抑制腫瘤細(xì)胞的增殖,而且能改變促腫瘤免疫細(xì)胞與抗腫瘤免疫細(xì)胞的相對(duì)比例,使腫瘤微環(huán)境向抗腫瘤表型轉(zhuǎn)化[20]。本文分析發(fā)現(xiàn)CCL2和IL-6在SCC中表達(dá)降低,需要進(jìn)一步分析驗(yàn)證并探討其分子機(jī)制。MMP9是基質(zhì)金屬蛋白酶家族成員之一,有文獻(xiàn)報(bào)道MMP9在多種腫瘤中表達(dá)增高[21,22],但在肺鱗癌中的作用機(jī)制研究尚不完善,有待進(jìn)一步探討。
綜上所述,本研究通過對(duì)肺鱗癌及癌旁組織的差異表達(dá)基因進(jìn)行分析,發(fā)現(xiàn)PCNA、FOS、PTPRC、MMP9、CDK1、CCL2、IL-6、GMPS、CCNB1和TOP2A這十個(gè)核心基因,它們主要參與細(xì)胞周期、DNA復(fù)制及免疫應(yīng)答等。這些發(fā)現(xiàn)有助于增強(qiáng)對(duì)肺鱗癌病因和潛在分子機(jī)制的了解,篩選得到的核心基因和通路可能成為肺鱗癌的診斷和治療靶點(diǎn)。