洪 超 ,向旭東 ,李盈甫 ,曹 楊 ,陳雪雅 ,李 帥 ,邢安灝 ,林 牧 ,馬千里
(1)中國醫(yī)學(xué)科學(xué)院 &北京協(xié)和醫(yī)學(xué)院醫(yī)學(xué)生物學(xué)研究所,云南 昆明 650118;2)昆明醫(yī)科大學(xué)第三附屬醫(yī)院胸外科,云南 昆明 650118;3)昆明醫(yī)科大學(xué)第一附屬醫(yī)院干療科,云南 昆明 650032;4)云南省保山市第二人民醫(yī)院檢驗科,云南 保山 678000)
2020 年,全球估計有220 萬肺癌新發(fā)病例和180 萬死亡病例,約占癌癥診斷的十分之一(11.4%)和死亡的五分之一(18.0%)[1]。2016 年我國癌癥統(tǒng)計報告顯示,肺癌是男、女性癌癥死亡的最常見原因,約占男性癌癥死亡的29.71%和女性癌癥死亡的22.92%[2],這主要是因為肺癌早期癥狀隱匿,難以實現(xiàn)早期診治[3]。肺癌的發(fā)生受多種因素影響[4],而其中遺傳因素是影響個體間肺癌易感性差異的最主要因素[5]。非小細(xì)胞肺癌(non-small cell lung cancer,NSCLC)是常見的肺癌類型,約占肺癌的85%[6],NSCLC 預(yù)后較差,且近年來發(fā)病趨于年輕化[7]。研究發(fā)現(xiàn),有多條信號通路參與了NSCLC 的發(fā)生發(fā)展過程,如CDKN2A/RB1、NFE2L2/KEAP1/CUL3、PI3K/AKT、SOX2/TP63/NOTCH1 等[8-10]。這些信號通路相關(guān)基因中的單核苷酸多態(tài)性位點(single nucleotide polymorphisms,SNPs)可能與NSCLC 的發(fā)生發(fā)展有相關(guān)性[11]。
絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)信號通路在腫瘤發(fā)生過程中起關(guān)鍵作用,與腫瘤發(fā)生的多個方面有關(guān),包括細(xì)胞分化、增殖、侵襲、血管生成、凋亡和轉(zhuǎn)移[12]。細(xì)胞外信號調(diào)節(jié)激酶(ERK)是3 個MAPK 家族(JNK,p38/SAPK 和ERK)之一[13-15]。ERK1/2 通路也被稱為經(jīng)典的MAPK 信號傳導(dǎo)途徑,約在34%的腫瘤中發(fā)生改變[16]。研究發(fā)現(xiàn),位于基因3'非翻譯區(qū)(3'untranslated region,3'UTR)的SNP可能會影響miRNA-mRNA 相互作用[17-18],進而影響靶基因的表達(dá),可能在腫瘤的發(fā)生中發(fā)揮關(guān)鍵作用[19]。本研究選取了4 個ERK1/2 信號通路基因3'UTR 區(qū)域的SNP 位點(MAPK1基因中的rs9340,NRAS基因中的rs14804,KRAS基因 中的rs712 和rs7973450),探討其與NSCLC 遺傳易感性的相關(guān)性,以期為肺癌的分子病理機制的探究提供數(shù)據(jù)支持。
隨機選取在昆明醫(yī)科大學(xué)第三附屬醫(yī)院診斷的478 名NSCLC 患者,納入標(biāo)準(zhǔn)為:患者經(jīng)活檢或手術(shù)診斷為NSCLC、臨床資料完整、具有較好的依從性、無其他合并腫瘤、無其他腫瘤既往史、未接受放療或化療等抗腫瘤治療。診斷標(biāo)準(zhǔn)依據(jù)《中華醫(yī)學(xué)會肺癌臨床診療指南(2018 版)》[20]。同時隨機選取480 名同期健康體檢人員作為健康對照組。采集所有受試者的乙二胺四乙酸(EDTA)抗凝全血4 mL。所有樣本收集均獲得患者及家人的知情同意,并經(jīng)昆明醫(yī)科大學(xué)第三附屬醫(yī)院倫理委員會批準(zhǔn)(審查編號:KYLX2022180)。為了響應(yīng)我國對肺癌篩查與早診早治的倡議,根據(jù)《中國肺癌篩查與早診早治指南(2021,北京)》[21]以及《老年晚期肺癌內(nèi)科治療中國專家共識(2022 版)》[22]的推薦,本研究將受試者按照年齡劃分為 <50 歲組,50~65 歲組以及>65歲組。
使用全血基因組DNA 提取試劑盒QIAamp DNA Mini Kit(購自Qiagen 公司,Qiagen NV,Venlo,Netherlands),根據(jù)試劑說明書完成基因組DNA提取。使用Multiskan GO 全波長酶標(biāo)儀測定DNA濃度及純度。將提取到的DNA 樣本稀釋到25 ng/μL的工作濃度,用于隨后的基因分型檢測。
使用CAPD 數(shù)據(jù)庫(http://bio-bigdata.hrbmu.edu.cn/CPAD/index.jsp)選取與肺癌相關(guān)的候選信號通路,利用GEPIA 數(shù)據(jù)庫(http://gepia.cancerpku.cn/)對信號通路中的候選基因進行表達(dá)驗證,使用Ensembl 數(shù)據(jù)庫(https://www.ensembl.org/index.html)及UCSC 數(shù)據(jù)庫(https://genome.ucsc.edu/)查找位于候選基因3'UTR 區(qū)域的SNP 位點。同時以中國南方漢族人群次要等位基因頻率(minor allele frequency,MAF)高于0.04 作為篩選標(biāo)準(zhǔn)。最終選取4 個SNP 作為本次研究的候選SNP,分別是位于MAPK1基因 3'UTR 區(qū)域的 rs9340,位于NRAS基因3'UTR 區(qū)域的rs14804,位于KRAS基因3'UTR 區(qū)域的rs712 和rs7973450,見表1。
表1 所選SNP 位點信息Tab.1 The information of selected SNPs in the current study
使用TaqMan 探針法對上述SNP 進行基因分型檢測,所用試劑及探針均購自美國ABI 公司,具體分型方法參見筆者之前的研究[23]。為驗證基因分型結(jié)果的準(zhǔn)確性,本研究隨機挑選5%的樣本進行重復(fù)檢測,并隨機挑選了3%的樣本進行測序驗證。
利用GTEx 數(shù)據(jù)庫(https://www.gtexportal.org/home/)評估SNP 和基因表達(dá)的相關(guān)性,使用miRNASNP 數(shù)據(jù)庫(http://bioinfo.life.hust.edu.cn/mi-RNASNP/#!/)預(yù)測基因3'UTR 變異對miRNAmRNA 相互作用的影響。
使用Microsoft Excel 軟件整理所有基因分型數(shù)據(jù)以及臨床信息,采用Graphpad Prism 軟件和在線軟件SHEsis[24]進行統(tǒng)計學(xué)分析。研究對象年齡以()表示,性別、病理類型、臨床分期、SNP 位點等位基因及基因型以例數(shù)和百分比[n(%)]表示。使用獨立樣本t檢驗分析病例組和對照組間樣本年齡差異;使用χ2檢驗分析2 組間性別分布差異;采用哈迪溫伯格平衡(hardyweinberg equilibrium,HWE)檢驗分析納入樣本的群體代表性;采用χ2檢驗分析各SNP 位點等位基因及基因型在各組間的分布頻率的差異及優(yōu)勢比(odd ratio,OR),檢驗水準(zhǔn)α為0.05。對于多重比較,使用Bonferroni 校正P值,本次研究設(shè)定P值為0.012(0.05/n,n=4)。假陽性報告概率(false positive report probability,F(xiàn)PRP)分析[25]用于評估研究結(jié)果中假陽性發(fā)生的概率。
本研究共納入958 名受試者,包括478 名NSCLC 患者,平均年齡為(55.94 ± 10.79)歲,其中男性305 名,女性173 名。健康對照組包含480 名受試者,平均年齡為(55.16 ± 11.35)歲,其中男性277 名,女性203 名。2 組受試者之間的年齡和性別分布比較差異無統(tǒng)計學(xué)意義(t=1.09,P=0.275;χ2=3.74,P=0.053),見表2。
表2 受試者臨床信息[/n(%)]Tab.2 The clinical characteristics of the subjects enrolled in the current study [/n(%)]
表2 受試者臨床信息[/n(%)]Tab.2 The clinical characteristics of the subjects enrolled in the current study [/n(%)]
位于ERK1/2 信號通路相關(guān)基因3'UTR 區(qū)域的4 個SNP 的基因型在對照組中的分布特征均符合HWE(P>0.05),表明本研究納入樣本是具有群體代表性的隨機樣本。對4 個SNP 位點等位基因和基因型在對照組與NSCLC 組中分布頻率的差異進行分析,結(jié)果顯示,4 個SNP 的等位基因和基因型在對照組與NSCLC 組中分布頻率的差異經(jīng)Bonferroni 校正后,差異無統(tǒng)計學(xué)意義(P>0.012),見表3。
表3 在健康對照組和NSCLC 組中4 個SNP 位點等位基因及基因型頻率分布結(jié)果[n(%)]Tab.3 Allele and genotype frequencies of four SNPs between the control group and NSCLC group [n(%)]
為了探究ERK1/2 信號通路相關(guān)基因3'UTR區(qū)域的4 個SNP 與不同病理類型NSCLC 的相關(guān)性,本研究按照病理類型將NSCLC 組分為腺癌組(adenocarcinoma,AC)和鱗狀細(xì)胞癌組(squamous cell carcinoma,SCC),并分析4 個SNP 位點的等位基因和基因型在對照組與AC 組以及對照組與SCC 組中分布頻率的差異。結(jié)果顯示,rs9340 位點的等位基因在對照組與SCC 組中分布頻率的差異具有統(tǒng)計學(xué)意義(P=0.009),在先驗概率水平為0.25 時,rs9340 與SCC 的相關(guān)性仍有意義(FPRP=0.045),該結(jié)果表明rs9340 位點的G 等位基因可能是非小細(xì)胞肺鱗癌的保護性因素(OR=0.67,95%CI:0.50~0.91),而其余位點的等位基因和基因型在對照組與各病理類型組間分布頻率的差異經(jīng)Bonferroni 校正后均無統(tǒng)計學(xué)意義(P>0.012),見表4。
為分析ERK1/2 信號通路相關(guān)基因3'UTR 區(qū)域的4 個SNP 位點與NSCLC 不同臨床分期的相關(guān)性,本研究按臨床分期將NSCLC 組分為I+II 期組以及III+IV 期組,并分析4 個SNP 位點等位基因和基因型在對照組與I+II 期組以及對照組與III+IV 期組中分布頻率的差異。結(jié)果顯示,4 個SNP 位點的等位基因和基因型在對照組與I+II 期組以及對照組與III+IV 期組中分布頻率的差異經(jīng)Bonferroni 校正后差異無統(tǒng)計學(xué)意義(P>0.012),見表5。
為了分析ERK1/2 信號通路相關(guān)基因3'UTR區(qū)域的4 個SNP 位點在不同的年齡組中與NSCLC 的相關(guān)性,本研究分析了4 個SNP 位點等位基因和基因型在 <50 歲組、50~60 歲組以及 >65 歲組中分布頻率的差異。結(jié)果顯示,在 <50歲年齡組中,rs9340 位點的等位基因在對照組和NSCLC 組中的分布頻率差異具有統(tǒng)計學(xué)意義(P=5.07×10-4),在先驗概率水平為0.25 時,rs9340與 <50 歲年齡組中NSCLC 的相關(guān)性仍有意義(FPRP=2.52 × 10-4),該結(jié)果表明rs9340 等位基因G 可能是NSCLC 的保護性因素(OR=0.46,95%CI:0.29~0.72),見表6。
在獲得rs9340 位點可能與NSCLC 發(fā)生風(fēng)險具有相關(guān)性的結(jié)果后,本研究利用生物信息學(xué)工具對rs9340 位點的功能進行初步預(yù)測,結(jié)果顯示,rs9340 位點的A 等位基因可使培養(yǎng)的成纖維細(xì)胞中MAPK1基因表達(dá)升高,見圖1。在miRNAmRNA 相互作用方面,rs9340 位點的A 等位基因可能在MAPK1基因3'UTR 區(qū)域增加了與hsa-miR-153-3p、hsa-miR-448 的結(jié)合位點,同時影響了與hsa-miR-521 的結(jié)合。該結(jié)果表明,rs9340 位點可能是通過影響MAPK1基因的表達(dá)而在NSCLC 的發(fā)生過程中發(fā)揮作用。
圖1 rs9340 調(diào)節(jié)MAPK1 的表達(dá)Fig.1 rs9340 regulates the expression of MAPK1
ERK1/2 信號通路參與多個細(xì)胞生物學(xué)進程的調(diào)控,包括增殖、分化和轉(zhuǎn)化[26],異常激活的ERK1/2 信號通路可以促進癌細(xì)胞的增殖、抑制凋亡、促進血管生成和細(xì)胞遷移等,從而促進腫瘤的生長和轉(zhuǎn)移[27-28]。更重要的是,ERK1/2 信號通路深度參與癌癥治療中的放射抵抗[29],可能與腫瘤不良預(yù)后相關(guān)。研究發(fā)現(xiàn),腫瘤相關(guān)信號通路基因中的突變在腫瘤發(fā)生發(fā)展過程中發(fā)揮著重要作用[30-31],這些突變通常與信號通路基因表達(dá)及功能的改變相關(guān)[32-33],其中位于基因3'UTR區(qū)域的SNP 可能會通過影響miRNA-mRNA 的相互作用[34],而影響信號通路基因的表達(dá)[35],進而產(chǎn)生級聯(lián)反應(yīng)[36],并在疾病的發(fā)生發(fā)展過程中發(fā)揮作用[37]。因此,本研究選取了4 個位于ERK1/2信號通路的基因3'UTR 區(qū)域的SNP 位點,研究其與NSCLC 發(fā)生風(fēng)險的相關(guān)性。
絲裂原活化蛋白激酶1(MAPK1)是研究廣泛的MAP 激酶家族成員,也被稱為細(xì)胞外信號調(diào)節(jié)激酶2(ERK2)[38]。在正常生理條件下,MAPK1在大多數(shù)組織中呈中度持續(xù)表達(dá),但在乳腺癌、膀胱癌、肺癌和胃癌等多種惡性腫瘤中表達(dá)會發(fā)生顯著變化[39-40]。Wang 等[41]的實驗證實,MAPK1可以雙向調(diào)控靶基因,從而促進胃腺癌細(xì)胞的侵襲和遷移。Zhu 等[42]報道,MAPK1在宮頸癌患者中表達(dá)上調(diào),MAPK1逆轉(zhuǎn)了miR-217 對細(xì)胞活力、遷移、侵襲和凋亡的抑制。Gagliardi 等[43]的研究結(jié)果表明,ERK2可以促進三陰性乳腺癌細(xì)胞的遷移和侵襲、腫瘤干細(xì)胞表型形成和轉(zhuǎn)移。以上研究資料表明MAPK1基因的表達(dá)異常在腫瘤發(fā)生中發(fā)揮重要作用。而rs9340 位點位于MAPK1 基因的3'UTR,可能參與MAPK1的轉(zhuǎn)錄后調(diào)控,而與疾病的發(fā)生相關(guān)。Guo 等[44]對MAPK1基因中的rs9340 的研究結(jié)果顯示,rs9340 位點的G 等位基因與降低圍絕經(jīng)期冠心病的易感性顯著相關(guān)。Insodaite 等[45]的結(jié)果表明,rs9340 位點基因型A/A 是喉鱗癌患者發(fā)生遠(yuǎn)處轉(zhuǎn)移的風(fēng)險因素。同樣,本研究結(jié)果顯示rs9340 可能與非小細(xì)胞肺鱗癌的發(fā)生風(fēng)險具有相關(guān)性,其中等位基因G 可能是非小細(xì)胞肺鱗癌的保護性因素。本研究生物信息學(xué)相關(guān)分析結(jié)果提示rs9340 位點可能會影響miRNA 與MAPK1基因3'UTR 區(qū)域的相互作用,并與MAPK1基因的表達(dá)相關(guān),這可能是該位點與非小細(xì)胞肺鱗癌發(fā)生風(fēng)險相關(guān)的機制。非小細(xì)胞肺鱗癌與其他類型肺癌相比,預(yù)后不理想,并且缺乏可用的靶向藥物,往往對免疫治療的敏感性較低[20,46-47],結(jié)合本研究的發(fā)現(xiàn),未來應(yīng)繼續(xù)在更大規(guī)模人群中分析rs9340 位點與非小細(xì)胞肺鱗癌的相關(guān)性,并通過功能研究探究相關(guān)機制,為該位點在非小細(xì)胞肺鱗癌早期診斷及預(yù)后分析中的應(yīng)用提供必要的指導(dǎo)。
此外,本研究結(jié)果還顯示,在 <50 歲人群中,rs9340 位點與NSCLC 發(fā)生風(fēng)險相關(guān)。肺癌是全球及我國60 歲以上人群發(fā)病率及死亡率最高的惡性腫瘤[48],考慮到我國肺癌發(fā)病年齡較早,《中國肺癌篩查與早診早治指南》建議我國的肺癌篩查起始年齡為50 歲[21]。因此,未來有必要開展更多研究探討MAPK1基因3'UTR 區(qū)域的rs9340 位點在50 歲以下人群的NSCLC 風(fēng)險預(yù)測中的應(yīng)用。
綜上所述,本研究分析了4 個位于ERK1/2信號通路基因3'UTR 區(qū)域的SNP 位點與NSCLC發(fā)生風(fēng)險的相關(guān)性。研究結(jié)果初步揭示了位于MAPK1基因3'UTR 區(qū)域的rs9340 位點與NSCLC發(fā)生風(fēng)險的相關(guān)性及其可能的機制,未來應(yīng)在此基礎(chǔ)上進一步開展更大樣本量的相關(guān)性研究以及功能研究,闡明該位點在肺癌發(fā)生過程中發(fā)揮的作用及其機制,為該位點在肺癌的早期診斷及治療中的應(yīng)用提供研究基礎(chǔ)。