杜 強(qiáng),姚義勇,曾 剛
(南京醫(yī)科大學(xué)附屬蘇州醫(yī)院呼吸與危重癥醫(yī)學(xué)科,江蘇 蘇州 215008)
目前,肺癌的發(fā)病率和致死率在惡性腫瘤中位居首位。2018年全球腫瘤統(tǒng)計(jì)報(bào)告顯示,新發(fā)肺癌患者達(dá)210 萬,肺癌患者死亡人數(shù)為180 萬(約占癌癥死亡人數(shù)的1/5),其中東亞地區(qū)男性肺癌發(fā)病率全球最高,而女性患者發(fā)病率最高的是北美及歐洲等西方國(guó)家[1]。非小細(xì)胞肺癌是最常見的肺癌病理類型,占所有肺癌的85%,其中肺腺癌是最常見的非小細(xì)胞肺癌亞型,占比可達(dá)40%[2]。近年研究發(fā)現(xiàn),異常紡錘體樣小頭畸形相關(guān)基因(abnormal spindle-like microcephalyassociated gene,ASPM)參與神經(jīng)系統(tǒng)的發(fā)育、調(diào)節(jié)干細(xì)胞特性等功能[3]。此外,在神經(jīng)系統(tǒng)、消化系統(tǒng)、生殖系統(tǒng)等多種惡性腫瘤中,ASPM 表達(dá)水平較癌旁組織高,且高表達(dá)患者預(yù)后較差。但其影響腫瘤預(yù)后的分子作用機(jī)制不明確,此前報(bào)道可能通過調(diào)控細(xì)胞周期、p53、Wnt 等通路促進(jìn)腫瘤的發(fā)生發(fā)展[4],目前ASPM在肺腺癌中的作用研究甚少,缺乏ASPM對(duì)肺腺癌患者生存預(yù)后影響及潛在機(jī)制方面的研究。本研究旨在通過生物信息學(xué)方法研究ASPM 在肺腺癌中表達(dá)情況、對(duì)肺癌預(yù)后的影響及可能的作用機(jī)制。
從TCGA 數(shù)據(jù)庫(kù)下載肺腺癌患者RNASeq-2GeneNorm 表達(dá)譜數(shù)據(jù)和相關(guān)臨床數(shù)據(jù)共585 例(數(shù)據(jù)截止更新日期為2016 年01 月28 日),其中肺腺癌515例,剔除資料不全的樣本,具有完整生存隨訪時(shí)間的肺腺癌病例共470 例,其中男性病人219 例,女性病人251例,具有配對(duì)的癌旁組織共計(jì)58例;主要臨床資料包括年齡、吸煙史、TNM分期及生存狀態(tài)等。
1.2.1 生存分析將肺腺癌患者按照ASPM 表達(dá)水平高低進(jìn)行排序,以ASPM 表達(dá)水平中位數(shù)為界,分為低表達(dá)組和高表達(dá)組,使用SPSS 軟件中以Kaplan-Meier法分析患者的ASPM表達(dá)水平與生存期關(guān)系,進(jìn)行l(wèi)og-rank 檢驗(yàn);并采用Cox 回歸模型分析影響預(yù)后的危險(xiǎn)因素,計(jì)算風(fēng)險(xiǎn)比及95%置信區(qū)間,P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。
1.2.2 差異基因篩選從TCGA 數(shù)據(jù)庫(kù)下載表達(dá)數(shù)據(jù),按照ASPM 表達(dá)水平的中位數(shù)為界,分為低表達(dá)組和高表達(dá)組,使用R語言中的ballgown及ggplot軟件包進(jìn)行高低表達(dá)組間差異基因篩選[閾值設(shè)置:差異基因上調(diào)倍數(shù)(fold change,F(xiàn)C)≥1.3 或下調(diào)倍數(shù)≤0.8,P<0.05]。
1.2.3 差異基因GO 分析在DAVID 6.8 在線數(shù)據(jù)庫(kù)中(https://david.ncifcrf.gov/),對(duì)差異基因進(jìn)行GO(gene ontology)分析(物種和背景均為Homo sapiens),主要涉及細(xì)胞組分(cellular component,CC)、生物過程(biological process, BP) 和 分 子 功 能(molecular function,MF)。
1.2.4 ASPM 相關(guān)的信號(hào)通路富集分析按照ASPM表達(dá)水平分高表達(dá)組和低表達(dá)組,使用GSEA4.0.3進(jìn)行KEGG 信號(hào)通路分析,參數(shù)設(shè)置:Gene sets database:c2.cp.kegg.v7.1.symbols;Number of permutations:1 000 次;以|NES|>1,NOMP-value<0.05,F(xiàn)DRqvalue<0.25作為基因顯著富集的判斷標(biāo)準(zhǔn)。
1.2.5 蛋白交互網(wǎng)絡(luò)分析利用在線分析工具STRING(https://string-db.org/)預(yù)測(cè)差異蛋白間的相互作用,在STRING中輸入183個(gè)差異基因并分析,綜合評(píng)分≥0.7被認(rèn)為是有意義的,繪制蛋白質(zhì)網(wǎng)絡(luò)分析圖[5],將STRING 得到的差異基因?qū)隒ytoscape 軟件中,利用Cytohubba 插件基于最大鄰域分量法(maximum neighborhood component,MNC)分析關(guān)鍵基因。
癌和癌旁組織表達(dá)差異基因采用R 語言分析(ballgown及ggplot軟件包);統(tǒng)計(jì)分析使用SPSS 21.0軟件;ASPM mRNA 在癌和癌旁組織表達(dá)水平的差異采用GraphPad Prism 7 軟件作圖,采用配對(duì)樣本t檢驗(yàn);ASPM mRNA 表達(dá)與肺腺癌患者臨床病理學(xué)特征的關(guān)系采用χ2檢驗(yàn);生存分析采用Kaplan-Meier 法及l(fā)og-rank檢驗(yàn);并運(yùn)用Cox比例風(fēng)險(xiǎn)回歸模型分析影響患者預(yù)后危險(xiǎn)因素,P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
在TCGA 數(shù)據(jù)庫(kù)中具有完整資料的肺腺癌和匹配的癌旁組織共計(jì)58例,對(duì)其ASPM mRNA表達(dá)水平進(jìn)行分析顯示癌組織表達(dá)水平明顯高于匹配的癌旁組織,且差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖1。
圖1 癌和癌旁組織中ASPM的表達(dá)差異
通過篩選TCGA 數(shù)據(jù)庫(kù)中肺腺癌患者RNAseq 2GeneNorm 表達(dá)數(shù)據(jù)和相關(guān)臨床數(shù)據(jù),得到具有完整資料的腺癌病例470 例。采用卡方檢驗(yàn)分析ASPM mRNA 表達(dá)與臨床相關(guān)指標(biāo)如年齡(≤65 歲,>65 歲)、性別、吸煙史、T 分期、N 分期相關(guān)性。結(jié)果顯示,ASPM mRNA 表 達(dá) 與 年 齡(P=0.034)、性 別(P=0.026)、吸煙史(P=0.016)、T 分期(P=0.003)相關(guān),即ASPM mRNA在≤65歲、男性、有吸煙史及T2~4期的人群中表達(dá)量高,與N分期(P=0.327)無明顯相關(guān),見表1。
對(duì)470 例肺腺癌病例采用Kaplan-Meier 法及l(fā)ogrank 檢驗(yàn)分析,結(jié)果顯示ASPM mRNA 表達(dá)水平高的肺腺癌患者的生存期短(P=0.002),見圖2。對(duì)影響因素進(jìn)行單因素分析顯示年齡、性別、吸煙史與患者的生存期無明顯關(guān)系(P>0.05),而T 分期(P=0.004)、N 分期(P<0.01)與患者生存期相關(guān),即T分期、N分期越晚總體生存率越低;進(jìn)一步Cox 分析結(jié)果顯示N 分期[HR=2.313,95%CI(1.696,3.154),P<0.01)]、ASPM表達(dá)水平[HR=1.521,95%CI(1.114,2.076),P=0.008]均為影響肺腺癌預(yù)后的獨(dú)立危險(xiǎn)因素。見表2。
表1 ASPM mRNA表達(dá)與臨床病理參數(shù)相關(guān)性
圖2 生存曲線ASPM高低表達(dá)組的生存曲線
表2 肺腺癌患者生存期預(yù)后影響因素的單因素和多因素分析
將470 例肺腺癌患者按照ASPM mRNA 表達(dá)水平分為高表達(dá)組和低表達(dá)組,使用R 語言中ballgown 及ggplot軟件篩選出差異基因183個(gè),其中上調(diào)倍數(shù)≥1.3倍的有97 個(gè),下調(diào)倍數(shù)≤0.8 的有86 個(gè),P<0.01,根據(jù)上述數(shù)據(jù)構(gòu)建差異基因火山圖(圖3),列出其中表達(dá)差異最大的前10個(gè)基因(表3)。
圖3 差異基因的火山圖
利用DAVID 6.8軟件對(duì)183個(gè)差異基因進(jìn)行GO富 集分析(數(shù)目≥4,P<0.05),將差異基因分為BP、CC和MF 3 個(gè)亞類(圖4)。在生物過程方面主要富集于蛋白質(zhì)分解、細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)、細(xì)胞蛋白質(zhì)代謝過程、氧化應(yīng)激反應(yīng)等,在細(xì)胞組分方面,主要富集于細(xì)胞外間隙、細(xì)胞外區(qū)、細(xì)胞表面、蛋白質(zhì)細(xì)胞外基質(zhì)、核小體等,分子功能方面差異基因主要富集于鈣離子結(jié)合、絲氨酸型內(nèi)肽酶活性、激素活性、蛋白質(zhì)結(jié)合橋接、鈣依賴性蛋白結(jié)合方面。
按照ASPM mRNA 的表達(dá)量分為高表達(dá)組和低表達(dá)組,進(jìn)行GSEA 分析發(fā)現(xiàn)有18條通路出現(xiàn)有意義富集(表4),|NES|>2 的富集通路有7 條(圖5),主要集中于卵母細(xì)胞減數(shù)分裂、細(xì)胞周期、孕酮介導(dǎo)的卵母細(xì)胞成熟、p53 信號(hào)通路、同源重組、一碳代謝及DNA復(fù)制。
表3 表達(dá)差異最明顯的前10個(gè)基因
圖4 GO功能富集分析
表4 KEGG信號(hào)通路富集分析
通過STRING 在線工具對(duì)差異基因進(jìn)行分析,以綜合評(píng)分(high confidence)大于0.7 作為篩選標(biāo)準(zhǔn)構(gòu)建PPI網(wǎng)絡(luò)圖(圖6)。隨后將STRING獲取的節(jié)點(diǎn)數(shù)據(jù)導(dǎo)入Cytoscape 軟件中使用CytoHubba 插件篩選出關(guān)鍵基因4 個(gè)(圖7),分別為絲酶抑制蛋白家族D1 成員(serpin family D member 1,SERPIND1,MNC=7),纖維蛋白原β鏈(fibrinogen beta chain,F(xiàn)GB,MNC=7),纖維蛋白原α鏈(fibrinogen alpha chain,F(xiàn)GA,MNC=9),纖維蛋白原γ鏈(fibrinogen gamma chain,F(xiàn)GG,MNC=9)。
圖5 GSEA富集KEGG pathway基因集
圖6 差異表達(dá)蛋白的相互作用
圖7 蛋白相互作用中的關(guān)鍵基因
肺癌是全世界范圍內(nèi)發(fā)生率和死亡率最高的腫瘤,按病理可分為小細(xì)胞和非小細(xì)胞肺癌兩大類,其中85%以上都是非小細(xì)胞肺癌。盡管目前藥物和手術(shù)方式上都有了很大進(jìn)展,但由于缺乏早期癥狀且轉(zhuǎn)移風(fēng)險(xiǎn)高,多數(shù)患者確診時(shí)已處于晚期,5 年生存率低于15%[6]。肺腺癌屬于非小細(xì)胞肺癌一種,是原發(fā)性肺癌中發(fā)生率最高的亞型,占到全部肺癌病例的40%且呈現(xiàn)持續(xù)上漲的趨勢(shì)[7]。多數(shù)肺癌患者確診時(shí)已進(jìn)入進(jìn)展期或者出現(xiàn)遠(yuǎn)處轉(zhuǎn)移,失去了手術(shù)機(jī)會(huì),放化療等成為主要的治療方式。腫瘤的發(fā)生發(fā)展是一個(gè)復(fù)雜的過程,包括原發(fā)部位脫落、細(xì)胞外基質(zhì)降解、侵犯周圍組織、進(jìn)入血液及淋巴系統(tǒng)并最終形成一個(gè)新的病灶[8],涉及的機(jī)制眾多,常見的包括細(xì)胞周期、細(xì)胞凋亡、細(xì)胞自噬、免疫逃避及細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)等[9],而發(fā)現(xiàn)新的分子標(biāo)記物能夠讓腫瘤診斷窗口期前移,增加腫瘤患者手術(shù)治療機(jī)會(huì),并能更準(zhǔn)確評(píng)估患者預(yù)后。
本研究通過分析TCGA 數(shù)據(jù)庫(kù)中肺腺癌和癌旁組織臨床資料及mRNA 表達(dá)譜數(shù)據(jù),發(fā)現(xiàn)ASPM mRNA在肺腺癌組織中表達(dá)顯著上調(diào),其表達(dá)水平與年齡、性別、吸煙史、T 分期相關(guān),進(jìn)一步生存分析發(fā)現(xiàn)ASPM mRNA 表達(dá)水平、N 分期及T 分期與肺腺癌預(yù)后顯著相關(guān),且ASPM mRNA 高表達(dá)組患者總體生存率顯著下降。進(jìn)一步的多因素生存分析顯示ASPM 高表達(dá)是肺腺癌預(yù)后不良的獨(dú)立危險(xiǎn)因素,可作為判斷腫瘤預(yù)后的標(biāo)志物。
ASPM基因位于人類染色體1q31,編碼3 477 個(gè)氨基酸(蛋白410 kDa),由1個(gè)潛在的微管結(jié)合結(jié)構(gòu)域氨基末端、2個(gè)鈣調(diào)蛋白同源結(jié)構(gòu)域、81個(gè)異亮氨酸-谷氨酰重復(fù)序列和1 個(gè)未知功能的羧基末端組成,ASPM 蛋白以剪接異構(gòu)體的形式存在,包括124、164、218、250 和410 kDa,其中250 和410 kDa 富集于中心體和中間體,提示這兩種形式的剪接異構(gòu)體是ASPM蛋白的主要功能形式[10]。
最早發(fā)現(xiàn)ASPM 是參與神經(jīng)系統(tǒng)發(fā)育和腦體積增大中的關(guān)鍵蛋白[11],主要參與紡錘體的調(diào)節(jié)進(jìn)而在有絲分裂過程中發(fā)揮作用,該基因突變會(huì)導(dǎo)致常染色體隱性原發(fā)性小頭[12]。隨著研究的深入,發(fā)現(xiàn)ASPM是一種干細(xì)胞標(biāo)記物[13],并且在多種腫瘤細(xì)胞中高表達(dá),如膠質(zhì)瘤、胰腺癌、卵巢癌和肝細(xì)胞癌組織[14-16]。在膠質(zhì)瘤中,ASPM 在腫瘤組織中表達(dá)升高[17],結(jié)果在體外實(shí)驗(yàn)和大鼠成瘤實(shí)驗(yàn)得到進(jìn)一步驗(yàn)證,且ASPM 的表達(dá)水平與腫瘤的分期和復(fù)發(fā)率密切相關(guān),其可能機(jī)制是影響腫瘤干細(xì)胞的擴(kuò)增。在胰腺導(dǎo)管腺癌中,Xiong等[18]研究者通過RT-PCR方法證實(shí)ASPM 在癌組織中高表達(dá),且與腫瘤進(jìn)展密切相關(guān)。在前列腺癌中,Pai 等[19]研究發(fā)現(xiàn)ASPM 可能通過激活Wnt 信號(hào)通路促進(jìn)前列腺腫瘤進(jìn)展。ASPM 首先與通路上游Dvl-3 相互作用增加β-catenin 穩(wěn)定性并抑制其降解,使細(xì)胞內(nèi)β-catenin 濃度增加,通過Wnt-Frizzled-Dvl3-βcatenin 信號(hào)傳導(dǎo)方式促進(jìn)下游靶基因表達(dá),敲低ASPM 后則相應(yīng)出現(xiàn)侵襲增殖能力、克隆形成能力以及腫瘤細(xì)胞干性和成瘤能力的下降,由此可見ASPM 能夠促進(jìn)前列腺癌進(jìn)展。在侵襲性乳腺癌中,Shubbar等[20]研究發(fā)現(xiàn)只有ASPM和Cyclin B2與其相關(guān)存活率和臨床病理參數(shù)有關(guān),兩者共同參與乳腺癌發(fā)生、發(fā)展,推測(cè)參與細(xì)胞周期調(diào)控有關(guān),但詳細(xì)作用機(jī)制尚未闡明。
本文通過GO 分析發(fā)現(xiàn)ASPM 廣泛分布在細(xì)胞表面、胞質(zhì)內(nèi)及細(xì)胞核中,可能通過橋接作用、絲氨酸磷酸化等機(jī)制,參與蛋白質(zhì)分解、細(xì)胞間信號(hào)傳導(dǎo)等方面參與腫瘤的發(fā)生發(fā)展,通過PPI 網(wǎng)絡(luò)圖,本研究發(fā)現(xiàn)了與ASPM 有密切作用的4 個(gè)蛋白(SERPIND1、FGB、FGA、FGG),并分析了KEGG 信號(hào)通路,發(fā)現(xiàn)ASPM 參與的機(jī)制眾多,主要集中于細(xì)胞分化的早期階段,如DNA 復(fù)制、減數(shù)分裂及細(xì)胞周期等,提示ASPM 可以通過多個(gè)方面的分子機(jī)制共同促進(jìn)腫瘤發(fā)展。
綜上所述,本研究利用生物信息學(xué)方法分析ASPM mRNA 在肺腺癌組織中高表達(dá)且與患者總體生存率呈負(fù)相關(guān),是肺腺癌的一項(xiàng)新的獨(dú)立預(yù)后指標(biāo),SERPIND1、FGB、FGA、FGG 4 個(gè)蛋白是ASPM 起作用的關(guān)鍵分子,通過影響細(xì)胞發(fā)育的早期階段來促進(jìn)肺腺癌進(jìn)展,這些可以作為肺腺癌的潛在診斷和治療靶點(diǎn)。本研究局限性在于僅基于公共數(shù)據(jù)庫(kù)所提供的mRNA 表達(dá)水平分析,缺乏足夠的臨床樣本及細(xì)胞、動(dòng)物實(shí)驗(yàn)支持,本課題組后續(xù)將通過相關(guān)實(shí)驗(yàn)研究進(jìn)一步探索ASPM 在肺腺癌中的具體機(jī)制,為肺癌的診斷和治療提供一個(gè)新方向。