孫 娟,楊莉娜,崔昊晶,胡文良,蘇 琳,2
(1.內蒙古醫(yī)科大學附屬醫(yī)院耳鼻咽喉頭頸外科,內蒙古 呼和浩特 010000;2.內蒙古醫(yī)科大學研究生學院,內蒙古 呼和浩特 010050)
喉癌是頭頸部最常見的惡性腫瘤之一,發(fā)病率呈逐年上升趨勢[1]。喉癌發(fā)病隱匿,確診時多為晚期,預后不佳[2]。以手術為核心的綜合治療仍是喉癌的主要治療方式,但聲音嘶啞、吞咽困難等并發(fā)癥較為常見[3],患者在承受手術創(chuàng)傷的同時,還要承受失聲等并發(fā)癥帶來的心理打擊。有研究發(fā)現,蛋白激酶在調控腫瘤生長轉移等方面發(fā)揮重要作用[4]。近年來,針對蛋白激酶進行的分子靶向治療逐漸成為臨床腫瘤治療的熱點,并取得了良好效果[5],但蛋白激酶在喉癌中作為診療靶點的潛力仍有待進一步挖掘。本研究利用生物信息學方法篩選與喉癌預后相關的蛋白激酶,并建立喉癌預后預測模型,通過功能分析明確預后相關蛋白激酶的作用,以期為喉癌的診療和預后評估提供新的靶點。
從美國癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數據庫獲取96例喉鱗狀細胞癌患者的樣本轉錄組測序RNAseq數據及對應的臨床數據。96例喉癌患者中,男82例,女14例;年齡<65歲者65例,>65歲者31例;原發(fā)腫瘤浸潤T1~T2者17例,T3~T4者79例;淋巴結轉移N0者41例,N1~N3者55例;60例仍存活,36例已死亡。
利用R語言(版本4.0.3)limma包提取TCGA數據庫喉癌樣本的生存時間及生存狀態(tài)數據,再利用R語言survival包對蛋白激酶基因與喉癌預后生存時間的關系進行Cox單因素回歸分析,從而篩選與預后相關的基因。將蛋白激酶庫中的512個蛋白激酶基因和預后相關基因取交集后,獲得與喉癌預后相關的蛋白激酶基因。同時繪制森林圖,風險比(hazardratio,HR)>1代表高風險基因,HR<1代表保護基因。高風險基因表示蛋白激酶基因表達量與喉癌預后存在負相關,保護基因表示蛋白激酶基因表達量與喉癌預后存在正相關。
利用最小絕對收縮與選擇算子(least absolute shrinkage and selection operator,LASSO)回歸分析對TCGA數據庫中的喉癌樣本進行風險評分,并構建預后預測模型。LASSO模型通過懲罰機制篩選出與患者生存相關的關鍵基因。根據風險評分的中位值將總樣本分成高危組(高風險評分)和低危組(低風險評分)。基于R語言survival包比較2組患者生存差異。
利用注釋、可視化和集成發(fā)現數據庫(The Database for Annotation,Visualization and Integrated Disco-very,DAVID)v6.8分析喉癌中與預后相關的蛋白激酶基因,分別在生物學過程(biological process,BP)、分子功能(molecular function,MF)和細胞成分(cellular component,CC)層面分析預后相關蛋白激酶在喉癌中的作用。
采用R語言及其相應程序包進行生物信息學分析。采用limma包進行數據標準化和差異表達分析。使用survival包、glment包、survminer包構建Cox回歸模型,P<0.05為基因與預后具有顯著相關性。利用R語言pROC包繪制受試者工作特征(receiveropera-tingcharacteristic,ROC)曲線,獲得該模型預測喉癌患者預后的敏感度和特異度。利用riskScore、PCA、survStat和t-SNE的R包驗證模型預測的準確度。利用DAVID數據庫對基因進行功能分析,經Fisher精確檢驗,P<0.05為差異有統計學意義。
基于TCGA數據庫喉癌數據及Cox單因素回歸分析結果顯示,共有25個蛋白激酶基因與喉癌患者的預后生存時間顯著相關(P<0.05)。其中MAP3K5、IL20RA、NPM1、PLAU、LAMB3、LAMC2、IL1RAP、CDK1和CDH3等9個蛋白激酶基因是喉癌預后的高風險基因(HR>1,P<0.05)。GNG7、PRLR、ELMO1、XPA、MAP3K14、OAZ1、CD36、RGMB、NOTCH1、THEM4、MAVS、TNF、LAMP1、MSRB2、ENTPD1和GMIP等16個蛋白激酶基因是喉癌預后的保護基因(HR<1,P<0.05),見圖1。
圖1 與喉癌預后相關的蛋白激酶基因
基于蛋白激酶基因構建的喉癌預后預測模型顯示,通過計算MAP3K5、PRLR、OAZ1、CD36、RGMB、NOTCH1、THEM4、MAVS、IL20RA、NPM1、PLAU、MSRB2、ENTPD1、LAMC2、CDK1和GMIP等16個蛋白激酶基因的表達量所得出的風險評分能夠將喉癌樣本分成高危組和低危組。生存分析顯示,高危組的生存率顯著低于低危組(P<0.05),見圖2。
圖2 喉癌預后預測模型的生存率分析
ROC曲線分析結果顯示,風險評分的曲線下面積(areaunderthecurve,AUC)在生存曲線的第1~3年分別為0.778、0.782和0.815。隨著生存時間的延長,風險評分的AUC逐漸增大,提示該模型具有較高的預測喉癌預后的能力(圖3)。
圖3 喉癌預后預測模型的ROC曲線
基于蛋白激酶構建的喉癌預后預測模型的riskScore和survStat分析結果顯示,隨著患者風險評分的增加,高危組的病死率明顯高于低危組(P<0.05);PCA和t-SNE分析結果顯示,高危組和低危組的喉癌樣本分布差異顯著(P<0.05),見圖4。證實該模型預測喉癌預后的準確度較高。
a:riskScore分析;b:PCA分析;c:survStat分析;d:t-SNE分析
喉癌預后相關蛋白激酶的主要BP功能包括細胞黏附、細胞遷移正性調控、NF-kappaB及JUNK等信號通路的調控等(P<0.05);MF功能為蛋白激酶結合(P<0.05);CC功能提示這些蛋白激酶主要通過細胞膜發(fā)揮作用(P<0.05),見圖5。
圖5 喉癌預后相關蛋白激酶的GO功能分析
作為信號傳導途徑中的重要分子,蛋白激酶可通過磷酸化目標蛋白使信號逐級傳遞并放大,從而調節(jié)細胞的多種生物學行為,如細胞增殖、細胞凋亡、細胞周期、細胞移行等[6]。因此,蛋白激酶已成為抗癌治療的重要靶點,但蛋白激酶在癌癥預后預測方面的潛力還有待挖掘[7]。
本研究結果顯示,25個蛋白激酶基因與喉癌的預后密切相關,基于其中16個蛋白激酶基因表達量而算出的風險評分能夠將喉癌樣本分成高危組與低危組,且高危組生存率顯著低于低危組。提示由多種蛋白激酶所組成的基因集能夠識別喉癌患者的預后風險,可能是預測喉癌預后的重要標志物。這個基因集中的多個基因對腫瘤的發(fā)生發(fā)展具有重要的調控作用。如Takada等[8]通過RT-PCR發(fā)現MAP3K5在喉癌中高表達,但其在喉癌中的作用還不清楚;Pressinotti等[9]研究發(fā)現,MAP3K5在前列腺癌中高表達并能將患者分成高危組和低危組,是前列腺癌的潛在治療靶點。本研究結果顯示,MAP3K5是喉癌預后的高危因素之一,與上述研究一致,提示MAP3K5是喉癌診療的重要潛在靶點。Bednarek等[10]發(fā)現CDK1在喉癌中高表達;Lian等[11]發(fā)現CDK1能夠促進喉癌細胞發(fā)生淋巴轉移。本研究結果顯示,CDK1是喉癌預后的高危因素,CDK1的表達量與喉癌患者生存時間呈反比,與上述研究結果一致,提示CDK1是預測喉癌預后的重要靶點。Dasgupta等[12]發(fā)現CDH3在頭頸部鱗癌中高表達,但作用尚不清楚。Zhou等[13]發(fā)現在敲減CDH3后甲狀腺癌細胞增殖、侵襲被顯著抑制。Wang等[14]發(fā)現NPM1在喉癌中高表達,敲減NPM1后喉癌細胞的凋亡率顯著增加。有研究表明,LAMB3在多種癌細胞中高表達并可促進癌癥進展,如胰腺癌、結腸癌等[15-16],但在喉癌中的表達情況尚不清楚。GMIP是一個腫瘤抑制因子,在肺癌和膀胱癌中發(fā)揮重要抑癌作用[17-18];OAZ1是一個新型抑癌因子,過表達后能夠抑制非小細胞肺癌、口腔鱗癌等惡性腫瘤細胞增殖轉移[19-20]。本研究結果顯示,以上蛋白激酶在喉癌中低表達,并與喉癌患者的預后呈正相關,提示這些蛋白激酶具有作為喉癌診療新靶點的潛力。
有研究發(fā)現,細胞黏附與腫瘤轉移密切相關,黏附分子能提高癌細胞間的黏附性,使癌細胞之間保持密切接觸,不易脫離原發(fā)癌灶而發(fā)生遠處轉移[21]。此外,癌細胞可與血管內皮細胞黏附,使內皮基底膜充分暴露,進而促使更多癌細胞與基底膜黏附[22]。蛋白激酶在這一過程中發(fā)揮重要作用,如CDK1能夠通過調節(jié)細胞周期使細胞黏著斑發(fā)生變化,進而促進細胞發(fā)生遠處轉移[23]。蛋白激酶與細胞遷移也密切相關,如Yang等[24]研究發(fā)現NPM1能夠促進白血病細胞侵襲遷移。本研究功能分析結果顯示,喉癌預后相關蛋白激酶主要參與細胞黏附及細胞遷移正性調控等細胞生物學行為,提示喉癌預后相關蛋白激酶可能通過調控細胞黏附及遷移能力影響喉癌患者的預后。
目前,TNM分期是臨床上預測喉癌患者預后最主要的方法,但仍存在較大預測差異[25]。本研究基于預后相關蛋白激酶,利用LASSO回歸等方法建立了喉癌預后預測模型,其ROC曲線在確診后3年的預后預測能力持續(xù)升高,在第3年的預后預測AUC超過0.8,提示這一模型具有很強的預后預測特異度和敏感度,未來可為喉癌的臨床診療及預后預測提供新的切入點。