呂勝男, 彭新宇, 張 健, 劉 歡, 魏 鋒
吉林大學(xué)第一醫(yī)院普通外科中心肝膽胰腺外科, 長春 130021
胰腺癌是消化系統(tǒng)惡性程度最高的腫瘤之一,5年生存率不到9%,目前的治療手段對患者生存期的改善仍十分有限[1],大多數(shù)患者死于腫瘤復(fù)發(fā)或轉(zhuǎn)移,因此尋找新的標(biāo)志物對于評價(jià)胰腺癌的預(yù)后具有重要的臨床意義。
內(nèi)質(zhì)網(wǎng)應(yīng)激是細(xì)胞常見的一種適應(yīng)性反應(yīng),當(dāng)細(xì)胞受到內(nèi)外不良環(huán)境的影響時(shí),內(nèi)質(zhì)網(wǎng)應(yīng)激被激活,通過激活未折疊蛋白質(zhì)反應(yīng)和回收錯(cuò)誤折疊的蛋白質(zhì)分子,使細(xì)胞恢復(fù)穩(wěn)態(tài),維持細(xì)胞存活,而當(dāng)細(xì)胞穩(wěn)態(tài)無法被恢復(fù)時(shí),內(nèi)質(zhì)網(wǎng)應(yīng)激也會(huì)誘導(dǎo)細(xì)胞凋亡。內(nèi)質(zhì)網(wǎng)應(yīng)激在多種腫瘤中具有重要功能[2],其既可以調(diào)控腫瘤細(xì)胞本身的生存狀態(tài),影響腫瘤細(xì)胞的信號通路改變及侵襲、遷移表型的變化,也可以調(diào)控腫瘤微環(huán)境內(nèi)巨噬細(xì)胞[3]、自然殺傷細(xì)胞(NK 細(xì)胞)等免疫細(xì)胞的功能狀態(tài)[4],進(jìn)一步影響腫瘤進(jìn)展。內(nèi)質(zhì)網(wǎng)應(yīng)激在胰腺癌的發(fā)生發(fā)展中具有重要的調(diào)控作用[5],但其與胰腺癌預(yù)后的關(guān)系尚未明確。
因此,本研究利用了生物信息學(xué)方法,分析內(nèi)質(zhì)網(wǎng)應(yīng)激基因在胰腺癌組織和正常胰腺組織中的表達(dá)特征,并據(jù)此劃分預(yù)后不同的胰腺癌亞群,進(jìn)一步篩選亞群間的差異表達(dá)基因作為預(yù)后標(biāo)志分子,構(gòu)建了胰腺癌的預(yù)后預(yù)測模型,最后通過生物學(xué)實(shí)驗(yàn)驗(yàn)證預(yù)后標(biāo)志分子在胰腺癌組織內(nèi)的表達(dá)情況。該研究證實(shí)了內(nèi)質(zhì)網(wǎng)應(yīng)激基因影響胰腺癌預(yù)后,并篩選出最可能作為預(yù)后標(biāo)志物和治療靶點(diǎn)的基因,為此后基于內(nèi)質(zhì)網(wǎng)應(yīng)激的胰腺癌治療的相關(guān)研究提供了重要思路。
1.1 材料與試劑
1.1.1 組織樣本 利用生物信息學(xué)分析方法,對人類癌癥基因組圖譜(TCGA)及基因型-組織表達(dá)(GTEx)數(shù)據(jù)庫收錄的177 例胰腺癌樣本和170 例正常胰腺組織樣本的轉(zhuǎn)錄組數(shù)據(jù)中的260 個(gè)內(nèi)質(zhì)網(wǎng)應(yīng)激基因的表達(dá)特征進(jìn)行分析,并依據(jù)差異表達(dá)且影響預(yù)后的內(nèi)質(zhì)網(wǎng)應(yīng)激基因劃分胰腺癌亞群。實(shí)驗(yàn)所用的40 對胰腺癌組織和癌旁正常胰腺組織標(biāo)本來源于吉林大學(xué)第一醫(yī)院普通外科中心肝膽胰外科,經(jīng)術(shù)后病理確診為胰腺導(dǎo)管腺癌。
1.1.2 主要試劑和儀器 實(shí)時(shí)熒光定量PCR 儀購自美國Roche 公司;研究所用的RNA 采用總RNA 提取試劑盒(Invitrogen,美國)提取,利用PrimeScript RT reagent Kit (Takara)及通用引物對RNA 進(jìn)行反轉(zhuǎn)錄,應(yīng)用SYBR Primix Ex Taq 酶(Takara)進(jìn)行實(shí)時(shí)熒光定量,引物序列在表1中列出。
表1 引物序列Table 1 Primer sequences
1.2 實(shí)驗(yàn)方法
1.2.1 研究數(shù)據(jù)獲取及處理 通過基因組數(shù)據(jù)共享數(shù)據(jù)門戶(https://portal. gdc. cancer. gov/)平臺(tái)下載了TCGA和GTEx數(shù)據(jù)庫收錄的胰腺癌和正常胰腺組織樣本的轉(zhuǎn)錄組測序數(shù)據(jù)。利用R 分析軟件(R-4.2.1)的limma(3.52.4)包進(jìn)行歸一化處理,應(yīng)用Sva(3.46.0)包進(jìn)行去批次效應(yīng)。
1.2.2 內(nèi)質(zhì)網(wǎng)應(yīng)激基因的獲取 通過MsigDB 網(wǎng)站(https://www. gsea-msigdb. org/gsea/msigdb)獲取到與內(nèi)質(zhì)網(wǎng)應(yīng)激相關(guān)的260個(gè)基因。
1.2.3 差異表達(dá)分析 通過R 分析軟件DESeq2(1.36.0)包進(jìn)行差異表達(dá)分析,并計(jì)算表達(dá)量倍數(shù)(fold change,F(xiàn)C),篩選條件為:|log2FC|≥1 且校正后的P值(Padj)<0.05。
1.2.4 共識(shí)聚類分析 利用R 分析軟件的ConsensusClusterPlus(1.60.0)包對TCGA 胰腺癌隊(duì)列的177例樣本進(jìn)行共識(shí)聚類分析,迭代次數(shù)為50次。
A:如果這位老師扮演的角色就只是“管工”,那么,孩子即使很努力,也無法“用心學(xué)習(xí)”的。如果加上家長只會(huì)等著“收割”,那就是不斷制造壓力,讓孩子失去學(xué)習(xí)興趣。一年級的孩子需要半年的“磨合期”,對學(xué)校的制度、對老師的教學(xué)、對時(shí)間的管理,都需要重新適應(yīng),老師和家長的幫助必不可少。
1.2.5 總RNA 提取及反轉(zhuǎn)錄 按照Invitrogen 總RNA 提取試劑盒的說明書提取細(xì)胞總RNA 并測定RNA 濃度,按照逆轉(zhuǎn)錄試劑盒的操作步驟將RNA 反轉(zhuǎn)錄為cDNA。
1.2.6 實(shí)時(shí)熒光定量PCR 以反轉(zhuǎn)錄獲得的cDNA為模板進(jìn)行實(shí)時(shí)熒光定量PCR,以GAPDH 作為內(nèi)參基因,采用Folds=2-ΔΔCT公式計(jì)算實(shí)驗(yàn)組與對照組的相對倍數(shù)關(guān)系。每個(gè)實(shí)驗(yàn)重復(fù)3次,取平均值。
1.3 統(tǒng)計(jì)學(xué)方法 采用SPSS 20.0 統(tǒng)計(jì)軟件以及GraphPad Prism10進(jìn)行數(shù)據(jù)分析。計(jì)量資料以±s表示,兩組間比較采用成組t檢驗(yàn)。計(jì)數(shù)資料兩組間比較采用χ2檢驗(yàn)。通過R 分析軟件的survival(3.5-0)包進(jìn)行單因素Cox 回歸分析,判斷單個(gè)變量與患者預(yù)后的關(guān)系,對有統(tǒng)計(jì)學(xué)意義的變量應(yīng)用R 軟件glmnet(4.1-6)包進(jìn)行Lasso回歸分析篩選,以得到系數(shù)不為0的特征變量?;赗分析軟件的survival 和 surviminer包進(jìn)行生存分析,并繪制Kaplan-Meier生存曲線,利用Log-rank 檢驗(yàn)進(jìn)行生存期的比較。應(yīng)用R 軟件caret(6.0-93)包進(jìn)行預(yù)測模型的建立,并利用ROCR(1.0-11)包繪制受試者工作特征(ROC)曲線,通過評估ROC曲線下的面積以評價(jià)模型的預(yù)測價(jià)值。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2.1 與胰腺癌預(yù)后相關(guān)的內(nèi)質(zhì)網(wǎng)應(yīng)激基因 對在TCGA和GTEx隊(duì)列中胰腺癌腫瘤組(n=177)和正常組(n=170)之間差異表達(dá)的內(nèi)質(zhì)網(wǎng)應(yīng)激基因進(jìn)行單因素Cox回歸分析,結(jié)果顯示,MARCKS為胰腺癌預(yù)后的保護(hù)因素,而CEBPB、PMAIP1、UBXN10 是胰腺癌預(yù)后的獨(dú)立危險(xiǎn)因素(圖1)。
圖1 胰腺癌預(yù)后相關(guān)內(nèi)質(zhì)網(wǎng)應(yīng)激基因森林圖Figure 1 Forest map of ER stress genes associated with prognosis in pancreatic cancer
2.2 兩種預(yù)后不同的胰腺癌亞群 基于CEBPB、MARCKS、PMAIP1、UBXN10 的表達(dá)量對TCGA 胰腺癌隊(duì)列中177 個(gè)腫瘤樣本進(jìn)行了共識(shí)聚類分析(圖2a),確定聚類變量K=2 為最佳分簇?cái)?shù)并最終獲得兩個(gè)胰腺癌亞群:簇A(n=106)和簇B(n=71),簇B 患者的總體生存期要明顯長于簇A(χ2=12.232,P=0.01)(圖2b)。
圖2 依據(jù)胰腺癌內(nèi)質(zhì)網(wǎng)應(yīng)激基因劃分的兩個(gè)亞群的聚類熱圖及生存曲線Figure 2 Cluster heat map and survival curve of two clusters of pancreatic cancer based on ER stress genes
2.3 胰腺癌亞群預(yù)后的獨(dú)立危險(xiǎn)因素 分析了簇A和簇B 的基因差異表達(dá)情況,依據(jù)|log2
FC|≥1 且Padj<0.05的篩選條件共獲得了51個(gè)差異基因(附錄A),通過單因素Cox 回歸分析,鑒定出14個(gè)與總生存期相關(guān)的基因,且均為胰腺癌預(yù)后的危險(xiǎn)因素(附錄A)。
2.4 成功構(gòu)建胰腺癌預(yù)后預(yù)測模型
2.4.1 構(gòu)建胰腺癌預(yù)后預(yù)測模型 對14 個(gè)預(yù)后相關(guān)的差異基因進(jìn)行分析,應(yīng)用Lasso 回歸分析方法,通過交叉驗(yàn)證實(shí)驗(yàn)得出log(λ)最小值為5(注:λ 表示懲罰系數(shù))(圖3a),確定構(gòu)建模型的5 個(gè)最佳基因并計(jì)算了回歸系數(shù)(圖3b),風(fēng)險(xiǎn)評分方程為:風(fēng)險(xiǎn)評分=0.156×CDA+0.135×AHNAK2+0.020×RHOV+0.095×LY6D+0.054×SPRR1B。將TCGA胰腺癌隊(duì)列的177個(gè)腫瘤患者根據(jù)中位風(fēng)險(xiǎn)值分為高風(fēng)險(xiǎn)或低風(fēng)險(xiǎn),采用留出法進(jìn)行訓(xùn)練集和測試集的劃分,訓(xùn)練集∶測試集=7∶3,通過隨機(jī)抽樣方法將177 個(gè)樣本劃分為訓(xùn)練集(n=125)和測試集(n=52)以訓(xùn)練并測試模型,結(jié)果顯示,該模型總體預(yù)測性能較好,預(yù)測患者1、3、5 年生存期的準(zhǔn)確率分別為0.731、0.712、0.686(圖3c),且該模型所預(yù)測的高風(fēng)險(xiǎn)患者的總體生存期與低風(fēng)險(xiǎn)組相比明顯縮短(χ2=11.733,P=0.001)(圖3d)。
圖3 Lasso回歸結(jié)果及模型預(yù)測效果Figure 3 The results of Lasso regression and the effectiveness of this prediction model
采用χ2檢驗(yàn)比較TCGA 胰腺癌隊(duì)列高低風(fēng)險(xiǎn)組之間的臨床特征(包括年齡、性別、腫瘤分期、T、N、M分期),結(jié)果顯示兩組之間的年齡、性別、腫瘤分期、T分期、N 分期均無顯著差異,而M 分期存在差異(χ2=8.730,P=0.007),但可能是大量樣本的遠(yuǎn)處轉(zhuǎn)移情況無法評估導(dǎo)致的(附錄B)。
2.4.2 外部數(shù)據(jù)集驗(yàn)證反映模型的預(yù)測效果良好驗(yàn)證了該模型對來自GEO 數(shù)據(jù)庫的外部數(shù)據(jù)集GSE57495 的預(yù)測效果,結(jié)果顯示,該模型表現(xiàn)出了良好的預(yù)測性能,預(yù)測患者1、3、5 年生存期的準(zhǔn)確率分別為0.674、0.680、0.608(圖4a),且該模型所預(yù)測的高風(fēng)險(xiǎn)患者的總體生存期與低風(fēng)險(xiǎn)組相比明顯縮短(χ2=5.303,P<0.05)(圖4b)。
圖4 模型對外部數(shù)據(jù)集生存期的預(yù)測結(jié)果Figure 4 Survival prediction of external datasets using this model
2.5 CDA、AHNAK2、RHOV、LY6D、SPRR1B 在胰腺癌組織中的表達(dá)情況 檢測了在40 對胰腺癌組織和癌旁正常組織中的基因表達(dá)量,結(jié)果顯示,與癌旁正常組織相比,CDA(t=2.529,P=0.013 4)、AHNAK2(t=2.458,P=0.016 2)、RHOV(t=3.314,P=0.001 4)、LY6D(t=3.583,P=0.000 6)、SPRR1B(t=5.082,P<0.000 1)在胰腺癌組織中顯著上調(diào)(圖5)。
圖5 CDA、AHNAK2、RHOV、LY6D、SPRR1B在腫瘤組織和正常組織的表達(dá)量Figure 5 The expression levels of CDA, AHNAK2,RHOV, LY6D, and SPRR1B in the tumor and normal tissues
胰腺癌是消化系統(tǒng)常見的惡性腫瘤,是全球所有癌癥中第二大致死性病因,目前胰腺癌的5 年生存率約為9%[6]。近幾年來胰腺癌的發(fā)病率仍呈逐年上升趨勢,但病死率并沒有因技術(shù)手段發(fā)展出現(xiàn)明顯改善,仍和發(fā)病率基本持平[7-8]。其根本原因在于胰腺癌的早期診斷困難,大部分患者起病隱匿,且臨床癥狀不典型,導(dǎo)致許多患者錯(cuò)過了最佳的治療時(shí)機(jī),且胰腺癌惡性程度高,容易發(fā)生神經(jīng)、血管浸潤及轉(zhuǎn)移。目前針對胰腺癌患者的治療策略仍以手術(shù)治療為主[9],輔助吉西他濱等化療藥物治療,由奧沙利鉑、伊立替康、氟尿嘧啶、亞葉酸鈣組成的Forfirinox 聯(lián)合化療方案也取得了良好的效果[10]。但尚未研制出有效的分子靶向藥物,常規(guī)的免疫治療方法在胰腺癌中也已達(dá)到理想的療效[11]。如何找到有效的治療藥物,延長胰腺癌患者生存期,仍是醫(yī)學(xué)界亟待攻克的難關(guān)。
內(nèi)質(zhì)網(wǎng)應(yīng)激在胰腺癌的發(fā)生發(fā)展中具有重要作用。內(nèi)質(zhì)網(wǎng)應(yīng)激基因BZW1 能夠以PERK 通路依賴的形式促進(jìn)胰腺癌細(xì)胞的Warburg效應(yīng)進(jìn)而促進(jìn)動(dòng)物模型體內(nèi)的腫瘤生長[12],內(nèi)質(zhì)網(wǎng)氧化還原酶1 α在內(nèi)質(zhì)網(wǎng)應(yīng)激條件下上調(diào),并能夠促進(jìn)胰腺癌細(xì)胞的增殖[13]。此外,有研究[14]表明內(nèi)質(zhì)網(wǎng)應(yīng)激可能與胰腺癌的不良預(yù)后相關(guān),葡萄糖調(diào)節(jié)蛋白78(glucose-regulated protein 78,GRP78)是一種重要的內(nèi)質(zhì)網(wǎng)伴侶蛋白,它被視為內(nèi)質(zhì)網(wǎng)應(yīng)激的標(biāo)志物,來自180 例胰腺癌患者的基于組織微陣列的腫瘤和正常組織的免疫組化顯示,與非腫瘤組織相比,癌細(xì)胞中的GRP78 表達(dá)顯著增加(P<0.05),GRP78 的高表達(dá)與更高的T 分期和較差的總生存期有關(guān)(P<0.05)[15]。多變量分析顯示,內(nèi)質(zhì)網(wǎng)跨膜蛋白ATF6α 高表達(dá)和磷酸化P38 低表達(dá)的組合與胰腺癌患者的不良結(jié)局(HR=2.705,P=0.023)以及腫瘤分級(HR=2.886,P=0.029)相關(guān)[16]。
但目前尚無研究闡述內(nèi)質(zhì)網(wǎng)應(yīng)激基因能否作為胰腺癌的預(yù)后分子標(biāo)志物,本研究適時(shí)地填補(bǔ)了這一領(lǐng)域的空白。筆者首次揭示了內(nèi)質(zhì)網(wǎng)應(yīng)激基因作為胰腺癌預(yù)后的獨(dú)立相關(guān)因素的重要價(jià)值,并成功依據(jù)它們的表達(dá)特征實(shí)現(xiàn)了胰腺癌亞群的劃分。對兩個(gè)亞群間的基因表達(dá)特征的進(jìn)一步探究發(fā)現(xiàn)了對胰腺癌預(yù)后有重要影響的14 個(gè)差異基因,并從中篩選出最重要的5 個(gè)基因:CDA、AHNAK2、RHOV、LY6D、SPRR1B,并且依據(jù)該組核心基因成功構(gòu)建了胰腺癌的預(yù)后預(yù)測模型,而這一組基因在胰腺癌中的重要作用此前鮮有報(bào)道。有研究表明CDA編碼胞苷脫氨酶,在胰腺癌組織中高表達(dá),能夠滅活吉西他濱,降低其對腫瘤細(xì)胞的毒性[17],高表達(dá)CDA的巨噬細(xì)胞也與胰腺癌的吉西他濱耐藥相關(guān)[18]。而AHNAK2 目前在胰腺癌中的研究較少,僅有一項(xiàng)薈萃分析[19]提示AHNAK2可以作為胰腺癌的診斷分子。既往有其他生物信息學(xué)分析提出LY6D與胰腺癌的不良預(yù)后相關(guān)[20]。僅有一項(xiàng)研究[21]表明SPRR1B是胰腺癌預(yù)后的危險(xiǎn)因素。而RHOV在胰腺癌中的作用尚未被提及。
本研究的局限性在于,只能依據(jù)生物信息學(xué)分析推測變量與結(jié)局之間的相關(guān)性,并結(jié)合生物學(xué)背景進(jìn)行一定的推測,但無法明確地闡明因果關(guān)系,這也是生物信息學(xué)的局限性所在。如需探究某變量變化與腫瘤發(fā)生發(fā)展的先后順序,揭示其內(nèi)在作用機(jī)制,仍需要在體內(nèi)和體外實(shí)驗(yàn)中通過分子生物學(xué)實(shí)驗(yàn)具體研究。此外,本研究只利用了TCGA 數(shù)據(jù)庫的胰腺癌隊(duì)列數(shù)據(jù)進(jìn)行模型訓(xùn)練,如果能納入多中心、多樣本數(shù)據(jù),將有希望提升模型預(yù)測的準(zhǔn)確性。
總之,本研究在構(gòu)建胰腺癌內(nèi)質(zhì)網(wǎng)應(yīng)激基因分型的基礎(chǔ)上,依據(jù)亞群間基因的表達(dá)差異篩選出5 個(gè)核心基因用以構(gòu)建胰腺癌的預(yù)后預(yù)測模型,最終在40對胰腺癌組織中驗(yàn)證了它們的高水平表達(dá)。本研究揭示了內(nèi)質(zhì)網(wǎng)應(yīng)激在胰腺癌發(fā)生發(fā)展中的重要作用,為尋找胰腺癌治療靶點(diǎn)、預(yù)測胰腺癌患者預(yù)后提供了重要的參考價(jià)值。
倫理學(xué)聲明:本研究方案于2022年2月28日經(jīng)由吉林大學(xué)第一醫(yī)院倫理委員會(huì)審批,批號:2022-017。
利益沖突聲明:本文不存在任何利益沖突。
作者貢獻(xiàn)聲明:呂勝男負(fù)責(zé)課題設(shè)計(jì),數(shù)據(jù)收集與分析,實(shí)驗(yàn)設(shè)計(jì)及操作,撰寫論文;彭新宇負(fù)責(zé)數(shù)據(jù)分析及撰寫代碼;張健負(fù)責(zé)修改文章;劉歡負(fù)責(zé)組織樣本收集及處理;魏鋒負(fù)責(zé)擬定研究思路,指導(dǎo)文章撰寫并最后定稿。