鐘慧敏 莫華倩 姜燕慧 沈婷 劉宜敏
胰腺癌(pancreatic adenocarcinoma,PAAD)是常見的惡性程度較高的消化系統(tǒng)腫瘤,發(fā)病率、死亡率分別位于惡性腫瘤中前10 位、第4 位[1]。手術治療和化療是其主要治療手段,然而目前二者對PAAD 患者的總體生存率影響有限[2]。盡管CA19?9、CA125、CEA 等可作為PAAD 診斷和預后的臨床標志物,但其預測準確性還有待提高[3]。因此,需要找到新的生物標志物以實現胰腺癌的早期診斷,把握胰腺癌的關鍵治療時機。
C19orf33 基因是由4 個跨越約1 kbp 的外顯子組成,位于HAI?2 基因下游的11 kbp 處[4]。研究表明,C19orf33 在多種腫瘤如卵巢癌中表達異常且與預后緊密相關[5]。但其在胰腺癌中的作用還尚未研究透徹。因此,本研究旨在通過生物信息學分析TCGA(The Cancer Genome Atlas)數據庫中C19orf33 和臨床相關信息,評估C19orf33 基因表達在胰腺癌中的診斷和預后價值,并對其潛在的作用機制進行探索。
1.1 一般資料我們從TCGA 數據庫和基因型組織表達數據庫(Genotype?Tissue Expression,GTEx,V8 版本)中下載最新的RNA 測序數據和相應的臨床病理信息(截止至2021 年1 月2 日)?;颊呔炇鹬橥鈺⑼ㄟ^醫(yī)院倫理委員會批準(2021?KY015)。病例排除標準:(1)“0”基因表達值;(2)臨床資料不完整;(3)組織病理類型不為PAAD 的患者;(4)生存時間<1個月的患者;共納入178例符合標準的PAAD 樣本和336 例正常胰腺組織樣本。為了提高篩選結果的可靠證據,我們另外從GEO(Gene Expression Omnibus)數據庫下載GSE71729數據集的RNA 芯片表達和相關臨床數據,包括145例腫瘤組織和46例胰腺正常組織[6]。
1.2 差異表達基因篩選R 軟件deseq2 包、GEO2R 分別用于篩選TCGA?PAAD、GTEx 和GSE71729 數據集中胰腺癌和正常胰腺組織的差異表達的基因(differentially expressed genes,DEGs)及與C19orf33 相關的DEGs[7];R 軟件ggplot2 包繪制差異表達火山圖和上調及下調DEGs 的韋恩圖(Venn),確定可信的DEGs。差異表達的篩選閾值為:|log2(FC)|>2&p.adjust<0.05。
1.3 生存分析采用基因表達中位數作為分組依據,Kaplan?Meier 法分析不同組的OS 和PFI 的預后差異,預后數據來自《Cell》的一篇文章[8]。
1.4 差異表達及ROC分析Mann?Whitney U 檢驗探索TCGA?PAAD、GTEx 數據集胰腺癌與正常胰腺組織及腫瘤不同T 分期亞組之間的C19orf33 表達差異,R 軟件包ggplot2 繪制箱式圖。受試者工作特征曲線(receiver operating characteristic curve,ROC)曲線下面積(area under the curve,AUC)預測C19orf33 表達對患者是否罹患胰腺癌和腫瘤T 分期的診斷價值。
1.5 REACTOME 和KEGG GSEA 分析參考基因集合為MSigDB(v7.4)[9]中的c2.cp.v7.2.symbols.gmt[Curated],每次分析重復1000 次,用Benjamini?Hochberg 方法進行P 值矯正,以標準化富集分數(normalized enrichment score,NES)>1.5,錯誤發(fā)現率(false discovery rate,FDR)<0.25 且p.adjust<0.05作為顯著富集標準。
1.6 統(tǒng)計學分析所有統(tǒng)計學分析和可視化均使用R 軟件(v.3.6.3)進行。Excel 軟件(v2020)進行統(tǒng)計描述;χ2檢驗和Fisher 精確檢驗進行統(tǒng)計檢驗。Kaplan?Meier 法計算生存率;使用單因素和多因素Cox 比例風險模型進行生存分析。具有統(tǒng)計學意義的檢驗水準為P<0.05。
2.1 差異表達基因篩選及C19orf33 的生存分析和差異表達結果見圖1。
圖1 差異表達基因篩選及C19orf33 的生存分析和差異表達結果
2.2 C19orf33 是胰腺癌OS 相關的獨立預后危險因素見表1。
表1 胰腺癌患者C19orf33 相關的基線資料表
2.3 胰腺癌患者中基于C19orf33 表達水平的REACTOME 和KEGG 功能富集分析見圖2。
圖2 REACTOME 和KEGG GSEA 分析胰腺癌中C19orf33 高、低表達組DEGs 富集的功能和通路
胰腺癌是常見的消化系統(tǒng)惡性腫瘤,易發(fā)生轉移,預后極差,且當前治療手段對PAAD 患者的總體生存率影響有限。研究表明C19orf33 高表達與多種腫瘤的預后較差緊密相關。然而,C19orf33在PAAD 中的臨床意義、作用和分子機制仍不明確,因此C19orf33 在胰腺癌腫瘤發(fā)生發(fā)展中的確切作用值得進一步研究。
在這項研究中,我們篩選發(fā)現C19orf33 在PAAD 中具有差異表達,進一步地,我們發(fā)現C19orf33 表達水平與PAAD 患者的總生存率及無進展間期呈負相關(P均<0.05),同時,ROC 曲線分析也證實C19orf33 表達可作為胰腺癌理想的診斷生物標志物。與我們研究結果相似,研究發(fā)現在乳頭腎細胞癌、結直腸癌[10]中,C19orf33 高表達,且與其預后差相關。這表明C19orf33 可作為惡性腫瘤患者的預后預測標志物。然而其具體相關作用機制尚不明確。
有研究表明C19orf33 可分別通過調節(jié)上皮?間充質轉化或與Hippo 通路YAP1 協(xié)調作用進而抑制乳腺癌細胞系或甲狀腺乳頭狀癌細胞的進展[11]。本研究中,我們也發(fā)現C19orf33 在神經活性配體和受體間相互作用、趨化因子信號通路等多個信號通路上聚集,由此可見,C19orf33 在免疫相關的生物學過程中發(fā)揮著一定作用。但是C19orf33 與這些通路之間的確切相互作用關系還有待進一步的實驗驗證。
綜合上述分析,C19orf33 不僅對胰腺癌患者的疾病狀態(tài)具有診斷價值,而且是胰腺癌的獨立預后危險因素,但尚需開展更多的實驗來進一步驗證。