林思其,張澤鑫,夏睿琪,劉紫鳳,陳林靜,陳栩靜,陳祎琦
(1.廣州中醫(yī)藥大學(xué)第二臨床醫(yī)學(xué)院,廣東 廣州 510405;2.廣州中醫(yī)藥大學(xué)第一臨床醫(yī)學(xué)院,廣東 廣州 510405)
肝細(xì)胞癌(hepatocellular carcinoma,HCC)是世界上第5 大常見的惡性腫瘤[1],全球發(fā)病率逐步上升[2]。目前,手術(shù)治療是HCC 的主要治療方法,然而術(shù)后5 年復(fù)發(fā)率已達(dá)70%[3],生存質(zhì)量難以提高。到目前為止,一些生物標(biāo)志物已被證明與HCC 的發(fā)生發(fā)展相關(guān),但其可靠性仍存在爭(zhēng)議。miRNA 是一種非編碼RNA,其失調(diào)會(huì)導(dǎo)致細(xì)胞的異常生長和生物合成,促進(jìn)腫瘤的發(fā)生發(fā)展[4]。此外,不同表達(dá)譜的miRNA 可以作為腫瘤診斷和預(yù)后的分子標(biāo)志物,如血清miR-122 可以作為HCC 診斷標(biāo)志物之一[5]。Liu G 等[6]已構(gòu)建了HCC 的miRNA 特征預(yù)后模型,但并沒有進(jìn)行驗(yàn)證和風(fēng)險(xiǎn)評(píng)估。本研究構(gòu)建并驗(yàn)證了一種新的miRNA 預(yù)后模型,旨在評(píng)估TCGA 數(shù)據(jù)庫中HCC 患者過度生存情況,探究三種miRNA 信號(hào)的潛在生物學(xué)特征、腫瘤相關(guān)功能和信號(hào)通路,為了解HCC 模型的分子機(jī)制提供依據(jù),現(xiàn)報(bào)道如下。
1.1 數(shù)據(jù)下載和處理 miRNA 的表達(dá)數(shù)據(jù)如下:[病例(373):項(xiàng)目(TCGA)、項(xiàng)目(TCGA-LIHC)、基本位點(diǎn)(肝臟)、疾病類型(腺瘤和腺癌);檔案(425):數(shù)據(jù):類型(亞型表達(dá)定量分析)、類別(轉(zhuǎn)錄組分析)]。mRNA 表達(dá)數(shù)據(jù)如下:[病例(371):項(xiàng)目(TCGA)、項(xiàng)目(TCGA-LIHC)、基本位點(diǎn)(肝臟)、疾病類型(腺瘤和腺癌);檔案(424):數(shù)據(jù):類型(基因表達(dá)定量分析)、類別(轉(zhuǎn)錄組分析)];相關(guān)臨床信息(377)(數(shù)據(jù)格式:bcr xml,數(shù)據(jù)類別:臨床)。從癌癥基因組圖譜(TCGA)的官方網(wǎng)站下載所有數(shù)據(jù)。miRNA 表達(dá)數(shù)據(jù)包含375 個(gè)癌細(xì)胞樣本和50 個(gè)普通細(xì)胞樣本,而mRNA 表達(dá)數(shù)據(jù)包括374 個(gè)癌細(xì)胞樣本和50 個(gè)普通細(xì)胞樣本。
1.2 數(shù)據(jù)分析 所有數(shù)據(jù)分析均使用R 語言的3.6.1版本和相關(guān)軟件包。
1.2.1 差異表達(dá)miRNA、mRNA 的檢測(cè)及與臨床生存時(shí)間的聯(lián)合分析 根據(jù)校正后的P值標(biāo)準(zhǔn)(>1 和(FDR)<0.05),檢測(cè)出差異表達(dá)的miRNA 和mRNA 的數(shù)據(jù),使用R 語言的邊緣包進(jìn)行標(biāo)準(zhǔn)化。將所有患者生存時(shí)間數(shù)據(jù)與標(biāo)準(zhǔn)化的miRNA 和mRNA 差異表達(dá)數(shù)據(jù)相結(jié)合。1.2.2 樣本分組、模型構(gòu)建、評(píng)估和驗(yàn)證 使用R 語言v.3.6.1 的“caret”包,將包含總生存時(shí)間和差異表達(dá)的miRNA 數(shù)據(jù)樣本,以非特異性方式分為測(cè)試組和訓(xùn)練組。通過單因素Cox 回歸分析對(duì)訓(xùn)練組進(jìn)行檢驗(yàn),P<0.05。檢驗(yàn)的結(jié)果通過R 語言中的“Coxph”函數(shù)和“direction=both”函數(shù)進(jìn)行多因素Cox 回歸分析。根據(jù)風(fēng)險(xiǎn)評(píng)分進(jìn)行分組后,該模型通過Log-rank檢驗(yàn)和Kaplan-Meier 曲線對(duì)患者生存預(yù)后進(jìn)行評(píng)估,得到中位數(shù)。使用“survivalROC”軟件包評(píng)估m(xù)iRNA 模型的預(yù)測(cè)能力,獲得3 年依賴的ROC 曲線,并計(jì)算曲線下面積(AUC)。
1.2.3 獨(dú)立預(yù)后潛力評(píng)估 使用單因素Cox 回歸分析確定miRNA 表達(dá)數(shù)據(jù)與HCC 患者總生存時(shí)間,以及其他臨床信息(年齡、性別、分級(jí)、臨床分期、腫瘤浸潤、淋巴結(jié)和遠(yuǎn)處轉(zhuǎn)移)之間的相關(guān)性。滿足P<0.05 的變量進(jìn)一步使用多因素Cox 回歸進(jìn)行分析,證明其為具有獨(dú)立作為預(yù)后因素的潛力。
1.2.4 三種miRNA 的靶基因及潛在活性預(yù)測(cè) 從miRDB、TargetScan 和miRTarBase 三個(gè)數(shù)據(jù)庫中下載miRNA 的相關(guān)基因。使用Perl 語言進(jìn)行搜索,按照滿足至少存在于兩個(gè)數(shù)據(jù)庫中的標(biāo)準(zhǔn),篩選出目標(biāo)基因,并繪制韋恩圖,利用Cytoscape3.7.2 確認(rèn)miRNA 與其靶基因的相關(guān)性。對(duì)靶基因取交集,用差異表達(dá)mRNA 進(jìn)行處理,驗(yàn)證這些靶基因在HCC中的作用。使用R 語言的“org.Hs.eg.db”和“cluster-Profiler”軟件包對(duì)所有基因進(jìn)行GO 和KEGG 富集分析,調(diào)整后的P<0.05,Q<0.05。
1.2.5 中樞基因、與生存相關(guān)基因篩選 在String 數(shù)據(jù)庫中,將中等置信度設(shè)置為0.400,構(gòu)建PPI 網(wǎng)絡(luò)。使用Cytoscape3.7.2 的CytoHubb 插件計(jì)算基因的度值,篩選前10 個(gè)中樞基因。同時(shí),采用Kaplan-Meier方法,以P<0.05 為標(biāo)準(zhǔn),篩選出與生存相關(guān)的基因。
2.1 miRNA 和mRNA 差異表達(dá)的檢測(cè) 根據(jù)以上標(biāo)準(zhǔn),共鑒定出300 個(gè)差異表達(dá)miRNA,包括下調(diào)40個(gè)和上調(diào)260 個(gè);6219 個(gè)差異表達(dá)mRNA,包括上調(diào)4870 個(gè)和下調(diào)1349 個(gè)。
2.2 三種miRNA 預(yù)后模型的構(gòu)建 將原始組的miRNA(N=371)結(jié)合總生存時(shí)間隨機(jī)分為訓(xùn)練組(184)和測(cè)試組(187)。訓(xùn)練組采用單因素Cox 回歸(P<0.05)得到12 個(gè)miRNA,見表1;對(duì)其進(jìn)行多因素Cox 回歸分析,并構(gòu)建模型。Kaplan-Meier 方法表明hsa-miR-139-5p、hsa-miR-9-5p、hsa-miR-3682-3p 是與患者總生存時(shí)間最顯著的3 個(gè)miRNA(P<0.05),見圖1;多因素Cox 回歸系數(shù)如下:miRNA 特征性風(fēng)險(xiǎn)評(píng)分=(-0.3325×hsa-miR-139-5p 表 達(dá))+(0.2717×hsa-miR-3682-3p 表 達(dá))+(0.0929×hsa-miR-9-5p 表達(dá))。
圖1 Kaplan-Meier 曲線和Log-rank 檢驗(yàn)篩選出的與HCC 患者總生存期相關(guān)的miRNA
表1 單因素和多因素回歸分析的差異表達(dá)miRNA
2.3 三種miRNA 模型在三組中的總體生存預(yù)測(cè)分組 采用中位數(shù)風(fēng)險(xiǎn)評(píng)分,Kaplan-Meier 曲線顯示,在比較低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組時(shí),三組的P值分別為P=1.274e-06、P=7.728e-04 和P=8.834e-09,見圖2A~圖2C);此外,訓(xùn)練組的高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組的5 年總生存率分別為33.5%和68.6%;測(cè)試組為28.1%和57%;原始組為31.6%和62.7%。
2.4 對(duì)三組中的三種miRNA 模型的評(píng)估 ROC 曲線結(jié)果顯示,三組的AUC 分別為0.789、0.730、0.763,見圖2D~圖2F,說明了該模型預(yù)測(cè)HCC 患者生存機(jī)會(huì)的能力。在比較這三組的兩個(gè)得分時(shí),發(fā)現(xiàn)高風(fēng)險(xiǎn)得分比低風(fēng)險(xiǎn)得分的死亡率高。
圖2 三種miRNA 預(yù)后模型的驗(yàn)證和評(píng)估
2.5 考慮其他臨床因素時(shí),三種miRNA 模型的獨(dú)立性 單因素Cox 回歸分析表示,三種miRNA 模型與患者總生存時(shí)間明顯相關(guān);而進(jìn)一步的多因素Cox回歸分析證明了當(dāng)考慮其他臨床信息時(shí),三種miRNA 模型可以獨(dú)立于總生存時(shí)間,其中包括T 分期、臨床分期以及遠(yuǎn)處轉(zhuǎn)移的存在,見表2。
表2 臨床特征的單因素和多因素回歸分析
2.6 預(yù)測(cè)這3 種miRNA 的靶基因 結(jié)果顯示,hsamiR-139-5p、hsa-miR-9-5p、hsa-miR-3682-3p 分別可以檢測(cè)到642、1314 和397 個(gè)重疊基因。其中,篩選出174 個(gè)基因作為三種已鑒定的miRNA 的遺傳靶點(diǎn)。為了驗(yàn)證這些miRNA 靶基因是否參與了HCC 的進(jìn)展,對(duì)上調(diào)miRNA(hsa-miR-9-5p、hsamiR-3682-3p)與下調(diào)的靶mRNA,以及下調(diào)miRNA(hsa-miR-139-5p)和上調(diào)靶mRNA 取交集,并進(jìn)行結(jié)果分析,最終得到了174 個(gè)基因,其中包括88 個(gè)上調(diào)基因和96 個(gè)下調(diào)基因。
2.7 HCC 相關(guān)靶基因的GO 和KEGG 富集分析 通過對(duì)與HCC 相關(guān)的靶基因的GO 注釋,獲得了415個(gè)結(jié)果。在這3 類研究中,BP 分析主要包括對(duì)神經(jīng)元投射發(fā)育、軸突發(fā)生和中樞神經(jīng)系統(tǒng)神經(jīng)元分化的調(diào)控。CC 分析主要包括突觸膜、突觸后特化和突觸后膜。MF 分析主要包括磷酸酯水解酶活性、DNA-結(jié)合轉(zhuǎn)錄激活因子活性、RNA 聚合酶Ⅱ-特異性和酰胺結(jié)合。從HCC 相關(guān)遺傳靶點(diǎn)的KEGG 通路中獲得了6 個(gè)結(jié)果,其中超過5 個(gè)基因主要富集在細(xì)胞因子-細(xì)胞因子受體相互作用的信號(hào)通路中。
2.8 來自PPI 網(wǎng)絡(luò)的中樞基因和與生存相關(guān)的基因目標(biāo) 從174 個(gè)遺傳靶點(diǎn)中篩選出100 個(gè),構(gòu)成遺傳靶點(diǎn)的蛋白-蛋白相互作用網(wǎng)絡(luò)復(fù)合體,包括114 條邊和299 個(gè)節(jié)點(diǎn)。共篩選10 個(gè)中樞基因(ALPL、CXCL12、OIP5、TOP2A、AR、KPNA2、SLC7A2、DBT、HMGB2、MAD2L1);其中174 個(gè)基因中有30 個(gè)基因(CDC37L、C6、C21orf91、BEND4、CEPB3、DBT、MPDZ、HS3ST3B1、GHR、ENPEP、IL33、GPR65、NSUN6、PCDHGC5、STARD5、PDK4、OGDHL、ST8SIA6、RBMS3、RNASE4、ANXA10、ACADSB、ALPL、ANGPTL1、PDE7B、ANO1、SLC7A2、NDRG2、SELP、WNT1)與生存預(yù)后正相關(guān),17 個(gè)基因(GPSM2、EME1、COL11A1、HOXD10、LRP12、MAD2L1、KPNA2、CHST4、HMGB2、LAPTM4B、PLCB1、RAD54B、OIP5、TOP2A、TMC7、KLHL23、MEX3A)與生存預(yù)后負(fù)相關(guān)。
肝細(xì)胞癌是一種高度惡性的腫瘤,極易發(fā)生肺(38.4%)、骨(32.6%)和淋巴結(jié)(24.6%)的轉(zhuǎn)移[7],5年生存率僅18%,甚至約20%的患者在6 個(gè)月后復(fù)發(fā)[8]。因此,臨床迫切需要尋找具有高敏感性和特異性的生物標(biāo)志物。研究顯示[9],miRNA 可能成為腫瘤生存預(yù)后的敏感生物標(biāo)志物。miR-9-5p 可以通過調(diào)控GOT1 的表達(dá)來阻礙胰腺癌侵襲、增殖、谷氨酰胺代謝和氧化還原穩(wěn)態(tài);miR-3682-3p 通過靶向肝癌中的腫瘤抑制基因GAS8,促進(jìn)HCC 的侵襲和遷移[10];而miR-139-5p 可以通過下調(diào)SLITRK4 的表達(dá)來影響HCC 細(xì)胞的侵襲和增殖能力[11]。這三種miRNA 都參與了各種腫瘤的發(fā)展調(diào)控過程,可以作為一種新的敏感生物標(biāo)志物,且多種miRNA 信號(hào)比單一的miRNA 表現(xiàn)出更大的優(yōu)勢(shì)。本研究通過單因素和多因素Cox 回歸分析構(gòu)建了hsa-miR-3682-3p、hsa-miR-9-5p 和hsa-miR-139-5p 三種miRNA特征模型,與已有的研究不同,通過miRNA 分組來驗(yàn)證模型的可行性。
慢性炎癥可以促進(jìn)癌細(xì)胞免疫逃逸,而各種腫瘤細(xì)胞分泌的細(xì)胞因子與免疫細(xì)胞具有協(xié)同作用,可以促進(jìn)腫瘤活性[12]。Han KQ 等[13]發(fā)現(xiàn)CXCL1RNAi可抑制腫瘤細(xì)胞的凋亡和生長,提示CXCL1 可能是治療HCC 的靶點(diǎn)。而生長激素可以上調(diào)小鼠肝臟中GAL1 的表達(dá)[14],并且影響腫瘤血管的生成[15]。Boguszewski CL 等[16]的實(shí)驗(yàn)也證明了在一些動(dòng)物模型和與耐藥或生長激素缺乏相關(guān)的遺傳缺陷患者中,生長激素對(duì)腫瘤發(fā)生具有一定的保護(hù)作用。為了深入研究HCC 中三種miRNA 信號(hào)的調(diào)控機(jī)制,本研究利用3 個(gè)數(shù)據(jù)庫對(duì)模型中三種miRNA 的靶基因進(jìn)行了評(píng)估。結(jié)果顯示,靶基因的信號(hào)通路結(jié)果主要富集于細(xì)胞因子-細(xì)胞因子受體的相互作用途徑以及生長激素的合成、分泌和作用途徑中。
為了建立調(diào)控連接HCC 的三種miRNA 模型的關(guān)鍵節(jié)點(diǎn),本研究共篩選出10 個(gè)中樞基因以及47個(gè)與生存預(yù)后相關(guān)的基因;其中DBT、SLC7A2、ALPL、TOP2A、MAD2L1、OIP5、KPNA2 不 僅 是PPI網(wǎng)絡(luò)中的中樞基因,而且與患者的生存狀態(tài)相關(guān)。除DBT 基因缺乏相關(guān)研究外,SLC7A2 可能成為是乳腺癌的一個(gè)新的預(yù)后標(biāo)志物,與強(qiáng)大的生存優(yōu)勢(shì)密切相關(guān)[17];ALPL 的高表達(dá)與前列腺癌生存率較差相關(guān)[18];KPNA2[11]和OIP5[19]參與HCC 的進(jìn)展及其作用機(jī)制;TOP2A 可以影響肺腺癌細(xì)胞[20];MAD2L1 在淋巴結(jié)轉(zhuǎn)移的肺鱗癌患者表達(dá)較高,參與細(xì)胞周期的調(diào)節(jié),可以作為非小細(xì)胞肺癌發(fā)展的預(yù)后生物標(biāo)志物[21],這6 個(gè)基因均可以作為腫瘤的預(yù)后標(biāo)志物。提示這7 個(gè)基因可能成為HCC 新的治療靶點(diǎn),為肝癌的治療提供一種新的思路。
綜上所述,本研究構(gòu)建了能夠預(yù)測(cè)HCC 預(yù)后的miRNA 模型,分組驗(yàn)證了該模型的預(yù)測(cè)能力,并且驗(yàn)證了該模型可以作為HCC 中獨(dú)立預(yù)后因素。最后,通過預(yù)測(cè)miRNA 的遺傳靶點(diǎn)進(jìn)一步了解HCC的發(fā)生和進(jìn)展。