陳俊光
(石河子大學(xué) 生命科學(xué)學(xué)院,新疆石河子 832003)
肝癌(Liver hepatocellular carcinoma,LIHC)是指發(fā)生于肝臟的原發(fā)性或者繼發(fā)性腫瘤。其中,起始于肝臟的癌癥稱為原發(fā)性肝癌,由起始位置不同分為4個類型:肝細(xì)胞癌、膽管細(xì)胞型肝癌、肝母細(xì)胞癌和血管內(nèi)皮瘤;由血液、淋巴系統(tǒng)轉(zhuǎn)移或者臨近腫瘤浸潤至肝臟產(chǎn)生的癌癥稱為繼發(fā)性肝癌,其患者數(shù)量是前者的三十余倍[1-2]。長期慢性炎癥、肝硬化和酗酒是導(dǎo)致原發(fā)性肝癌的主要因素,此外,代謝癥候群和血色沉著病患者等遺傳性因素也是肝癌的誘因[3-4]。肝癌患者存在明顯的地域分布差異,亞太地區(qū)患者數(shù)量遠(yuǎn)高于歐美地區(qū),發(fā)病率和肝炎患者數(shù)量呈正相關(guān)[5-6]。肝癌還存在性別分布差異,男性患者數(shù)量高出女性40%,且男性患者死亡率有持續(xù)走高趨勢,而女性患者死亡率趨勢平緩[7]。肝癌是第三大癌癥致死類型,患者占所有癌癥患者的2.37%,多發(fā)現(xiàn)于晚期,死亡率一直居高不下,臨床治療多以侵入式治療為主。
MicroRNAs(miRNAs),又名小分子核糖核酸,是序列長度21~23 nt的非編碼小分子RNA,經(jīng)DNA轉(zhuǎn)錄后并未進(jìn)一步翻譯成蛋白質(zhì),而是和mRNA的3'UTR部分或者完全互補(bǔ)配對結(jié)合,從而調(diào)控基因表達(dá)在細(xì)胞凋亡、分化和增殖上發(fā)揮著重要作用[8-9]。miRNAs在體內(nèi)發(fā)揮著類似抑癌基因和原癌基因的功能,但在腫瘤中常處于失調(diào)狀態(tài),因此miRNAs的異常水平表達(dá)和癌癥的發(fā)展以及預(yù)后密切相關(guān)[10-11]。miRNAs不僅可以作為精確預(yù)測、診斷和追蹤癌癥預(yù)后的生物標(biāo)志物,而且在腫瘤的靶向藥物開發(fā)和化療方案選取上具有重要的參考價(jià)值。
本研究從TCGA(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫的肝癌樣本篩選出10個miRNA作為一個組合,利用風(fēng)險(xiǎn)評分(Risk score,RS)對患者進(jìn)行生存分析,證實(shí)ten-miRNAs組合具有高靈敏度和高特異性,可以作為肝癌預(yù)后分析的生物標(biāo)記物。
在R(V-4.0.0)環(huán)境下,使用RTCGA在TCGA數(shù)據(jù)庫下載LIHC全部亞型的臨床數(shù)據(jù)和miRNAs數(shù)據(jù)集。除LIHC外,TGCA還提供另外32種癌癥的臨床數(shù)據(jù)、RNA測序數(shù)據(jù)、DNA甲基化數(shù)據(jù)、DNA拷貝數(shù)變異數(shù)據(jù)和miRNAs測序數(shù)據(jù)等。所有數(shù)據(jù)來自374例肝癌組織和50例癌旁組織,共有1 046個miRNAs表達(dá)數(shù)據(jù)。使用EdgeR和Stringr包,篩選臨床數(shù)據(jù),過濾掉至少在3個樣本中CPM(count-permillion)≤1的miRNAs,使用TMM法對數(shù)據(jù)進(jìn)行歸一處理,并設(shè)定閾值(FDR<0.05,fold change>2)。使用Gplots對篩選差異表達(dá)的miRNAs(Different Expression miRNAs,DEMs)進(jìn)行熱圖繪制。
在R環(huán)境下,使用Survival包中Cox比例風(fēng)險(xiǎn)回歸模型(Cox's proportional hazards regression model)進(jìn)行單因素回歸分析,得到偏回歸系數(shù)β、風(fēng)險(xiǎn)比(Hazard Ratio,HR)、P值等。
使用Survival包的Step函數(shù),將單因素回歸分析結(jié)果中影響患者生存的全部變量(P<0.05)作為Cox多因素回歸分析的單線變量進(jìn)行Cox多因素回歸分析,采用雙向逐步遞歸法和wald卡方檢驗(yàn)。
β>0,HR>1,說明該變量水平增加時(shí),危險(xiǎn)率增加,該變量是危險(xiǎn)因素;β<0,HR<1,說明該變量水平增加時(shí),危險(xiǎn)率下降,該變量是保護(hù)因素;β=0,HR=1,說明該變量水平增加時(shí),危險(xiǎn)率不變,該變量是危險(xiǎn)無關(guān)因素。P<0.05的因素視為預(yù)后的獨(dú)立影響因素。
在R環(huán)境下,使用Survival包的Predict函數(shù),根據(jù)公式(1)計(jì)算每一位患者的風(fēng)險(xiǎn)評分(Survival Risk Score,SRS)。以風(fēng)險(xiǎn)評分的中位數(shù)為臨界值,小于等于中位數(shù)的患者為低風(fēng)險(xiǎn)組,高于中位數(shù)的患者為高風(fēng)險(xiǎn)組。
使用R語言對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)分析,數(shù)據(jù)表示為平均值±標(biāo)準(zhǔn)偏差(SD),統(tǒng)計(jì)學(xué)比較采用配對樣品t檢驗(yàn)法,P<0.05被認(rèn)為具有統(tǒng)計(jì)顯著性差異。
通過對TCGA數(shù)據(jù)庫的50個癌旁組織(對照組)和374個肝癌組織的miRNAs測序數(shù)據(jù)的分析,篩選肝癌中差異表達(dá)的miRNAs共247個,其中228個上調(diào),19個下調(diào)。圖1為424個樣本差異表達(dá)基因雙向分層聚類的熱圖,>0表示基因表達(dá)上調(diào),<0表示基因表達(dá)下調(diào)。
單因素Cox回歸分析結(jié)果顯示,247個DEMis中有23個miRNAs和患者的總體生存期(Overall survival,OS)顯著相關(guān)(P<0.05)(表1)。
圖1 基因差異表達(dá)雙向分層聚類分析
表1 單因素Cox回歸分析結(jié)果
選擇逐步多元Cox回歸分析結(jié)果中前23個miRNAs中的10個建立預(yù)測模型。預(yù)測模型被定義為多因素Cox回歸分析中由相對系數(shù)加權(quán)的tenmiRNAs表達(dá)水平的線性組合,用方程表達(dá)如公式(2)所示。
風(fēng)險(xiǎn)分層和ROC曲線表明,ten-miRNAs標(biāo)志物組合在預(yù)測肝癌患者總生存期方面表現(xiàn)出良好的準(zhǔn)確性。如圖2所示,將研究中隨訪數(shù)據(jù)完整的340名患者進(jìn)行生存風(fēng)險(xiǎn)評分,并根據(jù)中位數(shù)進(jìn)行風(fēng)險(xiǎn)評分把患者分為高風(fēng)險(xiǎn)組(n=170)和低風(fēng)險(xiǎn)組(n=170)。如圖3所示,基于ten-miRNA的兩組Tekaplan-Meier總生存曲線顯著不同(log-rankP=0<0.001),高風(fēng)險(xiǎn)患者生存時(shí)間顯著降低,預(yù)后較差。如圖4所示,計(jì)算接收者操作特征曲線(Receiver operating characteristic curve,ROC)下部面積(Area under the Curve of ROC,AUC for ROC)對ten-miRNA特征的預(yù)后能力,評估結(jié)果顯示AUC=0.785,表明ten-miRNA特征模型在預(yù)測肝癌患者存活風(fēng)險(xiǎn)方面具有良好的準(zhǔn)確度。
圖2 Ten-miRNAs組合熱圖
圖3 使用ten-miRNAs標(biāo)志物用于肝癌患者的總生存期Kaplan-Meier生存曲線
圖4 Ten-miRNAs標(biāo)志物的ROC曲線分析
通過對TCGA數(shù)據(jù)庫中肝癌的臨床數(shù)據(jù)和miRNAs數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘,確定了一個tenmiRNA 組 合:hsa-mir-9-2、hsa-mir-506、hsamir-139、hsa-mir-3911、hsa-mir-548f-1、hsamir-326、hsa-mir-92a-1、hsa-mir-3171、hsamir-3614、hsa-mir-621。AUC評估顯示ROC曲線有著良好的特異性和敏感度,可以作為評估肝癌患者預(yù)后的生物標(biāo)志物。
miR-9由 Hsa-mir-9-1、Hsa-mir-9-2、Hsamir-9-3編碼,最初被認(rèn)為是促進(jìn)神經(jīng)元增生的神經(jīng)發(fā)育調(diào)控因子,后在各種惡性腫瘤中被觀察到異常表達(dá),干擾正常細(xì)胞途徑促使癌變,并且顯示出功能多樣性[12-13]。hsa-mir-548f-1所屬的hsa-mir-548家族是轉(zhuǎn)座子衍生物,是癌癥的全局調(diào)控基因。上調(diào)會對控制細(xì)胞正常增殖的基因產(chǎn)生抑制,使細(xì)胞周期脫離正常調(diào)控,同時(shí)下調(diào)免疫細(xì)胞受體基因、轉(zhuǎn)錄因子和腫瘤壞死因子的編碼基因[14]。hsa-mir-506、hsa-mir-139、hsa-mir-326、hsa-mir-92a-1、hsamir-621分別在乳腺癌、結(jié)腸癌、神經(jīng)膠質(zhì)瘤等癌癥患者體內(nèi)發(fā)揮著抑癌基因的作用,下調(diào)FGF1、NOB1等原癌基因,抑制相關(guān)腫瘤細(xì)胞的黏附、增殖、浸潤和轉(zhuǎn)移,將細(xì)胞周期阻滯在G1期(DNA合成前的時(shí)期),促使細(xì)胞凋亡,并增加癌變細(xì)胞對紫杉醇和卡鉑(PTX/CBP)等化療的敏感性[15-20]。其中,hsamir-139已被認(rèn)為是多種癌癥的腫瘤抑制因子以及癌癥早期診斷和預(yù)后的生物標(biāo)志物,hsa-mir-92a-1是miR-17~92致癌基因群成員,在轉(zhuǎn)錄后發(fā)揮調(diào)控作用[21-23]。hsa-mir-3911、hsa-mir-3171、hsa-mir-3614還未有和癌癥基因間相互作用的報(bào)道。其中,hsamir-3911僅在心臟損傷早期預(yù)測中被鑒定為異常表達(dá),且僅存在于外排體中;hsa-mir-3171被確定為乳腺癌預(yù)后標(biāo)記物,但作用機(jī)制尚未闡明;hsamir-3614為病毒的防御基因,抑制病毒的感染性并抑制病毒復(fù)制[24-27]。
本研究構(gòu)建的ten-miRNAs組合在作為肝癌預(yù)后預(yù)測模型上表現(xiàn)出良好的準(zhǔn)確性,可以作為預(yù)測肝癌患者預(yù)后的生物標(biāo)志物,hsa-mir-3911、hsamir-3171、hsa-mir-3614各自的具體功能和實(shí)際臨床價(jià)值還需要在細(xì)胞水平上進(jìn)一步驗(yàn)證。