劉璇,龔培賢,劉金瑋,孫濤,范正軍
(鄭州大學(xué)第一附屬醫(yī)院 肝膽外科,河南 鄭州 450052)
肝細(xì)胞癌(hepatocellular carcinoma,HCC)是原發(fā)性肝癌的最常見的病理類型,病死率居全球第2位,居我國第3位。HCC的致病原因較多,但肝炎病毒,尤其是乙型肝炎病毒(hepatitis B,HBV)與HCC的發(fā)生發(fā)展密切相關(guān)。我國HBV的流行率為18%,HCC確診病例中,約85%的患者合并HBV。
隨著影像技術(shù)的發(fā)展,肝癌的早期發(fā)現(xiàn)、早期診斷和早期治療情況有所改善,加之肝癌的病程、診斷和治療概念得以更新,肝癌外科手術(shù)切除率提高、死亡率下降,術(shù)后1、3、5 a生存率分別為88.1%、71.9%和60.0%。但我國肝癌患者多合并慢性肝炎和肝硬化,肝功能代償能力差,術(shù)后復(fù)發(fā)率約50%,預(yù)后較差。另外,HCC起病隱匿,早期無明顯臨床表現(xiàn),多數(shù)患者確診時(shí)已為中晚期,錯(cuò)過了最佳治療時(shí)機(jī),只能接受姑息性綜合治療以緩解癥狀、提高生活質(zhì)量,總體預(yù)后極差。因此,尋找新的肝癌生物標(biāo)志物對提高HCC早期診斷率和促進(jìn)預(yù)后十分重要。
RNA結(jié)合蛋白(RNA-binding protein,RBP)是一類伴隨RNA調(diào)控與代謝過程的與RNA相結(jié)合的蛋白質(zhì)總稱,其在基因的轉(zhuǎn)錄后調(diào)控中起著關(guān)鍵作用。通過全基因組篩選,已在人類基因組中鑒定出1 500多個(gè)RBP基因,幾乎所有的RBP直接或間接地參與人體內(nèi)蛋白質(zhì)的生物合成。RBP通過各種途徑來維持細(xì)胞生理的穩(wěn)態(tài),特別是在發(fā)育和應(yīng)激反應(yīng)中。傳統(tǒng)RBS的功能取決于它們與靶RNA的結(jié)合和核糖核蛋白復(fù)合物的形成,而這些復(fù)合物和RNA的合成、加工和翻譯等生物學(xué)行為相關(guān)。許多研究已經(jīng)明確RBP參與人類惡性腫瘤的發(fā)生和發(fā)展[1],并與患者預(yù)后密切相關(guān)[2]。但RBP在HCC中的研究并不成熟,為了探究RBP在HCC發(fā)生發(fā)展中的作用,從癌癥基因組圖譜數(shù)據(jù)庫(the Cancer Genome Atlas,TCGA)下載HCCRNA序列數(shù)據(jù),通過生物信息學(xué)分析,借助相關(guān)軟件篩選獨(dú)立影響HCC患者預(yù)后的RBP,并構(gòu)建預(yù)后模型,以期為肝癌的診療及預(yù)后評估提供新的觀點(diǎn)。
1.1 資料通過TCGA數(shù)據(jù)庫,下載50例正常肝組織和374例HCC肝組織的RNA測序數(shù)據(jù)集以及相應(yīng)的臨床數(shù)據(jù)。
1.2 方法借助R軟件處理數(shù)據(jù),利用LIMMA軟件包找出正常肝組織和HCC組織中差異表達(dá)的RBP相關(guān)基因,通過STRING數(shù)據(jù)庫構(gòu)建差異RBP蛋白質(zhì)互作網(wǎng)絡(luò)。
1.3 統(tǒng)計(jì)學(xué)方法采用Strawberry Perl語言和R語言處理數(shù)據(jù),應(yīng)用Wilcox秩檢驗(yàn)篩選差異表達(dá)RBP,單因素分析應(yīng)用檢驗(yàn)分析得出結(jié)果,應(yīng)用logistic回歸模型分析所得到的HCC預(yù)后相關(guān)RBP,進(jìn)而得出獨(dú)立影響HCC預(yù)后的RBP,利用R軟件在多因素聯(lián)合的基礎(chǔ)上構(gòu)建預(yù)后模型,應(yīng)用Kaplan-Meier法和Log-rank檢驗(yàn)進(jìn)行生存分析。P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
2.1 HCC患者正常組織和腫瘤組織中差異表達(dá)的RBP識別借助R軟件,得出正常肝臟組織和HCC組織中差異表達(dá)的1 317個(gè)RBP,其中325個(gè)RBP滿足篩查標(biāo)準(zhǔn),上調(diào)RBP 203個(gè),下調(diào)RBP 122個(gè)。
2.2 蛋白質(zhì)互作網(wǎng)絡(luò)構(gòu)建通過STRING數(shù)據(jù)庫,基于2.1得到的325個(gè)RBP構(gòu)建蛋白質(zhì)互作網(wǎng)絡(luò),刪除孤立RBP,得到305個(gè)相互聯(lián)系RBP。
2.3 預(yù)后相關(guān)RBP的篩選及預(yù)后模型的構(gòu)建基于2.2中得到的305個(gè)差異表達(dá)RBP,進(jìn)行單因素Cox回歸分析,共篩選出46個(gè)與HCC預(yù)后顯著相關(guān)的RBP(圖1A)。所有樣本隨機(jī)分為建模組和驗(yàn)證組。針對建模組,將46個(gè)RBP進(jìn)行多因素Cox回歸分析,最終得到EIF2AK4、PRKDC、DHX37、INTS8和EEF1E1 5個(gè)HCC獨(dú)立預(yù)后RBP(圖1B,表1)?;诓煌瑯颖局羞@5個(gè)RBP的表達(dá)量,計(jì)算所有樣本風(fēng)險(xiǎn)分?jǐn)?shù),計(jì)算公式為:
S=(-0.713 21×φEIF2AK4)+(0.808 75×φPRKDC)+(-0.210 47×φDHX37)+(-0.379 71×φINTS8)+(0.426 27×φEEF1E1)。
式中:S為風(fēng)險(xiǎn)分?jǐn)?shù);φ為蛋白表達(dá)量。
A.單因素分析;B.多因素分析
表1 多因素Cox回歸分析
2.4 模型預(yù)后評估能力分析根據(jù)所有樣本風(fēng)險(xiǎn)值的中位值,將建模組樣本和驗(yàn)證組樣本分為高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)兩組。生存分析結(jié)果顯示,無論是建模組還是驗(yàn)證組,高風(fēng)險(xiǎn)組患者預(yù)后均差于低風(fēng)險(xiǎn)組患者(圖2A、C),另外,受試者工作曲線(圖2B、D)顯示,建模組中曲線下面積為0.710,驗(yàn)證組中曲線下面積為0.660。
2.5 模型獨(dú)立預(yù)后分析將模型風(fēng)險(xiǎn)分?jǐn)?shù)和臨床相關(guān)因素匯總進(jìn)行單因素Cox回歸分析,只有風(fēng)險(xiǎn)分?jǐn)?shù)和T分期差異具有統(tǒng)計(jì)學(xué)意義(圖3A),將分級、T、N、M分期和風(fēng)險(xiǎn)分?jǐn)?shù)一并納入多因素Cox回歸分析之中,風(fēng)險(xiǎn)分?jǐn)?shù)和T分期是HCC患者獨(dú)立預(yù)后因素(圖3B)。
A、B.建模組;C、D.驗(yàn)證組
A.單因素;B.多因素
2.6 模型相關(guān)列線圖的繪制根據(jù)預(yù)后模型中每個(gè)RBP回歸系數(shù)大小,繪制列線圖(圖4),能準(zhǔn)確預(yù)估患者1、3、5 a的生存率。
圖4 模型相關(guān)列線圖
正常細(xì)胞發(fā)揮作用是通過一套完整的、較復(fù)雜的調(diào)控機(jī)制來完成的,包括表觀遺傳修飾、RNA轉(zhuǎn)錄后修飾和蛋白質(zhì)組的轉(zhuǎn)錄后修飾。越來越多證據(jù)表明RNA轉(zhuǎn)錄后修飾和腫瘤的發(fā)生密切相關(guān)。RBP是一類能夠結(jié)合單鏈或雙鏈RNA并參與形成核糖核蛋白復(fù)合物的蛋白質(zhì)。這些蛋白質(zhì)影響RNA的結(jié)構(gòu)和相互作用,并在其生物發(fā)生、穩(wěn)定性、功能、轉(zhuǎn)運(yùn)和細(xì)胞定位中發(fā)揮關(guān)鍵作用。當(dāng)RBP基因表達(dá)上調(diào)或者下調(diào)時(shí),可導(dǎo)致正常細(xì)胞轉(zhuǎn)錄組和蛋白質(zhì)表達(dá)組的全基因組改變,進(jìn)而影響細(xì)胞的生長、增殖、侵襲和死亡。
為了研究RBP在HCC發(fā)生發(fā)展中的作用,從TCGA數(shù)據(jù)庫下載50例正常肝臟組織樣本和374例HCC組織樣本的RNA測序數(shù)據(jù)集以及相應(yīng)的臨床數(shù)據(jù),提取所有樣本的RBP表達(dá)量。借助R軟件,最終得到305個(gè)在正常肝臟組織和HCC組織差異表達(dá)的RBP相關(guān)基因。經(jīng)過篩選,得到EIF2AK4、PRKDC、DHX37、INTS8和EEF1E1為獨(dú)立影響HCC預(yù)后的RBP。PRKDC是DNA依賴性蛋白激酶的一個(gè)亞基,它參與DNA雙鏈斷裂的修復(fù)過程[3-4],屬于磷脂酰肌醇-3-激酶家族成員。當(dāng)DNA發(fā)生斷裂時(shí),PRKDC被激活,并且形成具有DNA結(jié)合作用的DNAPK復(fù)合物,觸發(fā)非同源末端連接DNA修復(fù)行為[5]。DHX37是一種高度保守的RNA解旋酶,參與核糖體的生物合成,同時(shí)也是CD8 T細(xì)胞的功能調(diào)節(jié)劑[6],可能是腫瘤免疫治療的潛在靶標(biāo)。INTS8是整合體復(fù)合物家族成員,參與腫瘤的發(fā)生和發(fā)展。Tong等[7]研究發(fā)現(xiàn),在HCC中,INTS8通過上調(diào)TGF-β信號通路來加速EMT[8]過程,并且證明INTS8在腫瘤組織中高表達(dá),而且和腫瘤的侵襲轉(zhuǎn)移以及預(yù)后有關(guān)。EEF1E1屬于真核生物延伸因子復(fù)合物家族,參與基因表達(dá)的翻譯過程,Kim等[9]研究發(fā)現(xiàn),在胃癌和大腸癌中,EEF1E1表達(dá)下調(diào),并且可能是胃癌和大腸癌的抑癌基因。EIF2AK4屬于真核翻譯起始因子2α激酶家族,當(dāng)細(xì)胞缺乏必需氨基酸時(shí),EIF2AK4被激活,抑制翻譯過程[10],從而避免出現(xiàn)異常翻譯。前文已有所述,RBP通過表達(dá)上調(diào)或下調(diào),影響細(xì)胞的生長、增殖、侵襲和死亡,未來可以通過靶向調(diào)節(jié)RBP的表達(dá)來實(shí)現(xiàn)HCC的診斷和治療。
通過5個(gè)具有獨(dú)立預(yù)后能力的RBP,構(gòu)建的預(yù)后模型,無論是在建模組還是驗(yàn)證組,風(fēng)險(xiǎn)分?jǐn)?shù)均和預(yù)后相關(guān),而且高風(fēng)險(xiǎn)組預(yù)后明顯差于低風(fēng)險(xiǎn)組,說明模型具有一定的預(yù)測預(yù)后能力。在單因素Cox回歸分析中,只有風(fēng)險(xiǎn)分?jǐn)?shù)和T分期差異具有統(tǒng)計(jì)學(xué)意義,結(jié)合臨床實(shí)際,將分級、T、N、M分期和風(fēng)險(xiǎn)分?jǐn)?shù)一并納入多因素Cox回歸分析之中,發(fā)現(xiàn)風(fēng)險(xiǎn)分?jǐn)?shù)和T分期是獨(dú)立影響HCC患者預(yù)后的因素,說明所建模型能實(shí)現(xiàn)獨(dú)立預(yù)后分析。在受試者工作曲線中,建模組曲線下面積為0.71,驗(yàn)證組曲線下面積為0.66,說明模型具有良好的診斷與預(yù)后能力。另外,通過列線圖較準(zhǔn)確的預(yù)估患者1、3、5 a的存活率,可輔助臨床醫(yī)生對HCC患者進(jìn)行個(gè)體化治療。但此項(xiàng)研究仍有不足,首先,基于TCGA數(shù)據(jù)庫構(gòu)建的預(yù)后模型,雖然在TCGA數(shù)據(jù)庫內(nèi)部驗(yàn)證中取得了較理想的結(jié)果,但未在其他數(shù)據(jù)庫中進(jìn)行驗(yàn)證;其次,本項(xiàng)研究是在回顧性分析的基礎(chǔ)上設(shè)計(jì)和進(jìn)行的,未來需要進(jìn)行前瞻性研究進(jìn)一步來驗(yàn)證結(jié)果的準(zhǔn)確性。
綜上所述,本研究通過生物信息學(xué)方法,較系統(tǒng)地探討了RBP在HCC表達(dá)及預(yù)后中的價(jià)值,篩選出EIF2AK4、PRKDC、DHX37、INTS8和EEF1E1具有獨(dú)立預(yù)后能力的RBP,并構(gòu)建了預(yù)后模型。該模型具有良好的HCC鑒別與診斷能力。本研究有助于揭示HCC的發(fā)病機(jī)制,為開發(fā)新的治療靶點(diǎn)和分子標(biāo)志物提供參考。