楊永勤 馮鞏 郝帥 陳敏 梁甜 閆紅林 賀娜
甲胎蛋白(AFP)和維生素K缺乏誘導(dǎo)蛋白(PIVKA-II)是目前常用的肝癌標(biāo)志物,然而,這些標(biāo)志物有時(shí)在慢性肝炎患者中也較高[1]。蛋白質(zhì)組學(xué)是指大規(guī)模研究蛋白質(zhì)特性,它不僅為生命活動規(guī)律提供了物質(zhì)基礎(chǔ),同時(shí)也為闡明多種疾病機(jī)制提供了理論基礎(chǔ)[2-6]。本研究從蛋白質(zhì)組學(xué)的角度尋找肝癌復(fù)發(fā)的標(biāo)志物。
數(shù)據(jù)來自公開的臨床蛋白質(zhì)組學(xué)腫瘤分析聯(lián)盟(Clinical Proteomic Tumor Analysis Consortium, CPTAC)數(shù)據(jù)庫。CPTAC整合基因組學(xué)和蛋白質(zhì)組學(xué)數(shù)據(jù),以識別和表征腫瘤和非腫瘤組織中的全部蛋白質(zhì)并確定用作腫瘤生物標(biāo)志物的候選蛋白[7,8]。為了驗(yàn)證本研究中關(guān)鍵的差異蛋白,使用人類蛋白圖譜(human protein atlas, HPA)數(shù)據(jù)庫。
本研究使用的統(tǒng)計(jì)軟件包括R(4.0.1)、R Bioconductor軟件包和Perl語言。根據(jù)|log2FC|>1和P<0.05選擇差異表達(dá)蛋白(differentially expressed proteins, DEP),隨后通過GO和KEGG富集分析確定差異蛋白關(guān)鍵的功能和通路。生存分析、Cox回歸和ROC曲線用于進(jìn)一步評估DEP。
從CPTAC數(shù)據(jù)庫中,獲得了乙型肝炎相關(guān)HCC樣本中的復(fù)發(fā)組(n=50)和非復(fù)發(fā)組(n=77)。根據(jù)|log2FC|>1和P<0.05的標(biāo)準(zhǔn),獲得690個(gè)DEP。GO分析發(fā)現(xiàn),DEP的生物過程(BP)豐富于線粒體電子傳遞、線粒體呼吸鏈復(fù)合體I組裝和蛋白質(zhì)定位到Cajal體的調(diào)節(jié)。分子功能(MF)富集在氧化還原酶活性、Ras GTPase結(jié)合、磷脂結(jié)合和NADH脫氫酶活性方面。細(xì)胞成分(CC)主要富集于氧化還原酶復(fù)合物、呼吸鏈復(fù)合物和呼吸鏈復(fù)合物1(圖1)。KEGG通路分析表明DEP在癌癥、化學(xué)致癌、氧化磷酸化、非酒精性脂肪肝和乙型肝炎、神經(jīng)退行性變、PD-L1中富集(圖2)。
圖1 A GO富集分析; B KEGG富集分析
為了進(jìn)一步研究DEP在蛋白質(zhì)水平上的聯(lián)系,開發(fā)了基于DEP相互作用的PPI網(wǎng)絡(luò)(圖2)。PPI網(wǎng)絡(luò)使用1054個(gè)相互作用和297個(gè)節(jié)點(diǎn)構(gòu)建,基因之間最相鄰的前9個(gè)節(jié)點(diǎn)為UBA52、AKT1、LCK、SHC1、PTGES3、CD4、NDUFB7、NDUFB8和PTPN6。
圖2 蛋白質(zhì)相互作用網(wǎng)絡(luò)圖
進(jìn)一步從CPTAC數(shù)據(jù)庫獲得生存信息,通過Kaplan-Meier生存曲線分析發(fā)現(xiàn)39個(gè)生存相關(guān)蛋白(均P<0.05)。圖3描繪了其中7個(gè)DEP的Kaplan-Meier生存曲線。在此基礎(chǔ)上,進(jìn)行單變量和多變量Cox回歸分析。單變量Cox回歸分析獲得了32個(gè)差異蛋白,多變量Cox回歸分析獲得了18個(gè)差異蛋白。對18個(gè)差異蛋白進(jìn)行1年、3年、5年生存ROC曲線分析。根據(jù)5年生存ROC曲線下面積>0.7的標(biāo)準(zhǔn),篩選出7種重要蛋白,包括BAHCC1、ESF1、RAP1GAP、RUFY1、SCAMP3、STK3、TMEM230(圖4)。7種重要的差異蛋白熱圖見圖5。
圖3 7個(gè)DEP(BAHCC1、ESF1、RAP1GAP、RUFY1、SCAMP3、STK3和TMEM230)的Kaplan-Meier生存曲線
圖4 5年生存ROC曲線下面積>0.7的7種重要蛋白
圖5 7種重要蛋白的熱圖
為了驗(yàn)證關(guān)鍵差異蛋白,使用人類蛋白質(zhì)圖譜(HPA)數(shù)據(jù)庫。在HPA數(shù)據(jù)庫中,轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué)技術(shù)被用于在RNA和蛋白質(zhì)水平上研究蛋白質(zhì)在不同人體組織和器官中的表達(dá)。采用免疫組織化學(xué)方法比較關(guān)鍵差異蛋白在正常肝組織和肝癌組織中的表達(dá)。在圖6中,RUFY1,TMEM230和STK3在正常肝組織中不表達(dá)或僅輕微表達(dá),在HCC中度或重度表達(dá)。同時(shí),ESF1在非腫瘤組織中低表達(dá),在腫瘤組織中高表達(dá)。
圖6 RUFY1、TMEM230、STK3、ESF1的免疫組化染色情況 (第一行為正常組織,第二行為腫瘤組織)
本研究從蛋白質(zhì)組學(xué)的角度發(fā)現(xiàn)了與肝癌復(fù)發(fā)密切相關(guān)的新的重要蛋白質(zhì)。蛋白質(zhì)組學(xué)在癌癥研究中發(fā)揮著重要作用,無論是在腫瘤發(fā)生、復(fù)發(fā)和其他方面。CPTAC數(shù)據(jù)庫的優(yōu)點(diǎn)是,大多數(shù)其他數(shù)據(jù)庫在mRNA水平上分析基因表達(dá),而CPTAC在蛋白質(zhì)水平上描述基因表達(dá),這更接近疾病的最原始表現(xiàn)。此外,CPTAC包含了大量的臨床數(shù)據(jù),為蛋白質(zhì)與生存和臨床條件之間的關(guān)系提供了很好的驗(yàn)證。
在本研究中,首先確定了690個(gè)與肝癌復(fù)發(fā)相關(guān)的差異蛋白。為了尋找更有臨床價(jià)值的蛋白,進(jìn)行了Cox回歸和ROC曲線分析。其中最重要的7種蛋白(ESF1、SCAMP3、RAP1GAP、BAHCC1、STK3、RUFY1、TMEM230)不僅是肝癌預(yù)后的獨(dú)立影響因素,而且對肝癌5年生存率有較好的預(yù)測價(jià)值。其中關(guān)鍵蛋白 RUFY1、TMEM230、STK3、ESF1在隨后的HPA數(shù)據(jù)庫中也得到了驗(yàn)證。
研究表明,ESF1與肝癌的生存率顯著相關(guān)[9]。Kang等[10]發(fā)現(xiàn),SCAMP3可通過EGFR-MAPK p38信號通路促進(jìn)肝癌細(xì)胞轉(zhuǎn)移,因此SCAMP3可能成為肝癌治療的靶點(diǎn)。此外,Zhou等[11]證明SCAMP3表達(dá)與多個(gè)生存相關(guān)基因相關(guān),因此SCAMP3可能是HCC的診斷或預(yù)后生物標(biāo)志物。Kim等[12]報(bào)道,當(dāng)哺乳動物肝臟中的Hippo激酶Mst1和Mst2被廢除時(shí),會導(dǎo)致HCC的快速形成,并激活各種分子和相關(guān)信號,包括STAT3。Chen等[13]認(rèn)為RUFY1參與Rab14的功能,Rab14促進(jìn)肝癌細(xì)胞的遷移、侵襲和轉(zhuǎn)移。但本研究的結(jié)果僅來自數(shù)據(jù)挖掘,未在臨床標(biāo)本或基礎(chǔ)研究中得到進(jìn)一步證實(shí)。
利益沖突聲明:所有作者均聲明不存在利益沖突。