(青島大學(xué)附屬醫(yī)院,山東 青島 266003 1 普外科; 2 肝膽胰外科)
肝細(xì)胞癌(HCC)在我國惡性腫瘤發(fā)病率中居第5位,死亡率居第2位[1-2]。HCC起病隱匿,多數(shù)患者發(fā)現(xiàn)時(shí)已是晚期,且術(shù)后復(fù)發(fā)率高,總體預(yù)后較差。盡管目前經(jīng)聯(lián)合射頻消融治療、肝動(dòng)脈栓塞化療、靶向藥物治療等多學(xué)科綜合治療,患者生存情況已得到明顯改善,但5年生存率僅約60%[3-4]。目前HCC治療的主要難點(diǎn)在于腫瘤異質(zhì)性強(qiáng)、多靶點(diǎn)藥物應(yīng)答率低且易產(chǎn)生耐藥,因此,急需從分子水平深入探索其發(fā)病機(jī)制,挖掘更有意義的基因靶點(diǎn),為評(píng)估患者預(yù)后及靶向治療提供更可靠的依據(jù)。
隨著高通量測(cè)序技術(shù)的發(fā)展以及人類基因組計(jì)劃研究項(xiàng)目的完成,對(duì)腫瘤的分子機(jī)制有了更深入的了解[5]。其中,RNA測(cè)序技術(shù)是目前最常用的篩選癌組織和正常組織差異表達(dá)基因的方法[6]。通過對(duì)HCC的mRNA表達(dá)譜分析,可明確其生物學(xué)進(jìn)程,進(jìn)而可以開展對(duì)HCC更深入和系統(tǒng)的研究。本研究利用生物學(xué)信息技術(shù),通過對(duì)高通量測(cè)序芯片數(shù)據(jù)的分析,篩選出HCC和正常肝組織差異表達(dá)的基因及可用于預(yù)測(cè)HCC預(yù)后的特征性基因,系統(tǒng)地從分子水平揭示HCC的發(fā)生發(fā)展[7-8],為預(yù)測(cè)HCC預(yù)后及指導(dǎo)靶向治療提供參考。
利用美國國立生物技術(shù)信息中心的GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)選取并下載GSE41804、GSE19665和GSE101685 3個(gè)包含黃色人種的HCC基因表達(dá)的數(shù)據(jù)集;利用GEO數(shù)據(jù)庫中的在線分析工具GEO2R對(duì)3個(gè)數(shù)據(jù)集進(jìn)行處理,為減少假陽性的結(jié)果,使用P<0.05和Benjamini-Hochberg進(jìn)行檢驗(yàn);下載GEO2R處理后的3個(gè)數(shù)據(jù)集中的數(shù)據(jù),以P<0.05和|logFC|≥2為標(biāo)準(zhǔn)進(jìn)行基因篩選,并提取3個(gè)數(shù)據(jù)集的交集,篩選出HCC與正常組織差異表達(dá)的基因。
使用R語言的clusterprofiler可視化R包對(duì)篩選出的HCC與正常組織差異表達(dá)的基因進(jìn)行GO功能富集分析[9]和KEGG通路分析[10],選擇條件為:人源基因以及P<0.05。
通過蛋白-蛋白互作預(yù)測(cè)網(wǎng)站STRING(http://string-db.org)[11]構(gòu)建蛋白互作網(wǎng)絡(luò),并使用Cytoscape 3.6.1軟件[12]對(duì)篩選出的差異表達(dá)蛋白進(jìn)行可視化分析,再利用其自帶小程序MCODE對(duì)蛋白互作網(wǎng)絡(luò)進(jìn)行分析,以標(biāo)注有“seed”的基因?yàn)楹蜻x基因。
通過Kaplan-Meier在線生存網(wǎng)站(http://kmplot.com)[13]進(jìn)行候選基因與HCC患者總生存期(OS)關(guān)系的生存分析。然后以HCC患者候選基因表達(dá)量的中位數(shù)為界限,將患者分為高表達(dá)組和低表達(dá)組,分別比較兩組之間的生存差異,計(jì)算每個(gè)候選基因的P值、危險(xiǎn)比和95%置信區(qū)間,排除沒有生存意義的基因,以有生存意義的基因?yàn)殛P(guān)鍵基因,將關(guān)鍵基因在HCC患者中的表達(dá)情況進(jìn)行在線預(yù)后分析,繪制預(yù)后生存曲線圖,并將關(guān)鍵基因作為一個(gè)聯(lián)合特征性基因集用于分析HCC預(yù)后。
通過在線的網(wǎng)站GEPIA(http://gepia.cancer-pku.cn/index.html)[14]對(duì)得到的關(guān)鍵基因在HCC患者中以P<0.01為界限進(jìn)行可視化分析。
選取青島大學(xué)附屬醫(yī)院肝膽胰外科30例HCC患者手術(shù)過程中留取的HCC組織及癌旁正常肝組織標(biāo)本,所有標(biāo)本均經(jīng)病理組織學(xué)驗(yàn)證為HCC或正常肝組織。在說明書的指導(dǎo)下利用Trizol試劑提取標(biāo)本組織中總RNA。隨后通過A260/A280比率標(biāo)準(zhǔn)估計(jì)總RNA細(xì)度,并使用PrimeScriptTMRT試劑盒(日本Takara公司)獲得相應(yīng)的互補(bǔ)DNA。最后使用Takara TB GreenTMPreMix Ex TaqTMⅡ試劑(Tli RNAseH Plus,日本Takara公司)并在羅氏LightCycler480上進(jìn)行實(shí)時(shí)定量聚合酶鏈反應(yīng)(RT-qPCR)以獲取基因相對(duì)表達(dá)量。該研究獲我院倫理委員會(huì)批準(zhǔn)。
對(duì)GEO數(shù)據(jù)庫進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,顯示基因表達(dá)數(shù)據(jù)集GSE41804、GSE19665和GSE101685中分別包含HCC與正常組織差異表達(dá)基因數(shù)量為393、1 110和515個(gè),對(duì)3個(gè)數(shù)據(jù)集取交集后最后得到147個(gè)HCC與正常組織差異表達(dá)的基因。
對(duì)147個(gè)HCC組織和正常組織差異表達(dá)基因進(jìn)行GO功能富集分析顯示,這些基因與對(duì)無機(jī)物的反應(yīng)、加單氧酶活化、類固醇?xì)浠富罨壬镞M(jìn)程明顯相關(guān)(圖1A),圖中基因功能從上至下是按照P值由小到大進(jìn)行排序,柱狀長短代表富集于此功能的HCC組織和正常組織差異表達(dá)基因的數(shù)量。再對(duì)147個(gè)差異表達(dá)基因進(jìn)行KEGG通路分析,顯示這些差異表達(dá)基因主要是通過p53信號(hào)通路影響HCC的發(fā)生和進(jìn)展(圖1B),圖中信號(hào)通路從上至下是按照P值由小到大進(jìn)行排序,點(diǎn)的大小代表富集于此功能的HCC組織和正常組織差異表達(dá)基因的數(shù)量。
使用STRING和Cytoscape構(gòu)建HCC與正常組織147個(gè)差異表達(dá)基因間的蛋白-蛋白互作網(wǎng)絡(luò)圖(圖2)。圖中藍(lán)色圖標(biāo)中的為147個(gè)HCC與正常組織差異表達(dá)的蛋白名稱,蛋白與蛋白之間的連線表示蛋白之間相互作用,連線越多表示存在的相互作用越緊密。
用MCODE對(duì)蛋白互作網(wǎng)絡(luò)圖進(jìn)行分析,得到6個(gè)作用緊密的蛋白表達(dá)簇,其中每一簇都包含1個(gè)標(biāo)注“seed”的基因。這6個(gè)標(biāo)注“seed”的基因?yàn)镕AM83D、CYP2C8、MT1M、SLCO1B3、GYS2以及FCN3,即為候選基因。
通過Kaplan-Meier在線生存網(wǎng)站對(duì)關(guān)鍵基因與HCC患者預(yù)后的相關(guān)性進(jìn)行了分析,結(jié)果顯示MT1M基因沒有生存意義,故將之剔除,只對(duì)有生存意義的另外5個(gè)基因進(jìn)行分析。其中CYP2C8高表達(dá)的患者OS顯著長于CYP2C8低表達(dá)的患者,而FAM83D、SLCO1B3、GYS2和FCN3低表達(dá)的患者OS顯著長于其對(duì)應(yīng)基因高表達(dá)的患者。將5個(gè)HCC患者預(yù)后相關(guān)的基因進(jìn)行聯(lián)合預(yù)后分析,在線網(wǎng)站根據(jù)風(fēng)險(xiǎn)得分中位數(shù)將患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,低風(fēng)險(xiǎn)組患者OS顯著長于高風(fēng)險(xiǎn)組。
A:差異表達(dá)基因GO功能富集分析結(jié)果;B:差異表達(dá)基因KEGG通路分析結(jié)果
圖1 HCC與正常組織差異表達(dá)基因的GO功能富集分析和KEGG通路分析
通過在線網(wǎng)站GEPIA對(duì)5個(gè)關(guān)鍵基因在TCGA數(shù)據(jù)庫進(jìn)行HCC組織和正常肝組織表達(dá)量的可視化分析,顯示基因CYP2C8、FCN3、GYS2以及SLCO1B3在HCC組織中表達(dá)量低于正常肝組織,而基因FAM83D則呈相反的趨勢(shì)。對(duì)臨床上獲取的實(shí)物標(biāo)本進(jìn)行RT-qPCR,結(jié)果同樣顯示CYP2C8、FCN3、GYS2及SLCO1B3在HCC組織中表達(dá)量低于正常肝組織,F(xiàn)AM83D在HCC組織中表達(dá)量高于正常肝組織,與TCGA數(shù)據(jù)庫中分析結(jié)果一致。
HCC是臨床常見、致死率高的惡性腫瘤,也是我國高發(fā)的,危害極大的惡性腫瘤[15]。由于HCC早期臨床癥狀并不明顯,大多數(shù)患者發(fā)現(xiàn)時(shí)病情較晚,失去最佳手術(shù)治療時(shí)機(jī),且由于HCC異質(zhì)性強(qiáng),靶向治療易出現(xiàn)耐藥性,因此患者預(yù)后較差。目前,甲胎蛋白指標(biāo)是作為HCC早期復(fù)發(fā)的有效評(píng)估指標(biāo),但是其陽性率較低,臨床上約30%肝細(xì)胞癌患者甲胎蛋白并沒有升高,用于術(shù)后HCC早期復(fù)發(fā)篩查及預(yù)后評(píng)估存在著一定的局限性。索拉非尼、倫伐替尼是HCC的首選靶向治療藥物,但目前整體治療效果仍不佳,因此篩選新的治療靶點(diǎn)對(duì)改善患者的預(yù)后具有重要意義。
圖2 差異表達(dá)基因間的蛋白-蛋白互作網(wǎng)絡(luò)圖
本研究首先針對(duì)黃色人種選擇了GSE41804、GSE19665以及GSE101685共3個(gè)數(shù)據(jù)集,其中,GSE41804包含了20例HCC組織和20例正常組織的數(shù)據(jù),GSE19665包含了10例HCC組織和10例正常組織的數(shù)據(jù),GSE101685包含了24例HCC組織和8例正常組織的數(shù)據(jù),對(duì)38例正常肝組織和54例HCC患者的樣本數(shù)據(jù)進(jìn)行綜合分析,初步篩選出147個(gè)HCC與正常組織差異表達(dá)基因,然后再利用GO富集分析和KEGG通路分析來檢測(cè)3個(gè)數(shù)據(jù)集,探索147個(gè)HCC與正常組織差異表達(dá)基因之間的相互作用,通過GO功能富集分析顯示這些基因與對(duì)無機(jī)物的反應(yīng)、加單氧酶活化、類固醇?xì)浠富罨壬镞M(jìn)程明顯相關(guān),提示這些基因可能參與了腫瘤細(xì)胞的增殖和凋亡過程[16-17];KEGG通路分析顯示,147個(gè)差異表達(dá)基因主要通過p53信號(hào)通路影響HCC的發(fā)生。肝臟作為人體的最大的代謝器官,參與營養(yǎng)物質(zhì)以及藥物等的代謝過程,HCC與正常肝組織的差異表達(dá)基因KEGG分析顯示,視黃醇代謝、藥物以及酶代謝的變化與HCC患者患病時(shí)的代謝功能紊亂狀態(tài)相吻合[18-19]。同時(shí)利用在線網(wǎng)站STRING研究蛋白質(zhì)之間的功能相互作用關(guān)系,以發(fā)現(xiàn)癌癥的發(fā)生或發(fā)展?jié)撛跈C(jī)制。利用Cytoscape 3.6.1對(duì)蛋白相互作網(wǎng)絡(luò)圖進(jìn)行分析,根據(jù)作用程度將蛋白互作網(wǎng)絡(luò)分成6個(gè)作用緊密的簇,每一簇中有一個(gè)基因標(biāo)注為“seed”,分別為基因FAM83D、CYP2C8、MT1M、SLCO1B3、GYS2、FCN3,即為該簇的候選基因,上述6個(gè)候選基因不僅和其他基因有著密切的相互作用,而且可能決定其他基因的功能。通過對(duì)候選基因進(jìn)行Kaplan-Meier預(yù)后分析發(fā)現(xiàn),F(xiàn)AM83D、CYP2C8、GYS2、SLCO1B3、FCN3關(guān)鍵基因是評(píng)估HCC患者預(yù)后以及靶向治療的關(guān)鍵基因。通過RT-qPCR檢測(cè)獲取的實(shí)物標(biāo)本中5個(gè)關(guān)鍵基因的表達(dá)量,并與數(shù)據(jù)庫中分析獲得的關(guān)鍵基因表達(dá)量進(jìn)行了比對(duì),兩者結(jié)果一致。
FAM83D是FAM83家族成員之一,參與紡錘體相關(guān)蛋白的編碼以及有絲分裂過程,可以調(diào)節(jié)細(xì)胞分裂,可以調(diào)節(jié)癌細(xì)胞的增殖、遷移、侵襲和凋亡等過程[20]。研究發(fā)現(xiàn)FAM83D高表達(dá),可能與HCC增殖能力呈正相關(guān)[21]。敲降FAM83D可以抑制乳腺癌細(xì)胞增殖以及誘導(dǎo)細(xì)胞凋亡[22]。在正常肝組織中FCN3是一種模式識(shí)別分子,具有激活補(bǔ)體凝集素途徑的功能,研究發(fā)現(xiàn)FCN3可以識(shí)別卵巢癌細(xì)胞參與免疫應(yīng)答[23]。有研究顯示FCN3在HCC中可作為腫瘤的潛在標(biāo)志物[24-25]。CYP家族是癌癥形成過程的關(guān)鍵酶,介導(dǎo)多種致癌物質(zhì)的代謝以及活化,在HCC患者中,CYP2C8低表達(dá)患者的OS比CYP2C8高表達(dá)患者的短[26-27]。此外,CYP2C8的低表達(dá)與腫瘤分期、肝內(nèi)轉(zhuǎn)移等晚期臨床病理特征有關(guān),分期早及病理結(jié)果較好的患者CYP2C8表達(dá)量高[28]。GYS2是GYS的一個(gè)亞型,GYS是糖原生物合成的關(guān)鍵酶,可通過與p53的負(fù)反饋機(jī)制抑制HBV相關(guān)HCC的腫瘤生長,GYS2在HCC組織當(dāng)中表達(dá)下調(diào),可以抑制HCC的生長[29-30]。研究顯示SLCO1B3是在肝臟中表達(dá)的功能性轉(zhuǎn)運(yùn)蛋白,可轉(zhuǎn)運(yùn)多種內(nèi)源性和外源性化合物,包括激素及其結(jié)合物,并且和紫杉烷類等抗癌藥耐藥性的產(chǎn)生有關(guān)[31-32]。綜上所述,基因FAM83D、FCN3、CYP2C8、GYS2以及SLCO1B3可能是潛在的預(yù)測(cè)和指導(dǎo)HCC治療的標(biāo)志物。
綜上所述,本研究利用生物信息學(xué)方法對(duì)HCC患者的相關(guān)數(shù)據(jù)進(jìn)行分析,獲得預(yù)測(cè)和指導(dǎo)HCC治療的潛在標(biāo)志物,對(duì)更加深入地認(rèn)識(shí)和了解HCC的發(fā)生和發(fā)展提供了理論依據(jù),為后續(xù)的動(dòng)物實(shí)驗(yàn)和臨床試驗(yàn)提供了研究方向。