王永坤 李保國
摘? 要: 肝癌轉(zhuǎn)移是肝癌患者治療失敗和死亡的主要原因,尋找與肝癌發(fā)生轉(zhuǎn)移相關的基因?qū)τ谘芯扛伟┺D(zhuǎn)移的分子機制,及時診斷、防治肝癌轉(zhuǎn)移具有重要的生物學意義。我們在前期研究中已經(jīng)發(fā)現(xiàn)脂肪代謝可能與免疫微環(huán)境存在關聯(lián)。本研究從GEO數(shù)據(jù)庫下載27例伴有高低轉(zhuǎn)移的肝細胞癌樣本的表達譜信息,比較高低轉(zhuǎn)移樣本之間基因表達譜的差異,從中篩選出91個脂代謝相關的差異表達基因。通過脂代謝基因的表達譜數(shù)據(jù),我們計算了22種免疫細胞在這27例轉(zhuǎn)移樣本中的免疫細胞占比,并通過皮爾森相關性分析篩選出脂代謝-免疫相關基因,進一步探究脂代謝與與免疫微環(huán)境之間的關系。最后,通過KEGG通路Pathway功能富集分析以及預后分析發(fā)現(xiàn)CYP4A11、CYP3A5、CYP2C8、ALDH2、BDH1、ALDH7A1等脂代謝-免疫相關基因可能在肝癌侵襲和轉(zhuǎn)移中發(fā)揮重要作用。
關鍵詞: 肝癌轉(zhuǎn)移;脂代謝;免疫細胞;表達譜
【Abstract】: Hepatocellular carcinoma (HCC) has a poor prognosis due to its rapid development and early metastasis. Finding genes related to metastatic HCC may bring important biological significance for studying the molecular mechanism and intervention targets of prevention and cure of liver cancer. In this study, 27 samples of hepatocellular carcinoma with high and low metastasis were downloaded from the GEO database, 91 differentially expressed genes related to lipid metabolism were screened out by comparing gene expression profiles between high and low metastasis samples. Furthermore, the proportions of 22 immune cells in 27 samples were calculated by CIBERSORT, the lipid metabolism genes which are highly correlated with HCC metastasis and immune microenvironment were further explored by Pearson correlation analysis. Eventually, we found that CYP4A11, CYP3A5, CYP2C8, ALDH2, BDH1, ALDH7A1 lipid metabolism-immunity-related genes may play an important role in liver cancer invasion and metastasis by KEGG pathway functional enrichment and prognostic analysis. Not only might these molecules allow more accurate prediction of prognosis for patients with HCC, but they may also provide targets for potential therapeutic agents.
【Key words】: Liver cancer metastasis; Lipid metabolism; Immune cells; Expression profile
0? 引言
原發(fā)性肝癌是最常見的惡性腫瘤之一,居全球癌癥患者致死率的第三位,并在全世界范圍內(nèi)呈現(xiàn)逐年上升趨勢[1]。肝細胞肝癌(Hepatocellular carcinoma,HCC)是最常見的原發(fā)性肝癌,癌細胞的擴散和轉(zhuǎn)移是HCC患者的主要死因[2]。代謝是肝癌的標志,其有助于肝癌發(fā)生和發(fā)展,一方面,致癌因素破壞機體的代謝平衡,誘發(fā)代謝重組,細胞發(fā)生癌變;另一方面,重組后的代謝系統(tǒng)介導多種生物學行為,參與癌細胞的增殖、侵襲和轉(zhuǎn)移[3-4]。脂代謝是機體代謝中的重要一環(huán),肝臟是脂代謝的重要場所。肝癌轉(zhuǎn)移是一個包含肝癌細胞脫離原發(fā)瘤、在循環(huán)系統(tǒng)中存活并種植生長于靶器官的復發(fā)的過程,其中的每一步都受到肝癌微環(huán)境中的非肝癌細胞的影響,炎癥在肝癌的發(fā)生發(fā)展、侵襲轉(zhuǎn)移過程中起重要作用[5]。腫瘤微環(huán)境(Tumor microenvi ronment,TME)中的免疫抑制被認為是基于免疫細胞和腫瘤細胞的相互代謝需求[6]。腫瘤細胞中不僅發(fā)生脂質(zhì)代謝異常,而且TME顯示脂質(zhì)代謝異常,進一步募集免疫細胞。HCC中免疫微環(huán)境、脂代謝異常以及肝癌侵襲轉(zhuǎn)移之間的作用機制目前尚不清楚。因此,深入了解三者之間的復雜關系對于肝癌的綜合治療具有重要意義。
近幾年,隨著數(shù)據(jù)類型的增多,EXCEL、SPSS等常用軟件已經(jīng)不能滿足科研需求了。R語言以其方便、快捷的優(yōu)勢,迅速獲得許多科研人員的青睞,例如R語言的limma包可以有效分析FPKM數(shù)據(jù)的表達值,計算差異表達基因,ggplot2包和heatmap包可以將表達情況以熱圖的方式直觀展示出來。Python語言中的re板塊可以快速匹配多套數(shù)據(jù),sys模塊可以在外部向程序內(nèi)部傳遞參數(shù),還可以使用SVM--Lasso等,訓練模型,畫出AUC曲線。但不是所有的科研人員可以熟練的使用編程語言,因此越來越多的分析軟件被研發(fā)出來應用于生物信息的研究,例如CIBERSORT是一種利用組織RNA混合物表征細胞異質(zhì)性的軟件,采用基因表達譜數(shù)據(jù)[7,8],以1為基數(shù),計算22種免疫細胞在某個樣本中的相對比例。該軟件通過線性支持向量回歸(SVR)和機器學習方法對混合物進行去卷積,有助于對細胞生物標記物和治療靶標的RNA混合物進行大規(guī)模分析[20-24],即從基因表達譜數(shù)據(jù)中中鑒定復雜組織細胞組成的工具。g:Profiler是一個公共Web服務器,用于表征和操作由挖掘高通量基因組數(shù)據(jù)產(chǎn)生的基因列表,進行KEGG和GO等多種分析。STRING是已知和預測的蛋白質(zhì)-蛋白質(zhì)相互作用的數(shù)據(jù)庫。
GEO數(shù)據(jù)庫[9]是由美國國立生物技術信息中心(NCBI)建立的基因表達資源庫。GEO數(shù)據(jù)庫中已收錄了不同組織來源的各個組學水平的數(shù)據(jù),可作為肝癌轉(zhuǎn)移研究的主要數(shù)據(jù)來源。利用GEO數(shù)據(jù)庫中肝癌轉(zhuǎn)移數(shù)據(jù)及相關的工具和算法,能夠全面分析肝癌脂質(zhì)代謝與免疫微環(huán)境對轉(zhuǎn)移的影響。本課題通過基因表達譜篩選與免疫微環(huán)境中免疫細胞占比顯著相關的脂代謝基因,為肝癌轉(zhuǎn)移相關重要基因和標志物的篩選提供另一種角度。
1? 材料與方法
1.1? 材料
通過GEO數(shù)據(jù)庫檢索界面的GEO DataSets搜索HCC Metastasis,共搜集到856篇相關文獻或數(shù)據(jù)。精讀文獻最終確定研究號為GSE77314[10]的肝癌轉(zhuǎn)移基因表達譜數(shù)據(jù)(https://www.ncbi.nlm.nih. gov/geo/query/acc.cgi?acc=GSE77314)為研究數(shù)據(jù)。研究對象為27例肝癌轉(zhuǎn)移樣本,其中13例伴有高轉(zhuǎn)移,14例伴有低轉(zhuǎn)移。
1.2? 方法
(1)篩選脂代謝相關差異表達基因
為了全面篩選在肝癌轉(zhuǎn)移過程中改變的脂代謝相關基因,通過查閱200多篇脂代謝相關文獻以及KEGG數(shù)據(jù)庫中整合代謝通路中的脂代謝相關基因,使用R語言計算差異表達基因(p<0.05),進而通過Python語言的re模塊對兩者進行匹配從而篩選出脂代謝相關基因。
(2)免疫細胞占比及皮爾遜相關性分析
本文使用CIBERSORT軟件計算22種免疫細胞在27例轉(zhuǎn)移樣本中的免疫細胞占比。為探討高低轉(zhuǎn)移組中脂代謝基因與免疫微環(huán)境之間的關系,對脂代謝基因表達值與免疫細胞占比進行了皮爾遜相關性檢驗,篩選既與脂代謝相關又與免疫細胞占比顯著相關(P<0.05)的候選基因以供后續(xù)的分析。篩選標準:高/低轉(zhuǎn)移樣本中與22種免疫細胞中的至少一種細胞顯著相關。
(3)KEGG通路富集和基因預后分析
利用本組開發(fā)的OmicsBean-Cancer (http://www. omicsbean.com:XX/)多組學數(shù)據(jù)分析系統(tǒng),針對多種類型組合的組學實驗設計方案進行數(shù)據(jù)分析。對與脂代謝-免疫細胞占比顯著相關的候選基因進行KEGG富集分析,比較高低轉(zhuǎn)移組脂代謝通路及通路上脂代謝基因的差異。為了探究脂代謝基因?qū)颊哳A后的影響,采用Omicsbean-Cancer軟件對脂代謝通路上富集的基因和高低轉(zhuǎn)移組中共有的基因分別作預后分析。篩選條件設定為:Log-rank檢驗P<0.05,用于篩選目標基因。
(4)蛋白質(zhì)相互作用網(wǎng)絡(protein protein interaction network,PPI network)
通過STRING數(shù)據(jù)庫[11]將與肝癌預后分析顯著性相關的目標基因進行蛋白質(zhì)相互作用網(wǎng)絡分析,篩選出目標基因的中心節(jié)點。
2? 結(jié)果與分析
2.1? 脂質(zhì)代謝相關基因的篩選
通過查閱文獻以及KEGG數(shù)據(jù)庫中收集的脂代謝相關基因1009個對1789個差異表達基因進行比對,最終篩選出91個差異表達的脂代謝相關基因。將91個脂代謝基因作為主的研究對象,其中明顯表達上調(diào)的基因35個,明顯表達下調(diào)的基因56個,如圖1所示。
2.2? 免疫細胞占比及皮爾遜相關性檢驗
通過使用CIBERSORT軟件分別計算高轉(zhuǎn)移組和低轉(zhuǎn)移組中的22種免疫細胞占比,發(fā)現(xiàn)在高/低轉(zhuǎn)移樣本中幼稚B細胞、巨噬細胞M1、樹突狀休眠細胞占比最高(見圖2)。
腫瘤微環(huán)境中的炎癥細胞有腫瘤相關巨噬細胞(Tumer Associated Macrophage,TAM)、樹突狀細胞(Dendritic cells,DC)和淋巴細胞。研究表明,TAM被認為是腫瘤細胞侵襲轉(zhuǎn)移中重要的參與者,TAM
分泌的某些分子,不僅能夠促血管形成機制促進原發(fā)腫瘤發(fā)展,也介導了腫瘤的轉(zhuǎn)移過程[12]。腫瘤組織中TAM缺乏,不能明顯地改變癌前病變,但卻能很明顯地推遲腫瘤侵襲能力的出現(xiàn),減少腫瘤轉(zhuǎn)移的形成[12-13]。DC誘導的自體T淋巴細胞增殖分化為細胞毒性T細胞(CLT)能明顯降低AFP mMRNA陽性率,并相應減少肝癌轉(zhuǎn)移的發(fā)生[14]。在本文的研究中,在高轉(zhuǎn)移組中TAM的平均占比為0.12略高于低轉(zhuǎn)移組的平均占比0.11,高轉(zhuǎn)移組DC的平均占比0.1略低于低轉(zhuǎn)移組的平均占比0.12,與文獻中的報道相一致[12-14]。
為了進一步探討脂代謝與免疫微環(huán)境之間的關系,對脂代謝基因表達值與免疫細胞占比進行了皮爾遜相關性檢驗,得到既與脂代謝有關又與免疫細胞占比顯著性相關的基因(P<0.05)。其中,高轉(zhuǎn)移組中基因47個,低轉(zhuǎn)移組基因18個,其中9個基因同時存在于高/低轉(zhuǎn)移樣本中。在高轉(zhuǎn)移樣本中的脂代謝-免疫相關基因中,ALDH2及CYP450家族基因(CYP4A11、CYP3A5等)呈顯著下調(diào)(圖1),這與CYP3A5基因表達水平低能夠促進肝癌的轉(zhuǎn)移相一致[15]。另外,Hou G,Chen L等[16]研究表明在遷移能力較強的腫瘤組織中,HCC患者的預后較差與ALDH2基因表達水平降低有關。
2.3? KEGG通路富集分析
上述的研究中,發(fā)現(xiàn)高/低轉(zhuǎn)移組中與免疫細胞占比顯著相關的脂代謝基因相差很大,為了進一步
探討轉(zhuǎn)移過程中脂代謝通路的改變,對高/低轉(zhuǎn)移組中的脂代謝-免疫相關基因分別作KEGG通路富集分析,結(jié)果顯示:高轉(zhuǎn)移組中的47個脂代謝基因主要富集在脂肪酸降解、酮體的合成和降解、原發(fā)性膽汁酸生物合成、類固醇激素生物合成、甘油脂代謝、花生四烯酸代謝六種脂代謝通路中,而低轉(zhuǎn)移組中的18個脂代謝基因僅有SRD5A1, SRD5A2兩個基因富集在類固醇激素生物合成通路中(表1)。高低轉(zhuǎn)移脂代謝通路的不同,對肝癌轉(zhuǎn)移程度產(chǎn)生很大的影響,例如,高轉(zhuǎn)移組的花生四烯酸代謝通路,其代謝途徑有四個子過程:磷脂酶A2(PLA2)催化產(chǎn)生花生四烯酸;通過各種酶生產(chǎn)下游產(chǎn)物;環(huán)加氧酶(COXs),脂氧合酶(LOXs)產(chǎn)生白三烯和氫過氧二十碳四烯酸(HETEs);以及細胞色素P450(CYP450)環(huán)加氧酶產(chǎn)生幾種HETE和環(huán)氧二十碳三烯酸(EETs),這四個子過程與炎癥的發(fā)生和發(fā)展關系密切,以促炎或者抑炎的方式參與炎癥過程的調(diào)節(jié)[17]。對于HETE和EET的產(chǎn)生,CYP450家族基因起重要作用。在花生四烯酸代謝通路中CYP450家族基因顯著下調(diào),表明HETES和EETs產(chǎn)生的功能減少。CYP4A11合酶的主要作用是使花生四烯酸發(fā)生ω酶氧化,同時CYP4A11也是轉(zhuǎn)移風險的重要基因[18]。
2.4? 脂代謝基因?qū)︻A后的影響
為了研究脂質(zhì)代謝的預后影響,特別是高/低轉(zhuǎn)移組脂代謝通路上顯著富集的基因。為了研究脂質(zhì)代謝對肝癌病人的預后影響,特別是高/低轉(zhuǎn)移組脂代謝通路上顯著富集的基因。我們從UCSC(Uni versity of California Santa Cruz)數(shù)據(jù)庫中下載TCGA Liver Cancer數(shù)據(jù)集(https://xenabrowser.net/dat a pages/?cohort=TCGA%20Liver%20Cancer%20(LIHC)&removeHub=https%3A%2F%2Fxena.treehouse.gi.ucsc.edu%3A443),從中提取出既有基因表達數(shù)據(jù)又有完整的總生存期(OS)和無復發(fā)生存期(RFS)的樣本342例。根據(jù)基因表達量的中值把病人分成兩組,用Log-Rank檢驗估計兩組的存活時間之間的差異。篩選出具有顯著預后影響的脂質(zhì)代謝相關基因。其中高轉(zhuǎn)移中CYP4A11、ALDH7A1、ADH1C、ALDH2、ADH1B、ADH1A、BDH1、SCP2、SLC27A5、
CYP3A5、SRD5A2、DGKG、CYP4A11、CYP2C8等基因預后較顯著(P<0.05),低轉(zhuǎn)移中僅有SRD5A2基因預后較顯著。高低轉(zhuǎn)移中基因預后差別較大,可能是導致轉(zhuǎn)移高低的原因。對高低轉(zhuǎn)移共有的基因作預后分析,結(jié)果發(fā)現(xiàn)AQP9,SRD5A2,ABCG5,BDH1較顯著。根據(jù)STRING數(shù)據(jù)庫對預后較顯著的基因構(gòu)建蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(PPI)分析,發(fā)現(xiàn)除了已經(jīng)報道的CYP4A11和ALDH2外[17-18],CYP3A5、CYP2C8、BDH1、ALDH7A1是被識別的網(wǎng)絡中心節(jié)點(圖3),且其預后效果比較好(圖4),如酮體合成與降解通路中的BDH1基因,其為促進酮體產(chǎn)生的限速酶,在乳腺癌中生酮成纖維細胞促進腫瘤的生長與轉(zhuǎn)移[19],這與本研究的結(jié)果相一致,為下一步的研究提供了依據(jù)。這些分子可能是HCC的潛在預后生物標志物,在肝癌轉(zhuǎn)移過程中可能發(fā)揮了非常重要的作用。
3? 結(jié)論
肝癌的復發(fā)轉(zhuǎn)移已經(jīng)嚴重影響肝癌病人生存率,尋找促使肝癌發(fā)生轉(zhuǎn)移的基因改變 ,探明肝癌轉(zhuǎn)移的分子機制,預防或阻斷肝癌轉(zhuǎn)移成為進一步提高肝癌治療效果的關鍵,并已成為近年肝癌研究的熱點。雖然過去的許多研究對肝癌轉(zhuǎn)移分子機制進行了有益的探索,并且已經(jīng)發(fā)現(xiàn)了一些與肝癌轉(zhuǎn)移相關的基因[18]。但這些研究大多集中在尋找信號通路相關基因。近年來生物信息分析軟件在腫瘤研究中的應用越來越廣泛,本文通過R語言的limma包比較分析27例伴有高低轉(zhuǎn)移的肝癌之間基因表達譜的差異,CIBERSORT分析免疫細胞占比與肝癌轉(zhuǎn)移的相關性,g:Profiler軟件聚焦篩選了與肝癌轉(zhuǎn)移密切相關的脂代謝-免疫基因,并使用STRING軟件分析了這些基因的功能以及它們之間相互作用的關系,最終使用Log-Rank檢驗篩選出CYP4A11、CYP3A5、CYP2C8、ALDH2、BDH1、ALDH7A1等6個基因進一步與肝癌預后相關。本文研究結(jié)果為篩選可阻斷腫瘤侵襲和轉(zhuǎn)移的新的分子標志物提供了思路和方法。
參考文獻
[1]Pascual S, Herrera I, Irurzun J. New advances in hepa tocellular carcinoma[J]. World J Hepatol, 2016, 8(9): 421- 438.
[2]Kim J U, Shariff M I F, Crossey M M E, et al. Hepatocellular carcinoma: Review of disease and tumor biomarkers[J]. World Journal of Hepatology, 2016, 8(10): 471.
[3]Deberardinis R J, Lum J J, Hatzivassiliou G, et al. The Biology of Cancer: Metabolic Reprogramming Fuels Cell Growth and Proliferation[J]. Cell Metabolism, 2008, 7(1): 0-20.
[4]Yang G, Wang Y, Feng J, et al. Aspirin suppresses the abnormal lipid metabolism in liver cancer cells via disrupting an NFκB-ACSL1 signaling. [J]. Biochemical & Biophysical Research Communications, 2017, 486(3): 827.
[5]Shi Y, Qin N, Zhou Q, et al. Role of IQGAP3 in metastasis and epithelial–mesenchymal transition in human hepatoce llular carcinoma[J]. Journal of Translational Medicine, 2017, 15(1): 176.
[6]Tahmasebi Birgani M, Carloni V . Tumor Microenvironment, a Paradigm in Hepatocellular Carcinoma Progression and Therapy[J]. International Journal of Molecular Sciences, 2017, 18(2): 405.
[7]Chen B, Khodadoust M S, Liu C L, et al. Profiling Tumor Infiltrating Immune Cells with CIBERSORT[J]. Methods in Molecular Biology, 2018, 1711: 243.
[8]Li Taiwen, Fan Jingyu, Wang Binbin, et al. TIMER: A Web Server for Comprehensive Analysis of Tumor-Infiltrating Immune Cells[J]. Cancer Research, 2017, 77(21): e108.
[9]Barrett T, Troup D B, Wilhite S E, et al. NCBI GEO: archive for functional genomics data sets--10 years on[J]. Nucleic Acids Research, 2013, 39(Database issue): 1005-10.
[10]Liu G, Hou G, Li L, et al. Potential diagnostic and prognostic marker dimethylglycine dehydrogenase (DMGDH) suppre sses hepatocellular carcinoma metastasis in vitro and in vivo. [J]. Oncotarget, 2016, 7(22): 32607-32616.
[11]Li L, Lei Q, Zhang S, et al. Screening and identification of key biomarkers in hepatocellular carcinoma: Evidence from bioinformatic analysis[J]. Oncology Reports, 2017.
[12]Tan H, Wang N, Feng Y . Autophagy mediated activation of Relb/p52 responsible for the reprogramming of tumour associated macrophages[J]. European Journal of Cancer, 2016, 61: S49-S49.
[13]許晶, 管曉翔. 腫瘤微環(huán)境的組成及其在腫瘤轉(zhuǎn)移中的作用[J]. 癌癥進展, 2014, 12(2): 144-148.
[14]孫建聰. 1. 負載肝癌干細胞RNA樹突狀細胞疫苗誘導的抗肝癌免疫應答研究;2. EDIL3的表達和肝癌患者預后的關系[D]. 中山大學, 2010.
[15]Jiang F. CYP3A5 Functions as a Tumor Suppressor in Hepa tocellular Carcinoma by Regulating mTORC2/Akt Signa ling[J]. Cancer Research, 2015, 75(7): 1470-1481.
[16]Hou G, Chen L, Liu G, et al. Aldehyde dehydrogenase‐2 (ALDH2) opposes hepatocellular carcinoma progression by regulating AMP-activated protein kinase signaling in mice[J]. Hepatology, 2017, 65(5): 1628.
[17]Li J, Li O, Kan M . Berberine induces apoptosis by suppressing the arachidonic acid metabolic pathway in hepatocellular carcinoma.[J]. Molecular Medicine Reports, 2015, 12(3): 4572.
[18]Chen P, Wang F, Feng J, et al. Co-expression network analysis identified six hub genes in association with meta stasis risk and prognosis in hepatocellular carcinoma[J]. Oncotarget, 2017, 8(30): 48948-48958.
[19]Martinez-Outschoorn U E, Lin Z, Whitaker-Menezes D, et al. Ketone body utilization drives tumor growth and meta sta sis[J]. Cell Cycle, 2012, 11(21): 3964-3971.
[20]蒲杰方, 盧熒玲. 基于聚類算法和神經(jīng)網(wǎng)絡的客戶分類模型構(gòu)建[J]. 軟件, 2018, 39(4): 130-136.
[21]吳亞熙, 岑峰. 基于卷積神經(jīng)網(wǎng)絡的多層級目標檢測方法[J]. 軟件, 2018, 39(4): 164-169.
[22]阮陽, 劉禹, 韓港成, 等. 基于爬蟲的定向數(shù)據(jù)檢索系統(tǒng)[J]. 軟件, 2018, 39(5): 118-120.
[23]岳立言, 歐陽昇, 翟寶蓉. 嵌入式Linux遠程監(jiān)控系統(tǒng)的設計與開發(fā)[J]. 軟件, 2018, 39(6): 20-22.
[24]張敏, 徐啟華. 基于改進BP的神經(jīng)網(wǎng)絡模型參考自適應控制[J]. 軟件, 2015, 36(7): 118-123.