譚崢嶸, 豐大利, 張 清
宜昌市第二人民醫(yī)院, 三峽大學第二人民醫(yī)院 a.消化內科; b.腫瘤科, 湖北 宜昌 443000
膽管癌(cholangiocarcinoma,CCA)是源于肝外膽管包括肝門區(qū)至膽總管下端的膽管的惡性腫瘤,預后較差[1]。近年來CCA的發(fā)病率和死亡率顯著增加。其病因尚不清楚,可能與遺傳、膽管結石、寄生蟲和膽管囊性擴張癥等有關。由于大多數CCA患者臨床早期無明顯癥狀,因此很難進行早期診斷和早期治療。
長鏈非編碼RNA(long non-coding RNA,LncRNA)是指長度>200個核苷酸的轉錄本,雖然這些分子的功能正逐漸被破譯,但因為其不編碼蛋白,曾被認為是“垃圾基因”或“轉錄噪音”[2-3]。基因間長鏈非編碼RNA(intergenic long non-coding RNA,lincRNA)是最大類的LncRNA分子[4-5]。許多研究報道lincRNA具有抑制腫瘤或促進腫瘤的作用[6]。在本研究中,通過整合分析公共數據庫中的基因芯片測序數據和臨床數據,鑒定CCA中與預后相關的關鍵lincRNA,并通過實驗驗證,為CCA的防治研究提供有價值的線索。
1.1 材料
1.1.1 高通量表達數據 CCA表達量和臨床數據獲取自人類癌癥基因組圖譜(the cancer genome atlas,TCGA)(http://www.tcga.org),包含36例腫瘤樣本和9例正常樣本。數據集GSE107943獲取自高通量基因表達數據庫(gene expression omnibus,GEO)(https://www.ncbi.nlm.nih.gov/gds/)[7],包含30例腫瘤樣本和27例正常樣本。所有腫瘤樣品均為人源,均為實體瘤樣品。
1.1.2 組織樣本收集 臨床組織樣本來源于2018年-2019年在宜昌市第二人民醫(yī)院確診為CCA的5例患者,術中分別取癌組織和癌旁組織。入選標準:(1)所有患者經實驗室檢查和影像學檢查明確診斷確診為CCA;(2)術前未進行化療或放療;(3)臨床資料完整。樣本收集后用RNA保護液儲存后放入-80 ℃冰箱。本研究經宜昌市第二人民醫(yī)院醫(yī)學倫理委員會審查通過(批號:S2019-026),所有患者知情同意。
1.1.3 試劑 提取RNA采用Trizol試劑,cDNA反轉錄試劑盒和熒光定量PCR試劑盒購自寶日醫(yī)生物技術有限公司。實時熒光定量PCR儀選用Applied Biosystems 7300。
1.2 方法
1.2.1 差異表達lincRNA的篩選 用R軟件進行差異性基因分析,并進行Mann-WhitneyU檢驗以確定腫瘤組織和正常樣品之間顯著差異性表達的lincRNA。腫瘤組織表達量比正常組織表達量的差異倍數大于2倍,校正P< 0.05 視為顯著失調lincRNA,使用雙側非配對t檢驗來檢測表達差異的顯著性。韋恩圖使用Venny 2.1(http://bioinfogp.cnb.csic.es/tools/venny/index.html)進行分析制作。
1.2.2 lincRNA的診斷和預后分析 本研究使用Graphpad prism 8對lincRNA的表達進行了受試者工作特征曲線(ROC曲線)分析,ROC曲線下面積(AUC)>0.8,P<0.05時,基因表達對CCA有診斷意義。使用Graphpad prism 8對lincRNA RP11-488L18.10的表達進行了Kaplan-Meier生存曲線分析,P<0.05表示對預后有意義。
1.2.3 基因富集分析 基因富集分析用來挖掘在CCA組織中l(wèi)incRNA RP11-488L18.10 顯著富集分通路[8]?;蚺判驑藴蔬x項選擇Pearson分析,置換次數選擇2000。
1.2.4 實時熒光定量PCR Trizol法提取組織總RNA,反轉錄為cDNA。采用實時熒光定量PCR檢測癌組織和癌旁組織中l(wèi)incRNA RP11-488L18.10和MCM2的表達。lincRNA RP11-488L18.10引物序列,上游5’- CCAAGACCCAAGGACAGCT-3’,下游5’- GAAGGATGGACAGGAGATG-3’; MCM2引物序列,上游5’- ATGGCGGAATCATCGGAATCC-3’,下游5’- GGTGAGGGCATCAGTACGC-3’;內參GAPDH引物序列,上游5’-GACTCATGACCACAGTCCATGC -3’,下游5’-AGAGGCAGGGATGATGTTCTG -3’。結果采用 Applied Biosystems 7300系統分析。P<0.05為差異有統計學意義。
2.1 表達差異lincRNA的篩選 分別在TCGA和GSE107943篩選表達差異lincRNA,然后將兩個數據集上調和下調lincRNA分別取交集,分別得到451個同時在TCGA和GSE107943上調的lincRNA和154個同時在TCGA和GSE107943下調的lincRNA(圖1a)。接著對這些失調基因進行生存曲線分析,發(fā)現8個lincRNA對預后影響顯著。對這8個lincRNA在腫瘤組織中的表達豐度進行了比較,發(fā)現lincRNA RP11-488L18.10在TCGA和GSE107943腫瘤組織中豐度相對都較高(圖1b)。
注:a,TCGA和GSE107943數據集中上調和下調lincRNA的交集;b,8個lincRNA在腫瘤組織中的表達豐度。
圖1表達差異lincRNA的篩選
2.2 lincRNA RP11-488L18.10對CCA的診斷意義 通過對TCGA和GSE107943進行分析發(fā)現,lincRNA RP11-488L18.10在這兩個數據集的CCA組織中顯著上調(圖2a、b)。利用TCGA和GSE107943數據集對lincRNA RP11-488L18.10的表達與CCA的關系進行ROC曲線分析,結果顯示,TCGA中AUC=1,P<0.000 1;在GSE107943中AUC=0.946 9,P<0.000 1。這說明lincRNA RP11-488L18.10的高表達可以預測CCA的發(fā)生(圖2c、d)。
2.3 lincRNA RP11-488L18.10表達對CCA患者的預后預測價值 在TCGA中,lincRNA RP11-488L18.10的高表達可以顯著預測CCA患者的總生存率(P=0.016)(圖3a)和無復發(fā)生存率(P=0.017)(圖3b);在GSE107943中,lincRNA RP11-488L18.10 的高表達可以顯著預測CCA患者的總生存率(P=0.023)(圖3c)和無復發(fā)生存率(P=0.005)(圖3d)。
注:a,TCGA數據庫中l(wèi)incRNA RP11-488L18.10的表達;b,GSE107943中l(wèi)incRNA RP11-488L18.10的表達;c,TCGA中ROC曲線分析;d,GSE107943中ROC曲線分析。
圖2lincRNARP11-488L18.10的表達水平及其對CCA的診斷意義
注:a,TCGA中l(wèi)incRNA RP11-488L18.10表達與CCA總生存率的關系;b,TCGA中l(wèi)incRNA RP11-488L18.10表達與CCA無復發(fā)生存率的關系;c,GSE107943中l(wèi)incRNA RP11-488L18.10表達與CCA總生存率的關系;d,GSE107943中l(wèi)incRNA RP11-488L18.10表達與CCA無復發(fā)生存率的關系。
圖3lincRNARP11-488L18.10表達對CCA的預后預測分析
2.4 lincRNA RP11-488L18.10的功能預測 在TCGA和 GSE107943兩個數據集中對lincRNA RP11-488L18.10進行基因富集分析,結果顯示, lincRNA RP11-488L18.10的表達和DNA復制通路呈顯著正相關(P值分別為0.022、0.008)(圖4a、b)。分別對兩個數據集中的核心富集基因進行分析,發(fā)現這些基因的表達都與 lincRNARP11-488L18.10的表達呈顯著正相關,并且R值均大于0.3(圖4c、d)。微型染色體維持蛋白2(minichromosomemaintenance protein 2,MCM2)在兩個數據集中都顯示出了較高的相關性和富集度,所以選擇MCM2來進一步分析。散點圖顯示兩個數據集中l(wèi)incRNA RP11-488L18.10 都與 MCM2呈顯著正相關(P值均<0.001)(圖4e、f)。
2.5 臨床樣本驗證 取臨床樣本檢測癌旁組織中l(wèi)incRNA RP11-488L18.10的相對表達量為0.918±0.230,CCA組織為2.636±1.127,2組比較差異有統計學意義(t=3.340,P=0.010);癌旁組織MCM2的相對表達量為0.942±0.216,CCA組織為1.766±0.617,2組比較差異有統計學意義(t=2.818,P=0.023)。
在過去的幾十年中,CCA的發(fā)病率顯著增加。大多數患者早期沒有明顯的癥狀,其高危風險因素包括膽汁淤積和慢性炎癥環(huán)境。一般采用手術切除、全身化療和靶向放射等治療[9]。近年來,對CCA機制的研究越來越深入,但腫瘤發(fā)生發(fā)展是一個多因素、多階段及多基因調控的過程,徹底了解遺傳因素在CCA中的作用和信號通路需要大樣本研究。轉錄組重建技術能夠快速方便地從RNA-seq數據中篩選差異性LncRNA[10-11]。測序深度和閱讀長度的快速增加大大提高了轉錄物重建的準確性。綜合生物信息學分析方法解決了單個隊列研究的局限性。
LncRNA影響包括致瘤過程在內的各種生物過程,既往研究[12-14]已表明它們在生理病理、腫瘤和胚胎發(fā)育中的重要性。LncRNA可以通過復雜的機制影響腫瘤的侵襲和轉移,包括表達水平失調和靶基因的調控,因此被認為是潛在的預后標志物[15]。例如,LncRNA TP73-AS1被發(fā)現充當海綿miR-194的競爭性內源RNA,促進結直腸癌細胞的增殖,遷移和侵襲[16]。據報道[17],lincRNA 00961可作為神經膠質瘤患者的預后指標和潛在的治療靶標。LncRNA SNHG20被確定為骨肉瘤患者不良預后的獨立影響因素,可調節(jié)腫瘤細胞的遷移和侵襲[18]。關于LncRNA與CCA的預后及發(fā)展目前研究較少。研究[19]發(fā)現線粒體RNA加工內切核糖核酸酶的LncRNA組分通過調節(jié)miR-217參與CCA的進展。有研究[20]顯示,LncRNA EPIC1通過靶向調控Myc促進CCA進展。本研究首次報道了在TCGA和GSE107943兩個數據集中l(wèi)incRNA RP11-488L18.10在腫瘤組織中豐度相對較高。lincRNA RP11-488L18.10的高表達可以顯著預測CCA的發(fā)生和不良預后。lincRNA RP11-488L18.10與MCM2呈顯著正相關。
MCM在細胞周期中形成DNA復制前復合物,啟動DNA復制,是所有真核細胞DNA復制所必須的。MCM家族蛋白中共6個成員,分別為MCM2-7,MCM2能更準確地反映細胞增殖情況。MCM2只存在于細胞周期的細胞核中,在增殖細胞中表達水平高,在靜止期細胞或分化好的細胞中不表達或水平很低,提示MCM2可以作為增殖細胞的特異標志[21]。有研究[21-22]顯示,在卵巢癌中MCM2的表達明顯高表達,且MCM2的表達水平與預后呈正相關。LncRNA的生物學功能主要表現在從表觀遺傳學、轉錄調控及轉錄后調控3個層面實現對基因表達的調控。lincRNA RP11-488L18.10與MCM2的具體結合位點和功能學,需通過動物學實驗和細胞實驗進一步研究。
綜上所述,本研究首次報道了lincRNA RP11-488L18.10與CCA的發(fā)生及預后密切相關,提示lincRNA RP11-488L18.10具有成為CCA診斷標志物的良好前景。