高 杰,張 曉*,魏 超
(東南大學(xué)公共衛(wèi)生學(xué)院,江蘇 南京 210009)
胰腺癌是一種常見的消化系統(tǒng)高度惡性腫瘤,是中國(guó)致死率第7位的腫瘤,發(fā)病率呈現(xiàn)不斷上升的趨勢(shì)[1-2]。胰腺癌的診斷和治療手段雖然一直在進(jìn)步,但效果仍然不盡如人意,胰腺癌早期難以診斷且患者經(jīng)手術(shù)治療后的5年生存率低[3]。因此迫切需要確定可靠、敏感的生物標(biāo)志物用于胰腺癌的早期診斷和治療[4-5]。微小RNA(microRNA,miRNA)是真核生物中存在的一類長(zhǎng)度約為20個(gè)核苷酸的內(nèi)源性非編碼RNA,可以與mRNA結(jié)合從而調(diào)控基因的表達(dá)[6]。目前已有的研究證實(shí)miRNA幾乎在所有生物途徑中都發(fā)揮著重要作用,與腫瘤的發(fā)生、發(fā)展密切相關(guān),可以作為腫瘤診斷和治療的分子靶標(biāo)[7-8]。目前miRNA已被廣泛應(yīng)用于肺癌、胃癌、乳腺癌、肝癌等腫瘤研究中[9-11],本研究應(yīng)用基因芯片表達(dá)匯編數(shù)據(jù)庫(Gene Expression Omnibus,GEO)和腫瘤基因組圖譜數(shù)據(jù)庫(The Cancer Genome Atlas,TCGA)篩選胰腺癌預(yù)后相關(guān)的miRNA。
從美國(guó)國(guó)立生物技術(shù)中心的GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)中下載胰腺癌GSE32678和GSE71533芯片數(shù)據(jù)集,這兩套數(shù)據(jù)集包括胰腺癌組織和正常組織的基因芯片表達(dá)數(shù)據(jù)[12]。GSE32678數(shù)據(jù)集包含胰腺癌組織樣本25例,正常組織樣本7例,GSE71533數(shù)據(jù)集包含胰腺癌組織樣本36例,正常組織樣本16例。從TCGA數(shù)據(jù)庫(https://cancergenome.nih.gov/)獲取178例胰腺癌樣本的miRNA表達(dá)及預(yù)后數(shù)據(jù)。
將GSE32678和GSE71533數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使用R語言中的Limma軟件包(Limma package R 3.1.1)篩選差異表達(dá)miRNA。篩選條件為|log2(fold change)|>2且FDR(矯正后的P值)<0.05。結(jié)合GSE24279數(shù)據(jù)集[13],獲得GSE32678、GSE71533和GSE24279數(shù)據(jù)集差異表達(dá)miRNA的交集。所篩選出的交集miRNA至少在2個(gè)及以上數(shù)據(jù)集中存在差異表達(dá)。對(duì)篩選出的差異表達(dá)miRNA繪制熱圖、火山圖和韋恩圖,熱圖的繪制使用R語言中的heatmap軟件包,火山圖的繪制使用R語言的ggplot2軟件包。
獲取TCGA數(shù)據(jù)庫中178例胰腺癌樣本的miRNA表達(dá)和預(yù)后數(shù)據(jù),應(yīng)用R語言中的Survival軟件包(R package survival),采用Kaplan-Meier方法對(duì)篩選出的交集miRNA進(jìn)行生存時(shí)間相關(guān)性分析,miRNA表達(dá)數(shù)據(jù)為自變量,生存時(shí)間為因變量,檢驗(yàn)采用雙側(cè)log-Rank檢驗(yàn),P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
應(yīng)用靶基因預(yù)測(cè)數(shù)據(jù)庫miRanda(http://www.microrna.org/)、miRTarBase(http://mirtarbase.mbc.nctu.edu.tw/)、 miWalk(http://mirwalk.umm.uni-heidelberg.de/)和TargetScan(http://www.targetscan.org/)對(duì)交集miRNA進(jìn)行潛在調(diào)控靶基因的預(yù)測(cè),篩選出的靶基因需要同時(shí)包含于以上所有數(shù)據(jù)庫中,P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
DAVID數(shù)據(jù)庫是一個(gè)生物信息數(shù)據(jù)庫,可以提供生物信息功能注釋信息[14]。使用DAVID(The database for annotation,visualization and integrated discovery)在線軟件(https://david.ncifcrf.gov/)對(duì)靶基因進(jìn)行GO功能富集分析和KEGG通路分析,P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
STRING數(shù)據(jù)庫是一種預(yù)測(cè)蛋白質(zhì)之間相互作用的軟件[15]。根據(jù)預(yù)測(cè)得到的靶基因,應(yīng)用STRING在線軟件(https://string-db.org/)將靶基因所對(duì)應(yīng)的蛋白質(zhì)之間的相互作用關(guān)系可視化。
根據(jù)胰腺癌3個(gè)芯片數(shù)據(jù)集的交集miRNA與靶基因之間的關(guān)系,應(yīng)用Cytoscape 2.8.2軟件[16]繪制miRNA與mRNA之間的調(diào)控網(wǎng)絡(luò)圖。
應(yīng)用Cytoscape 2.8.2軟件將核心miRNA-mRNA對(duì)、mRNA-pathway對(duì)組合在一起,構(gòu)建核心miRNA-mRNA-pathway調(diào)控網(wǎng)絡(luò)。
GSE32768數(shù)據(jù)集中共有100個(gè)miRNA在胰腺癌組織中表達(dá)呈顯著改變(|log2(fold change)|>2,P<0.05),其中表達(dá)上調(diào)的miRNA有55個(gè),表達(dá)下調(diào)的miRNA有45個(gè),見圖1A與圖1C。GSE71533數(shù)據(jù)集中共有113個(gè)miRNA在胰腺癌組織中表達(dá)呈顯著改變[|log2(fold change)|>2,P<0.05],其中表達(dá)上調(diào)的miRNA有34個(gè),表達(dá)下調(diào)的miRNA有79個(gè),見圖1B與圖1D。GSE24279數(shù)據(jù)集中共有59個(gè)miRNA在胰腺癌組織中表達(dá)呈顯著改變,與GSE32768、GSE71533數(shù)據(jù)集中差異表達(dá)的miRNA取交集,在兩個(gè)以上數(shù)據(jù)集中顯著表達(dá)的miRNA為交集miRNA,3個(gè)數(shù)據(jù)集中均存在差異表達(dá)的miRNA有4個(gè),兩個(gè)數(shù)據(jù)集中均存在差異表達(dá)的miRNA有18個(gè),共有22個(gè)交集miRNA,見圖1E。其中9個(gè)miRNA表達(dá)上調(diào),13個(gè)miRNA表達(dá)下調(diào)。上調(diào)的miRNA為hsa-miR-10a-5p、hsa-miR-210-3p、hsa-miR-221-3p、hsa-miR-222-3p、hsamiR-125b-5p、 hsa-miR-199a-3p、 hsa-miR-23a-3p、 hsa-miR-31-5p、 hsa-miR-135b-5p; 下調(diào)的miRNA為hsa-miR-148a-3p、hsa-miR-216a-5p、hsamiR-216b-5p、hsa-miR-217、hsa-miR-29b-3p、hsamiR-29c-3p、hsa-miR-30a-5p、hsa-miR-30c-5p、hsa-miR-335-5p、 hsa-miR-375、 hsa-miR-551a、hsa-miR-1184、hsa-miR-552-3p。
圖1 差異miRNA表達(dá)圖(聚類圖、火山圖、韋恩圖)
結(jié)合TCGA數(shù)據(jù)庫178個(gè)胰腺癌樣本的miRNA表達(dá)及預(yù)后數(shù)據(jù)對(duì)22個(gè)交集miRNA進(jìn)行Kaplan-Meier生存分析。結(jié)果顯示hsa-miR-30a-5p、hsa-miR-551a、hsa-miR-375與胰腺癌患者的生存預(yù)后密切相關(guān)。其中hsa-miR-30a-5p和hsa-miR-551a低表達(dá)組的生存時(shí)間均長(zhǎng)于高表達(dá)組生存時(shí)間(P<0.05),見圖2A與圖2C。hsa-miR-375高表達(dá)組生存時(shí)間長(zhǎng)于低表達(dá)組生存時(shí)間(P<0.05),見圖2B。
圖2 miRNA高表達(dá)組和低表達(dá)組的Kaplan-Meier生存分析
通過miRanda、miRTarBase、miWalk和TargetScan數(shù)據(jù)庫對(duì)22個(gè)交集miRNA進(jìn)行靶基因預(yù)測(cè),獲得645個(gè)靶基因,并進(jìn)行GO與KEGG pathway分析。圖3是排名前20的靶基因顯著性GO功能和KEGG通路圖。靶基因主要富集于基因的轉(zhuǎn)錄和表達(dá)、細(xì)胞增殖、信號(hào)轉(zhuǎn)導(dǎo)、蛋白質(zhì)磷酸化等生物學(xué)過程和功能(P<0.05),見圖3A。靶基因主要參與癌癥通路、MicroRNAs通路、肝細(xì)胞癌通路、細(xì)胞衰老通路等通路(P<0.05),見圖3B。
圖3 交集miRNA靶基因的功能分析
將預(yù)測(cè)得到的靶基因數(shù)據(jù)上傳到STRING數(shù)據(jù)庫中,獲得靶基因?qū)?yīng)的蛋白質(zhì)之間的相互作用。蛋白質(zhì)之間通常是相互作用的,兩個(gè)或兩個(gè)以上的蛋白質(zhì)會(huì)通過非共價(jià)鍵形成蛋白復(fù)合體,蛋白質(zhì)之間的相互作用越多,則該蛋白質(zhì)越重要。CD44、STAT3、STK11、AKT2、FOXO3靶基因?qū)?yīng)的蛋白質(zhì)互作關(guān)系密切,這些靶基因編碼的蛋白質(zhì)可能會(huì)影響胰腺癌的放療敏感性,進(jìn)而對(duì)預(yù)后產(chǎn)生影響,見圖4。
根據(jù)交集miRNA與其靶基因之間的靶向調(diào)控關(guān)系,應(yīng)用Cytoscape 2.8.2軟件構(gòu)建的交集miRNA-mRNA調(diào)控網(wǎng)絡(luò)如圖5所示。該圖將交集miRNA與靶基因之間的關(guān)系可視化。miRNA調(diào)控的下游靶基因數(shù)目越多說明該miRNA越重要。將miRNA-mRNA調(diào)控網(wǎng)絡(luò)中miRNA所調(diào)控的下游基因數(shù)目前5的miRNA篩選為核心miRNA[17],分別是:hsa-miR-125b-5p、hsamiR-221-3p、hsa-miR-31-5p、hsa-miR-222-3p、hsa-miR-10a-5p。
基于上述5個(gè)核心miRNA,繪制核心miRNA-mRNA-pathway調(diào)控網(wǎng)絡(luò)。其中節(jié)點(diǎn)基因較重要的有RAF1、MAPK10、FOXO3、TIAM1、BCL2等,且與癌癥通路、MicroRNAs通路、河馬信號(hào)通路、細(xì)胞衰老通路、趨化因子信號(hào)通路等顯著相關(guān)。
圖4 胰腺癌靶基因的蛋白互作網(wǎng)絡(luò)
圖5 胰腺癌交集miRNA-mRNA調(diào)控網(wǎng)絡(luò)
圖6 胰腺癌miRNA-mRNA-pathway調(diào)控網(wǎng)絡(luò)
胰腺癌通常發(fā)病隱匿,難以診斷和治療,容易發(fā)生轉(zhuǎn)移,治療效果差,5年生存率僅1.2%~6.0%[18-19]?;煛⒎暖?、手術(shù)治療等傳統(tǒng)療法在提高胰腺癌患者生存率方面發(fā)揮的作用很小[20-21],所以尋找胰腺癌診斷、治療、預(yù)后相關(guān)的分子靶標(biāo)至關(guān)重要。許多研究表明miRNA可以作為腫瘤診斷和預(yù)后的生物標(biāo)志物[22]。目前有一些研究表明特異性miRNA可用作胰腺癌預(yù)后和診斷的標(biāo)志物,但是每個(gè)研究所包含的研究患者很少,可重復(fù)性很差[23],也有一些基于TCGA數(shù)據(jù)庫的研究[24],TCGA數(shù)據(jù)庫擁有豐富的胰腺癌患者基因測(cè)序數(shù)據(jù)和相應(yīng)臨床數(shù)據(jù),TCGA數(shù)據(jù)庫中胰腺癌組織樣本有178例,但正常組織樣本僅4例[25],正常組織樣本過少,容易造成偏倚。本研究所選取的GEO數(shù)據(jù)庫中GSE32678和GSE71533數(shù)據(jù)集共含有61例胰腺癌樣本和23例正常組織樣本,樣本豐富。此外本研究構(gòu)建了胰腺癌miRNA-mRNA-pathway調(diào)控網(wǎng)絡(luò),既能看出miRNA對(duì)mRNA的調(diào)控作用,又可以看出其對(duì)通路的調(diào)控作用。
本研究應(yīng)用生物信息學(xué)方法篩選出22個(gè)交集miRNA,其中hsa-miR-217可以抑制胰腺癌細(xì)胞的侵襲能力[26],與患者的生存顯著相關(guān)。hsa-miR-30c-5p與胰腺癌預(yù)后的相關(guān)關(guān)系尚未見報(bào)道,但有研究表明其與乳腺癌的生存期密切相關(guān)[27]。
接著采用TCGA數(shù)據(jù)庫中178例胰腺癌樣本的miRNA表達(dá)及預(yù)后數(shù)據(jù)對(duì)交集miRNA進(jìn)行生存分析。生存分析發(fā)現(xiàn)hsa-miR-375、hsa-miR-30a-5p、hsamiR-551a與胰腺癌患者的預(yù)后相關(guān)。hsa-miR-375在胰腺癌中表達(dá)上調(diào),可以抑制腫瘤細(xì)胞的增殖、遷移,與患者生存顯著相關(guān)[28-29]。已有研究表明hsamiR-30a-5p在多種癌癥中異常表達(dá)[30-31]且可以作為胰腺癌預(yù)后的標(biāo)志[24]。hsa-miR-551a在胰腺癌中的預(yù)后研究尚未見報(bào)道,但是研究[32]表明其可以顯著抑制胃癌細(xì)胞的侵襲和遷移。
進(jìn)一步采用miRanda等數(shù)據(jù)庫對(duì)交集miRNA進(jìn)行靶基因預(yù)測(cè)并進(jìn)行功能分析。功能分析發(fā)現(xiàn)胰腺癌的差異表達(dá)miRNA可能與基因的轉(zhuǎn)錄和表達(dá)、細(xì)胞增殖等功能有關(guān),與癌癥通路、MicroRNAs通路等有關(guān),這些都與腫瘤的治療效果密切相關(guān)。更進(jìn)一步構(gòu)建靶基因?qū)?yīng)蛋白質(zhì)的蛋白互作網(wǎng)絡(luò),將靶基因?qū)?yīng)的蛋白質(zhì)之間的互作關(guān)系可視化,CD44、STAT3、STK11、AKT2、FOXO3靶基因?qū)?yīng)的蛋白質(zhì)互作關(guān)系密切,相應(yīng)蛋白質(zhì)可能會(huì)影響胰腺癌放射敏感性,進(jìn)而影響預(yù)后。
接著繪制交集miRNA-mRNA調(diào)控網(wǎng)絡(luò),通過可視化的miRNA-mRNA調(diào)控網(wǎng)絡(luò)我們發(fā)現(xiàn)hsa-miR-125b-5p、hsa-miR-221-3p、hsa-miR-31-5p、hsamiR-222-3p、hsa-miR-10a-5p是miRNA-mRNA調(diào)控網(wǎng)絡(luò)中的核心miRNA。已有研究表明hsa-miR-125b-5p的表達(dá)與胰腺癌的侵襲性呈正相關(guān)[33]。hsa-miR-221-3p和hsa-miR-31-5p在胰腺癌預(yù)后中的作用尚未見報(bào)道,但研究表明hsa-miR-221-3p可以促進(jìn)宮頸鱗狀細(xì)胞癌的轉(zhuǎn)移且可作為宮頸鱗狀細(xì)胞癌診斷和治療的生物標(biāo)志物[34],此外也有研究表明hsa-miR-31-5p在結(jié)直腸癌中高表達(dá),在癌細(xì)胞增殖、遷移、侵襲和凋亡過程中發(fā)揮重要作用[35]。hsa-miR-222-3p與胰腺癌預(yù)后的關(guān)系尚未知曉,但有研究表明hsa-miR-222-3p可參與口腔鱗狀細(xì)胞癌的各種癌癥途徑[36],可以作為口腔鱗狀細(xì)胞癌預(yù)后的生物標(biāo)志。已有研究表明hsa-miR-10a-5p可以促進(jìn)胰腺癌的轉(zhuǎn)移,與患者生存緊密相關(guān)[37]。
最后根據(jù)miRNA-mRNA調(diào)控網(wǎng)絡(luò)確定5個(gè)核心miRNA并構(gòu)建miRNA-mRNA-pathway調(diào)控網(wǎng)絡(luò)。通過調(diào)控網(wǎng)絡(luò),我們發(fā)現(xiàn)RAF1、MAPK10、FOXO3、TIAM1、BCL2為節(jié)點(diǎn)基因前5位。已有研究表明這5個(gè)基因可以作用于相應(yīng)的信號(hào)轉(zhuǎn)導(dǎo)通路,發(fā)揮原癌基因或抑癌基因的作用[38-42]。
綜上所述,通過對(duì)GEO和TCGA數(shù)據(jù)庫的胰腺癌相關(guān)數(shù)據(jù)的分析,所篩選出的hsa-miR-30a-5p、hsamiR-551a、hsa-miR-375與胰腺癌患者的預(yù)后密切相關(guān),可以作為胰腺癌預(yù)后的判斷標(biāo)志。hsa-miR-125b-5p、hsa-miR-221-3p、hsa-miR-31-5p、hsamiR-222-3p、hsa-miR-10a-5p是miRNA-mRNA調(diào)控網(wǎng) 絡(luò) 中 的 核 心 miRNA。 RAF1、MAPK10、FOXO3、TIAM1、BCL2對(duì)胰腺癌患者預(yù)后的影響值得進(jìn)一步關(guān)注。本研究的局限性在于所有分析均通過生物信息學(xué)方法完成,未進(jìn)行相關(guān)實(shí)驗(yàn)進(jìn)行驗(yàn)證,這些都有待在進(jìn)一步的工作中繼續(xù)完成。