文舒展, 付子樂, 陳淑英
(1.復旦大學附屬華山醫(yī)院骨科,上海 200040;2.復旦大學附屬中山醫(yī)院肝外科,上海 200032;2.復旦大學附屬華山醫(yī)院檢驗醫(yī)學科,上海 200040)
微小RNA(microRNA,miRNA)是長度約22 nt的非編碼RNA,在后生動物和植物基因的轉(zhuǎn)錄后調(diào)節(jié)中起關鍵作用[1]。miRNA由非外顯子區(qū)域基因組轉(zhuǎn)錄,成熟后可與目標信使RNA(messenger RNA,mRNA)結(jié)合,與靶mRNA不完全互補的miRNA在蛋白質(zhì)翻譯水平上可抑制其靶mRNA表達(在哺乳動物中比較普遍),或影響mRNA的穩(wěn)定性,引起靶mRNA的降解(在植物中比較常見)[2]。在許多重要的生物學過程中都有miRNA的參與,如細胞增殖和凋亡、血細胞發(fā)育、炎癥細胞激活、神經(jīng)發(fā)生、胎兒發(fā)育[2-3]。人微小RNA-34a(homo sapiens microRNA-34a,hsa-miR-34a)被認為是腫瘤抑制的主要調(diào)節(jié)因子,在許多腫瘤中表達缺失或降低[4],通過miR-34a再表達治療腫瘤已成為一個重要的研究方向。本研究通過生物信息學方法預測hsa-miR-34a的靶基因,采用功能富集、信號通路富集、蛋白質(zhì)相互作用分析等方法對其進行分析,結(jié)合miR-34a在腫瘤中表達的變化,以期能進一步分析hsa-miR-34a在腫瘤發(fā)生、發(fā)展中的作用,為后續(xù)的臨床和基礎研究提供參考。
在Pubmed(https://pubmed.ncbi.nlm.nih.gov/)、Web of science(https://www.webofscience.com/wos/alldb/basic-search)、OVID(https://ovidsp.dc2.ovid.com/ovid-a/ovidweb.cgi)數(shù)據(jù)庫進行文獻搜索,文獻檢索主題詞:“hsa-miR-34a”“microRNA”“cancer”“bioinformatics analysis”“GO”“enrichment analysis”,對檢索到的文獻進行歸納整理,分析hsa-miR-34a在不同類型腫瘤中的表達變化。
采用UCSC Genome Browser(http://genome-asia.ucsc.edu/index.html)對hsa-miR-34a對應基因組在人染色體上的位置進行定位,使用miRBase在線工具(http://www.miRbase.org)檢索獲得不同物種中miR-34a的染色體定位和堿基序列,通過比對獲得同源保守序列。
分別通過TargetScan(http://www.targetscan.org/)、miRDB(http://www.miRdb.org/)、miRWalk(http://miRwalk.umm.uni-heidelberg.de/)和mirDIP(http://ophid.utoronto.ca/mirDIP/index.jsp)4個數(shù)據(jù)庫獲得hsamiR-34a的靶基因預測結(jié)果,取4個預測結(jié)果的交集,以mirDIP數(shù)據(jù)庫的數(shù)據(jù)為參照標準,采用Target Score功能進行排序,篩選前30個基因作為預測靶基因集。
利用TiGER數(shù)據(jù)庫(http://bioinfo.wilmer.jhu.edu/tiger/)獲得靶基因集合在正常人體不同組織和器官中的表達情況。采用Graphpad Prism 8.0軟件對數(shù)據(jù)進行可視化分析,采用單因素方差分析進行統(tǒng)計分析。
利用PANTHER(http://pantherdb.org/)和DAVID(https://david.ncifcrf.gov/home.jsp)在線工具對靶基因集進行基因本體論(Gene Ontology,GO)富集分析和REACTOME通路富集分析。
將預測靶基因?qū)牡鞍踪|(zhì)名稱錄入STRING數(shù)據(jù)庫(https://string-db.org/),得出靶基因?qū)鞍踪|(zhì)的相互關系網(wǎng)絡圖。
采用Graphpad Prism 8.0軟件對靶基因表達數(shù)據(jù)進行可視化分析,采用單因素方差分析進行統(tǒng)計分析。采用Fisher精確概率法統(tǒng)計通路富集分析數(shù)據(jù)。以P<0.05為差異有統(tǒng)計學意義。
文獻檢索結(jié)果顯示,乳腺癌、前列腺癌、膀胱癌等腫瘤中hsa-miR-34a表達顯著降低,見表1。
表1 不同腫瘤中hsa-miR-34a的表達情況及作用
通過miRBase、UCSC Genome Browser分析得到hsa-miR-34a對應基因組定位于人染色體1p36.22[9151668-9151777],長度為110 bp,序列號為MI0000268。分析小鼠、獼猴等不同物種的miR-34a,發(fā)現(xiàn)“UGGCAGUGU”序列在不同物種間高度保守。見表2。
表2 不同物種中miR-34a的保守序列
采用TargetScan、miRDB、miRWalk和mirDIP數(shù)據(jù)庫預測hsa-miR-34a的靶基因,分別得到靶基因數(shù)量為754、899、7 345、1 399個,取交集后得到225個靶基因,然后采用Target Score功能排序,選取前30個靶基因作為后續(xù)分析的靶基因集合,分別為:MDM4、DLL1、RAP1GDS1、FAM167A、HCN3、SDK2、FAM76A、E2F5、FKBP1B、PPP1R11、SCN2B、MGAT4A、NAV3、SYT1、SATB2、CELF3、XYLT1、MET、MYCN、PACS1、NAV1、CACNA1E、LGR4、TGIF2、VAMP2、FUT9、PKP4、RRAS、ABR、MSR1。
采用TiGER數(shù)據(jù)平臺分析靶基因集在人體各組織器官中的表達,未查詢到FAM167A、CELF3、CACNA1E、PPP1R11、MGAT4A、PACS1、TGIF2、FUT9基因相關信息,22個靶基因在人體不同器官組織的特異性表達譜,見圖1。單因素方差分析結(jié)果顯示,不同器官和組織之間各靶基因的相對表達量差異均無統(tǒng)計學意義(P>0.05)。
圖1 22個靶基因在正常人體組織中的表達
利用PANTHER在線工具對30個靶基因進行細胞組分和分子功能的GO富集分析,結(jié)果顯示,靶基因SYT1和VAMP2集中表達在網(wǎng)格蛋白囊泡及囊泡膜(P<0.000 1),轉(zhuǎn)運物質(zhì)包括谷氨酸、單胺、γ-氨基丁酸;獲得HCN3、SCN2B、SYT1、VAMP2基因GO分子功能注釋信息,主要與電壓門控鈉通道活性及與syntaxin-1蛋白有關(P<0.05);成功獲得26個基因GO生物學過程注釋信息(P<0.05),主要集中于多細胞生物過程和發(fā)育、神經(jīng)系統(tǒng)發(fā)生和發(fā)育、解剖結(jié)構(gòu)發(fā)育等。見表3、表4和圖2。
圖2 hsa-miR-34a預測靶基因的GO生物學過程分析結(jié)果
表3 hsa-miR-34a預測靶基因的GO細胞組分分析結(jié)果
表4 hsa-miR-34a預測靶基因的GO分子功能分析結(jié)果
在GO富集分析的基礎上,利用已有的生物通路數(shù)據(jù),通過DAVID在線工具對靶基因集進行REACTOME生物通路富集分析。結(jié)果顯示,hsa-miR-34a靶基因集中富集在B型和G型肉毒桿菌毒素毒性(富集倍數(shù)>300),同時還富集在人信號素4D(semaphorin 4D,Sema4D)介導的細胞黏附和遷移抑制,γ-氨基丁酸的合成、釋放、再吸收和降解,乙酰膽堿等神經(jīng)遞質(zhì)的釋放循環(huán)等生物信號通路中。見表5。
表5 hsa-miR-34a預測靶基因的通路分析結(jié)果
利用STRING數(shù)據(jù)庫構(gòu)建hsa-miR-34a的30個靶基因?qū)鞍椎幕プ骶W(wǎng)絡,見圖3。根據(jù)靶基因?qū)鞍自谠摼W(wǎng)絡中的連接性,對靶基因重新進行排序,排在前5位的靶基因分別為SYT1、VAMP2、MET、RRAS、CACNA1E,這5個基因?qū)鞍椎年P聯(lián)值均>10。
圖3 hsa-miR-34a的30個靶基因?qū)鞍椎幕プ骶W(wǎng)絡
miRNA屬于高度保守的非編碼RNA分子,可特異性識別靶基因3'非翻譯區(qū)(3' untranslated region,3' UTR)的相應靶位點,抑制特定靶基因的表達或降解靶基因。本研究結(jié)果顯示,hsamiR-34a在乳腺癌、膀胱癌等多種腫瘤中的表達顯著降低。有研究結(jié)果顯示,hsa-miR-34a可通過抑制700多個與細胞增殖、存活和可塑性有關的轉(zhuǎn)錄物來抑制腫瘤的發(fā)生、發(fā)展[21],但具體作用機制尚不清楚。因此,對hsa-miR-34a進行多層面的生物信息學分析,對后續(xù)研究腫瘤的發(fā)生、發(fā)展及治療有一定的指導意義。
目前已有一些研究提示了hsa-miR-34a抑癌的機制,在生理條件下,miR-34a在轉(zhuǎn)錄中沉默其原癌靶基因的表達,miR-34a的上調(diào)會導致細胞凋亡、細胞周期停滯、細胞衰老,進而可以抑制腫瘤細胞繁殖和遷移[4,22],目前證實其涉及的靶基因、靶蛋白或信號通路有MET、CD44、Notch1、LEF1、E2F、PI3K/Akt等。miR-34a的低表達與其受到CpG甲基化修飾有關[23-24],有研究證明,人乳頭瘤病毒(human papillomavirus,HPV)通過HPV E6/p53信號通路使miR-34a甲基化,抑制其表達,調(diào)節(jié)宮頸癌的Warburg效應,促進腫瘤的生長和侵襲[18]。
本研究選取進化程度不同的物種進行同源性分析,miR-34a對應基因序列在不同物種中的相似性較高,其中“UGGCAGUGU”序列為不同物種共同具有的保守區(qū),人與倭黑猩猩、獼猴、婆羅洲猩猩等同源性較高的物種在基因上的位置也高度相似。本研究分析了22個靶基因在人體各器官和組織中的表達情況,發(fā)現(xiàn)大部分靶基因在人體各器官組織中均有表達,且在不同器官和組織中的表達量差異均無統(tǒng)計學意義(P>0.05),可見hsa-miR-34a的靶基因大部分具有廣譜表達性;miR-34a對應基因的高度保守性和靶基因的廣譜表達性提示miR-34對應基因可能有多個識別位點或多個靶標,發(fā)揮著重要的生物學功能。
本研究通過4個數(shù)據(jù)庫(TargetScan、miRDB、miRWalk和mirDIP)預測hsa-miR-34a的靶基因,結(jié)果不盡相同,且基因數(shù)差距較大,取交集后基因數(shù)仍有225個。這一方面提示miR-34a生物學功能的廣泛性和復雜性,另一方面也說明可能存在較高的假陽性率。因此,本研究采用Target Score功能對獲得的基因進行排序,選取前30個靶基因進行分析,以增加預測的精確度,但在精確度增加的同時可能會對結(jié)果的全面性產(chǎn)生一定的影響。
在30個靶基因中,MDM4、Notch1、LEF1、Jagged1等基因已被證明在miR-34a抑制腫瘤中發(fā)揮重要的作用,進一步驗證了miR-34a的抑癌作用。這些靶基因可作為分析miR-34a抑制腫瘤作用機制的重點方向。Target Score排序最高的基因為MDM4,是p53上游重要的調(diào)控因子。在生理條件下,miR-34a的轉(zhuǎn)錄主要由關鍵抑癌基因p53調(diào)控,通過與miR-34a區(qū)域附近多個典型的p53結(jié)合位點結(jié)合產(chǎn)生影響,但幾個反饋回路,如p53/miR-34a/MDM4反饋環(huán)提示miR-34a參與了p53的調(diào)節(jié)[21,25-26]。
相對于對單個靶基因的研究和分析,多個靶基因的整合富集分析有助于更直接和全面地了解miR-34a的生物學功能。本研究通過GO富集分析發(fā)現(xiàn)hsa-miR-34a生物學功能廣泛,其靶基因集中表達于網(wǎng)格蛋白囊泡和囊泡膜及其物質(zhì)轉(zhuǎn)運、細胞黏附和遷移、神經(jīng)遞質(zhì)的合成和釋放、多細胞生物過程等,這些都可能對腫瘤發(fā)生的各階段產(chǎn)生影響,如miR-34a的靶基因富集于Sema4D介導的細胞黏附和遷移抑制,這很可能是miR-34a抑制腫瘤細胞黏附和遷移的重要機制,但目前尚缺乏直接的實驗證據(jù)。值得注意的是,本研究通路分析及組織表達分布的結(jié)果均具有較強的指向性,提示miR-34a在神經(jīng)系統(tǒng)的發(fā)育、形成及功能中具有重要的意義,而腫瘤的發(fā)生與神經(jīng)因素也有著密不可分的關系[27],由此推測miR-34a抑制腫瘤發(fā)生的機制可能與神經(jīng)因素調(diào)節(jié)有關。
綜上所述,本研究通過REACTOME通路分析和GO分析,初步探討了miR-34a的靶基因及其生物學功能,可為后續(xù)的臨床和基礎研究提供參考依據(jù)。