趙之新, 盧 軒, 楊 銘, 趙 冰, 唐 川
(大連大學(xué)生命科學(xué)與技術(shù)學(xué)院, 大連 116600)
癌癥已成為危害人類(lèi)健康的最大因素之一[1],口腔癌是最常見(jiàn)的癌癥之一,吸煙和飲酒被認(rèn)為是其最主要的致病因素[2],1990—2017年世界口腔癌發(fā)病率和病死率增長(zhǎng)了一倍[3]. 目前,口腔癌主要的治療手段是通過(guò)手術(shù)治療,而且早期的口腔癌不容易診斷,降低了患者的生存率,且預(yù)后較差,晚期口腔癌患者的5年生存率仍然低于63%[4]. 近年來(lái),大量研究表明,基因的異常表達(dá)是導(dǎo)致口腔癌發(fā)生與發(fā)展的重要因素,因此,從分子水平對(duì)口腔癌組織進(jìn)行研究,探索口腔癌的發(fā)病機(jī)制和可能的治療靶點(diǎn)具有重要意義.
微小核糖核酸(MicroRNAs, miRNAs)是由內(nèi)源性發(fā)夾結(jié)構(gòu)轉(zhuǎn)錄產(chǎn)物衍生而來(lái)的一種具有22個(gè)左右核苷的單鏈RNA[5],是基因表達(dá)的重要調(diào)節(jié)因子. miRNAs通過(guò)靶向mRNAs的翻譯抑制或切割來(lái)抑制基因表達(dá)[6]. 據(jù)估計(jì),30%的人類(lèi)基因可能受到miRNAs的調(diào)控[7]. 越來(lái)越多的miRNAs與人類(lèi)疾病的研究表明,miRNAs與人類(lèi)疾病尤其是癌癥的發(fā)生密切相關(guān)[8].
目前,生物信息學(xué)及基因芯片技術(shù)已廣泛應(yīng)用于基因變化所致腫瘤的研究中. 借助現(xiàn)有的miRNAs基因芯片數(shù)據(jù),挖掘與口腔癌相關(guān)的miRNAs可以探索口腔癌的發(fā)生機(jī)制,并對(duì)口腔癌的早期診斷及治療提供數(shù)據(jù)及基礎(chǔ). 本研究利用生物信息學(xué)方法對(duì)GEO數(shù)據(jù)庫(kù)中的口腔癌miRNAs表達(dá)數(shù)據(jù)進(jìn)行分析,篩選差異表達(dá)的miRNAs,并通過(guò)基因富集分析分析差異表達(dá)的miRNAs的功能,為口腔癌的靶向治療提供一定的理論依據(jù).
口腔癌miRNAs芯片表達(dá)數(shù)據(jù)集(GSE124566和GSE113956)從GEO數(shù)據(jù)庫(kù)[9](https:∥www.ncbi.nlm.nih.gov/geo)下載,GSE124566含有10個(gè)口腔癌組織樣本和10個(gè)正常組織樣本,GSE113956含有25個(gè)口腔癌組織樣本和15個(gè)正常組織樣本. 平臺(tái)分別為GPL18402和GPL18058,芯片研究類(lèi)型為Non-coding RNA profiling by array,種屬為homo sapiens,都是標(biāo)準(zhǔn)的口腔組織,具有代表性與典型性.
利用GEO2R在線(xiàn)分析工具(http:∥www.ncbi.nlm.nih.gov/geo/geo2r/)分析口腔癌與正常組織之間的差異表達(dá)miRNAs. 針對(duì)差異表達(dá)miRNAs采用閾值標(biāo)準(zhǔn)來(lái)計(jì)算基因表達(dá)的Fold Change 和校正P值,P≤0.05, |log2FC|≥1作為有統(tǒng)計(jì)學(xué)意義為標(biāo)準(zhǔn),每個(gè)數(shù)據(jù)集的所有差異用miRNAs火山圖表示.
為了使結(jié)果更加規(guī)范、準(zhǔn)確,需要使用Venn Diagram在線(xiàn)工具(http:∥bioinformatics.psb.uget.be/webtools/Venn)進(jìn)行篩選上述2個(gè)數(shù)據(jù)集共同的差異表達(dá)miRNAs.
基因本體論分析[10](Gene Ontology,GO)是對(duì)基因和蛋白功能進(jìn)行分類(lèi)和描述的分析,包括細(xì)胞學(xué)組分(Cellular Components, CC)、生物學(xué)過(guò)程(Biological Process, BP)、分子生物學(xué)功能(Molecular Function, MF). 京都基因和基因組百科全書(shū)[11](KEGG)用于注釋參與其中的基因列表和信號(hào)通路網(wǎng)絡(luò).
FunRich(http:∥funrich.org/)是一個(gè)獨(dú)立的軟件工具,主要用于基因和蛋白質(zhì)的功能和相互作用網(wǎng)絡(luò)分析[12],可用于繪制韋恩圖,其最大的優(yōu)點(diǎn)是可以進(jìn)行基因ID轉(zhuǎn)換、基因富集和miRNAs的富集分析并可直接進(jìn)行可視化等. 本研究利用FunRich3.1.3對(duì)GO和KEGG通路進(jìn)行富集分析來(lái)確定差異表達(dá)miRNAs的功能.
為了探索上述篩選出來(lái)的差異表達(dá)miRNAs作用的靶標(biāo)基因,方便后期對(duì)靶標(biāo)基因進(jìn)行研究. 本研究使用miRWalk3.0(http:∥mirwalk.umm.uni-heidelberg.de/)對(duì)差異表達(dá)的miRNAs進(jìn)行靶標(biāo)基因的預(yù)測(cè).
利用FunRich尋找靶基因的蛋白相互作用關(guān)系,篩選連接度前10位的基因作為網(wǎng)絡(luò)核心基因.
本研究從GEO(Gene Expression Omnibus)數(shù)據(jù)庫(kù)下載了2個(gè)不同的口腔癌miRNAs芯片表達(dá)數(shù)據(jù)集(GSE124566和GSE113956),GSE124566含有10個(gè)口腔癌組織樣本和10個(gè)正常組織樣本,GSE113956含有25個(gè)口腔癌組織樣本和15個(gè)正常組織樣本. 用GEO2R在線(xiàn)分析工具,調(diào)整后P≤0.05, |log2FC|≥1作為截?cái)嘀档臉?biāo)準(zhǔn),以分析口腔癌和正常組織之間的差異表達(dá)miRNAs.
在GSE124566和GSE1139566中分別篩選了總共109、1 079個(gè)差異表達(dá)miRNAs,分別包括41、673個(gè)上調(diào)基因和68、406個(gè)下調(diào)基因,圖1為這2個(gè)數(shù)據(jù)集的火山圖,橫坐標(biāo)表示log2FC(癌癥樣本比正常樣本),縱坐標(biāo)表示-log10P. 其中黃色的點(diǎn)表示不顯著的差異表達(dá)miRNAs,紅色的點(diǎn)表示上調(diào)的差異表達(dá)miRNAs,藍(lán)色的點(diǎn)表示下調(diào)的差異表達(dá)miRNAs.
圖1 口腔癌miRNAs數(shù)據(jù)集表達(dá)水平火山圖
為了得到更有可信度的差異表達(dá)miRNAs,分別對(duì)2個(gè)數(shù)據(jù)集上調(diào)和下調(diào)的miRNAs分別繪制韋恩圖取交集(圖2),結(jié)果得出16個(gè)上調(diào)的共表達(dá)差異miRNAs(表1)和14個(gè)下調(diào)的共表達(dá)差異miRNAs(表2).
表1 16個(gè)差異表達(dá)上調(diào)的miRNAs的P及l(fā)og2 FC
圖2 共同差異表達(dá)miRNAs Venn圖
表2 14個(gè)差異表達(dá)下調(diào)的miRNAs的P及l(fā)og2 FC
LU等[13]將6種口腔癌細(xì)胞系與正常角質(zhì)形成細(xì)胞作比較,發(fā)現(xiàn)在口腔癌細(xì)胞系中miR-31表達(dá)下調(diào),這與本研究結(jié)果一致.
為了進(jìn)一步明確30個(gè)共同差異表達(dá)miRNAs的生物學(xué)功能,利用軟件FunRich對(duì)差異表達(dá)miRNAs進(jìn)行了GO與KEGG生物途徑富集分析.
2.3.1 GO分析 GO分析結(jié)果顯示:16個(gè)上調(diào)的miRNAs的細(xì)胞組分主要在細(xì)胞核(Nucleus)、細(xì)胞質(zhì)(Cytoplasm)、細(xì)胞質(zhì)膜(Plasma membrane)、溶酶體(Lysosome)和核仁(Nucleolus)(圖3A);分子功能主要集中在轉(zhuǎn)錄因子活性(Transcription factor activity)、轉(zhuǎn)錄調(diào)節(jié)活性(Transcription regulator activity)、RNA結(jié)合(RNA binding)、絲氨酸/蘇氨酸激酶活性(Protein serine/thereonine kinase activity) 和受體信號(hào)蛋白絲氨酸/蘇氨酸蛋白激酶活性(Receptor signacling protein serine/threonine kinase activity)(圖3B);生物學(xué)過(guò)程 主要富集在在轉(zhuǎn)運(yùn)(Transport),信號(hào)轉(zhuǎn)導(dǎo)(Signal transduction),堿基、核苷、核苷酸和核酸代謝的調(diào)節(jié)(Regulation of nucleobase,nucleoside,nucleotide and nuclelc acid metabolism),基因表達(dá)和表觀(guān)遺傳的調(diào)控(Regulation of gene expression,epigenetics),囊泡介導(dǎo)的轉(zhuǎn)運(yùn)(Vesicle-mediated transport)(圖3C).
圖3 共同差異表達(dá)上調(diào)miRNAs GO分析
14個(gè)下調(diào)的miRNAs的細(xì)胞組分主要富集細(xì)胞核(Nucleus)、細(xì)胞質(zhì)(Cytoplasm)、細(xì)胞質(zhì)膜(Plasma membrane)和溶酶體(Lysosome)和高爾基體(Golgl aparatus)(圖4A);分子功能主要集中轉(zhuǎn)錄因子活性(Transcription factor activity)、轉(zhuǎn)錄調(diào)節(jié)活性(Transcription regulator activity)、RNA結(jié)合(RNA binding)、泛素蛋白特異性蛋白酶活性(Ubiquitin-specific protease activity)和轉(zhuǎn)運(yùn)蛋白活性(Transporter activity)(圖4B);生物學(xué)過(guò)程主要富集在轉(zhuǎn)運(yùn)(Transport),信號(hào)轉(zhuǎn)導(dǎo)(Signal transduction),堿基、核苷、核苷酸和核酸代謝的調(diào)節(jié)(Regulation of nucleobase,nucleoside,nucleotide and nucleic acid metabolism),基因表達(dá)和表觀(guān)遺傳的調(diào)控(Regulation of gene expression,epigenetics)和細(xì)胞間通訊(Cell communication)(圖4C).
圖4 共同差異表達(dá)下調(diào)miRNAs的GO分析
2.3.2 KEGG分析 KEGG/生物途徑分析顯示:上調(diào)的miRNAs主要參與蛋白多糖多配體多糖介導(dǎo)的信號(hào)(Proteoglycan syndecan-mediated signaling events)、ErbB受體信號(hào)網(wǎng)絡(luò)(ErbB receptor signaling network)和磷脂酰肌醇蛋白聚糖通路(Glypican pathway)、質(zhì)膜雌激素受體信號(hào)轉(zhuǎn)導(dǎo)(Plasma membrane estrogen receptor signaling)和LKB1信號(hào)(LKB1 signaling events)(圖5A). 另外,下調(diào)的miRNAs主要參與蛋白多糖多配體多糖介導(dǎo)的信號(hào)(Proteoglycan syndecan-mediated signaling events)、ErbB受體信號(hào)網(wǎng)絡(luò)(ErbB receptorsignaling network)和磷脂酰肌醇蛋白聚糖相關(guān)通路(Glypican pathway)、β整合素細(xì)胞表面相互作用(βintegrin cell surface interactions),和整合素家族細(xì)胞表面相互作用(Integrin family cell surface interactions)(圖5B).有研究表明miR-23、miR-142-3p以及miR-223參與了口腔癌變的磷脂酰肌醇激酶參與的相關(guān)通路[14],與本研究結(jié)果一致.
圖5 共同差異表達(dá)miRNAs的KEGG分析
經(jīng)過(guò)前面的篩選,獲得了30個(gè)共同差異表達(dá)的miRNAs,打開(kāi)靶標(biāo)基因預(yù)測(cè)工具miRWalk3.0,點(diǎn)擊 Target Ming里的miRNAs,導(dǎo)入30個(gè)差異表達(dá)的miRNAs進(jìn)行靶基因預(yù)測(cè),最后得到SMG7、NFIA、RIMS1、POTEA等13 796個(gè)靶基因.
利用FunRich對(duì)靶基因進(jìn)行相互作用分析,獲得了蛋白相互作用網(wǎng)絡(luò),經(jīng)篩選并在蛋白相互作用網(wǎng)絡(luò)中尋找連接數(shù)前10位的作為核心基因. 經(jīng)過(guò)篩選發(fā)現(xiàn),編碼生長(zhǎng)因子受體結(jié)合蛋白2基因(GRB2)、編碼表皮生長(zhǎng)因子受體基因(EGFR)、編碼酪氨酸3單加氧酶基因(YWHAG)、編碼調(diào)控細(xì)胞分裂增殖的Tp53蛋白基因(TP53)、酪氨酸激酶基因(ABL1)、腫瘤壞死因子受體相關(guān)因子(TRAF6)、編碼核蛋白的癌基因(MYC)、轉(zhuǎn)化生長(zhǎng)因子TGF-β信號(hào)轉(zhuǎn)導(dǎo)相關(guān)基因(SMAD2)、B細(xì)胞k輕肽基因增強(qiáng)子抑制因子(IKBKE)和編碼非受體酪氨酸激酶基因(SRC)是靶基因相關(guān)蛋白相互作用網(wǎng)絡(luò)中的核心基因.
目前,對(duì)口腔癌的治療來(lái)說(shuō),大多數(shù)還是放療、化療和手術(shù)切除病變位置,這些方法的治療效果不理想,預(yù)后較差,導(dǎo)致口腔癌患者的生存率不高,對(duì)于口腔癌在分子層面的發(fā)病機(jī)制和預(yù)后機(jī)制的研究也相對(duì)較少. 所以,研究發(fā)現(xiàn)有關(guān)口腔癌在分子層面的發(fā)病機(jī)制有利于對(duì)口腔癌有更清楚的認(rèn)識(shí),以及更有利于研發(fā)癌癥靶向治療的藥物.
根據(jù)上文可以發(fā)現(xiàn):(1)在分子功能方面,差異表達(dá)的miRNAs最顯著集中于轉(zhuǎn)錄調(diào)節(jié)活性和轉(zhuǎn)錄因子活性. 可見(jiàn),差異表達(dá)的miRNAs對(duì)某種口腔癌基因的表達(dá)有顯著或輕微的抑制作用,是普遍轉(zhuǎn)錄因子還是特異性轉(zhuǎn)錄因子發(fā)揮作用尚不明確. (2)在細(xì)胞組分方面,差異表達(dá)下調(diào)的miRNAs與差異表達(dá)上調(diào)的miRNAs不同的是下調(diào)的miRNAs富集于高爾基體,其作用主要是將蛋白質(zhì)加工和運(yùn)輸后送到細(xì)胞特定的部位或者細(xì)胞外,差異表達(dá)下調(diào)的miRNAs這一獨(dú)特的作用也在分子功能富集上得到了驗(yàn)證,差異表達(dá)下調(diào)的miRNAs區(qū)別于上調(diào)的miRNAs不同的是下調(diào)的miRNAs主要富集在蛋白轉(zhuǎn)運(yùn). 根據(jù)這一特點(diǎn)可知,下調(diào)的miRNAs對(duì)某些蛋白的轉(zhuǎn)運(yùn)起作用,后期如果能找到生物標(biāo)志物,那么下調(diào)miRNAs很有可能成為新的治療靶點(diǎn). (3)在生物學(xué)過(guò)程方面,上調(diào)和下調(diào)miRNAs主要差別在于轉(zhuǎn)運(yùn)和細(xì)胞間通訊過(guò)程,可推測(cè)它們分別參與物質(zhì)傳遞和信息交流相關(guān)過(guò)程. (4)在差異表達(dá)miRNAs參與的生物通路方面,不同之處在于上調(diào)的miRNAs主要參與質(zhì)膜雌激素受體信號(hào)轉(zhuǎn)導(dǎo)和LKB1信號(hào)通路,下調(diào)的miRNAs主要參與整合素家族細(xì)胞表面相互作用相關(guān)通路,這些都可能對(duì)研究口腔癌患者發(fā)生惡性腫瘤的機(jī)制和預(yù)后機(jī)制提供一些線(xiàn)索.
本研究也存在一定的局限性,差異表達(dá)的miRNAs以及涉及到的生物信號(hào)通路,尚未進(jìn)行分子水平的驗(yàn)證,這將是下一步的研究目標(biāo).
本研究對(duì)口腔癌與正常組織間的差異表達(dá)miRNAs進(jìn)行分析,并對(duì)差異miRNAs進(jìn)行GO功能注釋、KEGG信號(hào)通路分析,使我們能夠識(shí)別出一些miRNA,通過(guò)分析預(yù)測(cè)并通過(guò)PPI互作分析篩選出了聯(lián)系最緊密的靶基因. 這些數(shù)據(jù)會(huì)為口腔癌檢測(cè)提供一些有用的信息和方向.