樊春燕,魏強(qiáng),郝志強(qiáng),李廣林
陜西師范大學(xué)生命科學(xué)學(xué)院,西安 710062
miRNAs調(diào)控lincRNAs的生物信息學(xué)預(yù)測與功能分析
樊春燕,魏強(qiáng),郝志強(qiáng),李廣林
陜西師范大學(xué)生命科學(xué)學(xué)院,西安 710062
基因間長鏈非編碼RNAs(Long intergenic non-coding RNAs, lincRNAs)是位于蛋白編碼基因之間的長度超過200 nt的非編碼RNAs,在動物中參與細(xì)胞周期調(diào)控、免疫監(jiān)視、胚胎干細(xì)胞分化等多種生物學(xué)過程,但是lincRNAs在大多數(shù)植物中的功能尚不清楚。MicroRNAs(miRNAs)是真核生物中一類在轉(zhuǎn)錄水平和轉(zhuǎn)錄后水平介導(dǎo)基因沉默的21 nt左右的內(nèi)源性單鏈小非編碼RNAs分子,通過序列互補(bǔ)的方式調(diào)控靶標(biāo)基因的表達(dá)。目前miRNAs的靶標(biāo)研究主要集中于編碼蛋白的基因,而對于靶標(biāo)為非編碼RNAs的研究較少,尤其在植物中的研究更為少見。為了系統(tǒng)挖掘植物中l(wèi)incRNAs的功能,文章整合miRNAs數(shù)據(jù)、cDNAs數(shù)據(jù)和降解組數(shù)據(jù),利用生物信息學(xué)方法找到擬南芥(Arabidopsis thaliana)337個成熟miRNAs在2708個lincRNAs上的可能結(jié)合位點(diǎn),構(gòu)建了miRNAs-mRNAs-lincRNAs調(diào)控網(wǎng)絡(luò),并根據(jù)競爭性內(nèi)源(ceRNA)假說預(yù)測lincRNAs的功能,為進(jìn)一步闡明植物中miRNAs對lincRNAs的調(diào)控機(jī)制以及l(fā)incRNAs的功能奠定了基礎(chǔ)。
微小RNAs;基因間長鏈非編碼RNAs;降解組;靶標(biāo)
基因間長鏈非編碼 RNAs(Long intergenic noncoding RNAs, lincRNAs)是一類位于基因間區(qū)長度超過 200nt的低度保守的非編碼 RNAs(Non-coding RNAs, ncRNAs),其廣泛存在于真核生物中,在動物中參與細(xì)胞周期調(diào)控、免疫監(jiān)視、胚胎干細(xì)胞分化等多種生物學(xué)過程[1]。目前,雖然對擬南芥(Arabidopsis thaliana)、玉米(Zea mays)等植物中的lincRNAs進(jìn)行了預(yù)測和表達(dá)分析,但植物中大多數(shù)lincRNAs的功能尚不清楚[2~4]。MicroRNAs (miRNAs)是一類長度約21nt的內(nèi)源性單鏈小非編碼RNAs分子,主要在轉(zhuǎn)錄和轉(zhuǎn)錄后水平通過與靶基因序列互補(bǔ)的方式來調(diào)控靶基因的表達(dá)[5~7]。目前,miRNAs靶標(biāo)的研究主要集中在編碼蛋白的基因,而對于靶標(biāo)為非編碼 RNAs的研究較少。Majoros等[8,9]的研究結(jié)果顯示,與 miRNAs優(yōu)先結(jié)合靶基因的3′UTR區(qū)相似,miRNAs在調(diào)控 lncRNAs(Long noncoding RNAs, lncRNAs)時argonaute蛋白質(zhì)(AGO)會優(yōu)先與lncRNAs的中間或3′末端結(jié)合。競爭性內(nèi)源RNA(Competing endogenous RNA, ceRNA)假說[10~12]是指lincRNAs可以作為 miRNAs的內(nèi)源性模擬靶標(biāo)(Endogenous microRNA target mimics, eTMs)直接與miRNAs結(jié)合抑制miRNAs對mRNAs的調(diào)控作用,從而使mRNAs的含量增多。Cesana等[13]已經(jīng)證實linc-MD1可以競爭性結(jié)合miR-133和miR-135來抑制miR-133和miR-135與靶基因的作用,從而調(diào)控人(Homo sapiens)和鼠(Mus musculus)肌肉中MAML1和MEF2C的表達(dá)。Wu等[14]發(fā)現(xiàn)在擬南芥和水稻(Oryza sativa)中l(wèi)ncRNAs可以作為eTMs阻礙miRNAs和其真正靶標(biāo)的作用,當(dāng)過表達(dá)miR160的模擬靶標(biāo)ath-eTM160-1、osa-eTM160-3時,會使miR160靶標(biāo)的表達(dá)量增加,并且miR160的表達(dá)水平明顯降低。因此,lincRNAs可能作為eTMs抑制相應(yīng)miRNAs的功能。
降解組數(shù)據(jù)(Degradome data)是通過降解組測序(Degradome sequencing)方法得到的測序數(shù)據(jù),整合miRNAs潛在的靶標(biāo)和降解組數(shù)據(jù)是提高miRNAs靶標(biāo)預(yù)測效率的有效手段,目前已在擬南芥、水稻、黃瓜(Cucumis sativus)等植物中有效地驗證了保守和不保守miRNAs靶標(biāo)[15~19]。所以,將降解組數(shù)據(jù)和miRNAs靶標(biāo)預(yù)測結(jié)合是挖掘 miRNAs與 mRNAs及miRNAs與lincRNAs調(diào)控關(guān)系的有效手段。為了系統(tǒng)挖掘植物中l(wèi)incRNAs的功能,本研究首先整合miRNAs數(shù)據(jù)、cDNAs數(shù)據(jù)和降解組數(shù)據(jù),利用生物信息學(xué)方法找到擬南芥 337個成熟 miRNAs在2708個 lincRNAs上的可能結(jié)合位點(diǎn),最后構(gòu)建了miRNAs- mRNAs-lincRNAs調(diào)控網(wǎng)絡(luò),并根據(jù)競爭性內(nèi)源(ceRNA)假說預(yù)測lincRNAs的功能,為進(jìn)一步闡明植物中 miRNAs對 lincRNAs的調(diào)控機(jī)制以及l(fā)incRNAs的功能奠定了基礎(chǔ)。
1.1 miRNAs序列
從miRBase[20](http://microrna.sanger.ac.uk/, release 20)中下載擬南芥337條成熟的miRNAs序列。
1.2 轉(zhuǎn)錄本序列
1.2.1 cDNAs序列
從擬南芥信息資源網(wǎng)站(The Arabidopsis Information Resource, TAIR)[21](ftp://ftp.arabidopsis.org/home/ tair/Sequences/blast_datasets/TAIR10_blastsets/, release 10)下載得到33 602條擬南芥cDNAs序列。
1.2.2 lincRNAs序列
Liu等[4]通過 RNA-seq確認(rèn)了擬南芥 2708個lincRNAs,并將其命名為“ATXNCxxxxxx”,這與TAIR中對 cDNAs的注釋號“ATXGxxxxxx”相似,NC代表ncRNAs,X代表來源的染色體號。
1.3 降解組序列
從Next-Gen Sequence Data-bases[22](http://mpss. udel.edu/)和美國國立生物信息中心(NCBI)GEO數(shù)據(jù)庫[23](http://www.ncbi.nlm.nih.gov/geo/)下載AxIDT、AxIRP、AxSRP、Col、ein5、TWF、Tx4F、GSM278333降解組數(shù)據(jù)。其中野生型擬南芥材料有:(1)生態(tài)型材料(col-0):AxIDT、AxIRP、GSM278333、Col、TWF是擬南芥的生態(tài)型花序降解組數(shù)據(jù),AxSRP是擬南芥的生態(tài)型幼苗降解組數(shù)據(jù);(2)突變體材料:ein5(對照野生型為Col),Tx4F(對照野生型為TWF)均為突變體花序降解組數(shù)據(jù)。以上數(shù)據(jù)均為利用German等[17]方法建立的PARE庫,并用Illumina技術(shù)平臺測序后過濾得到質(zhì)量較高的reads。
1.4 miRNAs靶基因的預(yù)測
本研究利用 RNAplex[24,25]和 CleaveLand[15,26]軟件并整合降解組數(shù)據(jù),預(yù)測擬南芥337條成熟miRNAs序列在2708個lincRNAs和33 602條mRNAs上可能的結(jié)合位點(diǎn),并繪制相應(yīng)的t-plots圖。在預(yù)測miRNAs靶基因時,選取最小折疊自由能(Minimal folding free energy, MFE)率大于或等于0.65時的miRNAs-RNAs復(fù)合物,并按照MFE率的大小排序。同時,根據(jù)Allen等[27]的打分標(biāo)準(zhǔn)(每個G:U堿基配對罰0.5分,錯配、缺失、插入等罰1分,當(dāng)錯配發(fā)生在miRNAs第2~13位時,所有罰分加倍),計算miRNAs與其靶基因配對時的得分,得分越高,代表 miRNAs-RNAs的結(jié)合能力越弱。
1.5 miRNAs-lincRNAs-mRNAs相互作用網(wǎng)絡(luò)
本文選取了對 lincRNAs有潛在調(diào)控作用的miRNAs,分別預(yù)測每個miRNAs調(diào)控mRNAs時的靶基因,并利用 Cytoscape[28]整合 miRNAs-mRNAs與miRNAs-lincRNAs網(wǎng)絡(luò)調(diào)控關(guān)系。
1.6 lincRNAs功能預(yù)測與富集分析
基因功能富集分析軟件(Gene Ontology Enrichment Analysis Software Toolkit, GOEAST)[29](http:// omicslab.genetics.ac.cn/GOEAST/)用于識別特定靶基因中富集的go術(shù)語。本文通過富集miRNAs靶基因的功能,推測lincRNAs作為模擬靶標(biāo)時的功能及不同go富集狀態(tài)之間的功能相關(guān)性。
2.1 miRNAs調(diào)控lincRNAs的生物信息學(xué)預(yù)測
本研究從擬南芥花序、幼苗等組織中共收集了12 075 505條降解組reads,根據(jù)miRNAs與靶標(biāo)通過序列互補(bǔ)配對發(fā)揮生物學(xué)效應(yīng)的特性,利用降解組數(shù)據(jù)和生物信息學(xué)方法首先預(yù)測了337個miRNAs在2708個lincRNAs上可能的剪切位點(diǎn)。結(jié)果表明,有34個miRNAs與33個lincRNAs可以形成39個miRNAs-lincRNAs復(fù)合物,且每個復(fù)合物中miRNAs在lincRNAs的第10個核苷酸處均有剪切作用(表1)。其中,大部分miRNAs與lincRNAs是一對一的關(guān)系,即一個 miRNA只可能調(diào)控一個 lincRNA,如 athmiR157d與At3NC005090;此外,一個miRNA也可能調(diào)控兩個 lincRNAs,如 ath-miR413可能調(diào)控At2NC055950和At3NC084830;還有少數(shù)兩個或兩個以上miRNAs對同一個lincRNA起調(diào)控作用的可能,如 At3NC084820可能受 ath-miR172b-3p和ath-miR172e調(diào)控(圖1)。
Jalali等[9]報道了lncRNAs不僅有miRNAs潛在的調(diào)控元件,而且可以參與miRNAs的調(diào)控網(wǎng)絡(luò)。因此,本研究在建立miRNAs-mRNAs調(diào)控網(wǎng)絡(luò)的基礎(chǔ)上,增加miRNAs-lincRNAs網(wǎng)絡(luò),最后在全基因組范圍內(nèi)建立miRNAs-lincRNAs-mRNA調(diào)控網(wǎng)絡(luò)。該網(wǎng)絡(luò)總共由 2319個 hub組成,其中包括 34個miRNAs、33個lincRNAs、2252個mRNAs(圖2,圖3)。本文推測miRNAs或lincRNAs可能作為橋梁將不同的miRNAs、lincRNAs、mRNAs的調(diào)控作用聯(lián)系起來。為闡述miRNAs-lincRNAs-mRNAs的調(diào)控機(jī)制,選取部分網(wǎng)絡(luò)進(jìn)行分析。如ath-miR3440b-3p調(diào)控的靶基因可能不受其他 miRNAs、mRNAs或lincRNAs的影響,ath-miR3440b-3p可能通過與At1NC051890、AT3G31314.1、AT2G01250.1、AT5G-28070.1、AT3G51260.1、AT4G01150.1、AT1G-60900.1、AT3G44940.1、AT5G23940.1等 RNAs結(jié)合來調(diào)控基因表達(dá)(圖3)。另外,同一家族的miRNAs既有可能調(diào)控相同的RNAs,也有可能與完全不同的RNAs形成互不干擾的調(diào)控網(wǎng)絡(luò),從而發(fā)揮不同的生物學(xué)功能。如 ath-miR447家族的 ath-miR447a.2-3p和ath-miR447c-3p分別形成各自特有的調(diào)控網(wǎng)絡(luò)(圖4A)。ath-miR156家族的ath-miR156b和ath-miR156h不僅都能調(diào)控AT3G15270.1、AT5G38610.1等mRNAs,還可能分別與At4NC064490和At4NC031260形成miRNAs-lincRNAs的調(diào)控關(guān)系,此外還分別與部分mRNAs形成了特異的調(diào)控作用(圖 4B)。與 athmiR156不同的是,ath-miR158家族可以調(diào)控相同的lincRNAs和部分 mRNAs(圖4C)。此外,不同基因家族的 miRNAs可能調(diào)控同一個 lincRNA,如At1NC061870可能同時參與 ath-miR845a和 athmiR829.1的調(diào)控網(wǎng)絡(luò)(圖4D)。
表1 擬南芥中預(yù)測的miRNAs-lincRNAs相互作用信息
圖1 不同miRNAs調(diào)控同一個lincRNA的剪切信息及t-plots圖A:ath-miR172e調(diào)控At3NC084820的t-plots圖;B:ath-miR172b-3p調(diào)控At3NC084820的t-plots圖。X軸:轉(zhuǎn)錄本位置;Y軸:降解組豐度;“T”:lincRNAs;“Q”:ath-miRNAs;“S”:代表潛在的剪切位點(diǎn);category:降解組剪切信號分類;“p”:p值;黑線:代表可以結(jié)合到lincRNAs降解組reads;紅點(diǎn):表示miRNA在lincRNAs上潛在的剪切位點(diǎn);綠色方框:由該降解組庫中預(yù)測得到的剪切位點(diǎn)。
圖2 miRNAs可能調(diào)控的lincRNAs和mRNAs數(shù)目
圖3 miRNAs-mRNAs-lincRNAs調(diào)控網(wǎng)絡(luò)
圖4 不同miRNAs家族與lincRNAs和mRNAs的調(diào)控網(wǎng)絡(luò)A:ath-miR447a.2-3p和ath-miR447c-3p的調(diào)控網(wǎng)絡(luò);B:ath-miR156b和ath-miR156h的調(diào)控網(wǎng)絡(luò);C:ath-miR158a和ath-miR158b的調(diào)控網(wǎng)絡(luò);D:ath-miR845a和ath-miR829.1的調(diào)控網(wǎng)絡(luò)。
2.3 lincRNAs功能預(yù)測及分析
本文通過對miRNAs調(diào)控的mRNAs靶基因進(jìn)行GO分析,并根據(jù)lincRNAs可能作為eTMs抑制miRNAs的功能,推測lincRNAs可能對轉(zhuǎn)錄因子的活性、催化活性、有機(jī)物循環(huán)復(fù)合物或雜環(huán)復(fù)合物結(jié)合、翻譯起始因子的活性、氨肽酶活性、結(jié)構(gòu)分子活性、焦磷酸化酶、水解酶、GTP酶活性等生物學(xué)功能產(chǎn)生影響。以ath-miR5021為例,從GO分析得出 ath-miR5021靶基因的分子功能主要有蛋白結(jié)合功能,影響水解酶活性及作用于酯鍵的能力,At3NC016580及At5NC013910與ath-miR5021的真實靶基因間可能存在競爭性關(guān)系,ath-miR5021與At3NC016580或At5NC013910的結(jié)合會使得本來與mRNAs結(jié)合的ath-miR5021含量減少,從而影響靶基因的表達(dá)(圖 5)。另外,ath-miR156家族中ath-miR156b可能調(diào)控 At4NC064490,而 athmiR156h可能調(diào)控 At4NC031260;我們預(yù)測 athmiR156b靶基因可能和細(xì)胞核、細(xì)胞器的組成有關(guān),參與生殖發(fā)育,胚后發(fā)育,花的形狀、器官、雄蕊發(fā)育等生物過程,并具有調(diào)控核酸轉(zhuǎn)錄因子活性、果膠酯酶活性,與DNA、核酸、雜環(huán)復(fù)合物、有機(jī)環(huán)狀復(fù)合物結(jié)合等功能(圖6)。而At4NC064490可能影響ath-miR156b與其靶基因的結(jié)合,阻礙 ath-miR156b靶基因功能的發(fā)揮。類似于 ath-miR156b,與其同屬一個家族的 ath-miR156h也有可能調(diào)控擬南芥lincRNAs,即At4NC031260,而ath-miR156h只保留了 ath-miR156b的部分調(diào)控作用,這可能由于在進(jìn)化時隨著環(huán)境或基因突變等因素,或者是ath-miR156h 與 At4NC031260 的作用影響了ath-miR156b對靶標(biāo)的調(diào)控能力。
圖5 ath-miR5021的GO分子功能樹狀分析圖方框:代表 go術(shù)語,方框內(nèi)包含ID、術(shù)語的描述及詳細(xì)信息,“q/m|t/k (P-value)”等;箭頭:不同go術(shù)語間的聯(lián)系;紅色箭頭:兩個富集go術(shù)語的關(guān)系;黑色實線箭頭:富集go術(shù)語與不富集go術(shù)語的關(guān)系;黑色虛線箭頭:兩個不富集go術(shù)語。下圖同。白色方框:富集不重要的 go術(shù)語;黃色方框:富集重要的 go術(shù)語;方框內(nèi)的顏色越深,go術(shù)語的富集作用越明顯。
近年來,人們逐步認(rèn)識到lincRNAs對表觀遺傳調(diào)控、基因轉(zhuǎn)錄調(diào)控、轉(zhuǎn)錄調(diào)控等的生物學(xué)過程重要性,目前雖然在許多物種中已預(yù)測出lincRNAs,但對植物中 lincRNAs的功能研究較少,尤其在miRNAs調(diào)控lincRNAs方面的報道更為少見,遠(yuǎn)不能滿足研究的需要,因此需要開發(fā)新的生物信息學(xué)方法預(yù)測lincRNAs的功能。本文利用降解組數(shù)據(jù)和生物信息學(xué)方法,探索了miRNAs調(diào)控lincRNAs的可能功能,發(fā)現(xiàn)有 33個 lincRNAs可能受 34個miRNAs調(diào)控,并形成由 39個 miRNAs-lincRNAs復(fù)合物組成的調(diào)控網(wǎng)絡(luò)。在該網(wǎng)絡(luò)中既有同一miRNAs調(diào)控多個lincRNAs,也有同一個lincRNAs受多個miRNAs調(diào)控的情況。本文在構(gòu)建miRNAsmRNAs調(diào)控網(wǎng)絡(luò)的基礎(chǔ)上,添加miRNAs-lincRNAs網(wǎng)絡(luò),最后建立了miRNAs-mRNAs-lincRNAs調(diào)控網(wǎng)絡(luò)。在該網(wǎng)絡(luò)中,可以清晰的看出miRNAs調(diào)控的lincRNAs數(shù)量明顯少于miRNAs調(diào)控mRNAs數(shù)量,這可能由于在擬南芥中已發(fā)現(xiàn)的lincRNAs數(shù)量比較少或者可能調(diào)控lincRNAs的miRNAs還未被人們發(fā)現(xiàn),還有可能因為miRNAs的調(diào)控作用主要發(fā)生在蛋白編碼基因上,真正受 miRNAs調(diào)控的lincRNAs比較少。此外,本文根據(jù) ceRNA假說對lincRNAs的功能進(jìn)行了預(yù)測,發(fā)現(xiàn) lincRNAs可能影響轉(zhuǎn)錄因子的活性、催化活性、翻譯起始因子的活性、氨肽酶活性、焦磷酸化酶、水解酶、GTP酶活性等多種生物學(xué)功能。本文不僅預(yù)測了擬南芥中l(wèi)incRNAs的功能,而且為挖掘其他植物中l(wèi)incRNAs功能提供了理論參考。
[1] Khalil AM, Guttman M, Huarte M, Garber M, Raj A, Mo
rales DR, Thomas K, Presser A, Bernstein BE, van Oudenaarden A, Regev A, Lander ES, Rinn JL. Many human large intergenic noncoding RNAs associate with chromatin-modifying complexes and affect gene expression. Proc Natl Acad Sci USA, 2009, 106(28): 11667-11672.
[2] Li L, Eichten SR, Shimizu R, Petsch K, Yeh CT, Wu W, Chettoor AM, Givan SA, Cole RA, Fowler JE, Evans MMS, Scanlon MJ, Yu JM, Schnable PS, Timmermans MCP, Springer NM, Muehlbauer GJ. Genome-wide discovery and characterization of maize long non-coding RNAs. Genome Biol, 2014, 15(2): R40.
[3] Boerner S, McGinnis KM. Computational identification and functional predictions of long noncoding RNA in Zea mays. PloS ONE, 2012, 7(8): e43047.
患者確診后,予以三維適形放射治療,5次/周,1次/d,常規(guī)分割200 cGy/次,治療計劃總劑量為6200 cGy。治療期間,實施以下護(hù)理干預(yù)措施:
[4] Liu J, Jung C, Xu J, Wang H, Deng SL, Bernad L, Arenas-Huertero C, Chua NH. Genome-wide analysis uncovers regulation of long intergenic noncoding RNAs in Arabidopsis. Plant Cell, 2012, 24(11): 4333-4345.
[5] Voinnet O. Origin, biogenesis, and activity of plant microRNAs. Cell, 2009, 136(4): 669-687.
[6] Bartel DP. MicroRNAs: target recognition and regulatory functions. Cell, 2009, 136(2): 215-233.
[7] Brodersen P, Sakvarelidze-Achard L, Bruun-Rasmussen M, Dunoyer P, Yamamoto YY, Sieburth L, Voinnet O. Widespread translational inhibition by plant miRNAs and siRNAs. Science, 2008, 320(5880): 1185-1190.
[8] Majoros WH, Ohler U. Spatial preferences of microRNA targets in 3' untranslated regions. BMC Genomics, 2007, 8(1): 152.
[9] Jalali S, Bhartiya D, Lalwani MK, Sivasubbu S, Scaria V. Systematic transcriptome wide analysis of lncRNA-miRNA interactions. PloS ONE, 2013, 8(2): e53823.
[10] Salmena L, Poliseno L, Tay Y, Kats L, Pandolfi PP. A ceRNA Hypothesis: The Rosetta Stone of a Hidden RNA Language? Cell, 2011, 146(3): 353-358.
[11] Zhao Y, He SM, Liu CN, Ru SW, Zhao HT, Yang Z, Yang PC, Yuan XY, Sun SW, Bu DB, Huang JF, Skogerb? G, Chen RS. MicroRNA regulation of messenger-like noncoding RNAs: a network of mutual microRNA control. Trends Genet, 2008, 24(7): 323-327.
[12] Liu K, Yan ZM, Li YC, Sun ZR. Linc2GO: a human LincRNA function annotation resource based on ceRNA hypothesis. Bioinformatics, 2013, 29(17): 2221-2222.
[13] Cesana M, Cacchiarelli D, Legnini I, Santini T, Sthandier O, Chinappi M, Tramontano A, Bozzoni I. A long noncoding RNA controls muscle differentiation by functioning as a competing endogenous RNA. Cell, 2011, 147(2): 358-369.
[14] Wu HJ, Wang ZM, Wang M, Wang XJ. Widespread long noncoding RNAs as endogenous target mimics for microRNAs in plants. Plant Physiol, 2013, 161(4): 1875-1884.
[15] Addo-Quaye C, Eshoo TW, Bartel DP, Axtell MJ. Endogenous siRNA and miRNA Targets Identified by Sequencing of the Arabidopsis Degradome. Curr Biol, 2008, 18(10): 758-762.
[16] German MA, Pillay M, Jeong DH, Hetawal A, Luo SJ, Janardhanan P, Kannan V, Rymarquis LA, Nobuta K, German R, De Paoli E, Lu C, Schroth G, Meyers BC, Green PJ. Global identification of microRNA-target RNA pairs by parallel analysis of RNA ends. Nat Biotechnol, 2008, 26(8): 941-946.
[17] German MA, Luo SJ, Schroth G, Meyers BC, Green PJ. Construction of Parallel Analysis of RNA Ends (PARE) libraries for the study of cleaved miRNA targets and the RNA degradome. Nat Protoc, 2009, 4(3): 356-362.
[18] Li YF, Zheng Y, Addo-Quaye C, Zhang L, Saini A, Jagadeeswaran G, Axtell MJ, Zhang WX, Sunkar R. Transcriptome-wide identification of microRNA targets in rice. Plant J, 2010, 62(5): 742-759.
[19] Mao WH, Li ZY, Xia XJ, Li YD, Yu JQ. A combined approach of high-throughput sequencing and degradome analysis reveals tissue specific expression of microRNAs and their targets in cucumber. PloS ONE, 2012, 7(3): e33040.
[20] Griffiths-Jones S, Saini HK, van Dongen S, Enright AJ. miRBase: tools for microRNA genomics. Nucleic Acids Res, 2008, 36(Database issue): D154-D158.
[21] Huala E, Dickerman AW, Garcia-Hernandez M, Weems D, Reiser L, LaFond F, Hanley D, Kiphart D, Zhuang MZ, Huang W, Mueller LA, Bhattacharyya D, Bhaya D, Sobral BW, Beavis W, Meinke DW, Town CD, Somerville C, Rhee SY. The Arabidopsis Information Resource (TAIR): a comprehensive database and web-based information retrieval, analysis, and visualization system for a model plant. Nucleic Acids Res, 2001, 29(1): 102-105.
[22] Nakano M, Nobuta K, Vemaraju K, Tej SS, Skogen JW, Meyers BC. Plant MPSS databases: signature-based transcriptional resources for analyses of mRNA and small RNA. Nucleic Acids Res, 2006, 34(Database issue): D731-D735.
[23] Barrett T, Troup DB, Wilhite SE, Ledoux P, Rudnev D, Evangelista C, Kim IF, Soboleva A, Tomashevsky M, Marshall KA, Phillippy KH, Sherman PM, Muertter RN, Edgar R. NCBI GEO: archive for high-throughput functional genomic data. Nucleic Acids Res, 2009, 37(Database issue): D885-D890.
[24] Lorenz R, Bernhart SH, H?ner Zu Siederdissen C, Tafer H, Flamm C, Stadler PF, Hofacker IL. ViennaRNA Package 2.0. Algorithms Mol Biol, 2011, 6(1): 26.
[25] Tafer H, Hofacker IL. RNAplex: a fast tool for RNA-RNA interaction search. Bioinformatics, 2008, 24(22): 2657-2663.
[26] Addo-Quaye C, Miller W, Axtell MJ. CleaveLand: a pipeline for using degradome data to find cleaved small RNA targets. Bioinformatics, 2009, 25(1): 130-131.
[27] Williams L, Carles CC, Osmont KS, Fletcher JC. A database analysis method identifies an endogenous trans-acting short-interfering RNA that targets the Arabidopsis ARF2, ARF3, and ARF4 genes. Proc Natl Acad Sci USA, 2005, 102(27): 9703-9708.
[28] Shannon P, Markiel A, Ozier O, Baliga NS, Wang JT, Ramage D, Amin N, Schwikowski B, Ideker T. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Res, 2003, 13(11): 2498-2504.
[29] Zheng Q, Wang XJ. GOEAST: a web-based software toolkit for Gene Ontology enrichment analysis. Nucleic Acids Res, 2008, 36(Web Server issue): W358-W363.
(責(zé)任編委: 方向東)
Prediction and functional analysis of lincRNAs targeted by miRNAs
Chunyan Fan, Qiang Wei, Zhiqiang Hao, Guanglin Li
College of Life Science, Shaanxi Normal University, Xi’an 710062, China
Long intergenic non-coding RNAs (lincRNAs) located between protein-coding genes are non-coding RNAs longer than 200 nucleotides in length. LincRNAs are involved in a variety of biological processes such as cell cycle regulation, immune surveillance and embryonic stem cells differentiation in animals; however, the function of lincRNAs in plants is largely unclear. MicroRNAs (miRNAs) are a class of endogenous, single-stranded, non-coding small (~21 nt) RNAs, which can regulate gene expression at transcriptional or post-transcriptional level in eukaryotes by means of sequence complementation. Now, intensive studies on protein-coding genes targeted by miRNAs have been carried out, but the research on non-coding RNAs targeted by miRNAs is seldom explored, especially in plants. In order to uncover the potential function of lincRNAs, the data including miRNAs, cDNAs and degradomes were firstly collected and integrated, followed by bioinformatics methods to predict the potential binding sites of 337 mature miRNAs at 2708 lincRNAs in Arabidopsis thaliana. The regulatory networks ofmiRNAs-mRNAs-lincRNAs were constructed and the function of lincRNAs was predicted according to the competing endogenous RNA (ceRNA) hypothesis. This study may lay a solid foundation for elucidating the regulatory mechanism of miRNAs on lincRNAs as well as the function of lincRNAs in plants.
microRNAs (miRNAs); long intergenic non-coding RNAs (lincRNAs); degradome data; targets
2014-05-21;
2014-07-24
教育部新世紀(jì)優(yōu)秀人才支持計劃(編號:NCET-12-0896),陜西省自然科學(xué)基礎(chǔ)研究計劃項目(編號:2014JM3074)和陜西師范大學(xué)研究生培養(yǎng)創(chuàng)新基金項目(編號:2013CXS020)資助
樊春燕,碩士研究生,專業(yè)方向:非編碼RNA。Tel: 15829008925; E-mail: cyfan89@163.com
李廣林,博士,副教授,研究方向:功能基因組學(xué)與生物信息學(xué)。E-mail: glli@snnu.edu.cn
10.3724/SP.J.1005.2014.1226
時間: 2014-9-24 14:09:12
URL: http://www.cnki.net/kcms/detail/11.1913.R.20140926.1342.004.html