亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于高通量測(cè)序技術(shù)的細(xì)菌非編碼RNA研究方法進(jìn)展

        2015-04-09 12:35:18郭明璋許文濤
        生物技術(shù)通報(bào) 2015年4期
        關(guān)鍵詞:高通量基因組測(cè)序

        郭明璋 許文濤

        (中國(guó)農(nóng)業(yè)大學(xué)食品科學(xué)與營(yíng)養(yǎng)工程學(xué)院 食品安全與分子生物學(xué)實(shí)驗(yàn)室,北京 100083)

        基于高通量測(cè)序技術(shù)的細(xì)菌非編碼RNA研究方法進(jìn)展

        郭明璋 許文濤

        (中國(guó)農(nóng)業(yè)大學(xué)食品科學(xué)與營(yíng)養(yǎng)工程學(xué)院 食品安全與分子生物學(xué)實(shí)驗(yàn)室,北京 100083)

        細(xì)菌非編碼RNA指細(xì)菌中不編碼蛋白質(zhì),而以RNA的分子形式起調(diào)控作用的一類(lèi)核酸分子。高通量測(cè)序技術(shù)的應(yīng)用極大地推進(jìn)了多種細(xì)菌中非編碼RNA的發(fā)現(xiàn)工作,但由于現(xiàn)階段對(duì)細(xì)菌非編碼RNA特征的認(rèn)識(shí)尚不夠深入,該領(lǐng)域測(cè)序數(shù)據(jù)的生物信息學(xué)分析還存在許多不足。介紹了應(yīng)用高通量測(cè)序技術(shù)研究細(xì)菌非編碼RNA的兩種主要技術(shù)——RNA-seq技術(shù)和dRNA-seq技術(shù),對(duì)現(xiàn)行的篩選非編碼RNA的生物信息學(xué)分析方法進(jìn)行綜述,并對(duì)該領(lǐng)域生物信息學(xué)分析策略的改進(jìn)提出設(shè)想。

        細(xì)菌;非編碼RNA;高通量測(cè)序;生物信息學(xué)

        非編碼RNA指不編碼蛋白質(zhì),對(duì)基因表達(dá)等生理過(guò)程或核酸、蛋白質(zhì)等物質(zhì)活性起調(diào)控作用的RNA。真核生物中的非編碼RNA,如miRNA、piRNA、lncRNA等已經(jīng)得到了深入的研究。相比而言,原核生物非編碼RNA的研究還處于初級(jí)階段。細(xì)菌中的非編碼RNA通常統(tǒng)稱(chēng)為non-coding RNA(ncRNA)或small RNA(sRNA),但也有些研究者以sRNA表示反式調(diào)控作用的非編碼RNA,以區(qū)分反義RNA(antisense RNA,asRNA)、核糖開(kāi)關(guān)(Riboswitch)、長(zhǎng)重疊非編碼區(qū)(long overlapping UTR)等順式調(diào)控元件,本文傾向于使用后一種表述方式。

        雖然細(xì)菌在進(jìn)化中比較低等,但其所處環(huán)境復(fù)雜多變,決定了它們必須具有一套反應(yīng)迅速的調(diào)控系統(tǒng)[1],因此非編碼RNA的調(diào)控作用對(duì)細(xì)菌來(lái)說(shuō)至關(guān)重要。已知的細(xì)菌非編碼RNA調(diào)控機(jī)制包括順式互補(bǔ)配對(duì)調(diào)控基因表達(dá)、反式互補(bǔ)配對(duì)調(diào)控基因表達(dá)、調(diào)控蛋白質(zhì)活性、聚簇規(guī)律間隔短回文重復(fù)序列(CRISPR)等類(lèi)型[2]。非編碼RNA調(diào)控涉及細(xì)菌碳代謝、氨基酸代謝、鐵元素調(diào)控、群體效應(yīng)和生物膜形成、對(duì)各種不良環(huán)境的耐受性以及病原微生物的致病性等各個(gè)方面[3]。非編碼RNA與轉(zhuǎn)錄因子等傳統(tǒng)的調(diào)控元件構(gòu)成了復(fù)雜的調(diào)控網(wǎng)絡(luò),成為介導(dǎo)環(huán)境和細(xì)菌生理狀態(tài)的重要橋梁。

        近10年來(lái),研究者對(duì)細(xì)菌非編碼RNA認(rèn)識(shí)的逐步深入有賴(lài)于研究技術(shù)的快速發(fā)展,其中細(xì)菌非編碼RNA大規(guī)模發(fā)現(xiàn)技術(shù)經(jīng)歷了Hfq蛋白免疫共沉淀技術(shù)、基于基因組數(shù)據(jù)進(jìn)行計(jì)算機(jī)預(yù)測(cè)技術(shù)、Tiling芯片技術(shù)和高通量測(cè)序技術(shù)。高通量測(cè)序技術(shù)因其高通量性、無(wú)偏性和廣泛適用性,現(xiàn)在已成為發(fā)現(xiàn)新非編碼RNA的主流方法。在某些菌種中,利用高通量測(cè)序技術(shù)發(fā)現(xiàn)的非編碼RNA已經(jīng)超過(guò)以往所有方法發(fā)現(xiàn)的非編碼RNA的總和[4]。

        測(cè)序可以產(chǎn)生大量RNA序列數(shù)據(jù),如何從這些海量數(shù)據(jù)中高效準(zhǔn)確地篩選出非編碼RNA,是基于高通量測(cè)序細(xì)菌研究非編碼RNA的關(guān)鍵。與真核生物相比,細(xì)菌非編碼RNA具有長(zhǎng)度不一致、二級(jí)結(jié)構(gòu)不一致、在基因組中的位置不一致等特點(diǎn)[5],導(dǎo)致進(jìn)行生物信息學(xué)分析難度較高。目前利用高通量測(cè)序技術(shù)發(fā)現(xiàn)非編碼RNA已在多種細(xì)菌中有所應(yīng)用,但是不同的研究者往往采用不同的測(cè)序和生物信息學(xué)分析策略,尚未形成統(tǒng)一的標(biāo)準(zhǔn)方案和流程。本文將對(duì)基于高通量測(cè)序技術(shù)的細(xì)菌非編碼RNA研究進(jìn)行綜述,旨在能為相關(guān)研究者提供參考。

        1 測(cè)序策略:RNA-seq和dRNA-seq

        2008年德國(guó)馬克斯普朗克傳染病生物學(xué)研究所的J?rg Vogel研究團(tuán)隊(duì)最早發(fā)表論文報(bào)道了應(yīng)用高通量測(cè)序技術(shù)對(duì)細(xì)菌非編碼RNA進(jìn)行的研究[6]。該研究首先通過(guò)免疫共沉淀技術(shù)分離出了鼠傷寒沙門(mén)氏菌(Salmonella entericaserovar Typhimurium)中與Hfq蛋白相結(jié)合的非編碼RNA,再對(duì)RNA進(jìn)行RNA-seq測(cè)序。雖然Hfq蛋白是重要的非編碼RNA結(jié)合蛋白,但并非所有的非編碼RNA都通過(guò)與Hfq蛋白結(jié)合發(fā)揮作用,并且在一些細(xì)菌中并不存在Hfq蛋白[7],因此這種Hfq蛋白免疫共沉淀依賴(lài)的RNA-seq技術(shù)存在一定的局限性。直接對(duì)細(xì)菌總RNA進(jìn)行克隆測(cè)序的方法可以更廣譜地發(fā)現(xiàn)新的非編碼RNA,然而由于細(xì)菌總RNA中95%以上的都是tRNA和rRNA[8],因此直接對(duì)總RNA進(jìn)行克隆測(cè)序難以高效地得到非編碼RNA的信息。2009年Liu等[9]首次報(bào)道了原核生物中穩(wěn)定的rRNA和tRNA去除方法,從而實(shí)現(xiàn)了直接克隆(direct cloning)的非編碼RNA-seq研究。該研究提取霍亂弧菌(Vibrio cholerae)總RNA并分離出14-200 nt長(zhǎng)度范圍的轉(zhuǎn)錄本,去除rRNA和tRNA后直接進(jìn)行高通量測(cè)序的研究,發(fā)現(xiàn)了大量的非編碼RNA。隨后類(lèi)似的直接克隆RNA-seq技術(shù)被應(yīng)用到大腸桿菌(Escherichia coli)[10,11]、單增李斯特菌(Listeria monocytogenes)[4,12]、結(jié)核分枝桿菌(Mycobacterium tuberculosis)[13]、金黃色葡萄球菌(Staphylococcus aureus)[14,15]、肺炎鏈球菌(Streptococcus pneumoniae)[16]、鼠疫耶爾森菌[17]等菌種的非編碼RNA研究中。

        2009年J?rg Vogel團(tuán)隊(duì)又開(kāi)發(fā)了一種新的細(xì)菌非編碼RNA測(cè)序策略,即dRNA-seq(differential RNA-seq)技術(shù),用以研究幽門(mén)螺桿菌(Helicobacter pylori)的初級(jí)轉(zhuǎn)錄本和非編碼RNA[18]。該技術(shù)將總RNA分成兩份,其中一份直接進(jìn)行測(cè)序,另一份中加入5'單磷酸依賴(lài)的外切酶(Terminator 5'-phosphate-dependent exonuclease,TEX)處理,選擇性地降解5'端具有單磷酸的加工過(guò)的轉(zhuǎn)錄本,包括rRNA、tRNA以及部分降解的RNA片段,只保留5'端具有三磷酸的初級(jí)轉(zhuǎn)錄本,即未經(jīng)加工的mRNA及非編碼RNA,再進(jìn)行建庫(kù)測(cè)序。通過(guò)比較兩份樣品的測(cè)序結(jié)果,dRNA-seq技術(shù)可以有效地確定非編碼RNA的轉(zhuǎn)錄起始位點(diǎn)(Transcriptional start sites,TSS)以及mRNA的非編碼區(qū)(UTR),對(duì)于研究順式調(diào)控的核糖開(kāi)關(guān)和長(zhǎng)非編碼區(qū)是非常有利的。通過(guò)dRNA-seq技術(shù),研究者已在根癌 農(nóng) 桿 菌(Agrobacterium tumefaciens)[19]、 枯 草芽孢桿菌(Bacillus subtilis)[20]、谷氨酸棒狀桿菌(Corynebacteriumg lutamicum)[21]、單增李斯特菌[22]、結(jié)核分枝桿菌[23]、鼠傷寒沙門(mén)氏菌[24]、天藍(lán)色鏈霉菌(Streptomyces coelicolor)[25]等菌株中發(fā)現(xiàn)了大量的非編碼RNA。dRNA-seq技術(shù)比傳統(tǒng)的RNA-seq技術(shù)得到的信息更加豐富和準(zhǔn)確,今后很有可能成為高通量測(cè)序依賴(lài)的非編碼RNA研究技術(shù)的主流。

        2 非編碼RNA的篩選與分析策略

        細(xì)菌非編碼RNA的篩選指標(biāo)很多,但適用于所有非編碼RNA的共有特征卻較少。表達(dá)豐度是細(xì)菌非編碼RNA篩選的先決指標(biāo),但由于不同研究中測(cè)序數(shù)據(jù)量的不同,表達(dá)豐度閾值只能依據(jù)研究對(duì)象具體情況而設(shè)定。序列對(duì)應(yīng)在基因組中的位置是比較通用的細(xì)菌非編碼RNA篩選指標(biāo)。當(dāng)此指標(biāo)篩選出來(lái)的潛在非編碼RNA過(guò)多時(shí),研究者會(huì)利用轉(zhuǎn)錄信號(hào)、序列保守性等特征進(jìn)一步篩選,以縮小非編碼RNA的范圍。由于研究者對(duì)于非編碼RNA的二級(jí)結(jié)構(gòu)、Hfq結(jié)合性等特征的認(rèn)識(shí)還不夠深入,因此目前還難以通過(guò)這些特征對(duì)非編碼RNA進(jìn)行篩選,只能對(duì)篩選出來(lái)的這些非編碼RNA特征進(jìn)行分析。

        2.1 序列對(duì)應(yīng)在基因組上位置的篩選

        無(wú)論是RNA-seq還是dRNA-seq研究,序列對(duì)應(yīng)在基因組上的位置都是首要的非編碼RNA篩選的指標(biāo):sRNA來(lái)源于基因間區(qū),asRNA來(lái)源于基因的互補(bǔ)鏈對(duì)應(yīng)序列。Integrated Genome Browser[26],Integrative Genomics Viewer[27]等軟件可以形象化地展示測(cè)序數(shù)據(jù)在基因組上的位置,供研究者人工篩選非編碼RNA。

        關(guān)于基因間區(qū)的定義在不同研究中有所差異。Irnov等[20]將基因組上距離上下游注釋基因編碼區(qū)距離大于25 nt的區(qū)域定義為基因間區(qū),在其他的研究中也有將此最小距離設(shè)置為30 nt[28]、60 nt[25]、80 nt[13]和100 nt[22]?;騾^(qū)間定義的不同主要是由于研究者對(duì)細(xì)菌基因UTR區(qū)長(zhǎng)度的認(rèn)識(shí)不同。dRNA-seq技術(shù)研究表明細(xì)菌的5' UTR區(qū)通常較短,大部分mRNA的5' UTR為20-40 nt,但也有某些mRNA的5' UTR可以長(zhǎng)達(dá)幾百個(gè)堿基[18,20,22,24],因此不同基因間區(qū)的定義體現(xiàn)了對(duì)非編碼RNA篩選的準(zhǔn)確度和靈敏度的不同要求,難以形成統(tǒng)一的標(biāo)準(zhǔn)。另外,不同研究者對(duì)asRNA在基因組中位置的篩選條件也不同。有的研究要求asRNA必須與基因的編碼區(qū)有重疊區(qū)域[22],也有的研究中考慮到asRNA可能作用于mRNA的非編碼區(qū),因此將與基因編碼區(qū)上下游一定長(zhǎng)度范圍有重疊的非編碼RNA也定義為asRNA[21]。

        2.2 轉(zhuǎn)錄信號(hào)分析

        在原核生物非編碼RNA的生物信息學(xué)分析中,轉(zhuǎn)錄起始位點(diǎn)、啟動(dòng)子和終止子是主要的轉(zhuǎn)錄信號(hào)。應(yīng)用dRNA-seq技術(shù)可以有效地確定轉(zhuǎn)錄起始位點(diǎn),而應(yīng)用RNA-seq技術(shù)得到的非編碼RNA的轉(zhuǎn)錄起始位點(diǎn)可能不準(zhǔn)確。Shinhara等[10]應(yīng)用RNA-seq技術(shù)研究大腸桿菌中的非編碼RNA時(shí),在篩選條件中加入了轉(zhuǎn)錄起始的預(yù)測(cè)證據(jù)和實(shí)驗(yàn)證據(jù),即以預(yù)測(cè)的sigma70結(jié)合位點(diǎn)為預(yù)測(cè)證據(jù),以文獻(xiàn)中報(bào)道的大腸桿菌轉(zhuǎn)錄起始位點(diǎn)為實(shí)驗(yàn)證據(jù),對(duì)測(cè)序獲得的非編碼RNA進(jìn)行篩選和起始位點(diǎn)的校正。

        啟動(dòng)子和終止子分析在RNA-seq測(cè)序和dRNA-seq測(cè)序的生物信息學(xué)分析中都很常見(jiàn)。啟動(dòng)子的預(yù)測(cè)通常需先將非編碼RNA轉(zhuǎn)錄起始位點(diǎn)前一定長(zhǎng)度的序列提取出來(lái),在應(yīng)用dRNA-seq測(cè)序的研究中通常取轉(zhuǎn)錄起始位點(diǎn)前的40-50 nt的序列進(jìn)行啟動(dòng)子分析,而在應(yīng)用RNA-seq測(cè)序的研究中,由于轉(zhuǎn)錄起始位點(diǎn)的相對(duì)不準(zhǔn)確性,通常取更長(zhǎng)的50-100 nt長(zhǎng)度的序列進(jìn)行分析。BPROM[29]、HMMER[30]等軟件可以進(jìn)行啟動(dòng)子的預(yù)測(cè)。非Rho因子依賴(lài)的終止子預(yù)測(cè)通常在非編碼RNA的3'端進(jìn)行,TransTermHP[31]是最為常用的非Rho因子依賴(lài)的終止子預(yù)測(cè)軟件。

        雖然啟動(dòng)子和終止子分析在非編碼RNA的研究中很常見(jiàn),但是只有少數(shù)研究以啟動(dòng)子和終止子的存在與否作為篩選非編碼RNA的必要條件,主要原因是許多非編碼RNA在特殊環(huán)境條件下表達(dá),它們的啟動(dòng)子往往是未知的稀有啟動(dòng)子,而是否所有非編碼RNA都有非Rho因子依賴(lài)的終止子也尚未明確。Mentz等[21]以5'端上游存在啟動(dòng)子作為篩選條件,Yan等[17]以5'端上游存在啟動(dòng)子或3'端具有非Rho因子依賴(lài)的終止子作為篩選條件,他們篩選非編碼RNA的策略準(zhǔn)確度比較高,假陽(yáng)性較少,但可能靈敏度較低,會(huì)遺漏某些由未知的稀有啟動(dòng)子介導(dǎo)轉(zhuǎn)錄起始的非編碼RNA。

        2.3 序列保守性分析

        非編碼RNA一級(jí)序列在遠(yuǎn)親基因組(Distantly related genomes)中的保守性很低[5],但在同一屬或同一種的不同菌株存在一定的保守性。在鑒定出新非編碼RNA后,研究者通常會(huì)利用BLAST、BLAT等工具在近緣物種的基因組中檢測(cè)這些非編碼RNA的保守性。通過(guò)比較發(fā)現(xiàn)的不保守的非編碼序列,經(jīng)常是在病原細(xì)菌中起關(guān)鍵作用的非編碼RNA[22]。

        2.4 二級(jí)結(jié)構(gòu)分析

        非編碼RNA的二級(jí)結(jié)構(gòu)分析主要包括結(jié)構(gòu)聚類(lèi)分析、結(jié)構(gòu)保守性分析和結(jié)構(gòu)穩(wěn)定性分析。結(jié)構(gòu)聚類(lèi)分析和結(jié)構(gòu)保守性分析具有類(lèi)似的原理,但側(cè)重點(diǎn)有所不同。大部分RNA家族是由相似二級(jí)結(jié)構(gòu)來(lái)定義的,而家族內(nèi)通常沒(méi)有很強(qiáng)的序列同源性[18]。結(jié)構(gòu)聚類(lèi)分析通過(guò)對(duì)非編碼RNA進(jìn)行結(jié)構(gòu)分析,將這些非編碼RNA進(jìn)行分類(lèi),以加深對(duì)其進(jìn)化關(guān)系的認(rèn)識(shí)和理解[18]。LocARNA軟件[32]是完成二級(jí)結(jié)構(gòu)聚類(lèi)分析的重要工具。結(jié)構(gòu)保守性分析是利用基因組數(shù)據(jù)進(jìn)行計(jì)算機(jī)預(yù)測(cè)發(fā)現(xiàn)非編碼RNA的重要原理[5]。研究者認(rèn)為編碼蛋白的mRNA具有較強(qiáng)的一級(jí)序列保守性,而不編碼蛋白的非編碼RNA應(yīng)該具有較強(qiáng)的二級(jí)結(jié)構(gòu)保守性,通過(guò)研究近緣物種基因組序列的一級(jí)序列保守性和二級(jí)結(jié)構(gòu)保守性,可以區(qū)分編碼RNA和非編碼RNA。依據(jù)此原理,RNAz[33]等軟件被開(kāi)發(fā)出來(lái)用以非編碼RNA的預(yù)測(cè)。Mentz等[21]利用RNAz軟件對(duì)谷氨酸棒狀桿菌基因組上的非編碼RNA進(jìn)行預(yù)測(cè),以尋找預(yù)測(cè)結(jié)果與dRNA-seq測(cè)序結(jié)果發(fā)現(xiàn)的非編碼RNA的交集。此外,因?yàn)榉蔷幋aRNA通常具有穩(wěn)定的二級(jí)結(jié)構(gòu),有研究者從能量的角度分析非編碼RNA的結(jié)構(gòu)穩(wěn)定性,如Miotto等[13]分析了非編碼RNA的最小折疊能(Minimum Folding Energy,MFE),Perkins等[34]分析了非編碼RNA的最小自由能(Minimum Free-Energy MFE)。由于目前還未發(fā)現(xiàn)普適性的非編碼RNA二級(jí)結(jié)構(gòu)特點(diǎn),因此還難以通過(guò)二級(jí)結(jié)構(gòu)對(duì)測(cè)序發(fā)現(xiàn)的非編碼RNA進(jìn)行篩選。

        2.5 開(kāi)放閱讀框分析

        測(cè)序?qū)嶒?yàn)鑒定出的非編碼RNA也有可能編碼未知短肽鏈,因此有必要對(duì)鑒定出的sRNA進(jìn)行開(kāi)放閱讀框分析[18,21]。起始密碼子、終止密碼子和核糖體結(jié)合序列是開(kāi)放閱讀框分析的主要依據(jù)[18]。GenDB[35]、ORFfinder[36]、Glimmer[37]和GeneMarkHMM[38]等軟件可以幫助研究者對(duì)非編碼RNA中的開(kāi)放閱讀框進(jìn)行分析。

        2.6 非編碼RNA的表達(dá)驗(yàn)證實(shí)驗(yàn)

        目前對(duì)非編碼RNA表達(dá)的驗(yàn)證以Northern印記雜交和實(shí)時(shí)定量PCR驗(yàn)證為主,Northern印記雜交結(jié)果比較直觀(guān),而實(shí)時(shí)定量PCR驗(yàn)證可快速大批量地對(duì)非編碼RNA進(jìn)行表達(dá)量驗(yàn)證。在測(cè)序?qū)嶒?yàn)中,對(duì)重點(diǎn)非編碼RNA的實(shí)驗(yàn)方法驗(yàn)證是必不可少的。

        2.7 非編碼RNA靶標(biāo)或靶功能預(yù)測(cè)和驗(yàn)證

        靶標(biāo)分析可以幫助研究者找到在某一生理過(guò)程中起重要作用的非編碼RNA,從而確定后續(xù)研究的重點(diǎn)對(duì)象。靶標(biāo)的預(yù)測(cè)主要依據(jù)非編碼RNA與靶標(biāo)的互補(bǔ)配對(duì)的特點(diǎn),目前已有許多非編碼RNA的靶基因預(yù)測(cè)軟件可以應(yīng)用,其中TargetRNA[39]的應(yīng)用最為廣泛。真核生物非編碼RNA,如miRNA的靶標(biāo)預(yù)測(cè)往往采用多種不同預(yù)測(cè)原理的軟件預(yù)測(cè)后,取結(jié)果的交集,而現(xiàn)階段細(xì)菌中非編碼RNA靶標(biāo)的預(yù)測(cè)多以單一軟件預(yù)測(cè)結(jié)果為準(zhǔn),在這方面應(yīng)該借鑒真核生物非編碼RNA研究的經(jīng)驗(yàn)。對(duì)非編碼RNA功能的驗(yàn)證以定點(diǎn)突變和敲除實(shí)驗(yàn)為主。定點(diǎn)突變可驗(yàn)證非編碼RNA與靶標(biāo)基因的結(jié)合性與結(jié)合位點(diǎn)。敲除實(shí)驗(yàn)則可驗(yàn)證非編碼RNA在某一生理過(guò)程中的調(diào)控作用。

        3 問(wèn)題與展望

        在RNA-seq和dRNA-seq等技術(shù)的幫助下,人類(lèi)在細(xì)菌中發(fā)現(xiàn)的非編碼RNA的數(shù)量迅速增長(zhǎng),相比之下,經(jīng)過(guò)功能驗(yàn)證的非編碼RNA卻極為稀少。以單增李斯特菌為例,目前發(fā)現(xiàn)的sRNA已有147個(gè)(包括LhrA-LhrC、RliA-RliI、RnpB、SsrA、SsrS、SbrA、Rli22-Rli147, 不 計(jì)asRNA)[4], 但目前有文章報(bào)道的經(jīng)過(guò)功能驗(yàn)證的只有LhrA[40]、LhrC[41]和Rli27[42]。大量經(jīng)測(cè)序發(fā)現(xiàn)的非編碼RNA主要是通過(guò)“來(lái)源于基因組上的基因間區(qū)或基因互補(bǔ)鏈的對(duì)應(yīng)序列”這一位置標(biāo)準(zhǔn)篩選出來(lái)的,這些非編碼RNA是否真正能在細(xì)菌中起到調(diào)控作用尚不得而知。

        目前除了“在基因組上的位置”這一非編碼RNA篩選條件外,難以發(fā)現(xiàn)非編碼RNA的其他普適特征,這一瓶頸可能與細(xì)菌非編碼RNA的分類(lèi)不清有關(guān)。解決這一問(wèn)題可采用分而治之的思想。隨著人類(lèi)對(duì)細(xì)菌非編碼RNA認(rèn)識(shí)的不斷加深,可能找到某一種類(lèi)型的非編碼RNA的統(tǒng)一特征,將其特征用于測(cè)序?qū)嶒?yàn)結(jié)果的非編碼RNA篩選,可以更好地篩選出有特定功能的某一類(lèi)非編碼RNA。例如,隨著人類(lèi)對(duì)Hfq蛋白與非編碼RNA相互作用的認(rèn)識(shí)不斷加深,可以總結(jié)出能與Hfq蛋白結(jié)合的RNA的序列或結(jié)構(gòu)特征,以此特征為篩選條件,便可從測(cè)序數(shù)據(jù)中篩選出依賴(lài)Hfq蛋白的非編碼RNA。

        對(duì)細(xì)菌非編碼RNA的研究只是研究細(xì)菌生理調(diào)控的一個(gè)方面,單獨(dú)的非編碼RNA研究難以對(duì)細(xì)菌為適應(yīng)環(huán)境而進(jìn)行的復(fù)雜調(diào)控有全面的認(rèn)識(shí),今后的研究應(yīng)將非編碼RNA測(cè)序與單株菌的全基因組重頭測(cè)序、轉(zhuǎn)錄組學(xué)、蛋白組學(xué)、代謝組學(xué)以及典型特征環(huán)境因素相結(jié)合,實(shí)現(xiàn)多層次多因素的綜合分析,才能更客觀(guān)地分析非編碼RNA的特點(diǎn)及功能。多組學(xué)綜合分析在真核生物非編碼RNA介導(dǎo)的生理調(diào)控的研究中已有應(yīng)用,在相關(guān)領(lǐng)域提出了更完善的生理調(diào)控網(wǎng)絡(luò)[43]。在原核生物中,研究者往往只將非編碼RNA測(cè)序與轉(zhuǎn)錄組學(xué)聯(lián)用[18,22],至于非編碼RNA是否導(dǎo)致蛋白水平、代謝水平的變化還沒(méi)有應(yīng)用組學(xué)方法的全面研究。因此,雖然微生物非編碼RNA研究較多地關(guān)注了多種環(huán)境因素對(duì)非編碼RNA表達(dá)圖譜的影響,但因缺少蛋白組、代謝組數(shù)據(jù)的支持,并未真正找到非編碼RNA介導(dǎo)的細(xì)菌對(duì)環(huán)境因素的適應(yīng)性調(diào)控網(wǎng)絡(luò)。多組學(xué)研究將為探索微生物奧秘的旅程打開(kāi)嶄新的一扇門(mén)。

        [1]Papenfort K, Vogel J. Regulatory RNA in bacterial pathogens[J]. Cell Host & Microbe, 2010, 8(1):116-127.

        [2]Storz G, Vogel J, Wassarman KM. Regulation by small RNAs in bacteria:expanding frontiers[J]. Molecular Cell, 2011, 43(6):880-891.

        [3]Michaux C, Verneuil N, Hartke A, et al. Physiological roles of small RNA molecules[J]. Microbiology, 2014, 160(6):1007-1019.

        [4]Behrens S, Widder S, Mannala GK, et al. Ultra deep sequencing of Listeria monocytogenes sRNA transcriptome revealed new antisense RNAs[J]. PloS One, 2014, 9(2):e83979.

        [5]Sridhar J, Gunasekaran P. Computational small RNA prediction in bacteria[J]. Bioinformatics and Biology Insights, 2013, 7:83.

        [6]Sittka A, Lucchini S, Papenfort K, et al. Deep sequencing analysis of small noncoding RNA and mRNA targets of the global posttranscriptional regulator, Hfq[J]. PLoS Genetics, 2008, 4(8):e1000163.

        [7]Gottesman S, Storz G. RNA reflections:converging on Hfq[J]. RNA, 2015, 21(4):511-512.

        [8]Sorek R, Cossart P. Prokaryotic transcriptomics:a new view on regulation, physiology and pathogenicity[J]. Nature Reviews Genetics, 2010, 11(1):9-16.

        [9] Liu JM, Livny J, Lawrence MS, et al. Experimental discovery of sRNAs in Vibrio cholerae by direct cloning, 5S/tRNA depletion and parallel sequencing[J]. Nucleic Acids Res, 2009, 37(6):e46.

        [10]Shinhara A, Matsui M, Hiraoka K, et al. Deep sequencing reveals as-yet-undiscovered small RNAs in Escherichia coli[J]. BMC Genomics, 2011, 12(1):428.

        [11]Raghavan R, Groisman EA, Ochman H. Genome-wide detection of novel regulatory RNAs in E. coli[J]. Genome Research, 2011, 21(9):1487-1497.

        [12]Mraheil MA, Billion A, Mohamed W, et al. The intracellular sRNA transcriptome of Listeria monocytogenes during growth in macrophages[J]. Nucleic Acids Research, 2011:gkr033.

        [13]Miotto P, Forti F, et al. Genome-wide discovery of small RNAs in Mycobacterium tuberculosis[J]. PLoS One, 2012, 7(12):e51950.

        [14]Bohn C, Rigoulay C, Chabelskaya S, et al. Experimental discovery of small RNAs in Staphylococcus aureus reveals a riboregulator of central metabolism[J]. Nucleic Acids Research, 2010:gkq462.

        [15]Howden BP, Beaume M, Harrison PF, et al. Analysis of the small RNA transcriptional response in multidrug-resistant Staphylococcus aureus after antimicrobial exposure[J]. Antimicrobial Agents and Chemotherapy, 2013, 57(8):3864-3874.

        [16]Acebo P, Martin-Galiano AJ, Navarro S, et al. Identification of 88 regulatory small RNAs in the TIGR4 strain of the human pathogen Streptococcus pneumoniae[J]. RNA, 2012, 18(3):530-546.

        [17]Yan Y, Su S, Meng X, et al. Determination of sRNA expressions by RNA-seq in Yersinia pestis grown in vitro and during infection[J]. PLoS One, 2013, 8(9):e74495.

        [18]Sharma CM, Hoffmann S, Darfeuille F, et al. The primary transcriptome of the major human pathogen Helicobacter pylori[J]. Nature, 2010, 464(7286):250-255.

        [19]Wilms I, Overl?per A, Nowrousian M, et al. Deep sequencinguncovers numerous small RNAs on all four replicons of the plant pathogen Agrobacterium tumefaciens[J]. RNA Biology, 2012, 9(4):446-457.

        [20] Irnov I, Sharma CM, Vogel J, et al. Identification of regulatory RNAs in Bacillus subtilis[J]. Nucleic Acids Res, 2010:gkq454.

        [21] Mentz A, Neshat A, Pfeifer-Sancar K, et al. Comprehensive discovery and characterization of small RNAs in Corynebacteriumglutamicum ATCC 13032[J]. BMC Genomics, 2013, 14(1):714.

        [22]Wurtzel O, Sesto N, Mellin JR, et al. Comparative transcriptomics of pathogenic and non pathogenic Listeria species[J]. Molecular Systems Biology, 2012, 8(1):583.

        [23]Dinan AM, Tong P, Lohan AJ, et al. Relaxed selection drives a noisy noncoding transcriptome in members of the Mycobacterium tuberculosis complex[J]. mBio, 2014, 5(4):e01169-14.

        [24]Kr?ger C, Dillon SC, Cameron ADS, et al. The transcriptional landscape and small RNAs of Salmonella entericaserovar Typhimurium[J]. Proceedings of the National Academy of Sciences, 2012, 109(20):E1277-E1286.

        [25]Vockenhuber MP, Sharma CM, Statt MG, et al. Deep sequencingbased identification of small non-coding RNAs in Streptomyces coelicolor[J]. RNA Biology, 2011, 8(3):468-477.

        [26]Nicol JW, Helt GA, Blanchard SG, et al. The Integrated Genome Browser:free software for distribution and exploration of genomescale datasets[J]. Bioinformatics, 2009, 25(20):2730-2731.

        [27]Robinson JT, Thorvaldsdóttir H, Winckler W, et al. Integrative genomics viewer[J]. Nat Biotechnol, 2011, 29(1):24-26.

        [28]Toffano-Nioche C, Nguyen AN, Kuchly C, et al. Transcriptomic profiling of the oyster pathogen Vibrio splendidus opens a window on the evolutionary dynamics of the small RNA repertoire in the Vibrio genus[J]. RNA, 2012, 18(12):2201-2219.

        [29] Solovyev V, Salamov A. Automatic annotation of microbial genomes and metagenomicsequences[M]// Robert W Li Metagenomics and Its Applica-tions in Agriculture, Biomedicine and Environmental Studies. Nova Science Publishers Inc, 2011:61-78.

        [30] Eddy SR. A new generation of homology search tools based on probabilistic inference[C]. Genome Inform, 2009, 23(1):205-211.

        [31]Kingsford CL, Ayanbule K, Salzberg SL. Rapid, accurate, computational discovery of Rho-independent transcription terminators illuminates their relationship to DNA uptake[J]. Genome Biology, 2007, 8(2):R22.

        [32] Will S, Reiche K, Hofacker IL, et al. Inferring noncoding RNA families and classes by means of genome-scale structure-based clustering[J]. PLoS Computational Biology, 2007, 3(4):e65.

        [33] Washietl S, Hofacker IL, Stadler PF. Fast and reliable prediction of noncoding RNAs[J]. PNAS, 2005, 102(7):2454-2459.

        [34]Perkins TT, Kingsley RA, Fookes MC, et al. A strand-specific RNSeq analysis of the transcriptome of the typhoid bacillus salmonella typhi[J]. PLoS Genetics, 2009, 5(7):e1000569.

        [35]Meyer F, Goesmann A, McHardy AC, et al. GenDB-an open source genome annotation system for prokaryote genomes[J]. Nucleic Acids Research, 2003, 31(8):2187-2195.

        [36]Rombel IT, Sykes KF, Rayner S, et al. ORF-FINDER:a vector for high-throughput gene identification[J]. Gene, 2002, 282(1):33-41.

        [37]Delcher AL, Harmon D, Kasif S, et al. Improved microbial gene identification with GLIMMER[J]. Nucleic Acids Research, 1999, 27(23):4636-4641.

        [38]Lukashin AV, Borodovsky M. GeneMark. hmm:new solutions for gene finding[J]. Nucleic Acids Res, 1998, 26(4):1107-1115.

        [39]Tjaden B. TargetRNA:a tool for predicting targets of small RNA action in bacteria[J]. Nucleic Acids Research, 2008, 36(suppl. 2):W109-W113.

        [40]Nielsen JS, Larsen MH, Lilleb?k EMS, et al. A small RNA controls expression of the chitinase ChiA in Listeria monocytogenes[J]. PLoS One, 2011, 6(4):e19019.

        [41]Sievers S, Lilleb?k EMS, Jacobsen K, et al. A multicopy sRNA of Listeria monocytogenes regulates expression of the virulence adhesin LapB[J]. Nucleic Acids Research, 2014, 42(14):9383-9398.

        [42]Quereda JJ, Ortega áD, Pucciarelli MG, et al. The Listeria small RNA Rli27 regulates a cell wall protein inside eukaryotic cells by targeting a long 5'-UTR variant[J]. PLoS Genetics, 2014, 10(10):e1004765.

        [43]Qi X, Yang X, Chen S, et al. Ochratoxin A induced early hepatotoxicity:new mechanistic insights from microRNA, mRNA and proteomic profiling studies[J]. Scientific Reports, 2014, 4:5163.

        Progress in Methodology of Bacterial Noncoding RNA Research Based on High-throughput Sequencing

        Guo Mingzhang Xu Wentao
        (Laboratory of Food Safety and Molecular Biology,College of Food Science and Nutritional Engineering,China Agricultural University,Beijing 100083)

        Bacterial noncoding RNA refers to the nucleic acid molecules that do not encode proteins, but play roles in the regulation in the form of RNA in bacteria. Application of high-throughput sequencing technology has greatly advanced the discovery of non-coding RNA in a variety of bacterial species. However, due to the lack of enough knowledge on the characteristics of non-coding RNA in bacteria, the bioinformatics analysis of the sequencing data are still defective. This article describes two main techniquesthat applied high-throughput sequencing to be used in the researches on bacterial non-coding RNA:RNA-seq and dRNA-seq. The existing bioinformatics methods for screening of non-coding RNA are reviewed, and the recommendations for improving the bioinformatics strategy in this field are proposed.

        bacteria;non-coding RNA;high-throughput sequencing;bioinformatics

        10.13560/j.cnki.biotech.bull.1985.2015.03.015

        2015-03-29

        國(guó)家高技術(shù)研究發(fā)展計(jì)劃(“863”計(jì)劃,2012AA101606),北京市科技新星計(jì)劃(XX2014B069)

        郭明璋,男,博士研究生;E-mail:guomingzhang126@126.com

        許文濤,男,副教授,博士生導(dǎo)師,研究方向:食品病原微生物的檢測(cè)技術(shù)和致毒機(jī)制研究、轉(zhuǎn)基因生物檢測(cè)和食用安全性評(píng)價(jià)研究、食品源風(fēng)險(xiǎn)因子對(duì)腸道微生物健康的影響等;E-mail:xuwentao1111@sina.com

        猜你喜歡
        高通量基因組測(cè)序
        高通量衛(wèi)星網(wǎng)絡(luò)及網(wǎng)絡(luò)漫游關(guān)鍵技術(shù)
        杰 Sir 帶你認(rèn)識(shí)宏基因二代測(cè)序(mNGS)
        新民周刊(2022年27期)2022-08-01 07:04:49
        牛參考基因組中發(fā)現(xiàn)被忽視基因
        二代測(cè)序協(xié)助診斷AIDS合并馬爾尼菲籃狀菌腦膜炎1例
        傳染病信息(2021年6期)2021-02-12 01:52:58
        高通量血液透析臨床研究進(jìn)展
        Ka頻段高通量衛(wèi)星在鐵路通信中的應(yīng)用探討
        中國(guó)通信衛(wèi)星開(kāi)啟高通量時(shí)代
        基因捕獲測(cè)序診斷血癌
        單細(xì)胞測(cè)序技術(shù)研究進(jìn)展
        基因組DNA甲基化及組蛋白甲基化
        遺傳(2014年3期)2014-02-28 20:58:49
        麻豆91蜜桃传媒在线观看| 亚洲精品黄网在线观看| 免费a级毛片无码a∨免费| 免费视频一区二区三区美女| 日本免费视频| 无码精品久久久久久人妻中字| 99热精品成人免费观看| 国产黄色污一区二区三区| 中文字幕在线看精品乱码| 欧美日韩精品久久久免费观看| 最新亚洲人成无码网www电影| 美女裸体无遮挡免费视频国产| 日本免费影片一区二区| 久久人妻av一区二区软件| 99偷拍视频精品一区二区| 欧美性爱一区二区三区无a| 国产中文字幕亚洲国产| 一本加勒比hezyo无码专区| 精品国产三级a∨在线观看| 欧洲人体一区二区三区| 亚洲国产一区二区中文字幕| 国产偷国产偷精品高清尤物| 日本夜爽爽一区二区三区| 男女上床视频免费网站| 国产高清在线一区二区不卡| 极品少妇一区二区三区四区| 在线精品国内视频秒播| 亚洲天堂av中文字幕| 国产精品亚洲精品日韩已方| 日韩电影一区二区三区| 日韩精人妻无码一区二区三区| 精品一区二区三区人妻久久福利| 国产永久免费高清在线| 国产欧美日韩专区| 激情视频国产在线观看| 最新国产精品拍自在线观看 | 最新国产女主播福利在线观看| 91快射视频在线观看| 中文无码成人免费视频在线观看| 无遮挡亲胸捏胸免费视频| 色婷婷久久99综合精品jk白丝|