孫 軍 李貴生
(植物資源保護(hù)與利用湖南省高校重點(diǎn)實(shí)驗(yàn)室,吉首大學(xué),生物資源與環(huán)境科學(xué)學(xué)院,吉首 416000)
擬南芥孢子體有營養(yǎng)期到生殖期的轉(zhuǎn)變,而它們受到相互拮抗的miR156 和miR172 的控制。擬南芥有3個(gè)MIR156基因,它們產(chǎn)生的miR156能通過堿基互補(bǔ)配對的方式結(jié)合SQUAMOSA-PRO?MOTER BINDING PROTEIN-LIKE(SPL)基 因 的mRNA,并引起后者的斷裂或者翻譯抑制[1-2]。miR156 的濃度在幼期植株中很高,而在發(fā)育過程中逐漸下降[3-5]。反過來,SPL轉(zhuǎn)錄本的水平前期低、后期高[6]。MIR156的組成型表達(dá)延長植株幼期,而其功能失去的植株沒有幼期的特征,譬如短的節(jié)間和光滑的葉下表面[7]。擬南芥SPL3/4/5的miR156結(jié)合位點(diǎn)被屏蔽后使得成熟和開花提前[8],而加強(qiáng)SPL9的功能可以使幼期被跳過[4,9]。相應(yīng)地,SPL9/15的雙突變可打斷從幼態(tài)到成熟的轉(zhuǎn)變[4,9]。擬南芥的SPL2/10/11/13也在從幼態(tài)到開花的轉(zhuǎn)變中發(fā)揮作用[3]。正因?yàn)槿绱?,增加植株的糖分可以通過抑制MIR156的轉(zhuǎn)錄而加快生長時(shí)期的轉(zhuǎn)變[10]。
擬南芥有5 個(gè)MIR172基因,它們編碼的miR172 在營養(yǎng)期濃度較低、但在生殖期會(huì)積累到較高水平,而其APETALA2(AP2)-like 靶基因的轉(zhuǎn)錄本、特別是其蛋白產(chǎn)物的濃度會(huì)反方向變化[11-12]。特別是,MIR172D在頂端分生組織積累,而MIR172A/B積聚在葉的維管束,從而分別在短日照下通過年齡途徑和在長日照下通過光周期途徑去加速開花過程[13-14]。miR172水平過高會(huì)使擬南芥提前開花[11-12]。反過來,AP2-like靶基因的超表達(dá)抑制開花[11,15],而它們的功能失去突變導(dǎo)致過早開花[11,16-17]。MIR172基因的轉(zhuǎn)錄能被SPL蛋白激活[4],而miR172的積累水平在spl15的突變體里大大降低[18]。
蕨類植物的孢子體也有營養(yǎng)生長和生殖生長,而它們是否也由miR156 和miR172 調(diào)控不得而知。粗梗水蕨(Ceratopteris pteridoides)是一種水生的水龍骨蕨類[19-21],在配子體世代首先發(fā)育成絲狀體、然后發(fā)育成鏟狀雄性原葉體或者連指套狀兩性原葉體。粗梗水蕨孢子體的葉在營養(yǎng)期為通常的片狀,但在生殖期葉為條狀、其下表面長有孢子[22]。我們測定以及分析了粗梗水蕨營養(yǎng)期和生殖期的小RNA(sRNA),發(fā)現(xiàn)miR156 和miR172 以及它們的靶基因有和開花植物相似的積累模式。因此,miRNA 控制生長時(shí)期的轉(zhuǎn)變可能在二者的共同祖先即原始真葉植物里就已出現(xiàn)。
營養(yǎng)期的粗梗水蕨生長在無菌的MS 培養(yǎng)基中,28 ℃、16 h 光照。生殖期的植株位于培養(yǎng)缽中,25 ℃、連續(xù)光照、70%濕度。整株采集,營養(yǎng)期植株采集為受精3 周以后、因而無任何孢子發(fā)生;生殖期植株通過孢子囊的存在而確認(rèn),并在采集時(shí)去掉衰老的根和額外的葉。樣品先用液氮速凍,然后保存于-80 ℃,運(yùn)輸時(shí)用干冰。
總RNA用CTAB法提?。?3],18~30 nt RNA被切膠回收、接著先后連上5′和3′接頭、然后逆轉(zhuǎn)錄,最后通過PCR擴(kuò)增構(gòu)建文庫、并用Agilent 2100 Bioana?lyzer(Agilent Technologies,Waldbronn,Germany)和ABI StepOnePlus Real-Time PCR System(Applied Biosystems,CA,USA)進(jìn)行質(zhì)量檢測[24]。測序平臺(tái)為Hiseq 2000(Illumina,SanDiego,USA),測序公司為華大集團(tuán)(中國,深圳)。測序原理為邊合成邊測序,預(yù)期測序讀長為50 nt。測序數(shù)據(jù)編號(hào)為SRA022988(http://www.ncbi.nlm.nih.gov/Traces/sra)。
濾掉測序得分低的序列,并進(jìn)一步去掉含有接頭、少于18 nt、以及為polyA的序列,然后鑒定全長sRNA。用bowtie 程序(http://bowtie-bio.source?forge.net/index.shtml)查詢miRBase 數(shù)據(jù)庫(http://www.mirbase.org/ftp.shtml)以鑒定保守的miRNA,其中要求錯(cuò)配少于兩個(gè)、沒有間斷,并最后在RNAcentral 平臺(tái)(https://rnacentral.org/)逐個(gè)比對以及肉眼檢查。同樣查詢GenBank(tp://ftp.ncbi.nlm.nih.gov/genbank/)和Rfam(http://rfam.janelia.org/)以 鑒 定rRNA/scRNA/snoRNA/snRNA/tRNA,同時(shí)根據(jù)3′端2 個(gè)堿基的突出鑒定siRNA。最后用mireap(https://sourceforge.net/projects/mireap/)對剩下的sRNA 進(jìn)行新miRNA 預(yù)測。用psRobot(http://omicslab.genetics.ac.cn/psRobot/)和Target?Finder(https://github. com/carringtonlab/TargetFind?er)進(jìn)行miRNA靶基因預(yù)測,并取其并集作為最終結(jié)果。用DEGseq(http://www.r-project.org/)進(jìn)行表達(dá)差異分析,以qvalue<0.05和|log2FoldChange|>1為閾值。
營養(yǎng)期sRNA 測序產(chǎn)生了22 596 914 個(gè)原始序列,其中干凈序列有21 930 111 個(gè)、占比97.78%。生殖期測序產(chǎn)生了21 612 191 個(gè)干凈序列,占所有原始序列的94.20%。在營養(yǎng)期的干凈序 列 中,miRNA 占9.72%,rRNA/tRNA/snRNA/snoRNA 占47.95%,而剩下的42.31%未能被注釋(見圖1A)。生殖期情況類似。21 nt 的干凈序列最多,接著是20、24 nt的序列(見圖1B)。
圖1 干凈序列的統(tǒng)計(jì)A.營養(yǎng)期樣品干凈序列對應(yīng)的各種sRNAs的數(shù)目;B.2個(gè)樣品中干凈序列的長度分布Fig.1 Statistics of clean reads A.Clean reads corresponding to various sRNAs with sums in the vegetative sample;B.Length distribution of clean reads in the two samples
通過序列相似性分析鑒定了42 個(gè)保守的miRNA(見表1)。它們多數(shù)覆蓋了最佳匹配的90%以上,而只有包括miR394 和miR845 在內(nèi)的7個(gè)miRNA 覆蓋了最佳匹配的76%~86%。通過對RNAcentral 所有動(dòng)植物miRNA 的默認(rèn)參數(shù)比對,有14 個(gè)miRNA 能在比蕨類植物更早的苔蘚植物和石松植物里找到同源物,而剩下的絕大部分只能在種子植物里找到同源物。有12 個(gè)miRNA 只能找到1 個(gè)相似性匹配,而有著明確功能的miR?NA 能在多個(gè)物種里找到匹配。所有miRNA 在營養(yǎng)期和生殖期之間差異表達(dá),其中25 個(gè)miRNA 具有2 倍以上的差異。9 個(gè)miRNA 在營養(yǎng)期表達(dá)上調(diào),而更多的在生殖期表達(dá)上調(diào)(P<0.01)。
表1 兩個(gè)樣品中鑒定到的保守miRNATable 1 Conserved miRNAs identified in the two samples
miR319a-3p、 miR394a、 miR397、 miR3630-3p、miR4414a-5p 和miR7806 只在生殖期表達(dá),而miR408 和miR845b 只在營養(yǎng)期表達(dá)。最后,miR156、miR529 和miR535 有著同樣的靶基因(如下所述),而它們的差異表達(dá)也一樣,只是miR157有點(diǎn)例外。同樣,miR165和miR166有著近似的差異性表達(dá),而miR166 的變體之間,以及miR396 的變體之間也是如此。
我們也對這兩個(gè)時(shí)期進(jìn)行了轉(zhuǎn)錄組測序,這使得我們能夠分析以上miRNA 的靶基因及其表達(dá)。參照種子植物里miRNA和靶基因之間的對應(yīng)關(guān)系,我們發(fā)現(xiàn)粗梗水蕨的miR408 有3 個(gè)cupre?doxin靶基因和2個(gè)uclacyanin靶基因(見表2)。這些基因在生殖期表達(dá)上調(diào)、從而與對應(yīng)的miRNA反向水平表達(dá)。4 個(gè)SPL基因可被預(yù)測為miR156a、miR157d、miR529d 和miR535d 的 靶 位點(diǎn),且它們都在生殖期表達(dá)上調(diào)從而與所有相互作用的miRNA 反向水平表達(dá)。2 個(gè)NUCLEAR FACTOR Y(NF-YA)靶基因在生殖期表達(dá)上調(diào),而它們的5′端不翻譯區(qū)有miR169a-5p 的結(jié)合位點(diǎn)、并與之反向水平表達(dá)。一個(gè)LEAF CURLING RE?SPONSIVENESS(LCR)靶基因在生殖期的表達(dá)下調(diào)可能與此時(shí)miR394a 的表達(dá)上調(diào)有關(guān)。有3 個(gè)AP2-like 基因可能被miR172 靶向,只是其中2 個(gè)基因與miRNA 反向水平表達(dá)的同時(shí)、另一個(gè)與之正向水平表達(dá)。3 個(gè)LTR 逆轉(zhuǎn)座子的引物結(jié)合位點(diǎn)能被miR845 識(shí)別,并且二者之間表達(dá)水平反向。5 個(gè)class Ⅲhomeodomain leucine zipper(HDZIPIII)基因可被預(yù)測為miR166a-3p 和miR166m、但不是miR165a-3p 的靶位點(diǎn),不過二者都在生殖期表達(dá)上調(diào)。miR171a-5p 和它的一個(gè)SCARE?CROW-LIKE(SCL)靶基因同時(shí)在生殖期表達(dá)上調(diào)。miR160h 和它的3 個(gè)AUXIN RESPONSE FACTOR(ARF)靶基因,miR159c-5p 和它的2 個(gè)MYB靶基因也都同時(shí)在生殖期積累。miR319b和miR159有同樣的MYB靶基因,二者之間也是正向水平表達(dá)。miR397 和它的1 個(gè)cupredoxin 靶基因之間也無反向水平的表達(dá)。最后,在粗梗水蕨里沒有找到miR319 的TCP靶 基 因,miR167 的ARF靶 基 因,miR396 的GROWTNH-REGULATING FACTOR(GRF)靶基因,以及miR168 的Argonaute1(AGO1)靶基因。剩下的miRNA大部分缺乏靶基因方面的可信研究,故這里沒有對它們進(jìn)行探討。
表2 已知miRNAs靶基因的差異表達(dá)Table 2 Differential expression of target genes of known miRNAs
如前所述,miR390 在粗梗水蕨的生殖期有更高水平的積累,我們也從相應(yīng)的轉(zhuǎn)錄組里找到了它的初級(jí)轉(zhuǎn)錄本(見圖2A)。粗梗水蕨有2 個(gè)TAS3基因,一個(gè)是含有2 個(gè)串聯(lián)tasiR-ARF 的長的CpTAS3a,一個(gè)是只有1 個(gè)tasiR-ARF 的短的Cp?TAS3b。有24 225 個(gè)干凈序列及其對應(yīng)的288 個(gè)sRNA 可以對應(yīng)到CpTAS3a,而其中24 014 個(gè)干凈序列及226 個(gè)對應(yīng)的sRNA 位于它的2 個(gè)miR390互補(bǔ)位點(diǎn)之間(見圖2B)。這些sRNA 的長度在20~25 nt,而其中173 個(gè)(~60%)為21 nt。進(jìn)一步,4 個(gè)21 nt sRNA 可對應(yīng)33 個(gè)干凈序列、并且和3′端miR390 切割位點(diǎn)相位吻合;特別是其中1 個(gè)對應(yīng)著10 個(gè)干凈序列、并剛好位于5′D1(+)區(qū)域。最后,4 個(gè)sRNAs 與5′端miR390 切割位點(diǎn)相位吻合,并且其中一個(gè)剛好從切割位點(diǎn)起始。但是,沒有任何sRNA 對應(yīng)著CpTAS3a的2 個(gè)預(yù)測tasiRARF。不過,CpTAS3a的第1 個(gè)tasiR-ARF 與它的5′端miR390 切割位點(diǎn)相位吻合。在CpTAS3b中,有238 個(gè)sRNAs 位于2 個(gè)miR390 互補(bǔ)位點(diǎn)之間,8個(gè)sRNAs 與3′端的miR390 切割位點(diǎn)相位吻合、5個(gè)與5′端的miR390 切割位點(diǎn)相位吻合,并且有1個(gè)sRNA 位于5′D1(+)區(qū)域。最后,一個(gè)相位吻合的sRNA 在營養(yǎng)期有158 個(gè)對應(yīng)的干凈序列、在生殖期有154 個(gè)對應(yīng)的干凈序列,并且準(zhǔn)確落在了CpTAS3b預(yù)測的tasiR-ARF位點(diǎn)。
圖2 tasiR-ARF的鑒定A.MIR390 序列及miR390 和miR390*位點(diǎn);B.TAS3 序列及對應(yīng)sRNAs;Cp.Ceratopteris pteridoides;Cg.Cyrtomium guizhouense;Pn.Parathelyp?teris nipponica;和5′端miR390 切割位點(diǎn)相位吻合的sRNA 用前向箭頭表示;和3′端切割位點(diǎn)相位吻合的sRNA 用后向箭頭表示;CpTAS3b中對應(yīng)于tasiR-ARF的sRNA用紅色實(shí)線箭頭表示;CpTAS3a中可能的tasiR-ARF的sRNA用紅色虛線箭頭表示Fig.2 Characterization of tasiR-ARF A.MIR390 sequences with sites of miR390 and miR390*;B.TAS3 sequences with corresponding sRNAs;Cp.Ceratopteris pteridoides;Cg.Cyrtomium guizhouense;Pn.Parathelypteris nipponica;sRNAs in phase with the 5′cleavage site of miR390 were indicated by forward arrows and those with the 3′cleavage site by backward arrows;One sRNA corresponding to tasiR-ARF was indicated by a filled red arrow in CpTAS3b,and a putative sRNA corresponding tasiR-ARF was shown by a punctuated red arrow in CpTAS3a
Illumina HiSeq 儀器能檢測每個(gè)細(xì)胞中低至一個(gè)的分子,并且能同時(shí)檢測miRNA、siRNA、piR?NA、rRNA、tRNA 以 及mRNA 的 降 解 產(chǎn) 物[25]。sRNA 被界定為小于200 nt,而其中miRNA 為20~24 nt。植物中經(jīng)典的miRNA 為21 nt,它們被AGO1 蛋白復(fù)合體招募;長的miRNA 有24 nt,被AGO4 蛋 白 復(fù) 合 體 招 募[26-27]。siRNA 長 為24 nt,piRNA長為30 nt,而sRNA的峰值長度在動(dòng)物中為20 nt。我們的測序參數(shù)與這些經(jīng)驗(yàn)吻合(見圖1),因此粗梗水蕨營養(yǎng)期到生殖期轉(zhuǎn)變相關(guān)的miRNA可能就在所測的sRNA當(dāng)中。
基于序列相似性在粗梗水蕨中發(fā)現(xiàn)了多個(gè)保守miRNA,但是其中一些并沒有顯示很高的整體相似度,這可能是數(shù)據(jù)庫中沒有與之最近緣的。粗梗水蕨的miRNA 多數(shù)也見于種子植物,這可能與蕨類植物是它的姊妹類群、并且二者同屬于真葉植物有關(guān)[28-29]。粗梗水蕨的一些miRNA 只能在一個(gè)物種中找到匹配,所以它們可能是假陽性、從而沒有被收入到某些數(shù)據(jù)庫中[30-31]。其他蕨類植物研究沒有發(fā)現(xiàn)miR397,這可能是因?yàn)樗淮嬖谟谌~以外的組織;因此,它和miR845、miR894、miR394、miR172、miR168 以及smiR169 可能在陸地植物的進(jìn)化中首次出現(xiàn)于蕨類植物[32-33]。
miR156a、miR157d、miR529d 和miR535d 在粗梗水蕨中都靶向4個(gè)不同的SPL基因,并且前者幾乎都在生殖期表達(dá)下調(diào)而后者都在此時(shí)表達(dá)上調(diào);這與它們在種子植物中的情況非常相似,因此它們可能也參與蕨類植物從營養(yǎng)期到生殖期的轉(zhuǎn)變。鑒于生殖期表達(dá)下調(diào)的miRNA 顯著較少(見表1),這一點(diǎn)更令人信服。在小立碗蘚(Physcomi?trella patens)配子體的發(fā)育過程中,miR156 會(huì)逐漸積累而SPL靶基因受其影響同時(shí)表達(dá)下調(diào),這表明了該相互作用在配子體中有相反的方向[34]。并且,在更早期的地錢(Marchantia polymorpha)中,沒有miR156、而SPL受到物種特異性的miRNA 的控制[35]。miR172 不存在于苔蘚植物和石松植物,并且它對AP2-like 基因的調(diào)控可能首先出現(xiàn)在蕨類植物[32,36-37]。粗梗水蕨中miR172 在生殖期表達(dá)上調(diào),與此同時(shí)它的一些靶基因表達(dá)下調(diào),因此可能與miR156-SPL 一樣參與蕨類植物生長時(shí)期轉(zhuǎn)變的調(diào)控。值得指出的是,AP2-like 靶基因?qū)iR172 的反應(yīng)也可能是翻譯水平上的[11-12]。綜上所述,蕨類植物的孢子體可能在進(jìn)化中第1次同時(shí)使用了miR156 和miR172 去控制營養(yǎng)期到生殖期的轉(zhuǎn)變。miR171 和miR159 都在粗梗水蕨生殖期表達(dá)上調(diào),這和它們在種子植物中是miR156—SPL 相互作用的拮抗者和修飾者相一致[38-39]。如此看來,蕨類植物的營養(yǎng)期到生殖期的調(diào)控除了沒有導(dǎo)致開花之外,與被子植物基本相同。
miR160 在粗梗水蕨的生殖期積累,而它在番茄中超表達(dá)會(huì)造成向下的內(nèi)卷葉[40],這與粗梗水蕨的可育葉非常相似。并且,它的一個(gè)靶基因在生殖期表達(dá)下調(diào),而在擬南芥中它的靶基因的超表達(dá)會(huì)使葉向上卷[41]。粗梗水蕨中miR166 和miR319 在生殖期的表達(dá)上調(diào)也可能影響可育葉的卷曲[42]。miR394 在粗梗水蕨生殖期的表達(dá)上調(diào)可能調(diào)控葉的卷曲方向、也可能與脅迫應(yīng)答有關(guān)[43]。這是因?yàn)?,我們的營養(yǎng)期樣品生長在無菌培養(yǎng)基中,而生殖期樣品生長在開放的培養(yǎng)缽中。同樣,miR408、miR169、miR397 和miR845 的差異性表達(dá)可能源自試驗(yàn)中銅、氮和水供應(yīng)的不一致[44-48]。
粗梗水蕨的一個(gè)21 nt 的sRNA 受到多個(gè)干凈序列的支持,并且與TAS3b的3′端miR390 切割位點(diǎn)的相位吻合(見圖2)。這個(gè)sRNA的序列能與粗梗水蕨ARF2-like 基因高度互補(bǔ),并且這些基因確實(shí)在二者的結(jié)合位點(diǎn)受到了切割[29]。其他蕨類也有MIR390、TAS3,以及含有該結(jié)合位點(diǎn)的ARF2-like基因。因此,蕨類植物確實(shí)存在類似于種子植物的tasiR-ARF。ARF2-like 基因在苔蘚植物中受到其他分子的切割,而石松植物沒有MIR390、其ARF2-like 基因也沒有tasiR-ARF 結(jié)合位點(diǎn)[29]。因此,tasiR-ARF 可能只局限于真葉植物。TAS3a的一個(gè)預(yù)期切割物極其類似tasiR-ARF,只是可能在測序中沒有被檢測到(見圖2)。果真如此,則ta?siR-ARF 來源于不同長度版本的TAS3基因在真葉植物的祖先里就已出現(xiàn)。