萬平
(首都師范大學生命科學學院,北京 100048)
RNA編輯指通過替換、插入、缺失機制在RNA分子水平改變遺傳信息的生物學過程[1-3]。1986年,在錐體蟲的線粒體中首先發(fā)現(xiàn)RNA編輯現(xiàn)象[4]。1989年,在植物的線粒體中發(fā)現(xiàn)RNA編輯現(xiàn)象[5-7]。1991年,在植物的葉綠體中發(fā)現(xiàn)RNA編輯現(xiàn)象[8]。到目前為止,在真核生物、細菌、病毒中都已發(fā)現(xiàn)RNA編輯,但在古細菌中還沒有發(fā)現(xiàn)[9]。
植物中RNA編輯主要發(fā)生在進行光合作用的葉綠體和進行呼吸作用的線粒體這兩種細胞器中[10],植物RNA編輯類型主要有3種:C-to-U、U-to-C和A-to-I。C-to-U編輯發(fā)生在除苔類植物地錢之外的所有陸生植物中,U-to-C編輯只發(fā)生在從角苔到蕨類的少數(shù)非開花陸生植物中[11]。A-to-I編輯只在種子植物葉綠體 tRNA 中被觀察到[12,13]。
植物線粒體和葉綠體RNA編輯數(shù)目存在很大差別。被子植物葉綠體中RNA編輯位點數(shù)目遠低于線粒體RNA編輯位點數(shù)目[14]。盡管距發(fā)現(xiàn)植物RNA編輯現(xiàn)象已過去了20多年,但人們對于葉綠體和植物線粒體中RNA編輯的機理仍知之甚少[15,16]。
Thompson 等[17,18]采用(1)氨基酸轉移概率、(2)密碼子轉移概率、(3)編輯位點在密碼子中的位置、(4)編輯位點-1位置堿基出現(xiàn)頻率、(5)編輯位點+1位置堿基出現(xiàn)頻率5個特征預測植物線粒體C-to-U編輯,取得很好預測效果。本研究采用這5個特征,對非維管植物和維管植物線粒體和葉綠體RNA編輯進行比較研究,旨在為該方面研究提供參考。
非管植物和維管植物RNA編輯位點信息及基因組DNA序列下載自NCBI GenBank數(shù)據(jù)庫(表1)。
采用Perl腳本,對4 892個線粒體RNA編輯位點和1 228個葉綠體RNA編輯位點進行以下5個方面的分析:
表1 本研究所用數(shù)據(jù)集
(1)氨基酸轉移概率。計算公式如下:
其中,ai代表RNA編輯前編輯位點所在密碼子編碼的氨基酸;aj代表RNA編輯后編輯位點所在密碼子編碼的氨基酸;faiaj代表由編輯前密碼子編碼的氨基酸ai轉移為編輯后密碼子編碼的氨基酸aj出現(xiàn)的頻數(shù)。氨基酸共有20種。
(2)密碼子轉移概率。計算公式如下:
其中,codoni代表RNA編輯前編輯位點所在密碼子;codonj代表RNA編輯后編輯位點所在密碼子;fcodonicodonj代表由編輯前密碼子codoni轉移為編輯后密碼子codonj出現(xiàn)的頻數(shù)。密碼子共有64種。
(3)編輯位點在密碼子中出現(xiàn)位置概率。編輯位點在密碼子中可能出現(xiàn)的位置分別為1、2、3,統(tǒng)計編輯位點出現(xiàn)在密碼子中每個位置上的概率。
(4)編輯位點-1位堿基組成。統(tǒng)計編輯位點上游-1位置出現(xiàn)A、U、C、G四種堿基的概率。
(5)編輯位點+1位堿基組成。統(tǒng)計編輯位點下游+1位置出現(xiàn)A、U、C、G四種堿基的概率。
樣本概率分布差異檢驗采用R語言工具包(http://www.r-project.org/)中Mann-Whitney檢驗方法。
RNA編輯前后,編輯位點所在密碼子編碼的氨基酸種類通常會發(fā)生轉變,被稱為氨基酸轉移。在RNA編輯中,不同氨基酸發(fā)生轉移的概率不同。結果顯示,非維管植物(角苔)中脯氨酸到亮氨酸(P>L)、絲氨酸到苯丙氨酸(S>F)的轉移概率較高(圖1-A)。而維管植物中脯氨酸到亮氨酸(P>L)和絲氨酸到亮氨酸(S>L)氨基酸轉移概率較高(圖1-B和 1-C)。
圖1 植物線粒體和葉綠體RNA編輯的氨基酸轉移概率
Mann-Whitney檢驗結果表明,在非維管植物和蕨類植物中,線粒體和葉綠體RNA編輯在氨基酸轉移概率都沒有顯著差別(p值分別為0.816 6和0.099 98),而被子植物線粒體和葉綠體在氨基酸轉移概率方面存在顯著差異(p值為0.042 94)。
RNA編輯前后,編輯位點所在密碼子的種類也有可能發(fā)生轉變,這種轉變被稱為密碼子轉移。在RNA編輯中,不同密碼子發(fā)生轉移的概率不同。非維管植物(角苔)中密碼子UCA>UUA和UCU>UUU的轉移概率較高(圖2-A)。蕨類植物的線粒體RNA編輯中,密碼子CGG>UGG和UCC>UUC的轉移概率較高;而蕨類植物葉綠體RNA編輯中,密碼子ACG>AUG和UCA>UUA中的轉移概率較高(圖2-B)。被子植物中,密碼子UCA>UUA的轉移概率都很高(圖2-C),但線粒體密碼子轉移的種類(57種)遠多于葉綠體密碼子轉移的種類(10種),并且也多于非維管植物(角苔)(43種)和蕨類植物(35種)中線粒體密碼子轉移的種類。
Mann-Whitney檢驗結果表明,在非維管植物和蕨類植物中,線粒體和葉綠體RNA編輯在密碼子轉移概率方面都沒有顯著差別(p值分別為0.221 2和0.181 4),而被子植物線粒體和葉綠體在密碼子轉移概率方面存在顯著差異(p值為5.989 e-9)。
編輯位點在密碼子中的3個位置都有可能出現(xiàn),但在非維管植物和維管植物線粒體和葉綠體RNA編輯中,編輯位點在密碼子第2位出現(xiàn)的概率都很高(圖3)。Mann-Whitney檢驗結果表明,植物線粒體和葉綠體RNA編輯位點在密碼子中出現(xiàn)位置不存在顯著差異。
圖2 植物線粒體和葉綠體RNA編輯的密碼子轉移概率
圖3 植物線粒體和葉綠體RNA編輯編輯位點在密碼子中的位置
植物線粒體和葉綠體RNA編輯中,4種堿基在編輯位點-1位都有可能出現(xiàn),但尿嘧啶(U)和胞嘧啶(C)出現(xiàn)在編輯位點-1位的概率較高(圖4)。Mann-Whitney檢驗結果表明,植物線粒體和葉綠體RNA編輯在編輯位點-1位堿基出現(xiàn)概率方面不存在顯著差異。
植物線粒體和葉綠體RNA編輯中,4種堿基在編輯位點+1位都有可能出現(xiàn)(圖5)。非維管植物中U和C出現(xiàn)概率較高(圖5-A);蕨類植物中C和G出現(xiàn)概率較高(圖5-B);被子植物中A和G出現(xiàn)概率較高(圖5-C)。Mann-Whitney檢驗結果表明,非維管植物和維管植物植物線粒體和葉綠體RNA編輯在編輯位點+1位堿基出現(xiàn)概率方面都不存在顯著差異。
圖4 植物線粒體和葉綠體RNA編輯編輯位點-1位堿基出現(xiàn)概率
圖5 植物線粒體和葉綠體RNA編輯編輯位點+1位堿基出現(xiàn)概率
植物線粒體RNA編輯位點的數(shù)目大約是葉綠體RNA編輯位點數(shù)目的10倍,但目前人們還不知道為什么植物線粒體RNA編輯位點數(shù)目遠多于葉綠體RNA 編輯位點數(shù)目[19]。
已發(fā)現(xiàn)在植物線粒體中存在兩套tRNA:第一套由線粒體基因組編碼,第二套由核基因組編碼,經(jīng)細胞質輸入到線粒體[20]。而在葉綠體中,所有tRNA 都是由葉綠體基因組編碼[21,22]。然而,在已測序的葉綠體tRNA或tRNA基因中,與密碼子CUU/C(Leu),CCU/C(Pro),GCU/C(Ala)和 CGC/A/G(Arg)互補的反密碼子tRNA都沒有被發(fā)現(xiàn)[12]。
本研究發(fā)現(xiàn),被子植物線粒體和葉綠體RNA編輯在密碼子轉移概率方面存在顯著差異,葉綠體RNA編輯中密碼子轉移的種類(10種)遠少于線粒體中密碼子轉移的種類(57種)。產(chǎn)生這種現(xiàn)象的原因很可能是由于葉綠體中tRNA種類不全造成的,而被子植物線粒體和葉綠體RNA編輯在氨基酸轉移概率方面的顯著差異可能也是由于葉綠體中tRNA種類不全間接導致的。
另外,已發(fā)現(xiàn)有兩個蛋白家族:PPR和MORF參與RNA編輯[23],蛋白家族中不同成員分別參與葉綠體和線粒體RNA編輯過程。參與葉綠體和線粒體RNA編輯過程的PPR蛋白的種類和數(shù)目可能也是導致葉綠體和線粒體RNA編輯在氨基酸轉移概率和密碼子轉移概率方面存在顯著差異原因。
植物RNA編輯機理仍是一個未解之謎,葉綠體中tRNA的種類為何不完整,以及除PPR和MORF家族外是否還有其他蛋白家族參與植物RNA編輯,這些問題需要進一步深入的研究。
被子植物線粒體和葉綠體RNA編輯在氨基酸轉移概率、密碼子轉移概率方面存在顯著差異。
[1] Gott JM. Expanding genome capacity via RNA editing[J].Comptes Rendus Biologies, 2003, 326(10-11):901-908.
[2] Brennicke A, Marchfelder A, Binder S. RNA editing[K]. FEMS Microbiol Rev, 1999, 23(3):297-316.
[3] Knoop V. When you can’t trust the DNA:RNA editing changes transcript sequences[J]. Cell Mol Life Scie, 2011, 68:1-20.
[4] Benne R, Van den Burg J, Brakenhoff JP, et al. Major transcript of the frameshifted coxII gene from trypanosome mitochondria contains four nucleotides that are not encoded in the DNA[J]. Cell, 1986,46(6):819.
[5] Covello PS, Gray MW. RNA editing in plant mitochondria[J].Nature, 1989, 341:662-666.
[6] Hiesel R, Wissinger B, Schuster W, Brennicke A. RNA editing in plant mitochondria[J]. Science, 1989, 246:1632-1634.
[7] Gualberto JM, Lamattina L, Bonnard G, et al. RNA editing in wheat mitochondria results in the conservation of protein sequences[J].Nature, 1989, 341(6243):660-662.
[8] Hoch B, Maier RM, Appel K, et al. Editing of a chloroplast mRNA by creation of an initiation codon[J]. Nature, 1991, 353:178-180.
[9] Grosjean H. Modification and editing of RNA:historical overview and important facts to remember[J]. Topics in Current Genetics,2005, 12:1-22.
[10] Chateigner-Boutin AL. Plant RNA editing[J]. RNA Biology,2010, 7(2):213-219.
[11] Freyer R, Kiefer-Meyer MC, K?ssel H. Occurrence of plastid RNA editing in all major lineages of land plants[J]. PNAS, 1997, 94(12):6285- 6290.
[12] Pfitzinger H, Weil JH, Pillay DTN, Guillemaut P. Codon recognition mechanisms in plant chloroplasts[J]. Plant Molecular Biology,1990, 14(5):805-814.
[13] Delannoy E, Le Ret M, Faivre-Nitschke E, et al.ArabidopsistRNA adenosine deaminase arginine edits the wobble nucleotide of chloroplast tRNAArg(ACG)and is essential for efficient chloroplast translation[J]. The Plant Cell, 2009, 21(7):2058-2071.
[14] Gray MW. RNA editing in plant mitochondria:20 years later[J].IUBMB Life, 2009, 61(12):1101-1104.
[15] Kotera E, Tasaka M, Shikanai T. A pentatricopeptide repeat protein is essential for RNA editing in chloroplasts[J]. Nature, 2005,433(7023):326-330.
[16] Fujii S, Small I. The evolution of RNA editing and pentatricopeptide repeat genes[J]. New Phytol, 2011, 191(1):37-47.
[17] Thompson J, Gopal S. Genetic algorithm learning as a robust approach to RNA editing site prediction[J]. BMC Bioinformatics,2006, 7(1):145.
[18] Thompson J, Gopal S. Correction:genetic algorithm learning as a robust approach to RNA editing site prediction[J]. BMC Bioinformatics, 2006, 7(1):406.
[19] Gray MW. Evolutionary origin of RNA editing[J]. Biochemistry,2012, 51(26):5235-5242.
[20] Marechal-Drouard L, Weil JH, Guillemaut P. Import of several tRNAs from the cytoplasm into the mitochrondria in beanPhaseolus vulgaris[J]. Nucl Acids Res, 1988, 16(11):4777-4788.
[21] Ohyama K, Fukuzawa H, Kohchi T, et al. Chloroplast gene organization deduced from complete sequence of liverwortMarchantia polymorphachloroplast DNA[J]. Nature, 1986, 322:572-574.
[22] Shinozaki K, Ohme M, Tanaka M, et al. The complete nucleotide sequence of the tobacco chloroplast genome:its gene organization and expression[J]. The EMBO Journal, 1986, 5(9):2043-2049.
[23] Takenaka M, Zehrmann A, Verbitskiy D, et al. Multiple organellar RNA editing factor(MORF)family proteins are required for RNA editing in mitochondria and plastids of plants[J]. PNAS, 2012,109(13):5104-5109.