丁安明,李凌,屈旭,孫亭亭,陳雅瓊,宗鵬,李尊強,龔達平,孫玉合
1.中國農(nóng)業(yè)科學院煙草研究所,煙草行業(yè)煙草基因資源利用重點實驗室,青島 266100;2.大理州煙草公司彌渡縣公司,大理 675600;3.牡丹江煙草科學研究所,牡丹江 157011
典型的 PPR(Pentatricopeptide repeats)蛋白包含2~27個串聯(lián)重復(fù)的含有35個氨基酸殘基的PPR或PPR相關(guān)結(jié)構(gòu)域; 在其序列N端一般含有長度可變、不保守的細胞器定位序列; 部分序列 C端還含有1~3個非 PPR 結(jié)構(gòu)域-E、E-E+或 E-E+-DYW[1~3]。PPR基因家族在植物特別是陸生植物中廣泛存在[1],其在植物生長發(fā)育過程中發(fā)揮著廣泛而且至關(guān)重要的作用,例如參與線粒體和葉綠體基因轉(zhuǎn)錄后加工(包括 RNA編輯、剪接、剪切、翻譯和降解等)、調(diào)控細胞質(zhì)雄性不育相關(guān)基因的表達、參與調(diào)控胚胎形成和植物生長發(fā)育等[2,4~6]。
第一個PPR基因由 Manthey等[7]在釀酒酵母(Saccharomyces cerevisiaeL.)中發(fā)現(xiàn); 第一個植物PPR基因為玉米(Zea maysL.)crp1[8]。隨后,大量PPR基因通過其突變體被鑒定出來。2000年,Small和Peeters[9]在對擬南芥(Arabidopsis thalianaL.)進行全基因組分析時發(fā)現(xiàn),具有 PPR結(jié)構(gòu)特點的基因組成一個基因家族,并將其命名為PPR基因家族以方便對其進行描述。之后,該研究組對擬南芥 PPR基因家族進行了系統(tǒng)分析,預(yù)測和鑒定了擬南芥基因組441個PPR編碼基因,并研究了其組織結(jié)構(gòu)、亞細胞定位和表達特點等[1]。當前,在植物中鑒定基因家族的方法主要有分子生物學和生物信息學兩種。隨著多個真核生物基因組計劃和基因注釋工作的完成,生物信息學策略雖然存在假陽性較高的缺點,但利用其對基因家族成員進行功能鑒定和預(yù)測,對分子生物學實驗具有重要的指導(dǎo)意義。目前,已經(jīng)對超過 18個已完成測序的植物物種進行了全基因組PPR基因家族分析[10],其中含有PPR基因數(shù)目最多的陸生植物是大豆(Glycine maxL.),有629個; 最少的是蒺藜狀苜蓿(Medicago truncatulaL.),有365個(苔蘚植物除外)。此外,研究發(fā)現(xiàn)PPR基因家族的一大特點是其在原核生物中不存在,相對于其他真核生物,在陸生植物中的數(shù)目尤為巨大,例如擬南芥和水稻(Oryza sativaL.)分別含有450和477個成員,而人(Homo sapiensL.)、線蟲(Caenorhab diti selegansL.)和果蠅(DrosophilaL.)則分別只有6、2和2個成員[1]。PPR結(jié)構(gòu)域在植物之間是高度保守的,均為35個氨基酸的重復(fù)基序,基序內(nèi)高度保守的氨基酸殘基使每一個 PPR結(jié)構(gòu)域形成一對 α-螺旋[9],這為利用生物信息學手段進行該家族的同源預(yù)測提供了依據(jù)。
番茄(Solanum lycopersicumL.)不僅是重要的蔬菜,也是分子生物學研究的模式植物,具有很高的經(jīng)濟價值和抗癌等藥用價值。2012年,番茄基因組測序計劃完成[11],為PPR基因家族的全基因組生物信息學分析奠定了基礎(chǔ)。迄今,筆者尚未見有關(guān)番茄PPR基因家族成員的研究報道。鑒于PPR基因家族的重要生理功能,將其從番茄基因組鑒定出來,可為PPR基因的克隆和研究其對番茄的生長發(fā)育調(diào)控等提供參考。
在番茄基因組數(shù)據(jù)庫ITAG(ftp://ftp.solgenomics.net/tomato_genome)下載已測序完成的番茄基因組序列、預(yù)測蛋白質(zhì)序列(共 34727條)及基因注釋信息。在網(wǎng)站 ftp://ftp.sgn.cornell.edu/unigene_builds/Tomato.seq下載番茄轉(zhuǎn)錄組數(shù)據(jù)庫。
在 Pfam26.0[12](http://pfam.sanger.ac.uk/)下載 PPR種子序列(PF01535),利用隱馬爾科夫模型(profile hidden Markov models,profile HMMs)軟件 HMMER 3.0[13]檢索番茄基因組功能注釋的34727條蛋白質(zhì)序列。共得到483條候選序列。利用以擬南芥PPR基因家族的 P(PPR)、L、L2、S、E、E+和 DYW 7個保守結(jié)構(gòu)域定義的HMMER矩陣(HMMER matrices,由Small Ian教授提供)對483條序列進行結(jié)構(gòu)域檢索,并人工逐條序列進行結(jié)構(gòu)分析和分類。Hmmsearch的E值設(shè)置< e-10。
PPR蛋白通常含有2~27個PPR相關(guān)結(jié)構(gòu)域,且不包含 7個結(jié)構(gòu)域之外的結(jié)構(gòu)域。因此,對結(jié)構(gòu)分析中只含有一個PPR結(jié)構(gòu)域的序列和含有其他結(jié)構(gòu)域的序列進行檢查。在NCBI進行Blastp分析,獲得相應(yīng) PPR序列的相似序列,在番茄基因組(http://solgenomics.net/gbrowse/bin/gbrowse/ITAG2.3_genomic/)中截取相應(yīng)基因區(qū)域約 10 kb核酸序列,利用 SoftBerry FGENESH+(http://linux1.softberry.com/berry.phtml/)軟件進行基于序列相似性的基因結(jié)構(gòu)預(yù)測。最后,只含有一個 P結(jié)構(gòu)域的序列被去除,對含有其他結(jié)構(gòu)域的序列進行了修改。
根據(jù)序列結(jié)構(gòu)分析的結(jié)果,將番茄PPR基因家族7個保守結(jié)構(gòu)域的全部序列分別經(jīng)ClustalW[14]比對后,利用HMMER 3.0的hmmbuild程序構(gòu)建各個結(jié)構(gòu)域的 HMMER矩陣,在此基礎(chǔ)上,利用hmmemit程序獲得各結(jié)構(gòu)域的保守序列。
鑒定的番茄PPR蛋白序列利用ClustalW進行序列比對,默認參數(shù)設(shè)置。然后利用 MEGA 5[15]構(gòu)建鄰接樹(NJ),設(shè)置Bootstrap為500次重復(fù)。
根據(jù)PPR編碼基因在ITAG上的物理位置,利用 Genomepixelizer[16]軟件將其定位在番茄 12條染色體上,并繪制圖譜。
利用信號肽序列預(yù)測程序Predotar[17]和TargetP[18]分別對番茄471條PPR蛋白序列進行N端信號肽預(yù)測。
利用Blastx程序?qū)⒎艳D(zhuǎn)錄組數(shù)據(jù)庫與預(yù)測的PPR蛋白序列進行比對,E值設(shè)置為< e-30,獲得PPR基因家族的表達信息。
利用AgBase v2.00[19](http://agbase.msstate.edu/index.html)的相應(yīng)程序?qū)Ψ?PPR蛋白進行GO分析。首先,利用Goanna對番茄PPR蛋白進行Blastp分析,數(shù)據(jù)庫選擇 Uniprot; 然后,利用 Goanna2ga程序?qū)a(chǎn)生的比對結(jié)果轉(zhuǎn)換為基因關(guān)聯(lián)文件(gene association file); 其次,利用Goslim Viewer產(chǎn)生蛋白功能注釋概要; 最后,將所得數(shù)據(jù)拷貝到Excel作圖。
本研究在番茄 34727條蛋白序列中鑒定了 483條PPR蛋白候選序列。在對其進行蛋白結(jié)構(gòu)分析和讀碼框分析后,11條序列被鑒定只含有一個P結(jié)構(gòu)域,最終被去除; 12條包含其他結(jié)構(gòu)域的序列被修改; 2條序列(03g063370和03g063380)合并為一條序列。因此,本研究共在番茄基因組中鑒定了 471條PPR蛋白序列。
序列結(jié)構(gòu)分析表明,番茄 PPR基因家族分為 P和 PLS兩個亞家族,其中 P亞家族有 233條序列,PLS亞家族有238條。PLS亞家族又分成PLS、E、E+和DYW四類,分別有13、83、54和88條序列。所有蛋白序列及其結(jié)構(gòu)見附表1。
利用番茄各結(jié)構(gòu)域的序列及PF01535的PPR序列,獲得了各結(jié)構(gòu)域的保守序列,并對 PPR相關(guān)序列進行了比較(圖1)。
PPR相關(guān)結(jié)構(gòu)域比較結(jié)果表明,PF01535的保守序列與番茄P、L、S和L2結(jié)構(gòu)域高度相似,其與番茄P結(jié)構(gòu)域相比只包含6個非保守氨基酸殘基的變化; PPR相關(guān)結(jié)構(gòu)域均包含一對α-螺旋[9],高度保守的氨基酸殘基有利于該結(jié)構(gòu)的形成。從圖1還可以看出,P與S結(jié)構(gòu)域較L和L2保守性更高,因此,在進行結(jié)構(gòu)域分析時,二者會產(chǎn)生大量重疊。為解決這一問題,根據(jù) PPR蛋白的類型、結(jié)構(gòu)域排列方式和序列匹配得分,對每條序列進行了人工分析。
本研究中,番茄50.5%的PPR蛋白以P-L-S串聯(lián)重復(fù)為組織方式,且其94.5% 序列C端均含有非PPR結(jié)構(gòu)域。保守序列分析表明,番茄E、E+和DYW結(jié)構(gòu)域分別含有76、31和95個氨基酸殘基(圖2),分別存在于225、142和88條PPR序列中。
通常PPR蛋白包含2~27個串聯(lián)重復(fù)的PPR結(jié)構(gòu)域或PPR相關(guān)結(jié)構(gòu)域,平均每條PPR序列含有12個該類結(jié)構(gòu)域[1]。在番茄中,共在 471條 PPR蛋白中鑒定了5600個PPR相關(guān)結(jié)構(gòu)域,平均每條序列含有11.9個。
本研究鑒定的番茄471條PPR蛋白序列所構(gòu)建的系統(tǒng)進化樹如圖2所示。P亞家族和PLS亞家族分別在進化樹兩端聚集成簇。PLS亞家族又分成 4個分支,分別為PLS亞家族的PLS、E、E+和DYW四類。
圖1 番茄PPR蛋白7個結(jié)構(gòu)域的保守序列及PPR相關(guān)序列比較
番茄平均每條染色體含有40個PPR基因,但整個基因家族在各個染色體上的數(shù)目差異較大,其中,第Ⅰ、Ⅱ和Ⅲ號染色體含有的PPR基因數(shù)目顯著多于平均值; 第Ⅴ、Ⅷ、Ⅹ和Ⅻ號染色體上的基因數(shù)目只有約 20個,例如在第Ⅻ號染色體上含有 18個成員,而在Ⅰ號染色體上有69個(表1)。每個亞類型成員數(shù)目的分布差異也很大,例如E+亞類型在第Ⅹ號染色體上含有 1個成員,而在第Ⅱ號染色體上有10個; DYW亞類型在第Ⅷ和Ⅻ號染色體上含有3個成員,而在第Ⅰ和Ⅲ號染色體上分別有14和12個。
與番茄抗病基因[20]相比,PPR編碼基因多不明顯成簇存在。事實上,在很多染色體內(nèi)部,該基因家族成員也密集集中于某些染色體區(qū)域,該現(xiàn)象在第Ⅰ、Ⅱ、Ⅲ和Ⅺ號染色體上尤為明顯(圖3)。
圖2 番茄PPR基因家族的進化分析
表1 番茄12條染色體上PPR編碼基因的數(shù)目
圖3 PPR基因在番茄12條染色體上的分布
如圖4所示,利用Predotar程序預(yù)測,約60%的PPR蛋白定位于線粒體或葉綠體,利用TargetP程序預(yù)測得到了相似的結(jié)果。P亞家族和PLS亞家族的E、E+定位于線粒體序列數(shù)遠多于定位于葉綠體的序列數(shù); PLS則剛好相反; DYW定位于線粒體和葉綠體的序列數(shù)目相當。此外,PLS亞家族中,除DYW外,未檢測到信號肽的序列數(shù)目顯著多于P亞家族。
通過Blastx比對,為471個PPR編碼基因的433個找到了EST證據(jù)。未能找到EST表達證據(jù)的序列可能尚未被研究或者已進化為假基因。
對番茄PPR基因進行GO分析,以了解其在番茄生長發(fā)育過程中的作用(圖5)。在分子功能上,約70%的PPR基因具有 RNA結(jié)合活性,少數(shù)具有DNA結(jié)合活性。在生物過程類別中,PPR基因主要參與包含堿基復(fù)合體的催化過程、有機體發(fā)育過程、代謝和細胞學過程; 部分PPR基因還參與了脅迫反應(yīng)、胚胎發(fā)育、授粉和生長過程等。在細胞組成類別中,大多數(shù)PPR基因(66%)是線粒體或葉綠體組分。
隨著多個物種基因組計劃的完成,從全基因組層面鑒定和研究基因家族的分類、序列特點、進化特征和功能預(yù)測等已成為生物學領(lǐng)域所關(guān)注的重要問題。PPR基因家族在植物生長發(fā)育過程中發(fā)揮著至關(guān)重要的作用,是當前生物學研究的熱點。2012年,番茄基因組計劃完成,使其全基因組 PPR編碼基因的鑒定成為可能。本研究預(yù)測番茄基因組可能含有471個PPR編碼基因,但這一數(shù)目只是初步預(yù)測的結(jié)果,可能隨著PPR基因的克隆和基因組注釋工作的完善而變化。
圖4 利用Predotar程序預(yù)測PPR基因家族的亞細胞定位
圖5 番茄PPR基因的GO分析
與其他植物一樣,番茄PPR基因家族分為P和PLS兩個亞家族,PLS亞家族又分為PLS、E、E+和DYW 四類。兩個亞家族成員各占序列數(shù)目的約一半。PPR蛋白的各個結(jié)構(gòu)域在植物之間高度保守。系統(tǒng)進化分析顯示,不同類型的PPR基因分別聚集成簇。研究發(fā)現(xiàn),PPR基因家族在維管植物中數(shù)目得到巨大擴增,且PLS亞家族為陸生植物特有[1,10]。由此,人們推測 PPR基因家族可能在進化到陸生植物或者維管植物時發(fā)生了大規(guī)模復(fù)制擴增; PLS亞家族可能由P亞家族突變起源[1],其序列C端非PPR結(jié)構(gòu)域的獲得和擴增可能是功能進化的需要,例如適應(yīng)植物中 RNA編輯或剪切位點的增加[26]。PPR編碼基因的一大結(jié)構(gòu)特點大多無內(nèi)含子結(jié)構(gòu),例如擬南芥和水稻PPR基因家族約80%的序列無內(nèi)含子結(jié)構(gòu); 相反,低等植物苔蘚基因組約80%的PPR基因是含有內(nèi)含子的[1,2]。本研究中,番茄約 60%的PPR基因無內(nèi)含子。研究認為,PPR基因家族起源于反轉(zhuǎn)錄轉(zhuǎn)座事件,即祖先PPR基因(有內(nèi)含子)轉(zhuǎn)錄并被加工為成熟RNA后經(jīng)反轉(zhuǎn)錄成為雙鏈DNA(無內(nèi)含子),插入基因組形成無內(nèi)含子的拷貝; 重復(fù)發(fā)生的反轉(zhuǎn)錄轉(zhuǎn)座形成了龐大的基因家族,并丟失了內(nèi)含子[27,28]。因此,PPR基因家族與成簇存在的抗病基因家族不同,在染色體上無明顯的簇集現(xiàn)象。
每個PPR結(jié)構(gòu)域可形成一對反向平行的α-螺旋,多個PPR結(jié)構(gòu)域通過形成超螺旋結(jié)構(gòu)結(jié)合RNA,參與線粒體或葉綠體RNA加工過程[9,29]。通過計算機程序預(yù)測和表達PPR基因編碼區(qū)或可能的信號區(qū)與綠色熒光蛋白基因(GFP)的融合蛋白發(fā)現(xiàn),擬南芥大部分 PPR蛋白定位在線粒體或葉綠體[1]。本研究利用Predotar和TargetP將番茄約60%的PPR序列定位在線粒體或葉綠體; 3%的序列有信號序列,但定位不明確。確切的亞細胞定位還需進一步表達番茄PPR基因與GFP基因的嵌合蛋白進行驗證,但不排除定位于其他亞細胞結(jié)構(gòu)的可能性。例如,在擬南芥中就發(fā)現(xiàn) PPR蛋白 GRP23定位于細胞核,與RNA聚合酶II作用,調(diào)控轉(zhuǎn)錄[30]。經(jīng)序列比對發(fā)現(xiàn),番茄Solyc01g103160與GRP23相似度為56%,但二者 N端信號序列差異較大,信號肽預(yù)測軟件將Solyc01g103160定位于線粒體,二者功能是否相似,有待于對其進行克隆和進一步功能分析確定。另外,有 38%的序列未檢測到信號序列,可能與預(yù)測軟件本身的可靠性和基因功能注釋的準確性有關(guān),需要進一步完善。目前鑒定的絕大多數(shù)PPR蛋白均參與RNA加工,如編輯、剪切等。GO分析發(fā)現(xiàn),番茄66%的PPR蛋白是線粒體或葉綠體組分; 70%的PPR蛋白具有RNA結(jié)合活性,少量具有DNA結(jié)合活性,參與核酸加工過程。
附表1見www.chinagene.cn。
[1]Lurin C,Andres C,Aubourg S,Bellaoui M,Bitton F,Bruyere C,Caboche M,Debast C,Gualberto J,Hoffmann B,Lecharny A,Le Ret M,Martin-Magniette ML,Mireau H,Peeters N,Renou JP,Szurek B,Taconnat L,Small I.Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis.Plant Cell,2004,16(8):2089–2103.
[2]Saha D,Prasda AM,Srinivasan R.Pentatricopeptide repeat proteins and their emerging roles in plants.Plant Physiol Biochem,2007,45(8):521–543.
[3]Schmitz-Lnneweber C,Small I.Pentatricopeptide repeat proteins:a socket set for organelle gene expression.Trends Plant Sci,2008,13(12):663–670.
[4]Wang Z,Zou Y,Li X,Zhang Q,Chen L,Wu H,Su D,Chen Y,Guo J,Luo D,Long Y,Zhong Y,Liu YG.Cytoplasmic male sterility of rice with boro II cytoplasm is caused by a cytotoxic peptide and is restored by two related PPR motif genes via distinct modes of mRNA silencing.Plant Cell,2006,18(3):676–687.
[5]徐相波,邱登林,孫永堂,王守經(jīng),孫桂芝,李新華.PPR基因家族的研究進展.遺傳,2006,28(6):726–730.
[6]何鵬,陳海燕,俞嘉寧.PPR蛋白參與RNA編輯機制的研究進展.西北植物學報,2013,33(2):415–421.
[7]Manthey GM,McEwen JE.The product of the nuclear gene PET309 is required for translation of mature mRNA and stability or production of intron-containing RNAs derived from the mitochondrial COX1 locus of Saccharomyces cerevisiae.EMBO J,1995,14(16):4031–4043.
[8]Barkan A,Walker M,Nolasco M,Johnson D.A nuclear mutation in maize blocks the processing and translation of several chloroplast mRNAs and provides evidence for the differential translation of alternative mRNA forms.EMBO J,1994,13(13):3170–3181.
[9]Small ID,Peeters N.The PPR motif-a TPR-related motif prevalent in plant organellar proteins.Trends Biochem Sci,2000,25(2):46–47.
[10]Fujii S,Small I.The evolution of RNA editing and pentatricopeptide repeat genes.New Phytologist,2011,191(1):37–47.
[11]Tomato Genome Consortium.The tomato genome sequence provides insights into fleshy fruit evolution.Nature,2012,485(7400):635–641.
[12]Punta M,Coggill PC,Eberhardt RY,Mistry J,Tate J,Boursnell C,Pang N,Forslund K,Ceric G,Clements J,Heger A,Holm L,Sonnhammer ELL,Eddy SR,Bateman A,Finn RD.The Pfam protein families database.Nucleic Acids Res,2012,40(D1):D290–D301.
[13]Finn RD,Clements J,Eddy SR.HMMER web server:interactive sequence similarity searching.Nucleic Acids Res,2011,39(Web Server issue):W29–W37.
[14]Thompson JD,Higgins DG,Gibson TJ.CLUSTALW:improving the sensitivity of progressive multiple sequence alignment through sequence weighting,position-specific gap penalties and weight matrix choice.Nucleic Acids Res,1994,22(22):4673–4680.
[15]Tamura K,Peterson D,Peterson N,Stecher G,Nei M,and Kumar S.MEGA5:molecular evolutionary genetics analysis using maximum likelihood,evolutionary distance,and maximum parsimony methods.Mol Biol Evol,2011,28(10):2731–2739.
[16]Kozik A,Kochetkova E,Michelmore R.GenomePixelizer-a visualization program for comparative genomics within and between species.Bioinformatics,2002,18(2):335–336.
[17]Small I,Peeters N,Legeai F,Lurin C.Predotar:a tool for rapidly screening proteomes for N-terminal targeting sequences.Proteomics,2004,4(6):1581–1590.
[18]Emanuelsson O,Nielsen H,von Heijne G.ChloroP,a neural network-based method for predicting chloroplast transit peptides and their cleavage sites.Protein Sci,1999,8(5):978–984.
[19]McCarthy FM,Gresham CR,Buza TJ,Chouvarine P,Pillai LR,Kumar R,Ozkan S,Wang H,Manda P,Arick T,Bridges SM,Burgess SC.AgBase:supporting functional modeling in agricultural organisms.Nucleic Acids Res,2011,39(Database issue):D497–D506.
[20]Lozano R,Ponce O,Ramirez M,Mostajo N,Orjeda G.Genome-wide identification and mapping of NBS-encoding resistance genes inSolanumtuberosumgroup phureja.PLoS ONE,2012,7(4):e34775.
[21]Cui X,Wise RP,Schnable PS.Therf2nuclear restorer gene of malesterile T-cytoplasm maize.Science,1996,272(5266):1334-1336.
[22]Itabashi E,Iwata N,Fujii S,Kazama T,Toriyama K.The fertility restorer gene,Rf2,for Lead Rice-type cytoplasmic male sterility of rice encodes a mitochondrial glycine-rich protein.Plant J,2011,65(3):359–367.
[23]Fujii S,Toriyama K.Suppressed expression of Retrograde-Regulated Male Sterility restores pollen fertility in cytoplasmic male sterile rice plants.Proc Natl Acad Sci USA,2009,106(23):9513-9518.
[24]Bentolila S,Alfonso AA,Hanson MR.A pentatricopeptide repeat-containing gene restores fertility to cytoplasmic male-sterile plants.Proc Natl Acad Sci USA,2002,99(16):10887–10892.
[25]Jo YD,Kim YM,Park MN,Yoo JH,Park MK,Kim BD,Kang BC.Development and evaluation of broadly applicable markers for Restore-of-fertility in pepper.Mol Breed,2010,25(2):187–201.
[26]O’toole N,Hattori M,Andres C,Iida K,Lurin C,Schmitz-Linneweber C,Sugita M,Small I.On the expansion of the pentatricopeptide repeat gene family in plants.Mol Biol Evol,2008,25(6):1120–1128.
[27]Lecharny A,Boudet N,Gy I,Aubourg S,Kreis M.Introns in,introns out in plant gene families:a genomic approach of the dynamics of gene structure.J Struct Funct Genomics,2003,3(1-4):111–116.
[28]Anderson TM,Hutchison D,Vernon DM.A possible role for RNA-mediated gene duplication in the evolution of a huge plant superfamily.In:Meetings of American Society of Plant Biology.Orlando,USA,2004.
[29]Barkan A,Rojas M,Fujii S,Yap A,Chong YS,Bond CS,Small I.A combinatorial amino acid code for RNA recognitionby pentatricopeptiderepeat proteins.PLoS Genet,2012,8(8):e1002910.
[30]Ding YH,Liu NY,Tang ZS,Liu J,Yang WC.Arabidopsis GLUTAMINE-RICH PROTEIN23 is essential for early embryogenesis and encodes a novel nuclear PPR motif protein that interacts with RNA polymerase II subunit III.Plant Cell,2006,18(4):815–830.