張曉,李才華,王婧,張?zhí)m蘭,牟曉雨,王昕玥,甘劉美,周鵬展,張銳
1.長春理工大學(xué)生命科學(xué)技術(shù)學(xué)院,長春130022;
2.中國農(nóng)業(yè)科學(xué)院生物技術(shù)研究所,北京100081
RNA編輯現(xiàn)象普遍存在于植物線粒體基因組的蛋白編碼基因中,并且根據(jù)選擇壓強度的不同而有完全編輯和部分編輯之分。植物線粒體基因組中有的基因是多拷貝基因(加倍基因),那么同一個基因不同拷貝的RNA編輯情況如何,目前尚無相關(guān)報道。本團隊前期研究發(fā)現(xiàn),棉花細胞質(zhì)雄性不育(cytoplasmic male sterile,CMS)系和保持系線粒體基因組中atpA基因各有兩個拷貝,但每個拷貝的RNA編輯率差異尚不清楚[1]。本研究將分析兩系atpA基因每個拷貝的RNA編輯率差異,這對探究植物線粒體基因表達調(diào)控(核質(zhì)互作)、揭示棉花細胞質(zhì)雄性不育機理具有重要意義。
植物線粒體基因組中的RNA編輯現(xiàn)象特指C-U RNA編輯。它是植物線粒體基因表達的必需步驟之一,屬轉(zhuǎn)錄后加工范疇,主要發(fā)生在編碼蛋白的基因中,通常位于密碼子的第一、二位,導(dǎo)致編碼的氨基酸發(fā)生改變[2]。RNA編輯后,表達的蛋白質(zhì)與其他物種同源性更高[3]。目前已在甜菜[4]、油菜[5]、葡萄[6]、水稻[7]、擬南芥[8]、海棗樹[9]、棉花[10]、蘇鐵[11]等植物線粒體基因組中分別發(fā)現(xiàn)了370、427、445、446、456、592、692、1 084個RNA編輯位點。擬南芥456個位點中位于蛋白編碼區(qū)、非編碼區(qū)(內(nèi)含子、5'非翻譯區(qū)和3'非翻譯區(qū))的分別是441、15個[8]。葡萄445個編輯位點中位于蛋白編碼區(qū)、非編碼區(qū)的分別是401、44個,位于蛋白編碼區(qū)的401個位點中76%是部分編輯[6]。
PPR蛋白在RNA編輯中發(fā)揮重要作用,它們是植物中比較保守的由串聯(lián)排列的35個氨基酸構(gòu)成的一類蛋白[12],是目前公認的反式作用編輯因子[13],參與了細胞器RNA的成熟過程,并組成一個大的家族來負責(zé)植物細胞器中所有的RNA編輯事件。近年來,通過對突變體的研究,在擬南芥中已經(jīng)發(fā)現(xiàn)了25種PPR蛋白參與RNA編輯[14-33]。目前,水稻、高粱和玉米等作物中也鑒定出大量的PPR蛋白,它們大多是不同物種間的同源 基 因[34]。PPR蛋 白 以 自 身 做 為RNA編 輯酶[13,35]、或充當(dāng)RNA編輯酶募集者[36]的方式參與線粒體RNA編輯。
基因加倍是指在同一個基因組內(nèi)存在2個以上拷貝的同源基因序列,是一種普遍的生物現(xiàn)象。在已完成全測序的生物基因組中,存在大量的加倍基因[37-38],它們在基因組分化和生物進化中發(fā)揮重要作用[39]。植物線粒體基因組結(jié)構(gòu)復(fù)雜,存在基因重排、重組現(xiàn)象,導(dǎo)致產(chǎn)生較多重復(fù)序列,位于長重復(fù)序列上的基因便成為加倍基因。不同植物線粒體基因組中的加倍基因數(shù)目從一個到十幾個不等[40-45]。
本團隊研究發(fā)現(xiàn),棉花CMS系和保持系線粒體atpA基因各有兩個拷貝:一個是完整的,一個是3'截短的,屬于基因加倍現(xiàn)象。但該基因加倍對RNA編輯的影響尚不清楚。本研究擬對兩系atpA雙拷貝基因進行DNA序列解析和RNA編輯分析,研究基因加倍對RNA編輯率的影響,以期為植物線粒體基因表達調(diào)控提供實驗數(shù)據(jù),并探討RNA編輯率與棉花細胞質(zhì)雄性不育之間的關(guān)系。
陸地棉CMS系P30A,保持系P30B。P30B是陸地棉品種;P30A是P30B與104-7A多代回交得到的高代不育系;P30B與P30A的核背景一致。所有材料種植于大田或人工氣候培養(yǎng)箱。
1.2.1 總DNA提取5 g新鮮葉片用液氮速凍后,快速充分研磨成粉末,轉(zhuǎn)入50 mL離心管中,加入20 mL提取液[100 mmol·L-1Tris-HCl(pH8.0),1.5 mol·L-1NaCl,20 mmol·L-1EDTA(pH8.0),2%CTAB,2%PVP40,2%β-巰基乙醇],65℃水浴40 min,期間溫和顛倒混勻數(shù)次,然后加入20 mL氯仿∶異戊醇(24∶1)振蕩混勻,12 000 r·min-1離心10 min,后續(xù)步驟參照張曉等[46]的方法。
1.2.2 Southern blot取40 μg總DNA,分別以300 UEcoRⅠ和HindⅢ(美國Promega公司)充分酶切,0.8%瓊脂糖凝膠電泳,經(jīng)脫嘌呤、變性步驟后,以10×SSC為轉(zhuǎn)膜緩沖液用真空轉(zhuǎn)印儀(Vacuum Blotter 785,美國Bio-Rad公司)將DNA轉(zhuǎn)印到Hybond N+尼龍膜(美國Amersham Pharmacia Biotech公司)上,用紫外交聯(lián)儀(CL-1000 UV Crosslinker,美國UVP公司)交聯(lián)1 min(劑量約為0.1 J·cm-2)。探針標記、雜交、檢測步驟參照張曉等[47]的方法。
取1 μgatpA基因DNA片段(所用引物見表1中的atpAF和atpAR)為模板進行標記。同時將Gene-ruler DNA ladder Mix SM0331(美國Thermo公司)進行標記做為分子量參照。尼龍膜在雜交爐(美國Hybaid公司)中42℃雜交至少20 h,探針濃度為25 ng·mL-1。X光膠片曝光30 min后沖洗膠片。
1.2.3 反向PCR法結(jié)合Tail-PCR法擴增atpA5'和3'側(cè)翼序列 具體方法參照張曉等[1]的方法。
1.2.4 總RNA提取與Northern blot分析 花蕾總RNA的提取采用RNAout Plant試劑盒(Tianze,China)。進行Northern blot實驗時,RNA樣品在1.2%甲醛變性膠中60 V電泳2 h,后續(xù)步驟同1.2.2。
1.2.5 RT-PCR與cRT-PCR RT-PCR實 驗 參 照張曉等[46]的方法。RT-PCR所用引物序列見表1。cRT-PCR參照Kuhn等[48]和張曉等[46]的方法,所用特異反向引物為表1中的atpAIF和atpAIR。
表1 研究使用的引物Table 1 Primers used in this study
Southern blot實驗在棉花保持系和CMS系中各獲得兩個atpA基因雜交條帶(圖1)。保持系、CMS系的EcoRⅠ限制片段長度分別是2.2和5.1 kb、2.2和3.3 kb;HindⅢ限制片段長度分別是8.5和11.7 kb、9.1和11.7 kb。通過反向PCR和Tail-PCR技術(shù)克隆到這些片段的具體序列,結(jié)果發(fā)現(xiàn),兩系各含有2個atpA基因拷貝:一個是完整的,一個是3'截短型的(圖2)。保持系中的完整拷貝和截短型拷貝分別命名為(N)atpA-1(11 689 bp)和(N)atpA-2(8 501 bp);CMS系中相應(yīng)的拷貝分別命名為(S)atpA-1(11 658 bp)和(S)atpA-2(9 139 bp)。上述4段序列具有相同的5'側(cè)翼區(qū)(圖2),并且一致性序列至少延伸到atpA起始密碼子上游-4 351 bp(HindⅢ位點)處。
圖1 陸地棉細胞質(zhì)雄性不育系、保持系總DNA的Southern blot分析Fig.1 Southern blot analysis of total DNAs of CMS,maintainer line of Gossypium hirsutum L.
(N)atpA-1和(S)atpA-1含有完整的atpA基因編碼序列(1 524 bp),并具有相似的3'延伸區(qū),但是在atpA終止密碼子下游161~212 bp區(qū)域,存在一個SSR位點。該位點在保持系中是(TAA)7(TA)6,在CMS中是(TAA)3(TA)2。
(N)atpA-2和(S)atpA-2含有3'截短型的atpA基因,但是斷點不同:(N)atpA-2是在atpA編碼序列的第1 352 bp處截斷;(S)atpA-2是在第1 336 bp處截斷(圖2)。二者序列在atpA編碼區(qū)一致,但是從斷點處往下開始出現(xiàn)長度分別為515和555 bp的特異嵌合序列。N515和S555嵌合序列后面,又分別存在一段2 010 bp(或2 016 bp)的一致序列。在該一致序列之后,又開始出現(xiàn)差異,這段差異序列一直延伸到各自HindⅢ位點處,并繼續(xù)往下延伸,總長度未知。經(jīng)ORFfinder預(yù)測,(N)atpA-2和(S)atpA-2中atpAORF分別是1 947和1 821 bp,即終止密碼子分別位于各自斷點下游595、485 bp處。
圖2 棉花CMS和保持系中atpA基因HindⅢ限制性片段Fig.2 HindⅢrestriction fragments of atpA gene in CMS and maintainer line of cotton.
為研究棉花兩系中atpA基因的兩個拷貝是否都轉(zhuǎn)錄,我們合成了針對每個拷貝的特異引物,并進行RT-PCR分析。結(jié)果顯示,4個拷貝的cDNA都檢測到,這說明盡管3'末端大約1/8的編碼區(qū)被截短,但(N)atpA-2和(S)atpA-2都能夠轉(zhuǎn)錄(圖3)。兩系的atpA全長拷貝都是1 524 bp;截短型拷貝在保持系中預(yù)測開放閱讀框(open reading frame,ORF)是1 947 bp,在CMS系中預(yù)測開放閱讀框是1 821 bp。
圖3 棉花CMS和保持系中atpA基因的RT-PCR分析Fig.3 RT-PCR analysis of atpA gene in CMS and maintainer line of cotton
利用cRT-PCR法克隆到CMS系atpA基因兩個拷貝的轉(zhuǎn)錄本全長。完整atpA基因的cDNA全長1 807 bp,包含1 524 bp的完整atpA基因。主要的轉(zhuǎn)錄起始位點位于-81 bp處(表2),主要的轉(zhuǎn)錄終止位點位于+200 bp處(表2)。
CMS系截短型atpA基因的cDNA全長2 150 bp,其中包含一個1 821 bp的ORF,該ORF由1 336 bp的atpA編碼序列和其下游485 bp序列組成。主要的轉(zhuǎn)錄起始位點位于-81 bp處(表2)。主要的轉(zhuǎn)錄終止位點位于終止密碼子(TAG)下游+249 bp處(表2)。
表2 棉花CMS系全長和截短型atpA基因轉(zhuǎn)錄起始位點和終止位點情況Table 2 Start and termination sites of transcripts of intact and truncated atpA gene in CMS line of cotton
由此可見,CMS系atpA基因兩個拷貝轉(zhuǎn)錄起始位點均位于-81 bp附近,表明二者啟動子基本相同。
為研究atpA基因的轉(zhuǎn)錄本情況,以atpA核心序列為探針進行了Northern blot分析,發(fā)現(xiàn)CMS系和保持系均有4個轉(zhuǎn)錄本:最長的1個轉(zhuǎn)錄本豐度最高、較短的3個轉(zhuǎn)錄本豐度均較低,且兩系之間帶型無明顯差異(圖4)。這說明雖然不育系P30A、保持系P30B都有特異截短型的atpA轉(zhuǎn)錄本,但可能由于電泳時間不夠長、轉(zhuǎn)錄本的大小差異不明顯或者表達量很低,因此用Northern blot方法檢測不到差異。
圖4 棉花CMS和保持系atpA基因Northern blot分析Fig.4 Northern blot analysis of atpA gene in CMS and maintainer line of cotton
利用特異引物對P30B和P30AatpA全長和截短型拷貝進行了RT-PCR分析。將cDNA序列和基因組序列進行比對發(fā)現(xiàn),atpA全長拷貝中存在6處C-U RNA編輯位點,它們的核苷酸位置(對應(yīng)密碼子、對應(yīng)氨基酸位置、對應(yīng)氨基酸變化)分別是:1 039(CCC-UCC、347、Pro-Ser)、1 064(UCGUUG、355、Ser-Leu)、1 216(CUU-UUU、406、Leu-Phe)、1 292(CCG-CUG、431、Pro-Leu)、1 415(CCACUA、472、Pro-Leu)、1 484(CCA-CUA、495、Pro-Leu)bp處(圖2)。這6處位點4個發(fā)生在密碼子的第二位,2個發(fā)生在密碼子的第1位。這些位點對應(yīng)在ATPA蛋白的C末端區(qū)域,導(dǎo)致6個氨基酸發(fā)生改變,其中3個脯氨酸和1個絲氨酸都變成亮氨酸,使得多肽中更容易形成α-螺旋,同時提高了棉花ATPA蛋白與其他物種ATPA蛋白的相似性。
在提莫菲維小麥、普通小麥[49]、黑小麥[50]、月見草[51]和甜菜[52]線粒體atpA轉(zhuǎn)錄本中也分別發(fā)現(xiàn)了6、6、6、4、3個RNA編輯位點。不同植物atpA轉(zhuǎn)錄本的RNA編輯通常發(fā)生在同樣的位點,有的沒有發(fā)生編輯是因為它們在基因組水平上已經(jīng)完成編輯。例如,第472位氨基酸對應(yīng)的序列在提莫菲維小麥、普通小麥、黑小麥基因組上已經(jīng)是棉花編輯后的序列;同樣在棉花基因組上第10、324、393位氨基酸對應(yīng)的序列已經(jīng)是提莫菲維小麥、普通小麥、黑小麥RNA編輯后的序列(表3)。
表3 棉花atpA編輯位點與其他植物的比較Table 3 Comparison of cotton atpA editing sites with those of other plants
在兩系截短型拷貝中,分別存在4個RNA編輯位點:第1 039、1 064、1 216、1 292 bp。這4個位點與全長拷貝中的完全一樣。
同時,在P30A全長atpA拷貝終止密碼子下游+78 bp處(3'-UTR區(qū)),存在一個編輯位點,該位點的編輯率是41%(7/17),屬于部分編輯。
對cDNA克隆子進行測序發(fā)現(xiàn),棉花atpA基因的RNA編輯率在不同系和不同拷貝間存在明顯差異(表4)。
表4 棉花CMS系(S)和保持系(N)atpA基因完整拷貝和截短型拷貝的RNA編輯率比較Table 4 Comparison of RNA editing rates of intact and truncated copies of atpA gene in CMS line(S)and maintainer line(N)of cotton
(N)atpA-1中6個位點的編輯率都是100%,說明保持系中完整atpA基因是完全編輯。(S)atpA-1中6個位點的編輯率分別是100%、85%、100%、92%、100%、100%,即第2(S-L)、4(P-L)位點的編輯率不足100%。這兩處編輯位點的作用都是改變氨基酸序列,特別是第4位點,能夠?qū)⒏彼嵝拚秊榱涟彼?,并且從?可看出,每一種植物在此處都應(yīng)是亮氨酸,此處編輯不足,可能導(dǎo)致大約8%的轉(zhuǎn)錄本是“不合格”的。這種“不合格率”是否會影響CMS系中線粒體ATP合酶的正常功能尚未知。
(N)atpA-2和(S)atpA-2的RNA編輯率存在明顯差異。(N)atpA-2中4個位點的編輯率分別是55%、37%、55%、27%,說明保持系截短型atpA基因是部分編輯,且編輯率特別低。但(S)atpA-2中4個位點的編輯率分別是100%、90%、100%、100%,接近完全編輯,整體編輯率甚至超過(S)atpA-1。特別是第4個位點,完整拷貝中編輯率是92%,截短型拷貝中是100%。
綜上,保持系中atpA基因完整拷貝編輯率較高(100%),截短型拷貝編輯率較低(60%以下)。而CMS系中完整拷貝和截短型拷貝編輯率均較高(接近100%)。據(jù)此推測,atpA基因RNA編輯率可能與棉花CMS之間有相關(guān)性。
高等植物線粒體基因組中的多拷貝基因通常都是位于長重復(fù)序列上[53]。本文中的棉花雙拷貝atpA基因也是如此。在每個棉花品種中,全長拷貝和截短型拷貝之間的重復(fù)序列都在5 800 bp以上。在Genbank中進一步分析發(fā)現(xiàn),該重復(fù)序列可能位于與亞洲棉線粒體基因組中的反向重復(fù)序列R1(63.789 kb)[54]、海島棉線粒體基因組中的正向重復(fù)序列R1(63.904 kb)[55]、三裂棉線粒體基因組中的正向重復(fù)序列R1(12.921 kb)[54]相似的長重復(fù)序列上。atpA基因位于長重復(fù)序列的3'端,此處是重組或重排位點,CMS系和保持系在此處存在明顯序列差異。棉花線粒體atpA基因是研究基因加倍的一個很好的模型,因為兩個拷貝的3'末端有特異序列,所以可以設(shè)計特異引物對每一個拷貝進行擴增分析。
植物線粒體基因組結(jié)構(gòu)復(fù)雜多樣,有環(huán)形(主環(huán)、亞環(huán))、線形等多種形式[56]。Iwahashi等[57]提出水稻線粒體基因組由5個亞環(huán)構(gòu)成,每個亞環(huán)都與其他1、2個環(huán)共享一段同源重復(fù)序列,某些重復(fù)序列會引起分子內(nèi)或分子間重組事件,使DNA主環(huán)變?yōu)?個亞環(huán)分子,或使2個亞環(huán)形成一個主環(huán),使線粒體基因組結(jié)構(gòu)呈現(xiàn)異質(zhì)性[58-60]。目前已公布的棉屬植物線粒體基因組都是一個主環(huán)結(jié)構(gòu),推測atpA基因的兩個拷貝是位于同一個主環(huán)內(nèi)。棉花線粒體基因組是否存在亞環(huán),以及atpA基因是否有可能位于不同的環(huán)狀基因組分子中,目前尚無相關(guān)報道。
高等植物線粒體基因組中幾乎每一個編碼蛋白的基因中都存在RNA編輯。RNA編輯位點絕大多數(shù)出現(xiàn)在基因編碼區(qū),少部分在基因間隔區(qū)或非偏碼區(qū)。編碼區(qū)的RNA編輯位點基本都是完全編輯,而非編碼區(qū)的編輯位點通常是部分編輯[8]。這說明,編輯位點的選擇遵循“節(jié)約”原則。需要編輯的地方因為具有功能所以受到的選擇壓較大而編輯,不需要編輯的地方因為失去功能所以受到的選擇壓較小而不編輯,這樣的節(jié)約原則也影響了基因的表達。
CMS系和保持系中atpA基因各有兩個拷貝,通過對P30A中atpA轉(zhuǎn)錄本5'末端進行分析表明,完整拷貝和截短型拷貝轉(zhuǎn)錄本的5'末端是基本相同的,說明二者啟動子基本相同,即啟動子對這兩個拷貝的RNA編輯率的影響可能不大。
完整atpA基因的RNA編輯位點在保持系和CMS系中相同,且6個位點的編輯率都接近100%。但截短型拷貝的RNA編輯率在保持系和CMS系間差距較大:保持系的編輯率很低,在27%~55%之間;而CMS系的卻很高,接近100%。加倍基因的命運通常有新功能化、亞功能化和去功能化3種[61]。保持系atpA截短型拷貝的RNA編輯率特別低,可能說明該基因(加倍基因)的功能可有可無,所受選擇壓很低,逐步退出調(diào)控網(wǎng)絡(luò),為亞功能化或去功能化;相反,CMS系中該拷貝的編輯率很高(接近100%),可能意味著該基因仍有明確的功能,所受選擇壓較大,為新功能化。CMS系中atpA截短型拷貝的RNA編輯率非常充分的原因,即為何CMS系體內(nèi)要動用這個拷貝、對之施加這么高的選擇壓讓其充分編輯,可能是因為CMS系中完整拷貝的6個RNA編輯位點中有2個位點的編輯率不足100%,導(dǎo)致不能產(chǎn)生足夠多的正確的ATPA蛋白,需要再動員截短型拷貝來繼續(xù)生產(chǎn)ATPA相似蛋白來補充,但具體結(jié)論需要我們進一步深入研究。
RNA編輯既受所在基因組序列的影響,也受細胞核的調(diào)控影響[62]。本研究內(nèi)容屬于前者,因為P30A和P30B是同核異質(zhì)系,細胞核是相同的,atpA基因RNA編輯的差異主要受其所在線粒體基因組序列的影響。后續(xù)研究可以將恢復(fù)系和F1代也引入分析。比如不育系P30A和恢復(fù)系的細胞質(zhì)(包括線粒體基因組)是相同的,但細胞核不同,因此未來可以將兩者進行比較,來探究細胞核對RNA編輯的影響。