郭冉昊, 趙淑文*, 米福貴, 候偉峰, 趙力興
(1.內蒙古農業(yè)大學草原與資源環(huán)境學院, 內蒙古 呼和浩特 010000; 2.內蒙古農業(yè)大學植物學國家級實驗教學示范中心,內蒙古 呼和浩特 010000; 3.興安盟農牧科學研究所, 內蒙古 興安盟 137400)
葉綠體屬于一種半自主性細胞器,一般為共價閉合的環(huán)狀四分體結構,是高等植物細胞中光合作用的主要場所。葉綠體具有獨立的遺傳物質,即cpDNA,主要編碼與光合作用相關的上百種基因,大小介于120~180 kbp,包括長單拷貝區(qū)(Large single copy,LSC)、短單拷貝區(qū)(Small single copy,SSC)及2個反向重復序列(Inverted repeat sequence,IRS)。cpDNA在物種分類、系統發(fā)育、遺傳多樣性、物種形成、適應性進化等諸多研究中具有重要作用[1-4]。隨著DNA測序技術進步、成本降低,植物基因組學的研究也越來越深入。而相較于大豆核基因組結構和遺傳多樣性的廣泛研究報道,大豆屬細胞質基因組研究相對滯后[5]。
大豆屬(Glycine)屬于豆科(Leguminosae),蝶形花亞科(Papilionatae),含一年生Soja和多年生野生Glycine兩個亞屬[6]。栽培大豆(G.max)是我國重要的經濟作物之一,與野大豆(G.soja)同屬Soja亞屬。野大豆具有蛋白含量高、抗逆性強、生物量較高等特點,是重要的育種材料和優(yōu)質飼草,但由于其莖纏繞,利用上有一定難度。除一年生栽培大豆和野生大豆外,還存在一種特殊類群,即性狀介于野生大豆與栽培大豆之間,被前蘇聯學者Skvortzow稱為的半野生大豆(G.gracilis)[7],其種子百粒重通常在3 g乃至10 g以上,形態(tài)上有黑、褐、黃、綠、雙色種皮及各種中間種皮顏色,莖呈纏繞、弱纏繞、葡匐、蔓生、半蔓生、半直立、甚至直立類型,形態(tài)豐富[8]。半野生大豆兼具栽培大豆和野生大豆性狀等特征,不僅是栽培大豆馴化研究的重要遺傳材料[5],與栽培大豆雜交,也可以比野大豆更便捷有地效拓寬大豆遺傳基礎,創(chuàng)造優(yōu)異種質。由于半野生大豆的百粒重與栽培大豆有重疊,而且其莖形態(tài)與野生大豆和栽培大豆也有重疊,因此半野生大豆的分類地位一直存在爭議。有學者認為半野生大豆是野生大豆向栽培大豆馴化后的中間產物,而另一些學者提出半野生大豆是栽培大豆和野生大豆雜交后的產物[9-12]。
直立型半野生大豆既有半野生大豆高蛋白、多花莢、生育繁茂等優(yōu)良特性,也克服了野大豆莖纏繞,種植利用困難等問題,具有較高的研究價值。本研究以興安盟農牧科學研究所提供的一份直立型半野生大豆為試材,采用高通量測序技術對其cpDNA序列、密碼子偏好性、SSR位點及親緣關系等進行分析,以期為半野生大豆細胞質多樣性、系統分類地位、分子育種及種質利用提供依據。
試驗材料為采自內蒙古自治區(qū)興安盟科爾沁右翼前旗索倫鎮(zhèn)草根臺嘎查(120°54′E,46°45′N)的直立型半野生大豆。2021年秋季采收的種子于2022年種植在呼和浩特市內蒙古農業(yè)大學試驗園區(qū)。
在田間采集健康新鮮植株葉片,置于液氮帶回實驗室于-80℃冰箱存儲,委托北京百邁客生物科技有限公司對樣品進行高通量測序、DNA文庫構建等工作。
原始測序數據(raw data)經Fastqc程序質檢后,用trim_galore除去低質量序列得到clean data,然后用Getorganelle[13]對cpDNA進行組裝。進一步借助在線工具GeSeq[14](https://chlorobox.mpimp-golm.mpg.de/geseq.html)對組裝結果進行注釋(注釋參考基因組:NC_0229868.1)。注釋過程中,先依據注釋后IR區(qū)的位置手動調整基因組起始位置,并將基因組按照LSC,IRb,SSC和IRa順序排列,最后將排列完成的cpDNA用在線軟CPGAVAS2[15](http://47.96.249.172:16019/analyzer/home)進行cpDNA注釋。cpDNA物理圖譜由Chloroplot[16]R軟件包繪制。
用tRNAscan-SE software軟件確定編碼基因總數、編碼tRNA和rRNA的基因數目[17]。
運用CodonW 1.4.2軟件[18](http://mobyle.pas-teur/fr/cgi-bin/portal.py?from=codonw)分析材料cpDNACDS序列,獲得試驗材料同義密碼子的相對使用度(relative synon-ymous codon usage,RSCU);采用在線網站(https://webblast. ipk-gatersleben. de/misa/index.php?action=1)掃描分析直立型半野生大豆cpDNA序列進行微衛(wèi)星掃描分析,單核苷酸、雙核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸設置參數重復數分別不少于10,5,4,4,4,4。
在NCBI數據庫中下載所有已公布大豆屬植物cpDNA序列,包括Glycine和Soja兩個亞屬共8個材料同時以模式植物擬南芥[(Arabidopsisthaliana)(MZ323108.1)]、煙草[(Nicotianatabacum)(MZ707522.1)]作為外類群,將所有參試物種的cpDNA序列選擇MAFFT進行多序列比對,手動校正,使用PhyloSuite軟件[19]中的RAxML,bootstrap為1 000,構建系統發(fā)育樹。
供試直立型半野生大豆的cpDNA全長為148 320 bp,屬典型環(huán)狀四分體結構(圖1)。共編碼108個基因,包括66個蛋白編碼基因、29個tRNA基因和4個rRNA基因。按基因功能可將供試直立型半野生大豆cpDNA編碼基因分為3大類:57個基因表達相關基因、42個光合作用相關基因、7個開放閱讀和其他蛋白編碼基因以及2個未知功能基因。其中基因表達相關基因包含5個小類,數量最多的為轉運RNA基因,RNA聚合酶基因與核糖體RNA基因數量較少,僅為4個(表1)。
圖1 直立型半野生大豆(G.gracilis)cpDNA環(huán)形圖譜Fig.1 Circularized map of the chloroplast genome of the erect semi-wild soybean (Glycine gracilis)
表1 直立型半野生大豆(G. gracilis)cpDNA注釋信息Table 1 Gene annotation of the chloroplast genome of the erect semi-wild soybean (Glycine gracilis)
材料cpDNA密碼子偏好性等分析結果如圖2所示,可見編碼亮氨酸(L)、精氨酸(R)、絲氨酸(S)的密碼子數量較多,編碼色氨酸(W)的密碼子數量較少。RSCU值大于1的密碼子共有31個,其中29個以A/U結尾,僅有2個以G/C結尾。
圖2 直立型半野生大豆(G.gracilis)葉綠體基因組各氨基酸的RSCU分析Fig.2 RSCU analysis of each amino acid in the erect semi-wild soybean (G. gracilis)
從材料cpDNA中共鑒定出5種不同類型的SSR位點87個(表2)。其中單核苷酸重復序列最多,共55個,分為A(31SSRs),T(23SSRs),C(1SSRs)三種類型;其次是雙核苷酸重復序列19個,包含AT/TA兩種類型。此外,鑒定出三核苷酸重復序列4個、四核苷酸重復序列7個、五核苷酸重復序列2個。絕大多數SSR分布于大單拷貝區(qū),其余分布于小單拷貝區(qū)和反向重復序列a(表2)。
根據已公布的所有大豆屬材料cpDNA構建系統發(fā)育樹。結果表明,大豆屬9個物種構成一個單系類群,靴帶支持率(bootstrap)高達100%(見圖3)。該類群進一步又可劃分為兩類,即一年生的半野生大豆G.gracilis.、栽培大豆G.max和野大豆G.soja與被測直立型半野生大豆組成一類,多年生大豆G.falcata,G.canescens,G.syndetika,G.dolichocarpa等組成一類。該結果與目前系統分類學對大豆屬植物的分類相符。
圖3 基于cpDNA序列構建的大豆屬系統發(fā)育樹Fig.3 Phylogenetic tree constructed based on the DNA sequence in Glycine chloroplast genomes注:“★”代表分支節(jié)點的靴帶支持率為100%Note:“★”represents the bootstrap support rate of 100% on the branch
葉綠體DNA與線粒體DNA一起被稱為細胞質基因(Cytoplasmic genome),有遺傳多樣性和單親遺傳限制,異交重組等特點,是植物系統發(fā)育研究、作物馴化追溯、作物改良和基因工程研究的重要對象[9,11,20-24]。隨著測序技術水平提高,測序成本不斷降低,植物cpDNA研究開始興起。據報道,植物cpDNA長度通常在120~180 kb,編碼基因一般在 100~130 個,其中蛋白編碼基因多至 80 個、tRNA編碼基因30~32個,rRNA編碼基因數穩(wěn)定,常有4種[25]。本文試驗材料cpDNA大小、編碼基因數目和種類等與前人研究結果一致,符合cpDNA高度保守性的特性。
植物翻譯蛋白時并不平均地使用同義密碼子,某一或幾種特定密碼子使用頻率高于其他同義密碼子,這種現象即為密碼子偏好性。RSCU常被用作衡量密碼子偏好性,可在一定程度上反映基因乃至物種起源及進化方式,并對基因功能及其編碼蛋白表達有一定影響[26]。當某一密碼子RSCU值大于1,則表明其使用頻率相對較高。本研究中密碼子偏好性分析結果表明,RSCU值大于1的同義密碼子共有31個,其中以A/T結尾的有29個,與扁蓿豆、紫花苜蓿等豆科植物密碼子偏好性一致[27-28]。簡單重復序列(SSR)又稱微衛(wèi)星,是整個基因組中1~6 bp的重復序列,多態(tài)性高、分布廣泛,是高等真核生物基因組的重要組成部分。又因為cpDNA結構簡單、相對保守,cpSSR成為在遺傳分析、物種鑒定、群體遺傳多態(tài)性等研究中的重要工具[29]。在本研究中共鑒定出單核苷酸、雙核苷酸、三核苷酸、四核苷酸、五核苷酸共5種不同類型的SSR位點87個,重復序列數及類型與已報道的其他被子植物cpDNA的SSRs序列構成基本一致[30],同時印證了cpSSRs主要由短的poly A、poly T而非C或G的重復串聯構成[31]。cpDNA尤其對近緣物種,能有效進行鑒定和系統親緣關系分析[32]。本文基于cpDNA序列對大豆屬9個物種構建系統發(fā)育樹,結果與目前系統分類學對大豆屬植物的分類相符合。但半野生大豆在soja亞屬中的系統分類地位尚不能完全說明?,F已公布soja亞屬cpDNA數據僅有9個,或許隨著數據量的增加可以從cpDNA角度解釋半野生大豆在soja亞屬中的分類地位。
直立型半野生大豆cpDNA全長148 320 bp,典型四分體結構,編碼基因108個,其中蛋白編碼基因66個、tRNA基因29個、rRNA基因4個。基因組序列上共檢測出單核苷酸、雙核苷酸、三核苷酸、四核苷酸、五核苷酸,五種類型SSR位點87個。在系統發(fā)育上,直立型半野生大豆與已公布的普通型一年生半野生大豆(G.gracilis)、大豆(G.max)及野大豆(G.soja)親緣關系較近,但其在soja亞屬中的分類地位還有待進一步研究。本研究對直立型野大豆cpDNA進行了初步分析,為半野生大豆細胞質多樣性、半野生大豆系統分類、分子育種及種植利用提供依據,也為soja亞屬系統進化和遺傳研究提供了重要的數據資源。