洪森榮,劉雯莉,宋冰雁,顏玉情
懷玉山產(chǎn)三葉青葉綠體基因組特征及其系統(tǒng)進(jìn)化關(guān)系
洪森榮1, 2, 3, 4,劉雯莉1,宋冰雁1,顏玉情1
1. 上饒師范學(xué)院生命科學(xué)學(xué)院,江西 上饒 334001 2.上饒農(nóng)業(yè)技術(shù)創(chuàng)新研究院,江西 上饒 334001 3.上饒市藥食同源植物資源保護(hù)與利用重點(diǎn)實(shí)驗(yàn)室,江西 上饒 334001 4.上饒市三葉青保育與利用技術(shù)創(chuàng)新中心,江西 上饒 334001
解析懷玉山產(chǎn)三葉青葉綠體基因組信息序列特征和確定其在崖爬藤屬的系統(tǒng)位置。用Illumina高通量測(cè)序平臺(tái)NovaSeq6000進(jìn)行測(cè)序獲得懷玉山產(chǎn)三葉青葉綠體基因組序列,借助GeSeq、tRNAscan-SE、MISA、VISTA tools、DNADnaSP6.0、JSHYCloud、CodonW1.4.2、Pasteur Galaxy、mafft 7.0、fasttree 2.1.10等生物信息學(xué)工具進(jìn)行序列分析、密碼子偏好分析、崖爬藤屬基因組比較分析和系統(tǒng)發(fā)育研究。懷玉山產(chǎn)三葉青葉綠體基因組為共價(jià)閉合雙鏈環(huán)狀分子,長(zhǎng)160 165 bp,包含1個(gè)大單拷貝區(qū)(large single copy region,LSC)、1個(gè)反向重復(fù)區(qū)a(inverted repeat region a,IRa)、1個(gè)反向重復(fù)區(qū)b(inverted repeat region b,IRb)和1個(gè)小單拷貝區(qū)(small single copy region,SSC);懷玉山產(chǎn)三葉青葉綠體基因組注釋到光合作用基因、自我復(fù)制基因、其他基因和未知功能基因4類(lèi)共133個(gè)基因,包括 88個(gè)CDS基因、37個(gè)tRNA基因和8個(gè)rRNA基因;懷玉山產(chǎn)三葉青葉綠體基因組檢測(cè)到63個(gè)SSR位點(diǎn),其中單堿基重復(fù)56個(gè),雙堿基重復(fù)7個(gè);懷玉山產(chǎn)三葉青葉綠體基因組核苷酸多樣性的變化范圍為0~0.234 18,基因間隔區(qū)、以及基因變異率最高。懷玉山產(chǎn)三葉青葉綠體基因組密碼子偏好以A或U結(jié)尾,具有較強(qiáng)的偏好性。突變對(duì)密碼子偏好性的影響較強(qiáng),而其他因素如自然選擇對(duì)密碼子的偏好性影響較小。懷玉山產(chǎn)三葉青葉綠體基因組有31個(gè)高頻密碼子,16個(gè)以U結(jié)尾,13個(gè)以A結(jié)尾,2個(gè)以G結(jié)尾,其中13個(gè)為最優(yōu)密碼子。懷玉山產(chǎn)三葉青與福建產(chǎn)三葉青(MW375708)和廣西產(chǎn)三葉青(MW375709)親緣關(guān)系較近,與浙江產(chǎn)三葉青(MT827073)、浙江產(chǎn)三葉青(MW375707)、浙江產(chǎn)三葉青KT033563(NC_029339)、四川產(chǎn)三葉青(MW375710)和浙江產(chǎn)三葉青(MW375711)親緣關(guān)系較遠(yuǎn)。三葉青之間的親緣關(guān)系與地理位置相關(guān)性不大。首次采用生物信息學(xué)分析方法對(duì)懷玉山產(chǎn)三葉青葉綠體基因組進(jìn)行了全面、深度解析,結(jié)果將為崖爬藤屬藥用植物的遺傳多樣性分析以及新品系的遺傳育種研究等提供理論依據(jù)。
三葉青;葉綠體基因組特征;系統(tǒng)進(jìn)化關(guān)系;大單拷貝區(qū);小單拷貝區(qū)
三葉青Diels et Gilg為我國(guó)特有珍稀瀕危葡萄科崖爬藤屬藥用植物[1],其新鮮或干燥塊根可清熱解毒、消腫止痛、化痰散結(jié),常用于治療小兒高熱驚風(fēng)、百日咳、毒蛇咬傷等[2];其干燥全草也可清熱解毒、消腫止痛、活血祛風(fēng),常用于治療流行性感冒、肝炎、泌尿系統(tǒng)結(jié)石、跌打損傷等[3]。
葉綠體是為綠色植物提供能量的光合細(xì)胞器,在光合作用及相關(guān)代謝活動(dòng)中起重要作用[4]。隨著生物技術(shù)的開(kāi)發(fā)和應(yīng)用,葉綠體基因組大小已經(jīng)確定,被子植物中典型的葉綠體基因組為雙鏈共價(jià)閉合環(huán)狀分子,具有典型的四分體結(jié)構(gòu),包括一個(gè)大單拷貝區(qū)(large single copy region,LSC),小單拷貝區(qū)(small single copy region,SSC),反向重復(fù)區(qū) a(inverted repeat region a,IRa),反向重復(fù)區(qū) b(inverted repeat region b,IRb),植物葉綠體基因組的大小差異由IRa和IRb決定)[5]。被子植物的葉綠體基因組的長(zhǎng)度一般在120~170 kb,通常編碼110~130個(gè)基因,約40個(gè)基因是參與光合作用、轉(zhuǎn)錄和翻譯[6]。葉綠體基因結(jié)構(gòu)高度保守,確保在進(jìn)化群體之間基因的直接同源性,能自我復(fù)制,多為母系遺傳,進(jìn)化不重組,直接反映植物進(jìn)化積累的遺傳變異,可為高等植物群體遺傳學(xué)、系統(tǒng)發(fā)育和基因組進(jìn)化提供依據(jù)[7]。
三葉崖爬藤植物在形態(tài)上很難區(qū)分,被認(rèn)為是崖爬藤屬中最難分類(lèi)的一個(gè)屬,許多專(zhuān)家學(xué)者從DNA分子標(biāo)記和形態(tài)學(xué)角度對(duì)三葉崖爬藤植物進(jìn)行了相關(guān)的研究,但這些分類(lèi)系統(tǒng)還是存在較大差異,究其原因,一是形態(tài)學(xué)的傳統(tǒng)物種分類(lèi)方法易受環(huán)境因子影響,二是DNA分子標(biāo)記關(guān)注的側(cè)重點(diǎn)存在差異[8]。植物葉綠體基因組遠(yuǎn)小于核基因組,編碼區(qū)和非編碼區(qū)的分子進(jìn)化速度差異顯著,各類(lèi)群葉綠體基因組之間共線(xiàn)性良好,隨著系統(tǒng)發(fā)育學(xué)和基因組學(xué)的交融,在植物系統(tǒng)發(fā)育研究中,基于葉綠體基因組的系統(tǒng)發(fā)育基因組學(xué)研究?jī)?yōu)勢(shì)漸漸凸顯,為一些分類(lèi)困難類(lèi)群的系統(tǒng)學(xué)問(wèn)題提供了新的解決方案[9-10]。
國(guó)內(nèi)已經(jīng)有浙江三葉崖爬藤[9-10]葉綠體基因組的相關(guān)報(bào)道,但未涉及到崖爬藤屬植物葉綠體基因組密碼子偏好性分析。三葉青種質(zhì)遺傳多樣性十分豐富,浙江產(chǎn)三葉青種質(zhì)之間的遺傳信息有一定差異[11]。懷玉山產(chǎn)三葉青為江西省上饒市玉山全縣特產(chǎn),2016年3月31日原中華人民共和國(guó)農(nóng)業(yè)部正式批準(zhǔn)對(duì)“懷玉山產(chǎn)三葉青”實(shí)施農(nóng)產(chǎn)品地理標(biāo)志登記保護(hù)[12]。本研究對(duì)懷玉山產(chǎn)三葉青葉綠體基因組進(jìn)行測(cè)序,對(duì)其GC含量、SSR位點(diǎn)等進(jìn)行分析,并與不同產(chǎn)地三葉崖爬藤以及崖爬藤屬其他物種的基因組進(jìn)行多重比較,以期為懷玉山產(chǎn)三葉青的系統(tǒng)發(fā)育和不同產(chǎn)地三葉青的親緣關(guān)系提供數(shù)據(jù)支撐,同時(shí)豐富三葉崖爬藤的葉綠體基因組數(shù)據(jù)庫(kù),為懷玉山產(chǎn)三葉青的遺傳多樣性保護(hù)、生產(chǎn)性狀等相關(guān)研究提供理論基礎(chǔ),也為懷玉山產(chǎn)三葉青種質(zhì)鑒定、DNA條形碼開(kāi)發(fā)提供新思路。
懷玉山產(chǎn)三葉青栽培種“懷玉2號(hào)”試管苗(由上饒市三葉青保育與利用技術(shù)創(chuàng)新中心提供)。由上饒市紅日農(nóng)業(yè)開(kāi)發(fā)有限公司陳榮華高級(jí)農(nóng)藝師鑒定為三葉青Diels et Gilg栽培種“懷玉2號(hào)”試管苗。
高通量二代測(cè)序NextSeq 550AR基因測(cè)序儀(Illumina公司,美國(guó))。
用CTAB法提取懷玉山產(chǎn)三葉青葉片DNA,DNA濃度利用Qubit2.0進(jìn)行精確定量檢測(cè)合格后,將DNA片段化(Covaris超聲波破碎儀隨機(jī)打斷),經(jīng)過(guò)片段純化、末端修復(fù)等途徑獲得測(cè)序文庫(kù)。文庫(kù)構(gòu)建完成后,先用Qubit2.0進(jìn)行初步定量,稀釋文庫(kù),隨后使用Agilent 2100對(duì)文庫(kù)的插入片段進(jìn)行檢測(cè),插入片段大小符合預(yù)期后,使用Q-PCR方法對(duì)文庫(kù)的有效濃度進(jìn)行準(zhǔn)確定量,以保證文庫(kù)質(zhì)量。文庫(kù)檢測(cè)合格后,在天津諾禾致源科技有限公司用Illumina高通量測(cè)序平臺(tái)NovaSeq6000進(jìn)行測(cè)序。
首先利用SOAPnovo v2.04(http://soap. genomics.org.cn/)拼接軟件對(duì)質(zhì)控后的全部clean data進(jìn)行novo初步組裝,將組裝得到的全部contig與葉綠體數(shù)據(jù)庫(kù)進(jìn)行比對(duì),篩選得到來(lái)自葉綠體的contig;然后利用MITObim v1.6通過(guò)迭代比對(duì),將測(cè)序的所有clean reads mapping到這些contig上進(jìn)行延伸,通過(guò)gap close獲得葉綠體的全基因組序列。將懷玉山產(chǎn)三葉青葉綠體基因組序列上傳至NCBI(GenBank登錄號(hào)OP589402)。使用GeSeq、tRNAscan-SE對(duì)葉綠體基因組進(jìn)行注釋?zhuān)俳?jīng)過(guò)手工校正后得到最終的葉綠體基因組基因注釋結(jié)果。使用OGDRAW制作葉綠體基因組圖譜。
使用MISA在線(xiàn)工具(https://webblast.ipk- gatersleben. de/misa /index. php)的微衛(wèi)星定位檢測(cè)技術(shù)對(duì)懷玉山產(chǎn)三葉青葉綠體基因組序列中的簡(jiǎn)單重復(fù)序列(Simple sequence repeats,SSR)進(jìn)行搜索。用VISTA tools繪制結(jié)構(gòu)mVIST結(jié)構(gòu)變異圖。利用DNADnaSP6.0軟件計(jì)算近緣物種的基因組Pi。通過(guò)JSHYCloud在線(xiàn)工具集分析懷玉山產(chǎn)三葉青葉綠體基因組IR 區(qū)邊界結(jié)構(gòu)差異,從NCBI中選崖爬藤屬浙江產(chǎn)三葉青Diels et Gilg、扁擔(dān)藤(Hook.) Gagnep.、毛五葉崖爬藤Pierre ex Gagnep.、Linnaeus、(Miq.) Planch.;葡萄翁屬祖提葡萄翁(Dinter & Gilg) Desc.、矮葡萄甕(N. E. Br.) Desc. ex Wild & R. B. Drumm.、(Sprague) Desc.、桑德森葡萄翁Linnaeus和烏蘞莓烏蘞莓(Thunb.) Raf.的10種植物葉綠體基因組來(lái)比對(duì)不同物種間葉綠體基因組異同。運(yùn)用軟件CodonW1.4.2分析懷玉山產(chǎn)三葉青葉綠體基因組的相對(duì)同義密碼子使用情況(relative synonymous condon usage,RSC)。通過(guò)Pasteur Galaxy 在線(xiàn)工具集(https://galaxy.pasteur. fr/ CodonW)中的CodonW模塊分析密碼子使用情況,設(shè)置輸出結(jié)果為有效密碼子數(shù)(ENC)和相對(duì)同義密碼子使用度(RSCU),其他參數(shù)設(shè)為默認(rèn)值。ENC>35表示含有較多種類(lèi)的稀有密碼子,且基因表達(dá)量偏低;某一密碼子的RSCU>1.00表示編碼對(duì)應(yīng)的蛋白質(zhì)時(shí)偏好使用該密碼子,RSCU<1.00表示不偏好使用該密碼子,RSCU=1.00表示該密碼子沒(méi)有偏好性。對(duì)近緣物種進(jìn)行GC3~GC12分析(Neutrality-plot分析)、ENC-plot分析和PR2-bias-plot分析和最優(yōu)密碼子分析。將懷玉山產(chǎn)三葉青葉綠體基因組序列上傳至NCBI進(jìn)行BLASTn比對(duì),選擇highly similar sequence(megablast)來(lái)比較相似性在95%以上的序列,檢索獲得懷玉山產(chǎn)三葉青的近緣種,以明確懷玉山產(chǎn)三葉青葉綠體基因組序列在葡萄科中的系統(tǒng)關(guān)系。序列比對(duì)利用mafft 7.0軟件,建樹(shù)利用fasttree 2.1.10軟件。
測(cè)序raw reads為17 808 860條。測(cè)序clean reads為17 695 827條。經(jīng)組裝和注釋后懷玉山產(chǎn)三葉青葉綠體基因組為共價(jià)閉合的雙鏈環(huán)狀分子(圖1),長(zhǎng)160 165 bp,具有典型的四分體結(jié)構(gòu),由1個(gè)LSC、2個(gè)IR(1個(gè)IRa和1個(gè)IRb)和1個(gè)SSC共4部分組成,其中,LSC、SSC、IRa和IRb區(qū)的長(zhǎng)度分別為88 172、18 963、26 515和26 515 bp?;蚪M的總GC含量為37.50%,其中,LSC、SSC、IRa和IRb區(qū)的GC含量分別為35.50%、31.76%、42.89%和42.89%。
對(duì)懷玉山產(chǎn)三葉青葉綠體基因組進(jìn)行在線(xiàn)注釋?zhuān)Y(jié)果見(jiàn)表1。由表1可知,共注釋到光合作用基因、自我復(fù)制基因、其他基因和未知功能基因4類(lèi),包括88個(gè)CDS基因、37個(gè)tRNA基因和8個(gè)rRNA基因,共133個(gè)基因。對(duì)有多個(gè)外顯子的葉綠體基因進(jìn)行結(jié)構(gòu)分析,由2個(gè)外顯子構(gòu)成的基因有19個(gè),包括8個(gè)CDS基因和13個(gè)tRNA基因,其中有2個(gè)基因在IR區(qū)重復(fù);由4個(gè)外顯子構(gòu)成的基因有4個(gè),均為4個(gè)tRNA基因;完全在LSC區(qū)的基因有82個(gè);完全在SSC區(qū)的基因有12個(gè);完全在IRb和IRa區(qū)的基因有17個(gè);在SSC-IRb junction的基因有1個(gè);在LSC-IRb junction的基因有1個(gè);在SSC-IRa junction的基因有1個(gè);在LSC-IRa junction無(wú)基因;rps12有2個(gè)拷貝,每個(gè)拷貝具有3個(gè)外顯子,且2個(gè)拷貝共享第一個(gè)外顯子,第一個(gè)外顯子位于LSC區(qū)域,另外2個(gè)外顯子位于IR區(qū)域。
圖1 懷玉山產(chǎn)三葉青葉綠體基因組圖譜
表1 懷玉山產(chǎn)三葉青葉綠體基因功能分類(lèi)
Fig.1 Chloroplast gene functional classification offrom Huaiyu Mountain
基因功能基因類(lèi)型基因名基因數(shù)量 光合作用光系統(tǒng)psaA、psaB、psaC、psaI、psaJ 5 光系統(tǒng)ⅡpsaJ、psbA、psbB、psbC、psbD、psbE、psbF、psbH、psbI、psbK、psbL、psbM、psbT、psbZ14 NADH 脫氫酶ndhA、ndhB、ndhB、ndhC、ndhD、ndhE、ndhF、ndhG、ndhH、ndhI、ndhJ、ndhK12 細(xì)胞色素b /f 復(fù)合體petA、petB、petD、petG、petL、petN 6 ATP合成酶atpA、atpB、atpE、atpF、atpH、atpI 6 自我復(fù)制核糖體大亞基蛋白質(zhì)rpl14、rpl16、rpl2、rpl2、rpl20、rpl22、rpl23、rpl23、rpl32、rpl33、rpl3611 核糖體小亞基蛋白質(zhì)rps11、rps12、rps12、rps14、rps15、rps16、rps18、rps19、rps2、rps3、rps4、rps7、rps7、rps814 核糖體大亞基rbcL 1 RNA聚合酶rpoA、rpoB、rpoC1、rpoC2 4 核糖體RNArrn16、rrn16、rrn23、rrn23、rrn4.5、rrn4.5、rrn5、rrn5 8 轉(zhuǎn)運(yùn)RNA trnC-GCA、trnD-GUC、trnF-GAA、trnG-GCC、trnH-GUG、trnI-CAU、trnI-CAU、trnK-UUU trnTERM-UUA、trnL-CAA、trnL-CAA、trnL-UAA、trnL-UAG、trnM-CAU、trnN-GUU、trnN-GUU、trnP-UGG、trnQ-UUG、trnR-ACG、trnR-ACG、trnR-UCU、trnS-GCU、trnS-GGA、trnS-UGA、trnT-UGU、trnV-GAC、trnV-GAC、trnV-UAC、trnW-CCA、trnY-GUA、trnfM-CAU30 其他基因成熟酶matK 1 蛋白酶clpP1 1 囊膜蛋白cemA 1 乙酰輔酶A羧化酶accD 1 C-型細(xì)胞色素合成基因ccsA 1 翻譯起始因子infA 1 未知功能基因保守假設(shè)葉綠體閱讀框架ycf1、ycf1、ycf15、ycf15、ycf2、ycf2 6
懷玉山產(chǎn)三葉青葉綠體基因組中SSR的類(lèi)型及分布見(jiàn)表2。由表2可知,在懷玉山產(chǎn)三葉青葉綠體基因組中共檢測(cè)到63個(gè)SSR位點(diǎn),其中,單堿基重復(fù)有56個(gè),雙堿基重復(fù)有7個(gè),其中,重復(fù)單元為A、重復(fù)頻率為10的SSR位點(diǎn)數(shù)量最多(7),重復(fù)單元為T(mén)、重復(fù)頻率為10的SSR位點(diǎn)數(shù)量最多(11),重復(fù)單元為A/T的最高重復(fù)頻率為18。
懷玉山產(chǎn)三葉青IR區(qū)邊界結(jié)構(gòu)差異分析見(jiàn)圖2。由圖2可知,11種葡萄科植物葉綠體基因組結(jié)構(gòu)從LSC中間呈線(xiàn)性展開(kāi),均由1個(gè)LSC區(qū)、1個(gè)SSC和2個(gè)反向重復(fù)區(qū)(IRa和IRb)4部分組成,各個(gè)區(qū)域間對(duì)應(yīng)的連接基因相同。除了的基因位于接近JLB邊界的LSC區(qū)外,其他10種植物浙江產(chǎn)三葉青、扁擔(dān)藤、毛五葉崖爬藤、、烏蘞莓、祖提葡萄翁、矮葡萄甕、、桑德森葡萄翁的基因橫跨 JLB邊界;基因位于接近JLB邊界的LSC區(qū);基因位于接近JLB邊界的IRb區(qū)和接近JLA邊界的IRa區(qū);基因橫跨JSB邊界和JSA邊界;除了烏蘞莓和的基因橫跨JSB邊界外,其他9種植物浙江產(chǎn)三葉青、扁擔(dān)藤、毛五葉崖爬藤、、、祖提葡萄翁、矮葡萄翁、桑德森葡萄翁的基因位于接近JSB邊界的SSC區(qū);基因和基因位于接近JLA邊界的LSC區(qū)。由IR區(qū)邊界擴(kuò)張和收縮情況看,葡萄科植物、、和4個(gè)基因位置和長(zhǎng)度在屬間差異明顯,基因位置和長(zhǎng)度不太一致。懷玉山產(chǎn)三葉青和浙江產(chǎn)三葉青基因和基因一致,但具有位置和長(zhǎng)度的特異性,與烏蘞莓屬和葡萄翁屬組間差異明顯,說(shuō)明基因和基因不同程度的擴(kuò)張和伸縮導(dǎo)致了不同物種間的IR和SSC區(qū)長(zhǎng)度差異。
表2 懷玉山產(chǎn)三葉青葉綠體基因組中SSR的類(lèi)型及分布
Table 2 Type and distribution of SSR in chloroplast genome of T. hemsleyanum from Huaiyu Mountain
重復(fù)單元堿基類(lèi)型重復(fù)單元重復(fù)次數(shù)總數(shù) 5678910111213141516171819 A????? 7 5 522?2???23 C????? 1????????? 1 T?????11 8 543????132 AT??11? 2????????? 4 CT??1???????????? 1 TA?11???????????? 2 A/T?????18131065?2??155 C/G????? 1????????? 1 AG/CT??1???????????? 1 AT/AT?121 2????????? 6
JLB-LSC和IRb區(qū)的邊界 JSB-IRb和SSC區(qū)的邊界 JSA-SSC和IRa區(qū)的邊界 JLA-IRa和LSC區(qū)的邊界
以懷玉山產(chǎn)三葉青為參考,使用mVISTA在線(xiàn)軟件對(duì)11種葡萄科植物葉綠體基因組進(jìn)行全序列比對(duì),以分析11種葡萄科植物葉綠體基因組序列的差異。結(jié)果表明,崖爬藤屬、烏蘞莓屬、葡萄翁屬植物的基因組變化較大,但崖爬藤屬植物的基因組較為保守,特別是懷玉山產(chǎn)三葉青和浙江產(chǎn)三葉青之間的基因組較為穩(wěn)定(圖3)。使用滑動(dòng)窗口計(jì)算高度可變區(qū)域的核苷酸多樣性,以估計(jì)所分析11種葡萄科植物葉綠體基因組中不同區(qū)域的差異水平。結(jié)果表明,核苷酸多樣性的變化范圍為0~0.234 18,基因間隔區(qū)、以及基因變異率最高(圖4),以上結(jié)果與mVISTA軟件分析結(jié)果一致。
懷玉山產(chǎn)三葉青氨基酸RSCU見(jiàn)表3和圖5。由表3和圖5可知RSCU值大于1.00的密碼子共有30個(gè)(終止密碼子除外),其中,有29個(gè)以A或U結(jié)尾,有1個(gè)以G結(jié)尾,說(shuō)明懷玉山產(chǎn)三葉青葉綠體基因組的密碼子偏好以A或U結(jié)尾。RSCU值等于1的密碼子有1個(gè),表明該密碼子使用無(wú)偏好性。RSCU值大于1.60的密碼子為編碼Ala的GCU、編碼Arg的AGA、編碼Gly的GGA、編碼Leu的UUA、編碼Tyr的UAU、編碼Thr的ACU、編碼Ser的UCU、編碼Met的AUG。RSCU值小于0.60的密碼子包括編碼Ala的GCG、編碼Arg的CGC和CGG、編碼Asn的AAC、編碼Asp的GAC、編碼Cys的UGC、編碼Gln的CAG、編碼Glu的GAG、編碼Gly的GGC、編碼His的CAC、編碼Leu的CUC和CUG、編碼Lys的AAG、編碼Met的GUG、編碼Pro的CCG、編碼Ser的AGC和UCG、編碼Thr的ACG、編碼Tyr的UAC、編碼Val的GUC和GUG。綜上所述,懷玉山產(chǎn)三葉青葉綠體基因組高頻率使用GCU、AGA、GGA、UUA、UAU、ACU、UCU、AUG分別編碼Ala、Arg、Gly、Leu、Tyr、Thr、Ser和Met,低頻率使用GCG、CGC和CGG、AAC、GAC、UGC、CAG、GAG、GGC、CAC、CUC和CUG、AAG、GUG、CCG、AGC和UCG、ACG、UAC、GUC和GUG分別編碼Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Leu、Lys、Met、Pro、Ser、Thr、Tyr和Val。
圖3 11種葡萄科植物葉綠體基因組的可視化比對(duì)圖
圖4 11種葡萄科植物葉綠體基因組核苷酸多樣性
表3 懷玉山產(chǎn)三葉青氨基酸的RSCU
Table 3 RSCU of amino acids of T. hemsleyanum from Huaiyu Mountain
密碼子氨基酸 RSCU數(shù)量密碼子氨基酸RSCU數(shù)量 GCAAla1.101 780 0387UUALeu1.791 490 0842 GCCAla0.643 416 0226UUGLeu1.238 300 0582 GCGAla0.438 434 0154AAALys1.467 320 01044 GCUAla1.816 370 0638AAGLys0.532 677 0379 AGAArg1.911 730 0527AUGMet1.993 800 0643 AGGArg0.634 825 0175GUGMet0.006 201 52 CGAArg1.356 710 0374UUCPhe0.748 021 0567 CGCArg0.362 757 0100UUUPhe1.251 980 0949 CGGArg0.449 819 0124CCAPro1.153 500 0325 CGUArg1.284 160 0354CCCPro0.716 948 0202 AACAsn0.457 358 0303CCGPro0.546 584 0154 AAUAsn1.542 640 01022CCUPro1.582 960 0446 GACAsp0.403 950 0225AGCSer0.353 444 0124 GAUAsp1.596 050 0889AGUSer1.162 950 0408 UGCCys0.577 640 093UCASer1.282 660 0450 UGUCys1.422 360 0229UCCSer0.963 420 0338 CAAGln1.543 270 0740UCGSer0.544 418 0191 CAGGln0.456 726 0219UCUSer1.693 110 0594 GAAGlu1.509 540 01068UAATer1.465 910 043 GAGGlu0.490 459 0347UAGTer0.784 091 023 GGAGly1.640 860 0747UGATer0.750 000 022 GGCGly0.366 831 0167ACAThr1.255 300 0429 GGGGly0.645 799 0294ACCThr0.711 046 0243 GGUGly1.346 510 0613ACGThr0.418 435 0143 CACHis0.486 983 0159ACUThr1.615 220 0552 CAUHis1.513 020 0494UGGTrp1.000 000 0471 AUAIle0.898 172 0688UACTyr0.378 270 0188 AUCIle0.629 243 0482UAUTyr1.621 730 0806 AUUIle1.472 580 01128GUAVal1.488 950 0539 CUALeu0.859 574 0404GUCVal0.527 624 0191 CUCLeu0.425 532 0200GUGVal0.585 635 0212 CUGLeu0.434 043 0204GUUVal1.397 790 0506 CUULeu1.251 060 0588
下面方塊代表編碼每種氨基酸的所有密碼子,上方柱子的高度代表所有密碼子RSCU值的總和
利用Codon W和CUSP在線(xiàn)軟件對(duì)11種葡萄科植物葉綠體基因組的88條CDS進(jìn)行密碼子組成成分分析(圖6)。由圖6可知,11種葡萄科植物的T3和A3含量高于G3含量,表明11種葡萄科植物的第3位堿基以A/T為主。對(duì)11種葡萄科植物各基因密碼子的GC含量進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)GC3含量(29.18%)均低于GC1(45.90%)和GC2(39.87%),表明GC在密碼子不同位置上的分布并不均勻,GC1、GC2、GC3呈現(xiàn)不斷降低的趨勢(shì)。大部分基因的ENC值都在40以上。ENC的取值大小側(cè)面反映了密碼子偏性的強(qiáng)弱,值越高偏性越弱,懷玉山產(chǎn)三葉青各基因的ENC值介于26.167~61.000,平均值為46.88,其中ENC值大于45的有59個(gè),小于45的僅有29個(gè),表明懷玉山產(chǎn)三葉青葉綠體基因組密碼子具有較強(qiáng)的偏好性。
11種葡萄科植物葉綠體基因組密碼子GC3-GC12分析分析結(jié)果見(jiàn)圖7。由圖7可知,GC3-GC12分析發(fā)現(xiàn)11種葡萄科植物葉綠體基因的GC3含量分布在0.15~0.50,GC12含量分布在0.30~0.60,二者的分布范圍都比較集中,且沿著對(duì)角線(xiàn)上方分布。兩者的相關(guān)系數(shù)=0.01(2=0.000 1),相關(guān)顯著,表明密碼子偏好性主要受突變影響,受選擇因素影響較小?;貧w曲線(xiàn)斜率為0.015 2,說(shuō)明密碼子第1、2位與第3位堿基組成偏好性差異較小,突變對(duì)密碼子偏好性的影響較強(qiáng),而其他因素,如自然選擇可能對(duì)密碼子的偏好性影響較小。
ENC-plot分析主要用于判斷密碼子偏好性是否被突變或選擇等因素影響,11種葡萄科植物的ENC-plot分析見(jiàn)圖8。由圖8可知,部分基因位點(diǎn)沿標(biāo)準(zhǔn)曲線(xiàn)分布或落在標(biāo)準(zhǔn)曲線(xiàn)附近,表明這些基因?qū)嶋HENC值與預(yù)期值相近;另外一部分基因位點(diǎn)落在期望值的下方,說(shuō)明實(shí)際ENC值與預(yù)期ENC值之間存在差異,說(shuō)明11種葡萄科植物葉綠體基因組有一部分基因的密碼子偏好性受到突變的影響較大,而受到選擇效應(yīng)的影響相對(duì)較小。
通過(guò)PR2-plot分析,11種葡萄科植物葉綠體基因組中由4個(gè)密碼子編碼的氨基酸家族中第3位上嘌呤(A、G)和嘧啶(T、C)的使用情況見(jiàn)圖9。
GC12表示密碼子第1、2位GC含量的平均值;GC3表示密碼子第3位的GC含量 A~K分別代表懷玉山產(chǎn)三葉青、浙江產(chǎn)三葉青、扁擔(dān)藤、毛五葉崖爬藤、Tetrastigma rafflesiae、Tetrastigma lawsonii、烏蘞莓、祖提葡萄翁、矮葡萄翁、Cyphostemma adenopodum和桑德森葡萄翁,下同
圖7 11種葡萄科植物葉綠體基因組密碼子GC3-GC12分析
由圖9可知,基因不均勻地分布于平面圖的4個(gè)區(qū)域內(nèi),平面圖左上方基因分布較多,說(shuō)明密碼子第3位堿基的使用存在偏性,而且T的使用頻率低于A,C的使用頻率高于G。當(dāng)密碼子使用偏好只受突變影響時(shí),4種堿基的使用頻率應(yīng)相等。因此,11種葡萄科植物葉綠體基因組密碼子使用模式不僅受到突變影響,同時(shí)還受到如選擇壓力等其他因素的影響。
圖8 11種葡萄科植物葉綠體基因組密碼子ENC-plot分析
對(duì)懷玉山產(chǎn)三葉青葉綠體基因的ENC值進(jìn)行排序,分別選取兩端基因各5個(gè),構(gòu)建高表達(dá)基因庫(kù)(ENC值?。┖偷捅磉_(dá)基因庫(kù)(ENC值大),并計(jì)算二者的RSCU差值(ΔRSCU)。篩選ΔRSCU≥0.08的高表達(dá)密碼子,且RSCU>1的高頻率密碼子定義為懷玉山產(chǎn)三葉青葉綠體基因組的最優(yōu)密碼子(表4)。由表4可知,懷玉山產(chǎn)三葉青有31個(gè)高頻密碼子,16個(gè)以U結(jié)尾,13個(gè)以A結(jié)尾,2個(gè)以G結(jié)尾,其中有13個(gè)為最優(yōu)密碼子(6個(gè)以U結(jié)尾,7個(gè)以A結(jié)尾)。
圖9 11種葡萄科植物葉綠體基因組密碼子PR2-plot分析
基于6個(gè)崖爬藤屬種類(lèi)1個(gè)烏蘞莓屬種類(lèi)、4個(gè)葡萄翁屬種類(lèi)、1個(gè)牛果藤屬種類(lèi)和1個(gè)菱葉藤屬種類(lèi)的葉綠體基因組構(gòu)建的系統(tǒng)發(fā)育樹(shù)見(jiàn)圖10。由圖10可知,在崖爬藤屬植物中,懷玉山產(chǎn)三葉青(SYQ)、浙江產(chǎn)三葉青(NC_029339)、扁擔(dān)藤、毛五葉崖爬藤、、和烏蘞莓聚為一大支;祖提葡萄翁、矮葡萄翁、、桑德森葡萄翁聚為一支;牛果藤和菱葉藤聚為一大支,但懷玉山產(chǎn)三葉青與浙江產(chǎn)三葉青聚為一小支。說(shuō)明聚在一支的崖爬藤屬植物種類(lèi)親緣關(guān)系較近,崖爬藤屬植物與烏蘞莓屬、葡萄翁屬、牛果藤屬和菱葉藤屬植物親緣關(guān)系較遠(yuǎn)。
表4 懷玉山產(chǎn)三葉青葉綠體基因最優(yōu)密碼子篩選
Table 4 Screening of optimal codons for chloroplast genes of T. hemsleyanum from Huaiyu Mountain
密碼子氨基酸RSCU數(shù)量RSCU低表達(dá)數(shù)量RSCU高表達(dá)數(shù)量RSCU差值 GCUAla1.816 37638 1.655 170121.655 170 UUALeu1.791 498421.034 48051.866 670140.832 190 UCUSer1.693 115940.272 72711.785 710101.512 983 GGAGly1.640 867471.333 33062.074 070140.740 740 GAUAsp1.596 058890.800 00021.428 570100.628 570 CCUPro1.582 964461.538 46051.882 350 80.343 890 CAAGln1.543 277401.200 00031.733 330130.533 330 GUAVal1.488 955391.142 86041.454 550120.311 690 UAATer1.465 91430.600 00011.200 000 30.600 000 CGUArg1.284 163540.833 33351.315 790 50.482 457 UCASer1.282 664501.636 36061.964 290110.327 930 UUUPhe1.251 989491.230 77081.680 000210.449 230 CCAPro1.153 503250.615 38520.705 882 30.090 497
圖10 基于葉綠體基因組的葡萄科13個(gè)種類(lèi)的系統(tǒng)發(fā)育樹(shù)
基于8個(gè)三葉崖爬藤[懷玉山產(chǎn)三葉青(SYQ)、福建產(chǎn)三葉青(MW375708)、廣西產(chǎn)三葉青(MW375709)、浙江產(chǎn)三葉青(MT827073)、浙江產(chǎn)三葉青(MW375707)、浙江產(chǎn)三葉青(KT033563)(NC_029339)、四川三葉青(MW375710)、浙江產(chǎn)三葉青(MW375711)]、扁擔(dān)藤、毛五葉崖爬藤、、Wen12461牛果藤和菱葉藤的葉綠體基因組構(gòu)建的系統(tǒng)發(fā)育樹(shù)見(jiàn)圖11。由圖11可知,三葉青聚為2大類(lèi),其中一類(lèi)包括福建產(chǎn)三葉青(MW375708)、廣西產(chǎn)三葉青(MW375709)、浙江產(chǎn)三葉青(MT827073)、浙江產(chǎn)三葉青(MW375707)和浙江產(chǎn)三葉青(KT033563)(NC_029339),另一類(lèi)包括四川三葉青(MW375710)和浙江產(chǎn)三葉青(MW375711)。而在第一類(lèi)中,浙江產(chǎn)三葉青KT033563(NC_029339)單獨(dú)成一小支,浙江產(chǎn)三葉青(MT827073)和浙江產(chǎn)三葉青(MW375707)單獨(dú)成一小支,懷玉山產(chǎn)三葉青(SYQ)、福建產(chǎn)三葉青MW375708和廣西產(chǎn)三葉青(MW375709)單獨(dú)成一小支。說(shuō)明懷玉山產(chǎn)三葉青(SYQ)、福建產(chǎn)三葉青(MW375708)和廣西產(chǎn)三葉青(MW375709)親緣關(guān)系較近。
圖11 基于葉綠體基因組的葡萄科15個(gè)種類(lèi)的系統(tǒng)發(fā)育樹(shù)
葉綠體是高等植物光合作用和碳固定的重要細(xì)胞器,起到能量轉(zhuǎn)換的作用[13]。在葉綠體基因組中以若干小簇的形式排列的光合作用基因如-、-、-、-、---和---等屬于轉(zhuǎn)錄單位和調(diào)控單位,如葉綠體中的基因都具轉(zhuǎn)錄活性,可編碼NADH-質(zhì)體醌(PQ)氧化還原酶,當(dāng)用PQ氧化抑制劑阻斷光合系統(tǒng)I和II之間的電子傳遞通道時(shí),葉綠體呼吸的電子傳遞則不受影響;葉綠體的和基因可編碼膜上輸送各種代謝物質(zhì)的蛋白質(zhì);約有一半的葉綠體基因包括rRNA、tRNA、RNA多聚酶和核糖體蛋白質(zhì)等基因協(xié)同核基因參與到葉綠體蛋白質(zhì)的合成;葉綠體基因如tRNA和蛋白質(zhì)基因均含有內(nèi)含子,在表達(dá)過(guò)程中需要對(duì)轉(zhuǎn)錄后的RNA分子進(jìn)行拼接加工[14]。
植物葉綠體基因組長(zhǎng)約107~218 kb,其長(zhǎng)短取決于IR區(qū)的收縮和擴(kuò)張[15]。本研究所獲得的懷玉山產(chǎn)三葉青葉綠體基因組大小與結(jié)構(gòu)與已報(bào)道的被子植物研究結(jié)果相符。懷玉山產(chǎn)三葉青葉綠體基因組長(zhǎng)160 165 bp,是一個(gè)典型的四分體結(jié)構(gòu),與浙江產(chǎn)三葉青(159 914 bp)[9-10]、浙江舟山三葉青(152 281 bp)差異小。懷玉山產(chǎn)三葉青葉綠體基因組GC含量為37.50%,與浙江舟山三葉青葉綠體基因組中GC含量(37.5%)一致,與浙江產(chǎn)三葉青葉綠體基因組中GC含量(37.55%)有些差異,懷玉山產(chǎn)三葉青葉綠體基因組IRs區(qū)中GC含量達(dá)到最高(42.98%),與浙江舟山三葉青IRs中GC含量42.9%有差異[9-10]。懷玉山產(chǎn)三葉青葉綠體基因組LSC區(qū)88 172 bp,SSC區(qū)18 963 bp,IRs區(qū)26 515 bp,與浙江產(chǎn)三葉青(LSC:87 927 bp、SSC:18 967 bp、IRs:26 510 bp)、浙江舟山三葉青(LSC:88 185 bp、SSC:18 966 bp、IRs:26 519 bp)遺傳差異很小,LSC區(qū)域10~250 bp,SSC和IRs區(qū)域相差1~10 bp[9-10]。
通過(guò)IRscope比較分析,發(fā)現(xiàn)葡萄科的11個(gè)物種葉綠體基因組結(jié)構(gòu)和大小差異較大,SC和IR邊界有明顯區(qū)別,基因和基因不同程度的擴(kuò)張和伸縮導(dǎo)致了11個(gè)物種間的IR和SSC區(qū)長(zhǎng)度差異。反向重復(fù)區(qū)域經(jīng)常出現(xiàn)假基因化,在懷玉山產(chǎn)三葉青葉綠體基組中,基因有2個(gè),分別橫跨JSB邊界和JSA邊界,位于JSA邊界的基因長(zhǎng)度為5633 bp(浙江舟山三葉青為5634 bp),為正?;颍晃挥贘SB邊界的基因長(zhǎng)度為1199 bp(浙江舟山三葉青為1200 bp),位于JS邊界的基因的3’端SS區(qū)發(fā)生缺失,僅有56 bp,位于JSB邊界的基因?yàn)橐粋€(gè)假基因[9]。有研究表明,陰暗潮濕等環(huán)境因子的自然選擇,等基因選擇壓力存在差異,導(dǎo)致等基因的進(jìn)化速率也存在差異[16-17],這類(lèi)進(jìn)化速率存在差異的等基因,可以組合成為DNA條形碼用來(lái)分析崖爬藤屬植物的系統(tǒng)發(fā)育[18]。
懷玉山產(chǎn)三葉青葉綠體基因組共注釋出133個(gè)基因,包括88個(gè)基因、37個(gè)tRNA基因和8個(gè)rRNA基因,這與浙江舟山三葉青葉綠體基因組的基因注釋結(jié)果[9]一致。懷玉山產(chǎn)三葉青葉綠體基因組沒(méi)有檢測(cè)到內(nèi)含子,僅個(gè)別基因具1~2個(gè)含子。其中基因具2個(gè)內(nèi)含子,而浙江舟山三葉青葉綠體基因組和基因具2個(gè)內(nèi)含子,且懷玉山產(chǎn)三葉青葉綠體基因組沒(méi)有注釋到基因。值得一提的是懷玉山產(chǎn)三葉青葉綠體基因組注釋到6個(gè)未知功能基因[(2)、(2)、(2)],而浙江舟山三葉青葉綠體基因組未知功能基因有7個(gè),注釋到了1個(gè)基因[9]。基因和基因可能是造成懷玉山產(chǎn)三葉青與浙江舟山三葉青品質(zhì)差異的2個(gè)候選基因,其功能需進(jìn)一步利用先進(jìn)的分子技術(shù)手段對(duì)其功能進(jìn)行鑒定。在本研究中,基于VISTA tools和DNADnaSP6.0軟件分析結(jié)果表明,在11種葡萄科植物存在一些變異率較高的區(qū)段,如、以及基因等,今后這些變異熱點(diǎn)區(qū)段,或許可以也作為新的DNA條形碼,用于崖爬藤屬植物的物種鑒定和系統(tǒng)發(fā)育關(guān)系等方面的研究[9]。
葉綠體SSR為短的單核苷酸串聯(lián)重復(fù)序列,位于葉綠體基因組非編碼區(qū)域時(shí),通常顯示種內(nèi)變異重復(fù)次數(shù)[19],在同一物種表現(xiàn)高度變異,廣泛用于群體遺傳學(xué)和系統(tǒng)發(fā)育分析等領(lǐng)域[20-21]。懷玉山產(chǎn)三葉青葉綠體基因組共檢測(cè)到63個(gè)SSR位點(diǎn),單堿基重復(fù)有56個(gè),雙堿基重復(fù)有7個(gè),其中,單重復(fù)單元為A或T重復(fù)頻率為10的SSR位點(diǎn)數(shù)量最多,重復(fù)單元為A/T的最高重復(fù)頻率最高,這與其他植物科[22]中的報(bào)道一致,懷玉山產(chǎn)三葉青葉綠體基因組SSR位點(diǎn)可為崖爬藤屬物種分子標(biāo)記開(kāi)發(fā)及物種鑒定提供理論依據(jù)。
核酸組成成分顯著影響核基因密碼子使用偏好性,自然選擇和變異方向在葉綠體基因組密碼子使用偏好性中起到重要作用[23]。在本研究中,懷玉山產(chǎn)三葉青葉綠體基因組RSCU值大于1.00的密碼子共有30個(gè)(終止密碼子除外),其中有29個(gè)以A或U結(jié)尾,有1個(gè)以G結(jié)尾,這一結(jié)果與大多數(shù)被子植物葉綠體基因組的研究結(jié)果類(lèi)似,都偏好使用A或U結(jié)尾的密碼子[24-25]。以葉綠體基因組為對(duì)象,RSCU值>1.60時(shí),為高使用頻率密碼子,RSCU值<0.60時(shí)為低使用頻率密碼子[26],在本研究中,懷玉山產(chǎn)三葉青葉綠體基因組高頻率使用GCU、AGA、GGA、UUA、UAU、ACU、UCU、AUG分別編碼Ala、Arg、Gly、Leu、Tyr、Thr、Ser和Met,低頻率使用GCG、CGC和CGG、AAC、GAC、UGC、CAG、GAG、GGC、CAC、CUC和CUG、AAG、GUG、CCG、AGC和UCG、ACG、UAC、GUC和GUG分別編碼Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Leu、Lys、Met、Pro、Ser、Thr、Tyr和Val。假設(shè)核苷酸堿基變異發(fā)生在密碼子第3位,那么在基因或基因組中簡(jiǎn)并密碼子A、T和C、G所占比例相當(dāng)[27]。本研究通過(guò)PR2-plot分析發(fā)現(xiàn),基因不均勻地分布于平面圖的4個(gè)區(qū)域內(nèi),平面圖左上方基因分布較多,密碼子第3位堿基的使用存在偏性,T使用頻率低于A,C使用頻率高于G,說(shuō)明懷玉山產(chǎn)三葉青葉綠體基因組受堿基突變和自然選擇的雙重影響。本研究GC3-GC12分析表明,密碼子第1、2位與第3位堿基組成偏好性差異較小,突變對(duì)密碼子偏好性的影響較強(qiáng),而其他因素如自然選擇可能對(duì)密碼子的偏好性影響較小。有研究表明,低等生物體中如細(xì)菌和古生菌,富含GC的物種通常擁有GC含量較高的最優(yōu)密碼子[28];反之,富含AU的物種,最優(yōu)密碼子AU含量較高[29]。本研究結(jié)果與此一致,懷玉山產(chǎn)三葉青有31個(gè)高頻密碼子,16個(gè)以U結(jié)尾,13個(gè)以A結(jié)尾,2個(gè)以G結(jié)尾,其中有13個(gè)為最優(yōu)密碼子(6個(gè)以U結(jié)尾,7個(gè)以A結(jié)尾),最優(yōu)密碼子多以A或U堿基結(jié)尾,可為葉綠體是通過(guò)內(nèi)共生方式從藍(lán)細(xì)菌進(jìn)化而來(lái)的觀點(diǎn)提供依據(jù)[30]。
葉綠體基因組信息量較大,且其結(jié)構(gòu)、大小和基因組成相對(duì)恒定,已廣泛應(yīng)用于系統(tǒng)進(jìn)化分析。蔣明等[9]和Li等[10]分別構(gòu)建了三葉崖爬藤、赤蒼藤、葡萄、夏葡萄、東北蛇葡萄、槭葉葡萄等12種植物和三葉崖爬藤、葡萄等40種植物葉綠體基因組的系統(tǒng)發(fā)生樹(shù),均發(fā)現(xiàn)崖爬藤屬的三葉崖爬藤單獨(dú)聚為一組,與葡萄屬較為接近。本研究結(jié)果與此研究結(jié)果一致,本研究構(gòu)建了6個(gè)崖爬藤屬種類(lèi)、1個(gè)烏蘞莓屬種類(lèi)、4個(gè)葡萄翁屬種類(lèi)、1個(gè)牛果藤屬種類(lèi)和1個(gè)菱葉藤屬種類(lèi)葉綠體基因組的系統(tǒng)發(fā)育樹(shù),發(fā)現(xiàn)懷玉山產(chǎn)三葉青與浙江產(chǎn)三葉青聚為一小支,說(shuō)明聚在一支的崖爬藤屬植物種類(lèi)親緣關(guān)系較近,崖爬藤屬植物與烏蘞莓屬、葡萄翁屬、牛果藤屬和菱葉藤屬植物親緣關(guān)系較遠(yuǎn)。本研究還構(gòu)建了懷玉山產(chǎn)三葉青、福建產(chǎn)三葉青、廣西產(chǎn)三葉青、浙江產(chǎn)三葉青、四川三葉青葉綠體基因組構(gòu)建的系統(tǒng)發(fā)育樹(shù),發(fā)現(xiàn)懷玉山產(chǎn)三葉青、福建產(chǎn)三葉青和廣西產(chǎn)三葉青聚為一小支,說(shuō)明懷玉山產(chǎn)三葉青與福建產(chǎn)三葉青和廣西產(chǎn)三葉青親緣關(guān)系較近,與浙江產(chǎn)三葉青、四川三葉青和浙江產(chǎn)三葉青親緣關(guān)系較遠(yuǎn),說(shuō)明三葉青之間的親緣關(guān)系與地理位置相關(guān)性不大,這也證實(shí)了尹明華等[31]利用SSR熒光標(biāo)記分析三葉青64個(gè)種質(zhì)遺傳多樣性和親緣關(guān)系的結(jié)論。本研究獲得了懷玉山產(chǎn)三葉青葉綠體基因組的基本信息及其系統(tǒng)發(fā)育關(guān)系,為懷玉山產(chǎn)三葉青的遺傳多樣性保護(hù)、生產(chǎn)性狀、系統(tǒng)演化等相關(guān)研究提供數(shù)據(jù)基礎(chǔ),也為懷玉山產(chǎn)三葉青種質(zhì)鑒定、DNA條形碼開(kāi)發(fā)提供了新思路。
利益沖突 所有作者均聲明不存在利益沖突
[1] Zhan L H, Pu J B, Zheng J R,.Diels et Gilg ameliorates lipopolysaccharide induced sepsis via repairing the intestinal mucosal barrier [J]., 2022, 148: 112741.
[2] Yang L, Shi Y S, Ruan X,. Salt interferences to metabolite accumulation, flavonoid biosynthesis and photosynthetic activity in[J]., 2022, 194: 104765.
[3] Liu Y Y, Li Y L, Chen W,.flavones exert antihepatic carcinoma property both in vitro and in vivo [J]., 2021, 5: 9-16.
[4] Bobik K, Burch-Smith T M. Chloroplast signaling within, between and beyond cells [J]., 2015, 6: 781.
[5] Shahzadi I, Abdullah, Mehmood F,. Chloroplast genome sequences ofand: Comparative analyses, mutational hotspots in genus Artemisia and phylogeny in family Asteraceae [J]., 2020, 112(2): 1454-1463.
[6] Liu Y C, Li Y T, Feng S X,. Complete chloroplast genome structure of four Ulmus species andand comparative analysis within Ulmaceae species [J]., 2022, 12(1): 15953.
[7] Meng J, Li X P, Li H T,. Comparative analysis of the complete chloroplast genomes of four Aconitum medicinal species [J]., 2018, 23(5): 1015.
[8] 孫健, 沈曉霞, 陳加紅, 等. 藥用植物三葉青種質(zhì)多樣性與栽培管理的研究進(jìn)展 [J]. 科技通報(bào), 2018, 34(1): 13-17.
[9] 蔣明, 王軍峰, 應(yīng)夢(mèng)豪, 等. 三葉崖爬藤葉綠體基因組的組裝與序列分析 [J]. 中草藥, 2020, 51(2): 461-468.
[10] Li M Z, Chen Q Y, Yang B X,. The complete chloroplast genome sequence ofDiels at Gilg [J]., 2016, 27(5): 3729-3730.
[11] 尹明華, 謝妮妮, 徐文慧, 等. 三葉青種質(zhì)資源遺傳多樣性的ISSR分析 [J]. 中草藥, 2018, 49(20): 4884-4891.
[12] 林國(guó)衛(wèi), 聞靜, 石光禹, 等. 侵染懷玉山產(chǎn)三葉青的病毒RT-PCR鑒定 [J]. 分子植物育種, 2020, 18(3): 968-975.
[13] Neuhaus H E, Emes M J. Nonphotosynthetic metabolism in plastids [J]., 2000, 51: 111-140.
[14] Grevich J J, Daniell H. Chloroplast genetic engineering: Recent advances and future perspectives [J]., 2005, 24(2): 83-107.
[15] Yu J Y, Xia M Z, Xu H,. The complete chloroplast genome sequence of(Asteraceae) [J]., 2021, 6(2): 430-431.
[16] Yang X F, Wang Y T, Chen S T,. PBR1 selectively controls biogenesis of photosynthetic complexes by modulating translation of the large chloroplast gene Ycf1 in[J]., 2016, 2: 16003.
[17] Vitti J J, Grossman S R, Sabeti P C. Detecting natural selection in genomic data [J]., 2013, 47: 97-120.
[18] 裴男才. 利用植物DNA條形碼構(gòu)建亞熱帶森林群落系統(tǒng)發(fā)育關(guān)系: 以鼎湖山樣地為例 [J]. 植物分類(lèi)與資源學(xué)報(bào), 2012, 34(3): 263-270.
[19] Provan J, Powell W, Hollingsworth P M. Chloroplast microsatellites: New tools for studies in plant ecology and evolution [J]., 2001, 16(3): 142-147.
[20] Wills D M, Hester M L, Liu A Z,. Chloroplast SSR polymorphisms in the Compositae and the mode of organellar inheritance in[J]., 2005, 110(5): 941-947.
[21] Ebrahimi A, Zarei A, Zamani F M,. Evaluation of genetic variability among early mature Juglans regia using microsatellite markers and morphological traits [J]., 2017, 5: e3834.
[22] 孫哲, 李澳旋, 杜曉蓉, 等. 房山紫堇葉綠體基因組特征及其系統(tǒng)進(jìn)化關(guān)系 [J]. 草地學(xué)報(bào), 2022, 30(8): 1982-1989.
[23] Pechmann S, Frydman J. Evolutionary conservation of codon optimality reveals hidden signatures of cotranslational folding [J]., 2013, 20(2): 237-243.
[24] 楊亞蒙, 焦健, 樊秀彩, 等. 桑葉葡萄葉綠體基因組及其特征分析 [J]. 園藝學(xué)報(bào), 2019, 46(4): 635-648.
[25] Zhou M, Long W, Li X. Patterns of synonymous codon usage bias in chloroplast genomes of seed plants [J]., 2008, 10(4): 235-242.
[26] Mukhopadhyay P, Basak S, Ghosh T C. Nature of selective constraints on synonymous codon usage of rice differs in GC-poor and GC-rich genes [J]., 2007, 400(1/2): 71-81.
[27] Liu Q P, Xue Q Z. Comparative studies on codon usage pattern of chloroplasts and their host nuclear genes in four plant species [J]., 2005, 84(1): 55-62.
[28] Nekrutenko A, Li W H. Assessment of compositional heterogeneity within and between eukaryotic genomes [J]., 2000, 10(12): 1986-1995.
[29] Hershberg R, Petrov D A. General rules for optimal codon choice [J]., 2009, 5(7): e1000556.
[30] Raven J A, Allen J F. Genomics and chloroplast evolution: What did cyanobacteria do for plants? [J]., 2003, 4(3): 209.
[31] 尹明華, 徐文慧, 謝妮妮, 等. 三葉青種質(zhì)資源遺傳多樣性的SSR熒光標(biāo)記分析 [J]. 中草藥, 2018, 49(23): 5649-5656.
Phylogenetic relationship and characterization of chloroplast genome offrom Huaiyu Mountain
HONG Sen-rong1, 2, 3, 4, LIU Wen-li1, SONG Bing-yan1, YAN Yu-qing1
1. College of Life Sciences, Shangrao Normal University, Shangrao 334001, China 2. Shangrao Agricultural Technology Innovation Research Institute, Shangrao 334001, China 3. Key Laboratory of protection and utilization of medicinal and edible plant resources in Shangrao City, Shangrao 334001, China 4. ShangraoDiels et Gilg Conservation and Utilization Technology Innovation Center, Shangrao 334001, China
To analyze the genomic information sequence characteristics of the chloroplast offrom Huaiyu Mountain and determine its systematic position in the genus of.The chloroplast genome sequence offrom Huaiyu Mountain was obtained by sequencing with Illumina high throughput sequencing platform NovaSeq6000, and bioinformatics tools such as GeSeq, tRNAscan SE, MISA, VISTA tools, DNADnaSP6.0, JSHYCloud, CodonW1.4.2, Pasteur Galaxy, Mafft 7.0, fasttree 2.1.10 were used for sequence analysis, codon preference analysis, genome comparative analysis and phylogenetic research of.The chloroplast genome offrom Huaiyu Mountain is a covalently closed double stranded ring molecule with a length of 160 165 bp, including 1 LSC, 1 IRa, 1 IRb and 1 SSC; the chloroplast genome offrom Huaiyu Mountain has been annotated with 133 genes in four categories: photosynthesis genes, self-replication genes, other genes and unknown functional genes, including 88 CDS genes, 37 tRNA genes and eight rRNA genes; Sixty three SSR loci were detected in the chloroplast genome offrom Huaiyu Mountain, including 56 single base repeats and seven double base repeats; The variation range of nucleotide diversity of the chloroplast genome offrom Huaiyu Mountain was 0—0.234 18, and the variation rates of,and genewere the highest. The codon of chloroplast genome offrom Huaiyu Mountain had a strong preference for ending in A or U. Mutation had a strong impact on codon preference, while other factors such as natural selection had a small impact on codon preference. The chloroplast genome offrom Huaiyu Mountain had 31 high-frequency codons, 16 ending in U, 13 ending in A, and two ending in G, of which 13 were the optimal ones.from Huaiyu Mountain was close tofrom Fujian MW375708 andfrom Guangxi MW375709, and far fromfrom Zhejiang MT827073,from Zhejiang MW375707,from Zhejiang KT033563 (NC_029339),from Sichuan MW375710 andfrom Zhejiang MW375711, which showed that there was little correlation between the genetic relationship and the geographical location.The genetic relationship betweenis not closely related to its geographical location. In this study, the chloroplast genome offrom Huaiyu Mountain is analyzed comprehensively and deeply for the first time by using bioinformatics analysis method, which will provide theoretical basis for genetic diversity analysis of medicinal plants and genetic breeding research of new strains of.
Diels et Gilg; characterization of chloroplast genome; phylogenetic relationship; large single copy region; small single copy region
R286.12
A
0253 - 2670(2023)16 - 5358 - 14
10.7501/j.issn.0253-2670.2023.16.025
2023-02-03
國(guó)家自然科學(xué)基金資助項(xiàng)目(31960079);2022年上饒市科技專(zhuān)項(xiàng)項(xiàng)目(饒科發(fā)[2023]5號(hào)社發(fā)類(lèi))(2022A008);江西省科技廳重點(diǎn)研發(fā)計(jì)劃一般項(xiàng)目(20202BBG73010);江西省教育廳科學(xué)技術(shù)研究項(xiàng)目(GJJ201704);上饒市科技局平臺(tái)載體建設(shè)項(xiàng)目(2020J001)
洪森榮(1974—),教授,主要從事植物生物技術(shù)研究工作。Tel: (0793)8153721 E-mail: hongsenrong@163.com
[責(zé)任編輯 時(shí)圣明]