朱惠霞, 陶興林, 劉明霞
(甘肅省農業(yè)科學院蔬菜研究所, 蘭州 730070)
花椰菜屬十字花科蕓薹屬甘藍種的變種,原產于地中海沿岸,由野生甘藍演化而來,花球顏色以白色為主,在長期的進化過程中逐漸出現(xiàn)了紫色、橙色、淡綠色等,統(tǒng)稱為彩色花椰菜。彩色花椰菜中含有一些特殊的物質,如紫色花椰菜中的花青素、橙色花椰菜中的類胡蘿卜素、綠色花椰菜中的葉綠素等,具有保護視力、緩解過敏、保護心血管、抗衰老、抗炎和抗癌作用,越來越受到人們的關注[1-5]。在十字花科作物中,通過對油菜、芥菜、蘿卜、芝麻菜、蕪菁、海甘藍、甘藍、西蘭花等葉綠體全基因組的研究[6-16],揭示了部分十字花科葉綠體基因組結構特征,并利用葉綠體基因組在大小、種類以及排列順序的差異[17-19],結合系統(tǒng)發(fā)育分析探討不同十字花科作物屬種間的關系。本研究分析白色、紫色、橙色、淡綠色花椰菜的葉綠體全基因組特征,并進行系統(tǒng)發(fā)育分析,以期闡明花椰菜與十字花科物種之間親緣關系,為彩色花椰菜遺傳關系研究提供基本信息。
試驗材料分別為白色、紫色、橙色、淡綠色花椰菜(BrassicaoleraceaL. var.botrytis),于2019 年3月種植于甘肅省農業(yè)科學院蔬菜研究所試驗地(36.0999°N,103.6900°E),試驗品種均由甘肅省農業(yè)科學院蔬菜研究所提供,4~5片葉片時采集材料嫩葉,干冰保存,送樣進行測試分析。憑證標本存放于甘肅省農業(yè)科學院蔬菜研究所實驗室超低溫冰箱。
1.2.1DNA的提取與測序
提取花椰菜樣品DNA,檢測DNA質量做片段化處理,純化并進行末端修復,再選擇片段擴增,建成測序文庫。質檢合格后用Illumina HiSeq平臺進行測序。
1.2.2葉綠體基因組組裝與注釋
對Raw Data軟件進行數(shù)據過濾,按參考物種的葉綠體基因組序列進行組裝和基因結構注釋,得到完整的花椰菜葉綠體基因組序列。利用BLAST軟件對比NCBI數(shù)據庫(National Center for Biotechnology Information,美國國家生物技術信息中心)葉綠體基因組cds序列,手工校正后獲得最終注釋結果,使用hmmer軟件比對NCBI數(shù)據庫里葉綠體基因組rRNA序列,使用aragorn軟件進行tRNA的預測,分別獲得rRNA和tRNA的注釋信息,利用 OGDRAW 在線軟件繪制花椰菜葉綠體基因組圖譜。
1.2.3SSR位點與密碼子偏好性分析
使用MISA (MIcroSAtellite identification tool)軟件進行葉綠體基因組SSR分析,利用Codon W 1.4.2 軟件檢測花椰菜葉綠體基因組中大于200 bp 蛋白編碼基因的密碼子,然后分析相對密碼子的使用頻率(RSCU)。
1.2.4系統(tǒng)發(fā)育分析
從NCBI數(shù)據庫下載部分十字花科類植物的葉綠體全基因組序列,以紫羅蘭作為外類群,與4種顏色的花椰菜葉綠體基因組進行比對,RAxML軟件,選用GTRGAMMA模型,進行進化樹構建。
獲得4種顏色花椰菜葉綠體基因組信息并上傳NCBI數(shù)據庫,登錄號分別為:橙色花椰菜:MT 499334;白色花椰菜:MT 499335;淡綠色花椰菜:MT 499336;紫色花椰菜:MT 499337?;ㄒ巳~綠體基因組共由4個區(qū)域組成環(huán)狀結構,包括1個88 136~88 138 bp的長單拷貝(LSC)、1個17 834~17 835 bp的短單拷貝區(qū)(SSC)以及2個26 196~26 197 bp的反向重復 (IRa/IRb),淡綠色花椰菜葉綠體基因組全長為153 366 bp,其余3種全長均為153 364 bp,平均GC含量均為36.36%,LSC區(qū)GC含量34.15%,SSC區(qū)GC含量29.10%,IR區(qū)GC含量42.35%(表1)。4種顏色花椰菜均注釋出132個基因,其中,8個為rRNA基因、37個為tRNA基因、87個為蛋白編碼基因,基因數(shù)量與排列順序完全相同,在IR區(qū)重復2次的有19個基因,包括4個rRNA基因、7個tRNA基因和8個蛋白編碼基因(表2)。
表1 花椰菜葉綠體基因組長度和核苷酸含量
表2 花椰菜葉綠體基因組注釋基因
花椰菜葉綠體組中有22個基因具有內含子(表3),其中有12個分布在LSC區(qū),9個分布在IR區(qū),1個分布在SSR區(qū),其中,ycf3、rps12、clpP、rps12分別含有3個外顯子,ycf3和clpP含有2個內含子。分析外顯子和內含子的長度發(fā)現(xiàn),ndhB的外顯子Ⅰ和外顯子Ⅱ最長,分別為777 bp和762 bp,petB的外顯子Ⅰ最短,僅為6 bp,trnK-UUU內含子最長為2 557 bp,trnL-UAA內含子最短為311 bp。
圖1 花椰菜葉綠體基因圖譜
表3 花椰菜葉綠體基因組中具有內含子基因長度
在花椰菜葉綠體基因組的67個編碼序列中(表4),有32個密碼子的RSCU值大于1.00,為高頻密碼子,其中,以A結尾的13個,以U結尾的16個,其余3個以G結尾,以A或U結尾的同義密碼子占90.6%;34個RSCU值小于1.00的密碼子中,以G結尾的有13個,以C結尾的有17個,以A結尾的有4個,以G或C結尾的密碼子占88.2%;有1個密碼子RSCU值等于1。RSCU值最大和最小的密碼子均編碼甲硫氨酸(Met),其中密碼子AUG的RSCU值最大,為3.97,密碼子AUC的RSCU值最小,僅為0.01。亮氨酸(Leu)為編碼率最高的氨基酸(圖2),由CUA、CUC、CUG、CUU、UUA、UUG編碼,共有2 828個密碼子參與編碼。半胱氨酸(Cys)為編碼率最低的氨基酸,由UGC、UGU編碼,僅有325個密碼子參與編碼。
表4 花椰菜同義密碼子(RSCU)使用情況分析
圖2 花椰菜葉綠體基因組SSR重復類型與次數(shù)
花椰菜葉綠體基因組共檢測到290個SSR位點,其中LSC區(qū)188個,占64.8%;SSC區(qū)60個,占20.7%;IR區(qū)42個,占14.5%。單核苷酸重復有A、C和T共3種類型,占總堿基數(shù)的72.84%,在單堿基中,A/T類型最多,占96.49%,重復8次和9次的堿基最多;二核苷酸重復有AT、TA共2種類型,重復次數(shù)集中在5~7次;三核苷酸重復有AAC、AAG、AAT、AGA、AGC等25種類型,重復數(shù)大多為3次,僅有AAT、ATT、TTA重復了4次。四核苷酸重復有ATAG、CAAA、TAAA、GATT、TATC和TTCT共5種類型,重復次數(shù)均為3次(圖2)。
IR區(qū)擴張和收縮分析(圖3)表明,4種顏色花椰菜的LSC/IRb邊界均位于rps19,且rps19有116~118 bp位于LSC區(qū),112~115 bp位于IRb區(qū); SSC/IRb邊界位于ycf1和ndhF,且ndhF向IRb區(qū)擴張了34~38 bp,ycf1向SSC區(qū)擴張了1~5 bp;但在SSC/IRa邊界,白色、橘色、淺綠色花椰菜邊界位于ycf1,有1 030 bp位于IRa區(qū),4 358 bp位于SSC區(qū),與其中9種植物相似,但紫色花椰菜的ycf1在邊界處被分為兩段,位于SSC區(qū)4 248 bp的ycf1向SSC區(qū)收縮了111 bp,位于LSC區(qū)1 030 bp的ycf1向SSC區(qū)擴張了14 bp,且缺失了trnN;在IRa/LSC邊界,4種花椰菜均為rpl2向LSC區(qū)收縮167 bp,trnH向IRa區(qū)收縮3 bp。
圖3 花椰菜葉綠體基因組 IR/SC 邊界分析
圖4 基于葉綠體基因組序列構建的系統(tǒng)發(fā)育樹
將4個花椰菜和十字花科13個物種的葉綠體全基因組序列進行比對后構建系統(tǒng)進化樹。結果(圖4)顯示,4種不同顏色花椰菜中,親緣關系最近的是紫色與橙色,它們聚為一支后與甘藍(MH 388764.1)聚在一起,白色花椰菜獨立為一支,而淡綠色花椰菜與甘藍(KR 233156.1)親緣關系最近,它們聚為一支,之后才與花椰菜和甘藍聚在一起,最后與獨立分支的歐洲油菜、芥菜聚為一個大類,成為十字花科蕓薹屬的分支,而蕓薹屬的黑芥和野芥則和其他屬的聚在一起。
蕓薹屬甘藍種的葉綠體基因組長度幾乎相同,4種顏色的花椰菜葉綠體基因組長度基本一致,淡綠色花椰菜葉綠體基因組全長為153 366 bp,與甘藍(Brassicaoleracea)相同,白色、紫色、橘色花椰菜全長為153 364 bp,與青花菜(BrassicaoleraceaL. var.italica)相同,總GC含量均為36.36%[19]。蕓薹屬的芥菜(BrassicajunceaL.)和歐洲油菜(BrassicaNapusL.)的葉綠體基因組全長分別為153 483 bp和152 860 bp[15-20],同一屬內的葉綠體基因長度差別最大為623 bp,且受LSC長度的影響較大,所有蕓薹屬植物具有幾乎相同的GC含量,均為36%左右,注釋基因111~113種,說明蕓薹屬植物的葉綠體基因組高度保守,這與其他植物[21]上的研究相似。
從花椰菜葉綠體基因組中檢測到228個單核苷酸,在A、C和T 3種類型中,其中,A/T類型占96.49%,18個二核苷重復全部為AT/TA類型,62個三核苷酸重復中全部由A、T堿基構成的占比為37.10%,這與張明英等[21]研究的美麗芍藥基因組中三核苷酸全部由A、T堿基組合構成的結果不一致。
IR邊界分析發(fā)現(xiàn),在SSC/IRa邊界,紫色花椰菜與其他不同,4種花椰菜有明顯的不同,ycf1向SSC區(qū)收縮了111 bp,向SSC區(qū)擴張了14 bp,與 2種甘藍(Brasrsicaoleraceavar.capitata;Brasrsicaoleraceavar.italica)和芥菜(Brasrsicanapus)相同,而在LSC/IR和SSC/IR邊界區(qū)有相同的基因種類和排列順序,存在不同程度的擴張和收縮,且與大多數(shù)十字花科植物相似。野芥(Sinapisarvensis)和海甘藍(Crambehispanicasubsp.abyssinica)SSC/IRb邊界則與其他種稍有區(qū)別,海甘藍ycf1擴張程度與其他種相同,而IRb區(qū)則注釋為72 bp的trnN向內收縮1 356 bp,野芥則表現(xiàn)為ycf1向SSC區(qū)擴張了44 bp;在IRa/LSC邊界,有3種植物有明顯不同,藍花子的ycf1向LSC擴張了511 bp,trnM向LSC收縮了599 bp,甘藍的trnA向內收縮3 bp,野芥有完全不同的基因P31pgt向LSC收縮了2 bp,其他植物的IRa/LSC邊界均處于rpl2和trnH之間,其中,rpl2向LSC區(qū)收縮167 bp,trnH向IRa區(qū)收縮3 bp,在此邊界,4種花椰菜均無區(qū)別。
本研究中,十字花科葉綠體全基因組序列構建的系統(tǒng)發(fā)育樹,分成為兩大分支,其中一支包括甘藍種、芥菜種、歐洲油菜種,全部為蕓薹屬;而第二支,蕓薹屬的黑芥和野芥親緣關系最近,且它們與海甘藍親緣關系更密切,這與芝麻菜[16]、海甘藍[18]葉綠體基因組上的研究結果相似,碎米芥屬和紫羅蘭屬親緣關系最近,它們與諸葛菜屬、菥蓂屬(遏藍菜)聚為一類,之后與黑芥、野芥和海甘藍分支聚在一起,最后與蘿卜屬聚為一支。本研究分析了4種花椰菜與部分十字花科部分植物的親緣關系,將為研究十字花科植物的系統(tǒng)進化關系提供一定參考。