馮汝龍 王彥剛 常晨晨 景濤 馮錫鴻 申太榮 董建力
摘要 [目的]明確番茄耐裂基因在染色體上的位置。[方法]以耐裂果番茄14FP5和易裂果番茄14FP26為試材,將二者雜交得到F1代,F(xiàn)1自交得到F2,分別構建2個極端性狀的DNA混合池,采用BSA-seq方法進行定位。[結果]利用 BSA-seq 對F2 群體的2個極端混池進行基因組重測序分析,將番茄耐裂基因定位在5號染色體上,位于34 140 000~38 120 000 pb,區(qū)間大小為3.98 Mb,候選區(qū)間內共注釋到38個基因,其中非同義突變基因4個。[結論]該研究結果可為番茄耐裂基因的精細定位提供數(shù)據(jù)支撐,為番茄耐裂分子育種奠定基礎。
關鍵詞 番茄;耐裂性;BSA-seq;基因定位;候選基因
中圖分類號 S126? 文獻標識碼 A? 文章編號 0517-6611(2024)10-0120-05
doi:10.3969/j.issn.0517-6611.2024.10.025
Extraction of Tomato Cracking Tolerance Candidate Genes Based on BSA-seq Technique
FENG Ru-long,WANG Yan-gang,CHANG Chen-chen et al
(Ningxia Zhongqing Agricultural Science Co. Ltd., Yinchuan, Ningxia 750001)
Abstract [Objective] To determine the position of tomato crack tolerance gene on chromosome.[Method]Tomato 14FP5 which is resistant to cracking and tomato 14FP26 which is easy to crack are used as test materials,cross the two to get F1 generation, F1 self-cross to get F2,DNA mixing pools with two extreme traits were constructed respectively,BSA-seq method was used to locate the location.[Result]BSA-seq was used for genome resequencing analysis of 2 extreme mixed pools of F2 population.The tomato anti-cracking gene was initially located on chromosome 5,located between 34 140 000 and 38 120 000 pb,the interval size is 3.98 Mb,a total of 38 genes were annotated in the candidate region,including 4 non-synonymous mutant genes.[Conclusion]The results provide data support for the fine localization of tomato crack tolerance genes, and lay a foundation for tomato crack tolerance molecular breeding.
Key words Tomato;Cracking-resistant;BSA-seq;Assignment of genes;Candidate gene
基金項目 寧夏自然科學基金項目(2020AAC03508);寧夏回族自治區(qū)重大科技項目(2017DC55)。
作者簡介 馮汝龍(1990—),男,山東濟南人,助理農藝師,從事瓜菜育種與栽培研究。*通信作者,研究員,從事作物生物技術育種研究。
收稿日期 2023-07-02;修回日期 2023-07-20
番茄作為人們喜愛的果蔬,在我國有著“長壽果”的美譽。隨著番茄種植面積的不斷擴大,番茄在農業(yè)增效、農民增收及人們生活方面有著重要的位置。由于番茄在生產中易出現(xiàn)裂果現(xiàn)象,嚴重影響了番茄種植的經濟效益。裂果已成為生產、銷售中的一大危害。在生產中,通過栽培管理措施可以在一定程度上減輕番茄裂果的發(fā)生,卻很難從根本上解決問題。因此,番茄耐裂品種的選育成為重要課題。
番茄裂果性屬數(shù)量性狀遺傳,在開發(fā)特異性分子標記中存在成本高、周期長、效率低等缺點,較難獲得特異性分子標記。群體分離分析法(bulked segregant analysis,BSA)通過表型差異構建分離群體快速篩選和定位目標性狀相關基因[1]。BSA-seq 技術基于高通量測序技術,具有試驗周期短、定位準確,開發(fā)的分子標記分布均勻、密度高等優(yōu)點[2-3]。該方法在動植物功能基因定位研究中應用廣泛[4-5]。
目前,關于高通量測序技術開發(fā)番茄耐裂特異分子標記鮮見報道。筆者在前期試驗結果的基礎上,利用BSA-seq技術對番茄耐裂基因進行定位,旨在為番茄耐裂分子育種奠定基礎。
1 材料與方法
1.1 材料
供試易裂果番茄自交系14FP26和耐裂果番茄自交系14FP5,均來源于寧夏平羅中青種業(yè)公司。14FP26作母本與14FP5雜交,F(xiàn)1代自交產生F2分離群體,通過混合BSA法,分別選擇20株耐裂單株和30株易裂單株構建混合DNA池的樣品。
1.2 方法
1.2.1 裂果性鑒定。番茄裂果性鑒定采用蘇彥賓等[6]的方法進行。
1.2.2
混池構建及測序。取F2極端耐裂和易裂各30株頂端幼嫩葉片1片,干冰保存寄往北京百邁克生物科技有限公司進行檢測,采用改良的CTAB法提取DNA,將耐裂DNA和易裂DNA分別等量混合,構建2個后代極端DNA混池,利用 Illumina HiSeq 平臺完成建庫測序。
1.2.3 測序數(shù)據(jù)分析。
將構建的樣品文庫上機測序得到測序數(shù)據(jù)(raw reads),經Base Calling分析轉化為原始測序序列(Sequenced Reads),其中含有帶接頭、低質量的Reads,為了保證信息分析質量,對Raw Reads進行過濾,得到Clean Reads,將Clean reads通過BWA 軟件與番茄基因組進行比對。根據(jù)Clean read比對結果,利用 GATK 軟件檢測和過濾得到檢測樣品與參考基因組之間高質量的可信SNP位點和序列插入與缺失(InDel)位點。利用歐式距離法[7](euclidean distance,ED)和SNP-index 法計算與性狀關聯(lián)的候選區(qū)域。利用SNPindex 進行關聯(lián)分析[7-8]。
1.2.4 候選區(qū)域篩選與功能注釋。 關聯(lián)分析結果合并取交集,用 BLAST[9]通過多個數(shù)據(jù)庫(NR、Swiss-Prot、GO、KEGG、COG[10-11])深度注釋候選區(qū)間內的編碼基因,快速篩選候選基因。
2 結果與分析
2.1 番茄耐裂性鑒定
種植F2代群體單株共243株,從243株 F2群體中經表型鑒定獲得裂果嚴重單株24株,中度裂果單株27株,輕度裂果單株55株,抗裂單株67株,中抗單株42 株,高抗單株28株。其抗性呈近似正態(tài)分布,這表明番茄耐裂性符合數(shù)量性狀遺傳。從裂果嚴重和高抗裂果中各取20株嫩葉,構建抗裂和易裂DNA混池。
2.2 測序數(shù)據(jù)量及數(shù)據(jù)質量
利用SLAF-seq技術對父本、母本和極端混池DNA進行測序,過濾后共獲得了1 148 198 726條reads數(shù)據(jù),其中,父本和母本分別為221 566 116、203 712 478條(表1),抗裂池和易裂池分別為345 739 096、377 181 036條。測序質量值 Q30為93.85%~95.01%,平均為94.52%,說明測序堿基錯誤率低,所獲數(shù)據(jù)合格。測序獲得GC含量在34.85%~35.40%,平均在35.13%。插入片段長度呈正態(tài)分布(圖1),說明測序數(shù)據(jù)文庫構建無異常。父本、母本和極端混池樣品與參考基因組平均比對率為99.49%,基因組平均覆蓋深度約為53.25X,1%覆蓋率超過97.02%,5%覆蓋率超過95.77%,10%覆蓋率超過94.26%(表1),結果表明,測試數(shù)據(jù)符合標準,可進一步檢測和篩選。
2.3 SNP和InDel變異檢測與注釋
SNP檢測結果顯示,共獲得6 340 143個SNP,引起非同義突變的SNP共59 846個。其中,親本P1、P2之間共獲得2 710 004個SNP,非同義突變的SNP共24 737個,混合池C1、C4之間共獲得3 630 139個SNP,引起非同義突變的SNP共17 767個。通過InDel檢測,親本之間共獲得431 661個小片段插入與缺失(small InDel),混合池之間共獲得 560 795個smal lnDel(圖2)。大部分SNP和InDel分布在基因間、基因上游區(qū)段、基因下游區(qū)段。
2.4 關聯(lián)分析
2.4.1 SNP關聯(lián)分析。對SNP進行過濾后得到質量高的可信SNP位點1 487 748 個。采用ED算法和SNP-index算法對這些位點數(shù)據(jù)進行關聯(lián)分析,得到4個染色體候選區(qū)段與番茄抗裂性相關聯(lián),區(qū)域所注釋到的基因總長度為8.34 Mb。Chr05區(qū)段長度為3.98 Mb,位于34 140 000~38 120 000 bp,Chr05區(qū)段長度為3.98 Mb,位于40 640 000~44 620 000 bp,Chr011區(qū)段長度為0.08 Mb,位于3 740 000~3 820 000 bp(表2、圖3)。根據(jù)SNP-index 算法關聯(lián)閾值(0.95)判定,共得到2個與番茄抗裂性相關聯(lián)的染色體區(qū)段,關聯(lián)分布見圖4,區(qū)段注釋到的基因總長度為2.18 Mb,其中 Chr05區(qū)段長度最小,為0.06 Mb,位于42 240 000~42 300 000 bp。2種關聯(lián)分析方法取交集,得到2個與性狀相關的侯選交集區(qū)段,區(qū)段總長度為4.28 Mb(表2、圖4)。
2.4.2 InDel關聯(lián)分析。對 InDel位點進行過濾后得到質量高的可信InDel 位點192 616 個。根據(jù)ED關聯(lián)閾值判定,共得到8個區(qū)段,總長度為12.54 Mb。采用與SNP關聯(lián)分析時相同的方法(SNP-index),當置信度為0.99時,共得到5個區(qū)段,總長度為7.18 Mb。2種關聯(lián)分析方法取交集,得到2個與番茄抗裂性相關的侯選區(qū)段,區(qū)段總長度為0.36 Mb(表3)。
2.5 候選區(qū)段篩選與基因注釋
將SNP關聯(lián)分析結果與InDel關聯(lián)結果進行統(tǒng)計分析后取交集,InDel交集結果為空,該項目默認采用SNP的候選區(qū)間結果(表2),最終鎖定番茄耐裂性候選區(qū)段在5號染色體上,位于34 140 000~38 120 000 pb,區(qū)間大小為3.98 Mb。利用 GO[12]、KEGG[11]等數(shù)據(jù)庫對候選區(qū)段內的基因進行深度注釋,有38個基因被注釋,其中非同義突變基因4個。
利用番茄基因組數(shù)據(jù)庫信息,利用 BlAST軟件對候選區(qū)段內的基因進行NR、GO、KEGG、COG數(shù)據(jù)庫進行深度注釋,在候選區(qū)段內共注釋到 38個基因,其中在 NR、trEMBL數(shù)據(jù)庫中均注釋到 38 個基因,Swiss Prot數(shù)據(jù)庫中注釋到29個基因,GO 數(shù)據(jù)庫中注釋到31個基因,KEGG數(shù)據(jù)庫中注釋到23個基因,COG數(shù)據(jù)庫中注釋到12個基因(表4)。
2.5.1 GO數(shù)據(jù)庫分析。
利用GO數(shù)據(jù)庫對候選基因和基因產物在細胞組分、分子功能和生物學過程3個方面,將候選區(qū)段內38個基因進行GO功能注釋,有31個基因(表4)分別被注釋到7個細胞組分、3個分子功能和 13 個生物學過程中(圖5)?;蛟诩毎M分中主要存在于細胞器中的葉綠體;基因在分子功能中主要發(fā)揮催化活性、信號傳遞等功能;基因在生物學過程中主要參與代謝、生物合成及生物調節(jié)等。這說明當番茄受到不良因素開裂時,番茄的抗裂響應可能有細胞轉化、細胞膜修復、氨基酸代謝、生物調節(jié)信息傳遞等。
2.5.2 ?KEGG數(shù)據(jù)庫分析。
利用KEGG數(shù)據(jù)庫對候選基因區(qū)段進行 Pathway 富集分析,38個候選基因被注釋到的基因數(shù)為23個,這23個基因(表4)所參與的代謝通路主要為植物激素信號傳導、苯丙氨酸酪氨酸的生物合成、甘氨酸、絲氨酸和蘇氨酸的代謝等(圖5)。這表明當番茄開裂時,體內會出現(xiàn)傳導開裂信號的響應,體內合成、代謝和生物調控增加,產生各種蛋白酶與核酸等物質,同時進行生物調控、代謝,促進細胞間的黏合力抵御開裂。
3 結論與討論
該試驗利用BSA-seq方法快速挖掘到抗裂候選基因區(qū)段位于5號染色體上,關聯(lián)區(qū)段總長度為3.98 Mb,對候選區(qū)段內的基因進行生物信息學分析后,共注釋到38個基因,經過多個數(shù)據(jù)庫的分析發(fā)現(xiàn),5號染色體上關聯(lián)區(qū)段內的基因有可能在番茄裂果過程中發(fā)揮著重要作用,成為控制番茄裂果的主效基因,為番茄抗裂基因的精細定位和分子克隆提供了科學依據(jù)。
目前對番茄果實裂果性狀進行基因定位的研究并不多見,張冬野等[13]利用SSR和AFLP分子標記對F2群體進行QTL定位及遺傳連鎖圖譜的構建,找到與番茄果質量、果形指數(shù)、果皮韌度等相關的QTLs位于3號染色體上。陳斌等[14]利用QTL-seq 分析檢測到2個調控番茄不規(guī)則裂果性狀的QTLs,分別位于2號染色體的38.75 ~ 42.14 Mb 區(qū)段和5號染色體的49.07~49.48 Mb 區(qū)段。該研究結果顯示,番茄抗裂性基因位點位于5號染色體上,推測5號染色體上抗裂基因富集區(qū)段至少有3位點,這表明5號染色體上的位點對番茄抗裂性有重要控制作用。
該研究使用NR、GO、KEGG、COG功能數(shù)據(jù)庫進行深度注釋,在5號染色體上注釋到38個候選基因,發(fā)現(xiàn)這些基因顯著富集在番茄的生物代謝、生物合成及生物調節(jié)等途徑中,該代謝通路可增加番茄細胞間的黏合力,控制黏合力的基因與細胞轉化、細胞膜修復、氨基酸代謝密切相關。由于注釋到的基因較多,至于哪些區(qū)段的基因為控制番茄耐裂的主效基因,需進一步進行基因精細定位、功能和表達驗證。在該研究的基礎上,期待進一步挖掘控制番茄抗裂基因,同時開發(fā)番茄抗裂基因分子標記,對于闡明番茄與抗裂果的互作機制及抗裂分子標記輔助育種具有重要意義。
參考文獻
[1] MICHELMORE R W,PARAN I,KESSELI R V.Identification of markers linked to disease-resistance genes by bulked segregant analysis:A rapid method to detect markers in specific genomic regions by using segregating populations[J].Proc Natl Acad Sci USA,1991,88(21):9828-9832.
[2] ABE A,KOSUGI S,YOSHIDA K,et al.Genome sequencing reveals agronomically important loci in rice using MutMap[J].Nat Biotechnol,2012,30(2):174-178.
[3] ZHANG H,WANG X,PAN Q,et al.QTG-seq accelerates QTL fine mapping through QTL partitioning and whole-genome sequencing of bulked segregant samples[J].Mol Plant,2019,12(3):426-437.
[4] ZOU C,WANG P X,XU Y B.Bulked sample analysis in genetics,genomics and crop improvement[J].Plant Biotechnoll,2016,14(10):1941-1955.
[5] POOL J E.Genetic mapping by bulk segregant analysis in Drosophila:Experimental design and simulation-based inference[J].Genetics,2016,204(3):1295-1306.
[6] 蘇彥賓,劉玉梅,方智遠,等.結球甘藍耐裂球性狀遺傳分析[J].園藝學報,2012,39(8):1482-1490.
[7] HILL J T,DEMAREST B L,BISGROVE B W,et al.MMAPPR:Mutation mapping analysis pipeline for pooled RNA-seq[J].Genome Res,2013,23(4):687-697.
[8]FEKIH R,TAKAGI H,TAMIRU M,et al.MutMap +:Genetic mapping and mutant identification without crossing in rice[J].PLoS One,2013,8(7):1-10.
[9] ALTSCHUL S F,MADDEN T L,SCHFFER A A,et al.Gapped BLAST and PSI-BLAST:A new generation of protein database search programs[J].Nucleic Acids Res,1997,25(17):3389-3402.
[10] 鄧泱泱,荔建琦,吳松鋒,等.nr數(shù)據(jù)庫分析及其本地化[J].計算機工程,2006,32(5):71-73,76.
[11] KANEHISA M,GOTO S,KAWASHIMA S,et al.The KEGG resource for deciphering the genome[J].Nucleic Acids Res,2004,32(S1):D277-D280.
[12] ASHBURNER M,BALL C A,BLAKE J A,et al.Gene ontology:Tool for the unification of biology[J].Nat Genet,2000,25(1):25-29.
[13] 張冬野,李會佳,楊歡歡,等.番茄裂果性狀及QTL定位分析[J].北方園藝,2017(17):44-51.
[14] 陳斌,吳震,文軍琴,等.番茄不規(guī)則裂果性狀的QTL定位及候選基因分析[J].園藝學報,2021,48(7):1329-1339.