Genetic Diversity Analysis of Kainong Series Peanut Varieties (Lines) Based on Whole-Genome Resequencing
Guo Minjie1,Deng Li1,Miao Jianli’,Luo Feng2,Yin Junhua’,Sun Yigen3,Xiao Ting3,Ren Li (1. Kaifeng Research Academy of Agriculture and Forestry, Kaifeng 475004, China; 2. Henan Provincial Seed Industry Development Center, Zhengzhou 45Oo0o, China ; 3. Kaifeng Municipal Seed Industry Development Center, Kaifeng 475004,China)
AbstractIn this study,a total of 30 Kainong series peanut varieties (lines)derived from O317 combination(Kainong 30× Kaixuan O16) with larger promotion areas were used as materials, and the genetic similarity analysis,population structure analysis and cluster analysis based on the second-generation whole genome resequencing data were conducted,in order to provide basic materials and visual technical references for efficient utilization of peanut germplasm resources in China.The results showed that after data control,423 149 high-quality single nucleotidepolymorphism(SNP)sites were obtained that were evenly distributed on the chromosomes.Among them,chromosome 3 had the most SNP sites and chromosome 10 had the least,accounting for 8.56% and 2.66% of the total,respectively. There were 435 genetic similarity coefficient values between diferent peanut varieties (lines)ranging from O.55 to 0.96,and the average value was O.73.The highest genetic similarity coefficient (0.96)was between Kainong 301 and Kainong 3O6,showing the closest genetic relationship.The lowest genetic similarity coeficient (O.55)was between Kainong 176 and Kainong 100, showing the farthest genetic relationship.Through population structure analysis,the 3O peanut varieties (lines) were divided into three subgroups,accounting for 30.00% , 33.33% and 36.67% of the total, respectively.Among which,the genetic backgrounds of Kainong 99 and Kainong 65 were relatively complex.The cluster analysis results showed that the result from population genetic heatmap of the 3O peanut varieties (lines)was consistent with that from evolutionary tree;the 3O peanut varieties (lines)were divided into three groups;combined with the pedigree relationships,it was found that varieties bred from the same combination might not necessrily clustered in the same group. In conclusion,the genetic similarity among the 3O peanut varieties(lines)in this study was relatively high,so the genetic basis should be broadened.In the process of excellent peanut varieties breeding,it might be posible to comprehensively analyze pedigree and SNP-based clustering results for screening germplasm resources.
KeywordsPeanut; Germplasm resources ; O317 combination; Single nucleotide polymorphism; Genetic diversity
中國是世界上花生第一生產(chǎn)大國,2017—2021年間,我國花生平均每年總產(chǎn)1764.90萬噸,占世界花生總產(chǎn)的 34.42% ,單產(chǎn)是世界平均的2倍[1]。盡管我國花生以油用為主,但是當前國產(chǎn)食用植物油供給嚴重不足,大量依賴進口[2],選育高產(chǎn)花生新品種仍是我國花生育種的主導方向。開農(nóng)系列花生品種在我國花生產(chǎn)業(yè)發(fā)展進程中做出了較大的貢獻,自1958年以來,以高產(chǎn)、優(yōu)質為目標開展花生育種工作,通過創(chuàng)制出的0317組合(開農(nóng) 30× 開選016)育成了包括開農(nóng)1715、開農(nóng)71、開農(nóng)1760[3] 在內(nèi)的一大批優(yōu)異花生品種,其中開農(nóng) 71入選2022年全國糧油生產(chǎn)主導品種
傳統(tǒng)的作物遺傳多樣性分析多依賴表型數(shù)據(jù)[4-9],隨著生物技術的發(fā)展,以簡單重復序列(SSR)、限制性片段長度多態(tài)性(RFLP)等為代表的基于分子標記開展遺傳多樣性分析的技術愈趨成熟[10-11],白冬梅等[12]、王潤風等[13]利用 SSR引物分別評價了山西省和我國南方花生品種的遺傳多樣性。近年來,栽培花生基因組完成了測序工作[14-16],依靠單核苷酸多態(tài)性(SNP)進行遺傳背景分析顯得更為高效、可靠。然而,有關花生遺傳多樣性的研究仍然主要停留在表型和第一代、第二代分子標記上,基于第三代分子標記SNP的花生遺傳多樣性研究鮮有報道。為全面了解開農(nóng)系列花生品種中不同材料之間的遺傳關系,本研究利用全基因組測序技術對高油酸骨干親本開選016衍生的且在目前市場上推廣面積較大的30份花生品種(系)進行深度為 10× 的重測序,并基于SNP數(shù)據(jù)開展遺傳相似性、群體結構、聚類等方面的遺傳多樣性分析,結合系譜分析更加全面地了解開農(nóng)系列花生主推品種間的遺傳關系,為作物群體遺傳背景分析提供科學、有效的方法,更為我國花生種質資源的利用和育種提供技術依據(jù)
1材料與方法
1.1 試驗材料及概況
本試驗所用30份開農(nóng)系列花生品種(系)為近年2003年配置的第17個組合(0317:開農(nóng) 30× 開選016)的衍生材料(表1),產(chǎn)量表現(xiàn)穩(wěn)定。試驗于2019年在河南省開封市杏花營鎮(zhèn)試驗田進行,試驗地為沙質壤土。每個品種(系)種植1行( (6.67m) ,單粒播種,穴距20cm ,各品種(系)行間距 40cm 。
1.2 試驗方法
1.2.1DNA 提取取生長3周的花生嫩葉組織約0.5g ,用CTAB法[17]提取基因組DNA。使用濃度為1% 的瓊脂糖凝膠電泳和紫外分光光度計檢測DNA樣品濃度與純度,用Qubit熒光計對DNA濃度進行精確定量,將無污染且濃度介于 10~100ng/μL 之間的合格樣品于 -20°C 儲存?zhèn)溆谩?/p>
1.2.2二代重測序30 份花生的 DNA 樣品由北京諾禾致源科技股份有限公司利用IlluminaNo-vaSeq平臺進行二代重測序,測序深度為 10× ,高通量測序得到的原始圖像數(shù)據(jù)文件經(jīng)堿基識別分析轉化為原始測序序列。
1.2.3 質控條件將測序結果比對到花生參考基因組Tifrunner[18]上,對SNP進行質控,質控后分別利用BWA軟件[19]和SAMtools軟件[20]進行比對和檢測。將SNP進行過濾,過濾條件:測序深度 ?3 、SNP位點在樣品中的缺失率 ?0.2 次等位基因頻率 ?0.05 ,對獲得高質量的SNP進行遺傳多樣性分析。
1.3 數(shù)據(jù)處理與分析
利用Plink1.9軟件[21]進行品種(系)間遺傳相似性分析,使用admixture軟件[22-23]進行群體遺傳結構分析,使用R語言軟件的cluster[24]進行聚類分析。
2 結果與分析
2.1 30份花生品種(系)的系譜分析
系譜是識別品種(系)來源的直觀圖。從圖1看出,30份花生品種(系)中直接由0317組合(開農(nóng) 30× 開選016)選育的品種(系)有13個,分別為G4、G7、G8、G10、G12、G13、G19、G20、G22、G25、G27、G28、G29,占總數(shù)的 43.33% 。G14和G17、G11和G3、G9和G24各自由同一組合選育而成,G9、G24、G30、G23、G6的父母本均來自于0317組合。G1為開農(nóng)30,是0317組合的母本材料,G21由K9508-1和開選016配置組合育成,與開選016的親緣關系系數(shù)為0.5。
2.230份花生品種(系)的DNA濃度及測序質量從表2可知,30份花生的DNA濃度介于15.41~57.21ng/μL 之間,平均為 31.14ng/μL ,樣本質量滿足建庫測序要求,且總量滿足建庫需要與參考基因組相比,堿基的Q20(錯誤率 1% 以下)介于 96.03%~97.90% 之間,平均為 97.36% ;Q30(錯誤率 1‰ 以下)介于 89.68%~94.18% 之間,平均為 92.57% 。測序錯誤率低,則堿基質量高。
GC含量分布用于檢測有無AT、GC分離現(xiàn)象,根據(jù)堿基互補原則,A和T的比例應該接近,C 和G的比例也應該接近。統(tǒng)計測序堿基 A,T C、G、N的含量分布發(fā)現(xiàn),GC含量在 36.34%~ 39.14% 之間,平均為 37.69% 。綜上可知,30份花生品種(系)的測序質量較高,遺傳多樣性分析可靠性高。
2.3 30份花生品種(系)的SNP位點分布及多樣性分析
基于高通量二代重測序對30份花生品種(系)進行基因組測序,與參考基因組Tifrunner比對,過濾質控后獲得423149個高質量SNP位點,平均 1Mb 含有169個SNP位點(圖2)。其中,3號染色體上的SNP位點最多,為36236個,占總數(shù)的 8.56% ,其次是4號、18號、1號、9號、14號、2號、5號、12號、13號、17號、7號、6號、16號、20號、19號、15號、11號、8號、10號,10號染色體上的 SNP位點最少,為11269個,占總數(shù)的 2.66% 。SNP位點在染色體上的分布較為均勻,差異不明顯,這些SNP位點將用于30份開農(nóng)系列花生品種(系)的遺傳多樣性分析。
2.430份花生品種(系)的遺傳相似性分析
遺傳相似性系數(shù)可以反映種質間的親緣關系,是衡量品種間相似程度的重要指標[25]。利用SNP分子標記計算得出,30份開農(nóng)系列花生品種(系)間存在435個遺傳相似性系數(shù)值(表3),取值范圍為 0.55~0.96 ,平均值為0.73。G29(開農(nóng)301)和G27(開農(nóng)306)的遺傳相似性系數(shù)最高為0.96,遺傳關系最近,二者均來自于0317組合(開農(nóng) 30× 開選016);G20(開農(nóng)176)和G18(開農(nóng)100)的遺傳相似性系數(shù)最低為0.55,二者的遺傳關系最遠。其原因是開農(nóng)176由開農(nóng) 30× 開選016選育而成,開農(nóng)100由秋樂花 177× 花育50號選育而成,親本間親緣關系相對較遠
另外,通過可視化作圖讓品種(系)之間的遺傳相似性系數(shù)直觀展示(圖3),遺傳相似性系數(shù)的色階變化基本為白色-淺紅色-深紅色,系數(shù)值均在0.50以上,顏色越深,親緣關系就越近,反之親緣關系就越遠。G10、G11、G12和G13這4個品種(系)間的親緣關系系數(shù)最近, G10~G13 與G3\~G6品種(系)間的親緣關系較近
2.530份花生品種(系)的群體遺傳結構分析
將群體結構分群K值設置為2\~6,當 K=3 時,交叉驗證誤差率最?。▓D4A),所以30份花生品種(系)的最佳分群K值為3,此時最接近群體遺傳結構的真實情況
圖4B中,橫坐標為花生品種(系)的ID,縱坐標Q值為材料在不同亞群中對應的遺傳背景比重,可作為種質資源的分群指標,每個直方柱表示一個品種(系),每根柱的顏色代表遺傳組分的構成[26]。30份花生品種(系)可分為3個亞群,分別是V1(紅色)、V2(綠色)和V3(藍色),亞群V1含有9份花生品種(系),占總數(shù)的 30.00% ,分別是 G9,G14,G15,G16,G30,G28,G29,G3,G5 ,其中G5(開農(nóng)99)的Q值小于0.6,遺傳背景相對復雜;亞群V2含有10份花生品種(系),占總數(shù)的33.33% ,分別是 G1,G11,G13,G20,G24,G22,G6 G12、G10、G25;亞群V3含有11份花生品種(系),占總數(shù)的 36.67% ,分別是G17、G18、G19、G27,G4,G2,G21,G23,G26,G7,G8 ,其中G8(開農(nóng)65)的Q值小于0.6,同時具有相對較多的亞群V1的遺傳背景。
2.6 30份花生品種(系)遺傳相似性系數(shù)的聚類分析
基于品種(系)間遺傳相似性系數(shù),對30份花生品種(系)進行遺傳熱圖分析(圖5A),并通過臨接法(NJ)構建NJ進化樹(圖5B)。群體遺傳熱圖中沿著中斜線出現(xiàn)3個深色區(qū)域,即表示分為3個類群:第一亞群(右上正方形)由G25、G20、G30、G21、G8、G29、G27、G7、G19組成,共9個品種(系),與進化樹中的類群Ⅲ相吻合;群體遺傳熱圖中的第二亞群(左下正方形)由G17、G14、G15、G24、G23、G28、G2、G9、G22、G16、G26、G18組成,共12個品種(系),與進化樹中的類群Ⅱ一致;群體遺傳熱圖中的第三亞群(中間正方形)由G3、G1、G6、G4、G12、G11、G5、G10、G13共9個品種組成,與進化樹中的類群I一致。綜上,群體遺傳熱圖與進化樹分析結果一致,均將30份品種(系)分為3個類群。
3討論與結論
種質資源是作物遺傳改良和相關研究的基礎[27]。花生種質資源的分類和利用是花生育種工作的第一步。本研究中的0317組合(開農(nóng) 30× 開選016)的母本開農(nóng) 30[28] 是大果、高產(chǎn)花生品種,父本開選 016[29] 是小果、高油酸花生品種。本研究的30份開農(nóng)系列花生品種(系)中有13個是由0317組合直接選育而成,另外17個品種(系)中除開農(nóng)30和開農(nóng)H03-3外,均由0317組合衍生而成,開農(nóng)系列花生品種(系)及其衍生的優(yōu)異品種(系)被多家花生育種單位直接或間接利用。
本研究全基因組重測序深度為 10× ,覆蓋基因組超 90% ,與其他研究相比測序質量高,SNP位點在染色體上的分布較為均勻,平均 1Mb 含有169個SNP位點,所以利用重測序數(shù)據(jù)進行群體遺傳多樣性分析可靠性高。品種(系)間遺傳相似性系數(shù)平均值為0.73,說明該群體材料的親緣關系較近,這與它們均是0317組合的衍生材料有關,開農(nóng)301和開農(nóng)306的遺傳相似性系數(shù)最高,二者均是小果、高油酸花生品種,親本相同,表型差異主要集中在莢果腰深度上。開農(nóng)176和開農(nóng)100的遺傳相似性系數(shù)最低,二者雖然都是大果花生品種,但在表型、品質方面差異較大。
群體結構分析能夠明確該群體的分群合理性及個體遺傳組分的多少[24]。本研究中,30 份花生品種(系)被劃分為3個亞群,各亞群數(shù)量比接近1:1:1,Q值 lt;0.6 的品種有2個,占總數(shù)的 6.67% ,表明該群體的遺傳混雜程度較低,這說明育種單位對優(yōu)良骨干親本品種的利用率過高,導致群體遺傳背景較為單一。聚類分析中基于品種(系)間遺傳相似性系數(shù)進行群體遺傳熱圖和進化樹分析,二者結果完全吻合,30份品種(系)均分為3個類群。群體遺傳結構分析亞群和聚類分析類群相比,亞群V1[9個品種(系)]與類群Ⅱ有5個品種(系)相同,亞群V2(10個品種)與類群I有6個品種相同,亞群V3[11個品種(系)]與類群Ⅱ有5個品種(系)相同。綜上可知,群體結構分析與聚類分析的分群結果基本吻合。
系譜分析與基于全基因組SNP的聚類分析發(fā)現(xiàn),同一組合育成的品種(系)不一定會聚在一起,如0317組合的13份品種(系)在3個類群中均有分布,這與前人研究結果相一致[30-31]。產(chǎn)生這種現(xiàn)象的原因,一方面是由于育種過程中會出現(xiàn)定向選擇,在世代的選擇中往往會將重點集中在目標性狀上,從而導致其他位點的丟失;另一方面是包含基因重組在內(nèi)的遺傳變異也會產(chǎn)生上述現(xiàn)象;最后還可能是品種(系)之間的遺傳基礎狹窄而沒有過多的外來基因交流導致的。所以今后在花生育種過程中,可綜合考慮系譜關系和聚類分析結果進而做出選擇。
開農(nóng)系列花生育種中高頻率使用相同骨干材料或其衍生材料做親本,導致育成的花生品種(系)遺傳基礎狹窄、多樣性水平低,但是不可忽視的是,開農(nóng)系列花生品種(系)仍然存在一定的遺傳多樣性,它們在表型、品質、產(chǎn)量方面有不同程度的差異表現(xiàn)。如:以開農(nóng)1760為代表的小果、高油酸花生品種,以開農(nóng)98為代表的大果、非高油酸花生品種等,這些品種的平均產(chǎn)量均在4 500kg/hm2 以上,為河南省乃至全國花生產(chǎn)業(yè)的發(fā)展起到重要推動作用。在今后的育種工作中,一方面需擴大親本利用范圍,拓寬親本遺傳基礎;另一方面要加強種質資源的創(chuàng)新研究,采用多種育種方式相結合的方法,創(chuàng)制優(yōu)異中間材料,選育具有突破性的花生新品種。另外,雖然本研究的群體較小,但基于重測序數(shù)據(jù)對花生群體進行遺傳多樣性分析的方法同樣適用于較大群體的不同作物,該研究結果可為較大群體的相關研究提供參考。
參考文獻:
[1]FAO.FAOSTAT[DB/OL]. Statistical Database FAOSTAT.2016-12-04[2023-10-20]. https://www.fao.org/faostat/en/#data/QCL.
[2]鄧麗,郭敏杰,谷建中,等.大果花生品種產(chǎn)量及其構成的可視化分析[J].分子植物育種,2021,19(18):6258-6264.
[3]鄧麗,郭敏杰,殷君華,等.高油酸花生品種開農(nóng)1760產(chǎn)量及其構成的可視化分析[J].中國油料作物學報,2021,43(3):502-509.
[4]李潔,聶紅民,陳翠霞,等.94個花生新品種主要農(nóng)藝性狀遺傳多樣性分析[J].花生學報,2023,52(2):61-67.
[5]林顯鳳,夏友霖,敬昱霖,等.四川花生地方品種主要農(nóng)藝性狀的遺傳多樣性分析[J].中國農(nóng)學通報,2021,37(34):9-14.
[6]徐志軍,吳小麗,胡小文,等.33份引進花生資源表型遺傳多樣性分析及在粵西地區(qū)的適應性初步評價[J].熱帶作物學報,2021,42(7) :1885-1895.
[7]黃楊,熊信果,鄒小云,等.江西地方花生種質資源主要農(nóng)藝性狀分析與評價[J].植物遺傳資源學報,2021,22(6):1550-1558.
[8]黃雷,謝文輝,魯林欣,等.59份首蓿種質種子表型性狀遺傳多樣性分析及評價[J].山東農(nóng)業(yè)科學,2024,56(10):34-42.
[9]韓婭楠,行文妍,史艷艷,等.加工型辣椒種質資源遺傳多樣性分析[J].山東農(nóng)業(yè)科學,2024,56(1):34-42.
[10]宋萬朵,晏立英,雷永,等.基于ISSR與ITS-RFLP的花生白絹病菌遺傳多樣性分析[J].中國油料作物學報,2020,43(4) :724-730.
[11]郭敏杰,殷君華,鄧麗,等.開農(nóng)系列高油酸花生遺傳多樣性分析[J].花生學報,2020,49(4):14-22.
[12]白冬梅,薛云云,張鑫,等.基于SSR 標記分析山西地方花生種質遺傳多樣性[J].中國油料作物學報,2020,42(5):753-759.
[13]王潤風,魯清,洪彥彬,等.中國南方區(qū)試花生品種的遺傳多樣性分析[J].廣東農(nóng)業(yè)科學,2021,48(12):44-53.
[14] Bertioli D J,Jenkins J,Clevenger J,et al. The genome sequenceof segmental allotetraploid peanut Arachis hypogaea[J]. NatureGenetics,2019,51(5) :877-884.
[15] Chen X P,Lu Q,Liu H,et al. Sequencing of cultivated peanut,Arachis hypogaea, yields insights into genome evolution and oilimprovement[J]. Molecular Plant,2019,12(7) :920-934.
[16] Zhuang WJ,Chen H,Yang M,et al. The genome of cultivatedpeanut provides insight into legume karyotypes,polyploid evolu-tion and crop domestication[J]. Nature Genetics,2019,51(5):865-876.
[17]Doyle JJ. Isolation of plant DNA from fresh tissue[J].Focus,1990,12:13-15.
[18]Peanutbase[ DB/OL]. The peanut genome,2021-06-04[2023-10-20]. https://www.peanutbase.org/peanut_genome.
[19]Li H,Durbin R.Fast and accurate short read alignment with Bur-rows-Wheeler transform[J]. Bioinformatics,2009,25(14):1754-1760.
[20] Li H,Handsaker B,Wysoker A,et al. The sequence alignment/map format and SAMtools[J]. Bioinformatics,2009,25(16):2078-2079.
[21] Chang C C,Chow C C,Tellier L C,et al. Second-generationPLINK: rising to the challenge of larger and richer datasets[J].Gigascience,2015,4(1) :7.
[22]Paterson N,Price A L,Reich D.Population structure andeigenanalysis[J]. PLoS Genetics,2006,2(12) :e190.
[23]Alexander D H,Novembre J,Lange K. Fast model-based estima-tion of ancestry in unrelated individuals[J]. Genome Research,2009,19:1655-1664.
[24]Meachler M,Rousseeuw P,Struyf A,et al. Cluster: cluster analy-sis basics and extensions.R package version 2.1.2,2021.
[25]朱鳳潔,張山山,袁媛,等.金銀花種質資源DNA身份證構建及遺傳相似性分析[J].中國中藥雜志,2018,43(9):1825-1831.
[26]韓志剛,郝文勝,謝銳,等.基于全基因組重測序 SNP標記的148份馬鈴薯種質遺傳多樣性分析[J].西北植物學報,2021,41(8) :1302-1314.
[27]黎裕,李英慧,楊慶文,等.基于基因組學的作物種質資源研究:現(xiàn)狀與展望[J].中國農(nóng)業(yè)科學,2015,48(17):3333-3353.
[28]李傳強,谷建中,任麗,等.花生新品種開農(nóng)30的選育[J].河南農(nóng)業(yè)科學,2002(7):20-21.
[29]谷建中,郭敏杰,鄧麗,等.基于親緣系數(shù)的高油酸花生骨干親本開選016的育種價值分析[J].河南農(nóng)業(yè)科學,2018,47(9) :53-58.
[30]曹廷杰,謝菁忠,吳秋紅,等.河南省近年審定小麥品種基于系譜和SNP標記的遺傳多樣性分析[J].作物學報,2015,41(2) :197-206.
[31]段紹光,金黎平,李廣存,等.馬鈴薯品種遺傳多樣性分析[J]:作物學報,2017,43(5):718-729.