摘要 近年來,棉花黃萎病在新疆蔓延,已成為制約當(dāng)?shù)孛藁ㄉa(chǎn)的重要因素之一。運(yùn)用高通量SNP芯片對(duì)344份具有代表性的棉花種質(zhì)資源進(jìn)行基因型分析,考察群體在4個(gè)環(huán)境(2年2個(gè)試驗(yàn)點(diǎn))中的黃萎病發(fā)病率表型,并利用混合線性模型(mixed linear model,MLM)進(jìn)行全基因組關(guān)聯(lián)分析。結(jié)果表明,棉花黃萎病發(fā)病率與產(chǎn)量、纖維品質(zhì)存在負(fù)相關(guān)性。該群體在4個(gè)環(huán)境中黃萎病發(fā)病率的廣義遺傳力為40.10%。群體結(jié)構(gòu)分析表明,該群體可分為2個(gè)亞群。MLM模型檢測(cè)到18個(gè)顯著位點(diǎn),分布在A03、A05、A10、A12、D02、D11和D13。研究結(jié)果有助于解析棉花黃萎病抗性的遺傳基礎(chǔ),為研究棉花黃萎病的致病機(jī)制以及指導(dǎo)黃萎病抗性的遺傳改良提供理論參考。
關(guān)鍵詞 陸地棉;種質(zhì)資源;黃萎病發(fā)病率;關(guān)聯(lián)分析
中圖分類號(hào) S 562" 文獻(xiàn)標(biāo)識(shí)碼 A
文章編號(hào) 0517-6611(2025)04-0001-04
doi:10.3969/j.issn.0517-6611.2025.04.001
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Genomewide Association Analysis of Verticillium Wilt Mobidity in Upland Cotton Accessions (Gossypium hirsutum L.)
ZHOU Xiaofeng1,CAO Yang2,HE Liangrong3 et al
(1.Cotton Institute,Xinjiang Academy of Agricultural and Reclamation Science/Northwest Inland Region Key Laboratory of Cotton Biology and Genetic Breeding,Ministry of Agriculture and Rural Affairs,Shihezi,Xinjiang 832000;2.Institute of Agricultural Science,F(xiàn)ifth Division of Xinjiang Production and Construction Corps,Shuanghe,Xinjiang 833408;3.Tarim University,Ala'er,Xinjiang 843300)
Abstract In recent years,cotton verticillium wilt disease spread in Xinjiang,has become one of the important factors affecting local cotton production.In this study,a collection of 344 representative cotton accessions were genotyped by the highthroughput SNP array for investigating the phenotype of verticillium wilt at two locations and for two years.The genomewide association study(GWAS)" of disease percentage was performed via the mixed linear model(MLM).The results showed that there was a negative correlation between verticillium wilt incidence and yield and fiber quality.The broad sense heritability of verticillium wilt morbidity in 4 environments was 40.10%.Population structure analysis showed that the group can be divided into 2 subgroups.The MLM model detected 18 significant loci that were distributed on A03,A05,A10,A12,D02,D11,and D13.The present results help to analyze the genetic basis of cotton verticillium wilt resistance and lay the foundation for studying the pathogenic mechanism and guiding the genetic improvement of cotton verticillium wilt resistance.
Key words Upland cotton;Germplasm resources;Verticillium wilt mobidity;Association analysis
基金項(xiàng)目 兵團(tuán)重點(diǎn)領(lǐng)域科技攻關(guān)項(xiàng)目(2024AB001);八師重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2021NY01)。
作者簡(jiǎn)介 周小鳳(1975—),女,安徽廬江人,研究員,碩士,從事棉花遺傳育種研究。
收稿日期 2024-01-08
由大麗輪枝菌引起的棉花黃萎病,是影響棉花安全生產(chǎn)的世界性難題[1]。新疆是我國(guó)最大的棉花產(chǎn)區(qū),近年來,黃萎病在新疆棉區(qū)蔓延,給棉農(nóng)造成較大經(jīng)濟(jì)損失,嚴(yán)重影響當(dāng)?shù)孛藁óa(chǎn)業(yè)的可持續(xù)發(fā)展,提高棉花抗病性迫在眉睫。選育和種植抗黃萎病的棉花品種被認(rèn)為是防治黃萎病的有效措施,抵抗黃萎病菌侵染已成為選育棉花新品種的重要目標(biāo)性狀[2]。
目前,由于對(duì)棉花抗黃萎病遺傳模式及抗病機(jī)制等缺乏系統(tǒng)研究和科學(xué)認(rèn)知,導(dǎo)致棉花抗黃萎病種質(zhì)材料的篩選、創(chuàng)制和新品種選育受到制約[3]。研究發(fā)現(xiàn),黃萎病菌分泌的毒素可能是其主要致病因素,其中細(xì)胞壁降解酶、脂多糖蛋白復(fù)合物以及核蛋白可能是重要的致病成分[4]。王龍等[5]研究發(fā)現(xiàn),與棉花抗黃萎病性狀相關(guān)的22個(gè)SSR位點(diǎn)中,能同時(shí)在2個(gè)以上環(huán)境出現(xiàn)的位點(diǎn)有2個(gè)。棉花黃萎病的抗性受多基因協(xié)同控制,可以通過簡(jiǎn)化基因組測(cè)序的全基因組關(guān)聯(lián)分析(GWAS)解析棉花黃萎病抗性的分子遺傳規(guī)律。全基因組關(guān)聯(lián)分析是一種基于連鎖不平衡的定位方法,是在全基因組水平上分析數(shù)量性狀遺傳構(gòu)成的重要方法[7]。Li等[6]通過基于簡(jiǎn)化基因組測(cè)序的棉花黃萎病抗性全基因組關(guān)聯(lián)分析,發(fā)現(xiàn)了14個(gè)抗病新位點(diǎn)。
與連鎖作圖相比,全基因組關(guān)聯(lián)分析具有精確度高、無需專門構(gòu)建群體、能同時(shí)分析同一位點(diǎn)的多個(gè)等位基因等優(yōu)點(diǎn)[8-9]。目前,全基因組關(guān)聯(lián)分析主要用于研究棉花產(chǎn)量、品質(zhì)等性狀的遺傳構(gòu)成,而關(guān)于棉花抗病性關(guān)鍵位點(diǎn)和候選基因的研究較少[10-11]。該研究以我國(guó)不同棉區(qū)種質(zhì)資源為研究對(duì)象,于2018—2019年在新疆博樂和阿拉爾2個(gè)黃萎病發(fā)生嚴(yán)重地區(qū)進(jìn)行試驗(yàn),通過全基因組關(guān)聯(lián)分析,開發(fā)SNP標(biāo)記,挖掘與抗黃萎病相關(guān)的特異性位點(diǎn),從而為棉花抗黃萎病遺傳改良以及抗黃萎病性狀棉花新品種分子標(biāo)記輔助選擇提供理論基礎(chǔ)和技術(shù)支撐。
1 材料與方法
1.1 試驗(yàn)材料及田間試驗(yàn)設(shè)計(jì) 該試驗(yàn)采用的334份陸地棉種質(zhì)資源均由新疆農(nóng)墾科學(xué)院棉花研究所提供,于2018—2019年分別種植于第一師農(nóng)科所(阿拉爾)和第五師農(nóng)科所(博樂)黃萎病發(fā)生地。試驗(yàn)地各點(diǎn)肥力均勻,采用隨機(jī)區(qū)組設(shè)計(jì),每份材料設(shè)2次重復(fù),采用1膜6行種植模式,小區(qū)面積2.3 m2,行距為寬行66.0 cm+窄行10.0 cm,株距9.5 cm,每份材料種植2小行,機(jī)械鋪膜打孔,膜上人工點(diǎn)播,膜下滴灌栽培,4個(gè)環(huán)境(2年2個(gè)試驗(yàn)點(diǎn))的田間管理方法同常規(guī)大田生產(chǎn)一致。
1.2 表型性狀調(diào)查 黃萎病抗性、產(chǎn)量性狀和纖維品質(zhì)性狀的調(diào)查方法參照杜雄明等[12]的棉花種質(zhì)資源描述規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn)。
黃萎病抗性調(diào)查:在黃萎病發(fā)病高峰期調(diào)查發(fā)病率(DP)和發(fā)病指數(shù)(DI);黃萎病依照 DB51/T 1205—2011《棉花黃萎病抗性鑒定技術(shù)規(guī)程》進(jìn)行鑒定[13]。
產(chǎn)量性狀調(diào)查:在棉花吐絮后期,每份材料每個(gè)重復(fù)分別收取中部10個(gè)棉鈴,于室內(nèi)充分干燥后稱量10個(gè)棉鈴的籽棉質(zhì)量,使用SY-50A棉花考種軋花機(jī)軋花后稱量皮棉質(zhì)量(LW),測(cè)定單鈴質(zhì)量(SBW)并計(jì)算衣分(LP)。根據(jù)試驗(yàn)小區(qū)的實(shí)收籽棉產(chǎn)量計(jì)算實(shí)收皮棉產(chǎn)量(LAW),實(shí)收皮棉產(chǎn)量=實(shí)收籽棉產(chǎn)量×衣分。
纖維品質(zhì)性狀測(cè)量:考種完成后,在新疆農(nóng)墾科學(xué)院棉花研究所進(jìn)行纖維品質(zhì)性狀測(cè)定,棉花纖維檢測(cè)儀器為Premier HFT 9000半自動(dòng)纖維測(cè)定儀,檢測(cè)溫度26 ℃,相對(duì)濕度65%。每份材料每個(gè)重復(fù)分別取約15 g皮棉樣品,檢測(cè)指標(biāo)包括纖維上半部平均長(zhǎng)度(FL)、纖維比強(qiáng)度(FS)、纖維整齊度(FU)、纖維伸長(zhǎng)率(FE)和馬克隆值(MV)。
1.3 全基因組重測(cè)序檢測(cè)SNP及基因型分析 2018年夏天取334份棉花嫩葉樣品送往北京諾禾致源科技股份有限公司進(jìn)行高通量全基因組重測(cè)序。步驟:提取棉花基因組DNA,檢測(cè)DNA濃度和質(zhì)量,取5 μg質(zhì)量濃度大于1.5 μg/μL且光密度值在1.8~2.0的DNA樣品,采用TruSeq DNA試劑盒(Illumina,圣地亞哥,加利福尼亞,美國(guó))構(gòu)建測(cè)序文庫(kù),檢測(cè)合格后的DNA樣品使用Illumina NovaSeq測(cè)序平臺(tái)進(jìn)行重測(cè)序,讀取長(zhǎng)度為雙端150 bp,平均測(cè)序深度為6.1倍。
將測(cè)序獲得的Raw Reads通過Trimmomatic軟件(version 0.32)[14]除去接頭,經(jīng)FASTP軟件進(jìn)行質(zhì)控后得到Clean Reads,再用BWA軟件[15]將Clean Reads與武漢大學(xué)參考基因組(Ghirsutum_TM-1_WHU_genome.standard.fa)比對(duì),剔除堿基質(zhì)量得分(Q值)小于20的堿基對(duì)。進(jìn)一步用GATK軟件[16]的HaplotypeCaller模塊進(jìn)行SNP檢測(cè),使用 Plink 軟件從初步獲得的群體SNP中篩選出最小等位基因頻率(MAF)大于0.05、缺失率(MR)小于0.1的SNP用于后續(xù)分析。
2 結(jié)果與分析
2.1 表型性狀數(shù)據(jù)分析 通過BLUP分析,334份棉花種質(zhì)資源表型發(fā)病率在4個(gè)環(huán)境中具有廣泛的變異,在重病地考察群體材料發(fā)病率,發(fā)病率的極差范圍為47.27%~82.48%,發(fā)病率的平均值為68.73%,發(fā)病率的廣義遺傳力為40.10%,其中標(biāo)準(zhǔn)差和變異系數(shù)分別為5.56和8.09%。
2.2 黃萎病抗病性及重要農(nóng)藝性狀間的相關(guān)性分析 如圖1所示,10個(gè)性狀間的相關(guān)性分析產(chǎn)生108對(duì)相關(guān)系數(shù),范圍為-0.67~0.88。發(fā)病率與發(fā)病指數(shù)存在極顯著正相關(guān),而發(fā)病率與實(shí)收皮棉產(chǎn)量、單鈴質(zhì)量、衣分、馬克隆值、纖維整齊度、纖維伸長(zhǎng)率存在極顯著負(fù)相關(guān),發(fā)病指數(shù)與實(shí)收皮棉產(chǎn)量、單鈴質(zhì)量、衣分、纖維上半部平均長(zhǎng)度、纖維比強(qiáng)度、馬克隆值、纖維整齊度、纖維伸長(zhǎng)率存在極顯著負(fù)相關(guān)。
產(chǎn)量相關(guān)性狀之間,實(shí)收皮棉產(chǎn)量與單鈴質(zhì)量、衣分均表現(xiàn)出極顯著的正相關(guān)。
5個(gè)纖維品質(zhì)性狀之間,纖維上半部平均長(zhǎng)度與纖維整齊度、纖維比強(qiáng)度、纖維伸長(zhǎng)率均呈極顯著正相關(guān);纖維比強(qiáng)度與纖維整齊度和纖維伸長(zhǎng)率均表現(xiàn)出極顯著的正相關(guān)。
對(duì)10個(gè)表型性狀進(jìn)行頻率分析,均比較符合正態(tài)分布,可以進(jìn)行關(guān)聯(lián)分析。
2.3 基因型數(shù)據(jù)及群體結(jié)構(gòu)分析 將334份陸地棉材料的測(cè)序數(shù)據(jù)與武漢大學(xué)參考基因組比對(duì),共檢測(cè)到2 366 003個(gè)SNP和137 361個(gè)InDel, SNP平均密度為1.05/kb,InDel平均密度為0.06/kb,其中A08染色體上的SNP密度最大,A02染色體上的SNP密度最?。ū?)。
使用Plink (v1.9)對(duì)334份陸地棉材料群體基因型數(shù)據(jù)進(jìn)行PCA群體結(jié)構(gòu)分析,結(jié)果顯示群體可以劃分為2個(gè)明顯的組,PCA的結(jié)果作為Q矩陣用于關(guān)聯(lián)分析。使用 tassel(v5)計(jì)算kinship得到K矩陣(圖2)。
2.4 黃萎病相關(guān)性全基因組關(guān)聯(lián)分析 使用Tassel(v5) 的MLM模型對(duì)發(fā)病率進(jìn)行關(guān)聯(lián)分析,顯著性閾值為-lg (P) =6.28 時(shí),共檢測(cè)到18個(gè)與黃萎病發(fā)病率顯著關(guān)聯(lián)的SNP顯著位點(diǎn),分布在A03、A05、A10、A12、D02、D11和D13(表2)。
全基因組關(guān)聯(lián)分析檢測(cè)到的與棉花黃萎病發(fā)病率表型顯著關(guān)聯(lián)且穩(wěn)定的位點(diǎn)在A12染色體上鑒定到了顯著峰(圖3A),分別位于12_90567113_SNV、12_90797437_SNV、12_90797546_SNV、12_91032350_SNV、12_94484859_SNV 5個(gè)顯著SNP位點(diǎn)(圖3B和C)。
3 討論
3.1 表型數(shù)據(jù)分析 該研究對(duì)334份棉花種質(zhì)資源發(fā)病率進(jìn)行考察,分析其在4個(gè)環(huán)境下的發(fā)病率表型。結(jié)果顯示,中創(chuàng)83、新陸早24號(hào)、94052等發(fā)病率低且穩(wěn)定,可推薦作為改良黃萎病抗性的優(yōu)良親本。該研究關(guān)于黃萎病抗病性和農(nóng)藝性狀的相關(guān)性分析顯示,棉花黃萎病不僅嚴(yán)重影響棉花的產(chǎn)量,對(duì)棉花品質(zhì)也有負(fù)面影響,這與Gapare等[3]的研究一致。
3.2 關(guān)聯(lián)分析 傳統(tǒng)的棉花育種方法主要通過在黃萎病地的鑒定進(jìn)行選擇,育種周期長(zhǎng),隨機(jī)性較大,而且棉花的黃萎病抗病性極易受環(huán)境的影響,因此利用分子標(biāo)記的手段,找到與抗黃萎病密切相關(guān)的位點(diǎn),可以加快育種進(jìn)程。該研究利用多年多環(huán)境的表型數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,顯著性閾值為-lg (P)=6.28 時(shí),共檢測(cè)到18個(gè)與發(fā)病率關(guān)聯(lián)的顯著位點(diǎn),將全基因組關(guān)聯(lián)分析檢測(cè)到的與棉花黃萎病發(fā)病率表型顯著關(guān)聯(lián)且穩(wěn)定的位點(diǎn)進(jìn)行鑒定,在A12染色體上鑒定到了顯著峰,分別位于12_90567113_SNV、12_90797437_SNV、12_90797546_SNV、12_91032350_SNV、12_94484859_SNV 5個(gè)顯著SNP位點(diǎn)。
4 結(jié)論
該研究使用Tassel(v5)的MLM模型,利用 90K SNP 芯片對(duì)334份棉花種質(zhì)資源發(fā)病率進(jìn)行全基因組關(guān)聯(lián)分析,群體在4個(gè)環(huán)境中發(fā)病率的廣義遺傳力為40.10%,獲得18個(gè)顯著關(guān)聯(lián)的SNP標(biāo)記位點(diǎn),其中A12是攜帶棉花黃萎病抗性基因的熱點(diǎn)區(qū)域,包含12_90567113_SNV、12_90797437_SNV、12_90797546_SNV、12_91032350_SNV和12_94484859_SNV 5個(gè)突出位點(diǎn),這些位點(diǎn)可能是與棉花黃萎病抗性相關(guān)的重要位點(diǎn)。
參考文獻(xiàn)
[1] LOCKE T.Compendium of potato diseases[J].Journal of agricultural science,2002,138(4):459-461.
[2]" 賈海紅,郭興啟.棉花GhMAPK7基因抵抗黃萎病菌的分子機(jī)理研究:華東六省一市生物化學(xué)與分子生物學(xué)會(huì)2015年學(xué)術(shù)交流會(huì)論文集[C].[出版地不詳]:[出版者不詳],2015:15-16.
[3] GAPARE W,CONATY W,ZHU Q H,et al.Genomewide association study of yield components and fibre quality traits in a cotton germplasm diversity panel[J].Euphytica,2017,213(3):1-22.
[4] 傅明川,李浩,陳義珍,等.利用WGCNA鑒定棉花抗黃萎病相關(guān)基因共表達(dá)網(wǎng)絡(luò)[J].作物學(xué)報(bào),2020,46(5):668-679.
[5] 王龍,李黎貝,馬啟峰,等.陸地棉抗黃萎病性狀與SSR標(biāo)記的關(guān)聯(lián)分析[J].新疆農(nóng)業(yè)科學(xué),2018,55(9):1569-1578.
[6] LI T G,MA X F,LI N Y,et al.Genomewide association study discovered candidate genes of Verticillium wilt resistance in upland cotton (Gossypium hirsutum L.)[J].Plant biotechnology journal,2017,15(12):1520-1532.
[7] 顧明亮,牛文全.全基因組關(guān)聯(lián)研究的策略及面臨的挑戰(zhàn)[J].國(guó)際遺傳學(xué)雜志,2012,35(2):70-81.
[8]" HUANG X,HAN B.Natural variations and genomewide association studies in crop plants[J].Annual review of plant biology,2014,65:531-551.
[9]" NUZHDIN S V,F(xiàn)RIESEN M L,MCINTYRE L M.Genotypephenotype mapping in a postGWAS world[J].Trends genet,2012,28(9):421-426.
[10] 韓貝,王旭文,李保奇,等.陸地棉種質(zhì)資源抗旱性狀的關(guān)聯(lián)分析[J].作物學(xué)報(bào),2021,47(3):438-450.
[11] 崔靜,王志城,張新雨,等.棉花 GbSTK 基因調(diào)控開花和黃萎病抗性的功能研究[J].作物學(xué)報(bào),2021,47(1):30-41.
[12] 杜雄明, 周忠麗.棉花種質(zhì)資源描述規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn)[M].北京:中國(guó)農(nóng)業(yè)出版社,2005.
[13] 四川省質(zhì)量技術(shù)監(jiān)督局.棉花黃萎病抗性鑒定技術(shù)規(guī)程:DB51/T 1205—2011[S].四川省質(zhì)量技術(shù)監(jiān)督局,2011.
[14] BOLGER A M,LOHSE M,USADEL B.Trimmomatic:A flexible trimmer for Illumina sequence data[J].Bioinformatics,2014,30(15):2114-2120.
[15] LI H,DURBIN R.Fast and accurate short read alignment with BurrowsWheeler transform[J].Bioinformatics,2009,25(14):1754-1760.
[16] MCKENNA A,HANNA M,BANKS E,et al.The Genome Analysis Toolkit: A MapReduce framework for analyzing nextgeneration DNA sequencing data[J].Genome research,2010,20(9):1297-1303.