劉亭萱 谷勇哲 張之昊 王 俊 孫君明 邱麗娟1,
基于高密度遺傳圖譜定位大豆蛋白質(zhì)含量相關(guān)的QTL
劉亭萱1,2,**谷勇哲2,**張之昊3王 俊1,*孫君明2,*邱麗娟1,2,*
1長(zhǎng)江大學(xué), 湖北荊州 434025;2中國(guó)農(nóng)業(yè)科學(xué)院作物科學(xué)研究所 / 農(nóng)業(yè)農(nóng)村部北京大豆生物學(xué)重點(diǎn)實(shí)驗(yàn)室 / 農(nóng)業(yè)農(nóng)村部種質(zhì)資源利用重點(diǎn)實(shí)驗(yàn)室, 北京 100081;3東北農(nóng)業(yè)大學(xué)農(nóng)學(xué)院, 黑龍江哈爾濱 150030
大豆是重要的糧食作物和經(jīng)濟(jì)作物, 其籽粒蛋白約為40%, 是優(yōu)質(zhì)植物蛋白主要來源之一。挖掘控制大豆高蛋白數(shù)量性狀位點(diǎn)(Quantitative trait loci, QTL)以及分子標(biāo)記育種對(duì)高蛋白大豆培育具有重要的意義。本研究利用蛋白含量存在明顯差異的中黃35 (Zhonghuang 35, ZH35)和中黃13 (Zhonghuang 13, ZH13)雜交構(gòu)建的包含192個(gè)株系的重組自交系群體為供試材料, 通過對(duì)兩親本及RIL群體重測(cè)序, 構(gòu)建了包含4879個(gè)bin標(biāo)記的高密度遺傳圖譜, 總遺傳距離為3760.71 cM, 相鄰標(biāo)記間的遺傳距離為0.77 cM。RIL群體及親本分別于北京順義和河南濮陽(yáng)種植, 2個(gè)環(huán)境共檢測(cè)到15個(gè)蛋白含量相關(guān)QTL位點(diǎn), 分布于5號(hào)、12號(hào)、15號(hào)、17號(hào)、18號(hào)、19號(hào)和20號(hào)染色體, 貢獻(xiàn)率為4.36%~11.39%。其中, 北京順義和河南濮陽(yáng)檢測(cè)到和, 2個(gè)QTL貢獻(xiàn)率分別為7.65%和7.58%, 重疊區(qū)域包括33個(gè)基因。本研究有助于精細(xì)定位和圖位克隆大豆蛋白含量相關(guān)基因, 并為進(jìn)一步培育高蛋白大豆品種提供基因資源。
大豆; 蛋白質(zhì)含量; 重組自交系; bin圖譜; QTL定位
大豆是世界上最重要的經(jīng)濟(jì)作物之一, 籽粒富含優(yōu)質(zhì)蛋白, 對(duì)于人類消費(fèi)和工業(yè)應(yīng)用有很大的貢獻(xiàn)[1-2]。提高大豆蛋白質(zhì)含量對(duì)優(yōu)化作物品質(zhì)、育成優(yōu)異大豆品種具有重要意義。大豆蛋白含量是由多個(gè)QTL/基因和環(huán)境因素共同影響的數(shù)量性狀[3-4], 遺傳基礎(chǔ)比較復(fù)雜。
大豆不同性狀的QTL鑒定, 大多采用傳統(tǒng)的分子標(biāo)記技術(shù)來構(gòu)建遺傳圖譜, 包括限制性片段長(zhǎng)度多態(tài)性(restriction fragment length polymorphism, RFLP)、擴(kuò)增片段長(zhǎng)度多態(tài)性(amplified fragment length polymorphism, AFLP)和簡(jiǎn)單序列重復(fù)多態(tài)性(simple sequence repeat polymorphism, SSR)等[5-8]。Apuya等[9]利用RFLP標(biāo)記構(gòu)建了第1張大豆分子遺傳圖譜, 包括4個(gè)連鎖群和11個(gè)分子標(biāo)記。Keim等[10]利用栽培大豆與野生大豆雜交的F2群體, 構(gòu)建第2張遺傳連鎖圖譜, 共有130個(gè)RFLP標(biāo)記。Keim等[11]利用BSR-101和PI437.654配置的RIL群體, 構(gòu)建了一張遺傳距離為3441 cM的遺傳圖譜, 包括650個(gè)AFLP標(biāo)記。隨著分子標(biāo)記技術(shù)的不斷發(fā)展, 出現(xiàn)了多態(tài)性更高的簡(jiǎn)單重復(fù)序列標(biāo)記(simple sequence repeats, SSR)[12]。Cregan等[13]利用A81-356022和PI 468916雜交的F2群體, 構(gòu)建了一張包含606個(gè)SSR的遺傳圖譜。然而, 傳統(tǒng)分子標(biāo)記構(gòu)建的遺傳圖譜, 在全基因組上分布不均勻, 標(biāo)記密度不足以完全覆蓋大豆基因組, 缺少Q(mào)TL檢測(cè)所需的豐富遺傳背景, 構(gòu)建的遺傳圖譜限制了QTL定位的效率和精準(zhǔn)度[14]。
近年來, 隨著高通量測(cè)序技術(shù)的快速發(fā)展, 為大規(guī)模單核苷酸多態(tài)性(single nucleotide polymorphism, SNPs)標(biāo)記檢測(cè)提供了一個(gè)高效平臺(tái), 用于構(gòu)建高密度遺傳圖譜[15], 已經(jīng)成功應(yīng)用于擬南芥、水稻、玉米和大豆等遺傳圖譜的構(gòu)建[16-19]。Jiang等[20]利用高通量測(cè)序技術(shù)研究水稻低溫發(fā)芽能力, 鑒定出6個(gè)與水稻低溫發(fā)芽相關(guān)的QTL; Tian等[21]利用中黃13和中品03-5373配置的RIL群體, 構(gòu)建了一張包含4011個(gè)bin標(biāo)記的高密度遺傳圖譜, 在6個(gè)環(huán)境中檢測(cè)到3個(gè)新位點(diǎn); Pan等[22]研究大豆開花期, 從獲得的QTL中挖掘獲得52個(gè)候選基因, 包括已驗(yàn)證的、、和基因。構(gòu)建高密度遺傳圖譜可以加速?gòu)?fù)雜性狀QTL/基因的挖掘和應(yīng)用, 相關(guān)分子標(biāo)記為后續(xù)精細(xì)定位和基因鑒定奠定了良好的基礎(chǔ), 對(duì)大豆的科學(xué)研究和育種實(shí)踐具有重要意義[23]。
本研究以低蛋白品種中黃35 (Zhonghuang 35, ZH35)和高蛋白品種中黃13 (Zhonghuang 13, ZH13)為親本, 構(gòu)建了包含192個(gè)株系的重組自交系(recombinant inbred lines, RIL)群體, 利用全基因組測(cè)序(whole genome sequencing, WGS)技術(shù)對(duì)RIL群體進(jìn)行測(cè)序, 構(gòu)建了一張基于bin標(biāo)記的高密度遺傳圖譜, 鑒定與蛋白含量相關(guān)的QTL, 對(duì)大豆蛋白質(zhì)含量精細(xì)定位、候選基因鑒定、分子機(jī)制研究和分子標(biāo)記輔助選擇(marker assisted selection, MAS)等方面的深入研究具有一定的參考價(jià)值。
以ZH35和ZH13為親本配置組合, 從F2代通過單粒傳法構(gòu)建F2:6RILs群體, 群體包含192個(gè)株系, 在2020年7月分別種植于北京順義和河南濮陽(yáng)。群體種植均采用2 m行長(zhǎng), 行距為50 cm, 株距為10 cm,每個(gè)株系種植1行。
選擇表面干凈, 無菌斑、病害、裂紋, 顆粒完整的種子樣品, 利用德國(guó)Bruker公司生產(chǎn)的傅立葉變換近紅外光譜儀測(cè)定蛋白質(zhì)含量, 每個(gè)株系取5個(gè)單株, 每株3次重復(fù), 取5個(gè)單株的平均值為樣品的最終蛋白質(zhì)含量。利用SPSS (https://www.spssau. com/)軟件對(duì)親本及RIL群體表型數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì), 包括性狀在環(huán)境下的平均值、變異系數(shù)和正態(tài)分布檢驗(yàn)等。
隨機(jī)取F2:7各個(gè)株系的5個(gè)單株幼嫩葉片混樣, 按CTAB法[24]提取DNA后送北京諾禾致源生物信息科技有限公司進(jìn)行分析。檢測(cè)合格的DNA樣品通過酶切、加測(cè)序接頭、純化、PCR擴(kuò)增等步驟完成整個(gè)文庫(kù)制備。文庫(kù)質(zhì)檢合格后通過Illumina平臺(tái)測(cè)序[25]。
以Williams 82基因組序列(https://phytozome- next.jgi.doe.gov/info/Gmax_Wm82_a2_v1)作為參考基因組序列, 父本ZH13測(cè)序數(shù)據(jù)來源于Shen等[26]的相關(guān)報(bào)道, 結(jié)合實(shí)驗(yàn)室前期得到的ZH35測(cè)序數(shù)據(jù), 將2個(gè)親本及192個(gè)子代測(cè)序數(shù)據(jù)與參考基因組進(jìn)行比對(duì), 然后對(duì)親本和192個(gè)子代進(jìn)行SNP檢測(cè), 并且統(tǒng)計(jì)SNP的相關(guān)信息。通過親本基因型檢測(cè)結(jié)果, 對(duì)高質(zhì)量的SNP標(biāo)記進(jìn)行篩選?;诤Y選到的SNP標(biāo)記, 對(duì)每個(gè)個(gè)體以15個(gè)SNP為滑動(dòng)窗口, 步移長(zhǎng)度為1的策略檢測(cè)大豆RILs間的重組斷點(diǎn), 同時(shí)使用JoinMap4.0[27]對(duì)每個(gè)連鎖群的bin標(biāo)記進(jìn)行排序, 最終獲得可以使用的bin標(biāo)記, 用perl SVG模塊繪制高密度遺傳圖譜。由天津極智基因科技有限公司完成遺傳圖譜的構(gòu)建。
本研究使用MapQTL中的PT確定表型的LOD值閾值, 使用WinQTL軟件中的CIM算法進(jìn)行QTL定位, 當(dāng)某個(gè)位置檢測(cè)到的LOD值大于閾值時(shí), 就認(rèn)為該位置存在1個(gè)QTL, 在5%顯著性水平下, 以2.5為臨界值, 即LOD≥2.5作為判定QTL存在的依據(jù)。定位到的QTL的主要內(nèi)容包括染色體、遺傳距離、加性效應(yīng)、置信區(qū)間、LOD值以及單個(gè)QTL的表型貢獻(xiàn)率(2)。QTL命名法是按照McCouch等[28]描述的方法建立的, 以q開頭, 然后是性狀名稱、染色體名稱和該染色體QTL順序的縮寫。
利用定位區(qū)間所對(duì)應(yīng)的物理位置, 在SoyBase (https://www.soybase.org/)網(wǎng)站查詢基因功能注釋, 結(jié)合基因的表達(dá)量篩選候選基因。
由表1可知, 親本ZH35和ZH13蛋白質(zhì)含量差異較大, 2個(gè)環(huán)境下ZH13的蛋白含量都顯著高于ZH35。在北京順義, RIL群體蛋白含量的最大值為46%, 最小值為37.51%, 變異系數(shù)為2.48%; 在河南濮陽(yáng), RIL群體蛋白含量的最大值為45.98%, 最小值為37.04%, 變異系數(shù)為2.98%。比較2個(gè)環(huán)境中親本及RIL群體蛋白含量, 親本差異較小, 但是RIL群體蛋白含量在2個(gè)環(huán)境中呈極顯著差異(圖1)。2個(gè)環(huán)境中RIL群體的蛋白含量變異幅度較大, 峰度和偏度絕對(duì)值均小于1, 服從正態(tài)分布, 表現(xiàn)為數(shù)量性狀的遺傳模式(圖2)。
圖1 2個(gè)環(huán)境中F2:6群體蛋白含量表型箱型圖
***:< 0.001.
表1 2年兩代親本及重組自交系群體蛋白質(zhì)含量統(tǒng)計(jì)分析
RIL: 重組自交系。RIL: recombinant inbred lines.
圖2 ZH35/ZH13重組自交系及親本的蛋白含量表型分布特征
A: RIL群體在北京順義的蛋白含量分布圖; B: RIL群體在河南濮陽(yáng)的蛋白含量分布圖。ZH35: 中黃35; ZH13: 中黃13。
A: the distribution of protein content of RIL population in Shunyi, Beijing; B: the distribution of protein content of RIL population in Puyang, Henan. ZH35: Zhonghuang 35; ZH13: Zhonghuang 13. RIL: the recombinant inbred lines.
對(duì)ZH35和ZH13構(gòu)建的192個(gè)株系進(jìn)行WGS測(cè)序, 將2個(gè)親本及192個(gè)子代測(cè)序數(shù)據(jù)與參考基因組進(jìn)行比對(duì), 2個(gè)親本比對(duì)率都在93%以上, 1X覆蓋度平均在95.23%, 說明測(cè)序數(shù)據(jù)的均一性比較好。基于比對(duì)結(jié)果, 對(duì)親本和192個(gè)子代進(jìn)行SNP檢測(cè)、SNP標(biāo)記開發(fā)、基因分型和SNP標(biāo)記篩選, 最終得到有效標(biāo)記共1,034,092個(gè); 針對(duì)大豆的每條染色體, 使用JoinMap 4.0對(duì)每條染色體的bin標(biāo)記進(jìn)行排序, 染色體使用極大似然法排序, Kosambi函數(shù)計(jì)算遺傳距離, 最終上圖bin標(biāo)記共4879個(gè)。最終構(gòu)建的高密度遺傳圖譜遺傳距離總長(zhǎng)3760.71 cM, 平均遺傳距離0.77 cM, 覆蓋大豆全基因組20條染色體(圖3)。每條染色體標(biāo)記數(shù)為126~402個(gè), 平均為243.95個(gè), 遺傳距離為96.81~291.38 cM, 標(biāo)記間平均遺傳距離為0.77 cM (表2)。染色體中長(zhǎng)度小于5 cM的Gap比例平均達(dá)99.51%, 表明圖譜非常均勻。每條染色體上大部分標(biāo)記的順序與基因組保持一致, 能夠滿足定位要求。
在北京順義和河南濮陽(yáng)2個(gè)環(huán)境, 從F2:6RIL群體中共檢測(cè)出15個(gè)控制大豆蛋白含量的QTL, 分布于5號(hào)、12號(hào)、15號(hào)、17號(hào)、18號(hào)、19號(hào)和20號(hào)染色體(表3)。其中, 在北京順義檢測(cè)到9個(gè), 分布于15號(hào)、17號(hào)、18號(hào)、19號(hào)和20號(hào)染色體, LOD值介于2.85~4.48之間, 貢獻(xiàn)率介于4.44%~7.65%之間; 河南濮陽(yáng)檢測(cè)到6個(gè), 分布于5號(hào)、12號(hào)和20號(hào)染色體, LOD值介于2.67~4.82之間, 貢獻(xiàn)率介于4.83%~8.58%之間。所有QTL位點(diǎn)中,貢獻(xiàn)率最高, 達(dá)到8.51%, 區(qū)間內(nèi)包含49個(gè)基因;是QTL位點(diǎn)區(qū)間最小, 僅包含11個(gè)基因; 除此之外, 在20號(hào)染色體上, 2個(gè)環(huán)境分別鑒定到和存在重疊區(qū)域, 位于標(biāo)記bin5059~bin5060之間。
圖3 染色體標(biāo)記分布圖
X軸代表染色體編號(hào); Y軸代表遺傳距離(cM); 藍(lán)色代表bin標(biāo)記。
X-axis represents chromosome number; Y-axis represents genetic distance (cM); the blue represents the bin mark.
表2 中黃35/中黃13的RIL群體連鎖圖譜的基本信息
小于5 cM的gap比例是指染色體中長(zhǎng)度小于5 cM的gap比例, 比例越高圖譜越均勻。RIL: 重組自交系。
Higher proportion of gap length less than 5 cM in linkage group indicates the map is more uniform. RIL: the recombinant inbred lines.
表3 2種環(huán)境下檢測(cè)到的大豆蛋白質(zhì)含量QTL
在bin5059位點(diǎn), 低蛋白基因型(aa)有93個(gè)株系,在北京順義和河南濮陽(yáng)平均蛋白含量分別為41.68%和40.59%; 高蛋白基因型(bb)有99個(gè)株系, 在北京順義和河南濮陽(yáng)平均蛋白含量分別為42.37%和41.51%; 在bin5060位點(diǎn), 低蛋白基因型(aa)有95個(gè)株系, 在北京順義和河南濮陽(yáng)平均蛋白含量分別為41.67%和40.65%; 高蛋白基因型(bb)有97個(gè)株系, 在北京順義和河南濮陽(yáng)平均蛋白含量分別為42.39%和41.46% (圖4)。表明這2個(gè)標(biāo)記與大豆蛋白含量緊密連鎖, 可用于大豆蛋白改良的標(biāo)記輔助育種。
通過SoyBase (https://www.soybase.org/)網(wǎng)站對(duì)20號(hào)染色體重疊區(qū)間bin5059~bin5060內(nèi)的33個(gè)基因進(jìn)行檢索, 25個(gè)基因有功能注釋(表4)。同時(shí), 利用SoyBase網(wǎng)站對(duì)區(qū)間內(nèi)基因種子發(fā)育不同時(shí)期的表達(dá)量進(jìn)行分析(圖5), 表達(dá)量較高的有4個(gè)基因, 分別是、、和, 表達(dá)量中等的有5個(gè)基因, 分別是、、、和, 表達(dá)量較低的有5個(gè)基因, 分別是、、、和。
圖4 重疊區(qū)域中標(biāo)記bin5059與bin5060的基因型與表型相關(guān)性分析
(A): bin5059的基因型與表型相關(guān)性分析; (B): bin5060的基因型與表型相關(guān)性分析。圖中橫坐標(biāo)為基因型, 低蛋白記為a和A, 高蛋白記為b和B, 縱坐標(biāo)為蛋白含量。**:< 0.01。
(A): the correlation analysis between genotype and phenotype of bin5059; (B): the correlation analysis between genotype and phenotype of bin5060. The abscissa is the genotype, low protein is denoted as a and A, high protein content is denoted as band B, and the vertical ordinate is the number of protein content. **:< 0.01.
(續(xù)表4)
圖5 SoyBase網(wǎng)站候選區(qū)間內(nèi)基因在種子不同發(fā)育時(shí)期表達(dá)量
與傳統(tǒng)低密度遺傳圖譜相比, bin遺傳圖譜是基于高通量測(cè)序技術(shù)構(gòu)建的, 標(biāo)記密度高, 物理位置準(zhǔn)確, 精度達(dá)100 kb, 且一個(gè)bin內(nèi)部包含很多不發(fā)生重組的SNP, 可以用來精確檢測(cè)雙交換, 同時(shí)還能提供與關(guān)聯(lián)QTL連鎖更緊密的分子標(biāo)記用于MAS[29-30]。標(biāo)記間平均遺傳距離是評(píng)價(jià)高密度遺傳圖譜質(zhì)量的一個(gè)重要指標(biāo), Xu等[31]在2013年利用RIL群體在大豆中構(gòu)建了第一個(gè)bin高密度遺傳圖譜, 平均遺傳距離為0.70 cM; Karikari等[32]在6個(gè)不同環(huán)境中利用高通量測(cè)序方法鑒定大豆蛋白含量QTL, 構(gòu)建了一張包含2267個(gè)bin標(biāo)記的高密度遺傳圖譜, 標(biāo)記之間的平均距離為1.08 cM; Ma等[33]采用全基因組測(cè)序方法鑒定大豆蛋白含量QTL, 構(gòu)建了一張包含3420個(gè)bin標(biāo)記的高密度遺傳圖譜, 標(biāo)記間平均距離為0.94 cM; Huang等[34]利用全基因組測(cè)序技術(shù)構(gòu)建了包含3413個(gè)bin標(biāo)記的高密度遺傳連鎖圖譜, 標(biāo)記間的平均距離為1.58 cM, 檢測(cè)到3個(gè)LOD值比較高的蛋白含量QTL; Wang等[35]利用南夏豆25號(hào)和通豆11號(hào)配置的RIL群體鑒定大豆蛋白含量QTL, 構(gòu)建了一張包含2072個(gè)bin標(biāo)記的高密度遺傳圖譜, 標(biāo)記間平均距離為0.94 cM。Patil等[36]利用重組自交系群體鑒定大豆蛋白含量相關(guān)QTL, 構(gòu)建了一張包含4070個(gè)bin標(biāo)記的高密度遺傳圖譜。相較前人研究, 本研究中, 高密度遺傳圖譜的bin標(biāo)記最多, 包含4879個(gè), 并且bin標(biāo)記間平均遺傳距離為0.77 cM, 略大于Xu等[31]的研究結(jié)果, 但小于Karikari等[32]、Ma等[33]、Huang等[34]和Wang等[35]的圖譜, 表明該圖譜的bin標(biāo)記在基因組上密度較高。此外, 構(gòu)建高密度遺傳圖譜的4879個(gè)bin標(biāo)記在每條染色體上均勻分布, 大部分標(biāo)記的順序與基因組保持一致, 表明該遺傳圖譜共線性好, 遺傳重組率準(zhǔn)確度高, 極大地提高了QTL定位的精度, 為下一步挖掘大豆高蛋白相關(guān)基因奠定了基礎(chǔ)。
利用CIM法在北京順義和河南濮陽(yáng)共檢測(cè)到15個(gè)控制大豆蛋白含量的QTL, 其中有6個(gè)QTL位點(diǎn)在前人的研究中均被報(bào)道[37-39], 證明了本研究位點(diǎn)的可靠性。位于5號(hào)染色體, 與Wang等[39]報(bào)道的區(qū)間距離很近;位于15號(hào)染色體, LOD值為3.05, 貢獻(xiàn)率為5.12%, 該區(qū)間與Zhang等[37]研究一致, 其中Ma等[33]報(bào)道的貢獻(xiàn)率為14.70%, LOD為6.36;位于19號(hào)染色體, 貢獻(xiàn)率4.38%, LOD值為2.57, 該QTL包含在Kaleri等[42]報(bào)道的的位點(diǎn)之中, 同時(shí)距離位置很近。除此之外, 8個(gè)QTL是未被報(bào)道的大豆蛋白質(zhì)含量新位點(diǎn)(表4), 其中和兩個(gè)QTL位點(diǎn)具有一段重疊區(qū)域, 在北京順義和河南濮陽(yáng)都被檢測(cè)到, 說明該位點(diǎn)遺傳穩(wěn)定, 受環(huán)境影響較小, 可用于下一步精細(xì)定位、基因克隆和功能驗(yàn)證等研究。
用SoyBase (https://www.soybase.org/)網(wǎng)站獲得定位區(qū)間內(nèi)基因在種子不同發(fā)育時(shí)期的表達(dá)模式, 使用TBtools生成熱圖。其中在種子不同發(fā)育時(shí)期表達(dá)量最高, 并在Seed 14DAY時(shí)期表達(dá)量達(dá)到頂峰, 從Seed 10DAY到Seed 14DAY時(shí)期, 表達(dá)量呈現(xiàn)上升趨勢(shì), 可能大豆籽粒中蛋白質(zhì)正在逐步積累。同時(shí)利用SoyBase (https:// www.soybase.org/)提供的信息對(duì)區(qū)間內(nèi)基因進(jìn)行注釋, 根據(jù)功能推測(cè),參與谷胱甘肽代謝, 谷胱甘肽由谷氨酸、半胱氨酸及甘氨酸組成, 其中半胱氨酸為含硫氨基酸, 而蛋白品質(zhì)主要與含硫氨基酸相關(guān)[43]。據(jù)報(bào)道, 大豆中導(dǎo)入玉米醇溶蛋白基因, 使籽粒中的半胱氨酸含量從26.97%增加到29.33%, 進(jìn)而影響大豆蛋白品質(zhì)[44]。此外, 重疊QTL區(qū)間內(nèi)3個(gè)基因參與細(xì)胞內(nèi)蛋白質(zhì)的轉(zhuǎn)運(yùn), 可能調(diào)控大豆籽粒蛋白含量, 3個(gè)基因分別是、和。因此, 推測(cè)、、和這4個(gè)候選基因可能與大豆蛋白質(zhì)含量有關(guān), 但是還需進(jìn)一步的鑒定和驗(yàn)證。
本研究對(duì)中黃35和中黃13及其衍生的RILs群體進(jìn)行重測(cè)序, 構(gòu)建了包含4879個(gè)bin標(biāo)記的高密度遺傳圖譜。在北京順義和河南濮陽(yáng)鑒定到15個(gè)控制大豆蛋白含量的QTL, 其中8個(gè)是新的大豆蛋白位點(diǎn), 包括2個(gè)環(huán)境中均檢測(cè)到和的重疊區(qū)域, 區(qū)域內(nèi)有33個(gè)基因。本研究結(jié)果為候選基因的鑒定和蛋白含量的遺傳基礎(chǔ)分析奠定了基礎(chǔ)。
[1] Huang J H, Ma Q B, Cai Z D, Xia Q J, Cheng Y B. Identification and mapping of stable QTLs for seed oil and protein content in soybean [(L.) Merr]., 2020, 68: 6448–6460.
[2] Wang J, Chen P, Wang D, Shannon G, Zeng A, Orazaly M, Wu C. Identification and mapping of stable QTL for protein content in soybean seeds., 2015, 35: 92–102.
[3] Pathan S M, Vuong T, Clark K, Lee J D, Sleper D A. Genetic mapping and confirmation of quantitative trait loci for seed protein and oil contents and seed weight in soybean., 2013, 53: 765–774.
[4] Wilcox J R. Increasing seed protein in soybean with eight cycles of recurrent selection., 1998, 38: 1536–1540.
[5] Keim P, Diers B W, Olson T C, Shoemaker R C. RFLP mapping in soybean: association between marker loci and variation in quantitative traits., 1990, 126: 735–742.
[6] Du W J, Wang M, Fu S X, Yu D Y. Mapping QTLs for seed yield and drought susceptibility index in soybean (L.) across different environments., 2009, 36: 721–731.
[7] Pipolo C V, Pipolo A E, Haleem A H, Boerma H R, Sinclair T R. Identification of QTLs associated with limited leaf hydraulic conductance in soybean.,2012, 186: 679–686.
[8] Powell W, Morgante M, Andre C, Hanafey M, Vogel J, Tingey S, Rafalski A. The comparison of RFLP, RAPD, AFLP and SSR (microsatellite) markers for germplasm analysis., 1996, 2: 225–238.
[9] Apuya N R, Frazier B L, Keim P, Roth E J, Lark K G. Restriction fragment length polymorphisms as genetic markers in soybean,(L.) Merrill., 1988, 75: 889–901.
[10] Keim P S, Diers B W, Olson T C, Shoemaker R C. RFLP mapping in soybean: association between marker loci and variation in quantitative traits., 1990, 126: 735–742.
[11] Keim P, Schupp J M, Travis S E, Clayton K, Zhu T, Shi L, Ferreira A, Webb D M. A high-density soybean genetic map based on AFLP markers., 1997, 37: 537–543.
[12] Akkaya M S, Shoemaker R C, Specht J E, Bhagwat A A, Cregan P B. Integration of simple sequence repeat DNA markers into a soybean linkage map., 1995, 35: 1439–1445.
[13] Cregan P B, Jarvik T, Bush A L, Kaya N, Vantoai T T, Lohnes D G, Chung J. An integrated genetic linkage map of the soybean genome., 1999, 39: 1464–1490.
[14] Liu N X, Li M, Hu X B, Ma Q B, Mu Y H, Tan Z Y, Xia Q J, Zhang G Y, Nian H. Construction of high-density genetic map and QTL mapping of yield-related and two quality traits in soybean RILs population by RAD-sequencing., 2017, 18: 466–479.
[15] Varshney R K, Nayak S N, May G D, Jackson S A. Next- generation sequencing technologies and their implications for crop genetics and breeding., 2009, 27: 522–530.
[16] Joosen R V L, Arends D, Willems L A J, Ligterink W, Jansen R C, Hilhorst H W M. Visualizing the genetic landscape ofseed performance., 2012, 158: 570–589.
[17] Yu H H, Xie W B, Wang J, Xing Y Z, Xu C G, Li X H, Xiao J H, Zhang Q F. Gains in QTL detection using an ultra-high density SNP map based on population sequencing relative to traditional RFLP/SSR markers., 2011, 6: e17595.
[18] Song W B, Wang B B, Hauck A L, Dong X M, Li J P, Lai J S. Genetic dissection of maize seedling root system architecture traits using an ultra-high density bin-map and a recombinant inbred line population., 2015, 58: 266–279.
[19] Cheng Y B, Ma Q B, Ren H L, Xia Q J, Song E L, Tan Z Y, Li S X, Zhang G Y, Nian H. Fine mapping of a phytophthora- resistance genein soybean (L.) by high- throughput genome-wide sequencing., 2017, 130: 1041–1051.
[20] Jiang N F, Shi S L, Shi H, Khanzada H, Wassan G M, Zhu C L, Peng X S, Yu Q Y, Chen X R, He X P, Fu J R, Hu L F, Xu J, Ou-Yang L J, Sun X T, Zhou D H, He H H, Bian J M. Mapping QTL for seed germinability under low temperature using a new high-density genetic map of rice., 2017, 8: 1223–1232.
[21] Yu T, Lei Y, Lu H F, Zhang B, Li Y F, Liu C, Ge T L, Liu Y L, Han J N, Li Y H, Qiu L J. QTL analysis for plant height and fine mapping of two environmentally stable QTLs with major effects in soybean., 2022, 21: 933–946.
[22] Pan L Y, He J B, Zhao T J, Xing G N, Wang Y F, Yu D Y, Chen S Y, Gai J Y. Efficient QTL detection of flowering date in a soybean RIL population using the novel restricted two-stage multi-locus GWAS procedure., 2018, 131: 2581–2599.
[23] Wang W B, Liu M F, Wang Y F, Li X L, Cheng S X, Shu L P, Yu Z P, Kong J J, Zhao T J, Gai J Y. Characterizing two inter-specific bin maps for the exploration of the QTLs/genes that confer three soybean evolutionary traits., 2016, 7: 1248–1264.
[24] Allen G C, Flores-Vergara M A, Krasnyanski S, Kumar S, Thompson W F. A modified protocol for rapid DNA isolation from plant tissues using cetyltrimethylammonium bromide., 2006, 1: 2320–2325.
[25] Wang L X, Wang J, Luo G L, Yuan X X, Gong D, Hu L L, Chen H L, Wang S H, Chen X, Cheng X Z. Construction of a high- density adzuki bean genetic map and evaluation of its utility based on a QTL analysis of seed size., 2021, 20: 1753–1761.
[26] Shen Y T, Du H L, Liu Y C, Ni L B, Wang Z, Liang C Z, Tian Z X. Update soybean Zhonghuang 13 genome to a golden reference., 2019, 62: 1257–1260.
[27] Liu D Y, Ma C X, Hong W G, Huang L, Liu M, Liu H, Zeng H P, Deng D J, Xin H, Song J, Xu C H, Sun X W, Hou X L, Wang X W, Zheng H K. Construction and analysis of high-density linkage map using high-throughput sequencing data., 2014, 9: e98855.
[28] McCouch S R, Cho Y G, Yano M, Paul E, Blinstrub M, Morishima H, Kinoshita T. Report on QTL nomenclature., 1997, 14: 11–12.
[29] 董驥馳, 楊靖, 郭濤, 陳立凱, 陳志強(qiáng), 王慧. 基于高密度Bin圖譜的水稻抽穗期QTL定位. 作物學(xué)報(bào), 2018, 44: 938–946. Dong J C, Yang J, Guo T, Chen L K, Chen Z Q, Wang H. QTL mapping for heading date in rice using high-density bin map., 2018, 44: 938–946 (in Chinese with English abstract).
[30] Hori K, Kobayashi T, Shimizu A, Sato K, Takeda K, Kawasaki S. Efficient construction of high-density linkage map and its application to QTL analysis in barley., 2003, 107: 806–813.
[31] Xu X Y, Zeng L, Tao Y, Vuong T, Wan J R, Boerma R, Noe J, Li Z L, Finnerty S, Pathan S M, Shannon J G, Nguyen H T. Pinpointing genes underlying the quantitative trait loci for root-knot nematode resistance in palaeopolyploid soybean by whole genome resequencing., 2013, 110: 13469–13474.
[32] Karikari B, Li S G, Bhat J A, Cao Y, Kong J J, Yang J Y, Gai J Y, Zhao T J. Genome-wide detection of major and epistatic effect QTLs for seed protein and oil content in soybean under multiple environments using high-density bin map., 2019, 20: 979–1000.
[33] Ma Y J, Ma W Y, Hu D Z, Zhang X N, Yuan W J, He X H, Kan G Z, Yu D Y. QTL mapping for protein and sulfur-containing amino acid contents using a high-density bin-map in soybean (L. Merr.)., 2019, 67: 12313–12321.
[34] Huang J H, Ma Q B, Cai Z D, Xia Q J, Li S X, Jia J, Chu L, Lian T X, Nian H, Cheng Y B. Identification and mapping of stable QTLs for seed oil and protein content in soybean [(L.) Merr.]., 2020, 68: 6448–6460.
[35] Wang J, Mao L, Zeng Z Q, Yu X B, Lian J Q, Feng J, Yang W Y, An J G, Wu H Y, Zhang M G, Liu L Z. Genetic mapping high protein content QTL from soybean ‘Nanxiadou 25’ and candidate gene analysis., 2021, 21: 388.
[36] Patil G, Vuong T D, Kale S, Valliyodan B, Deshmukh R, Zhu C S, Wu X L, Bai Y H, Yungbiuth D, Lu F, Kumpatla S, Shannon J G, Varshney R K, Nguyen H T. Dissecting genomic hotspots underlying seed protein, oil, and sucrose content in an interspecific mapping population of soybean using high-density linkage mapping, 2018, 16: 1939–1953.
[37] Mansur L M, Orf J H, Chase K, Jarvik T, Cregan P B, Lark K G. Genetic mapping of agronomic traits using recombinant inbred lines of soybean., 1996, 36: 1327–1336.
[38] Mao T T, Jiang Z F, Han Y P, Teng W L, Zhao X, Li W B. Identification of quantitative trait loci underlying seed protein and oil contents of soybean across multi-genetic backgrounds and environments., 2013, 132: 630–641.
[39] Li X Y, Xue H, Zhang K X, Li W B, Ning H L. Mapping QTLs for protein and oil content in soybean by removing the influence of related traits in a four-way recombinant inbred line population.,2020, 158: 659–675.
[40] Wang W, Sun Y, Yang P, Cai X, Yang L, Ma J, Ou Y, Liu T, Ali I, Liu D. A high density SLAF-seq SNP genetic map and QTL for seed size, oil and protein content in upland cotton., 2019, 20: 599–610.
[41] Zhang J P, Wang X Z, Lu Y M, Bhusal S J, Song Q J, Cregan P B, Yen Y, Brown M, Jiang G L. Genome-wide scan for seed composition provides insights into soybean quality improvement and the impacts of domestication and breeding.,2018, 11: 460–472.
[42] Kaleri A A, Li L, Zhang Y, Liu W, Jiang C, Zhang Y, Liu C, Kaleri H A, Nizamani M M, Mehmood A, Bahadur S, Li W X, Ning H. Recognition of QTL for seed protein and oil content in two soybean recombinat inbred lines populations.,2021, 31: 1669–1685.
[43] 邱紅梅, 厲志, 于妍, 高淑芹, 馬曉萍, 鄭宇宏, 孟凡凡, 侯云龍, 王躍強(qiáng), 王曙明. 基于元分析的大豆含硫氨基酸相關(guān)基因挖掘與信息學(xué)分析. 中國(guó)油料作物學(xué)報(bào), 2015, 37: 141–147. Qiu H M, Li Z, Yu Y, Gao S Q, Ma X P, Zheng Y H, Meng F F, Hou Y L, Wang Y Q, Wang S M. Mining and analysis of genes related to sulfur-containing amino acids in soybean based on meta-QTL., 2015, 37: 141–147 (in Chinese with English abstract).
[44] Li Z W, Meyer S, Essig J S, Liu Y, Schapaugh M A, Muthukrishnan S, Hainline B E, Trick H N. High-level expression of maize γ-zein protein in transgenic soybean ()., 2005, 16: 11–20.
Mapping soybean protein QTLs based on high-density genetic map
LIU Ting-Xuan1,2,**, GU Yong-Zhe2,**, ZHANG Zhi-Hao3, WANG Jun1,*, SUN Jun-Ming2,*, and QIU Li-Juan1,2,*
1Yangtze University, Jingzhou 434025, Hubei, China;2National Key Facility for Gene Resources and Genetic Improvement of MARA / Beijing Key Laboratory of Soybean Biology of MARA / Institute of Crop Sciences, Chinese Academy of Agricultural Sciences, Beijing 100081, China;3College of Agriculture, Northeast Agricultural University, Harbin 150030, Heilongjiang, China
Soybean is an important food crop and economic crop, and its grain protein is about 40%, which is one of the main sources of high-quality vegetable protein. Mining the quantitative trait loci (QTL) that control soybean high protein and molecular marker breeding are of great significance for the breeding of high protein soybean. In this study, a recombinant inbred line population consisting of 192 lines constructed by crossing Zhonghuang 35 (ZH35) and Zhonghuang 13 (ZH13) with significant differences in protein content was used as the experimental materials. A high-density genetic map containing 4879 bin markers was constructed with the total genetic distance of 3760.71 cM and the genetic distance between adjacent markers of 0.77 cM by resequencing the two parents and the RIL population. The RIL population and its parents were grown in Shunyi, Beijing and Puyang, Henan, respectively. A total of 15 protein content-related QTL loci were detected in the two environments, which were distributed on chromosomes 5, 12, 15, 17, 18, 19, and 20, respectively. The contribution rate was 4.36%–11.39%, among which,andwere detected in Shunyi, Beijing and Puyang, Henan, respectively. The contribution rates of the two QTLs were 7.65% and 7.58%, respectively, and the overlapping regions included 33 genes. This study is helpful for fine mapping and map-based cloning of soybean protein content-related genes, and provides genetic resources for further breeding of high-protein soybean varieties.
soybean; protein content; recombinant inbred lines; bin map; QTL mapping
10.3724/SP.J.1006.2023.24121
本研究由中國(guó)和烏拉圭聯(lián)合實(shí)驗(yàn)室合作項(xiàng)目(2018YFE0116900)資助。
This study was supported by the Project of Sino-Uruguayan Joint Laboratory (2018YFE0116900).
邱麗娟, E-mail: qiulijuan@caas.cn; 王俊, E-mail: wangjagri@yangtzeu.edu.cn; 孫君明, E-mail: qiulijuan@caas.cn
**同等貢獻(xiàn)(Contributed equally to this work)
劉亭萱, E-mail: 18834408825@163.com; 谷勇哲, E-mail: guyongzhe@caas.cn
2022-05-19;
2022-10-10;
2022-10-20.
URL: https://kns.cnki.net/kcms/detail/11.1809.S.20221019.1603.006.html
This is an open access article under the CC BY-NC-ND license (http://creativecommons.org/licenses/by-nc-nd/4.0/).