井付鈺, 王瑞, 徐新福, 曲存民, 盧坤, 李加納
西南大學(xué) 農(nóng)學(xué)與生物科技學(xué)院/南方山地農(nóng)業(yè)教育部工程研究中心, 重慶 400715
甘藍(lán)型油菜分枝角度主要指有效分枝與主莖之間形成的夾角[1]. 分枝角度是檢測植物空間分布能力的一個重要指標(biāo), 受遺傳因素、 植物激素和環(huán)境因素等多重因素調(diào)控[2-4]. 甘藍(lán)型油菜株型高大、 分枝多且長, 而分枝角度太大會造成分枝間相互交叉纏繞, 降低機(jī)械收獲時的分行、 切割和輸送效率[5], 油菜機(jī)械化收獲產(chǎn)量的取得得益于小的分枝角度[6]. 王俊生等[7]提出理想油菜株型應(yīng)該包括成株期分枝角度較小等一系列特征. 曾川等[8]發(fā)現(xiàn)油菜株型在開花期和角果形成期應(yīng)表現(xiàn)為分枝緊湊. 陳新軍等[9]研究發(fā)現(xiàn)分枝角度小的緊湊型品種更抗倒伏, 單株生產(chǎn)力較高, 同時機(jī)械化收獲產(chǎn)量也較高. 李揚(yáng)等[10]提出分枝角度的大小決定油菜冠層結(jié)構(gòu)的緊湊度, 而緊湊度適宜的株型既可以提高種植密度, 也可以減少機(jī)械化收獲時因植株分枝間的纏繞造成的產(chǎn)量損失. 張倩[11]發(fā)現(xiàn)株型緊湊的油菜更適宜密植, 對群體的產(chǎn)量和抗倒伏性貢獻(xiàn)率較高.
目前, 對于油菜分枝角度基因定位的研究還較少. 張倩[11]對分枝形態(tài)差異較大的兩個親本F2后代進(jìn)行研究, 檢測到1個位于LG1連鎖群上的分枝角度數(shù)量性狀座位(Quantitative Trait Locus, QTL), 該QTL分布在標(biāo)記SWUC893和SWUC816b之間. 段秀建[12]在研究油菜自然群體的分枝角度時發(fā)現(xiàn)1個候選基因, 該基因與擬南芥基因AT5G14090(AtLAZY1)同源, 且該基因的調(diào)節(jié)機(jī)制主要是重新分布植物內(nèi)的生長素, 從而調(diào)節(jié)腋芽的向地性, 達(dá)到改變分枝角度大小的作用. 沈鈺森[13]利用小孢子培養(yǎng)得到的DH群體進(jìn)行遺傳分析, 在全基因組范圍內(nèi)檢測到17個與分枝角度性狀相關(guān)的QTL, 其中位于A03上的1個QTL和C03上的2個QTL為新發(fā)現(xiàn)的主效QTL, 檢測到SAUR30(BnaC03g14890D)和SAUR55(BnaC03g16420D)可能與生長素早期響應(yīng)和油菜分枝角度大小的調(diào)控相關(guān). 孫程明[14]利用Illumina 60K SNP芯片對520份甘藍(lán)型油菜材料進(jìn)行基因分型, 聯(lián)合使用3種模型, 共檢測到56個顯著位點(diǎn), 預(yù)測到77個候選基因. 汪文祥等[15]以小孢子培養(yǎng)得到的DH群體為實(shí)驗材料, 利用油菜60K SNP芯片對DH群體基因分型, 定位到17個分枝角度QTL, 并獲得1個與分枝角度相關(guān)的候選基因VAMP714, Wang等[16]采用集團(tuán)分離分析法(BSA)結(jié)合下一代測序技術(shù)對分枝角度QTL進(jìn)行精細(xì)繪制, 鑒定出一個位于A06染色體上的主效QTL, 并在該QTL區(qū)域鑒定出多個基因, 其中BnaA0639380D可能是油菜分枝角度的候選基因.
本文以分枝角度大的純系黃花親本62與分枝角度小的純系粉花親本77為親本構(gòu)建114個DH群體株系, 通過GBS簡化測序[17]獲得SNP數(shù)據(jù), 考察DH群體一次分枝角度表型, 利用一般線性模型(General Linear Model, GLM)[18]進(jìn)行全基因組關(guān)聯(lián)分析.
黃花親本62和粉花親本77都是小孢子加倍后的純系材料. DH群體為(黃花62×粉花77)F1花粉小孢子加倍成功的114個基因型株系.
2018年9月-2019年5月, 將親本和DH群體種植于重慶市北碚區(qū)歇馬鎮(zhèn)西南大學(xué)油菜生物學(xué)團(tuán)隊育種基地. 每個材料種植3行, 每行8株, 行距40 cm, 株距30 cm, 田間管理按常規(guī)方式進(jìn)行. 2個親本材料分別為62-1,77-1. 62-1為分枝角度大的親本, 平均一次有效分枝角度為43.4°. 77-1為分枝角度小的親本, 平均一次有效分枝角度為38.0°. 油菜主莖上的一次分枝角度和主莖的夾角直接用量角器測量. 分枝角度(BT)在群體中每個單株測5次夾角值, 選長勢一致的5個單株進(jìn)行測量.
2018年12月, 采集親本和DH群體植株嫩葉, 20℃保存?zhèn)溆茫?2019年1月送北京諾禾致源生物信息科技有限公司測序. 2個親本DNA建庫類型為DNA-350 bp, 以Illumina HiSeq PE150方法測序, 測序得到的總堿基數(shù)與待測基因組大小的比值即測序深度, 該數(shù)值為30×[19-20]. DH子代進(jìn)行GBS簡化基因組測序. 利用GBS-SNP-CROP[13]分析流程通過barcode文件得到114個DH子代系的雙末端測序文件. 以法國甘藍(lán)型油菜Darmor-bzh為參考組, 采用BWA-mem軟件比對測序reads到參考組, 并通過SAMtools[21]軟件參數(shù)mpileup 獲得114個DH子代系的SNP數(shù)據(jù).
用Excel 2019計算出每個性狀的平均值, 通過R3.5.0軟件包畫出分枝角度頻數(shù)分布直方圖和概率密度曲線圖(圖1). 用SPSS統(tǒng)計分析軟件計算出數(shù)據(jù)的統(tǒng)計信息, 并用Kolmogorov-Smirnov[21]方法驗證數(shù)據(jù)的正態(tài)分布.
黑色虛線代表均值線.
利用TASSEL關(guān)聯(lián)分析軟件[22]中的一般線性模型, 結(jié)合基因型數(shù)據(jù), 進(jìn)行全基因組關(guān)聯(lián)分析, 以每個SNP位點(diǎn)的-log10(P)觀察值和期望值, 繪制Quantile-Quantile散點(diǎn)圖(QQ Plot)和曼哈頓圖(Manhattan Plot). 在Manhattan Plot中, SNP位點(diǎn)P的閾值小于2.59×10-6, 表示位于該閾值以下的SNP位點(diǎn)與性狀關(guān)聯(lián)程度較強(qiáng).
KEGG采用R3.6.0/clusterProfiler包, 在所定位的油菜QTL區(qū)間中, 找到與油菜基因同源的擬南芥基因, 利用R包中自帶的擬南芥數(shù)據(jù)庫, 通過KEGG富集出可能參與的代謝通路.
DH群體一次分枝角度頻數(shù)分布直方圖和概率密度曲線如圖1所示. 利用統(tǒng)計學(xué)Kolmogorov-Smirnov方法檢測到分枝角度性狀(BT)服從正態(tài)分布(表1), 表明一次分枝角度可能受主效基因控制, 因此對分枝角度性狀進(jìn)行主效基因定位分析.
表1 分枝角度基本統(tǒng)計數(shù)據(jù)和標(biāo)準(zhǔn)正態(tài)驗證
利用DH群體GBS簡化測序獲得的SNP數(shù)據(jù)(圖2)和一次分枝角度表型數(shù)據(jù)進(jìn)行GWAS定位分析. QQ圖(圖3)表明, GLM模型檢測到的P值基本接近期望值, 具有較好的控制假陽性能力. 利用GLM模型對分枝角度進(jìn)行關(guān)聯(lián)定位, Manhattan圖展示分析結(jié)果(圖4), 當(dāng)設(shè)置顯著性閾值-log10(P)=6.5, 共檢測到8個顯著位點(diǎn). 這8個顯著位點(diǎn)都分布在A07染色體(表2). 其中顯著性最高位點(diǎn)為3469428A07和3469437A07, -log10(P)為8.08, 對表型變異的貢獻(xiàn)率都為30.72%. 其余位點(diǎn)的-log10(P)值范圍是7.17~7.56, 可解釋25.21%~35.05%的表型變異.
表2 甘藍(lán)型油菜一次分枝角度顯著關(guān)聯(lián)位點(diǎn)
X軸表示連鎖群; Y軸表示遺傳距離(單位: cm); 藍(lán)色為有效SNP標(biāo)記.
圖3 甘藍(lán)型油菜一次分枝角度全基因組關(guān)聯(lián)分析QQ圖
圖4 甘藍(lán)型油菜一次分枝角度全基因組關(guān)聯(lián)分析Manhattan圖
依據(jù)法國甘藍(lán)型油菜參考組序列信息, 8個顯著的SNP位點(diǎn)區(qū)間內(nèi)共有49個基因(表3). 結(jié)合法國甘藍(lán)型油菜基因序列和擬南芥同源基因序列注釋這49個基因.BnaA07g01910D和BnaA07g01920D基因與擬南芥基因AT5G13370和AT5G13360序列或結(jié)構(gòu)域高度同源, 而擬南芥基因AT5G13370和AT5G13360編碼與生長素合成相關(guān)的GH3家族蛋白. 已有多個文獻(xiàn)研究結(jié)論推測分枝角度和生長素密切相關(guān), 本研究在GWAS定位分枝角度A07染色體區(qū)間內(nèi), 令人意外地注釋到了與生長素合成的油菜基因.
表3 一次分枝角度候選基因鑒定
續(xù)表3
繼續(xù)對定位區(qū)間內(nèi)的49個基因進(jìn)行KEGG分析, 本研究發(fā)現(xiàn)8個基因分別富集到8個代謝通路上(表4).BnaA07g03650D在嘌呤代謝通路上,BnaA07g01280D參與泛醌及其他萜類醌的生物合成,BnaA07g05610D參與蛋白轉(zhuǎn)運(yùn),BnaA07g01250D參與生理周期調(diào)節(jié),BnaA07g05090D參與嘧啶代謝,BnaA07g01910D在植物激素信號轉(zhuǎn)導(dǎo)中起作用,BnaA07g05610D參與內(nèi)質(zhì)網(wǎng)中的蛋白質(zhì)加工,BnaA07g03650D參與丙氨酸、 天冬氨酸和谷氨酸代謝, 而BnaA07g01920D卻沒有富集到任何通路上, 其余40個甘藍(lán)型油菜基因也未被富集到任何代謝通路上(圖5). 本研究在KEGG網(wǎng)站上查詢ko04075通路, 發(fā)現(xiàn)BnaA07g01910D參與的GH3家族蛋白負(fù)責(zé)細(xì)胞繁殖擴(kuò)增的功能(圖6).
表4 KEGG富集表
橫向為該代謝通路蛋白個數(shù)及占蛋白總數(shù)的比例, 縱向為KEGG代謝通路的名稱.
圖6 植物激素轉(zhuǎn)運(yùn)代謝通路
甘藍(lán)型油菜第一次分枝角度與遺傳基因密切相關(guān). 李洪戈[23]、 張倩[11]、 汪文祥等[15]利用F2分離群體檢測到甘藍(lán)型油菜一次分枝角度由一對主效基因和多個微效基因共同控制. 本研究考察DH群體一次分枝角度表型以及利用簡化測序SNP數(shù)據(jù)對此表型進(jìn)行GWAS分析, 顯示出一次分枝角度表型為一對主效基因的特點(diǎn), 且一次分枝角度表型基因效應(yīng)與以往學(xué)者的研究結(jié)論基本一致.
本研究通過GWAS分析流程檢測到8個顯著的SNP位點(diǎn)與一次分枝角度密切關(guān)聯(lián). 這8個SNP位點(diǎn)分別位于A07染色體1.5Mb,0.9Mb,3.4Mb,6.1Mb附近, 此區(qū)間內(nèi)分布有49個基因. 從傳統(tǒng)QTL分析思路上可認(rèn)為, 一次分枝角度在A07染色體上端部位有3個主效QTL. 而張倩[11]檢測到A01染色體有1個分枝角度QTL, 沈鈺森[13]發(fā)現(xiàn)位于A03上的1個QTL和C03上的2個QTL與分枝角度高度關(guān)聯(lián). 孫程明[14]定位到52個顯著SNP位點(diǎn)與分枝角度相關(guān), 汪文祥等[15]定位到17個分枝角度QTL, 分析推測C08染色體上1個QTL可能控制甘藍(lán)型油菜分枝角度. 因此, 不同作者使用不同群體利用不同分析方法得到的甘藍(lán)型油菜分枝角度主效基因定位和QTL定位結(jié)論差異很大. 原因在于分枝角度是一個很復(fù)雜的生物學(xué)現(xiàn)象, 不僅受遺傳基因作用, 還受激素和環(huán)境因素的影響.
GWAS和傳統(tǒng)QTL本質(zhì)上都是尋找標(biāo)記和性狀之間的關(guān)聯(lián), 但GWAS與傳統(tǒng)QTL相比較具有3個優(yōu)勢[24]. ① 分辨率高. 基于家系群體如BC1、 F2、 RIL 都是先計算Marker之間的重組率, 再計算遺傳距離, 從而推測Marker與性狀之間的關(guān)聯(lián). 家系群體內(nèi)發(fā)生的重組交換有限, 重組事件少, 在遺傳過程中目標(biāo)區(qū)塊沒有被完全打碎, 重組率分辨度不夠?qū)е妈b定的關(guān)聯(lián)候選區(qū)域特別大. 而GWAS分析的自然群體內(nèi)部隨機(jī)交配多, 能夠把連鎖區(qū)塊打得足夠碎, 重組事件足夠多, 定位到的區(qū)間足夠小, 因此分辨率更高、 更精確. ② 不需要構(gòu)建家系群體, 節(jié)約時間和成本. BC1和F2群體至少需要2年, RIL群體需要5年以上, 而自然群體或DH群體需要年限短, 且群體內(nèi)部保留了大量的遺傳變異位點(diǎn). ③ 能識別更多的等位基因. 傳統(tǒng)QTL連鎖分析針對雙親之間的差異目標(biāo)性狀, 家系群體只能分析一個性狀, 而GWAS一次可以采集群體的多個性狀同時進(jìn)行分析.
本研究所用的SNP位點(diǎn)信息來源于GBS簡化測序. 簡化測序和全基因組重測序比較有很多不足. 簡化測序是酶切全基因組, 對酶切位點(diǎn)附件的片段進(jìn)行變異檢測. 酶的選擇、 酶切效率、 酶切位點(diǎn)在物種內(nèi)的實(shí)際分布都影響著SNP 數(shù)據(jù)的收集. 簡化測序一般只能鑒定到幾萬個至10幾萬個SNP, 而全基因組重測序能鑒定到10 Mb以上的SNP數(shù)據(jù)量[25]. 因此, 在經(jīng)費(fèi)充足的情況下, 最理想的GWAS分析是對群體株系進(jìn)行全基因組重測序, 才能確保染色體上分布足夠密度的SNP位點(diǎn).
本研究DH群體的一次分枝角度表型呈正態(tài)分布. GWAS方法將一次分枝角度主效基因定位在A07染色體上. 定位區(qū)間內(nèi)分析和注釋了49個基因, KEGG分析推測甘藍(lán)型油菜一次分枝角度主效基因可能為編碼GH3家族蛋白的BnaA07g01910D基因, 此基因負(fù)責(zé)細(xì)胞繁殖擴(kuò)增, 影響分枝角度表型.