唐錚灝,劉 潔,陳 巧,謝 皓
(北京農(nóng)學(xué)院植物科學(xué)技術(shù)學(xué)院/農(nóng)業(yè)應(yīng)用新技術(shù)北京市重點實驗室,北京102206)
株高是大豆育種中一個重要的農(nóng)藝性狀,矮稈表型對于選育具有理想株型的高產(chǎn)品種起到重要作用[1],矮稈能夠提高抗倒伏和光能利用率,實現(xiàn)大豆產(chǎn)量的提高[2-3]。近年來,隨著分子生物學(xué)技術(shù)的發(fā)展,矮稈基因不斷被發(fā)掘出來,并應(yīng)用于培育矮稈品種[4]。例如,HWANG等[5]利用輻照發(fā)現(xiàn)一個大豆矮稈突變體,培育出Hobbit 87、Charleston、Apex和Strong等半矮稈品種,顯著提高大豆的產(chǎn)量。據(jù)分析[6-7],大豆株高的遺傳力較高,約85.6%,受主效基因和多對微效基因共同控制,同時環(huán)境對大豆表型影響也較大。何平等[8]對矬大豆、早豐5、九交7601等品種的研究表明,株高由隱性主效單基因及若干修飾基因控制;目前在SoyBean數(shù)據(jù)庫中收集約200多個與株高有關(guān)的數(shù)量性狀位點(quantitative trait loci,QTL)[9-10]。除發(fā)現(xiàn)調(diào)控株高的主效基因外,DONG等[11]研究認(rèn)為,大豆品種Jimidou-1和Gongjiao 9112雜交后代的半矮性狀受一個隱性基因控制;LI等[12]用EMS誘變大豆品種中品661,獲得一個矮稈突變體dw,發(fā)現(xiàn)dw的矮稈性狀由1對隱性核基因控制。
本課題組在大豆新品種選育過程中,從高稈品種海系13與矮稈品種北農(nóng)103雜交的分離后代中,發(fā)現(xiàn)高稈和矮稈性狀極端分離的情況。經(jīng)對該雜交組合F2群體的遺傳分析和分子標(biāo)記初步定位,北農(nóng)103攜帶1對調(diào)控矮稈性狀的隱性核基因,位于大豆19號染色體(L連鎖群)上[13]。本研究在此基礎(chǔ)上,對該基因進行精細定位和克隆,為進一步研究和利用北農(nóng)103及其矮稈基因奠定基礎(chǔ)。
大豆矮稈品種北農(nóng)103、高稈品種海系13和以北農(nóng)103為父本、海系13為母本雜交構(gòu)建的688個F5代重組自交系(342個矮稈系和346個高稈系)。其中,北農(nóng)103為北京農(nóng)學(xué)院選育、北京市農(nóng)作物品種審定委員會審定的夏播品種,為有限生長型品種,株高55 cm;海系13為南京品種,半有限生長型,北京夏播株高90 cm。試驗材料由本課題組保存和提供,種植在北京農(nóng)學(xué)院大豆試驗地。
1.2.1 株高鑒定與田間取樣 大豆植株開花結(jié)束后,株高不再生長時,鑒定各個自交系的株高,矮稈系50 cm左右,高稈系90 cm左右。分別采取矮稈系和高稈系幼嫩葉片于-80 ℃冰箱保存?zhèn)溆谩?/p>
1.2.2 BSA-Seq混池的構(gòu)建、重測序及矮稈基因初步定位 選取矮稈和高稈重組自交系葉片各30份,提取DNA,將DNA等量混合構(gòu)建矮稈和高稈混池,并以矮稈父本北農(nóng)103和高稈母本海系13為對照,利用高通量重測序技術(shù),分析株高在大豆全基因組變異情況及相關(guān)區(qū)域。測序及數(shù)據(jù)基本分析由上海美吉生物醫(yī)藥科技有限公司完成。
1.2.3 分子標(biāo)記的開發(fā) 在高通量重測序的基礎(chǔ)上,參照大豆數(shù)據(jù)庫Soybase(https://soybase.org/)提供的SSR引物序列合成引物,同時利用測序數(shù)據(jù)設(shè)計插入缺失位點標(biāo)記引物。引物由北京擎科新業(yè)生物科技有限公司合成。
1.2.4 DNA提取和PCR體系 CTAB法提取葉片DNA。參照袁鷹等[13]的方法,PCR反應(yīng)體系10 μL,其中,1 μL引物(2 μmol/L),5 μL 2×T5 Super PCR Mix,2 μL樣品DNA(15~25 ng/μL),2 μL ddH2O;PCR反應(yīng)程序,95 ℃預(yù)變性5 min;95 ℃變性45 s;55~60 ℃退火45 s;72 ℃延伸30 s;35次循環(huán), 72 ℃延伸10 min。利用8%非變性聚丙烯酰胺凝膠電泳檢測擴增產(chǎn)物。
1.2.5 遺傳連鎖圖譜的構(gòu)建及目標(biāo)基因的定位 以(海系13×北農(nóng)103) F5重組自交系為定位材料,根據(jù)688個重組自交系產(chǎn)生的分子標(biāo)記和對應(yīng)自交系的田間株高表型,利用Mapmaker 3.0和MapDraw V2.1軟件進行遺傳連鎖距離分析;根據(jù)標(biāo)記與株高性狀的緊密連鎖程度,參照大豆遺傳連鎖圖譜(https://soybase.org/)定位矮稈基因。
1.2.6 基因克隆 根據(jù)矮稈基因定位結(jié)果,在NCBI(https://www.ncbi.nlm.nih.gov/)上分析定位區(qū)域內(nèi)的已知基因,推測可能與矮稈性狀相關(guān)的候選基因,并根據(jù)其序列設(shè)計引物。以海系13、北農(nóng)103和(海系13×北農(nóng)103) F5重組自交系中矮稈、高稈各3株幼葉提取的DNA為模板,進行PCR擴增,擴增結(jié)果連接至pEASY-BluntZero載體上,培養(yǎng)后挑取單克隆及重組體菌液PCR鑒定。取300 μL陽性克隆菌液上游引物、下游引物各20 μL,在北京擎科新業(yè)生物技術(shù)有限公司進行測序。pEASY-BluntZeroCloning Kit試劑盒購自北京全式金生物公司。
1.2.7 株高發(fā)育期候選基因表達量分析 采用實時熒光定量分析法,分別在苗期、花芽分化期、開花期、成熟前期摘取北農(nóng)103和海系13頂部相同位置的葉片,利用試劑盒TransZol Up,提取RNA;以Goldenstar RT6 cDNA Synthesis Kit試劑盒反轉(zhuǎn)錄RNA。根據(jù)候選基因序列設(shè)計引物進行實時熒光定量PCR,檢測候選基因表達量,參照劉潔等[14]的方法,PCR體系為25 μL:上游引物和下游引物各1 μL(10 μmol/L),12.5 μL SYBR GREEN PCR Premix HS Taq,2 μL模板cDNA,8.5 μL H2O(DNase free)。PCR反應(yīng)程序,94 ℃預(yù)變性30 s;94 ℃變性30 s;60 ℃退火30 s;72 ℃延伸30 s,40次循環(huán);熔解曲線,95 ℃ 10 s,65 ℃ 60 s,97 ℃ 1 s。試劑購自北京鼎國昌盛生物技術(shù)公司。
實時熒光定量分析試驗均重復(fù)3次,經(jīng)儀器自動分析獲得基因的Ct值,用Microsoft Excel軟件作圖分析,SPSS軟件分析顯著性,用3次重復(fù)的平均值比較高稈基因和矮稈基因的相對表達量,相對表達量的計算采用2-△△Ct法[15]。
株高性狀高通量測序分析見表1。全基因組高通量重測序共獲得178.48G數(shù)據(jù)量,原始數(shù)據(jù)總序列數(shù)為539.24M,Q30達到93.84%,親本樣品平均測序深度為35X,矮稈系和高稈系混池樣品平均測序深度為36X。測樣與參考基因平均比對率為99.72%,平均覆蓋深度為36X,基因組覆蓋度為93%。當(dāng)置信度為0.99時,控制株高性狀的基因可能位于大豆10號、19號、2號、4號和8號染色體的5個區(qū)域中,共有1 461個候選基因,301個單核苷酸多態(tài)性位點和57個插入缺失位點。
表1 矮稈性狀基因和高稈性狀基因全基因組高通量重測序結(jié)果Tab.1 Whole genome high throughput resequencing of dwarf/tall trait genes
根據(jù)初步定位結(jié)果,選取10號、19號、2號、4號和8號染色體上SSR引物,從(海系13×北農(nóng)103) F5重組自交系群體中選取矮稈系和高稈系各4份,采用集團分離分析法,建立矮稈和高稈2個近等基因池,通過PCR擴增,檢測引物產(chǎn)生的多態(tài)性。在19號染色體(L)上的56對SSR引物中有12對引物在混池擴增出多態(tài)性,而在10號、2號、4號和8號染色體上的SSR引物的擴增結(jié)果未檢測出多態(tài)性。將產(chǎn)生多態(tài)性的12對SSR引物,分別對群體中346個高稈系和342個矮稈系的DNA進行PCR檢測,12對引物中有10對引物產(chǎn)生的多態(tài)性標(biāo)記與矮稈基因緊密連鎖。為增加標(biāo)記的數(shù)量,根據(jù)全基因組重測序結(jié)果中19號染色體(L)48 410 000到50 666 457區(qū)域內(nèi)DNA的序列,設(shè)計50對插入/缺失標(biāo)記,通過PCR多態(tài)性檢測,發(fā)現(xiàn)缺失標(biāo)記XH-8和XH-23與矮稈基因緊密連鎖。最終,共發(fā)現(xiàn)12對引物(表2)擴增產(chǎn)生的標(biāo)記與矮稈基因緊密連鎖。其中,引物Satt373的部分PCR結(jié)果如圖1。
表2 12對SSR引物的序列信息及位置Tab.2 Information of 12 pairs of SSR primers used in this study
利用Mapmaker3.0和MapDraw V2.1軟件對12對引物與688個自交系的DNA擴增的標(biāo)記基因型數(shù)據(jù)和688個自交系的表型數(shù)據(jù)進行遺傳連鎖分析,繪制出遺傳連鎖圖譜(圖2)。根據(jù)袁鷹等[13]的建議,將矮稈基因暫命名為Gmd1。遺傳連鎖分析表明標(biāo)記Satt373、XH-8、Sat_245、Satt513、XH-23、Satt229、Satt527、Satt166、Satt481、Satt418 、Sat_195和Satt278與Gmd1的遺傳距離分別為0.8、1.0、1.8、2.3、4.4、8.3、11.4、12.3、15.6、22.2、25.4和28.4 cM,從遺傳連鎖圖譜可以看出Gmd1位于標(biāo)記Satt373與XH-8之間,與12個標(biāo)記的連鎖位置為Satt278-Sat_195-Satt418-Satt481-Satt166-Satt527-Satt229-XH-23-Satt513-Satt373-Gmd1-XH- 8-Sat_245。結(jié)合大豆品種Williams 82的物理圖譜(https://www.soybase.org),分子標(biāo)記Satt373至XH-8區(qū)間對應(yīng)于19號染色體上195 kb的物理區(qū)間。
檢索NCBI(https://www.ncbi.nlm.nih.gov/)的大豆基因組,發(fā)現(xiàn)在引物Satt 373和XH-8區(qū)間包含25個基因,根據(jù)功能對這些基因進行初步篩選,2個候選基因GRF1和IAA16與矮稈性狀相關(guān),參照GRF1和IAA16的序列設(shè)計引物(表3),以海系13、北農(nóng)103及其后代高稈系和矮稈系為材料,對候選基因進行克隆和序列分析。候選基因GRF1全長1 100 bp,在海系13、北農(nóng)103、高稈系和矮稈系中的GRF1序列完全相同;候選基因IAA16全長2 760 bp,在海系13和高稈系中IAA16序列相同,而北農(nóng)103和矮稈系的IAA16序列相同,海系13與北農(nóng)103相比,IAA16在1 564 bp處海系13堿基為A,而北農(nóng)103為C;在1 571 bp處海系13堿基為G,而北農(nóng)103為C(圖3)。分析IAA16序列,編碼序列全長為4 35 bp,共編碼144個氨基酸,海系13和北農(nóng)103中因堿基的不同出現(xiàn)兩處氨基酸變化(圖4)。北農(nóng)103候選基因IAA16在第132個氨基酸,由酪氨酸突變成絲氨酸;在第134個氨基酸,由絲氨酸突變成蘇氨酸。經(jīng)蛋白結(jié)構(gòu)分析推測,北農(nóng)103的候選基因IAA16中氨基酸變異在可引起蛋白結(jié)構(gòu)變化的結(jié)構(gòu)域范圍之內(nèi)。
表3 候選基因克隆引物序列Tab.3 Sequence information of candidate gene clone primers
為驗證候選基因IAA16對株高的影響,在矮稈品種北農(nóng)103和高稈品種海系13的苗期、花芽分化期、開花期和成熟前期,分別取幼葉,提取RNA反轉(zhuǎn)錄為cDNA,利用實時熒光定量分析法對候選基因IAA16在不同生育期的表達量進行分析(圖5)。苗期和花芽分化期IAA16表達量相對較高,海系13中IAA16表達量略高于北農(nóng)103,但差異不明顯(P>0.05);開花期海系13中IAA16表達量較高,而北農(nóng)103較低,相差6倍,差異極顯著(P<0.01);成熟前期IAA16表達量都較低,雖然海系13的IAA16表達量也比北農(nóng)103高,但差異不明顯(P>0.05)。
目前,對大豆矮稈基因的定位區(qū)間多位于6號、7號、13號和18號染色體上,且多為QTL定位[14],而QTL在實際應(yīng)用上有一定的難度。本研究以矮稈品種北農(nóng)103、高稈品種海系13及其雜交F2分離群體衍生的F5重組自交系群體為研究材料,通過全基因組高通量重測序技術(shù)初步定位,F(xiàn)5重組自交系群體的精細定位,篩選與克隆候選基因,并對候選基因進行生育期表達量分析,以確定候選基因的可靠性。大豆品種北農(nóng)103攜帶有1對控制矮稈性狀的隱性基因,該基因暫定名為Gmd1,位于大豆19號染色體(L連鎖群)上,與12對引物產(chǎn)生的分子標(biāo)記緊密連鎖,在標(biāo)記Satt373與XH-8之間,遺傳距離分別為0.8 cM和1.0 cM;區(qū)間內(nèi)北農(nóng)103候選基因IAA16發(fā)生兩處單堿基變異,分別發(fā)生在1 564 bp和1 571 bp處,導(dǎo)致氨基酸變化,從而蛋白結(jié)構(gòu)受影響;海系13在開花期候選基因IAA16的表達量高于北農(nóng)103,相差6倍,差異極顯著,作為高稈和半有限生長型品種的海系13,開花期仍是株高生長的快速期,而北農(nóng)103為矮稈和有限生長型品種,開花期株高的生長基本停止,表明IAA16開花期在海系13中的高表達量與其對株高的調(diào)控有關(guān)。結(jié)合IAA16在海系13和北農(nóng)103中的DNA序列和蛋白結(jié)構(gòu)分析,推測IAA16的等位突變基因可能是調(diào)控北農(nóng)103矮稈性狀的基因,即Gmd1。
據(jù)報道,在大豆上已發(fā)現(xiàn)的矮稈基因dw[12],位于8號染色體;半矮基因sdf-1[11]位于19號染色體45 201 612 bp到45 250 751 bp之間。本研究發(fā)現(xiàn)Gmd1定位在19號染色體49 191 336 bp到49 386 333 bp之間,與前人的研究不在同一定位區(qū)間,推測Gmd1可能是一個新的矮稈基因。目前與株高相關(guān)的基因中,大多與植物激素有關(guān),并通過調(diào)控植物激素的合成或其信號傳導(dǎo)途徑,以此控制植物株高[16-17]。盡管本研究獲得的候選基因IAA16的功能有待進一步確定,但是為研究北農(nóng)103及其攜帶的矮稈基因提供重要的信息。此外,劉潔等[14]的研究表明北農(nóng)103還攜帶有1對調(diào)控早花的隱性基因e1,因此,北農(nóng)103作為改良大豆株高和成熟期的品種資源具有一定的利用價值。