羅含敏 熊發(fā)前 丘立杭 劉 菁 段維興高軼靜 覃夏燕 吳建明 李楊瑞 劉俊仙
(1廣西壯族自治區(qū)農(nóng)業(yè)科學(xué)院甘蔗研究所,530007,廣西南寧;2農(nóng)業(yè)農(nóng)村部廣西甘蔗生物技術(shù)與遺傳改良重點(diǎn)實(shí)驗(yàn)室/廣西甘蔗遺傳改良重點(diǎn)實(shí)驗(yàn)室,530007,廣西南寧;3廣西壯族自治區(qū)農(nóng)業(yè)科學(xué)院經(jīng)濟(jì)作物研究所,530007,廣西南寧)
甘蔗(Saccharum officinarumssp.)被廣泛種植于熱帶和亞熱帶地區(qū),不僅是重要的禾本科糖料作物,也是重要的生物質(zhì)與能源作物和經(jīng)濟(jì)作物[1-2]。廣西是我國最大的甘蔗生產(chǎn)基地,自2000年以來,種植面積占我國糖料作物總面積的 70%以上,另外,甘蔗糖占我國食糖總量的90%以上,因此,甘蔗產(chǎn)業(yè)對(duì)保障國家蔗糖供給安全有著舉足輕重的作用。
甘蔗栽培由新植和宿根組成,國內(nèi)的一般可收獲3年(1年新植和2年宿根),而國外多數(shù)產(chǎn)蔗國多于3年。其單產(chǎn)為單位面積有效蔗莖的總重量,由株高、分蘗、莖徑、錘度和單莖重等多基因調(diào)控的重要數(shù)量性狀組成[3-4],因此,確保甘蔗種植穩(wěn)產(chǎn)增產(chǎn)的重要途徑之一是培育優(yōu)良新品種,高產(chǎn)、高糖、宿根性好和抗性強(qiáng)等優(yōu)良性狀需綜合兼顧,不同時(shí)代甘蔗品種的更迭對(duì)提高甘蔗產(chǎn)量意義非凡[5]。然而,甘蔗新品種選育和改良主要采用傳統(tǒng)的有性雜交程序(圖1),該程序存在選育周期長(zhǎng)、經(jīng)驗(yàn)性居多和效率低等問題,育成1個(gè)甘蔗新品種需要8~10年,甚至更長(zhǎng)的時(shí)間。此外,甘蔗栽培種的基因組高度雜合,染色體呈非整倍性[6],而當(dāng)前甘蔗高貴化育種的遺傳基礎(chǔ)狹窄[7-8],這些加大了甘蔗品種選育和遺傳改良的難度[9]。雖然可通過近緣屬和遠(yuǎn)緣屬雜交引入更多的優(yōu)異基因資源以拓寬甘蔗遺傳基礎(chǔ)[10-11],但重要數(shù)量性狀在甘蔗雜交后代中易受環(huán)境因子影響而表現(xiàn)不穩(wěn)定[12-13],這也加劇了甘蔗品種選育難度。由此可知,甘蔗常規(guī)品種選育的瓶頸顯而易見。目前,隨著分子生物學(xué)及基因組學(xué)技術(shù)和手段的快速發(fā)展,甘蔗栽培種R570和細(xì)莖野生種割手密(Saccharum spontaneumL. AP85-441)基因組的公布[6,14],且越來越多甘蔗栽培品種(系)RNA-Seq數(shù)據(jù)的發(fā)表[15-18],給基于大數(shù)據(jù)挖掘與開發(fā)甘蔗性狀相關(guān)的分子標(biāo)記在甘蔗育種上的利用帶來了新的希望和機(jī)遇。雖然基于基因組的分子標(biāo)記極大地促進(jìn)了重要作物農(nóng)藝性狀的遺傳選育[19],然而,甘蔗分子標(biāo)記輔助育種仍面臨著許多挑戰(zhàn)。本文通過分析甘蔗分子標(biāo)記輔助育種的現(xiàn)狀及其瓶頸,總結(jié)應(yīng)用于甘蔗的分子標(biāo)記種類及其存在的問題,闡明分子標(biāo)記在甘蔗遺傳連鎖圖譜構(gòu)建中的作用及其研究狀況,進(jìn)而從甘蔗產(chǎn)量與蔗糖分性狀相關(guān) QTL的定位、甘蔗主要抗病基因的定位及其在抗病分子育種中的應(yīng)用概況、關(guān)聯(lián)分析方法在甘蔗重要農(nóng)藝性狀研究中的應(yīng)用等方面對(duì)性狀相關(guān)的分子標(biāo)記進(jìn)行綜述,為分子標(biāo)記技術(shù)助力甘蔗新品種選育和提高育種效率提供理論參考。
圖1 甘蔗新品種的常規(guī)雜交選育流程Fig.1 The process of conventional cross breeding for new sugarcane varieties
分子標(biāo)記輔助育種技術(shù)可提高作物育種效率,也能準(zhǔn)確地進(jìn)行目標(biāo)農(nóng)藝性狀的定向選擇。雖然分子標(biāo)記在甘蔗及其種質(zhì)遺傳多樣性研究中已有許多報(bào)道,但目前只有抗褐銹病基因標(biāo)記能夠應(yīng)用于甘蔗分子標(biāo)記輔助育種中[20]。究其原因主要有 4點(diǎn),一是甘蔗遺傳背景復(fù)雜且基因組高度雜合與龐大,二是甘蔗高貴化代表性品種全基因組序列尚未測(cè)序并組裝完成,三是缺乏簡(jiǎn)單實(shí)用高效的 DNA分子標(biāo)記,四是遺傳連鎖圖譜構(gòu)建密度極度不飽和。這些是導(dǎo)致甘蔗種質(zhì)資源的分子精準(zhǔn)鑒定和評(píng)價(jià)、高密度遺傳連鎖圖譜的構(gòu)建、重要性狀QTL精細(xì)定位、關(guān)鍵基因的圖位克隆以及與之緊密連鎖的分子標(biāo)記開發(fā)等都存在困難的原因,因此,很難真正達(dá)到甘蔗分子標(biāo)記輔助育種和分子聚合育種的目的。
目前,雖然有越來越多與甘蔗相關(guān)的轉(zhuǎn)錄組測(cè)序(RNA-Seq)報(bào)道,但甘蔗基因組的de novo測(cè)序及其組裝尚未完成,而已公布的相關(guān)甘蔗基因組在育種研究工作中的應(yīng)用有待挖掘。因此,為了加快甘蔗分子育種的進(jìn)程,針對(duì)目標(biāo)性狀開發(fā)簡(jiǎn)單、實(shí)用和高效的分子標(biāo)記十分必要。目前應(yīng)用在甘蔗種質(zhì)資源分子鑒定和評(píng)價(jià)上的分子標(biāo)記技術(shù)有RAPD[21]、ISSR[22]、AFLP[23]、SRAP[24]和 SCoT[25],雖然這些分子標(biāo)記技術(shù)在甘蔗DNA多態(tài)性檢測(cè)上發(fā)揮著重要作用,也可用于甘蔗種質(zhì)資源的遺傳多樣性分析和構(gòu)建其DNA身份證數(shù)據(jù)庫,但RAPD技術(shù)的重復(fù)性較差[26],AFLP技術(shù)的操作流程較復(fù)雜且對(duì)科研人員及實(shí)驗(yàn)儀器設(shè)備要求較高[27],ISSR[22]、SRAP[28]和 SCoT[29]雖然操作簡(jiǎn)單但多態(tài)性不夠豐富,且都是顯性分子標(biāo)記技術(shù),擴(kuò)增條帶數(shù)較多,PCR擴(kuò)增結(jié)果易受環(huán)境影響,其重復(fù)性和穩(wěn)定性不夠好。許多研究表明,SSR標(biāo)記在甘蔗上有豐富的多態(tài)性,已被廣泛應(yīng)用于甘蔗遺傳多樣性分析[30]、分子遺傳連鎖圖譜構(gòu)建[31-32]和QTL定位[33],雖然國內(nèi)外已開發(fā)出了數(shù)量較多的甘蔗SSR標(biāo)記引物對(duì),但開發(fā)效率相對(duì)較低。現(xiàn)今,隨著高通量測(cè)序技術(shù)的快速發(fā)展和測(cè)序成本的大幅下降,轉(zhuǎn)錄組測(cè)序或者簡(jiǎn)化基因組測(cè)序在規(guī)?;_發(fā)甘蔗SSR標(biāo)記上有巨大潛力,但甘蔗基因組龐大且復(fù)雜(約10Gb),目前開發(fā)出來的SSR標(biāo)記引物對(duì)數(shù)量還遠(yuǎn)遠(yuǎn)不夠,且在任意2份甘蔗材料之間具有多態(tài)性的SSR標(biāo)記引物數(shù)量更是有限。此外,擴(kuò)增出來的片段大小差異小,需要通過較為復(fù)雜的后期技術(shù)和手段(如聚丙烯酰胺凝膠電泳或毛細(xì)管電泳等)分離。這些缺點(diǎn)嚴(yán)重制約了分子標(biāo)記在甘蔗種質(zhì)資源的精準(zhǔn)鑒定及評(píng)價(jià)、高密度遺傳連鎖圖譜的構(gòu)建、重要性狀的 QTL定位、基因的圖位克隆以及分子標(biāo)記輔助育種中的應(yīng)用。
高密度和高分辨率的遺傳連鎖圖譜是進(jìn)行數(shù)量性狀基因精細(xì)定位(quantitative trait loci,QTL)、分子標(biāo)記輔助選擇育種、重要基因克隆及比較基因組研究的基礎(chǔ)[34]。雖然分子標(biāo)記技術(shù)的開發(fā)與應(yīng)用促進(jìn)了甘蔗屬作物遺傳連鎖圖譜的構(gòu)建,但由于甘蔗屬及其近緣屬一般為復(fù)雜的多倍體或高度雜合的非整倍性多倍體作物,染色體數(shù)多達(dá)100~150條,基因組龐大且高度雜合,因此,其遺傳連鎖圖譜的構(gòu)建研究滯后于其他作物[31,35-37]。據(jù)保守估計(jì),由于甘蔗的基因組遺傳距離為17 000~18 000cM[37-38],理論上構(gòu)建1個(gè)平均距離為10cM的飽和遺傳連鎖圖譜,大概需要1700~1800個(gè)單雙劑量標(biāo)記。目前,甘蔗遺傳連鎖圖譜的構(gòu)建主要利用RFLP、RAPD、SSR和AFLP分子標(biāo)記技術(shù)。
割手密最早的遺傳圖譜是通過RFLP分子標(biāo)記技術(shù)構(gòu)建的[39],該圖譜包含216個(gè)單劑量標(biāo)記(single dose marker,即只在父本或母本一方存在的標(biāo)記)和44個(gè)連鎖群。利用RAPD分子標(biāo)記技術(shù)構(gòu)建的割手密遺傳連鎖圖譜包含279個(gè)單劑量標(biāo)記和42個(gè)連鎖群[40]。然而,通過整合這2種分子標(biāo)記技術(shù)構(gòu)建的割手密遺傳連鎖圖譜則包含442個(gè)單劑量標(biāo)記和64個(gè)連鎖群[41],其密度和分辨率明顯優(yōu)于單一的分子標(biāo)記技術(shù)。以此估算割手密無性系“SES208”(2n=80)的基因組長(zhǎng)度為3300cM,而通過單一RAPD分子標(biāo)記技術(shù)推斷的僅為 2550cM[40],其基因組大小顯然與甘蔗屬預(yù)計(jì)相差甚遠(yuǎn)。由此可見,利用單一的分子標(biāo)記技術(shù)構(gòu)建的甘蔗遺傳連鎖圖譜的基因組覆蓋率小,無法精細(xì)定位。
在栽培甘蔗分子遺傳連鎖圖譜方面,分子標(biāo)記SSR和AFLP整合用于構(gòu)建甘蔗雜交父母本和甘蔗栽培品種雜交后代[37,42],以及甘蔗商業(yè)品種Co419與野生種割手密Y75-1-2的雜交F1和回交BC1群體的遺傳連鎖圖譜的構(gòu)建[31],將新型分子標(biāo)記技術(shù)TRAP(target region amplified polymorphism)融入這 2種技術(shù)整合體系后,以美國路易斯安那州主栽品種LCP85-384作為遺傳材料構(gòu)建的遺傳連鎖圖譜包含1111個(gè)多態(tài)性標(biāo)記,其中有773個(gè)為單劑量標(biāo)記,分布在108個(gè)連鎖群上,總遺傳距離為12 313cM[32],這間接證實(shí)甘蔗基因組龐大的事實(shí)[6]。另外,新型分子標(biāo)記EST-SSR與AFLP聯(lián)合構(gòu)建的甘蔗栽培品種(IAC66-6×TUC71-7)后代遺傳連鎖圖譜的總遺傳距離也有4843.19cM[43]。可見,新型分子標(biāo)記技術(shù)的研發(fā)及多種分子標(biāo)記技術(shù)的聯(lián)合應(yīng)用對(duì)構(gòu)建甘蔗高密度遺傳連鎖圖譜意義重大。
綜上可知,單一分子標(biāo)記技術(shù)的應(yīng)用對(duì)甘蔗屬遺傳連鎖圖譜構(gòu)建的貢獻(xiàn)有限,而不同分子標(biāo)記技術(shù)的整合應(yīng)用效果更為明顯。此外,不同甘蔗種屬間及其雜交后代的遺傳距離差異很大,這暗示甘蔗基因組極其復(fù)雜多變,對(duì)構(gòu)建高密度和高分辨率遺傳連鎖圖譜造成極大挑戰(zhàn),重要農(nóng)藝性狀功能基因精細(xì)定位的難度較大。
產(chǎn)量和糖分相關(guān)性狀一直是甘蔗育種研究的熱點(diǎn),實(shí)現(xiàn)高產(chǎn)、高糖也是甘蔗育種和栽培技術(shù)的瓶頸[44-45]。雖然分子標(biāo)記技術(shù)的快速發(fā)展給作物遺傳連鎖圖譜的構(gòu)建提供了可靠的技術(shù)支撐,且利用分子標(biāo)記開展性狀相關(guān)QTL定位的報(bào)道并不鮮見,也在甘蔗屬作物上得到了應(yīng)用[46],但目前國內(nèi)外關(guān)于甘蔗產(chǎn)量和糖分相關(guān)性狀 QTL定位的報(bào)道相對(duì)較少。
Ming等[47]利用甘蔗栽培種與割手密雜交后代的分離群體構(gòu)建了包含735個(gè)RFLP標(biāo)記的遺傳連鎖圖譜,結(jié)合2年表型數(shù)據(jù)的統(tǒng)計(jì)分析和遺傳標(biāo)記的連鎖分析,定位到了甘蔗產(chǎn)量、糖分、莖重、有效莖數(shù)、纖維含量和灰分含量等性狀的QTL。Pinto等[48]利用優(yōu)良種質(zhì)SP80-180(父本)和SP80-4966(母本)的雜交后代群體為材料,也構(gòu)建了2年生育期的甘蔗RFLP遺傳連鎖圖譜,并定位了120個(gè)與單位面積含糖量和產(chǎn)糖量、纖維含量以及蔗莖產(chǎn)量相關(guān)的QTL,其中有26個(gè)QTL在2年中均有定位到,有32個(gè)QTL僅在宿根蔗中定位到,此外,還鑒定了50個(gè)與這4個(gè)性狀具有雙基因上位互作的標(biāo)記,進(jìn)一步分析發(fā)現(xiàn),1個(gè)與蔗糖合成相關(guān)的QTL與蔗莖產(chǎn)量呈負(fù)相關(guān),但與單位面積含糖量和產(chǎn)糖量呈正相關(guān)。由于數(shù)量性狀在甘蔗雜交后代中易受環(huán)境影響,表現(xiàn)不穩(wěn)定[12-13],故檢測(cè)中不能忽略QTL、收獲年限和種植地點(diǎn)之間交互作用的影響。針對(duì)這一問題,Pastina等[49]提出了一種聯(lián)合區(qū)間作圖法與混合模型分析法對(duì)甘蔗多重–多年收獲–多點(diǎn)試驗(yàn)數(shù)據(jù)的QTL檢測(cè)策略,通過該策略發(fā)現(xiàn)甘蔗分離群體后代在2個(gè)試驗(yàn)點(diǎn)下連續(xù)3年收獲的46個(gè)QTL,其中13個(gè)為蔗莖產(chǎn)量,14個(gè)為糖產(chǎn)量,11個(gè)為纖維分,8個(gè)為蔗糖分。另外,這些QTL受收獲互作、地理位置互作及二者均互作的影響均達(dá)顯著水平。在甘蔗的3個(gè)生育周期中,Singh等[50]對(duì)7個(gè)不同地理環(huán)境下甘蔗產(chǎn)量相關(guān)性狀開展了更加全面細(xì)致的定位,連鎖分析發(fā)現(xiàn)雜交后代分離群體中有8個(gè)群體與母本Co86011連鎖,16個(gè)群體與父本CoH70連鎖,基于SSR分子標(biāo)記構(gòu)建了總長(zhǎng)為2606.77cM的遺傳連鎖圖譜,還精細(xì)定位到了31個(gè)與父母本在遺傳影響上一致的QTL,分別是2個(gè)苗期錘度 QTL、7個(gè)田間錘度 QTL、6個(gè)蔗糖分QTL、4個(gè)有效莖數(shù)QTL、1個(gè)莖長(zhǎng)QTL、3個(gè)莖粗QTLs、6個(gè)節(jié)間數(shù)QTL和2個(gè)綠葉片數(shù)QTL,其中與糖含量性狀相關(guān) QTL連鎖的 SSR標(biāo)記在UGSM31548和 UGSM31649之間,這暗示甘蔗農(nóng)藝性狀標(biāo)記的遺傳距離比較大。
然而,Hoarau等[51]以甘蔗栽培種R570的自交系群體為標(biāo)記對(duì)象,利用1000個(gè)AFLP標(biāo)記構(gòu)建了覆蓋R570一半基因組的遺傳連鎖圖譜,并定位到了4個(gè)甘蔗重要農(nóng)藝性狀的QTL,包括株高、莖數(shù)、莖徑和錘度相關(guān),這些 QTL的個(gè)體差異解析了整個(gè)表型變異的3%~7%,且可能受40個(gè)假定的數(shù)量性狀等位基因(quantitative trait allele,QTA)調(diào)控。為了更加精準(zhǔn)地挖掘甘蔗產(chǎn)量相關(guān) QTL的連鎖基因,Balsalobre等[52]構(gòu)建了基于223個(gè)連鎖群體測(cè)序基因分型(genotyping-by-sequencing,GBS)數(shù)據(jù)的QTL遺傳連鎖圖譜,通過GBS測(cè)序分析開發(fā)了3433到15906個(gè)高質(zhì)量的標(biāo)記,利用其中的 993個(gè)單劑量標(biāo)記累積繪制的圖長(zhǎng)為3682.04cM,平均標(biāo)記密度為3.70cM,定位到了7個(gè)產(chǎn)量構(gòu)成性狀相關(guān)的QTL,并關(guān)聯(lián)到可溶性固體含量QTL和纖維含量QTL的候選基因。
總之,雜交后代分離群體密度及其個(gè)體間遺傳差異大小與遺傳連鎖圖譜的總遺傳距離和平均標(biāo)記密度密切關(guān)聯(lián),而甘蔗雜交后代分離群體個(gè)體差異大致使其分子標(biāo)記間隔距離較大,這給控制甘蔗重要性狀 QTL的主效基因定位和挖掘帶來了許多困難。
目前,隨著氣候的變化,全球蔗區(qū)甘蔗病害嚴(yán)重頻發(fā),對(duì)產(chǎn)量和蔗糖分造成了不可逆轉(zhuǎn)的損失[53-56]。因此,甘蔗抗病育種迫在眉睫,然而抗病品種的選育進(jìn)展緩慢。褐銹病是甘蔗最嚴(yán)重的葉部病害之一,自Daugrois等[57]報(bào)道,Bru1為甘蔗抗褐銹病的主效基因后,Asnaghi等[58]采用AFLP分子標(biāo)記/BSA測(cè)序的聯(lián)合方法獲得了Bru1基因目標(biāo)區(qū)域的分子標(biāo)記,在該基因兩側(cè)共獲得8個(gè)AFLP遺傳標(biāo)記,而其中與Bru1基因最近的2個(gè)遺傳標(biāo)記的遺傳距離分別為1.9和2.2cM。McIntyre等[59]利用甘蔗抗性基因類似物的序列對(duì)遺傳圖譜進(jìn)行標(biāo)記驗(yàn)證,共檢測(cè)到31個(gè)標(biāo)記,其中3個(gè)標(biāo)記與甘蔗抗褐銹病顯著相關(guān),還定位到解釋甘蔗抗褐銹病 7%~18%表型變異的 QTL[60]。Raboin等[61]利用抗病品種 MQ76-53和感病品種 R570雜交后代的分離群體作為材料,綜合運(yùn)用AFLP、SSR和RFLP技術(shù)構(gòu)建了由 424個(gè)單劑量標(biāo)記組成的 MQ76-53遺傳連鎖圖譜,定位到了1個(gè)新的抗褐銹病的主效QTL和1個(gè)微效QTL,但與主效QTL最近的AFLP遺傳標(biāo)記(acgcta16)的距離有23cM??梢?,這些與Bru1基因相關(guān)的遺傳標(biāo)記的分辨率不高,相關(guān)的QTL所解析的表型變異也大,在抗銹病育種材料篩選的難度較大。隨著生物技術(shù)的發(fā)展,Asnaghi等[62]和Le Cunff等[63]均運(yùn)用比較基因組學(xué)策略來加密甘蔗目的基因的遺傳圖譜,最終獲得Bru1基因區(qū)域內(nèi)高分辨率遺傳圖譜,并將Bru1基因定位于甘蔗第7條染色體0.42cM區(qū)域內(nèi),發(fā)現(xiàn)該區(qū)域與高粱第4號(hào)染色體上的約225kb區(qū)域和水稻第2號(hào)染色體短臂上的600kb區(qū)域具有高度同線性,這是目前與Bru1基因共分離最近的遺傳標(biāo)記距離,分別達(dá)到0.28和0.14cM的高分辨率。說明基于同源功能基因序列靶向開發(fā)目標(biāo)標(biāo)記是可行的,這對(duì)于缺乏參考基因組的作物具有借鑒意義。
迄今,隨著甘蔗抗褐銹病Bru1基因被廣泛地深入研究,這一抗性標(biāo)記的開發(fā)也逐漸被成功應(yīng)用于甘蔗分子標(biāo)記輔助育種中,并陸續(xù)被法國[64]、美國[65-66]、阿根廷[67]、中國[68-72]、巴西[73]等國家的科研工作者應(yīng)用于分子育種研究,這意味著在甘蔗抗銹病育種中邁出了堅(jiān)實(shí)的一步,并給其他農(nóng)藝性狀的分子標(biāo)記輔助育種提供了參考。
黃點(diǎn)病是僅次于褐銹病的葉部嚴(yán)重病害,Aljanabi等[33]利用抗病品種“M134/75”和感病品種“R570”雜交的227個(gè)后代個(gè)體作為作圖群體,利用AFLP和SSR標(biāo)記構(gòu)建了包含557個(gè)單劑量標(biāo)記的甘蔗栽培種M134/75的遺傳連鎖圖譜,并在連鎖群LG87上定位到了一個(gè)抗甘蔗黃點(diǎn)病主效基因CIR12284,該基因位于標(biāo)記aagctt3和actctc10之間,而與距離最近的actctc10標(biāo)記的遺傳距離也有14cM。而Parmessur等[74]通過融入EST-SSR分子標(biāo)記對(duì) 227個(gè)作圖群體進(jìn)行了基因分型,再經(jīng)過RAD-seq測(cè)序分析得到含528個(gè)單劑量標(biāo)記和2777個(gè)RAD-seq標(biāo)記的甘蔗M134/75的遺傳連鎖圖譜,經(jīng)Software Joinmap 4.1分析后產(chǎn)生總長(zhǎng)8277cM(2046標(biāo)記)由286個(gè)連鎖群組成的圖譜,隨后,基于EST-SSR分子標(biāo)記在M134/75的LG28上鑒定到1個(gè)抗黃點(diǎn)病的主效QTL,其最近的遺傳標(biāo)記距離為5cM,分辨率提高超過2.5倍,且這個(gè)QTL解析了30%的表型變異??梢?,采用不同的標(biāo)記技術(shù),靶向基因遺傳標(biāo)記距離的差距較大,這可能與物種染色體的倍性及復(fù)雜度有關(guān)。
據(jù)不完全統(tǒng)計(jì)[75],黑穗病是我國甘蔗生產(chǎn)上最主要的病害,發(fā)生嚴(yán)重年份造成甘蔗產(chǎn)量損失達(dá)20%~50%,蔗糖分降低 0.3%~0.5%(絕對(duì)值),宿根蔗受害尤為嚴(yán)重??购谒氩「收嵝缕贩N的選育是減輕黑穗病對(duì)甘蔗產(chǎn)業(yè)危害的根本途徑,但由于甘蔗遺傳背景復(fù)雜,迄今為止,關(guān)于甘蔗抗黑穗病基因的定位、克隆及其分子標(biāo)記輔助育種的研究進(jìn)展十分緩慢,相關(guān)的研究報(bào)道甚少[76]。許莉萍等[77]結(jié)合RAPD技術(shù)和BSA法,獲得了1個(gè)與甘蔗抗黑穗病生理小種2基因連鎖的分子標(biāo)記,并將其轉(zhuǎn)化為SCAR標(biāo)記。高軼靜等[78]則通過SSR技術(shù)與BSA法的整合,獲得了1個(gè)與甘蔗抗黑穗病基因連鎖的SSR標(biāo)記。
根據(jù)孟德爾和摩爾根提出的遺傳定律,調(diào)控甘蔗重要性狀的遺傳基因既存在分離與自由組合,也會(huì)發(fā)生連鎖與互換,而甘蔗基因組龐大且高度雜合,染色體存在非整倍性現(xiàn)象,控制重要性狀的基因發(fā)生連鎖遺傳的概率較高。雖然已有不少研究者針對(duì)甘蔗屬重要性狀進(jìn)行了遺傳連鎖圖譜構(gòu)建和QTL定位研究,但農(nóng)藝性狀一般受多個(gè)數(shù)量性狀位點(diǎn)或基因共同調(diào)控[79],理論上發(fā)生連鎖基因的不平衡遺傳在甘蔗上的體現(xiàn)更為突出[80-81]。然而,基于連鎖不平衡(linkage disequilibrium,LD)的性狀關(guān)聯(lián)分析在甘蔗上的研究報(bào)道較少。
起初,Jannoo等[82]對(duì)59份甘蔗商業(yè)品種材料進(jìn)行LD分析,通過38個(gè)RFLP探針揭示出這些材料間DNA的多態(tài)性,發(fā)現(xiàn)33個(gè)基因座與42例雙位點(diǎn)事件有關(guān)聯(lián),且它們間的遺傳距離大多不超過10cM,相對(duì)應(yīng)的等位基因在起源品種中至少有1個(gè)被發(fā)現(xiàn),這暗示它們存在血緣關(guān)系,即當(dāng)基因座緊密相連時(shí),由此產(chǎn)生的優(yōu)異等位基因組合在隨后的雜交中得以維持,也證實(shí)了基于LD在分子標(biāo)記與甘蔗農(nóng)藝性狀之間進(jìn)行關(guān)聯(lián)分析的可行性。隨后,Raboin等[83]對(duì)基于LD的關(guān)聯(lián)分析在繪制甘蔗基因組圖譜上的價(jià)值進(jìn)行了評(píng)估,以品種“R570”為對(duì)照,使用42對(duì)AFLP標(biāo)記引物對(duì)72個(gè)甘蔗現(xiàn)代栽培種進(jìn)行了親緣關(guān)系分析,基于1537個(gè)多態(tài)性標(biāo)記的關(guān)聯(lián)分析結(jié)果顯示,許多連鎖標(biāo)記因遺傳多倍性而無法被識(shí)別。然而,就共分離群體而言,同一個(gè)被分配的標(biāo)記,這些甘蔗現(xiàn)代栽培種樣本的LD關(guān)聯(lián)分析結(jié)果和對(duì)照種后代的遺傳連鎖分析表現(xiàn)出一樣的效果,說明甘蔗現(xiàn)代栽培種性狀的LD關(guān)聯(lián)分析不受遺傳多倍性的影響。另外,Wei等[84]運(yùn)用1068個(gè)AFLP標(biāo)記和141個(gè)SSR標(biāo)記對(duì)154份甘蔗品系進(jìn)行關(guān)聯(lián)分析,通過回歸分析獲得了與澳大利亞4種最重要甘蔗病害關(guān)聯(lián)的分子標(biāo)記,其中,4個(gè)標(biāo)記解釋了甘蔗白葉病和根腐病32%的表型變異,5個(gè)標(biāo)記解釋了甘蔗斐濟(jì)病26.2%的表型變異,11個(gè)標(biāo)記解釋了甘蔗抗黑穗病 58.6%的表型變異(其中4個(gè)效應(yīng)較大的標(biāo)記解釋了53.7%的表型變異),同時(shí)還提出種群結(jié)構(gòu)在標(biāo)記–性狀關(guān)聯(lián)分析中應(yīng)該被考慮。
近年來,Banerjee等[85]利用基因組的123條ESTSSR引物對(duì)印度亞熱帶蔗區(qū)的102個(gè)甘蔗品種進(jìn)行群體結(jié)構(gòu)、親緣關(guān)系和標(biāo)記–性狀 LD關(guān)聯(lián)分析等研究,發(fā)掘了989個(gè)SSR標(biāo)記位點(diǎn)。隨后,基于混合線性模型分析,分別鑒定了4個(gè)和7個(gè)與莖徑、株高及有效莖數(shù)顯著相關(guān)的標(biāo)記,另外,有 15個(gè)標(biāo)記連續(xù)3年穩(wěn)定地解釋了57%的有效莖數(shù)、34%的莖粗、27%的莖長(zhǎng)、20%的蔗糖分含量和19%的節(jié)數(shù)等甘蔗產(chǎn)量和蔗糖性狀變異,進(jìn)一步指出甘蔗家系分組的群體結(jié)構(gòu)對(duì)利用基于基因數(shù)據(jù)的關(guān)聯(lián)分析進(jìn)行品種選育至關(guān)重要,這一觀點(diǎn)與Wei等[84]一致。Singh等[86]也利用LD關(guān)聯(lián)作圖法獲得4個(gè)可解釋甘蔗抗赤腐病10%~16%表型變異的SSR標(biāo)記,并通過EST測(cè)序與高粱基因組進(jìn)行共線性比對(duì)以鑒定其候選基因,發(fā)現(xiàn)標(biāo)記位點(diǎn)對(duì)應(yīng)的基因編碼重要的植物防御相關(guān)蛋白,認(rèn)為它們可能是潛在的抗性候選基因。
Fickett等[87]利用基于全基因組關(guān)聯(lián)分析(genome wide association study,GWAS)開發(fā)的SNP和InDel標(biāo)記對(duì)甘蔗的11個(gè)產(chǎn)量性狀和蔗糖分性狀進(jìn)行研究,發(fā)現(xiàn)56個(gè)標(biāo)記與蔗糖分性狀顯著相關(guān),且在多個(gè)性狀上也表現(xiàn)出一致的顯著性,隨后,這些標(biāo)記在更加多樣化的群體中得到了驗(yàn)證,可用于甘蔗品系的分子標(biāo)記輔助選育,Racedo等[80]和Yang等[81]的研究結(jié)果可作為最新的佐證。You等[88]也基于 SNP標(biāo)記技術(shù)開發(fā)出了甘蔗高通量100K SNP矩陣試劑盒,用于構(gòu)建3個(gè)甘蔗親本的遺傳連鎖圖譜,并對(duì)來自這3個(gè)親本雜交及自交的469份后代材料進(jìn)行關(guān)聯(lián)分析,鑒定出了27個(gè)抗病基因,其中18個(gè)與SCYLV(Sugarcane yellow leaf virus)抗性相關(guān)的QTL關(guān)聯(lián),此外,這469份材料基因分型的結(jié)果顯示,樣本 SNP多態(tài)性的比例高達(dá)77.04%。可見,SNP陣列可作為高度多倍體甘蔗高通量基因分型的有效遺傳標(biāo)記工具,將在重要性狀的關(guān)聯(lián)分析及其調(diào)控基因挖掘上發(fā)揮巨大作用[89]。
基因組是作物分子育種研究的關(guān)鍵,也是突破傳統(tǒng)育種的重要基礎(chǔ)。甘蔗分子標(biāo)記輔助育種進(jìn)展十分緩慢,其真正原因在于甘蔗遺傳背景復(fù)雜且基因組龐大與高度雜合,甘蔗高貴化代表性品種全基因組尚未測(cè)序并組裝完畢,缺乏高質(zhì)量甘蔗參考基因組序列,進(jìn)而導(dǎo)致本身或借鑒其他作物基于基因組的許多分子標(biāo)記的開發(fā)和應(yīng)用難度大,標(biāo)記的分辨率和精確性普遍較低。當(dāng)前在甘蔗遺傳研究上應(yīng)用最多的是SSR分子標(biāo)記,但多數(shù)集中在遺傳多樣性分析[90]和真假雜種鑒定上[91],關(guān)于其他傳統(tǒng)分子標(biāo)記技術(shù)的應(yīng)用研究也有不少報(bào)道,然而,這些分子標(biāo)記技術(shù)普遍存在通量低、分辨率和多態(tài)性不高等問題,嚴(yán)重制約其應(yīng)用于甘蔗分子育種,尤其是性狀關(guān)聯(lián)優(yōu)異基因的精細(xì)定位。最近,Yang等[92]開始嘗試?yán)?GBS測(cè)序技術(shù)篩選出甘蔗抗性相關(guān)基因并進(jìn)行了SNP標(biāo)記開發(fā),將這些標(biāo)記在F1群體中進(jìn)行驗(yàn)證,關(guān)聯(lián)得到2個(gè)與抗橙銹病QTL顯著相關(guān)的SNP標(biāo)記。
隨著甘蔗屬相關(guān)全基因組序列圖譜的陸續(xù)公布,如甘蔗栽培種 R570的單倍體基因組序列[6]和甘蔗細(xì)莖野生種單倍體割手密AP85-441的全基因組序列[14],使得高通量開發(fā)SSR和SNP標(biāo)記成為可能。但我們初步研究發(fā)現(xiàn),當(dāng)將這2個(gè)基因組序列作為甘蔗參考基因組時(shí),基于樣本與參考基因組的比對(duì)結(jié)果開發(fā)的 SNP標(biāo)記質(zhì)量并不高,應(yīng)用效果也不好。只有在獲得了高質(zhì)量甘蔗參考基因組序列的前提下,通過重測(cè)序和簡(jiǎn)化基因組測(cè)序(如SLAF、RAD和GBS)等高通量基因分型手段和生物信息學(xué)對(duì)甘蔗遺傳群體及其自然群體的重要性狀進(jìn)行基因定位和關(guān)聯(lián)作圖,才能準(zhǔn)確并高通量地挖掘出其中的變異組成,進(jìn)而高效地開發(fā)相應(yīng)的遺傳標(biāo)記(如SNP、InDel、SV、PAV和CNV),再結(jié)合群體結(jié)構(gòu)聚類分析和表型組學(xué)分析的精準(zhǔn)鑒定,采用連鎖分析或者關(guān)聯(lián)分析篩選出與甘蔗重要農(nóng)藝性狀緊密連鎖的分子標(biāo)記。
高密度的遺傳連鎖圖譜和高分辨率的遺傳標(biāo)記是甘蔗分子標(biāo)記輔助育種研究取得突破的關(guān)鍵。關(guān)聯(lián)分析則是重要性狀相關(guān)標(biāo)記精準(zhǔn)鑒定的重要手段,然而,重要性狀的基因解析需要高質(zhì)量且精細(xì)的全基因組序列圖譜,即精準(zhǔn)挖掘與性狀關(guān)聯(lián)標(biāo)記的候選基因是甘蔗分子設(shè)計(jì)育種或者分子標(biāo)記輔助育種策略的突破。目前,在甘蔗上,只能通過BSA法、蛋白質(zhì)組、RNA-seq和代謝組測(cè)序等多種組學(xué)方法,鑒定出可能的候選基因,然后對(duì)其進(jìn)行多重qRT-PCR表達(dá)驗(yàn)證來篩選關(guān)鍵基因,并對(duì)關(guān)鍵基因進(jìn)行轉(zhuǎn)基因功能驗(yàn)證或基因編輯研究。利用高通量測(cè)序技術(shù)對(duì)甘蔗重要性狀進(jìn)行連鎖和關(guān)聯(lián)分析,就目前擁有的高質(zhì)量甘蔗參考基因組而言[6,14],仍存在測(cè)序成本偏高的問題,由于甘蔗基因組龐大(約10Gb),約為水稻(400Mb)的25倍,目前水稻完全可以通過高通量測(cè)序技術(shù)完成各種性狀的基因定位研究,但甘蔗的定位難度很大?,F(xiàn)今,高通量測(cè)序技術(shù)的迅速發(fā)展和成本不斷降低以及表型組學(xué)的興起,使得甘蔗重要性狀基因的挖掘及其分子標(biāo)記開發(fā)成為可能。這些技術(shù)將促進(jìn)與甘蔗重要性狀緊密連鎖的分子標(biāo)記和關(guān)鍵基因的編輯研究應(yīng)用于甘蔗分子標(biāo)記輔助育種和遺傳改良中,從而提高甘蔗育種效率和準(zhǔn)確性。