伍葉娜,潘根,姜慧,常麗,黃思齊,唐慧娟,欒明寶,陳安國
(中國農(nóng)業(yè)科學(xué)院麻類研究所,湖南 長沙 410205)
亞麻(Linum usitatissimum L.)是亞麻科(Linaceae)亞麻屬(Linum)一年生草本植物,自花授粉,喜涼爽濕潤氣候,起源于中亞和地中海地區(qū),是我國重要的經(jīng)濟作物之一,按照用途分為纖用亞麻、油用亞麻及油纖兼用亞麻。纖用亞麻主要種植于黑龍江、吉林、新疆、內(nèi)蒙古等地。亞麻纖維因具有強韌、吸濕、透氣、耐磨等優(yōu)良性狀而被譽為“纖維皇后”[1]。油用亞麻又稱為胡麻,多分布于新疆、甘肅、河北、內(nèi)蒙古等地。亞麻籽中富含α-亞麻酸、木酚素、優(yōu)質(zhì)植物蛋白質(zhì)等多種對人體有利的營養(yǎng)成分[2-3],亞麻籽品質(zhì)特性的重要指標(biāo)是含油量,其油脂含量為35%~45%[4]。α-亞麻酸是通過外源補充的一種人體必需不飽和脂肪酸營養(yǎng)物質(zhì),為二十碳五烯酸(EPA,eicosapentaeno-ic acid)、二十二碳五烯酸(DPA,docosapentaenoic acid)和二十二碳六烯酸(DHA,docosahexaenoic acid)的合成前體物質(zhì),在降血脂血壓、預(yù)防糖病、防治癌癥以及延緩血管衰老等方面發(fā)揮著重要的作用[2]。此外,亞麻木酚素(SDG,secoisolariciresinol diglucoside)在預(yù)防和治療乳腺癌[5]以及骨質(zhì)疏松癥[6]等方面發(fā)揮著重要的作用,亞麻籽蛋白中的半胱氨酸和蛋氨酸含量能夠提高人體抗氧化能力,有效預(yù)防結(jié)腸癌發(fā)生[7]??傮w來說,亞麻是一種綜合利用價值極高的作物,在紡織、食品、工業(yè)、醫(yī)藥保健等方面發(fā)揮著重要的作用。
隨著分子生物學(xué)的發(fā)展,利用分子標(biāo)記進(jìn)行亞麻分子育種的研究越來越多,常用的分子標(biāo)記有擴增片段長度多態(tài)性(AFLP,amplified fragment length polymorphism)、隨機擴增多態(tài)性 DNA(RAPD,random amplified polymorphic)、簡單序列重復(fù)(SSR,simple sequence repeats)以及單核苷酸多態(tài)性(SNP,single nucleotide polymorphism),主要應(yīng)用于亞麻種質(zhì)資源鑒定、遺傳連鎖圖譜構(gòu)建、數(shù)量性狀座位(QTL,quantitative trait locus)定位和全基因組關(guān)聯(lián)分析(GWAS,genome-wide association studies)等。亞麻農(nóng)藝及品質(zhì)性狀多數(shù)為多基因控制的數(shù)量性狀,其遺傳表現(xiàn)復(fù)雜,一般的QTL位點具有較低的遺傳率。另外,我國亞麻存在纖維產(chǎn)需缺口大、亞麻品質(zhì)差、抗逆性較差等問題,因此揭示亞麻產(chǎn)量、品質(zhì)以及抗逆等相關(guān)性狀的遺傳基礎(chǔ)并培育優(yōu)良亞麻品種是目前的研究目標(biāo)。為培育出高產(chǎn)、優(yōu)質(zhì)、抗逆的新品種,需要進(jìn)行產(chǎn)量、品質(zhì)和抗性性狀等基因的發(fā)掘和利用[8-9]。GWAS是解析表型遺傳機制及挖掘QTL的重要手段,具有定位精確度高、檢測范圍廣、構(gòu)建群體所需時間短等優(yōu)點,已應(yīng)用于水稻[10]、玉米[11]以及大豆[12]等作物的分子育種研究。GWAS在亞麻多種性狀研究以及育種研究中得到了一定的應(yīng)用,為闡明亞麻復(fù)雜性狀的遺傳結(jié)構(gòu)提供了理論基礎(chǔ),對亞麻品種改良具有指導(dǎo)性意義。本文簡要介紹了GWAS基本原理及方法,總結(jié)了其在亞麻遺傳育種中的研究進(jìn)展,以及存在的問題和解決途徑,進(jìn)一步為亞麻分子標(biāo)記輔助育種研究提供依據(jù)和參考。
關(guān)聯(lián)分析是以連鎖不平衡(LD,linkage disequilibrium)為基礎(chǔ),鑒定某一群體內(nèi)目標(biāo)性狀與遺傳標(biāo)記或候選基因關(guān)系的分析方法[13],與傳統(tǒng)作圖相比,具有不需要構(gòu)建作圖群體、可同時考察多個性狀進(jìn)行關(guān)聯(lián)分析、基因定位精確度高等特點[14]。關(guān)聯(lián)分析可分為全基因組掃描和基于候選基因的關(guān)聯(lián)分析兩種策略[15]。GWAS理論基礎(chǔ)是連鎖不平衡,通過全基因組內(nèi)的SNP變異與復(fù)雜性狀進(jìn)行關(guān)聯(lián)分析,發(fā)掘影響目標(biāo)性狀的候選基因[16],從分子水平揭示作物表型多樣性的遺傳基礎(chǔ)。近年來隨著簡化基因組測序(SLAF-seq)技術(shù)的不斷發(fā)展,測序成本的下降,基于全基因組檢測SNP變異位點進(jìn)行GWAS的研究不斷增加。1996年,Risch等[17]首次提出了全基因組關(guān)聯(lián)分析的概念。目前已在水稻[10]、玉米[11]、大豆[12]等作物中有了深入研究,為其他作物品種遺傳改良和培育提供了理論依據(jù)。
1.2.1 群體結(jié)構(gòu)對GWAS的影響
群體結(jié)構(gòu)會導(dǎo)致GWAS結(jié)果出現(xiàn)假陽性,故進(jìn)行試驗前應(yīng)選取具有代表性、數(shù)量較多的種質(zhì)資源作為研究群體,通過增大群體容量和評估種群結(jié)構(gòu)來盡可能減少假陽性,進(jìn)而降低群體結(jié)構(gòu)對試驗的干擾。一般線性模型(GLM,general linearmodel)和混合線性模型(MLM,mixed linearmodel)是全基因組關(guān)聯(lián)分析常用的兩種模型[18],其中MLM模型在GWAS分析過程中能夠有效控制群體結(jié)構(gòu)的影響,提高分析效率和結(jié)果的準(zhǔn)確性[19]。此外,可通過SNP標(biāo)記的檢測,主成分分析(PCA,principal component analysis)獲得的P值、親緣關(guān)系K值以及群體結(jié)構(gòu)Q值等對群體結(jié)構(gòu)進(jìn)行進(jìn)一步的校正與分析[20]。
1.2.2 連鎖不平衡對GWAS的影響
連鎖不平衡是指群體內(nèi)不同位點上等位基因間的非隨機關(guān)聯(lián),是GWAS的理論基礎(chǔ),一般情況下LD衰減距離越小,關(guān)聯(lián)分析時需要的SNP標(biāo)記越多,越容易找到與目標(biāo)性狀緊密連鎖的分子標(biāo)記,提高關(guān)聯(lián)分析的精確性[21]。在構(gòu)建關(guān)聯(lián)群體時,為了減少連鎖不平衡性,獲得更多的表型和遺傳變異,應(yīng)選擇地理差異較大的品種作為關(guān)聯(lián)分析材料[22]。除此之外,GWAS研究還需要對表型性狀進(jìn)行準(zhǔn)確鑒定,如實施合理的田間試驗、考慮環(huán)境與基因型的互作效應(yīng)等[23]。
1.3.1 種質(zhì)材料選擇
豐富的種質(zhì)資源是GWAS研究的基礎(chǔ),因而需要選取足夠多的樣本量[24],但群體來源越多會導(dǎo)致假陽性的概率增加,需利用家系群體進(jìn)行初步定位,再用自然群體高精度定位[25],兩種方法結(jié)合分析可減少群體之間假陽性的概率,提高關(guān)聯(lián)分析的分辨率。
1.3.2 表型考察
GWAS需要對基因型數(shù)據(jù)和表型數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,因而需要對目的性狀進(jìn)行準(zhǔn)確測定和評估。然而,表型性狀具有可塑性,不僅受基因型的控制,還受周圍環(huán)境的影響,因而會影響GWAS分析結(jié)果[26]。因此,在試驗前期應(yīng)制定科學(xué)的試驗計劃[27],合理選擇隨機區(qū)組試驗等田間試驗設(shè)計,從時間、空間上增加表型的重復(fù)性[24],在多年和多環(huán)境中進(jìn)行目標(biāo)性狀的表型鑒定,降低環(huán)境影響以及減少表型測定誤差。
1.3.3 基因型鑒定
隨著高通量測序技術(shù)的發(fā)展和測序成本的降低,使用SLAF-seq、基因芯片技術(shù)、全基因組重測序等方法獲得群體SNP信息,可提升關(guān)聯(lián)分析遺傳定位的精度,廣泛應(yīng)用于GWAS研究。
1.3.4 群體結(jié)構(gòu)和親緣關(guān)系分析
在關(guān)聯(lián)分析過程中,自花授粉作物的群體結(jié)構(gòu)會導(dǎo)致某些等位基因頻率在不同亞群之間存在顯著差異,從而導(dǎo)致出現(xiàn)假陽性結(jié)果[28]。亞麻屬于自花授粉作物,在對亞麻進(jìn)行群體結(jié)構(gòu)分析時,可以在進(jìn)行表型與基因型關(guān)聯(lián)分析之前通過構(gòu)建群體系統(tǒng)進(jìn)化樹、PCA、Structure分析等對樣本間的群體結(jié)構(gòu)和親緣關(guān)系進(jìn)行分析[29],從而避免定位時出現(xiàn)的假陽性問題。
1.3.5 關(guān)聯(lián)作圖及候選基因發(fā)掘
PLINK[30]和TASSEL[31]等分析軟件用于全基因組關(guān)聯(lián)分析,其中TASSEL軟件既可以對各種模型進(jìn)行相關(guān)分析,又可以估計LD值和作圖,估計種群結(jié)構(gòu)和作圖基于遺傳距離的樹形圖[32]。亞麻作為自花授粉作物,通過GWAS定位性狀相關(guān)基因難以達(dá)到單基因水平,必須綜合基因芯片、RNA測序、實時熒光定量PCR(qRT-PCR,real-time reverse transcription-PCR)等技術(shù)來確定與目標(biāo)性狀相關(guān)聯(lián)的候選基因。
隨著高通量測序技術(shù)的進(jìn)步,GWAS在亞麻農(nóng)藝(表1)、品質(zhì)(表2)以及抗逆(表3)等相關(guān)性狀的育種研究中取得了一些進(jìn)展,為亞麻品種改良和分子育種奠定了重要的理論基礎(chǔ)。
表1 全基因組關(guān)聯(lián)分析在亞麻農(nóng)藝性狀中的相關(guān)進(jìn)展Table 1 Progress of GWAS in agronomic traits of flax
續(xù)表1
續(xù)表1
表2 全基因組關(guān)聯(lián)分析在亞麻品質(zhì)性狀中的相關(guān)進(jìn)展Table 2 Progress of GWAS in quality traits of flax
續(xù)表2
千粒重、分枝數(shù)、開花日數(shù)、分枝習(xí)性是亞麻種子產(chǎn)量的主要決定因素,出麻率、株高、干莖制成率是亞麻纖維產(chǎn)量的主要決定因素[33]。GWAS能夠?qū)喡榉种?shù)、株高以及生育期等性狀進(jìn)行QTL定位和候選基因預(yù)測,進(jìn)一步為亞麻分子標(biāo)記輔助育種提供理論基礎(chǔ)。為了鑒定亞麻農(nóng)藝相關(guān)性狀遺傳改良的標(biāo)記和候選基因,Xie等[34]利用SLAF-seq技術(shù)對生長在3種不同環(huán)境下的224份亞麻核心種質(zhì)進(jìn)行GWAS分析,得到42個與株高、工藝長度、分枝數(shù)、單株果數(shù)、千粒重等5個農(nóng)藝性狀相關(guān)的SNP位點,并利用GLM和MLM模型在10 kb范圍內(nèi)篩選出15個候選基因,確定與株高相關(guān)的候選基因是UGT和PL,與分枝數(shù)相關(guān)的候選基因為GRAS和XTH,與單株果數(shù)相關(guān)的候選基因是Contig1437和LU0019C12,與千粒重相關(guān)的候選基因是PHO1。在此基礎(chǔ)上,Xie等[35]又利用GLM模型對13個農(nóng)藝性狀進(jìn)行分析,檢測出與亞麻纖維相關(guān)性狀相關(guān)聯(lián)的幾個位點,預(yù)測了亞麻出麻率的候選基因Lus10016354和株高候選基因Lus10016125,為進(jìn)一步研究亞麻纖維相關(guān)性狀的分子機制提供了幫助。鄧欣[33]利用SSR標(biāo)記對182份亞麻核心種質(zhì)產(chǎn)量進(jìn)行關(guān)聯(lián)分析,確定與株高相關(guān)聯(lián)的位點是M187,與工藝長度相關(guān)聯(lián)的位點是M169-1,與單株蒴果數(shù)相關(guān)聯(lián)的位點是M80,M169-2、M192與分枝數(shù)相關(guān)聯(lián),M146、M185與開花期相關(guān)聯(lián),M155-1、M187與全生長日數(shù)相關(guān)聯(lián)。伊六喜[36]基于相關(guān)序列擴增多態(tài)性(SRAP,sequence-related amplified polymorphism)通過全基因組重測序?qū)?69份胡麻進(jìn)行GWAS分析,獲得了與產(chǎn)量相關(guān)性狀顯著關(guān)聯(lián)的21個SNP位點和57個候選基因,其中與株高相關(guān)的SNP位點有5個,獲得14個候選基因;分枝數(shù)相關(guān)SNP位點有2個,獲得5個候選基因;千粒重相關(guān)SNP位點3個,獲得5個候選基因;千株粒重相關(guān)SNP位點2個,獲得1個候選基因;果粒數(shù)相關(guān)SNP位點2個,獲得8個候選基因;株果數(shù)相關(guān)SNP位點1個,獲得7個候選基因;工藝長度相關(guān)SNP位點4個,獲得15個候選基因。Pydiura等[37]基于亞麻基因組信息,通過GWAS分析鑒定出與亞麻纖維發(fā)育相關(guān)的候選基因32個,其中編碼纖維素合成酶(CesA)和纖維素合成酶類蛋白(Csl)的候選基因各有16個。Chandrawati等[38]選取168份亞麻材料,通過50個SSR標(biāo)記對其進(jìn)行分析,在GLM和MLM模型的關(guān)聯(lián)分析過程中均檢測出Lu__3043是與開花天數(shù)50%相關(guān)的SSR標(biāo)記。GWAS挖掘到的亞麻株高、千粒重等性狀相關(guān)的基因,為亞麻新品種的分子選育提供理論依據(jù),前人研究所鑒定的SNP位點和相應(yīng)的候選基因可作為改良亞麻重要農(nóng)藝性狀的生物學(xué)基礎(chǔ)。
表3 全基因組關(guān)聯(lián)分析在亞麻抗逆性狀中的相關(guān)進(jìn)展Table 3 Progress of GWAS in stress resistance of flax
亞麻品質(zhì)性狀有含油率、碘值、油酸、亞油酸、亞麻酸、棕櫚酸、粗脂肪等,被廣泛應(yīng)用于食品、醫(yī)療保健等領(lǐng)域,研究亞麻品質(zhì)相關(guān)性狀遺傳機理有助于提高亞麻品質(zhì),進(jìn)一步為亞麻優(yōu)質(zhì)育種提供理論依據(jù)。Soto-Cerda等[39]利用460個微衛(wèi)星標(biāo)記對390份亞麻種質(zhì)材料的含油率、硬脂酸、亞油酸、亞麻酸和碘值等品質(zhì)性狀進(jìn)行關(guān)聯(lián)作圖,鑒定了9個候選QTL。You等[40]通過GWAS對3個不同雙親亞麻作圖群體的260個品系進(jìn)行分析,共鑒定出17 288個SNP,解釋的成熟期、碘值、棕櫚酸、硬脂酸、亞油酸和亞麻酸含量的表型變異高于80%,檢測到23個基因組區(qū)域與33個QTL相關(guān),解釋了含油量、碘值、棕櫚酸、亞油酸和亞麻酸的表型變異為48%~73%。張喻[41]對來自43個國家的200份亞麻進(jìn)行GWAS分析,挖掘了8個與油酸代謝相關(guān)的候選基因,2個與亞油酸代謝相關(guān)的候選基因。伊六喜[36]通過全基因組重測序?qū)?69份胡麻進(jìn)行GWAS分析,獲得了與品質(zhì)相關(guān)性狀顯著關(guān)聯(lián)的19個SNP位點和43個候選基因,其中與油酸、亞油酸、亞麻酸、棕櫚酸、硬脂酸以及粗脂肪相關(guān)的SNP位點分別是3個、1個、8個、2個、3個、2個,獲得的候選基因分別是5個、6個、17個、5個、7個、3個。Xie等[42]通過GWAS對3種不同環(huán)境下的224個亞麻群體進(jìn)行分析,檢測到16個與種子脂肪酸含量顯著相關(guān)的SNP,10個候選基因,其中有6個候選基因參與脂肪酸代謝途徑。伊六喜等[43]選取220份亞麻核心種質(zhì),通過SSR標(biāo)記的關(guān)聯(lián)分析檢測亞麻木酚素含量相關(guān)位點,基于GLM模型和MLM模型均檢測到LU_203、LU_661和LU_330位點。伊六喜等[44]對4個環(huán)境下的269份亞麻種質(zhì)的木酚素含量進(jìn)行GWAS分析,得到13個SNP位點和21個候選基因。目前亞麻品質(zhì)改良育種較薄弱,GWAS分析在亞麻育種中的應(yīng)用較少,這些新發(fā)現(xiàn)的遺傳位點可以顯著改善亞麻分子育種進(jìn)程,鑒定的候選基因有助于闡明亞麻品質(zhì)相關(guān)性狀的生物合成機制。
干旱、鹽堿、礦物質(zhì)缺乏等非生物脅迫以及白粉?。?5]、炭疽?。?6]等病害引起的生物脅迫,均嚴(yán)重影響亞麻產(chǎn)量和品質(zhì),因而提供抗逆性是亞麻育種目標(biāo)之一。近年來科學(xué)家利用GWAS挖掘到部分亞麻抗逆相關(guān)位點。Dash等[47]通過GWAS揭示了在莖和根中共調(diào)控表達(dá)的26個基因與干旱脅迫反應(yīng)有關(guān),其中根應(yīng)對干旱脅迫比莖要強一些。Soto-Cerda等[48]選取390份加拿大亞麻核心種質(zhì)進(jìn)行關(guān)聯(lián)作圖,基于MLM模型確定了與6個農(nóng)藝性狀關(guān)聯(lián)的12個位點,其中位于第6連鎖群的兩個標(biāo)記位點,確定了1個抗倒伏相關(guān)的QTL位點。Sertse等[49]通過GWAS對6個性狀及其相應(yīng)的脅迫指數(shù)進(jìn)行了分析,檢測到編碼干旱脅迫相關(guān)蛋白候選基因Lus10030150。He等[50]選取370份亞麻核心種質(zhì)材料確定了與抗派斯莫病相關(guān)的67個QTL位點,獲得候選基因Lus10031043和Lus10020016。謝冬微等[51]在亞麻全基因組中共找到137個核苷酸結(jié)合位點(NBS,nucleotidebinding site)類抗病基因,進(jìn)一步加快了亞麻抗病育種研究。Saha等[52]找到響應(yīng)高溫脅迫的熱休克因子(HSF,heat shock factor)基因34個,為進(jìn)一步促進(jìn)亞麻耐高溫遺傳改良和適應(yīng)性育種提供了依據(jù)。目前GWAS在亞麻抗逆相關(guān)性狀研究中的應(yīng)用還較少,雖然利用該方法能夠鑒定出一些與亞麻抗逆相關(guān)的位點,但這些位點是否能夠有效地應(yīng)用到亞麻分子育種中,還需要進(jìn)一步驗證。
綜上可知,與傳統(tǒng)的QTL作圖相比,GWAS具有檢測范圍廣[53]、分辨率高[54]、材料來源多[55]等優(yōu)勢,從而在亞麻產(chǎn)量、品質(zhì)以及抗逆等相關(guān)育種研究中取得一系列重要進(jìn)展。但GWAS也有其自身的局限性,在亞麻育種試驗設(shè)計上仍需謹(jǐn)慎,畢竟其只是對候選遺傳位點的一種預(yù)測,后續(xù)還需要結(jié)合其他技術(shù)手段進(jìn)行深入研究,探究其生物學(xué)功能。常規(guī)育種效率低、周期長,而關(guān)聯(lián)分析與分子育種相結(jié)合,再加上基因組、轉(zhuǎn)錄組、蛋白組及代謝組等多組學(xué)融合能更深入地了解亞麻復(fù)雜性狀的遺傳結(jié)構(gòu),有利于亞麻遺傳育種的進(jìn)一步發(fā)展。
GWAS是作物表型與基因型結(jié)合用于作物遺傳改良的優(yōu)良技術(shù),其包括研究群體的選擇、多年多點的表型鑒定、高通量測序、關(guān)聯(lián)分析、基因功能注釋、精細(xì)定位、候選基因功能驗證等,在亞麻遺傳改良中具有重大的應(yīng)用潛力。盡管GWAS當(dāng)前還存在一些不足,但隨著分子生物學(xué)技術(shù)的不斷深入,其在實際應(yīng)用中的局限性會不斷得以克服。隨著高通量測序技術(shù)的發(fā)展,水稻、玉米、大豆等參考基因組已公布,其基因組范圍內(nèi)的變異數(shù)據(jù)用于遺傳作圖和作物演化研究,GWAS在這些作物育種研究中已較為成熟,GWAS在應(yīng)用于亞麻重要性狀研究中可多參考這些作物以進(jìn)一步對亞麻農(nóng)藝相關(guān)性狀、品質(zhì)相關(guān)性狀以及抗逆相關(guān)性狀等方面進(jìn)行研究,為亞麻品種改良和培育提供依據(jù)。在今后的亞麻育種研究中,應(yīng)當(dāng)繼續(xù)利用高通量測序等技術(shù),在全基因組水平對亞麻群體進(jìn)行基因型鑒定,開展遺傳多樣性和群體結(jié)構(gòu)分析,進(jìn)一步結(jié)合多組學(xué)融合分析和基因功能驗證等方法,挖掘亞麻產(chǎn)量、品質(zhì)以及抗性等相關(guān)性狀的候選基因,為亞麻優(yōu)質(zhì)育種提供一定的理論基礎(chǔ)。