王竹林,劉曙東,奚亞軍 (西北農(nóng)林科技大學農(nóng)學院,陜西楊凌712100)
作物的許多農(nóng)藝性狀如產(chǎn)量、品質、抗逆性等都是數(shù)量性狀,由微效多基因控制,這些基因稱為數(shù)量性狀基因(Quantitative Trait Locus,QTL)。傳統(tǒng)的數(shù)量遺傳學把這些微效多基因作為一個整體,用統(tǒng)計學方法分析其總的遺傳效應,無法把微效多基因分解為一個個孟德爾因子[1]。分子標記技術的出現(xiàn)和發(fā)展為高密度的遺傳連鎖圖譜的構建提供了基礎,成為作物各種農(nóng)藝性狀基因分析和定位的重要手段,以分子標記為基礎的QTL研究是目前作物遺傳育種研究的熱點[2]。自PATERSON 等[3]首次應用 RFLP連鎖圖在番茄中定位QTL之后,國際和國內已有大量的關于QTL研究的報道。QTL研究在分子標記、作圖群體和統(tǒng)計分析方法等方面都取得了極大的進展。QTL定位工作現(xiàn)已成為數(shù)量性狀遺傳研究的一種標準程序。QTL研究從一個生育階段的靜態(tài)定位發(fā)展到全生育期的動態(tài)定位,從常規(guī)可見的表型發(fā)展到生理指標甚至基因的表達水平[1]。利用分子標記進行遺傳連鎖分析,可將QTL定位,并借助與QTL連鎖的分子標記,提高作物育種中對數(shù)量性狀優(yōu)良基因型選擇的準確性。更為重要的是越來越多的作物包括番茄、水稻、小麥等許多重要性狀QTL被分離克隆。筆者介紹QTL分析的原理、軟件和最新進展。
QTL定位的基本原理是分析整個染色體組的標記基因型和數(shù)量性狀值之間的連鎖[4]。QTL定位工作的基本要素包括合適的分離群體,分子標記連鎖圖以及合適的統(tǒng)計模型與分析方法。QTL定位的一般步驟包括:選擇具有目標相對性狀的純系雜交獲得作圖群體;用大量分子標記檢測分離群體,獲得分離群體中每一個體的標記基因型;分析群體標記基因型,構建該群體的遺傳連鎖圖;檢測分離世代群體中每一個體的數(shù)量性狀值;在獲得了遺傳連鎖圖和分離世代群體中每一個體的數(shù)量性狀值之后,需要分析標記基因型和數(shù)量性狀值的關系,確定QTL在染色體上的相對位置。QTL定位的分析方法有方差分析法、區(qū)間作圖法、復合區(qū)間作圖、基于最小二乘的復合區(qū)間作圖和基于混合線形模型的復合區(qū)間作圖等[2,4]。由于對大量數(shù)據(jù)進行分析和處理的復雜性,所以必須借助計算機軟件才能完成。QTL分析常見軟件有QTLnetwork、PLABQTL、MAPMAKER/QTL1.1 、QGene 2.29、QTLMapper2.0 和 winQTLCart2.0 等[1]。
2.1 數(shù)據(jù)準備 準備6個文本數(shù)據(jù)文件:Chromosome label(連鎖群的名稱),mark number(每個連鎖群上的標記的數(shù)目),Mark labels(標記名稱),Mark positions(標記之間的距離),Mark genetype(標記基因型),Trait value(性狀值),標記基因型從原來的橫排轉置成豎排,標記順序按照染色體的順序。
2.2 運行軟件 winQTLCart2.0軟件運行時間較長,在運算時不可運行其他大型程序,否則可能引起死機。
打開winQTLCart2.0,點擊“new”,出現(xiàn) Step 1 of 2 對話框,在里面填上相應數(shù)據(jù),如該試驗連鎖群(Cromosome number)為“20”,性狀(Trait)為“1”,單株數(shù)(Individual number)為“218”,群體(Crossing type)為“SF2”。單株的標記帶型記錄:“AA”記為“A”,表示該單株包含親本A的純合等位基因?!癮a”記為“B”,表示該單株包含來自親本a的純合等位基因?!癆a”記為“H”,表示該單株是同時攜帶A和a 2個等位基因的雜合體?!癮_”記為“C”表示該單株是A的等位基因的非純合體(要么是aa基因型,要么是Aa基因型)?!癆_”記為“D”表示該單株是a的等位基因的非純合體(要么是AA基因型,要么是Aa基因型)。“—”表示某單株的數(shù)據(jù)在該位點缺失(圖1)。
圖1 QTL分析群體基本信息
數(shù)據(jù)輸完之后點“ok”,出現(xiàn)“Create New Source File-Step 2 of 2”對話框,點擊“Labels”,出現(xiàn)“Data import for new file function”對話框,點擊“browse”,將事先準備好的Chromosome label文件輸入。按照第一個數(shù)據(jù)文件的輸入程序依次輸入剩下的5個數(shù)據(jù)文件(圖2)。
數(shù)據(jù)輸入完之后,點擊“ok”按鈕,之后產(chǎn)生X.mcd文件,點擊QTL分析所要用的方法“IM(區(qū)間作圖法)”、“CIM(復合區(qū)間作圖法)”或“MIM(混合復合區(qū)間作圖法)”。輸入分析設定的參數(shù),如LOD值一般設為2.0(圖3)。然后點擊“start”,分析開始。
圖2 QTL分析數(shù)據(jù)文件輸入
圖3 QTL分析基本參數(shù)設定
2.3 性狀定位 1~2 min運行結束。會出現(xiàn)QTL分析總結文件Untitled-C-eqtl.txt。從此文件能了解QTL定位的結果。如圖4所示QTL分析結果為:QTL數(shù)目共為4個。第1個QTL位于第4條染色體上,在第2個標記附近,在染色體上的位置是89.81 CM,LOD 為 2.98,加性效應為 -0.950 3,顯性效應為0,貢獻率為7%等。
圖4 QTL分析結果列表
打開軟件生成的qrt文件,可以看見曲線圖(圖5),圖上LOD值大于2.0就是QTL位點。按下坐標顯示的按鈕,將鼠標移動到一個LOD值大于2.0的位置,圖標會顯示出相關的信息,如第幾條染色體、LOD值、距離。
2.4 制圖 制圖可以用系統(tǒng)自帶的畫圖工具,也可以用photoshop。制圖就是注釋某個性狀QTL在骨架圖上的位置,只要根據(jù)上一步所確定的QTL在染色體上的位置,用方框、三角、圓圈等不同圖形表示不同性狀,在骨架圖上對應的染色體位置標注上即可(圖6)。
3.1 關聯(lián)分析在QTL分析中的應用 關聯(lián)分析(Association analysis)又稱連鎖不平衡作圖(LD mapping)或關聯(lián)作圖(Association mapping),是利用不同基因座等位變異(基 因)間的連鎖不平衡關系,進行標記與性狀的相關性分析,以達到鑒定特定目標性狀基因(或染色體區(qū)段)的目的[5]。與傳統(tǒng)的連鎖分析相比,關聯(lián)分析具有如下優(yōu)勢:①作圖定位更精確。關聯(lián)分析利用的是自然群體在長期進化中所積累的重組信息,具有較高的解析率,可實現(xiàn)數(shù)量性狀基因(位點)的精細定位,甚至直接定位到基因本身;②可同時考察一個基因座的多個等位基因。關聯(lián)分析可實現(xiàn)對其作圖群體(自然群體)一個基因座上所有等位基因的考察;③不需構建作圖群體。關聯(lián)分析利用的群體是自然群體,不需再人工構建,省時省力,并有較多的群體可供利用。④可發(fā)現(xiàn)較連鎖分析更多的QTL位點。鑒于關聯(lián)分析本身存在的優(yōu)勢,目前已廣泛應用于多種作物不同生物特性的研究,如玉米籽粒油分的生物合成[6]、水稻的開花時間和籽粒產(chǎn)量[7]和小麥的籽粒大小和研磨品質[8]等。MACCAFERRI等[9]利用225個分布于21條染色體上的SSR標記對164個硬粒小麥品種的苗期和成株抗葉銹性進行關聯(lián)分析,鑒定出3個具有較大效應的QTL位點,分別位于7BL末端(Lr14附近)、2A和2B染色體上,其中位于7BL的末端的QTL位點為硬粒小麥中重要的抗病基因,15%的供試品種中都攜帶該抗病基因位點。張學勇等[10]發(fā)現(xiàn)關聯(lián)分析定位的QTL比以往作圖結果豐富,發(fā)現(xiàn)了Xgwn149-153-4BL和Xgwm130-132-7AS與粒重顯著相關。CROSSA等[11]進一步證明了關聯(lián)分析能有效地定位和挖掘小麥產(chǎn)量性狀基因,在實際育種和種質資源研究中具有重要應用價值。HAO等[12]對266個小麥微核心種質抗赤霉病表型性狀和3B染色體3.1-Mb區(qū)段42個標記的關聯(lián)分析結果表明,cfb6059與小麥赤霉病Type II抗性顯著相關,且與已廣泛應用于抗赤霉病育種的選擇標記umn10非常接近??梢婈P聯(lián)分析大大提高了目標性狀基因或者相關QTL的挖掘和定位,是基因(QTL)定位分析的另一重要方法。
圖5 QTL分析結果
圖6 QTL在染色體上的位置
3.2 關聯(lián)分析程序
3.2.1 連鎖不平衡分析。
(1)基因型頻率統(tǒng)計分析:運用PLINK v1.07軟件進行一般的統(tǒng)計分析,包括等位基因頻率、標記的雜合率、材料的雜合度等。
(2)連鎖不平衡(LD)分析:首先從所有標記中篩選出單個標記缺失率小于10%同時最小等位頻率大于10%的標記,然后去除標記間距小于50 Kb的標記,再隨機選擇幾千個標記,進一步進行群體結構分析。用選擇的幾千個標記,運用Structure V2.3.3軟件對500個左右品種或高代品系組成的關聯(lián)分析群體進行遺傳結構分析。根據(jù)關聯(lián)分析群體的遺傳組成,將與特定亞群的遺傳相似性比例大于60%的材料劃分到相應亞群中,而將與任何亞群的遺傳相似性比例均小于60%的材料劃分到混合亞群中。
(3)鄰近LD窗口分析:用TASSEL進行材料間遺傳距離計算,并運用Neighbor-joining算法進行聚類圖構建。用進化樹查看軟件FigTree v1.3.1進行畫圖。
(4)單倍型分析:采用統(tǒng)計算法,以LD為基礎,如果2標記存在―強LD,則將該標記劃入一種單倍型。單倍型分析用軟件PLINK v1.07完成。
3.2.2 關聯(lián)作圖。首先將PLINK生成的單倍型塊(Haplotype blocks)結果在Excel中生成可以輸入TASSEL的多態(tài)性文件格式(如果單倍型中有任何標記缺失,則將該單倍體基因型定為缺失),然后將單倍型數(shù)據(jù)導入TASSEL對500份左右品種或高代品系的表型數(shù)據(jù)和SNP數(shù)據(jù)進行關聯(lián)作圖,找到與目標基因(QTL)緊密連鎖的SNP標記,并定位相關基因(QTL)。
關聯(lián)分析較傳統(tǒng)QTL分析存在優(yōu)勢,它是建立在自然群體基礎之上,可以對一些骨干親本、大面積推廣品種進行全基因組高密度掃描,找到這些重要品種的重要基因組區(qū)段,弄清骨干親本及推廣品種的基因組學基礎,為分子育種奠定基礎。但關聯(lián)分析也有局限性,如結果受群體結構的影響大,大量數(shù)據(jù)所導致的統(tǒng)計分析方法的不足以及對遺傳多樣性低的物種群體作圖效果差等。因此,在QTL分析時,應將關聯(lián)分析與QTL連鎖分析相結合,相互補充,相互印證,取長補短,最終實現(xiàn)目標性狀的精細作圖。
[1]楊紹華.植物QTL 研究進展[J].中國農(nóng)學通報,2011,27(3):226 -231.
[2]薛永國,劉麗君,高明杰,等.作物中 QTL的研究進展及展望[J].東北農(nóng)業(yè)大學學報,2007,38(4):542 -547.
[3]PATERSON A H,LANDER E S,HEWITT J D,et al Resolution of quantitative traits into Mendelian factors,using a complete linkage map of restriction fragment length polymorphisms[J].Nature,1988,335:721 -726.
[4]章元明.作物QTL定位方法研究進展[J].科學通報,2006(19):2223-2231.
[5]FLINT-GARCIA S A,THORNSBERRY J M,BUCKLER E S.Structure of linkage disequilibrium in plants[J].Annual Review of Plant Biology,2003,54:357 -374.
[6]LI H,PENG Z,YANG X,et al.Genome-wide association study dissects the genetic architecture of oil biosynthesis in maize kernels[J].Nature Genetics,2013,45:43 -50.
[7]HUANG X,ZHAO Y,WEI X,et al.Genome-wide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm[J].Nature Genetics,2012,44:32 -39.
[8]BRESEGHELLO F,SORRELLS M E.Association mapping of kernel size and milling quality in wheat(Triticum aestivum L.)cultivars[J].Genetics,2006,172:1165 -1177.
[9]MACCAFERRI M,SANGUINETI M C,MANTOVANI P,et al.Association mapping of leaf rust response in durum wheat[J].Molecular Breeding,2010,26:189 -228.
[10]張學勇,童依平,游光霞,等.選擇牽連效應分析:發(fā)掘重要基因的新思路[J].中國農(nóng)業(yè)科學,2006,39(8):1526 -1535.
[11]CROSSA J,BURGUENO J,DREISIGACKER S,et al.Association analysis of historical wheat germplasm using additive genetic covariance of relatives and population structure[J].Genetics,2007,177:1889 -1913.
[12]HAO C Y,WANG Y Q,HOU J,et al.Association mapping and haplotype analysis of a 3.1-Mb genomic region involved in Fusarium head blight resistance on wheat chromosome 3BS[J].PLOS ONE,2012,7(10):46444.