郭麗麗 李昱瑩 郭大龍 侯小改
(河南科技大學(xué)農(nóng)學(xué)院/牡丹學(xué)院,洛陽(yáng) 471023)
遺傳圖譜(Genetic map)或連鎖圖譜(Linkage map)或遺傳連鎖圖譜(Genetic linkage map),是以遺傳標(biāo)記間重組頻率為基礎(chǔ)的染色體或基因組內(nèi)位點(diǎn)相對(duì)位置的線(xiàn)性排列圖[1]?;ɑ苤参镞z傳連鎖圖譜構(gòu)建是開(kāi)展分子標(biāo)記輔助育種的重要工具,可將遺傳圖譜上的分子標(biāo)記作為框架,標(biāo)記和定位植物體內(nèi)質(zhì)量性狀和數(shù)量性狀基因座[2]。高密度遺傳圖譜是輔助基因組測(cè)序序列組裝的重要工具[3],進(jìn)而實(shí)現(xiàn)較為精細(xì)的比較基因組分析[4]。通過(guò)整合遺傳圖譜內(nèi)種質(zhì)的基因分型,可以解析基因組連鎖不平衡規(guī)律,為開(kāi)展全基因組關(guān)聯(lián)分析[5]提供研究基礎(chǔ)。高密度遺傳圖譜還可通過(guò)整合物理圖譜和遺傳圖譜,加速主效關(guān)鍵基因和目標(biāo)性狀QTL圖位克隆進(jìn)程,從而有效提高育種效率和改良品種[6]。
分子標(biāo)記是以核苷酸序列變異為基礎(chǔ),直接反應(yīng)DNA水平遺傳多態(tài)性的遺傳標(biāo)記。計(jì)算分子標(biāo)記間的重組率,基于重組率構(gòu)建遺傳連鎖圖譜,特別是高密度遺傳圖譜,是進(jìn)行遺傳分析和QTL定位的重要手段,是促進(jìn)種質(zhì)資源性狀改良的有效途徑[7]。單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)是基因組水平上由單個(gè)核苷酸變異引起的DNA序列多態(tài)性,變異類(lèi)型和變異頻率豐富[8]。高通量測(cè)序技術(shù)的快速發(fā)展和成本的不斷降低,使SNP標(biāo)記在高密度遺傳圖譜構(gòu)建研究中的應(yīng)用越來(lái)越廣泛[9]。
遺傳圖譜作為分子標(biāo)記輔助育種技術(shù)的重要工具,對(duì)重要花卉植物的新品種選育具有重要的指導(dǎo)意義。目前重要花卉植物如牡丹、梅花、月季、菊花、蘭花、荷花、桂花等高遺傳圖譜的構(gòu)建研究已有報(bào)道,但圖譜精密度尚無(wú)法滿(mǎn)足精細(xì)定位研究的要求。百合、紫薇、郁金香、向日葵等花卉植物高密度遺傳圖譜構(gòu)建研究還相對(duì)較少,制約了花卉植物分子標(biāo)記輔助育種研究的進(jìn)程。因此,本文概述了高密度遺傳圖譜構(gòu)建流程及作圖方法(圖1),綜述了重要傳統(tǒng)木本花卉和草本花卉植物遺傳圖譜構(gòu)建研究進(jìn)展,討論了重要花卉植物高密度遺傳圖譜構(gòu)建存在的主要問(wèn)題,對(duì)今后重要花卉植物遺傳圖譜構(gòu)建研究的發(fā)展方向及其在育種中的應(yīng)用前景進(jìn)行了展望,以期為花卉植物目標(biāo)性狀QTL定位、輔助基因組組裝、比較基因組學(xué)、圖位克隆、分子標(biāo)記輔助育種等研究提供參考。
遺傳圖譜構(gòu)建首先需要構(gòu)建一個(gè)親本差異顯著的分離群體,通過(guò)對(duì)分離群體進(jìn)行多態(tài)性標(biāo)記篩選、個(gè)體掃描和連鎖分析,使用作圖軟件確定連鎖群中標(biāo)記的相對(duì)順序和遺傳距離,利用群體內(nèi)染色體交換重組,構(gòu)建完整的遺傳圖譜[1]。作圖群體是影響遺傳圖譜構(gòu)建質(zhì)量的重要因素,作圖群體的親本選擇、群體類(lèi)型、群體大小、分子標(biāo)記種類(lèi)及遺傳距離估計(jì)均影響遺傳圖譜的構(gòu)建效果[10]。
圖1 高密度遺傳圖譜構(gòu)建策略
構(gòu)建遺傳圖譜的作圖群體時(shí),雜交組合親本間的遺傳差異應(yīng)盡量大,方可獲得足夠的DNA序列差異。親本間遺傳差異過(guò)大,則使雜種染色體間的配對(duì)及重組受到抑制[11],導(dǎo)致連鎖座位間重組率偏低,引起偏分離現(xiàn)象,降低遺傳圖譜的可靠性和適用范圍,還會(huì)造成雜種后代結(jié)實(shí)率下降,甚至不育,影響分離群體的構(gòu)建[12]。雙親間遺傳差異過(guò)小,則親本間多態(tài)性水平較低,導(dǎo)致獲得相對(duì)飽和連鎖圖的難度增加[13]。因此,選擇親本時(shí)應(yīng)兼顧親本差異性和后代可育性,同時(shí)盡量選擇純度高的材料并通過(guò)自交進(jìn)行純化[14]。
遺傳圖譜構(gòu)建采用的作圖群體主要有F1群體、F2群體、重組自交系群體(Recombinant inbred lines,RIL)[15]、回 交 群 體(Backcross,BC)[16]、加倍單倍體群體(Doubled haploid,DH)[17]、近等基因系群體(Near-isogenic lines,NILs)[18]、殘留異質(zhì) 系 群 體(Residual heterozygous lines,RHLs)[19]、導(dǎo)入系群體(Introgressive lines,ILs)[20]等。木本植物世代周期長(zhǎng),雜交結(jié)實(shí)率低,獲得具有顯著孟德?tīng)栠z傳特征的高世代群體較難;多數(shù)木本植物自交不親和及組培體系不完善,導(dǎo)致F2、BC、DH、RIL等群體不適于其遺傳圖譜構(gòu)建;木本植物遺傳背景復(fù)雜,雜合度高,基因組大,重復(fù)序列多,均制約其遺傳圖譜構(gòu)建研究的深入開(kāi)展[21]。F1群體是木本植物遺傳圖譜構(gòu)建采用較為廣泛的作圖群體[22]。F2群體在楊樹(shù)、桉樹(shù)等速生林木遺傳圖譜構(gòu)建上的應(yīng)用較多[13]。半同胞家系(Half-sib family)群體的構(gòu)建無(wú)需人工雜交,花粉來(lái)源清楚的半同胞家系可用于林木遺傳圖譜的構(gòu)建[23]。母本減數(shù)分裂形成的大配子體(Macrogametophytes)其分離和重組交換不受近交和自由授粉家系的影響,可用于針葉樹(shù)種的遺傳圖譜構(gòu)建研究[24]。
作圖群體的大小是遺傳圖譜分辨率和精度的決定因素。群體越小,圖譜精度越低,檢測(cè)到的重組圖距偏大,導(dǎo)致QTL定位時(shí)檢測(cè)不到重組事件,引起標(biāo)記偏分離現(xiàn)象的產(chǎn)生,造成圖譜誤差較大。群體越大,檢測(cè)到的重組圖距越小,有利于緊密連鎖位點(diǎn)的區(qū)分。群體太大,則增加實(shí)驗(yàn)費(fèi)用及工作量。開(kāi)展遺傳圖譜構(gòu)建研究時(shí),應(yīng)根據(jù)群體類(lèi)型、作圖目標(biāo)、親本間雜合度及標(biāo)記分離情況等確定群體大小。以基因組序列分析和基因克隆為目的的遺傳圖譜構(gòu)建,需要較大的作圖群體;QTL定位分析時(shí)宜選擇包含150個(gè)單株的隨機(jī)小群體構(gòu)建骨架連鎖圖譜,對(duì)性狀進(jìn)行精細(xì)定位時(shí)可通過(guò)增大群體數(shù),對(duì)目標(biāo)連鎖群進(jìn)行加密[25]。近年來(lái),通過(guò)增大作圖群體提高遺傳圖譜精密度的研究日益增多。
基于高通量測(cè)序技術(shù)的SNP標(biāo)記開(kāi)發(fā),可短時(shí)間、低成本、高通量完成基因組DNA分型,有助于快速準(zhǔn)確的找到變異位點(diǎn),估算等位基因頻率[26]。全基因組測(cè)序(Genome sequencing)、簡(jiǎn)化基因組測(cè) 序(Reduced-representation genome sequencing,RRGS)和轉(zhuǎn)錄組測(cè)序(Transcriptome sequencing)是開(kāi)發(fā)SNP標(biāo)記的主要高通量測(cè)序技術(shù)。隨著越來(lái)越多植物全基因組測(cè)序的完成,使基于全基因組測(cè)序的重測(cè)序技術(shù)構(gòu)建高密度遺傳圖譜應(yīng)用越來(lái)越廣泛。而大部分多年生木本植物基因組龐大且復(fù)雜,全基因組測(cè)序成本太高,使重測(cè)序技術(shù)在其遺傳圖譜構(gòu)建中的應(yīng)用受到限制,重測(cè)序技術(shù)較為適用于規(guī)模較小的自然群體、骨干親本和極端混池測(cè)序(Bulked segregant analysis,BSA)[27]。
RRGS技術(shù)不受參考基因組限制,利用限制性?xún)?nèi)切酶對(duì)基因組DNA進(jìn)行酶切,僅富集具有限制性酶切位點(diǎn)的基因組片段,極大的降低了基因組復(fù)雜度和測(cè)序數(shù)據(jù)量,且采集盡可能覆蓋全基因組的遺傳變異信息,解決了高成本重測(cè)序技術(shù)的局限性[28]。RRGS技術(shù)主要有(1)簡(jiǎn)化文庫(kù)(Reduced representation libraries,RRLs)[29]和簡(jiǎn)化多態(tài)序列復(fù)雜性(Complexity reduction of polymorphic sequences,CroPS)[30];(2)限制性酶切位點(diǎn)關(guān)聯(lián)DNA測(cè)序(Restriction-site-associated DNA sequencing,RADseq):RAD(Restriction-site associated DNA)[31]、ddRAD[32]、2b-RAD[33]、SLAF-Seq(Specific-locus amplified fragment sequencing)[34];(3)低 覆 蓋 基因分型文庫(kù):多元鳥(niǎo)槍法基因分型(Multiplexed shotgun genotyping,MSG)[35]和基于測(cè)序的基因分型(Genotyping by sequencing,GBS)[36]。CroPS適用于基因組含有大量重復(fù)序列且DNA多態(tài)性較低的物種,GBS和RAD-seq適用于大樣本和復(fù)雜基因組物種[37]。
構(gòu)建遺傳圖譜時(shí)需要將分子標(biāo)記劃分成若干連鎖群,每個(gè)連鎖群中的標(biāo)記排序后確定標(biāo)記位點(diǎn)在遺傳連鎖群上的位置,標(biāo)記間的位置以遺傳距離表示[38]。常用的作圖軟件主要有Mapmaker[39]、JoinMap[40]、FsLinkageMap[41]等。但是,由于同一作圖軟件并不能包含所有的分離類(lèi)型,不同軟件構(gòu)建的遺傳圖譜也存在差異,應(yīng)根據(jù)實(shí)際情況選擇適合的軟件。
以牡丹“鳳丹白”M24ד紅喬”雜交,構(gòu)建包含195個(gè)子代的F1群體為作圖群體,采用SLAFseq簡(jiǎn)化基因組測(cè)序技術(shù),構(gòu)建了首張牡丹高密度遺傳連鎖圖譜,該圖譜含5個(gè)連鎖群,1189個(gè)SNP標(biāo)記和72個(gè)SSR標(biāo)記,遺傳圖距1061.94 cM,標(biāo)記間平均遺傳圖距0.84 cM,最大連鎖群306.85 cM,最小連鎖群96.32 cM[42]。以“鳳丹”ד新日月錦”F1群體為作圖群體(120個(gè)子代),采用GBS技術(shù)構(gòu)建了包含3868個(gè)SNP標(biāo)記和35個(gè)SSR標(biāo)記的高密度遺傳圖譜,總遺傳圖距13175.5 cM,覆蓋5個(gè)連鎖群,連鎖群平均長(zhǎng)度2635.1 cM,標(biāo)記數(shù)變化范圍322-1224,平均標(biāo)記位點(diǎn)773.6個(gè),標(biāo)記間平均距離3.406 cM,基因組覆蓋范圍1428.378 cM-3786.571 cM[2]。以“青龍禾墨池”ד墨子蓮”雜交獲得F1分離群體為材料,采用RAD-seq技術(shù)構(gòu)建牡丹高密度遺傳圖譜,該圖譜分別覆蓋父母本965.69 cM和870.21 cM,標(biāo)記間平均間隔分別0.66 cM和1.10 cM[43]。
通過(guò)‘Red New Dawn’(RND)בMorden Centennial’(MC)雜交,構(gòu)建了包含177個(gè)子代的F1作圖群體,構(gòu)建了月季高密度遺傳圖譜,該圖譜含有1929個(gè)SNP標(biāo)記,覆蓋25個(gè)連鎖群,遺傳圖距765.5 cM,平均標(biāo)記距離0.9 cM[44]。采用GBS技術(shù)構(gòu)建月季F1分離群體J06-20-14-3בLittle Chief’(J14-3×LC),J06-20-14-3בVineyard Song‘(J14-3×VS)和‘Old Blush’בRed Fairy’(OB×RF)的整合高密度遺傳圖譜,該圖譜包含3527個(gè)SNP標(biāo)記,標(biāo)記間平均距離0.25 cM,遺傳圖距892.2 cM,覆蓋7個(gè)連鎖群,連鎖群大小95-167 cM,最大連鎖群LG7(167 cM),標(biāo)記密度最高(6標(biāo)記/cM)且平均距離最小(1 cM/bin標(biāo)記)的連鎖群為L(zhǎng)G2,遺傳缺口最大的連鎖群為L(zhǎng)G5(11.2 cM)。整合圖譜長(zhǎng)度比單個(gè)圖譜增加近390 cM,圖譜密度和標(biāo)記間平均距離有所改善,標(biāo)記密度和標(biāo)記順序可靠性得到提高[45]。使用RAD-seq技術(shù)構(gòu)建了Rosa chinensis‘Old Blush’和R. wichuraiana‘Basyes Thornless’回交群體BC1F1(152個(gè)子代)的高密度連鎖圖譜,該圖譜包含2213個(gè)標(biāo)記,分布在7個(gè)連鎖群上,遺傳圖譜總長(zhǎng)度為1027.425 cM,標(biāo)記間平均距離0.96 cM,將1.21/23.14 Mb(12.18/44.52%)未組裝‘Old Blush’的scaffolds錨定到7條pseudochromosomes上[46]。
采用RAD-seq簡(jiǎn)化基因組測(cè)序技術(shù),在含190個(gè)子代的梅花“粉瓣”ד扣子玉蝶”F1群體中,檢測(cè)到1484個(gè)SNP標(biāo)記,構(gòu)建了包含8個(gè)連鎖群的梅花高密度遺傳圖譜,總遺傳圖距780.9 cM,標(biāo)記間平均距離為0.5 cM,錨定513條梅花基因組組裝序列,覆蓋基因組84%[47]。該遺傳圖譜輔助梅花全基因組組裝,提高了梅花基因組組裝質(zhì)量[3]。利用梅花品種“六瓣”ד粉臺(tái)垂枝”含387個(gè)子代的F1作圖群體,采用SLAF-seq技術(shù)構(gòu)建了梅花高密度遺傳圖譜,圖譜包含8個(gè)連鎖群,8007個(gè)遺傳標(biāo)記,標(biāo)記間平均距離0.195 cM,遺傳總圖距為1550.62 cM,SNP標(biāo)記在F1群體中的平均完整度為96%,垂枝性狀定位在7號(hào)染色體10.54 Mb-11.68 Mb之間,10個(gè)SNP分子標(biāo)記與梅花垂枝性狀緊密連鎖[48]。
采用桂花‘Wan Yin Gui’(Albus Group)為父本,‘Huang Chuan Jin Gui’(Luteus Group)為母本,構(gòu)建了包含129個(gè)子代的F1作圖群體,使用SLAFseq技術(shù)構(gòu)建了桂花高密度遺傳圖譜,該圖譜包含14189個(gè)高質(zhì)量SLAF標(biāo)記,分布在23個(gè)遺傳連鎖群上,總長(zhǎng)度2962.46 cM,相鄰標(biāo)記間平均距離0.21 cM[49]。
“中國(guó)古代蓮”×美洲黃蓮‘AL1’雜交構(gòu)建F1作圖群體(51個(gè)子代)[50],基于RAD-seq技術(shù)構(gòu)建了蓮高密度遺傳連鎖圖譜,使用美洲黃蓮‘AL1’遺傳圖譜錨定“中國(guó)古代蓮”基因組圖譜框架序列,3603個(gè)SNP標(biāo)記將234個(gè)individual scaffold sequence錨定在9個(gè)megascaffolds,覆蓋基因組67%[51]。以較大的“中國(guó)古代蓮”×美洲黃蓮‘AL1’F1群體(80個(gè)后代)為材料[52],以“中國(guó)古代蓮”基因組為參考序列[53],利用RAD-seq技術(shù)構(gòu)建美洲黃蓮‘AL1’的高密度遺傳圖譜,該圖譜由1515個(gè)SNP標(biāo)記組成,分布在10個(gè)連鎖群上,基因組覆蓋長(zhǎng)度563.6 cM,平均圖距0.38 cM。通過(guò)‘Man tian xing’בJu wu ba’F1群體自交,獲得F2作圖群體(96個(gè)子代),采用ddRAD-seq技術(shù)構(gòu)建高密度遺傳圖譜,圖譜包含8971 SNP標(biāo)記,覆蓋8個(gè)連鎖群,遺傳圖距581.3 cM,平均標(biāo)記間隔為0.74 cM,錨定基因組框架序列809個(gè),wild sacred蓮花基因組覆蓋度70.6%[54]。采用‘Chinese Tai-zi’ בThailand Chiang Mai’ F2作圖群體(181個(gè)子代),基于RADseq技術(shù)構(gòu)建N. nucifera高密度遺傳圖譜,輔助‘Chinese Tai-zi’基因組組裝,使基因組scaffold N50從0.989 Mb 增加至1.48 Mb,提高了基因組組裝質(zhì)量[55]。中國(guó)蓮“金秋”(多瓣)ד白花建蓮”(少瓣)構(gòu)建F2 作圖群體(121個(gè)子代),采用全基因組重測(cè)序技術(shù)構(gòu)建了中國(guó)蓮高密度遺傳圖譜,圖譜由8個(gè)連鎖群組成,包含1939個(gè)區(qū)間標(biāo)記和79596個(gè)SNPs標(biāo)記,標(biāo)記平均圖距為0.49 cM,遺傳圖距總長(zhǎng)度為772.92 cM,連鎖群平均長(zhǎng)度為96.61 cM[56]。
采 用 菊 花DB36451×DB39287(P2) 雜交F1群體(406個(gè)子代)構(gòu)建六倍體菊花(Chrysanthemum×morifolium,2n=6x=54) 的高密度遺傳連鎖圖譜,該圖譜包含30312個(gè)SNP標(biāo) 記,覆 蓋9個(gè) 連 鎖 群[57]。通 過(guò)Chrysanthemum×Morifolium‘Candy’(雙 花/扁 平花)和Chrysanthemum×Morifolium‘225’(單花/管狀花)雜交,獲得包含305個(gè)個(gè)體的F1作圖群體,使用SLAF-seq技術(shù)構(gòu)建菊花高密度遺傳連鎖圖譜,圖譜包含6452個(gè)標(biāo)記,總遺傳圖距4301.5 cM,平均距離為0.76 cM;LG平均長(zhǎng)度159.315 cM,包含270個(gè)標(biāo)記,跨度為120.84 cM;最長(zhǎng)連鎖群LG9包括299個(gè)標(biāo)記,遺傳圖譜距離263.37 cM,平均標(biāo)記間距離0.88 cM;最短連鎖群LG18含147個(gè)標(biāo)記,遺傳圖譜距離84.66 cM,平均標(biāo)記間距離0.58 cM;LG2遺傳缺口最大(18.92 cM),LG20中遺傳缺口最?。?.23 cM)[58]。
通過(guò)蘭花‘Dendrobium nobile’בDendrobium wardianum’雜交構(gòu)建包含100個(gè)子代的F1作圖群體,采用RNA-seq技術(shù)鑒定到9645個(gè)有效多態(tài)性SNP標(biāo)記,構(gòu)建了蘭花高密度整合遺傳圖譜,圖譜覆蓋19個(gè)連鎖群,總遺傳圖距為3612.12 cM,平均標(biāo) 記間隔為0.41 cM[59]。利用‘Dendrobium moniliforme’בD. officinale’雜交,獲得含111個(gè)后代的F1作圖群體[60],采用SLAF-seq技術(shù)構(gòu)建了蘭花高密度遺傳連鎖圖譜,圖譜包含8573個(gè)SNP標(biāo)記,分布在19個(gè)連鎖群上,總遺傳圖距為2737.49 cM,標(biāo)記間平均遺傳距離為0.32 cM[61]。
通過(guò)單瓣矮牽牛×重瓣矮牽牛雜交獲得F1群體,從F1群體中隨機(jī)選取一株重瓣后代為父本,選擇一株單瓣后代為母本,雜交獲得F2群體,從F2群體中選取50株單瓣和51株重瓣植株,以此作為作圖群體,采用全基因組重測(cè)序技術(shù),構(gòu)建了矮牽牛高密度遺傳連鎖圖譜。使用Join Map4.1構(gòu)建的遺傳圖譜包含4474個(gè)標(biāo)記,總遺傳距離2022.786 cM,平均遺傳距離0.758 cM;使用Lepmap構(gòu)建的遺傳圖譜包含8030個(gè)標(biāo)記,總遺傳距離453.39 cM,平均遺傳距離1.00 cM,重瓣性狀定位在LG5[62]。
以康乃馨‘85-11’בPretty Favvare’雜交F2作圖群體為材料,采用ddRAD-seq技術(shù)構(gòu)建了康乃馨高密度遺傳圖譜,該圖譜包含285個(gè)SSR和2119個(gè)SNP標(biāo)記,覆蓋15個(gè)連鎖群,遺傳圖距為971.5 cM,標(biāo)記間平均距離為0.4 cM[63]。
全基因組測(cè)序、簡(jiǎn)化基因組測(cè)序、RNA-Seq等高通量測(cè)序技術(shù)的飛速發(fā)展,為分子標(biāo)記開(kāi)發(fā)提供了成本更低更高效的手段。梅花[3]、菊花[64]、蓮花[53,65-67]、牡丹[68]、桂花[69]、康乃馨[70]、蘭花[71-73]、矮牽牛[74]等基因組的發(fā)布,有利于基于全基因組重測(cè)序的高密度遺傳圖譜構(gòu)建研究的深入開(kāi)展,有利于推動(dòng)花卉植物生物學(xué)和分子育種研究的進(jìn)程。然 而,目 前 牡 丹[2,42-43]、月 季[44-46]、梅 花[47-48]、桂花[49]、蓮花[51,54-56]、菊花[57-58]等重要觀賞植物所構(gòu)建的遺傳圖譜,其精密度尚無(wú)法滿(mǎn)足精細(xì)定位及圖位克隆研究的需求,百合、紫薇、郁金香、向日葵等重要觀賞植物高密度遺傳圖譜構(gòu)建尚見(jiàn)未開(kāi)展,制約了觀賞植物分子育種研究進(jìn)程。今后應(yīng)加大基于大群體、多群體、高世代群體及野生資源為親本群體的高密度遺傳圖譜構(gòu)建研究,提升現(xiàn)有遺傳圖譜的精密度,使其應(yīng)用于精細(xì)定位和圖位克隆等研究。種質(zhì)資源的商業(yè)化開(kāi)發(fā)與應(yīng)用,導(dǎo)致其遺傳變異特性的局限性,探索原始野生種的基因遺傳變異對(duì)促進(jìn)遺傳改良具有重要意義。