摘要:全基因組關聯分析(genome-wide association analysis,GWAS)是一種基于連鎖不平衡理論的成本低、精度高的基因分型方法,用于影響復雜性狀的基因或基因組區(qū)域定位。隨著果樹各樹種基因組的陸續(xù)公布,近年來GWAS在果樹研究中得到廣泛應用。本文介紹了GWAS的基本原理和影響因素,綜述了GWAS在仁果類、核果類、柑橘類、漿果類和其他經濟類果樹中的研究進展,關聯性狀主要集中在果實品質性狀評估(風味、香氣、質地、果實外觀、色澤、單果重等)和抗性基因鑒定(蘋果褐斑病、李痘病毒、褐腐病、草莓枯萎病、葡萄裂果等)等方面,梳理了利用結構變異、轉座子開展關聯分析的研究報道,基于GWAS+TWAS等衍生應用在作物中的研究進展分析了對果樹相關研究的借鑒和參考意義,最后歸納了果樹GWAS研究的不足,并提出未來研究方向和建議。
關鍵詞:全基因組關聯分析(GWAS);果樹;品質性狀;抗性性狀
中圖分類號:S660.1文獻標志碼:A
文章編號:1002-1302(2024)11-0010-10
我國是目前世界上最大的水果生產國和消費國,種植面積和產量均居世界第一。全國共有21個國家果樹種質資源圃,保存果樹種質資源2.3萬余份,是多種果樹的起源演化中心之一,同時也是世界上最大的果樹資源國[1]。然而,我國的果樹資源仍然存在數量不足、覆蓋面積不足、缺少外國種質等問題[2]。據調查發(fā)現,自1950年以來,我國育成了約2 000多個果樹品種[1],但在實際生產中這些品種的應用十分有限,這主要是由于在種質資源利用方面,骨干親本的重復利用導致品種間基因同質性高、遺傳背景狹窄。此外,我國的果樹育種以傳統(tǒng)的雜交育種為主,現代育種技術與理論基礎結合不夠緊密,未能實現分子標記輔助育種、基因編輯、全基因組選擇等實用化技術突破。我國的果樹產業(yè)與先進國家之間存在一定差距,尤其是突破性優(yōu)良品種方面,需加強對優(yōu)異野生資源的挖掘利用,加強高效育種技術理論研究和實踐應用,以高效培育出遺傳背景豐富、品質優(yōu)異的特色品種,調整產業(yè)品種結構、引領產業(yè)發(fā)展。
全基因組關聯分析(genome-wide association study,GWAS)是利用連鎖不平衡(linkage disequilibrium,LD)為理論基礎,通過大樣本群體中的表型變異和多態(tài)性標記展開統(tǒng)計分析,定位影響復雜性狀的基因或基因組區(qū)域,是一種成本低、精度高的基因分型方法[3],通過高密度單核苷酸多態(tài)性序列標記(single nucleotide polymorphism,SNP)在全基因組的分布,至少找到1個能夠影響目標性狀的數量性狀位點(quantitative trait locus,QTL),從而實現目標性狀的定位、新標記開發(fā)和新基因挖掘。GWAS已成為研究植物種質資源和育種的重要手段和方法[4]。在作物領域,關聯分析主要應用于水稻稻瘟?。?]、小麥穗粒數[6]、玉米穗部性狀[7]、油菜角果粒數[8]、棉花產量[9]、大豆耐低磷性[10]等。近年來,隨著全基因重測序成本大幅度降低,果樹基因組序列陸續(xù)公布,GWAS已應用于包含櫻桃[11]、桃[12]、蘋果[13]、梨[14]、葡萄[15]、柑橘[16]等果樹研究中。本文基于全基因組關聯分析的基本原理和影響因素概述,重點闡述了GWAS在果樹重要性狀定位的最新研究進展,探討了果樹GWAS未來研究趨勢。
1 全基因組關聯分析的基本原理
連鎖不平衡(LD)是指在一段基因序列中,2個不同基因座之間的2種等位基因非隨機地聯合存在的現象[17]。LD的存在會影響全基因組關聯分析的精度和可靠性,其程度的高低受多種因素影響,包括基因座的物理距離、遺傳多樣性、種群歷史等。在關聯分析中,通常使用D′(standardized disequilibrium coefficients,D′)和r2(squared allele-frequency correlation,r2)2個參數來衡量基因座間的LD程度。D′值范圍在0~1之間,表示2個基因座間的非隨機聯合存在程度;r2值也在0~1之間,表示2個基因座在不同群體中的等位基因頻率的協(xié)方差,值越高表示LD程度越高[18]。全基因組關聯分析利用LD的特性,對大規(guī)模遺傳數據進行統(tǒng)計分析,尋找基因座與性狀之間的關聯,從而找到可能影響性狀的基因或基因組區(qū)域具有重要意義。
在GWAS分析中,r2被認定為是衡量LD的首選指標,用于評估標記和遺傳變異性狀之間的相關性[19]。LD衰減是指隨著物理距離的增加,基因座之間的r2值逐漸減小的過程,表示從連鎖不平衡狀態(tài)到平衡狀態(tài)的轉變。一般情況下,馴化程度較高的群體,其LD衰減距離較大。
2 全基因組關聯分析的影響因素
2.1 群體大小和結構
群體大小直接影響表型和基因型之間的關聯關系,大型群體具有增強友系關聯的作用[20]。然而,特定的育種親本及其后代可能會影響群體結構,從而影響群體中SNP與目標性狀之間的關聯,是因為估計的育種值會顯著高于其他親本材料,并且在親本后代組成的亞群中等位基因頻率更高,因此在特定亞群中可能存在假陽性結果[21]。為了平衡遺傳多樣性和等位基因頻率,選擇全球范圍內的多樣性個體組成大群體是最佳選擇[20]。
2.2 表型變異
表型變異是關聯分析的重要組成部分,為了保證分析的準確性,表型數據應符合正態(tài)分布。通常情況下,繪制箱線圖可以排除極端異常值。為了減少誤差,經常采用采集多年多點表型數據的方式,但是這種方法可能會受到環(huán)境的影響,從而導致遺傳力下降。為了解決這個問題,可以使用最佳線性無偏預測(BLUP)和最佳線性無偏估計(BLUE)等方法進行數據歸一化處理,調整基因型×環(huán)境間的相互作用,上述方法可以有效地減少誤差并提高分析的準確性[22]。
2.3 統(tǒng)計模型
根據基因控制的數量不同,可以將性狀分為質量性狀和數量性狀。對于質量性狀,通常采用Logistic回歸模型進行關聯分析。而對于數量性狀,關聯分析多采用一般線性模型(GLM)和混合線性模型(MLM)2種方法[23],GLM模型通過引入協(xié)變量來解釋基因型在群體中的方差[24],而MLM則在GLM的基礎上加入群體結構和個體間關系,以減少假陽性的影響[25]。
3 GWAS在果樹中的應用
對于果樹,果實品質(內在品質和外觀品質)和抗性是種質資源和育種研究經久不衰的方向,以下綜述了GWAS在仁果類、核果類、柑橘類、漿果類及其他果樹上的研究應用,分析現有文獻,關聯分析相關研究也主要集中在品質性狀評估和抗性基因鑒定等方面,詳見表1。
3.1 仁果類果樹
蘋果是仁果類果樹中的代表性樹種,我國蘋果栽培面積和產量居世界首位[26],果實品質、病害、脅迫響應機制等一直是蘋果研究的重點,GWAS也不例外,但相關報道較少。果實香氣受糖酸含量、著色、重量、外界環(huán)境等多因素影響,是蘋果重要的品質因子[27]。研究人員基于氣相色譜-質譜法(gas chromatography-mass spectrometry,GC-MS)從149個蘋果樣本中鑒定出49種揮發(fā)性有機化合物(volatile organic compounds,VOCs),經關聯分析發(fā)現,在2號染色體上有和乙酸丁酯、乙酸己酯相關的
顯著性標記,同時檢測到3個與收獲時期顯著關聯的SNP位點,其中1個SNP(chr3:31409362)位于果實成熟轉錄因子NAC18.1的編碼區(qū)[28]。蘋果褐斑病(apple marssonina blotch,AMB)是由蘋果雙殼菌引起的病害,可在葉片和果實上發(fā)生,導致早期落葉、降低果實質量、影響樹木活力和生長。通過全基因組關聯分析探索影響AMB疾病感染的基因,發(fā)現5個極顯著SNP位點與AMB抗性相關,LOC103442381和LOC103443382這2個SNP位點相關的候選基因可能與AMB抗性密切相關[29]。葉片蠟質能夠阻止非氣孔水分流失,從而增強植株的抗寒、抗旱能力[30-32],CAO等基于GC-MS方法分析123份蘋果新鮮葉片中蠟成分并進行GWAS,篩選得到了大量顯著性位點,并結合GO富集分析,研究發(fā)現7個與葉蠟合成和運輸相關的基因,分別是MdSHN1、MdWSD1、MdLTP4、MdRDR1、MdACBP6、MdNLE和MdABCG21,以上研究及結果為蘋果育種中品質、抗病性基因挖掘及分析標記開發(fā)提供了重要參考[33]。
我國梨栽培面積和產量占世界一半以上[34],但存在著果實品質較差、經濟效益低的問題[35],開展梨品質資源鑒定、性狀遺傳基礎研究從而進行性狀改良遺傳育種,解決梨口味淡、品質差的弊端具有重要意義。研究者基于312個沙梨初花期、果實發(fā)育期和營養(yǎng)生長天數等果實物候期性狀、單果重、石細胞含量、果皮顏色等果實品質性狀的GWAS,發(fā)現了與物候期相關的5個基因座和與果實品質相關的37個候選基因座,其中候選基因PbrSTONE的功能被證實參與了梨石細胞形成的調控,這項研究為利用GWAS研究果實復雜生物學性狀提供了新思路[36]。尹明華等對2種上饒早梨品種進行全基因組測序和轉錄組測序,將獲得的基因組數據和轉錄組數據進行關聯分析,發(fā)現共有1 561個基因在上饒梨中表達,其中198個轉錄本差異顯著,部分基因具有高表達差異,為上饒梨品種資源鑒定和品種選育提供了理論基礎[37]。Minamikawa等也通過GWAS鑒定到與果實質量、酸含量、果實表皮顏色、霉心病、采前果實落果等性狀顯著關聯的位點,對于探尋位點上控制上述性狀的關鍵基因提供了參考[38]。
綜上所述,全基因組關聯分析在有效鑒定果實發(fā)育中重要品質性狀的遺傳位點、挖掘調控果實發(fā)育過程相關基因等中發(fā)揮了重要作用,也為其他性狀的相關研究提供了參考和思路。
3.2 核果類果樹
核果類果樹包含桃、李、杏、櫻桃等??v觀產業(yè)發(fā)展,傳統(tǒng)桃、李、杏、櫻桃品種普遍因果肉軟、不耐運貯、貨架期短及綜合品質差等因素而面臨淘汰,產業(yè)亟需品質好、硬度高的優(yōu)良品種[39]。此外,李痘病和褐腐病是危害核果類果樹的主要病害,李痘病甚至會造成毀樹毀園,褐腐病主要危害果實,嚴重時造成絕產,所以加強種質資源發(fā)掘利用、研究果實品質性狀遺傳基礎、開發(fā)與性狀關聯的標記開發(fā)等,對于核果類果樹品質及抗性選育具有重要意義。
研究人員利用由野生品種、地方品種、育成品種組成的129份桃種質進行高通量測序,并對果肉質地、果實特性、種子特性等進行GWAS,篩選得到的關于果肉質地、果實形狀和果肉黏度等性狀的峰值信號與連鎖分析結果相一致,并發(fā)現在桃的馴化和改良過程中,一些與果實重量和可溶性固形物含量相關的基因組區(qū)域與預測的選擇性清除相重疊[40]。對于櫻桃而言,果皮顏色豐富,可分為黃色、紅黃色、紅色、紫紅色、紅紫色、紫色櫻桃,櫻桃果皮顏色呈紅色與花青苷的含量與組成有關[41]。為了提高甜櫻桃標記密度,以235份甜櫻桃種質為試驗材料進行GWAS,發(fā)現櫻桃果實顏色和果肉顏色相關的候選基因MYB10.1存在單核苷酸缺失,位于chr3_23995550位點上,與最顯著位點chr3_23939472相距約55 kb,對黃色櫻桃果實進行測序后,發(fā)現3號染色體上存在一段90 kb的缺失與果實顏色有關,其中包括5個MYB10轉錄因子,這些結果對于了解櫻桃的遺傳機制和DNA輔助育種具有重要意義[42]。
李痘病毒(plum pox virus,PPV),別名莎卡(sharka),是李屬(Prunus L.)植物中危害最大的病毒之一。為進一步了解杏樹抗PPV的遺傳特性,Mariette等利用包括22份抗性材料在內的72份杏育種資源進行全基因組SNP分型,通過對56 708個SNP進行GWAS,共鑒定到38個顯著性SNP,其中有34個SNP位點的候選基因與植物-病毒的相互作用有關,基因pp022195編碼BTB/POZ-MATH-TRAF樣蛋白,ppa012234m推測編碼絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)雙特異性(絲氨酸/蘇氨酸和酪氨酸)磷酸酶[43]。這些候選蛋白表明植物降解途徑存在與杏抗PPV相關的潛在抗病毒機制[44-45]。褐腐?。∕onilinia spp.)是一種核果病害,會導致果實腐爛,造成產量嚴重損失。為了確定與褐腐病相關的基因組區(qū)域,研究人員選用了26個具有Bolinha品種抗性的桃栽培品種及其子代作為試驗材料,在2年中對損傷和非損傷果實的褐腐病嚴重程度指數進行GWAS,鑒定出了4個與果肉和10個與果皮耐腐相關的SNP位點,確定了25個與抗病性相關的候選基因,該報道研究結果有助于深入了解褐腐病的遺傳機制,為DNA輔助育種提供了重要基礎[46]。
3.3 柑橘類果樹
相比較于其他果樹,柑橘已進入分子育種時代,國際上已經公布14個柑橘基因組,進入功能基因組和泛基因組時代[47]。目前針對柑橘的農藝性狀已經展開多項全基因組關聯分析研究,獲得了與果實重量、果皮顏色、果肉硬度、花藥顏色等多種表型相關的顯著性位點。國內外均有相關報道,根據Minamikawa等的研究,基于111個柑橘品種組成的親本群體和676個F1代個體組成的育種群體,獲得 1 841 個SNP的基因分型,對包括果實重量、果皮顏色、果實硬度和種子數量等的17個農藝性狀進行GWAS,發(fā)現最顯著的SNP位于8號染色體,并與果實重量性狀相關聯,且該SNP位于QTL作圖研究中的FW8區(qū)域內[48]。Imai等對110份柑橘材料的8種果實品質性狀進行全基因組關聯分析,在2 309個SNP中鑒定到7個顯著相關的QTL區(qū)域,包含與果實重量相關的QTL 4個,與果皮顏色、果肉硬度和囊硬度相關的QTL各1個[49]。孫珍珠利用240份寬皮柑橘與112 768個SNPs進行GWAS,以果形指數、果皮光滑度、花藥顏色等10個重要性狀為表型指標,共鑒定到35個顯著性SNP標記,其中與花藥顏色性狀相關的顯著性位點最多,共10個。此外,還找到了55個候選基因,分布在NW006262339.1和NW006262022.1等2條染色體上。這些QTL的發(fā)現和候選基因的發(fā)掘有望應用于柑橘雜交種的培育中[50]。
3.4 漿果類果樹
分析文獻報道發(fā)現,漿果類果樹的全基因組關聯分析主要集中于葡萄的研究中,其他漿果類果樹的GWAS處于起步階段。鮮食葡萄育種的目標主要包括有香氣、自然大粒、耐貯運[51],因而育種家在品種選育過程中更多地關注果實形態(tài)、果實重量、果實開裂程度等果實重要農藝性狀。研究表明漿果果形性狀可能受多基因協(xié)同調節(jié),基因VIT_12s0134g00230和VIT_02s0025g01360通過調節(jié)植物激素影響果實形態(tài),泛素連接酶基因VIT_03s0088g01090和VIT_10s0003g04300與多種漿果形狀相關[52]。Guo等對179份葡萄種質進行了全基因組測序,并將32 311個SNP與果實發(fā)育期、果實重量、果實形狀等8個性狀進行GWAS,篩選出多個顯著性標記。其中,在2號染色體上檢測到與葡萄果皮顏色相關的mybA轉錄因子,以及在16號染色體上檢測到2個與果實發(fā)育期相關的顯著性標記[15]。這些與漿果性狀密切相關的標記有助于葡萄育種。裂果是果實生長發(fā)育過程中常見的現象,嚴重影響果實產量和品質。Zhang等通過2019年和2020年連續(xù)調查,對漿果開裂率、漿果開裂指數和漿果開裂類型進行關聯分析,鑒定到5個與漿果開裂指數相關的SNP,2個與漿果開裂類型相關的SNP,這些位點分布于4條染色體上,與10個候選裂果基因相關[53]。
藍莓和樹莓作為新興水果,相較于其他果樹歷史較短,參考基因組公布時間也比較晚,全基因組關聯分析相關研究仍處于起步階段。在南高叢藍莓品種中,Ferro等利用源自92個南高叢組合的886份雜交后代為試驗材料,以10種脂肪酸衍生物、5種萜類化合物、2種苯類化合物為表性指標,利用GWAS分析成功鑒定到藍莓上有519個顯著性SNPs與屬于不同代謝途徑的11個揮發(fā)性有機化合物(volatile organic compounds,VOCs)相關。他們證明了VOCs受幾個主要的基因組區(qū)域控制,其中一些區(qū)域含有生物合成酶編碼基因,部分VOCs調節(jié)消費者偏好,為育種提供了方向[54]。為簡化生產管理難度,樹莓品種的無刺性狀也備受關注。Khadgi和Weber以92個樹莓樣本為材料進行測序,鑒定了4個極顯著SNP,其中SNP 4_35148226被鑒定為對無刺性狀有積極貢獻,為研究樹莓無刺性狀基因組區(qū)域奠定了基礎[55]。
草莓枯萎?。‵usarium wilt)是一種由真菌引起的突然傳播性疾病,嚴重影響全球草莓生產。Pincot等通過對565份重要草莓種質的14 408個SNP進行全基因組關聯分析,在2號染色體的2.3 Mb區(qū)間內檢測到與草莓枯萎病基因Fw1連鎖不平衡的14個SNP,最顯著SNP解釋了85%的表型變異,預測了97%的抗性,廣義遺傳力為0.96[56]。
綜上,研究發(fā)現的SNP位點有望在品種改良中發(fā)揮重要作用,為推進通過分子標記輔助育種和基因選擇來提高核果類果樹的品質、抗病性等奠定了基礎。
3.5 其他經濟類果樹
除上述大宗類果樹外,在甜瓜、棗、橄欖等經濟類果樹中也逐步開展了全基因組關聯分析研究。其中在甜瓜中,研究者基于48個商業(yè)東方甜瓜品種的葉片、葉柄、花序、果實等48個表型進行了GWAS,新發(fā)現了2個分別位于1號染色體和8號染色體上的OM1_30331998和OM8_81597532個SNP位點與性別表達相關,并預測到4個潛在候選基因MELO3C015898、MELO3C015904、MELO3C024563和MELO3C024565與東方甜瓜的性別表達相關[57],這些結果為研究甜瓜性別表達的分子遺傳機制提供了基礎。在棗中,研究人員基于180份中國棗的9個品質性狀開展關聯分析,成功鑒定出45個與果實大小、果核大小和果實開裂相關的SNP標記,并通過基因功能注釋,鑒定出了21個候選基因,這些基因參與細胞擴增、非生物脅迫反應、激素信號和生長發(fā)育等過程[58]。在橄欖中,Kaya等對來自美國和土耳其共183份橄欖材料,利用GWAS技術探究了葉片長度、葉片寬度、果實重量、果核重量和果肉果核比5個性狀與SNP的相關性,共發(fā)現52個顯著性標記與葉片長度、果實重量、果核重量和果肉果核比相關聯,預測到19個候選基因,大部分的基因注釋是參與生理發(fā)育過程的蛋白質[59]。
綜上,通過全基因組關聯分析,可以找到與目標性狀密切相關的位點,挖掘基因功能,從而在解析果樹品質形成機制、遺傳馴化規(guī)律、病害發(fā)生機理及鑒定種質資源、分析基因調控網絡等方面發(fā)揮重要作用。上述研究為理解核果類果樹李痘病、褐腐病等重要病害的遺傳機制及品質等農藝性狀候選基因的篩選研究提供了重要基礎,為推動分子標記輔助選擇(marker-assisted selection,MAS)育種的進程提供了重要參考。
4 GWAS的發(fā)展應用
GWAS作為定位性狀相關位點、基因的有效工具,在植物中最早被應用于糖料作物海甜菜的研究[60],距今已有20多年,隨著對植物基因組認識的不斷深入,GWAS相關的衍生技術也已被廣泛應用,為研究提供了更多的思路和選擇。目前在植物中應用比較廣泛的GWAS衍生技術主要集中于對基因型數據進行改變,以及關聯分析和其他方法的結合運用2方面,從而更好地研究性狀的遺傳變異趨勢,彌補GWAS的不足。以下綜述結構變異(structural variant,SV)、轉座子(transposable element,TE)及轉錄組關聯分析(TWAS)與GWAS聯合運用的研究進展。
結構變異(SV)包括插入、缺失、重復和倒位[61],最初被定義為超過1 kb大小的插入、缺失和反轉,但隨著人類基因組測序的常規(guī)化,結構變異已經包括長度大于50 bp的事件[62]。隨著泛基因組研究的增多,基于SV開展GWAS,已成功應用于大豆[63]、玉米[65]、油菜[66]、桃[67-69]、水稻[70-71]、番茄[72]等植物性狀的研究中,證明與傳統(tǒng)的SNP相比,SV具有更大的表型效應,基因或調控序列中出現的SV基因可能會影響表達,進而影響農藝性狀的變化。
轉座子(TE)活性通過轉位、插入、切除、染色體斷裂和異位重組產生基因和基因組結構的變化,通常伴隨著基因活性的改變[73]。有研究證明,使用TE標記進行GWAS比使用SNP標記連鎖不平衡的假陽性低,基因組掃描顯示了與農藝性狀相關的TE陽性選擇[74]。在番茄中用TE插入多態(tài)性(TE insertions polymorphisms,TIP)進行關聯分析,確定了至少40個與主要農藝性狀或次級代謝產物的極端變異密切相關的TIP,大部分TE插入都是低頻變體,很少被SNP標記[75]。玉米ZmCCT基因編碼含有CCT結構域的光周期相關蛋白質,通過GWAS在啟動子中檢測到CACAT樣轉座子,顯著縮短開花時間,TE插入發(fā)生在馴化之后,在相關的連鎖不平衡區(qū)塊內產生了強烈的選擇性清除[76]。
全轉錄組關聯分析(transcriptome-wide association study,TWAS)是基于GWAS的統(tǒng)計分析,將基因表達量與表型性狀相關聯,識別與復雜性狀相關聯的順式調節(jié)表達基因[77],補充研究GWAS定位到的基因與關聯性狀背后的生物學機制[78]。GWAS+TWAS聯合運用的方法已經在多種植物中得到應用,包括玉米[79-80]、棉花[81]、水稻[82]、油菜[83-84]等,首先通過GWAS與功能基因組學相結合鑒定調節(jié)基因,其次利用TWAS研究調節(jié)基因的表達量與復雜性狀之間的關聯,對鑒定到的基因進行貢獻率排序,從而更全面地了解基因調控機制和復雜性狀的遺傳基礎[85]。
綜上,利用SV、TE開展關聯分析以及GWAS+TWAS等衍生應用在擴大表型效應、降低連鎖不平衡的假陽性、關聯基因表達量與復雜性狀的遺傳基礎等方面具有優(yōu)勢,彌補了GWAS單獨分析的不足。
5 展望
GWAS是一種挖掘功能基因/位點的有效研究手段,其優(yōu)勢在于不需要任何先驗信息來衡量遺傳變異和表型多樣性之間的關聯便可以挖掘種質資源中尚未發(fā)現的有價值的遺傳變異,為今后的育種工作提供新的遺傳變異,為實現品種改良,開發(fā)具有理想性狀的新品種奠定了前期基礎。
縱觀水稻、玉米和大豆等大田作物,除了鑒定顯著性位點,更多的是關注性狀的遺傳調控機制,挖掘功能基因所處的信號調節(jié)通路。如利用大豆GWAS得到的顯著性關聯區(qū)域構建遺傳調控網絡,發(fā)現有部分性狀可能共同遺傳,受同一個顯著性區(qū)域調控,為一因多效作用的結果[86];在水稻研究中發(fā)現,OsGSK2基因是參與油菜素甾體信號(brassinosteroids,BR)傳導的保守激酶,通過協(xié)調獨腳金內酯和油菜素甾醇調節(jié)中胚軸長[87];MRG702基因、粒寬基因GW5在秈稻、粳稻2個栽培稻群體中受選擇,參與BR信號通路的調控[88];對8個植物代表性性狀進行PCA,利用PC1作為因變量進行GWAS研究,發(fā)現SPINDLY基因被鑒定為通過抑制赤霉素(GA)信號傳導來調節(jié)水稻結構[89]。與之相比在果樹中的研究應用還相對滯后,可借鑒、參考其思路和方法。
果樹開展GWAS研究的瓶頸因素包括以下內容:(1)樣本數量和種質資源:GWAS研究需要大量的樣本和種質資源,而果樹因保存資源受試驗地面積影響,多數野生資源、地方品種以原生態(tài)就地保存為主,分布廣泛,集中獲取難度大。(2)基因組數據:GWAS研究需要高質量完整的基因組數據進行分析,但是果樹基因組數據的獲取、分析和注釋仍存在困難,這也制約了GWAS研究的深入開展。(3)環(huán)境因素的影響:果樹對于環(huán)境的適應性很強,而環(huán)境因素對果樹性狀的影響比其他作物更為復雜多變,環(huán)境因素可能會掩蓋或干擾GWAS的結果。(4)遺傳背景和多倍體物種分析:果樹多數為多倍體物種,造成基因型分析和遺傳背景建立存在難度,同時多倍體物種還需要考慮親代效應、雜種優(yōu)勢、雜合子喪失等問題。這些因素都增加了果樹GWAS研究的復雜性。針對這些問題,需要通過多種手段解決,如建設多樣化的果樹種質資源庫,改進數據測序技術和生物信息學分析方法,開展多個作物種類的GWAS研究以提高GWAS的可靠性和推廣應用。
綜上所述,隨著蘋果[90]、桃[91]、梨[92]、藍莓[93]等果樹基因組的公布,在果實品質性狀評估、抗性基因鑒定等方面發(fā)揮了重要作用。此外,果樹上GWAS研究目前相對集中在核果類和仁果類果樹中,而對于樹莓、藍莓等樹種的GWAS研究領域仍有大量空白需要填補。因此,在今后的研究中,開展結構變異、轉座子層面的關聯分析,以及將GWAS研究與QTL定位、轉錄組、基因選擇、基因編輯、功能基因解析等多種方法結合在一起,將更有利于實現基因組學輔助育種和基于基因組學的技術對果樹進行遺傳改良。
參考文獻:
[1]陳學森,王 楠,張宗營,等. 關于果樹種質資源與遺傳育種若干問題的理解與思考[J]. 中國農業(yè)科學,2022,55(17):3395-3410.
[2]王力榮,吳金龍. 中國果樹種質資源研究與新品種選育70年[J]. 園藝學報,2021,48(4):749-758.
[3]Zahid G,Aka Kaar Y,Dnmez D,et al. Perspectives and recent progress of genome-wide association studies (GWAS) in fruits[J]. Molecular Biology Reports,2022,49(6):5341-5352.
[4]趙 惠,房玉林,張 穎,等. 關聯分析及其在果樹育種研究中的應用[J]. 分子植物育種,2018,16(7):2291-2299.
[5]周海平,張 帆,陳 凱,等. 水稻種質資源稻瘟病抗性全基因組關聯分析[J]. 作物學報,2023,49(5):1170-1183.
[6]徐 鑫,張德華,趙吉順,等. 普通小麥小穗粒數性狀全基因組關聯分析[J]. 植物遺傳資源學報,2022,23(4):1098-1110.
[7]李 婷,董 遠,張 君,等. 玉米雜交種穗部性狀的全基因組關聯分析[J]. 中國農業(yè)科學,2022,55(13):2485-2499.
[8]唐玉鳳,姚 敏,何 昕,等. 甘藍型油菜SGR基因家族的全基因組鑒定與功能分析[J]. 作物學報,2023,49(7):1829-1842.
[9]王 娟,馬曉梅,周小鳳,等. 棉花產量構成因素性狀的全基因組關聯分析[J]. 中國農業(yè)科學,2022,55(12):2265-2277.
[10]梁騰月,谷勇哲,馬英杰,等. 大豆耐低磷性全基因組關聯分析[J]. 植物遺傳資源學報,2023,24(1):237-251.
[11]彭芳芳,龍治堅,魏召新,等. 櫻桃種質SCoT分子標記與葉片表型性狀關聯分析[J]. 園藝學報,2021,48(2):325-335.
[12]李雄偉,賈惠娟,高中山. 桃基因組及全基因組關/聯分析研究進展[J]. 遺傳,2013,35(10):1167-1178.
[13]儲寶華,曹富國,卞寧寧,等. 84個蘋果栽培品種對斑點落葉病的抗性評價和全基因組關聯分析[J]. 中國農業(yè)科學,2022,55(18):3613-3628.
[14]胡哲輝,劉 園,王江波,等. 3個品種梨香氣感官品質與揮發(fā)性物質關聯分析[J]. 華中農業(yè)大學學報,2022,41(4):217-225.
[15]Guo D L,Zhao H L,Li Q,et al. Genome-wide association study of berry-related traits in grape (Vitis vinifera L.) based on genotyping-by-sequencing markers[J]. Horticulture Research,2019,6(1):1655-1667.
[16]Minamikawa M F,Nonaka K,Kaminuma E,et al. Genome-wide association study and genomic prediction in citrus:potential of genomics-assisted breeding for fruit quality traits[J]. Scientific Reports,2017,7(1):1-13.
[17]Flint-Garcia S A,Thornsberry J M,Th B E. Structure of linkage disequilibrium in plants.[J]. Annual Review of Plant Biology,2003,54(1):357-374.
[18]Flint-Garcia S A,Thornsberry J M,Buckler Iv E S. Structure of linkage disequilibrium in plants[J]. Annual Review of Plant Biology,2003,54(1):357-374.
[19]Abdallah J M,Goffinet B,Cierco-Ayrolles C,et al. Linkage disequilibrium fine mapping of quantitative trait loci:a simulation study[J]. Genetics Selection Evolution,2003,35(5):513-532.
[20]Alqudah A M,Sallam A,Baenziger P S,et al. GWAS:fast-forwarding gene identification and characterization in temperate cereals:lessons from barley-a review[J]. Journal of Advanced Research,2020,22:119-135.
[21]Hayes B. Overview of statistical methods for genome-wide association studies (GWAS)[J]. Methods in Molecular Biology,2013,1019:149-169.
[22]Aoun M,Carter A H,Ward B P,et al. Genome-wide association mapping of the ‘Super-Soft’ kernel texture in white winter wheat[J]. Theoretical and Applied Genetics,2021,134:2547-2559.
[23]趙宇慧,李秀秀,陳 倬,等. 生物信息學分析方法Ⅰ:全基因組關聯分析概述[J]. 植物學報,2020,55(6):715-732.
[24]Pritchard J K,Stephens M,Donnelly P. Inference of population structure using multilocus genotype data[J]. Genetics,2000,155(2):945-959.
[25]Yu J,Pressoir G,Briggs W H,et al. A unified mixed-model method for association mapping that accounts for multiple levels of relatedness[J]. Nature Genetics,2006,38(2):203-208.
[26]叢佩華,張 彩,韓 曉,等. 我國蘋果育種研究現狀及展望[J]. 中國果樹,2018(6):1-5.
[27]王 森,何 平,王海波,等. 魯麗蘋果在不同產地果實風味及品質差異分析[J]. 果樹學報,2023,40(6):1135-1145.
[28]Larsen B,Migicovsky Z,Jeppesen A A,et al. Genome-wide association studies in apple reveal loci for aroma volatiles,sugar composition,and harvest date[J]. The Plant Genome,2019,12(2):180104.
[29]Noh J,Do Y S,Kim G H,et al. A genome-wide association study for the detection of genes related to apple Marssonina blotch disease resistance in apples[J]. Scientia Horticulturae,2020,262:108986.
[30]Liao P,Chen Q F,Chye M L. Transgenic Arabidopsis flowers overexpressing acyl-CoA-binding protein ACBP6 are freezing tolerant[J]. Plant and Cell Physiology,2014,55(6):1055-1071.
[31]Kerstiens G. Water transport in plant cuticles:an update[J]. Journal of Experimental Botany,2006,57(11):2493-2499.
[32]Kunst L,Samuels A L. Biosynthesis and secretion of plant cuticular wax[J]. Progress in Lipid Research,2003,42(1):51-80.
[33]Cao F,Li Z,Jiang L,et al. Genome-wide association study (GWAS) of leaf wax components of apple[J]. Stress Biology,2021,1(1):1-14.
[34]陳學森,王 楠,張宗營,等. 仁果類果樹資源育種研究進展Ⅰ:我國梨種質資源、品質發(fā)育及遺傳育種研究進展[J]. 植物遺傳資源學報,2019,20(4):791-800.
[35]張紹鈴. 當前我國梨產業(yè)發(fā)展面臨的重大問題和對策措施[J]. 中國果業(yè)信息,2016,33(12):12-14.
[36]Zhang M Y,Xue C,Hu H,et al. Genome-wide association studies provide insights into the genetic determination of fruit traits of pear[J]. Nature Communications,2021,12(1):1144.
[37]尹明華,吳平華,劉邦旺,等. 上饒早梨全基因組重測序和轉錄組的關聯分析[J]. 分子植物育種,2019,17(11):3490-3496.
[38]Minamikawa M F,Takada N,Terakami S,et al. Genome-wide association study and genomic prediction using parental and breeding populations of Japanese pear (Pyrus pyrifolia Nakai)[J]. Scientific Reports,2018,8(1):1-12.
[39]姜 全. 當前我國桃產業(yè)發(fā)展面臨的重大問題和對策措施[J]. 中國果業(yè)信息,2017,4(1):5-6,10.
[40]Cao K,Zhou Z,Wang Q,et al. Genome-wide association study of 12 agronomic traits in peach[J]. Nature Communications,2016,7(1):13246.
[41]Wei H,Chen X,Zong X,et al. Comparative transcriptome analysis of genes involved in anthocyanin biosynthesis in the red and yellow fruits of sweet cherry (Prunus avium L.)[J]. PLoS One,2015,10(3):e0121164.
[42]Holuová K,C[DD(-1][HT6]ˇ[DD)]mejlová J,Suran P,et al. High-resolution genome-wide association study of a large Czech collection of sweet cherry (Prunus avium L.) on fruit maturity and quality traits[J]. Horticulture Research,2023,10(1):uhac233.
[43]Mariette S,Wong Jun Tai F,Roch G,et al. Genome-wide association links candidate genes to resistance to plum pox virus in apricot (Prunus armeniaca)[J]. New Phytologist,2016,209(2):773-784.
[44]Zuriaga E,Soriano J M,Zhebentyayeva T,et al. Genomic analysis reveals MATH gene(s) as candidate(s) for plum pox virus (PPV) resistance in apricot (Prunus armeniaca L.)[J]. Molecular Plant Pathology,2013,14(7):663-677.
[45]Gupta R,Huang Y,Kieber J,et al. Identification of a dual-specificity protein phosphatase that inactivates a MAP kinase from Arabidopsis[J]. The Plant Journal,1998,16(5):581-589.
[46]Fu W,da Silva Linge C,Gasic K. Genome-wide association study of brown rot (Monilinia spp.) tolerance in peach[J]. Frontiers in Plant Science,2021,12:635914.
[47]鄧秀新. 中國柑橘育種60年回顧與展望[J]. 園藝學報,2022,49(10):2063-2074.
[48]Minamikawa M F,Nonaka K,Kaminuma E,et al. Genome-wide association study and genomic prediction in citrus:potential of genomics-assisted breeding for fruit quality traits[J]. Scientific Reports,2017,7(1):4721.
[49]Imai A,Nonaka K,Kuniga T,et al. Genome-wide association mapping of fruit-quality traits using genotyping-by-sequencing approach in citrus landraces,modern cultivars,and breeding lines in Japan[J]. Tree Genetics amp; Genomes,2018,14(2):1-15.
[50]孫珍珠. 寬皮柑橘種質資源的多樣性研究及重要農藝性狀的全基因組關聯分析[D]. 重慶:西南大學,2018:53-54.
[51]段長青. 當前我國葡萄產業(yè)發(fā)展面臨的重大問題和對策措施[J]. 中國果業(yè)信息,2017,34(1):3-4.
[52]Zhang C,Cui L,Fang J. Genome-wide association study of the candidate genes for grape berry shape-related traits[J]. BMC Plant Biology,2022,22(1):42.
[53]Zhang C,Wu J,Cui L,et al. Mining of candidate genes for grape berry cracking using a genome-wide association study[J]. Journal of Integrative Agriculture,2022,21(8):2291-2304.
[54]Ferro L F V,Johnson T S,Benevenuto J,et al. Genome-wide association of volatiles reveals candidate loci for blueberry flavor[J]. New Phytologist,2020,226(6):1725-1737.
[55]Khadgi A,Weber C A. Genome-wide association study (GWAS) for examining the genomics controlling prickle production in red raspberry (Rubus idaeus L.)[J]. Agronomy,2020,11(1):27.
[56]Pincot D D A,Poorten T J,Hardigan M A,et al Genome-wide association mapping uncovers [WTBX][STBX]Fw1[WTBZ][STBZ],a dominant gene conferring resistance to Fusarium wilt in strawberry[J]. G3:Genes,Genomes,Genetics,2018,8(5):1817-1828.
[57]Kishor D S,Noh Y,Song W H,et al. SNP marker assay and candidate gene identification for sex expression via genotyping-by-sequencing-based genome-wide associations (GWAS) analyses in oriental melon (Cucumis melo L. var. makuwa)[J]. Scientia Horticulturae,2021,276:109711.
[58]Hou L,Chen W,Zhang Z,et al. Genome-wide association studies of fruit quality traits in jujube germplasm collections using genotyping-by-sequencing[J]. The Plant Genome,2020,13(3):e20036.
[59]Kaya H B,Akdemir D,Lozano R,et al. Genome wide association study of 5 agronomic traits in olive (Olea europaea L.)[J]. Scientific Reports,2019,9(1):1-14.
[60]Hansen M,Kraft T,Ganestam S,et al. Linkage disequilibrium mapping of the bolting gene in sea beet using AFLP markers[J]. Genetics Research,2001,77(1):61-66.
[61]Abel H J,Larson D E,Regier A A,et al. Mapping and characterization of structural variation in 17,795 human genomes[J]. Nature,2020,583(7814):83-89.
[62]Alkan C,Coe B P,Eichler E E. Genome structural variation discovery and genotyping[J]. Nature Reviews Genetics,2011,12(5):363-376.
[63]Liu Y,Du H,Li P,et al. Pan-genome of wild and cultivated soybeans[J]. Cell,2020,182(1):162-176.
[64]Yang N,Liu J,Gao Q,et al. Genome assembly of a tropical maize inbred line provides insights into structural variation and crop improvement[J]. Nature Genetics,2019,51(6):1052-1059.
[65]Sun S,Zhou Y,Chen J,et al. Extensive intraspecific gene order and gene structural variations between [WTBX][STBX]Mo17[WTBZ][STBZ] and other maize genomes[J]. Nature Genetics,2018,50(9):1289-1295.
[66]Song J M,Guan Z,Hu J,et al. Eight high-quality genomes reveal pan-genome architecture and ecotype differentiation of Brassica napus[J]. Nature Plants,2020,6(1):34-45.
[67]Guan J,Xu Y,Yu Y,et al. Genome structure variation analyses of peach reveal population dynamics and a 1.67 Mb causal inversion for fruit shape[J]. Genome Biology,2021,22(1):1-25.
[68]Zhou H,Ma R,Gao L,et al. A 1.7-Mb chromosomal inversion downstream of a [WTBX][STBX]PpOFP1[WTBZ][STBZ] gene is responsible for flat fruit shape in peach[J]. Plant Biotechnology Journal,2021,19(1):192-205.
[69]Guo J,Cao K,Deng C,et al. An integrated peach genome structural variation map uncovers genes associated with fruit traits[J]. Genome Biology,2020,21:1-19.
[70]Wang W,Mauleon R,Hu Z,et al. Genomic variation in 3,010 diverse accessions of Asian cultivated rice[J]. Nature,2018,557(7703):43-49.
[71]Hu Z,Wang W,Wu Z,et al. Novel sequences,structural variations and gene presence variations of Asian cultivated rice[J]. Scientific Data,2018,5(1):1-7.
[72]Alonge M,Wang X,Benoit M,et al. Major impacts of widespread structural variation on gene expression and crop improvement in tomato[J]. Cell,2020,182(1):145-161. e23.
[73]Bennetzen J L. Transposable element contributions to plant gene and genome evolution[J]. Plant Molecular Biology,2000,42(1):251-269.
[74]Yan H,Haak D C,Li S,et al. Exploring transposable element-based markers to identify allelic variations underlying agronomic traits in rice[J]. Plant Communications,2022,3(3):100270.
[75]Domínguez M,Dugas E,Benchouaia M,et al. The impact of transposable elements on tomato diversity[J]. Nature Communications,2020,11(1):4058.
[76]Yang Q,Li Z,Li W,et al. CACTA-like transposable element in ZmCCT attenuated photoperiod sensitivity and accelerated the postdomestication spread of maize[J]. Proceedings of the National Academy of Sciences,2013,110(42):16969-16974.
[77]Gusev A,Ko A,Shi H,et al. Integrative approaches for large-scale transcriptome-wide association studies[J]. Nature Genetics,2016,48(3):245-252.
[78]Gamazon E R,Wheeler H E,Shah K P,et al. A gene-based association method for mapping traits using reference transcriptome data[J]. Nature Genetics,2015,47(9):1091-1098.
[79]Wu D,Li X,Tanaka R,et al. Combining GWAS and TWAS to identify candidate causal genes for tocochromanol levels in maize grain[J]. Genetics,2022,221(4):iyac091.
[80]Lin M,Qiao P,Matschi S,et al. Integrating GWAS and TWAS to elucidate the genetic architecture of maize leaf cuticular conductance[J]. Plant Physiology,2022,189(4):2144-2158.
[81]Ma Y,Min L,Wang J,et al. Combined transcriptome GWAS and TWAS reveal genetic elements leading to male sterility during high temperature stress in cotton[J]. New Phytologist,2021,231(1):165-181.
[82]Anacleto R,Badoni S,Parween S,et al. Integrating a genome-wide association study with a large-scale transcriptome analysis to predict genetic regions influencing the glycaemic index and texture in rice[J]. Plant Biotechnology Journal,2019,17(7):1261-1275.
[83]Tan Z,Xie Z,Dai L,et al. Genome-and transcriptome-wide association studies reveal the genetic basis and the breeding history of seed glucosinolate content in Brassica napus[J]. Plant Biotechnology Journal,2022,20(1):211-225.
[84]Zhang Y,Zhang H,Zhao H,et al. Multi-omics analysis dissects the genetic architecture of seed coat content in Brassica napus[J]. Genome Biology,2022,23(1):86.
[85]Li B,Ritchie M D. From GWAS to gene:transcriptome-wide association studies and other methods to functionally understand GWAS discoveries[J]. Frontiers in Genetics,2021,12:713230.
[86]Fang C,Ma Y,Wu S,et al. Genome-wide association studies dissect the genetic networks underlying agronomical traits in soybean[J]. Genome Biology,2017,18(1):1-14.
[87]Sun S,Wang T,Wang L,et al. Natural selection of a [WTBX][STBX]GSK3[WTBZ][STBZ] determines rice mesocotyl domestication by coordinating strigolactone and brassinosteroid signaling[J]. Nature Communications,2018,9(1):2523.
[88]李嘉琦. 基于GWAS解析水稻粒型變異的遺傳基礎[D]. 沈陽:沈陽師范大學,2020:46-50.
[89]Yano K,Morinaka Y,Wang F,et al. GWAS with principal component analysis identifies a gene comprehensively controlling rice architecture[J]. Proceedings of the National Academy of Sciences,2019,116(42):21262-21267.
[90]Velasco R,Zharkikh A,Affourtit J,et al. The genome of the domesticated apple (Malus×domestica Borkh.)[J]. Nature Genetics,2010,42(10):833-839.
[91]International Peach Genome Initiative,Verde I,Abbott Ag,et al. The high-quality draft genome of peach (Prunus persica) identifies unique patterns of genetic diversity,domestication and genome evolution[J]. Nature Genetics,2013,45(5):487-494.
[92]Wu J,Wang Z,Shi Z,et al. The genome of the pear (Pyrus bretschneideri Rehd.)[J]. Genome Research,2013,23(2):396-408.
[93]Colle M,Leisner C P,Wai C M,et al. Haplotype-phased genome and evolution of phytonutrient pathways of tetraploid blueberry[J]. Gigascience,2019,8:giz012.