路田 劉子輝 趙鵬 邱四春 王曉明 鄭煒君 韓德俊 毛虎德 宋衛(wèi)寧 陳新宏 奚亞軍 王中華 吉萬全 康振生 許盛寶
摘 要 本研究在大規(guī)模根系轉(zhuǎn)錄組分析的基礎(chǔ)上,獲得406份全球遺傳多樣性豐富的小麥種質(zhì)的基因型數(shù)據(jù),并通過對18個農(nóng)藝性狀在10個種植環(huán)境中的系統(tǒng)調(diào)查,獲得對應(yīng)的表型數(shù)據(jù)。實驗室前期評估證實表型與基因型數(shù)據(jù)可靠,可應(yīng)用于小麥研究。同時,整合基因型、轉(zhuǎn)錄組、表型與栽培環(huán)境的氣象數(shù)據(jù),建立了一個可在網(wǎng)站(https://iwheat.net/resource)自由下載與利用的小麥多組學(xué)數(shù)據(jù)庫,為小麥功能基因的挖掘與機理研究提供支持。
關(guān)鍵詞 小麥;多組學(xué);數(shù)據(jù)庫;基因型;表現(xiàn)型
小麥是全球最重要的糧食作物之一,是人類的主要營養(yǎng)來源[1]。在人口規(guī)??焖僭鲩L的大背景下,增加小麥產(chǎn)量是當今農(nóng)業(yè)領(lǐng)域最重要的課題之一。開發(fā)高產(chǎn)、優(yōu)質(zhì)、適應(yīng)性強的小麥新品種是保障小麥持續(xù)供應(yīng)的必要途徑。變異在植物進化過程中始終持續(xù)發(fā)生,植物通過變異選擇適應(yīng)環(huán)境的優(yōu)良性狀穩(wěn)定遺傳,解析變異信息,是研究植物性狀遺傳的重要手段[2]。隨著測序技術(shù)的不斷發(fā)展和進步,研究人員得到了大量的變異數(shù)據(jù),為了便于應(yīng)用這些數(shù)據(jù),各種網(wǎng)絡(luò)共享數(shù)據(jù)庫應(yīng)運而生。目前,有許多大型公共網(wǎng)站可以免費使用,例如NCBI (National Center for Biotechnology Information)、Uniprot (Universal Protein)等。
隨著小麥基因組的快速發(fā)展,不同小麥品種間的基因型變異也逐漸被揭示。國際小麥基因組測序聯(lián)盟(International Wheat Genome Sequencing Consortium,IWGSC)2018年公布了六倍體小麥的最新參考基因組[3],此后小麥的測序數(shù)據(jù)呈現(xiàn)爆炸式增長,小麥基因組信息可以方便地從國內(nèi)外的眾多公共數(shù)據(jù)庫獲得。如,IWGSC數(shù)據(jù)庫包含完整的中國春參考基因組和基因注釋信息,Wheat Expression Browser(www.wheat-expression.com)數(shù)據(jù)庫包含大量六倍體小麥基因表達量數(shù)據(jù),CerealsDB(www.cerealsdb.uk.net)數(shù)據(jù)庫包含大量六倍體小麥SNP和基因分型數(shù)據(jù)[4],這兩個數(shù)據(jù)庫都很好地提供了大量分子標記,為育種工作提供了便利;WGVD小麥基因組變異數(shù)據(jù)庫包含7 346 814個SNP和? 1 044 400個indels[5],該數(shù)據(jù)庫還可以進行可視化基因組變異,并可以利用比對工具Blast來搜索序列之間的同源區(qū)域;WheatQTLdb提供了小麥高產(chǎn)、抗逆等多方面研究中已報道的位點與基因座信息[6],其包含小麥的形態(tài)學(xué)性狀、對脅迫的耐受性、質(zhì)量性狀和產(chǎn)量及其相關(guān)性狀已經(jīng)報道的位點或基因座;然而這些數(shù)據(jù)庫并沒有提供相應(yīng)的表型數(shù)據(jù)。此外,還有大量可視化數(shù)據(jù)庫,例如Triticeae-GeneTribe[7]、Snphub[8]與WheatExp[9]等,都可以較為容易地獲得小麥基因組、基因表達信息以及不同小麥品種的單倍型信息,這些小麥基因組數(shù)據(jù)共享為小麥優(yōu)異基因的發(fā)掘提供了堅實的基礎(chǔ)。
然而,在基因組學(xué)數(shù)據(jù)庫爆炸增長的同時,表型組學(xué)數(shù)據(jù)庫的發(fā)展較為滯后。目前存在的幾個作物表型數(shù)據(jù)庫,如,Planteome[10]和PGP repository[11]都是比較成熟的大型植物表型組學(xué)數(shù)據(jù)發(fā)布平臺,但其中并沒有系統(tǒng)的小麥表型組數(shù)據(jù)。OPTIMAS-DW數(shù)據(jù)庫提供了玉米的轉(zhuǎn)錄組學(xué)與表型組學(xué)綜合數(shù)據(jù)資源[12];BIOGEN BASE-CASSAVA是一個木薯表型組與基因組信息資源庫[13]。多組學(xué)數(shù)據(jù)庫的誕生為基礎(chǔ)植物研究與作物育種提供了很大幫助,然而目前并沒有一個真正成熟的小麥表型組數(shù)據(jù)庫,這成為當前小麥功能基因發(fā)掘中的一個短板[14]。因此,構(gòu)建一個包含小麥基因組與表型組數(shù)據(jù)的多組學(xué)數(shù)據(jù)庫,對于小麥領(lǐng)域研究人員具有重要意義。
本研究利用遺傳多樣性豐富的406份小麥種質(zhì),通過大規(guī)模根系轉(zhuǎn)錄組分析,獲得了406份小麥的基因型數(shù)據(jù)。在10個不同種植環(huán)境下對這些種質(zhì)的18個農(nóng)藝性狀表型進行系統(tǒng)的觀察與記錄,得到了一份與基因組對應(yīng)的表型組數(shù)據(jù),同時記錄了10個栽培環(huán)境的氣象數(shù)據(jù)。經(jīng)過實驗室前期的應(yīng)用與評估,表型與基因型數(shù)據(jù)良好可靠,可以應(yīng)用到小麥研究的多個方面。該數(shù)據(jù)庫包含了表型、基因型以及對應(yīng)的氣象數(shù)據(jù),希望能給小麥領(lǐng)域研究人員提供一些研究便利。
1 材料與方法
1.1 試驗材料的收集
供試材料為親緣關(guān)系彼此較遠的406份小麥種質(zhì)資源,其中包括87份地方農(nóng)家種,259份栽培種,60份高代育種系。在259份栽培種中,包括205份中國小麥現(xiàn)代品種(128份來自中國黃淮冬麥區(qū),29份來自長江中下游冬麥區(qū),18份來自北方冬麥區(qū),15份來自西南春麥區(qū),8份來自東北春麥區(qū),2份來自青藏春冬兼播麥區(qū),2份來自西北春麥區(qū),1份來自新疆冬春兼播麥區(qū),2份材料不能確定具體麥區(qū))與52份國外引進的品種(9份來自意大利;6份來自加拿大;4份來自美國;3份來自智利;以及來自德國、巴西、南非的各2份材料;來自阿根廷、埃及、澳大利亞、法國、哥倫比亞、摩洛哥、葡萄牙、日本、塞爾維亞、伊朗、以色列、印度、英國的各1份材料,11份材料不能確定具體國家);60份高代育種系分別來自從國際旱地農(nóng)業(yè)研究中心ICARDA引進的小麥抗逆材料,以及從美國引進的高代育種系材料。
1.2 田間表型測定
1.2.1 田間試驗 在陜西省咸陽市楊陵區(qū)曹新莊試驗農(nóng)場于2018-2019、2019-2020和? 2020-2021、2021-2022年當年10月初正常播種和次年1月中旬進行晚播;在四川省崇州市四川農(nóng)業(yè)大學(xué)現(xiàn)代農(nóng)業(yè)研究基地于2018-2019年和2020-2021年當年10月末進行正常播種。每個材料3個重復(fù),行長1 m、行距20 cm,每行點播10粒種子,并根據(jù)當?shù)厣a(chǎn)情況進行田間管理。
1.2.2 農(nóng)藝性狀表型測定 于小麥抽穗期開花期統(tǒng)計每個重復(fù)各種質(zhì)的抽穗期(Heading date)、開花期(Flowering date)、灌漿持續(xù)時間(Grain filling date)。
于小麥成熟期人工統(tǒng)計每個重復(fù)各種質(zhì)的株高(Plant height,PH),穗下節(jié)長度(Peduncle length,PL)、總分蘗數(shù)(Total tiller number,TTN)、有效分蘗數(shù)(Productive tiller number,PTN)、旗葉長(Flag leaf length,F(xiàn)LL)、旗葉寬(Flag leaf width,F(xiàn)LW)、旗葉夾角(Flag leaf angle,F(xiàn)LAN)、旗葉面積(Flag leaf area,F(xiàn)LA)[15],每個重復(fù)調(diào)查3個樣品。
每個重復(fù)收獲5個長勢一致的小麥穗子,人工統(tǒng)計穗長(Spike length,SL)、總小穗數(shù)(Total spikelet number,TSN)、可育小穗數(shù)(Fertile spikelet number,F(xiàn)SN)、穗粒數(shù)(Kernel number per spike,KNS)。
利用SC-G谷粒外觀質(zhì)量快速圖像分析系統(tǒng)分析每個重復(fù)各種質(zhì)的千粒質(zhì)量(Thousand kernel mass,TKW)、籽粒長(Kernel length,KL)、籽粒寬(Kernel width,KW)。
1.3 根系表型測定
選取飽滿一致的小麥種子,將種子消毒、吸脹,將打破休眠后的種子放入發(fā)芽盒中,將406份材料分別于培養(yǎng)箱中培養(yǎng)4 d、7 d、14 d,用直尺測量總根長(Total root length TRL)、主根長(Primary root length PRL);于貼近種子處剪下小麥初生根,擦拭水分,測量根鮮質(zhì)量(Root fresh mass,RFW)。利用萬深LA-S植物根系掃描儀進行根系表型掃描并分析,得到根表面積(Root surface area,RS)和根體積(Root volume,RV)。
1.4 氣象數(shù)據(jù)收集
通過國家氣象信息中心(https://data.cma.cn),統(tǒng)計10個環(huán)境的最高氣溫、最低氣溫、降水量、日照時數(shù)、相對濕度和太陽輻射共6個氣象因子。
1.5 數(shù)據(jù)處理
利用Microsoft office EXCEL軟件和Python程序語言對得到的10個環(huán)境農(nóng)藝性狀、根系表型、氣象數(shù)據(jù)進行處理,利用R語言的R包Lme4計算最佳線性無偏估計值(Best linear unbiased estimate,BLUE)。
1.6 轉(zhuǎn)錄組測序
與武漢菲沙公司合作對這406份小麥材料的苗期根系進行了大規(guī)模轉(zhuǎn)錄組測序(RNA-seq)與組裝,對測序得到的數(shù)據(jù)進行過濾以及質(zhì)量控制,過濾標準為:只保留純合基因型,并且每個樣本的支持reads必須大于等于30。通過小麥660 K SNP微陣列對過濾到的SNP準確性進行評估[16]。
1.7 在線數(shù)據(jù)庫搭建
本數(shù)據(jù)庫利用R語言Shiny框架進行構(gòu)建,使用R語言的R包shinydashboard編寫UI模塊設(shè)計web網(wǎng)頁的頁面前端布局,編寫Server模塊實現(xiàn)后端程序的功能并且控制輸出,將兩模塊的代碼整合,利用R包DT和CSS語言代碼塊將整合結(jié)果輸出為網(wǎng)頁數(shù)據(jù)庫的外觀界面并進行相關(guān)屬性配置。
2 結(jié)果與分析
2.1 數(shù)據(jù)庫群體組成、基因型與表型
本數(shù)據(jù)庫包含406份遺傳多樣性豐富的小麥種質(zhì)資源,其中包含87份地方農(nóng)家種(Landraces,LA),259份栽培種(Modern cultivars,MC),60份高代育種系(Breeding lines,BL)。在259份栽培種中包括128份材料來自黃淮冬麥區(qū)(Yellow and Huai wheat zone,Y&H),29份材料來自長江中下游冬麥區(qū)(Yangtze River wheat zone,YTS),50份材料來自中國其他麥區(qū)(Other wheat zone,OTW),52份材料屬于國外引入品種(Introduced abroad modern cultivars,IC)(圖1)。
通過與武漢菲沙公司合作對這406份小麥材料的苗期根系進行了大規(guī)模轉(zhuǎn)錄組測序(RNA-seq)與組裝,共鑒定到了1 232 311個單核苷酸多態(tài)性(SNP)(圖2),利用小麥660 K SNP微陣列評估鑒定SNP準確性>99%,大約一半的SNP(48.43%)位于CDS(編碼DNA序列)區(qū)域[16]。
同時,通過對這406份材料進行了4? a 10個環(huán)境的種植(表1),并且系統(tǒng)調(diào)查了18個農(nóng)藝性狀的表型(表2)。同時對4 a 10個環(huán)境對應(yīng)的氣象數(shù)據(jù)進行了收集。數(shù)據(jù)庫也收錄了其中351份材料出苗后4 d、7 d,406份材料出苗后14 d的苗期根系表型,此外,利用紅外分析儀對每個環(huán)境下收獲籽粒的品質(zhì)性狀也進行了測量,但使用時發(fā)現(xiàn)除蛋白含量這一指標比較穩(wěn)定外,其余性狀在不同環(huán)境中的變異非常大,為避免誤導(dǎo)他人,這份數(shù)據(jù)并未提供下載,如有需要,可以單獨索取,作為研究參考。
2.2 數(shù)據(jù)庫的使用
本數(shù)據(jù)庫包含6個部分,分別為小麥群體材料信息部分(Sample Information)、基因型數(shù)據(jù)(Genotypic Data)、基因表達數(shù)據(jù)(Gene Expression Data)、表型數(shù)據(jù)(Phenotypic Data)、氣象數(shù)據(jù)(Meteorologic Data)以及小麥群體高質(zhì)量SNP信息(SNP root and Yield Traits)。
小麥群體材料信息包含406份小麥材料的編號、名稱、類型以及來源(圖3)。
基因型數(shù)據(jù)包含406份小麥材料的原始和估算SNP,測序數(shù)據(jù)映射到IWGSC RefSeq v1.0。可根據(jù)不同染色體位置進行下載。基因表達數(shù)據(jù)包含高置信度和低置信度基因的表達(百萬分之一轉(zhuǎn)錄本,TPM)。該數(shù)據(jù)在小麥根系中鑒定出39 243個LC基因,擴展了小麥基因表達數(shù)據(jù)庫。
表型數(shù)據(jù)包括18個農(nóng)藝性狀與根系表型。農(nóng)藝性狀按照株型性狀、產(chǎn)量性狀、生育期性狀分環(huán)境提供,根系性狀分別提供了4 d、7 d、14 d的根系表型??筛鶕?jù)需要自行下載(圖4)。
氣象數(shù)據(jù)包括7種環(huán)境中的最高和最低溫度、降水量、日照時數(shù)、相對濕度和太陽輻射。可根據(jù)需要下載不同環(huán)境數(shù)據(jù)。
高質(zhì)量SNP標記信息包含SNP所在染色體及物理位置(Chr、Pos)、堿基突變類型(REF、ALT)、對農(nóng)藝性狀和根部表型的影響情況(Down表示下調(diào)表型、Up表示上調(diào)表型)以及在每個材料的變異情況(0/0表示與參考等位基因型一致,1/1表示與變異等位基因型一致);并提供不同染色體的SNP標記數(shù)據(jù)(圖5)。研究人員可以根據(jù)需要進行下載,得到SNP標記信息以及這些標記在群體材料中的分布情況信息。
綜上,研究人員通過本數(shù)據(jù)庫獲得的信息,可以為后續(xù)的育種工作提供參考。
2.3 數(shù)據(jù)庫應(yīng)用
2.3.1 GWAS的應(yīng)用
小麥農(nóng)藝性狀的基因定位是小麥研究中的一項重要工作,是發(fā)掘小麥優(yōu)良單倍型與研究基因功能的重要基礎(chǔ)。用于QTL定位的群體組成形式多樣,主要包括重組自交系、雙單倍體系與小麥多品種的自然群體。本數(shù)據(jù)庫包括406份遺傳多樣性豐富的小麥種質(zhì)資源以及4 a 10個環(huán)境的性狀數(shù)據(jù),前期用株高數(shù)據(jù)進行了GWAS評估,發(fā)現(xiàn)? Rht-D1b與? Rht-B1b對株高貢獻較大,符合長期以來的共識,因此,初步認為該數(shù)據(jù)庫中的表型數(shù)據(jù)與標記較為可靠。除這兩個強效位點之外,利用上述數(shù)據(jù)同時定位到了多個與株高關(guān)聯(lián)的位點,通過對其中一個位點的驗證發(fā)現(xiàn),該位點可以通過控制穗下節(jié)來控制株高,同時調(diào)整穗下節(jié)在全株的比例[17]。
本數(shù)據(jù)庫群體較大,包括406份小麥種質(zhì),即使分成兩個自然群體,也可以有效進行QTL定位。利用resampling GWAS進行QTL定位,可以組成更多有效的GWAS群體,篩選出潛在位點。據(jù)此對所有的18個農(nóng)藝性狀都做了GWAS分析,從運行的結(jié)果來看,效果比較理想,可以關(guān)聯(lián)到大量顯著標記[18]。本數(shù)據(jù)庫提供了全部個體基因型,可以有根據(jù)地組配群體結(jié)構(gòu),避免群體出現(xiàn)大量標記連鎖的不平衡分離現(xiàn)象,為更好選擇與組配定位群體提供了更多的選擇。
本數(shù)據(jù)庫表型可以作為其他定位結(jié)果的重要參考、幫助選擇可靠位點并縮小定位區(qū)間。本數(shù)據(jù)庫的標記來自大規(guī)模的轉(zhuǎn)錄組分析,一方面可為精細定位提供更多標記,同時可為確定候選基因提供參考。此外,利用這套數(shù)據(jù)可評估候選位點對全部18個農(nóng)藝性狀是否具有遺傳效應(yīng),以評估目標位點的多效性。
2.3.2 不同單倍型在育種中選擇與應(yīng)用的分析 通過查閱記錄,逐步理清406份種質(zhì)資源的品種屬性。參考英國John Innes Centre的經(jīng)驗,將1960年前育成或已經(jīng)種植的小麥材料劃分為農(nóng)家種,而1960年后釋放的品種認定為現(xiàn)代育成品種。對于現(xiàn)代品種的栽培地域,限于記錄不全與年代久遠,部分品種不能確認年代與種植區(qū)域,在259份栽培種中,有26份材料沒有年代信息,2份材料不能確認地域信息。
根據(jù)這些信息可以分析群體中各SNP在現(xiàn)代育種過程中的選擇力度,以及不同種植區(qū)域?qū)NP的選擇情況。如發(fā)現(xiàn)的降低穗下節(jié)的單倍型,除降低穗下節(jié)外,還能增加穗粒數(shù)與粒質(zhì)量,是個非常有價值的優(yōu)異基因單倍型。育種選擇分析表明這個位點的單倍型在栽培種中被顯著選擇(圖6-A),但這個選擇只在中國的現(xiàn)代小麥品種中發(fā)生了,而國外品種中卻幾乎沒有被選擇利用(圖6-B),所以有時會稱它為中國單倍型[17]。
2.3.3 探究環(huán)境對小麥生長發(fā)育及育種改良的影響 小麥作為固著生長的植物,其生長發(fā)育受到氣象條件的嚴格調(diào)控,小麥的各種農(nóng)藝性狀是基因型與環(huán)境因子互作的結(jié)果,因此,研究氣象條件對小麥生長習性的調(diào)控,是高產(chǎn)優(yōu)質(zhì)小麥品種選育與栽培的重要基礎(chǔ)。然而目前對于小麥響應(yīng)環(huán)境的機理并不清楚。
采用多元回歸分析方法研究氣象因子對小麥生長發(fā)育的影響是小麥育種工作中的常用方法。本數(shù)據(jù)庫收集了小麥群體在不同生長環(huán)境中的6個氣象因子。結(jié)合不同品種在不同環(huán)境下發(fā)育進程的記錄,可以得到不同品種在不同發(fā)育時期經(jīng)歷的氣象因素變化,通過擬合多元線性回歸方程可探究不同環(huán)境因子對小麥表型、生育時期的影響。如筆者利用多元回歸分析擬合其中7個生長環(huán)境的不同氣象因子與13個農(nóng)藝性狀的表型數(shù)據(jù)的方程,發(fā)現(xiàn)溫度對幾乎所有的小麥農(nóng)藝性狀都有顯著影響,尤其是株高、分蘗數(shù)和千粒質(zhì)量等[18]。此部分數(shù)據(jù)有望能為探究環(huán)境影響小麥生長發(fā)育的科研工作者提供一定數(shù)據(jù)支持。
2.3.4 不同SNP可能參與的發(fā)育過程進行評估
本數(shù)據(jù)庫轉(zhuǎn)錄組測序得到的1 232 311個高質(zhì)量SNP??梢愿鶕?jù)任一SNP的不同單倍型將406份材料劃分為兩個群體,結(jié)合多環(huán)境的表型,分析該SNP是否顯著地改變了小麥農(nóng)藝性狀,初步推斷該SNP參與了小麥哪些發(fā)育過程,從而為深入研究該SNP所在基因的功能提供切入點與基礎(chǔ)。據(jù)此本數(shù)據(jù)庫鑒定到了大量對千粒質(zhì)量、穗粒數(shù)、有效分蘗數(shù)、根表面積等性狀存在潛在影響的高質(zhì)量SNP。同時,這部分的結(jié)果也可以為實驗室中研究小麥基因功能提供一個平行的田間表型證據(jù)。
3 討? 論
這套表型數(shù)據(jù)中一共包含了18個田間農(nóng)藝性狀,彼此之間呈現(xiàn)一定的關(guān)聯(lián)性。這些表型相互組合以后又會產(chǎn)生新的內(nèi)涵,比如,穗長除以每穗小穗數(shù),可以得到穗間距;旗葉長與旗葉寬的比例,可以得到旗葉長寬比,可以拓展到旗葉形狀與細胞形狀的研究中[19];而把有效分蘗數(shù)、穗粒數(shù)、粒質(zhì)量進行組合后,可以進行小麥單株產(chǎn)量的基因定位;而利用單株產(chǎn)量/株高×分蘗數(shù)則有助于定位到一些與經(jīng)濟系數(shù)相關(guān)的位點;同時如果根系里每個表達的基因量也可以作為一個性狀的話,控制每個基因表達的位點也有希望能采用GWAS分析去探索。因此,使用者可以根據(jù)自己的研究興趣,利用該數(shù)據(jù)庫做出相應(yīng)的拓展。
GWAS是一種常用的發(fā)掘作物優(yōu)異基因的方法。近年來已經(jīng)大量開展了關(guān)于GWAS表型分析的流程、模型、方法的探索性研究。如將主成分作為因變量進行全基因組關(guān)聯(lián)分析[20];將不同環(huán)境間的方差作為表型進行關(guān)聯(lián),從而篩選不同環(huán)境中穩(wěn)定出現(xiàn)的候選基因[21-22];使用各環(huán)境的表型均值也可以定位到共同穩(wěn)定的位點,去發(fā)現(xiàn)獨立于環(huán)境的遺傳位點[23-24];此外,也可以利用核苷酸多態(tài)性的估計效應(yīng)篩選候選基因[25];目前在小麥中GWAS已逐漸成為一種常用的優(yōu)異基因發(fā)掘的方法,相對于其他物種,小麥的基因組大,冗余性高,對于GWAS的定位易造成假陽性高與定位區(qū)間大等限制。多年多點可靠的表型與基因型數(shù)據(jù)將可以為不同方向的研究人員提供基礎(chǔ)數(shù)據(jù),希望這份數(shù)據(jù)能為發(fā)展與優(yōu)化小麥GWAS流程做出一些貢獻。此外,根據(jù)這套數(shù)據(jù)也嘗試做了TWAS分析,并且找到了Rht-D1b與小麥根系。然而,基于目前小麥的TWAS流程現(xiàn)狀,這個結(jié)果存在一定的偶然性,尚需該領(lǐng)域的專家學(xué)者利用這套數(shù)據(jù)做更好的評估與開發(fā)。
2022年Nature發(fā)表了16份小麥的全基因組的序列,為小麥泛基因組正式拉開了序幕[26],結(jié)合此前遺傳所魯非的414份小麥的外顯子測序[27],農(nóng)科院張學(xué)勇的145份小麥測序[28],以及西農(nóng)姜雨的93份小麥基因組測序[29],進一步推進了小麥的泛基因組研究。泛基因組指的是同一物種的全部基因包括核心基因組與可變基因組,泛基因組可通過將測序個體與參考基因組比對,獲得完整的群體變異情況,很好地解決了傳統(tǒng)基因組學(xué)研究中,參考基因組不能完全覆蓋小麥的全部遺傳信息的問題,同時泛基因組是研究不同小麥品種的外源基因滲入、染色體片段的插入易位與重組等信息,以及挖掘小麥稀有單倍型的重要基礎(chǔ),也將是未來小麥基因發(fā)掘的重要研究方向。
本項目中的轉(zhuǎn)錄組包含406份小麥根系轉(zhuǎn)錄組信息,得到了不同品種間的SNP,首先鑒定到的39 243個根系表達的基因是在國際小麥基因組測序聯(lián)盟(IWGSC)的低可信基因庫中(iwgsc_refseqv1.1_genes_2017July06),為這部分基因提供了表達的證據(jù),為研究人員選擇基因提供了可選的參考。這些獲得的全部集合可以作為小麥苗期根系的泛轉(zhuǎn)錄組,盡管不能涵蓋小麥的基因組,但其中的外源基因深入、易位與插入等信息可為當前的泛基因組提供重要的補充??梢宰鳛楦捣恨D(zhuǎn)錄組與小麥泛基因組新的切入點。
經(jīng)過5 a多的基因型與表型的調(diào)查與評估,目前這個包含406份小麥材料的群體展現(xiàn)出可靠與穩(wěn)健地結(jié)果輸出能力,可以用于小麥研究的多個方面。旱區(qū)逆境作物生物學(xué)重點實驗室與課題組希望通過分享該數(shù)據(jù)庫,為國內(nèi)小麥同行提供更多的研究選擇,共同推進國內(nèi)小麥基礎(chǔ)與育種研究。同時,在利用的同時希望進一步提升與拓展該群體的質(zhì)量與應(yīng)用范圍,以期成為廣大小麥工作者的一個可靠支撐,因此也歡迎廣大同行在使用時,不斷提出存在問題與改進建議,共同做好這份數(shù)據(jù)的持續(xù)性升級與利用。
致謝:感謝所有作者在種質(zhì)收集、種質(zhì)篩選與種質(zhì)劃分,以及表型調(diào)查中的支持與建議。感謝四川農(nóng)業(yè)大學(xué)陳國躍與蒲至恩老師表型調(diào)查中的支持。
參考文獻 Reference:
[1] APPELS R,EVERSOLE K,STEIN N,et al.Shifting the limits in wheat research and breeding using a fully annotated reference genome [J].Science,2018,361:7191.
[2]OTTO S P,GERSTEIN A C.The evolution of haploidy and diploidy [J].Current Biology,2008,18(24):1121-1124.
[3]IWGSC.Shifting the limits in wheat research and breedingusing a fully annotated reference genome [J].Science,2018,361(6403):7191.
[4]WILKINSON P A,ALLEN A M,TYRRELL S,et al.CerealsDB-new tools for the analysis of the wheat genome:update 2020 [J/OL].Database,2020.01.01.
[5]WANG J R,F(xiàn)U W W,WANG R,et al.WGVD:an integrated web-database for wheat genome variation and selective signatures[J/OL].Database,2020.01.01.
[6]SINGH K,BATRA R,SHARMA S,et al.WheatQTLdb:a QTL database for wheat [J].Molecular Genetics And Genomic,2021,296(5):1051-6.
[7]CHEN Y,SONG W,XIE X,et al.A collinearity-incorporating? homology? inference strategy for connecting? emerging? assemblies in the triticeae tribe as a? pilot? practice in the? plant? pangenomic? era [J].Molecular Plant,2020, 13(12):1694-708.
[8]WANG W,WANG Z,LI X,et al.SnpHub:an easy-to-set-up web server framework for exploring large-scale genomic variation data in the post-genomic era with applications in wheat [J].Gigascience,2020,9(6):1-8.
[9]PEARCE S,VAZQUEZ-GROSS H,HERIN S Y,et al.WheatExp:an RNA-seq expression database for polyploid wheat [J].BMC Plant Biology,2015,15:299.
[10] COOPER L,MEIER A,LAPORTE M A,et al.The Planteome database:an integrated resource for reference ontologies,plant genomics and phenomics [J].Nucleic Acids Research,2018,46(D1):1168-1180.
[11]AREND D,JUNKER A,SCHOLZ U,et al.PGP repository:a plant phenomics and genomics data publication infrastructure[J/OL].Database,2016.04.17.
[12]COLMSEE C,MASCHER M,CZAUDERNA T,et al.OPTIMAS-DW:a comprehensive transcriptomics,metabolomics,ionomics,proteomics and phenomics data resource for maize[J].BMC Plant Biology,2012,12:245.
[13]JAYAKODI M,SELVAN G,NATESAN S,et al.A web accessible resource for investigating cassava phenomics and genomics information:BIOGEN BASE [J].Bioinformation,2011,6(10):391-392.
[14]王璟璐,張 穎,潘曉迪,等.作物表型組數(shù)據(jù)庫研究進展及展望 [J].中國農(nóng)業(yè)信息,2018,30(5):13-23.
WANG J L,ZHANG Y,PAN X D,et al.Research progress and prospect on cropphenomics database[J].China Agricultural Informatics,2018,30(5):13-23
[15]FAN X,CUI F,ZHAO C,et al.QTLs for flag leaf size and their influence on yield-related traits in wheat (Triticum aestivum L.)[J].Molecular Breeding,2015,35:1-16.
[16]WANG X,ZHAO P,GUO X,et al.Population Transcriptome and Phenotype Reveal that the Rht-D1b Contribute a Larger Seedling Roots to Modern Wheat Cultivars [J].BioRxiv,2022.Doi:https://doi.org/10.1101/2022.06.02.494553.
[17]LIU Z,ZHAO P,LAI X,et al.The selection and application of peduncle length QTL QPL_6D.1 in modern wheat (Triticum aestivum L.) breeding [J].Theoretical and Applied Genetics,2022,136(3):32.
[18]LIU Z,HU Z,LAI X,et al.Multi-environmental population phenotyping suggests the higher risk of wheat Rht-B1b and Rht-D1b cultivars in global warming scenarios? [J/OL].BioRxiv,2022.07.18.
[19]CHEN S,LIU F,WU W,et al.A SNP-based GWAS and functional haplotype-based GWAS of flag leaf-related traits and their influence on the yield of bread wheat (Triticum aestivum L.) [J].Theoretical and Applied Genetics,2021,134(12):3895-3909.
[20]YANO K,MORINAKA Y,WANG F,et al.GWAS with principal component analysis identifies a gene comprehensively controlling rice architecture [J].Proceedings of The National Academy of Sciences of The United States of America,2019,116(42):21262-21267.
[21]RIEDELSHEIMER C,LISEC J,CZEDIK-EYSENBERG A,et al.Genome-wide association mapping of leaf metabolic profiles for dissecting complex traits in maize [J].Proceedings of The National Academy of Sciences of The United States of America,2012,109(23):8872-8877.
[22]蘇麗娜.玉米苞葉表型可塑性的GWAS分析 [D].沈陽:沈陽農(nóng)業(yè)大學(xué),2019.
SU L N.GWAS analysis of phenotypic plasticity of maize bracts [D].Shenyang:Shenyang Agricultural University,2019.
[23]WU J,YU R,WANG H,et al.A large-scale genomic association analysis identifies the candidate causal genes conferring stripe rust resistance under multiple field environments [J].Plant Biotechnology Journal,2021,19(1):177-191.
[24]LOU H,ZHANG R,LIU Y,et al.Genome-wide association study of six quality-related traits in common wheat (Triticum aestivum L.) under two sowing conditions [J].Theoretical and Applied Genetics,2021,134(1):399-418.
[25]YANO K,YAMAMOTO E,AYA K,et al.Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice [J].Nature Genetics,2016,48(8):927-934.
[26]WALKOWIAK S,GAO L,MONAT C,et al.Multiple wheat genomes reveal global variation in modern breeding [J].Nature,2020,588(7837):277-283.
[27]ZHOU Y,ZHAO X,LI Y,et al.Triticum population sequencing provides insights into wheat adaptation [J].Nature Genetics,2020,52(12):1412-1422.
[28]HAO C,JIAO C,HOU J,et al.Resequencing of 145 landmark cultivars reveals? asymmetric? sub-genome? selection and? strong? founder? genotype effects on? wheat? breeding in China [J].Molecular Plant,2020,13(12):1733-1751.
[29]CHENG H,LIU J,WEN J,et al.Frequent intra- and inter-species introgression shapes the landscape of genetic variation in bread wheat [J].Genome Biology,2019, 20(1):136.
Construction and Application of Wheat Multiomics Database at Northwest A&F University
LU Tian1,2,LIU Zihui1,2,ZHAO Peng1,2,QIU Sichun1,2,WANG Xiaoming1,2,
ZHENG Weijun1,2,HAN? Dejun1,2,MAO Hude1,2,SONG Weining1,2,
CHEN Xinhong1,2,XI Yajun1,2,WANG Zhonghua1,2,JI Wanquan1,2,KANG Zhensheng2,3 and? XU Shengbao1,2
(1.College of Agronomy(Academy of Agricultural Sciences),Northwest A&F university,Yangling Shaanxi 712100,China;
2.State Key Laboratory of Crop Stress Biology for Arid Areas,Northwest A&F University,Yangling Shaanxi 712100,China;
3.College of Plant Protection,Northwest A&F University,Yangling Shaanxi 712100,China)
Abstract Based on the analysis of large scale root system? transcriptome. 406 wheat genotype data with global genetic diversity were collected. The investigation encompassed 18 agronomic traits across in 10 planting environments. A reliable wheat multi-omics database was created by integrating genotype,transcriptome,phenotype,and meteorological data of planting environments,accessible at https://iwheat.net/resource. The database facilitates functional gene exploration and mechanism research in wheat.
Key words Wheat; Multi-omics; Database; Genotype; Phenotype
Received? 2023-01-08??? Returned 2023-04-26
Foundation item Regulation of? TaGSK on Lateral Root Development in Wheat (No.CSBAA202210).
First author LU Tian,female,master student.Research area:molecular design breeding for wheat stress resistance.E-mail:Lut17@nwafu.edu.cn
Corresponding?? author XU Shengbao,male,professor,doctoral supervisor.Research area:molecular mechanism of heat resistance in wheat. E-mail: xushb@nwsuaf.edu.cn
(責任編輯:成 敏 Responsible editor:CHENG? Min)