潘佳穎
(東北農(nóng)業(yè)大學(xué),黑龍江 哈爾濱 150030)
植物育種核心物質(zhì)基礎(chǔ)是控制農(nóng)藝性狀遺傳變異,如何從廣泛種質(zhì)資源中利用優(yōu)異遺傳變異是植物育種研究的重要課題?,F(xiàn)代基因組學(xué)技術(shù)發(fā)展是植物功能基因組學(xué)研究的核心動力,高質(zhì)量參考基因組為遺傳變異發(fā)掘提供統(tǒng)一標(biāo)準(zhǔn)框架。最高通量基因組學(xué),轉(zhuǎn)錄組測序等技術(shù)為遺傳變異發(fā)掘提供高效技術(shù)手段。隨著對多樣性植物資源研究,單一參基因組不能代表資源所有遺傳變異,對多樣性資源基因組研究易出現(xiàn)錯(cuò)誤,難以有效鑒定基因中結(jié)構(gòu)變異。拷貝數(shù)變異等結(jié)構(gòu)變異在作物品種間普遍存在,基因組結(jié)構(gòu)變異導(dǎo)致物種個(gè)體間基因結(jié)構(gòu)等發(fā)生實(shí)質(zhì)性變化。為完整描述群體遺傳變異,科學(xué)家提出泛基因組概念,為功能基因組學(xué)研究提供參考框架。植物泛基因組研究成為植物基因組學(xué)研究熱點(diǎn)。
泛基因組概念源于微生物基因組學(xué)研究,通過研究細(xì)菌基因組發(fā)現(xiàn)不同菌株存在大量基因缺失變異,Tetelin 等首次提出泛基因組概念,迅速用于動植物等生物基因組學(xué)研究中。目前構(gòu)建包括大豆等20 多種真核生物泛基因組。泛基因組功能型定義以功能為核心研究對象,指群體所有功能基因總和。通過泛基因組研究群體功能基因分布,呈現(xiàn)群體功能基因,可以從基因拓展至基因家族。
結(jié)構(gòu)性定義為對群體基因組序列比較分析,微生物組研究以基因?yàn)楹诵姆夯蚪M定義應(yīng)用較多,序列為基礎(chǔ)泛基因組定義適合真核生物研究。泛基因組包括核心與非必需基因組,核心基因組指存在所有個(gè)體基因,核心基因組基因包括維持物種存活所需基本生理功能基因,如維持DNA 復(fù)制等功能[1];非必需基因包含群體全部可變基因,很多物種存在大量非必需基因組,擁有本文少的外顯,如非必需基因非同義比例高于核心基因組,大部分非必需基因組與微生物多樣性有關(guān),基因功能主要富集于生物脅迫、植物發(fā)育等生物學(xué)功能。
基因組學(xué)是20 世紀(jì)90 年代興趣的研究領(lǐng)域,功能基因組是利用結(jié)構(gòu)基因組學(xué)提供信息,通過基因全面分析功能,使生物學(xué)研究轉(zhuǎn)向?qū)Χ鄠€(gè)基因系統(tǒng)研究。泛基因組最早應(yīng)用于轉(zhuǎn)座子研究,目前超過16 個(gè)植物物種建立泛基因組,包括小麥等重要農(nóng)作物。植物群體中非必需基因數(shù)量龐大,如油菜泛基因組中38%為非必需。木豆泛基因組組裝1900 多個(gè)參考基因組不存在新基因,功能富集于生物學(xué)功能中。非必需基因是控制植物重要農(nóng)藝性狀的功能基因,有利于功能基因鑒定。
目前泛基因組以新測序數(shù)據(jù)為基礎(chǔ)進(jìn)行組裝構(gòu)建。策略分為對所有材料進(jìn)行基因從頭組裝;以已有參考基因組為基礎(chǔ),通過對比—組裝迭代進(jìn)行構(gòu)建;基于變異圖組裝。不同組裝策略具有不同優(yōu)缺點(diǎn),植物泛基因組構(gòu)建面臨挑戰(zhàn)是結(jié)構(gòu)變異序列正確組裝。對每個(gè)材料進(jìn)行基因組從頭組裝方法,可以解決重復(fù)序列組裝問題,有利于結(jié)構(gòu)變異發(fā)掘鑒定。缺點(diǎn)是基因組從頭組裝費(fèi)用高,難以大規(guī)模實(shí)施[2],不能解決大結(jié)構(gòu)變異解析問題。
以參考基因組為基礎(chǔ)迭代組裝策略,對不能比對測序數(shù)據(jù)組裝,如不能采用迭代法,可以運(yùn)用類似宏基因組組裝策略,組裝得到泛基因組,實(shí)現(xiàn)基因PAV 分析。策略優(yōu)點(diǎn)是技術(shù)相對簡單,缺點(diǎn)是難以解決重復(fù)序列組裝,不能很好地對大結(jié)構(gòu)變異解析?;趫D論組裝法把基因組分為若干部分,可以通過變異圖譜進(jìn)行分析。泛基因組圖提供新的概念,應(yīng)用理論技術(shù)尚不成熟。相對線性基因組概念,泛基因組圖適用于變異數(shù)據(jù)組織,具有廣闊應(yīng)用前景。目前多數(shù)植物泛基因組構(gòu)建基于二代測序技術(shù)組裝,應(yīng)用基于參考基因組策略難以解決重復(fù)序列造成組裝錯(cuò)誤[3]。碎片化問題影響在結(jié)構(gòu)變異鑒定中的應(yīng)用效果。
PacBiO 等長讀長基于單分子測序三代測序技術(shù)得到廣泛應(yīng)用,三代測序具有長讀長優(yōu)點(diǎn),可以解決序列組裝問題。在光學(xué)圖譜等技術(shù)下實(shí)現(xiàn)高質(zhì)量基因組組裝,可以組裝質(zhì)量更好的泛基因組?;谌鷾y序進(jìn)行泛基因組組裝法成功用于大豆等植物范基因組構(gòu)建中,組裝策略選擇是泛基因組組裝重要問題。從頭組裝策略費(fèi)用較高,導(dǎo)致構(gòu)建泛基因組多樣性不足等問題。迭代組裝利用二代測序數(shù)據(jù)組裝,可通過分析個(gè)體提高泛基因組多樣性。但泛基因組完整性較低,選擇群體中少數(shù)代表性材料從頭組裝,結(jié)合大規(guī)模多樣性材料二代測序數(shù)據(jù)對比,是構(gòu)建高質(zhì)量泛基因組的可行策略。
植物進(jìn)化是植物基因組學(xué)研究的重點(diǎn),解析植物進(jìn)化基因組結(jié)構(gòu)變異,有助于為植物育種提供線索。泛基因組結(jié)構(gòu)變異捕獲具有獨(dú)特優(yōu)勢,可以為植物進(jìn)化提供寬泛基礎(chǔ)數(shù)據(jù)。如大豆種皮顏色為馴化重要性狀,由于查爾酮合成酶基因結(jié)構(gòu)變異導(dǎo)致野生大豆黑皮演變?yōu)辄S皮。研究通過大豆野生資源構(gòu)建泛基因組發(fā)現(xiàn)基因結(jié)構(gòu)變異,分析泛基因組單倍體型剖析大豆種皮顏色馴化歷史。
Sariel 等構(gòu)件向日葵泛基因組,通過泛基因組進(jìn)行同源基因比較分析,印證現(xiàn)代向日葵品種抗病性改良基因來源。利用控制主要農(nóng)藝性狀是植物遺傳改良的基礎(chǔ),常規(guī)方法通過比較典型材料基因組結(jié)構(gòu),新測序技術(shù)為遺傳變異分析提供高效技術(shù)手段,目前多以單一參考基因組為基礎(chǔ),不適用于基因組結(jié)構(gòu)變異引起表型遺傳分析。泛基因組可通過完整捕獲群體全部遺傳變異,提供完整的基因組參考消息。為GWAS 等技術(shù)應(yīng)用遺傳變異分析提供數(shù)據(jù)。泛基因組矯正單一參考基因組分析導(dǎo)致偏差,多樣性測序數(shù)據(jù)對比單一參考基因組出現(xiàn)系統(tǒng)性偏差,參考基因組缺失序列讀序數(shù)被丟棄。由于泛基因組包絡(luò)群體完整基因組多樣性,避免高度多態(tài)性讀數(shù)丟失問題。
目前開發(fā)多個(gè)新測序數(shù)據(jù)對比方法,基于范基因組測序數(shù)據(jù)分析成為基因組學(xué)研究重要方法。泛基因組可以提高GWAS 準(zhǔn)確向,GWAS 分析參考基因組不存在功能基因表型,出席縣實(shí)際功能基因偏差較大情況,如GWAS 鑒定玉米米抗甘蔗花葉病毒功能基建營,以B73 參考引資加納定SPN 關(guān)聯(lián)分析檢測功能相差8.5Mb,泛基因組以結(jié)構(gòu)變異與SNP 為基因型數(shù)據(jù),解決單一參考組導(dǎo)致GWAS 結(jié)果偏差問題。非必須基因組與很多農(nóng)藝性狀關(guān)聯(lián),通過泛基因組分析非必需基因,對鑒定抗功能性基因應(yīng)用具有重要價(jià)值。
功能基因組學(xué)研究是利用結(jié)構(gòu)基因組學(xué)提供信息,使生物學(xué)研究轉(zhuǎn)向?qū)Χ鄠€(gè)基因同時(shí)系統(tǒng)研究。主要采用比較基因序列方法,植物功能基因組是植物后代基因研究核心內(nèi)容,特點(diǎn)是采用高通量實(shí)驗(yàn)方法進(jìn)行研究。目前功能基因組學(xué)研究包括高通量遺傳轉(zhuǎn)化鑒定系統(tǒng)、獲得DNA 芯片基因轉(zhuǎn)錄圖譜等。人們建立系列有效的技術(shù)方法對功能基因組學(xué)深入研究,包括表達(dá)序列標(biāo)簽、插入突變等。
基因表達(dá)分析系列是快速研究基因表達(dá)的新技術(shù),鑒定基因組中95%的基因,通常為9~10bp 寡核苷酸序列,通過連接酶將多個(gè)標(biāo)簽隨機(jī)串聯(lián),可以顯示各SAGE 標(biāo)簽代表基因特定組織表達(dá),可保留基因表達(dá)數(shù)據(jù),研究細(xì)胞轉(zhuǎn)錄變化引起生物現(xiàn)象。日本科學(xué)家Matsumura 等人首次利用SAGE 技術(shù)研究高等植物全基因表達(dá)定量,F(xiàn)izames 等人用SAGE 技術(shù)分析擬南芥根基劃分基因表達(dá),通過獲得SAGE 標(biāo)簽與已知基因?qū)Ρ确治?,通過對不同狀態(tài)下表達(dá)圖譜比較發(fā)現(xiàn)基因表達(dá)差異。
現(xiàn)有轉(zhuǎn)基因食品分析檢測技術(shù)適用范圍不同,需要進(jìn)行相關(guān)分析檢測技術(shù)研究。研究對異源四倍體野生花生進(jìn)行基因組組裝,對基因組進(jìn)行區(qū)分得到亞基因組。異源四倍體植物具有兩個(gè)亞基因組,Bertioli 等發(fā)現(xiàn)基因組與栽培花生AB 基因組序列相近,可以對鑒定抗病基因等問題提供幫助,為選育適應(yīng)性強(qiáng)花生品種奠定基礎(chǔ),對花生樹進(jìn)化提供科學(xué)參考價(jià)值。
目前泛基因組領(lǐng)域需要解決更好地把最新測序技術(shù)及數(shù)據(jù)技術(shù)用于泛基因組組裝,構(gòu)建高質(zhì)量泛基因組等問題。泛基因組組裝廣泛應(yīng)用三代測序技術(shù),解決大規(guī)模群體稀有遺傳變異捕獲問題需要開發(fā)相應(yīng)技術(shù)流程。人工智能技術(shù)在泛基因組組裝應(yīng)用,有助于解決組裝功能研究的挑戰(zhàn)。如何更好地解析泛基因組變異數(shù)據(jù)是應(yīng)用研究面臨的挑戰(zhàn)。
泛基因組應(yīng)用研究核心是構(gòu)建合適的數(shù)據(jù)框架,通過泛基因組呈現(xiàn)群體內(nèi)結(jié)構(gòu)變異?;趫D論泛基因組數(shù)據(jù)結(jié)構(gòu)化是目前研究熱點(diǎn)。大豆泛基因組構(gòu)建利用相關(guān)技術(shù)構(gòu)建基于圖泛基因組,目前相應(yīng)技術(shù)算法不成熟,利用泛基因組圖用于生物信息學(xué)分析,需要復(fù)雜的計(jì)算,開發(fā)完整的泛基因組數(shù)據(jù)分析流程,是未來泛基因組應(yīng)用研究重點(diǎn)。隨著基因組學(xué)技術(shù)的發(fā)展,單一參考基因組不能適應(yīng)現(xiàn)代功能基因?qū)W研究需要,泛基因組可以為功能基因組學(xué)研究提供基礎(chǔ)變異數(shù)據(jù),構(gòu)建泛基因組推動功能基因組學(xué)研究發(fā)展。
目前植物功能基因組學(xué)研究取得一定進(jìn)展,反向遺傳學(xué)處于大量突變?nèi)后w建立初級階段。林木功能基因組研究主要研究對林木響應(yīng)逆境脅迫研究較少,林木功能基因組學(xué)研究需要開展廣泛國際合作。隨著水稻基因組研究深入,可提供植物基因序列信息、基因功能信息等更多,為植物分子改良提供有效的技術(shù)支撐。