亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        植物及煙草表型組學(xué)大數(shù)據(jù)研究進(jìn)展

        2021-03-24 05:28:24金靜靜曹培健許亞龍李澤鋒
        煙草科技 2021年3期
        關(guān)鍵詞:高通量組學(xué)表型

        盧 鵬,金靜靜,曹培健,許亞龍,李澤鋒

        中國(guó)煙草總公司鄭州煙草研究院,鄭州高新技術(shù)產(chǎn)業(yè)開(kāi)發(fā)區(qū)楓楊街2 號(hào) 450001

        近年來(lái),隨著高通量植物表型數(shù)據(jù)獲取技術(shù)的廣泛應(yīng)用和植物表型數(shù)據(jù)的快速積累,逐步形成了以植物表型組學(xué)數(shù)據(jù)為基礎(chǔ)、以多學(xué)科交叉分析技術(shù)為手段的大數(shù)據(jù)體系,并在植物表型大數(shù)據(jù)的數(shù)據(jù)獲取、數(shù)據(jù)存儲(chǔ)管理以及數(shù)據(jù)分析應(yīng)用等方面取得了較快的研究進(jìn)展,利用表型大數(shù)據(jù)開(kāi)展植物育種尤其是為作物進(jìn)行智能輔助育種已逐漸成為研究熱點(diǎn)。為及時(shí)了解植物表型大數(shù)據(jù)相關(guān)技術(shù)的發(fā)展,跟蹤植物表型大數(shù)據(jù)的研究前沿與熱點(diǎn),回顧了植物表型組學(xué)的相關(guān)概念,并對(duì)植物表型組學(xué)大數(shù)據(jù)的研究進(jìn)展,尤其是對(duì)其在育種方面的應(yīng)用進(jìn)行了梳理,同時(shí)關(guān)注了煙草表型大數(shù)據(jù)的產(chǎn)生和發(fā)展過(guò)程,并對(duì)該領(lǐng)域今后的發(fā)展作了展望。

        1 植物表型組學(xué)大數(shù)據(jù)發(fā)展概況

        在植物學(xué)和遺傳學(xué)研究領(lǐng)域,特別是在作物育種領(lǐng)域,表型(Phenotype)是一個(gè)使用非常廣泛的術(shù)語(yǔ),該術(shù)語(yǔ)來(lái)源于希臘詞語(yǔ)Phainein 和Typos的組合。在1911 年“表型”這一術(shù)語(yǔ)被Johannsen首次定義為“可通過(guò)直接觀察或精細(xì)測(cè)量進(jìn)行描述區(qū)分的生物屬性”[1]。表型組(Phenome)則在1949 年被Davis 首次定義為“細(xì)胞中所有非遺傳性、非自復(fù)制部分的總和,是所有表型的集合”[2]。20 世紀(jì)90 年代,人類基因組、轉(zhuǎn)錄組以及遺傳疾病關(guān)聯(lián)分析等各類研究的開(kāi)展促進(jìn)了相關(guān)理論的不斷發(fā)展,1997 年,Schork 等[3]首次在疾病研究中提出了表型組學(xué)概念。此后,隨著表型組學(xué)研究的不斷深入和發(fā)展,表型組學(xué)的定義也在不斷地完善。2010 年,Houle 等[4]定義表型組學(xué)為“在整個(gè)組織范圍內(nèi)獲取多維表型數(shù)據(jù)”。2013年,F(xiàn)iorani 等[5]提出將植物表型組學(xué)定義為“作為一套方法學(xué),在不同尺度上精確測(cè)量植物的生長(zhǎng)、結(jié)構(gòu)和組成”。現(xiàn)在植物表型組學(xué)更傾向于被定義為“在植物發(fā)育過(guò)程中,對(duì)整個(gè)生物體進(jìn)行高通量數(shù)據(jù)準(zhǔn)確采集和多維表型分析的多學(xué)科研究”[6]。表型組學(xué)自20 世紀(jì)90 年代被提出,經(jīng)歷多年的研究和發(fā)展,現(xiàn)已逐漸成為生命科學(xué)領(lǐng)域的一個(gè)重要分支。

        系統(tǒng)的植物表型組學(xué)研究正式開(kāi)始于20 世紀(jì)末,主要收集質(zhì)量較高、可重復(fù)獲取的植物表型數(shù)據(jù),在該數(shù)據(jù)的基礎(chǔ)上分析基因型和環(huán)境因素的互作效應(yīng),研究該數(shù)據(jù)對(duì)產(chǎn)量、質(zhì)量和抗性等主要植物性狀的影響[7]。進(jìn)入21 世紀(jì)以后,隨著下一代測(cè)序技術(shù)的廣泛應(yīng)用和基因組學(xué)研究的不斷深入,表型組學(xué)的理論基礎(chǔ)和研究方法也得到了快速的發(fā)展[8]。2011 年,澳大利亞植物學(xué)家Furbank等[9]指出,高通量表型數(shù)據(jù)采集技術(shù)在田間的應(yīng)用、全球表型組學(xué)信息數(shù)據(jù)庫(kù)的元數(shù)據(jù)標(biāo)準(zhǔn)化缺失、植物非生物脅迫的高通量表型數(shù)據(jù)分析等問(wèn)題已經(jīng)成為植物表型組學(xué)研究的瓶頸。為有效解決這些問(wèn)題,打破植物表型研究的發(fā)展瓶頸,大量?jī)?yōu)秀的商業(yè)機(jī)構(gòu)和科研機(jī)構(gòu)進(jìn)行了相關(guān)技術(shù)的開(kāi)發(fā),促進(jìn)了高通量、高精度表型數(shù)據(jù)采集工具的快速發(fā)展。隨著表型獲取技術(shù)精度的不斷提升、通量的不斷提高、成本的逐漸降低,越來(lái)越多的植物進(jìn)行了高精度高通量的表型數(shù)據(jù)獲取,如擬南芥[10]、大麥[11]、玉米[12]等。

        科學(xué)大數(shù)據(jù)的形成依賴于海量數(shù)據(jù)的獲取和積累,隨著各類高通量表型數(shù)據(jù)采集設(shè)備的使用,植物表型數(shù)據(jù)量也呈現(xiàn)出快速增長(zhǎng)的態(tài)勢(shì)。隨著數(shù)據(jù)體量不斷增大,各類植物表型數(shù)據(jù)庫(kù)和相關(guān)數(shù)據(jù)管理分析平臺(tái)紛紛建立,期間多種學(xué)科領(lǐng)域數(shù)據(jù)分析和挖掘技術(shù)也開(kāi)始研發(fā)與應(yīng)用,逐漸形成了數(shù)據(jù)體量大、增長(zhǎng)速度快、多學(xué)科技術(shù)交叉、數(shù)據(jù)多樣的植物表型組學(xué)大數(shù)據(jù)體系,該體系涵蓋了從植物細(xì)胞到植物群體的多個(gè)尺度、多種生長(zhǎng)環(huán)境下植物性狀的遺傳與變異,以及植物對(duì)生物和非生物脅迫的響應(yīng)等各類信息[13]。

        2 植物表型組學(xué)大數(shù)據(jù)研究進(jìn)展

        植物表型組學(xué)大數(shù)據(jù)的研究主要集中在大數(shù)據(jù)的獲取、存儲(chǔ)管理、分析和應(yīng)用4 個(gè)方面。其中數(shù)據(jù)獲取主要是利用各類成像技術(shù)、設(shè)備平臺(tái)獲取表型數(shù)據(jù);數(shù)據(jù)存儲(chǔ)管理是將數(shù)以Tb 計(jì)的表型數(shù)據(jù)進(jìn)行存儲(chǔ)、管理,以便進(jìn)行后續(xù)的數(shù)據(jù)檢索、分析和應(yīng)用;數(shù)據(jù)分析是通過(guò)各種技術(shù)手段分析表型數(shù)據(jù),以獲得可用的生物學(xué)、農(nóng)學(xué)知識(shí);數(shù)據(jù)應(yīng)用主要集中在育種方面,包括鑒定各類候選基因和分子標(biāo)記,將表型組數(shù)據(jù)與其他組學(xué)數(shù)據(jù)整合,建立各類育種輔助模型等。

        2.1 植物表型數(shù)據(jù)的獲取

        植物表型數(shù)據(jù)的獲取是指利用包括多光譜成像、高光譜成像、紅外成像、光合熒光成像、CT 掃描和MRI 掃描等技術(shù)在內(nèi)的數(shù)據(jù)采集設(shè)備,從細(xì)胞、器官、植株、群體等不同尺度對(duì)表型數(shù)據(jù)進(jìn)行獲取的過(guò)程。數(shù)據(jù)采集設(shè)備所搭載的平臺(tái)涵蓋了從室內(nèi)到大田,從便攜式表型采集設(shè)備到各類型航空飛行器等多個(gè)層面。利用這些方法進(jìn)行數(shù)據(jù)采集的植物主要包括:擬南芥[10]、大麥[11]、玉米[12]、小麥[14]、大豆[15]、水稻[16]等。表1 列舉了高通量植物表型數(shù)據(jù)獲取的平臺(tái)、支持的采集技術(shù)、應(yīng)用場(chǎng)景以及優(yōu)缺點(diǎn)等信息。

        目前,植物表型數(shù)據(jù)獲取的研究熱點(diǎn)仍然集中于開(kāi)發(fā)高通量、高精度、應(yīng)用場(chǎng)景廣泛、使用成本低的大型平臺(tái),此類平臺(tái)主要包括能夠應(yīng)用于溫室內(nèi)和田間的傳送帶式和軌道式兩種。田間和溫室傳送帶主要針對(duì)能夠在傳送帶上培養(yǎng)的盆栽植物,通過(guò)動(dòng)力傳送至成像區(qū)域進(jìn)行成像,分別以澳大利亞植物表型加速器和德國(guó)尤利希植物表型研究中心溫室表型系統(tǒng)為代表。田間和溫室的軌道式平臺(tái)用于固定區(qū)域內(nèi)植株群體性狀的采集,應(yīng)用較為廣泛的主要有德國(guó)LemnaTec 公司的Field Scanalyzer 采集平臺(tái),主要用于檢測(cè)可控環(huán)境中的植物形態(tài)特征,可進(jìn)行高通量植物表型成像分析測(cè)量、植物脅迫響應(yīng)成像分析測(cè)量、植物生長(zhǎng)分析測(cè)量、性狀識(shí)別及植物生理生態(tài)分析研究等[27]。

        我國(guó)在大型表型數(shù)據(jù)采集平臺(tái)方面的自主研發(fā)起步相對(duì)較晚,開(kāi)發(fā)出的表型平臺(tái)主要針對(duì)單一植物或者固定性狀進(jìn)行采集,整體平臺(tái)研發(fā)水平與國(guó)際先進(jìn)水平仍有一定差距。國(guó)內(nèi)使用較為廣泛的自主研發(fā)平臺(tái)主要有2014 年華中農(nóng)業(yè)大學(xué)和華中科技大學(xué)聯(lián)合研制的全生育期高通量水稻表型數(shù)據(jù)測(cè)量平臺(tái),用于自動(dòng)采集水稻株高、葉面積、分蘗數(shù)、生物量、產(chǎn)量等15 個(gè)參數(shù)的數(shù)據(jù)[30],以及2017 年中國(guó)科學(xué)院遺傳與發(fā)育生物學(xué)研究所研制的植物表型組學(xué)研究平臺(tái)PPAP[31]。

        表1 高通量植物表型數(shù)據(jù)采集平臺(tái)Tab.1 High-throughput plant phenotypic data collection platforms

        2.2 植物表型數(shù)據(jù)的存儲(chǔ)管理

        高通量植物表型數(shù)據(jù)主要分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)兩大類,結(jié)構(gòu)化數(shù)據(jù)主要是指?jìng)鹘y(tǒng)農(nóng)藝性狀、植物抗病抗逆信息、品質(zhì)性狀等數(shù)值型和字符型數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)主要來(lái)源于各類圖像、光譜、文件等。根據(jù)表型數(shù)據(jù)的特點(diǎn),在進(jìn)行數(shù)據(jù)存儲(chǔ)利用之前,會(huì)依據(jù)最小信息、本體術(shù)語(yǔ)和數(shù)據(jù)格式等3 個(gè)原則對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,之后通過(guò)文件服務(wù)器存儲(chǔ)數(shù)據(jù)、數(shù)據(jù)庫(kù)系統(tǒng)發(fā)布數(shù)據(jù)和提供服務(wù)的方式對(duì)表型數(shù)據(jù)進(jìn)行存儲(chǔ)管理。

        目前單一的植物表型組學(xué)數(shù)據(jù)庫(kù)較少,大部分?jǐn)?shù)據(jù)庫(kù)都涵蓋了包括基因組數(shù)據(jù)在內(nèi)的多個(gè)組學(xué)的數(shù)據(jù)。表2 匯總了2015 年以來(lái)具有代表性的植物及煙草表型組學(xué)數(shù)據(jù)平臺(tái),包括平臺(tái)的簡(jiǎn)單介紹、數(shù)據(jù)內(nèi)容和發(fā)布年份等信息。

        應(yīng)用較為廣泛且影響力較大的綜合類表型數(shù)據(jù)有Planteome 數(shù)據(jù)庫(kù)和PGP 知識(shí)庫(kù)。Planteome數(shù)據(jù)庫(kù)采用本體術(shù)語(yǔ)(Ontology Terms)作為表型數(shù)據(jù)的唯一和可重復(fù)性注釋,本體術(shù)語(yǔ)主要包括植物本體、植物性狀本體、植物實(shí)驗(yàn)條件本體、表型和屬性本體等。數(shù)據(jù)庫(kù)提供了95 個(gè)植物分類群的表型數(shù)據(jù),主要包括植物表型、植物性狀、基因功能和表達(dá)數(shù)據(jù)及其本體術(shù)語(yǔ)注釋等,憑借著其較為全面的數(shù)據(jù)和標(biāo)準(zhǔn)的作物本體,其對(duì)性狀和表型評(píng)分的標(biāo)準(zhǔn)已經(jīng)被多個(gè)國(guó)際作物育種項(xiàng)目采用[34]。PGP 知識(shí)庫(kù)是一個(gè)用于存儲(chǔ)、分享植物基因組學(xué)和表型組學(xué)研究數(shù)據(jù)的平臺(tái),數(shù)據(jù)庫(kù)擁有21 157 個(gè)數(shù)據(jù)實(shí)體,主要包括來(lái)自高通量植物表型的數(shù)據(jù)圖像、未完成的基因型數(shù)據(jù)、用于可視化的形態(tài)植物模型數(shù)據(jù)、質(zhì)譜數(shù)據(jù)以及各類軟件文檔等未正式發(fā)布的跨域?qū)嶒?yàn)數(shù)據(jù)集,并提供所有數(shù)據(jù)的發(fā)布和下載功能[38]。

        表2 植物表型組學(xué)數(shù)據(jù)平臺(tái)Tab.2 Plant phenomics data platforms

        2.3 植物表型數(shù)據(jù)的分析

        高通量采集設(shè)備獲取的表型數(shù)據(jù)中大部分是非結(jié)構(gòu)化數(shù)據(jù)。植物表型分析和研究主要是通過(guò)計(jì)算機(jī)科學(xué)技術(shù)進(jìn)行分析,例如視覺(jué)算法、深度學(xué)習(xí)、數(shù)字圖像處理、數(shù)據(jù)挖掘等技術(shù),提取出數(shù)據(jù)中具有使用價(jià)值的生物學(xué)信息,利用這些信息或結(jié)合其他組學(xué)、環(huán)境數(shù)據(jù)再進(jìn)行植物生長(zhǎng)發(fā)育的研究。表3 匯總了在表型圖像數(shù)據(jù)分析中主要使用的理論方法、應(yīng)用技術(shù)和已成功應(yīng)用的案例等。

        表3 表型數(shù)據(jù)分析方法分類Tab.3 Classification of phenotypic data analysis methods

        盡管傳統(tǒng)的機(jī)器學(xué)習(xí)和圖像處理技術(shù)在特定場(chǎng)景下仍然發(fā)揮著作用,但隨著高通量表型數(shù)據(jù)采集技術(shù)的快速發(fā)展和表型數(shù)據(jù)量的爆炸式增長(zhǎng),利用包括卷積神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、轉(zhuǎn)移學(xué)習(xí)等在內(nèi)的深度學(xué)習(xí)算法開(kāi)發(fā)算法架構(gòu),如ResNet[46],VGGNet[46],AlexNet[47],GoogLeNet[47],SegNet[48],SqueezeNet[49],ARIGAN[50]等,以及自動(dòng)識(shí)別及分析圖像數(shù)據(jù)已經(jīng)成為表型數(shù)據(jù)分析一個(gè)主要的研究方向,在植物表型尤其在植物脅迫和病害表型的大數(shù)據(jù)圖像處理方面開(kāi)始廣泛應(yīng)用[44]并且表現(xiàn)出色,如植物表型信息預(yù)測(cè)方面的基于葉脈模式的植物識(shí)別[51]、植物秸稈數(shù)量和秸稈寬度測(cè)量[52]、根和芽的定位和特征檢測(cè)[14],植物抗逆抗病檢測(cè)分析方面的木薯褐斑病和花葉病檢測(cè)[53]、橄欖快速衰退綜合征檢測(cè)[54]以及甜瓜黃斑病、黃瓜花葉病等多種作物病害分析[55]等。這些方法能夠利用多類型表型數(shù)據(jù)建立植物組織模型、研究植物表型地域差異、預(yù)測(cè)植物表型信息和揭示植物演化規(guī)律等,可為植物表型組的持續(xù)深入研究提供重要的技術(shù)支持。

        2.4 植物表型數(shù)據(jù)在育種方面的應(yīng)用

        育種是植物表型研究,尤其是作物表型研究的重要應(yīng)用目的之一。作物育種經(jīng)歷了以人工篩選為主要方法的第一代、以雜交為主要方法的第二代和以分子標(biāo)記和全基因組關(guān)聯(lián)分析為主要輔助方法的第三代的逐步發(fā)展,目前正在開(kāi)啟多學(xué)科交叉、多組學(xué)數(shù)據(jù)支持的第四代大數(shù)據(jù)智能輔助育種階段[56]。實(shí)現(xiàn)智能化輔助育種需要整合表型組和基因組、轉(zhuǎn)錄組、代謝組等多組學(xué)數(shù)據(jù),通過(guò)全基因組關(guān)聯(lián)研究(Genome-Wide Association Studies,GWAS)、數(shù)量性狀位點(diǎn)(Quantitative Trait Loci,QTL)分析等多種技術(shù)手段生成大量候選基因、候選分子標(biāo)記等數(shù)據(jù),建立育種信息模擬、親本選配推薦、育種路徑推薦、育成品種預(yù)測(cè)等一批模型,形成最終的智能育種決策體系(圖1)。

        圖1 植物大數(shù)據(jù)智能輔助育種體系Fig.1 Intelligent breeding system assisted by plant big data

        近年來(lái),很多植物都完成了全基因組測(cè)序,隨著大規(guī)模植物表型數(shù)據(jù)采集和處理技術(shù)的發(fā)展,植物表型組學(xué)數(shù)據(jù)的持續(xù)積累和完善,利用表型組數(shù)據(jù)進(jìn)行植物基因型選擇鑒定研究的應(yīng)用也日益廣泛。2014 年,Honsdorf 等[57]通過(guò)高通量表型平臺(tái)Scanalyzer3D,在一組野生大麥滲入系中分別鑒定出了44 個(gè)和21 個(gè)干旱脅迫QTLs。2015 年,Yang 等[58]使用自行設(shè)計(jì)的高通量葉片評(píng)分系統(tǒng)(High-throughput Leaf Scoring,HLS)對(duì)3 個(gè)生長(zhǎng)階段的533 份水稻材料進(jìn)行了檢測(cè),對(duì)其29 個(gè)葉片性狀進(jìn)行了GWAS 分析,從中檢測(cè)出了9 個(gè)與葉片性狀相關(guān)的基因位點(diǎn)。2019 年,Yano 等[59]對(duì)大量水稻表型性狀數(shù)據(jù)進(jìn)行主成分分析,提取具有特定表型性狀的主成分,并將主成分得分與GWAS 結(jié)合起來(lái),鑒定出能夠激活赤霉素(GA)信號(hào)的SPINDLY(OsSPY)基因,并證實(shí)了GA 信號(hào)對(duì)水稻結(jié)構(gòu)調(diào)控的影響。將高通量表型數(shù)據(jù)與大規(guī)模QTL 或GWAS 分析技術(shù)相結(jié)合,為植物基因挖掘、基因表征提供了新的方法,為分子育種和智能輔助育種提供了技術(shù)支持。

        相比其他育種方法,第四代智能輔助育種體系有著無(wú)可比擬的優(yōu)勢(shì),是育種發(fā)展的必然趨勢(shì)。一些擁有較為完善組學(xué)數(shù)據(jù)的作物研究機(jī)構(gòu)和高校,已經(jīng)開(kāi)始將表型組學(xué)大數(shù)據(jù)應(yīng)用于智能育種的方案設(shè)計(jì),提出了初步的智能育種商業(yè)模式[60]。相信在不久的將來(lái),智能輔助育種的各種模型和決策體系將會(huì)快速建立起來(lái),推動(dòng)植物育種進(jìn)入新的時(shí)代。

        3 煙草表型組學(xué)大數(shù)據(jù)研究進(jìn)展

        煙草作為茄科植物的一個(gè)重要模式物種,憑借著較高的科研價(jià)值和經(jīng)濟(jì)價(jià)值,在宿主與病原體的相互作用以及瞬時(shí)蛋白表達(dá)、蛋白功能檢測(cè)、亞細(xì)胞蛋白定位研究[61-63]、植物與非生物脅迫響應(yīng)、植物發(fā)育和代謝的功能基因研究[64-65]等多方面必將有著廣泛的應(yīng)用前景。

        3.1 煙草表型組學(xué)數(shù)據(jù)的積累

        早期煙草表型研究的發(fā)展和表型數(shù)據(jù)的積累往往在煙草育種研究的推動(dòng)下進(jìn)行。20 世紀(jì)70年代,美、日、俄等國(guó)家相繼開(kāi)始收集作物種質(zhì)資源,構(gòu)建相關(guān)的種質(zhì)資源庫(kù),在世界各國(guó)煙草品種和種質(zhì)資源的收集整理過(guò)程產(chǎn)生了早期的煙草表型數(shù)據(jù),如美國(guó)國(guó)家植物種質(zhì)資源系統(tǒng),日本的作物種質(zhì)資源信息系統(tǒng),前蘇聯(lián)的農(nóng)作物種質(zhì)資源數(shù)據(jù)庫(kù)等。其中,截止到2019 年底,美國(guó)國(guó)家植物種質(zhì)資源系統(tǒng)共收錄了2 300 余條煙草表型數(shù)據(jù)[66],涵蓋煙草形態(tài)和生物學(xué)特征、化學(xué)成分等兩大類共28 個(gè)屬性。

        煙草作為我國(guó)農(nóng)業(yè)生產(chǎn)中重要的經(jīng)濟(jì)作物之一,科研人員對(duì)于煙草表型的研究很關(guān)注,尤其是煙葉的產(chǎn)量質(zhì)量、煙草的抗性、遺傳育種等方面。在傳統(tǒng)農(nóng)業(yè)研究領(lǐng)域中,我國(guó)主要的煙草表型相關(guān)數(shù)據(jù)庫(kù)有兩個(gè),一個(gè)是中國(guó)作物種質(zhì)資源信息系統(tǒng),該系統(tǒng)于1986 年我國(guó)啟動(dòng)國(guó)家種質(zhì)資源的收集工作時(shí)開(kāi)始構(gòu)建,涵蓋180 種作物,包括38 萬(wàn)余份種質(zhì)信息,其中收錄了約1 160 余份煙草種質(zhì)的表型數(shù)據(jù)[67];另一個(gè)是煙草專業(yè)的種質(zhì)資源數(shù)據(jù)庫(kù)“中國(guó)煙草種質(zhì)資源信息系統(tǒng)”,該系統(tǒng)在兩次全國(guó)大范圍收集煙草種質(zhì)資源數(shù)據(jù)的基礎(chǔ)上,于2010 年開(kāi)始構(gòu)建,收集了約5 200 份煙草種質(zhì)資源信息,共收錄4 000 余條表型數(shù)據(jù)[68],涵蓋煙草形態(tài)與生物學(xué)特征、品質(zhì)特征及抗逆性三大類的73 個(gè)屬性,目前該數(shù)據(jù)庫(kù)是我國(guó)煙草表型數(shù)據(jù)收錄較全的專業(yè)數(shù)據(jù)庫(kù)之一。此外,近年來(lái)在地方煙草種質(zhì)資源鑒定和煙草品種培育的過(guò)程中,如云南、貴州、湖北等地都持續(xù)有煙草表型數(shù)據(jù)的產(chǎn)出,但這些數(shù)據(jù)多以紙質(zhì)書籍的形式進(jìn)行記錄和發(fā)表[69-71],未能建立有效的電子數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)交流和共享,在一定程度上限制了數(shù)據(jù)的高效利用。

        隨著煙草基因組相關(guān)研究的快速發(fā)展,尤其是多個(gè)煙草基因組數(shù)據(jù)的發(fā)布,推動(dòng)了煙草表型性狀相關(guān)功能基因的研究,新基因挖掘和基礎(chǔ)研究取得了明顯進(jìn)展。近年來(lái),一批重要性狀的功能基因,尤其是在煙草優(yōu)質(zhì)、多抗、低害方面的相關(guān)基因被分析鑒定,例如蔗糖合酶基因家族在煙草系統(tǒng)發(fā)育中的表達(dá)模式分析[72],煙草CAMTA基因家族的進(jìn)化和表達(dá)分析研究[73],本氏煙病毒誘導(dǎo)基因沉默研究[35],LcPDS,LcZDS和LcCRTISO基因過(guò)表達(dá)對(duì)煙草耐鹽性的影響[74],煙草CchGLP基因過(guò)表達(dá)對(duì)表型和microRNAs 表達(dá)變化的研究[75],烤煙產(chǎn)量相關(guān)性狀的QTL 定位分析[76],不同發(fā)育時(shí)期煙草葉數(shù)和葉面積的QTL 動(dòng)態(tài)分析[77]等。在功能基因研究鑒定的過(guò)程中產(chǎn)生了一批煙草表型數(shù)據(jù),部分研究專門建立了煙草基因組和表型組的數(shù)據(jù)庫(kù)[35]。

        隨著植物高通量表型數(shù)據(jù)獲取技術(shù)的日益成熟,部分高通量數(shù)據(jù)采集技術(shù)和數(shù)據(jù)分析技術(shù)開(kāi)始應(yīng)用于煙草,其中應(yīng)用較為廣泛的是小型無(wú)人機(jī)采集平臺(tái)。目前該技術(shù)在煙草上的應(yīng)用領(lǐng)域主要為煙草的生產(chǎn)管理,如煙株數(shù)量統(tǒng)計(jì)[78]、烤煙生長(zhǎng)狀態(tài)檢測(cè)[79]、煙草種植面積評(píng)估[80]、煙草含氮化合物估測(cè)[81]等;另外在煙草病蟲(chóng)害檢測(cè)方面也有應(yīng)用,如煙草花葉病害高光譜特征研究[82]等。

        通過(guò)傳統(tǒng)農(nóng)業(yè)研究、現(xiàn)代育種技術(shù)和高通量技術(shù)等產(chǎn)生的煙草表型數(shù)據(jù)正在日益增長(zhǎng),這些數(shù)據(jù)將逐漸成為煙草表型組學(xué)研究的基礎(chǔ)。

        3.2 我國(guó)煙草表型組學(xué)大數(shù)據(jù)的研究進(jìn)展

        為推進(jìn)煙草科學(xué)大數(shù)據(jù)的發(fā)展,2018 年國(guó)家煙草專賣局“煙草科研大數(shù)據(jù)”重大專項(xiàng)正式啟動(dòng)實(shí)施,開(kāi)始進(jìn)行煙草科學(xué)大數(shù)據(jù)平臺(tái)的硬件搭建和項(xiàng)目部署,也為煙草表型組學(xué)大數(shù)據(jù)提供了有利的軟、硬件環(huán)境。項(xiàng)目初期進(jìn)行了煙草科學(xué)大數(shù)據(jù)資源體系和標(biāo)準(zhǔn)體系的構(gòu)建,體系中規(guī)劃了現(xiàn)代煙草農(nóng)業(yè)數(shù)據(jù)和生態(tài)基礎(chǔ)數(shù)據(jù)等內(nèi)容,規(guī)范了相關(guān)的數(shù)據(jù)元標(biāo)準(zhǔn)[83-84]。目前首批重大專項(xiàng)項(xiàng)目已經(jīng)有部分?jǐn)?shù)據(jù)和成果產(chǎn)出,如煙葉質(zhì)量大數(shù)據(jù)構(gòu)建及應(yīng)用研究項(xiàng)目產(chǎn)出煙葉相關(guān)的表型數(shù)據(jù),將降維技術(shù)應(yīng)用到煙葉質(zhì)量可視化[85];煙草近紅外大數(shù)據(jù)構(gòu)建及應(yīng)用項(xiàng)目利用近紅外設(shè)備進(jìn)行煙草化學(xué)成分高通量檢測(cè)分析;煙草育種大數(shù)據(jù)構(gòu)建及應(yīng)用項(xiàng)目開(kāi)始建立專業(yè)平臺(tái)進(jìn)行煙草表型組、基因組、轉(zhuǎn)錄組等數(shù)據(jù)的收集整理。以上項(xiàng)目的實(shí)施,能夠?yàn)闊煵菘茖W(xué)大數(shù)據(jù)尤其是煙草表型組學(xué)大數(shù)據(jù)提供統(tǒng)一的數(shù)據(jù)存儲(chǔ)管理平臺(tái),解決煙草表型數(shù)據(jù)較為分散的問(wèn)題。

        目前已有高通量數(shù)據(jù)采集設(shè)備應(yīng)用于煙草表型研究,如采用無(wú)人機(jī)對(duì)群體表型數(shù)據(jù)進(jìn)行采集的方式,高通量數(shù)據(jù)處理分析算法的研究也取得了一定進(jìn)展[78-82]。同時(shí)煙草科研大數(shù)據(jù)項(xiàng)目站在大數(shù)據(jù)的角度,開(kāi)始將三維建模、機(jī)器學(xué)習(xí)、人工智能等計(jì)算機(jī)技術(shù)和生物技術(shù)引入到煙草科學(xué)大數(shù)據(jù)分析中,為煙草表型組學(xué)大數(shù)據(jù)研究打下基礎(chǔ)。但煙草高通量數(shù)據(jù)采集主要集中在群體表型方面,缺乏溫室傳送帶或者軌道式平臺(tái)在溫室或田間對(duì)煙草整株、局部組織器官和種子等進(jìn)行高通量多光譜的測(cè)量。該類數(shù)據(jù)的缺乏將限制相關(guān)數(shù)據(jù)分析算法在煙草上的應(yīng)用,遲滯煙草生長(zhǎng)發(fā)育過(guò)程監(jiān)測(cè)、植株三維模型構(gòu)建等研究的開(kāi)展。

        分子育種技術(shù)目前是世界煙草育種使用的主要手段[86],我國(guó)煙草也處于分子育種的階段,擁有一套較為成熟的分子育種技術(shù)體系[87]。該體系由煙草分子標(biāo)記輔助育種、基因克隆與基因轉(zhuǎn)化等多種技術(shù)組成。煙草方面開(kāi)展了抗多種病毒?。?8]以及糖酯[89]相關(guān)的分子標(biāo)記開(kāi)發(fā)、品種創(chuàng)制以及表型驗(yàn)證等工作,獲取了一批與抗病和品質(zhì)性狀相關(guān)的分子標(biāo)記和基因。雖然有很多煙草基因和分子標(biāo)記被鑒定發(fā)布,但由于缺乏高通量的表型采集設(shè)備和分析軟件,尤其是針對(duì)煙草組織、器官和單株等表型的專業(yè)數(shù)據(jù)采集設(shè)備,導(dǎo)致煙草暫未開(kāi)展高通量表型數(shù)據(jù)與大規(guī)模QTL 或GWAS 分析技術(shù)相結(jié)合的研究工作,也未能開(kāi)展大規(guī)模、更深入的基因挖掘和基因表征的研究工作。煙草表型數(shù)據(jù)在育種研究中的應(yīng)用也多以分子標(biāo)記和基因的驗(yàn)證為主,應(yīng)用范圍較為有限。

        煙草表型組學(xué)研究進(jìn)展較為遲緩,高通量數(shù)據(jù)積累較少,已有的數(shù)據(jù)分布零散,多項(xiàng)數(shù)據(jù)標(biāo)準(zhǔn)仍在制定過(guò)程中,距推廣應(yīng)用還有一定距離。煙草分子標(biāo)記和基因的數(shù)量相較其他作物仍然較少,仍未能形成統(tǒng)一的煙草表型組學(xué)大數(shù)據(jù)體系,而煙草智能育種體系的構(gòu)建需要煙草表型組大數(shù)據(jù)和煙草基因型大數(shù)據(jù)作為核心驅(qū)動(dòng)源,在缺少該部分核心大數(shù)據(jù)的前提下,煙草的各類智能化輔助育種模型的構(gòu)建也鮮有報(bào)道,煙草表型組學(xué)大數(shù)據(jù)在智能輔助育種方面仍有較長(zhǎng)的路要走。

        4 展望

        綜上,相比其他植物的表型研究,煙草高通量表型數(shù)據(jù)采集技術(shù)的應(yīng)用仍然較少,煙草表型組學(xué)相關(guān)大數(shù)據(jù)平臺(tái)的建設(shè)也較為遲緩,植物學(xué)、自動(dòng)化、圖形圖像和計(jì)算機(jī)科學(xué)等其他科學(xué)領(lǐng)域先進(jìn)的數(shù)據(jù)分析技術(shù)也鮮有使用,使得煙草表型缺少形成大數(shù)據(jù)的基礎(chǔ)條件,無(wú)法形成一個(gè)有效的科學(xué)系統(tǒng),難以為煙草大數(shù)據(jù)智能化輔助育種提供支持。針對(duì)我國(guó)煙草表型組學(xué)大數(shù)據(jù)發(fā)展的問(wèn)題,為快速推進(jìn)我國(guó)煙草表型組學(xué)大數(shù)據(jù)的構(gòu)建和發(fā)展,提出以下建議:

        (1)強(qiáng)化高通量表型數(shù)據(jù)采集技術(shù)在煙草上的應(yīng)用

        目前部分煙草抗逆性、基礎(chǔ)農(nóng)藝性狀等表型數(shù)據(jù)的獲取仍然是以人工采集的方式為主,該方法雖然便于實(shí)施,但是大規(guī)模數(shù)據(jù)采集的難度較大,準(zhǔn)確性較難保障。高通量的表型數(shù)據(jù)采集設(shè)備和技術(shù)已經(jīng)在煙草上開(kāi)始應(yīng)用,但相較其他作物仍然不成熟,缺乏高通量的表型數(shù)據(jù)采集設(shè)備和數(shù)據(jù)分析技術(shù),限制了煙草產(chǎn)量預(yù)測(cè)、群體性狀檢測(cè)、大面積病蟲(chóng)害監(jiān)測(cè)預(yù)警、三維模型構(gòu)建、表型鑒定和分類、整合表型組學(xué)的多組學(xué)研究等多個(gè)方面的研究進(jìn)展。高通量表型數(shù)據(jù)采集設(shè)備是獲取高通量植物表型數(shù)據(jù)最有效、最快速的技術(shù)手段,其應(yīng)用水平直接影響到煙草表型組學(xué)大數(shù)據(jù)的發(fā)展。因此,建議加強(qiáng)高通量表型數(shù)據(jù)采集技術(shù)在煙草上的推廣應(yīng)用,加快數(shù)據(jù)采集方式由機(jī)器代替人工的轉(zhuǎn)變,為煙草表型組學(xué)大數(shù)據(jù)的發(fā)展奠定數(shù)據(jù)基礎(chǔ)。

        (2)構(gòu)建煙草高通量表型數(shù)據(jù)標(biāo)準(zhǔn)和高通量數(shù)據(jù)庫(kù)

        我國(guó)的煙草表型研究機(jī)構(gòu)較多,但目前尚未制定出煙草高通量表型數(shù)據(jù)標(biāo)準(zhǔn),雖然煙草行業(yè)已經(jīng)開(kāi)始了煙草科學(xué)大數(shù)據(jù)資源體系和標(biāo)準(zhǔn)體系的構(gòu)建,但在數(shù)據(jù)采集的設(shè)備信息、數(shù)據(jù)采集方法、數(shù)據(jù)圖像格式等一系列元數(shù)據(jù)采集上仍然缺少統(tǒng)一的命名、標(biāo)注和約束條件等數(shù)據(jù)采集標(biāo)準(zhǔn)和規(guī)范。在沒(méi)有數(shù)據(jù)采集標(biāo)準(zhǔn)和規(guī)范的前提下采集的表型數(shù)據(jù)往往會(huì)造成采集數(shù)據(jù)差異大、數(shù)據(jù)信息不完整、數(shù)據(jù)無(wú)法共享通用等一系列問(wèn)題,最終會(huì)遲滯煙草表型組學(xué)大數(shù)據(jù)的快速發(fā)展。現(xiàn)階段煙草高通量表型數(shù)據(jù)尚未形成規(guī)模,可優(yōu)先建立相關(guān)數(shù)據(jù)標(biāo)準(zhǔn),并在此基礎(chǔ)上,整合開(kāi)發(fā)適用于煙草表型數(shù)據(jù)的數(shù)據(jù)庫(kù),為煙草表型研究提供統(tǒng)一、通用和共享的資源平臺(tái),促進(jìn)煙草表型組學(xué)大數(shù)據(jù)的發(fā)展。

        (3)加強(qiáng)煙草表型數(shù)據(jù)在煙草育種應(yīng)用方面的研究

        目前煙草高通量表型數(shù)據(jù)主要集中在煙葉生產(chǎn)管理方面,對(duì)于煙草育種的應(yīng)用價(jià)值有限。有關(guān)煙草育種相關(guān)高通量表型數(shù)據(jù)的采集力度有待進(jìn)一步加強(qiáng),并在現(xiàn)有高通量數(shù)據(jù)分析技術(shù)的基礎(chǔ)上,結(jié)合生物學(xué)、人工智能和機(jī)器學(xué)習(xí)等多個(gè)學(xué)科領(lǐng)域的先進(jìn)技術(shù),開(kāi)發(fā)出適用煙草育種表型大數(shù)據(jù)的數(shù)據(jù)分析挖掘方法。此外,以精準(zhǔn)育種和智能決策為目標(biāo),整合煙草基因型數(shù)據(jù)和表型組大數(shù)據(jù),建立包括煙草親本選配、育成品種預(yù)測(cè)等各類模型,構(gòu)建基因型-表型-環(huán)境多位數(shù)據(jù)驅(qū)動(dòng)的智能育種決策體系,提升煙草表型組學(xué)大數(shù)據(jù)的研究應(yīng)用水平,推動(dòng)煙草育種技術(shù)的快速發(fā)展。

        猜你喜歡
        高通量組學(xué)表型
        高通量衛(wèi)星網(wǎng)絡(luò)及網(wǎng)絡(luò)漫游關(guān)鍵技術(shù)
        高通量血液透析臨床研究進(jìn)展
        Ka頻段高通量衛(wèi)星在鐵路通信中的應(yīng)用探討
        口腔代謝組學(xué)研究
        基于UHPLC-Q-TOF/MS的歸身和歸尾補(bǔ)血機(jī)制的代謝組學(xué)初步研究
        建蘭、寒蘭花表型分析
        中國(guó)通信衛(wèi)星開(kāi)啟高通量時(shí)代
        GABABR2基因遺傳變異與肥胖及代謝相關(guān)表型的關(guān)系
        代謝組學(xué)在多囊卵巢綜合征中的應(yīng)用
        慢性乙型肝炎患者HBV基因表型與血清學(xué)測(cè)定的臨床意義
        天堂а√在线中文在线新版| 亚洲国产综合精品中久| aaa日本高清在线播放免费观看| 亚洲avav天堂av在线网爱情| 国内免费AV网站在线观看| 午夜视频免费观看一区二区 | 免费中文熟妇在线影片| 亚洲天堂av在线免费看| 2021年性爱喷水视频| 亚洲日产乱码在线中文字幕| 国产精品二区一区二区aⅴ污介绍 少妇伦子伦情品无吗 | 国产高清精品一区二区| 女局长白白嫩嫩大屁股| 国产成人综合久久精品推| 国产高潮精品一区二区三区av| 亚洲乱码中文字幕视频| 疯狂三人交性欧美| 亚洲中文字幕无码mv | 久久久亚洲精品蜜桃臀| 免费人成在线观看播放视频| 亚洲国产精彩中文乱码av| 久久aⅴ人妻少妇嫩草影院| 亚洲精品国产一二三无码AV| 亚洲一区二区日韩在线| 国产免费又色又爽粗视频| 青青久在线视频免费观看| 91精品综合久久久久m3u8| 亚洲男同免费视频网站| 亚洲国产精品无码中文字| 亚洲精品日韩自慰喷水白浆| 国产麻豆放荡av激情演绎| 日韩精品人妻久久久一二三| 久久九九国产精品怡红院| 麻豆密入视频在线观看| 熟女人妻一区二区三区| 国产伦精品一区二区三区妓女| 日韩AVAV天堂AV在线| 伊人久久大香线蕉综合av| 色窝窝无码一区二区三区| 激情第一区仑乱| 久久久久99精品成人片试看|