亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于5993個(gè)核基因的被子植物系統(tǒng)發(fā)育關(guān)系研究

        2020-03-02 07:46:59金鑫程書(shū)楊拓余慷段肖霞倪雪梅李世明張耕耘
        廣西植物 2020年1期

        金鑫 程書(shū) 楊拓 余慷 段肖霞 倪雪梅 李世明 張耕耘

        摘 要:系統(tǒng)發(fā)育關(guān)系的構(gòu)建對(duì)被子植物分類(lèi)及進(jìn)化研究非常重要。長(zhǎng)期以來(lái),被子植物系統(tǒng)發(fā)育的研究,大多使用質(zhì)體基因、線(xiàn)粒體基因或少數(shù)保守的單拷貝核基因。該研究從已注釋基因組或轉(zhuǎn)錄組中搜集88種被子植物(包含58目)的核基因集;通過(guò)對(duì)其進(jìn)行同源基因聚類(lèi)及去旁系同源基因,獲得了5 993個(gè)一對(duì)一的直系同源基因家族(即對(duì)于每個(gè)基因家族,每種植物最多一條序列,最少包含50個(gè)物種);使用截取各種不同數(shù)目基因集的DNA或氨基酸序列,采用串聯(lián)法(concatenation)和溯祖法(coalescence),共構(gòu)建了20棵進(jìn)化樹(shù)。比較這些進(jìn)化樹(shù),雖然大部分結(jié)果支持APG IV中描述的被子植物主要支系之間的關(guān)系[(真雙子葉植物,單子葉植物),木蘭類(lèi)植物],但真雙子葉植物內(nèi)部各目分支的演化關(guān)系與APG IV有一個(gè)很大的不同,即認(rèn)為檀香目和石竹目是薔薇類(lèi)植物的姊妹群?;谶@些進(jìn)化樹(shù),估算了被子植物各目分支的分化時(shí)間,結(jié)果表明被子植物的起源時(shí)間為237.78百萬(wàn)年前(95%置信區(qū)間為202.6~278.08),與主流觀點(diǎn)認(rèn)為的225百萬(wàn)年至240百萬(wàn)年前一致。以上結(jié)果為構(gòu)建進(jìn)化樹(shù)提供了一種可行性策略,這種方法允許使用基因數(shù)目更多而計(jì)算速度更快。

        關(guān)鍵詞:系統(tǒng)發(fā)育關(guān)系,被子植物,核基因,同源基因聚類(lèi),串聯(lián)法,溯祖法,分化時(shí)間

        中圖分類(lèi)號(hào):Q949.4文獻(xiàn)標(biāo)識(shí)碼:A

        文章編號(hào):1000-3142(2020)01-0044-16

        Abstract:Construction of phylogeny is important for classification and research of angiosperms. For a long time,angiosperm phylogeny has been analysed using plastid genes,mitochondrial genes or a few conserved single-copy nuclear genes. We collected nuclear gene sets of 88 species of angiosperm (contains 58 orders) from annotated genomes or transcriptomes. By using a combined homology- and phylogeny tree-based approach,we obtained a total of 5 993 one-to-one ortholog groups (one sequence of each species for each ortholog group),each of which was represented by at least 50 species. Then,a total of 20 species trees were reconstructed using? methods with different combinations of reconstruction (concatenation-based and coalescence-based) and sequence type (nucleotide or amino acid) for gene data sets with different gene occupancy values. Most of the resulting topologies support the relationships of the major clades of angiosperm as described in APG IV,but present different deep relationships among major clades in eudicots phylogeny such as the placement of Santalales and Caryophyllales as sisters to Rosids. We estimate the divergence times of the major clades of angiosperm and conclude that the origin of angiosperm is about 237.78 million years ago(95% confidence interval is 202.6-278.08),which is in accordance with the previously accepted 225 million years to 240 million years ago. This study provides an efficient strategy for building phylogenetic trees using thousands of genes with ultrafast calculation.

        Key words:phylogeny,angiosperms,nuclear genes,ortholog inference,concatenation,coalescence,divergence time

        系統(tǒng)發(fā)育樹(shù)的正確構(gòu)建對(duì)植物分類(lèi)及進(jìn)化研究非常重要。進(jìn)化樹(shù)構(gòu)建的準(zhǔn)確度主要受以下因素的影響。其一,所使用的數(shù)據(jù)集的種類(lèi)及大小。不僅使用形態(tài)性狀數(shù)據(jù)、質(zhì)體基因、線(xiàn)粒體基因及核基因序列建立的進(jìn)化樹(shù)不一樣(Endress & Doyle,2009; Soltis et al.,2011; Ruhfel et al.,2014; Zeng et al.,2014),使用全長(zhǎng)核酸序列或僅使用基因密碼子某個(gè)位點(diǎn)的核酸序列及氨基酸序列所構(gòu)建的進(jìn)化樹(shù)也有所不同(Wickett et al.,2014);其二,構(gòu)建樹(shù)的方法及模型。方法有串聯(lián)法(concatenation)和溯祖法(coalescence)。串聯(lián)法是將所有基因串聯(lián)作為一個(gè)整體,使用軟件RAxML(Stamatakis,2014)或iqtree(Nguyen et al.,2015)構(gòu)建系統(tǒng)發(fā)育樹(shù);溯祖法是先對(duì)每個(gè)基因建樹(shù),再使用軟件ASTRAL(Zhang et al.,2017)建立所有基因樹(shù)的共有樹(shù)(Wickett et al.,2014)。而構(gòu)建系統(tǒng)發(fā)育樹(shù)使用的模型更是多種多樣,如核酸模型GTR、HKY、JC、F81、K2P、K3P、K81uf等,蛋白質(zhì)模型LG、Poisson、cpREV、mtREV、Dayhoff、mtMAM、JTT、WAG等(Nguyen et al.,2015)。

        被子植物是植物界最高等且種類(lèi)最多的一類(lèi),它們?cè)诘厍蛏险紦?jù)著絕對(duì)優(yōu)勢(shì)?,F(xiàn)在已報(bào)道被子植物有352 000種(http://www.theplantlist.org/),屬于416科和64目,各目之間的演化關(guān)系一直是研究的熱點(diǎn)和爭(zhēng)論的焦點(diǎn)。被子植物除了最基部的三個(gè)目:無(wú)油樟目(Amborellales)、睡蓮目(Amborellales)和木蘭藤目(Austrobaileyales),又稱(chēng)ANITA組,其余的(99.95%)可以分為五類(lèi):木蘭類(lèi)植物(magnoliids)、單子葉植物(monocots)、真雙子葉植物(eudicots)、金栗蘭科(Chloranthaceae)和金魚(yú)藻科(Ceratophyllaceae)。這五類(lèi)的系統(tǒng)演化拓?fù)潢P(guān)系一直存在爭(zhēng)論,Zeng et al.(2014)總結(jié)了已經(jīng)發(fā)表的五種主要的拓?fù)潢P(guān)系(圖1:A-E),其中A是最主流的,也是APG IV(The Angiosperm Phylogeny Group,2016)的拓?fù)浣Y(jié)構(gòu)。Soltie et al.(2011)使用17個(gè)基因串聯(lián)(包括質(zhì)體基因、線(xiàn)粒體基因和核基因)為640種植物構(gòu)建的系統(tǒng)發(fā)育進(jìn)化樹(shù)和Ruhfel et al.(2014)使用78個(gè)質(zhì)體基因串聯(lián)為360種植物構(gòu)建的進(jìn)化樹(shù),支持主流A拓?fù)浣Y(jié)構(gòu)。Wickett et al.(2014)使用674個(gè)核基因串聯(lián)為92種植物構(gòu)建的進(jìn)化樹(shù)和Zeng et al.(2014)使用59個(gè)核基因串聯(lián)為61種植物構(gòu)建的進(jìn)化樹(shù),支持B拓?fù)浣Y(jié)構(gòu)。除此之外,Qiu et al.(2010)使用4個(gè)線(xiàn)粒體基因?yàn)?80種植物構(gòu)建的進(jìn)化樹(shù),支持C拓?fù)浣Y(jié)構(gòu);Endress & Doyle(2009)使用形態(tài)性狀構(gòu)建的進(jìn)化樹(shù),支持D拓?fù)浣Y(jié)構(gòu);Zhang et al.(2012)使用5個(gè)核基因?yàn)?1種植物構(gòu)建的進(jìn)化樹(shù),支持E拓?fù)浣Y(jié)構(gòu)。

        去掉金栗蘭科和金魚(yú)藻科后,單子葉植物、木蘭類(lèi)植物、真雙子葉植物之間的系統(tǒng)發(fā)育關(guān)系有三種:(真雙子葉植物,單子葉植物),木蘭類(lèi)植物;(真雙子葉植物,木蘭類(lèi)植物),單子葉植物;(單子葉植物,木蘭類(lèi)植物),真雙子葉植物。Lu et al.(2018)使用4個(gè)質(zhì)體基因和1個(gè)線(xiàn)粒體基因分析了5 864種中國(guó)被子植物(幾乎包括所有中國(guó)地區(qū)被子植物)的系統(tǒng)發(fā)育關(guān)系,其構(gòu)建的進(jìn)化樹(shù)支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,單子葉植物),木蘭類(lèi)植物]。Chen et al.(2019)發(fā)布了木蘭類(lèi)植物鵝掌楸(Liriodendron)基因組,使用其502個(gè)核基因及溯祖法為18種植物構(gòu)建的進(jìn)化樹(shù),同樣支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,單子葉植物),木蘭類(lèi)植物]。Chaw et al.(2019)發(fā)布了另一個(gè)木蘭類(lèi)植物牛樟(stout camphor tree)基因組,使用其211個(gè)核基因?yàn)?3種植物構(gòu)建的進(jìn)化樹(shù),支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,木蘭類(lèi)植物),單子葉植物]。Li et al.(2019)使用2 881種被子植物的質(zhì)體基因組的80個(gè)基因重建了被子植物高分辨率的系統(tǒng)發(fā)育樹(shù),支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,單子葉植物),木蘭類(lèi)植物]。從上述已有的研究中,我們發(fā)現(xiàn),使用核基因串聯(lián)法建立的進(jìn)化樹(shù)基本都支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,木蘭類(lèi)植物),單子葉植物],使用核基因溯祖法、質(zhì)體和線(xiàn)粒體基因建立的進(jìn)化樹(shù)基本都支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,單子葉植物),木蘭類(lèi)植物]。

        真雙子葉植物內(nèi)部各目的系統(tǒng)發(fā)育關(guān)系也存在爭(zhēng)論(圖1:F-K),真雙子葉植物除了最基部的毛茛目(Ranunculales)、山龍眼目(Proteales)、昆欄樹(shù)目(Trochodendrales)、黃楊目(Buxales)和洋二仙草目(Gunnerales),其余的可以分為兩類(lèi):薔薇類(lèi)植物(Rosids)和菊類(lèi)植物(Asterids)。這兩類(lèi)植物的基部有6個(gè)目的系統(tǒng)發(fā)育關(guān)系比較混亂,即五椏果目(Dilleniales)、虎耳草目(Saxifragales)、葡萄目(Vitales)、檀香目(Santalales)、智利藤目(Berberidopsidales)及石竹目(Caryophyllales)。Zeng et al.(2017)總結(jié)了已經(jīng)發(fā)表的六種主要的拓?fù)潢P(guān)系(圖1:F-K),其中K是APG IV中所認(rèn)可的拓?fù)浣Y(jié)構(gòu)。Moore et al.(2010)使用83個(gè)質(zhì)體基因?yàn)?6種植物構(gòu)建的進(jìn)化樹(shù),支持“五椏果目是薔薇類(lèi)植物的姊妹群”;Soltie et al.(2011)使用17個(gè)基因串聯(lián)(包括質(zhì)體基因、線(xiàn)粒體基因和核基因)為640種植物構(gòu)建的進(jìn)化樹(shù)和Moore et al.(2011)使用質(zhì)體IR序列為87種植物構(gòu)建的進(jìn)化樹(shù),支持“五椏果目是菊類(lèi)植物的姊妹群”;Worberg et al.(2007)等使用五個(gè)基因組區(qū)域序列為56種植物構(gòu)建的進(jìn)化樹(shù)和Moore et al.(2011)使用質(zhì)體IR序列為244種植物構(gòu)建的進(jìn)化樹(shù),及APG IV都支持“五椏果目是薔薇類(lèi)植物和菊類(lèi)植物共同的姊妹群”。大部分研究都支持“葡萄目和虎耳草目是薔薇類(lèi)植物的姊妹群,智利藤目、檀香目和石竹目是菊類(lèi)植物的姊妹群”(Worberg et al.,2007; Moore et al.,2010,2011; Yang et al.,2015);Zeng et al.(2017)使用504個(gè)核基因和溯祖法為100種植物構(gòu)建的進(jìn)化樹(shù),支持“檀香目和智利藤目是薔薇類(lèi)植物的姊妹群”。

        被子植物的起源及進(jìn)化一直是植物學(xué)界研究和爭(zhēng)論的熱點(diǎn)。在古生物學(xué)界,很長(zhǎng)時(shí)期內(nèi),被子植物的最早化石記錄都是白堊紀(jì)125百萬(wàn)年前,也是最早的真雙子葉植物化石記錄(Herendeen,1995)。Fu et al.(2018)發(fā)現(xiàn)了早侏羅紀(jì)地層(約175百萬(wàn)年前)中的“南京花”,其具有花萼、花瓣、雌蕊,有明顯的杯托、下位子房上位花、樹(shù)狀的花柱,其種子/胚珠確實(shí)是被完全包裹著,子房壁將種子與外界完全隔絕,這都滿(mǎn)足了被子植物判斷標(biāo)準(zhǔn)?!澳暇┗ā钡陌l(fā)現(xiàn),將被子植物最早化石記錄向前推進(jìn)了約5 000萬(wàn)年,并填補(bǔ)了被子植物化石記錄(125百萬(wàn)年前)與分子鐘推算時(shí)間(225百萬(wàn)年至240百萬(wàn)年前)之間的“侏羅紀(jì)空缺”(Jurassic gap)(Li et al.,2019)。目前,大多數(shù)基于系統(tǒng)進(jìn)化樹(shù)的被子植物分化時(shí)間估計(jì)研究,都認(rèn)為被子植物的起源為三疊紀(jì)225百萬(wàn)年至240百萬(wàn)年前(Magallon,2010; Smith et al.,2010; Zeng et al.,2014; Mandel,2019),這與起傳粉作用的核心植食性鱗翅目昆蟲(chóng)的起源時(shí)間(約230百萬(wàn)年前)一致(Zeng et al.,2014; Li et al.,2019)。

        本研究使用超過(guò)5 000個(gè)核基因的核酸及蛋白序列,用兩種進(jìn)化樹(shù)構(gòu)建方法分析了88種被子植物的系統(tǒng)發(fā)育關(guān)系(包括87科58目),并對(duì)各進(jìn)化分支的分化時(shí)間進(jìn)行了估計(jì)(總流程如圖2)。為了得到準(zhǔn)確可靠的被子植物系統(tǒng)發(fā)育進(jìn)化樹(shù),我們對(duì)5 000多個(gè)核基因進(jìn)行了拆分,得到了包含不同基因數(shù)量的多個(gè)數(shù)據(jù)集,并對(duì)各個(gè)數(shù)據(jù)集進(jìn)行系統(tǒng)發(fā)育樹(shù)的構(gòu)建,最后比較了所得到的20棵系統(tǒng)發(fā)育進(jìn)化樹(shù)之間的一致性。

        1 材料與方法

        1.1 材料

        我們收集了1個(gè)裸子植物(Ginkgo biloba作為外類(lèi)群)基因組、43個(gè)被子植物基因組(主要來(lái)自NCBI和PHYTOZOME數(shù)據(jù)庫(kù))、43個(gè)被子植物已拼接轉(zhuǎn)錄組(http://www.onekp.com/public_data.html )及2個(gè)被子植物RNA-seq數(shù)據(jù)(其中無(wú)葉蓮Petrosavia sakurai是本研究測(cè)序的物種),A-E. 五類(lèi)被子植物間[金栗蘭科(Chl)、金魚(yú)藻科(Cer)、木蘭類(lèi)植物(Mag)、單子葉植物(Mon)及真雙子葉植物(Eud)]5種代表性拓?fù)浣Y(jié)構(gòu); F-K. 真雙子葉植物內(nèi)部各目間6種代表性拓?fù)浣Y(jié)構(gòu)。

        A-E. Five representative topologies among eudicots (Eud),monocots (Mon),magnoliids (Mag),Ceratophyllaceae (Cer) and Chloranthaceae (Chl); F-K. Six representative topologies among eudicots.其中被子植物共包含87科58目(表1)。

        1.2 基于基因組序列的直系同源基因鑒定

        我們使用Yang & Smith(2014)報(bào)道的方法,對(duì)43個(gè)植物基因組的基因集進(jìn)行同源基因聚類(lèi)分析。首先,使用軟件BLASTN v2.6.0+ 對(duì)43個(gè)基因集CDS序列進(jìn)行all-by-all blast,每條序列取最佳的1 000條比對(duì)結(jié)果,去掉比對(duì)長(zhǎng)度小于1/3總長(zhǎng)的序列,修剪未比對(duì)上的末端序列。然后,使用MCL軟件(Van,2000)進(jìn)行同源基因聚類(lèi)(inflation value = 1.4),去除少于20個(gè)植物的基因家族,剩余基因家族使用MAFFT v7.310軟件(Katoh & Standley,2013)進(jìn)行多序列比對(duì)(maximum iterative refinement cycles = 1 000),使用PHYUTILITY v2.2.6軟件(Smith & Dunn,2008)修剪缺失率大于90%的位點(diǎn),使用軟件RAXML v8.2.11(Stamatakis,2014)對(duì)修剪后的多序列比對(duì)數(shù)據(jù)估算系統(tǒng)進(jìn)化樹(shù)(model = GTRCAT)。最后修剪掉進(jìn)化樹(shù)上的所有旁系同源基因枝,修剪枝長(zhǎng)大于0.6的枝、比姐妹枝長(zhǎng)十倍的末端枝,單源且全部同樣品的枝只保留一個(gè),修剪枝長(zhǎng)比預(yù)期堿基替換率大0.3倍的內(nèi)部枝,再使用MO方法(Yang & Smith,2014)去除所有剩余的旁系同源枝,獲得one-to-one同源基因家族(即每個(gè)樣品最多一條序列),只保留大于20個(gè)樣品的基因家族。

        1.3 轉(zhuǎn)錄組及外類(lèi)群數(shù)據(jù)處理

        我們對(duì)兩個(gè)來(lái)自?xún)蓚€(gè)科(無(wú)葉蓮科Petrosavia sakurai和鴉跖草科Cyanotis arachnoidea)的RNA-seq數(shù)據(jù)從頭拼接。首先使用Trimmomatic v0.38軟件(Bolger et al.,2014)過(guò)濾原始reads數(shù)據(jù)(參數(shù)HEADCROP:15 LEADING:20 TRAILING:20 SLIDINGWINDOW:5:20 MINLEN:50 AVGQUAL:20),再使用Trinity v2.6.6軟件(Grabherr et al.,2011)拼接(min contig length=150 bp),最后使用TransDecoder v5.5.0(https://github.com/TransDecoder/TransDecoder/releases/tag/TransDecoder-v5.5.0 )進(jìn)行CDS和蛋白質(zhì)序列預(yù)測(cè)(參考數(shù)據(jù)庫(kù)為Swissprot和Pfam-A)。將得到的這兩個(gè)物種的基因集、從onekp數(shù)據(jù)庫(kù)下載得到的43種被子植物的基因集和1個(gè)裸子植物(Ginkgo biloba)的基因集,使用HaMStR v13.2.6軟件(Ebersberger et al.,2009)合并到利用基因組數(shù)據(jù)得到的同源基因家族中,最終只保留大于50個(gè)樣品的基因家族。

        1.4 系統(tǒng)發(fā)育進(jìn)化樹(shù)構(gòu)建

        我們采用兩種方法串聯(lián)法 (concatenation)和溯祖法(coalescence),并分別使用CDS序列和氨基酸序列構(gòu)建進(jìn)化樹(shù)。無(wú)論是CDS序列還是蛋白質(zhì)序列,都使用PRANK v.170427軟件(http://wasabiapp.org/software/prank/)進(jìn)行多序列比對(duì),使用PHYUTILITY v2.2.6軟件(Smith & Dunn,2008)修剪缺失率大于70%的位點(diǎn),其中CDS序列需去除長(zhǎng)度小于300個(gè)堿基的序列,蛋白質(zhì)序列需去除長(zhǎng)度小于100個(gè)氨基酸的序列。

        溯祖法,先對(duì)每個(gè)基因使用RAxML v8.2.11軟件(默認(rèn)參數(shù))(Stamatakis,2014)畫(huà)樹(shù),再使用ASTRAL v5.5.9軟件(Zhang et al.,2017)處理所有基因樹(shù),得到共有樹(shù),參數(shù)設(shè)置“-t 1--gene-only”以獲得bootstrap值和基因支持率,枝長(zhǎng)使用iqtree v1.5.5軟件(Nguyen et al.,2015)獲得。

        串聯(lián)法,先使用PartitionFinder v2.1.1軟件(Lanfear et al.,2009)對(duì)串聯(lián)序列進(jìn)行分區(qū)和進(jìn)化模型檢測(cè),從而設(shè)置較合理的分區(qū)和為每個(gè)分區(qū)選擇合理的進(jìn)化模型。對(duì)CDS序列檢測(cè)下列的四個(gè)分區(qū)策略(表2):no partitioning,partitioning by each codon position (three partitions),partitioning by gene和partitioning by each codon position within each gene。對(duì)蛋白質(zhì)序列檢測(cè)下列兩個(gè)分區(qū)策略:no partitioning和 partitioning by gene。參數(shù)設(shè)置如下:branch lengths = linked;model_selection = aicc;search = user;models = GTR,GTR+G,GTR+I+G(CDS序列)或者models = LG+G,LG+I+G,WAG+G,WAG+I+G(蛋白質(zhì)序列)。再使用iqtree v1.5.5軟件畫(huà)樹(shù)[1000 ultrafast bootstrap replicates(Von Haeseler et al.,2013),-spp設(shè)置最優(yōu)分區(qū)策略],基因支持率使用ASTRAL v5.5.9軟件(-t 1)獲得。最后使用軟件Evolview v2(He et al.,2016)對(duì)獲得的所有進(jìn)化樹(shù)進(jìn)行美化。

        A. 每個(gè)同源基因家族含有的基因數(shù)目; B. 每個(gè)樣品含有的同源基因家族數(shù)目。

        A. Gene number of each orthologous gene family; B. Number of orthologous genes for each sample.

        1.5 分化時(shí)間估計(jì)

        我們使用PAML v4.9軟件包 (Yang,2007)的MCMCTREE程序進(jìn)行分化時(shí)間估計(jì),輸入拓?fù)浣Y(jié)構(gòu)為綜合20棵進(jìn)化樹(shù)的最佳拓?fù)浣Y(jié)構(gòu)(即使用742個(gè)基因的CDS序列串聯(lián)法獲得的拓?fù)浣Y(jié)構(gòu)),輸入序列為742個(gè)基因的CDS序列。我們先對(duì)每個(gè)基因都分別估計(jì)分化時(shí)間,再綜合742個(gè)基因的分析結(jié)果(即每個(gè)節(jié)點(diǎn)取所有基因的平均值)獲得最終的分化時(shí)間樹(shù)。拓?fù)浣Y(jié)構(gòu)的枝長(zhǎng)使用JONES+gamma堿基替換模型獲得;rgene gamma設(shè)定為G(1,4.5);sigma2 gamma設(shè)定為G(1,4.5);clock設(shè)定為3;Markov chain Monte Carlo(MCMC)設(shè)定為burnin=50 000,sampfreq=100,nsample=10 000。對(duì)每個(gè)基因,都是分別運(yùn)行兩次獨(dú)立的MCMC(即不同的random seeds),使用Tracer v1.7軟件(https://github.com/beast-dev/tracer/releases/tag/v1.7.1 )觀察運(yùn)行結(jié)果是否穩(wěn)定和收斂,所有節(jié)點(diǎn)及參數(shù)的effective sample size是否大于200。九個(gè)化石校準(zhǔn)設(shè)定如下:銀杏分化時(shí)間為290百萬(wàn)年至310百萬(wàn)年前(Gao et al.,1989);單子葉植物和真雙子葉植物分化時(shí)間為130百萬(wàn)年至200百萬(wàn)年前(Kumar et al.,2017);真雙子葉植物共同祖先(即最早的雙子葉植物化石記錄)為125 百萬(wàn)年前(Herendeen,1995; Zeng et al.,2014);山龍眼目(Proteales)的共同祖先為108.8百萬(wàn)年前(Crane et al.,1996);葡萄目(Vitales)與其余薔薇類(lèi)植物間分化時(shí)間為105百萬(wàn)年至115百萬(wàn)年前(Fawcett et al.,2009; Kumar et al.,2017);Arabidopsis thaliana與Populus trichocarpa間分化時(shí)間為97百萬(wàn)年至109百萬(wàn)年前(Kumar et al.,2017);豆目(Fabales)與殼斗目(Fagales)間分化時(shí)間為93.5百萬(wàn)年前(Friis et al.,1996);山茱萸目(Cornales)共同祖先為85.8百萬(wàn)年前(Takahashi et al.,2002);唇形目(Lamiales)共同祖先為44.3百萬(wàn)年前(Call et al.,1992)。

        2 結(jié)果與分析

        2.1 直系同源基因鑒定

        我們對(duì)44個(gè)植物基因組基因集和45個(gè)已拼接轉(zhuǎn)錄組CDS序列進(jìn)行同源基因聚類(lèi),并使用Yang & Smith(2014)報(bào)道的方法,去除所有旁系同源基因,最終獲得大于50個(gè)樣品的one-to-one 基因家族(即每個(gè)樣品最多一條序列)共5 993個(gè)(圖3:A),各種植物的基因覆蓋率從33.57%到97.85%,平均為80.40%(圖3:B)。

        2.2 系統(tǒng)發(fā)育進(jìn)化樹(shù)構(gòu)建

        我們采用串聯(lián)和溯祖法共構(gòu)建了20棵進(jìn)化樹(shù),并比較它們之間的不同(圖4),以評(píng)估樹(shù)的穩(wěn)定性。CDS序列和蛋白質(zhì)序列,都分別使用五個(gè)數(shù)據(jù)集,總共構(gòu)建20棵樹(shù)(5棵CDS串聯(lián)法樹(shù),5棵CDS溯祖法樹(shù),5棵AA串聯(lián)法樹(shù)和5棵AA溯祖法樹(shù))。這5個(gè)數(shù)據(jù)集分別包含5 928個(gè)orthologs(≥50 samples)、3 384個(gè)orthologs(≥70 samples)、1 791個(gè)orthologs(≥80 samples)、742個(gè)orthologs(≥85 samples)及42個(gè)orthologs(≥89 samples)。

        這20棵進(jìn)化樹(shù)主要是為了進(jìn)一步確定圖1中五類(lèi)被子植物間演化關(guān)系和真雙子葉植物內(nèi)部各目間系統(tǒng)發(fā)育關(guān)系。這些進(jìn)化樹(shù)中的大多數(shù),是與使用742個(gè)基因CDS序列(共4 069 848位點(diǎn))串聯(lián)方法建立的進(jìn)化樹(shù)高度一致的(圖5)(使用3 384個(gè)基因AA序列建立的進(jìn)化樹(shù),和使用1 791個(gè)基因AA序列建立的進(jìn)化樹(shù),也是相同的最佳拓?fù)浣Y(jié)構(gòu))。

        2.2.1 木蘭類(lèi)植物、單子葉植物及雙子葉植物間演化關(guān)系 無(wú)論核酸序列還是蛋白質(zhì)序列,使用串聯(lián)法和溯祖法建立的進(jìn)化樹(shù)基本都支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,單子葉植物),木蘭類(lèi)植物](圖4)。

        2.2.2 金栗蘭科與金魚(yú)藻科 我們的研究表示,金魚(yú)藻科是真雙子葉植物的姊妹群,這與前人的研究結(jié)果一致(圖4)。但金栗蘭科是所有被子植物(除ANITA外)的基底旁系群,這與APG IV認(rèn)為的“金栗蘭科是木蘭類(lèi)植物的姊妹群”是不同的。

        2.2.3 雙子葉植物內(nèi)部各目的系統(tǒng)發(fā)育關(guān)系 我們的研究認(rèn)為,五椏果科是薔薇類(lèi)植物和菊類(lèi)植物共同的姊妹群,虎耳草目是薔薇類(lèi)植物的姊妹群,這都與APG IV一致(圖4)。

        APG IV認(rèn)為“檀香目和石竹目是菊類(lèi)植物的姊妹群”,而我們的研究否定了這一結(jié)論:20棵進(jìn)化樹(shù)中,所有結(jié)果都支持“石竹目是薔薇類(lèi)植物的姊妹群”;大部分支持“檀香目是薔薇類(lèi)植物的姊妹群”,這與Zeng et al.( 2017)的研究結(jié)果一致;少部分支持“檀香目是薔薇類(lèi)植物和菊類(lèi)植物共同的姊妹群”(圖4)。

        APG IV認(rèn)為“智利藤目是菊類(lèi)植物的姊妹群”,而我們的研究只有少部分支持這一結(jié)論。使用蛋白質(zhì)序列建立的進(jìn)化樹(shù),無(wú)論串聯(lián)還是溯祖法,都支持“智利藤目是薔薇類(lèi)植物和菊類(lèi)植物共同的姊妹群”。使用核酸序列建立的進(jìn)化樹(shù),隨著基因數(shù)目的增多,逐漸轉(zhuǎn)變?yōu)橹С帧爸抢倌渴蔷疹?lèi)植物的姊妹群”,與APG IV一致(圖4)。

        2.3 分化時(shí)間估計(jì)

        基于742個(gè)基因CDS序列串聯(lián)方法建立的進(jìn)化樹(shù),我們估計(jì)了被子植物的分化時(shí)間(圖6)。我們認(rèn)為被子植物的起源時(shí)間為237.78百萬(wàn)年前(95%置信區(qū)間為202.6~278.08),與主流觀點(diǎn)認(rèn)為的225百萬(wàn)年至240百萬(wàn)年前一致 (Magallon,2010; Smith et al.,2010; Zeng et al.,2014)。木蘭類(lèi)植物與單子葉植物和真雙子葉植物的分化時(shí)間約為166.11百萬(wàn)年前;五椏果科與薔薇類(lèi)和菊類(lèi)植物的分化時(shí)間約為124.23百萬(wàn)年前;薔薇類(lèi)植物與菊類(lèi)植物的分化時(shí)間約為116.98百萬(wàn)年前;唇形類(lèi)植物(Lmiids)與桔梗類(lèi)植物(Campanulids)的分化時(shí)間約為102.37百萬(wàn)年前。

        3 討論與結(jié)論

        長(zhǎng)期以來(lái),被子植物的系統(tǒng)發(fā)育關(guān)系重建,都是使用質(zhì)體基因、線(xiàn)粒體基因或少數(shù)保守的單拷貝核基因。Yang & Smith(2014)報(bào)道了一種基于系統(tǒng)進(jìn)化樹(shù)的同源基因聚類(lèi)及去旁系同源基因的方法,我們使用此種方法對(duì)收集的88種植物核基因集進(jìn)行聚類(lèi),共獲得了多達(dá)5 993個(gè)one-to-one基因家族,并從這個(gè)數(shù)據(jù)集里面截取各種大小的數(shù)據(jù)進(jìn)行進(jìn)化樹(shù)重建,以測(cè)定進(jìn)化樹(shù)的穩(wěn)定性。

        獲得比以前更多的核基因家族后,制約系統(tǒng)演化關(guān)系構(gòu)建的另一個(gè)因素就是大量的計(jì)算資源和計(jì)算時(shí)間。構(gòu)建系統(tǒng)進(jìn)化樹(shù)時(shí),一般需要設(shè)置bootstrap值(100~1 000)迭代,此步驟非常耗費(fèi)計(jì)算時(shí)間。Nguyen et al.(2015)發(fā)表的軟件iqtree,采用ultrafast bootstrap approximation(UFBoot)方法獲得bootstrap值(Von Haeseler et al.,2013),比RAxML軟件的傳統(tǒng)方法,計(jì)算速度快10~40倍,并且獲得的bootstrap值更精確。

        我們使用多達(dá)5 993個(gè)one-to-one基因家族構(gòu)建的進(jìn)化樹(shù),與APG IV報(bào)道的主要差異為檀香目和石竹目在系統(tǒng)發(fā)育樹(shù)中的位置,本研究認(rèn)為“檀香目和石竹目是薔薇類(lèi)植物的姊妹群”,而APG IV認(rèn)為“檀香目和石竹目是菊類(lèi)植物的姊妹群”??赡茉蛴幸韵聝蓚€(gè):一是基因數(shù)目的增多;二是本研究所選88個(gè)植物只有一半使用的基因組序列,另一半為轉(zhuǎn)錄組序列,而轉(zhuǎn)錄組序列一般存在大量的基因缺失(即未表達(dá)基因較多)。

        A. Bootstrap值; B. 基因支持率。紅色表示支持,藍(lán)色表示拒絕,紅色星星表示支持率最高的拓?fù)浣Y(jié)構(gòu)。

        A. Bootstrap value; B. Gene trees support ratio. Red represents support,blue represents rejection,the topology labeled with a red star represents the most support.枝上斜線(xiàn)左邊數(shù)字為bootstrap值,右邊數(shù)字為基因支持率。

        灰色條紋為分化時(shí)間的95%置信區(qū)間,九個(gè)化石校準(zhǔn)時(shí)間為(1)銀杏分化時(shí)間為290百萬(wàn)年至310百萬(wàn)年前;(2)單子葉植物和真雙子葉植物分化時(shí)間為130百萬(wàn)年至200百萬(wàn)年前;(3)真雙子葉植物共同祖先(即最早的雙子葉植物化石記錄)為125 百萬(wàn)年前;(4)山龍眼目(Proteales)的共同祖先為108.8百萬(wàn)年前;(5)山茱萸目(Cornales)共同祖先為85.8百萬(wàn)年前;(6)唇形目(Lamiales)共同祖先為44.3百萬(wàn)年前;(7)葡萄目(Vitales)與其余薔薇類(lèi)植物間分化時(shí)間為105百萬(wàn)年至115百萬(wàn)年前;(8)豆目(Fabales)與殼斗目(Fagales)間分化時(shí)間為93.5百萬(wàn)年前;(9)Arabidopsis thaliana與Populus trichocarpa間分化時(shí)間為97百萬(wàn)年至109百萬(wàn)年前。

        Grey bars are 95% confidence intervals,nine fossil calibration points are as follows:(1) The divergence time of Ginkgo biloba is 290 million years to 310 million years ago; (2) The divergence time of eudicots and monocots is 130 million years to 200 million years ago; (3) The divergence time of eudicots is 125 million years ago; (4) The divergence time of Proteales is 108.8 million years ago; (5) The divergence time of Cornales is 85.8 million years ago; (6) The divergence time of Lamiales is 44.3 million years ago; (7) The divergence time of Vitales from Rosids is 105 million years to 115 million years ago; (8) The divergence time of Fabales and Fagales is 93.5 million years ago; (9) The divergence time of Arabidopsis thaliana and Populus trichocarpa is 97 million years to 109 million years ago.總的來(lái)說(shuō),本研究不僅進(jìn)一步確定了被子植物各目間系統(tǒng)發(fā)育關(guān)系,而且為“使用更多的基因和計(jì)算速度更快的方法構(gòu)建進(jìn)化樹(shù)”探討了一種可行性策略:即使用Yang & Smith(2014)報(bào)道的同源基因聚類(lèi)及去旁系同源基因方法,獲得大量的one-to-one基因家族,再使用IQ-TREE(串聯(lián)法)和ASTRAL(溯祖法)軟件,能快速精確的計(jì)算出進(jìn)化樹(shù)。隨著更多植物基因組的測(cè)序和基因聚類(lèi)及系統(tǒng)發(fā)育關(guān)系構(gòu)建方法的進(jìn)一步優(yōu)化,被子植物系統(tǒng)發(fā)育關(guān)系將越來(lái)越精確,例如進(jìn)一步準(zhǔn)確確定檀香目和石竹目在被子植物中與其他進(jìn)化分支之間的關(guān)系。

        參考文獻(xiàn):

        BOLGERAM,LOHSE M,USADEL B,2014. Trimmomatic:A flexible trimmer for Illumina sequence data[J]. Bioinforma-tics,30(15):2114-2120.

        CALL VB,DILCHER DL,1992. Investigations of angiosperms from the Eocene of southeastern North America:Samaras of Fraxinus wilcoxiana Berry[J]. Rev Palaeobot Palynol,74:249-266.

        CHAW SM,LIU YC,WU YW,et al.,2019. Stout camphor tree genome fills gaps in understanding of flowering plant genome evolution[J]. Natl Plants,5(1):63-73.

        CHEN JH,HAO ZD,GUANG XM,et al.,2019. Liriodendron genome sheds light on angiosperm phylogeny and species-pair differentiation[J]. Nat Plants,5(1):18-25.

        CRANE PR,HERENDEEN PS,1996. Cretaceous floras containing angiosperm flowers and fruits from eastern North America[J]. Rev Palaeobot Palynol,90:319-337.

        EBERSBERGER I,STRAUSS S,VON HAESELER A,2009. HaMStR:Profile hidden markov model based search for orthologs in ESTs[J]. Bmc Evol Biol,9(1):157-157.

        ENDRESS PK,DOYLE JA,2009. Reconstructing the ancestral angiosperm flower and its initial specializations[J]. Am J Bot,96(1):22-66.

        FAWCETT JA,MAERE S,VAN DE PEER Y,2009. Plants with double genomes might have had a better chance to survive the Cretaceous-Tertiary extinction event[J]. Proc Natl Acad Sci USA,106(14):5737-5742.

        FRIIS EM,PEDERSEN KR,SCHNENBERGER J,2006. Normapolles plants:A prominent component of the Cretaceous rosid diversification[J]. Plant Syst Evol,260:107-140.

        FU Q,DIEZ JB,POLE M,et al.,2018. An unexpected noncarpellate epigynous flower from the Jurassic of China[J]. Elife,7:e38827.

        GAO Z,BARRY AT,1989. A review of fossil cycad megasporophylls,with new evidence of Crossozamia pomel and its associated leaves from the lower permian of Taiyuan,China[J]. REV Palaeobot Palynol,60(3-4):205-223.

        GRABHERR MG,HAAS BJ,YASSOUR M,et al.,2011. Full-length transcriptome assembly from RNA-Seq data without a reference genome[J]. Nat Biotechnol,29(7):644-652.

        HE ZL,ZHANG HK,GAO SH,et al.,2016. Evolview v2:An online visualization and management tool for customized and annotated phylogenetic trees[J]. Nucl Acid Res,44(W1):236-241.

        HERENDEEN PS,1995. The enigma of angiosperm origins[J]. Earth-Sci Rev,39(1):253-254.

        KATOH K,STANDLEY DM,2013. MAFFT multiple sequence alignment software version 7:Improvements in performance and usability[J]. Mol Biol Evol,30(4):772-780.

        KUMAR S,STECHER G,SULESKI M,et al.,2017. TimeTree:A Resource for 598 timelines,timetrees,and divergence times[J]. Mol Biol Evol,34:1812-1819.

        LANFEAR R,F(xiàn)RANDSEN PB,WRIGHT AM,et al.,2016. PartitionFinder 2:New methods for selecting partitioned models of evolution formolecular and morphological phylogenetic analyses[J]. Mol Biol Evol,34(3): 772-773.

        LU LM,MAO LF,YANG T,et al.,2018. Evolutionary history of the angiosperm flora of China[J]. Nature,554(1):234-238.

        LI HT,YI TS,GAO LM,et al.,2019. Origin of angiosperms and the puzzle of the Jurassic gap[J]. Nat Plants,5(1):461-470.

        MAGALLON S,2010. Using fossils to break long branches in molecular dating:A comparison of relaxed clocks applied to the origin of angiosperms[J]. Syst Biol,59(4):384-399.

        MOORE MJ,HASSAN N,GITZENDANNER MA,et al.,2011. Phylogenetic analysis of the plastid inverted repeat for 244 species:Insights into deeper-level angiosperm relationships from a long,slowly evolving sequence region[J]. Int J Plant Sci,172(4):541-558.

        MOORE MJ,SOLTIS PS,BELL CD,et al.,2010. Phylogenetic analysis of 83 plastid genes further resolves the early diversification of eudicots[J]. Proc Natl Acad Sci USA,107(10):4623-4628.

        NGUYEN LT,SCHMIDT HA,VON HAESELER A,et al.,2015. IQ-TREE:A fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies[J]. Mol Biol Evol,32(1):268-274.

        QIU YL,LI LB,WANG B,et al.,2010. Angiosperm phylogeny inferred from sequences of four mitochondrial genes[J]. JSE,48(6):391-425.

        RUHFEL BR,GITZENDANNER MA,SOLTIS PS,et al.,2014. From algae to angiosperms-inferring the phylogeny of green plants (Viridiplantae) from 360 plastid genomes[J]. Bmc Evol Biol,14(1):23.

        SMITH SA,BEAULIEU JM,DONOGHUE MJ,2010. An uncorrelated relaxed-clock analysis suggests an earlier origin for flowering plants[J]. Proc Natl Acad Sci USA,107(13): 5897-5902.

        SMITH SA,DUNN CW,2008. Phyutility:A phyloinformatics tool for trees,alignments and molecular data[J]. Bioinformatics,24(5):715-716.

        SOLTIS DE,SMITH SA,CELLINESE N,et al.,2011. Angiosperm phylogeny:17 genes,640taxa[J]. Am J Bot,98(4): 704-730.

        STAMATAKIS A,2014. RAxML Version 8:A tool for phylogenetic analysis and post—analysis of large phylogenies[J]. Bioinformatics,30(9):1312-1313.

        TAKAHASHI M,CRANE PR,MANCHESTER SR,2002. Hironoia fusiformis gen. et sp. nov.,a cornalean fruit from the Kamikitaba locality (Upper Cretaceous,Lower Coniacian) in northeastern Japan[J]. J Plant Res,115:463-473.

        THE ANGIOSPERM PHYLOGENY GROUP,2016. An update of the angiosperm phylogeny group classification for the orders and families of flowering plants:APGIV[J]. Bot J Linn Soc,181(1):1-20.

        VANDS,2000. Graph Clustering by Flow Simulation[M]. University of Utrecht.

        VONHAESELER A,MINH BQ,NGUYEN MAT,2013. Ultrafast approximation for phylogenetic bootstrap[J]. Mol Biol Evol,30(5):1188-1195.

        WICKETT NJ,MIRARAB S,NGUYEN N,et al.,2014. Phylotranscriptomic analysis of the origin and early diversification of land plants[J]. Proc Natl Acad Sci USA,111(45): 4859-4868.

        WORBERG A,QUANDT D,BARNISKE AM,et al.,2007. Phylogeny of basal eudicots:Insights from non-coding and rapidly evolving DNA[J]. Org Divers Evol,7(1):55-77.

        YANG Z,2007. PAML 4:Phylogenetic analysis by maximum likelihood[J]. Mol Biol Evol,24:1586-1591.

        YANG Y,MOORE MJ,BROCKINGTON SF,et al.,2015. Dissecting molecular evolution in the highly diverse plant clade caryophyllales using transcriptome sequencing[J]. Mol Biol Evol,32(8):2001-2014.

        YANG Y,SMITH SA,2014. Orthology inference in nonmodel organisms using transcriptomes and low-coverage genomes:Improving accuracy and matrix occupancy for phylogenomics[J]. Mol Biol Evol,31(11):3081-3092.

        ZENG LP,ZHANG N,ZHANG Q,et al.,2017. Resolution of deep eudicot phylogeny and their temporal diversification using nuclear genes from transcriptomic and genomic datasets[J]. New Phytol,214(3):1338-1354.

        ZENG LP,ZHANG Q,SUN RR,et al.,2014. Resolution of deep angiosperm phylogeny using conserved nuclear genes and estimates of early divergence times[J]. Nat Comm,5(1): 4956.

        ZHANG C,SAYYARI E,MIRARAB S,2017. ASTRAL-III:Increased scalability and impacts of contracting low support branches[J]. RECOMB-CG,Springer,Cham:53-75.

        ZHANG N,ZENG LP,SHAN HY,et al.,2012. Highly conserved low-copy nuclear genes as effective markers for phylogenetic analyses in angiosperms[J]. New Phytol,195(4):923-937.

        (責(zé)任編輯 周翠鳴)

        久久久精品亚洲人与狗| 久青草国产视频| 精品无吗国产一区二区三区av| 亚洲国产成人精品久久成人| 国产91久久麻豆黄片| 国产md视频一区二区三区| 国产精品户露av在线户外直播| 亚洲av午夜成人片精品| 日韩国产自拍视频在线观看| 人妻熟妇乱又伦精品视频| 午夜精品一区二区三区的区别| 国产成人精品三级麻豆 | 国产亚洲精品精品精品| 艳妇乳肉豪妇荡乳av无码福利| 杨幂Av一区二区三区| 亚洲国产精品av麻豆网站| 久久人人爽爽爽人久久久| 在线观看国产精品日韩av| 青青草99久久精品国产综合| 高清不卡av一区二区| 黑人巨大精品欧美一区二区免费 | 91网红福利精品区一区二| 毛片精品一区二区二区三区| 久久一道精品一区三区| 国产高潮视频在线观看| 毛片网站视频| 日韩精品一级在线视频| 国产玉足榨精视频在线观看| 被群cao的合不拢腿h纯肉视频| 日韩在线精品在线观看| 我揉搓少妇好久没做高潮| 国产三级精品三级| 国产亚洲精品aaaa片app| 青青草一级视频在线观看| 久久久精品国产性黑人| 久久水蜜桃亚洲av无码精品麻豆| 精品人伦一区二区三区蜜桃麻豆| 久久狼人国产综合精品| 无遮挡18禁啪啪羞羞漫画| 北条麻妃毛片在线视频| 女同久久精品国产99国产精|