亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基因組預(yù)測(cè)的序列數(shù)據(jù)在家畜育種中的應(yīng)用

        2021-09-05 20:09:43張配配黃選洋
        關(guān)鍵詞:變異

        張配配 校 黃選洋 譯

        摘? 要:全基因組序列數(shù)據(jù)的使用在家畜育種計(jì)劃中具有巨大的潛力,可以提高發(fā)現(xiàn)變異基因的能力,同時(shí)能更準(zhǔn)確和更持久地預(yù)測(cè)育種值而不是標(biāo)記陣列。要了解家畜基因組序列數(shù)據(jù)的全部潛力,需要從大量的個(gè)體,甚至要從數(shù)百萬(wàn)個(gè)個(gè)體上獲得基因組序列和表型數(shù)據(jù),從而準(zhǔn)確地估測(cè)構(gòu)成數(shù)量性狀基礎(chǔ)的大量致病變異的影響。

        關(guān)鍵詞:全基因組;標(biāo)記陣列;估測(cè);變異;雜交剝離

        中圖分類號(hào):S813.3 文獻(xiàn)標(biāo)志碼:C 文章編號(hào):1001-0769(2021)04-0012-03

        低成本的測(cè)序策略結(jié)合估測(cè)法(imputation),能夠以負(fù)擔(dān)得起的成本為大量個(gè)體生成所需基因組序列的信息。低覆蓋率使研究人員對(duì)大量個(gè)體進(jìn)行基因組測(cè)序成為可能,這可以提高變異的發(fā)現(xiàn)率,特別是低頻率的變異,并能加強(qiáng)根據(jù)基因組序列數(shù)據(jù)對(duì)整個(gè)群體的估測(cè)。

        本文介紹了我們?cè)谝豁?xiàng)研究中所采用的策略,該研究對(duì)來(lái)自9個(gè)商業(yè)品系的7 848頭豬進(jìn)行了全基因組測(cè)序,這些品系大部分處于低覆蓋率范圍。隨后,我們證明,將該測(cè)序策略與“雜交剝離”估測(cè)法相結(jié)合,是一種可為大群家畜純種系譜產(chǎn)生全基因組序列數(shù)據(jù)的有效策略。最后,我們測(cè)試了這些大數(shù)據(jù)集對(duì)合成表型的基因組預(yù)測(cè)的優(yōu)勢(shì)。

        1? 材料和方法

        1.1 測(cè)序策略

        我們對(duì)Genus plc公司的9個(gè)商業(yè)品系(PIC豬商業(yè)品系,公司位于美國(guó)田納西州亨德森縣)的7 848頭豬的全基因組進(jìn)行了測(cè)序。測(cè)序時(shí),我們從每個(gè)品系中選擇約2%(1.7%~2.5%)的豬。結(jié)果表明,大多數(shù)豬處于低覆蓋率,目標(biāo)覆蓋率為1倍或2倍,一小部分豬處于較高的覆蓋率,分別為5倍、 15倍或30倍。個(gè)體的平均覆蓋率為4.1倍,但中位數(shù)為1.5倍。我們使用三步策略選擇個(gè)體和這些個(gè)體的覆蓋范圍:

        第一步:在純種系譜中貢獻(xiàn)最多基因型后代的父系和母系分別擁有2倍和1倍的覆蓋率。

        第二步:AlphaSeqOpt法第1部分用于識(shí)別在種群?jiǎn)伪缎椭姓加凶畲蟊壤膯伪缎蛡€(gè)體,并在控制總成本的前提下,為它們及其祖先分配一個(gè)介于0倍至30倍的最優(yōu)水平的測(cè)序覆蓋。

        第三步:AlphaSeqOpt法第2部分用于識(shí)別累計(jì)覆蓋率低(低于10倍)的單倍型個(gè)體,并對(duì)這些個(gè)體進(jìn)行1倍測(cè)序,以增加單倍型的累計(jì)覆蓋率(即大于或等于10倍)。

        AlphaSeqOpt法使用根據(jù)階段性標(biāo)記陣列基因型推斷的單倍型。

        1.2 發(fā)現(xiàn)變異

        將測(cè)序結(jié)果與Sscrofa 11.1參考基因組進(jìn)行比對(duì),利用一個(gè)基于GATK 3.8的Haplotype-Caller工具的數(shù)據(jù)來(lái)源找出變異。為了避免在應(yīng)用低覆蓋率序列數(shù)據(jù)時(shí)對(duì)GATK引入的參考等位基因產(chǎn)生誤差,我們利用堆積函數(shù)提取了支持該等位基因的讀取數(shù),結(jié)果從這9個(gè)品系中共發(fā)現(xiàn)了6 000萬(wàn)個(gè)單核苷酸多態(tài)性(Single Nucleotide Polymorphisms,SNPs)。

        1.3 估測(cè)全基因組序列數(shù)據(jù)

        使用商業(yè)標(biāo)記陣列對(duì)每個(gè)群體中的大多數(shù)個(gè)體進(jìn)行基因分型,擁有15 000個(gè)低密度(Low Density,LD)或75 000個(gè)高密度(High Density,HD)全基因組標(biāo)記。正如用AlphaPeel法測(cè)算的那樣,采用雜交剝離估測(cè)法分別估測(cè)每個(gè)群體的全基因組序列。該方法通過(guò)兩階段,降低估測(cè)成本:

        · 多軌跡迭代剝離,可以根據(jù)數(shù)組中的該標(biāo)記估計(jì)分離概率。

        · 改進(jìn)的單位點(diǎn)迭代剝離,可以基于序列數(shù)據(jù)旁側(cè)數(shù)組的該標(biāo)記的估測(cè)值,利用該序列數(shù)據(jù)大致估計(jì)任何其他變異位點(diǎn)上的分離概率。由于每條染色體中重組基因的數(shù)量有限,以及附近標(biāo)記共同被遺傳的概率很高,這種大致估測(cè)的精度損失可以忽略不計(jì)。9個(gè)品系估測(cè)出的豬總數(shù)約為35萬(wàn)頭。

        為了評(píng)估估測(cè)的準(zhǔn)確性,我們使用了來(lái)自4個(gè)大小不同的群體在高覆蓋率(15倍或30倍)下測(cè)序的284個(gè)個(gè)體。被檢測(cè)個(gè)體的序列數(shù)據(jù)用留一法設(shè)計(jì)(leave-one-out design)可以完全掩蓋。將估測(cè)的等位基因劑量與獲得完整數(shù)據(jù)的等位基因劑量進(jìn)行比較,認(rèn)為是“真”值。

        1.4 基因組的預(yù)測(cè)

        我們?cè)谝粋€(gè)擁有3萬(wàn)個(gè)個(gè)體的品系中檢測(cè)了基因組預(yù)測(cè)的準(zhǔn)確性,這些個(gè)體的估測(cè)基因型為1 600萬(wàn)個(gè)SNPs。正如在AlphaBayes軟件中預(yù)測(cè)的那樣,使用嶺回歸( ridge regression)模型預(yù)測(cè)基因組。

        利用該模式測(cè)試了22 318個(gè)個(gè)體,驗(yàn)證了1 458個(gè)個(gè)體。對(duì)9個(gè)具有不同遺傳力和數(shù)量性狀核苷酸(Quantitative Trait Nucleotides,QTN)的合成性狀進(jìn)行基因組預(yù)測(cè)。

        使用4組標(biāo)記進(jìn)行基因組預(yù)測(cè):從陣列中預(yù)選5.7萬(wàn)個(gè)標(biāo)記(HD),從基于LD修剪的序列數(shù)據(jù)中預(yù)選24.8萬(wàn)個(gè)變體[全基因組測(cè)序(Whole Genome Sequencing,WGS)_LD,WGS_LD],從基于單標(biāo)記回歸結(jié)果[(WGS_基于總數(shù)據(jù)的孟德?tīng)栯S機(jī)化(Summary data-based Mendelian Randomization,SMR),WGS_SMR]的序列數(shù)據(jù)中預(yù)選18.3萬(wàn)個(gè)變體,或通過(guò)僅每保留第200個(gè)變體(WGS_200)從該序列數(shù)據(jù)中預(yù)選6.7萬(wàn)個(gè)變體?;蚪M估計(jì)育種值(Genomic Estimated Breeding Value,gEBV)的準(zhǔn)確性是根據(jù)該驗(yàn)證數(shù)據(jù)集中g(shù)EBV與合成表型之間的相關(guān)性來(lái)估計(jì)的。

        2? 結(jié)果和討論

        2.1 估測(cè)的準(zhǔn)確性

        對(duì)大多數(shù)受試個(gè)體而言,真實(shí)數(shù)據(jù)的估測(cè)精度較高(圖1)。平均個(gè)體劑量相關(guān)性為0.94,中位數(shù)為0.97,四分位數(shù)范圍為0.94~0.98。一些屬于該純種系譜最早幾個(gè)世代的最古老的個(gè)體(位于系譜的前20%)具有很低的估測(cè)精度,因?yàn)樗鼈儫o(wú)法提供其直系祖先的信息,或能夠提供的信息極少,這影響了估測(cè)精度。

        較晚幾個(gè)世代的個(gè)體(位于系譜中前20%的后面)有更高的估測(cè)精度,平均劑量相關(guān)性為0.97,變異性更低:中位數(shù)為0.98,四分位數(shù)間距為0.96~0.99。

        個(gè)體的標(biāo)記陣列密度與用標(biāo)記陣列基因分型獲得的直系祖先的數(shù)量相矛盾,但對(duì)稍后幾個(gè)世代的個(gè)體而言,標(biāo)記陣列密度的HD和LD之間無(wú)顯著差異,種群大小對(duì)估測(cè)精度的影響無(wú)明顯的傾向性。

        2.2 基因預(yù)測(cè)

        在某些情況下,與標(biāo)記陣列相比,序列數(shù)據(jù)能夠提供更好的預(yù)測(cè)精度,但其優(yōu)勢(shì)取決于該性狀的遺傳結(jié)構(gòu)。

        表1列出了9個(gè)合成性狀的基因組預(yù)測(cè)精度。當(dāng)QTN的數(shù)量較小時(shí),可以識(shí)別能支撐該性狀的遺傳變異的變體(variants)具有足夠的統(tǒng)計(jì)功效(statistical power),使用這些變體(WGS_SMR)進(jìn)行預(yù)測(cè)的準(zhǔn)確性高于用來(lái)自商業(yè)標(biāo)記陣列(HD)的標(biāo)記進(jìn)行預(yù)測(cè)的。這與之前的觀察結(jié)果一致,添加一個(gè)或幾個(gè)具有較大作用的標(biāo)記作為預(yù)測(cè)因子可以提高該標(biāo)記序列的預(yù)測(cè)精度。

        當(dāng)QTN的數(shù)量較大時(shí),WGS_SMR的性能比HD的差。在這種情況下,從序列數(shù)據(jù)中選擇的其他變異集可能(略微)比商業(yè)標(biāo)記序列更有利,因?yàn)樗鼈儾粫?huì)像商業(yè)標(biāo)記序列那樣受到確定偏倚(ascertainment bias)的影響。

        這些結(jié)果部分是由于目前使用商業(yè)標(biāo)記陣列進(jìn)行基因組選擇已經(jīng)獲得了很高的預(yù)測(cè)準(zhǔn)確性,且與其他研究結(jié)果一致。后者發(fā)現(xiàn),與HD標(biāo)記陣列相比,序列數(shù)據(jù)在基因組預(yù)測(cè)上沒(méi)有改善或只有微小的變化。有待確定的是,結(jié)果是否會(huì)因以下原因而得到改善:來(lái)自多個(gè)品種的數(shù)據(jù),使用多品種測(cè)試和更大的測(cè)試集,或比嶺回歸更適合于大規(guī)模開(kāi)發(fā)序列數(shù)據(jù)的基因組預(yù)測(cè)方法。

        3? 結(jié)論

        無(wú)論種群的規(guī)模多大,只要個(gè)體與具有標(biāo)記陣列或序列數(shù)據(jù)的親緣聯(lián)系在一起,同時(shí)該親緣有足夠多的信息,恰當(dāng)?shù)臏y(cè)序策略和“雜交剝離”的結(jié)合是在大群的純種系譜中生成全基因組序列數(shù)據(jù)的一種有效方法。

        目前尚不清楚,這些帶有估測(cè)序列數(shù)據(jù)的大數(shù)據(jù)集是否能夠提高基因組預(yù)測(cè)的準(zhǔn)確性。

        原題名:Sequence data for genomic prediction in livestock breeding(英文)

        原作者:Roger Ros-Freixedes等(愛(ài)丁堡大學(xué))

        猜你喜歡
        變異
        新型冠狀病毒關(guān)切變異株的研究進(jìn)展
        傳染病信息(2022年6期)2023-01-12 08:56:26
        變異危機(jī)
        變異
        大型水利樞紐下游水沙變異特征
        制造趣味物種變異
        基因突變與生物變異
        生物的變異與進(jìn)化
        變異的蚊子
        病毒的變異
        術(shù)語(yǔ)的變異問(wèn)題
        2018天天躁夜夜躁狠狠躁| 久久99老妇伦国产熟女高清| 在线播放偷拍一区二区| 国产在线一区二区三区乱码| 国产剧情亚洲一区二区三区| 国产亚洲一区二区三区综合片| 狠狠色狠狠色综合| 日本一本久道| 亚洲黄片av在线免费观看| 国产一区二区三区在线观看完整版| 麻豆国产在线精品国偷产拍| 日韩在线看片| 日韩人妻免费一区二区三区| 日本亚洲国产精品久久| 国产a国产片国产| 少妇高潮惨叫久久久久久| 免费a级毛片无码a∨免费| 久久亚洲春色中文字幕久久| 国产精品中文久久久久久久| 日本aⅴ大伊香蕉精品视频| 最新精品国偷自产在线婷婷| 国产精品区二区东京在线| 丰满人妻熟妇乱又仑精品| 国产av一区二区精品久久凹凸| 久久久久成人精品免费播放| 日本视频一区二区二区| 久久91精品国产一区二区| 亚洲女同一区二区| 亚洲国产中文在线二区三区免| 黄色三级视频中文字幕| 精品一区中文字幕在线观看| 伊人久久精品久久亚洲一区 | 亚洲av一区二区三区蜜桃| 久久婷婷人人澡人人喊人人爽 | 青青草视频在线观看视频免费| 女人的精水喷出来视频| 亚洲有码转帖| 日本啪啪一区二区三区| 人妻免费一区二区三区免费| 久久丫精品国产亚洲av不卡| 性做久久久久久久|