亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        參考群篩選方法及規(guī)模對(duì)基因型填充準(zhǔn)確性的影響

        2021-12-31 01:08:46陽文攀葉紹潘葉浩強(qiáng)張志剛張細(xì)權(quán)陳贊謀
        畜牧獸醫(yī)學(xué)報(bào) 2021年12期
        關(guān)鍵詞:一致性方法

        陽文攀,葉紹潘,葉浩強(qiáng),林 清,魏 趁,張志剛,張細(xì)權(quán),陳贊謀,張 哲*

        (1.華南農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)學(xué)院 國家生豬種業(yè)工程技術(shù)研究中心,廣州 510642;2.福建傲農(nóng)生物科技集團(tuán)股份有限公司,漳州 363000;3.廈門銀祥集團(tuán)有限公司 肉食品安全生產(chǎn)技術(shù)國家重點(diǎn)實(shí)驗(yàn)室,廈門 361100;4.汕頭大學(xué)理學(xué)院,廣東省海洋生物技術(shù)重點(diǎn)實(shí)驗(yàn)室,汕頭 515063)

        在畜禽選育中,育種值估計(jì)準(zhǔn)確性是影響畜禽遺傳進(jìn)展的重要因素之一?;蚪M選擇(genomic selection,GS)能有效提高育種值估計(jì)準(zhǔn)確性,已在奶牛育種中取得了較大效益[1],并逐漸推廣到豬[2]、雞[3]、魚[4]等畜禽及水產(chǎn)品種選育中。在實(shí)施基因組選擇時(shí),參考群規(guī)模和標(biāo)記密度是影響基因組選擇準(zhǔn)確性的重要因素[5-6]。由于基因分型成本較高,常通過構(gòu)建具有高密度SNP芯片數(shù)據(jù)或全基因組序列數(shù)據(jù)的參考群體,根據(jù)不同方法對(duì)低密度SNP芯片進(jìn)行基因型填充,以獲得高質(zhì)量的基因型數(shù)據(jù)[7-9]。目前,該技術(shù)已廣泛應(yīng)用于奶牛[10]、豬[11]、雞[12]等畜禽育種中。

        通過基因型填充獲取高質(zhì)量高密度的基因型數(shù)據(jù)是提高基因組選擇準(zhǔn)確性的有效方式之一[13]。然而,基因型填充的準(zhǔn)確性受諸多因素影響,如基因型填充軟件[14]、參考群規(guī)模[15]、參考群體和目標(biāo)群體之間的關(guān)系[16]等。其中,參考群篩選和構(gòu)建方式尤為重要,參考群規(guī)模越大,基因型填充準(zhǔn)確性越高,然而基因分型成本也隨之增加[17]。研究表明,當(dāng)參考群體與目標(biāo)群體間的親緣關(guān)系較近時(shí),兩者之間的單倍型長度和數(shù)量都會(huì)增加,使填充更準(zhǔn)確[18-19]。因此,如何篩選關(guān)鍵個(gè)體構(gòu)建參考群至關(guān)重要,能夠保證基因型填充準(zhǔn)確性從而降低成本。

        本研究擬使用矮小黃羽肉雞資源群體作為研究對(duì)象,采用不同方法篩選關(guān)鍵個(gè)體構(gòu)建參考群,將低密度標(biāo)記的驗(yàn)證群填充至高密度標(biāo)記,通過比較不同參考群篩選方法的基因型填充準(zhǔn)確性及其在基因組預(yù)測(cè)中的應(yīng)用效果,探究構(gòu)建參考群最佳的策略,為基因型填充技術(shù)在遺傳育種中的應(yīng)用提供參考。

        1 材料與方法

        1.1 試驗(yàn)群體

        本研究所用群體來自廣東溫氏南方家禽育種有限公司提供的矮小型黃羽肉雞N301系第25世代03批次,共1 600羽個(gè)體,公母各半,全部由30只公雞和360只母雞產(chǎn)生。結(jié)合系譜信息和性狀記錄的完整性,選取15羽親本公雞及435羽子代公雞送往上海伯豪生物技術(shù)有限公司(Shanghai Biotechnology Corporation)進(jìn)行基因分型,基因分型采用雞600K SNP芯片(Affymetrix Axion HD genotyping array),最終共檢測(cè)到559 898個(gè)SNPs位點(diǎn)。同時(shí)測(cè)定435羽子代公雞45、56、70、84、91日齡體重。

        1.2 低密度芯片數(shù)據(jù)模擬

        為保證SNP芯片的質(zhì)量及基因型填充,本研究使用Plink v1.90[20]去除未定位到參考基因組染色體上的SNP位點(diǎn)后剩余552 335個(gè)SNPs,使用Beagle4.0(r1399)[21]對(duì)缺失位點(diǎn)進(jìn)行填充;使用Plink對(duì)填充后的數(shù)據(jù)進(jìn)行質(zhì)量控制,剔除小等位基因頻率小于0.005的SNP位點(diǎn),剩余464 119個(gè)SNPs。60K芯片數(shù)據(jù)生成采用隨機(jī)提取和相等排序間隔提取兩種方式,共進(jìn)行5次重復(fù)。隨機(jī)提取方式是使用R v4.0.1[22]軟件設(shè)立3組隨機(jī)數(shù)種子,從464 119個(gè)SNPs中隨機(jī)選取46 412個(gè)SNPs生成,共3次重復(fù)。相等排序間隔提取方式是從根據(jù)染色體與物理位置排序后的600K芯片中每隔10個(gè)SNPs取1個(gè)SNP,從第2、7個(gè)SNP開始,共2次重復(fù)。

        1.3 關(guān)鍵群體篩選方法

        為探究不同參考群篩選方法對(duì)基因型填充準(zhǔn)確性的影響,本研究主要涉及表1中的5種參考群篩選方法。

        表1 不同參考群篩選方法Table 1 The different methods for choosing reference population

        1.4 基因型填充準(zhǔn)確性影響因素比較

        為探究不同版本Beagle軟件及系譜使用對(duì)基因型填充準(zhǔn)確性的影響,本研究根據(jù)MCA、RELA、KIN、RAN方法篩選前50個(gè)關(guān)鍵群體作為參考群,分別使用Beagle4.0+系譜信息、Beagle4.0、Beagle5.1(18May20.d20)[21,23]將60K SNP芯片數(shù)據(jù)填充至600K SNP芯片數(shù)據(jù),比較不同版本Beagle軟件及系譜使用基因型填充等位基因一致性比率。

        為探究不同參考群篩選方法對(duì)基因型填充準(zhǔn)確性的影響,本研究分別根據(jù)RELA、MCA、KIN、RAN方法篩選的前15個(gè)關(guān)鍵個(gè)體和15個(gè)共同祖先作為參考群,使用Beagle4.0與系譜信息對(duì)目標(biāo)群體進(jìn)行填充,軟件使用默認(rèn)參數(shù),將60K SNP芯片數(shù)據(jù)填充至600K SNP芯片數(shù)據(jù),比較不同篩選關(guān)鍵群體方法進(jìn)行基因型填充等位基因一致性比率。

        為探究參考群規(guī)模對(duì)基因型填充準(zhǔn)確性的影響,本研究分別根據(jù)MCA、KIN、RAN方法篩選的前15、25、50個(gè)關(guān)鍵個(gè)體作為參考群,使用Beagle4.0與系譜信息將60K SNP芯片數(shù)據(jù)填充至600K SNP芯片數(shù)據(jù),比較使用不同規(guī)模參考群進(jìn)行基因型填充等位基因一致性比率。

        為探究填充芯片對(duì)基因組預(yù)測(cè)準(zhǔn)確性的影響,本研究分別根據(jù)MCA、RAN方法篩選的前15、25、50個(gè)關(guān)鍵個(gè)體作為參考群,使用Beagle4.0與系譜信息將60K SNP芯片數(shù)據(jù)填充至600K SNP芯片數(shù)據(jù),比較填充芯片數(shù)據(jù)與真實(shí)芯片數(shù)據(jù)基因組預(yù)測(cè)準(zhǔn)確性與基因組預(yù)測(cè)無偏性。

        1.5 基因型填充準(zhǔn)確性的評(píng)估

        本研究使用兩種驗(yàn)證標(biāo)準(zhǔn)來衡量基因型填充準(zhǔn)確性。一種是等位基因一致性比率,另一種是基因組預(yù)測(cè)準(zhǔn)確性和無偏性。

        1.5.1 等位基因一致性比率 等位基因一致性比率為正確填充基因型所占百分比,其具體操作為:將60K SNP芯片填充至600K SNP芯片數(shù)據(jù)后,使用R軟件比較每個(gè)個(gè)體填充基因型與真實(shí)基因型間的正確率,并將其平均值作為基因型填充準(zhǔn)確性的評(píng)判依據(jù)。

        1.5.2 基因組預(yù)測(cè)準(zhǔn)確性和無偏性 為比較填充芯片數(shù)據(jù)與真實(shí)芯片數(shù)據(jù)在基因組預(yù)測(cè)中的應(yīng)用效果,本研究采用基因組最佳線性無偏預(yù)測(cè)(genomic best linear unbiased prediction,GBLUP)進(jìn)行預(yù)測(cè),具體公式如下:

        yi=u+ai+ei,

        基因組預(yù)測(cè)準(zhǔn)確性與無偏性為基因組估計(jì)育種值(GEBV)和校正表型間的相關(guān)系數(shù)與回歸系數(shù)。其具體操作為:使用R軟件中的lm函數(shù)對(duì)子代435羽個(gè)體45、56、70、84、91日齡體重等原始表型值進(jìn)行年-季節(jié)固定效應(yīng)校正,將殘差作為校正后的表型值用于交叉驗(yàn)證。使用R軟件中的 rrBLUP包[24]計(jì)算群體基因組估計(jì)育種值,通過5*10的交叉驗(yàn)證計(jì)算填充芯片數(shù)據(jù)與真實(shí)芯片數(shù)據(jù)基因組預(yù)測(cè)準(zhǔn)確性與無偏性。

        2 結(jié) 果

        2.1 Beagle版本與系譜信息對(duì)基因型填充準(zhǔn)確性的影響

        根據(jù)MCA、RELA、KIN、RAN方法篩選前50個(gè)關(guān)鍵個(gè)體作為參考群,使用不同版本Beagle與系譜信息進(jìn)行基因型填充準(zhǔn)確性估計(jì),如圖1所示。從圖1可知,使用Beagle5.1進(jìn)行基因型填充的等位基因一致性比率最低,為0.594~0.595。使用Beagle4.0進(jìn)行基因型填充,未使用系譜信息時(shí),MCA、RELA、KIN等方法進(jìn)行基因型填充的等位基因一致性比率為0.961、0.963、0.947;使用系譜信息時(shí),MCA、RELA、KIN等方法進(jìn)行基因型填充的等位基因一致性比率為0.970、0.971、0.953。提供系譜信息可以提高M(jìn)CA、RELA、KIN等方法的等位基因一致性比率,但會(huì)導(dǎo)致RAN方法等位基因一致性比率降低,使其從0.956降低至0.939。

        圖1 不同Beagle版本和系譜信息使用與否的基因型填充準(zhǔn)確性Fig.1 Genotype imputation accuracy by different Beagle versions and pedigree information

        2.2 不同篩選關(guān)鍵群體策略對(duì)基因型填充準(zhǔn)確性的影響

        表2展示了不同參考群篩選方法篩選的關(guān)鍵個(gè)體交叉數(shù)量??梢钥闯?,使用CA、MCA、RELA、KIN等方法篩選的參考群至少有10個(gè)共同個(gè)體,而RAN方法篩選出的15個(gè)關(guān)鍵個(gè)體與其它方法篩選出的關(guān)鍵個(gè)體無共同個(gè)體。

        表2 不同參考群篩選方法所篩選關(guān)鍵個(gè)體交叉表Table 2 Individual crosstab selected by different reference population selection methods

        根據(jù)RELA、MCA、KIN、RAN方法篩選的前15關(guān)鍵個(gè)體和15個(gè)共同祖先作為參考群,使用Beagle4.0與系譜信息對(duì)目標(biāo)群體進(jìn)行基因型填充,不同參考群篩選方法基因型填充準(zhǔn)確性如圖2所示。由圖2可知,MCA方法篩選參考群進(jìn)行基因型填充的等位基因一致性比率最高為0.757,其次是CA、RELA方法為0.755、0.751。此外,MCA、RELA、CA 3種方法的等位基因一致性比率差別較小,RAN方法等位基因一致性比率最低為0.595。

        圖2 不同參考群篩選方法的基因型填充準(zhǔn)確性Fig.2 Genotype imputation accuracy of different reference population choosing methods

        2.3 參考群規(guī)模對(duì)基因型填充準(zhǔn)確性的影響

        根據(jù)MCA、RELA、KIN、RAN方法篩選的前15、25、50個(gè)關(guān)鍵個(gè)體作為參考群,使用Beagle4.0與系譜信息對(duì)目標(biāo)群體進(jìn)行填充,不同參考群規(guī)模對(duì)基因型填充準(zhǔn)確性的影響如圖3所示。由圖3可以看出,MCA、RELA、KIN、RAN方法篩選的前15、25、50個(gè)關(guān)鍵個(gè)體作為參考群,基因型填充的等位基因一致性比率為0.595~0.757、0.773~0.897、0.939~0.971。隨著參考群規(guī)模增加,等位基因一致性比率也隨之增加。但隨著參考群規(guī)模增大(從15增加至25再增加至50),等位基因一致性比率的提升幅度下降,從0.150降低至0.100。當(dāng)參考群規(guī)模較小時(shí),MCA與RELA方法篩選參考群的等位基因一致性比率保持明顯優(yōu)勢(shì),但是隨著參考群規(guī)模的增加,MCA與RELA方法篩選參考群的等位基因一致性比率優(yōu)勢(shì)降低。

        圖3 不同參考群規(guī)模的基因型填充準(zhǔn)確性Fig.3 Genotype imputation accuracy of different reference population sizes

        2.4 填充芯片對(duì)基因組預(yù)測(cè)準(zhǔn)確性的影響

        根據(jù)MCA、RAN方法篩選的前15、25、50個(gè)關(guān)鍵個(gè)體作為參考群,使用Beagle4.0與系譜信息進(jìn)行基因填充,不同填充芯片與真實(shí)芯片數(shù)據(jù)基因組預(yù)測(cè)準(zhǔn)確性如表3、表4所示??梢钥闯?,真實(shí)芯片預(yù)測(cè)無偏性一般表現(xiàn)為最佳。隨著參考群規(guī)模增加,填充基因組預(yù)測(cè)準(zhǔn)確性與無偏性同真實(shí)芯片基因組預(yù)測(cè)準(zhǔn)確性與無偏性相比差別越小。相對(duì)于RAN方法,使用MCA方法篩選關(guān)鍵個(gè)體進(jìn)行基因型填充的基因組預(yù)測(cè)準(zhǔn)確性與真實(shí)芯片數(shù)據(jù)的預(yù)測(cè)結(jié)果更為接近。

        表3 基因型填充的基因組預(yù)測(cè)準(zhǔn)確性Table 3 Genome prediction accuracy of genotype imputation

        表4 基因型填充的基因組預(yù)測(cè)無偏性Table 4 Genome prediction unbiased of genotype imputation

        3 討 論

        本研究使用Beagle4.0、Beagle4.0+系譜信息、Beagle5.1等軟件進(jìn)行基因型填充,其中Beagle4.0+系譜信息填充效果最佳,其次為Beagle4.0,而Beagle5.1填充效果最差。Pook等[25]對(duì)比了Beagle4.0、Beagle5.1未使用系譜信息時(shí)雙單倍型玉米基因型填充效果,結(jié)果發(fā)現(xiàn)Beagle5.1填充錯(cuò)誤率最低,這與本研究結(jié)果存在較大差異,可能是由于其試驗(yàn)群體基因型都為純合位點(diǎn)且群體較大,而本研究選取的群體是由15羽親本公雞與435羽子代群體構(gòu)成,雜合位點(diǎn)較高且群體較小。Whalen和Hickey[26]使用Beagle4.1、Beagle5.1在18 349個(gè)個(gè)體的模擬豬家系中使用350、10 000、33 000、46 000個(gè)標(biāo)記進(jìn)行填充,Beagle4.1填充準(zhǔn)確性為0.995、0.944、0.969、0.327,Beagle5.1填充準(zhǔn)確性為0.626、0.909、0.939、0.219,當(dāng)標(biāo)記數(shù)目為46 000時(shí),與本研究結(jié)果類似。這可能與Beagle5.1采用綜合單倍型有關(guān),在輸入目標(biāo)單倍型時(shí),僅使用參考單倍型的子集[27-28]。本研究僅使用Beagle軟件進(jìn)行測(cè)試,根據(jù)不同使用需求可以選擇不同軟件進(jìn)行基因型填充[29],如FImpute[17]、Impute5[14]等。

        本研究結(jié)果表明,參考群規(guī)模一定時(shí),不同參考群篩選方法基因型填充準(zhǔn)確性不同。使用CA、MCA、RELA法篩選參考群進(jìn)行基因型填充的準(zhǔn)確性較好,使用RAN法篩選參考群進(jìn)行基因型填充的準(zhǔn)確性較差。Druet等[19]發(fā)現(xiàn),RELA方法填充效果優(yōu)于RAN法,特別是在MAF較低的位點(diǎn),這與本研究結(jié)果類似。Yu等[18]發(fā)現(xiàn),MCA方法填充效果優(yōu)于RELA、KIN、RAN方法。當(dāng)使用Beagle4.0+系譜信息進(jìn)行基因型填充時(shí),對(duì)篩選構(gòu)建的參考群填充效果更佳。這是因?yàn)橥ㄟ^參考群篩選方法篩選關(guān)鍵個(gè)體可最大限度的代表群體的遺傳變異,同時(shí)使參考群體與低密度基因型目標(biāo)群體有更強(qiáng)的親緣關(guān)系[15,18,30]。所以使用共同祖先與親本信息進(jìn)行基因型填充,也可獲取高質(zhì)量的填充基因型數(shù)據(jù)[31]。本研究僅采用系譜親緣關(guān)系矩陣進(jìn)行參考群篩選,在擁有稀疏基因型信息的情況下,可以考慮使用基因型親緣關(guān)系矩陣進(jìn)行關(guān)鍵個(gè)體篩選[32]。同時(shí),當(dāng)僅存在部分個(gè)體有低密度基因型的情況下,可以使用一步法建立H矩陣[33-34],進(jìn)行關(guān)鍵個(gè)體篩選。

        隨著參考群規(guī)模增大,基因型填充準(zhǔn)確性增高。但隨著關(guān)鍵個(gè)體參考群的增大(從15增加至25再增加至50),基因型填充準(zhǔn)確性的提升幅度下降。Wang等[35]使用3K、50K芯片對(duì)2 246頭安格斯牛進(jìn)行基因型填充,參考群體比例分別為總?cè)后w的1%、10%、20%、50%,填充準(zhǔn)確性分別為64%、71%、75%、75%。Ghoreishifar等[36]使用水牛群體在保持目標(biāo)群體數(shù)目不變的情況下增加參考群規(guī)模,填充準(zhǔn)確性在參考群從小到中等規(guī)模變化時(shí)提升較快,從中等到大規(guī)模時(shí)提升較慢。這與本研究結(jié)果相似,隨著參考群規(guī)模增加,單倍型推斷及匹配更加準(zhǔn)確,基因型填充準(zhǔn)確性也隨之增加,這可能是因?yàn)檩^多的參考群個(gè)體能夠提供更多的單倍型。但是隨著參考群規(guī)模的進(jìn)一步擴(kuò)大提升幅度會(huì)逐漸降低[30,37],因此,在保證基因型填充準(zhǔn)確性足夠分析的情況下,可以適當(dāng)控制參考群規(guī)模,以降低檢測(cè)成本。

        不同填充芯片與真實(shí)芯片數(shù)據(jù)基因組預(yù)測(cè)準(zhǔn)確性相比,基因型填充一致性比率越大越接近真實(shí)芯片預(yù)測(cè)結(jié)果,真實(shí)芯片預(yù)測(cè)無偏性一般表現(xiàn)最佳。然而當(dāng)參考群規(guī)模較小時(shí),其基因型填充一致性比率較低,而預(yù)測(cè)準(zhǔn)確性卻表現(xiàn)較佳。這可能是因?yàn)槭褂昧讼底V信息進(jìn)行填充,導(dǎo)致填充后的結(jié)果與系譜預(yù)期更符合,從而導(dǎo)致預(yù)測(cè)準(zhǔn)確性更高。

        小等位基因頻率[38]、目標(biāo)群體與參考群體芯片密度[38]、填充軟件、參考群組成、參考群體大小等因素都會(huì)影響基因型填充準(zhǔn)確性,然而在實(shí)際生產(chǎn)中對(duì)于小等位基因頻率難以進(jìn)行控制,目標(biāo)群體與參考群體也基本使用定制芯片。本研究通過探究參考群篩選方法及規(guī)模對(duì)基因型填充準(zhǔn)確性的影響,發(fā)現(xiàn)使用Beagle4.0+系譜信息有更好的填充效果。使用MCA法篩選參考群進(jìn)行基因型填充準(zhǔn)確性最高,但當(dāng)系譜關(guān)系清晰時(shí)使用共同祖先與親本信息進(jìn)行基因型填充也可以獲取高質(zhì)量的高密度芯片。參考群規(guī)模增加,基因型填充準(zhǔn)確性也隨之增加,但過多的增加參考群所帶來的的收益較低。將公共動(dòng)植物基因型填充數(shù)據(jù)庫中的個(gè)體添加到參考群體中,以此增加參考群數(shù)目也可以有效增加基因型填充準(zhǔn)確性[39-40]。

        4 結(jié) 論

        綜上所述,可以通過參考群篩選方法構(gòu)建參考群以及控制參考群規(guī)模,以保證基因型填充和基因組預(yù)測(cè)準(zhǔn)確性并節(jié)省成本,本研究可為基因型填充在畜禽遺傳育種中的應(yīng)用提供技術(shù)參考。

        猜你喜歡
        一致性方法
        關(guān)注減污降碳協(xié)同的一致性和整體性
        公民與法治(2022年5期)2022-07-29 00:47:28
        注重教、學(xué)、評(píng)一致性 提高一輪復(fù)習(xí)效率
        對(duì)歷史課堂教、學(xué)、評(píng)一體化(一致性)的幾點(diǎn)探討
        IOl-master 700和Pentacam測(cè)量Kappa角一致性分析
        學(xué)習(xí)方法
        ONVIF的全新主張:一致性及最訪問控制的Profile A
        可能是方法不對(duì)
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        基于事件觸發(fā)的多智能體輸入飽和一致性控制
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        欧美xxxx色视频在线观看| 亚洲三级香港三级久久| 国产av精品一区二区三区久久| 亚洲婷婷五月综合狠狠爱| 曰本极品少妇videossexhd| 91精品国产91热久久p| 在线观看一区二区三区国产| 精品国产天堂综合一区在线 | 国产三a级三级日产三级野外 | 国产黑丝美腿在线观看| 亚洲av无码一区二区三区观看| 2021国产最新在线视频一区| 国产一区亚洲一区二区| 亚洲在线视频免费视频| 日本道精品一区二区三区| 国产亚洲女在线线精品| 国内精品少妇久久精品| 亚洲av乱码一区二区三区林ゆな| 韩国19禁无遮挡啪啪无码网站| 午夜不卡亚洲视频| 蜜乳一区二区三区亚洲国产| 亚洲熟女www一区二区三区| 夜色阁亚洲一区二区三区| 亚洲国产精品国自产拍av在线| 亚洲va视频一区二区三区| 天天燥日日燥| 精品少妇爆乳无码aⅴ区| 亚洲熟女天堂av一区二区三区| 国产成人小视频| 久久亚洲sm情趣捆绑调教| 亚洲国产精品第一区二区三区| 亚洲av不卡一区男人天堂| av午夜久久蜜桃传媒软件| 久久精品爱国产免费久久| 成人自拍偷拍视频在线观看| 中文无码伦av中文字幕| 香蕉久久夜色精品国产2020| 亚洲av永久综合网站美女| 久久天天躁夜夜躁狠狠85麻豆| 久久久久久久久888| 中文字幕一区二区网站|