亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多層感知機(jī)的綿羊限性性狀基因組選擇模擬研究

        2023-07-31 08:56:46王萬年陳思佳郜金榮溫中豪袁夢嬌張洪志龐志旭喬利英劉文忠
        畜牧獸醫(yī)學(xué)報(bào) 2023年7期
        關(guān)鍵詞:模型

        王萬年,陳思佳,郜金榮,溫中豪,袁夢嬌,張洪志,龐志旭,喬利英,劉文忠

        (山西農(nóng)業(yè)大學(xué)動物科學(xué)學(xué)院,太谷 030801)

        基因組選擇(genomic selection, GS)是利用覆蓋于全基因組范圍內(nèi)的遺傳標(biāo)記,結(jié)合表型信息對個(gè)體育種值進(jìn)行預(yù)測的方法[1]。隨著近年來基因分型成本的降低,基因組選擇在畜禽育種中得到了廣泛應(yīng)用[2-3]。相對于最佳線性無偏預(yù)測(best linear unbiased prediction, BLUP)[4],基因組最佳線性無偏預(yù)測(genomic BLUP, GBLUP)模型[5]和一步法基因組最佳線性無偏預(yù)測(single-step GBLUP, SSGBLUP)[6]利用了基因型信息,提高了基因組估計(jì)育種值的準(zhǔn)確性。除BLUP系列方法之外,由于深度學(xué)習(xí)(deep learning, DL)在許多其他科學(xué)領(lǐng)域的應(yīng)用力量,人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)模型也開始用于GS[7],多層感知機(jī)(multilayer perceptron, MLP)是一種前饋神經(jīng)網(wǎng)絡(luò)模型,利用了多層神經(jīng)網(wǎng)絡(luò)擬合基因組信息和表型信息間的關(guān)系計(jì)算GEBV。在前人研究中[8],MLP在奶牛生長性狀中有更小的基因組預(yù)測誤差和更高的表型值預(yù)測精度[8]。

        與生長性狀不同,限性性狀指在一個(gè)物種的一種性別中表達(dá)的性狀。這些性狀由性染色體或僅在一種性別中表達(dá)的常染色體基因控制,如單睪、產(chǎn)仔數(shù)、產(chǎn)蛋量等。相對于非限性性狀,限性性狀目前只能在單性別中測定表型,在育種中缺少一個(gè)性別的選種,選擇效率不高,利用基因組選擇可以實(shí)現(xiàn)雙性別都參與選種。GBLUP、SSGBLUP、MLP在非限性性狀基因組選擇中,由于可以使用全部的表型數(shù)據(jù)和與之對應(yīng)的基因組數(shù)據(jù),GS準(zhǔn)確性可以達(dá)到較高水準(zhǔn),并且SSGBLUP和MLP優(yōu)于GBLUP;而在限性性狀中,表型數(shù)據(jù)只來自于單性別,GBLUP通過偽表型,SSGBLUP結(jié)合了系譜信息,MLP通過神經(jīng)元學(xué)習(xí)基因組和表型關(guān)系均同時(shí)使用了來自公畜和母畜基因組數(shù)據(jù),這些不同導(dǎo)致估計(jì)方法的GEBV準(zhǔn)確性可能會存在差異。許多研究表明,對于易于測量性狀和中高遺傳力性狀,BLUP取得了較好的應(yīng)用效果[9-10],對于限性性狀,BLUP方法應(yīng)用效果較差[11]。相比于傳統(tǒng)BLUP和GBLUP,使用SSGBLUP可以有效提高GS的準(zhǔn)確性[12-14],而MLP法在限性性狀中的GS效果仍需進(jìn)一步評估。由于在方法原理和使用條件中差異的存在,檢驗(yàn)MLP在限性性狀中GS的效果是否優(yōu)秀,對促進(jìn)限性性狀的選擇具有重要意義。

        為了估計(jì)育種值,需要對遺傳參數(shù)進(jìn)行估計(jì),3大遺傳參數(shù)指遺傳力(heritability,h2)、重復(fù)力和遺傳相關(guān),通常使用估計(jì)遺傳力(遺傳參數(shù))與當(dāng)代群體真實(shí)遺傳力(遺傳參數(shù))的接近程度衡量遺傳評估效果。近年來,遺傳參數(shù)估計(jì)的方法被不斷改進(jìn),從傳統(tǒng)的方差分析法[15]到適用于混合模型的Henderson方法[16]、最大似然法[17]和約束最大似然法(restricted maximum likelihood, REML)[18]。REML法避免了最大似然估計(jì)造成的偏低估計(jì),是使用線性混合模型進(jìn)行遺傳參數(shù)估計(jì)的常用方法。相對于REML法,ANN是非線性模型,沒有對SNP標(biāo)記和表型之間的關(guān)系做出先驗(yàn)假設(shè),而是通過神經(jīng)元的連接分析兩者之間的潛在關(guān)系,為適應(yīng)輸入和輸出之間的復(fù)雜關(guān)聯(lián)提供了靈活性[19]。前人研究報(bào)道中[14],在計(jì)算得出EBV/GEBV后,必須還要對其準(zhǔn)確性進(jìn)行評估,通過EBV/GEBV準(zhǔn)確性的高低評判各模型的選擇效果。

        為了研究MLP在限性性狀GS中的有效性,檢驗(yàn)MLP在限性性狀GS中的應(yīng)用效果是否優(yōu)秀,本研究基于多個(gè)綿羊模擬群體進(jìn)行以下研究:1)比較不同情況下MLP與BLUP、GBLUP、SSGBLUP遺傳參數(shù)估計(jì)結(jié)果;2)預(yù)測不同情況下MLP的GEBV準(zhǔn)確性,并對MLP在GS中的使用效果進(jìn)行評估。

        1 材料與方法

        1.1 數(shù)據(jù)模擬

        使用QMsim軟件[20]模擬3個(gè)水平(50、100、500)數(shù)量性狀基因座(quantitative trait loci, QTL)數(shù)目及3個(gè)水平(0.05、0.2、0.5)h2的限性性狀,性狀表型方差標(biāo)準(zhǔn)化為1,對整個(gè)模擬過程重復(fù)10次,以減少抽樣誤差。由于模擬群體經(jīng)過幾代之后,當(dāng)代群體h2與設(shè)置值有出入,所以需要計(jì)算真實(shí)的當(dāng)代群體h2。為了得到與實(shí)際綿羊群體相似的連鎖不平衡(linkage disequilibrium, LD)和突變-漂變平衡[21],構(gòu)建了2 000個(gè)世代的綿羊群體,起始規(guī)模3 000頭,群體規(guī)模大小不變,群體構(gòu)建階段,公、母數(shù)目保持一致,采用隨機(jī)交配。從構(gòu)建的群體最后一代隨機(jī)抽取50頭公羊,1 000頭母羊作為當(dāng)代的初始群體,分別構(gòu)建4個(gè)世代的當(dāng)代群體Pop1和5個(gè)世代的當(dāng)代群體Pop2。模擬中,公、母羊淘汰率均為20%,公、母羊增長率均為40%。公、母羊隨機(jī)交配,每頭母畜后裔數(shù)為1,公母后裔各半。選擇估計(jì)育種值高的個(gè)體留種,并按年齡進(jìn)行淘汰。

        本試驗(yàn)?zāi)M綿羊的基因組信息,設(shè)置26對常染色體,總長2 584 cM。為了模擬接近真實(shí)情況的LD,依據(jù)真實(shí)染色體長度及數(shù)目模擬基因組信息。分別模擬10 000(10K)和50 000(50K)個(gè)SNPs標(biāo)記,假定SNP標(biāo)記均勻分布在全基因組范圍內(nèi),且標(biāo)記無效應(yīng)。分別設(shè)置QTL數(shù)目為50、100和500個(gè),QTL的最小等位基因頻率(minor allele frequency, MAF)為0.1。假定QTL在全基因組范圍內(nèi)隨機(jī)分布,QTL效應(yīng)值服從伽馬分布(形狀參數(shù)為0.4)。為了創(chuàng)建突變-漂變平衡,設(shè)置構(gòu)建群體中QTL和SNP標(biāo)記的回復(fù)突變率為10-5。

        在Pop1中選擇第2~3世代作為參考群,第4世代作為候選群;在Pop2中選擇1~4世代作為參考群,第5世代作為候選群。保留Pop1和Pop2的完整系譜,和參考群中所有母畜的表型信息。選取參考群有后裔的公畜和所有母畜進(jìn)行基因分型,隨機(jī)選取候選群的100個(gè)個(gè)體進(jìn)行基因分型。本研究只對部分候選群體進(jìn)行基因分型,更有實(shí)踐意義。

        1.2 基因組預(yù)測模型

        (1)

        其中,

        MME的求解通過DMU[22]軟件完成。

        1.2.2 MLP MLP由輸入層(input layer, IL)、隱藏層(hidden layer, HL)和輸出層(output layer, OL)組成。IL接收標(biāo)記信息,HL分別由n1, n2, …, nj神經(jīng)元組成,OL由代表神經(jīng)網(wǎng)絡(luò)輸出值的nol神經(jīng)元組成,輸入經(jīng)過IL被傳遞給HL1的神經(jīng)元,然后每個(gè)隱藏的神經(jīng)元產(chǎn)生一個(gè)輸出,用作HL2的每個(gè)神經(jīng)元的輸入,以此類推最終得到輸出值yi。在這種結(jié)構(gòu)中,每一層均產(chǎn)生權(quán)重w[i]矩陣,其中輸出由最后一個(gè)HL的線性組合產(chǎn)生。最終得到的預(yù)測值為:

        (2)

        其中,bi代表第i層的偏置,初始偏置設(shè)置為1,w[i]代表第i層權(quán)重,fi為激活函數(shù),p代表IL神經(jīng)元個(gè)數(shù),t表示第t個(gè)神經(jīng)元。在本試驗(yàn)中,采用含3個(gè)HL的MLP架構(gòu),IL、HL1、HL2、HL3、OL神經(jīng)元個(gè)數(shù)依次為64、32、32、16、1。為了防止模型過擬合,在第一隱藏層到第二隱藏層間增加了隨機(jī)失活層,訓(xùn)練時(shí)設(shè)置為0.2,即保留80%的節(jié)點(diǎn),其余的20%置為0。

        本研究中使用修正線性單元(rectifier linear unit, ReLU)激活函數(shù)[23],增加了神經(jīng)網(wǎng)絡(luò)各層之間的非線性關(guān)系。

        (3)

        采用均方誤差(mean square error, MSE)作為損失函數(shù),平均絕對誤差(mean absolute error, MAE)作為評估函數(shù),在反向傳播過程中,損失函數(shù)En對輸出層輸出yi的求偏導(dǎo),得到輸出yi與真實(shí)值yt的差值δi=yi-yt,若設(shè)定zi=ReLU(x),則損失函數(shù)對隱藏層輸出ai的偏導(dǎo)為:

        (4)

        損失函數(shù)對網(wǎng)絡(luò)權(quán)重w[i]的梯度為:

        (5)

        為了使模型輸出逼近最優(yōu)值,采用了均方根傳遞(root mean square prop, RMSProp)算法[24]來更新模型的網(wǎng)絡(luò)參數(shù)。RMSProp除了自適應(yīng)調(diào)節(jié)學(xué)習(xí)率之外,對權(quán)重w和偏置b的梯度計(jì)算了微分平方加權(quán)平均數(shù),用以修正擺動幅度,加快函數(shù)的收斂。

        E[g2]t=αE[g2]t-1+(1-α)g2

        (6)

        (7)

        (8)

        1.3 遺傳參數(shù)估計(jì)方法

        (9)

        其中,

        P=V-1-V-1X(X-1V-1X)-1XTV-1

        (10)

        (11)

        IAE=λIEM+(1-λ)IAI

        (12)

        其中,IEM是EM算法的期望最大陣,IAI是AI算法的平均信息陣。λ∈[0,1],設(shè)置λ以一定步長增長。直到迭代后的方差組分估計(jì)值在參數(shù)空間內(nèi)。

        1.3.2 ANN 在ANN中,估計(jì)h2和SNP效應(yīng),需要獲得標(biāo)記的相對重要性(relative importance, RI)。Olden等[29]提出了一種方法,即使神經(jīng)網(wǎng)絡(luò)有多個(gè)HL,可以使用所有的連接權(quán)重來獲得RI。連接權(quán)值矩陣的優(yōu)劣決定了SNP效應(yīng)估計(jì)的準(zhǔn)確性,為了計(jì)算所有標(biāo)記的RI向量,將連接權(quán)重矩陣相乘。即

        RI=w[1]*w[2]*…*w[j-1]

        (13)

        其中,將w[i=1]作為連接第j-1層到第j層的的估計(jì)權(quán)值矩陣,j是人工神經(jīng)網(wǎng)絡(luò)的層數(shù)。使用如下線性近似[29],通過RI值估計(jì)加性SNP效應(yīng)向量βα,即:

        (14)

        (15)

        1.4 模型評價(jià)

        1.4.1h2比較 10次重復(fù)下,各方法計(jì)算當(dāng)代群體估計(jì)h2的均值和標(biāo)準(zhǔn)誤在相同條件下與真實(shí)h2進(jìn)行比較并做顯著性檢驗(yàn),h2估值越接近真實(shí)h2越準(zhǔn)確,h2估值越準(zhǔn)確說明遺傳評估效果越好。各方法估計(jì)h2與真實(shí)h2差異越顯著,說明遺傳評估效果越差。

        1.4.2 候選群體EBV/GEBV準(zhǔn)確性比較 用EBV/GEBV準(zhǔn)確性來比較不同模型的性能。準(zhǔn)確性通過EBV/GEBV與QMsim軟件中模擬的TBV之間的相關(guān)系數(shù)衡量。即

        從不同QTL數(shù)目、不同標(biāo)記數(shù)與不同遺傳力3個(gè)角度,對Pop1和Pop2進(jìn)行育種值估計(jì),計(jì)算其候選群EBV/GEBV準(zhǔn)確性。相同條件下,準(zhǔn)確性越高說明模型性能越好。

        2 結(jié) 果

        2.1 參考群體和候選群體

        2個(gè)獨(dú)立的當(dāng)代群體Pop1和Pop2群體結(jié)構(gòu)模擬結(jié)果見表1。其中Pop1的參考群個(gè)體為3 360個(gè),基因分型個(gè)體為1 866個(gè),候選群個(gè)體為2 744個(gè),基因分型個(gè)體為100個(gè);Pop2的參考群個(gè)體為7 154個(gè),基因分型個(gè)體為3 351個(gè),候選群個(gè)體為3 842,基因分型個(gè)體為100個(gè)。

        表1 模擬數(shù)據(jù)的當(dāng)代群體結(jié)構(gòu)Table 1 Structure of recent population obtained from QMsim

        2.2 MLP模型評估

        如圖1所示,MSE最終達(dá)到了0.002 7,MAE最終達(dá)到了0.037 2,損失函數(shù)和評估函數(shù)在訓(xùn)練600次之后基本均趨于平緩,模型擬合效果良好。

        圖1 MLP模型損失函數(shù)與評估函數(shù)結(jié)果Fig.1 MLP model loss function and evaluation function results

        2.3 不同情況下各模型的h2估計(jì)結(jié)果

        設(shè)定初始群體特定限性性狀h2為0.05時(shí),MLP、SSGBLUP、GBLUP和傳統(tǒng)BLUP的h2估計(jì)結(jié)果見表2。4種方法的估計(jì)值介于0.028~0.075,與當(dāng)代群體遺傳力0.047~0.051相符。MLP的估計(jì)值介于0.044~0.057,相比SSGBLUP介于0.041~0.068范圍更小。在QTL數(shù)目和標(biāo)記數(shù)相同的情況下,Pop1(Pop2)中當(dāng)代群體遺傳力為0.049~0.051(0.047~0.050),與MLP的h2估值0.044~0.057(0.046~0.055)差異不顯著。在Pop2群體中標(biāo)記數(shù)為10K且QTL數(shù)為100時(shí),SSGBLUP與MLP差異不顯著,但兩種方法均顯著(P<0.05)優(yōu)于GBLUP和BLUP;除此之外,MLP的h2估計(jì)結(jié)果均顯著(P<0.05)優(yōu)于SSGBLUP、GBLUP和BLUP。

        表2 設(shè)定初始群體特定限性性狀h2為0.05時(shí)各模型h2估計(jì)結(jié)果Table 2 Estimation results of h2 of each model when the prior population-specific limit trait h2 is set to 0.05

        設(shè)定初始群體特定限性性狀h2為0.2時(shí),各方法h2估計(jì)結(jié)果與當(dāng)代群體h2的對比見表3。在QTL數(shù)和參考群大小相同的情況下,SSGBLUP和GBLUP法遺傳力估計(jì)結(jié)果在不同標(biāo)記數(shù)下差別較大,MLP差別較小。在Pop1群體中標(biāo)記數(shù)為10K且QTL數(shù)為50時(shí),MLP的h2估值與當(dāng)代群體h2差異顯著(P<0.05);除此之外,在QTL數(shù)目和標(biāo)記數(shù)相同的情況下,Pop1(Pop2)中當(dāng)代群體遺傳力為0.196~0.207(0.194~0.207),與MLP的h2估值0.196~0.216(0.185~0.203)差異不顯著。在Pop1中QTL數(shù)為500的兩個(gè)標(biāo)記數(shù)下和Pop2中QTL數(shù)為10且標(biāo)記數(shù)為50K兩種情況下,MLP的h2估值與SSGBLUP差異不顯著,但兩種方法均顯著(P<0.05)優(yōu)于GBLUP和BLUP;除此之外,MLP的h2估計(jì)結(jié)果均顯著(P<0.05)優(yōu)于SSGBLUP、GBLUP和BLUP。

        表3 設(shè)定初始群體特定限性性狀h2為0.2時(shí)各模型h2估計(jì)結(jié)果Table 3 Estimation results of h2 of each model when the prior population-specific limit trait h2 is set to 0.2

        設(shè)定初始群體特定限性性狀h2為0.5時(shí),各方法h2估計(jì)結(jié)果見表4。在QTL數(shù)及標(biāo)記數(shù)相同的情況下,4種方法在Pop2群體中的遺傳參數(shù)估計(jì)結(jié)果較Pop1更接近于真值。QTL數(shù)為100,Pop1中標(biāo)記數(shù)10K下和Pop2中標(biāo)記數(shù)50K下,MLP的h2估值與SSGBLUP差異不顯著,但兩種方法均顯著(P<0.05)優(yōu)于GBLUP和BLUP。除此情況之外,MLP的h2估計(jì)結(jié)果均顯著(P<0.05)優(yōu)于SSGBLUP、GBLUP和BLUP。

        2.4 不同模型預(yù)測效果

        表5為不同h2初值時(shí),各方法的預(yù)測準(zhǔn)確性范圍。在QTL數(shù)目和標(biāo)記數(shù)相同的情況下,h2初值為0.05時(shí),MLP的GEBV準(zhǔn)確性較SSGBLUP和GBLUP明顯提高;h2初值為0.2時(shí),MLP的GEBV預(yù)測準(zhǔn)確性較SSGBLUP有略微提高,較GBLUP有明顯提高;h2初值為0.5時(shí),MLP的GEBV準(zhǔn)確性較SSGBLUP沒有明顯提高,較GBLUP和BLUP優(yōu)勢明顯。

        表5 不同h2初值時(shí)各方法預(yù)測準(zhǔn)確性范圍Table 5 When different prior h2 values, the prediction accuracy range of each method

        圖2為不同情況下MLP、SSGBLUP、GBLUP的GEBV準(zhǔn)確性及BLUP的EBV準(zhǔn)確性,在h2、QTL數(shù)和標(biāo)記數(shù)相同的情況下,Pop1和Pop2群體中,MLP的預(yù)測準(zhǔn)確性均為最高,BLUP均為最低;Pop2群體中各方法的預(yù)測準(zhǔn)確性較Pop1群體均有提升。在QTL數(shù)、標(biāo)記數(shù)和群體相同的情況下,隨著h2降低,MLP較GBLUP和SSGBLUP的GEBV準(zhǔn)確性差值變大,優(yōu)勢逐漸增加。在h2、QTL數(shù)和群體相同的情況下,MLP、SSGBLUP及GBLUP模型在標(biāo)記數(shù)為50K時(shí)的準(zhǔn)確性較標(biāo)記數(shù)為10K時(shí)有提高。其中,在QTL數(shù)目相同及h2初值為0.05時(shí),Pop1(Pop2)群體中MLP在標(biāo)記數(shù)為10K時(shí)預(yù)測準(zhǔn)確性介于0.269~0.278(0.287~0.300)略高于SSGBLUP在標(biāo)記數(shù)為50K的預(yù)測準(zhǔn)確性0.224~0.241(0.262~0.279)。在h2、標(biāo)記數(shù)和群體相同的情況下,預(yù)測準(zhǔn)確性隨QTL數(shù)改變并沒有明顯變化。

        3 討 論

        在綿羊育種中,限性性狀是影響經(jīng)濟(jì)效益的重要性狀,這種復(fù)雜性狀的遺傳增益可以有效的提高綿羊的生產(chǎn)效率[30]。除產(chǎn)奶量外,乳房構(gòu)型、產(chǎn)羔困難和乳腺炎等限性性狀對生產(chǎn)成本和動物福利影響同樣很大,也需要在育種目標(biāo)中加以考慮[31]。在綿羊中實(shí)施基因組選擇最嚴(yán)峻的挑戰(zhàn)是品種問題,許多品種個(gè)體數(shù)少,導(dǎo)致參考群小,連鎖不平衡低,有時(shí)甚至缺乏表型記錄[32]。用MLP進(jìn)行GS[8]已有報(bào)道,但是在綿羊限性性狀中還未應(yīng)用,所以本研究在不同h2、QTL數(shù)目、標(biāo)記數(shù)的兩個(gè)群體(Pop1和Pop2)中對MLP模型進(jìn)行了全面的測試。研究發(fā)現(xiàn),在QTL數(shù)、標(biāo)記數(shù)和群體相同的情況下,在3個(gè)h2水平下,MLP較GBLUP和SSGBLUP優(yōu)勢更大;隨著h2降低,MLP較GBLUP和SSGBLUP的優(yōu)勢逐漸增加,表明DL方法的實(shí)施為改善綿羊限性性狀的遺傳增益提供了巨大潛力。

        遺傳參數(shù)估計(jì)是家畜育種中的重要組成部分,群體遺傳參數(shù)估值的優(yōu)劣對正確評定種畜育種值和育種規(guī)劃有非常重要的作用。MLP是通過神經(jīng)元權(quán)值矩陣計(jì)算SNP效應(yīng)向量從而進(jìn)行遺傳參數(shù)估計(jì);而REML法是對線性模型求解約束似然函數(shù),通過迭代的方式求解其極值點(diǎn)計(jì)算方差組分。本研究中,4種方法在Pop2群體中的遺傳參數(shù)估計(jì)結(jié)果較Pop1更接近于真值,表明在估計(jì)遺傳參數(shù)時(shí)MLP與SSGBLUP、GBLUP和BLUP同樣受參考群體大小的影響,參考群體越大,遺傳參數(shù)估計(jì)結(jié)果與當(dāng)代群體遺傳參數(shù)的差值越小[33]。除個(gè)別情況之外,MLP的遺傳力估計(jì)結(jié)果與其他3種方法差異顯著,且在相同h2、QTL和標(biāo)記數(shù)下,對于Pop1和Pop2兩個(gè)群體MLP的遺傳參數(shù)估值與群體遺傳參數(shù)的差值較SSGBLUP、GBLUP和BLUP均更小,表明MLP在遺傳參數(shù)估計(jì)上優(yōu)于其他3種方法,這可能是因?yàn)槎鄬尤斯ど窠?jīng)網(wǎng)絡(luò)采用非先驗(yàn)假設(shè)很好的解釋了非加性效應(yīng),彌補(bǔ)了線性模型的局限性[34]。Gholizadeh等[35]在奶牛中應(yīng)用神經(jīng)網(wǎng)絡(luò),得到了準(zhǔn)確的產(chǎn)奶量遺傳力估計(jì)結(jié)果。Coelho de Sousa等[36]在咖啡中應(yīng)用MLP進(jìn)行遺傳力估計(jì),得到的結(jié)果優(yōu)于GBLUP,這是因?yàn)闃?biāo)記物之間的相互作用隱含在神經(jīng)元多次加權(quán)的輸出中。

        Pérez-Rodríguez 等[37]通過小麥數(shù)據(jù)集對神經(jīng)網(wǎng)絡(luò)和幾種線性模型進(jìn)行了評估,發(fā)現(xiàn)在植物中非線性神經(jīng)網(wǎng)絡(luò)比線性模型有更好的預(yù)測精度。McDowell[38]使用擬南芥、玉米和小麥數(shù)據(jù)對常規(guī)基因組預(yù)測模型與MLP進(jìn)行了比較,在3個(gè)性狀中,MLP的預(yù)測準(zhǔn)確性均高于傳統(tǒng)的基因組預(yù)測模型。預(yù)測準(zhǔn)確性結(jié)果顯示,相同h2、QTL和標(biāo)記數(shù)下,相比于Pop1群體,具有更大參考群規(guī)模的Pop2群體中4種方法的GEBV準(zhǔn)確性均有提高,由此推測低遺傳力性狀需要更多的表型數(shù)據(jù)來提高準(zhǔn)確性。Luan等[39]使用挪威紅牛數(shù)據(jù)應(yīng)用GBLUP及Bayes模型時(shí)也顯示出與本研究相似的結(jié)果,對于h2更高的性狀和更大參考群體,育種值估計(jì)更準(zhǔn)確。本研究在不同QTL數(shù)下各模型獲得的準(zhǔn)確性無明顯變化,可能是因?yàn)樵囼?yàn)中假設(shè)所有標(biāo)記解釋相同的效應(yīng)方差且無主效基因。在Daetwyler等[40]的模擬研究中,GBLUP在不同QTL數(shù)目時(shí),準(zhǔn)確性基本無變化,與本研究結(jié)果相符。隨著標(biāo)記數(shù)從10K增加至50K,4種方法整體上基因組估計(jì)育種值準(zhǔn)確性均呈上升趨勢,在張猛[41]的研究中也得到了相同的結(jié)論。在h2為0.05時(shí),MLP在標(biāo)記數(shù)為10K時(shí)的準(zhǔn)確性略高于其他方法在50K時(shí)的準(zhǔn)確性,這可能是由于標(biāo)記數(shù)過少造成SSGBLUP法性能的下降。

        相對于非限性性狀,在限性性狀中想要使遺傳評估和育種值估計(jì)結(jié)果達(dá)到更高水平難度更大,雖然使用GS利用雙性別的基因型數(shù)據(jù)彌補(bǔ)了一部分表型缺失的劣勢,但是育種值準(zhǔn)確性的提高仍然有限[13]。在方法上,各模型對非限性性狀進(jìn)行正常流程的遺傳評估和基因組選擇,而對于限性性狀,GBLUP必須使用EBV[42]或逆回歸育種值[43-44]作為偽表型值,通過偽表型值和基因組信息得到基因組估計(jì)育種值。SSGBLUP將系譜信息與基因組信息整合到模型[6]中,構(gòu)建基因組關(guān)系矩陣(H陣),結(jié)合表型信息預(yù)測未進(jìn)行基因分型個(gè)體的EBV及基因分型個(gè)體的GEBV。MLP是使用輸入數(shù)據(jù)為該網(wǎng)絡(luò)尋找最佳權(quán)重,它將輸入的多個(gè)數(shù)據(jù)集映射到單一的輸出數(shù)據(jù)集上,每個(gè)神經(jīng)元的輸出表示為神經(jīng)元全部輸入的加權(quán)和,通過線性和非線性激活函數(shù)[45-46]調(diào)節(jié)預(yù)測變量的特定權(quán)值從而學(xué)習(xí)基因型和表型之間的關(guān)系。在結(jié)果上,結(jié)合前人研究[47],非限性性狀的GEBV準(zhǔn)確性較限性性狀更高,這是由于使用偽表型值或非線性學(xué)習(xí)模式均不能完全彌補(bǔ)表型的缺失。

        在模擬研究中,非線性模型優(yōu)于線性模型[48],而在真實(shí)數(shù)據(jù)中,非線性模型較線性模型只有輕微優(yōu)勢或沒有優(yōu)勢[49]。無論哪種模型都是簡化模型,與真實(shí)模型會有較大差異,可能更接近復(fù)雜生物現(xiàn)象的其他模型尚未找到,還需要繼續(xù)大量研究。本研究中MLP法的優(yōu)勢和有效性仍然需要在真實(shí)綿羊群體中進(jìn)行驗(yàn)證。

        4 結(jié) 論

        對于綿羊限性性狀,MLP模型在遺傳參數(shù)估計(jì)方面較線性模型有更好的表現(xiàn)。MLP可以有效提高GEBV準(zhǔn)確性,在綿羊限性性狀GS中有良好應(yīng)用潛力。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        久久中文字幕久久久久91| 乱人伦中文无码视频在线观看| 国产人妻黑人一区二区三区| 国产精品久久久久久久y| 国产成人美涵人妖视频在线观看| 精品人妻av区乱码色片| 特级毛片a级毛片100免费播放 | 国产精品国产三级国产av18 | 久久久久久免费毛片精品| 久久频这里精品99香蕉| 国产免费一区二区三区三| 久久精品国产亚洲av沈先生| 天堂av在线美女免费| 国产精品成人观看视频| 亚洲精品综合第一国产综合| 一道本中文字幕在线播放| 亚洲精品国产第一综合色吧| 老熟妇仑乱视频一区二区| 亚洲AV秘 无码二区在线| 国产午夜福利av在线麻豆| 久久久久99精品成人片欧美| 国产国语熟妇视频在线观看 | 亚洲天堂免费一二三四区| 精品久久久少妇一区二区| 性大毛片视频| 中文字幕av一区二区三区| 白色白色白色在线观看视频| 无码无套少妇毛多18p| 欧美日本国产va高清cabal| 午夜在线观看有码无码| 蜜桃视频第一区免费观看| 亚洲春色在线视频| 亚洲AV无码久久久一区二不卡| 亚洲一区二区三区资源| 国产极品粉嫩福利姬萌白酱| 中国一 片免费观看| 久久成人黄色免费网站| 国产变态av一区二区三区调教| 欧美极品色午夜在线视频| 中文字幕无码免费久久99| 久久99精品久久只有精品|