摘要:BLUP(Best Linear Unbiased Prediction,最佳線性無偏預(yù)測)方法是目前進行育種值估計最好的方法,它已經(jīng)在各個國家得到了廣泛應(yīng)用,有利于各國畜牧業(yè)的發(fā)展。本文主要介紹BLUP的基本原理、特點、基本步驟;并簡述目前常用的BLUP三種形式 (E-BLUP、R-BLUP、M-BLUP)的模型、原理以及BLUP的應(yīng)用和未來的發(fā)展前景。
關(guān)鍵詞:BLUP; 家畜育種; 模型
中圖分類號:S8-0 文獻標識碼:A文章編號:1674-0432(2012)-07-0139-2
1949年,美國數(shù)量遺傳學家C.R.漢特遜(Henderson)在研究對于不平衡資料應(yīng)用混和模型方程組的原理估計固定效應(yīng)和預(yù)測隨機效應(yīng)時,提出了BLUP(Best Linear Unbiased Prediction,最佳線性無偏預(yù)測)方法[1],于1973年在紀念勒什(Lush)的學術(shù)討論會上他又對該法的理論和應(yīng)用進行了系統(tǒng)闡述,同時隨著計算機技術(shù)的迅速發(fā)展和普及,BLUP法才得到了廣泛的應(yīng)用,普遍認為BLUP法是最好的畜禽遺傳評定方法。
1 BLUP法的概述
1.1 基本原理
BLUP是一種數(shù)理統(tǒng)計方法,基本原理是線性統(tǒng)計模型方法論與數(shù)量遺傳學相結(jié)合。BLUP模型中包括固定效應(yīng)和除了殘差效應(yīng)以外的隨機效應(yīng),所以是一個混合模型。BLUP混合模型的一般形式: Yijk =μ+hi+Sj+eijk (1)
式中Yijk:觀察值向量,μ:總體均值,hi:第i個畜禽的固定效應(yīng)值,sij:第i個畜群中第j個公畜的隨機遺傳效應(yīng),eijk:隨機剩余效應(yīng)。
以矩陣形式表示為:Y=Xβ+Zn+e (2)
式中Y:觀察值向量,X:固定因子結(jié)構(gòu)矩陣,β:固定效應(yīng)向量,Z:隨機因子的結(jié)構(gòu)矩陣,u:隨機效應(yīng)向量,e:隨機殘差向量,并有e~N(0,R),E(Y)=Xβ,E(u)=0, E(e')=0,Var(u)=G,Var(e)=R, Cov(u,e,)=0, Var(y)=V=ZGZ'+R
當u和e服從正態(tài)分布,即u~N(0,G), e~N(0,R)時
y和u的聯(lián)合密度函數(shù):f(y,u)=f1(y∣u)f2(u)
f1(y∣u)=C1exp{-1/2(y- Xβ-Zu)’r-1(y- Xβ-Zu)}
f2(u)= C2exp{-1/2u’G-1u}
f(y,u)=Cexp{-1/2(y- Xβ-Zu)’R-1(y-Xβ-Zu)-1/2u’G-1u}
其中:C=C2*C1,為一常數(shù)。對f(y,u)求關(guān)于β和u的極大值:
整理方程得:
式中,是f(y,u)達最大時的解,被稱為混合模型方程組(mixed model equations,MME)
1.2 特點
BLUP法將選擇指數(shù)法和最小二乘估計方法有機的結(jié)合起來,解決了選擇指數(shù)存在的問題。其重要特征是將性狀觀察值剖分出遺傳效應(yīng)再進一步剖分為固定的遺傳效應(yīng)和隨機的遺傳效應(yīng),能夠利用各方面的資料在同一估計的混和模型方程中,既能估計固定的環(huán)境效應(yīng)和固定的遺傳效應(yīng),又能預(yù)測隨機的遺傳效應(yīng)。
BLUP育種值估計方法之所以被認為是目前最好的畜禽遺傳評定方法在于它具有如下優(yōu)點,(a)能充分利用個體及其父母、同胞、后代等所有親屬的信息,做到親屬資料的最佳利用,提高育種值估計的準確性;(b)可消除環(huán)境因素造成的偏差,獲得個體真實育種值;(c)可以估計群體的遺傳趨勢和當前的育種水平,估計遺傳進展的遺傳參數(shù);(d)可以估計一些沒有記錄的祖先或者個體的育種值,即方程的數(shù)目可以大于有記錄的家畜的數(shù)目;(e)可使所造成的偏差降到最低。
1.3 基本步驟
BLUP是根據(jù)遺傳學、統(tǒng)計學知識和實際的生產(chǎn)情況,將觀察值表示為對其有影響的固定效應(yīng)、隨機效應(yīng)和隨機殘差的線性組合,也即是將表型值表示成遺傳效應(yīng)、系統(tǒng)環(huán)境效應(yīng)、隨機環(huán)境效應(yīng)和剩余效應(yīng)的線性組合,構(gòu)建線性混合模型,然后根據(jù)線性(估計值與觀察值呈線性關(guān)系)、無偏(估計值的數(shù)學期望為真值)、最佳(估計值的誤差方差最?。┑脑瓌t對模型中的各個效應(yīng)進行估計,其基本步驟:(a)根據(jù)現(xiàn)有的畜群生產(chǎn)情況和資料結(jié)構(gòu)建立一個線性混合模型,這個模型應(yīng)盡可能地描述真實的情況,同時又不能過于復(fù)雜而導(dǎo)致估計的精確性降低或計算困難,估計的準確性和精確性完全取決于模型是否合理;(b)該方程組為混合模型方程組,方程組中方程的個數(shù)等于模型中所有因子的所有水平之和;(c)利用計算機對方程求解。
到目前為止,已構(gòu)建出幾個基本的估計畜禽育種值的BLUP模型,如:公畜模型(sire model)、公畜-母畜模型(sire-dam model)、外祖父模型(maternal grandsire model)、個體動物模型(individual animal model, IAM)、簡化動物模型(reduced animal model, M)等。其中,以個體動物模型估計的育種值較為精確,廣泛應(yīng)用于畜禽育種中。
2 BLUP法的幾種形式
2.1 E-BLUP
BLUP法能得到最佳線性無偏預(yù)測的育種值,前提應(yīng)滿足所用數(shù)據(jù)的正確完整性,所用模型的真實可靠性,同時所涉及到的各種群體參數(shù)(方差組分或方差組分的比值),如誤差方差協(xié)方差、育種值方差協(xié)方差等都是已知的??墒?,在實際的育種工作中,BLUP得到的育種值估計值往往并不是真正最佳無偏,因為存在記錄的差錯和不完整,正確的A矩陣很難得到,所用的模型(操作模型)也與真實模型有區(qū)別,方差組分或方差組分比值的真值一般也是未知的,只能用估計值去代替。這種通常用方差組分估計的方法,如Henderson、MINOUE、REML等方法進行方差組分估計,再對固定效應(yīng)估計、隨機效應(yīng)預(yù)測的方法即為E-BLUP(empirical BLUP)。
Robinson(1991),Speed(1991)用BLUP法對β和u的計算,值為:
而E-BLUP就是用方差組分的估計值去代替它們的真值,對β進行估計,稱為empirical BLUE(EBLUE);對u進行預(yù)測,稱為empirical BLUP(EBLUP):
同時EBLUE和EBLUP的估計和預(yù)測值已不再是觀察值的線性組合,因為此時對固定效應(yīng)的估計和隨機效應(yīng)的預(yù)測是通過上述的兩個過程完成,它們與觀察值呈漸近線組合。例如,如果方差組分估計漸近真值,則所估計的固定效應(yīng) 同樣也能代表真值。E-BLUP也就是通常應(yīng)用于育種實踐中,進行畜禽遺傳評定的方法。
2.2 R-BLUP
BLUP法應(yīng)用于育種實踐中,通常是選擇與經(jīng)濟價值相關(guān)的幾個性狀,其最終的目的就是能估計出家畜的遺傳特性以便于我們挑選遺傳特性優(yōu)良的家畜留種,逐步提高家畜的各性狀育種值。然而,在某些情況下,進行家畜育種時為了提高家畜某個性狀表型值的同時,使另外的一些性狀的表型值保持不變或按一定比例改變。對于這種情況R-BLUP (Restricted BLUP)可應(yīng)用于這些性狀的育種值估計。
Quaas和Henderson指出R-BLUP在多性狀育種值估計中,可直接對某些性狀進行約化。它是一種當性狀彼此間存在相關(guān)時,進行多性狀育種值選擇的有效方法。例如,在奶牛育種中,奶牛斷奶重與初生重呈強正相關(guān),人們要提高的是奶牛的斷奶重,但是為了避免母牛難產(chǎn),初生重必須保持在一定的范圍內(nèi);在綿羊育種中,羊毛的數(shù)量與羊毛品質(zhì)(羊毛直徑)呈強負相關(guān),在羊毛直徑保持一定的情況下,對羊毛的數(shù)量進行選擇,增加羊毛數(shù)量,有利于提高綿羊在市場上的使用價值;同時在豬育種中,日增重與背膘厚呈負相關(guān),若背膘過厚,豬肉品質(zhì)就會降低,目前日增重性狀的選擇已達一個較高的水平,所以為了進一步提高豬肉品質(zhì),在日增重的基礎(chǔ)上主要選擇背膘厚。
進行多性狀育種值估計的BLUP混和模型為:
yi=Xibi+Ziui+ei (6) (i:q個性狀中的第i個)
E(u)=E(e)=0,Var(u)=G, Var(e)=R, Cov(u,e’)=0, G=G0×A
G0:q×q性狀的加性遺傳方差協(xié)方差矩陣
A:分子血緣系數(shù)矩陣
若要對一些性狀進行約化,則隨機效應(yīng)u=C'u,C=C0×In, C0=CZ/CP
CZ:約化性狀保持不變,CP:約化性狀按比例改變
R-BLUP方程組的形式為:
其中::Lagrange乘數(shù)向量 G=G0 ×A
為避免A矩陣的復(fù)雜計算,使計算簡便,可將方程組簡化為:
其中:P=G0C0×In
2.3 M-BLUP
20世紀70年代以后,隨著分子生物學的發(fā)展,相繼建立了多種分子遺傳標記檢測技術(shù)。人們利用這些技術(shù),找到并定位了對家畜的重要經(jīng)濟性狀有較大效應(yīng)的基因座(quantitative trait loci, QTL),人們可以借助標記直接或間接的對QTL進行分析。近年來,標記輔助選擇(Marker-assisted selection, MAS)已逐步應(yīng)用于遺傳育種領(lǐng)域中,它既能利用傳統(tǒng)方法所利用的表型和系譜的信息,也能利用DNA標記所提供的信息。
M-BLUP(marker-assisted BLUP)法就是將表型信息、系譜信息、分子標記信息有機結(jié)合起來,從分子的水平去估計個體育種值。由于DNA標記具有多態(tài)性豐富、檢測效率高,不受環(huán)境因素的影響,并且不受性別和年齡的限制,所以M-BLUP能提高遺傳估計的精確性和選擇強度,縮短世代間隔,進行早期選擇,尤其是它能更有效的估計那些遺傳力低、只在一個性別中表達又難以度量的性狀的育種值。
M-BLUP的一般模型為:y=Xβ+Zu+Wv+e (9)
v: MQTL的隨機加性配子效應(yīng) W:v的關(guān)聯(lián)矩陣
G: QTL的配子關(guān)聯(lián)矩陣 σv2:QTL等位基因的方差
方程組的形式為:
K1=σe2/σu2 K2=σe2/σu2
雖然M-BLUP法在動植物的育種中有廣泛的應(yīng)用前景,但是,M-BLUP也存在一些不足。它只適用于整個家畜均進行分子標記的情況,當家畜中含有部分未經(jīng)檢測的個體時,計算較復(fù)雜;進行分子標記檢測的成本也較高;同時,與重要經(jīng)濟性狀(QTL)緊密連鎖的分子標記目前還較少。
3 BLUP法的應(yīng)用及其前景
BLUP法優(yōu)于所有傳統(tǒng)的育種值估計方法,是目前應(yīng)用估計各種家畜育種值的最好方法,同時在計算機技術(shù)的普及下,BLUP法在世界各地逐步得到了推廣。美國、加拿大、印度、日本等國家都有大量的應(yīng)用報道。歐美發(fā)達國家的BLUP法在奶牛的育種中已經(jīng)達到系統(tǒng)化、規(guī)范化的程度,加拿大從1985年開始采用動物模型BLUP對豬的背膘厚和達100kg體重育種值進行估計使其遺傳進展速度都有了大幅度的提高,這兩個性狀的年遺傳進展為-0.35mm/年和-1.5天/年,使每頭商品豬的利潤提高了1.30加元,意味著加拿大養(yǎng)豬業(yè)逐年增加利潤2000萬美元,直到兩個性狀達到最佳值。BLUP法在我國也已經(jīng)推廣應(yīng)用,如:動物模型BLUP估計內(nèi)蒙古白絨山羊的育種值;動物模型BLUP對北京市奶牛、四川省南江黃羊進行遺傳評定和性能測定。
我們也應(yīng)看到,要實現(xiàn)BLUP的優(yōu)越性,必需以一定的育種措施為基礎(chǔ),以先進的計算工具為手段,以完善的育種資料記錄系統(tǒng)為保證,否則難以發(fā)揮它的優(yōu)勢。今后,在BLUP方法的應(yīng)用中,我們要改進BLUP中的計算方法,使其能應(yīng)用于更多信息的運算;進一步構(gòu)建出不同的BLUP模型,應(yīng)用于不同情況下、不同動物、不同性狀的育種值估計,同時盡可能的使估計值反映真實育種值。
參考文獻
[1] 張沅,張勤.畜禽育種中的線性模型.中國農(nóng)業(yè)出版社, 1993,9: 58-78.
[2] MART MOLS. Constraints on Random effects and Mixed Linear Model Predicitions. Acta Applicandae Mathematicae, 2003,17:17-23.
[3] Jiming Jiang.ASYMPTOTIC PROPERTIES OF THE EMPIRICALBLUP AND BLUE IN MIXED LINEAR MODELS. Statistica Sinica, 1998, (8):861-885.
[4] R.J.C.Cantet, A.N.Birchmeier, M.G.Santos-Cristal,V.S.de Avila. Comparison of restricted maximum likelihood and Method R for estimating heritability and predicting breeding value under selection. J.Anim.Sci , 2000,78:2554-2560.
[5] M.Satoh. Amethod of computing restricted best linear unbiased prediction of breeding values for some animals in a population, J.Anim.Sci., 2004,82:2253-2258
[6] LU Shao-Xiong, WU Chang-Xin, LIAN Lin-Sheng. Primary Factors affecting the Evaluation Accuracy of Animal Model MBLUP. Acta Genetica Sinica , 2003,30(1):35-39.
[7] LIU Huiying, AHNG QinZHANG Yuan. Relative efficency of marker assisted selecion when marker and QTL are incompletely linked. Chinese Science Bulletin, 2001,46(24).
[8] 張勝利,石萬海,鄭維韜,曹福存.北京市奶牛遺傳評定概況. 中國奶牛,2002,2:27-29.
[9] 張紅平,李利,徐剛毅,吳登俊.動物模型BLUP法應(yīng)用于肉用山羊育種的探討.2003—2004年全國養(yǎng)羊生產(chǎn)與學術(shù)研討會議論文集,97-98.
[10] 吳麗麗,劉學洪.一種先進的畜禽遺傳評定方法-動物模型BLUP法.動物育種.2003,11(11):48-50.
[11] 俞英,張沅.畜禽遺傳評定方法的研究進展.遺傳. 2003,25(5):607-610.
[12] 王麗娟,李武,張廣民.BLUP模型及其在豬育種中的應(yīng)用. 黑龍江畜牧獸醫(yī).003,1:25-26.
作者簡介:李玉紅(1981-),女,貴州都勻人,黔南民族師范學院講師,從事動物學、生物統(tǒng)計學研究。