陸雪林,周洪鈞,高楊,袁紅艷,趙樂樂,梁永軍
(1.上海市動物疫病預(yù)防控制中心,上海 201103; 2.同濟(jì)大學(xué)電信學(xué)院,上海 201805;3.上海樂本信息科技有限公司,上海 201802; 4.上海紅艷山雞孵化專業(yè)合作社,上海 201408;5.吉林省四平市鐵西區(qū)畜牧管理服務(wù)中心,吉林 四平 136000)
隨著國內(nèi)山雞產(chǎn)業(yè)的發(fā)展,山雞企業(yè)的種雞群體規(guī)模越來越大。由于山雞養(yǎng)殖有世代間隔短、性狀指標(biāo)多、數(shù)據(jù)量龐大等特點(diǎn),加重了企業(yè)數(shù)據(jù)收集和管理的負(fù)擔(dān),使山雞育種進(jìn)展緩慢。因此,利用計(jì)算機(jī)技術(shù),結(jié)合家禽育種學(xué)及數(shù)量遺傳學(xué)理論,開發(fā)出一個簡潔完善的育種管理系統(tǒng),及時收集處理各種山雞育種數(shù)據(jù)資料,準(zhǔn)確計(jì)算育種值,指導(dǎo)企業(yè)選種、選配工作,是提高整個育種效率的有效手段。
應(yīng)用計(jì)算機(jī)技術(shù)進(jìn)行動物育種資料的管理和數(shù)據(jù)分析并不是一個新鮮話題[1]。國外已有比較成熟的通用軟件ASREML[2],不僅適合于不同物種,而且還提供了大量的二次開發(fā)功能,但是,ASREML對于國內(nèi)用戶來說顯得比較難以使用。國內(nèi)也有家禽育種管理系統(tǒng)[1],但一般都是一個單機(jī)版系統(tǒng),無法對家禽生產(chǎn)性狀數(shù)據(jù)進(jìn)行云端管理,更不可能利用云計(jì)算來實(shí)現(xiàn)大數(shù)據(jù)挖掘;而且,這些信息軟件具有很強(qiáng)的專業(yè)性和針對性,并不是所有山雞養(yǎng)殖場都能適用。因而,本課題組研究人員設(shè)計(jì)開發(fā)了一款專門針對山雞育種的分析管理軟件平臺——紅艷山
雞育種分析管理軟件。該軟件基于C/S框架,利用云計(jì)算平臺搭建,利用了最新的VC#.net 2012軟件開發(fā)技術(shù)。數(shù)據(jù)存儲的云端數(shù)據(jù)庫采用基于C/S框架的分散DB設(shè)計(jì)方案,解決了局部用戶(LOCAL)數(shù)據(jù)上傳及管理需要,也實(shí)現(xiàn)了服務(wù)器云端統(tǒng)一管理需求。在育種值計(jì)算方面,采用了業(yè)內(nèi)先進(jìn)的最佳線性無偏預(yù)測法(Best Linear Unbiased Prediction,BLUP),不但可完成山雞各類生產(chǎn)性狀育種值的估計(jì),還可以計(jì)算綜合育種值,從而實(shí)現(xiàn)了考慮多種性狀、不同經(jīng)濟(jì)系數(shù)綜合影響下的山雞留種工作。
山雞育種工作周期性很強(qiáng),一般來說1年1個世代,在山雞不同生長階段實(shí)施不同育種措施。山雞育種數(shù)據(jù)管理與分析系統(tǒng)的程序總流程見圖1。
圖1 山雞育種數(shù)據(jù)管理與分析系統(tǒng)的程序總流程圖
本系統(tǒng)數(shù)據(jù)庫的建立與設(shè)計(jì)是基于山雞育種流程特點(diǎn)和MySQL數(shù)據(jù)庫設(shè)計(jì)原理來進(jìn)行的。每個山雞個體從系譜孵化出生到繁殖下一代的生活周期中,在其不同生長階段實(shí)施不同育種措施,所有育種數(shù)據(jù)都以個體出生時所佩戴的個體身份標(biāo)識——翅號為基礎(chǔ),個體數(shù)據(jù)以及家系信息不斷積累、計(jì)算和傳遞,從而在純系選育過程中充分利用這些數(shù)據(jù)信息。本系統(tǒng)的數(shù)據(jù)流程見圖2。
為了存儲山雞生活周期中各個時期的生產(chǎn)數(shù)據(jù),系統(tǒng)在數(shù)據(jù)庫中設(shè)計(jì)了12個基本數(shù)據(jù)表格:檔案新登表、上測定籠表、生長測定表、外貌測定表、屠宰測定表、生長期選留表、上產(chǎn)蛋籠表、開產(chǎn)測定表、蛋品測定表、料蛋比測定表、產(chǎn)蛋量測定表、繼代選留表。檔案新登表主要記錄雛雞出生信息及其父母信息等,該類信息將在后面各階段數(shù)據(jù)中共享;上測定籠表用于記錄雛雞雞舍編號等信息;生長測定表用于記錄始測、中測、結(jié)測3個時期山雞的耗料及體重,從而計(jì)算測定期料肉比;外貌測定表用于記錄胸寬、體長等山雞體型外貌信息;屠宰測定表用于記錄山雞屠宰測定的全凈膛重、腹脂率等數(shù)據(jù);生長期選留表用于記錄利用已測數(shù)據(jù)進(jìn)行淘汰選留的情況;上產(chǎn)蛋籠表用于記錄產(chǎn)蛋舍號、籠號等信息;開產(chǎn)測定表用于記錄山雞開產(chǎn)日齡、開產(chǎn)體重等信息;蛋品測定表用于記錄山雞蛋蛋品質(zhì)性狀測定的蛋重、蛋殼色澤、蛋殼強(qiáng)度、蛋殼厚度、哈氏單位等各類信息;料蛋比測定表用于記錄山雞蛋蛋重與飼料消耗等數(shù)據(jù);產(chǎn)蛋量測定表用于記錄不同時間段山雞產(chǎn)蛋量;繼代選留表是系統(tǒng)依據(jù)測定數(shù)據(jù)及計(jì)算的育種值進(jìn)行選留后的結(jié)果。
主要由檔案信息、肉用性狀、蛋用性狀、孵化管理、系譜選種選配以及系統(tǒng)維護(hù)等模塊組成(圖3)。
圖2 山雞育種數(shù)據(jù)管理與分析系統(tǒng)的數(shù)據(jù)流程
圖3 山雞育種數(shù)據(jù)管理與分析系統(tǒng)結(jié)構(gòu)
本系統(tǒng)采用云存儲(計(jì)算)結(jié)構(gòu),用戶利用應(yīng)用程序,負(fù)責(zé)數(shù)據(jù)的輸入及簡單計(jì)算,比如肉料比等計(jì)算,基本是在本地計(jì)算機(jī)上完成。數(shù)據(jù)輸入界面等也在本地計(jì)算機(jī)展示,從而實(shí)現(xiàn)數(shù)據(jù)輸入。大量山雞性狀測定數(shù)據(jù)被存儲到云端服務(wù)器上,利用云端服務(wù)器的高性能計(jì)算能力進(jìn)行BLUP計(jì)算,從而實(shí)現(xiàn)高性能云計(jì)算結(jié)構(gòu)(圖4)。
采用現(xiàn)場(山雞場或孵化場)應(yīng)用模式和辦公室(育種技術(shù)室)局域網(wǎng)應(yīng)用模式相結(jié)合的系統(tǒng)應(yīng)用方式?,F(xiàn)場應(yīng)用模式包括肉用性狀測定、蛋用性狀測定、孵化管理、系譜選種選配等過程,完成現(xiàn)場數(shù)據(jù)采集和育種資料的收集工作后,將采集的數(shù)據(jù)轉(zhuǎn)存于辦公室局域網(wǎng)服務(wù)器中,在辦公室應(yīng)用模式中完成數(shù)據(jù)處理、統(tǒng)計(jì)分析、辦公室選種、組建家系和遺傳分析等工作。進(jìn)行辦公室應(yīng)用時,只有具有訪問權(quán)限的用戶才能通過遠(yuǎn)程登錄進(jìn)行系統(tǒng)應(yīng)用操作,而且只有系統(tǒng)管理員才可以進(jìn)行所有育種數(shù)據(jù)的修改、編輯和數(shù)據(jù)轉(zhuǎn)移等操作。
檔案信息:對山雞場布局、雞場結(jié)構(gòu)和數(shù)量、雞舍數(shù)量和編號、品種情況、家系數(shù)量和組成登錄存檔。
圖4 云存儲(計(jì)算)系統(tǒng)
肉用性狀數(shù)據(jù):此模塊的主要功能有肉用性狀測定數(shù)據(jù)表生成、測定數(shù)據(jù)的現(xiàn)場輸入、辦公室數(shù)據(jù)處理和初選、各選擇性狀統(tǒng)計(jì)分析等。為解決群體中多個不同批次以及不同人員之間的測定誤差,系統(tǒng)采用生物統(tǒng)計(jì)分析方法,先計(jì)算個體的標(biāo)準(zhǔn)化離差,再在此基礎(chǔ)上進(jìn)行家系成績統(tǒng)計(jì),從而消除某些系統(tǒng)因素的影響。本模塊是整個育種程序中數(shù)據(jù)處理量最大、要求最高的一個程序,處理后的數(shù)據(jù)指導(dǎo)群體的早期選種和系譜選種。
蛋用性狀數(shù)據(jù):此模塊是針對母山雞需要進(jìn)行個體蛋用性狀測定而專門設(shè)計(jì)的。它包括“母山雞上籠”、“母山雞個體信息導(dǎo)出”、“蛋用性狀測定記錄導(dǎo)入”和“產(chǎn)蛋數(shù)據(jù)統(tǒng)計(jì)分析”等程序。其中,個體蛋用性狀測定記錄數(shù)據(jù)輸入后,經(jīng)由“產(chǎn)蛋數(shù)據(jù)統(tǒng)計(jì)分析”程序進(jìn)行統(tǒng)計(jì)分析,計(jì)算出每只母山雞各時期的累計(jì)總蛋數(shù)、累計(jì)合格蛋數(shù)、開產(chǎn)日齡、蛋重、蛋色、蛋品質(zhì)等,同時也計(jì)算出家系和同胞上述各性狀成績,從而指導(dǎo)母山雞蛋用性狀選種。
孵化管理:家系輸精生產(chǎn)的種蛋管理,孵化廳系譜孵化的數(shù)據(jù)記錄和管理,出雛時穿戴翅號,建立山雞雛個體翅號信息并記錄山雞雛出生重、出生日期、批次等出生信息。
系譜選種選配:利用測定的生產(chǎn)性狀等數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,采用BLUP算法進(jìn)行計(jì)算。同時,可以根據(jù)用戶實(shí)際需求進(jìn)行BLUP模型的定義及綜合育種值各類經(jīng)濟(jì)系數(shù)的定義,因而分為單個育種值和綜合育種值的計(jì)算。單個育種值是根據(jù)用戶事先定義好的固定變量及隨機(jī)變量等參數(shù)計(jì)算出的育種值;綜合育種值是以上一步計(jì)算的結(jié)果乘以事先定義好的經(jīng)濟(jì)系數(shù)而得到的綜合育種值,而經(jīng)濟(jì)系數(shù)是用戶根據(jù)自己企業(yè)具體需求來定義的。該模塊的模型定義及計(jì)算需要育種專家配合實(shí)施。
系統(tǒng)選種選配可以實(shí)現(xiàn)自動生成選配計(jì)劃。自動選配可以根據(jù)親緣關(guān)系系數(shù)來控制每個家系內(nèi)具有全同胞或半同胞關(guān)系的母山雞,以保證家系公山雞與家系內(nèi)的任何母山雞沒有全同胞或半同胞關(guān)系。另外,系統(tǒng)還可以選擇實(shí)行或者避免同型交配,為避免同型交配過于集中,系統(tǒng)將母山雞的主要選擇性狀在不同家系間均衡分布,既可以防止出現(xiàn)兩極分化,也可以長時間保持品系的相對遺傳多樣性。該模塊由程序通過計(jì)算親緣關(guān)系系數(shù)組建家系,并避免全同胞或半同胞交配。
紅艷山雞育種分析管理軟件的主界面見圖5。山雞的生產(chǎn)性狀數(shù)據(jù)分上籠測定、生長測定、體型外貌測定、屠宰測定、上產(chǎn)蛋籠后的開產(chǎn)測定、蛋品測定及產(chǎn)蛋量測定等十余個測定環(huán)節(jié),包羅了種山雞生長測定及產(chǎn)蛋測定的所有性狀。在繼代選留環(huán)節(jié),用戶可以根據(jù)綜合育種值來進(jìn)行核心群的選擇。
BLUP是目前動植物育種計(jì)算中的主流[3~5]。它是由C.R.Henderson提出的、統(tǒng)計(jì)學(xué)上用于線性混合模型對隨機(jī)效應(yīng)進(jìn)行預(yù)測的一種方法,隨機(jī)效應(yīng)的最佳線性無偏預(yù)測等同于固定效應(yīng)的最佳線性無偏估計(jì)。
本系統(tǒng)利用美國農(nóng)業(yè)部農(nóng)業(yè)研究服務(wù)中心(Agricultural Research Service,ARS)開發(fā)的第三方軟件MTDFREML工具軟件進(jìn)行育種值的BLUP計(jì)算[6]。該工具軟件利用Restricted maximum likelihood(REML)進(jìn)行混合線性模型中的協(xié)方差矩陣參數(shù)G與R的估計(jì),利用估計(jì)后的參數(shù)來預(yù)測用戶所需性狀的育種值。但考慮到企業(yè)經(jīng)常會根據(jù)自身具體情況來綜合多個性狀的綜合效應(yīng),本系統(tǒng)還可以利用自定義的經(jīng)濟(jì)系數(shù)(式1)來進(jìn)行綜合多個性狀的育種值計(jì)算,從而得出個體的綜合育種值。
Comp*
(1)
EVi:第i個性狀的育種值;
wi:第i個性狀的經(jīng)濟(jì)系數(shù);
CompEV:綜合育種值。
本系統(tǒng)就是利用綜合育種值CompEV,以家系為單位進(jìn)行下一代核心群的選取。
本系統(tǒng)中用戶定義混合線性模型的界面見圖6。通過該界面,用戶可以定義要計(jì)算的目標(biāo)性狀、固定效應(yīng)及隨機(jī)效應(yīng)等參數(shù)。
圖5 山雞育種數(shù)據(jù)管理與分析系統(tǒng)主界面
圖6 BLUP模型登記界面
用戶利用綜合育種值進(jìn)行種山雞核心群繼代選留的界面見圖7。在該界面,用戶可以利用個體綜合育種值、家系平均綜合育種值及同胞平均綜合育種值進(jìn)行排序,從而進(jìn)行下一代核心群的選留。
圖7 利用綜合育種值進(jìn)行核心群繼代選留
紅艷山雞育種分析管理軟件的研發(fā)與應(yīng)用,全面規(guī)范了山雞育種的數(shù)據(jù)采集、檢索及育種值計(jì)算等業(yè)務(wù)流程,并充分滿足了育種工作人員的實(shí)際應(yīng)用要求。該系統(tǒng)從實(shí)際出發(fā),收集、整理和規(guī)范所有相關(guān)育種信息資料,對規(guī)范種山雞場的工作流程有著積極作用,同時也大大降低了工作人員的工作負(fù)擔(dān)和工作誤差。
該系統(tǒng)界面友好、使用方便、現(xiàn)場可操作性強(qiáng),大大提高了數(shù)據(jù)的準(zhǔn)確性、安全性和信息傳遞及時性,為種山雞育種工作提供了強(qiáng)有力的技術(shù)支撐。同時由于該系統(tǒng)為C/S框架數(shù)據(jù)庫結(jié)構(gòu),采用的是云平臺,很好地解決了多個場區(qū)數(shù)據(jù)統(tǒng)一管理的客戶需求。
基于云端的大數(shù)據(jù)處理技術(shù),也使系統(tǒng)可以及時傳遞各類信息資料,有利于實(shí)時把握選育成效,及時應(yīng)對市場需求變化,并有效降低育種成本,顯著改善育種工作效率,改善種群遺傳進(jìn)展。
綜上所述,該系統(tǒng)的開發(fā)與應(yīng)用是傳統(tǒng)數(shù)量遺傳育種技術(shù)與現(xiàn)代計(jì)算機(jī)技術(shù)在山雞育種工作中的緊密結(jié)合。在今后的發(fā)展中,配合現(xiàn)代化電子標(biāo)簽及光電技術(shù)進(jìn)行山雞無紙化測定,從而進(jìn)一步降低工作強(qiáng)度,提高數(shù)據(jù)準(zhǔn)確性、可信性及安全性,最大化利用所有可利用的現(xiàn)代化技術(shù)資源,將進(jìn)一步提高山雞整體育種工作效率和市場應(yīng)變能力,且更加有效地推動山雞育種工作開展。
[1]劉宗萌.家禽育種數(shù)據(jù)庫軟件的開發(fā)與應(yīng)用[D].武漢:華中農(nóng)業(yè)大學(xué),2013.
[2]林元震,陳曉陽.R與ASReml-R統(tǒng)計(jì)分析教程[M].北京:中國林業(yè)出版社,2012.
[3]Robinson,G.K..That BLUP is a good thing:the estimation of random effects[J].Statistical Science,1991,6(1):15-32.
[4]Henderson,C.R..Best linear unbiased estimation and prediction under a selection model[J].Biometrics,1975,31:423-447.
[5]Xu-QingLiu,Jian-Ying Rong,Xiu-Ying Liu.Best linear unbiased prediction for linear combinations in general mixed linear models[J].Journal of Multivariate Analysis,2008,99(8):1503-1517.
[6]Boldmann,K.G.,L.A.Kriese,et al.A manual for use of MTDFREML[M].UnitedStates Department of Agriculture:Agricultural Research Service,1995.