陸雪林,周洪鈞,高楊,袁紅艷,趙樂(lè)樂(lè),梁永軍
(1.上海市動(dòng)物疫病預(yù)防控制中心,上海 201103; 2.同濟(jì)大學(xué)電信學(xué)院,上海 201805;3.上海樂(lè)本信息科技有限公司,上海 201802; 4.上海紅艷山雞孵化專業(yè)合作社,上海 201408;5.吉林省四平市鐵西區(qū)畜牧管理服務(wù)中心,吉林 四平 136000)
隨著國(guó)內(nèi)山雞產(chǎn)業(yè)的發(fā)展,山雞企業(yè)的種雞群體規(guī)模越來(lái)越大。由于山雞養(yǎng)殖有世代間隔短、性狀指標(biāo)多、數(shù)據(jù)量龐大等特點(diǎn),加重了企業(yè)數(shù)據(jù)收集和管理的負(fù)擔(dān),使山雞育種進(jìn)展緩慢。因此,利用計(jì)算機(jī)技術(shù),結(jié)合家禽育種學(xué)及數(shù)量遺傳學(xué)理論,開(kāi)發(fā)出一個(gè)簡(jiǎn)潔完善的育種管理系統(tǒng),及時(shí)收集處理各種山雞育種數(shù)據(jù)資料,準(zhǔn)確計(jì)算育種值,指導(dǎo)企業(yè)選種、選配工作,是提高整個(gè)育種效率的有效手段。
應(yīng)用計(jì)算機(jī)技術(shù)進(jìn)行動(dòng)物育種資料的管理和數(shù)據(jù)分析并不是一個(gè)新鮮話題[1]。國(guó)外已有比較成熟的通用軟件ASREML[2],不僅適合于不同物種,而且還提供了大量的二次開(kāi)發(fā)功能,但是,ASREML對(duì)于國(guó)內(nèi)用戶來(lái)說(shuō)顯得比較難以使用。國(guó)內(nèi)也有家禽育種管理系統(tǒng)[1],但一般都是一個(gè)單機(jī)版系統(tǒng),無(wú)法對(duì)家禽生產(chǎn)性狀數(shù)據(jù)進(jìn)行云端管理,更不可能利用云計(jì)算來(lái)實(shí)現(xiàn)大數(shù)據(jù)挖掘;而且,這些信息軟件具有很強(qiáng)的專業(yè)性和針對(duì)性,并不是所有山雞養(yǎng)殖場(chǎng)都能適用。因而,本課題組研究人員設(shè)計(jì)開(kāi)發(fā)了一款專門(mén)針對(duì)山雞育種的分析管理軟件平臺(tái)——紅艷山
雞育種分析管理軟件。該軟件基于C/S框架,利用云計(jì)算平臺(tái)搭建,利用了最新的VC#.net 2012軟件開(kāi)發(fā)技術(shù)。數(shù)據(jù)存儲(chǔ)的云端數(shù)據(jù)庫(kù)采用基于C/S框架的分散DB設(shè)計(jì)方案,解決了局部用戶(LOCAL)數(shù)據(jù)上傳及管理需要,也實(shí)現(xiàn)了服務(wù)器云端統(tǒng)一管理需求。在育種值計(jì)算方面,采用了業(yè)內(nèi)先進(jìn)的最佳線性無(wú)偏預(yù)測(cè)法(Best Linear Unbiased Prediction,BLUP),不但可完成山雞各類生產(chǎn)性狀育種值的估計(jì),還可以計(jì)算綜合育種值,從而實(shí)現(xiàn)了考慮多種性狀、不同經(jīng)濟(jì)系數(shù)綜合影響下的山雞留種工作。
山雞育種工作周期性很強(qiáng),一般來(lái)說(shuō)1年1個(gè)世代,在山雞不同生長(zhǎng)階段實(shí)施不同育種措施。山雞育種數(shù)據(jù)管理與分析系統(tǒng)的程序總流程見(jiàn)圖1。
圖1 山雞育種數(shù)據(jù)管理與分析系統(tǒng)的程序總流程圖
本系統(tǒng)數(shù)據(jù)庫(kù)的建立與設(shè)計(jì)是基于山雞育種流程特點(diǎn)和MySQL數(shù)據(jù)庫(kù)設(shè)計(jì)原理來(lái)進(jìn)行的。每個(gè)山雞個(gè)體從系譜孵化出生到繁殖下一代的生活周期中,在其不同生長(zhǎng)階段實(shí)施不同育種措施,所有育種數(shù)據(jù)都以個(gè)體出生時(shí)所佩戴的個(gè)體身份標(biāo)識(shí)——翅號(hào)為基礎(chǔ),個(gè)體數(shù)據(jù)以及家系信息不斷積累、計(jì)算和傳遞,從而在純系選育過(guò)程中充分利用這些數(shù)據(jù)信息。本系統(tǒng)的數(shù)據(jù)流程見(jiàn)圖2。
為了存儲(chǔ)山雞生活周期中各個(gè)時(shí)期的生產(chǎn)數(shù)據(jù),系統(tǒng)在數(shù)據(jù)庫(kù)中設(shè)計(jì)了12個(gè)基本數(shù)據(jù)表格:檔案新登表、上測(cè)定籠表、生長(zhǎng)測(cè)定表、外貌測(cè)定表、屠宰測(cè)定表、生長(zhǎng)期選留表、上產(chǎn)蛋籠表、開(kāi)產(chǎn)測(cè)定表、蛋品測(cè)定表、料蛋比測(cè)定表、產(chǎn)蛋量測(cè)定表、繼代選留表。檔案新登表主要記錄雛雞出生信息及其父母信息等,該類信息將在后面各階段數(shù)據(jù)中共享;上測(cè)定籠表用于記錄雛雞雞舍編號(hào)等信息;生長(zhǎng)測(cè)定表用于記錄始測(cè)、中測(cè)、結(jié)測(cè)3個(gè)時(shí)期山雞的耗料及體重,從而計(jì)算測(cè)定期料肉比;外貌測(cè)定表用于記錄胸寬、體長(zhǎng)等山雞體型外貌信息;屠宰測(cè)定表用于記錄山雞屠宰測(cè)定的全凈膛重、腹脂率等數(shù)據(jù);生長(zhǎng)期選留表用于記錄利用已測(cè)數(shù)據(jù)進(jìn)行淘汰選留的情況;上產(chǎn)蛋籠表用于記錄產(chǎn)蛋舍號(hào)、籠號(hào)等信息;開(kāi)產(chǎn)測(cè)定表用于記錄山雞開(kāi)產(chǎn)日齡、開(kāi)產(chǎn)體重等信息;蛋品測(cè)定表用于記錄山雞蛋蛋品質(zhì)性狀測(cè)定的蛋重、蛋殼色澤、蛋殼強(qiáng)度、蛋殼厚度、哈氏單位等各類信息;料蛋比測(cè)定表用于記錄山雞蛋蛋重與飼料消耗等數(shù)據(jù);產(chǎn)蛋量測(cè)定表用于記錄不同時(shí)間段山雞產(chǎn)蛋量;繼代選留表是系統(tǒng)依據(jù)測(cè)定數(shù)據(jù)及計(jì)算的育種值進(jìn)行選留后的結(jié)果。
主要由檔案信息、肉用性狀、蛋用性狀、孵化管理、系譜選種選配以及系統(tǒng)維護(hù)等模塊組成(圖3)。
圖2 山雞育種數(shù)據(jù)管理與分析系統(tǒng)的數(shù)據(jù)流程
圖3 山雞育種數(shù)據(jù)管理與分析系統(tǒng)結(jié)構(gòu)
本系統(tǒng)采用云存儲(chǔ)(計(jì)算)結(jié)構(gòu),用戶利用應(yīng)用程序,負(fù)責(zé)數(shù)據(jù)的輸入及簡(jiǎn)單計(jì)算,比如肉料比等計(jì)算,基本是在本地計(jì)算機(jī)上完成。數(shù)據(jù)輸入界面等也在本地計(jì)算機(jī)展示,從而實(shí)現(xiàn)數(shù)據(jù)輸入。大量山雞性狀測(cè)定數(shù)據(jù)被存儲(chǔ)到云端服務(wù)器上,利用云端服務(wù)器的高性能計(jì)算能力進(jìn)行BLUP計(jì)算,從而實(shí)現(xiàn)高性能云計(jì)算結(jié)構(gòu)(圖4)。
采用現(xiàn)場(chǎng)(山雞場(chǎng)或孵化場(chǎng))應(yīng)用模式和辦公室(育種技術(shù)室)局域網(wǎng)應(yīng)用模式相結(jié)合的系統(tǒng)應(yīng)用方式?,F(xiàn)場(chǎng)應(yīng)用模式包括肉用性狀測(cè)定、蛋用性狀測(cè)定、孵化管理、系譜選種選配等過(guò)程,完成現(xiàn)場(chǎng)數(shù)據(jù)采集和育種資料的收集工作后,將采集的數(shù)據(jù)轉(zhuǎn)存于辦公室局域網(wǎng)服務(wù)器中,在辦公室應(yīng)用模式中完成數(shù)據(jù)處理、統(tǒng)計(jì)分析、辦公室選種、組建家系和遺傳分析等工作。進(jìn)行辦公室應(yīng)用時(shí),只有具有訪問(wèn)權(quán)限的用戶才能通過(guò)遠(yuǎn)程登錄進(jìn)行系統(tǒng)應(yīng)用操作,而且只有系統(tǒng)管理員才可以進(jìn)行所有育種數(shù)據(jù)的修改、編輯和數(shù)據(jù)轉(zhuǎn)移等操作。
檔案信息:對(duì)山雞場(chǎng)布局、雞場(chǎng)結(jié)構(gòu)和數(shù)量、雞舍數(shù)量和編號(hào)、品種情況、家系數(shù)量和組成登錄存檔。
圖4 云存儲(chǔ)(計(jì)算)系統(tǒng)
肉用性狀數(shù)據(jù):此模塊的主要功能有肉用性狀測(cè)定數(shù)據(jù)表生成、測(cè)定數(shù)據(jù)的現(xiàn)場(chǎng)輸入、辦公室數(shù)據(jù)處理和初選、各選擇性狀統(tǒng)計(jì)分析等。為解決群體中多個(gè)不同批次以及不同人員之間的測(cè)定誤差,系統(tǒng)采用生物統(tǒng)計(jì)分析方法,先計(jì)算個(gè)體的標(biāo)準(zhǔn)化離差,再在此基礎(chǔ)上進(jìn)行家系成績(jī)統(tǒng)計(jì),從而消除某些系統(tǒng)因素的影響。本模塊是整個(gè)育種程序中數(shù)據(jù)處理量最大、要求最高的一個(gè)程序,處理后的數(shù)據(jù)指導(dǎo)群體的早期選種和系譜選種。
蛋用性狀數(shù)據(jù):此模塊是針對(duì)母山雞需要進(jìn)行個(gè)體蛋用性狀測(cè)定而專門(mén)設(shè)計(jì)的。它包括“母山雞上籠”、“母山雞個(gè)體信息導(dǎo)出”、“蛋用性狀測(cè)定記錄導(dǎo)入”和“產(chǎn)蛋數(shù)據(jù)統(tǒng)計(jì)分析”等程序。其中,個(gè)體蛋用性狀測(cè)定記錄數(shù)據(jù)輸入后,經(jīng)由“產(chǎn)蛋數(shù)據(jù)統(tǒng)計(jì)分析”程序進(jìn)行統(tǒng)計(jì)分析,計(jì)算出每只母山雞各時(shí)期的累計(jì)總蛋數(shù)、累計(jì)合格蛋數(shù)、開(kāi)產(chǎn)日齡、蛋重、蛋色、蛋品質(zhì)等,同時(shí)也計(jì)算出家系和同胞上述各性狀成績(jī),從而指導(dǎo)母山雞蛋用性狀選種。
孵化管理:家系輸精生產(chǎn)的種蛋管理,孵化廳系譜孵化的數(shù)據(jù)記錄和管理,出雛時(shí)穿戴翅號(hào),建立山雞雛個(gè)體翅號(hào)信息并記錄山雞雛出生重、出生日期、批次等出生信息。
系譜選種選配:利用測(cè)定的生產(chǎn)性狀等數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,采用BLUP算法進(jìn)行計(jì)算。同時(shí),可以根據(jù)用戶實(shí)際需求進(jìn)行BLUP模型的定義及綜合育種值各類經(jīng)濟(jì)系數(shù)的定義,因而分為單個(gè)育種值和綜合育種值的計(jì)算。單個(gè)育種值是根據(jù)用戶事先定義好的固定變量及隨機(jī)變量等參數(shù)計(jì)算出的育種值;綜合育種值是以上一步計(jì)算的結(jié)果乘以事先定義好的經(jīng)濟(jì)系數(shù)而得到的綜合育種值,而經(jīng)濟(jì)系數(shù)是用戶根據(jù)自己企業(yè)具體需求來(lái)定義的。該模塊的模型定義及計(jì)算需要育種專家配合實(shí)施。
系統(tǒng)選種選配可以實(shí)現(xiàn)自動(dòng)生成選配計(jì)劃。自動(dòng)選配可以根據(jù)親緣關(guān)系系數(shù)來(lái)控制每個(gè)家系內(nèi)具有全同胞或半同胞關(guān)系的母山雞,以保證家系公山雞與家系內(nèi)的任何母山雞沒(méi)有全同胞或半同胞關(guān)系。另外,系統(tǒng)還可以選擇實(shí)行或者避免同型交配,為避免同型交配過(guò)于集中,系統(tǒng)將母山雞的主要選擇性狀在不同家系間均衡分布,既可以防止出現(xiàn)兩極分化,也可以長(zhǎng)時(shí)間保持品系的相對(duì)遺傳多樣性。該模塊由程序通過(guò)計(jì)算親緣關(guān)系系數(shù)組建家系,并避免全同胞或半同胞交配。
紅艷山雞育種分析管理軟件的主界面見(jiàn)圖5。山雞的生產(chǎn)性狀數(shù)據(jù)分上籠測(cè)定、生長(zhǎng)測(cè)定、體型外貌測(cè)定、屠宰測(cè)定、上產(chǎn)蛋籠后的開(kāi)產(chǎn)測(cè)定、蛋品測(cè)定及產(chǎn)蛋量測(cè)定等十余個(gè)測(cè)定環(huán)節(jié),包羅了種山雞生長(zhǎng)測(cè)定及產(chǎn)蛋測(cè)定的所有性狀。在繼代選留環(huán)節(jié),用戶可以根據(jù)綜合育種值來(lái)進(jìn)行核心群的選擇。
BLUP是目前動(dòng)植物育種計(jì)算中的主流[3~5]。它是由C.R.Henderson提出的、統(tǒng)計(jì)學(xué)上用于線性混合模型對(duì)隨機(jī)效應(yīng)進(jìn)行預(yù)測(cè)的一種方法,隨機(jī)效應(yīng)的最佳線性無(wú)偏預(yù)測(cè)等同于固定效應(yīng)的最佳線性無(wú)偏估計(jì)。
本系統(tǒng)利用美國(guó)農(nóng)業(yè)部農(nóng)業(yè)研究服務(wù)中心(Agricultural Research Service,ARS)開(kāi)發(fā)的第三方軟件MTDFREML工具軟件進(jìn)行育種值的BLUP計(jì)算[6]。該工具軟件利用Restricted maximum likelihood(REML)進(jìn)行混合線性模型中的協(xié)方差矩陣參數(shù)G與R的估計(jì),利用估計(jì)后的參數(shù)來(lái)預(yù)測(cè)用戶所需性狀的育種值。但考慮到企業(yè)經(jīng)常會(huì)根據(jù)自身具體情況來(lái)綜合多個(gè)性狀的綜合效應(yīng),本系統(tǒng)還可以利用自定義的經(jīng)濟(jì)系數(shù)(式1)來(lái)進(jìn)行綜合多個(gè)性狀的育種值計(jì)算,從而得出個(gè)體的綜合育種值。
Comp*
(1)
EVi:第i個(gè)性狀的育種值;
wi:第i個(gè)性狀的經(jīng)濟(jì)系數(shù);
CompEV:綜合育種值。
本系統(tǒng)就是利用綜合育種值CompEV,以家系為單位進(jìn)行下一代核心群的選取。
本系統(tǒng)中用戶定義混合線性模型的界面見(jiàn)圖6。通過(guò)該界面,用戶可以定義要計(jì)算的目標(biāo)性狀、固定效應(yīng)及隨機(jī)效應(yīng)等參數(shù)。
圖5 山雞育種數(shù)據(jù)管理與分析系統(tǒng)主界面
圖6 BLUP模型登記界面
用戶利用綜合育種值進(jìn)行種山雞核心群繼代選留的界面見(jiàn)圖7。在該界面,用戶可以利用個(gè)體綜合育種值、家系平均綜合育種值及同胞平均綜合育種值進(jìn)行排序,從而進(jìn)行下一代核心群的選留。
圖7 利用綜合育種值進(jìn)行核心群繼代選留
紅艷山雞育種分析管理軟件的研發(fā)與應(yīng)用,全面規(guī)范了山雞育種的數(shù)據(jù)采集、檢索及育種值計(jì)算等業(yè)務(wù)流程,并充分滿足了育種工作人員的實(shí)際應(yīng)用要求。該系統(tǒng)從實(shí)際出發(fā),收集、整理和規(guī)范所有相關(guān)育種信息資料,對(duì)規(guī)范種山雞場(chǎng)的工作流程有著積極作用,同時(shí)也大大降低了工作人員的工作負(fù)擔(dān)和工作誤差。
該系統(tǒng)界面友好、使用方便、現(xiàn)場(chǎng)可操作性強(qiáng),大大提高了數(shù)據(jù)的準(zhǔn)確性、安全性和信息傳遞及時(shí)性,為種山雞育種工作提供了強(qiáng)有力的技術(shù)支撐。同時(shí)由于該系統(tǒng)為C/S框架數(shù)據(jù)庫(kù)結(jié)構(gòu),采用的是云平臺(tái),很好地解決了多個(gè)場(chǎng)區(qū)數(shù)據(jù)統(tǒng)一管理的客戶需求。
基于云端的大數(shù)據(jù)處理技術(shù),也使系統(tǒng)可以及時(shí)傳遞各類信息資料,有利于實(shí)時(shí)把握選育成效,及時(shí)應(yīng)對(duì)市場(chǎng)需求變化,并有效降低育種成本,顯著改善育種工作效率,改善種群遺傳進(jìn)展。
綜上所述,該系統(tǒng)的開(kāi)發(fā)與應(yīng)用是傳統(tǒng)數(shù)量遺傳育種技術(shù)與現(xiàn)代計(jì)算機(jī)技術(shù)在山雞育種工作中的緊密結(jié)合。在今后的發(fā)展中,配合現(xiàn)代化電子標(biāo)簽及光電技術(shù)進(jìn)行山雞無(wú)紙化測(cè)定,從而進(jìn)一步降低工作強(qiáng)度,提高數(shù)據(jù)準(zhǔn)確性、可信性及安全性,最大化利用所有可利用的現(xiàn)代化技術(shù)資源,將進(jìn)一步提高山雞整體育種工作效率和市場(chǎng)應(yīng)變能力,且更加有效地推動(dòng)山雞育種工作開(kāi)展。
[1]劉宗萌.家禽育種數(shù)據(jù)庫(kù)軟件的開(kāi)發(fā)與應(yīng)用[D].武漢:華中農(nóng)業(yè)大學(xué),2013.
[2]林元震,陳曉陽(yáng).R與ASReml-R統(tǒng)計(jì)分析教程[M].北京:中國(guó)林業(yè)出版社,2012.
[3]Robinson,G.K..That BLUP is a good thing:the estimation of random effects[J].Statistical Science,1991,6(1):15-32.
[4]Henderson,C.R..Best linear unbiased estimation and prediction under a selection model[J].Biometrics,1975,31:423-447.
[5]Xu-QingLiu,Jian-Ying Rong,Xiu-Ying Liu.Best linear unbiased prediction for linear combinations in general mixed linear models[J].Journal of Multivariate Analysis,2008,99(8):1503-1517.
[6]Boldmann,K.G.,L.A.Kriese,et al.A manual for use of MTDFREML[M].UnitedStates Department of Agriculture:Agricultural Research Service,1995.