王甲福,常海天
(長(zhǎng)春工業(yè)大學(xué),吉林 長(zhǎng)春 130012)
偏最小二乘法在西門塔爾牛體尺估測(cè)中的應(yīng)用
王甲福,常海天
(長(zhǎng)春工業(yè)大學(xué),吉林 長(zhǎng)春 130012)
偏最小二乘法能有效解決多元回歸分析中變量的多重共線性問題。選用牛體重、體高兩個(gè)參數(shù)做自變量估測(cè)牛的胸圍和腹圍,應(yīng)用所建立的線性模型對(duì)184頭西門塔爾牛的數(shù)據(jù)進(jìn)行誤差分析,腹圍平均相對(duì)誤差為3.742%,胸圍平均相對(duì)誤差為4.385%.證明所得偏最小二乘回歸模型具有較好的精度,模型能應(yīng)用到種牛的選育過程中,具有較強(qiáng)的實(shí)用性。
偏最小二乘回歸法;牛體尺測(cè)量;西門塔爾牛
目前,傳統(tǒng)的牛體體尺、體重測(cè)量大多使用測(cè)杖、卷尺、圓形測(cè)定器、地衡(磅秤)等工具進(jìn)行人工測(cè)量,測(cè)量過程中測(cè)量者需要對(duì)牛進(jìn)行接觸式測(cè)量,這種測(cè)量方式工作量大且伴有一定的危險(xiǎn)性。接觸式測(cè)量會(huì)對(duì)牛造成應(yīng)激反應(yīng),影響牛的生長(zhǎng)和發(fā)育。文章通過偏最小二乘法建立線性回歸分析模型,經(jīng)過各項(xiàng)體尺數(shù)據(jù)的相關(guān)性分析,選用體重和體高兩項(xiàng)體尺作為指標(biāo),對(duì)牛的胸圍和腹圍進(jìn)行估測(cè)。
(1)材料來源。試驗(yàn)數(shù)據(jù)均來自國內(nèi)某養(yǎng)牛場(chǎng)。數(shù)據(jù)統(tǒng)計(jì)日期從2010年到2012年,記錄了184頭牛在0月齡、6月齡、12月齡、18月齡、24月齡的體重、體高、十字部高、體斜長(zhǎng)、胸圍、腹圍信息。其中體重使用地磅稱重;體高指耆甲最高點(diǎn)到地面的垂直距離,用測(cè)杖或皮尺測(cè)量;體斜長(zhǎng)指肩端至坐骨端的距離,用測(cè)杖或皮尺測(cè)量;胸圍是指肩胛骨后端,圍繞胸部一周的長(zhǎng)度,用軟尺測(cè)量;腹圍是腰部圍繞腹部一周的長(zhǎng)度,用軟尺測(cè)量;十字部高為十字部到地面的垂直高度,用測(cè)杖或直尺測(cè)量。
(2)相關(guān)性分析。以18月齡牛的數(shù)據(jù)為例,利用SPSS軟件,對(duì)體重、體高、十字部高、體斜長(zhǎng)、胸圍、腹圍六個(gè)變量進(jìn)行相關(guān)性分析,并使用皮爾遜雙側(cè)檢驗(yàn)法檢驗(yàn)其顯著性,統(tǒng)計(jì)結(jié)果如表1所示。
表1 皮爾遜相關(guān)系數(shù)統(tǒng)計(jì)表
從表1中可知體重、體高、十字部高、體斜長(zhǎng)、胸圍、腹圍各變量間相關(guān)達(dá)到極顯著水平,體高與十字部高具有極強(qiáng)相關(guān)性,與體斜長(zhǎng)具有強(qiáng)相關(guān)性;胸圍和體斜長(zhǎng)、腹圍具有強(qiáng)相關(guān)性。可見在估測(cè)胸圍、腹圍時(shí),自變量間存在一定的共線性問題。由于變量間共線性問題的存在,運(yùn)用普通最小二乘法(OLS)回歸分析所建立的數(shù)學(xué)模型會(huì)失真或難以估計(jì)準(zhǔn)確。
(3)用偏最小二乘法建立線性回歸分析模型。為了有效解決自變量間共線性問題,文章通過偏最小二乘法(PLS)建立線性回歸分析模型。偏最小二乘回歸分析法采用成分提取的方法,在成分提取時(shí)選擇對(duì)自變量和因變量解釋性最強(qiáng)的綜合變量,排除噪聲干擾。
考慮到模型的實(shí)用性和可操作性,選取實(shí)際測(cè)量時(shí)較容易測(cè)量的體重和體高作為自變量,利用SPSS中PLS模塊對(duì)胸圍和腹圍進(jìn)行估測(cè)。部分實(shí)測(cè)數(shù)據(jù)如表2所示。
表2 18月齡西門塔爾牛體尺數(shù)據(jù)
胸圍估測(cè)模型:y1=1.812x2-0.037x2-39.418;
腹圍估測(cè)模型:=y2=1.804x1-0.046x2-11.809;
其中x1為體高,x2為體重。
預(yù)測(cè)值與實(shí)測(cè)值的吻合程度檢驗(yàn)的常用方法有誤差百分比法和線性回歸檢驗(yàn)法。文章采用誤差百分比法,將實(shí)測(cè)數(shù)據(jù)帶入模型中,用估測(cè)值與實(shí)測(cè)值進(jìn)行對(duì)比分析,部分結(jié)果如表3所示,184頭牛估測(cè)值與實(shí)測(cè)值的胸圍平均相對(duì)誤差率為3.633%,腹圍平均相對(duì)誤差率為4.361%,其中胸圍最大相對(duì)誤差為10.41%,腹圍最大相對(duì)誤差為11.96%,胸圍相對(duì)誤差低于7%的數(shù)據(jù)占總量的83.7%,腹圍相對(duì)誤差低于7%的數(shù)據(jù)占總量的93.6%,同時(shí)考慮到人工測(cè)量和記錄數(shù)據(jù)過程中不可避免的會(huì)產(chǎn)生數(shù)據(jù)偏差,因此估測(cè)的數(shù)學(xué)模型能夠滿足實(shí)際應(yīng)用中對(duì)誤差的要求。
表3 實(shí)際胸圍、腹圍尺寸與估測(cè)胸圍、腹圍尺寸表
文章通過偏最小二乘法回歸分析分別對(duì)不同月齡的牛胸圍和腹圍建立估測(cè)模型,模型精度和準(zhǔn)確度都能滿足實(shí)際應(yīng)用中的要求,結(jié)合牛場(chǎng)在測(cè)量數(shù)據(jù)時(shí)的實(shí)際情況,選用體重和體高兩項(xiàng)比較方便測(cè)量的數(shù)據(jù)作為自變量進(jìn)行建模,所建立的數(shù)學(xué)模型較以往的經(jīng)驗(yàn)公式有很強(qiáng)的準(zhǔn)確性和科學(xué)性優(yōu)勢(shì),可結(jié)合圖像和視覺構(gòu)建非接觸測(cè)量系統(tǒng),具有很好的實(shí)用性。但由于估測(cè)模型為靜態(tài)模型,在測(cè)量體型特殊的對(duì)象時(shí)會(huì)有一定的偏差。
[1]陸洪濤.偏最小二乘回歸數(shù)學(xué)模型及其算法研究[D].北京:華北電力大學(xué),2014.
[2]鄧衛(wèi)東,劉萬洪,王彥豐,等.云南省西門塔爾牛生長(zhǎng)模型的建立[J].中國畜牧獸醫(yī),2007,34(5):143-145.
王甲福(1966-),吉林吉林人,主要研究方向:模式識(shí)別與智能系統(tǒng)。