劉 鋒,徐振樞,王利兵
(重慶理工大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400054)
小麥的機(jī)械強(qiáng)度受到小麥許多指標(biāo)因素的影響,其中,小麥抗倒伏性對(duì)小麥生產(chǎn)至關(guān)重要[1-3]。小麥的抗倒伏性在小麥生長(zhǎng)的不同時(shí)期可造成不同的影響。通過(guò)增強(qiáng)小麥的抗倒伏指數(shù),可以更有效地讓小麥成熟,從而增加小麥產(chǎn)量。本文主要用部分線性模型對(duì)小麥機(jī)械強(qiáng)度與小麥各參數(shù)之間的關(guān)系進(jìn)行研究。
Engle(1986)[4]首先提出了半?yún)?shù)部分線性模型,其具體形式是:
其中:x=(x1,x2,…,xs)是隨機(jī)變量;xj,j=1,2,…,s是x的第j個(gè)分量;β是未知參數(shù)部分;g(·)是未知函數(shù)部分;ε為隨機(jī)誤差,隨機(jī)誤差部分需要滿足E(εi)=0,Var(εi)=σ2。本文就是要應(yīng)用部分線性模型得到小麥抗倒伏指標(biāo)中機(jī)械強(qiáng)度與小麥自身的指數(shù)之間的參數(shù)關(guān)系,進(jìn)而進(jìn)行分析。
對(duì)于上述的部分線性模型,需要對(duì)未知參數(shù)和未知函數(shù)部分進(jìn)行估計(jì)。本文應(yīng)用兩步估計(jì)算法對(duì)未知的函數(shù)進(jìn)行估值,從而得到函數(shù)的形式。兩步估計(jì)算法[5]是通過(guò)將函數(shù)擬合得到對(duì)于未知部分的估計(jì)值。
模型為
對(duì)于該模型以變量T取條件期望,從而得到方程:
式(2)減去式(1)得到:
缺失數(shù)據(jù)是在生活與科研中經(jīng)常遇到的,由于部分原因?qū)е铝藬?shù)據(jù)統(tǒng)計(jì)中出現(xiàn)了數(shù)據(jù)的缺失,進(jìn)行分析時(shí)只能對(duì)一部分?jǐn)?shù)據(jù)進(jìn)行分析。
對(duì)于缺失數(shù)據(jù)的分析,首先設(shè)定缺失指示變量,即:
據(jù)此可以得出相應(yīng)的缺失模型:
利用已知數(shù)據(jù)及上述模型,根據(jù)文獻(xiàn)[6]得到缺失數(shù)據(jù)的借補(bǔ)值。
本研究選取了2007、2008和2011年小麥數(shù)據(jù)(矮抗58,周麥18),包括小麥各節(jié)長(zhǎng)度、粗度,單個(gè)小麥的重心高度、莖稈壁厚、穗重等對(duì)小麥抗倒伏性研究較為重要的指標(biāo)。
可以看到,上述公式中莖稈鮮重與莖稈重心高度都可以通過(guò)測(cè)量得到,而機(jī)械強(qiáng)度往往不容易獲得,因此莖稈機(jī)械強(qiáng)度對(duì)于小麥抗倒伏性是非常重要的。
由于只有2007年的數(shù)據(jù)給出了具體的小麥機(jī)械強(qiáng)度測(cè)量數(shù)據(jù),因此首先就要進(jìn)行數(shù)據(jù)分析和方程擬合,得到機(jī)械強(qiáng)度與各指標(biāo)之間的函數(shù)關(guān)系,進(jìn)而應(yīng)用2008年與2011年的數(shù)據(jù)得到這2個(gè)年度小麥品種的機(jī)械強(qiáng)度。通過(guò)3個(gè)年度的數(shù)據(jù)比較,分析出矮抗58的抗倒性要強(qiáng)于周麥18的抗倒性。
2.1.1 周麥18分析
在2個(gè)小麥品種之中,周麥18這個(gè)小麥品種的各項(xiàng)指標(biāo)不存在缺失,因此先分析該種小麥。
令:y為機(jī)械強(qiáng)度;x1為莖稈重心;x2為基部第5節(jié)長(zhǎng)度;x3為基部第5節(jié)粗度;x4為基部第4節(jié)長(zhǎng)度;x5為基部第4節(jié)粗度;x6為基部第3節(jié)長(zhǎng)度;x7為基部第3節(jié)粗度;x8為基部第2節(jié)長(zhǎng)度;x9為基部第2節(jié)粗度;x10為莖稈壁厚;x11為麥穗鮮重。
首先通過(guò)數(shù)據(jù)的相關(guān)性分析得到機(jī)械強(qiáng)度與主要指標(biāo)之間的相關(guān)系數(shù)矩陣,見(jiàn)表1。
對(duì)小麥品種周麥18進(jìn)行因子分析,結(jié)果表明,前2個(gè)成分的累積貢獻(xiàn)率達(dá)到0.801 56,因此取這2個(gè)成分進(jìn)行分析。具體形式為:
由圖1、2可以看出:第1成分與機(jī)械強(qiáng)度之間存在著較強(qiáng)的線性關(guān)系,而第2成分與響應(yīng)變量之間無(wú)法得到具體的函數(shù)形式。因此,用部分線性模型進(jìn)行擬合,核函數(shù)選取為k(t)=15×(1-t2)2/16,窗寬選擇為h=0.911 423 5,利用兩步估計(jì),得到擬合方程為
圖1 周麥18第1成分與機(jī)械強(qiáng)度之間的關(guān)系
圖2 周麥18第2成分與機(jī)械強(qiáng)度之間的關(guān)系
2.1.2 矮抗58分析
矮抗58的數(shù)據(jù)存在缺失,并且存在個(gè)別的異常數(shù)據(jù)。首先要對(duì)數(shù)據(jù)進(jìn)行篩選,同時(shí)對(duì)缺失數(shù)據(jù)進(jìn)行借補(bǔ)。將借補(bǔ)值填充到缺失值對(duì)應(yīng)的部分進(jìn)行分析。首先對(duì)機(jī)械強(qiáng)度與小麥各指標(biāo)數(shù)據(jù)之間進(jìn)行了相關(guān)系數(shù)分析,對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,得到矮抗58機(jī)械強(qiáng)度與主要指標(biāo)之間的相關(guān)系數(shù)矩陣,見(jiàn)表2。
表2 矮抗58機(jī)械強(qiáng)度與主要指標(biāo)之間的相關(guān)系數(shù)矩陣
通過(guò)因子分析得到對(duì)于矮抗58這個(gè)小麥品種機(jī)械強(qiáng)度與各個(gè)品種之間的關(guān)系。通過(guò)數(shù)據(jù)模擬可以得到前2個(gè)成分的累積貢獻(xiàn)率達(dá)到0.820 29,因此取這2個(gè)成分進(jìn)行分析,其具體形式為:
接下來(lái)將得到的2個(gè)成分與小麥機(jī)械強(qiáng)度作散點(diǎn)圖,見(jiàn)圖3、4。
圖3 短抗58第1成分與機(jī)械強(qiáng)度之間的關(guān)系
圖4 短抗58第2成分與機(jī)械強(qiáng)度之間的關(guān)系
由圖3、4可以看出,小麥機(jī)械強(qiáng)度與第1成分有較為明顯的線性關(guān)系,而第2成分與小麥機(jī)械強(qiáng)度之間得不到具體的函數(shù)形式。核函數(shù)選取為k(t)=15×(1-t2)2/16,窗寬選擇為h=1.322 978,利用兩步估計(jì),得到擬合方程為
將利用上述方法得到的模型應(yīng)用到2007、2008年與2011年的數(shù)據(jù)之中,分別計(jì)算出2個(gè)小麥品種在這2個(gè)年度中樣品的機(jī)械強(qiáng)度。加上2007年數(shù)據(jù),結(jié)果見(jiàn)表3。
表3 3個(gè)年度2個(gè)小麥品種機(jī)械強(qiáng)度 kg
部分線性模型理論正在逐步推廣,其應(yīng)用還不是很全面。部分線性模型是一種非參數(shù)模型,許多統(tǒng)計(jì)問(wèn)題可以應(yīng)用該模型進(jìn)行求解。兩步估計(jì)算法在部分線性模型的估計(jì)中起到了舉足輕重的作用,它可以有效解決部分線性模型各個(gè)函數(shù)的估計(jì)問(wèn)題,如本文中所應(yīng)用的方法可以有效地解決“維數(shù)災(zāi)禍”的問(wèn)題。
本文將部分線性模型應(yīng)用到小麥抗倒伏性的研究中,獲得了對(duì)小麥抗倒伏性起到關(guān)鍵作用的機(jī)械強(qiáng)度指標(biāo)的計(jì)算方法,得到了所給定的小麥品種之中矮抗58的小麥抗倒伏性最強(qiáng)的結(jié)果。但由于數(shù)據(jù)給定的范圍較為有限,模型的精度還有待進(jìn)一步的提高,還需要進(jìn)一步研究。
[1]田保明,楊光圣,曹剛強(qiáng).農(nóng)作物倒伏及其影響因素分析[J].中國(guó)農(nóng)學(xué)通報(bào),2006,22(4):163-167.
[2]王勇,李斯深,李安飛,等.小麥種植抗倒性的評(píng)價(jià)和抗倒性裝的相關(guān)與通徑分析[J].西北植物學(xué)報(bào),2000,20(1):79-85.
[3]余澤高,李志新,嚴(yán)波.小麥莖稈機(jī)械強(qiáng)度與若干形狀的相關(guān)性研究[J].農(nóng)業(yè)工程學(xué)報(bào),2007,23(7):14-18.
[4]Engle R F,Granger C W J,Rice J,et al.Semiparametric estimates between weather and electricity sales[J].Journal of American Statistical Association,1986,80:310-319.
[5]封維波,劉瓊蓀.半?yún)?shù)模型中兩步估計(jì)與最小二乘估計(jì)的比較[J].統(tǒng)計(jì)與決策,2008(4):27-29.
[6]楊宜平,薛柳根,程維虎.響應(yīng)變量存在缺失時(shí)部分線性模型的經(jīng)驗(yàn)似然[J].高校應(yīng)用數(shù)學(xué)學(xué)報(bào),2010,25(1):43-52.