王 麗,黃 勇,丁 濤,陶洪飛,周 洋
本文以提高新疆兵團第八師灌溉用水有效利用系數(shù)為目的,對其影響因素進行主成分分析[1],將原來多個可能存在共線關系的影響因素數(shù)據(jù)簡化為少量新的綜合指標,建立多元線性回歸模型,對今后的灌溉用水有效利用系數(shù)進行模型預測。
新疆兵團第八師農業(yè)灌溉灌區(qū)劃分為兩個大型灌區(qū),3個中型灌區(qū),1個純井灌區(qū),無小型灌區(qū)[2],具體劃分情況見表1。
表1 第八師各灌區(qū)情況Tab.1 The irrigation areas of the eighth division
在選取第八師灌溉水影響因素時,結合第八師各灌區(qū)的現(xiàn)狀農業(yè)情況,綜合考慮自然因素、灌區(qū)用水管理水平、節(jié)水灌溉情況、渠系防滲、田間節(jié)水等方面,全面概括各主要因素,然后將各影響因素指標量化,便于分析各影響因素對灌溉用水有效利用系數(shù)的影響程度。影響因素指標選取時應符合以下原則:各影響因素全面概括性;確保影響因素沒有被重復考慮;各影響因素可量化性;選取的影響因素符合被研究灌區(qū)的實際狀況。
為了全面客觀選取影響因素,既要收集第八師多年的灌區(qū)基礎資料進行統(tǒng)計分析,又要咨詢當?shù)馗鞴鄥^(qū)的相關專家。從整體最優(yōu)化選取為目標出發(fā),對自然因素、種植模式、管理因素以及高效節(jié)水灌溉因素進行量化分析、綜合選取,建立關于影響因素的基礎指標體系,見表2。
表2 影響因素指標體系Tab.2 Index system of influencing factors
主成分分析的主要作用是降維和簡化數(shù)據(jù)結構,把原有的多個指標轉化為少數(shù)幾個代表性較好的綜合指標,這少數(shù)幾個指標能夠反映原來指標大部分的信息,并且各個指標之間保持獨立,避免出現(xiàn)重疊信息。
本文基于2008-2017年新疆兵團第八師各灌區(qū)農業(yè)灌溉基礎數(shù)據(jù),經過文獻查閱、專家咨詢,結合第八師灌區(qū)現(xiàn)狀情況,選取灌溉面積、毛灌溉用水總量、棉花種植比、當年完成節(jié)水工程投資、累計達到節(jié)水灌溉工程面積、渠道襯砌率、降水量等影響因素進行主成分分析。通過主成分分析影響因素,有效降低了模型變量的維數(shù),有效解決了影響因素共線、信息重疊給數(shù)據(jù)分析帶來的困擾[3]。
通過Spss軟件對各影響因素原始數(shù)據(jù)進行標準化處理消除量綱,通過主成分分析得到相關系數(shù)矩陣(表3)。從表3中可以看出,渠道襯砌率與灌溉面積、累計達到節(jié)水灌溉工程面積有較高相關性。說明它們在信息上重疊,用Spss提取出主成分綜合指標來代替影響因素原始指標分析,可以有效避免重疊信息,并且各綜合指標可以保持相對獨立,可見采用主成分分析是比較合適的方法。
表3 相關系數(shù)矩陣Tab.3 Correlation coefficient matrix
通過表4中KMO和巴特利特檢驗結果可以得出,KMO等于0.611,大于0.5適合作因子分析;顯著性P為0.002,小于顯著性水平0.05,可以得出用主成分分析比較合適。
表4 KMO和巴特利特檢驗Tab.4 KMO and bartlett tests
通過表5中共同度分析結果可以看出,每個變量在每個共同因素負荷量的平方總和分別為0.958、0.478、0.762、0.519、0.873、0.962和0.756,說明主成分變量能夠表達原始變量。
表5 共同度分析Tab.5 Common degree analysis
通過表6中主成分提取結果可以得到,提取兩個主成分,特征值分別為3.826和1.483,前兩個方差百分比為75.850,表明主成分分析結果比較理想。
表6 主成分提取結果Tab.6 Principal component extraction results
由因子荷載矩陣(表7)可知,灌溉面積、毛灌溉用水總量、當年完成節(jié)水工程投資、累計達到節(jié)水灌溉工程面積、渠道襯砌率在第一主成分上有較高荷載,第一主成分基本反映了這些信息;棉花種植比、降水量在第二主成分上有較高荷載,決定用兩個新的變量代替原來的7個原始變量。但這兩個新變量還不能從輸出窗口直接得到,每一個荷載量表示主成分與對應變量的相關系數(shù)。
表7 因子荷載矩陣Tab.7 Factor load matrix
圖1為主成分因子分析輸出的碎石圖,橫坐標代表公共因子的個數(shù),縱坐標代表公共因子的特征值。
圖1 主成分影響因子碎石圖Fig.1 Principal component influencing factor lithotripsy diagram
第一、第二主成分模型的表達式見式(1)、式(2):
F1=0.44X1-0.35X2+0.22X3-0.36X4+0.48X5+0.5X6-0.16X7
(1)
F2=0.37X1-0.02X2+0.63X3-0.14X4-0.02X5+0.06X6+0.67X7
(2)
式中:F1為第一主成分;F2為第二主成分;X1為灌溉面積;X2為毛灌溉用水總量;X3為棉花種植比;X4為當年完成節(jié)水工程投資;X5為累計達到節(jié)水灌溉工程面積;X6為渠道襯砌率;X7為降水量。
主成分綜合模型:
(3)
樣本綜合得分結果見表8。
表8 樣本綜合得分Tab.8 Composite sample score
由表9可以得出主成分荷載值,主成分荷載值反映了主成分與原指標之間的相關性。從表9可以得出,第一主成分中灌溉面積、渠道襯砌率、累計達到節(jié)水灌溉工程面積、當年完成節(jié)水工程投資、毛灌溉用水總量荷載值分別為0.964、0.955、0.881、0.718和-0.664;第二主成分中棉花種植比、降水量的荷載值為0.856和-0.868,說明第一主成分中灌溉面積、毛灌溉用水總量對灌水效率的影響比較大,同時累計達到節(jié)水灌溉工程面積、當年完成節(jié)水工程投資、渠道襯砌率對灌水效率的影響也比較顯著。說明棉花種植比、降水量在第一主成分中占得比重較小,相對來說棉花種植比、降水量對灌水效率的影響程度較小,雖然影響程度小,但是第二主成分的貢獻率也達到了21.191%,說明棉花種植比、降水量也是不能忽略的影響因素。
表9 旋轉后的成分矩陣Tab.9 The component matrix after rotation
2.3.1 分析計算過程
通過多元線性回歸分析,建立以第一、第二主成分為自變量,以灌溉用水有效利用系數(shù)為因變量的多元線性回歸模型。
2.3.2 分析結果
R2反映了通過變量能夠對結果變量的方差變化做出多少比例的解釋。模型中R是0.963,即模型中的自變量和應變量的相關性達到0.963。模型輸出結果見表10。
表10 模型輸出結果Tab.10 Model output
2.3.3 結果檢驗
Regression 回歸部分的方差、Residual 殘量部分的方差、Total 所有方差和的結果顯示,本研究回歸模型具有統(tǒng)計學意義,F(xiàn)(2,1)=44.082,P<0.05,表示因變量和自變量之間存在線性相關。P<0.05,說明多元線性回歸模型中至少有一個自變量的系數(shù)不為零。同時,回歸模型有統(tǒng)計學意義也說明相較于空模型,納入自變量有助于預測因變量,或說明該模型優(yōu)于空模型。
表11 方差分析表(F檢驗)Tab.11 Analysis of variance (F test)
通過表12可得,綜合指標F1、F2的P值都小于0.05,說明F1、F2對灌水系數(shù)影響比較顯著,可以保留F1、F2,模型合理,可以用于估測灌溉用水有效利用系數(shù)。
表12 系數(shù)輸出表(T檢驗)Tab.12 Coefficient output table (T test)
綜上所述,以第一、第二主成分為自變量,灌溉用水有效利用系數(shù)為因變量,建立的多元線性回歸方程為:
Y=0.018XF1+0.003XF2+0.632
(4)
式中:因變量:灌溉用水有效利用系數(shù)Y;自變量:F1、F2分別為主成分分析得到的第一、第二主成分。
本文對自然因素、種植結構及管理因素、節(jié)水灌溉因素幾大方向進行分析篩選,建立影響因素指標體系,采用Spss軟件對影響因素進行主成分分析,將多個存在共線性的影響因素指標轉化為兩個相對獨立的綜合指標。通過驗證分析這兩個綜合指標,可以很好地表達原始影響因素,然后以2個綜合指標為自變量,以灌溉用水有效利用系數(shù)為因變量,建立多元線性回歸分析模型。通過驗證,該預測模型的可靠性較高,可以作為今后第八師灌溉用水有效利用系數(shù)的估測值。