□謝煊(成都體育學院四川成都610041;華安財產保險股份有限公司四川分公司四川成都610016)
多元線性回歸的S P SS統(tǒng)計應用
——以某公司成年男子體脂率與身體形態(tài)指標為例
□謝煊(成都體育學院四川成都610041;華安財產保險股份有限公司四川分公司四川成都610016)
本文運用多元線性回歸分析方法,對某公司40名成年男子的體脂率與身體形態(tài)指標進行分析,用逐步回歸方法建立線性回歸方程,并與全回歸結果進行對比,通過分析找出影響體脂率的主要形態(tài)指標因素。
成年男子體脂率形態(tài)指標多元線性回歸應用
為了描述父母身高與兒子身高之間的關系,生物統(tǒng)計學家高爾頓(F.Galton,1822-1911)引進了“回歸”一詞。
線性回歸分析研究的是因變量與自變量的線性依存關系,多元線性回歸方程為:y^=b0+b1x1+…+b k x k,其中y^為因變量y的估計值,x i(i=1,…,k)為自變量,k為自變量個數(shù),b0為回歸方程的常數(shù)項,b i(i=1,…,k)為回歸系數(shù)。
一元線性回歸方程在回歸模型中只含有一個自變量,它是多元線性回歸方程的特殊情形。
某公司40名成年男子體脂率(y)與身高(x1)、體重(x2)、胸圍(x3)、腰圍(x4)、臀圍(x5)等指標,如下表1所示。運用多元線性回歸分析法的其中兩種方法,即全回歸分析法及逐步回歸分析法及其相互間的分析對比,找出影響體脂率的主要形態(tài)指標因素。
選擇“分析”菜單—“回歸”—“線性(L)…”項,打開如圖1所示的“線性回歸”對話框,從左邊的原變量列表框將因變量“體脂率”移至“因變量(D)”框,再將“身高”、“體重”、“胸圍”、“腰圍”、“臀圍”等自變量全部移至“自變量(I)”框。在“方法(M)”下拉式列表框中選擇“進入”。
圖1 線性回歸對話框
單擊“統(tǒng)計量(S)…”按鈕,打開“線性回歸:統(tǒng)計量”對話框,如圖2所示。在“回歸系數(shù)”框中選擇“估計(E)”項,在“殘差”框中選擇“Dur b in-W atson”項,在其他選項中選擇“模型擬合度(M)”和“共線性診斷(L)”,其余使用默認選項?;氐健熬€性回歸”對話框,按“確認”按鈕,進行S P SS運算。
單擊“統(tǒng)計量(S)…”按鈕,打開“線性回歸:統(tǒng)計量”對話框,如圖2所示。在“回歸系數(shù)”框中選擇“估計(E)”項,在“殘差”框中選擇“Dur b in-W atson”項,在其他選項中選擇“模型擬合度(M)”和“共線性診斷(L)”,其余使用默認選項?;氐健熬€性回歸”對話框,按“確認”按鈕,進行S P SS運算。
表1 某公司40名成年男子形態(tài)指標匯總表
計算結果如表2至表5所示。
表2給出了回歸分析的常用統(tǒng)計量,其中包含了D-W檢驗值。決定系數(shù)R2為0.841,較接近于1;剩余標準差S y為2.69701,經計算,標準剩余標準差S y'為14.93%,精度低;D-W檢驗值為1.165,其值趨向于2,則說明不存在自相關關系,即不能認為存在異方差。
圖2 “線性回歸:統(tǒng)計量”對話框
表2模型匯總b
表3是對方程進行方差分析檢驗的結果,P<0.001,方程具有顯著的可靠性,線性關系可以確立。
?
表4給出方程系數(shù)、系數(shù)檢驗結果和共線性檢驗結果。由各自變量的標準回歸系數(shù)可以看出,胸圍(x3)、腰圍(x4)、臀圍(x5)等三項指標對體脂率(y)的影響最大。通過對各自變量回歸系數(shù)的t值大小的比較,也可以分析出胸圍(x3)、腰圍(x4)、臀圍(x5)等三個自變量對體脂率(y)的影響最大。參數(shù)檢驗結果顯示,只有b3、b4、b5的相伴概率P<0.1具有顯著意義,其余系數(shù)均P>0.1,不顯著。根據(jù)容忍值(T ol)法,因為T ol均大于0.1,初步說明自變量間的共線性不強。
表4 系數(shù)a
表5 共線性診斷a結果
由表4,可以得到回歸方程為:
y^=-32.796-0.47x1+0.00003956x2+0.192x3+0.218x4+0.252x5
表5為共線性診斷分析結果。可以看到,第6維的條件索引為174.314,遠遠大于30,特征值為0,但因只有身高(x1)的方差比例(0.99)大于50%,說明這幾個變量間不存在嚴重的共線性問題,即自變量間的共線性不強。
選擇“分析”菜單-“回歸”-“線性(L)…”項,打開如圖3所示的“線性回歸”對話框,從左邊的原變量列表框將因變量“體脂率”移至“因變量(D)”框,再將“身高”、“體重”、“胸圍”、“腰圍”、“臀圍”等自變量全部移至“自變量(I)”框。在“方法(M)”下拉式列表框中選擇“逐步”。
圖3 線性回歸對話框
在“線性回歸”對話框中單擊“選項”按鈕,打開“線性回歸:選項”對話框,如圖4所示,本題采用圖4的默認值。
回到“線性回歸”對話框,單擊“確認”按鈕進行統(tǒng)計S P SS運算。
圖4 “線性回歸:選項”對話框
計算結果如表6-表9所示。
由表6可以看出,本題的最終決定系數(shù)為0.840,與全回歸決定系數(shù)0.841非常接近,且仍較接近于1;剩余標準差S y為2.62864,經計算,標準剩余標準差S y'為14.55%,雖然自變量減少,但估計精度比全回歸反倒有所提高;D-W檢驗值為1.234,其值趨向于2,則說明不存在自相關關系,即不能認為存在異方差。
表6 模型匯總d
由表7可以看出,方差分析結果P<0.001,方程具有顯著的可靠性,線性關系可以確立。
由表8可以看出,只有胸圍(x3)、腰圍(x4)、臀圍(x5)被選入方程,其余變量均被剔除,最終得到回歸方程為:
y^=-40.787+0.198x3+0.214x4+0.245x5
參數(shù)檢驗結果顯示,目前方程中的三個自變量的P值都小于0.05,具有顯著意義。共線性檢驗結果顯示V I F<10,說明不存在共線性。
表7 逐步回歸方差分析表(novad)
表8 逐步回歸系數(shù)a分析表
由表9可以看出,模型3中第二維的條件指數(shù)大于15,第三維、第四維的條件指數(shù)均大于30,其特征值均接近于0,但在這三維中均未出現(xiàn)兩個以上變量的方差比例同時大于50%的情況,因此不能認定存在共線性問題。這與表8的結論一致。
表9 逐步回歸共線性診斷a分析表
通過與全回歸結果的對比分析,逐步回歸的效果均優(yōu)于全回歸分析效果;影響體脂率的主要形態(tài)指標因素是胸圍(x3)、腰圍(x4)、臀圍(x5)。
[1]權德慶主編.體育統(tǒng)計學[M].北京:人民體育出版社,2011.
[2]葉中行.概率論與數(shù)理統(tǒng)計[M].北京:北京大學出版社,2010.
[3]宇傳華.SPSS統(tǒng)計分析[M].北京:電子工業(yè)出版社,2007.
[4]陳及治.體育統(tǒng)計[M].北京:人民體育出版社,2006.
[5]李世明.實用體育多元分析方法[M].北京:人民體育出版社, 2006.
G804
A
1006-8902-(2017)-08-SY