王懷亮
(菏澤學(xué)院,山東菏澤 274015)
[經(jīng)濟管理]
基于R軟件的logistic回歸模型建模
王懷亮
(菏澤學(xué)院,山東菏澤 274015)
Logistic回歸模型是研究因變量為二分類觀察結(jié)果與影響因素(自變量)之間關(guān)系的重要多變量分析方法模型,但它的計算依賴于統(tǒng)計軟件。通過具體實例對自由優(yōu)秀R軟件在處理分析Logistic回歸模型作出簡要分析。
R軟件;logistic回歸;廣義線性模型
線性回歸模型是定量分析中最常用的統(tǒng)計分析方法,但線性回歸分析一般要求響應(yīng)變量是連續(xù)變量、數(shù)據(jù)分布為正態(tài)分布等條件。在實際分析研究中,經(jīng)常遇到的是非連續(xù)的響應(yīng)變量,即分類響應(yīng)變量,如經(jīng)濟學(xué)研究中所涉及的是否購買某種商品、是否滿意某種服務(wù)等,政治學(xué)中經(jīng)常涉及的研究是否選舉某候選人、流行病學(xué)中研究的是否患病等。在研究二分變量與諸多自變量的相互關(guān)系時,常選用Logistic回歸模型。
由于Logistic回歸模型涉及較復(fù)雜的數(shù)學(xué)理論,一般無法用手工計算,必須有計算機和統(tǒng)計軟件的支持,在統(tǒng)計軟件方面,常用的統(tǒng)計軟件有 SPSS、SAS、STAT、R、S-PLUS等。R軟件是一個自由、免費、開源的軟件,是一個具有強大統(tǒng)計分析功能和優(yōu)秀統(tǒng)計制圖功能的統(tǒng)計軟件,現(xiàn)已是國內(nèi)外眾多統(tǒng)計學(xué)者喜愛的數(shù)據(jù)分析工具。本文結(jié)合實例介紹了R軟件在Logistic回歸模型中的應(yīng)用。
Logistic回歸(logistic regression)是研究因變量為二分類觀察結(jié)果與影響因素(自變量)之間關(guān)系的一種多變量分析方法,屬概率型非線性回歸。一般Logistic模型為:
Logistic回歸參數(shù)的估計通常采用最大似然法(maximum likelihood,ML)。最大似然法的基本思想是先建立似然函數(shù)與對數(shù)似然函數(shù),再通過使對數(shù)似然函數(shù)最大求解相應(yīng)的參數(shù)值,所得到的估計值稱為參數(shù)的最大似然估計值。最大似然估計具有的一致性、有效性和正態(tài)性都是一些很好的統(tǒng)計性質(zhì),樣本數(shù)據(jù)越大時其估計值就越準(zhǔn)確。
由于Logistic回歸模型就是基于二項分布族的廣義線性模型,因此在R軟件中,Logistic回歸分析可以通過調(diào)用廣義線性回歸模型函數(shù)glm()來實現(xiàn),其調(diào)用格式為
Log<-glm(formula,family=binomial,data)
其中,formula為要擬合的模型,family=binomial說明分布為二項分布,data為可選擇的數(shù)據(jù)框。
例1 Coupons.sta是一組研究贈券效果的數(shù)據(jù)。研究者隨機選擇1000戶家庭,將面值分別為5美分、10美分、15美分、20美分或30美分的折扣券發(fā)給他們,每種面值的折扣都是200張,發(fā)給200個家庭。研究者感興趣的是折扣券的面值是否影響人們對它們的使用,因此因變量可以表示為每種折扣券分別有多少張被使用,以此來考察折扣券的效果。得到的數(shù)據(jù)如下表所示,每一行表示在某一折扣水平下,使用或不使用折扣券的戶數(shù),最后一列表示折扣券的實際效果,即是否被使用,“是”編碼為“1”,“否”編碼為“0”。
折扣(美分) 戶數(shù) 是否使用 折扣(美分)戶數(shù) 是否使用5 32 是 5 168否10 51 是 10 149否15 70 是 15 130否20 103 是 20 97否30 148 是 30 52否
R語言程序如下:
1.輸入數(shù)據(jù)及作logistic回歸:
折扣每增大5美分,人們使用它的概率就會變?yōu)樵瓉淼膃xp(0.108719x5)≈0.172倍.
[1]王濟川,郭志剛.Logistic回歸模型——方法與應(yīng)用[M].北京:高等教育出版社,2001.
[2]湯銀才.R語言與統(tǒng)計分析[M].北京:高等教育出版社,2008.
[3]呂曉玲,謝邦昌.?dāng)?shù)據(jù)挖掘:方法與應(yīng)用[M].北京:中國人民大學(xué)出版社,2009.
O212.1
B
1002-2880(2010)11-0117-02
王懷亮(1981-),男,漢族,山東曹縣人,菏澤學(xué)院經(jīng)濟系助教,碩士,主要從事計量經(jīng)濟統(tǒng)計分析。
(責(zé)任編輯:馬 琳)