摘 要:如何對(duì)貧困生進(jìn)行客觀界定一直是困擾各高校學(xué)生工作管理部門的難題。選取能夠充分反映學(xué)生家庭收支狀況的變量,利用具有代表性的樣本可建立用于貧困生界定的Logistic回歸模型,通過對(duì)樣本數(shù)據(jù)的檢驗(yàn)表明,該模型能夠成功地對(duì)貧困生進(jìn)行界定。
關(guān)鍵詞:貧困生界定;Logistic回歸模型;評(píng)價(jià)體系
一、問題的提出
高校貧困生的界定模型是高校學(xué)生獲得貧困補(bǔ)助及助學(xué)貸款的依據(jù),是高校資助體系的重要組成部分。而當(dāng)前的許多界定標(biāo)準(zhǔn)往往存在評(píng)定標(biāo)準(zhǔn)的依據(jù)或原理不明確,評(píng)定方法帶有很強(qiáng)主觀性等問題,由此可能導(dǎo)致評(píng)價(jià)程序繁瑣,評(píng)價(jià)結(jié)果與現(xiàn)實(shí)反差較大等。選取能夠充分反映學(xué)生家庭收支狀況的變量,依據(jù)在校學(xué)生的最低消費(fèi)水平構(gòu)建相應(yīng)的數(shù)學(xué)模型,并利用數(shù)學(xué)模型開發(fā)相應(yīng)的貧困生評(píng)定軟件系統(tǒng)可以避免這些問題,且可以減少人力支出,提高評(píng)定的工作效率。本研究利用東北某高校的學(xué)生樣本,構(gòu)建了貧困生界定的數(shù)學(xué)模型,且已被用于構(gòu)建該校的貧困學(xué)生識(shí)別系統(tǒng)。
二、研究述評(píng)
當(dāng)前,國(guó)外關(guān)于貧困生界定的做法多以稅收和家庭財(cái)產(chǎn)作為依據(jù),如美國(guó)利用收入查證和收入稅征收體系來確定家庭收入,并把它作為貧困生認(rèn)定的唯一指標(biāo);德國(guó)以學(xué)生父母所得稅作為學(xué)生家庭經(jīng)濟(jì)狀況的判定依據(jù);日本用居民收入、資產(chǎn)指標(biāo)與各種分類指標(biāo)相結(jié)合來確定家庭經(jīng)濟(jì)狀況。[1]然而,這些做法如在中國(guó)實(shí)施卻會(huì)面臨很多困難。由于我國(guó)的稅收體制并不完善,學(xué)生家庭收入無法通過稅收來進(jìn)行監(jiān)測(cè)。再者,許多家庭的財(cái)產(chǎn)無法進(jìn)行估價(jià),比如農(nóng)村學(xué)生家庭所擁有的土地使用承包權(quán)等,并且有些家庭的財(cái)產(chǎn)與家庭收入的對(duì)應(yīng)關(guān)系比較弱。
我國(guó)學(xué)者關(guān)于高校貧困生的認(rèn)定主要集中于兩種方法:一種是反映學(xué)生經(jīng)濟(jì)狀況的指標(biāo)體系認(rèn)定方法,一種是依據(jù)學(xué)生消費(fèi)行為的貧困度判定方法。目前大部分學(xué)者關(guān)于貧困生認(rèn)定方法的研究采用的是指標(biāo)體系認(rèn)定方法,如趙炳起和李永寧提出了五種綜合認(rèn)定指標(biāo)[2],劉進(jìn)設(shè)計(jì)了包含7個(gè)一級(jí)指標(biāo)和18個(gè)二級(jí)指標(biāo)的判定體系。[3]這種方法與此前一直采用的純粹由輔導(dǎo)員或?qū)W生來評(píng)定貧困生的方法相比工作效率更高,客觀性更強(qiáng),但其不足之處是選取的指標(biāo)之間往往有很強(qiáng)的相關(guān)性,并且很難確定各指標(biāo)的權(quán)重。常亞平和宗樹闊提出了依據(jù)學(xué)生消費(fèi)行為的貧困度判定方法,該方法把消費(fèi)指標(biāo)(消費(fèi)指標(biāo)是一些能夠反映學(xué)生日常消費(fèi)行的指標(biāo),如情感消費(fèi)、學(xué)習(xí)消費(fèi)、飲食與日常消費(fèi)等)的加權(quán)之和作為貧困生的判定依據(jù)。[4]這種方法避免了由學(xué)生戶口所在地相關(guān)部門開具貧困證明來遴選貧困生的種種弊端,但大學(xué)生的消費(fèi)行為的數(shù)據(jù)一般較難測(cè)量,數(shù)據(jù)的可靠性依賴于學(xué)生的誠(chéng)實(shí)與否,并且對(duì)于剛?cè)雽W(xué)的新生而言,在高校的消費(fèi)習(xí)慣尚未形成,消費(fèi)指標(biāo)的相應(yīng)數(shù)據(jù)無法獲取。
三、研究設(shè)計(jì)
1. 影響因素的確定
對(duì)絕大部分學(xué)生而言,其經(jīng)濟(jì)狀況正是其家庭的經(jīng)濟(jì)狀況的反映。而影響其家庭經(jīng)濟(jì)狀況的因素有很多,如家庭有多人上大學(xué),家中有長(zhǎng)期需要治療的病人,家中無固定勞動(dòng)力,家中以農(nóng)業(yè)收入為主且遭受過自然災(zāi)害等。所有的因素可以歸納為兩類:一類是影響家庭收入的因素,一類是影響家庭支出的因素。因此,可以直接通過學(xué)生家庭的支出和收入來評(píng)價(jià)學(xué)生的經(jīng)濟(jì)狀況。在調(diào)查的過程中學(xué)生往往可以回答或者計(jì)算出其家庭年收入,但是家庭年支出卻很難估算。由調(diào)查可知,對(duì)家庭困難的學(xué)生而言教育支出和醫(yī)療支出是兩項(xiàng)主要支出。因此,增加若干個(gè)驗(yàn)證性變量后可以初步確定影響學(xué)生經(jīng)濟(jì)狀況的變量:性別,家庭人口數(shù),是否決定貸款,月消費(fèi),伙食消費(fèi),生源類別,家庭年收入,教育支出,醫(yī)療支出。為了使學(xué)生便于回答,可以通過家庭成員的健康狀況這一分類變量來代替醫(yī)療支出,而家庭成員的健康狀況用分類變量加以表示。變量之間可能存在交叉或相關(guān),而這可以在建模過程中通過統(tǒng)計(jì)檢驗(yàn)來判定。為了在建模過程中便于對(duì)變量進(jìn)行處理,不妨通過表1對(duì)分類變量進(jìn)行設(shè)定。
2. 樣本數(shù)據(jù)的獲取
在統(tǒng)計(jì)學(xué)中,樣本量的大小取決于所要估計(jì)參數(shù)個(gè)數(shù)以及響應(yīng)變量的分類數(shù)。一般而言,當(dāng)樣本量大于500時(shí)使用極大似然估計(jì)將會(huì)顯得比較充分,但要避免自變量的過度共線以及因變量的值變化太小。[5]本研究的因變量為二分類變量:貧困和不貧困,貧困的含義是其家庭無法承擔(dān)其生活及學(xué)習(xí)花費(fèi),不貧困的含義是家庭有經(jīng)濟(jì)能力承擔(dān)其生活及學(xué)習(xí)花費(fèi)。如果研究需要也可以把分類變量定義為三類及以上,三類可定義為不貧困,貧困和非常貧困,其中非常貧困的含義可以界定為在不考慮學(xué)生上學(xué)花費(fèi)的情況下家庭成員的收入無法維持家庭成員的日常生活花費(fèi)。在確定樣本數(shù)時(shí)也要注意在調(diào)查過程中難免會(huì)出現(xiàn)學(xué)生不認(rèn)真填表以及未給填表同學(xué)解釋清楚等情況,這將會(huì)導(dǎo)致一部分學(xué)生所填問卷無效,因而在實(shí)際操作過程中抽取比模型實(shí)際要求略大的樣本也顯得非常必要。抽樣時(shí)先按分層抽樣法確定每個(gè)院系,年級(jí)和班級(jí)的具體人數(shù),然后在每個(gè)班級(jí)里進(jìn)行隨機(jī)抽樣以確定具體調(diào)查的學(xué)生。
當(dāng)樣本確定以后,可利用包含學(xué)生經(jīng)濟(jì)狀況影響因素的問卷進(jìn)行調(diào)查。調(diào)查問卷收集上來之后必須判定樣本學(xué)生屬于貧困還是非貧困。判定人員由統(tǒng)計(jì)學(xué)專家、經(jīng)濟(jì)學(xué)專家、高校資深資助工作人員以及學(xué)生構(gòu)成,需要判定的事實(shí)是樣本學(xué)生家庭是否可提供其最低生活標(biāo)準(zhǔn)所需費(fèi)用。最低生活標(biāo)準(zhǔn)由全校學(xué)生消費(fèi)狀況抽樣調(diào)查確定,圖1為東北某高校各學(xué)院隨機(jī)抽取的660個(gè)學(xué)生消費(fèi)狀況分布圖,由此可看出確定最低生活標(biāo)準(zhǔn)為400元比較合適,400元能保證學(xué)生進(jìn)行正常的學(xué)習(xí)和生活。如果出現(xiàn)有爭(zhēng)議的樣本,即專家判定組的判定結(jié)果不一致,那么要求學(xué)生提供進(jìn)一步的家庭信息以使專家判定組最終能夠達(dá)成一致。樣本數(shù)據(jù)分為兩部分,一部分用于建立數(shù)學(xué)模型,另一部分用于檢驗(yàn)數(shù)學(xué)模型的有效性。
3. 模型的構(gòu)建與檢驗(yàn)
如果因變量為連續(xù)變量,用回歸分析方法建立模型將會(huì)比較恰當(dāng),而如果因變量為分類變量時(shí),就必須應(yīng)用Logistic回歸模型或者Probit回歸模型進(jìn)行分析。由于最終要建立一個(gè)根據(jù)學(xué)生家庭基本信息判定學(xué)生是否貧困的判定模型,因此必須選擇后者。在處理因變量為分類變量的問題時(shí),一般采用Logistic回歸模型或者Probit回歸模型建立各類別與自變量之間的關(guān)系。如果因變量y有兩個(gè)類別(分別用1和0來代表),二分類Logistic回歸模型的一般形式為:
p(y=1/x1,x2,…,xn)=
在獲得樣本數(shù)據(jù)后,可利用極大似然估計(jì)法對(duì)參數(shù)進(jìn)行估計(jì),評(píng)價(jià)模型的擬合效果一般采用Pearsonx2和類R2等對(duì)模型進(jìn)行檢驗(yàn)和分析,對(duì)不同的模型進(jìn)行對(duì)比采用AIC和SC信息測(cè)量指標(biāo)。采用600個(gè)樣本數(shù)據(jù),利用SAS軟件中模型變量的反向逐步選擇法(backward stepwise)[5],可以得到以下模型:
1n==1.4627+0.00034x1-1.5743x2-0.00076x3+0.4x4
其中x1表示家庭教育總支出除以家庭總?cè)藬?shù),即為學(xué)生本人的學(xué)費(fèi)加上其他上學(xué)成員的學(xué)費(fèi)除以家庭總?cè)藬?shù),單位為元;x2表示家庭成員健康狀況對(duì)應(yīng)值之和除以家庭總?cè)藬?shù);x3表示家庭平均收入,即為年總收入除以家庭人口數(shù),單位為元;x4表示生源類別。
建模結(jié)果表明,模型能夠?qū)θ繕颖緮?shù)據(jù)進(jìn)行識(shí)別。當(dāng)要判定一個(gè)學(xué)生是否貧困時(shí),只要把此學(xué)生的人均教育支出,人均相應(yīng)健康狀況,人均年收入以及生源類別帶入上述表達(dá)式,如果P大于0.5,則可以判定該學(xué)生貧困,否則為不貧困。
用100個(gè)樣本作為檢驗(yàn)樣本,Logistic回歸模型的值與真實(shí)值非常接近(部分結(jié)果見表2)。檢驗(yàn)結(jié)果顯示,樣本數(shù)據(jù)的信息比較充分,Logistic回歸模型能夠很好的解決貧困生的判定問題。用Logistic回歸模型去處理分類問題時(shí),必須考慮樣本的數(shù)量和樣本的隨機(jī)性,以避免完全分離和空單元等情況的出現(xiàn),并且其對(duì)多元共線很敏感,故建模前必須對(duì)數(shù)據(jù)進(jìn)行必要的預(yù)處理。而模型選擇考慮的主要因素還是自變量的取舍,模型選擇的主要依據(jù)就是信息指標(biāo)如AIC、SC等值,其建立的分類模型可以很好的對(duì)各參數(shù)的意義進(jìn)行合理性解釋。
四、結(jié)論與討論
利用上述建立的Logistic回歸模型并開發(fā)相應(yīng)的軟件系統(tǒng),那么只要把學(xué)生家庭經(jīng)濟(jì)狀況的基本信息輸入系統(tǒng),系統(tǒng)將自動(dòng)計(jì)算出判定值,如果判定值大于0.5,則此學(xué)生為貧困生,否則為不貧困。從東北某校該系統(tǒng)實(shí)踐應(yīng)用的情況來看,并未出現(xiàn)學(xué)生反映判定結(jié)果與其家庭經(jīng)濟(jì)狀況不符的情況,因此該模型具有良好的界定效果。在學(xué)校填寫家庭經(jīng)濟(jì)狀況的基本信息時(shí),應(yīng)該讓其輸入一些驗(yàn)證性的輔助信息,如家庭職業(yè)、每個(gè)月的伙食費(fèi)占其總支出的比例等。同時(shí),為了使學(xué)生能夠誠(chéng)實(shí)填寫相關(guān)的信息,可對(duì)其實(shí)施“后審查”制度,隨機(jī)抽取一些遴選出的貧困學(xué)生開展貧困生家庭經(jīng)濟(jì)狀況調(diào)查,一旦發(fā)現(xiàn)其未如實(shí)填寫家庭經(jīng)濟(jì)狀況信息,對(duì)其采取一些相應(yīng)的懲罰措施。值得一提的是,不同的學(xué)校的界定模型是不一樣的,因?yàn)橛捎诟鱾€(gè)學(xué)校所在地的經(jīng)濟(jì)發(fā)展水平不同,學(xué)生必要的生活花費(fèi)也不一樣,相同經(jīng)濟(jì)狀況的學(xué)生在長(zhǎng)春的學(xué)??赡懿回毨В窃谏虾F浼彝ビ锌赡軣o法承擔(dān)學(xué)生的日?;ㄙM(fèi),但是無論對(duì)哪一個(gè)學(xué)校,模型建構(gòu)的方法和過程卻是一樣的。
參考文獻(xiàn):
[1]畢鶴霞.國(guó)內(nèi)外高校貧困生認(rèn)定與研究述評(píng)[J].比較教育研究,2009(1).
[2]趙炳起,李永寧.高校貧困生經(jīng)濟(jì)資助體系的困境與對(duì)策[J].事業(yè)財(cái)會(huì),2006(6).
[3]劉進(jìn),沈紅.我國(guó)高校貧困生認(rèn)定路徑[D].教育經(jīng)濟(jì)學(xué)年會(huì)會(huì)議論文.2007.29-33.
[4]常亞平,宗樹闊.中國(guó)高校學(xué)生貧困度測(cè)評(píng)體系和評(píng)價(jià)模型構(gòu)建研究[J].高教探索,2009(1).
[5]王濟(jì)川,郭志剛.Logistic回歸模型——方法與應(yīng)用[M].高等教育出版社,2001.19.