李亞偉,劉曉瑞
(浙江工商大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,杭州310018)
20世紀(jì)末,知識(shí)對(duì)經(jīng)濟(jì)與人的全面發(fā)展的重要性被提到了前所未有的高度。要獲得知識(shí),就必須依靠教育。舒爾茨(Theodore W.Schultz)指出:教育遠(yuǎn)不是一種消費(fèi)活動(dòng)。相反,政府和私人有意識(shí)地作投資,為的是獲得一種具有生產(chǎn)能力的潛力,它蘊(yùn)藏在人體內(nèi),會(huì)在將來做出貢獻(xiàn)。而教育的發(fā)展水平直接受到教育支出水平的影響。盡管我國(guó)一直堅(jiān)持教育的公益性質(zhì),突出政府在教育發(fā)展中的責(zé)任,但教育的資金投入不可能全部由國(guó)家財(cái)政包辦,尤其在上世紀(jì)90年代末期,我國(guó)實(shí)行以擴(kuò)招和收費(fèi)制為核心內(nèi)容的高等教育改革,使家庭分擔(dān)的教育成本逐步上升,家庭在這一領(lǐng)域發(fā)揮著越來越重要的作用。在此背景下,考察哪些因素會(huì)影響我國(guó)居民教育支出的差異,具有一定的現(xiàn)實(shí)意義。本文在已有影響因素的基礎(chǔ)上,結(jié)合社區(qū)因素,利用2006年中國(guó)健康和營(yíng)養(yǎng)調(diào)查數(shù)據(jù)(CHNS),嘗試使用分層線性模型分析方法研究我國(guó)居民家庭教育支出的主要影響因素。
本文使用的數(shù)據(jù)來自于美國(guó)北卡羅來納大學(xué)和中國(guó)預(yù)防醫(yī)學(xué)會(huì)2006年進(jìn)行的中國(guó)居民營(yíng)養(yǎng)和健康調(diào)查(CHNS)。這次調(diào)查在黑龍江、遼寧、山東、河南、江蘇、湖北、湖南、廣西和貴州9個(gè)省份,這些省份涉及中國(guó)的東、中、西不同的地區(qū),涵蓋了中國(guó)地區(qū)不同的經(jīng)濟(jì)發(fā)展水平,具有一定的代表性。該數(shù)據(jù)庫采用多階段隨機(jī)抽樣的方法,調(diào)查數(shù)據(jù)包含社區(qū)、家庭和個(gè)人層次資料,其中包含了教育和收入等方面的信息,符合本文研究的需要。本文選取的樣本為有家庭教育支出并且有子女上學(xué)的家庭,同時(shí)考慮到樣本信息的完全性,最終,本文的有效家庭樣本總量為623個(gè),有效社區(qū)樣本總量為188個(gè)。
本文的研究對(duì)象為家庭教育支出。表1為各主要變量的說明及描述性統(tǒng)計(jì)。從表1中我們看到社區(qū)之間家庭的收入水平存在的較大的差異,從最小值的1937.75到最大值的67776.2。此外,在家庭內(nèi)部,家庭收入水平、戶主的受教育年限、子女所處的教育階段等方面也存在著較大的差別。
對(duì)家庭教育支出的分析,不可避免地要涉及社會(huì)環(huán)境因素對(duì)家庭教育支出的影響,即家庭教育支出并非完全由家庭因素所決定,而是往往可能與社區(qū)居民的收入水平、教育的發(fā)展程度等相關(guān),這些因素會(huì)導(dǎo)致同一社區(qū)不同家庭的教育支出存在相關(guān)性,從而違背了樣本之間必須獨(dú)立的統(tǒng)計(jì)原則。傳統(tǒng)分析方法,如普通最小二乘和方差分析,都假設(shè)觀察相互獨(dú)立性,因而不適合分層數(shù)據(jù)的分析。1972年,Lindley和Simth提出了分層模型。分層模型解決了傳統(tǒng)統(tǒng)計(jì)方法在分析分層結(jié)構(gòu)數(shù)據(jù)時(shí)所遇到的問題。它不需要假設(shè)數(shù)據(jù)中的觀察的獨(dú)立性,在估計(jì)方法上,一般采用收縮估計(jì)和廣義最小二乘法估計(jì)模型的系數(shù),用受限的最大似然法或最大似然法估計(jì)方差成分和協(xié)方差成分,因而可以修正因觀察數(shù)據(jù)的非獨(dú)立性引起的參數(shù)標(biāo)準(zhǔn)誤偏差。
表1 變量的說明及描述性統(tǒng)計(jì)
結(jié)合本文變量和數(shù)據(jù)的特點(diǎn),我們將采用二層線性模型對(duì)我國(guó)居民家庭教育支出的影響因素進(jìn)行分析。具體而言,層一反映家庭特征,層二反映社區(qū)特征。本文所關(guān)心的是家庭因素和社區(qū)因素對(duì)家庭教育支出的影響,我們結(jié)合Hox(1994)和Singer(1998)所推薦的方法,在下面分層模型的建模過程中,我們以空模型來分析家庭教育支出的變異開始,然后依次建立隨機(jī)截距模型、隨機(jī)截距和隨機(jī)斜率模型,來考察可能影響家庭教育支出的家庭和社區(qū)因素及其跨層交互作用。
首先,我們建立家庭層和社區(qū)層均沒有解釋變量的空模型??漳P褪欠謱幽P徒5幕A(chǔ),如式(1)。
其中,i代表家庭,j代表社區(qū),yij表示第j社區(qū)中第i個(gè)家庭的教育支出;β0j表示第j個(gè)社區(qū)家庭的平均教育支出;γ00表示全部家庭平均教育支出;eij和μ0j分別為家庭層和社區(qū)層的隨機(jī)誤差項(xiàng),并且滿足
當(dāng)空模型顯示μ0j的方差統(tǒng)計(jì)顯著時(shí),我們應(yīng)考慮對(duì)家庭教育支出進(jìn)行分層模型分析,否則,用常規(guī)多元回歸分析該數(shù)據(jù)便可。另外,空模型提供了社區(qū)特征對(duì)家庭教育支出影響的大小。根據(jù)經(jīng)典定義,組內(nèi)相關(guān)系數(shù)被定義為組間方差與總方差之比,即通過該系數(shù),可以衡量社區(qū)之間教育支出的變異占家庭教育支出總變異的比例。ρ的值在0到1之間,ρ越大,則說明社區(qū)因素對(duì)家庭教育支出的作用越大。
如果式(1)顯示社區(qū)之間教育支出存在顯著差異,則我們將家庭變量和社區(qū)變量納入空模型,探討家庭和社區(qū)因素對(duì)教育支出的作用。假定社區(qū)之間平均教育支出存在顯著差異,家庭層的斜率是固定斜率時(shí),此時(shí),稱之為隨機(jī)截距模型。如式(2)。
其中,hholder_edu為戶主的受教育年限;income表示家庭收入;X為其他反映家庭特征的變量,包括戶主的職業(yè)、子女所受的教育階段、家庭人口規(guī)模。W表示社區(qū)層的因素,包括城鄉(xiāng)變量、社區(qū)居民收入水平、社區(qū)平均受教育水平、農(nóng)業(yè)勞動(dòng)人口比例、地區(qū)虛擬變量等因素。
為了考察戶主受教育年限與hukou變量是否存在不同層級(jí)的交互作用,我們對(duì)式(2)中戶主受教育年限的斜率設(shè)為隨機(jī)斜率,并加入hukou變量進(jìn)行解釋,此時(shí),該模型為隨機(jī)截距和隨機(jī)斜率模型。如式(3)。
其中,hukou表示城市與農(nóng)村的虛擬變量,μ1j為隨機(jī)誤差項(xiàng)
本文使用HLM6軟件演示分層模型,根據(jù)上文,我們首先對(duì)家庭教育支出進(jìn)行空模型分析。
從表2的結(jié)果可以看出,組內(nèi)相關(guān)系數(shù)(ρ)為0.14。該數(shù)值說明了家庭教育支出14%的可變性來自社區(qū),86%的變異來自家庭,家庭教育支出的變異是由家庭和社區(qū)因素共同導(dǎo)致的結(jié)果。另外,我們看到,家庭教育支出在社區(qū)的變異十分顯著。μ0j的p值為0.000,拒絕了各社區(qū)家庭教育支出無差別的原假設(shè)。因此,我們需采用分層模型技術(shù),從而有效地分析各因素對(duì)家庭教育支出的具體影響。
表2 模型1(空模型)分析結(jié)果
通過上述分析結(jié)果,我們知道家庭和社區(qū)特征會(huì)影響到家庭教育支出,但是具體有哪些因素影響,影響力如何并不知曉。下面我們?cè)谀P?中納入家庭和社區(qū)變量,探討它們對(duì)家庭教育支出的影響(見表3模型2)。與表2的分析結(jié)果相比較,就方差成分而言,社區(qū)層的變異值()大大減少,從空模型(表2的模型1)中的3990013.13到隨機(jī)截距模型(表3的模型2)的1000387.85,而家庭層次的變異值(σ2)僅從原來的24461871.38下降為22552324.57。根據(jù)公式我們算出社區(qū)和家庭因素對(duì)家庭教育支出變異的解釋能力:模型2中社區(qū)變量大約解釋教育支出在社區(qū)層次變異為75%。相反,家庭變量大約僅能解釋教育支出的在家庭層次變異的7.8%。由此,這意味著社區(qū)因素對(duì)家庭教育支出的差異有比較強(qiáng)的解釋能力。
從表3模型2的結(jié)果可以看出,家庭年收入對(duì)教育支出有顯著的積極影響,這與其他研究相符。戶主的受教育年限對(duì)家庭教育支出有顯著的正影響。由于戶主通常指的是父母,結(jié)果表明父母的文化程度每提高一年,其子女的平均教育支出會(huì)增加114.75元。我們認(rèn)為這種正向關(guān)系歸因于兩方面的影響。一方面,父母受教育程度越高,根據(jù)人力資本理論,往往家庭收入水平就越高,也越有能力用于子女的受教育消費(fèi)支出;另一方面,受教育程度越高的父母越希望子女的受教育程度超過自己,因而用于子女教育消費(fèi)方面的支出就越多。從子女特征因素來看,子女所處的教育階段對(duì)家庭教育支出有顯著的影響(p<0.001)。與子女就讀初等教育階段的家庭相比,有子女就讀于中等階段和高等階段的家庭,其教育支出分別增加3119.50和6871.20。家庭人口規(guī)模對(duì)家庭教育支出有顯著的正影響。戶主職業(yè)對(duì)教育支出的影響不具有統(tǒng)計(jì)顯著性。
表3模型2還顯示了盡管城鄉(xiāng)因素作用方向與預(yù)期相同,即城市家庭的教育支出高于農(nóng)村家庭,但城鄉(xiāng)因素對(duì)教育支出并不產(chǎn)生顯著影響。這可能與目前社會(huì)對(duì)高學(xué)歷人才的大量需求以及所帶來的社會(huì)就業(yè)結(jié)構(gòu)的變化有關(guān),每個(gè)家庭都迫切希望子女能有上大學(xué)的機(jī)會(huì),城鄉(xiāng)居民不惜代價(jià)給孩子創(chuàng)造好的教育條件。社區(qū)居民的收入水平對(duì)家庭教育支出有積極的影響,這種影響具有統(tǒng)計(jì)上的顯著性。這個(gè)結(jié)果證明了我們的觀點(diǎn),即社區(qū)居民的收入水平是影響我國(guó)居民家庭教育支出的重要解釋變量。我們認(rèn)為教育消費(fèi)作為消費(fèi)的一種類型,也具有消費(fèi)的一般特征,即J.Duscnberry(1949)提出的消費(fèi)行為的“示范效應(yīng)”。這就表明家庭教育支出是非獨(dú)立的,家庭教育消費(fèi)行為不僅受自身收入的影響,也受周圍家庭教育消費(fèi)水平的影響。社區(qū)居民的收入越高,則往往周圍家庭的文化消費(fèi)氣氛較濃,即使某個(gè)家庭的收入水平較低,也企圖接近周圍家庭的教育消費(fèi)水平,于是教育消費(fèi)就會(huì)越高。家庭教育支出的省際差異也十分明顯,與貴州省相比,黑龍江、江蘇、湖北和湖南省份的家庭教育支出都顯著偏高。
模型2分析了社區(qū)變異和家庭變異,并假定家庭因素對(duì)教育支出的影響在社區(qū)之間是恒定,但我們不能忽視家庭因素和社區(qū)因素因素互動(dòng)的可能性。模型3在模型2的基礎(chǔ)上,設(shè)戶主受教育年限斜率為隨機(jī),并加入城鄉(xiāng)變量進(jìn)行解釋,引入交叉項(xiàng)。因而我們可以檢驗(yàn)戶主受教育年限的斜率是否因城鄉(xiāng)而異。
從表3模型3的結(jié)果來看,與模型2相比,模型的擬合改善了。當(dāng)二個(gè)模型嵌套時(shí),偏差度差異可以用來評(píng)估模型擬合度的改善,一個(gè)經(jīng)驗(yàn)法則是兩個(gè)模型的偏差度的差值必須是兩個(gè)模型估計(jì)參數(shù)數(shù)目差異的兩倍以上。模型3比模型2偏差度減少了14.5,而模型估計(jì)的參數(shù)只多了一個(gè),從而顯示模型3擬合的改善具有統(tǒng)計(jì)顯著性??傮w而言,模型3和模型2顯示的數(shù)值,無論是系數(shù)還是標(biāo)準(zhǔn)誤,二者相差不大。戶主受教育年限納入隨機(jī)斜率對(duì)家庭層次變量的系數(shù)幾乎毫無影響。然而,模型3改變了部分社區(qū)因素對(duì)家庭教育支出的作用。社區(qū)居民收入和湖北地區(qū)的虛擬變量?jī)H在隨機(jī)截距模型中對(duì)教育支出產(chǎn)生顯著影響。這表明,當(dāng)模型允許低層因素對(duì)高層因素互動(dòng)時(shí),高層因素的作用受到削弱——部分高層因素對(duì)因變量的影響實(shí)際上是通過低層因素實(shí)現(xiàn)的。
表3 模型2和模型3的分析結(jié)果
此外,我們發(fā)現(xiàn),模型3中戶主受教育年限與城鄉(xiāng)變量的交互項(xiàng)并不顯著,也就是說,戶主受教育年限對(duì)家庭教育支出的影響在城鄉(xiāng)之間并不存在顯著的差異。我們認(rèn)為,無論在城市或農(nóng)村,受過良好教育的父母,本身就是教育的受益者,他們傾向于認(rèn)為投資子女的教育將獲得極大的未來收益,因而都會(huì)增加對(duì)子女的人力資本投資。我們還可以發(fā)現(xiàn)戶主受教育年限斜率隨機(jī)變量的變異依然顯著,這意味著,一方面,社區(qū)之間的差異的確影響戶主受教育年限對(duì)家庭教育支出的影響;另一方面,由于數(shù)據(jù)的局限,模型3遺漏了其他影響戶主受教育年限的重要因素。
本文利用2006年CHNS數(shù)據(jù)并采用二層線性模型,對(duì)我國(guó)居民家庭教育支出的影響因素進(jìn)行分析,重點(diǎn)考察了社區(qū)因素對(duì)家庭教育支出的影響。研究結(jié)果表明,社區(qū)間家庭的教育支出存在著顯著的差異;社區(qū)居民收入水平對(duì)家庭教育支出的影響是不可忽視的,社區(qū)居民收入水平是影響家庭教育支出的重要因素之一;戶主的教育水平的提高有利于增加對(duì)子女教育的支出,并且城鄉(xiāng)戶主的教育水平對(duì)家庭教育支出的影響沒有顯著差異;最后,家庭收入水平、家庭人口規(guī)模和子女受教育階段變量對(duì)家庭教育支出有顯著的正影響。
從上述實(shí)證分析的結(jié)果中我們可以得到兩點(diǎn)啟示:(1)發(fā)展經(jīng)濟(jì)發(fā)展落后社區(qū)的經(jīng)濟(jì),從而縮短由于社區(qū)收入水平造成的家庭教育支出差距。(2)努力改善家長(zhǎng)的教育素質(zhì),進(jìn)一步增強(qiáng)他們對(duì)子女教育質(zhì)量的偏好,從而增加家庭對(duì)子女教育的投入。
[1]李紅偉.中國(guó)城鎮(zhèn)居民家庭教育消費(fèi)實(shí)證研究[J].教育與經(jīng)濟(jì),2000,(4).
[2]孫彩紅.重慶市中小學(xué)生教育支出差異性分析[J].重慶工商大學(xué)學(xué)報(bào),2003,(2).
[3]雷萬鵬等.中國(guó)農(nóng)村家庭教育支出的實(shí)證研究:1985~1999[J].教育理論與實(shí)踐.2003,(7).
[4]雷萬鵬.高中生教育補(bǔ)習(xí)支出:影響因素及政策啟示[J].教育與經(jīng)濟(jì),2005,(1).
[5]丁小浩,薛海平.我國(guó)城鎮(zhèn)居民家庭義務(wù)教育支出差異性研究[J].教育與經(jīng)濟(jì),2005,(4).
[6]楊菊華.多層模型在社會(huì)科學(xué)領(lǐng)域的應(yīng)用[J].中國(guó)人口科學(xué),2006,(3).
[7]陳俊華等.從分層模型視角看出生人口質(zhì)量的影響因素——以江蘇省無錫市為例[J].中國(guó)人口科學(xué),2006,(3).
[8]楚紅麗.基礎(chǔ)教育階段家庭教育支出影響因素的研究述評(píng)[J].教育學(xué)報(bào),2006,(12).
[9]王海港等.城鎮(zhèn)居民教育收益率的地區(qū)差異及其解釋[J].經(jīng)濟(jì)研究,2007,(8).
[10]王濟(jì)川.多層統(tǒng)計(jì)分析模型—方法與應(yīng)用[M].北京:高等教育出版社,2008.
[11]許玲麗等.成人高等教育的工資效應(yīng)[J].經(jīng)濟(jì)研究,2008,(12).
[12]薛海平、丁小浩.中國(guó)城鎮(zhèn)學(xué)生教育補(bǔ)習(xí)研究[J].教育研究,2009,(1).
[13]寧光杰.教育擴(kuò)張能改變收入分配差距嗎?[J].世界經(jīng)濟(jì)文匯,2009,(1).
[14]楊汝岱.高等教育改革、預(yù)防性儲(chǔ)蓄與居民消費(fèi)行為[J].經(jīng)濟(jì)研究,2009,(8).
[15]楚紅麗.我國(guó)中小學(xué)課外補(bǔ)習(xí)家庭之背景特征及個(gè)人因素[J].教育學(xué)術(shù)月刊,2009,(12).
[16]Filippa Bono.Regional Inequalities in Consumption Patterns:A Multilevel Approach to the Case of Italy[J].International Statistical Review,2007,(75).
[17]Maria M.Ciarleglio.Hierarch Linear Modeling:An Overview[J].Child Abuse Neglect,2007,(31).