西安交通大學(xué)醫(yī)學(xué)院公共衛(wèi)生系衛(wèi)生統(tǒng)計(jì)學(xué)教研室(710061) 裴磊磊 任 琳 高文龍 顏 虹
集中指數(shù)及可信區(qū)間的SAS實(shí)現(xiàn)*
西安交通大學(xué)醫(yī)學(xué)院公共衛(wèi)生系衛(wèi)生統(tǒng)計(jì)學(xué)教研室(710061) 裴磊磊 任 琳 高文龍 顏 虹Δ
目的 利用SAS軟件實(shí)現(xiàn)集中指數(shù)及其可信區(qū)間的計(jì)算。方法 以2001年和2005年中國西部地區(qū)兒童營養(yǎng)狀況的調(diào)查數(shù)據(jù)為例,分別計(jì)算兩年干預(yù)組與對(duì)照組的生長遲緩、消瘦和低體重等指標(biāo)的集中指數(shù)及其差值,利用bootstrap再抽樣計(jì)算集中指數(shù)的可信區(qū)間。結(jié)果 根據(jù)集中指數(shù)計(jì)算公式,我們把SAS程序分為6步,最終得到2001年到2005年干預(yù)組各營養(yǎng)指標(biāo)的集中指數(shù)差值分別為生長遲緩-0.084,95%可信區(qū)間(-0.161,-0.001),消瘦為-0.094(-0.210,0.036),低體重為-0.109(-0.200,-0.004)。結(jié)論 SAS程序及bootstrap方法具有通用性、實(shí)用性和高效性的特點(diǎn)。
bootstrap 集中指數(shù) 可信區(qū)間
△通信作者:顏虹,E-mail:xjtu_yh.paper@yahoo.com.cn
集中指數(shù)(concentration index,CI)是評(píng)價(jià)人群健康不平等程度的一個(gè)重要指標(biāo),被認(rèn)為能較準(zhǔn)確地表達(dá)不同社會(huì)經(jīng)濟(jì)階層下健康狀況的公平性,而且較適用于國家地區(qū)間的比較和時(shí)間趨勢研究〔1〕。集中指數(shù)的點(diǎn)估計(jì)可以利用一般統(tǒng)計(jì)軟件實(shí)現(xiàn),而利用SAS軟件實(shí)現(xiàn)其區(qū)間估計(jì)在目前文獻(xiàn)中尚無報(bào)道,因此本文試圖利用SAS軟件編程計(jì)算集中指數(shù)的估計(jì)值及其可信區(qū)間。
集中曲線是以經(jīng)濟(jì)狀況排序的人口累計(jì)百分比為橫軸,以人群健康累計(jì)百分比為縱軸的光滑曲線,如果健康水平在不同的社會(huì)經(jīng)濟(jì)階層分布均勻,那么集中曲線與對(duì)角線重合,集中曲線離對(duì)角線越遠(yuǎn),健康不公平程度越大。集中指數(shù)等于集中曲線與對(duì)角線之間的面積與對(duì)角線下的面積之比,取值范圍是(-1,1)。當(dāng)集中曲線在對(duì)角線下方時(shí),收入較高的人群承受更差的健康狀況,規(guī)定集中指數(shù)為正值;當(dāng)集中曲線在對(duì)角線上方時(shí),收入較低的人群具有更差的健康狀況,規(guī)定集中指數(shù)為負(fù)值。
集中指數(shù)的一般計(jì)算公式為:
h為健康指標(biāo),μ是健康指標(biāo)的均數(shù),ri=i/N為個(gè)體按照財(cái)富等級(jí)從低到高排列的分?jǐn)?shù)秩,其中i=1為財(cái)富等級(jí)最低的人,而i=N為財(cái)富等級(jí)最高的人。
經(jīng)濟(jì)分層 兒童調(diào)查人數(shù)兒童數(shù)構(gòu)成比(%)兒童數(shù)累計(jì)構(gòu)成比(%)生長遲緩人數(shù)(構(gòu)成比%)生長遲緩累計(jì)構(gòu)成比(%)消瘦人數(shù)(構(gòu)成比%)消瘦累計(jì)構(gòu)成比(%)第一階層 2128 19.87 19.87 616(26.62) 26.62 126(24.14)24.14第二階層 2138 19.96 39.83 516(22.30) 48.92 109(20.88) 45.02第三階層 2144 20.02 59.85 468(20.22) 69.14 110(21.07) 66.09第四階層 2150 20.07 79.92 394(17.03) 86.17 92(17.62) 83.71第五階層 2151 20.08 100.00 320(13.83) 100.00 85(16.28) 100.00合計(jì)107112314 522
如2001年中國西部地區(qū)3歲以下兒童調(diào)查總數(shù)為10711,根據(jù)經(jīng)濟(jì)收入將他們從低到高分為5個(gè)不同的階層,各個(gè)階層的兒童數(shù)構(gòu)成比和累計(jì)構(gòu)成比分別見表1第3和4列,依據(jù)不同階層兒童生長遲緩率計(jì)算出兒童生長遲緩人數(shù),最后得到各階層兒童生長遲緩數(shù)構(gòu)成比和累計(jì)構(gòu)成比??梢园l(fā)現(xiàn)經(jīng)濟(jì)收入低的組兒童生長遲緩人數(shù)所占比例最大,經(jīng)濟(jì)收入高的組兒童生長遲緩人數(shù)所占比例最小。以經(jīng)濟(jì)狀況排序的兒童累計(jì)構(gòu)成比為橫坐標(biāo),以兒童生長遲緩累計(jì)構(gòu)成比為縱坐標(biāo),得到如圖1所示的集中曲線,結(jié)果集中曲線在對(duì)角線的上方,說明2001年中國西部地區(qū)3歲以下兒童生長遲緩更多地集中在經(jīng)濟(jì)收入低的人群中。同理,我們可以得到兒童消瘦在不同階層的構(gòu)成比和累計(jì)構(gòu)成比(見表1最后兩列),將兒童生長遲緩與消瘦進(jìn)行比較發(fā)現(xiàn),生長遲緩在中低收入階層的比例要大于消瘦的比例(69.14% >66.09%),生長遲緩集中曲線在消瘦的上方,相應(yīng)的集中指數(shù)分別為生長遲緩為-0.116和消瘦為-0.059,說明兒童生長遲緩比消瘦更易出現(xiàn)于貧困階層,這樣較好地反映了不同社會(huì)階層下健康狀況的公平性。
圖1 兒童營養(yǎng)不良集中指數(shù)曲線
以2001年和2005年中國西部農(nóng)村3歲以下兒童健康狀況的調(diào)查數(shù)據(jù)為例,2001年把兒童分為干預(yù)組(2782人)和對(duì)照組(7633人),在2005年分別評(píng)估干預(yù)組(2754人)和對(duì)照組(7162人)兒童健康公平性的變化。我們通過SAS軟件編程求出集中指數(shù)之間差值及可信區(qū)間,觀察2001年與2005年集中指數(shù)的變化情況。
表2給出數(shù)據(jù)中各指標(biāo)編碼,其中家庭財(cái)富指數(shù)是對(duì)母親受教育年限、是否擁有汽車以及清潔飲用水等指標(biāo)根據(jù)主成分分析法求取第一主成分的因子得分〔2〕。本例評(píng)價(jià)指標(biāo)為生長遲緩、消瘦和低體重三個(gè)指標(biāo)〔3〕,根據(jù)集中指數(shù)的計(jì)算公式,我們把過程分為六步,具體SAS過程見附錄。
表2 兒童營養(yǎng)狀況資料變量及其代碼
由附錄程序得到干預(yù)組與對(duì)照組在不同年份之間的集中指數(shù)差值及其可信區(qū)間見表3。
表3 集中指數(shù)差值及其95%CI
集中指數(shù)及bootstrap可信區(qū)間結(jié)果顯示,經(jīng)過干預(yù)之后,3歲以下兒童生長遲緩、消瘦與低體重的集中指數(shù)出現(xiàn)了不同程度的降低,即干預(yù)后家庭經(jīng)濟(jì)狀況較差的兒童具有更高營養(yǎng)不良發(fā)生率。但是對(duì)照組從2001年到2005年集中指數(shù)差值沒有統(tǒng)計(jì)學(xué)差異。
集中指數(shù)作為評(píng)價(jià)公平性的一個(gè)重要指標(biāo)應(yīng)用于多個(gè)方面,但目前文獻(xiàn)中很少涉及運(yùn)用SAS軟件對(duì)其進(jìn)行區(qū)間估計(jì),本文根據(jù)集中指數(shù)計(jì)算公式編寫SAS程序,并分析了中國西部地區(qū)兒童營養(yǎng)不良在不同社會(huì)經(jīng)濟(jì)階層的分布狀況。研究顯示兒童營養(yǎng)不良在家庭經(jīng)濟(jì)狀況較差的人群中更易出現(xiàn),同時(shí)發(fā)現(xiàn)從2001年到2005年兒童營養(yǎng)不良經(jīng)干預(yù)后不平等程度有增大的趨勢,但對(duì)照組尚無統(tǒng)計(jì)學(xué)差異,這可能是由于我們的干預(yù)項(xiàng)目對(duì)不同階層的家庭作用不同,即家庭經(jīng)濟(jì)狀況較差的家庭對(duì)干預(yù)的依從性差,而家庭經(jīng)濟(jì)狀況好的家庭依從性強(qiáng),此現(xiàn)象應(yīng)引起有關(guān)部門的重視,在以后的健康干預(yù)過程中應(yīng)加強(qiáng)對(duì)經(jīng)濟(jì)狀況差的家庭的宣教和督促力度,以提高健康干預(yù)的效果。
在求集中指數(shù)可信區(qū)間的過程中使用了Bootstrap再抽樣技術(shù),Efron〔4〕提出以原始的樣本資料為基礎(chǔ),借助經(jīng)驗(yàn)分布理論進(jìn)行有放回的重復(fù)抽樣,從而估計(jì)和推斷統(tǒng)計(jì)量的分布特征。此方法特別適用于難以用常規(guī)方法進(jìn)行參數(shù)估計(jì)和假設(shè)檢驗(yàn)的問題,具有通用性、高效性和實(shí)效性的優(yōu)點(diǎn),而且隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,計(jì)算量大這一缺陷已被逐漸克服,因此,目前bootstrap已經(jīng)成為非常常用的統(tǒng)計(jì)分析方法。1.Owen O’Donnell,Eddy van Doorslaer,Adam Wagstaff,et al.Analyzing Health Equity Using Household Survey Data.The World Bank Washington,D.C,2008:95-108.
2.Deon Filmer,Lant H.Pritchett.Estimating wealth effects without expenditure data—or tears:an application to educational enrollments in states of india.Demography,2001,38(1):115-132.
3.黨少農(nóng),顏虹,曾令霞,等.運(yùn)用人體測量法評(píng)估中國西部40個(gè)縣農(nóng)村3歲以下兒童的營養(yǎng)狀況.中華流行病學(xué)雜志,2005,26(3):177-181.
4.Efron B,Tibshirani R.Bootstrap methods for standard errors,confidence intervals,and other measures of statistical accuracy.Statistical Science,1986,1(1):54-77.
附錄:
/*第一步:對(duì)兒童生長遲緩stunting數(shù)據(jù)集進(jìn)行bootstrap再抽樣*/
proc surveyselect data=Stunting out=Stuntingboot/*輸出數(shù)據(jù)集為Stuntingboot*/
seed=8888 method=urs/*urs為非限制隨機(jī)抽樣*/
samprate=1 outhits rep=500;/*samprate表示抽樣比例為1,rep表示產(chǎn)生500個(gè)新數(shù)據(jù)集*/
run;
/*第二步:bootstrap再抽樣后,根據(jù)不同年份與干預(yù)分組對(duì)家庭財(cái)富求分?jǐn)?shù)秩*/
proc sort data=Stuntingboot;
by replicate year treat;/*對(duì)產(chǎn)生的Stuntingboot數(shù)據(jù)集按照年份、干預(yù)及抽樣號(hào)進(jìn)行排序*/
proc rank data=Stuntingboot out=Stuntingranka;/*輸出數(shù)據(jù)集為Stuntingranka*/
by replicate year treat;var wealth;/*根據(jù)年份、干預(yù)及抽樣號(hào)分組分別求家庭財(cái)富的秩*/
ranks wealthrank;/*家庭財(cái)富的秩表示為wealthrank*/
proc means data=Stuntingranka noprint;/*對(duì)數(shù)據(jù)集Stuntingranka進(jìn)行統(tǒng)計(jì)描述*/
by replicate year treat;var wealthrank;
/*根據(jù)年份、干預(yù)及抽樣號(hào)分組分別求家庭財(cái)富的最大秩wealthrank_max*/
output out=wealthrank_max max=wealthrank_max;
/*家庭財(cái)富的最大秩 wealthrank_max,輸出數(shù)據(jù)集wealthrank_max*/
data Stuntingrank;/*建立數(shù)據(jù)集Stuntingrank*/
merge Stuntingranka wealthrank_max;/*合并數(shù)據(jù)集Stuntingranka與wealthrank_max*/
by replicate year treat;/*根據(jù)年份、干預(yù)及抽樣號(hào)分組*/
wealthrank_frac=wealthrank/wealthrank_max;/*根據(jù)年份與干預(yù)分組分別求出家庭財(cái)富的分?jǐn)?shù)秩*/
/*第三步:求結(jié)局變量與分?jǐn)?shù)秩的協(xié)方差*/
proc corr data=Stuntingrank COV;
by replicate year treat;/*根據(jù)年份、干預(yù)及抽樣號(hào)分組*/
var stunting wealthrank_frac;/*求出家庭財(cái)富分?jǐn)?shù)秩與結(jié)局變量之間的協(xié)方差*/
ods output cov=cov;/*輸出數(shù)據(jù)集cov*/
data cova;set cov;/*建立數(shù)據(jù)集cova*/
if variable=“wealthrank_frac”;cov=stunting;/* 家庭財(cái)富分?jǐn)?shù)秩與stunting之間的協(xié)方差表示為cov*/
keep replicate year treat cov;/*數(shù)據(jù)集cova只保留變量replicate year treat cov*/
/*第四步:求不同年份與干預(yù)組的集中指數(shù)*/
proc means data=Stuntingboot noprint;
by replicate year treat;/*根據(jù)年份、干預(yù)及抽樣號(hào)分組*/
var stunting;output out=mu mean=mu;/*求出各組中stunting的均數(shù)mu并保存為數(shù)據(jù)集mu*/
data mua;set mu;keep replicate year treat mu;/*保留變量replicate year treat mu建立數(shù)據(jù)集mua*/
data ci;merge cova mua;/*合并協(xié)方差數(shù)據(jù)集cova與數(shù)據(jù)集mua,建立數(shù)據(jù)集ci*/
by replicate year treat;/*根據(jù)年份、干預(yù)及抽樣號(hào)分組*/
CI=2*COV/mu;/*根據(jù)公式求出各組的集中指數(shù)*/
if year=1 and treat=1 then group=1;/*2001年干預(yù)組命名為組1*/
else if year=1 and treat=2 then group=2;/*2001年對(duì)照組命名為組2*/
else if year=2 and treat=1 then group=3;/*2005年干預(yù)組命名為組3*/
else if year=2 and treat=2 then group=4;/*2005年對(duì)照組命名為組4*/
/*第五步:求在不同年份干預(yù)組和對(duì)照組集中指數(shù)的差值*/
proc sort;by replicate group;/*對(duì)數(shù)據(jù)集ci按照變量replicate與group分組進(jìn)行排序*/
proc transpose data=ci out=cia prefix=CI;/*對(duì)數(shù)據(jù)集ci轉(zhuǎn)置產(chǎn)生新數(shù)據(jù)集cia,變量前綴CI*/
by replicate;/*根據(jù)抽樣號(hào)對(duì)變量ci分組轉(zhuǎn)置*/
ID group;var ci;/*根據(jù)變量group對(duì)結(jié)果分組*/
data cib;set cia;/*建立數(shù)據(jù)集cib*/
cid1=ci3-ci1;/*求出干預(yù)組2005年與2001年之間的差值*/
cid2=ci4-ci2;/*求出對(duì)照組2005年與2001年之間的差值*/
/*第六步:求在不同年份干預(yù)組及對(duì)照組集中指數(shù)差值的可信區(qū)間*/
proc univariate data=cib;
var cid1;output out=pmethod1 mean=cid1 pctlpts=2.5 97.5 pctlpre=p pctlname=_lb_ub;/*求出干預(yù)組及對(duì)照組在不同年份之間的集中指數(shù)差值的95%可信區(qū)間*/
run;
聯(lián)合國兒童基金會(huì)(UNICEF)(No.YH001)
(責(zé)任編輯:郭海強(qiáng))