亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        成長(zhǎng)曲線模型原理及其應(yīng)用

        2021-10-16 02:14:58強(qiáng)
        醫(yī)學(xué)與社會(huì) 2021年10期
        關(guān)鍵詞:青少年模型

        傅 強(qiáng)

        美國(guó)塔夫茨大學(xué)文理學(xué)院社區(qū)健康系,美國(guó)馬薩諸塞州梅德福市,02155

        在社會(huì)科學(xué)及醫(yī)學(xué)領(lǐng)域中,數(shù)據(jù)往往具有分級(jí)嵌套結(jié)構(gòu)。例如在醫(yī)學(xué)研究中,研究者先隨機(jī)選擇一定數(shù)量的醫(yī)院,再?gòu)娜脒x的每家醫(yī)院中隨機(jī)選取一定數(shù)量的醫(yī)生,隨后從入選的每個(gè)醫(yī)生接診的病人中隨機(jī)選取一定數(shù)量的病人,最后對(duì)每位病人每個(gè)月隨訪一次,共隨訪三次。如果將每一次隨訪的數(shù)據(jù)確定為第一水平分析單位,則病人可確定為第二水平分析單位,醫(yī)生為第三水平分析單位,醫(yī)院為第四水平分析單位。每一水平的數(shù)據(jù)代表相應(yīng)水平的獨(dú)特特征,下一水平的數(shù)據(jù)嵌套(nested)或聚集(clustered)在上一水平數(shù)據(jù)結(jié)構(gòu)中。又如在社會(huì)科學(xué)研究中,研究者先隨機(jī)選擇一定數(shù)量的城市,再?gòu)娜脒x的每個(gè)城市中隨機(jī)選取一定數(shù)量的社區(qū),隨后從入選的每個(gè)社區(qū)中隨機(jī)選取一定數(shù)量的居民,最后對(duì)每位居民每周隨訪一次,多次隨訪。由此城市、社區(qū)、居民、每次隨訪構(gòu)成了不同的水平分析單位,每一水平的數(shù)據(jù)都代表相應(yīng)水平的獨(dú)特特征。如果研究者僅僅隨機(jī)選取病人或居民并多次隨訪,收集相關(guān)數(shù)據(jù),這種數(shù)據(jù)結(jié)構(gòu)則形成最簡(jiǎn)單的兩級(jí)嵌套結(jié)構(gòu),也可以被視為是最簡(jiǎn)單的聚集數(shù)據(jù)(clustered data)。上述這些數(shù)據(jù)被稱為縱向數(shù)據(jù)(longitudinal data),也稱為隊(duì)列數(shù)據(jù)(cohort data)或面板數(shù)據(jù)(panel data)。

        縱向數(shù)據(jù)包含對(duì)隨機(jī)抽樣個(gè)體的特征多次重復(fù)的觀測(cè)值。這種研究設(shè)計(jì)的優(yōu)點(diǎn)是可以發(fā)現(xiàn)一些特征隨時(shí)間變化的趨勢(shì),例如病人臨床轉(zhuǎn)歸的結(jié)局或居民生命質(zhì)量和幸福感隨時(shí)間變化的趨勢(shì)以及影響其變化的因素,從而回答許多社會(huì)科學(xué)和醫(yī)學(xué)領(lǐng)域中的問題。例如居民的生命質(zhì)量在開始追蹤調(diào)查時(shí)是否有差異?隨著時(shí)間推移生命質(zhì)量變化的軌跡(trajectory)怎樣?不同居民生命質(zhì)量變化的軌跡有區(qū)別嗎?什么因素可能解釋居民生命質(zhì)量平均變化趨勢(shì)的差異?但是,這種研究設(shè)計(jì)對(duì)運(yùn)用一般線性模型(general linear models, GLM)的分析方法提出了新的挑戰(zhàn)。一般線性模型假設(shè)任何兩個(gè)觀測(cè)值之間都是獨(dú)立的,它可以用來分析個(gè)體水平的數(shù)據(jù)。然而,在兩級(jí)嵌套結(jié)構(gòu)的縱向設(shè)計(jì)中,來自不同研究個(gè)體的觀測(cè)值之間保持獨(dú)立,但來自同一研究個(gè)體重復(fù)觀測(cè)所得到的觀測(cè)值之間,通常由于共享相同個(gè)體水平的特征而彼此相互關(guān)聯(lián),因此同一研究個(gè)體內(nèi)的觀測(cè)值之間不再獨(dú)立。縱向研究設(shè)計(jì)得到的重復(fù)測(cè)量數(shù)據(jù)不適合使用一般線性模型進(jìn)行分析,它要求對(duì)一般線性模型加以改進(jìn)以適應(yīng)縱向數(shù)據(jù)的特殊性。為此,在生物統(tǒng)計(jì)學(xué)領(lǐng)域,混合效應(yīng)模型(mixed-effects model)又稱隨機(jī)效應(yīng)模型(random-effects model)應(yīng)運(yùn)而生[1-3]。自20世紀(jì)80年代起,這種模型才開始流行開來,不同學(xué)科對(duì)該模型的命名也有所不同,例如社會(huì)科學(xué)領(lǐng)域的多水平線性模型(multilevel linear models)[4-5]、 教育學(xué)領(lǐng)域的分級(jí)線性模型(hierarchical linear models)[6]、經(jīng)濟(jì)學(xué)領(lǐng)域的隨機(jī)系數(shù)回歸模型(random-coefficient regression models)[7-8]、統(tǒng)計(jì)學(xué)領(lǐng)域的協(xié)方差成份模型(covariance components models)[9-10]。該模型應(yīng)用到縱向數(shù)據(jù)上又稱為成長(zhǎng)曲線模型(growth curve models)[11]。同一個(gè)統(tǒng)計(jì)方法在不同領(lǐng)域有不同的名稱,顯示同一種統(tǒng)計(jì)方法可以從不同的角度去理解和使用。

        1 因變量變化的特征和要求

        在現(xiàn)實(shí)世界中變化是永恒的,而靜止是暫時(shí)的,不變可以看作是變化的一種特殊形態(tài)。對(duì)因變量隨時(shí)間推移產(chǎn)生的變化進(jìn)行觀測(cè)時(shí)要注意3點(diǎn)[3]:①被衡量特征的數(shù)值應(yīng)隨時(shí)間變化而變化,而且該特征需滿足兩個(gè)條件。一是該特征的變化在理論上或?qū)嶋H中有意義;二是該特征的含義在不同時(shí)間衡量時(shí)都是相同的,即特征的含義不隨時(shí)間變化而變化。例如觀測(cè)體重指數(shù)(body mass index, BMI)隨時(shí)間推移發(fā)生的變化,無論何時(shí),體重指數(shù)的含義始終都是一樣的,都等于體重除以平方身高。又如觀察生活滿意度隨時(shí)間推移發(fā)生的變化,如果受試者對(duì)生活滿意的定義和條件依時(shí)間推移而變化,諸如20世紀(jì)80年代擁有老三大件即冰箱、彩電和洗衣機(jī)的話,大多數(shù)中國(guó)人就覺得滿意了;20世紀(jì)90年代變?yōu)閾碛行氯蠹纯照{(diào)、電腦和錄像機(jī)才滿意。在這種情況下,就無法確定所觀測(cè)到的生活滿意度變化是由于時(shí)間變化帶來的還是受試者對(duì)生活達(dá)到滿意的要求變化了而導(dǎo)致的。②重復(fù)觀測(cè)或隨訪的間隔時(shí)間需要考慮其適宜性和敏感性。對(duì)變化頻繁的特征,隨訪的間隔時(shí)間太長(zhǎng)就有失去觀測(cè)到變化的可能,反之對(duì)變化不頻繁的特征,隨訪的間隔時(shí)間太短就可能觀測(cè)不到實(shí)際變化。例如血壓和血糖變化較頻繁,以小時(shí)為單位比用周為單位更合適。觀測(cè)抑郁癥的變化以抑郁癥發(fā)作的間歇期為單位比用天或周為單位更合適。由于時(shí)間變量是成長(zhǎng)曲線模型中不可或缺的基本變量,研究者應(yīng)在仔細(xì)考量之后確定能可靠地、準(zhǔn)確地、敏感地、有意義地觀測(cè)出變化特征的間隔時(shí)間。③重復(fù)觀測(cè)的次數(shù)應(yīng)在3或4次以上。對(duì)于連續(xù)型變量重復(fù)觀測(cè)的次數(shù)至少3次,對(duì)于二分類變量重復(fù)觀測(cè)的次數(shù)至少4次,以提供足夠信息來估計(jì)模型中的參數(shù)。

        2 縱向數(shù)據(jù)的儲(chǔ)存格式

        縱向數(shù)據(jù)分析的第一步是將收集的數(shù)據(jù)以一個(gè)合適的格式儲(chǔ)存在數(shù)據(jù)庫(kù)里。儲(chǔ)存縱向數(shù)據(jù)的數(shù)據(jù)庫(kù)一般有兩種格式:一種是寬格式(wide format),即每一個(gè)個(gè)體只有一行記錄其觀測(cè)的數(shù)據(jù),每次重復(fù)或隨訪的觀測(cè)值均按不同的變量記錄在數(shù)據(jù)庫(kù)的不同列中。這種格式也可稱為個(gè)體級(jí)別格式(person-level format);另一種是長(zhǎng)格式(long format),即每一行記錄每一個(gè)個(gè)體每一次隨訪的觀測(cè)值,每一個(gè)個(gè)體因有多次隨訪數(shù)據(jù)故有多行記錄,每一個(gè)個(gè)體都有一個(gè)特定的個(gè)體編號(hào)加以識(shí)別。對(duì)于不隨時(shí)間變化的個(gè)體特征變量(time-invariant variables),例如性別和民族等,則在同一個(gè)個(gè)體的每一行重復(fù)同樣的觀測(cè)值。對(duì)于隨時(shí)間變化的個(gè)體特征變量(time-varying variables),例如體重和血壓等,則在同一個(gè)個(gè)體的每一行記錄不同的觀測(cè)值。這種格式也可稱為個(gè)體時(shí)間格式(person-period format)。表1顯示用長(zhǎng)格式記錄縱向數(shù)據(jù)的例子,可以看出每一個(gè)個(gè)體都有一個(gè)編號(hào),重復(fù)觀測(cè)的間隔時(shí)間按年計(jì)算,年齡和耐受性是隨時(shí)間變化的個(gè)體特征變量,故每人每次的值可能不同。性別和暴露因素是不隨時(shí)間變化的個(gè)體特征變量,故每人每次的值不變。大多數(shù)分析縱向數(shù)據(jù)的軟件要求使用長(zhǎng)格式的數(shù)據(jù)儲(chǔ)存格式。

        表1 長(zhǎng)格式縱向數(shù)據(jù)示例

        3 成長(zhǎng)曲線模型的構(gòu)成

        成長(zhǎng)曲線模型有兩種等同的數(shù)學(xué)表達(dá)形式,每種形式各有其優(yōu)點(diǎn),沒有對(duì)錯(cuò)之分。第一種形式是按不同水平的順序以等級(jí)模型(hierarchical model)形式表達(dá)。這種形式通俗易懂,但所用方程的數(shù)量較多。最低水平是每次重復(fù)的時(shí)間,上一水平是被研究的個(gè)體。下一等級(jí)嵌套在上一等級(jí)的結(jié)構(gòu)之中,故此模型為最簡(jiǎn)單的多水平模型(multilevel model)。統(tǒng)計(jì)學(xué)文獻(xiàn)習(xí)慣用希臘字母代表需估計(jì)的參數(shù),用大寫的英文字母代表隨機(jī)變量,小寫的英文字母代表變量取值,本文亦遵循這一傳統(tǒng)。

        第一水平模型:每個(gè)個(gè)體重復(fù)觀測(cè)值隨時(shí)間變化而變化,又稱個(gè)體內(nèi)變化(within-person change)

        Yij=π0i+π1iTIMEij+π2iXij+εij

        (1)

        第二水平模型:個(gè)體間變化(between-person change)

        π0i=γ00+γ01Zi+ζ0i

        (2)

        π1i=γ10+γ11Zi+ζ1i

        (3)

        方程(2)中π0i代表第i個(gè)個(gè)體的截距。γ00代表樣本所屬群體的截距的平均值。γ01是第二水平自變量Z的斜率,代表自變量Z每增加一個(gè)單位時(shí)所對(duì)應(yīng)的截距平均變化值。自變量Z反映的是不隨時(shí)間變化的個(gè)體特征,例如社會(huì)人口特征等性質(zhì)較穩(wěn)定的一類自變量。ζ0i代表截距的殘差,即自變量Z無法解釋的截距部分。方程(3)中π1i代表時(shí)間變量TIME的斜率。γ10代表樣本所屬群體的時(shí)間變量TIME的斜率的平均值。γ11是自變量Z的斜率,代表自變量Z每增加一個(gè)單位時(shí)所對(duì)應(yīng)的斜率變化,即成長(zhǎng)率的平均變化值。ζ1i代表時(shí)間變量TIME的斜率的殘差,即自變量Z無法解釋的成長(zhǎng)率部分??傊總€(gè)個(gè)體有各自的截距和時(shí)間變量斜率,故共有i個(gè)截距和i個(gè)時(shí)間變量斜率。但從統(tǒng)計(jì)學(xué)角度看,這些不同的截距和時(shí)間變量斜率可以被看作是來自一個(gè)共同群體的抽樣樣本,這些截距和時(shí)間變量斜率的殘差符合多元正態(tài)分布(multivariate normal distribution),

        其中τ代表方差/協(xié)方差。注意盡管方程(1)中Xij變量的觀測(cè)值依時(shí)間不同而不同,如果Xij變量與Yij之間的關(guān)系在每個(gè)個(gè)體都一樣,則π2i是一個(gè)常數(shù),即代表固定效應(yīng)回歸系數(shù),因此π2i沒有對(duì)應(yīng)的第二水平方程來估計(jì)其方差。如果Xij變量與Yij之間的關(guān)系在每個(gè)個(gè)體都不一樣,則π2i是一個(gè)隨機(jī)數(shù),代表隨機(jī)效應(yīng)回歸系數(shù),因此π2i也可像π1i一樣有對(duì)應(yīng)的第二水平方程來估計(jì)其方差。由于本文重點(diǎn)介紹成長(zhǎng)系數(shù),主要關(guān)注作為隨機(jī)效應(yīng)的時(shí)間變量,為了簡(jiǎn)潔易懂,暫且將π2i作為固定效應(yīng)回歸系數(shù)。將方程(2)和(3)代入方程(1)可得到一個(gè)復(fù)合模型(composite model),即方程(4)。

        Yij=(γ00+γ01Zi+ζ0i)+(γ10+γ11Zi+ζ1i)TIMEij+π2iXij+εij

        (4)

        方程(4)是成長(zhǎng)曲線模型第二種表達(dá)形式,它的優(yōu)點(diǎn)是可以直觀地區(qū)別出隨機(jī)效應(yīng)和固定效應(yīng)參數(shù),缺點(diǎn)是方程較為復(fù)雜。方程(4)的第一個(gè)括號(hào)中是復(fù)合截距,復(fù)合截距里包含截距的殘差,表明復(fù)合截距不是一個(gè)常數(shù),而是服從一個(gè)分布的復(fù)合變量,該變量描述了不同個(gè)體的Yij值在起始時(shí)間點(diǎn)的差異。復(fù)合截距里還包含了自變量Z,表示復(fù)合截距受自變量Z的影響,即第二水平的自變量影響第一水平的因變量。第二個(gè)括號(hào)中是時(shí)間變量TIME的復(fù)合斜率,復(fù)合斜率里包含斜率的殘差,表明不同個(gè)體在成長(zhǎng)速度上不是一個(gè)常數(shù),而是服從一個(gè)分布的復(fù)合變量。復(fù)合斜率里也包含了第二水平的Z自變量,表示復(fù)合斜率也受Z變量的影響。將上述復(fù)合方程重新組合排列以后得到方程(5),其參數(shù)可分為結(jié)構(gòu)部分(structural component)和隨機(jī)部分(stochastic component)兩類。

        Yij=γ00+γ10TIMEij+γ01Zi+γ11TIMEijZi+π2iXij+(ζ0i+ζ1iTIMEij+εij)

        (5)

        方程(5)的括號(hào)外部分為結(jié)構(gòu)部分,括號(hào)內(nèi)部分為隨機(jī)部分。這也是混合效應(yīng)模型名字的由來。在這個(gè)方程中可以直觀地看出γ11系數(shù)代表了跨水平變量之間的交互效應(yīng),即時(shí)間變量TIME與Y之間的關(guān)系受Z變量的影響。t檢驗(yàn)用于對(duì)結(jié)構(gòu)部分的參數(shù)(即γ00、γ10、γ01、γ11、π2i)是否分別為零進(jìn)行假設(shè)檢驗(yàn)。方程的復(fù)合殘差包含兩種獨(dú)立的殘差來源且隨時(shí)間變化而變化,表明各組內(nèi)觀測(cè)值之間不獨(dú)立,同時(shí)也包含異方差(heteroscedasticity),這是成長(zhǎng)曲線模型與經(jīng)典的一般線性回歸方程的根本區(qū)別所在。Z檢驗(yàn)用于對(duì)隨機(jī)部分的參數(shù)(即ζ0i的方差τ00、ζ1i的方差τ11、ζ0i和ζ1i之間的協(xié)方差τ01)是否分別為零進(jìn)行假設(shè)檢驗(yàn)。成長(zhǎng)曲線模型在實(shí)際運(yùn)用過程中會(huì)根據(jù)具體的研究問題或假設(shè)檢驗(yàn)的需要加以增減變化。目前主要統(tǒng)計(jì)軟件包給出的模型結(jié)果對(duì)應(yīng)方程(5)。本文之所以對(duì)上述兩種模型的數(shù)學(xué)表達(dá)形式均作介紹是方便讀者理解成長(zhǎng)曲線模型。

        4 成長(zhǎng)曲線模型參數(shù)估計(jì)方法

        方程中參數(shù)的常用估計(jì)方法有以下兩種。

        第一種是最大似然估計(jì)(maximum likelihood estimation)方法,估計(jì)混合效應(yīng)模型的未知參數(shù)[2,10,12]。1970年代后隨著期望-最大(expectation-maximization, EM)算法的誕生[13],通過優(yōu)化似然函數(shù)找到參數(shù)的無偏估計(jì)被廣泛應(yīng)用。該方法的基本思路是先確定包含參數(shù)的似然函數(shù),再給方程中截距、斜率、第一和第二水平的方差各自賦予一任意初始值,得到一個(gè)可以觀測(cè)到實(shí)際因變量值的似然值,然后不斷嘗試其他參數(shù)值的組合,并與之前得到的似然值對(duì)比,看是否優(yōu)化,如此循環(huán)往復(fù),直到得到可以觀測(cè)到實(shí)際因變量值的最大似然值。該方法在樣本足夠大時(shí)一致性和有效性均佳。但也發(fā)現(xiàn)有收斂慢的缺點(diǎn)[14]。隨后又有基于Newton-Raphson和Fisher scoring的估計(jì)方法誕生[15-16]。這些估計(jì)方法已經(jīng)被各種軟件采用。最大似然估計(jì)法有一大優(yōu)點(diǎn)是如果缺失數(shù)據(jù)的概率與因變量無關(guān),即符合隨機(jī)缺失(missing at random, MAR)機(jī)制,即使有部分資料缺失,最大似然估計(jì)法仍然會(huì)給出無偏參數(shù)估計(jì)值,因此成長(zhǎng)曲線模型允許部分樣本存在部分缺失的隨訪資料。

        最大似然估計(jì)法在實(shí)際應(yīng)用中又分為兩種情況。其一是對(duì)全模型即對(duì)結(jié)構(gòu)部分和隨機(jī)部分一起進(jìn)行運(yùn)算,稱為全信息最大似然估計(jì)法(full information maximum likelihood estimation, FIML);其二是僅對(duì)隨機(jī)部分即復(fù)合殘差部分進(jìn)行運(yùn)算,稱為限制性最大似然估計(jì)法(restricted maximum likelihood estimation, REML)。當(dāng)需要比較一系列模型并用最大似然值或其演化出來的統(tǒng)計(jì)指標(biāo)評(píng)估哪一個(gè)模型擬合更好時(shí),所比較的模型只有在使用同一最大似然估計(jì)方法的條件下才具有可比性,即要么比較用FIML得出的似然值,要么比較用REML得出的似然值。

        第二種是廣義最小二乘法(generalized least squares, GLS)[17]。這種方法是對(duì)一般線性回歸模型中使用的最小二乘法的擴(kuò)展。第一步忽略樣本的等級(jí)結(jié)構(gòu),用普通最小二乘法(ordinary least squares)估計(jì)其殘差的方差/協(xié)方差矩陣,假定從樣本得到的方差/協(xié)方差矩陣就是估計(jì)的總體的方差/協(xié)方差矩陣。第二步根據(jù)估計(jì)的方差/協(xié)方差矩陣再估計(jì)方程中的固定效應(yīng)參數(shù)及相應(yīng)的標(biāo)準(zhǔn)誤。再將第二步得到的新參數(shù)放回到第一步重新估計(jì)殘差的方差/協(xié)方差矩陣,然后再回到第二步,根據(jù)新估計(jì)的方差/協(xié)方差矩陣再重新估計(jì)方程中的固定效應(yīng)參數(shù)及相應(yīng)的標(biāo)準(zhǔn)誤,如此重復(fù),直到基于預(yù)先確定的標(biāo)準(zhǔn),使得估計(jì)的參數(shù)無法得到改進(jìn)為止,專業(yè)術(shù)語上稱之為收斂(convergence)。

        除上述兩種方法外,估計(jì)混合效應(yīng)模型參數(shù)的方法還有很多,并且不斷有新方法出現(xiàn)。這些方法已經(jīng)編入統(tǒng)計(jì)軟件中以便使用,故對(duì)于廣大應(yīng)用者,只需對(duì)其估計(jì)方法有一個(gè)基本的了解即可。

        5 成長(zhǎng)曲線模型的應(yīng)用

        當(dāng)研究者收集完數(shù)據(jù)并以長(zhǎng)格式的方式錄入到數(shù)據(jù)庫(kù)后,就可以開始分析。由于成長(zhǎng)曲線模型結(jié)構(gòu)較復(fù)雜,一般主張由簡(jiǎn)到繁,分步驟檢驗(yàn)不同的成長(zhǎng)曲線模型。本文以一項(xiàng)縱向研究為例,展示如何應(yīng)用成長(zhǎng)曲線模型[11]。

        美國(guó)青少年至成年人健康縱向研究(the national longitudinal study of adolescent to adult health,簡(jiǎn)稱Add Health),自1994-1995學(xué)年起對(duì)一組超過兩萬名具有全美代表性的七至十二年級(jí)的青少年進(jìn)行跟蹤隨訪,觀測(cè)這些青少年的發(fā)育、成長(zhǎng)、成熟、老齡化的全生命過程。該研究收集的數(shù)據(jù)包括人口資料、社會(huì)因素、家庭因素、社會(huì)經(jīng)濟(jì)狀況、行為、心理、認(rèn)知、生理和遺傳、用藥。除了調(diào)查在校青少年外,它還調(diào)查了青少年的家長(zhǎng)、學(xué)校、社區(qū)以及地理環(huán)境數(shù)據(jù)。該研究在1994-1995學(xué)年、1996-1997學(xué)年、2001-2002學(xué)年、2008-2009年、2016-2018年共進(jìn)行了5次調(diào)查。除了可能暴露研究對(duì)象身份的敏感數(shù)據(jù)(包括受訪者的生物遺傳信息、居住社區(qū)及地理信息)需提出申請(qǐng)并經(jīng)過審查后才能獲取使用外,該研究的絕大部分?jǐn)?shù)據(jù)已公布在互聯(lián)網(wǎng)上供研究和教學(xué)之用(https://addhealth.cpc.unc.edu/data)。至今已有數(shù)以千計(jì)使用該數(shù)據(jù)庫(kù)的論文發(fā)表。

        本文選取該研究前四次調(diào)研的一部分?jǐn)?shù)據(jù)(n=6291)作為學(xué)習(xí)探討使用成長(zhǎng)曲線模型的實(shí)例。20世紀(jì)90年代至今的30年期間,美國(guó)面臨的一個(gè)公共衛(wèi)生危機(jī)就是青少年肥胖率迅猛增長(zhǎng)。由于肥胖癥已被證明是導(dǎo)致心腦血管疾病、腫瘤、精神疾病等健康問題的重要成因,并且很多成年人疾病起因于青少年時(shí)期,因此從青少年開始研究肥胖癥的發(fā)生和發(fā)展規(guī)律,對(duì)于慢性病和精神疾病預(yù)防有著重大意義。本文擬從以下兩個(gè)方面來研究肥胖癥:①?gòu)?994至2008年,美國(guó)青少年體重總體上變化的趨勢(shì)是怎樣的?②是否所有青少年體重變化的趨勢(shì)都是一致的?哪些因素可以解釋青少年體重變化的趨勢(shì)?體重指數(shù)常用來衡量肥胖程度。從表2可以看出在本文使用的樣本中,從少年到青年,體重指數(shù)從初始時(shí)的正常到后來的超重呈現(xiàn)增長(zhǎng)的趨勢(shì),標(biāo)準(zhǔn)差隨時(shí)間推移而變大,男女變化的趨勢(shì)一致。下面本文分步分析數(shù)據(jù)以回答上述問題,所有結(jié)果均使用SAS軟件包獲得[18]。感興趣的讀者可通過微信公眾號(hào)(醫(yī)學(xué)與社會(huì))、中國(guó)知網(wǎng)、萬方等渠道下載本文的附件文件,獲取相關(guān)數(shù)據(jù)和SAS程序編碼。

        表2 四次調(diào)查樣本的體重指數(shù)描述性統(tǒng)計(jì)結(jié)果

        5.1 體重指數(shù)變化趨勢(shì)的圖形展示

        圖1為運(yùn)用懲罰B樣條曲線(penalized B-spline curves)擬合方法顯示隨機(jī)抽取的12位青少年每人在4次隨訪中體重指數(shù)的變化趨勢(shì)。橫軸表示隨訪時(shí)間,縱軸表示體重指數(shù)的范圍。這12條曲線的形狀各異,每次隨訪時(shí)體重指數(shù)數(shù)值均不同。由于存在失訪,有的受訪者只有2次或3次體重指數(shù)記錄。因此,如果僅看每個(gè)個(gè)體,很難把握體重指數(shù)的變化趨勢(shì)。

        圖1 12位青少年在4次隨訪中體重指數(shù)的變化趨勢(shì)(懲罰B樣條曲線)

        為了更好地看清每個(gè)個(gè)體的體重指數(shù)變化趨勢(shì),改用線性回歸方程分析每位受訪者體重指數(shù)隨時(shí)間變化的線性趨勢(shì)。圖2顯示這12位青少年中大部分人體重指數(shù)呈直線增長(zhǎng)趨勢(shì),也有下降和平緩趨勢(shì),這12條直線的斜率及每人的初始體重指數(shù)均不同。

        圖2 12位青少年在4次隨訪中體重指數(shù)的變化趨勢(shì)(線性回歸方程)

        當(dāng)隨機(jī)抽取的樣本量增加到100,就有100條體重指數(shù)變化直線,如果疊加在一張圖中,就很難用肉眼看清這100人體重指數(shù)變化的趨勢(shì)了,如果樣本更多難度則更大。研究者可以借助線性回歸方程,對(duì)所有個(gè)體樣本的斜率加以平均,歸納出所有受試者的平均變化趨勢(shì)。圖3分別展示了各100位男性和女性青少年體重指數(shù)隨時(shí)間的變化趨勢(shì)。圖3中的左圖顯示男性結(jié)果,右圖顯示女性結(jié)果,加粗的直線代表男性和女性青少年各自的平均線性回歸方程,其斜率分別為男性和女性青少年學(xué)生體重指數(shù)的平均成長(zhǎng)率。

        圖3 100位男性(GENDER=1)和女性(GENDER=2)青少年在4次隨訪中體重指數(shù)的變化趨勢(shì)(線性回歸方程)

        從圖3中我們可以看到,左圖男性青少年的平均體重指數(shù)在初始時(shí)比右圖的女性青少年稍高,14年后到第4次觀測(cè)時(shí),女性的平均體重指數(shù)已經(jīng)接近男性的平均體重指數(shù),提示男性和女性青少年體重指數(shù)狀況有別。具體差別可以用成長(zhǎng)曲線模型對(duì)所有樣本體重指數(shù)在這14年中的變化規(guī)律進(jìn)行研究。

        5.2 無條件均值模型

        首先需要檢驗(yàn)在面板數(shù)據(jù)中是否有證據(jù)支持引入混合效應(yīng)模型。如果把方程(1)和(2)簡(jiǎn)化為沒有任何自變量的方程,即:

        BMIij=π0i+εij

        (6)

        π0i=γ00+ζ0i

        (7)

        BMIij=γ00+ζ0i+εij

        (8)

        (9)

        ICC的值介于0~1之間,其值越接近1,表示使用混合效應(yīng)模型的必要性越大;其值等于零,則提示沒有必要使用混合效應(yīng)模型。ICC的大小及顯著性檢驗(yàn)的結(jié)果提供了一個(gè)是否需要使用混合效應(yīng)模型的統(tǒng)計(jì)判斷。方程(8)的主要參數(shù)估計(jì)結(jié)果見表3。

        表3中截距顯示所有樣本在所有時(shí)間的平均體重指數(shù)為24.73,略小于25.00即在正常范圍。第一水平方程殘差的方差為14.74,Z檢驗(yàn)結(jié)果顯著(14.74/0.17=86.71,P<0.0001),表示拒絕該方差等于零的原假設(shè),說明每個(gè)學(xué)生在不同時(shí)間的體重指數(shù)觀測(cè)值圍繞個(gè)體體重指數(shù)平均值波動(dòng),個(gè)體內(nèi)差異有顯著性。第二水平方程殘差的方差為21.32,Z檢驗(yàn)結(jié)果顯著(21.32/0.47=45.36,P<0.0001),表示學(xué)生個(gè)體間的截距的差異有顯著性,說明個(gè)體存在組間異質(zhì)性(heterogeneity),組內(nèi)個(gè)體存在聚集現(xiàn)象,即觀測(cè)值不獨(dú)立。將表3中方差值代入方程(9)算出ICC值等于21.32/(14.74+21.32)=0.59,它說明學(xué)生之間體重指數(shù)的差異,即組間的變異可以解釋59%的總體體重指數(shù)變異,還有41%的體重指數(shù)變異是由于時(shí)間不同而導(dǎo)致。此結(jié)果說明在研究體重指數(shù)與時(shí)間的關(guān)系時(shí),需要把個(gè)體內(nèi)(within-person)因時(shí)間不同而導(dǎo)致的體重指數(shù)變異和個(gè)體之間(between-person)體重指數(shù)的變異結(jié)合起來考慮,而混合效應(yīng)模型是目前處理這種兩水平數(shù)據(jù)最佳的統(tǒng)計(jì)方法之一,可以將這兩種變異均納入分析。

        表3 無條件均值模型結(jié)果

        表3中還列出了三項(xiàng)評(píng)估模型與樣本資料匹配程度的指標(biāo),即模型擬合度。其中Deviance為偏差,AIC是Akaike's information criterion的縮寫,BIC是Bayesian information criterion的縮寫。這些指標(biāo)可用于模型之間的比較,即將無條件均值模型與后續(xù)其它演化模型進(jìn)行比較(model comparison),模型擬合度指標(biāo)值較小的模型更好[20-21]。盡管無條件均值模型提供了重要的基本信息,但該模型僅提示體重指數(shù)會(huì)隨著個(gè)體的不同而不同,同一個(gè)體體重指數(shù)也會(huì)隨著時(shí)間的不同而不同,但體重指數(shù)與時(shí)間的具體關(guān)系并未給出。我們需要進(jìn)一步擬合其它模型,并與無條件均值模型進(jìn)行比較。

        5.3 無條件成長(zhǎng)曲線模型

        BMIij=π0i+π1iTIMEij+εij

        (10)

        方程(10)在無條件均值模型的基礎(chǔ)上加入了時(shí)間自變量TIME。方程(10)為第一水平模型,描述了不同個(gè)體在不同時(shí)間的體重指數(shù)與時(shí)間的關(guān)系。在本研究中,每次隨訪的間隔時(shí)間不等,第一次與第二次之間相隔2年,第二次與第三次之間相隔5年,第三次與第四次之間相隔7年。間隔時(shí)間不相等不會(huì)影響混合效應(yīng)模型的應(yīng)用,混合效應(yīng)模型可以靈活處理間隔時(shí)間相等或不相等的數(shù)據(jù)。在分析中對(duì)時(shí)間變量的編碼有兩種方法。一是按調(diào)查的時(shí)間順序依次編碼,即第一次記為0,第二次記為1,第三次記為2,第四次記為3。這種方法可以用來估計(jì)體重指數(shù)隨調(diào)查時(shí)間的推移變化的軌跡。該編碼方法既可用于間隔時(shí)間相等,也可用于間隔時(shí)間不等的縱向數(shù)據(jù)。另一種編碼方法是按調(diào)查時(shí)間的實(shí)際間隔編碼,以體現(xiàn)間隔時(shí)間不等。本例可以1994-1995學(xué)年為初始點(diǎn),第一次記為0,第二次記為2,第三次年為7,第四次記為14。該方法估計(jì)出每一年體重指數(shù)的變化軌跡。兩種編碼方法估計(jì)的變化軌跡的具體數(shù)值不一樣,但總體方向在多數(shù)情況下是一致的。本文采用第二種時(shí)間編碼方法,因其更接近實(shí)際情況。

        π0i=γ00+ζ0i

        (7)

        π1i=γ10+ζ1i

        (11)

        方程(7)與(11)均為第二水平模型。方程(11)的右端包含了時(shí)間變量的總體斜率和個(gè)體斜率與總體斜率之間的殘差。

        將方程(7)和(11)代入方程(10)后得到方程(12)

        BMIij=γ00+γ10TIMEij+(ζ0i+ζ1i*TIMEij+εij)

        (12)

        方程(12)即為無條件成長(zhǎng)曲線模型,顯示體重指數(shù)與時(shí)間的關(guān)系,括號(hào)中是包含有時(shí)間變量的復(fù)合殘差,它顯示復(fù)合殘差會(huì)隨時(shí)間的變化而變化,即存在異方差。方程(12)的主要參數(shù)估計(jì)結(jié)果見表4。

        表4中截距估計(jì)值表示在1994-1995學(xué)年美國(guó)青少年的平均體重指數(shù)為22.52,小于25.0即正常。時(shí)間斜率估計(jì)值為正,表明美國(guó)青少年的體重指數(shù)以每年平均0.42的速度增長(zhǎng)。截距(22.52/0.06=375.33,P<0.0001)和時(shí)間斜率(0.42/0.01=42.00,P<0.0001)的t檢驗(yàn)結(jié)果均顯著,表示拒絕截距和時(shí)間斜率等于零的原假設(shè)。表4中第一水平方程殘差的方差為4.23,與表3中相對(duì)應(yīng)的第一水平方程殘差的方差14.74相比下降了71%,表示71%的個(gè)體內(nèi)體重指數(shù)的差異可以被時(shí)間變量所解釋。由于該方差Z檢驗(yàn)結(jié)果顯著(4.23/0.06=70.50,P<0.0001),表示不接受該方差等于零的原假設(shè),提示還有其它第一水平的自變量可以引入方程來解釋剩余29%的個(gè)體內(nèi)體重指數(shù)的變異。

        表4 無條件成長(zhǎng)曲線模型結(jié)果

        對(duì)于隨時(shí)間變化的自變量,其變化可分為頻繁變化和相對(duì)穩(wěn)定兩種。例如許多生理指標(biāo),包括血壓、脈搏、血脂、血糖、激素水平等,變化頻繁,其變化可以分鐘或小時(shí)為單位。這類因素一般都作為隨時(shí)間變化的變量處理,即每一次隨訪都記錄下當(dāng)時(shí)的數(shù)值,在數(shù)據(jù)庫(kù)里存儲(chǔ)的每一條記錄可能相同也可能不同。又如生活方式和某些行為特征,隨時(shí)間變化而變化,但這些特征變化不是很頻繁,其變化多以年甚至5年為單位計(jì)算。如果在一段相對(duì)較短的時(shí)間內(nèi)反復(fù)觀測(cè),這些特征可能沒有變化。在這種情況下,這些特征可視為不隨時(shí)間變化的變量,屬于第二水平的個(gè)體變量。但是如果隨訪時(shí)間較長(zhǎng),則這類變量可視為隨時(shí)間變化的變量,屬于第一水平的變量??傊S時(shí)間變化的自變量和不隨時(shí)間變化的自變量的區(qū)分不是絕對(duì)的,需依具體情況做出最合適的判斷。

        第二水平初始值的方差Z檢驗(yàn)結(jié)果顯著(4.16/0.04=104.00,P<0.0001),表示不接受該方差等于零的原假設(shè)(P<0.0001),說明不同的學(xué)生個(gè)體在研究開始時(shí)體重指數(shù)有明顯的差異。第二水平成長(zhǎng)率即時(shí)間斜率的方差Z檢驗(yàn)結(jié)果顯著(0.29/0.01=29.00,P<0.0001),表示不接受該方差等于零的原假設(shè),說明不同的學(xué)生個(gè)體每年體重指數(shù)增長(zhǎng)速度明顯不同。協(xié)方差表示截距和斜率殘差間的相關(guān)度,表4中協(xié)方差估計(jì)值為0.08且Z檢驗(yàn)有顯著性,表示初始體重指數(shù)水平與體重指數(shù)增長(zhǎng)速度之間呈正相關(guān),即初始體重指數(shù)大的學(xué)生,后續(xù)體重指數(shù)的成長(zhǎng)率越快。假如協(xié)方差為負(fù)值且Z檢驗(yàn)有顯著性,則結(jié)論恰好相反。值得指出的是根據(jù)實(shí)際情況,初始值和成長(zhǎng)率之間的協(xié)方差可能為零也可能不為零,可以通過檢驗(yàn)加以驗(yàn)證。無條件成長(zhǎng)曲線模型的模型擬合度指標(biāo)與無條件均值模型相比具有較小的指標(biāo)值,表明無條件成長(zhǎng)曲線模型對(duì)數(shù)據(jù)的擬合更好。

        圖4顯示由方程(12)得出的預(yù)測(cè)的體重指數(shù)與時(shí)間的平均線性增長(zhǎng)關(guān)系,成長(zhǎng)率方差0.29描繪了其變異度,即不同的人有不同的增長(zhǎng)率。橫軸代表時(shí)間,單位為年;縱軸代表模型預(yù)測(cè)的體重指數(shù)。

        圖4 方程(12)預(yù)測(cè)的體重指數(shù)與時(shí)間的平均線性增長(zhǎng)關(guān)系

        盡管無條件成長(zhǎng)曲線模型顯示美國(guó)青少年初始的體重指數(shù)水平及后來體重指數(shù)增長(zhǎng)速度因人而異,但是沒有揭示哪些因素影響學(xué)生個(gè)體之間體重指數(shù)的差異,需要進(jìn)一步用其他模型加以探討。

        5.4 加入第二水平性別變量的條件成長(zhǎng)曲線模型

        眾所周知男性與女性在生理、心理、行為、生活方式上都有差別,因此首先檢驗(yàn)性別(GENDER)是否影響體重指數(shù)。性別不隨時(shí)間變化,屬于第二水平的自變量。在本研究數(shù)據(jù)錄入的長(zhǎng)格式中,同一個(gè)青少年有多至四條觀測(cè)記錄,故每個(gè)青少年的性別有多至四條重復(fù)的記錄,表明性別不隨時(shí)間變化而變化。其他類似的第二水平的自變量有籍貫、民族、家庭出身、出生地、血型、出生體重、基線調(diào)查的背景特征等。

        BMIij=π0i+π1iTIMEij+εij

        (10)

        與無條件成長(zhǎng)曲線模型一樣,第一水平模型仍然是方程(10),顯示體重指數(shù)與時(shí)間之間的關(guān)系。

        π0i=γ00+γ01GENDERi+ζ0i

        (13)

        π1i=γ10+γ11GENDERi+ζ1i

        (14)

        方程(13)表示截距與性別之間的關(guān)系,方程(14)表示時(shí)間斜率與性別之間的關(guān)系,方程(13)和(14)為第二水平模型。將方程(13)和(14)代入方程(10)后得到方程(15)。

        BMIij=γ00+γ01GENDERi+γ10TIMEij+γ11TIMEij*GENDERi+(ζ0i+ζ1i*TIMEij+εij)

        (15)

        方程(15)在一個(gè)方程中清楚地展示了分屬兩個(gè)水平的自變量如何統(tǒng)一對(duì)第一水平因變量體重指數(shù)產(chǎn)生影響。時(shí)間和性別的主效應(yīng)分別顯示第一水平和第二水平的自變量對(duì)體重指數(shù)的影響,時(shí)間和性別的交互效應(yīng)為跨水平變量之間的交互效應(yīng),表明時(shí)間對(duì)體重指數(shù)的效應(yīng)可能依性別不同而不同。方程(15)的主要參數(shù)估計(jì)結(jié)果見表5。

        表5 加入第二水平性別變量的條件成長(zhǎng)曲線模型結(jié)果

        表5中截距估計(jì)值表示在1994-1995學(xué)年,美國(guó)女性青少年的平均體重指數(shù)為22.39。性別的主效應(yīng)斜率表明男性比女性在1994-1995學(xué)年時(shí)的平均體重指數(shù)高0.27,t檢驗(yàn)結(jié)果顯著(0.27/0.11=2.45,P=0.017),表示不接受該斜率等于零的原假設(shè)。成長(zhǎng)率的主效應(yīng)估計(jì)值表明美國(guó)女性青少年的體重指數(shù)每年平均增長(zhǎng)0.44。t檢驗(yàn)結(jié)果顯示女性初始值(22.39/0.08=279.88,P<0.0001)及其成長(zhǎng)率(0.44/0.01=44.00,P<0.0001)的檢驗(yàn)均顯著,表示不接受女性青少年的初始值及其成長(zhǎng)率等于零的原假設(shè)。因?yàn)闀r(shí)間與性別交互效應(yīng)的系數(shù)為-0.03,所以男性青少年的體重指數(shù)每年平均增長(zhǎng)率為0.44-0.03=0.41,較女生慢,其t檢驗(yàn)結(jié)果顯著(-0.03/0.01=-3.01,P=0.003),表示拒絕時(shí)間與性別無交互效應(yīng)的原假設(shè)。圖5顯示由方程(15)得出的預(yù)測(cè)的男性和女性青少年體重指數(shù)與時(shí)間的不同的平均線性增長(zhǎng)關(guān)系。橫軸代表時(shí)間,單位為年;縱軸代表模型預(yù)測(cè)的體重指數(shù)。由圖5可見女性青少年在初始1994-1995學(xué)年時(shí)平均體重指數(shù)比男性青少年低,但體重指數(shù)的增長(zhǎng)速度較男性青少年快,到2008-2009學(xué)年時(shí)女性青少年平均體重指數(shù)比男性青少年高。

        圖5 方程(15)按男性(GENDER=1)和女性(GENDER=2)分別預(yù)測(cè)的體重指數(shù)與時(shí)間的平均線性增長(zhǎng)關(guān)系

        表5中第一水平的方差Z檢驗(yàn)結(jié)果顯著(4.09/0.06=68.17,P<0.0001),表示不接受該方差等于零的原假設(shè),說明每個(gè)青少年在不同時(shí)間的體重指數(shù)觀測(cè)值圍繞個(gè)體體重指數(shù)平均值波動(dòng),個(gè)體內(nèi)差異有顯著性,再次提示還有其它第一水平隨時(shí)間變化的自變量可以引入方程來解釋剩余的個(gè)體內(nèi)體重指數(shù)的變異。第二水平截距即初始值的方差Z檢驗(yàn)結(jié)果顯著(18.41/0.37=49.76,P<0.0001),表示不接受該方差等于零的原假設(shè),說明不同的青少年個(gè)體在研究開始時(shí)體重指數(shù)在考慮性別的影響后仍有明顯的差異,與表4中對(duì)應(yīng)的第二水平截距即初始值的方差相比,數(shù)值僅減少了0.02,提示需進(jìn)一步探索除性別以外的影響因素。第二水平成長(zhǎng)率的方差Z檢驗(yàn)結(jié)果顯著(0.10/0.01=10.00,P<0.0001),表示不接受該方差等于零的原假設(shè),說明在考慮性別的影響后,不同的青少年個(gè)體每年體重指數(shù)增長(zhǎng)速度還有明顯的差異,與表4中對(duì)應(yīng)的第二水平成長(zhǎng)率的方差相比,數(shù)值沒有變化,提示需進(jìn)一步探索除性別以外還有哪些因素影響成長(zhǎng)率。協(xié)方差為0.08,表示初始體重指數(shù)越大的青少年,其體重指數(shù)增長(zhǎng)速度越快。

        模型擬合度指標(biāo)與無條件成長(zhǎng)曲線模型相應(yīng)指標(biāo)相比除BIC略有增高外其它兩項(xiàng)有明顯降低,提示加入第二水平性別變量的條件成長(zhǎng)曲線模型比無條件成長(zhǎng)曲線模型對(duì)數(shù)據(jù)的擬合更好。在后續(xù)模型中其它可能的第二水平變量被繼續(xù)加入進(jìn)行擬合。

        5.5 加入其它第二水平變量的條件成長(zhǎng)曲線模型

        前述加入第二水平性別變量的條件成長(zhǎng)曲線模型的結(jié)果提示除性別以外還有其它因素影響初始體重指數(shù)以及體重指數(shù)的增長(zhǎng)速度,為此本文進(jìn)一步探討了隨訪對(duì)象在中學(xué)時(shí)的交友頻率(CONTACT)和就醫(yī)情況(TREATMENT)對(duì)體重指數(shù)初始值和成長(zhǎng)率的影響。交友頻率問題為“在過去的一周,你有多少次與朋友在一起?”選項(xiàng)包括完全沒有、一到兩次、三到四次、五次及以上。就醫(yī)問題為“在過去的一年里,是否有你認(rèn)為你應(yīng)該就醫(yī)卻沒有就醫(yī)的情況發(fā)生?”選項(xiàng)包括有、沒有。對(duì)于回歸模型中自變量的賦值編碼,一般建議最小值從零開始,例如對(duì)就醫(yī)問題,賦值為0=沒有和1=有;對(duì)交友頻率問題,賦值為0=完全沒有、1=一到兩次、2=三到四次、3=五次及以上,這樣使得截距的估計(jì)值有實(shí)際意義,以利于解釋。這樣賦值使得在包括交友頻率自變量的條件成長(zhǎng)曲線模型中,截距表示在過去的一周完全沒有與朋友在一起的青少年的平均體重指數(shù)。如果將交友頻率選項(xiàng)賦值成最小為1或其它大于零的整數(shù),則估計(jì)出的截距仍表明交友頻率選項(xiàng)為零時(shí)的平均體重指數(shù),由于交友頻率選項(xiàng)的賦值范圍不包括零,此時(shí)截距就沒有實(shí)際意義。賦值為零的選項(xiàng)一般稱為參照組,任何有意義的應(yīng)答選項(xiàng)均可以被指定為參照組。例如交友頻率的參照組可以指定是一到兩次的選項(xiàng),將其賦值為0、完全沒有項(xiàng)賦值為-1、三到四次項(xiàng)賦值為1、五次及以上項(xiàng)賦值為2,則此時(shí)截距表示在過去的一周有一到兩次與朋友在一起的青少年的平均體重指數(shù)。如果第一水平或第二水平自變量是連續(xù)型變量,則可以將其最小值、平均值、最大值或其它有實(shí)際意義的值定為零,使得對(duì)應(yīng)的截距有實(shí)際意義。這種方法在數(shù)據(jù)分析中稱為對(duì)變量的中心化(centering)處理。例如本研究中的隨訪對(duì)象為青少年,其年齡都在十歲以上。如果成長(zhǎng)曲線模型中將年齡作為自變量并直接采用調(diào)查數(shù)據(jù)中的實(shí)際年齡,則所得截距表示1994-1995學(xué)年青少年年齡為零時(shí)的體重指數(shù),這顯然與本研究的對(duì)象不相符。若將在1994-1995學(xué)年調(diào)查對(duì)象中的最低年齡或平均年齡定為參照年齡,即每個(gè)青少年的年齡都減去該最低年齡或平均年齡,進(jìn)行中心化處理后再納入模型,則所得截距表示1994-1995學(xué)年時(shí),青少年年齡為最低年齡或平均年齡時(shí)的平均體重指數(shù)。具體如何進(jìn)行中心化處理,在處理具體數(shù)據(jù)時(shí)應(yīng)具體情況具體分析。

        本文用成長(zhǎng)曲線模型分析了交友頻率與就醫(yī)因素及性別對(duì)研究開始時(shí)體重指數(shù)以及每年體重指數(shù)增長(zhǎng)速度的影響。與無條件成長(zhǎng)曲線模型一樣,第一水平模型仍然是方程(10),顯示體重指數(shù)與時(shí)間之間的關(guān)系。

        BMIij=π0i+π1iTIMEij+εij

        (10)

        在第二水平方程中,方程(16)描述了性別、交友頻率、就醫(yī)與截距之間的關(guān)系;方程(17)描述了性別、交友頻率、就醫(yī)與時(shí)間斜率之間的關(guān)系。

        π0i=γ00+γ01GENDERi+γ02CONTACTi+γ03TREATMENTi+ζ0i

        (16)

        π1i=γ10+γ11GENDERi+γ12CONTACTi+γ13TREATMENTi+ζ1i

        (17)

        將方程(16)和(17)代入方程(10)后得到方程(18)。時(shí)間交互效應(yīng)表明跨水平變量性別、交友、就醫(yī)分別對(duì)體重指數(shù)增長(zhǎng)率的影響。

        BMIij=γ00+γ01GENDERi+γ10TIMEij+γ02CONTACTi+γ03TREATMENTi+γ11TIMEij*GENDERi+γ12TIMEij*CONTACTi+γ13TIMEij*TREATMENTi+(ζ0i+ζ1i*TIMEij+εij)

        (18)

        分析后結(jié)果表明交友頻率與就醫(yī)對(duì)初始體重指數(shù)水平有影響,但是對(duì)每年體重指數(shù)增長(zhǎng)速度無顯著影響,因?yàn)棣?2和γ13的t檢驗(yàn)結(jié)果均不顯著即接受這兩個(gè)系數(shù)與零無差異的原假設(shè)(P值均大于0.05),故方程(18)可以簡(jiǎn)化成方程(19)。

        BMIij=γ00+γ01GENDERi+γ10TIMEij+γ02CONTACTi+γ03TREATMENTi+γ11TIME*GENDERi+(ζ0i+ζ1iTIMEij+εij)

        (19)

        方程(19)中有顯著意義的主要參數(shù)估計(jì)結(jié)果見表6。

        表6中截距估計(jì)值表示在1994-1995學(xué)年,在過去的一周完全沒有與朋友在一起以及在過去的一年里沒有發(fā)生應(yīng)該就醫(yī)卻沒有就醫(yī)的美國(guó)女性青少年的平均體重指數(shù)為22.65。時(shí)間斜率估計(jì)值顯示在調(diào)整了性別、交友頻率、就醫(yī)因素影響后的美國(guó)女性青少年的體重指數(shù)每年平均增長(zhǎng)0.44。截距(22.65/0.14=162.14,P<0.0001)和時(shí)間斜率(0.44/0.01=44.00,P<0.0001)的t檢驗(yàn)結(jié)果均顯著,表示截距和時(shí)間斜率均拒絕了等于零的原假設(shè)。性別的斜率表明當(dāng)交友頻率與就醫(yī)情況相同的條件下,男性青少年比女性青少年在1994-1995學(xué)年時(shí)的平均體重指數(shù)高0.30,t檢驗(yàn)結(jié)果顯著(0.30/0.11=2.72,P=0.008),表示該斜率等于零的原假設(shè)被拒絕。交友頻率的斜率估計(jì)值是負(fù)數(shù),表明在其它因素的影響保持相同的情況下,在1994-1995學(xué)年,與朋友一周內(nèi)接觸越頻繁的學(xué)生其平均體重指數(shù)越低。就醫(yī)頻率的斜率估計(jì)值顯示在其它因素的影響保持相同的情況下,在1994-1995學(xué)年,應(yīng)就醫(yī)而未就醫(yī)的青少年比應(yīng)就醫(yī)而就醫(yī)的青少年平均體重指數(shù)高0.47。時(shí)間與性別交互效應(yīng)的系數(shù)仍然為-0.03,顯示在其它因素的影響保持相同的情況下,男性青少年每年的體重指數(shù)增長(zhǎng)率為0.44-0.03=0.41,較女生慢,t檢驗(yàn)結(jié)果顯著(-0.03/0.01=-3.00,P=0.002),表示時(shí)間與性別交互效應(yīng)等于零的原假設(shè)被拒絕。

        表6 加入其它第二水平變量的條件成長(zhǎng)曲線模型結(jié)果

        表6中第一水平的方差Z檢驗(yàn)結(jié)果顯著(4.23/0.06=67.50,P<0.0001),表示不接受該方差等于零的原假設(shè),說明每個(gè)青少年在不同時(shí)間的體重指數(shù)觀測(cè)值圍繞個(gè)體體重指數(shù)平均值波動(dòng),個(gè)體內(nèi)差異有顯著性,再次提示還有其它第一水平隨時(shí)間變化的自變量可以引入方程來解釋剩余的個(gè)體內(nèi)體重指數(shù)的變異。第二水平截距即初始值的方差Z檢驗(yàn)結(jié)果顯著(4.14/0.04=103.50,P<0.0001),表示不接受該方差等于零的原假設(shè),說明性別、交友頻率、就醫(yī)無法完全解釋1994-1995學(xué)年體重指數(shù)的變異,表明還有其它第二水平不隨時(shí)間變化的自變量可以引入方程。初始值的方差4.14比表5中初始值的方差4.15稍小,說明交友頻率和就醫(yī)解釋1994-1995學(xué)年時(shí)美國(guó)青少年平均體重指數(shù)的差異的能力非常有限。第二水平成長(zhǎng)率方差Z檢驗(yàn)結(jié)果顯著(0.29/0.01=29.00,P<0.0001),表示該方差不等于零的原假設(shè)被拒絕,說明體重指數(shù)增長(zhǎng)率還有除性別、交友頻率、就醫(yī)以外的其它潛在因素的影響。表6中成長(zhǎng)率的均值與方差與表5中相比沒有差別,表明還需要尋找其它影響成長(zhǎng)率的因素,這是下一步需繼續(xù)研究的方向。表6中模型擬合度指標(biāo)與表5中相比具有較小的指標(biāo)值,表明加入性別、交友頻率和就醫(yī)的成長(zhǎng)曲線模型比僅加入性別的條件成長(zhǎng)曲線模型對(duì)數(shù)據(jù)的擬合更好,意味著最終的模型更好地概括了數(shù)據(jù)中體重指數(shù)潛藏的變化規(guī)律,支持目前的研究方向。

        綜合方程(8)、(9)、(12)、(19)的結(jié)果可發(fā)現(xiàn)在美國(guó)青少年至成年人健康縱向隊(duì)列研究中有明顯的聚類效應(yīng),即青少年個(gè)體之間的體重指數(shù)差異對(duì)其與時(shí)間的關(guān)系有明顯的干擾效應(yīng),在用混合效應(yīng)模型控制了干擾效應(yīng)后,在調(diào)查初始時(shí)即1994-1995學(xué)年青少年個(gè)體體重指數(shù)有高有低,其中女性、交友頻繁者、應(yīng)就醫(yī)而就醫(yī)者在調(diào)查初始時(shí)比男性、交友不頻繁者、應(yīng)就醫(yī)而沒就醫(yī)者的平均體重指數(shù)要低。青少年的體重指數(shù)從1994年到2008年有很明顯的增長(zhǎng),初始時(shí)的體重指數(shù)差異與后來14年的體重指數(shù)增長(zhǎng)呈正相關(guān),沒有發(fā)現(xiàn)初始時(shí)的交友頻率和就醫(yī)情況對(duì)體重指數(shù)增長(zhǎng)率有顯著影響。女性青少年盡管在開始時(shí)平均體重指數(shù)比男性青少年低,但后來居上,每年平均增長(zhǎng)速度明顯快于男性青少年,快速增長(zhǎng)的體重指數(shù)可能會(huì)增加了女性心腦血管疾病、腫瘤、心理疾患的危險(xiǎn)性。另外不是所有男性和女性青少年的體重指數(shù)增長(zhǎng)速度都一樣,個(gè)體之間差別很明顯。下一步的研究需要找到除性別、交友頻率、就醫(yī)情況外還有哪些因素可以影響體重指數(shù)增長(zhǎng)率,從而為下一步針對(duì)加速體重指數(shù)增長(zhǎng)的因素進(jìn)行有效干預(yù)提供建議,進(jìn)而降低人群中體重超重和肥胖癥的比例,最終達(dá)到降低人群中心腦血管疾病、腫瘤、心理疾患的危險(xiǎn)性的目標(biāo)。

        6 總結(jié)

        過去社會(huì)科學(xué)及醫(yī)學(xué)研究者認(rèn)為縱向研究設(shè)計(jì)收集數(shù)據(jù)不僅費(fèi)時(shí)費(fèi)事,成本也較高。隨著科技的進(jìn)步,人類收集數(shù)據(jù)的能力越來越強(qiáng),對(duì)研究質(zhì)量的要求也越來越高,近二十年來在社會(huì)科學(xué)和醫(yī)學(xué)領(lǐng)域里使用縱向設(shè)計(jì)的研究也越來越多。本文概括性地介紹了目前分析縱向數(shù)據(jù)的一個(gè)主要方法即成長(zhǎng)曲線模型的基本原理及應(yīng)用。使用美國(guó)青少年至成年人健康縱向調(diào)查數(shù)據(jù)探討了美國(guó)青少年體重指數(shù)從1994年到2008年間的變化趨勢(shì)以及部分潛在因素即性別、交友頻率、就醫(yī)情況對(duì)體重指數(shù)變化的影響,詳細(xì)介紹了成長(zhǎng)曲線模型中每個(gè)參數(shù)的實(shí)際意義,結(jié)合實(shí)例重點(diǎn)強(qiáng)調(diào)如何最大限度提取參數(shù)給出的信息以回答實(shí)際問題,涉及了部分相關(guān)的數(shù)據(jù)分析技巧。依次報(bào)告了無條件均值模型、無條件成長(zhǎng)曲線模型以及條件成長(zhǎng)曲線模型的結(jié)果,這些中間過渡模型的結(jié)果對(duì)于問題的探索和理解大有裨益。但在撰寫最終報(bào)告中可以省略模型的探索過程,只報(bào)告最終模型結(jié)果。另外,本文在分析美國(guó)青少年至成年人健康縱向研究樣本時(shí)沒有考慮復(fù)雜抽樣設(shè)計(jì)和樣本的加權(quán)值對(duì)統(tǒng)計(jì)檢驗(yàn)結(jié)果的影響,故分析結(jié)果不一定能代表美國(guó)青少年的真正體重指數(shù)變化情況,上述結(jié)論僅供學(xué)習(xí)討論成長(zhǎng)曲線模型之用。由于篇幅限制,本文僅介紹了普通成長(zhǎng)曲線模型,無法顧及其中許多細(xì)節(jié)及其它演化的模型,例如如何檢驗(yàn)?zāi)P偷木€性關(guān)系和正態(tài)分布的前提假設(shè)、非連續(xù)性成長(zhǎng)率、非線性模型、針對(duì)分類和計(jì)數(shù)因變量的成長(zhǎng)曲線模型、meta分析等。有興趣的讀者在對(duì)成長(zhǎng)曲線模型有了初步了解后可閱讀相關(guān)的專著以對(duì)成長(zhǎng)曲線模型有更全面深入的理解,加強(qiáng)合理運(yùn)用成長(zhǎng)曲線模型的能力。

        (本文受湖北省衛(wèi)生技術(shù)評(píng)估研究中心和《醫(yī)學(xué)與社會(huì)》編輯部邀請(qǐng)撰寫,編校過程中編輯部張治國(guó)和宋芳給予了大力協(xié)助,在此一并表示感謝。)

        猜你喜歡
        青少年模型
        一半模型
        青少年發(fā)明家
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        激勵(lì)青少年放飛心中夢(mèng)
        讓雷鋒精神點(diǎn)亮青少年的成長(zhǎng)之路
        關(guān)愛青少年的“三個(gè)一”
        暖其行 正其行 22 名“五老”與30 名失足青少年
        免费人成小说在线观看网站 | 香港三级日本三级a视频| 人人妻人人爽人人做夜欢视频九色 | 内射人妻少妇无码一本一道 | 日本国产精品高清在线| 国产免费三级av在线| 亚洲综合欧美在线一区在线播放| 国产日韩欧美网站| 国产一区亚洲一区二区| 日本道免费一区二区三区日韩精品| 亚洲av片一区二区三区| 真实国产乱视频国语| 麻豆激情视频在线观看| 欧美乱妇高清无乱码免费| 国产午夜精品一区二区三区软件| 在线精品日韩一区二区三区| 偷拍一区二区三区黄片| 日本边添边摸边做边爱喷水 | 亚洲日韩精品欧美一区二区一| 五月天无码| 成h视频在线观看免费| 美女脱了内裤张开腿让男人桶网站 | 久久久久久欧美精品se一二三四| 国产精品久久久久久妇女6080| 亚洲日产AV中文字幕无码偷拍| 亚洲一区二区三区偷拍视频| 亚洲精品成人无码中文毛片| 亚洲激情成人| 亚洲中文字幕在线精品2021| 国产精品久久久久久妇女| 洗澡被公强奷30分钟视频| 国内精品91久久久久| 放荡成熟人妻中文字幕| 亚洲精品国产suv一区88| 亚洲AV无码国产永久播放蜜芽 | 女人的天堂av免费看| 亚洲1区第2区第3区在线播放| 制服丝袜中文字幕在线| 久久久久成人亚洲综合精品| 淫秽在线中国国产视频| 亚洲精品国精品久久99热|