海軍軍醫(yī)大學(xué)衛(wèi)生勤務(wù)學(xué)系軍隊(duì)衛(wèi)生統(tǒng)計(jì)學(xué)教研室(200433)
秦宇辰 郭 威△
【提 要】 目的 介紹比較醫(yī)學(xué)研究與公共衛(wèi)生工作中常用的兩大變化趨勢(shì)描述指標(biāo),年度變化百分比(annual percent change,APC)和年均變化百分比(average annual percent change,AAPC)間的異同,介紹兩者在joinpoint軟件中的實(shí)現(xiàn)方法,為兩者的實(shí)踐運(yùn)用提供實(shí)用建議。方法 比較分析兩個(gè)指標(biāo)的基本原理、方法特性和相對(duì)優(yōu)劣勢(shì),論述各指標(biāo)的適用情景和應(yīng)用價(jià)值。結(jié)果 APC的使用需嚴(yán)格遵守線性趨勢(shì)假定,而AAPC具有諸如無(wú)需線性變化趨勢(shì)假定、適用面廣、方便各亞組間變化趨勢(shì)比較、更充分利用既有信息和取值對(duì)分割時(shí)間區(qū)段內(nèi)子時(shí)間段不敏感等優(yōu)點(diǎn),在線性變化趨勢(shì)假定下可化簡(jiǎn)為APC。結(jié)論 AAPC具有顯著的方法學(xué)優(yōu)勢(shì),可更科學(xué)、有效地刻畫(huà)觀察期內(nèi)的總體變化趨勢(shì),在醫(yī)學(xué)研究的趨勢(shì)分析中應(yīng)優(yōu)先選用。
醫(yī)學(xué)研究與公共衛(wèi)生工作中,常采用平均增長(zhǎng)速度、年度變化百分比(annual percent change,APC)和年均變化百分比(average annual percent change,AAPC)等指標(biāo)定量分析描述某事物或現(xiàn)象的時(shí)間變化趨勢(shì)。已有研究表明,相較于平均增長(zhǎng)速度,APC能更充分利用每個(gè)時(shí)段觀察值的信息,科學(xué)性和嚴(yán)謹(jǐn)性更強(qiáng),推薦在實(shí)踐工作中優(yōu)先使用[1]。然而目前,尚未有研究介紹比較年度變化百分比(APC)和年均變化百分比(AAPC)兩種時(shí)間變化趨勢(shì)描述指標(biāo)的特點(diǎn)與相對(duì)優(yōu)劣勢(shì)。本文旨在簡(jiǎn)要介紹兩個(gè)指標(biāo)的基本原理和特點(diǎn),比較它們的優(yōu)劣之處,并介紹軟件實(shí)現(xiàn)方法,以期為其推廣應(yīng)用提供參考。
假設(shè)目標(biāo)現(xiàn)象y(如發(fā)病率、死亡率等)在整個(gè)觀察期內(nèi)的變化速度恒定,采用線性回歸方程ln(y)=b0+b1x,擬合時(shí)間變量x與目標(biāo)現(xiàn)象的自然對(duì)數(shù)值ln(y)之間的線性關(guān)系,通過(guò)對(duì)該直線斜率b1的t檢驗(yàn),實(shí)現(xiàn)對(duì)APC取值是否為0的假設(shè)檢驗(yàn)。假設(shè)2015-2020年間某疾病發(fā)病率的APC為1%,2015年的發(fā)病率為20/10萬(wàn),則2016年的發(fā)病率為20/10萬(wàn)×1.01=20.2/10萬(wàn),2017年的發(fā)病率為20/10萬(wàn)×1.0122=20.402/10萬(wàn),以此類(lèi)推。APC及其95%置信區(qū)間(95% confidence interval,95% CI)的計(jì)算公式為:
APC95%CI={exp(b1±s×td(q))-1}×100,q=1-α/2
其中,s表示擬合線性回歸方程斜率b1的標(biāo)準(zhǔn)誤,td(q)指自由度為d的t分布的第百分之q×100分位數(shù)。
當(dāng)對(duì)數(shù)化后的發(fā)病率或者死亡率隨時(shí)間呈線性關(guān)系時(shí),可用APC描述其變化趨勢(shì)。而當(dāng)該線性假定不滿足時(shí),觀察時(shí)間內(nèi)的非線性變化趨勢(shì)可采用分段回歸模型(segmented regression model or piecewise regression model)[2],計(jì)算分段年度變化百分比sAPC(annual percent change from segmented analysis)進(jìn)行描述。sAPC的基本思想是,將觀察期內(nèi)的非線性變化趨勢(shì)劃分為多個(gè)呈線性變化的子時(shí)間段,并分別采用線性模型刻畫(huà)。具體地,設(shè)觀察期內(nèi)有k個(gè)“趨勢(shì)轉(zhuǎn)折點(diǎn)”(trend transitions points),將整體變化趨勢(shì)劃分為k+1個(gè)子時(shí)間段。每個(gè)子時(shí)間段內(nèi)的變化速率認(rèn)為不變,而子時(shí)間段間的變化速率可以不同。在每個(gè)子時(shí)間段內(nèi)分別擬合對(duì)數(shù)化的目標(biāo)現(xiàn)象特征和時(shí)間的線性回歸模型,得到各個(gè)子時(shí)間段內(nèi)的sAPC,具體計(jì)算方法參見(jiàn)相關(guān)文獻(xiàn)[3]。sAPC在實(shí)際應(yīng)用中可能存在以下問(wèn)題:(1)無(wú)法用一個(gè)數(shù)值綜合描述一段固定長(zhǎng)觀察期內(nèi)(如10年、20年等)的總體變化趨勢(shì);(2)在比較不同性別、年齡段等亞組間的變化趨勢(shì)時(shí),不同亞組的趨勢(shì)轉(zhuǎn)折點(diǎn)個(gè)數(shù)及子時(shí)間區(qū)段不同,導(dǎo)致無(wú)法直接使用sAPC進(jìn)行組間比較。
鑒于sAPC存在的問(wèn)題,年均變化百分比AAPC被提出用于綜合描述觀察時(shí)間段內(nèi)的總體變化趨勢(shì),方便不同亞組間的趨勢(shì)比較。其基本思想為,首先基于分段回歸模型得到k+1個(gè)子時(shí)間段的變化速率bi(i=1,…,k+1),然后對(duì)bi加權(quán)求和得到一個(gè)綜合數(shù)值。各個(gè)bi對(duì)應(yīng)的權(quán)重Wi為各個(gè)子時(shí)間段長(zhǎng)度占總觀察期的百分比。
假設(shè)某現(xiàn)象對(duì)數(shù)化后的發(fā)生率ln(y)在時(shí)間段[a,b]內(nèi)呈非線性變化,使用分段回歸模型擬合后得到k個(gè)拐點(diǎn),也即k+1個(gè)變化速率恒定的子時(shí)間段,則AAPC及其95%CI的計(jì)算公式為:
-1}×100
用于兩組比較時(shí),可采用下式計(jì)算兩組AAPC差值A(chǔ)APC(1)-AAPC(2)的95%CI。其中,AAPC(1)表示組1(如男性人群)在觀察時(shí)期內(nèi)的AAPC值,AAPC(2)表示組2(如女性人群)在觀察時(shí)期內(nèi)的AAPC值。
APC、sAPC和AAPC三類(lèi)時(shí)間變化趨勢(shì)描述指標(biāo)的相對(duì)優(yōu)劣勢(shì)如表1所示?;诤?jiǎn)單線性回歸的APC計(jì)算簡(jiǎn)單,易于理解和解釋?zhuān)鋵?duì)線性變化趨勢(shì)假定的強(qiáng)依賴(lài)也客觀限制了其適用的問(wèn)題情境。而基于分段回歸模型的sAPC則能很好地解決這一問(wèn)題,通過(guò)引入趨勢(shì)轉(zhuǎn)折點(diǎn),將總體的非線性變化趨勢(shì)切分為若干個(gè)呈線性變化趨勢(shì)的子時(shí)間段并分別描述其平均變化百分比,如此即可為整體的非線性變化趨勢(shì)提供一個(gè)細(xì)致、全面的多區(qū)段變化趨勢(shì)描述。但sAPC不利于綜合把握觀察期間的總體變化趨勢(shì)。此外,由于分段回歸模型很可能在不同亞組中擬合出不同的時(shí)間轉(zhuǎn)折點(diǎn)和子時(shí)間段,故無(wú)法使用sAPC進(jìn)行亞組間變化趨勢(shì)的檢驗(yàn)和比較。AAPC是由各子時(shí)間段sAPC加權(quán)得到的綜合指標(biāo),既可描述觀察期內(nèi)的總體變化趨勢(shì),也可用于亞組間的趨勢(shì)比較[6],其實(shí)質(zhì)是各子時(shí)間段的年度變化率的幾何均數(shù),故被稱(chēng)為年均變化百分比[3]。值得注意的是,APC可看作AAPC的特例,若整個(gè)觀察期的變化速率恒定,AAPC可化簡(jiǎn)為sAPC或APC。由于AAPC對(duì)于子時(shí)間段的選取不敏感,在描述子時(shí)間段變化趨勢(shì)時(shí),也可利用整個(gè)觀察期的信息。
總體而言,AAPC相較于傳統(tǒng)的APC有以下三點(diǎn)顯著優(yōu)勢(shì):(1)AAPC無(wú)需線性趨勢(shì)假定,適用面更廣;(2)AAPC可用于亞組間共同觀察時(shí)間段內(nèi)的總體趨勢(shì)比較和檢驗(yàn);(3)當(dāng)AAPC描述被趨勢(shì)轉(zhuǎn)折點(diǎn)分割出子時(shí)間區(qū)段的變化趨勢(shì)時(shí),任意子時(shí)間段內(nèi)任意兩時(shí)點(diǎn)間的AAPC都相同(均等于該子時(shí)間段的sAPC),故其對(duì)子時(shí)間區(qū)段內(nèi)的子區(qū)間選取不敏感。計(jì)算AAPC需基于分段回歸模型,故AAPC描述子時(shí)間區(qū)段變化趨勢(shì)時(shí)可利用整個(gè)觀察期的信息。而傳統(tǒng)的APC只能使用該子區(qū)間的有限數(shù)據(jù)重新計(jì)算變化速率,故會(huì)對(duì)所選定的子區(qū)間比較敏感。綜上,在描述觀察期內(nèi)的總體變化趨勢(shì)時(shí)應(yīng)盡可能選用AAPC,若使用APC則應(yīng)注意其所需的線性假定是否滿足。當(dāng)我們對(duì)觀察期內(nèi)各時(shí)點(diǎn)的具體變化趨勢(shì)感興趣時(shí),可使用基于分段回歸模型的sAPC詳細(xì)刻畫(huà)。
表1 三類(lèi)時(shí)間變化趨勢(shì)描述指標(biāo)間的優(yōu)劣勢(shì)比較
AAPC和APC可由美國(guó)國(guó)家癌癥研究所開(kāi)發(fā)的Joinpoint軟件計(jì)算獲得[4]。用戶(hù)只需在官網(wǎng)(https://surveillance.cancer.gov/joinpoint/)簽署使用協(xié)議并完成注冊(cè)便可免費(fèi)下載安裝。該軟件分為桌面版和命令行版。桌面版適合習(xí)慣進(jìn)行界面點(diǎn)選操作的用戶(hù),命令行版則允許用戶(hù)編寫(xiě)代碼執(zhí)行批量分析任務(wù)。目前軟件的最新版本為Join point Regression Program,Version 4.8.0.1(Statistical Research and Applications Branch,National Cancer Institute)。
如下以鄭文龍等[5]報(bào)告的2006-2015年天津市宮頸癌死亡率數(shù)據(jù)(表2)為例,介紹如何使用桌面版Join point 4.8.0.1軟件計(jì)算APC和AAPC。
表2 2006-2015年天津市宮頸癌死亡率(/10萬(wàn))
首先將表2中數(shù)據(jù)整理成縱向格式,數(shù)據(jù)包括year(年份)、mortalityrate(死亡率(/10萬(wàn)))和grp(分組,1:城市,2:農(nóng)村;3:總體)三個(gè)變量,如圖1所示。需注意的是,原始數(shù)據(jù)需按照分組變量grp和時(shí)間變量year升序排列后,方可導(dǎo)入Joinpoint軟件,否則軟件會(huì)提示發(fā)生錯(cuò)誤。
圖1 可導(dǎo)入Joinpoint軟件數(shù)據(jù)格式舉例
Joinpoint軟件支持*.dic(Seer*Stat Dictionary)、*.csv、*.gz、*.txt、*.xls、*.xlsx等多種數(shù)據(jù)格式導(dǎo)入。打開(kāi)軟件后,在界面菜單欄點(diǎn)選“File”→“New Session”,隨后在彈出的界面中,選中目標(biāo)數(shù)據(jù)文件并點(diǎn)擊“打開(kāi)”,則可在新建的Joinpoint Session會(huì)話框中分別點(diǎn)選界面左上端的“Input File”、“Method and Parameters”和“Advanced Analysis Tools”設(shè)置數(shù)據(jù)導(dǎo)入和分析的參數(shù)。
首先在新建的Joinpoint Session會(huì)話框中的“Input File”界面(圖2)設(shè)置數(shù)據(jù)導(dǎo)入和模型基本參數(shù)。界面上半部分的數(shù)據(jù)導(dǎo)入?yún)?shù)通常保持默認(rèn)即可,下半部分的模型基本參數(shù)設(shè)置中,首先需在右側(cè)的“Independent Variable”下拉菜單欄中將時(shí)間變量year選入為分段回歸模型的自變量;然后,在左側(cè)的“Dependent Variable”欄目的“Type of Variable”下拉菜單中選中“Crude Rate”;設(shè)定“Crude Rate”對(duì)應(yīng)的變量為mortalityrate;隨后在左側(cè)底端的“Heteroscedastic Errors Option”下拉菜單欄中選中“Constant Variance(Homoscedasticity)”,設(shè)定回歸模型的隨機(jī)誤差項(xiàng)為同方差的。由于同方差假定在實(shí)踐中經(jīng)常無(wú)法滿足,故當(dāng)率的標(biāo)準(zhǔn)誤可獲取時(shí),最好選擇“Standard Error(Provided)”并將標(biāo)準(zhǔn)誤變量選入“Standard Error”下拉菜單,以允許軟件使用加權(quán)最小二乘法處理異方差問(wèn)題。本界面左下方的“Log Transformation”顯示,默認(rèn)會(huì)先對(duì)原始的死亡率進(jìn)行自然對(duì)數(shù)轉(zhuǎn)換后再擬合回歸模型。如此即完成了所擬合分段回歸模型的基本參數(shù)設(shè)定,最后在“By Variables”子界面下點(diǎn)擊“Add”選項(xiàng),將分組變量grp納入模型,允許軟件按grp變量分別擬合分段回歸模型以分析三組(城市、農(nóng)村以及總體人群)的死亡率變化趨勢(shì)。
圖2 Joinpoint Session會(huì)話框的“Input File”界面
在“Method and Parameters”界面可以詳細(xì)設(shè)置分析的方法和參數(shù),一般采用默認(rèn)設(shè)置即可。點(diǎn)選界面左下端的“AAPC Segment Ranges—Entire Range”并設(shè)定時(shí)間范圍即可計(jì)算該時(shí)段內(nèi)的AAPC。設(shè)置完畢即可點(diǎn)選軟件界面上端快捷方式欄中的“Execute Current Session”按鈕,運(yùn)行分析程序獲得結(jié)果。
軟件結(jié)果輸出界面如圖3所示,左側(cè)菜單欄顯示,界面中包含URBAN(城市)、RURAL(農(nóng)村)和TOTAL(總體)三個(gè)隊(duì)列的分析結(jié)果。每個(gè)隊(duì)列均擬合了兩個(gè)分段回歸模型,標(biāo)★號(hào)的為軟件推薦的擬合模型,城市組和農(nóng)村組因十年間的死亡率變化趨勢(shì)均較為穩(wěn)定,無(wú)明顯趨勢(shì)轉(zhuǎn)折,故軟件推薦采用“0 Joinpoints”模型,在總體人群中發(fā)現(xiàn)一個(gè)有意義的趨勢(shì)轉(zhuǎn)折點(diǎn),故軟件推薦采用“1 Joinpoints”模型。右側(cè)的“Graph”視圖圖形化展示了三組死亡率變化趨勢(shì)的擬合情況,可通過(guò)點(diǎn)選結(jié)果輸出界面左上角的“Filter Cohorts”按鈕下的“View Multiple Models Simultaneously”并多選左側(cè)菜單欄顯示的多組擬合曲線,使其展示在同一畫(huà)幅中。在軟件菜單欄“Output”—“Options”下可設(shè)置結(jié)果輸出界面各子界面的展示形式,在“Graph”下完善美化趨勢(shì)圖,詳細(xì)過(guò)程此處不贅。
擬合趨勢(shì)如圖3所顯示,城市組和農(nóng)村組2006-2015十年間的死亡率總體變化趨勢(shì)較為穩(wěn)定,無(wú)明顯的趨勢(shì)轉(zhuǎn)折點(diǎn),兩組APC分別為7.68%和12.74%。而總體人群的死亡率變化趨勢(shì)于2013年存在一個(gè)有意義的轉(zhuǎn)折點(diǎn),2006-2013年間的APC為7.03%,2013-2015年間的APC為29.94%。
圖3 Joinpoint軟件的圖形化分析結(jié)果
圖4展示了“Trends”子界面的結(jié)果,主要包括各組的APC、AAPC及其95%CI的上下限、檢驗(yàn)統(tǒng)計(jì)量和P值等詳情??梢钥闯?,2006-2015年間,城市、農(nóng)村和總體人群的宮頸癌死亡率AAPC為7.68%(4.39%,11.07%)、12.74%(5.85%,20.08%)和11.74%(4.40%,19.60%),P值均小于0.01,提示三組宮頸癌死亡率的年均變化趨勢(shì)有統(tǒng)計(jì)學(xué)意義。本實(shí)例中,由于城市組和農(nóng)村組十年間均無(wú)有意義的趨勢(shì)轉(zhuǎn)折點(diǎn),故此兩組AAPC和APC的點(diǎn)估計(jì)及95%CI一樣。
圖4 Joinpoint軟件的趨勢(shì)分析結(jié)果
本文簡(jiǎn)要介紹了APC、sAPC和AAPC三個(gè)指標(biāo)的基本原理及關(guān)聯(lián)關(guān)系,梳理比較了三者的優(yōu)劣勢(shì),給出了使用Joinpoint軟件進(jìn)行基礎(chǔ)趨勢(shì)分析的基本流程和參數(shù)設(shè)置,以期為醫(yī)療和公共衛(wèi)生研究者提供參考。實(shí)際研究中,APC和AAPC均得到較為廣泛的應(yīng)用,但許多文獻(xiàn)使用APC時(shí)并未充分報(bào)告指標(biāo)所需的線性假設(shè)是否滿足,可能存在較多方法誤用的情況。研究者應(yīng)重視各個(gè)指標(biāo)背后的前提假定,結(jié)合自己的實(shí)際問(wèn)題作出合理選擇。鑒于AAPC的顯著優(yōu)勢(shì),本文建議在實(shí)踐工作中優(yōu)先選用AAPC,如可能,可同時(shí)報(bào)告APC和AAPC的結(jié)果。限于篇幅,本文未介紹如何使用Joinpoint軟件進(jìn)行亞組間變化趨勢(shì)的檢驗(yàn)和比較,我們將另文介紹具體實(shí)現(xiàn)方法及注意事項(xiàng)。感興趣的讀者可以在Joinpoint軟件官網(wǎng),下載軟件的使用手冊(cè)研讀學(xué)習(xí)。用戶(hù)也可在官網(wǎng)上反饋Joinpoint軟件使用過(guò)程中遇到的問(wèn)題并尋求指導(dǎo)和幫助。