林歡 鐘文昭 楊學(xué)寧 嚴(yán)紅虹 吳一龍
大多數(shù)人類腫瘤和環(huán)境因素相關(guān),但同樣暴露于特定致癌物,卻僅部分人群發(fā)病。另外,某些腫瘤也有明顯的家族聚集現(xiàn)象。可見,除環(huán)境因素外,遺傳背景尤其是基因的多態(tài)性差異也是重要的決定因素。來自冰島等地的研究揭示,家族聚集可表現(xiàn)為不同類型腫瘤的聚集,提示存在共同的遺傳因素。例如,雌激素相關(guān)基因可能和經(jīng)產(chǎn)婦患乳腺癌與肺癌風(fēng)險(xiǎn)性增加存在交叉聯(lián)系[1-4]。瑞典的研究[5]揭示,吸煙可能導(dǎo)致胰腺癌與肺癌的家族聚集,而胰腺癌與乳腺癌的家族聚集可能與BRCA2的遺傳變異有關(guān)。本文通過對(duì)單位時(shí)間內(nèi)的肺癌患者連續(xù)性收集調(diào)查資料,進(jìn)行大樣本量遺傳流行病學(xué)調(diào)查,對(duì)肺癌患者的腫瘤家族聚集性進(jìn)行研究,并建立肺癌風(fēng)險(xiǎn)度預(yù)測(cè)模型,期望有助于高危人群的篩選和早期發(fā)現(xiàn)。
圖 1 病例組和對(duì)照組年齡分布圖Fig 1 The distribution of age in case arm and control arm
1.1 病例選擇 連續(xù)性收集2009年10月-2010年12月于廣東省肺癌研究所病理學(xué)確診的肺癌患者,并以其作為先證者,其所在家系確定為先證者家系,其一級(jí)親屬(被調(diào)查者的父母、子女及同胞)為家系成員。因肺癌先證者的子女發(fā)病率極低,與大部分年齡未到發(fā)病高峰期有關(guān),且絕大部分子女為先證者和配偶對(duì)照組的共同子女,因此統(tǒng)計(jì)時(shí)將子女從一級(jí)親屬范圍剔除。
1.2 對(duì)照選擇 對(duì)照組為肺癌先證者的配偶家系,納入研究的配偶無腫瘤史,與肺癌家系成員之間不存在任何血緣關(guān)系。由同一調(diào)查員采用相應(yīng)調(diào)查表記錄對(duì)照家系成員的一般情況及家系資料,另一調(diào)查員進(jìn)行復(fù)核。
1.3 材料收集 由調(diào)查員對(duì)初治的肺癌患者進(jìn)行面訪,在先證者本人或其親屬簽定知情同意書后,應(yīng)用統(tǒng)一的調(diào)查表,對(duì)肺癌先證者及其配偶進(jìn)行調(diào)查。調(diào)查表內(nèi)容包括性別、年齡分組、吸煙指數(shù)、肺部既往疾病史、居住環(huán)境、職業(yè)接觸、一級(jí)親屬腫瘤家族史和親屬的情況等。由最了解情況者作為問訊對(duì)象,提高可靠性。為了減少回憶偏倚,我們盡可能增加了樣本量,同時(shí)又讓調(diào)查對(duì)象對(duì)一些不確定情況通過電話咨詢的方式進(jìn)行證實(shí)。
1.4 統(tǒng)計(jì)分析 用EpiData 3.1軟件建立數(shù)據(jù)庫,應(yīng)用SPSS 17.0對(duì)先證者及其家系資料和對(duì)照資料進(jìn)行統(tǒng)計(jì)學(xué)分析。分類資料的比較采用卡方檢驗(yàn),如不滿足卡方檢驗(yàn)條件者采用Fisher Exact檢驗(yàn);計(jì)量資料的比較采用兩獨(dú)立樣本t檢驗(yàn)。所有統(tǒng)計(jì)均采用雙側(cè)檢驗(yàn),檢驗(yàn)水準(zhǔn)為0.05。Crude OR通過卡方檢驗(yàn)計(jì)算得出,Adjusted OR通過Logistic回歸分析得到。Logistic逐步回歸模型對(duì)因素的篩選條件為進(jìn)入標(biāo)準(zhǔn)P<0.05,剔除標(biāo)準(zhǔn)為P>0.10。
表 1 臨床流行病學(xué)資料比較Tab 1 Comparison of epidemiology data
2.1 均衡性檢驗(yàn) 先證者及對(duì)照組的籍貫屬于中國東部沿海的25個(gè)省或直轄市,廣東省內(nèi)患者來自廣東省21個(gè)地級(jí)市。兩者家系在年齡、地區(qū)、居住環(huán)境和一級(jí)親屬人數(shù)的比較,無統(tǒng)計(jì)學(xué)差異(表1)。先證者的肺癌分期采用UICC的TNM2009分期,其中I期患者96例,II期患者63例,III期患者157例,IV期患者317例。
2.2 先證者與配偶年齡分布 由圖1可見,先證者由52歲開始迅速上升,56歲左右達(dá)高峰,至80歲后迅速下降,大致呈單峰分布。而配偶的年齡分布大致與之匹配。
2.3 一級(jí)親屬患癌風(fēng)險(xiǎn) 由表2、表3可見,肺癌患者一級(jí)親屬的患癌風(fēng)險(xiǎn)性明顯高于對(duì)照組。家系患癌個(gè)數(shù)分別為0、1和≥2三組,有統(tǒng)計(jì)學(xué)差異,發(fā)病年齡分層分析顯示晚發(fā)肺癌差異較早發(fā)肺癌明顯,但早發(fā)肺癌樣本量相對(duì)較少。
2.4 肺癌風(fēng)險(xiǎn)度的判別預(yù)測(cè)模型 為控制混雜因素,提高預(yù)測(cè)準(zhǔn)確率,建立以性別(女、男)[6]、吸煙指數(shù)(0、<400和≥400)[7]、肺部既往疾病史(無、有)[8]、生活接觸史(無、有)[9]、職業(yè)接觸史(無、有)[10]等公認(rèn)的危險(xiǎn)因素和本研究證實(shí)的一級(jí)親屬患癌個(gè)數(shù)(0、1、≥2),年齡分組(<50歲、≥50歲)[11]等肺癌風(fēng)險(xiǎn)度影響因素為自變量(各變量的取值以第一種情況為0,余各情況依次遞增),是否為先證者為因變量建立二分類Logistic前進(jìn)法逐步回歸模型。最終保留在模型中的自變量為性別、吸煙指數(shù)、肺部既往疾病史、職業(yè)接觸史和一級(jí)親屬患癌個(gè)數(shù)(表4)。
表 2 先證者一級(jí)親屬患癌風(fēng)險(xiǎn)性Tab 2 Risk of cancer in first-degree relatives of proband
表 3 先證者的一級(jí)親屬患癌風(fēng)險(xiǎn)性(以年齡分層)Tab 3 Risk of cancer in first-degree relatives of Proband stratified by age
根據(jù)表4得到回歸函數(shù)logit(P)=-0.867+0.464*性別+0.135*吸煙指數(shù)1+1.545*吸煙指數(shù)2+1.689*肺部既往疾病史+0.470*職業(yè)接觸+0.436*一級(jí)親屬患癌個(gè)數(shù)1+0.957*一級(jí)親屬患癌個(gè)數(shù)2。
①模型用于預(yù)測(cè):由于病例對(duì)照研究的非條件Logistic回歸得不到常數(shù)項(xiàng)a′的估計(jì)值,不能直接用于預(yù)測(cè),需要對(duì)常數(shù)項(xiàng)進(jìn)行校正,即:
其中n1和n0分別為病例和對(duì)照的樣本含量,q1和q0為特定人群中發(fā)病和不發(fā)病的先驗(yàn)概率。以《中國腫瘤登記地區(qū)2006年腫瘤發(fā)病和死亡資料分析》中肺癌發(fā)病率49.7/10萬用于常數(shù)項(xiàng)的校正[12],然后再用調(diào)整后的α作為Logistic回歸方程的常數(shù)項(xiàng)計(jì)算預(yù)測(cè)的肺癌發(fā)病概率(表5)。
由表5可見,模型將本研究的病例組和對(duì)照組分為58個(gè)亞組,并列出與普通人群肺癌發(fā)病率比較得到的相對(duì)風(fēng)險(xiǎn)度。根據(jù)第四版流行病學(xué)教科書關(guān)于暴露與疾病聯(lián)系強(qiáng)度的描述,RR在1.0-1.1為無聯(lián)系,RR在1.2-1.4代表聯(lián)系強(qiáng)度為弱,RR為1.5-2.9代表聯(lián)系強(qiáng)度為中等,RR為3.0-9.0代表聯(lián)系強(qiáng)度為強(qiáng),RR≥10代表聯(lián)系強(qiáng)度為很強(qiáng)。表5中風(fēng)險(xiǎn)度為普通人群10倍以上的群體共13個(gè)亞組,該人群主要為重度吸煙的吸煙人群,在性別、肺部既往疾病史、職業(yè)接觸史和一級(jí)親屬腫瘤家族史中具備至少兩個(gè)以上陽性。
②模型用于判別以驗(yàn)證正確率(表6):根據(jù)估計(jì)概率進(jìn)行判別歸類,第一類為非肺癌(對(duì)照),第二類為肺癌(病例)。如果估計(jì)概率<0.5,則將其判定為第一類;如果估計(jì)概率>0.5,則將其判定為第二類;如果=0.5,暫不歸類。最后將結(jié)果與實(shí)際情況對(duì)照,得到模型的正確率。
③風(fēng)險(xiǎn)度為普通人群10倍以上的群體預(yù)測(cè)正確率(表7,表8) 由表7和表8可見,在該群體應(yīng)用本預(yù)測(cè)模型的正確率達(dá)到了88.1%,有良好的應(yīng)用價(jià)值。
表 4 預(yù)測(cè)模型的二分類Logistic回歸分析模型Tab 4 A binary Logistic regression analysis of forecasting model
吸煙是目前肺癌最重要的危險(xiǎn)因素。其它的危險(xiǎn)因素包括二手煙、生活接觸、職業(yè)暴露、HPV等病毒感染、空氣污染和結(jié)核等?;蛞赘行栽谀贻p肺癌中起到尤其重要的意義。
腫瘤二次打擊學(xué)說主要適用于有遺傳傾向的腫瘤,如視網(wǎng)膜母細(xì)胞瘤等,對(duì)應(yīng)的臨床特點(diǎn)為:早年發(fā)病、病灶雙側(cè)或多發(fā)和家族聚集傾向,其中家族史是最明顯的臨床特征。Xu等[13]收集了1,561例肺癌先證者的12,817例一級(jí)親屬的資料進(jìn)行分析,提示孟德爾衰減模型和共顯性模型均能容納肺癌的病因解釋,而當(dāng)把發(fā)病年齡分布納入模型時(shí),則發(fā)現(xiàn)多基因和環(huán)境因子的交互作用模型更符合總體人群的肺癌發(fā)病分布。
本研究為單位時(shí)間內(nèi)連續(xù)收集病例的大樣本量病例對(duì)照研究,地域分布均衡,具有人群普遍性。Ziogas等[14]研究表明,以人口登記為基礎(chǔ)的研究其家族史假陽性率較高,以臨床患者為基礎(chǔ)的研究比較可靠。本研究的調(diào)查對(duì)象為臨床患者,風(fēng)險(xiǎn)比為控制性別、年齡分組、肺部既往疾病史、吸煙指數(shù)、居住環(huán)境、職業(yè)接觸得到的調(diào)整OR,因此,與以人群為基礎(chǔ)的研究比較可信度較高。
美國肺癌遺傳流行病學(xué)聯(lián)盟2004年首次定位了和肺癌家系關(guān)聯(lián)的區(qū)域——染色體6q23-25,并發(fā)現(xiàn)隨著家系中癌癥成員的增加,易感基因與6號(hào)染色體上的遺傳標(biāo)記的連鎖相關(guān)性也增強(qiáng)[15]。本文發(fā)現(xiàn)在調(diào)整性別、年齡分組、肺部既往疾病史、吸煙指數(shù)、生活接觸和職業(yè)接觸后,肺癌患者一級(jí)親屬的患癌風(fēng)險(xiǎn)性明顯高于對(duì)照組,且家系患癌個(gè)數(shù)為1和≥2的兩個(gè)亞組均有統(tǒng)計(jì)學(xué)差異(OR=1.55, P=0.005; OR=2.65, P=0.002),結(jié)論與前述類似。這提示隨著家系中腫瘤患者的增加,體現(xiàn)的腫瘤遺傳易感性強(qiáng)度有增加的趨勢(shì),這也是將家系中一級(jí)親屬患癌個(gè)數(shù)列為腫瘤風(fēng)險(xiǎn)度因素之一的依據(jù)。另外,發(fā)病年齡分層分析顯示晚發(fā)肺癌差異較早發(fā)肺癌明顯,除早發(fā)肺癌例數(shù)相對(duì)較少的因素外,也可能與肺癌由低腫瘤易感性的遺傳多態(tài)性決定有關(guān)。
表 5 研究對(duì)象的肺癌發(fā)病概率預(yù)測(cè)及相對(duì)風(fēng)險(xiǎn)度Tab 5 Prediction of lung cancer morbidity and relative risk in the study objects
日本有一項(xiàng)大規(guī)模的前瞻性隊(duì)列研究JPHC研究[16]表明所有癌癥家族史與肺癌發(fā)病風(fēng)險(xiǎn)增加無關(guān)。作為前瞻性研究,其與本研究肺癌先證者一級(jí)親屬患癌風(fēng)險(xiǎn)性有高度統(tǒng)計(jì)學(xué)意義的結(jié)論相反。從肺癌與其它腫瘤的家族聚集現(xiàn)象證明有共同遺傳因素影響的眾多研究,以及肺癌發(fā)病的理論推斷,肺癌先證者的腫瘤家族史對(duì)肺癌風(fēng)險(xiǎn)性的提高應(yīng)有影響,但影響低于肺癌家族史。分析該研究的隨訪,發(fā)現(xiàn)該隊(duì)列研究入組132,972受試者,年齡40歲-69歲,隨訪102,255例,隨訪13年發(fā)現(xiàn)791例新發(fā)肺癌。在基線記錄資料后,追蹤新發(fā)肺癌患者資料而未更新腫瘤家族史資料。而本研究以臨床患者為目標(biāo)人群,即時(shí)記錄對(duì)應(yīng)的腫瘤家族史,目的性和時(shí)效性強(qiáng)。因此,JPHC研究的樣本量基數(shù)大,腫瘤家族史資料未更新,可能導(dǎo)致關(guān)聯(lián)關(guān)系被掩蓋。
表 6 預(yù)測(cè)模型效果檢驗(yàn)Tab 6 Classification tablea of forecasting model
表 8 預(yù)測(cè)模型中風(fēng)險(xiǎn)度為普通人群十倍以上的群體效果檢測(cè)Tab 8 Classification tablea of people whose degree of risk are more than ten times to the Chinese population in the forecasting model
表 7 風(fēng)險(xiǎn)度為普通人群十倍以上的群體預(yù)測(cè)情況Tab 7 Prediction of people whose degree of risk are more than ten times to the Chinese population
早期肺癌篩查國際行動(dòng)計(jì)劃(International Early Lung Cancer Action Program, I-ELCAP)此前的研究數(shù)據(jù)[17]表明,每年進(jìn)行低劑量CT篩查可檢查出I期肺癌,I期肺癌患者若立即進(jìn)行手術(shù)切除腫瘤,其10年生存率可達(dá)92%,而所有未治療的I期患者將在5年內(nèi)死亡。該研究表明低劑量CT篩查可增加早期肺癌的診斷率,從而使患者獲得較好的生存結(jié)果。但該篩查的假陽性率一直被詬病。美國國立衛(wèi)生研究院(National Institutes of Health,NIH)一項(xiàng)大樣本、長期隨機(jī)臨床研究[18]表明,對(duì)高危人群(吸煙或曾經(jīng)吸煙達(dá)每年30包以上,年齡55歲-74歲)進(jìn)行低劑量CT掃描篩查肺癌的假陽性率較高,常常因“錯(cuò)誤預(yù)警”導(dǎo)致不必要的檢查、活檢和手術(shù)。因此,建立肺癌風(fēng)險(xiǎn)度模型,綜合評(píng)估肺癌發(fā)病的各個(gè)危險(xiǎn)因素,找到真正的肺癌高危人群,是性價(jià)比最高的途徑。
本文針對(duì)吸煙指數(shù)、性別、年齡分組、一級(jí)親屬患癌個(gè)數(shù)、肺部既往疾病史、生活接觸史和職業(yè)接觸史,建立回歸模型,賦值后得到各亞組肺癌發(fā)病概率與人群相比的風(fēng)險(xiǎn)度在0.38-63.08的結(jié)論,準(zhǔn)確率為70.2%。這可能是因?yàn)樵诘惋L(fēng)險(xiǎn)的群體,暴露因素和疾病聯(lián)系的強(qiáng)度不大從而影響了預(yù)測(cè)效率。而在聯(lián)系強(qiáng)度為很強(qiáng)、風(fēng)險(xiǎn)度為普通人群10倍以上的群體,應(yīng)用本模型的預(yù)測(cè)準(zhǔn)確率為88.1%。特點(diǎn)為:有肺部既往疾病史的重度吸煙人群,加上男性、職業(yè)暴露和一級(jí)親屬腫瘤家族史三項(xiàng)中的任一項(xiàng);有肺部既往疾病史或重度吸煙的人群中,有職業(yè)暴露的男性且一級(jí)親屬有不少于兩位腫瘤患者。因此,建議風(fēng)險(xiǎn)度為人群10倍以上的高危人群可每年進(jìn)行低劑量CT篩查,可望提高篩查效能。但因病例組和對(duì)照組為配偶關(guān)系,生活環(huán)境基本相同,所以生活接觸史未保留在模型中,應(yīng)用時(shí)應(yīng)結(jié)合本因素綜合考慮。