徐州醫(yī)科大學(xué)公共衛(wèi)生學(xué)院(221004) 劉 兵 李 蘋 朱玫燁 黃水平
胃癌是危害人類健康的消化道惡性腫瘤之一,世界胃癌的高發(fā)地區(qū)為亞洲,我國胃癌的年新發(fā)病率占世界總發(fā)病率的42%[1],且胃癌患者的生存率較低[2]。由于胃癌的發(fā)生發(fā)展受多方面因素的影響[3],故影響胃癌預(yù)后的因素逐漸成為研究的重點(diǎn)。傳統(tǒng)的影響因素分析多是采用了logistic回歸分析,該分析方法作為分析影響因素有效的統(tǒng)計(jì)學(xué)方法,有效的展現(xiàn)了因變量和自變量之間的數(shù)量依存關(guān)系,同時(shí)考慮自變量是否對因變量構(gòu)成交互作用,但當(dāng)自變量較多時(shí),回歸模型中要考慮交互作用很難真正實(shí)現(xiàn)。決策樹模型已經(jīng)廣泛應(yīng)用于經(jīng)濟(jì)領(lǐng)域[4-5]。針對傳統(tǒng)的回歸模型的局限性,決策樹模型能有效的解決,本文將決策樹模型應(yīng)用于流行病學(xué)資料,比較并結(jié)合logistic回歸分析的結(jié)果,以期望更好的對胃癌高危人群實(shí)施干預(yù),提高胃癌高危人群的生存率。
1.研究對象
干預(yù)對象為2012年6月至2015年6月課題組前期人工神經(jīng)網(wǎng)絡(luò)模型篩查出的胃癌高危人群,共111名病例[6]。納入標(biāo)準(zhǔn)為:①35~75歲的當(dāng)?shù)爻W【用瘢谧栽竻⒓游哥R復(fù)檢者;排除標(biāo)準(zhǔn)為:①確診的胃癌患者,②妊娠期婦女,③嚴(yán)重智障或語言交流障礙者,④患有胃鏡禁忌癥者,嚴(yán)重感冒、心臟疾病等。
2.研究方法
(1)資料收集
胃鏡初次檢查及檢查結(jié)束6個(gè)月后分別進(jìn)行干預(yù)前和干預(yù)后的問卷調(diào)查。對于未參與復(fù)查者采用電話訪問的方式進(jìn)行評估。調(diào)查問卷采用本課題前期臨床病例對照研究所制定的調(diào)查表,調(diào)查內(nèi)容主要包括基本情況,飲食習(xí)慣,生活狀況及健康檢查等,以胃鏡檢查結(jié)果情況改變?yōu)橐蜃兞?1好轉(zhuǎn),2無效)。
(2)建立決策樹模型
將影響胃癌高危人群干預(yù)效果的影響因素進(jìn)行CHAID算法分析,分類規(guī)則:分割顯著性水準(zhǔn)αmerge=αsplit=0.05;決策樹生長層數(shù)為3層,停止規(guī)則為α=0.05,母節(jié)點(diǎn)最小樣本量為50,子節(jié)點(diǎn)為10。
(3)建立logistic回歸模型
將影響胃癌高危人群干預(yù)效果的影響因素采用Forward Stepwise(Wald)方法建立非條件logistic回歸模型。
3.統(tǒng)計(jì)學(xué)處理
采用EpiData 3.1進(jìn)行調(diào)查表資料的雙份錄入,建立數(shù)據(jù)庫。用構(gòu)成比、率描述數(shù)據(jù)。采用卡方分析、秩和檢驗(yàn)進(jìn)行單因素分析,對于有統(tǒng)計(jì)學(xué)意義的自變量分別建立CHAID決策樹模型和logistic回歸模型,分析并比較兩種方法的分析結(jié)果,檢驗(yàn)水準(zhǔn)α=0.05。
1.基本情況
本次評價(jià)共調(diào)查111例胃癌高危病例,男性50例(45.05%),女性61例(54.95%),平均年齡為(54.96±9.88)歲。
2.影響胃癌高危人群干預(yù)效果的單因素分析
以胃鏡檢查結(jié)果改變情況為因變量(好轉(zhuǎn),無效)進(jìn)行單因素分析,結(jié)果表明:年齡、健康教育頻率、三餐情況、燒烤類食物攝入頻率、是否喜歡食用蘿卜、是否經(jīng)常生氣、幽門螺旋桿菌(HP)感染轉(zhuǎn)歸情況等因素有統(tǒng)計(jì)學(xué)意義,見表1。
表1 單因素分析結(jié)果
續(xù)表1 單因素分析結(jié)果
3.影響胃癌高危人群干預(yù)效果的多因素logistic回歸分析
將單因素分析有統(tǒng)計(jì)學(xué)意義的變量進(jìn)行二分類非條件logistic回歸分析,變量賦值見表2。結(jié)果顯示:健康教育頻率、三餐情況、是否喜歡食用蘿卜、HP感染轉(zhuǎn)歸情況等變量有統(tǒng)計(jì)學(xué)意義,經(jīng)常參加健康教育、喜歡食用蘿卜是干預(yù)效果的保護(hù)因素,三餐情況不規(guī)律、HP感染轉(zhuǎn)歸情況加重為危險(xiǎn)因素,見表3。Hosmer & Lemeshow檢驗(yàn)χ2=5.629,P=0.689, 說明模型能夠較好地?cái)M合數(shù)據(jù)。
表2 變量賦值表
表3 多因素logistic回歸分析結(jié)果
4.CHAID決策樹模型分析影響胃癌高危人群干預(yù)效果的因素
按照上述設(shè)置的參數(shù),產(chǎn)生的終末結(jié)點(diǎn)規(guī)則見表4。模型的判斷準(zhǔn)確率80.2%,說明所建立模型的預(yù)測準(zhǔn)確率較高。在入選的7個(gè)變量中,HP感染轉(zhuǎn)歸情況、是否喜歡食用蘿卜、三餐情況是決策樹中影響胃癌高危人群干預(yù)效果的變量。劃分第一層為HP感染轉(zhuǎn)歸情況,表明HP感染轉(zhuǎn)歸情況與干預(yù)效果的相關(guān)性最高,在HP感染轉(zhuǎn)歸好轉(zhuǎn)的高危人群的干預(yù)效果好轉(zhuǎn)占70%,干預(yù)無效的占30%。在HP感染轉(zhuǎn)歸無效和加重的高危人群中,喜歡食用胡蘿卜的高危人群的干預(yù)好轉(zhuǎn)占64.3%,干預(yù)無效占35.7%,三餐規(guī)律的不喜歡食用蘿卜的高危人群干預(yù)好轉(zhuǎn)占19.6%,干預(yù)無效占80.4%,而三餐不規(guī)律和偶爾的高危人群的干預(yù)效果好轉(zhuǎn)為0.0%,干預(yù)無效達(dá)到100.0%,見圖1。該模型估計(jì)風(fēng)險(xiǎn)為0.198,標(biāo)準(zhǔn)誤為0.038。
5.兩種模型分析結(jié)果的比較
兩種模型的分析結(jié)果顯示,年齡、燒烤類食物、是否經(jīng)常生氣在兩方法中均被排除,均顯示此三種因素均不是胃癌高危人群干預(yù)效果的影響因素。logistic回歸模型中的影響因素包括健康教育頻率,然而在決策樹模型中被剔除。展現(xiàn)了兩模型的不同之處,從兩方法的不同結(jié)果可知,logistic回歸模型表達(dá)了變量的依存關(guān)系,而決策樹考慮到了變量間的交互及關(guān)系,詳細(xì)的顯示出變量在各亞類中的作用形式,提供了豐富的信息。
表4 干預(yù)效果影響因素的分類規(guī)則(%)
圖1
CHAID決策樹模型與logistic回歸模型對干預(yù)效果的評價(jià)效能比較,CHAID模型評價(jià)預(yù)后好轉(zhuǎn)的AUC為0.814(95%CI0.730~0.898),靈敏度為85.7%,特異度為67.6%,logistic回歸模型評價(jià)預(yù)后好轉(zhuǎn)的AUC為0.849(95%CI0.771~0.927),靈敏度為76.%,特異度為76.5%,兩模型曲線下面積接近,說明兩者的評價(jià)效能相近,且決策樹模型靈敏度較高,logistic回歸模型的特異度較高,二者結(jié)合,將更加有助于找出影響干預(yù)效果的因素。
綜合兩模型的分析結(jié)果顯示,健康教育頻率、三餐情況、是否喜歡食用蘿卜、HP感染轉(zhuǎn)歸情況是胃癌高危人群胃病干預(yù)效果的影響因素,其中經(jīng)常參加健康教育以及喜歡食用蘿卜是胃癌干預(yù)效果的保護(hù)因素,三餐情況不規(guī)律以及HP感染轉(zhuǎn)歸情況加重是胃癌干預(yù)效果的危險(xiǎn)因素。
1.保護(hù)因素
經(jīng)常參加健康教育是胃癌高危人群胃癌干預(yù)效果的保護(hù)因素[7],參加健康教育人群可以對自身的疾病有更清醒的認(rèn)識,對于某些危害自身健康的不良生活方式、飲食習(xí)慣等,通過不斷的認(rèn)知學(xué)習(xí),可以有效的控制生活中這種不良行為的發(fā)生。本研究還注意到,喜歡食用蘿卜是胃癌高危人群胃癌干預(yù)效果的保護(hù)因素[8],是因?yàn)樘}卜中的β-胡蘿卜素,在體內(nèi)經(jīng)過代謝轉(zhuǎn)化,產(chǎn)生了增強(qiáng)機(jī)體免疫功能的維生素A,在預(yù)防上皮細(xì)胞癌變的過程中具有重要作用。
2.危險(xiǎn)因素
三餐情況不規(guī)律為胃癌干預(yù)效果的危險(xiǎn)因素[9],主要由于不規(guī)律、暴飲暴食等會加重胃的負(fù)擔(dān),引起胃酸的分泌紊亂,從而會影響胃黏膜,進(jìn)而加重胃部疾病。Correa等[10]在哥倫比亞的胃癌高發(fā)區(qū)進(jìn)行的一項(xiàng)852例HP感染的隨機(jī)對照干預(yù)研究在隨訪6年后發(fā)現(xiàn),根除HP后萎縮性胃炎和腸化生好轉(zhuǎn)的比例明顯增加,與對照組形成鮮明的對比;呂賓[11]對胃竇部萎縮患者隨訪三年后,發(fā)現(xiàn)HP根除者胃竇部萎縮評分明顯下降,而未進(jìn)行HP根除的對照組其評分并無明顯變化。我們的研究也表明,治療HP可以有效防止胃病的發(fā)生和發(fā)展。
3.決策樹模型和logistic回歸模型
研究顯示,CHAID決策樹模型清晰的指出了各因素間的相互作用關(guān)系,具體的分析說明了某因素在各亞群中是否有意義。比如不喜歡食用蘿卜在HP感染轉(zhuǎn)歸情況無效或加重中是干預(yù)效果的影響因素,而在HP感染轉(zhuǎn)歸情況好轉(zhuǎn)中沒有意義。還可以清晰的說明HP感染轉(zhuǎn)歸情況好轉(zhuǎn)的人干預(yù)好轉(zhuǎn)的發(fā)生率最高,提示HP感染轉(zhuǎn)歸情況是影響干預(yù)效果的最重要的因素。同時(shí),logistic回歸分析結(jié)果充分的展現(xiàn)了自變量與因變量的數(shù)量依存關(guān)系,在自變量對因變量變化關(guān)系方面的信息都比決策樹模型要充分,但是在交互作用方面的效果不如決策樹模型。因此,本研究認(rèn)為,在影響因素分析中,應(yīng)該注重將二者結(jié)合,充分發(fā)揮兩種模型的優(yōu)越性。
[1] 鄒文斌,李兆申.中國胃癌發(fā)病率及死亡率研究進(jìn)展.中國實(shí)用內(nèi)科雜志,2014,34(4):408-415.
[2] 于穎彥.胃癌的病理分型與預(yù)后.外科理論與實(shí)踐,2011,16(3):240-243.
[3] 樊海軍.我院1996-2010年胃癌手術(shù)預(yù)后分析.中國衛(wèi)生統(tǒng)計(jì),2013,30(2):289.
[4] 馬瑾,孫穎,劉尚輝.決策樹模型在住院2型糖尿病患者死因預(yù)測中的應(yīng)用.中國衛(wèi)生統(tǒng)計(jì),2013,30(3):422-423.
[5] 伍剛,許國宇,劉廣韜,等.決策樹模型與logistic回歸模型在腦出血預(yù)后分析中的應(yīng)用.解放軍醫(yī)學(xué)雜志,2015,40(12):1003-1006.
[6] 王慧,黃水平,李海朋.蘇北農(nóng)民胃癌主要影響因素及防治知識現(xiàn)狀.現(xiàn)代預(yù)防醫(yī)學(xué),2013,40(23):4362-4365.
[7] 楊宇紅,趙宜良,張濤,等.胃癌根治術(shù)后心理及飲食干預(yù)對患者生活質(zhì)量和復(fù)發(fā)等預(yù)后因素的影響.中國腫瘤臨床與康復(fù),2007,14(1):82-84.
[8] 朱舜時(shí),Joel Mason,施堯.葉酸對胃癌和其他胃腸道癌發(fā)生的干預(yù)作用-臨床試驗(yàn)七年隨訪.胃腸病學(xué),2002,7(2):73-78.
[9] 應(yīng)敏剛,周衍,肖景榕,等.福建省胃癌高低發(fā)地區(qū)居民飲食習(xí)慣與營養(yǎng)狀況的調(diào)查分析.中華腫瘤防治雜志,2008,15(23):1776-1779.
[10]Correa P,Fontham E,Bravo J,et al.Chemoprevention of gastric dysplasia:randomized trial of antioxidant supplements and anti-helicobacter pylori therapy.Jnci Journal of the National Cancer Institute,2001,92(23):1881-1888.
[11]呂賓,王慧萍,陳明濤,等.根除幽門螺桿菌對胃黏膜萎縮和腸化影響的隨訪研究.中華內(nèi)科雜志,2004,43(4):62-64.