許 人 石張鎮(zhèn) 張文龍 黃元平 朱曉雪 金 香 劉 蕊 孫延霞
(吉林大學第一醫(yī)院二部,吉林 長春 130031)
?
Logistic多元回歸和人工神經網絡在判斷進展期胃癌淋巴結轉移中的應用
許人石張鎮(zhèn)張文龍黃元平朱曉雪金香劉蕊孫延霞
(吉林大學第一醫(yī)院二部,吉林長春130031)
目的應用人工神經網絡及Logistic多元回歸分析方法建立術前判斷進展期胃癌淋巴結轉移的診斷模型。方法分析行手術切除的700例胃癌患者術前資料,對性別、發(fā)生部位、浸潤深度、病理類型等10項術前資料進行相關性分析,應用Logistic多元回歸和人工神經網絡建立術前判斷進展期胃癌淋巴結轉移的診斷模型。結果胃鏡下Borrmann分型、腫瘤發(fā)生部位、病理類型及浸潤深度4項因素對淋巴結轉移情況有統(tǒng)計學意義(P<0.01),稱為“危險變量”,而病史時間、首發(fā)癥狀、性別、年齡、吸煙史、飲酒史6項因素對淋巴結轉移情況無統(tǒng)計學意義(P>0.05)。Logistic回歸模型判斷進展期胃癌淋巴結轉移的準確率為69.3%,受試者工作特征(ROC)曲線下面積為0.771。根據4項“危險變量”建立的人工神經網絡模型ANN1判斷淋巴結轉移情況準確率為70.4%,ROC曲線下面積為0.796。全部術前資料建立的ANN2判斷淋巴結轉移情況準確率為75%,ROC曲線下面積為0.831。結論在術前資料判斷進展期胃癌淋巴結轉移情況的研究中,ANN診斷的準確率高于Logistic多元回歸分析模型,且術前資料越多,準確率越高,有望應用于臨床,幫助相關科室提高判斷淋巴結轉移的準確率。
進展期胃癌;淋巴結轉移;術前預測;人工神經網絡模型;Logistic多元回歸
進展期胃癌在我國所有胃癌中占92%~95%〔1〕。確定合理的術式及淋巴結清掃范圍、制定個體化治療方案是胃癌診治的焦點〔2,3〕。但患者術前資料多而復雜,單一因素很難確定胃癌分期,且資料相關性小,難以綜合評估并推測患者是否發(fā)生淋巴結轉移。本文采用人工神經網絡和Logistic多元回歸方法對進展期胃癌淋巴結轉移情況進行計量研究,探討術前資料與淋巴結轉移的相關性,提高診斷的準確率。
1.1一般資料2003年1月至2011年12月吉林大學第三臨床醫(yī)院行胃癌手術切除的700例進展期胃癌患者術前資料。其中男526例,女164例,年齡30~83歲,均行胃癌根治術+D1或D2淋巴結清掃術,術前未行任何抗腫瘤治療,術后病理均為進展期胃癌,并證實是否有淋巴結轉移。
1.2量化樣本數據集總結既往文獻報道的可能對進展期胃癌淋巴結轉移有影響的因素,選擇其中具有特征性的客觀指標,包括性別、吸煙史、飲酒史、首發(fā)癥狀、病史時間(<1年,1~2年,>2年)、發(fā)病年齡(30~50歲,51~70歲,>70歲)、腫瘤發(fā)生部位、浸潤深度、胃鏡下Borrmann分型、病理類型共10項。
1.3統(tǒng)計學方法應用SPSS17.0統(tǒng)計軟件進行χ2檢驗,Logistic多元回歸分析。
2.1單因素分析胃鏡下Borrmann分型、病理類型、腫瘤發(fā)生部位、浸潤深度4項因素在判斷淋巴結轉移方面,各組差異有統(tǒng)計學意義,是進展期胃癌淋巴結轉移的獨立影響因素,為“危險變量”。而性別、年齡、病史時間、吸煙史、飲酒史、首發(fā)癥狀,各組發(fā)生率差異無統(tǒng)計學意義。見表1。
2.2構建人工神經網絡模型ANN1自變量選擇4項“危險變量”,將所有樣本隨機按7∶2∶1的比例輸入訓練組、測試組及驗證組。訓練組用于訓練神經網絡;測試組為用于跟蹤訓練過程中的錯誤以防止超額訓練,對訓練好的網絡的泛化能力做出測試,以確定或肯定這個網絡;驗證組評估最終神經網絡。輸入層節(jié)點為17個,包括胃鏡下Borrmann分型、腫瘤發(fā)生部位、病理類型及浸潤深度;隱含層神經節(jié)點為5個(由經驗而定),采用雙曲正切傳遞函數;輸出層神經節(jié)點2個,為淋巴結轉移或無轉移,采用Softmax傳遞函數。建立的ANN1見圖1。應用ANN1對預測集樣本預測,正確判斷淋巴結有轉移的準確率為92.5%,正確判斷淋巴結無轉移的準確率為28.6%,總準確率為70.4%,受試者工作特征(ROC)曲線下面積為0.796。
輸入層節(jié)點為29個,包括性別、發(fā)病年齡、吸煙、鏡下Borrmann 分型等10項術前資料;隱含層神經節(jié)點為8個(由經驗而定),采用雙曲正切傳遞函數;輸出層神經節(jié)點2個,為淋巴結轉移或無轉移,采用Softmax傳遞函數,建立ANN2模型。應用ANN2對預測集樣本進行預測,正確判斷淋巴結有轉移的準確率為74.0%,正確判斷淋巴結無轉移的準確率為76.9%,總準確率為75.0%。預測淋巴結轉移的ROC曲線下面積為0.831。見圖1。
表1 胃癌淋巴結轉移影響因素的單因素分析(n)
圖1 ANN
2.3構建Logistic回歸模型Logistic多元回歸結果顯示:自變量“飲酒、病理類型、胃鏡下Borrmann 分型、浸潤深度”具有統(tǒng)計學差異(P<0.05);而性別、發(fā)病年齡、吸煙史、病史時間、首發(fā)癥狀、腫瘤發(fā)生部位差異無統(tǒng)計學意義(P>0.05),見表2。將10個自變量納入Logistic回歸分析,與進展期胃癌淋巴結轉移具有顯著相關性的變量按相關性由大至小順序依次為胃癌的浸潤深度、胃鏡下分型、病理類型、飲酒史。系統(tǒng)自動將篩選出的上述有統(tǒng)計學意義的4個變量帶入方程,隨機抽取部分病例驗證Logistic回歸模型預測進展期胃癌淋巴結轉移的情況,其準確率為69.3%,ROC曲線下面積為0.771。
表2 Logistic回歸分析結果
胃癌發(fā)病率和死亡率分別高達300.9/10萬和29.3/10萬。進展期胃癌具有發(fā)病率高、早期診斷率低、5年存活率低等特點〔4〕。術前判斷進展期胃癌淋巴結轉移情況十分重要。
Logistic回歸具有判別和預測功能,適用于定性及半定量的指標,具有限制條件少,資料要求相對低等優(yōu)點〔5〕。而人工神經網絡則模仿生物神經網絡的功能和結構建立數學模型〔6〕,具有很強的自適應、非線性特征,根據輸出和輸入因素間復雜的關系構建模型,能有效解決醫(yī)學復雜問題,并在醫(yī)學領域獲得了廣泛的應用〔7〕,可實現對疾病客觀的檢測和分類,提高疾病監(jiān)測和鑒別診斷有效率〔8,9〕,適用于大樣本、復雜樣本的統(tǒng)計。本文提示ANN1、ANN2判斷進展期胃癌淋巴結轉移的準確率優(yōu)于Logistic回歸模型,其訓練組、測試組及驗證組間數據動態(tài)轉換,相互校正,使準確率明顯提高;Logistic回歸模型可自動篩選出相關性大的指標作為“自變量”帶入方程構建模型,方便可行,易于推廣。上述兩個模型各有優(yōu)勢,可輔助相關專業(yè)醫(yī)生提高判斷淋巴結轉移的準確率。以后的研究將進一步擴大樣本數量、聯合影像學、腫瘤標志物等資料,完善該模型。上述模型能否對預后、療效等進一步判斷,還有待長期隨訪研究證實。
1郭丹陽,程文,周洋,等.胃窗超聲造影、多層螺旋CT及兩者聯合診斷胃癌的價值比較〔J〕.中國臨床醫(yī)學影像雜志,2012;23(11):789.
2呂瀟童,張軍.進展期胃癌的治療進展〔J〕.醫(yī)學綜述,2013;19(19):3513-4.
3Pasini F,Fraccon AP,de Manzoni G.The role of chemotherapy in metastatic gastric cancer〔J〕.Anticancer Res,2011;13(10):3543-54.
4趙敬柱,張汝鵬,王剛,等.進展期胃癌根治術后復發(fā)的預后分析〔J〕.中華胃腸外科雜志,2011;14(2):107-10.
5李建新,石張鎮(zhèn),郭賀,等.Logistic多元回歸和人工神經網絡在肺CT判斷肺癌病理分型中的應用〔J〕.中國實驗診斷學,2013;17(10):1800-3.
6張德豐,周靈,孫亞民,等.基于修剪技術分級學習的動態(tài)模糊神經網絡算法研究〔J〕.計算機應用研究,2011;28(1):124-30.
7王剛,林森森,姜新國,等.用于小細胞肺癌診斷的人工神經網絡模型〔J〕.中國衛(wèi)生統(tǒng)計,2013;30(2):257-8.
8Vallejo M,Isaza CV,Lopez JD.Artificial neural networks as an alternative to traditional fall detection methods〔J〕.Conf Proc IEEE Eng Med Biol Soc,2013;20(13):1648-9.
9白雪峰,王平瑜,吳擁軍.基于兩種判別模式的腫瘤標志物聯合檢測對肝癌輔助診斷的價值〔J〕.解放軍醫(yī)學雜志,2012;37(11):1019-20.
〔2014-11-16修回〕
(編輯苑云杰)
吉林省科技廳自然科學基金資助項目(No.201215069)
孫延霞(1965-),女,博士,碩士生導師,主要從事血液病、惡性腫瘤研究。
許人(1986-),女,碩士,醫(yī)師,主要從事腫瘤學研究。
R735.2
A
1005-9202(2016)16-3980-03;doi:10.3969/j.issn.1005-9202.2016.16.051