于長(zhǎng)春,曾昭成,金鑫玲,宋明媚,孫志偉,卜翠萍,王 靜,姜舒亞,施 科
巨細(xì)胞病毒(CMV)感染是人類常見的病毒感染,且多在嬰幼兒時(shí)期發(fā)病,引起多系統(tǒng)播散性疾病或單一器官損害,其中肺是最易受到感染的器官之一[1-3]。但由于嬰幼兒CMV性肺炎表現(xiàn)與其他病原體導(dǎo)致的喘息性支氣管(肺)炎相比無(wú)特異性,加之醫(yī)務(wù)人員對(duì)其認(rèn)識(shí)不足或重視程度不夠,往往被誤診為普通的喘息性支氣管(肺)炎,誤診率較高[4],從而導(dǎo)致抗生素和激素的濫用,對(duì)患兒的身體健康造成危害??焖佟?zhǔn)確地將巨細(xì)胞病毒性肺炎疑似患者從眾多的就診患者中篩查出來(lái)對(duì)該病的治療轉(zhuǎn)歸具有極其重要的意義。本研究運(yùn)用Logistic回歸與ROC曲線對(duì)所收集的病例數(shù)據(jù)進(jìn)行分析,建立診斷預(yù)測(cè)模型,為醫(yī)務(wù)人員有針對(duì)性的診斷CMV性肺炎提供有力的篩查手段。
1.1 一般資料 2011年9月—2012年4月某三級(jí)醫(yī)院兒科收治確診為CMV性肺炎和普通喘息性支氣管炎患兒共111例。其中CMV性肺炎(CMV性肺炎組)65例,男44例,女21例;年齡(0.76±0.41)歲;診斷標(biāo)準(zhǔn)依據(jù)中華醫(yī)學(xué)會(huì)兒科學(xué)分會(huì)感染學(xué)組最新公布的《兒童巨細(xì)胞病毒性疾病診斷和防治的建議》[5]。普通喘息性支氣管炎(普通喘息性支氣管炎組)46例,男 31例,女 15例;年齡(1.46±0.86)歲。
1.2 檢測(cè)方法 人CMV(HCMV)-IgG、HCMV-IgM測(cè)定采用膠體金標(biāo)免疫層析試驗(yàn),使用中山大學(xué)達(dá)安基因股份有限公司TORCH-IgG、TORCH-IgM試劑盒,操作過(guò)程嚴(yán)格按照試劑盒說(shuō)明書進(jìn)行。
1.3 統(tǒng)計(jì)學(xué)方法 應(yīng)用SPSS 13.0軟件進(jìn)行統(tǒng)計(jì)學(xué)處理。對(duì)定量指標(biāo)(年齡、HCMV-IgG、HCMVIgM)采用成組t檢驗(yàn)進(jìn)行比較,對(duì)定性指標(biāo)(性別、血常規(guī))采用卡方(χ2)檢驗(yàn)進(jìn)行比較。將差異有統(tǒng)計(jì)學(xué)意義的指標(biāo)運(yùn)用多因素Logistic回歸分析,以找出巨細(xì)胞病毒性肺炎的危險(xiǎn)因素與保護(hù)因素,利用ROC曲線對(duì)定量指標(biāo)的診斷價(jià)值進(jìn)行分析,確定截?cái)嘀?,?duì)樣本進(jìn)行預(yù)測(cè),并與實(shí)際診斷結(jié)果進(jìn)行對(duì)比,以評(píng)估預(yù)測(cè)的準(zhǔn)確度。兩曲線下面積的比較采用Z檢驗(yàn)[6]。α=0.05為檢驗(yàn)水準(zhǔn)。
2.1 兩組一般資料、HCMV-IgG、HCMV-IgM、血常規(guī)比較 兩組年齡、HCMV-IgG、HCMV-IgM、血紅蛋白、白細(xì)胞計(jì)數(shù)、淋巴細(xì)胞計(jì)數(shù)、血小板計(jì)數(shù)差異有統(tǒng)計(jì)學(xué)意義(P<0.01),見表1。
表1 兩組一般資料、HCMV-IgG、HCMV-IgM、血常規(guī)比較結(jié)果
2.2 危險(xiǎn)因素分析 經(jīng)多因素Logistic回歸分析,共有3個(gè)定量指標(biāo)進(jìn)入最終的模型,具體結(jié)果見表2。
2.3 ROC曲線分析 以普通喘息性支氣管炎組作為對(duì)照,對(duì)血紅蛋白、淋巴細(xì)胞計(jì)數(shù)、血小板計(jì)數(shù)3個(gè)指標(biāo)繪制ROC曲線并確定截?cái)嘀?,見?、表4和圖1。
表2 兒童巨細(xì)胞病毒性肺炎臨床篩查多元Logistic回歸分析結(jié)果
表3 3個(gè)檢測(cè)指標(biāo)的曲線下面積比較
表4 3個(gè)檢測(cè)指標(biāo)的靈敏度、特異度和診斷符合率比較(%)
圖1 血紅蛋白、淋巴細(xì)胞計(jì)數(shù)、血小板計(jì)數(shù)的ROC曲線
對(duì)3個(gè)指標(biāo)曲線下的面積采用Z檢驗(yàn)進(jìn)行兩兩比較,結(jié)果顯示差異均無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),利用3個(gè)指標(biāo)組成的Logistic回歸模型P=1/[1+e-(7.031-0.103血紅蛋白 +0.298 淋巴細(xì)胞計(jì)數(shù)+0.011血小板計(jì)數(shù))]對(duì)樣本進(jìn)行回代,若P≥0.5則判斷為CMV性肺炎,若P<0.5則判斷為普通喘息性支氣管炎,得到的綜合預(yù)測(cè)模型的靈敏度為83.08%,特異度為 76.09%,診斷符合率為80.18%。
HCMV感染呈世界性分布,在人群中廣為傳播,是引起先天性及圍生期病毒感染最常見的病原之一。HCMV的細(xì)胞和組織嗜性非常廣泛,任何器官都有可能受到HCMV感染,可累及多臟器、多系統(tǒng),且患者年齡越小,發(fā)病率越高,臨床后果越嚴(yán)重。在嬰幼兒中CMV感染以肺炎較為常見,但由于患病嬰幼兒的臨床表現(xiàn)不具特異性,往往被誤診為普通的喘息性支氣管炎、支原體肺炎、軍團(tuán)菌肺炎、肺結(jié)核[7]等。將HCMV肺炎疑似患者從眾多的就診患者中篩查出來(lái),再進(jìn)行CMV特異性指標(biāo)檢測(cè)加以確診,這樣不僅可以降低醫(yī)務(wù)人員的工作負(fù)荷,而且可以有效降低就診人群中CMV性肺炎的漏診和誤診率。機(jī)器學(xué)習(xí)是近年來(lái)逐漸興起的重要的數(shù)據(jù)挖掘工具,通過(guò)對(duì)大量數(shù)據(jù)的分析尋找出有價(jià)值的信息,為實(shí)踐活動(dòng)提供決策支持,在眾多領(lǐng)域得到了廣泛應(yīng)用。在醫(yī)學(xué)領(lǐng)域,利用收集的患者資料建立診斷預(yù)測(cè)系統(tǒng)是近年來(lái)興起的一種嶄新的研究手段,目前正得到越來(lái)越多的應(yīng)用,如圖像識(shí)別、疾病輔助診斷、疾病風(fēng)險(xiǎn)預(yù)測(cè)、生存期預(yù)測(cè)等[8-13],收到了較好的效果。通過(guò)中國(guó)知網(wǎng)期刊數(shù)據(jù)庫(kù)檢索1994—2012年發(fā)表的中文文獻(xiàn),未見有將機(jī)器學(xué)習(xí)用于兒童巨細(xì)胞病毒性肺炎篩查的相關(guān)報(bào)道,在PubMed上利用“機(jī)器學(xué)習(xí)(machine learnin)”、“巨細(xì)胞病毒(cytomegalovirus)”和“肺炎(pneumonia)”進(jìn)行檢索,結(jié)果顯示有將機(jī)器學(xué)習(xí)用于分子生物學(xué)研究、肺結(jié)核的輔助診斷、指導(dǎo)老年人下呼吸道感染的抗生素治療、預(yù)測(cè)肺炎患者經(jīng)過(guò)治療后的狀態(tài)、預(yù)測(cè)患者腎移植術(shù)后發(fā)生CMV性疾病的風(fēng)險(xiǎn)等報(bào)道[14-20],但未見將機(jī)器學(xué)習(xí)用于CMV性肺炎篩查的有關(guān)研究。探討機(jī)器學(xué)習(xí)用于CMV性肺炎的篩查和輔助診斷,對(duì)于提高醫(yī)務(wù)人員的診斷水平、減少CMV性肺炎的漏診和誤診具有十分積極的實(shí)際意義。
本研究采用多元Logistic回歸進(jìn)行因素篩選,得到血紅蛋白、淋巴細(xì)胞計(jì)數(shù)、血小板計(jì)數(shù)3個(gè)對(duì)巨細(xì)胞病毒性肺炎發(fā)生影響有統(tǒng)計(jì)學(xué)意義的指標(biāo)。三者的曲線下面積均在0.75以上,說(shuō)明用于篩查CMV性肺炎的診斷準(zhǔn)確性較高,從繪制出的ROC曲線可以看出,代表淋巴細(xì)胞計(jì)數(shù)和血小板計(jì)數(shù)的兩條曲線位于對(duì)角線上方,而代表血紅蛋白的曲線位于對(duì)角線下方,說(shuō)明前兩項(xiàng)指標(biāo)和后一項(xiàng)指標(biāo)對(duì)CMV性肺炎影響的作用方向是相反的,這與所建立的Logistic回歸模型中變量系數(shù)的正負(fù)號(hào)相一致,臨床觀察到CMV性肺炎患兒血紅蛋白降低、淋巴細(xì)胞計(jì)數(shù)和血小板計(jì)數(shù)升高的現(xiàn)象也印證了這一結(jié)果。從OR值的大小可以看出,淋巴細(xì)胞計(jì)數(shù)和血小板計(jì)數(shù)的OR值均>1,說(shuō)明二者是CMV性肺炎的危險(xiǎn)因素,血紅蛋白的OR值<1,提示該指標(biāo)是CMV性肺炎的保護(hù)因素。通過(guò)ROC曲線確定了各指標(biāo)的截?cái)嘀担謩e為血紅蛋白118.5 g/L、淋巴細(xì)胞計(jì)數(shù)4.61×109/L、血小板計(jì)數(shù)257×109/L,根據(jù)這3 個(gè)檢測(cè)指標(biāo)的數(shù)值大小可以獨(dú)立對(duì)患者發(fā)生CMV性肺炎的風(fēng)險(xiǎn)進(jìn)行評(píng)估,但診斷性能分析結(jié)果顯示獨(dú)立指標(biāo)預(yù)測(cè)均存在特異度偏低即誤診率偏高的問(wèn)題,三者組成的Logistic回歸綜合預(yù)測(cè)模型則較好地克服了這一問(wèn)題,預(yù)測(cè)結(jié)果較為理想。對(duì)預(yù)測(cè)患病風(fēng)險(xiǎn)高的人群再通過(guò)CMV特異性指標(biāo)檢測(cè)進(jìn)一步確診,這樣不僅降低了醫(yī)務(wù)人員的工作量,同時(shí)縮小了需要確診檢測(cè)的人群比例,在不增加患者經(jīng)濟(jì)負(fù)擔(dān)的情況下,提高了CMV性肺炎的人群檢出率。
利用統(tǒng)計(jì)學(xué)方法建立的預(yù)測(cè)模型是根據(jù)患者相關(guān)指標(biāo)大小對(duì)診斷結(jié)果進(jìn)行概率推斷,是近年來(lái)興起的一種重要的輔助診斷工具,減少了主觀經(jīng)驗(yàn)判斷的偏差,符合現(xiàn)代循證醫(yī)學(xué)理念,且臨床操作簡(jiǎn)便,有利于大規(guī)模推廣。其計(jì)算原理是建立在概率論的基礎(chǔ)上,因此其結(jié)論是概率性的,只能作為診斷疾病的佐證,并不能代替必要的確診性檢查,但是隨著臨床研究的不斷深入,病例數(shù)量的逐漸增加,所建立的預(yù)測(cè)模型不斷完善,預(yù)測(cè)結(jié)果的準(zhǔn)確性將越來(lái)越高,對(duì)臨床工作的指導(dǎo)意義將更大。
[1]劉麗,魯繼榮.嬰幼兒巨細(xì)胞病毒性肺炎49例臨床分析[J].臨床兒科雜志,2007,25(7):544-546.
[2]Iizuka T,Sakai F,Suzuki N,et al.Neuronal hyperexcitability in stroke-like episodes of MELAS syndrome[J].Neurology,2002,59(6):816-824.
[3]de Lonlay Debeney P,von Kleist Retzow J C,Hertz-Pannier L,et al.Cerebral white matter disease in children may be caused by mitochondrial respiratory chain deficiency[J].J Pediatr,2000,136(2):209-214.
[4]嚴(yán)清華,藺增榕,林世江.嬰幼兒巨細(xì)胞病毒感染31例臨床分析[J].中華全科醫(yī)學(xué),2008,6(12):1235-1236.
[5]中華醫(yī)學(xué)會(huì)兒科學(xué)分會(huì)感染學(xué)組,全國(guó)兒科臨床病毒感染協(xié)作組,《中華兒科雜志》編輯委員會(huì).兒童巨細(xì)胞病毒性疾病診斷和治療的建議[J].中華兒科雜志,2012,50(4):290-292.
[6]Hanley J A,McNeil B J.A method of comparing the areas under receiver operating characteristic curves derived from the same cases[J].Radiology,1983,148(3):839-843.
[7]高韋娟,陳雅蘭,胡艷艷,等.嬰幼兒巨細(xì)胞病毒肺炎臨床分析[J].疑難病雜志,2009,8(9):561-562.
[8]謝華,夏順仁,張贊超.醫(yī)學(xué)圖像識(shí)別中多分類器融合方法的研究進(jìn)展[J].國(guó)際生物醫(yī)學(xué)工程雜志,2006,29(3):152-157.
[9]Di Luca M,Grossi E,Borroni B,et al.Artificial neural networks allow the use of simultaneous measurements of Alzheimer Disease markers for early detection of the disease[J].J Transl Med,2005,3(30):1479-5876.
[10]Srinivasan V,Eswaran C,Sriraam N.Artificial neural network based epileptic detection using time-domain and frequency domain feature[J].J Med Syst,2005,29(6):647-660.
[11]徐繼承,李磊,劉桂紅,等.人工神經(jīng)網(wǎng)絡(luò)建立食管癌發(fā)病預(yù)測(cè)模型的比較研究[J].現(xiàn)代預(yù)防醫(yī)學(xué),2011,38(17):3408-3410.
[12]Acir N,Oztura I,Kuntalp M,et al.Automatic detection of epileptiform events in EEG by a three-stage procedure based on artificial neural networks[J].IEEE Trans Biomed Eng,2005,52(1):30-40.
[13]劉剛,柳紅,劉藝萍,等.人工神經(jīng)網(wǎng)絡(luò)在大腸癌患者術(shù)后5年生存期預(yù)測(cè)中的應(yīng)用[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2010,27(3):240-242.
[14]Huang J C,Jojic N.Modeling major histocompatibility complex binding by nonparametric averaging of multiple predictors and sequence encodings[J].J Immunol Methods,2011,374(1-2):35-42.
[15]Ladanyi A,Sher A C,Herlitz A,et al.Automatic detection of immunofluorescently labeled cytomegalovirus-infected cells in isolated peripheral blood leukocytes using decision tree analysis[J].Cytometry A,2004,58(2):147-156.
[16]Er O,Temurtas F,Tanrikulu A C.Tuberculosis Disease Diagnosis Using Artificial Neural Networks[J].J Med Syst,2010,34(3):299-302.
[17]Gueli N,Martinez A,Verrusio W,et al.Empirical antibiotic therapy(ABT)of lower respiratory tract infections(LRTI)in the elderly:application of artificial neural network(ANN).Preliminary results[J].Archives of Gerontology and Geriatrics,2012,55(2):499-503.
[18]Papageorgiou E I,F(xiàn)roelich W.Application of evolutionary fuzzy cognitive maps for prediction of pulmonary infections[J].IEEE Trans Inf Technol Biomed,2012,16(1):143-149.
[19]Sheppard D,McPhee D,Darke C,et al.Predicting cytomegalovirus disease after renal transplantation:an artificial neural network approach[J].Int J Med Inform,1999,54(1):55-76.
[20]曾文彤,葉青,羅光華,等.動(dòng)態(tài)檢測(cè)血漿CMV DNA載量在預(yù)測(cè)腎移植術(shù)后并發(fā)巨細(xì)胞病毒肺炎中的意義[J].中華泌尿外科雜志,2005,26(8):525-528.