吳貽怡,肖 湘,羅 瓊
(桂林市人民醫(yī)院超聲科,廣西桂林 541000)
先天性心臟病(簡稱先心病)是臨床上常見的一種兒科疾病,也是胎兒多種先天性發(fā)育畸形中較為常見的一種,據(jù)相關統(tǒng)計,在活產(chǎn)新生兒中,先心病的發(fā)病率為3%~8%[1]。不僅對其生命健康產(chǎn)生嚴重威脅,也對患兒家庭造成了巨大影響。隨著醫(yī)學超聲診斷設備的不斷進步,醫(yī)療設備的不斷改善,產(chǎn)前檢查技術不斷提高,使得能夠在妊娠期便給予有效措施進行干預成為可能,這可使神經(jīng)管缺損、發(fā)育異常等各種畸形疾病的發(fā)生率明顯降低[2]。在多種出生缺陷中,先心病的發(fā)病率已處于前列。因此,尋找能夠早期有效診斷先心病的方法已成為產(chǎn)科醫(yī)生們的重點研究問題。心臟大血管異常是造成先心病的重要原因,而產(chǎn)前超聲檢查是檢測胎兒時期心臟大血管發(fā)育異常的主要方法,具有診斷方便、安全性高的特點[3-4]。但超聲檢測影響因素較多,具有一定的局限性。隨著計算機輔助系統(tǒng)及數(shù)字挖掘技術的逐漸發(fā)展,其能夠從海量的數(shù)據(jù)中提取隱含的信息。數(shù)字挖掘技術包括logisitic回歸分析、神經(jīng)網(wǎng)絡及決策樹等方法[5]。本研究中收集455例臨床相關彩色多普勒超聲(color doppler ultrasound,CDU)影像圖像資料,分別建立logisitic回歸分析、反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡及決策樹模型,通過比較,旨在探究診斷先心病的最佳模型。
選取2017年3月至2020年1月在本院進行先心病篩查的455例孕婦產(chǎn)前CDU檢測圖像資料。其中孕婦平均年齡(27.58±1.72)歲,平均孕周(13.04±2.03)周。納入標準:(1)胎兒心率正常;(2)無先心病生育史;(3)無染色體異?,F(xiàn)象;(4)臨床資料完整;(5)胎兒家屬知情同意并簽訂知情同意書;(6)本研究經(jīng)醫(yī)院倫理委員會同意批準,并簽訂知情同意書。排除標準:(1)以先心病轉入本院;(2)具有心臟手術史;(3)對行CDU檢查不配合者。
1.2.1CDU檢測
采用GE VOLUSON E8、E10 CDU儀進行檢測,孕婦取仰臥位及側臥位,調整探頭角度,探頭頻率3.5 MHz。監(jiān)測胎兒心率、胎兒心臟外形、位置、結構、功能狀態(tài)及心臟瓣膜功能。
1.2.2資料錄入
采用問卷調查、體格檢查及實驗室檢查,由經(jīng)過專業(yè)培訓的人員進行調查,包括孕婦的年齡、孕周、孕婦血糖、是否早期服用致畸藥物史、新生兒出生孕周、新生兒性別、出生體重、Apagr評分,以及三尖瓣返流(tricuspid regurgitation,TR)、肺動脈瓣返流(pulmonary regurgitation,PR)、主動脈瓣返流(aortic regurgitation,AR)程度等。將所收集的資料錄入計算機數(shù)據(jù)庫,各項指標均嚴格按照變量的定義進行數(shù)據(jù)錄入,所有數(shù)據(jù)均采用Epidate3.1軟件,分兩人分次錄入,相互檢查校正。
1.2.3建立數(shù)學模型
采用SPSS Clementine13.0軟件將455例彩超資料的建模指標進行分析,并建立logisitic回歸分析(表1)、BP神經(jīng)網(wǎng)絡及決策樹模型,分別計算3個數(shù)學模型的準確度、靈敏度及特異度。利用Medcal軟件分別繪制logisitic回歸分析、BP神經(jīng)網(wǎng)絡及決策樹模型3個數(shù)學模型的受試者工作特征(receiveroperatingcharacteristic,ROC)曲線,計算曲線下面積(area under curve,AUC)。
表1 先心病發(fā)生影響因素的變量賦值
1.2.4觀察指標
(1)記錄研究對象的臨床基本資料;(2)比較3種模型檢測的靈敏度、特異度及準確度;(3)比較3種模型檢測的ROC曲線AUC;(4)采用Medcal軟件對3種模型的AUC進行比較,分析3種模型對先心病的診斷價值。
采用SPSS19.0軟件進行統(tǒng)計學數(shù)據(jù)分析,計數(shù)資料以率表示。logisitic回歸分析、BP神經(jīng)網(wǎng)絡及決策樹模型3個數(shù)學模型的AUC比較,以P<0.05為差異有統(tǒng)計學意義。
455例研究對象中61.32%的孕婦血糖正常,93.63%的孕婦早期未服用致畸藥物,63.52%的新生兒出生體重超過2 800 g,91.21%的新生兒出生時Apagr評分大于8分,95%以上的新生兒TR程度、PR程度、AR程度均正常,見表2、圖1~3。
表2 研究對象的臨床基本資料[n(%),n=455]
圖1 12周胎兒的頭臀徑
圖2 12周胎兒的頸項透明層圖像
圖3 胎兒靜脈導管血流頻譜
logisitic回歸分析模型、BP神經(jīng)網(wǎng)絡模型、決策樹模型檢測的靈敏度、特異度及準確度分別為84.82%、61.57%、81.79%,93.28%、81.68%、84.25%,86.46%、56.83%、81.02%,BP神經(jīng)網(wǎng)絡模型的靈敏度、特異度及準確度均明顯高于其他兩種,見表3。
表3 3種模型檢測的靈敏度、特異度及準確度(%)
logisitic回歸分析模型、BP神經(jīng)網(wǎng)絡模型、決策樹模型3種模型的AUC分別為0.742、0.786、0.728,BP神經(jīng)網(wǎng)絡模型的AUC明顯高于logisitic回歸分析模型及決策樹模型(P<0.01);而logisitic回歸分析模型與決策樹模型的AUC比較,無統(tǒng)計學意義(P>0.05),見表4、5。
表4 3種模型檢測的AUC
表5 3種模型的AUC比較
先心病屬于先天性畸形中最常見的一種,其主要的致病原因主要是由于胎兒時期心臟發(fā)育障礙所引起。在年齡越小的人群中,先心病的發(fā)病率越高,病死率越高,且先心病手術的成功與否,在很大程度上取決于術前的診斷[6]。因此,早期診斷先心病,并給予及時治療,對于改善患兒的預后意義重大。CDU作為早期診斷胎兒心臟形狀、位置及功能的重要方法,具有無痛、無創(chuàng)且重復性較好的優(yōu)勢,但其對于某些復雜先心病的診斷較為費時,診斷率較低,且仍有部分先心病無法在產(chǎn)前被診斷出[7]。因此,有必要針對先心病的CDU影像檢查結果,通過建立數(shù)學模型來早期診斷先心病,從而降低患兒病死率,改善患兒預后。
數(shù)學模型包括神經(jīng)網(wǎng)絡、logisitic回歸分析、決策樹等多種方法,其中,決策樹是一類算法的總稱,包括CHAID、CART、ID3、SLIQ及C5.0等多種算法,其能夠根據(jù)某種規(guī)則將研究對象分為不同亞群,使每個亞群中的因變量取值基本一致[8]。決策樹模型能夠分析出每個影響因素與因變量關系的密切程度,其在處理定性資料時能夠生成直觀的且容易理解的觀察結果。logisitic回歸分析根據(jù)因變量的資料類型可以分為二分類、多分類等[9],其中,二分類是較為常用的一種,其能夠從眾多復雜的因素中篩選出具有統(tǒng)計學意義的因素,并對各因素間的相互作用進行深入分析,從而評價疾病與各因素間的定量關系[10]。侯繼文[11]在輕度認知障礙影響因素分析及決策樹模型研究中發(fā)現(xiàn),決策樹分析結果顯示受教育年限、受教育程度與癡呆的發(fā)病率明顯相關,且經(jīng)常飲茶能夠保護老年人的認知功能,而logisitic回歸分析未能體現(xiàn)出來。認為決策樹分析較logisitic回歸分析能夠更為細致地發(fā)現(xiàn)影響癡呆發(fā)生的危險因素與保護因素。
神經(jīng)網(wǎng)絡使給予對人腦組織結構、活動機制的初步認識而提出的一種新型信息處理體系,BP神經(jīng)網(wǎng)絡屬于神經(jīng)網(wǎng)絡的一種,包括輸入層、隱層、輸出層,各層神經(jīng)元僅與相鄰層神經(jīng)元相連[12]。韓穎[13]在預測兒童急性髓系白血病的預后研究中,結果顯示,相較于logisitic回歸分析,BP神經(jīng)網(wǎng)絡有著更高的準確度。靈敏度、特異度與準確度作為重要的評價指標對有效診斷先心病具有重要作用。本研究結果發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡模型的準確度均明顯高于logisitic回歸分析模型及決策樹模型。BP神經(jīng)網(wǎng)絡模型對于先心病的診斷具有更高的準確度。
有研究證實,AUC的大小與實驗的識別算法能正確區(qū)分正確與錯誤目標能力的大小關系密切[14-15]。本研究中建立logisitic回歸分析、BP神經(jīng)網(wǎng)絡及決策樹模型3個數(shù)學模型,通過分析不同數(shù)學模型的AUC,結果發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡AUC明顯高于logisitic回歸分析模型與決策樹模型;此外,通過采用Medcal軟件對3種模型的AUC進行比較,結果發(fā)現(xiàn),logisitic回歸分析模型與 BP神經(jīng)網(wǎng)絡模型比較及BP神經(jīng)網(wǎng)絡模型與決策樹模型比較差異有統(tǒng)計學意義(P<0.01),而logisitic回歸分析模型與決策樹模型比較差異無統(tǒng)計學意義(P>0.05)。表明BP神經(jīng)網(wǎng)絡模型能夠更為準確地診斷先心病的發(fā)生。
綜上所述,相較于logisitic回歸分析模型與決策樹模型,BP神經(jīng)網(wǎng)絡模型診斷先心病靈敏度、特異度與準確度更高。但在臨床實際應用中,可根據(jù)不同情況選擇多種模型結合的方法進行疾病的診斷,以期能夠更為準確地診斷疾病的發(fā)生。