董浩 經(jīng)齊峰 邱勇剛 汪鑫斌 樓存誠(chéng)
臨床上,胸部外傷中最常見(jiàn)的損傷就是肋骨骨折[1],可分為完全性骨折和不完全性骨折[2]。薄層CT的廣泛應(yīng)用雖明顯提高了肋骨骨折的檢出率,但漏診現(xiàn)象仍不少見(jiàn)[3],尤其是一些較為隱匿的不完全性骨折,漏診率比較高,既會(huì)影響患者預(yù)后,也會(huì)引起一些不必要的醫(yī)療糾紛[4]。因此,提高肋骨骨折的診斷準(zhǔn)確率是十分必要的。隨著大數(shù)據(jù)的廣泛應(yīng)用,人工智能(artificial intelligence,AI)技術(shù)愈加成熟,其能夠從影像中提取肉眼容易忽視的信息,進(jìn)而提高影像的診斷價(jià)值[5]?;谏疃葘W(xué)習(xí)的AI肋骨骨折輔助檢測(cè)系統(tǒng)已在臨床開(kāi)展應(yīng)用,但對(duì)其準(zhǔn)確性的研究報(bào)道較少。本研究旨在評(píng)估AI輔助CT檢測(cè)肋骨骨折的價(jià)值。
1.1 臨床資料 選取2020年3月至2020年9月在杭州市蕭山區(qū)第一人民醫(yī)院行肋骨CT檢查的患者156例。(1)納入標(biāo)準(zhǔn):有明確外傷病史;有雙側(cè)肋骨CT圖像,且為外傷后3周內(nèi)所得;雙側(cè)肋骨至少有1處骨折。(2)排除標(biāo)準(zhǔn):圖像偽影太重而影響診斷;存在骨質(zhì)破壞或骨腫瘤;存在先天性肋骨發(fā)育不良或畸形。
1.2 檢查方法 應(yīng)用飛利浦Brilliance 64層螺旋CT機(jī)進(jìn)行容積掃描?;颊呷⊙雠P位,屏氣,掃描范圍從胸廓入口至第12肋。掃描參數(shù):120 KV,230 mA,層厚0.625 mm,螺距1.015。將圖像的原始數(shù)據(jù)進(jìn)行重建,重建算法為骨算法,層厚1 mm,間隔1 mm,窗寬1,500 HU,窗位500 HU。
1.3 圖像分析 (1)A組:由低年資醫(yī)師(3~5年)對(duì)156例患者的肋骨CT圖像進(jìn)行單獨(dú)閱片。(2)B組:將156例患者的肋骨CT圖像傳送至AI(北京推想科技有限公司InferRead CT Bone,版本:V9.5),得出自動(dòng)分析結(jié)果。(3)C組:由低年資醫(yī)師結(jié)合AI進(jìn)行綜合閱片。記錄每組的閱片時(shí)間及骨折檢出數(shù),并對(duì)檢出的骨折類(lèi)型進(jìn)行分類(lèi),最后由兩位從事影像診斷15年以上的副主任醫(yī)師同時(shí)對(duì)156例患者的肋骨CT圖像進(jìn)行閱片分析,意見(jiàn)不一致時(shí)經(jīng)討論后達(dá)成統(tǒng)一診斷結(jié)果,并以此作為金標(biāo)準(zhǔn)。分別計(jì)算A、B、C三組的誤診率、漏診率、敏感度,敏感度=診斷正確數(shù)/骨折總數(shù)×100%,漏診率=漏診數(shù)/骨折總數(shù)×100%,誤診率=誤診數(shù)/檢出數(shù)×100%。
1.4 統(tǒng)計(jì)學(xué)方. 采用SPSS 23.0統(tǒng)計(jì)軟件。計(jì)數(shù)資料以[n(%)] 表示,采用卡方檢驗(yàn)或Fisher確切概率法;計(jì)量資料符合正態(tài)分布以(±s)表示,采用t檢驗(yàn)。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
兩位影像診斷副主任醫(yī)師對(duì)156例患者的肋骨CT圖像進(jìn)行分析,確認(rèn)584處骨折,其中完全性骨折246處,不完全性骨折338處。A組檢出536處,漏診56處,誤診8處;B組檢出576處,漏診26處,誤診18處;C組檢出577處,漏診12處,誤診5處。
2.1 三組對(duì)不同類(lèi)型骨折診斷準(zhǔn)確數(shù)比較 完全骨折診斷準(zhǔn)確數(shù),C組>B組>A組,但組間兩兩比較差異均無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05);不全骨折診斷準(zhǔn)確數(shù),C組>B組>A組,A組與B組、C組比較差異均有統(tǒng)計(jì)學(xué)意義(P<0.001)。見(jiàn)表1。
表1 三組對(duì)不同類(lèi)型骨折診斷準(zhǔn)確數(shù)比較(n)
2.2 三組的診斷時(shí)間、敏感度、誤診率、漏診率比較 診斷時(shí)間,A組>C組>B組,組間兩兩比較差異均有統(tǒng)計(jì)學(xué)意義(P<0.001)。敏感度,C組>B組>A組;漏診率,A組>B組>C組;誤診率,B組>A組>C組。敏感度、漏診率組間兩兩比較,差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。B組、C組的誤診率比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。見(jiàn)表2。
表2 三組肋骨骨折檢測(cè)情況比較
肋骨骨折是胸部外傷最常見(jiàn)的骨折,若不能及時(shí)發(fā)現(xiàn)則會(huì)增加繼發(fā)相鄰臟器損傷的可能性[6],而且多發(fā)肋骨骨折常合并肺挫傷及血?dú)庑兀踔習(xí)?dǎo)致胸壁穩(wěn)定性減弱、臟器損傷引起呼吸、循環(huán)功能障礙,致死率高[7],所以早期準(zhǔn)確診斷肋骨骨折并采取有效的干預(yù)措施意義重大。雖然常規(guī)CT檢查對(duì)肋骨骨折的檢出率明顯優(yōu)于傳統(tǒng)X線(xiàn)檢查,但從數(shù)百?gòu)埍覥T圖像中檢出肋骨骨折會(huì)明顯提升影像科醫(yī)師的工作強(qiáng)度,而且臨床工作中漏診、誤診也時(shí)常發(fā)生[8]。人工智能的出現(xiàn)有利于解決以上這些問(wèn)題,其核心是機(jī)器學(xué)習(xí),深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支。深度學(xué)習(xí)的實(shí)質(zhì)是通過(guò)構(gòu)建含大量隱藏層的機(jī)器學(xué)習(xí)模型和海量訓(xùn)練集來(lái)學(xué)習(xí)更有用的特征,從而提升分類(lèi)或診斷的準(zhǔn)確性[9]?;谏疃葘W(xué)習(xí)的AI已在眾多醫(yī)學(xué)領(lǐng)域展開(kāi)研究,在肺結(jié)節(jié)的檢出及良惡性鑒別方面已經(jīng)取得了一些研究成果。
本研究顯示,三組對(duì)完全骨折的診斷準(zhǔn)確率比較差異均無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),因?yàn)橥耆钦鄣恼飨笙鄬?duì)明顯,不容易漏診及誤診。三組對(duì)于不全骨折的診斷正確率,A組與B組、C兩組比較差異均有統(tǒng)計(jì)學(xué)意義(P<0.001),說(shuō)明AI對(duì)不全骨折的診斷效能高于醫(yī)師單獨(dú)閱片,容易漏診的不全骨折大都是隱匿性骨折(圖1a),隱匿性骨折常規(guī)X線(xiàn)檢查一般無(wú)法檢出,在薄層CT上的骨折征象也十分細(xì)微。李三保等[10]研究顯示,線(xiàn)樣增亮征、皮質(zhì)凹陷征、皮質(zhì)翹起征與細(xì)小裂紋征可提示隱匿性肋骨骨折。此外,多層螺旋CT結(jié)合多維重建技術(shù)對(duì)隱匿性肋骨骨折的診斷有一定的價(jià)值[11]。醫(yī)師組的診斷敏感度低于其他兩組,而漏診率較高,可能是因?yàn)橛跋窨漆t(yī)師在大量重復(fù)閱片過(guò)程中不可避免產(chǎn)生了視覺(jué)疲勞,導(dǎo)致肋骨骨折的檢出率下降。人工智能的誤診率高于其他兩組,因?yàn)槿斯ぶ悄苡袝r(shí)會(huì)將肋骨正常解剖誤判為骨折,比如將肋軟骨誤認(rèn)為骨質(zhì)不連續(xù)(圖1b),將肋頭與錐體關(guān)節(jié)面連接處誤認(rèn)為骨質(zhì)斷裂(圖1c),將肋角誤認(rèn)為骨質(zhì)皺褶(圖1d),這也說(shuō)明人工智能的算法還有待完善。C組對(duì)檢出肋骨骨折的敏感度較高,且漏診率和誤診率均較低,不僅提高了骨折檢出的診斷正確率,降低了漏診風(fēng)險(xiǎn),還彌補(bǔ)了人工智能假陽(yáng)性率較高的缺點(diǎn)。除此之外,人工智能在閱片速度方面較影像醫(yī)師具有很大優(yōu)勢(shì),完成1例雙側(cè)肋骨CT的閱片平均需要28 s,而醫(yī)師閱片需要時(shí)間約5 min,可見(jiàn)醫(yī)師結(jié)合人工智能明顯提高了影像科醫(yī)師的工作效率和診斷準(zhǔn)確性,值得廣泛推廣。
圖1 a.放射醫(yī)師漏診的隱匿性骨折,AI診斷正確;b.AI將肋軟骨誤判為肋骨骨折;c.AI將肋頭與錐體關(guān)節(jié)面連接處誤判為骨折;d.AI將肋角誤判為骨折
綜上所述,影像醫(yī)師結(jié)合AI可顯著提高對(duì)CT肋骨骨折檢出的診斷效能,尤其不全性肋骨骨折,值得臨床推廣應(yīng)用。不過(guò),目前AI仍存在一定的誤診率,需進(jìn)一步改善算法以提高特異度。由于該研究樣本量不夠大,而且收集的病例均來(lái)自同一家醫(yī)院,未來(lái)將聯(lián)合多家醫(yī)院進(jìn)行多中心大樣本研究。