魏星月 王連雙 王媛媛 高孟澤 何 瓊 張 瑤 羅建文*
(1.清華大學(xué)醫(yī)學(xué)院生物醫(yī)學(xué)工程系, 北京 100084; 2.清華大學(xué)精準(zhǔn)醫(yī)學(xué)研究院,北京 100084; 3.首都醫(yī)科大學(xué)附屬北京地壇醫(yī)院超聲科,北京 100015; 4.北京理工大學(xué)光電學(xué)院北京市混合現(xiàn)實(shí)與新型顯示工程技術(shù)研究中心,北京 100081; 5.清華大學(xué)機(jī)械工程學(xué)院精密儀器系,北京 100084)
慢性肝病(chronic liver disease, CLD)是中國(guó)居民的高發(fā)病和常見(jiàn)病,它影響著數(shù)億人口[1],對(duì)中國(guó)居民的預(yù)期壽命和生活質(zhì)量造成了嚴(yán)重的負(fù)擔(dān)和影響。
CLD導(dǎo)致的肝臟病理改變主要有三種形式:肝纖維化、炎癥和脂肪變性。肝臟纖維化在早中期可逆,如果沒(méi)有積極的干預(yù)措施,病程可能進(jìn)展為肝硬化、肝衰竭等相關(guān)并發(fā)癥[2]。肝臟炎癥是肝臟疾病進(jìn)展的主要病理生理學(xué)和病理組織學(xué)基礎(chǔ)[3]。脂肪變性是中國(guó)第一大肝病,可進(jìn)展為肝硬化、肝衰竭和肝癌[4]。此外,由于復(fù)雜的病理演變過(guò)程,臨床上肝臟纖維化、炎癥和脂肪變性往往會(huì)相伴出現(xiàn),因此,同時(shí)實(shí)現(xiàn)肝臟纖維化、炎癥和脂肪變性這三種病理改變的診斷和評(píng)估具有重要的臨床價(jià)值。
當(dāng)前慢性肝病的臨床診斷標(biāo)準(zhǔn)是肝臟穿刺活體組織檢查(以下簡(jiǎn)稱(chēng)活檢),但它存在有創(chuàng)、抽樣誤差等局限[5]。血清生物標(biāo)志物如丙氨酸氨基轉(zhuǎn)移酶(alanine transaminase, ALT)、門(mén)冬氨酸氨基轉(zhuǎn)移酶(aspartate aminotransferase, AST)、血小板(platelet, PLT)和聯(lián)合生物標(biāo)志物,如門(mén)冬氨酸氨基轉(zhuǎn)移酶纖維化指數(shù)(aspartate aminotransferase to platelet ratio index, APRI)、肝纖維化4因子指數(shù)(fibrosis 4 score, FIB-4)[6-7], 雖然已用于CLD的臨床診斷,但是它們通常對(duì)早期CLD具有較低的特異度和靈敏度。因此本研究致力于開(kāi)發(fā)一種能同時(shí)診斷慢性肝病肝纖維化、炎癥和脂肪變性的無(wú)創(chuàng)、準(zhǔn)確、便捷、適用性廣的智能診斷方法。
超聲成像具有無(wú)創(chuàng)、經(jīng)濟(jì)高效和實(shí)時(shí)的優(yōu)點(diǎn),目前被用作CLD的臨床常規(guī)檢查,超聲彈性成像技術(shù)[8],如瞬時(shí)彈性成像(transient elastography, TE)和二維剪切波彈性成像(shear wave elastography, SWE)可以檢測(cè)肝臟硬度等信息,對(duì)于肝病的診斷和評(píng)估具有重要的臨床價(jià)值。因此,本研究從多模態(tài)超聲數(shù)據(jù)中提取多模態(tài)超聲特征,如聲衰減系數(shù)(ultrasound attenuation parameter, UAP)、Nakagami分布等[9-14],結(jié)合機(jī)器學(xué)習(xí)算法,構(gòu)建一個(gè)可以同時(shí)實(shí)現(xiàn)肝臟纖維化、炎癥和脂肪變性的智能分級(jí)評(píng)估模型。
本研究是一項(xiàng)回顧性研究,從首都醫(yī)科大學(xué)附屬北京地壇醫(yī)院共收集了486例慢性乙型肝炎患者的超聲數(shù)據(jù),納入標(biāo)準(zhǔn):①入院后行超聲引導(dǎo)下肝臟穿刺活檢病理學(xué)檢查;②年齡≥18周歲;③病理學(xué)診斷標(biāo)準(zhǔn)可以應(yīng)用Ishak評(píng)分系統(tǒng)和NAS評(píng)分系統(tǒng)的患者。排除標(biāo)準(zhǔn):①臨床、實(shí)驗(yàn)室或組織學(xué)證據(jù)為本項(xiàng)目研究的慢性肝病以外的肝病患者,以及合并患者;②各類(lèi)合并惡性肝臟腫瘤者;③合并其他系統(tǒng)腫瘤或疑似腫瘤者;④合并心、肺、腦、腎、血液等重要臟器疾病患者;⑤肝穿刺活檢不合格者;⑥超聲二維圖像、SWE、TE及其射頻(radio frequency, RF)數(shù)據(jù)等任何數(shù)據(jù)提取失敗的患者;⑦患者可能影響參與該研究的醫(yī)療或心理疾病。最終,142例患者的數(shù)據(jù)被納入本研究(詳細(xì)的招募流程如圖1所示)。本研究獲得了首都醫(yī)科大學(xué)附屬北京地壇醫(yī)院倫理委員會(huì)的批準(zhǔn)[倫理編號(hào):京地倫科字(2023)-026號(hào)]。作為歷史性研究可免除研究對(duì)象知情同意。
圖1 詳細(xì)的患者招募流程Fig.1 Detailed recruitmentTE: transient elastography; SWE: shear wave elastography.
1.2.1 患者一般資料
年齡、性別、身高、體質(zhì)量等。
1.2.2 血清學(xué)指標(biāo)
ALT、AST、APRI、FIB-4等。
1.2.3 SWE數(shù)據(jù)
使用Aixplorer超聲成像系統(tǒng)(法國(guó)聲科影像公司)對(duì)每位患者的肝臟進(jìn)行3次SWE檢查,生成3組JPEG格式的相同視野下的B模式圖像和SWE圖像。在每個(gè)SWE圖像上,選擇直徑為2 cm的圓形感興趣區(qū)域(region of interest, ROI)(圖2)。記錄Aixplorer系統(tǒng)在屏幕上自動(dòng)顯示的ROI內(nèi)的彈性值的平均值、最大值、最小值和標(biāo)準(zhǔn)差等指標(biāo)。
圖2 研究方法流程圖Fig.2 Pipeline of the proposed model
1.2.4 TE數(shù)據(jù)
使用iLivTouch系統(tǒng) (中國(guó)無(wú)錫海斯凱爾醫(yī)學(xué)技術(shù)有限公司)對(duì)每位患者進(jìn)行10次TE檢測(cè),生成10組一維M模式下的射頻數(shù)據(jù)、10組由iLivTouch系統(tǒng)輸出的肝臟彈性模量值和UAP值。
1.2.5 肝穿刺活檢病理結(jié)果
對(duì)每位患者進(jìn)行超聲引導(dǎo)下的肝臟穿刺活檢,根據(jù)慢性乙型肝炎防治指南(2022年版)[15],肝纖維化分為5級(jí):F0、F1、F2、F3和F4;慢性乙型肝炎患者的炎癥分為4級(jí):A1、A2、A3和A4;根據(jù)護(hù)理活動(dòng)評(píng)分量表(Nursing Activities Score,NAS)評(píng)分系統(tǒng)[16],脂肪變性分為4級(jí):S0、S1、S2和S3。
綜上,除了患者基本信息、血清學(xué)指標(biāo)和病理結(jié)果之外,對(duì)于每個(gè)患者,本研究需要收集的數(shù)據(jù)包括:3組JPEG格式的相同視野下的B模式圖像和SWE圖像、3組Aixplorer系統(tǒng)輸出的指標(biāo)、10組RF數(shù)據(jù)、iLivTouch系統(tǒng)輸出的10個(gè)肝臟彈性模量值和10個(gè)UAP值。
所有入組患者的臨床資料如表1所示。
表1 入組患者的人口統(tǒng)計(jì)學(xué)、生理學(xué)和組織學(xué)特征Tab.1 Demographic, physical, and histologic characteristics of participants
1.3.1 圖像特征
使用邊緣檢測(cè)算法將B模式和SWE圖像中的圓形ROI區(qū)域提取出來(lái),再對(duì)提取出的ROI區(qū)域進(jìn)行特征提取。
對(duì)于B模式ROI圖像,使用影像組學(xué)方法計(jì)算其紋理及強(qiáng)度特征。具體而言,計(jì)算強(qiáng)度分布的一階和二階統(tǒng)計(jì)量。一階統(tǒng)計(jì)特征包括最大值、最小值、均值、中值、熵等。二階統(tǒng)計(jì)特征是基于灰度共生矩陣提取了5個(gè)紋理特征,即對(duì)比度、相關(guān)性、能量、均勻性和熵。同時(shí),基于小波變換將每個(gè)B模式ROI圖像分解為3個(gè)尺度,對(duì)每個(gè)尺度提取上述一階和二階統(tǒng)計(jì)特征,并進(jìn)行平均。
對(duì)于SWE圖像,組織的楊氏模量被偽彩色編碼并疊加在灰度編碼的B模式圖像上,因此,首先需要通過(guò)匹配色條法從混合圖像中恢復(fù)楊氏模量[17-18],然后再使用與B模式ROI圖像相似的影像組學(xué)方法計(jì)算該SWE圖像ROI的一階和二階統(tǒng)計(jì)特征。
1.3.2 RF特征
對(duì)于從iLivTouch獲取的RF信號(hào),計(jì)算其香農(nóng)熵和4個(gè)與聲衰減系數(shù)相關(guān)的特征。進(jìn)一步地,利用希爾伯特變換從RF信號(hào)中獲得包絡(luò)信號(hào),提取其一階統(tǒng)計(jì)特征,然后,再利用Nakagami分布等來(lái)擬合包絡(luò)信號(hào),獲得對(duì)應(yīng)的統(tǒng)計(jì)學(xué)特征。
1.3.3 系統(tǒng)特征
在TE數(shù)據(jù)采集過(guò)程中,留存了每個(gè)患者10次采集對(duì)應(yīng)的10個(gè)肝臟彈性模量值和10個(gè)UAP值,在定量評(píng)估中,計(jì)算這10個(gè)肝臟彈性模量和10個(gè)UAP值的中位數(shù)和四分位差來(lái)作為iLivTouch最終給出的4個(gè)系統(tǒng)特征;在SWE圖像采集過(guò)程中,也留存了3組Aixplorer設(shè)備提供的7個(gè)定量指標(biāo),計(jì)算這7個(gè)指標(biāo)的組間平均值作為Aixplorer最終給出的7個(gè)系統(tǒng)特征。
綜上,從收集到的B模式圖像、SWE圖像、RF信號(hào)及兩臺(tái)超聲設(shè)備直接給出的系統(tǒng)指標(biāo)中,共提取了169個(gè)多模態(tài)特征,具體信息如圖2的feature extraction部分所示。
將上述提取到的169個(gè)定量特征結(jié)合在一起,輸入到支持向量機(jī)(support vector machine, SVM)中,分別進(jìn)行三種病理改變的分級(jí)診斷,包括肝臟纖維化≥F1,≥F2,≥F3, ≥F4,肝炎≥A2,≥A3,≥A4,脂肪變性≥S1,≥S2共9種分級(jí)判斷,其中,由于S3級(jí)的入組患者只有4例,所以本研究沒(méi)有進(jìn)行≥S3的分級(jí)診斷。
為了證明所提出的方法的臨床實(shí)用價(jià)值,將所提出的基于多模態(tài)超聲特征的SVM分類(lèi)方法和基于血清學(xué)指標(biāo)的SVM分類(lèi)方法進(jìn)行對(duì)比。對(duì)于每種疾病的分級(jí),以肝活檢病理學(xué)結(jié)果為標(biāo)簽,采用5折交叉驗(yàn)證的方式來(lái)訓(xùn)練和評(píng)估不同的模型。由于數(shù)據(jù)樣本較小且分布不均衡,所以本研究沒(méi)有單獨(dú)設(shè)置驗(yàn)證集來(lái)對(duì)模型進(jìn)行驗(yàn)證。準(zhǔn)確率、靈敏度、特異度和受試者工作特征(receiver operating characteristic, ROC)曲線下面積(area under the curve, AUC)[19]及AUC的95%置信區(qū)間(confidence interval, CI)被選作評(píng)估指標(biāo)。同時(shí),為了更加客觀地對(duì)比不同模型的分類(lèi)性能,對(duì)所提出的模型和其他對(duì)比模型的ROC曲線進(jìn)行了Delong檢驗(yàn)。
本研究所提出的方法對(duì)于肝纖維化的分級(jí)結(jié)果如表2所示??紤]到血清學(xué)指標(biāo)APRI、FIB-4和肝臟彈性信息對(duì)于肝纖維化的診斷具有重要價(jià)值,表2也給出了將APRI、FIB-4、Aixplorer系統(tǒng)指標(biāo)(記為SWE)和iLivTouch系統(tǒng)指標(biāo)(記為T(mén)E)分別輸入到SVM中并加以訓(xùn)練之后的評(píng)估結(jié)果。
表2 肝纖維化分級(jí)結(jié)果及與臨床指標(biāo)的對(duì)比結(jié)果Tab.2 Grading results of liver fibrosis and comparison with clinical indicators
可以看到,本研究所提出的方法對(duì)于不同級(jí)別的肝纖維化分級(jí)的AUC值均在0.8以上,對(duì)于肝纖維化≥F3及≥F4,AUC分別達(dá)到了0.89和0.87。同時(shí),本研究的方法整體上優(yōu)于其他四種臨床指標(biāo)。
根據(jù)Delong檢驗(yàn)結(jié)果,可以發(fā)現(xiàn),所提出的多模態(tài)超聲特征對(duì)比APRI指標(biāo)具有顯著差異(肝纖維化的不同分級(jí)下Delong檢驗(yàn)的P值均小于0.05),相比FIB-4指標(biāo)和TE指標(biāo)(iLivTouch系統(tǒng)提供的關(guān)于肝臟彈性信息的指標(biāo))在肝纖維化≥F1、≥F2及≥F3上差異有統(tǒng)計(jì)學(xué)意義,與SWE指標(biāo)(Aixplorer系統(tǒng)提供的關(guān)于肝臟彈性信息的指標(biāo))在肝纖維化≥F1分級(jí)中差異有統(tǒng)計(jì)學(xué)意義(P<0.001)。
本研究所提出的方法對(duì)于肝臟炎癥的分級(jí)結(jié)果如表3所示。血清學(xué)指標(biāo)AST、ALT經(jīng)常被用在肝臟炎癥的臨床診斷中,表3給出了將AST和ALT分別輸入到SVM中并加以訓(xùn)練之后的評(píng)估結(jié)果。
表3 肝臟炎癥分級(jí)結(jié)果及與臨床指標(biāo)的對(duì)比結(jié)果Tab.3 Grading results of liver inflammation and comparison with clinical indicators
可以看到,本研究所提出的方法對(duì)于不同級(jí)別的肝臟炎癥分級(jí)的AUC值均在0.8以上,對(duì)于肝臟炎癥≥A3及≥A4,AUC達(dá)到了0.93,準(zhǔn)確率、靈敏度和特異度均在0.86以上。同時(shí),本研究的方法比其他兩個(gè)血清學(xué)指標(biāo)具有明顯的優(yōu)勢(shì)。
在Delong檢驗(yàn)中,所提出的方法和ALT指標(biāo)在肝臟炎癥≥A2、≥A3及≥A4這3個(gè)分級(jí)上差異有統(tǒng)計(jì)學(xué)意義,和AST指標(biāo)在肝臟炎癥≥A2及≥A3上差異有統(tǒng)計(jì)學(xué)意義。
本研究所提出的方法對(duì)于肝臟脂肪變性的分級(jí)結(jié)果如表4所示。與聲衰減系數(shù)相關(guān)的指標(biāo)對(duì)于肝臟脂肪變性具有較好的診斷能力,表4給出了將超聲設(shè)備直接給出的UAP相關(guān)的指標(biāo)直接輸入到SVM中并加以訓(xùn)練之后的評(píng)估結(jié)果。
表4 肝臟脂肪變性分級(jí)結(jié)果及與臨床指標(biāo)的對(duì)比結(jié)果Tab.4 Grading results of liver steatosis and comparison with clinical indicators
可以看到,本研究所提出的方法對(duì)于中重度肝臟脂肪變性≥S2具有較好的診斷能力,AUC達(dá)到了0.92,準(zhǔn)確率、靈敏度和特異度均在0.86以上。同樣,本研究所提出的方法對(duì)比超聲設(shè)備直接給出的UAP相關(guān)的指標(biāo)具有較大的優(yōu)勢(shì)。在Delong檢驗(yàn)中,所提出的方法和UAP指標(biāo)差異無(wú)統(tǒng)計(jì)學(xué)意義。
本研究從多模態(tài)超聲數(shù)據(jù)中提取了多模態(tài)超聲特征,構(gòu)建了一個(gè)可以同時(shí)診斷肝纖維化、炎癥和脂肪變性的智能診斷模型。
本研究所提出的多模態(tài)特征在中度或重度肝病的分類(lèi)中比在輕度肝病的分級(jí)中表現(xiàn)得更好。以纖維化為例,分級(jí)≥F3(0.89)和F4(0.87)具有更高的AUC,但分級(jí)≥F2(0.80)和F1(0.81)則AUC更低。這與早期CLD相對(duì)難以識(shí)別的臨床認(rèn)知一致。然而,可以看到,在早期CLD上,本研究所提出的方法比其他臨床特征表現(xiàn)得更好,以纖維化≥F1為例,SWE指標(biāo)、TE指標(biāo)、APRI指標(biāo)和FIB-4指標(biāo)的準(zhǔn)確率和AUC都小于0.7,而所提出的方法在準(zhǔn)確率、靈敏度、特異度和AUC上都大于0.73,證明了所提出的多模態(tài)特征更適合CLD的診斷。
本研究對(duì)所提出的方法和其他對(duì)比模型進(jìn)行了Delong檢驗(yàn),結(jié)果表明,所提出的多模態(tài)超聲特征在肝纖維化≥F2、≥F3及≥F4這3個(gè)分級(jí)中和SWE指標(biāo)不具備顯著差異,考慮到本研究所提出的多模態(tài)超聲特征包含了SWE指標(biāo),該結(jié)果可以表明SWE指標(biāo)(即Aixplorer系統(tǒng)提供的肝臟硬度相關(guān)的指標(biāo))對(duì)于中重度肝纖維化的分級(jí)具有重要作用,這與臨床認(rèn)知一致,即肝纖維化的一個(gè)重要表現(xiàn)便是肝臟硬度升高。值得一提的是,SWE指標(biāo)對(duì)于肝纖維化≥F1表現(xiàn)較差(AUC、準(zhǔn)確率、靈敏度均小于0.5),表明SWE指標(biāo)不能很好地診斷早期肝纖維化。而所提出的基于多模態(tài)超聲特征的SVM分類(lèi)方法和基于SWE指標(biāo)的SVM分類(lèi)方法的Delong檢驗(yàn)的P值小于0.001,表明所提出的方法對(duì)于SWE指標(biāo)具有顯著性差異。同時(shí),結(jié)合所提出的方法在肝纖維化≥F1分級(jí)中的準(zhǔn)確率、靈敏度、特異度和AUC均大于0.73,證明了多模態(tài)超聲特征對(duì)于早期肝纖維化的診斷具有重要價(jià)值。
在肝臟炎癥的3個(gè)分級(jí)中,所提出的方法在整體上相比,AST和ALT指標(biāo)具有顯著性差異,結(jié)合更高的AUC等指標(biāo),可以證明多模態(tài)超聲特征相比血清學(xué)指標(biāo)AST和ALT對(duì)于肝臟炎癥具有更好的辨別效果。
在肝臟脂肪變性的2個(gè)分級(jí)中,所提出的多模態(tài)超聲特征相比UAP指標(biāo)不具有顯著性差異,表明UAP指標(biāo)在多模態(tài)超聲特征中對(duì)于肝脂肪變性的智能診斷貢獻(xiàn)更大。這也與臨床認(rèn)知一致,即肝臟脂肪變性意味著肝臟中具有大量的脂肪沉積,而脂肪對(duì)于超聲信號(hào)具有較強(qiáng)的反射和散射作用,導(dǎo)致較高的超聲衰減。
此外,在本研究中,僅招募了142例慢性乙型肝炎患者入組,數(shù)據(jù)樣本的缺乏限制了所提出模型的性能和泛化能力。更重要的是,這些患者的分級(jí)分布不均勻,事實(shí)上,如果能獲得一個(gè)更大的數(shù)據(jù)集,那么可以直接實(shí)現(xiàn)纖維化的五分、炎癥和脂肪變性的四分級(jí),這可以進(jìn)一步簡(jiǎn)化整套CLD智能診斷系統(tǒng)的規(guī)模和復(fù)雜度。
在本研究中,筆者提出了一種多模態(tài)定量超聲方法,該方法結(jié)合了從B模式圖像、SWE圖像、RF信號(hào)中基于影像組學(xué)方法和超聲組織定征方法提取的多模態(tài)特征以及由臨床超聲成像設(shè)備直接提供的特征,同時(shí)對(duì)三種形式的CLD進(jìn)行分級(jí),即肝纖維化、炎癥和脂肪變性。本研究成功招募了142例慢性乙型肝炎患者,并利用他們的肝活檢結(jié)果作為參考標(biāo)準(zhǔn),以上述提取的多模態(tài)特征作為輸入來(lái)訓(xùn)練SVM分類(lèi)器。結(jié)果表明,與血清學(xué)生物標(biāo)志物等臨床特征相比,所提出的多模態(tài)特征具有明顯優(yōu)勢(shì),表明所提出的方法在CLD的臨床篩查、診斷和治療方面具有潛在應(yīng)用。未來(lái)的研究方向如下:①在確保數(shù)據(jù)分布平衡的同時(shí),擴(kuò)大數(shù)據(jù)集規(guī)模;②以多分類(lèi)或回歸模型的方式實(shí)現(xiàn)對(duì)CLD的分級(jí)診斷,以降低整套CLD智能診斷系統(tǒng)的規(guī)模和復(fù)雜度。
利益沖突所有作者均聲明不存在利益沖突。
作者貢獻(xiàn)聲明魏星月、王連雙:提出研究思路, 設(shè)計(jì)研究方案, 數(shù)據(jù)采集、整理,撰寫(xiě)論文;王媛媛:數(shù)據(jù)整理分析;高孟澤:協(xié)助數(shù)據(jù)分析;何瓊:協(xié)助設(shè)計(jì)研究方案;張瑤、羅建文:總體把關(guān),論文審定。
首都醫(yī)科大學(xué)學(xué)報(bào)2023年6期