姜樂臨 陳彥晗 金夢佳 宋湘芬 冷曉暢 向建平 朱思品 姜文兵
據統(tǒng)計,2016年有1 790 萬人死于心血管疾?。╟ardiovascular disease,CVD),到2030年,預計死亡人數超過2 220 萬人[1]。牛眼圖是左心室在短軸切面上的周向橫斷面圖,通常用于顯示舒張末期與收縮末期室壁厚度變化、心肌灌注等心臟功能異常情況。射血分數是反映左心室收縮功能的可靠指標,有助于心力衰竭的診斷[2-4]。除室壁厚度和射血分數外,其他功能指標(如心肌質量等)也可用于心臟功能的分析。左心室體積可以估算這些心功能指標,臨床上通常通過左心室分割來量化左心室體積,進而診斷CVD。手工分割左心室的步驟繁瑣且受觀察者主觀影響較大,因此自動左心室分割在計算機輔助診斷中受到廣泛應用。在獲取心臟解剖信息的成像技術方面,與心臟MRI 相比,心臟計算機斷層血管造影(computed tomography angiography,CTA)具有檢查時間短、成本低、圖像質量較高等優(yōu)點[5]。然而,由于形狀和大小的變化、組織對比度差等,左心室自動分割仍具有挑戰(zhàn)性。傳統(tǒng)的左心室自動分割方法主要包括地圖集和變形模型。Yang 等[6]提出了一種三步多圖集分割方法,但該性能依賴于配準算法和融合策略。Medina 等[7]提出了一種基于水平集變形輪廓的兩階段分割技術,但該性能極易受初始形狀和不同類型參數的影響,而且計算量較大。基于卷積神經網絡(convolutional neural network,CNN)的深度學習是一種更準確、更有效的方法,近年來在醫(yī)學圖像分析中展現出廣闊的應用前景。U-Net 作為醫(yī)學圖像分割最經典的CNN,在有限的訓練數據下可以獲得精確的分割,因此得到了廣泛的應用[8]。但是由于其結構簡單,可能無法應付形狀、大小等變化較大的情況。Isensee 等[9]開發(fā)了一個級聯的UNet,一個模型首先提取全局信息來定位感興趣區(qū)(region of interest,ROI),另一個模型對該ROI 進行密集預測。Guo 等[10]將集成注意力機制應用到U-Net,以逐步抑制不相關區(qū)域的特征響應,而不需要額外的ROI 定位模型。Wu 等[11]引入深監(jiān)督機制對中間特征映射進行監(jiān)督,以緩解優(yōu)化挑戰(zhàn),同時提高邊界的區(qū)域判別等。Jun 等[12]將注意力與深監(jiān)督機制進行結合,重點關注左心室邊界結構。參考上述文獻,本研究開發(fā)了一種基于U-Net 的短軸心臟CTA 左心室心肌(left ventricular myocardium,LVM)自動分割系統(tǒng),并與原型UNet 方法的左心室分割性能進行比較,現將結果報道如下。
1.1 對象 選取2022年2 至10月在溫州市中心醫(yī)院就診的50 例疑似或確診CVD 患者為研究對象,其中男29 例,女21 例;年齡37~85(67±9)歲。納入標準:(1)年齡>18 歲;(2)行舒張末期或收縮末期的心臟CTA檢查;(3)CTA 圖像質量優(yōu),無明顯運動及呼吸偽影。排除標準:(1)存在對比劑過敏或硝酸甘油禁忌證;(2)孕婦或哺乳期婦女;(3)合并嚴重的心律不齊;(4)失代償性心功能不全;(5)合并嚴重的肝腎功能不全;(6)冠狀動脈旁路移植術后或冠狀動脈支架置入術后;(7)患有復雜的先天性心臟病;(8)行CTA 檢查時BMI>35 kg/m2;(9)最近1 個月發(fā)生過急性冠狀動脈綜合征,包括急性心肌梗死、不穩(wěn)定心絞痛等。本研究經溫州市中心醫(yī)院醫(yī)學倫理委員會批準(K2021-04-007),所有患者均知情同意。
1.2 基于U-Net 的短軸心臟CTA LVM 自動分割系統(tǒng)的開發(fā)
1.2.1 短軸切面獲取 使用德國西門子SOMATOM Force CT 掃描儀進行心臟CTA 檢查,并以DICOM 格式進行存儲,圖像分辨率0.25~0.37 mm,切片厚度0.50~0.75 mm。每幅圖像最初是在軸向視圖中獲得的,為了更好地分析心臟功能,需要在心臟CTA 檢查時從軸向切面重新定位到短軸切面。(1)在軸向切面中選擇一幅參考圖像繪制長軸,見圖1A;通過切割平行于長軸和垂直于參考圖像的軸向圖像獲得新的斷層圖像。(2)從新的斷層圖像中選擇一個參考圖像,并以同樣的方式繪制長軸,見圖1B;三維長軸的取向由軸向和新的斷層參考圖像中的兩個長軸決定。(3)通過切割垂直于三維長軸的軸向圖像,并調整到512×512 像素,得到短軸切面,見圖1C。
圖1 心臟計算機斷層血管造影檢查從軸向切面到短軸切面的重新定位(A:繪制長軸;B:切割獲得新的斷層圖像;C:調整像素獲得短軸切面)
1.2.2 訓練數據處理 從每例患者的短軸切面中選擇20 個具有代表性的圖像,包括左心室出現前的2 幅圖像和左心室消失后的2 幅圖像,共1 000 幅圖像。然后在Graph Cut 半自動分割工具協(xié)助完成分割工作[13],醫(yī)師隨后檢查并根據需要交互校正分割(半自動分割結果首先交由2 位具有5年以上經驗的醫(yī)師進行單獨校正標注后,再交由10年以上經驗的醫(yī)師審核并最終確認)。將具有標簽的數據分成訓練數據(隨機抽取80%的數據)和測試數據(其余20%的數據)。另外,在訓練中進行數據在線增強(旋轉、縮放和剪切變換),以擴大訓練數據的多樣性。
1.2.3 模型結構優(yōu)化 該方法基于U-Net 深度神經網絡的模型結構,由包括收縮路徑和擴張路徑的8 層組成,見圖2。每層有兩組卷積核為3×3 像素的卷積、批量歸一化和修正線性單元激活函數。殘差連接被合并到每一層,每層的輸入通過1×1 卷積與第二個3×3卷積的輸出進行加操作。收縮路徑中每層的輸出通過最大池化操作將分辨率降低一半。擴張路徑中的每層輸入通過卷積核為2×2 像素和步長為2 像素的反卷積操作,以逐層恢復分辨率,其后使用跳躍連接與收縮路徑相應層的輸出進行疊操作形式的連接。在收縮路徑中,第一層的輸入通道從1 增加到8,其他層的輸入通道增加1 倍。在擴張路徑中,每一層的輸入通道減半,最后一層的輸出通道使用1×1 卷積從8減少到1。從這里開始的分支作為主要的輸出分支。擴張路徑中的7 條輔助輸出分支作為深監(jiān)督從前7 層延伸出,每條分支由1 到7 個連續(xù)的2×2 個反卷積和1×1 個卷積組成,以恢復與主輸出分支相同的分辨率。注意力機制在7 條輔助輸出分支和主輸出分支之后添加。平均池化操作用于執(zhí)行全局下采樣,然后通過一組1×1 卷積和Sigmoid 激活獲得當前分支的權重。將來自不同分支的特征映射乘以不同的權重,以增強關鍵分支的注意力。再次添加一組1×1 卷積和Sigmoid 激活,以獲得當前分支的空間權重。將來自不同空間位置的特征映射乘以不同的權重,以提高關鍵區(qū)域的注意力。最后通過Sigmoid 激活,以獲得屬于前景(>0.5)或背景(≤0.5)的像素概率。
圖2 基于U-Net 的心臟計算機斷層血管造影短軸切面左心室分割方法的模型結構
1.3 訓練策略 訓練數據以零均值和單位方差進行歸一化操作,并以8 的批量大小輸入模型中。利用二值交叉熵的損失函數,將模型輸出與標簽進行比較。采用學習速率為2e-4 的自適應矩估計(Adam)優(yōu)化器對模型參數進行更新,使得損失最小化[14]。使用Pytorch 框架,在配備美國Nvidia 11 GB NVIDIA GeForce GTX1080Ti GPU 和3 585 個CUDA 核的Linux 系統(tǒng)下進行200 輪訓練[15]。
1.4 模型評估 采用Dice 相似系數(Dice similarity coefficient,DSC)、精度和靈敏度3 個指標進行量化評估模型輸出與標簽之間像素級的相似性程度,其中DSC 度量模型輸出與標簽之間的空間重疊度,DSC=2×(模型輸出∩標簽)/(模型輸出+標簽);精度是真陽性與DSC 的比值,精度=(模型輸出∩標簽)/模型輸出;靈敏度是真陽性與標簽的比值,靈敏度=(模型輸出∩標簽)/標簽。以上3個指標的值越大表示模型性能越高。
2.1 分割結果可視化比較 本研究新開發(fā)方法從心臟CTA 短軸切面分割左心室的結果與原型U-Net 方法的可視化比較發(fā)現,無論分割小區(qū)域的左心室或分割組織對比度較差的圖像,與原型U-Net 方法相比,本研究新開發(fā)方法與標簽具有更高的一致性;在可視化比較中,原型U-Net 方法展現出欠分割、過分割等問題,見圖3(封三)。
圖3 測試數據的6 個樣本圖像可視化比較
2.2 分割量化結果比較 本研究新開發(fā)方法的DSC、精度、靈敏度分別為0.964±0.033、0.960±0.043、0.970±0.040,原型U-Net 方法的DSC、精度、靈敏度分別為0.938±0.144、0.941±0.144、0.961±0.058,提示本研究新開發(fā)方法具有更高的分割精度和魯棒性。從綜合角度來看,兩種方法均存在一些異常值,但原型U-Net 方法的異常值跨度很大,如在DSC、精度的箱式圖中明顯可見,與上述分割量化結果一致;在原型UNet 方法的DSC、精度的箱式圖中,有一些離群點非常接近于零,見圖4。這提示原型U-Net 方法存在一定的過分割問題,如一些沒有左心室的圖像被分割出了左心室,見圖5。使用本研究新開發(fā)方法分割的3 例患者左心室表面三維視圖顯示平均分割時間為13 s(即處理速度約為0.037 s/幅),提示該方法整體上實現了較高的分割質量和分割效率,見圖6。
圖4 本研究新開發(fā)方法與原型U-Net 方法關于DSC、精度和靈敏度的箱圖比較結果(A:DSC;B:精度;C:靈敏度)
圖5 使用原型U-Net 方法分割失敗的樣本圖像
圖6 本研究新開發(fā)方法分割的3 例患者(連續(xù)短軸圖像)左心室表面三維視圖
左心室分割的準確性對于后續(xù)心臟功能定量分析和CVD 的診斷至關重要。本研究開發(fā)了一種基于U-Net 的短軸心臟CTA LVM 自動分割系統(tǒng),該方法將模型加深至8 層,同時結合深度學習中的幾種最先進技術(注意力機制、深監(jiān)督機制、殘差連接等)。注意力機制的模型通過隱式學習權重,以關注更多關鍵特征,同時逐步控制無關區(qū)域,從而很好地代替顯式ROI定位。深監(jiān)督機制的輔助作用是監(jiān)督和驅動中間特征在中間層進行鑒別,提高邊界處的最終鑒別能力,以應對不良的組織對比度。而模型加深至8層,有利于提取足夠的復雜特征,以學習左心室的各種形狀和大小。在Khan 等[16]的啟發(fā)下,本研究將殘差連接并入U-Net,期望以更平滑的梯度流來實現更好的反向傳播。
本研究新開發(fā)方法與原型U-Net 方法的分割性能比較,發(fā)現新開發(fā)方法左心室分割性能明顯提高,得益于加深的8 層,以及引入的注意力機制和深監(jiān)督機制,同時結合殘差連接的綜合效應。分割量化結果比較顯示,與原型U-Net 方法(0.938±0.144、0.941±0.144、0.961±0.058)相比,本研究新開發(fā)方法的DSC、精度、靈敏度分別為0.964±0.033、0.960±0.043、0.970±0.040,提示分割精度和魯棒性更高。對于不同形狀和大小的左心室,新開發(fā)方法能獲得更好的分割結果。此外,新開發(fā)方法對組織對比度差的左心室也能作較好的識別;而原型U-Net 方法展現出過分割、欠分割等問題,不能很好地控制無關區(qū)域,也不能很好地突出關鍵特性,同時在組織對比度差的情況下表現不佳。整體而言,原型U-Net 方法的簡單結構更適用于分割形狀和大小變化不大且有明顯邊界的物體,但對于變化較大和對比度較低的情況不是那么有效。而本研究所開發(fā)的自動分割左心室的方法,在處理變化較大、對比度較低的CTA 圖像時仍表現出較好的分割性能,這有利于圖像識別的深度學習方法在臨床實踐中的進一步應用。
以下文獻報道了基于CNN 的深度學習方法分割心臟CTA 中的左心室。Zreik 等[17]采用CNN 對心臟CTA 中的左心室進行分割,左心室的ROI 由3 個CNN組合定位,分別用于軸向、冠狀和矢狀面。一個特定的CNN 對ROI 進行體素分類,得到平均DSC 為0.850的分割結果。Koo 等[18]通過將全連接層改為全卷積層來實現對CTA 中左心室的語義分割,結果顯示平均DSC 為0.883。Wang 等[19]開發(fā)了一種基于視覺顯著性和Transformer 的雙輸入深度學習網絡以用于心臟結構的分割,結果分割左心室的DSC 達到了0.940。Jun等[12]將注意力機制和深監(jiān)督機制集成到U-Net 中,結果顯示DSC 達到0.916。本研究新開發(fā)方法的DSC 均高于上述研究結果,說明該方法在現有的心臟CTA 短軸切面分割方法中是具有競爭優(yōu)勢。但需要注意以下兩點:(1)本研究數據來自單一CTA 檢查儀器,缺乏多樣性,這可能是該方法分割心臟CTA 的評估結果優(yōu)于其他現有方法的原因之一。因此,多中心和多掃描數據驗證該方法的魯棒性和泛化性至關重要。(2)目前基于2D 分割的研究缺失圖像之間的空間相關性,使得部分二維圖像之間的連續(xù)性表現欠佳。因此,在后續(xù)工作中應收集多中心和多掃描儀的擴增數據,并深入基于三維分割的研究。
綜上所述,本研究開發(fā)了一種基于U-Net 的短軸心臟CTA LVM 自動分割系統(tǒng),該方法將注意力機制、深監(jiān)督機制和殘差連接集成到8 層U-Net 中,具有較高的分割精度、分割質量和分割效率,有望成為診斷CVD 的一種有效輔助工具。