朱逸峰,趙凱,郭麗,張耀峰,王祥鵬,張曉東,李雨師,王霄英
頸椎病(cervical spondylosis,CS)是椎間盤變性、椎體骨質(zhì)及小關(guān)節(jié)軟組織病理改變刺激和壓迫頸動脈、脊髓、頸神經(jīng)根等的退行性疾病,近年來患病率逐年增高,有明顯年輕化的趨勢[1]。
影像檢查可以輔助頸椎病的診斷,其中X線可顯示曲度改變、椎間隙變窄等,CT可顯示頸椎骨質(zhì)等結(jié)構(gòu),MRI可顯示脊髓和頸椎間盤等結(jié)構(gòu),在實際工作中MRI更普遍地被應用于頸椎病的診斷和評估[2]。頸椎影像的精確分割和量化分析在頸椎病診斷中非常重要,但頸椎區(qū)域的骨骼、韌帶、血管和神經(jīng)等解剖結(jié)構(gòu)較多,影像重疊度較高,如何客觀、量化分析頸椎結(jié)構(gòu)一直是尚未解決的難題[3]。隨著人工智能(artificial intelligence,AI)的發(fā)展,AI在醫(yī)學影像領(lǐng)域也得到了廣泛的研究和應用,通過深度學習對圖像進行自動分割在腎臟、前列腺和乳腺等部位都已經(jīng)得到實現(xiàn)[4-6]。既往也有很多學者針對不同人群、不同模態(tài)影像中頸椎各結(jié)構(gòu)的分割進行了相關(guān)研究[7-13]。
本研究以影像科醫(yī)師手動分割為金標準,訓練3D U-Net模型,實現(xiàn)對頸椎MR圖像中各結(jié)構(gòu)的自動分割,旨在為后續(xù)頸椎各結(jié)構(gòu)徑線自動測量和疾病診斷奠定基礎(chǔ)。
本研究獲得了本院倫理審查委員會的批準(2019-170),按照本單位人工智能(artificial intelligence,AI)模型訓練規(guī)范執(zhí)行研究方案。根據(jù)本單位AI訓練管理方法定義研發(fā)頸椎MRI圖像中各結(jié)構(gòu)自動分割及徑線測量模型的用例,包括模型的名稱、臨床問題、場景描述、模型在實際工作中的調(diào)用流程、模型輸入輸出數(shù)據(jù)結(jié)構(gòu)等。將頸椎矢狀面分割結(jié)果和橫軸面分割結(jié)果進行空間配準和定位,用程序?qū)崿F(xiàn)對頸椎各結(jié)構(gòu)(椎間盤、硬膜囊等)徑線及體積的測量和評價,結(jié)果可自動輸入到頸椎MRI結(jié)構(gòu)化報告中。設(shè)定AI模型的返回結(jié)果:頸椎椎體的定位、硬膜囊和脊髓的體積、徑線等,返回結(jié)果應用于頸椎MRI結(jié)構(gòu)化報告的“病灶列表”模塊(圖1)。
圖1 頸椎MRI分割及徑線測量模型的訓練流程。
自本院PACS系統(tǒng)回顧性搜集2020年4月-9月疑診頸椎病患者的MR圖像。排除標準:①行MR檢查前有手術(shù)等治療史;②有頸椎骨折、畸形和感染等;③不能配合檢查,圖像質(zhì)量不佳。最終將符合要求的92例患者共178掃描序列納入研究。年齡4~85歲,平均(55.6±21.8)歲,男、女比例為1.2∶1。
掃描設(shè)備包括GE Signa Excite 3.0T(48例)、GE Discovery HD750 3.0T(5例)、Siemens Magnetom Prisma 3.0T(2例)、Siemens Aera 1.5T(14例)、Phi-lips Ingenia 3.0T(3例)、Philips Achieva 1.5T(3例)、Philips Multiva 1.5T(17例)。掃描序列為頸椎矢狀面T1WI和T2WI,主要序列和掃描參數(shù):TR 550~800 ms、TE 7~14 ms(T1WI)或TR 2800~3000 ms、TE 100~130 ms(T2WI);層厚3.0~4.0 mm,層間距3.3~4.4 mm,視野22×22 cm~25×25 cm,矩陣≥320×224。
將頸椎矢狀面T1WI和T2WI的DICOM格式圖像轉(zhuǎn)換為NiFTI格式。由一位低年資放射科住院醫(yī)師(閱片經(jīng)驗2年)使用ITK-SNAP 3.6.0軟件在頸椎矢狀面T2WI圖像上進行標注,手工調(diào)整窗寬和窗位。標注的結(jié)構(gòu)包括椎體 、椎間盤 、硬膜囊、椎間孔和脊髓。然后由一位高年資放射科專家(閱片經(jīng)驗≥15年)對低年資醫(yī)師的標注進行復核,如有不一致的情況,以高年資放射科專家的標注為金標準,將修改好的T2WI圖像上的標簽匹配至T1WI圖像上,并進行修改和確認,標注內(nèi)容和標準如下。①椎體的標注:自C2椎體向下,在全部顯示椎體的區(qū)域逐層標注,椎體的前緣及上、下緣沿椎體邊緣進行標注,后緣標注時根據(jù)后上緣、后下緣確定邊界并進行標注(不包括椎板、棘突等附件結(jié)構(gòu))。②椎間盤的標注:自C2-3椎間盤以下,在全部顯示間盤的區(qū)域逐層標注,以T2WI椎體與椎間盤交界的低信號上、下邊緣,以椎間盤與椎前軟組織的交界為前緣,以椎間盤與硬膜囊的交界為后緣。③硬膜囊的標注:自枕骨大孔以下逐層標注掃描范圍內(nèi)包含硬膜囊的圖像,不包括硬膜外脂肪。④脊髓的標注:自延髓以下逐層標注掃描范圍內(nèi)包含脊髓的圖像,不包括神經(jīng)根。⑤椎間孔的標注:自C2-3椎間孔以下逐層標注掃描范圍內(nèi)的椎間孔,其關(guān)鍵標志是由椎體、椎間盤及椎板邊緣組成的完整環(huán)形及大部分完整環(huán)形(超過75%環(huán)形)的椎間孔區(qū)域。
使用的硬件為GPU NVIDIA Tesla P100 16G,軟件為Python3.6、Pytorch 0.4.1、Opencv、Numpy和SimpleITK等,Adam為訓練優(yōu)化器。圖像預處理參數(shù):size=16×448×256(z,y,x),自動窗寬、窗位。178個數(shù)據(jù)按照8︰1︰1的比例隨機分為訓練集(train dataset,n=138)、調(diào)優(yōu)集(validation dataset,n=20)和測試集(test dataset,n=20)。采用Coarse-to-Fine序貫訓練的方法訓練3D U-Net網(wǎng)絡(luò)深度學習模型:先訓練一個頸椎矢狀面MRI粗略分割模型,將得到的粗略分割結(jié)果作為掩膜(mask),再訓練精細分割模型。輸入頸椎矢狀面T1WI、T2WI圖像和各結(jié)構(gòu)的標注文件,分割椎體、椎間盤、硬膜囊、脊髓和椎間孔,訓練參數(shù):每次讀取的圖像數(shù)量(batch size)為4,學習率(learning rate)為0.0001,訓練次數(shù)(epoch)為400。
客觀評價:使用Dice相似系數(shù)(Dice similarity coefficient,DSC)評估U-Net模型的分割性能,計算公式為:
(1)
其中,A為放射科醫(yī)師在頸椎MR圖像上手工標注的頸椎某結(jié)構(gòu)的體素數(shù),B為在頸椎MR圖像上模型分割的頸椎某結(jié)構(gòu)的體素數(shù)。DSC是衡量兩個像素集合之間相似性的度量指標,取值范圍為0~1,數(shù)值越大,代表兩個集合之間的相似度越高。
使用MedCalc 15.8軟件對訓練集、調(diào)優(yōu)集及測試集中各結(jié)構(gòu)的DSC值進行正態(tài)性檢驗,對不符合正態(tài)分布的數(shù)據(jù)分別使用Friedman秩和檢驗及Kruskal-Wallis秩和檢驗,比較各結(jié)構(gòu)的DSC值在三組內(nèi)及組間是否存在統(tǒng)計學差異。
主觀評價:在測試集中,由影像醫(yī)師在正中矢狀面圖像上評估模型分割椎體、椎間盤、硬膜囊和脊髓的結(jié)果,在雙側(cè)旁正中矢狀面圖像上評估模型分割椎間孔的結(jié)果。當模型的分割結(jié)果完全覆蓋目標解剖區(qū)域,認為滿足徑線測量的要求;分割結(jié)果與目標區(qū)域有任何不重合之處,認為不滿足徑線測量的要求。
在訓練集、調(diào)優(yōu)集以及測試集中,分割模型對頸椎各結(jié)構(gòu)的標注結(jié)果與人工標注結(jié)果的DSC值及P值見表1。各結(jié)構(gòu)的DSC值在訓練集、調(diào)優(yōu)集和測試集之間三組的差異均有統(tǒng)計學意義(P<0.001)。在3個數(shù)據(jù)集中,頸椎各結(jié)構(gòu)之間的DSC值的差異均具有統(tǒng)計學意義(P<0.001)。在測試集中,平均DSC值為0.80±0.13,其中硬膜囊的DSC值最高,椎間孔的DSC值最低(圖2、3)。
表1 分割模型頸椎MR各結(jié)構(gòu)的DSC值
圖2 測試集病例T1WI上模型對頸椎各結(jié)構(gòu)的分割結(jié)果。a)正中矢狀面圖像上顯示硬膜囊的分割結(jié)果,DSC值為0.9;b)正中矢狀面圖像上顯示脊髓的分割結(jié)果,DSC值為0.82;c)正中矢狀面圖像上椎體和椎間盤的分割結(jié)果,DSC值分別為0.86和0.84;d)左側(cè)旁正中矢狀面圖像上顯示椎間孔的分割結(jié)果,DSC值為0.70;e)右側(cè)旁正中矢狀面圖像上顯示椎間孔的分割結(jié)果,DSC值為0.73;f)模型分割結(jié)果的三維圖像。圖3 測試集病例T2WI上模型對頸椎各結(jié)構(gòu)的分割結(jié)果。a)正中矢狀面圖像上顯示硬膜囊的分割結(jié)果,DSC值為0.87;b)正中矢狀面圖像上顯示脊髓的分割結(jié)果,DSC值為0.84;c)正中矢狀面圖像上椎體和椎間盤的分割結(jié)果,DSC值分別為0.87和0.8;d)左側(cè)旁正中矢狀面圖像上顯示椎間孔的分割結(jié)果,DSC值為0.72;e)右側(cè)旁正中矢狀面圖像上顯示椎間孔的分割結(jié)果,DSC值為0.72;f)模型分割結(jié)果的三維圖像。
影像醫(yī)師對測試集中模型分割結(jié)果進行主觀評價,3D U-Net模型對頸椎所有結(jié)構(gòu)的分割均能滿足徑線測量的要求。
X線、CT和MRI均已經(jīng)被廣泛應用于頸椎病的診斷,MRI相比X線和CT具有更高的軟組織分辨力,可清晰顯示脊髓和椎間盤等軟組織結(jié)構(gòu),因此能夠提供頸椎病診斷相關(guān)的定性和定量影像學信息。由于日常工作中對頸椎各結(jié)構(gòu)的人工測量耗時較多,所以在實際臨床工作中,影像科醫(yī)師對于頸椎MRI報告的書寫大多局限在定性診斷,較少進行定量指標的測量,導致影像報告的結(jié)果存在一定的主觀性。在本研究中,我們訓練了3D U-Net模型用于在矢狀面MR圖像中分割頸椎的主要結(jié)構(gòu),結(jié)果顯示模型的分割結(jié)果較好,為后續(xù)自動定量測量奠定了基礎(chǔ)。
既往有一些研究中提出了半自動或自動方法分割頸椎X線、CT或MR圖像中的結(jié)構(gòu)。在X線平片方面,Arif等[7]使用深度全卷積神經(jīng)網(wǎng)絡(luò)(fully convolu-tional neural networks,FCN)來定位頸椎X線側(cè)位片中的頸椎區(qū)域,然后利用深度概率空間回歸網(wǎng)絡(luò)對頸椎椎體中心進行定位,最后采用形狀感知深度分割網(wǎng)絡(luò)對圖像中的脊椎進行分割。最終得到了可在X線側(cè)位片中自動分割頸椎椎體的模型,其DSC值為0.84,形狀誤差為1.69 mm。Shin等[8]利用深度學習系統(tǒng)(deep learning system,DLS)分析了韓國不同性別、不同年齡段人群中頸椎曲度的變化趨勢,通過使用頸椎X線側(cè)位片訓練深度學習模型(訓練集325例、調(diào)優(yōu)集130例、測試集130例),并使用該模型對13691例頸椎側(cè)位X線片進行了頸椎分段和曲度測量,該模型的DSC值達到了0.96。
在CT方面,Zhang等[9]采用自適應閾值濾波器從CT圖像中分割頸椎椎體,將基于PointNet++的單椎體分割算法引入到頸椎分割中,最后利用基于邊緣信息的融合分割算法清晰地區(qū)分出兩個椎骨的邊緣,該模型的DSC值為0.96,明顯優(yōu)于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)分割模型。Bae等[10]使用2D U-Net模型實現(xiàn)了頸椎椎體及附件結(jié)構(gòu)的三維分割,該模型的DSC值為0.94。Liu等[11]使用稀疏椎間盤組合模型(sparse intervertebral fence composition,SiFC),通過對椎間盤的分割來重建相鄰椎體之間的邊界,顯著降低了頸椎分割的難度,該模型的DSC值為0.95。
在MRI方面,Daenzer等[12]提出了一種基于直方圖特征的機器學習頸椎分割方法(histograms of oriented gradients for volumetric data,VolHOG)對C3~C7頸椎椎體分別進行分割,其DSC值達0.98。Rak等[13]使用CNN分割脊柱3D-MRI上的所有椎體,其DSC值為0.96。上述研究中使用的影像檢查方法、模型分割的對象不盡相同(但大多集中在對頸椎椎體和附件的分割),結(jié)果和評價指標也不完全一致,多數(shù)研究中使用DSC作為評價指標。本研究中使用3D U-Net網(wǎng)絡(luò)結(jié)構(gòu)[14],以Coarse-to-Fine的方式序貫訓練分割模型,進行分割的頸椎結(jié)構(gòu)包括椎體、椎間盤、硬膜囊、脊髓和椎間孔等,最終建立的分割模型在測試集中對頸椎所有結(jié)構(gòu)的分割結(jié)果與人工標注間的平均DSC值為0.80±0.13。本研究中建立的分割模型的客觀評價指標值稍低于既往研究中單一分割模型,分析其原因可能是訓練樣本量較少、部分結(jié)構(gòu)特征不典型所致。但主觀評價的結(jié)果顯示分割結(jié)果符合臨床要求。
在本研究中,硬膜囊、脊髓、椎體和椎間盤的分割結(jié)果好于椎間孔的分割結(jié)果,分析其原因是由于椎間孔本身體積較小、與周圍其它結(jié)構(gòu)的重疊較多且信號強度接近,在標注時容易存在一定的主觀偏差,故3D U-Net模型無法精準分割椎間孔的結(jié)構(gòu),這也導致了最終模型的客觀評價結(jié)果低于既往研究中單一分割模型,雖然DSC值低于其它4個解剖結(jié)構(gòu),但考慮到椎間孔本身結(jié)構(gòu)較小且無明確的分界標志,對于影像科醫(yī)師及臨床醫(yī)師來說,模型將椎間孔區(qū)域分割出來即可達標,出現(xiàn)輕度偏差是可以接受的。
本研究是使用深度學習方法實現(xiàn)頸椎各徑線自動測量的序貫任務之一,即先完成頸椎各結(jié)構(gòu)的分割,在后續(xù)的研究中再開發(fā)算法測量相關(guān)徑線,從而實現(xiàn)對頸椎病的定量診斷。在模型的準確性較高時,可以自動生成結(jié)構(gòu)化報告,提高臨床診斷的準確性和效率,目前正在進行的是增加頸椎橫軸面MR圖像的標注和迭代。由本研究已經(jīng)完成的工作可知,在數(shù)據(jù)量并不大的情況下,不同廠商、不同場強MR掃描設(shè)備獲得的圖像均可達到較好的分割效果,可以預見在納入更多的圖像迭代后,模型對不同設(shè)備的適用性將不受限制。但就提高模型的泛化能力而言,仍需要嚴格制定和執(zhí)行影像檢查規(guī)范,以保證不同設(shè)備頸椎MR圖像的檢查質(zhì)量,并在模型迭代過程中納入各種有輕微偽影的病例,以提高模型在圖像質(zhì)量欠佳時的魯棒性。
綜上所述,本研究使用3D U-Net深度學習分割算法,建立了分割頸椎矢狀面MR圖像中椎體、椎間盤、硬膜囊、脊髓和椎間孔的自動分割模型,為下一步建立頸椎各結(jié)構(gòu)徑線自動測量和頸椎病的定量診斷模型提供了基礎(chǔ)。