辛培錦,任翠,秦思源,趙偉麗,劉珂,顏瑞馨,王奇政,陳永曄,郎寧
中軸型脊椎關(guān)節(jié)炎(axial spondyloarthritis,axSpA)是一類以腰背痛及骶髂關(guān)節(jié)和脊柱的慢性炎癥為代表癥狀的疾病[1]。axSpA初期癥狀隱匿且臨床表現(xiàn)缺乏特異性,經(jīng)常被延誤診斷[2]。隨著axSpA 病程的進(jìn)展,其臨床表現(xiàn)進(jìn)行性加重,未及時(shí)治療可導(dǎo)致不可逆的中軸骨畸形,致使活動(dòng)受限[3]。因此,早期診斷及早期治療以改善axSpA的預(yù)后意義重大。
影像技術(shù)在輔助診斷及鑒別診斷axSpA 的過(guò)程中不可或缺。在《影像學(xué)技術(shù)在脊柱關(guān)節(jié)炎中應(yīng)用的中國(guó)專家共識(shí)(2021 年版)》[4]中,骶髂關(guān)節(jié)MRI 被認(rèn)為是檢測(cè)放射學(xué)陰性(即X 線平片陰性)的疑診患者和axSpA 活動(dòng)性病變的首選方法。骶髂關(guān)節(jié)MRI在axSpA的早期診斷中起到了積極的作用。然而,近年越來(lái)越多的研究卻發(fā)現(xiàn)骨髓水腫缺乏特異性,可能存在于產(chǎn)后女性、入伍新兵乃至正常人群的骶髂關(guān)節(jié)MRI中[5-6]。這可能會(huì)導(dǎo)致假陽(yáng)性表現(xiàn),進(jìn)而導(dǎo)致axSpA 的過(guò)度診斷。另外,不同放射科醫(yī)生對(duì)骶髂關(guān)節(jié)MRI圖像的解讀可能不同,這種觀察者之間的變異性可能會(huì)影響診斷的準(zhǔn)確性[7]。2021 年,JIBRI 等[8]對(duì)2019 年更新的年國(guó)際脊柱關(guān)節(jié)炎評(píng)估協(xié)會(huì)(Assessment of SpondyloArthritis International Society, ASAS)axSpA骶髂關(guān)節(jié)陽(yáng)性病變分類標(biāo)準(zhǔn)的閱讀者間一致性進(jìn)行了研究。該研究中,2 名風(fēng)濕領(lǐng)域影像學(xué)專家對(duì)94 例活動(dòng)性axSpA 患者的骶髂關(guān)節(jié)MRI 圖像進(jìn)行判讀,發(fā)現(xiàn)對(duì)骶髂關(guān)節(jié)活動(dòng)性炎癥的判讀呈中等一致性,骨侵蝕的一致性較差。采用新技術(shù)對(duì)骶髂關(guān)節(jié)MRI進(jìn)行分析,可能會(huì)減少視覺(jué)解讀帶來(lái)的主觀性,并允許對(duì)成像數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化評(píng)估,進(jìn)而提高診斷準(zhǔn)確性。
影像組學(xué)是指從醫(yī)學(xué)影像中對(duì)特定感興趣區(qū)(region of interest, ROI)的定量特征進(jìn)行高通量計(jì)算提取,將醫(yī)學(xué)數(shù)字圖像轉(zhuǎn)換為深層數(shù)據(jù)進(jìn)行定量分析,最終可用于疾病的輔助診斷和分類分級(jí)[9]。利用該技術(shù),可從MRI 中提取眾多細(xì)微的定量特征,建立提高臨床診斷準(zhǔn)確度的模型。影像組學(xué)在腫瘤學(xué)領(lǐng)域已有較豐富的研究[10],但由于包括axSpA 在內(nèi)的肌骨疾病影像表現(xiàn)多樣,病變界限模糊,目前僅有少數(shù)研究使用影像組學(xué)方法分析骶髂關(guān)節(jié)MRI[11-12],且這些研究多集中于對(duì)影像特征的區(qū)分,尚未建立有效的能夠輔助臨床診斷的模型。本研究探討利用臨床數(shù)據(jù)及骶髂關(guān)節(jié)MRI 影像建立用于診斷axSpA的多模態(tài)融合影像組學(xué)模型,以期輔助提高臨床醫(yī)師診斷的效率。
本研究遵守《赫爾辛基宣言》,經(jīng)北京大學(xué)第三醫(yī)院倫理委員會(huì)批準(zhǔn),免除受試者知情同意,倫理批準(zhǔn)號(hào):M2022399,國(guó)家臨床試驗(yàn)編號(hào):MR-11-22-009236。
回顧性分析于2019 年4 月至2021 年9 月間在北京大學(xué)第三醫(yī)院接受骶髂關(guān)節(jié)MRI 檢查的患者臨床及影像資料。納入標(biāo)準(zhǔn):(1)年滿18 歲;(2)因懷疑axSpA(患有下背痛)就診;(3)無(wú)腰椎及骨盆手術(shù)史;(4)1 年內(nèi)無(wú)骶髂關(guān)節(jié)外傷史;(5)無(wú)骶髂關(guān)節(jié)感染史;(6)不合并其他結(jié)締組織病史;(7)無(wú)惡性腫瘤病史。排除標(biāo)準(zhǔn):(1)沒(méi)有明確的臨床診斷;(2)骶髂關(guān)節(jié)MRI圖像質(zhì)量差(如運(yùn)動(dòng)偽影重)、覆蓋范圍不完整或缺少所需序列;(3)臨床資料不完整。結(jié)合醫(yī)院電子病歷系統(tǒng)中臨床醫(yī)師的記錄,將患者分為確診患者及健康對(duì)照組。所有axSpA 確診患者均符合2019 年ASAS 工作組的診斷標(biāo)準(zhǔn)。健康對(duì)照組與axSpA 患者1∶1 配對(duì),為同期接受骶髂關(guān)節(jié)MRI 檢查,符合上述納入及排除標(biāo)準(zhǔn),因懷疑axSpA就診而后經(jīng)臨床醫(yī)師明確排除axSpA,且未患有其他疾病的患者,使兩組年齡和性別一致。
從醫(yī)院電子病歷系統(tǒng)中收集患者的病歷及臨床數(shù)據(jù)。我們收集了所有患者和健康對(duì)照組的性別、年齡、紅細(xì)胞沉降率(erythrocyte sedimentation rate, ESR)和C 反 應(yīng) 蛋 白(C-reactive protein,CRP)結(jié)果。
所有的MRI 圖像從3 臺(tái)3.0 T 磁共振儀中獲取,2 臺(tái)型號(hào)為GE Discovery 750w(GE 醫(yī)療,美國(guó)),1 臺(tái)型號(hào)為Discovery 750(GE醫(yī)療,美國(guó)),3臺(tái)磁共振儀的掃描參數(shù)一致。納入研究的掃描序列有斜冠狀位(平行于骶骨長(zhǎng)軸)快速自旋回波T1WI和斜冠狀位快速自旋回波脂肪抑制(fat-supressed, FS)T2WI。T1WI序列掃描參數(shù):重復(fù)時(shí)間450 ms,回波時(shí)間85 ms,層厚4 mm,層間隔0.5 mm,視野30 cm×30 cm,矩陣320×256,激發(fā)次數(shù)1;FS-T2WI 序列掃描參數(shù):重復(fù)時(shí)間3200 ms,回波時(shí)間85 ms,層厚4 mm,層間隔0.5 mm,視野30 cm×30 cm,矩陣320×256,激發(fā)次數(shù)4。
將所有入組者的骶髂關(guān)節(jié)MRI 斜冠狀位T1WI 及FS-T2WI 導(dǎo) 入ITK-SNAP 軟 件(版 本3.8.0,www.itksnap.org)[13]。在高年資醫(yī)師的指導(dǎo)下,由2 名分別具有2 年和5 年經(jīng)驗(yàn)的放射科醫(yī)生,在6 個(gè)連續(xù)骶髂關(guān)節(jié)中心層面上,沿著每側(cè)骶髂關(guān)節(jié)間隙的10 mm范圍勾畫ROI,如圖1所示。
圖1 T1WI(1A)及FS-T2WI(1B)圖像上勾畫受試者工作特征(ROI)示意圖。Fig.1 Regions of interest (ROI) segmented on T1WI (1A) and FS-T2WI(1B) images.
將每個(gè)層面的ROI 合并為1 個(gè)ROI 之后,使用PyRadiomics 平臺(tái)(版本3.0.1)[14]從每種序列勾畫的ROI 中提取了相應(yīng)的組學(xué)特征。為了提取更多的特征,將多種濾波器應(yīng)用于ROI圖像,再?gòu)闹刑崛√卣?。提取的特征遵循成像生物?biāo)志物標(biāo)準(zhǔn)化倡議定義[15],可分為幾何形狀特征、強(qiáng)度特征和紋理特征三組:幾何特征捕捉了ROI 的三維形狀特征;強(qiáng)度特征代表ROI 內(nèi)體素強(qiáng)度的一階統(tǒng)計(jì)分布;紋理特征描述強(qiáng)度的圖案或二階及高階空間分布。
為了評(píng)估圖像分割對(duì)組學(xué)特征穩(wěn)定性的影響,利用組內(nèi)相關(guān)系數(shù)(intra-class correlation coefficient, ICC)進(jìn)行了同一評(píng)估者及2 個(gè)不同評(píng)估者的重復(fù)性分析。同一評(píng)估者間隔2 周對(duì)隨機(jī)選擇的30 例患者圖像進(jìn)行重復(fù)兩次分割,而2 名評(píng)估者則對(duì)另外隨機(jī)選擇的30 例患者圖像進(jìn)行獨(dú)立分割。ICC 被用于評(píng)估從這些ROI 中提取的組學(xué)特征,其中ICC≥0.85被認(rèn)為是不受分割影響的穩(wěn)定特征。經(jīng)使用ICC 進(jìn)行初步篩選后,使用Z分?jǐn)?shù)方法對(duì)所有特征進(jìn)行標(biāo)準(zhǔn)化,以確保特征的數(shù)量級(jí)一致。隨后,使用t檢驗(yàn)計(jì)算所有組學(xué)特征的P值。僅保留P<0.05的影像組學(xué)特征用于進(jìn)一步分析。
為了識(shí)別高度相關(guān)的特征,使用皮爾遜相關(guān)系數(shù)對(duì)高度可重復(fù)特征進(jìn)行進(jìn)一步分析。為了避免冗余,當(dāng)任意兩種特征之間的相關(guān)系數(shù)超過(guò)0.9時(shí)只保留一個(gè)特征。為了在最大化特征具有代表性的同時(shí)使冗余最小化,采用貪心遞歸式消除策略過(guò)濾特征,每次迭代時(shí)刪除當(dāng)前集中冗余度最高的特征。
最終,使用最小絕對(duì)收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸模型篩選構(gòu)建影像組學(xué)標(biāo)簽的特征。根據(jù)正則化權(quán)重λ,LASSO 將許多相關(guān)性低的特征系數(shù)設(shè)置為0。使用最小標(biāo)準(zhǔn)10 倍交叉驗(yàn)證確定最佳λ值,選擇具有最低平均標(biāo)準(zhǔn)誤的λ。
對(duì)臨床特征,我們先后進(jìn)行了單變量和多變量分析。選擇多變量分析中差異具有統(tǒng)計(jì)學(xué)意義的特征用于構(gòu)建列線圖。對(duì)單變量分析中差異具有統(tǒng)計(jì)學(xué)意義的臨床特征,使用邏輯回歸(logistic regression, LR)、隨機(jī)森林(RandomForest)、極端隨機(jī)樹(ExtraTrees)、極端梯度提升(XGBoost)、多變量邏輯回歸(multivariate logistic regression)5 種方式建立機(jī)器學(xué)習(xí)模型。建立這些模型時(shí),采用了5 倍交叉驗(yàn)證,并利用了網(wǎng)格搜索進(jìn)行超參數(shù)調(diào)整。選擇性能最好的模型為臨床標(biāo)簽。
對(duì)經(jīng)LASSO篩選后的影像組學(xué)特征,利用與構(gòu)建臨床標(biāo)簽相同的機(jī)器學(xué)習(xí)模型,選擇其中性能最好的作為影像組學(xué)標(biāo)簽,并用于構(gòu)建列線圖。本研究比較了T1WI 和FS-T2WI 兩種序列的性能。為了評(píng)估這兩種序列的融合是否優(yōu)于單一序列,將兩種序列的特征組合以獲得融合特征集。該融合特征集特征選擇和建立機(jī)器學(xué)習(xí)模型的過(guò)程與單一序列特征集相同。
最終,整合選擇的臨床特征和影像組學(xué)標(biāo)簽以建立列線圖模型。
采用SPSS 24.0(IBM SPSS Inc., USA)軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。采用Kolmogorov-Smirnov 方法檢驗(yàn)定量變量臨床數(shù)據(jù)的正態(tài)性,符合正態(tài)分布的數(shù)據(jù)表示為平均值±標(biāo)準(zhǔn)差(±s)并采用獨(dú)立樣本t檢驗(yàn),偏態(tài)分布的定量數(shù)據(jù)則用中位數(shù)(四分位數(shù)間距)[M(Q1,Q3)]表示,使用Mann-WhitneyU檢驗(yàn),離散變量則使用卡方檢驗(yàn)。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。利用準(zhǔn)確性、受試者工作特征(receiver operating characteristic, ROC)曲線下面積(area under the curve, AUC)及其95%置信區(qū)間(confidence interval,CI)、敏感度、特異度、真陽(yáng)性率、假陽(yáng)性率以及F1分?jǐn)?shù)在訓(xùn)練及測(cè)試集中評(píng)估各個(gè)機(jī)器學(xué)習(xí)模型兩種標(biāo)簽及列線圖的診斷性能。生成校準(zhǔn)曲線來(lái)評(píng)估列線圖模型的校準(zhǔn)性能,利用決策曲線分析確定列線圖模型的臨床效用。
本研究最終建立了一個(gè)納入204 例患者的研究隊(duì)列,其中axSpA 確診患者102 例,健康對(duì)照組102 例。利用計(jì)算機(jī)隨機(jī)數(shù)字生成程序進(jìn)行簡(jiǎn)單隨機(jī)化,將204 例患者按照7∶3 的比例分為訓(xùn)練集和測(cè)試集。具體統(tǒng)計(jì)分析結(jié)果見(jiàn)表1。
表1 訓(xùn)練集和測(cè)試集中患者的基線特征Tab.1 Basic characteristics of the patients in the training set and testing set
對(duì)所有臨床特征進(jìn)行單變量分析,對(duì)單變量分析中P<0.05的變量進(jìn)行多變量分析,并獲得每個(gè)特征的比值比和相應(yīng)的P值,如表2 所示。其中,選擇多變量分析中的ESR(P<0.05)來(lái)構(gòu)建列線圖。圖2 中顯示了每個(gè)臨床特征之間的相關(guān)性,表明CRP、ESR與是否確診axSpA之間存在明顯的線性關(guān)系。
表2 臨床特征的單變量和多變量分析Tab.2 Uni-variable and multi-variable analysis of clinical characteristics
圖2 C 反應(yīng)蛋白(CRP)、紅細(xì)胞沉降率(ESR)與是否確診中軸型脊柱關(guān)節(jié)炎的Spearman 相關(guān)系數(shù)。圖3 訓(xùn)練集(3A)和測(cè)試集(3B)中基于臨床特征的不同機(jī)器學(xué)習(xí)模型的受試者工作特征曲線。AUC:曲線下面積;CI:置信區(qū)間;LR:邏輯回歸;RandomForest:隨機(jī)森林;ExtraTrees:極端隨機(jī)樹;XGBoost:極端梯度提升;MLP:多變量邏輯回歸。Fig.2 Spearman coefficients of C-reactive protein (CRP), erythrocyte sedimentation rate (ESR) and diagnosis of axial spondyloarthritis.Fig.3 The receiver operating characteristic (ROC) curves for different machine learning models based on clinical characteristics in the training set (3A) and testing set (3B).AUC: area under the curve; CI: confidence interval; LR: logistic regression; RandomForest:random forest ExtraTrees: Extremely randomized trees; XGBoost: eXtreme Gradient Boosting; MLP: multivariate logistic regression.
我們提取了單變量分析中P<0.05的臨床特征,包括CRP 和ESR,并構(gòu)建了多個(gè)機(jī)器學(xué)習(xí)模型。將測(cè)試集中AUC 最高的LR 模型(AUC=0.884, 95%CI:0.804-0.964)選為臨床標(biāo)簽(表3、圖3)。
表3 基于臨床特征的機(jī)器學(xué)習(xí)模型在訓(xùn)練集和測(cè)試集中的效能Tab.3 Performance of the machine learning models based on clinical characteristics in the training and testing set
從T1WI和FS-T2WI圖像中提取了共計(jì)1834種影像組學(xué)特征。包括:360種一階特征,14種形狀特征,以及1460 種紋理特征。為了增強(qiáng)特征集,我們合并了2 種不同時(shí)間模態(tài)的特征,最終得到3368 種融合特征。利用LASSO回歸模型,從這些特征中分別篩選了36 種融合特征、23 種T1WI 特征和17 種FS-T2WI 特征。所篩選的特征及λ系數(shù)如圖4所示。
圖4 篩選的融合特征(4A),T1WI特征(4B)和脂肪抑制(FS)T2WI特征(4C)及其λ系數(shù)。Fig.4 Selected fusion features (4A), T1WI features (4B) and fat-suppressed (FS) T2WI features (4C), and λ coefficients.
對(duì)于所篩選的T1WI、FS-T2WI 以及融合影像組學(xué)特征,利用了多種機(jī)器學(xué)習(xí)模型構(gòu)建預(yù)測(cè)模型(表4)。其中利用T1W1 和融合組學(xué)特征訓(xùn)練的機(jī)器學(xué)習(xí)模型中表現(xiàn)最佳的為L(zhǎng)R,其測(cè)試集AUC 分別為0.778(95%CI: 0.661-0.895)和0.905(95%CI: 0.829-0.981);利用FS-T2WI 特征訓(xùn)練的模型中表現(xiàn)最佳的則為XGBoost,其測(cè)試集AUC為0.907(95%CI: 0.832-0.981)?;诤Y選的融合影像組學(xué)特征的LR模型診斷性能最佳,過(guò)度擬合低且AUC高(圖5),這表明融合組學(xué)特征優(yōu)于單序列特征。最終,將基于所篩選的融合影像組學(xué)特征的LR模型選為最終的影像組學(xué)標(biāo)簽(Rad_Sig)。
圖5 訓(xùn)練集(5A)和測(cè)試集(5B)中基于T1加權(quán)、脂肪抑制T2加權(quán)以及融合影像組學(xué)特征的LR 模型的受試者工作特征曲線。AUC:曲線下面積;CI:置信區(qū)間。Fig.5 The receiver operating characteristic (ROC) curves of LR model based on T1-weighted, fat-suppressed T2-weighted and fused radiomics features in the training set (5A) and testing (5B) set.AUC: area under the curve; CI: confidence interval.
基于ESR 和前述所得的Rad_Sig,我們構(gòu)建了可用于輔助診斷的列線圖模型,如圖6 所示。最終所得的列線圖模型在訓(xùn)練集(AUC=0.997, 95%CI:0.992-1.000)和測(cè)試集(AUC=0.944, 95%CI: 0.889-1.000)中表現(xiàn)出了優(yōu)良的診斷性能。表5 及圖7 展示了列線圖模型同臨床標(biāo)簽及影像組學(xué)標(biāo)簽的效能 比較。圖8 所示校準(zhǔn)曲線顯示列線圖模型的校準(zhǔn)性能良好,決策曲線顯示列線圖模型具有更好的預(yù)測(cè)性能和臨床應(yīng)用價(jià)值。表6 所示DeLong 檢驗(yàn)發(fā)現(xiàn),訓(xùn)練集中臨床標(biāo)簽與列線圖及融合影像組學(xué)標(biāo)簽診斷axSpA的效能存在顯著差異(P<0.05)(表6)。
表5 臨床標(biāo)簽、融合影像組學(xué)標(biāo)簽及列線圖模型診斷axSpA的指標(biāo)Tab.5 Indicators for the diagnosis of axSpA using clinical label, fusion radiomics label and nomogram model
表6 臨床標(biāo)簽、融合影像組學(xué)標(biāo)簽及列線圖模型之間的DeLong檢驗(yàn)結(jié)果數(shù)值Tab.6 Results of DeLong test between clinical label, fusion radiomics label and nomogram model
圖6 臨床使用的列線圖。ESR:紅細(xì)胞沉降率;Rad_Sig:融合影像組學(xué)標(biāo)簽。Fig.6 Nomogram for clinical use.ESR: erythrocyte sedimentation rate;Rad_Sig: fusion radiomics label.
圖7 訓(xùn)練集(7A)及測(cè)試集(7B)中臨床標(biāo)簽(Clinic_Sig)、融合影像組學(xué)標(biāo)簽(Rad_Sig)及列線圖模型(nomogram)的受試者工作特征曲線。AUC:曲線下面積;CI:置信區(qū)間。Fig.7 The receiver operating characteristic (ROC) curves of clinical label (Clinic_Sig), fusion radiomics label (Rad_Sig) and nomogram model in training set (7A) and testing set (7B).AUC: area under the curve; CI:confidence interval.
圖8 測(cè)試集中臨床標(biāo)簽(Clinic_Sig)、融合影像組學(xué)標(biāo)簽(Rad_Sig)及列線圖模型(nomogram)的校準(zhǔn)曲線(8A)和決策曲線(8B)。Fig.8 Calibration curve (8A) and decision curve (8B) of clinical label(Clinic_Sig), fusion radiomics label (Rad_Sig), and nomogram model in the testing set.
本研究中,我們結(jié)合廣泛用于輔助診斷的臨床特征及基于影像組學(xué)的融合特征標(biāo)簽,成功地建立了能用于協(xié)助診斷axSpA 患者的列線圖模型。該模型在訓(xùn)練集和測(cè)試集中的AUC 分別為0.997(95%CI: 0.992-1.000)和0.944(95%CI: 0.889-1.000)。2019 年,JONES 等[16]總結(jié)了近年來(lái)國(guó)內(nèi)外將骶髂關(guān)節(jié)MRI 用于診斷axSpA 的研究發(fā)現(xiàn),這些研究以骨髓水腫為主要標(biāo)準(zhǔn),MRI 的敏感度在0.35 至0.91 之間,特異度在0.42 至0.97 之間。本研究所得的影像組學(xué)標(biāo)簽及列線圖模型的診斷效能表現(xiàn)優(yōu)良,優(yōu)于上述基于判讀骶髂關(guān)節(jié)MRI的研究,也優(yōu)于目前國(guó)內(nèi)外其他類似利用影像組學(xué)技術(shù)分析骶髂關(guān)節(jié)MRI的研究。這表明影像組學(xué)技術(shù)及列線圖模型優(yōu)于人工判讀影像,為更早的診斷axSpA 帶來(lái)了希望。長(zhǎng)久以來(lái),早期且準(zhǔn)確診斷axSpA是一項(xiàng)艱巨的挑戰(zhàn),患者常常在首診數(shù)年后方能確診[17]。本研究為進(jìn)一步利用影像組學(xué)技術(shù),建立能夠協(xié)助臨床醫(yī)師判讀骶髂關(guān)節(jié)MRI以及更早診斷axSpA的工具打下了基礎(chǔ)。
ESR 和CRP 是少數(shù)在臨床用于診斷axSpA 以及預(yù)測(cè)其疾病進(jìn)展的生物標(biāo)志物[18]。本研究對(duì)臨床因素的多變量回歸分析表明,ESR 水平是診斷axSpA 的獨(dú)立預(yù)測(cè)因素,這與之前的研究一致[19-20]。盡管CRP 和ESR 在單變量分析中都具有顯著性,CRP 卻并不是診斷的獨(dú)立危險(xiǎn)因素。非特異性腰痛患者和肥胖患者中的CRP 水平也會(huì)升高,這可能導(dǎo)致其在本研究中對(duì)于axSpA 診斷價(jià)值的下降[21]。人類白細(xì)胞抗原B27(Human leukocyte antigen B27, HLA-B27)蛋白也是臨床用于輔助診斷axSpA的生物標(biāo)志物,其與axSpA的關(guān)聯(lián)是迄今已知的任何人類疾病中最強(qiáng)的,大約85%的axSpA 患者HLA-B27 為陽(yáng)性。但HLA-B27 的特異性較低,陽(yáng)性個(gè)體一生中患axSpA 的概率僅為1%-2%[22]。本研究受臨床資料限制,未能完整收集入組患者的HLA-B27檢查結(jié)果,因此未被納入本研究中加以分析。此外,由于本研究入組的患者與健康對(duì)照組兩組患者年齡和性別一致,因此本研究中患者的年齡與性別不是獨(dú)立危險(xiǎn)因素。
2019 年ASAS 的最新定義認(rèn)為,骶髂關(guān)節(jié)MRI 顯示的骨髓水腫是axSpA 骶髂關(guān)節(jié)炎主要的診斷條件[23]。另外,如關(guān)節(jié)囊炎、骨侵蝕部位炎癥、附著點(diǎn)炎和關(guān)節(jié)間隙積液等骶髂關(guān)節(jié)的急性炎癥改變,以及如骨侵蝕、脂肪沉積、骨侵蝕腔內(nèi)脂肪化生、骨質(zhì)硬化、骨性強(qiáng)直和骨芽等結(jié)構(gòu)性變化也可輔助診斷[24]。國(guó)內(nèi)外指南推薦且臨床常用的骶髂關(guān)節(jié)MRI 掃描序列包括FS-T2WI、短時(shí)反轉(zhuǎn)恢復(fù)(short tau inversion recovery, STIR)以 及 T1WI 等[25-26]。FS-T2WI 能夠清晰顯示關(guān)節(jié)面下骨髓水腫、囊變及關(guān)節(jié)積液等信號(hào)變化。STIR 對(duì)炎癥活動(dòng)比較敏感,可檢測(cè)axSpA 的活動(dòng)性,但其特異度欠佳[27]。2019 年,GREESE 等[28]的研究顯示FS-T2WI 檢測(cè)骨炎的效能比STIR更好。T1WI主要顯示關(guān)節(jié)軟骨和軟骨下區(qū)的形態(tài)結(jié)構(gòu),但不易分辨骨皮質(zhì)、骨髓水腫及關(guān)節(jié)積液。本研究中建立的影像組學(xué)模型之所以能有良好的診斷性能,正是因?yàn)闃?gòu)建模型所用的影像組學(xué)特征是從上述MRI 序列中包含上述急性炎癥改變以及結(jié)構(gòu)性變化的骶髂關(guān)節(jié)ROI中所提取的。
本研究結(jié)果中,基于FS-T2WI建立的影像組學(xué)特征機(jī)器學(xué)習(xí)模型診斷axSpA的效能優(yōu)于T1WI,而結(jié)合了兩種序列的融合特征模型的效能又優(yōu)于FS-T2WI和T1WI。這些結(jié)果印證了之前的相關(guān)研究。先前研究顯示,T1WI 主要顯示的脂肪沉積和結(jié)構(gòu)性病變對(duì)axSpA 的診斷效能低于FS-T2WI 顯示的骨髓水腫[29]。WEBER 等[30]研究發(fā)現(xiàn),骶髂關(guān)節(jié)骨髓水腫診斷axSpA的敏感度為67%,而骨髓水腫聯(lián)合骨質(zhì)侵蝕,在保持良好特異度的同時(shí),診斷的敏感度能提高到81%。
利用蘊(yùn)藏在骶髂關(guān)節(jié)MRI中的憑人眼無(wú)法識(shí)別的大量的深層次數(shù)據(jù),影像組學(xué)技術(shù)能挖掘骶髂關(guān)節(jié)MRI輔助診斷axSpA的潛能[31]。到目前為止,國(guó)內(nèi)外僅有少數(shù)研究團(tuán)隊(duì)探索了影像組學(xué)在axSpA診斷中的應(yīng)用。TENóRIO 等[32]使用47 例axSpA 患者的隊(duì)列,將從骶髂關(guān)節(jié)MRI 的頻率衰減反轉(zhuǎn)恢復(fù)和STIR 序列中提取的影像組學(xué)特征與各種臨床指標(biāo)相關(guān)聯(lián),顯示組學(xué)特征具有評(píng)估SpA骶髂關(guān)節(jié)病變的潛力,且構(gòu)建的影像組學(xué)模型支持SpA臨床評(píng)估[13]。利用90例患者的隊(duì)列,KEPP等[33]揭示在區(qū)分骶髂關(guān)節(jié)炎和退行性變化方面,基于影像組學(xué)的紋理分析優(yōu)于定性評(píng)估。然而,上述研究與本研究不同,本研究結(jié)合臨床特征建立了能夠輔助臨床診斷的模型?;?38 例患者(424 例為axSpA,214例為非axSpA),YE等[20]建立了一個(gè)結(jié)合影像組學(xué)特征與臨床指標(biāo)相的列線圖模型。該模型在訓(xùn)練集和測(cè)試集中的AUC 分別為0.90(95%CI:0.86-0.93)和0.90(95%CI: 0.85-0.94)。YE等僅使用由影像組學(xué)標(biāo)簽中各個(gè)組學(xué)特征及其相應(yīng)LASSO系數(shù)計(jì)算得出的Rad_Score構(gòu)建列線圖模型,而本研究在構(gòu)建臨床模型和組學(xué)模型時(shí)嘗試了多種機(jī)器學(xué)習(xí)算法,由這些算法所得的最佳模型構(gòu)建的列線圖能顯示出更好的性能。因此,本研究所得的列線圖模型在訓(xùn)練集和測(cè)試集中的AUC均優(yōu)于YE等的列線圖模型,能夠更進(jìn)一步提高輔助診斷axSpA的效率。
本研究的局限性包括:(1)本研究為回顧性隊(duì)列研究,盡管已選取性別和年齡匹配的對(duì)照組,但可能存在選擇偏倚,需要前瞻性研究以進(jìn)一步證實(shí)結(jié)果;(2)本研究樣本量相對(duì)較少且來(lái)源于單一醫(yī)療機(jī)構(gòu),有待進(jìn)行大樣本、多個(gè)醫(yī)療中心的研究,以驗(yàn)證研究結(jié)果的可靠性;(3)本研究只采用了常規(guī)掃描序列提取的組學(xué)特征,從動(dòng)態(tài)對(duì)比增強(qiáng)、擴(kuò)散加權(quán)成像、Dixon 方法及三維高分辨率MR 等不常用于axSpA 篩查的序列圖像中[34-35],可提取更多種類的影像組學(xué)特征,以構(gòu)建效能更高的模型;(4)本研究使用手工勾畫ROI既復(fù)雜又耗時(shí),引入類似于KUCYBA?A等[36]使用的ROI自動(dòng)分割技術(shù),可提高ROI勾畫的可靠性和再現(xiàn)性。
綜上所述,骶髂關(guān)節(jié)MRI影像組學(xué)特征與臨床參數(shù)結(jié)合建立的聯(lián)合列線圖模型能夠有效區(qū)分axSpA患者和健康對(duì)照組,影像組學(xué)技術(shù)在輔助臨床診斷axSpA方面具有重大潛能以及廣泛的臨床應(yīng)用前景。
作者利益沖突聲明:全體作者均聲明無(wú)利益沖突。
作者貢獻(xiàn)聲明:郎寧、任翠設(shè)計(jì)本研究的方案,并對(duì)稿件重要內(nèi)容進(jìn)行了修改;辛培錦起草和撰寫稿件,獲取、分析并解釋本研究的數(shù)據(jù);秦思源,趙偉麗,劉珂,顏瑞馨,王奇政,陳永曄協(xié)助獲取及分析本研究的數(shù)據(jù),對(duì)稿件進(jìn)行了修改;郎寧、任翠分別獲得了國(guó)家自然科學(xué)基金、北京大學(xué)第三醫(yī)院臨床重點(diǎn)項(xiàng)目基金資助;全體作者都同意發(fā)表最后的修改稿,同意對(duì)本研究的所有方面負(fù)責(zé),確保本研究的準(zhǔn)確性和誠(chéng)信。