繆壽亮,林婷婷,肖琴琴,陳丹,葉魯思,鄭祥武
溫州醫(yī)科大學(xué)附屬第一醫(yī)院,浙江 溫州 325015,1.放射科;2.風(fēng)濕免疫科
中軸型脊柱關(guān)節(jié)?。╝xial spondyloarthritis,axSpA)是一個(gè)異質(zhì)性很強(qiáng)的疾病,臨床表現(xiàn)主要為慢性腰背痛,常累及40歲以下的年輕男性,主要侵犯骶髂關(guān)節(jié),受累關(guān)節(jié)可逐漸發(fā)生結(jié)構(gòu)損害、新骨形成、關(guān)節(jié)融合而致關(guān)節(jié)活動(dòng)受限、功能減退,從而嚴(yán)重影響患者工作及生活質(zhì)量,具有較高致殘 性[1-3]。然而,axSpA的臨床表現(xiàn)及實(shí)驗(yàn)室檢查指標(biāo)缺乏特異性,影像學(xué)CT檢查早期也可呈陰性表現(xiàn),導(dǎo)致該病常易被延遲診斷[4],早期診斷axSpA并有效干預(yù),可阻止患者關(guān)節(jié)結(jié)構(gòu)損害及延緩其影像學(xué)進(jìn)展,減少疾病的致殘率。本研究探討基于CT影像組學(xué)和臨床危險(xiǎn)因素的支持向量機(jī)(support vector machine, SVM)對(duì)axSpA的診斷價(jià)值,旨在提升其診斷效能。
1.1 一般資料 收集2012年10月至2019年2月在溫州醫(yī)科大學(xué)附屬第一醫(yī)院因腰背痛就診568例患者,最終臨床診斷axSpA 319例,非axSpA 249例,按7:3隨機(jī)將患者分為訓(xùn)練組與驗(yàn)證組。所有患者均有骶髂關(guān)節(jié)CT資料,臨床資料包括年齡、性別、HLA-B27、血沉、C反應(yīng)蛋白和疾病持續(xù)時(shí)間。納入標(biāo)準(zhǔn):①風(fēng)濕病學(xué)專(zhuān)家利用國(guó)際脊椎關(guān)節(jié)炎學(xué)會(huì)(ASAS)分類(lèi)標(biāo)準(zhǔn)[5]來(lái)診斷為非axSpA或axSpA;②骶髂關(guān)節(jié)CT檢查均為同一臺(tái)機(jī)器;③CT檢查和實(shí)驗(yàn)室檢查相隔不超過(guò)1周。排除標(biāo)準(zhǔn):CT圖像或臨床資料不完整。本研究獲得溫州醫(yī)科大學(xué)附屬第一醫(yī)院倫理委員會(huì)批準(zhǔn)。
1.2 CT檢查方法與圖像處理 采用美國(guó)GE Bright-Speed 16排CT行骶髂關(guān)節(jié)常規(guī)掃描,掃描參數(shù):管電壓120 kV,電流10~300 mAs,掃描層厚5 mm。所有圖像均由2名對(duì)患者臨床資料不知情的放射科醫(yī)師進(jìn)行分析,在連續(xù)6個(gè)最大骶髂關(guān)節(jié)橫斷位層面上,使用ITK-SNAP軟件(版本3.4.0,http://www.itksnap.org/)沿著骶髂關(guān)節(jié)關(guān)節(jié)面下1 cm以及包含關(guān)節(jié)間隙逐層手動(dòng)勾畫(huà)感興趣區(qū)(volume of interest, VOI),然后合成三維VOI,見(jiàn)圖1。導(dǎo)入GE公司的Artificial Intelligence Kit(A.K)軟件進(jìn)行影像組學(xué)特征提取,自動(dòng)提取出1 316個(gè)定量特征。特征可分為7類(lèi):①一階直方圖參數(shù)(n=252);②形狀參數(shù)(n=14);③灰度共生矩陣(gray-level co-occurrence matrix, GLCM)(n=336);④灰度差值法(gray-level difference method, GLDM)(n=196);⑤灰度運(yùn)行長(zhǎng)度矩陣(gray-level run length matrix, GLRLM)(n=224);⑥灰度尺寸區(qū)域矩陣(gray-level size zone matrix, GLSZM)(n=224);⑦鄰域灰度差值矩陣(neighborhood gray-tone difference matrix, NGTDM)(n=70)。利用組間相關(guān)系數(shù)(intraclass correlation coefficient, ICC)評(píng)估每類(lèi)特征的觀察者間一致性,ICC大于0.75表明所提取的特征具有高度穩(wěn)定性。
圖1 骶髂關(guān)節(jié)VOI勾畫(huà)示意圖
1.3 CT影像判讀 由2名放射科醫(yī)師在不了解患者臨床資料情況下對(duì)骶髂關(guān)節(jié)CT影像學(xué)改變根據(jù)修正紐約標(biāo)準(zhǔn)進(jìn)行0~4分級(jí)[6]。意見(jiàn)不一致時(shí)相互討論,得出統(tǒng)一結(jié)果記錄。影像學(xué)上骶髂炎定義為雙側(cè)骶髂關(guān)節(jié)大于或等于2級(jí),或單側(cè)骶髂關(guān)節(jié)大于3級(jí)。
1.4 模型的構(gòu)建與驗(yàn)證 使用最小冗余最大相關(guān)性(minimum redundancy maximum relevance,mRMR)和最小絕對(duì)收縮和選擇算子(least absolute shrinkage and selection operator, LASSO)算法對(duì)1 316個(gè)影像組學(xué)特征進(jìn)行降維,挑選出最有預(yù)測(cè)價(jià)值的特征,并利用其相關(guān)系數(shù)計(jì)算影像組學(xué)評(píng)分,見(jiàn)圖2、圖3。采用SVM構(gòu)建臨床、影像組學(xué)及臨床-影像組學(xué)診斷模型。
圖2 影像組學(xué)特征LASSO回歸降維過(guò)程
1.5 統(tǒng)計(jì)學(xué)處理方法 采用R語(yǔ)言(版本3.6.3,https://www.r-project.org/)進(jìn)行統(tǒng)計(jì)學(xué)分析。正態(tài)分布計(jì)量資料以±s表示,用Studentt檢驗(yàn);非正態(tài)分布資料用M(P25,P75)表示,用Mann-WhitneyU檢驗(yàn)或Wilcoxon秩和檢驗(yàn);計(jì)數(shù)資料用Pearson χ2檢驗(yàn)或Fisher精確檢驗(yàn);用“glmnet”軟件包進(jìn)行LASSO算法;用Logistic回歸模型分析相關(guān)臨床因素,篩選臨床獨(dú)立危險(xiǎn)因素;應(yīng)用受試者工作特征(receiver operating characteristic,ROC)曲線(xiàn)分析和曲線(xiàn)下面積(area under curve,AUC)評(píng)估模型的效用,并采用Delong檢驗(yàn)評(píng)價(jià)模型間效能的差異。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 一般資料 根據(jù)ASAS分類(lèi)標(biāo)準(zhǔn),共收集568例腰背痛患者,年齡14~84(41.7±13.4)歲,男351例,女217例,最終診斷axSpA患者319例,非axSpA患者249例。非axSpA主要診斷包括類(lèi)風(fēng)濕性關(guān)節(jié)炎、非特異性腰背痛、痛風(fēng)性關(guān)節(jié)炎、退行性骨關(guān)節(jié)炎、致密性骨炎、外周型脊柱關(guān)節(jié)病、感染、腰椎間盤(pán)突出及骨折等。與非axSpA組患者比,axSpA組患者更年輕,HLA-B27陽(yáng)性率、男性比例、血沉和C反應(yīng)蛋白水平更高,差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。訓(xùn)練組和驗(yàn)證組患者臨床特征差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),見(jiàn)表1。多因素Logistic 回歸分析顯示,年齡、男性、HLA-B27和血沉水平是axSpA的臨床獨(dú)立預(yù)測(cè)因素(P<0.05),見(jiàn)表2。
表1 axSpA組與非axSpA組、訓(xùn)練組與驗(yàn)證組間臨床特征和影像組學(xué)評(píng)分比較
表2 axSpA臨床預(yù)測(cè)因素的單因素和多因素Logistic回歸分析
2.2 影像組學(xué)特征 基于骶髂關(guān)節(jié)CT圖像提取影像組學(xué)特征,首先采用mRMR對(duì)組學(xué)特征進(jìn)行初步篩選,保留20個(gè)有最大預(yù)測(cè)效能的特征,然后將剩余的影像特征作LASSO回歸分析,通過(guò)10折交叉驗(yàn)證篩選LASSO回歸模型的最優(yōu)參數(shù)λ值,最后選出最優(yōu)15個(gè)影像組學(xué)特征并計(jì)算相關(guān)系數(shù),見(jiàn)圖3。15個(gè)影像組學(xué)特征觀察者間均大于0.860,具有良好的重復(fù)性,然后利用其相關(guān)系數(shù)計(jì)算影像組學(xué)評(píng)分。結(jié)果顯示,非axSpA與axSpA組間的影像組學(xué)評(píng)分差異有統(tǒng)計(jì)學(xué)意義(P<0.001);而訓(xùn)練組和驗(yàn)證組間影像組學(xué)評(píng)分差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),見(jiàn)表1。
圖3 最具預(yù)測(cè)性的影像組學(xué)特征相關(guān)系數(shù)
2.3 模型構(gòu)建及效能評(píng)價(jià) 訓(xùn)練組與驗(yàn)證組中臨床-影像組學(xué)聯(lián)合模型都具有最佳AUC值,其診斷效能高于臨床模型、影像組學(xué)模型和CT影像判讀,差異均有統(tǒng)計(jì)學(xué)意義(均P<0.05)。訓(xùn)練組中臨床模型、影像組學(xué)模型診斷效能也高于CT影像判讀,差異均有統(tǒng)計(jì)學(xué)意義(均P<0.05);而臨床模型與影像組學(xué)模型間診斷效能差異無(wú)統(tǒng)計(jì)學(xué)意義(均P> 0.05)。驗(yàn)證組中臨床模型、影像組學(xué)模型和CT影像判讀的診斷效能兩兩間差異無(wú)統(tǒng)計(jì)學(xué)意義(均P>0.05)。訓(xùn)練組中臨床-影像組學(xué)聯(lián)合模型的準(zhǔn)確性、特異度、陽(yáng)性預(yù)測(cè)值及陰性預(yù)測(cè)值高于影像組學(xué)模型;臨床-影像組學(xué)聯(lián)合模型的準(zhǔn)確性、靈敏度及陰性預(yù)測(cè)值高于CT影像判讀;臨床模型的準(zhǔn)確性、靈敏度及陰性預(yù)測(cè)值高于影像組學(xué)模型;臨床模型的靈敏度及陰性預(yù)測(cè)值高于CT影像判讀;CT影像判讀的特異度高于影像組學(xué)模型;驗(yàn)證組中臨床模型的靈敏度高于影像組學(xué)模型,差異均具有統(tǒng)計(jì)學(xué)意義(均P<0.05),見(jiàn)表3和圖4。
圖4 各組模型預(yù)測(cè)axSpA效能的ROC曲線(xiàn)
表3 不同模型對(duì)中軸性脊柱關(guān)節(jié)病的診斷效能
本研究基于臨床危險(xiǎn)因素和骶髂關(guān)節(jié)CT影像組學(xué)建立SVM模型,并評(píng)估其在axSpA中的診斷效能。結(jié)果表明,臨床-影像組學(xué)SVM聯(lián)合模型的診斷效能優(yōu)于影像組學(xué)、臨床模型及影像判讀,在axSpA的診斷中具有較好的應(yīng)用價(jià)值。
在7個(gè)潛在的臨床危險(xiǎn)因素中,發(fā)現(xiàn)年齡、性別、HLA-B27及血沉水平是axSpA的獨(dú)立預(yù)測(cè)因素。其中HLA-B27一直被認(rèn)為是與axSpA患者密切相關(guān)的臨床指標(biāo),在本研究中axSpA患者HLA-B27陽(yáng)性率達(dá)到91.2%,這與之前的研究結(jié)果一致[7]。此外, axSpA通常發(fā)生在年齡小于45歲的人群中,且在男性中更為常見(jiàn)[8-9],這同樣支持本組研究中axSpA患者較非axSpA患者的年齡更低和男性患病率更高的結(jié)果。另外,有研究表明血沉水平升高可用于評(píng)估axSpA疾病活動(dòng)情況[10],在本組研究中血沉也被證明是axSpA診斷的重要組成部分。
除了臨床危險(xiǎn)因素外,影像學(xué)評(píng)估也是診斷axSpA的關(guān)鍵,影像檢查方法主要包括X線(xiàn)、CT及MRI,一般推薦使用MRI。然而,MRI在診斷骶髂關(guān)節(jié)炎中特異性?xún)H為60%~70%[11]。雖然在MRI上骶髂關(guān)節(jié)的骨髓水腫表現(xiàn)與疾病早期診斷密切相關(guān),但其假陽(yáng)性率高且有一定主觀性,會(huì)造成病變定性及診斷困難。目前,CT作為鑒別診斷axSpA中結(jié)構(gòu)病變的金標(biāo)準(zhǔn)越來(lái)越受到重視。值得注意的是,雖然CT診斷axSpA的敏感性略低于MRI,但其特異性?xún)?yōu)于X線(xiàn)和MRI[12]。臨床實(shí)踐中,由于MRI價(jià)格貴、檢查等待時(shí)間長(zhǎng),而CT也可以觀察骶髂關(guān)節(jié)早期結(jié)構(gòu)變化,所以對(duì)于腰背部疼痛的患者臨床醫(yī)師會(huì)優(yōu)先選擇CT檢查[13]。然而,由于傳統(tǒng)影像檢查技術(shù)的局限性及診斷的主觀性,axSpA的診斷存在延遲和誤診的情況[4,14];金笛兒等[15]對(duì)原診斷axSpA的患者進(jìn)行再評(píng)估,發(fā)現(xiàn)放射學(xué)陰性axSpA其誤診率高達(dá)69.81%,強(qiáng)直性骶髂關(guān)節(jié)炎誤診率為34.48%,其中主要原因?yàn)轺诀年P(guān)節(jié)影像學(xué)誤讀。
與之相比,影像組學(xué)可以從影像圖像中提取海量的肉眼不能觀察的特征來(lái)量化疾病[16],已逐漸應(yīng)用于各種腫瘤的研究中,包括腫瘤的定性、臨床分級(jí)分期、療效評(píng)估、預(yù)后分析及基因分析等[17-19]。 由于axSpA也具有腫瘤樣異質(zhì)性,基于影像組學(xué)對(duì)這類(lèi)疾病的研究也已有少數(shù)文獻(xiàn)報(bào)道。TENORIO 等[20]基于MRI進(jìn)行了影像組學(xué)分析來(lái)幫助骶髂關(guān)節(jié)炎的診斷和SpA的分類(lèi)。CASTRO-ZUNTI等[21]利用基于CT的紋理特征對(duì)強(qiáng)直性骶髂關(guān)節(jié)炎進(jìn)行早期檢測(cè)。然而,目前國(guó)內(nèi)外基于影像組學(xué)機(jī)器學(xué)習(xí)方法在axSpA診斷上應(yīng)用尚未見(jiàn)有文獻(xiàn)報(bào)道。SVM屬于監(jiān)督式學(xué)習(xí),是一種在對(duì)給定的數(shù)據(jù)進(jìn)行精度與函數(shù)相結(jié)合來(lái)尋求最佳比例的機(jī)器學(xué)習(xí)模型,其泛化錯(cuò)誤率低,具有良好的學(xué)習(xí)能力,且學(xué)到的結(jié)果具有很好的推廣性[22-23]。目前文獻(xiàn)報(bào)道該模型可應(yīng)用于肺癌的診斷[24]、腎癌的分期預(yù)測(cè)[25]以及胃癌的療效評(píng)估[26]等方面。本組研究構(gòu)建影像組學(xué)、臨床及聯(lián)合三個(gè)SVM模型,結(jié)果顯示影像組學(xué)模型AUC值略高于影像主觀判讀,而聯(lián)合模型在構(gòu)建上包含了影像組學(xué)特征及臨床因素,其AUC值為0.91,其效能優(yōu)于臨床模型、影像組學(xué)模型和CT影像主觀判讀,對(duì)axSpA具有較高的診斷價(jià)值。
本研究尚有一些不足之處。首先,本研究是回顧性分析,不可避免地存在選擇偏倚,因此需要前瞻性研究。其次,本研究結(jié)果為單中心研究,需多中心或外部驗(yàn)證以檢驗(yàn)?zāi)P偷目芍貜?fù)性。第三,人工對(duì)VOI的分割費(fèi)時(shí)復(fù)雜,自動(dòng)化程度低,在一定程度上也會(huì)受到主觀因素的影響。從骶髂關(guān)節(jié)CT圖像中提取的影像組學(xué)特征有助于診斷axSpA。此外,臨床-影像組學(xué)聯(lián)合SVM模型對(duì)axSpA具有較高的診斷效能,有助于臨床中減少axSpA的誤診或漏診。
溫州醫(yī)科大學(xué)學(xué)報(bào)2022年3期