徐黎 李凱 過哲 王超 程曉光
骨關(guān)節(jié)炎是臨床十分多見的一類疾病,在全球范圍內(nèi)形成了巨大的社會和經(jīng)濟負擔(dān),估計60歲以上人群中13%患有膝關(guān)節(jié)骨關(guān)節(jié)炎并有癥狀[1]。目前,臨床研究主要集中于膝關(guān)節(jié)骨關(guān)節(jié)炎,原因在于膝關(guān)節(jié)骨關(guān)節(jié)炎發(fā)病率和致殘率均較高,而且膝關(guān)節(jié)軟骨厚度最大、易于進行X線平片和磁共振成像(magnetic resonance imaging,MRI)評估。傳統(tǒng)X線平片是評估膝關(guān)節(jié)骨關(guān)節(jié)炎最簡單經(jīng)濟的影像學(xué)方法,能夠直接觀察骨結(jié)構(gòu)特征,包括邊緣骨贅、軟骨下硬化和軟骨下囊腫,并能通過關(guān)節(jié)間隙寬度間接評估軟骨厚度和半月板完整性。作為斷層成像技術(shù),MRI可直接觀察關(guān)節(jié)軟骨、滑膜、半月板及其他關(guān)節(jié)內(nèi)結(jié)構(gòu)。更重要的是,運用軟骨體積定量評估和全關(guān)節(jié)半定量評估等方法,MRI技術(shù)能夠更敏感更可靠地評價各關(guān)節(jié)特征,這一優(yōu)勢對于多中心或縱向臨床研究是其他影像學(xué)方法無法替代的。MRI半定量評分將關(guān)節(jié)視為一個整體器官進行評估,除關(guān)節(jié)軟骨形態(tài)外,還可對其他重要的關(guān)節(jié)結(jié)構(gòu)及其病變進行評價,如半月板、骨贅、軟骨下骨磨損、軟骨下骨髓水腫及囊腫、交叉韌帶及側(cè)副韌帶、滑膜、關(guān)節(jié)積液和其他關(guān)節(jié)旁結(jié)構(gòu)。
目前, 4個MRI半定量評分系統(tǒng)可用于膝關(guān)節(jié)炎評估,分別是全關(guān)節(jié)磁共振成像評分(Whole-Organ Magnetic Resonance Imaging Score,WORMS),膝關(guān)節(jié)骨關(guān)節(jié)炎評分系統(tǒng)(Knee Osteoarthritis Scoring System,KOSS),Boston Leeds膝關(guān)節(jié)骨關(guān)節(jié)炎評分(Boston Leeds Osteoarthritis Knee Score,BLOKS) 和磁共振成像膝關(guān)節(jié)骨關(guān)節(jié)炎評分(MRI Osteoarthritis Knee Score,MOAKS)[2-5]。與KOSS、BLOKS和MOAKS相比,WORMS評分系統(tǒng)涵蓋關(guān)節(jié)內(nèi)及關(guān)節(jié)旁結(jié)構(gòu)最全面、關(guān)節(jié)分區(qū)最多、評分分級最細,是目前臨床研究項目應(yīng)用最廣泛的膝關(guān)節(jié)炎MRI半定量評估體系。MRI半定量評分系統(tǒng)是基于傳統(tǒng)的MR成像技術(shù),對影響膝關(guān)節(jié)功能、參與骨關(guān)節(jié)炎病生理過程的多個關(guān)節(jié)內(nèi)結(jié)構(gòu)進行半定量人工評分,其結(jié)果的可靠性不僅受圖像質(zhì)量的影響,更與評分者經(jīng)驗密切相關(guān)[6]。在進行MRI半定量評分之前,閱片者必須經(jīng)過系統(tǒng)培訓(xùn)并通過考核[7]。作為臨床研究運用最廣泛的評分系統(tǒng),WORMS關(guān)節(jié)內(nèi)分區(qū)相對復(fù)雜、對關(guān)節(jié)軟骨及骨贅分級細,其評分結(jié)果的可靠性是否受到評分者臨床閱片經(jīng)驗的影響是值得探討的問題。目前大部分研究僅限于探討MRI半定量評分系統(tǒng)的觀察者內(nèi)和觀察者間一致性,對觀察者閱片經(jīng)驗的差異對閱片效果的影響報道較少。
本研究旨在評價具備不同閱片經(jīng)驗的醫(yī)學(xué)影像科醫(yī)生經(jīng)過統(tǒng)一的WORMS評分系統(tǒng)標準化培訓(xùn)后對不同嚴重程度膝關(guān)節(jié)骨關(guān)節(jié)炎樣本進行WORMS半定量評分的觀察者間差異,分析WORMS評分系統(tǒng)對膝關(guān)節(jié)各結(jié)構(gòu)特征評價的觀察者間一致性及觀察者臨床閱片經(jīng)驗對評分結(jié)果的影響。
1.病例納入與排除標準:(1)病例納入標準:①年齡≥40歲;②經(jīng)X線檢查確定膝關(guān)節(jié)Kellgren-Lawrence評分為1~3級;③膝關(guān)節(jié)疼痛視覺模擬評分(visual analogue scale,VAS)≥4分。(2)病例排除標準:①合并痛風(fēng)或類風(fēng)濕關(guān)節(jié)炎等其他風(fēng)濕免疫及代謝性疾??;②合并嚴重心、肝、腎等重要器官病變;③合并化膿性或非特異性感染性關(guān)節(jié)炎;④合并創(chuàng)傷性或絨毛結(jié)節(jié)色素沉著性膝關(guān)節(jié)滑膜炎等病變;⑤存在晚期關(guān)節(jié)畸形或功能殘障與嚴重骨質(zhì)疏松;⑥妊娠、準備妊娠或哺乳期婦女;⑦有既往膝關(guān)節(jié)手術(shù)史。
2.一般臨床資料:利用“祛風(fēng)止痛膠囊對膝骨關(guān)節(jié)炎的臨床作用及機制研究”臨床研究項目(獲得四川大學(xué)華西醫(yī)院倫理委員會批準;所有受試對象簽署知情同意書)數(shù)據(jù)庫,隨機抽取2018年5至10月進行的單側(cè)膝關(guān)節(jié)MRI 10例,其中男4例,女6例,年齡為53~69歲。
3.設(shè)備:3T磁振掃描儀(Ingenia,Philips Healthcare,荷蘭),8通道膝關(guān)節(jié)線圈。
1.膝關(guān)節(jié)MRI掃描:對所有受試者采用以下掃描序列:①軸位T1加權(quán)像(T1 weight imaging,T1W1)快速自旋回波(turbo spin echo,TSE)[重復(fù)時間(repetition time,TR)=600~650 ms,回波時間(echo time,TE)=12 ms,頻率編碼(requency encoding,FE)];②冠狀位T1WI TSE (TR=650 ms,TE=9 ms,F(xiàn)E);③矢狀位T1WI TSE(TR=500 ms,TE=12 ms,F(xiàn)E);④軸位質(zhì)子密度脂肪抑制(protein density with fat suppression, PD FS)(TR=3 110 ms,TE=43 ms,F(xiàn)E);⑤冠狀位PD FS(TR=2 390 ms,TE=36 ms,F(xiàn)E);⑥矢狀位PD FS(TR=2 400 ms,TE=32 ms,F(xiàn)E)。軸位序列視野(field of view,FOV) =160 mm×160 mm,體素尺寸(voxel size)=0.55 mm×0.68 mm×3.00 mm。冠狀位及矢狀位序列FOV=160 mm×160 mm,voxel size=0.42 mm×0.50 mm×3.00 mm。所有序列層厚(slice thickness)=4.0 mm,層間隔(interslice gap)=0.4 mm。
2.膝關(guān)節(jié)MRI評估:評估人員包括3位放射科醫(yī)生,分別為副主任醫(yī)師1名(觀察者1,具備波士頓大學(xué)醫(yī)學(xué)院關(guān)節(jié)炎MRI定量評估實驗室認證資質(zhì)),高年資主治醫(yī)師1名(觀察者2,具備10年臨床閱片經(jīng)驗),低年資主治醫(yī)師1名(觀察者3,具備5年臨床閱片經(jīng)驗)。在讀片開始前,由觀察者1按照標準培訓(xùn)流程對觀察者2和觀察者3進行膝關(guān)節(jié)WORMS評分系統(tǒng)培訓(xùn),觀察者內(nèi)及觀察者間一致性各項評分指標達到較好(kappa值>0.6)時為合格。培訓(xùn)合格后從研究項目數(shù)據(jù)庫中隨機抽取10例樣本,由3名讀片者分別進行WORMS評分,并進行觀察者間一致性評價。對3位讀片者屏蔽評分樣本的臨床信息。
3.WORMS評分標準:WORMS評分系統(tǒng)將膝關(guān)節(jié)分為15個區(qū)域,分別為髕骨2區(qū)(內(nèi)側(cè)、外側(cè))、股骨6區(qū)(內(nèi)前、內(nèi)中、內(nèi)后、外前、外中、外后)、脛骨7區(qū)(內(nèi)前、內(nèi)中、內(nèi)后、外前、外中、外后、髁間棘)[2]。對除脛骨髁間棘外的14個區(qū)進行以下3方面評分:①關(guān)節(jié)軟骨形態(tài)及信號[0~6分:0分=正常;1分=厚度正常、有高信號,2分=小面積(最大徑<1 cm)部分層厚缺損,2.5分=小面積(最大徑<1 cm)全層厚缺損,3分=多灶性部分層厚缺損(2級)或大面積(最大徑>1 cm但區(qū)域面積<75%總面積)部分層厚缺損,4分=彌漫性部分層厚缺損(區(qū)域面積≥75%總面積),5分=多灶性全層厚缺損(2.5級)或大面積全層厚缺損(最大徑>1 cm但區(qū)域面積<75%總面積),6分=彌漫性全層厚缺損(區(qū)域面積≥75%總面積)];②關(guān)節(jié)面下骨磨損(0~3分:0分=正常,1分=輕度,2分=中度,3分=重度);③邊緣骨贅(0~7分:0分=無,1分=可疑,2分=小,3分=小到中等,4分=中等,5分=中到大,6分=大,7分=巨大)[2]。對全部15個關(guān)節(jié)分區(qū)進行軟骨下骨髓水腫和囊腫評分(0~3分:0分=正常;1分=區(qū)域面積<25%總面積;2分=區(qū)域面積為25%~50%總面積;3分=區(qū)域面積>50%總面積)。其他結(jié)構(gòu)評分標準分別為:韌帶0~1分(0分=完整,1分=撕裂);半月板0~4分(0分=完整,1分=小的放射狀或鳥嘴樣撕裂,2分=無移位的撕裂或術(shù)后修復(fù)改變,3分=移位性撕裂或部分切除,4分=完全磨損或全部切除);滑膜增厚及關(guān)節(jié)積液0~3分(0分=正常,1分=積液體積<33%關(guān)節(jié)腔體積,2分=積液體積為33%~66%關(guān)節(jié)腔體積,3分=積液體積>66%關(guān)節(jié)腔體積);關(guān)節(jié)腔游離體0~3分(0分=無,1分=1個游離體,2分=2個游離體,3分=3個以上游離體);滑囊囊腫或積液0~3分(0分=無,有囊腫或積液則依據(jù)囊腫或積液體積大小評為1~3分)[2]。
4.統(tǒng)計學(xué)處理:使用SPSS 22.0(IBM SPSS statistics Inc,美國)軟件對數(shù)據(jù)進行統(tǒng)計學(xué)分析。分別對觀察者1與觀察者2和觀察者3進行觀察者間一致性評價。觀察者間一致性通過kappa值計算獲得,kappa值≥0.75表示兩者一致性高,0.75>kappa值≥0.40表示一致性一般,kappa值<0.40表示一致性較差。P< 0.05為差異有統(tǒng)計學(xué)意義。
每位評分者獲得膝關(guān)節(jié)骨關(guān)節(jié)炎征象評分數(shù)量如下:關(guān)節(jié)軟骨評分140個(14區(qū)×10例)、軟骨下骨髓水腫及囊腫評分150個(15區(qū)×10例)、骨磨損評分140個(14區(qū)×10例)、骨贅評分140個(14區(qū)×10例)、半月板評分60個(6區(qū)×10例)、韌帶評分40個(4個×10例)、關(guān)節(jié)積液及滑膜炎評分10個、關(guān)節(jié)內(nèi)游離體評分10個、滑囊炎評分10個。
觀察者1對各征象評分結(jié)果見表1。140個關(guān)節(jié)軟骨評分中0分75個(53.6%),6分9個(6.4%),1~5分者數(shù)量分布較均勻(7~20個,5%~14.3%);150個軟骨下骨髓水腫及軟骨下囊腫評分中0分分別為111個(74%)和127個(84.7%),骨髓水腫3分5個(3.3%),囊腫最高評分為2分(6個,4%);140個骨磨損評分中0分101個(72.1%),最高評分為2分(6個,4.3%);140個骨贅評分中0分僅12個(8.6%),2~3分占比例最高(24個,17.1%),7分7個(5%);60個半月板評分中,0分46個(76.7%),2分、3分和4分分別為7個(11.7%)、4個(6.7%)和2個(3.3%);40個韌帶評分中,1分僅1個(2.5%);10例樣本均出現(xiàn)關(guān)節(jié)積液及滑膜炎,其中8例(80%)評分為1分,2例(20%)評分為2分;5例(50%)樣本出現(xiàn)關(guān)節(jié)內(nèi)游離體,其中1例(10%)評分為2分,4例(40%)評分為3分;10例樣本中5例(50%)無關(guān)節(jié)周圍滑囊炎,其余5例(50%)滑囊炎評分為1分。
表1 觀察者1膝關(guān)節(jié)骨關(guān)節(jié)炎各征象評分結(jié)果分布[n(%)]
各征象評分觀察者間一致性kappa值見表2。結(jié)果顯示,軟骨下骨髓水腫、軟骨下囊腫、骨磨損、關(guān)節(jié)內(nèi)游離體的WORMS評分在不同觀察者之間有很高的一致性(kappa值≥0.75),關(guān)節(jié)軟骨、骨贅、半月板、關(guān)節(jié)積液及滑膜炎、滑囊炎的WORMS評分在不同觀察者之間的一致性稍低,但全部kappa值≥0.6。由于韌帶評分為0和1分,無法計算kappa值,40個韌帶評分中的39個在3位觀察者間一致。高年資醫(yī)生對骨磨損和關(guān)節(jié)內(nèi)游離體的評分一致性比低年資醫(yī)生略高;而對關(guān)節(jié)軟骨、軟骨下骨髓水腫及囊腫、骨贅、半月板、滑囊炎,低年資醫(yī)生評分一致性高于高年資醫(yī)生。
表2 膝關(guān)節(jié)骨關(guān)節(jié)炎WORMS評分系統(tǒng)觀察者間一致性評估kappa值(95%CI,P值)
自2004年WORMS評分系統(tǒng)發(fā)表以來,KOSS、BLOKS和MOAKS等多個膝關(guān)節(jié)全器官MRI半定量評分系統(tǒng)相繼出現(xiàn),并被大量應(yīng)用于關(guān)節(jié)炎的橫向和縱向臨床研究中[3-5]。在骨關(guān)節(jié)炎的發(fā)生和發(fā)展過程中,雖然關(guān)節(jié)軟骨的狀態(tài)是反映疾病嚴重程度最為穩(wěn)定和重要的指標,但除關(guān)節(jié)軟骨外其他關(guān)節(jié)內(nèi)結(jié)構(gòu)與疾病的進展、病生理過程、相關(guān)臨床癥狀和預(yù)后之間的密切聯(lián)系也越來越受到重視[8-10]。WORMS評分系統(tǒng)是以關(guān)節(jié)內(nèi)分區(qū)而非病灶為單位進行評分,對關(guān)節(jié)軟骨、軟骨下骨髓水腫及囊腫征象也進行評分[7]。同時WORMS也是唯一將軟骨下骨磨損納入評分的系統(tǒng)。
本研究結(jié)果顯示,軟骨下骨髓病變(軟骨下骨髓水腫和軟骨下囊腫)、骨磨損和關(guān)節(jié)內(nèi)游離體的WORMS評分觀察者間一致性高,而關(guān)節(jié)軟骨、骨贅、半月板、關(guān)節(jié)積液和滑膜炎以及滑囊炎的WORMS評分觀察者間一致性稍低。通過接受標準化培訓(xùn)并通過考核,擁有不同臨床閱片經(jīng)驗的放射科醫(yī)生均能夠掌握WORMS評分系統(tǒng)。臨床閱片經(jīng)驗對評分效果未造成顯著影響。
在WORMS評分系統(tǒng)中,關(guān)節(jié)軟骨和骨贅的評分級別分別為0~6分和0~7分,不同級別之間差異小,不同閱片者對于同一級別征象的理解和判斷出現(xiàn)差異的可能性更高,因此對關(guān)節(jié)軟骨和骨贅評分的觀察者間一致性較低是必然的。國外文獻報道膝關(guān)節(jié)軟骨形態(tài)的半定量MRI評分的觀察者間一致性相關(guān)系數(shù)和kappa值分別為0.77~0.94和0.44~0.88,與本研究結(jié)果(kappa值=0.725和0.881)一致[2-4,11-17]。文獻報道中骨贅評分觀察者間一致性相關(guān)性系數(shù)和kappa值為0.66~1.00和0.735~0.916,而本研究中骨贅評分的kappa值分別為0.605和0.704,與文獻報道結(jié)果接近[2-4,13-14,16-17]。
WORMS系統(tǒng)中的半月板評分較為復(fù)雜,需要對前角、體部及后角分別進行評分(0~4分),其中2分(無移位的撕裂或術(shù)后修復(fù)改變)和3分(移位性撕裂或部分切除)區(qū)分較為困難,并且需要將各分區(qū)評分加權(quán)轉(zhuǎn)化為內(nèi)、外側(cè)半月板的總分(0~6分)[2]。文獻報道,半月板MRI半定量評分觀察者間一致性相關(guān)系數(shù)和kappa值分別為0.82~1.00和0.63~0.84,與本研究結(jié)果(0.672和0.866)無差異[2-4,12,14,16-18]。
關(guān)節(jié)積液及滑膜炎、滑囊炎的WORMS評分分值雖然為0~3分,但是評分標準以關(guān)節(jié)腔體積和滑囊體積大小為依據(jù),無客觀數(shù)值標準或示意圖顯示,因此評分易受主觀因素影響。文獻報道的關(guān)節(jié)積液和滑膜炎觀察者間一致性kappa值為0.892,略高于本研究結(jié)果(kappa值=0.737),可能與評分者閱片經(jīng)驗差異有關(guān)[16]。
軟骨下骨髓病變(軟骨下骨髓水腫和軟骨下囊腫)的WORMS評分分值為0~3分,以病灶面積占關(guān)節(jié)面面積比例為標準,評分標準客觀且不同級別之間差異較明確,因此不同閱片者之間評分差異較小。國外文獻報道軟骨下骨髓病變觀察者間一致性相關(guān)系數(shù)和kappa值分別為0.54~1.00和0.79~0.97,與本研究結(jié)果(kappa值=0.793~0.921)一致[2-4,12-14]。
WORMS評估系統(tǒng)對膝關(guān)節(jié)骨關(guān)節(jié)炎的評價效果同樣受到MRI圖像質(zhì)量的影響。標準化的掃描方案是獲得準確評分結(jié)果的基礎(chǔ)。掃描要求在1.5T以上MR掃描儀上完成,通過3個角度(軸位、矢狀位、冠狀位)對液體敏感的FSE FS序列能夠準確評估關(guān)節(jié)軟骨、軟骨下骨髓水腫、囊腫、滑膜炎及關(guān)節(jié)積液、韌帶以及半月板等結(jié)構(gòu),通過矢狀位及冠狀位T1WI SE序列能夠?qū)吘壒琴?、關(guān)節(jié)內(nèi)游離體和骨磨損進行準確評估[6]。
本研究的主要不足在于樣本數(shù)量有限,未計算各膝關(guān)節(jié)骨關(guān)節(jié)炎評分征象的總分以及評價總分的觀察者間一致性。雖然多數(shù)膝關(guān)節(jié)臨床研究采用的觀察指標是膝關(guān)節(jié)炎各WORMS評分征象的總分,但各征象總分是由該征象在各個關(guān)節(jié)分區(qū)內(nèi)的評分加權(quán)獲得,因此本研究中各關(guān)節(jié)分區(qū)內(nèi)征象評分結(jié)果能夠更直接反映WORMS評分系統(tǒng)的觀察者間一致性。本研究的另一個不足在于3位閱片者對骨關(guān)節(jié)系統(tǒng)MRI均有較豐富的閱片經(jīng)驗,因此該結(jié)果的代表性有一定局限性。
總之,擁有不同臨床閱片經(jīng)驗的閱片者經(jīng)過標準化培訓(xùn)和測試后均能掌握WORMS評分方法,其中軟骨下骨髓病變、骨磨損和關(guān)節(jié)內(nèi)游離體的觀察者間一致性很高,而臨床閱片經(jīng)驗不會顯著提高評分效果。
志謝感謝山東步長制藥有限公司為本研究提供的影像學(xué)圖像資料。
利益沖突聲明:本研究及本文內(nèi)容不存在與醫(yī)療工作職責(zé)相沖突的任何經(jīng)濟利益或非經(jīng)濟利益以及任何直接或間接的義務(wù)和責(zé)任。