曹月龍
(上海中醫(yī)藥大學(xué)附屬曙光醫(yī)院,上海 201203)
骨關(guān)節(jié)炎(osteoarthritis,OA)是一種復(fù)雜的多因素關(guān)節(jié)疾病,以局部軟骨退化、骨贅形成、軟骨下骨改變?yōu)橹饕±硖卣?,以關(guān)節(jié)疼痛、腫脹、僵硬及功能障礙為主要臨床表現(xiàn)[1-2]。相關(guān)研究表明,OA的患病率呈逐年遞增趨勢(shì)[3-4]。OA屬中醫(yī)“痹證”“痿證”范疇,是中醫(yī)骨傷科治療的優(yōu)勢(shì)病種之一。隨著OA臨床研究的日益增多,OA臨床研究療效評(píng)價(jià)指標(biāo)的選擇成為骨科界關(guān)注的重要問題。2020年10月,中國中醫(yī)藥研究促進(jìn)會(huì)骨傷科分會(huì)發(fā)布了《膝骨關(guān)節(jié)炎中醫(yī)診療指南(2020年版)》[5](以下簡稱《指南》)?!吨改稀酚糜谥笇?dǎo)和規(guī)范臨床實(shí)踐和相關(guān)研究,其中膝骨關(guān)節(jié)炎(knee osteoarthritis,KOA)療效評(píng)價(jià)指標(biāo)的推薦是亮點(diǎn)之一。本文結(jié)合《指南》推薦的KOA的療效評(píng)價(jià)指標(biāo),從療效評(píng)價(jià)指標(biāo)的選擇、常用療效評(píng)價(jià)指標(biāo)概述和療效評(píng)價(jià)指標(biāo)的方法學(xué)考慮3個(gè)方面,對(duì)OA臨床研究中療效評(píng)價(jià)指標(biāo)的相關(guān)問題進(jìn)行了探討,以期為臨床和科研工作者開展骨關(guān)節(jié)炎臨床研究時(shí)選擇合適的療效評(píng)價(jià)指標(biāo)提供指導(dǎo)。
OA臨床研究中的療效評(píng)價(jià)指標(biāo)包括主要結(jié)局指標(biāo)和次要結(jié)局指標(biāo)。主要結(jié)局指標(biāo)又稱主要終點(diǎn)指標(biāo),是與研究目的存在直接的、本質(zhì)的聯(lián)系且能確切反映干預(yù)措施有效性或安全性的觀察指標(biāo)。次要結(jié)局指標(biāo)又稱次要終點(diǎn)指標(biāo),是指與研究目的相關(guān)的輔助性指標(biāo)。一項(xiàng)臨床研究通常只有一個(gè)結(jié)局指標(biāo),但可以有多個(gè)次要結(jié)局指標(biāo)。主要結(jié)局指標(biāo)用于回答與研究目的直接相關(guān)的問題,次要結(jié)局指標(biāo)能夠回答與研究目的間接相關(guān)的問題。在臨床研究中,主要結(jié)局指標(biāo)與次要結(jié)局指標(biāo)均應(yīng)在設(shè)計(jì)方案中明確定義,并對(duì)這些指標(biāo)在解釋研究結(jié)果時(shí)的作用及相對(duì)重要性加以說明。
目前,在臨床研究中,研究人員在療效指標(biāo)的選擇、測(cè)量和報(bào)告等方面普遍存在不一致、不規(guī)范、發(fā)表偏倚等問題,導(dǎo)致同類研究的結(jié)果不能合并與比較[6]。《指南》推薦根據(jù)研究周期的長短,選擇設(shè)置主要療效指標(biāo)、次要療效指標(biāo)、次要終點(diǎn)指標(biāo)和/或主要終點(diǎn)指標(biāo)。近期、中期療效評(píng)價(jià)應(yīng)當(dāng)關(guān)注患者癥狀體征/中醫(yī)證候、關(guān)節(jié)功能評(píng)分及生活質(zhì)量的改善,遠(yuǎn)期療效評(píng)價(jià)應(yīng)當(dāng)關(guān)注患者影像學(xué)改變及手術(shù)干預(yù)時(shí)間。臨床研究中的療效評(píng)價(jià)指標(biāo)既要體現(xiàn)研究性質(zhì),又要體現(xiàn)干預(yù)措施的直接或間接結(jié)果[7]。因此,除了根據(jù)研究周期外,還需要根據(jù)研究目的、干預(yù)措施的特點(diǎn)有針對(duì)性地選擇療效評(píng)價(jià)指標(biāo)。
1.1 基于研究周期選擇療效評(píng)價(jià)指標(biāo)OA是一種慢性疾病,在短周期臨床研究中,應(yīng)重點(diǎn)關(guān)注患者癥狀和體征的變化,如隨訪觀察時(shí)間在3個(gè)月以內(nèi)的研究,可以將疼痛視覺模擬量表(visual analogue scale,VAS)或西安大略和麥克馬斯特大學(xué)(Western Ontario and McMaster Universities,WOMAC)骨關(guān)節(jié)炎指數(shù)[8]作為主要結(jié)局指標(biāo);在長周期臨床研究中,應(yīng)重點(diǎn)關(guān)注關(guān)節(jié)的結(jié)構(gòu)改變,如隨訪觀察時(shí)間在12個(gè)月以上的研究,所選擇的結(jié)局指標(biāo)應(yīng)能夠體現(xiàn)關(guān)節(jié)功能和結(jié)構(gòu)的改變。
1.2 基于研究目的選擇療效評(píng)價(jià)指標(biāo)臨床研究一般可分為解釋性臨床研究和實(shí)用性臨床研究。解釋性臨床研究的目的是確定干預(yù)措施是否產(chǎn)生了與之有關(guān)的結(jié)果或機(jī)制,該類研究通常在理想的試驗(yàn)條件下對(duì)嚴(yán)格符合受試條件的受試者進(jìn)行干預(yù),從而評(píng)價(jià)干預(yù)措施的療效(一般以安慰劑作為對(duì)照);實(shí)用性臨床研究通常用來研究一種治療方法在日常臨床實(shí)踐中的療效,該類研究多在“真實(shí)世界”的臨床環(huán)境中進(jìn)行。實(shí)用性臨床研究以其獨(dú)特的優(yōu)勢(shì)更適合中醫(yī)藥研究。對(duì)于實(shí)用性臨床研究,主要結(jié)局指標(biāo)通常選擇具有臨床意義的指標(biāo),但這類指標(biāo)可能不是干預(yù)措施的直接結(jié)果。例如,評(píng)估某種膝關(guān)節(jié)鍛煉對(duì)KOA的治療效果,在解釋性臨床研究中應(yīng)選擇肌力或關(guān)節(jié)活動(dòng)范圍等與治療方法直接相關(guān)的指標(biāo)作為主要結(jié)局指標(biāo);但在實(shí)用性臨床研究中,主要結(jié)局指標(biāo)可能是KOA患者的功能表現(xiàn),如WOMAC骨關(guān)節(jié)炎指數(shù)等。
1.3 基于干預(yù)措施選擇療效評(píng)價(jià)指標(biāo)辨證論治是中醫(yī)特色,目前OA證型的分類尚存在分歧[9]。針對(duì)特定證型的中藥復(fù)方研究,《指南》中的“膝骨關(guān)節(jié)炎主要癥狀體征/中醫(yī)證候分級(jí)量化評(píng)分表”是一大亮點(diǎn)。此表結(jié)合了癥狀和常見證型,可以說是“既對(duì)病也對(duì)證”的量表。在此表中,關(guān)節(jié)畏寒、關(guān)節(jié)發(fā)熱、腰膝酸軟、倦怠乏力則分別是寒濕痹阻證、濕熱痹阻證、肝腎虧虛證和氣血虛弱證的主癥,采用此表有助于觀察證候和證型的轉(zhuǎn)歸。而中醫(yī)復(fù)方的治療機(jī)制屬于多靶點(diǎn)調(diào)控,對(duì)于患者的全身狀態(tài)和生活質(zhì)量均有改善作用,簡明健康狀況調(diào)查表(short form 36 health survey questionnaire,SF-36)是常用的結(jié)局指標(biāo)。此外,當(dāng)研究中采用藥物等干預(yù)措施控制OA發(fā)作期的癥狀時(shí),主要結(jié)局指標(biāo)可不包括影像學(xué)評(píng)價(jià)指標(biāo);而采用截骨術(shù)等針對(duì)特定關(guān)節(jié)結(jié)構(gòu)進(jìn)行干預(yù)時(shí),主要結(jié)局指標(biāo)應(yīng)選擇影像學(xué)評(píng)價(jià)指標(biāo),如Kellgren-Lawrence影像分級(jí)[10]、MRI膝骨關(guān)節(jié)炎評(píng)分[11]、全關(guān)節(jié)核磁影像評(píng)分[12]等。目前,關(guān)于OA治療藥物研發(fā)的臨床研究,一般傾向于采用同時(shí)能夠評(píng)價(jià)關(guān)節(jié)結(jié)構(gòu)和癥狀改善的結(jié)局指標(biāo)??傊?,療效評(píng)價(jià)指標(biāo)的選擇必須以服務(wù)患者為中心,避免出現(xiàn)只關(guān)注指標(biāo)而不注重患者實(shí)際需求的情況。
OA臨床研究的結(jié)局指標(biāo)應(yīng)具有實(shí)際意義,應(yīng)能夠反映患者生活質(zhì)量的改善。OA療效評(píng)價(jià)指標(biāo)可分為基于測(cè)量的客觀類指標(biāo)和基于患者報(bào)告的主觀類指標(biāo)。客觀類指標(biāo)是對(duì)患者特定任務(wù)的完成情況的評(píng)估,如測(cè)量患者行走的距離或行走一段距離的時(shí)間、從坐位到站位的時(shí)間、上下一段樓梯的時(shí)間等;主觀類指標(biāo)是以患者的主觀感受為中心,反映了患者對(duì)自身功能、疼痛或其他身體狀態(tài)改善情況的感知。國際骨關(guān)節(jié)炎研究學(xué)會(huì)推薦在OA臨床研究中采用基于患者報(bào)告的療效評(píng)價(jià)指標(biāo)[13],如WOMAC骨關(guān)節(jié)炎指數(shù)、膝關(guān)節(jié)損傷和骨關(guān)節(jié)炎結(jié)局評(píng)分(knee injury and osteoarthritis outcome score,KOOS)[14]、髖關(guān)節(jié)傷殘和骨關(guān)節(jié)炎評(píng)分[15]以及患者報(bào)告結(jié)局測(cè)量信息系統(tǒng)(patient-reported outcomes measurement information system,PROMIS)[16]。
KOA主要癥狀體征/中醫(yī)證候分級(jí)量化評(píng)分表、利克特量表[17]、VAS、WOMAC骨關(guān)節(jié)炎指數(shù)、KOOS及間歇性和持續(xù)性骨關(guān)節(jié)炎疼痛問卷表[18]主要用于評(píng)價(jià)疼痛改善和功能恢復(fù)。KOA主要癥狀體征/中醫(yī)證候分級(jí)量化評(píng)分表側(cè)重于評(píng)價(jià)KOA患者的關(guān)節(jié)疼痛、腫脹以及伴隨癥狀的程度。關(guān)節(jié)炎影響測(cè)量量表[19]、下肢功能量表[20]也可用于評(píng)價(jià)患者功能恢復(fù)情況。SF-36、PROMIS、生活健康評(píng)估量表、日常生活活動(dòng)量表[21]等能夠從軀體疼痛、關(guān)節(jié)功能活動(dòng)、日常生活活動(dòng)、生理職能、社會(huì)功能、情感職能、心理健康、遠(yuǎn)期生活質(zhì)量等多方面評(píng)價(jià)患者的生活質(zhì)量和健康狀況。Kellgren-Lawrence影像分級(jí)基于X線檢查對(duì)膝關(guān)節(jié)的結(jié)構(gòu)改變(關(guān)節(jié)間隙、骨贅、軟骨骨化等)進(jìn)行評(píng)價(jià)。該方法將KOA分為0到4級(jí),0級(jí)為正常,級(jí)別越高表明疾病越嚴(yán)重。MRI是OA臨床研究中常用的影像學(xué)檢查方法,能夠清晰地顯示關(guān)節(jié)軟骨、滑膜、半月板、肌肉、肌腱等組織的形態(tài)結(jié)構(gòu)和病理變化,相較于X線和CT具有明顯優(yōu)勢(shì)[22-23]。常用OA臨床療效評(píng)價(jià)指標(biāo)見表1、表2。
表1 常用主觀類骨關(guān)節(jié)炎臨床療效評(píng)價(jià)指標(biāo)
表2 常用客觀類骨關(guān)節(jié)炎臨床療效評(píng)價(jià)指標(biāo)
3.1 樣本量對(duì)于OA的臨床研究,樣本量需控制在一定范圍內(nèi),以避免干預(yù)措施導(dǎo)致的差異是偶然因素造成的。通常情況下,樣本量應(yīng)基于Ⅰ型錯(cuò)誤和Ⅱ型錯(cuò)誤的概率進(jìn)行計(jì)算。樣本量過小會(huì)導(dǎo)致研究的統(tǒng)計(jì)學(xué)權(quán)重不足而增加Ⅱ型錯(cuò)誤的概率,而樣本量過大會(huì)導(dǎo)致資源浪費(fèi)。因此,臨床研究中樣本量的確定應(yīng)以主要結(jié)局指標(biāo)的最小臨床有意義改善(minimum clinical important improvement,MCII)作為參考,并將次要結(jié)局指標(biāo)的需求考慮進(jìn)來。
3.2 MCII測(cè)量的OA結(jié)局指標(biāo)主要有3類:癥狀體征變化、結(jié)構(gòu)改變、生活質(zhì)量改善。MCII是指測(cè)量的結(jié)局指標(biāo)發(fā)生具有臨床意義的最小變化值。臨床研究中應(yīng)避免只從統(tǒng)計(jì)學(xué)角度解讀數(shù)值結(jié)果的差異。例如,在采用VAS評(píng)價(jià)病情轉(zhuǎn)歸時(shí),患者2次測(cè)量結(jié)果的距離差值在5 mm時(shí),就可能在統(tǒng)計(jì)學(xué)上表現(xiàn)出差異,但這種差異并不具有臨床意義,即不能達(dá)到MCII值。KOA臨床研究中公認(rèn)的常用結(jié)局指標(biāo)的MCII值見表3[24]。
表3 膝骨關(guān)節(jié)炎常用結(jié)局指標(biāo)的最小臨床有意義改善值
3.3 多重性分析在臨床研究中,主要結(jié)局指標(biāo)和次要結(jié)局指標(biāo)的選擇在一定程度上會(huì)影響研究結(jié)果。一項(xiàng)臨床研究可以包括一個(gè)或多個(gè)次要結(jié)局指標(biāo),但次要結(jié)局指標(biāo)的測(cè)量不應(yīng)干擾主要結(jié)局指標(biāo)的測(cè)量。對(duì)于驗(yàn)證性臨床研究,特別是Ⅲ期臨床試驗(yàn),只有主要結(jié)局指標(biāo)有統(tǒng)計(jì)學(xué)意義,次要結(jié)局指標(biāo)的統(tǒng)計(jì)分析結(jié)果才有參考價(jià)值;對(duì)于探索性臨床研究,主要結(jié)局指標(biāo)和次要結(jié)局指標(biāo)的結(jié)果均可為進(jìn)一步的臨床試驗(yàn)設(shè)計(jì)提供線索。一般情況下,一項(xiàng)臨床研究只采用一個(gè)主要結(jié)局指標(biāo)。對(duì)于只有一個(gè)主要結(jié)局指標(biāo)且不進(jìn)行期中分析的臨床研究,一般不涉及多重性分析問題;但當(dāng)臨床研究中采用了多個(gè)主要結(jié)局指標(biāo)或進(jìn)行期中分析或進(jìn)行多組間比較時(shí),基本都會(huì)涉及多重性分析問題。
多重性分析是較復(fù)雜的統(tǒng)計(jì)學(xué)問題,臨床研究的多重性分析是指多次采用假設(shè)檢驗(yàn)。在進(jìn)行單個(gè)假設(shè)檢驗(yàn)時(shí),我們會(huì)先確定好顯著性水平(α通常取 0.05),代表單次檢驗(yàn)中可能出現(xiàn)假陽性的概率為5%。若同時(shí)檢驗(yàn)多個(gè)假設(shè),我們需要控制好Ⅰ型錯(cuò)誤的概率。多次假設(shè)檢驗(yàn)會(huì)增加Ⅰ型錯(cuò)誤發(fā)生的風(fēng)險(xiǎn),從而導(dǎo)致試驗(yàn)結(jié)果不準(zhǔn)確[25]。例如,4組之間進(jìn)行兩兩比較,如果每次檢驗(yàn)的顯著性水平均為0.05,則6次假設(shè)檢驗(yàn)至少出現(xiàn)1次假陽性的概率會(huì)高達(dá)26.5%。因此,當(dāng)需要采取合適的方法將總的Ⅰ型錯(cuò)誤控制在預(yù)定的檢驗(yàn)水準(zhǔn)之下時(shí),就會(huì)牽涉多重檢驗(yàn)校正問題。例如,在包含5個(gè)亞組分析或?qū)Ρ?個(gè)療效評(píng)價(jià)指標(biāo)的研究中,采用Bonferroni法將每項(xiàng)分析的檢驗(yàn)水準(zhǔn)調(diào)整為0.01(0.05/5),以保證總體Ⅰ型錯(cuò)誤的概率為0.05。對(duì)于有≥2個(gè)主要結(jié)局指標(biāo)的臨床研究,如果所有主要結(jié)局指標(biāo)的差異有統(tǒng)計(jì)學(xué)意義才可以認(rèn)為研究結(jié)果有效,則無需校正檢驗(yàn)水準(zhǔn);而如果任意主要結(jié)局指標(biāo)的差異有統(tǒng)計(jì)學(xué)意義即可認(rèn)為研究結(jié)果有效,則需要校正檢驗(yàn)水準(zhǔn)。
此外,對(duì)于涉及同一療效評(píng)價(jià)指標(biāo)的多亞組之間或多時(shí)間點(diǎn)之間差異比較的驗(yàn)證性臨床研究,建議在注冊(cè)隨機(jī)對(duì)照試驗(yàn)的原始資料中予以說明。在隨機(jī)對(duì)照試驗(yàn)中進(jìn)行亞組分析常需要較大的樣本量,而通常沒有足夠的樣本進(jìn)行次要結(jié)局指標(biāo)的檢測(cè)及交互效應(yīng)分析。這時(shí)就需要明確相關(guān)因素的分析是否適當(dāng)和可行、是否具有合適的顯著性水平,可參考臨床試驗(yàn)報(bào)告統(tǒng)一標(biāo)準(zhǔn)進(jìn)行判斷[26]。
《指南》在一定程度上和范圍內(nèi)規(guī)范了KOA中醫(yī)藥臨床研究的療效評(píng)價(jià)體系,提出了適合不同分期及病證結(jié)合狀態(tài)的評(píng)價(jià)方法,對(duì)于指導(dǎo)中醫(yī)藥治療KOA的臨床實(shí)踐與研究具有重要意義?!吨改稀吠扑]根據(jù)研究周期選擇合適的主要結(jié)局指標(biāo)和次要結(jié)局指標(biāo)。此外,對(duì)于OA臨床研究中的療效評(píng)價(jià)指標(biāo),還需要根據(jù)研究目的、干預(yù)措施的特點(diǎn)有針對(duì)性地進(jìn)行選擇;同時(shí)應(yīng)該從方法學(xué)角度充分考慮樣本量、MCII及多重性分析等因素,從而能夠更加規(guī)范、合理地開展相關(guān)臨床研究。目前,國際上關(guān)于OA臨床研究中療效評(píng)價(jià)指標(biāo)的研究較為細(xì)致,取得了一定的共識(shí),但探索能夠更好地體現(xiàn)中醫(yī)藥療效特點(diǎn)且形成規(guī)范方法學(xué)依據(jù)的中醫(yī)藥治療OA臨床研究中的療效評(píng)價(jià)指標(biāo)仍任重道遠(yuǎn)。