黎萬匯 陳瑩瑩 康曉鳳
心力衰竭是一種由心臟結構和/或功能異常引起的臨床綜合征,為多種心血管疾病的嚴重和終末階段,已影響全球約6400 萬人[1-2]。我國及歐洲、美國發(fā)布的心力衰竭診治指南[1,3]中均將延緩疾病進展(死亡、住院)、優(yōu)化患者健康狀況(癥狀、功能和生活質量等)列為心力衰竭治療的重要目標,多數心力衰竭臨床試驗也側重于這兩大類指標的測量以作為干預的證據基礎。其中,死亡和住院可通過直接數據衡量,但健康狀況如疲乏、生活質量這類指標卻難以通過客觀實驗室檢查獲得。患者報告結局(patient-reported outcomes,PROs)指未經醫(yī)生或其他人的解釋直接來自于患者的健康信息[4],已被國際各大心臟病學會認可能夠從生理、心理、社會三大層面準確的反應健康狀況,有效預測心力衰竭患者臨床結局,還能充分體現出患者需求與偏好,是指導心力衰竭臨床干預、提升以患者為中心醫(yī)療服務質量的關鍵[5-6]。PROs 應用的成功與否很大程度上取決于測量工具的選擇,因此本文對國際常用心力衰竭PROs 測量工具進行綜述,以期為完善我國心力衰竭健康評估及相關工具的選擇及開發(fā)提供參考。
EQ-5D 是1990 年歐洲生命質量工作組發(fā)布的健康評估工具,為心力衰竭臨床試驗中最常用的PROs 通用工具。EQ-5D 包含健康描述和視覺模擬(VAS)兩部分,健康描述從5 個維度測量:行動能力、自我照顧能力、日?;顒?、疼痛/不適、焦慮/抑郁,可根據特定效用積分體系將分數轉換為0 到1 的效用指數值,數值越高健康狀況越佳。EQ-VAS 為一個標有0(最差)到100(最好)刻度的標尺,由患者對自己的整體健康進行主觀評分。最早發(fā)布的EQ-5D-3L 健康描述部分采用3 級評分,在我國心力衰竭患者中的Cronbach’sα為0.761[7]。但調查顯示EQ-5D-3L 存在明顯的天花板效應,因此2011 年發(fā)布了5 級評分版本EQ-5D-5L,對健康問題較輕人群評估的靈敏度更高[8],在具有中至重度合并癥的心力衰竭人群中各個維度天花板效應降低了7%~17%[9]。Rasmussen 等[10]對丹麥1499 名心力衰竭患者的隨訪發(fā)現,較低的EQ-5D-5L 分數與患者1年后全因死亡率(95%CI1.15~1.38)增加1.3倍相關。EQ-5D 還廣泛用于衛(wèi)生經濟評價,Tanna等[11]系統(tǒng)評價顯示,70%以上的心力衰竭經濟學研究均選用EQ-5D,其效用指數值可計算質量調整生命年等經濟學評價重要參數。既往多采用日本、英國、韓國的效用值積分體系計算中國人群的效用指數值,Luo 等[12]在2017 年基于中國城市居民 (n= 1271)計算出新的EQ-5D-5L 效用值積分體系,應用于我國人群中敏感度更高。
最早的36 項健康調查簡表(SF-36)由波士頓健康研究所于1990 年開發(fā),包括36 個條目,8 個維度:生理功能、生理職能、軀體疼痛、一般健康狀況、精力、社會功能、情感職能、精神健康,可進一步總結軀體健康總評(PCS)和心理健康總評(MCS)。該量表分數需根據條目權重轉換為0(最差)至100(最好)的標準分,其中使用最多的是PCS、MCS,在中國心力衰竭人群中應用Cronbach’sα均大于 0.70,可作為心力衰竭患者再入院、死亡、炎癥標志物升高、運動不耐受等指標的有效預測因子[13]。1996 年Ware 等[14]為進一步開發(fā)了12 項健康調查簡表(SF-12),PCS-12、MCS-12 與原版本保持了較高的一致性,在英國人群中的相關系數分別為0.94、0.96[15]。其中PCS-12、MCS-12 分數降低與心力衰竭患者再入院及死亡風險增加相關,但MCS-12 對健康變化的識別能力較PCS-12 差[16]。SF-36、SF-12 作為通用工具提供的結果能在不同人群比較,然而相比于心力衰竭特異性工具,兩個版本尤其是SF-12 準確性及靈敏度稍遜色,不建議單獨使用SF-12 測量心力衰竭患者的健康相關生活質量[16]。
美國國立衛(wèi)生院將PROs 作為21 世紀醫(yī)學創(chuàng)新研究重點,2004 年聯合西北大學、斯坦福大學等多所學校研發(fā)了PROMIS,旨在打破PROs 工具各自為政的局面。PROMIS 以WHO 健康框架為基礎開發(fā)了一系測評工具,全面涵蓋生理、心理、社會及其下屬的一百多個健康領域。PROMIS 包括3 種測量形式:簡表(固定4~10 個條目),特征集(多個領域簡表的組合)和CATs(計算機個性化選擇條目),可根據需求靈活選擇。PROMIS 最早在構建條目池時就將心力衰竭患者納入目標人群,目前PROMIS中心力衰竭常見健康受損領域量表均在心力衰竭患者中得到驗證,如Flynn 等[17]的研究證實PROMIS身體功能、社會功能、疲勞簡表和CATs 與KCCQ相應領域均具有高相關性(r= -0.75~-0.78),可以反應出心臟移植前后心力衰竭患者健康的變化。Wiandt 等[18]開始嘗試將PROMIS 與心力衰竭門診結合,發(fā)現接受規(guī)范化藥物滴定后,患者呼吸困難和身體活動能力得到明顯改善。目前我國袁長蓉教授團隊成立了PROMIS 中國中心(PNC—China),正在積極開展中文版PROMIS 在中國人群的測量學檢驗及CATs 系統(tǒng)的開發(fā)。
KCCQ 由Green 等[19]2000 年發(fā)布的最常用于心力衰竭的疾病特異性PROs 工具。該量表回憶周期為2 周,包括23 個條目,能為心力衰竭患者提供軀體限制、癥狀頻率、癥狀穩(wěn)定性、癥狀負擔、自我效能、社會功能和生活質量7 大領域的評估,不同領域組合還可計算整體癥狀評分、臨床評分及總評分。2004 年鄧紅艷等[20]驗證KCCQ 各個領域在我國慢性心力衰竭患者中Cronbach’sα為0.81~0.93,與紐約心功能(NYHA)分級呈負相關,相關系數絕對值均大于0.74。KCCQ 所有分數均可轉換為0~100 的標準分,一般以25 分為區(qū)間劃分,如0~24 分為健康狀況非常差到差;以5、10 和20分的閾值對應小、中、大的臨床變化。HF-ACTION試驗[21]顯示,KCCQ 總評分每升高5 分,對應心血管死亡以及心血管死亡和心力衰竭住院復合終點風險降低10%,6 分鐘步行距離平均改善112 m,心肺運動耗氧量平均降低2.5 ml/(kg·min)。
為提高KCCQ 在臨床的可實施性,2015 年Spertus 等[22]將量表縮減到12 條目形成了KCCQ-12,2~3 min 即可完成,保留了軀體限制、癥狀頻率、社會功能和生活質量4 個領域,與KCCQ 相應領域的一致性均大于0.93,與6 個月死亡或再住院的結果呈分級負相關,在門診穩(wěn)定心力衰竭患者中重測信度≥0.76[23]。目前美國食品藥品監(jiān)督管理局(FDA)僅批準KCCQ 作為臨床結果評估工具,因此旨在通過FDA 批準新療法的試驗建議選擇KCCQ,而KCCQ-12 使用快捷便利,降低了患者近一半的應答負擔,在常規(guī)臨床實踐中具有更大的優(yōu)勢。
MLHFQ 為1983 年開發(fā)的最早用于心力衰竭的疾病特異性PROs 工具。該量表回憶周期為4 周,包括21 個條目,均采取Likert 6 級評分,可計算總分、軀體維度(8 個條目)及情緒維度(5 個條目)分數,分數越低表示生活質量越高。Kato 等[24]對日本門診心力衰竭患者的研究顯示,MLHFQ 得分為心臟事件、死亡及再住院的獨立預測因子。MLHFQ 總分能區(qū)分出NYHA I、II、III 患者的差異,但對NYHA III 和IV 之間的患者敏感度稍差。Rajati 等[25]發(fā)現,與SF-36 相比,MLHFQ 能更敏感的識別出心臟移植前后心力衰竭患者生活質量的變化。Napier 等[26]將MLHFQ 與KCCQ 進行對比,結果顯示MLHFQ對心力衰竭患者6 分鐘步行距離的變化更敏感。朱燕波等[27]于2004 年將量表引入我國,顯示量表內部一致性良好,身體及情緒維度Cronbach’sα分別為0.824、0.776,根據NYHA 分級將患者分組,發(fā)現不同組別總分和軀體維度得分存在差異。后續(xù)一些對MLHFQ 結構進行分析的研究指出,該量表可能包含第3 個社會維度,可能歸因于方法學及文化差異,未來有必要在大樣本中進一步研究。
最早的CHQ 是由麥克馬斯特大學Guyatt 等[28]在1989 年通過文獻研究和專家、患者訪談研制針對慢性心力衰竭患者的健康評估工具,包括呼吸困難(5 個條目)、疲勞(4 個條目)、情緒功能(7 個條目)、掌控感(4 個條目)4 部分,需要由經培訓的醫(yī)務人員進行測評。該量表應答周期為2周,采用Likert 7 級評分,分數越高功能越差,最小臨床重要差異值(MCID)為0.5 分。CHQ 已被證明與MLHFQ、KCCQ 具有高度相似的有效性和反應性,但CHQ 更著關注呼吸困難與疲勞這兩大心力衰竭常見癥狀,對患者狀況的惡化更為敏感。Lee等[29]驗證CHQ 整體在我國充血性心力衰竭老年患者中Cronbach’sα為0.95,可用于區(qū)分普通老年人與患者的健康狀況。2011 年Evans 等[30]進一步開發(fā)了CHQ-SR,可由患者自己報告,CHQ-SR 與CHQ 在相同的心力衰竭患者中分數無統(tǒng)計學差異,但CHQ-SR 呼吸困難維度得分整體比CHQ 低。目前CHQ-SR 中的呼吸困難分量表在臨床試驗中應用最多,但未有研究對比CHQ-SR 及CHQ 在中國人群中的應用效果。
MacNew 是1996 年基于心肌梗死后生活質量問卷改編的量表,旨在從軀體、情緒和社會功能三個領域測量心肌梗死、心絞痛、缺血性心力衰竭患者的健康相關生活質量,共包括 27 個條目。該量表回憶周期為2 周,均采用Likert 7 級評分,分數越高相應領域功能越好。其分數計算方法為應答條目分數總和/應答條目數,不受缺值影響,當缺失超過50%時,則不計算該領域分數。H?fer 等[31]證實MacNew 在美國、西班牙等5 個國家應用各個維度Cronbach’sα為0.75 ~0.97,量表三因子結構解釋了63.0~66.5%的方差,MCID 為0.5 分,低得分與心力衰竭患者不良臨床事件發(fā)生具有較高相關性。Lachowska 等[32]應用MacNew 評估呼吸訓練12 周前后的心力衰竭患者生活質量,結果顯示量表所有領域均能直接反映出患者狀態(tài)的變化,其情緒領域低得分對長期預后有明顯不利影響。2008 年Yu[33]將MacNew 漢化,該量表在香港心力衰竭患者中各領域Cronbach’sα≥0.877,對不同年齡、性別、情緒狀態(tài)的患者區(qū)分度良好,MacNew 尚未在大陸人群驗證,未來有待進一步開展研究。
HeartQoL 為2014 年Oldridge 等[34]基 于22 國家6384 名缺血性心臟病患者,對西雅圖心絞痛量表(SAQ)、SF-36、MLHFQ 中的條目重新組合開發(fā)的核心疾病特異性PROs 工具,可用于心肌梗死、心絞痛及缺血性心力衰竭患者。HeartQoL 包括軀體功能(10 個條目)和情緒功能(4 個條目)兩部分,回憶周期為4 周,采用Likert 3 級評分,分數越高狀況越好。HeartQoL 在大樣本檢驗中,兩部分及整體在心力衰竭患者中Cronbach’sα在0.80~0.91,與SF-36、HADS 具有顯著相關性,能夠識別出患者在進行心臟康復前后健康狀況的變化,但情緒功能部分存在一定的天花板效應[35]。Rasmussen 等[10]發(fā)現較低的HeartQoL 分數與心力衰竭患者出院1 年及3 年的全因死亡率和心血管死亡率相關。2022 年Luan 等[36]檢驗該該工具在我國心力衰竭人群中應用軀體及情感兩部分具有較好的信效度,Cronbach’sα為0.70、0.80,但還需要進一步確認HeartQoL 的臨床反應性。
在過去20 年中,醫(yī)療衛(wèi)生領域最重要的突破之一為認識到PROs 與臨床專業(yè)人員的判斷具備同樣的有效性及可靠性,極大的促進了現在PROs 測量工具的發(fā)展與應用。心力衰竭PROs 工具起源于19 世紀80 年代,MLHFQ 被認為是最早用于心力衰竭健康評估的PROs 工具,隨后不同研究者根據需求相繼開發(fā)出了更多可用的工具,心力衰竭國際常用心力衰竭PROs 測量工具及其內容見表1。
表1 心力衰竭患者PROs 測量工具的比較分析
從內容上來說,傳統(tǒng)通用工具如EQ-5D、SF-36 主要包括軀體活動、疼痛、焦慮抑郁這類多數疾病都會出現的健康問題,缺少呼吸障礙、水腫等心力衰竭患者特有的癥狀與體征。疾病特異性工具如KCCQ、MLHFQ 內容對心力衰竭患者針對性強,但數據無法在疾病間比較,開發(fā)時也未系統(tǒng)的將患者可能出現的健康問題全面納入。早期的PROs 工具各有不同的側重點,臨床試驗為保證指標的全面性及可比性,往往會選擇2 個以上工具,極大地增加了患者的應答負擔。隨著對PROs 工具理解的加深,研究者們認為核心集測量工具及PROMIS 為新的突破口,能夠最大程度兼顧特異性、全面性、可比性。但現階段開發(fā)核心集測量工具時,多將關注點集中在缺血性心臟病上,形成的工具如MacNew及HeartQoL 僅可用于缺血性心力衰竭患者。而PROMIS 內容全面,可根據需求選取相應工具,減少評估內容的疊加,近年來PROMIS 開始提倡將其中的通用條目與疾病特異性條目結合共同檢測某疾病人群健康狀態(tài)的變化,可能為未來心力衰竭PROs 工具探索的重點。
從使用的角度來說,PROs 工具在臨床研究和實踐的有用性不僅取決于常規(guī)的心理測量學屬性,還應進一步考慮該工具分數的可解釋性。目前臨床試驗多通過比較組間平均得分的差異來衡量干預對健康狀況的影響,均值差異雖然廣泛描述了分數分布的變化,但不適用于個體患者。要想提升PROs工具在臨床實際的應用價值,需定義其最小但具有臨床意義的分數閾值,即MCID 值。DEFINE-HF 試驗[37]就通過比較達格列凈治療組與對照組KCCQ分數提升超過其MCID 值的人數來分析達格列凈的治療效果,雖這種方法與比較組間均值差得出的結論相同,但可以更清楚的傳達出達格列凈對個體健康的益處?,F階段僅KCCQ、CHQ-SR、MacNew 計算了在心力衰竭人群中的MCID 值,未來研究還需進一步解釋MCID 值在不同條件下的適用性。
綜上所述,國際中有關心力衰竭PROs 研究已有40 多年的歷史,開發(fā)出了相當數量可用的工具,未來研究重點一方面應改變不同工具各自為政的局面,開發(fā)系統(tǒng)化PROs 測量工具體系,方便使用者對工具的選擇與應用;另一方面應深入討論工具的MCID 值,促進研究人員對結果的理解,提升PROs分數變化對臨床決策的指導意義。