史釗 ,李順平 *,吳小燕 ,劉嘉琪 ,杜慧敏
不孕癥是指1對配偶未采取避孕措施,有規(guī)律性生活至少12個月未能獲得臨床妊娠[1-2]。由于環(huán)境污染問題嚴(yán)峻,以及受睡眠不足、生活節(jié)奏加快等因素的影響,我國育齡夫婦的不孕不育率從20年前的2.5%~3%攀升至近年的15%左右[3-5]。不孕不育嚴(yán)重影響著個人健康和家庭幸福,已經(jīng)成為重要的公共衛(wèi)生問題,同時隨著我國人口老齡化趨勢加劇,不孕不育也已成為日益突出的社會性問題。健康相關(guān)生命質(zhì)量(HRQoL)是患者基于自身健康狀況和治療對其日常生活影響做出的自我評價,是從生理、心理和社會適應(yīng)方面綜合評價健康的一種模式,能比較全面地反映患者的主觀與客觀健康狀況[6]。同時,HRQoL是患者報告結(jié)局(PRO)測量的核心內(nèi)容之一。目前在不孕不育患者臨床效果評估中多將受精率、胚胎著床率、妊娠率等臨床客觀指標(biāo)作為健康結(jié)局指標(biāo)[7-9],但不孕不育的治療過程復(fù)雜、周期較長,可導(dǎo)致患者出現(xiàn)疼痛、失眠、焦慮等癥狀,尤其是在“不孝有三,無后為大”的觀念和“傳宗接代”的思想影響下,不孕不育患者更是承受著較大的社會、心理壓力[10]。因此,臨床客觀指標(biāo)并不能全面反映患者的健康狀況。
目前,已有研究者對國內(nèi)外不孕不育患者HRQoL量表進(jìn)行了詳細(xì)介紹[11-12]和系統(tǒng)綜述[13-17],并且不孕不育患者HRQoL量表已在臨床上得到了廣泛的應(yīng)用,但尚不確定這些量表應(yīng)用于臨床時是否具有良好的測量性能,缺乏對量表的質(zhì)量評價。健康測量工具遴選標(biāo)準(zhǔn)(COSMIN)是用于評價患者報告結(jié)局測量量表(PROMs)的測量性能及研究方法學(xué)質(zhì)量的工具,適用于PROMs的系統(tǒng)評價,可用于形成PROMs開發(fā)與利用相關(guān)推薦意見[18]。本研究通過全面梳理國內(nèi)外不孕不育患者HRQoL量表相關(guān)研究,采用COSMIN對不孕不育患者HRQoL特異性量表進(jìn)行系統(tǒng)評價,旨在為健康結(jié)局測量工具的合理選擇提供參考,也為中國不孕不育患者健康結(jié)局測量工具的研制提供借鑒。
1.1 文獻(xiàn)的納入與排除標(biāo)準(zhǔn)
1.1.1 納入標(biāo)準(zhǔn) (1)研究對象:臨床診斷患有不孕不育者。(2)研究工具:采用經(jīng)過信效度檢驗的普適性量表〔如健康調(diào)查簡表(SF-36)等〕或疾病特異性量表〔如生育生活質(zhì)量量表(FertiQoL)等〕對不孕不育患者的HRQoL進(jìn)行評估。(3)研究類型:研究類型不限,如橫斷面研究、隨訪研究等。(4)研究內(nèi)容:使用HRQoL量表測量不孕不育患者生命質(zhì)量、健康效用值等,包括量表開發(fā)、測量性能驗證研究,以及運用量表評估不孕不育患者HRQoL的實證研究等。
1.1.2 排除標(biāo)準(zhǔn) (1)評價內(nèi)容聚焦不孕不育患者婚姻質(zhì)量、心理健康;(2)未明確說明量表使用情況的研究;(3)綜述、系統(tǒng)綜述及其他二次研究;(4)重復(fù)發(fā)表文獻(xiàn);(5)非中、英文文獻(xiàn);(6)無法獲取全文的文獻(xiàn);(7)會議論文。
1.2 文獻(xiàn)檢索策略 于2020年10月,計算機(jī)檢索PubMed、Web of Science、the Cochrane Library、EmBase、中國知網(wǎng)、萬方數(shù)據(jù)知識服務(wù)平臺、維普中文科技期刊全文數(shù)據(jù)庫和中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫,獲取國內(nèi)外公開發(fā)表的有關(guān)不孕不育患者HRQoL的研究,檢索時限均為建庫至2020-10-05。檢索策略采用主題詞與自由詞相結(jié)合的方式。中文檢索詞包括不孕不育、生命質(zhì)量、生活質(zhì)量、生存質(zhì)量、健康效用值、健康偏好、健康結(jié)果測量、量表等;英文檢索詞包括 infertility、quality of life、health related quality of life、health state preference、PRO等。以PubMed為例,具體檢索策略請掃描本文二維碼獲取。
1.3 文獻(xiàn)篩選與資料提取 由兩名研究者獨立篩選文獻(xiàn)和提取資料,并交叉核對,如遇分歧則通過小組討論解決。篩選文獻(xiàn)時首先閱讀文章題目、摘要,在排除明顯不相關(guān)文獻(xiàn)后,進(jìn)一步閱讀可能符合納入標(biāo)準(zhǔn)文獻(xiàn)的全文,以確定最終是否納入。提取納入研究所采用的HRQoL量表的基本特征,內(nèi)容包括:研制者(第一作者)、量表(全)簡稱、研制時間、適用對象、研制國家/地區(qū)(組織)、量表維度與條目數(shù)、是否有中文版等。
1.4 評價方法 由兩名研究者分別采用COSMIN偏倚風(fēng)險評價清單[18]、更新版良好測量學(xué)屬性標(biāo)準(zhǔn)[19]對不孕不育患者HRQoL特異性量表開發(fā)研究、量表的測量性能進(jìn)行獨立評價,并交叉核對結(jié)果。如遇分歧,則通過小組討論解決。COSMIN偏倚風(fēng)險評價清單由10個模塊組成,采用4點評分法(“非常好”“合格”“有問題的”“不合格”)對每項量表開發(fā)研究的偏倚風(fēng)險進(jìn)行評價。某一模塊的整體偏倚風(fēng)險評分由模塊內(nèi)所有條目的最低評分決定,即最低計分原則。更新版良好測量學(xué)屬性標(biāo)準(zhǔn)主要用于評價量表的8種測量性能,并將評價等級設(shè)置為3個級別,即“足夠”“不足”“不確定”。
1.5 統(tǒng)計學(xué)方法 采用描述分析法對不孕不育患者HRQoL量表的應(yīng)用現(xiàn)狀,以及不孕不育患者HRQoL特異性量表的測量性能及量表開發(fā)研究的方法學(xué)質(zhì)量進(jìn)行分析。
2.1 文獻(xiàn)篩選流程及結(jié)果 初檢共獲得文獻(xiàn)2 608篇,剔重后獲得文獻(xiàn)1 805篇,經(jīng)閱讀題目和摘要排除1 439篇,閱讀全文后,排除不符合納入標(biāo)準(zhǔn)的文獻(xiàn)137篇,最終共納入229篇文獻(xiàn),文獻(xiàn)篩選流程見圖1。
圖1 文獻(xiàn)篩選流程Figure 1 Literature screening flowchart
2.2 納入不孕不育患者HRQoL量表的基本信息 納入的229篇文獻(xiàn)共涉及19個[20-39]不孕不育患者HRQoL量表,其中4個[20-24]為不孕不育患者HRQoL特異性量表〔TLMK(Tübinger Lebensqualit?tsfragebogen für M?nner mit Kinderwunsch)、FertiQoL、QOLICQ(Quality of Life in Infertile Couple Questionnaire)及中醫(yī)肝郁型不孕癥生命質(zhì)量量表〕,4個[25-28]為用于測評癌癥及其他疾病患者HRQoL的特異性量表,11個[29-39]為普適性HRQoL量表。2005年,德國學(xué)者研制了第一個用于測量男性不育患者HRQoL的量表——TLMK[20]。FertiQoL是由歐洲人類生殖和胚胎學(xué)協(xié)會與美國生殖醫(yī)學(xué)會專家于2011年采取國際合作方式、跨學(xué)科方法研制而成的且經(jīng)過國際多中心臨床驗證的第一個不孕不育患者HRQoL特異性量表[21-22],現(xiàn)已被翻譯和修訂成中文版且通過了心理測量學(xué)性能檢驗[40-42]。2017年王英[24]研制了中國首個針對女性肝郁型不孕癥患者的HRQoL特異性量表。在11個普適性HRQoL量表中,2個量表的研制基于中國人群數(shù)據(jù),分別為生活質(zhì)量評定問卷(GQOLI-74)[38]和中華生存質(zhì)量量表(ChQOL)[39]。19個不孕不育患者HRQoL量表的基本信息見表1。
2.3 不孕不育患者HRQoL測量的相關(guān)量表應(yīng)用現(xiàn)狀 納入的229篇文獻(xiàn)中,19個量表共計被使用233次,其中FertiQoL量表在現(xiàn)有研究中被使用的頻率最高〔39.1%(91/233)〕,其次為SF-36〔33.9%(79/233)〕、世界衛(wèi)生組織生存質(zhì)量測定量表簡表(WHOQOL-BREF)〔9.9%(23/233)〕、生活質(zhì)量綜合評定問卷(GQOLI-74)〔6.9%(16/233)〕、健康調(diào)查12條簡表(SF-12)〔2.1%(5/233)〕、世界衛(wèi)生組織生存質(zhì)量測定量表(WHOQOL-100)〔1.3%(3/233)〕等普適性HRQoL量表,見圖2。在不孕不育患者HRQoL特異性量表中,王英[24]編制的中醫(yī)肝郁型不孕癥生命質(zhì)量量表在開發(fā)后尚未得到應(yīng)用。
圖2 不孕不育患者HRQoL量表的應(yīng)用頻次(截至2020-10-05)Figure 2 The application frequency of HRQoL instruments in infertility patients as of October 5,2020
2.4 不孕不育患者HRQoL特異性量表開發(fā)質(zhì)量評價 基于COSMIN偏倚風(fēng)險評價清單中的PROMs開發(fā)模塊對TLMK[20]、FertiQoL[21-22]、QOLICQ[23]及中醫(yī)肝郁型不孕癥生命質(zhì)量量表[24]的開發(fā)質(zhì)量進(jìn)行評價(表2),并且對各個量表條目的形成與篩選過程進(jìn)行梳理(表3)。4個不孕不育患者HRQoL特異性量表開發(fā)研究均描述了量表針對的目標(biāo)人群和使用背景,且研究人群的選擇具有代表性,其在上述三方面的方法學(xué)質(zhì)量為“非常好”。除中醫(yī)肝郁型不孕癥生命質(zhì)量量表的開發(fā)者外,TLMK、FertiQoL、QOLICQ量表的開發(fā)者在構(gòu)建量表條目的過程中均對患者進(jìn)行了定性訪談。應(yīng)用認(rèn)知性訪談法評估目標(biāo)人群對不孕不育患者HRQoL特異性量表條目的理解及對量表內(nèi)容全面性的看法時:FertiQoL量表的開發(fā)者并未提及認(rèn)知性訪談是否由經(jīng)驗豐富的訪談員組織實施、訪談過程是否全程錄音、轉(zhuǎn)錄的細(xì)節(jié)及是否由兩名研究者參與資料分析等內(nèi)容,故FertiQoL量表開發(fā)研究認(rèn)知性訪談部分的方法學(xué)質(zhì)量為“有問題的”;而TLMK、QOLICQ量表的開發(fā)者則未闡述是否評估了目標(biāo)人群對量表條目的理解程度,故TLMK、QOLICQ量表開發(fā)研究認(rèn)知性訪談部分的方法學(xué)質(zhì)量為“不合格”。此外,上述3個量表開發(fā)研究對訪談提綱、轉(zhuǎn)錄/編碼過程、資料飽和判定標(biāo)準(zhǔn)及資料分析方法等方面的信息披露不足。FertiQoL量表開發(fā)的總體質(zhì)量為“有問題的”,TLMK、QOLICQ、中醫(yī)肝郁型不孕癥生命質(zhì)量量表開發(fā)的總體質(zhì)量均為“不合格”。
表2 不孕不育患者HRQoL特異性量表開發(fā)質(zhì)量評價Table 2 Evaluation of the development quality of infertility-specific HRQoL instruments
表3 不孕不育患者HRQoL特異性量表條目的形成與篩選Table 3 Item generation and screening toward developing infertilityspecific HRQoL instruments
2.5 不孕不育患者HRQoL特異性量表開發(fā)研究方法學(xué)質(zhì)量評價及量表測量性能評價 4項量表開發(fā)研究均未對量表的跨文化效度/測量等同性、測量誤差進(jìn)行評價。(1)內(nèi)容效度方面:FertiQoL、QOLICQ量表開發(fā)研究的方法學(xué)質(zhì)量分別為“非常好”“有問題的”;TLMK量表開發(fā)研究未采用專家評定法評價量表的內(nèi)容效度,中醫(yī)肝郁型不孕癥生命質(zhì)量量表開發(fā)者則未對患者進(jìn)行調(diào)查,并且對定性和定量分析的方法描述不夠清晰,故TLMK、中醫(yī)肝郁型不孕癥生命質(zhì)量量表開發(fā)研究的方法學(xué)質(zhì)量均為“合格”。(2)結(jié)構(gòu)效度方面:TLMK、FertiQoL及中醫(yī)肝郁型不孕癥生命質(zhì)量量表開發(fā)研究均采用探索性因子分析法評價量表的結(jié)構(gòu)效度,方法學(xué)質(zhì)量均為“合格”;QOLICQ量表開發(fā)研究雖然進(jìn)行了探索性因子分析,但是未明確闡明因子分析的樣本量及因子旋轉(zhuǎn)方法等,方法學(xué)質(zhì)量為“有問題的”;4個量表開發(fā)研究均未進(jìn)行驗證性因子分析,故4個量表的結(jié)構(gòu)效度均為“不確定”。(3)內(nèi)部一致性方面:4個量表開發(fā)研究均報告了量表的Cronbach'sα系數(shù),方法學(xué)質(zhì)量均為“非常好”;4個量表的Cronbach'sα系數(shù)均>0.7,內(nèi)部一致性均為“足夠”。(4)重測信度方面,僅QOLICQ量表開發(fā)研究對量表的重測信度進(jìn)行了評價,并報告了量表的重測信度相關(guān)系數(shù),但由于其未明確報告測量方法、統(tǒng)計分析方法等方面的信息,其方法學(xué)質(zhì)量為“有問題的”,量表的重測信度為“不確定”。(5)效標(biāo)效度方面:中醫(yī)肝郁型不孕癥生命質(zhì)量量表開發(fā)研究采用Pearson相關(guān)檢驗量表與FertiQoL量表間的效標(biāo)效度,方法學(xué)質(zhì)量為“非常好”;Pearson相關(guān)性系數(shù)為-0.792,量表的效標(biāo)效度為“足夠”。(6)建構(gòu)效度方面:僅TLMK量表開發(fā)研究進(jìn)行了建構(gòu)效度分析,方法學(xué)質(zhì)量為“非常好”,量表的建構(gòu)效度為“足夠”。(7)反應(yīng)度/靈敏度方面:FertiQoL量表開發(fā)研究發(fā)現(xiàn),不同性別不孕不育患者FertiQoL量表得分存在明顯差異;FertiQoL量表的方法學(xué)質(zhì)量為“非常好”,量表的反應(yīng)度/靈敏度為“足夠”,見表4、5。
表4 不孕不育患者HRQoL特異性量表開發(fā)研究的方法學(xué)質(zhì)量評價Table 4 Methodological quality of research on the development of infertility-specific HRQoL instruments
表5 不孕不育患者HRQoL特異性量表測量性能評價Table 5 Quality of measurement properties of infertility-specific HRQoL instruments
本研究全面梳理了國內(nèi)外不孕不育患者HRQoL量表相關(guān)研究,同時采用國際上應(yīng)用廣泛的PROMs質(zhì)量評價標(biāo)準(zhǔn)COSMIN對量表開發(fā)研究的方法學(xué)質(zhì)量和量表的測量性能進(jìn)行了評估。目前,國內(nèi)外研究者主要運用FertiQoL等特異性量表,以及SF-36、WHOQOL-BREF等普適性量表測量不孕不育患者HRQoL,盡管普適性量表對不孕不育患者HRQoL評估的靈敏度不如特異性量表[44-45],但由于普適性量表能夠為不同疾病人群的健康測量提供統(tǒng)一工具[45],其應(yīng)用仍較為廣泛。FertiQoL量表是目前國際上應(yīng)用最為廣泛的不孕不育患者HRQoL量表[16],其為評估不孕不育患者HRQoL及HRQoL的跨文化比較提供了有效的工具支持。本研究基于COSMIN對不孕不育患者HRQoL特異性量表進(jìn)行系統(tǒng)評價發(fā)現(xiàn),F(xiàn)ertiQoL量表與其他3個不孕不育患者HRQoL特異性量表相比,量表開發(fā)研究具有相對較好的方法學(xué)質(zhì)量且量表的測量性能更佳,但中文版FertiQoL量表中的“伴侶承諾”“是否可以獲取想要的不孕不育癥醫(yī)療服務(wù)”等條目在我國文化背景及醫(yī)療衛(wèi)生服務(wù)體系下的適用性略顯不足[40]。
目前,我國學(xué)者已研制出“中醫(yī)肝郁型女性不孕癥患者的生命質(zhì)量量表”[24],但該量表僅適用于中醫(yī)肝郁型女性不孕癥患者,應(yīng)用范圍較為局限。同時,該量表的開發(fā)者在研制量表的過程中未對患者進(jìn)行訪談。“患者參與”是量表研制的關(guān)鍵環(huán)節(jié),形成和篩選量表條目時,需要通過訪談法或焦點小組討論法等定性研究方法廣泛聽取患者及醫(yī)務(wù)人員的意見和建議[46-47],并且由于中西方之間對“健康”的理解存在較大差異,尤其是在生育文化方面存在著根本性差異[10],缺少“對患者進(jìn)行訪談”這一關(guān)鍵步驟可能會導(dǎo)致關(guān)鍵測量條目的缺失,從而影響量表的靈敏度。
在測量內(nèi)容上,幸福感等主觀感受越來越成為健康測量研究關(guān)注的焦點[48-50],尤其是在生殖健康領(lǐng)域,不孕不育不僅會影響患者的健康,還可能會影響婚姻質(zhì)量和家庭幸福感[15,17]?,F(xiàn)存的不孕不育患者HRQoL特異性量表中,僅TLMK量表包含幸福感維度[20],其余3個量表的研發(fā)者均對不孕不育患者幸福感的關(guān)注度相對不足。在測量方法上,4個不孕不育患者HRQoL特異性量表均是基于經(jīng)典測量理論研制的,其研制過程缺乏現(xiàn)代測量理論的指導(dǎo)。項目反應(yīng)理論等現(xiàn)代測量理論能為量表條目篩選、測量學(xué)性能評價提供更多的方法學(xué)支持[51-52]。此外,現(xiàn)存不孕不育患者HRQoL特異性量表均未對回憶期做出限定,而回憶期限不明確可能會導(dǎo)致測量結(jié)果產(chǎn)生偏倚,也可能會影響縱向研究中研究者對重復(fù)測量時間點的選擇,從而不利于量表反應(yīng)性的評價[16]。目前尚未有研究探討不孕不育患者HRQoL量表的最小臨床重要性差值(MCID)[16],這也給量表結(jié)果的解釋帶來一定的不利影響。
未來,在研制不孕不育患者HRQoL量表時,應(yīng)著力提升量表研制的規(guī)范性,可按照標(biāo)準(zhǔn)化研制流程或COSMIN進(jìn)行量表開發(fā)與測量性能驗證,構(gòu)建量表條目時應(yīng)將專家咨詢法與個人深度訪談法、焦點小組討論法等其他定性研究方法有機(jī)結(jié)合,基于多角度充分挖掘患者的感受和健康信息。在量表研制與測量性能評價方法方面,建議以項目反應(yīng)理論、經(jīng)典測量理論等多種理論為指導(dǎo)進(jìn)行量表條目篩選與測量性能評價,量表研制時需要盡可能設(shè)置回憶期,以為量表反應(yīng)性評估提供相關(guān)參照,保證測評的一致性與準(zhǔn)確性。同時,也須注重對MCID的探討,旨在為量表結(jié)果的解釋提供相應(yīng)參考。
本研究存在一定的局限性:首先,本研究采用了COSMIN作為不孕不育患者HRQoL特異性量表評價工具,COSMIN中部分評價標(biāo)準(zhǔn)主觀性較強(qiáng),可能會導(dǎo)致評價結(jié)果的偏倚;其次本研究僅對不孕不育患者HRQoL特異性量表開發(fā)研究的方法學(xué)質(zhì)量及原版量表的測量性能進(jìn)行了評價,未來在進(jìn)行量表的測量性能評價時可將不同語言版本的量表均納入研究,從而使評價結(jié)果更加全面、完善。也可運用COSMIN改良GRADE[53]綜合評定不孕不育患者HRQoL特異性量表各測量性能的證據(jù)等級,并形成對于量表的最終推薦意見。
作者貢獻(xiàn):史釗、李順平進(jìn)行文章的構(gòu)思與設(shè)計,史釗、吳小燕、劉嘉琪、杜慧敏負(fù)責(zé)文獻(xiàn)篩選及質(zhì)量控制與審校;史釗、吳小燕、劉嘉琪進(jìn)行數(shù)據(jù)收集及整理;史釗、李順平負(fù)責(zé)結(jié)果的分析與解釋,撰寫論文;史釗、李順平、吳小燕、劉嘉琪、杜慧敏進(jìn)行論文的修訂;李順平負(fù)責(zé)文章的可行性分析,對文章整體負(fù)責(zé),監(jiān)督管理。
本文無利益沖突。