宋培培
(上海市生物醫(yī)藥技術(shù)研究院《中華生殖與避孕雜志》編輯部,上海 200237)
隨機對照試驗(randomized controlled tiral,RCT)是臨床研究中評估干預效果的最佳研究,對臨床治療和醫(yī)療保健干預具有更重要和更直接的影響,因此其報告內(nèi)容必須具備完整性、科學性和透明性。臨床試驗報告的統(tǒng)一標準(Consolidate Standards of Reporting Trials,CONSORT)聲明及其擴展版是目前較為公認的RCT研究報告規(guī)范。但是,CONSORT聲明在中文醫(yī)學期刊未獲得廣泛采納[1],中文RCT論文的報告質(zhì)量距離CONSORT聲明要求仍有較大的差距[2-3]。中文醫(yī)學期刊作為記載、傳播我國醫(yī)學臨床研究科技信息的主要載體,肩負著為我國各類醫(yī)療衛(wèi)生決策提供證據(jù)的重任。因此,提高中文醫(yī)學期刊RCT報告質(zhì)量,是中文醫(yī)學期刊編輯亟須關(guān)注的問題。
但是,中文醫(yī)學期刊編輯對CONSORT聲明的知曉率和掌握程度較低[4-5],現(xiàn)有研究多集中在中文RCT的報告執(zhí)行的評價[6-7],卻鮮有研究從編輯角度,總結(jié)中文RCT研究報告中編輯審查要點。為此,本研究通過文獻調(diào)查法對比中英文期刊中RCT報告異同,結(jié)合筆者在工作和學習中的體會,淺談編輯借鑒CONSORT聲明對中文醫(yī)學期刊RCT報告的審查要點,以期為有助于提高中文RCT的報告質(zhì)量。
在中文醫(yī)學期刊全文數(shù)據(jù)庫中,檢索RCT研究報告。中文文獻納入標準:①28種入選2020年第5屆中國精品科技期刊的中華醫(yī)學會中華系列雜志;②文獻類型為隨機對照試驗原始研究;③發(fā)表年份為2019年。在中文醫(yī)學期刊全文數(shù)據(jù)庫中,運用檢索式為(((標題=隨機對照) OR關(guān)鍵詞=隨機對照*) OR 摘要=隨機對照) AND 刊名= * AND 出版日期= [2019-01-01 TO 2019-12-31]。排除標準:①隨機對照試驗的meta分析;②翻譯文獻;病例對照研究;診斷性試驗;通過標準數(shù)據(jù)庫采集臨床數(shù)據(jù)。共檢索到22條中文文獻。
以NEJM雜志為范本,按照中文文獻和英文文獻1:3比例收集英文文獻。文獻檢索策略:在“All the words”檢索項錄入“random”,在“Search within”檢索項選擇“Full text”,在“Article category”檢索項選擇“Research”,在“Date”檢索項選擇“Jan 2019”至“Dec 2019”。排除標準:未提供有關(guān)試驗設計信息和研究結(jié)果的論文。共檢索到180篇文獻。按照Most cited排序,選擇66篇文獻。
CONSORT清單共25項條目,若該條目的相關(guān)信息大部分或完整呈現(xiàn)定義為“報告”,按照報告率<10%、≥10%且<50%、≥50%且<100%和100%,中英文RCT文獻執(zhí)行CONSORT清單各條目的報告情況如表1所示。
表1 中英文RCT文獻CONSORT清單各條目報告情況[n(%)]
CONSORT聲明及其擴展版針對特殊研究設計、特殊研究領域及特殊結(jié)局限定了報告規(guī)范的適用范圍。RCT報告需根據(jù)設計類型和研究領域選擇合適的報告規(guī)范予以參考。本次調(diào)查中文文獻中有1篇整群隨機對照試驗、1篇非劣效性隨機對照試驗均未完全借鑒相應的報告規(guī)范進行報告。整群對照試驗中同一群內(nèi)個體往往具有一定的相關(guān)性(非獨立性),如果使用個體隨機化的方法分析整群隨機化試驗將夸大干預效應,出現(xiàn)假陽性的結(jié)果。而非劣效性試驗的目的是確定一種新的干預是否不劣于陽性藥物或者非藥物的標準治療,需要預先指定一個非劣效性差值(Δ)。對于非劣效性試驗報告,規(guī)范要求需明確非劣效性試驗做出合理的假設,需詳細說明非劣效性試驗的受試者、干預措施、結(jié)局指標時是否與確立參照處理優(yōu)效性的試驗中用到的相似或相同,且需要明確采取與傳統(tǒng)優(yōu)效性試驗(顯著性檢驗)不同的統(tǒng)計學方法。如果未正確報告此類試驗,研究結(jié)果將會錯誤估計療效,誤導讀者。因此,如RCT論文未參照合適的CONSORT研究報告規(guī)范,可能導致研究內(nèi)容信息披露不完整或存在偏差。
科研報告的完整性和透明性,是影響研究被轉(zhuǎn)化和利用的重要因素。RCT研究的評價需要從統(tǒng)計方法學和臨床醫(yī)學兩方面入手。因此,充分的、完整的方法學介紹,將有助于讀者判斷一項RCT研究結(jié)論在指導臨床醫(yī)生面對個性化患者時應用的可靠性。中英文文獻報告率均不足50%的條目有3b(試驗開始后方法上的重要改變及原因)、條目6b(試驗開始后結(jié)局的改變及原因)、條目8b(隨機化類型;任何限定情況,如區(qū)組和區(qū)組大小)、條目9(分配隱藏)、條目10(誰產(chǎn)生分配序列,誰納入研究對象,誰分配研究對象)、條目11b(組間干預的相似性)??梢姡谠囼為_始后是否有方法學和結(jié)局的改變,隨機化的方法上,中英文文獻在正文中的報告率均較低。中文文獻報告率不足50%,但是英文文獻報告率較高的條目有條目3a(隨機化類型)、條目6a(明確定義主要和次要結(jié)局,包括何時、如何評價)、條目7a(樣本量如何確定)。
結(jié)果部分,本研究中中文RCT文獻報告率不超過50%的,但是英文文獻報告率較高的條目有13a(各組接受隨機分配、接受干預和進入主要結(jié)局分析的研究對象數(shù)量)、13b(各組隨機化之后發(fā)生的失訪、排除,以及原因)。本研究中文文獻的報告中雖然都描述了各組研究對象納入結(jié)果,但是卻沒有一篇使用流程圖介紹入組過程。另外,在結(jié)果統(tǒng)計時,在中文文獻結(jié)果部分,均未能充分重視意向性治療(intention-to-treat,ITT)分析,全部都是按照符合方案(per protocol,PP)分析。而英文文獻都是用ITT分析。所有入選的受試者應該包括在原隨機分配的組別中進行分析,如果某些研究對象因脫落或退出未能完成研究,PP分析會導致偏倚的產(chǎn)生,因此,CONSORT聲明是推薦使用ITT分析,而目前ITT分析在RCT中文文獻應用尚不普遍。
對結(jié)局的描述不僅要描述發(fā)生/未發(fā)生事件的研究對象數(shù)量和分母,或結(jié)局指標的均值和標準差,還要描述組間比較的情況即效應大小及其置信區(qū)間。效應指標及其置信區(qū)間應與P值一起描述,但是目前這個要求在RCT中文文獻中并未普遍執(zhí)行,在英文文獻中普遍得到執(zhí)行。
CONSORT清單要求討論中對該研究的不足、存在問題、試驗過程中可能產(chǎn)生的偏倚、報告結(jié)果可能潛在的誤差和導致原因等方面進行客觀闡述。中英文文獻均有一半及以上的比例報告了條目20(試驗局限性;關(guān)注偏倚的來源、不精確度;多重比較問題)。但是,依然可以反映出,作者對原始研究局限性的討論在報告中常常忽略;另外,在中文文獻中常常將“樣本量較小”作為試驗的局限性。而中文文獻中是缺少樣本量的估算報告的,因此這個局限性的描述缺乏說服力。
要想依據(jù)CONSORT聲明準確、充分地報告RCT,首先是尋找到對應的CONSORT聲明及擴展版的報告規(guī)范。目前,CONSORT聲明擴展版有17份(詳情可查閱http://www.consort-statement.org/extensions)。編輯部在初審階段就可以要求作者對缺失條目予以補充,一方面避免試驗中確實已經(jīng)實施的步驟而在報告中遺漏的現(xiàn)象,另一方面也可對未能補充的條目闡明原因,以便在同行評議階段審稿專家對該試驗研究質(zhì)量進行偏倚評估。在此,筆者呼吁國內(nèi)期刊重視臨床試驗的注冊并在官網(wǎng)提供查看完整研究方案的路徑。編輯在審查時引導作者提高對試驗注冊的重視,可推動注冊的具體實施。應重視對RCT報告聲明倫理學的審查,對研究實施過程中是否符合《赫爾辛基宣言》進行審查。
編輯要繼續(xù)重視RCT研究報告中對隨機序列產(chǎn)生的類型、樣本量的估算方法、對期中分析的解釋和試驗終止標準、分配隱藏機制、盲法中的目標人群和實施的報告率。另外,本研究還發(fā)現(xiàn),盡管所有的中文RCT研究均報告了觀察指標及其定義,但是未明確定義主要結(jié)局指標和次要結(jié)局指標。明確定義主要結(jié)局是十分必要的,它常用于計算樣本量,注意此部分的報告,可以與樣本量的報告相呼應,提高樣本量的報告率。樣本量的確定是RCT研究設計的重要環(huán)節(jié)。編輯審查工作中,要重視RCT研究報告中詳細描述樣本量的估算要素,包括:①各組結(jié)局指標的估計值或比較組間具有重要臨床意義的目標差異,以及對照組結(jié)局指標的估計值。②表示I類錯誤水平的α。③統(tǒng)計學把握度1-β或表示II類錯誤的β。④對于連續(xù)變量,測量值的標準差。
CONSORT清單提供了研究對象的納入流程圖,在沒有失訪或排除的情況下,文章可以通過文字描述研究對象的流動過程,但是對于研究對象存在未接受所分配的干預、出現(xiàn)失訪、因依從性差從分析中被排除的情況時,編輯應該建議作者使用流程圖報告患者的納入情況。
在正規(guī)的隨機試驗中觀察到的差異按定義來說都是因機遇產(chǎn)生的,即使差異存在統(tǒng)計學意義,也是由于機會所導致的[8]。在基線特征比較時,中文醫(yī)學期刊編輯應引導作者正確認識P值的意義,在進行基線特征的假設檢驗不僅是不必要的,而且還可能是有害的,如果根據(jù)基線的統(tǒng)計學顯著性檢驗來考慮組間的可比性,則會導致研究者或者讀者忽略具有臨床意義的差異對干預效果帶來的影響。因此,在實際報告中,連續(xù)變量可以通過均數(shù)和標準差(正態(tài)分布)或中位數(shù)與范圍(偏態(tài)分布),分類變量可以通過各類數(shù)量和比例來判斷組間相似性。
ITT分析原則在中文RCT論文對結(jié)局的報告中未得到廣泛的應用。中文醫(yī)學期刊編輯應引導作者充分重視ITT分析,因為ITT分析可避免由于研究對象非隨機因素退出研究而造成的偏倚。而ITT原則主要是要求分配到任一處理組的受試者都應當作該組成員被隨訪、評估和分析。
CONSORT清單要求結(jié)果應報告每個主要和次要結(jié)局的結(jié)果、效應值和精度(如95%置信區(qū)間),二分類變量要同時報告絕對效應和相對效應。在中文RCT報告中較少提及效應值及其置信區(qū)間。對于連續(xù)性變量來說,效應值通常是均差,對于二分類變量來說,效應指標可能是相對危險度、比值比或率差,對于生存資料而言,效應值是危險比或中位生存時間差。臨床試驗的結(jié)果的判斷應從單純關(guān)注差異的統(tǒng)計學意義(P<0.05),擴展到同時關(guān)注結(jié)果的臨床意義和臨床效應量的大小[9]。因此,中文醫(yī)學期刊編輯應引導作者充分報告結(jié)果的效應值和其置信區(qū)間。
CONSORT清單要求在討論部分,應結(jié)合試驗的研究假設、試驗的結(jié)果、試驗的優(yōu)勢與不足對結(jié)果進行合理解釋。編輯在審查中,應提醒作者對研究的局限性進行說明,并注重審視以下幾個方面:一是注意從方法學的角度對研究的缺陷進行評價,但要避免出現(xiàn)文中未報告樣本量的計算方法,卻在討論中認定由于樣本量較小的情況。二是注意區(qū)分統(tǒng)計學上的差異和臨床意義的差異。中文RCT報告中,經(jīng)常遇到作者將一個統(tǒng)計學上不存在顯著性的差異,解釋為干預效果一樣。但是,統(tǒng)計學意義并不完全等于臨床意義,因此編輯在審查時應注意避免此類錯誤。在評價結(jié)果的臨床意義時,對于某一事件發(fā)生率較低的群體中,應特別考慮到是否是由于研究樣本量大從而達到了統(tǒng)計學上的顯著差異,但其絕對獲益很小,臨床干預意義并不大;或者應考慮到干預措施在衛(wèi)生經(jīng)濟學上的合理性,或者實施的可行性和可推廣性,是否是最優(yōu)選擇。三是注意謹慎解釋亞組分析結(jié)果。中文RCT報告常存在對亞組分析結(jié)果的誤讀。編輯在審查時,應提醒作者亞組分析的結(jié)果在統(tǒng)計學上有顯著性,通??赡軆H僅由于機會造成的,多重性分析可以增大假陽性的概率。當亞組分析在滿足下列條件時,包括:①亞組分析納入統(tǒng)計學設計;②亞組檢驗假說數(shù)量少;③亞組差異通過研究內(nèi)而不是不同研究得出;④亞組間差異大;⑤有不同研究亞組分析結(jié)果或外部證據(jù)的支持;⑥亞組分析結(jié)果符合醫(yī)學邏輯,才可提高亞組分析的可靠性[10]。
科技期刊編輯既是科研工作成果的把關(guān)人,也是指引者。作為臨床試驗研究領域第一個重要的報告規(guī)范,中文醫(yī)學編輯不僅應充分認識到CONSORT聲明的價值,更應根據(jù)清單熟練掌握編輯審查的要點,積極向讀者和作者宣教,以增加中文RCT研究報告的規(guī)范性和效力,提高中文RCT研究報告的刊登質(zhì)量。綜上,建議對于中文RCT報告,應首先逐一對比CONSORT聲明中的發(fā)表條目,其次進行相應的編輯審查,然后再送外審專家進行同行評議。盡管目前中文RCT研究報告質(zhì)量距離國際標準還有較大差距,只要國內(nèi)醫(yī)學期刊編輯能有效使用CONSORT聲明進行規(guī)范化要求,在編輯工作中嚴格履行審查職責,引導臨床科研工作者提高對中文RCT研究報告規(guī)范性和效力的重視,將有助于提升我國中文RCT研究報告的整體質(zhì)量。