陳佰鋒,陳玉娟,朱 玉,李 杰,姚應水
(皖南醫(yī)學院,安徽 蕪湖 241002)
● 經驗交流 ●
醫(yī)學科研中常見統計學誤用及其防范對策
陳佰鋒,陳玉娟,朱 玉,李 杰,姚應水
(皖南醫(yī)學院,安徽 蕪湖 241002)
醫(yī)學科研的整個過程都需要統計學知識,統計學的合理選擇及應用直接影響到醫(yī)學科研的質量。文章分別從研究設計、統計分析、統計學表達、結果解釋共4個方面對醫(yī)學科研中常見的統計學誤用進行了歸納分析,并提出了相應防范對策,為醫(yī)學科研工作者正確使用統計學知識提供參考依據。
醫(yī)學科研;統計學方法;統計學表達;結果解釋
統計學作為一種強大的醫(yī)學科研工具,廣泛應用于國內外各種公開發(fā)行的醫(yī)學期刊中,然而其應用水平往往不盡人意,大量的醫(yī)學科研論文被指出存在統計學誤用[1]。統計學誤用往往導致非常嚴重的后果,如結論錯誤、數據造假、丟失有價值的數據信息等,醫(yī)學科研中的統計學誤用更是違背了醫(yī)學倫理學要求,甚至可能導致不良的臨床后果[2]。
為了使廣大醫(yī)學科研工作者認識到統計學的重要性,筆者對近年來國內醫(yī)學期刊中常見的統計學誤用從四個方面進行了歸納分析,并提出了相應的防范對策,以提高科研論文質量及我國醫(yī)學科研的整體水平。
醫(yī)學科研順利開展的前提在于良好的設計,設計階段的缺陷可能導致整個科研沒有意義,甚至得出某些錯誤的結論[1],這也將嚴重違背醫(yī)學倫理學要求。統計學方面的設計主要包括確定研究類型、估算樣本含量、確定預期研究成果、選定統計分析指標和方法等。在研究設計階段應認真考慮統計方面設計。
樣本含量、抽樣方法、組間均衡性、盲法等科研方法都應在設計階段敘述清楚。樣本含量應在研究設計階段進行估計,研究中途的退出者應詳細記錄并體現在論文中,樣本含量不足時往往導致檢驗效能低下,從而增加犯II類錯誤的風險[3]。抽樣方法也應詳細介紹,所有的統計推斷結論都是基于隨機樣本得到的,對于“隨意取得”的樣本沒有任何意義。組間均衡性問題也應考慮,僅僅采用假設檢驗來判定組間基線資料的均衡性是不夠的,特別是當樣本量較小時,由于缺乏檢驗效能,結果往往不正確。當組間不均衡時,除非采用多元分析方法(如協方差分析)去校正混雜因素,否則統計學差異就不能簡單的歸因于實驗效應。另外,為了減小研究偏倚,還應盡量采用盲法等方法。研究設計中常見的統計學錯誤和缺陷見表1。
表1 研究設計常見的統計學錯誤和缺陷
同一種數據資料可選擇的統計分析方法有很多,但是研究者仍需慎重選擇最佳的統計方法。選擇任何統計學方法都應嚴格考慮其應用條件,然而不幸的是,在很多醫(yī)學期刊中,即使最簡單的統計學方法(如t檢驗和χ2檢驗等)都常常出現誤用(如不滿足正態(tài)性和方差齊性的兩獨立樣本卻采用了t檢驗)。除了要選擇正確的統計學方法,還需要選擇正確的計算公式,如進行四格表χ2檢驗時,公式的選擇需要考慮樣本含量及理論數的大小。
單因素K(K≥3)水平設計的定量資料,不能簡單的對多個組進行兩兩比較的t檢驗,否則會增大I類錯誤的風險[4]。另外,設計初期沒有指定的多組間兩兩比較方法也應避免使用,否則會給人以“經營”統計學顯著性結論的印象[5]。多個組的兩兩比較往往是由于設計缺陷導致,這種缺陷通??梢栽谘芯吭O計階段通過咨詢統計學家盡量避免。對于多組設計資料的比較,可采用非參數檢驗或方差分析。如果存在某些可能的混雜因子或者組間基線資料不匹配,還必須采用多元分析方法。數據分析常見的統計學錯誤和缺陷見表2。
表2 數據分析常見的統計學錯誤和缺陷
醫(yī)學科研的數據及統計學方法應詳細描述,以便讀者可以通過相關數據對研究結果進行檢驗。在論文中,雖然沒有必要介紹統計學的具體公式及計算過程,但所選擇的統計學方法的類型及其適用條件都應詳細說明;另外,對于是否配對設計,以及假設檢驗的單雙側問題等都應進行說明。有的論文中將統計學方法簡單的表述為“選擇合適的統計學方法”,雖然表面上作者好像是傾向于使用“合適”的統計學方法,實際上這種表達是不嚴謹的。
一個好的研究,其統計表達如同數據收集和統計分析一樣重要。若數據為正態(tài)分布或近似正態(tài)分布,用算數均數和標準差描述其集中趨勢和離散趨勢。表示方法上,采用“均數(標準差)”要好于“均數±標準差”,因為后者容易被誤讀為95%的置信區(qū)間。由于標準誤使數據看起來變異度更小,論文中常見用標準誤代替標準差進行統計描述的錯誤,而標準誤是統計推斷指標而不是統計描述指標,必須避免這種誤用[6]。如果資料是偏態(tài)分布,應使用中位數、四分位數間距或極差進行描述。然而,研究者應該認識到極差容易受到極端值的影響,因此使用四分位數間距更穩(wěn)定。若檢驗方法采用的是非參數檢驗,應采用中位數、極差或四分位數間距進行描述。此時用均數和標準差進行描述就自相矛盾了。另外,統計描述時僅僅給出了集中趨勢指標而沒有給出變異指標也是不充分的。
假設檢驗的P值僅僅反映現有樣本中H0成立的概率,它并不能反映組間差異的大小[7]。因此,為了反映組間差異的大小,對于主要的數據和結果還應給出置信區(qū)間,而且,除了有每個組的置信區(qū)間,還應該有組間差異的置信區(qū)間,這樣可以為讀者提供更多的信息。P值應該寫出具體值,而不是簡單的給出一個大小范圍(如P<0.05或P>0.05),但給出超高精確度P值也沒必要(如P=0.00321……),因為根本無法由一般大小的樣本含量去論證P值的超高精確度。統計學表達常見的統計學錯誤和缺陷見表3。
表3 統計學表達中常見的錯誤和缺陷
所有的研究結果必須有相關數據的支持,差異有統計學意義的結論必須來自于假設檢驗;差異無統計學意義時,下結論也要慎重,因為統計學沒有差異并不一定說明沒有效果或沒有差異——特別是結論來自于小樣本資料時要考慮犯II類錯誤的可能性,無統計學差異的結論也可能包含重要的臨床發(fā)現和對其他研究者有價值的信息。研究結果的解釋還需要充分考慮潛在的混雜因子和偏倚。統計分析結果解釋錯誤或缺陷見表4。
表4 統計分析結果解釋錯誤或缺陷
本文通過分析總結醫(yī)學科研中常見的統計學誤用情況,以幫助醫(yī)學科研工作者提高科研水平,重視數據在科研中的作用。本文分析了一些簡單但又很實用的統計學問題,旨在幫助那些沒有系統學習過統計學知識的科研人員完善其科研中的統計學設計。然而,隨著醫(yī)學科研對統計學要求的提高,本文所提到的統計學問題還遠遠不足,其它一些統計學問題如隨機對照試驗、meta分析、診斷試驗等,需要研究者學習更廣泛和更深入的統計學知識[8]。
目前有很多非常簡單的統計軟件包供科研者使用,即便是沒有什么統計學知識的研究人員同樣可以方便進行統計分析,但是若研究人員缺乏相關統計學知識或相關概念模糊,可能會出現一些錯誤的分析結果。另外,很多研究都是在設計已經完成之后,在研究過程中出現問題后再去請教統計學專家,此時往往難以避免統計學的不足,從而導致科研的浪費[9]。
有研究表明,醫(yī)學專業(yè)期刊的統計學審核還不夠嚴格,醫(yī)學雜志編輯應該對稿件中相關統計學問題進行專審。在論文發(fā)表前,需要統計學專家對所有統計學問題進行審核,雜志也應該在“稿約”中規(guī)定相關統計學的要求[10]。
生物醫(yī)學研究中統計學知識關系到一個病人的存活或者死亡、關系到健康的改善或損害、關系到醫(yī)學科學的進步或者錯誤。醫(yī)學科研的進步需要合理的統計學實踐,研究者、雜志編輯、大學老師、統計學專家等,無論其水平和職業(yè)都有義務以專業(yè)性、合乎倫理的態(tài)度,嚴謹的應用統計學方法來促進科學研究。
[1] ALTMAN DG.Statistics in medical journals: some recent trends[J].Stat Med,2000,19(23):3275-3289.
[2] GARDENIER JS,RESNIK DB.The misuse of statistics:concepts,tools,and a research agenda[J].Account Res, 2002,9(2):65-74.
[3] OLSEN CH.Review of the use of statistics in Infection and Immunity[J].Infect Immun,2003,71(12):6689-6692.
[4] 王 倩,張博恒.五種中華醫(yī)學會系列雜志論著中統計方法的應用現況[J].中華醫(yī)學雜志,1998,78(3):230-233.
[5] MOREIRA ED,STEIN Z,SUSSER E.Reporting on methods of subgroup analysis in clinical trials:a survey of four scientific journals[J].Brazilian J Med Biol Res,2001,34 (11):1441-1446.
[6] NAGELE P.Misuse of standard error of the mean (SEM) when reporting variability of a sample.A critical evaluation of four anaesthesia journals[J].Br J Anaesth,2001,90 (4):514-516.
[7] 孫紅衛(wèi),董兆舉,趙擁軍.對統計假設檢驗的誤解與誤用[J].中國衛(wèi)生統計,2012,29(1):147-150.
[8] MOHER D,SCHULZ KF,ALTMAN DG.The CONSORT statement:revised recommendations for improving the quality of reports of parallel-group randomised trials[J].Lancet, 2001,357(9263):1191-1194.
[9] ALTMAN DG,GOODMAN SN, SCHROTER S.How Statistical Expertise is used in Medical Research[J].JAMA,2002,287 (21):2817-2820.
[10] 王 玖,徐天和,祁愛琴,等.醫(yī)學論文統計學誤用及其防范對策[J].編輯學報,2002,14(6):417-418.
(本文編輯:何慶節(jié))
Prevention measure to common statistical misuse in medical research
CHEN Bai-feng, CHEN Yu-juan, ZHU Yu, LI Jie, YAO Ying-shui
(Wannan Medical College, Wuhu Anhui 241002, China)
The entire process of medical research requires statistical knowledge. The reasonable selection and application of statistic directly influent the quality of medical research. This paper concludes and analyzes common statistical misuse in medical research as follow 4 aspects: study design, statistic analysis, statistics expression and result interpretation. it is widely recognized that the proper use of statistics is a key element of research integrity. It puts forward relevant prevention measures, providing the reference frame for proper using statistic to medical researchers.
medical research, statistical method, statistics expression, result interpretation
R195.1
A
1003-2800(2014)01-0058-03
2013-07-29
安徽省高等學校省級教學研究項目(20100612,2008jyxm529)
陳佰鋒(1980-),男,湖北建始人,講師,碩士,主要從事流行病學研究。
姚應水(1972-),男,安徽銅陵人,教授,碩士生導師,主要從事流行病學和醫(yī)學統計學研究。