郭晉,李衛(wèi)
在臨床醫(yī)學(xué)研究中,統(tǒng)計(jì)學(xué)作為重要的分析手段已被廣大臨床醫(yī)生所認(rèn)同。因?yàn)榕R床醫(yī)學(xué)研究的對(duì)象是人,作為最高等的生物體,人體出現(xiàn)的各種現(xiàn)象充滿了變異性也存在許多規(guī)律性,統(tǒng)計(jì)學(xué)就是通過差異描述規(guī)律;透過現(xiàn)實(shí)走向理性,走出混沌,走向秩序的學(xué)科。
一項(xiàng)臨床研究項(xiàng)目,統(tǒng)計(jì)學(xué)研究設(shè)計(jì)、方法運(yùn)用質(zhì)量的高低反映了這個(gè)項(xiàng)目科學(xué)性、嚴(yán)謹(jǐn)性。希臘約阿尼納大學(xué)的Ioannidis等人對(duì)1990-2003年期間發(fā)表在N Engl J Med、JAMA和LANCET三種著名醫(yī)學(xué)雜志上,而且引用次數(shù)在1000次以上的文獻(xiàn)進(jìn)行調(diào)查。結(jié)果顯示,在49篇高引用率的原始文獻(xiàn)中,45篇聲稱干預(yù)方法有效,而報(bào)告結(jié)果被以后的研究所否定的有7篇(15.6%),最初報(bào)告的療效被夸大的有7篇(15.6%),因此接近1/3的研究結(jié)果沒有經(jīng)受住時(shí)間的考驗(yàn)[1,2]。如果這些研究在研究伊始,就能夠重視統(tǒng)計(jì)學(xué)在試驗(yàn)設(shè)計(jì)、資料收集與整理、資料表達(dá)與描述、結(jié)果分析、結(jié)果解釋和結(jié)論陳述等各環(huán)節(jié)的應(yīng)用,我們相信更多令人信服的結(jié)論會(huì)出現(xiàn)。針對(duì)臨床醫(yī)學(xué)科研中統(tǒng)計(jì)學(xué)的應(yīng)用,國(guó)家心血管病中心醫(yī)學(xué)研究統(tǒng)計(jì)中心將逐一介紹相關(guān)的理論和方法,以期幫助廣大臨床醫(yī)生提高統(tǒng)計(jì)學(xué)的應(yīng)用水平。
本期雜志,我們首先介紹統(tǒng)計(jì)學(xué)的基本內(nèi)容,概率的定義和醫(yī)學(xué)解釋。
在醫(yī)學(xué)科研和科研論文寫作時(shí),我們經(jīng)常會(huì)見到P<0.05的情形,要搞清楚這個(gè)問題,就要明白隨機(jī)事件的概念。在自然界和人類社會(huì)中,存在著兩類不同的現(xiàn)象:一種叫確定性事件,是指在一定條件下,一件事肯定發(fā)生或肯定不發(fā)生,如秋季過后,冬季必然會(huì)來臨,而不可能是夏季。另一種叫隨機(jī)事件,比如,拋擲一枚硬幣,結(jié)果可能是國(guó)徽向上,也可能幣值向上,拋擲前不能肯定。
對(duì)于隨機(jī)事件的發(fā)生情況,我們用概率(Probability)來描述,概率用P值來表示。P值反映了事件發(fā)生可能性的大小。概率用從0到1之間的小數(shù)表示,也可表示為百分?jǐn)?shù)。
比如,我們希望知道某種降壓藥物的有效性。為此,我們?cè)O(shè)計(jì)了一個(gè)試驗(yàn),有300個(gè)高血壓患者陸續(xù)接受了治療,其中240人用藥后降壓效果明顯,有效率為=80%,這個(gè)數(shù)字是經(jīng)過了300次試驗(yàn)得到的。就像仍硬幣一樣,扔的次數(shù)越多,國(guó)徽向上的可能性就越接近50%。同理,對(duì)于這個(gè)降壓藥而言,其有效的可能性就是80%,簡(jiǎn)單的理解,如果有第301個(gè)人用此降壓藥治療高血壓,用藥有效的可能性為80%。
統(tǒng)計(jì)學(xué)檢驗(yàn)的目的是檢驗(yàn)樣本之間的差別是來源于抽樣誤差的可能性大小。P<0.05是說明樣本之間的差別是不可能來源于抽樣誤差,而是事實(shí)存在的差別。還以上述高血壓試驗(yàn)為例。假如這300個(gè)人又服用了另外一種藥物,結(jié)果有210個(gè)人降壓效果明顯,有效率70%,問題是第一種藥和第二種藥的降壓效果到底有無(wú)區(qū)別呢?我們通過合適的統(tǒng)計(jì)學(xué)方法進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn)和計(jì)算,會(huì)得到一個(gè)P值,如果P<0.05,就說明我們的這次試驗(yàn)表明,兩種降壓藥物是等效的這種可能很小,是小概率事件,從而證明這兩種降壓藥的有效性是有差別的。
P<0.05的正確表達(dá)應(yīng)為“差異(或差別)有統(tǒng)計(jì)學(xué)意義”,并不含有差異非常大的意思?!安町?或差別)顯著”或“差異(或差別)非常顯著”是從英文翻譯過來的,原文statistical significance并不含差異大或非常大的意思。P>0.05的正確表達(dá)為“差異(或差別)無(wú)統(tǒng)計(jì)學(xué)意義”,并不能說明所檢測(cè)的對(duì)象有無(wú)差別,可能有差別,但是試驗(yàn)的結(jié)果沒有證明有差異,沒有達(dá)到有統(tǒng)計(jì)學(xué)意義的水平。
[1]蔣文.臨床研究結(jié)果面臨時(shí)間的考驗(yàn).中國(guó)醫(yī)學(xué)論壇報(bào),2005,21.
[2]Ioannidis JP.Why most published research findings are false.Plos Med,2005,2:e214.