亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        如何正確運用χ2檢驗——橫斷面設計四格表資料的χ2檢驗

        2021-03-24 03:48:46胡純嚴胡良平
        四川精神衛(wèi)生 2021年1期
        關鍵詞:四格橫斷面頻數(shù)

        胡純嚴 ,胡良平 ,2*

        (1.軍事科學院研究生院,北京 100850;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

        在生物醫(yī)藥學和流行病學研究中,基于橫斷面設計收集的四格表資料是常見的[1-2]。根據(jù)資料所滿足的前提條件不同,處理四格表資料的統(tǒng)計分析方法有多種,即“Pearson'sχ2檢驗及其精確檢驗”“校正的 Pearson'sχ2檢驗”“似然比χ2檢驗及其精確檢驗”和“Fisher's精確檢驗”[3],因篇幅所限,本文介紹“Pearson'sχ2檢驗”“校正的 Pearson'sχ2檢驗”“似然比χ2檢驗”3種統(tǒng)計分析方法。

        1 橫斷面設計四格表資料的實例與模式

        1.1 實例

        【例1】在文獻[1]中,根據(jù)MINI 5.0中文版自殺模塊判斷未治療抑郁障礙患者有無自殺風險,共6個條目,評分范圍0~33分。評分<6分為無自殺風險,評分≥6分為有自殺風險。再將兩組受試者分別按“性別”“婚姻狀況”“有無精神障礙家族史”和“是否伴有精神病性癥狀”進行劃分,可得4個“橫斷面設計四格表資料”,現(xiàn)將其中一個列在表1中。問:未治療抑郁障礙患者“有無自殺風險”與“婚姻狀況”之間是否存在關聯(lián)性?

        表1 未治療抑郁障礙患者“有無自殺風險”與“婚姻狀況”之間關系的調(diào)查結(jié)果

        【統(tǒng)計分析方法的選擇】兩個屬性變量(本例為“有無自殺風險”與“婚姻狀況”)之間是否存在關聯(lián)性,可選用 Pearson'sχ2檢驗、似然比χ2檢驗等方法。由于統(tǒng)計學家依據(jù)不同的原理和條件推導出了不同的χ2檢驗統(tǒng)計量,但它們通常都有一個共同的“檢驗假設”,即“兩變量之間互相獨立或無關聯(lián)性”;而且,所有的χ2檢驗統(tǒng)計量都必須服從χ2分布。

        【例2】在文獻[2]中,為了研究“中山市流動人口與戶籍人口自殺率和自殺方式特征”,研究考察了“戶籍狀況(分為‘戶籍組’與‘流動組’)”與“性別”“民族”“受教育程序”“婚姻狀況”和“職業(yè)”5 個屬性變量之間的關系,可得5個列聯(lián)表?,F(xiàn)將其中一個列在表2中。問:中山市2015年-2017年戶籍組和流動組自殺案例“戶籍狀況”與“民族”之間是否存在關聯(lián)性?

        表2 中山市2015年-2017年戶籍組和流動組自殺案例“戶籍狀況”與“民族”之間關系的調(diào)查結(jié)果

        【統(tǒng)計分析方法的選擇】回答兩個屬性變量(本例為“戶籍狀況”與“民族”)之間是否存在關聯(lián)性,可選用Pearson'sχ2檢驗、似然比χ2檢驗等方法。理由前面已述及,此處從略。

        1.2 模式

        為了便于采用簡單且易于理解的形式呈現(xiàn)橫斷面設計四格表資料的計算公式,特將表達橫斷面設計四格表資料的列聯(lián)表抽象成下面的兩種模式,分別見表3和表4。

        表3 同時按屬性變量A與B對受試對象進行分組計數(shù)的模式一

        表4 同時按屬性變量A與B對受試對象進行分組計數(shù)的模式二

        2 橫斷面設計四格表資料獨立性或關聯(lián)性分析的原理與計算公式

        2.1 獨立性與關聯(lián)性

        對于橫斷面設計四格表資料而言,通常假定兩個屬性變量之間的地位是平等的且并存的。也就是說,不認為其中一個是原因變量、另一個是結(jié)果變量;也不認為其中一個先出現(xiàn)、另一個后出現(xiàn)。研究者關心的是兩個屬性變量之間是否存在“關聯(lián)性”,而與其對立的是“獨立性”。在“兩屬性變量之間具有獨立性”的假設成立的條件下,當基于實際數(shù)據(jù)和統(tǒng)計學原理計算的結(jié)果認為應拒絕此假設,則認為“兩屬性變量之間具有關聯(lián)性”。于是,其檢驗假設可表述如下:

        H0:兩屬性變量之間相互獨立;H1:兩屬性變量之間不獨立或有關聯(lián)性。

        2.2 基于獨立性假設推導出計算理論頻數(shù)的公式

        基于表3中設定的符號,假定“屬性變量A”與“屬性變量B”之間互相獨立,則依據(jù)概率論中計算條件概率的公式可推算出與4個觀察頻數(shù)“ɑ、b、c、d”對 應 的 理 論 頻 數(shù)如下[4-5]:

        2.3 基于獨立性假設的Pearson's χ2檢驗統(tǒng)計量

        K.Pearson于十九世紀末提出用檢驗統(tǒng)計量來測量二維列聯(lián)表的各網(wǎng)格中觀測頻數(shù)(O)與理論頻數(shù)(T)之間的“差異程度”或“吻合度”[6]。如下式:

        在式(5)中,Oij、Tij分別為第(i,j)網(wǎng)格中的“觀測頻數(shù)”與“理論頻數(shù)”,R、C分別代表二維列聯(lián)表的“行數(shù)”與“列數(shù)”,K.Pearson證明了式(5)定義的近似地服從自由度為df=(R-1)(C-1)的χ2分布。

        將表3中設定的符號和式(1)~式(4)代入式(5),可得到分析橫斷面設計四格表資料的專用公式,見式(6)。

        由式(6)定義的漸近地服從自由度為1的χ2分布。

        【前提條件】當四格表資料中n>40且沒有T(理論頻數(shù))<5時,可以選用“Pearson'sχ2檢驗”。

        2.4 基于獨立性假設的校正Pearson's χ2檢驗統(tǒng)計量

        在四格表資料中,只要有一個網(wǎng)格上的理論頻數(shù)<5,若直接采用式(6)進行計算,其結(jié)果都會明顯偏離χ2分布,故需要采用下式進行校正。

        由式(7)定義的漸近地服從自由度為1的χ2分布。

        【前提條件】當四格表資料中n>40,但有1<T(理論頻數(shù))<5時,可以選用“校正Pearson'sχ2檢驗”。

        2.5 基于獨立性假設的對數(shù)似然比χ2檢驗統(tǒng)計量

        2.5.1 似然比統(tǒng)計量

        情形1:依據(jù)觀測的結(jié)果,得似然函數(shù)近似表達式:

        情形2:依據(jù)假設的結(jié)果,得似然函數(shù)近似表達式:

        上面兩式中的“∝”符號代表“呈正比”(例如,A與B呈正比,可表示為A∝B)。

        用式(8)除以式(9),得到似然比統(tǒng)計量如下:

        2.5.2 對數(shù)似然比χ2檢驗統(tǒng)計量

        在文獻[3,7]中,介紹了另一種檢驗兩屬性變量關聯(lián)性或獨立性的方法,叫做“似然比χ2檢驗”。但實際上,其檢驗統(tǒng)計量是對所構(gòu)造的“似然比統(tǒng)計量[見式(10)]”取對數(shù)后乘以2的結(jié)果。因此,其真實的名稱應該叫做“對數(shù)似然比χ2檢驗統(tǒng)計量”。于是,對式(10)取自然對數(shù)后乘以2,可得下式:

        在式(11)中,由所定義的檢驗統(tǒng)計量漸近地服從自由度為1的χ2分布。其中,nij、Tij分別代表四格表中第(i,j)網(wǎng)格上的觀察頻數(shù)與理論頻數(shù),i,j=1,2。

        【前提條件】當四格表資料中,無論是觀察頻數(shù)還是理論頻數(shù)中都沒有出現(xiàn)“零”時,可以選用“對數(shù)似然比χ2檢驗”。

        3 橫斷面設計四格表資料關聯(lián)性或獨立性分析的軟件實現(xiàn)

        3.1 基于SAS實現(xiàn)關聯(lián)性或獨立性分析

        沿用例1中的“問題與數(shù)據(jù)”,試進行關聯(lián)性或獨立性分析。設所需要的SAS程序如下[3]:

        第1行與第3行分別為“Pearson'sχ2檢驗”與“校正 Pearson'sχ2檢驗”的結(jié)果,第 2行為“似然比χ2檢驗(嚴格地說,為對數(shù)似然比χ2檢驗)”的結(jié)果。3種檢驗方法所得的P值都小于0.01,都拒絕“H0:有無自殺風險與婚姻狀況之間互相獨立”,接受“H1:有無自殺風險與婚姻狀況之間存在關聯(lián)性”。

        【結(jié)論】因為“有自殺風險”的“已婚比例為(13/52)×100%=25.00%”,而“無自殺風險”的“已婚比例為(33/65)×100%=50.77%”,這提示“有自殺風險”的未治療抑郁障礙患者的結(jié)婚比例明顯低于“無自殺風險”的未治療抑郁障礙患者的結(jié)婚比例。

        3.2 基于R實現(xiàn)關聯(lián)性或獨立性分析

        設所需要的R程序如下[8-9]:

        【程序說明】“>”代表R軟件運行環(huán)境中的“提示符”,上文的R程序中共有4個提示符,說明共有4個R語句;第一句組織第一個“行向量”,代表四格表資料的第1行數(shù)據(jù);第二句組織第二個“行向量”,代表四格表資料的第2行數(shù)據(jù);第三句和第四句都是調(diào)用函數(shù)“chisq.test()”進行χ2檢驗,其區(qū)別在于:選項“correct=FALSE”代表不進行“校正”,而該選項的默認值為“校正”,等價于寫“correct=TRUE”;而選項“rbind()”是將兩個行向量合并在一起,即構(gòu)成兩行兩列的四格表數(shù)據(jù)。

        【R主要輸出結(jié)果及解釋】

        以上為進行了連續(xù)性校正的χ2檢驗結(jié)果。

        以上R輸出結(jié)果與SAS輸出的結(jié)果是相同的(見上文SAS輸出結(jié)果中的第1行與第3行)。

        【結(jié)論】參見前文SAS輸出結(jié)果及結(jié)論,此處從略。

        4 討論與小結(jié)

        4.1 討論

        4.1.1 橫斷面設計的概念

        所謂橫斷面設計,就是依據(jù)研究目的確定了一個研究的總體,在一個時點或時段上,研究者對該總體中的全部個體(屬于全面調(diào)查或普查)或按某種規(guī)則隨機抽取的部分個體進行調(diào)查或測量。這種做法就被稱為“橫斷面研究設計”,簡稱為“橫斷面設計”。

        4.1.2 橫斷面設計四格表資料的特點

        在表1和表2資料中,都有兩個“屬性變量”,通常,研究者同時按兩個屬性變量的水平對受試對象進行分組計數(shù),而且,兩個屬性變量都是從受試對象身上“提取”出來的,換句話說,屬性變量是受試對象“自帶的”屬性(例如性別、民族);在多數(shù)場合下,兩個屬性變量之間不存在明顯的“原因變量”與“結(jié)果變量”之分,也就是說,它們之間更常見的是“相互關系”,而不是“因果關系”。

        若一個變量為“藥物種類(藥物A與藥物B)(研究者施加給受試對象的因素)”,另一個變量為“治療效果(‘有效’與‘無效’)”,此時,前者可視為“原因變量”,后者可視為“結(jié)果變量”。一般來說,從患者“服藥”到出現(xiàn)“療效”的時間間隔不長時,可視為一個“時點或時段”,這樣的四格表資料仍可被稱為“橫斷面設計四格表資料”。然而,當前述所指的“時間間隔”很長時,就不適合叫做“橫斷面設計四格表資料”了。

        值得注意的是,基于“藥物種類”與“治療效果”而形成的四格表資料與流行病學上常見的“隊列設計四格表資料(例如調(diào)查‘是否吸煙’與‘是否患肺癌’之間關系所得的資料)”是十分相似的。二者的區(qū)別在于以下兩點:其一,原因變量的來源不同。“藥物種類”是研究者施加給受試對象的影響因素,而“吸煙與否”是受試對象自身的行為習慣;其二,獲得結(jié)果變量取值的時間長度不同,通常,“服藥”與“療效”之間時間間隔不會很長;而“吸煙與否”與“患肺癌與否”之間時間間隔通常會比較長。

        4.1.3 橫斷面設計四格表資料統(tǒng)計分析方法的合理選擇

        在檢驗橫斷面設計四格表資料兩屬性變量之間“獨立性假設”的方法中,除了本文介紹的3種方法(運用時,請檢查前提條件是否滿足)之外,還有Fisher's精確檢驗、Pearson'sχ2檢驗的精確算法、似然比χ2檢驗的精確算法[3],因篇幅所限,此處從略。

        在運用SAS/STAT的FREQ過程時,若使用“exact chisq/mc;”語句,輸出結(jié)果中會呈現(xiàn)4種精確檢驗的結(jié)果[3],其中,除了前面提及的3種精確檢驗結(jié)果之外,還給出了“Mantel-Haenszel'sχ2檢驗及其精確檢驗結(jié)果”。然而,這種檢驗方法適用于“隊列設計”或“病例對照設計”四格表資料,其對應的檢驗假設為:“H0:RR=1,H1:RR≠ 1”(RR為相對危險度)或“H0:OR=1,H1:OR≠ 1”(OR為優(yōu)勢比)[10],因這些內(nèi)容與本文的目的不吻合,故未做介紹。

        4.2 小結(jié)

        本文呈現(xiàn)了橫斷面設計四格表資料的實例和模式,詳細給出了3種檢驗橫斷面設計四格表資料“關聯(lián)性或獨立性”假設的檢驗方法的原理和計算公式;基于SAS和R軟件實現(xiàn)了對橫斷面設計四格表資料的3種假設檢驗,對軟件輸出的結(jié)果做出了解釋,并給出了統(tǒng)計和專業(yè)結(jié)論。

        猜你喜歡
        四格橫斷面頻數(shù)
        油爆四格
        城市道路橫斷面設計研究
        爆笑四格
        爆笑四格
        爆笑四格
        中考頻數(shù)分布直方圖題型展示
        廣州市健康體檢人群種植修復情況的橫斷面研究
        學習制作頻數(shù)分布直方圖三部曲
        2014年某院醫(yī)院感染橫斷面調(diào)查
        頻數(shù)和頻率
        色婷婷久久99综合精品jk白丝| 十八禁在线观看视频播放免费| 伊人久久大香线蕉综合网站| 欧美大香线蕉线伊人久久| 久久久国产精品ⅤA麻豆百度| av在线不卡一区二区三区| 丝袜美腿视频一区二区| 无码熟妇人妻av影音先锋| 无码国产午夜福利片在线观看| 在线观看精品国产福利片100| 大量老肥熟女老女人自拍| 日本免费观看视频一区二区| 亚洲精品中文幕一区二区| 韩国无码av片在线观看网站| 亚洲欧美日韩中文v在线| 日韩中文字幕乱码在线| 国产精品国产三级国产专播下| 中文字幕乱码高清完整版| 亚洲视频一区| 国模少妇无码一区二区三区| av网址在线一区二区| 国产精品久久久天天影视| 国产午夜鲁丝片av无码| 亚洲精品中国国产嫩草影院美女| 国产女主播福利一区在线观看| 亚洲av色福利天堂久久入口| 国产欧美性成人精品午夜| 手机在线看永久av片免费| 高清国产亚洲va精品| av资源在线免费观看| 国产精品午夜福利视频234区| 国产精品爽黄69天堂a| 中文人妻AV高清一区二区| 日本顶级片一区二区三区 | 与漂亮的女邻居少妇好爽 | 中文字幕在线亚洲精品| 越南女子杂交内射bbwxz| 国产强伦姧在线观看| 日本一区二区三区高清视| 无码人妻一区二区三区在线| 国产午夜精品久久久久免费视 |