亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        如何正確運(yùn)用方差分析
        ——方差分析概述

        2022-03-02 04:19:08胡純嚴(yán)胡良平
        四川精神衛(wèi)生 2022年1期
        關(guān)鍵詞:平方和方差定量

        胡純嚴(yán),胡良平,2*

        (1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專(zhuān)業(yè)委員會(huì),北京 100029

        在運(yùn)用統(tǒng)計(jì)學(xué)的過(guò)程中,離不開(kāi)一些基本的統(tǒng)計(jì)量,例如平均指標(biāo)(算術(shù)平均值、幾何平均值、中位數(shù)等)和變異指標(biāo)(方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤等)等;也離不開(kāi)一些基本的分析方法,例如差異性分析、相關(guān)分析、關(guān)聯(lián)分析、回歸分析、聚類(lèi)分析和判別分析等。其中,“方差”和“方差分析(或稱為F檢驗(yàn))”在統(tǒng)計(jì)學(xué)中具有重要的作用。本文將對(duì)方差分析的內(nèi)容進(jìn)行介紹。

        1 與方差分析有關(guān)的基本概念

        1.1 方差的定義

        設(shè)X是一個(gè)隨機(jī)變量,又設(shè)E(X)是隨機(jī)變量X的數(shù)學(xué)期望(即算術(shù)平均值),若E(X2)存在,則稱由式(1)定義的V(X)為X的總體方差(簡(jiǎn)稱為方差)[1-2],通常記為V(X)或Va(rX)或σ2。

        方差V(X)的單位是隨機(jī)變量X的單位的平方,故在實(shí)際應(yīng)用時(shí),常取其算術(shù)平方根,令稱其為標(biāo)準(zhǔn)差或均方差。顯然,標(biāo)準(zhǔn)差σ與隨機(jī)變量X具有相同的量綱。

        設(shè)x1,…,xn是從特定總體中隨機(jī)抽取的樣本含量為n的一個(gè)樣本,并設(shè)為該樣本的樣本均值,則樣本方差由式(2)給出:

        設(shè)總體中個(gè)體的數(shù)目為N,觀測(cè)指標(biāo)為X,其總體平均值為μ,總體方差也可由式(3)給出:

        由數(shù)理統(tǒng)計(jì)知識(shí)可知:E(s2)=σ2,即樣本方差是總體方差的無(wú)偏估計(jì)量。

        1.2 方差的性質(zhì)

        隨機(jī)變量X的方差V(X)具有如下性質(zhì):其一,設(shè)X=C(常數(shù)),則V(X)=0,即常數(shù)的方差為零。其二,設(shè)Y=CX(C為常數(shù)、X為隨機(jī)變量),則V(Y)=C2V(X),即常數(shù)與隨機(jī)變量之積的方差等于該常數(shù)的平方與該隨機(jī)變量的方差之積。其三,設(shè)A、B是兩個(gè)不相等的常數(shù),則V(AX+B)=A2V(X)。其四,V(X)=E(X2)-[E(X)]2。其五,設(shè)X1與X2是兩個(gè)相互獨(dú)立的隨機(jī)變量,則V(X1+X2)=V(X1)+V(X2),即兩個(gè)相互獨(dú)立的隨機(jī)變量之和的方差等于它們各自方差之和[1-2]。這個(gè)性質(zhì)可以推廣到n個(gè)相互獨(dú)立的隨機(jī)變量,即設(shè)X1,…,Xn相互獨(dú)立,則有下式成立:

        1.3 方差的意義

        一個(gè)隨機(jī)變量的期望值(即均值)只能反映該隨機(jī)變量平均取值的大小,而無(wú)法反映其取值的波動(dòng)情況;方差是用來(lái)刻畫(huà)一個(gè)隨機(jī)變量的全部取值圍繞其期望值波動(dòng)程度大小的變異指標(biāo)之一。雖然有類(lèi)似功能的變異指標(biāo)還包括標(biāo)準(zhǔn)差、變異系數(shù)和四分位數(shù)間距,但它們的應(yīng)用場(chǎng)合遠(yuǎn)遠(yuǎn)少于方差。其根本原因在于方差中的主要部分是離均差平方和,人們可以依據(jù)資料中所包含的“變異來(lái)源的數(shù)目”對(duì)其進(jìn)行分解,從而揭示因各變異來(lái)源所引起的數(shù)據(jù)波動(dòng)的大小。尤其是在對(duì)調(diào)查資料進(jìn)行統(tǒng)計(jì)分析時(shí),當(dāng)計(jì)算得出調(diào)查結(jié)果估計(jì)量之后,需要知道其估計(jì)的精度是多少,而精度最常用的度量是調(diào)查估計(jì)量的方差[3]。

        1.4 方差分析的內(nèi)容

        1.4.1 方差的估計(jì)

        對(duì)于來(lái)自復(fù)雜抽樣設(shè)計(jì)的資料,研究者關(guān)注的是調(diào)查結(jié)果的方差大小,這就是方差估計(jì)問(wèn)題[3]。由于調(diào)查結(jié)果的精度受抽樣調(diào)查設(shè)計(jì)類(lèi)型、樣本含量、調(diào)查結(jié)果資料性質(zhì)等因素的影響,故調(diào)查結(jié)果估計(jì)量的方差估計(jì)問(wèn)題是一個(gè)非常復(fù)雜的統(tǒng)計(jì)學(xué)問(wèn)題[3]。

        1.4.2 方差的比較

        方差的比較包括兩方面內(nèi)容:其一,比較地位平等的兩個(gè)或多個(gè)方差之間的差別是否有統(tǒng)計(jì)學(xué)意義,以推斷它們所代表的兩個(gè)或多個(gè)總體的方差是否相等。與此研究目的對(duì)應(yīng)的假設(shè)檢驗(yàn)被稱為方差齊性檢驗(yàn)[4-5]。其二,比較地位可能不平等的兩個(gè)或多個(gè)方差(例如某因素各水平組間方差與組內(nèi)方差、某因素各水平組間方差與包含該因素的統(tǒng)計(jì)模型的誤差的方差)之間的差別是否有統(tǒng)計(jì)學(xué)意義,以推斷不同變異來(lái)源對(duì)試驗(yàn)結(jié)果平均效應(yīng)的影響是否有統(tǒng)計(jì)學(xué)意義。第二方面的內(nèi)容就是基于均值比較的方差分析,通常被稱為一元或多元單因素方差分析或多因素方差分析[6-7]。

        在前述提及的第二方面內(nèi)容中,若觀測(cè)結(jié)果變量為定量變量且構(gòu)建的回歸模型是多重線性回歸模型,基于兩個(gè)嵌套回歸模型(其中一個(gè)為包含所有自變量的全模型、另一個(gè)為僅包含部分自變量的部分模型)的殘差方差的比較,可推斷出是否可用部分模型取代全模型[6]。

        2 方差分析的數(shù)學(xué)基礎(chǔ)——F分布

        2.1 F分布的歷史

        F分布是一種連續(xù)型分布,它不僅是方差分析的基礎(chǔ),還與正態(tài)分布、χ2分布和t分布都有密切聯(lián)系。最初,人們是通過(guò)研究組間方差與組內(nèi)方差之比入手的。Fisher于1924年發(fā)現(xiàn)方差比有一個(gè)分布,并以的形式來(lái)編表。

        2.2 F分布的定義

        在式(5)中,F(xiàn)的分布稱為分子和分母的自由度分別為m和n的F分布[8],并記作F~Fm,n。F分布的密度函數(shù)見(jiàn)式(6):

        2.3 F分布的性質(zhì)

        2.3.1 概率密度函數(shù)的圖形

        在f(x;m,n)中,m為分子的自由度,n為分母的自由度,當(dāng)m=10,n分別取4、10、50、∞時(shí),F(xiàn)分布的概率密度函數(shù)圖形見(jiàn)圖1;當(dāng)n=10,m分別取4、10、50、∞時(shí),F(xiàn)分布的概率密度函數(shù)圖形見(jiàn)圖2。

        圖1 第一組條件下F分布概率密度函數(shù)圖形

        圖2 第二組條件下F分布概率密度函數(shù)圖形

        F分布概率密度函數(shù)圖形特點(diǎn)如下:①f(x;m,n)的形狀受分子和分母自由度的影響,固定其中一個(gè)自由度,改變另一個(gè)自由度,可以得到兩簇密度函數(shù)曲線;②單側(cè)F分布表用于方差分析,雙側(cè)F分布表用于兩總體方差齊性檢驗(yàn)。

        通常是已知右側(cè)尾端概率p(單側(cè))或雙側(cè)尾端概率p(雙側(cè))、分子和分母的自由度m和n,去查F分布的分位數(shù)(也稱為臨界值)。單、雙側(cè)時(shí),分別由式(8)和式(9)來(lái)確定橫軸上的分位數(shù)F。

        雙側(cè)時(shí),左側(cè)分位數(shù)F可由下式算出:,它通常小于1,而在計(jì)算兩樣本方差比時(shí),特意將較大方差放在分子上,故用于檢驗(yàn)兩總體方差齊性的F統(tǒng)計(jì)量的值通常大于等于1。因此,制表時(shí),即使是雙側(cè)分位數(shù),也只列出右側(cè)的分位數(shù),省略了左側(cè)的分位數(shù)。

        2.3.2 倒數(shù)變換后的隨機(jī)變量仍服從F分布

        服從F分布的隨機(jī)變量的倒數(shù)仍是服從F分布的隨機(jī)變量,但需要調(diào)換分子與分母的自由度,即若X~Fm,n,Y=1/X,則有下式:

        2.3.3 F分布與其他分布之聯(lián)系

        若 X~tn,則 X2~F1,n;若,則 X~mFm,∞;若 X~z(標(biāo)準(zhǔn)正態(tài)變量),則X2~F1,∞??偨Y(jié)上述關(guān)系,可得到式(11):

        在應(yīng)用中,利用上述關(guān)系有時(shí)可將一種檢驗(yàn)轉(zhuǎn)化為另一種檢驗(yàn),或用來(lái)核對(duì)計(jì)算是否正確。

        2.3.4 服從F分布的隨機(jī)變量經(jīng)對(duì)數(shù)變換后服從正態(tài)分布

        若 X~Fm,n,令Zm,n=lnX,則當(dāng)m和n都較大時(shí),Zm,n的分布近似于式(12):

        3 方差分析在差異性檢驗(yàn)中的應(yīng)用

        3.1 用于均值比較的方差分析

        在分析試驗(yàn)資料時(shí),若觀測(cè)結(jié)果為定量資料,一個(gè)最常見(jiàn)的分析目的就是比較某試驗(yàn)因素在不同水平條件下定量觀測(cè)指標(biāo)平均值之間的差別是否有統(tǒng)計(jì)學(xué)意義。在單因素試驗(yàn)研究場(chǎng)合下,需要進(jìn)一步考察試驗(yàn)設(shè)計(jì)的具體類(lèi)型和定量資料所滿足的前提條件,方可選擇合適的差異性檢驗(yàn)方法。通常,單因素試驗(yàn)設(shè)計(jì)類(lèi)型可分為以下四種:?jiǎn)谓M設(shè)計(jì)、配對(duì)設(shè)計(jì)、成組設(shè)計(jì)和單因素多水平設(shè)計(jì);定量資料可分為滿足和不滿足參數(shù)檢驗(yàn)前提條件(即獨(dú)立性、正態(tài)性和方差齊性)這兩種情形。

        當(dāng)定量資料滿足參數(shù)檢驗(yàn)的前提條件且設(shè)計(jì)類(lèi)型為“單組設(shè)計(jì)、配對(duì)設(shè)計(jì)和成組設(shè)計(jì)”三種時(shí),人們習(xí)慣于選擇基于t分布為理論依據(jù)的t檢驗(yàn);而當(dāng)定量資料滿足參數(shù)檢驗(yàn)的前提條件且設(shè)計(jì)類(lèi)型為“單因素多水平設(shè)計(jì)”時(shí),統(tǒng)計(jì)學(xué)上要求進(jìn)行方差分析。

        在多因素試驗(yàn)研究場(chǎng)合下,當(dāng)定量資料滿足參數(shù)檢驗(yàn)的前提條件且設(shè)計(jì)類(lèi)型為“某種特定的多因素設(shè)計(jì)”時(shí),統(tǒng)計(jì)學(xué)上強(qiáng)調(diào)必須選用與特定設(shè)計(jì)類(lèi)型對(duì)應(yīng)的方差分析方法處理定量資料。常見(jiàn)的多因素試驗(yàn)設(shè)計(jì)類(lèi)型包括隨機(jī)區(qū)組設(shè)計(jì)、拉丁方設(shè)計(jì)、交叉設(shè)計(jì)、析因設(shè)計(jì)、嵌套(或系統(tǒng)分組)設(shè)計(jì)、具有重復(fù)測(cè)量因素的設(shè)計(jì)和正交設(shè)計(jì)等。

        3.2 用于方差比較的方差分析

        實(shí)施用于均值比較的方差分析的一個(gè)重要前提條件是方差齊性,即某試驗(yàn)因素各水平組總體方差相等。SAS/STAT的GLM過(guò)程中介紹了4種方差齊性檢驗(yàn)方法:Bartlett’sχ2檢驗(yàn)、Levene’sF檢驗(yàn)、O′Brien’sF檢驗(yàn)以及Brown和Forsythe提出的F檢驗(yàn)方法。另外,基于兩樣本方差之比構(gòu)造出檢驗(yàn)統(tǒng)計(jì)量來(lái)推斷兩總體方差是否相等的檢驗(yàn)方法,也屬于用于方差比較的方差分析。

        3.3 用于線性回歸模型評(píng)價(jià)的方差分析

        假定在一個(gè)包含k(k≥2)個(gè)自變量和一個(gè)定量因變量且樣本含量為n的統(tǒng)計(jì)資料中,先構(gòu)建一個(gè)包含全部k(k≥2)個(gè)自變量(假定每個(gè)自變量都以一次方形式出現(xiàn),未引入任何派生自變量)的多重線性回歸模型,得到其殘差的離差平方和記為SSFR,自由度記為dfFR;依據(jù)專(zhuān)業(yè)知識(shí),從k(k≥2)個(gè)自變量中取出m(m

        在式(13)中,F(xiàn)服從分子與分母自由度分別為df1和dfFR的F分布;?=SSPR-SSFR,df1=dfPR-dfFR。若檢驗(yàn)統(tǒng)計(jì)量F值大于臨界值則表明不能采用簡(jiǎn)化回歸模型取代全模型,反之亦然。

        4 基于均值比較的方差分析的基本思想

        4.1 概述

        方差分析的基本思想是對(duì)定量結(jié)果變量Y的總離均差平方和的分解。分解出來(lái)的項(xiàng)數(shù)為所考查的影響因素(包含擬考查的因素之間的交互作用項(xiàng))的項(xiàng)數(shù)加一個(gè)誤差項(xiàng)。由于基于均值比較的方差分析與試驗(yàn)設(shè)計(jì)類(lèi)型和擬考查的交互作用項(xiàng)數(shù)有密切關(guān)系,故對(duì)定量結(jié)果變量Y的總離均差平方和的分解結(jié)果將會(huì)隨具體情況而變化。下面給出兩種常見(jiàn)試驗(yàn)設(shè)計(jì)類(lèi)型對(duì)應(yīng)的總離均差平方和分解的樣例。

        4.2 單因素多水平設(shè)計(jì)一元定量資料總離均差平方和的分解

        設(shè)試驗(yàn)因素A有k個(gè)水平,各水平下獨(dú)立重復(fù)試驗(yàn)次數(shù)為nj(j=1,2,…,k);又設(shè)在第j個(gè)水平下第i(j=1,2,…,nj)次獨(dú)立重復(fù)試驗(yàn)結(jié)果為Yij,設(shè)該水平條件下Y的平均值為;再設(shè)定量結(jié)果變量Y的總均值為Yˉ..。則定量結(jié)果變量Y的總離均差平方和的分解結(jié)果見(jiàn)式(14):

        在式(14)中,SSA和SSE分別代表因素A和誤差E的離均差平方和,表達(dá)式見(jiàn)式(15)、式(16):

        4.3 隨機(jī)區(qū)組設(shè)計(jì)一元定量資料總離均差平方和的分解

        設(shè)試驗(yàn)因素A有k個(gè)水平,區(qū)組因素B有c個(gè)水平,試驗(yàn)因素A各水平下都獨(dú)立重復(fù)試驗(yàn)c次;又設(shè)在第j個(gè)水平下第i(i=1,2,…,c)次獨(dú)立重復(fù)試驗(yàn)結(jié)果為Yij;再設(shè)定量結(jié)果變量Y的總均值為則定量結(jié)果變量Y的總離均差平方和的分解結(jié)果見(jiàn)式(17):

        在式(17)中,SSA、SSB和SSE分別代表因素A、因素B和誤差E的離均差平方和,具體表達(dá)式見(jiàn)式(18)、式(19)、式(20):

        4.4 檢驗(yàn)統(tǒng)計(jì)量F的構(gòu)造

        在總離均差平方和被正確分解之后,進(jìn)行方差分析就需要構(gòu)造出檢驗(yàn)統(tǒng)計(jì)量F,然后基于樣本數(shù)據(jù)計(jì)算出檢驗(yàn)統(tǒng)計(jì)量F的值,再依據(jù)F分布做出接受或拒絕無(wú)效假設(shè)的結(jié)論。也就是說(shuō),檢驗(yàn)統(tǒng)計(jì)量F是與特定無(wú)效假設(shè)和備擇假設(shè)相對(duì)應(yīng)的。

        4.4.1 與單因素多水平設(shè)計(jì)一元定量資料對(duì)應(yīng)的方差分析

        第一步,建立檢驗(yàn)假設(shè)。H0:因素A各水平下定量觀測(cè)結(jié)果Y的平均值相等;H1:因素A各水平下定量觀測(cè)結(jié)果Y的平均值不等或不全相等;給定顯著性水平α的值,通常取α=0.05。

        第二步,構(gòu)造檢驗(yàn)統(tǒng)計(jì)量F,見(jiàn)式(21),其中n為總樣本含量,F(xiàn)服從分子與分母自由度分別為(k-1)與(n-k)的F分布。

        第三步,做出統(tǒng)計(jì)結(jié)論。計(jì)算出檢驗(yàn)統(tǒng)計(jì)量F的值,若F大于等于F分布下右側(cè)尾端概率為α=0.05對(duì)應(yīng)的臨界值,可得出拒絕無(wú)效假設(shè)H0、接受備擇假設(shè)H1的統(tǒng)計(jì)結(jié)論。

        4.4.2 與隨機(jī)區(qū)組設(shè)計(jì)一元定量資料對(duì)應(yīng)的方差分析

        與“第4.4.1節(jié)”步驟基本相同,不同的是需要構(gòu)造兩個(gè)檢驗(yàn)統(tǒng)計(jì)量,分別用于檢驗(yàn)因素A和因素B。因篇幅所限,現(xiàn)將兩個(gè)檢驗(yàn)統(tǒng)計(jì)量扼要呈現(xiàn)如下,見(jiàn)式(22)、式(23):

        5 討論與小結(jié)

        5.1 討論

        總離均差平方和的分解方法不是唯一的,它與分解方法所依據(jù)的統(tǒng)計(jì)假設(shè)密切相關(guān)。在SAS/STAT的GLM過(guò)程[5]中,基于一般線性模型的理論進(jìn)行方差分析時(shí),對(duì)總離均差平方和給出了四種分解方法,分別為I型、II型、III型和IV型離均差平方和。在對(duì)多因素輕度非平衡(不同試驗(yàn)因素水平組合條件下獨(dú)立重復(fù)試驗(yàn)次數(shù)不等,但沒(méi)有一種組合條件下重復(fù)試驗(yàn)次數(shù)為0)試驗(yàn)設(shè)計(jì)定量資料進(jìn)行方差分析時(shí),基于四型離均差平方和所得到的方差分析結(jié)果不盡相同(此時(shí),III型和IV型離均差平方和所對(duì)應(yīng)的方差分析結(jié)果相同);尤其是在嚴(yán)重非平衡(不同試驗(yàn)因素水平組合條件下獨(dú)立重復(fù)試驗(yàn)次數(shù)不等,且部分組合條件下重復(fù)試驗(yàn)次數(shù)為0)試驗(yàn)設(shè)計(jì)條件下,基于四型離均差平方和所得到的方差分析結(jié)果幾乎完全不同。

        雖然方差分析可用于分析多因素試驗(yàn)研究資料,但它一般是由多次F檢驗(yàn)組成的。因?yàn)槊看蜦檢驗(yàn)都只針對(duì)一個(gè)因素或交互作用項(xiàng);而當(dāng)某因素的水平數(shù)大于2,且當(dāng)F檢驗(yàn)的結(jié)果為該因素的全部水平條件下定量結(jié)果變量的均值之間差異有統(tǒng)計(jì)學(xué)意義時(shí),還需要進(jìn)行多重比較。一般來(lái)說(shuō),不適合采用簡(jiǎn)單的t檢驗(yàn)[9-10]進(jìn)行多重比較,而需要根據(jù)不同的要求和精度,從眾多的多重比較方法中選用最符合分析要求的方法[5]。

        5.2 小結(jié)

        本文介紹了與方差分析有關(guān)的內(nèi)容,包括基本概念、方差分析的數(shù)學(xué)基礎(chǔ)——F分布、方差分析在差異性檢驗(yàn)中的應(yīng)用場(chǎng)合以及基于均值比較的方差分析的基本思想。最后,在討論部分中提出了“四型離均差平方和”的概念。之所以介紹這些在常規(guī)統(tǒng)計(jì)學(xué)教科書(shū)中幾乎未曾提及過(guò)的內(nèi)容,以引起讀者的興趣和思考。

        猜你喜歡
        平方和方差定量
        方差怎么算
        概率與統(tǒng)計(jì)(2)——離散型隨機(jī)變量的期望與方差
        顯微定量法鑒別林下山參和園參
        計(jì)算方差用哪個(gè)公式
        費(fèi)馬—?dú)W拉兩平方和定理
        當(dāng)歸和歐當(dāng)歸的定性與定量鑒別
        中成藥(2018年12期)2018-12-29 12:25:44
        利用平方和方法證明不等式賽題
        方差生活秀
        10 種中藥制劑中柴胡的定量測(cè)定
        中成藥(2017年6期)2017-06-13 07:30:35
        勾股定理的擴(kuò)展
        国产美女高潮流白浆免费观看| 久久99精品久久久久久秒播| 蜜桃成人无码区免费视频网站| 免费国产99久久久香蕉| 中文字幕一区二区在线看| 国产亚洲成人av一区| 女人被男人躁得好爽免费视频| 国产又黄又爽视频| 大量老肥熟女老女人自拍| 开心五月婷婷激情综合网| 人人妻人人澡人人爽欧美一区九九| 男女男在线精品网站免费观看| 欧洲一级无码AV毛片免费| 中文字幕乱码亚洲在线| 久久天天躁狠狠躁夜夜躁2014| 欧美一片二片午夜福利在线快| 男女上床视频免费网站| a黄片在线视频免费播放| 99久久精品午夜一区二区| 无码少妇一级AV便在线观看| 国产av91在线播放| 一区二区三区激情免费视频| 亚洲色大成网站www久久九九| 精品免费福利视频| 亚洲一区二区三区一区| 性色av一二三天美传媒| 亚洲男人的天堂在线播放| 国产一区二区欧美丝袜| av网站国产主播在线| 成人免费xxxxx在线观看| 国产在线观看入口| 久久本道久久综合一人| 久久国产劲爆∧v内射| 欧美日韩精品一区二区在线观看| 国产自精品在线| 国产一级黄色录像大片| 亚洲精品成人无码中文毛片| 国产欧美va欧美va香蕉在线观 | 日韩女优精品一区二区三区| 国产特级毛片aaaaaaa高清| 思思久久96热在精品不卡|