程 琮 劉一志 王如德
(1.泰山醫(yī)學院衛(wèi)生統(tǒng)計學教研室,2.統(tǒng)計學教研室, 山東 泰安 271016;3.臨沂市疾病預防控制中心,山東 臨沂 276001)
1.1基本概念
在等級資料或非正態(tài)分布的數(shù)據(jù)中,研究人員經(jīng)常對觀察對象的不同類型的能力進行評分,觀察不同能力之間的評分是否具有一致性。此類數(shù)據(jù)屬于雙因素設(shè)計,即為多樣本相關(guān)數(shù)據(jù)的分析??蓱肒endall協(xié)調(diào)系數(shù)W檢驗(Kendall’s coefficient of concordance W)的分析方法。該檢驗由Kendall 和Babington-Smith在1939年提出。
資料類型及特點:設(shè)有b個評判員(區(qū)組),對k個觀察對象或觀察指標(處理組)進行評分。按照每個評判員的評分,對k個觀察對象或觀察指標的評分由小到大編排秩次。秩次為從1,2,…,k。數(shù)據(jù)見表1。表1顯示:共有k=10個學生為觀察對象。由b=6個專家對每個學生6個方面的學習能力給予評分,表1中的數(shù)值不是原始評分數(shù)據(jù),而是根據(jù)評分已經(jīng)編排好的秩次。
1.2應用條件
(1)數(shù)據(jù)由k個觀察對象及b種測試能力或b個評判員的評分構(gòu)成。
(2)測量尺度至少是順序尺度。
(3)觀察值可以為原始評分的數(shù)據(jù),也可以是對原始數(shù)據(jù)編排的秩次。
1.3基本原理
檢驗假設(shè) H0:b組秩次沒有一致性;H1:b組秩次存在一致性。
檢驗統(tǒng)計量W計算公式為:
(1)
式中: b是評判個數(shù)。k是觀察對象或觀察指標個數(shù)。Rj是分配給第j個觀察對象的秩次的合計。
如果b種學習才能或特征之間無相關(guān),則各列出現(xiàn)的秩次值是隨機的。期望的各列合計值近似相等。如果b種特征之間存在相關(guān),則期望的某些列有較大的秩次,而另一些列則有較小的秩次。當H0成立時,則理論上各列的合計值相等,如表1數(shù)據(jù)的各列合計值等于330/10=33,則6個特征之間無相關(guān)。本例,計算的離均差平方和S的觀察值為:
S=(28-33)2+(25-33)2+…+(45-33)2=514
在6種學習能力中,如果每個學生有相同的能力,則應得到相同的評分和秩次。例如,若第一個學生在機械能力方面編排秩次為1,則在藝術(shù)才能方面也編排秩次為1,其它各才能方面編排秩次均為1,則秩次之和為6×1=6;第二個學生各能力方面均編排秩次為2,則秩次之和為6×2=12。余類推。
如果各個能力方面完全相關(guān),則各列秩和為:
第1列秩和為:6×1=6,
第2列秩和為:6×2=12,
第3列秩和為:6×3=18,
……
第10列秩和為:6×10=60,
此時,離均差平方和S的期望值為:
S=(6-33)2+(12-33)2+…+(60-33)2=2970
將本例的S觀察值與S期望值相比,有:
若存在完全一致性,則其比值為1。若完全沒有一致性,則比值為0(由于分子為0)。介于0和1之間,則有一定程度的相關(guān)性。
計算S的公式為:
(2)
公式中符號意義,見公式(1)。如果各組秩次有完全一致性,則列合計為1b,2b,…kb,但可以不按順序排列。各列與期望值之差的平方和,公式為:
(3)
公式(2)與公式(3)之比,即為檢驗統(tǒng)計量W:
(4)
經(jīng)過適當?shù)臄?shù)學變換,公式(4)可以變換為公式(1)。兩者等價。
表1 6名專家對10名學生學習能力的評分(秩次)
1.4出現(xiàn)相同數(shù)據(jù)
若出現(xiàn)2個或更多個相同數(shù)據(jù)時,計算平均秩次。公式(1)中分母被替換為下式:
b2k(k2-1)-bΣ(t3-t)
(5)
校正的Wc公式為:
(6)
式中:t為相同數(shù)據(jù)的個數(shù)。
1.5判斷原則
當觀察的各組秩次接近一致時,S值傾向于更大。當S值較大時,W值也較大,傾向于1。當觀察的各組秩次不一致時,S值傾向于更小。當S值較小時,W值也較小,傾向于0。當W值充分大時,結(jié)果將導致拒絕沒有一致性的無效假設(shè)。
當b和k較小時,可以根據(jù)α、b、k和W值,查Kendall協(xié)調(diào)系數(shù)W值表,判斷結(jié)論。
如果b、k值超出Kendall協(xié)調(diào)系數(shù)W值表,則應用大樣本近似法計算卡方值,并根據(jù)自由度υ=k-1,查閱卡方界值表作出判斷和結(jié)論。Kendall推薦當k>7時,計算卡方值??ǚ街涤嬎愎綖?/p>
χ2=b(k-1)W
(7)
2.1應用公式計算
例1 研究人員對戒酒中心的15名病人進行調(diào)查。讓病人對戒酒計劃中的10項指標給出評分。數(shù)據(jù)見表2。表2中的數(shù)據(jù)是對評分編排的秩次。試分析戒酒中心的病人對戒酒計劃其中的10項指標的評分是否具有一致性。
表2 Kendall協(xié)調(diào)系數(shù)W檢驗數(shù)據(jù)
表2中:no為編號,即為15個病人。x1~x10為10個評價指標。
檢驗步驟如下:
(1)建立檢驗假設(shè)
H0:病人對10項指標的評分沒有一致性;
H1:病人對10項指標的評分存在一致性。
α=0.05。
(2)計算檢驗統(tǒng)計量
將各列數(shù)據(jù)合計后平方再相加,有下列計算結(jié)果:
代入公式(1)有:
=0.4036
(3)確定P值,推斷結(jié)論
由于b=15,k=10,超出Kendall W一致性系數(shù)表范圍,可應用大樣本近似法計算卡方值:
χ2=b(k-1)W=15(10-1)0.4036=54.486
結(jié)論:可以認為15個病人對10項指標的評分具有一致性。
例2 3個監(jiān)督員為5個雇員的工作能力進行評分。分值最低為1分,最高為10分。見表3。
表3 3個監(jiān)督員為5個雇員工作能力評分(秩次)
注意:表3中的數(shù)據(jù)為3個監(jiān)督員的評分值,括號中數(shù)據(jù)為編排的秩次。對每個監(jiān)督員的評分值橫向編排秩次。第1個監(jiān)督員有兩個相同的評分即2分,求平均秩次為1.5。則t1=2。第3個監(jiān)督員也有兩個相同的評分,求平均秩次為3.5。則t2=2。
當出現(xiàn)相同數(shù)據(jù)時,計算校正的統(tǒng)計量Wc。
Σ(t3-t)=(23-2)+(23-2)=12
根據(jù)b=3,k=5,查Kendall W一致性系數(shù)表,當近似界值W=0.733時,P=0.038。由于P<0.05,拒絕H0,接受H1??梢哉J為3個監(jiān)督員對5個雇員工作能力的評分具有一致性。
注意: Kendall W一致性系數(shù)表中的W界值不一定與計算的統(tǒng)計量W值完全相同,可以取相近的W界值即可。
2.2應用SPSS13.0統(tǒng)計軟件計算
操作步驟如下:
1.建立數(shù)據(jù)文件
輸入數(shù)據(jù)模式見表2數(shù)據(jù)。注意:將所有變量定義為數(shù)值型變量。
2.運行非參數(shù)的“K Related Samples過程”
(1)打開待分析的數(shù)據(jù)文件,見表2數(shù)據(jù);
(2)在SPSS Data Editor窗口中,依次選擇:Analyze→Nonparametric Tests→K Related Samples→顯示“Tests for Several Related Samples”主對話框:進行參數(shù)設(shè)置。見圖1。
(3)在“Test Varibles”框中:選入“x1~x10”;
(4)選定“Kendall’s W”復選框;
(5)單擊“OK”按鈕,運行該過程。
圖1 Tests for Several Related Samples過程對話框
3.顯示“K Related Samples”過程結(jié)果
結(jié)果中顯示兩個表。
(1)Ranks表:顯示x1~x10這10個指標的平均秩次。
(2)Test Statistics表:顯示N為15例,Kendall’s W值為0.404,卡方(Chi-Square)值為54.491。P值(Asymp. Sig.)為0.000。結(jié)果與例1中用公式計算的相同,只是在第2位或第3位小數(shù)上有一點差別。
Kendall協(xié)調(diào)系數(shù)W檢驗是一種非參數(shù)檢驗方法,用于雙因素設(shè)計資料的一致性檢驗。其基本原理是由b個評判員對k個觀察對象或觀察指標進行評分,然后檢驗b個評判員的評價結(jié)果是否具有一致性。此方法在醫(yī)學心理測量指標及調(diào)查表中調(diào)查項目或指標的評價中應用廣泛??墒褂肧PSS統(tǒng)計分析軟件進行分析。
[1] Wayne W Daniel. Applied nonparametric statistics[J]. 2th edition. Boston: PWS-KENT Punlishing Company,1990:386-391.
[2] 程琮. SPSS統(tǒng)計分析教程[M]. 北京:現(xiàn)代教育出版社,2009.