閆 鑄,汪甜芳
(1.南京大學(xué) 工程管理學(xué)院,江蘇 南京 210046;2.內(nèi)蒙古工業(yè)大學(xué) 理學(xué)院,內(nèi)蒙古 呼和浩特 010051)
移除最高分最低分的均值統(tǒng)計(jì)理論研究
閆 鑄1,汪甜芳2
(1.南京大學(xué) 工程管理學(xué)院,江蘇 南京 210046;2.內(nèi)蒙古工業(yè)大學(xué) 理學(xué)院,內(nèi)蒙古 呼和浩特 010051)
在競技比賽中個(gè)人表現(xiàn)可以用裁判分?jǐn)?shù)的平均值來評估.兩種方法可以得到平均值.一種方法是直接取平均數(shù),而另一種則是通過剔除最高分和最低分取剩下樣本的平均值.后者在實(shí)際中得到了廣泛的應(yīng)用.本文建立了這種評價(jià)方法的統(tǒng)計(jì)理論,并與經(jīng)典理論進(jìn)行了比較.結(jié)果表明兩種方法的準(zhǔn)確性無顯著性差異.只有當(dāng)最高最低分代表少數(shù)評委的評價(jià),并且被懷疑有一定的傾向性時(shí),移除最高分和最低分才是合理的.該結(jié)果可指導(dǎo)實(shí)踐中選擇競賽評委和評價(jià)方法.
次序統(tǒng)計(jì)量;均值;最高分;最低分
近年來,隨著各種選秀、比賽節(jié)目的增多,經(jīng)??吹皆u委對選手進(jìn)行評分來反映選手的水平,評委的評分方法主要分為兩種:第一種是傳統(tǒng)的評分方法,即對所有得分求均值定為選手的得分;第二種為新式的方法,即除掉得分中的最高分和最低分求均值定為選手的得分.目前,這種新式的去掉最高分和最低分再求均值的評分方法廣受大眾推崇,但是卻很少發(fā)現(xiàn)有針對這種方法評價(jià)的理論研究,這種新式的評分方法理論上是否具有一定優(yōu)勢,相比較傳統(tǒng)的方法能不能更精確地體現(xiàn)選手的水平,為此本文中從理論和數(shù)值上進(jìn)行研究.
因?yàn)樵u委的打分是集中在一定區(qū)域的,均勻散布或呈現(xiàn)兩頭小中間大的趨勢,所以可以將評委的打分近似看成是服從均勻分布或正態(tài)分布的,也就是說,可以將評委所打的分?jǐn)?shù)看成是均勻分布或正態(tài)分布總體的子樣.
在基于這兩種分布,除掉最高分和最低分即為這一樣本中除掉最大次序統(tǒng)計(jì)量和最小次序統(tǒng)計(jì)量,討論傳統(tǒng)方法選手的得分即為樣本均值,而新式的方法即為除掉最大次序統(tǒng)計(jì)量和最小次序統(tǒng)計(jì)量后的樣本的均值,針對這兩種方法精度的比較,也就轉(zhuǎn)換成了:對這兩種均值的期望與方差大小的比較.
本節(jié)討論上述兩種評價(jià)方法的精度.
設(shè)評委的打分為 ξ1,ξ2,…,ξn,將其按從小到大排列為 ξ(1),ξ(2),…,ξ(n).假設(shè)評委的打分總體服從均勻分布,即 ξ1,ξ2,…,ξn是U(a,b)的容量為 n 的子樣,ξ(1),ξ(2),…,ξ(n)為對應(yīng)的次序統(tǒng)計(jì)量.令
因?yàn)棣?k)的密度函數(shù)為:
所以
根據(jù)(1.6),有
通過一些數(shù)學(xué)計(jì)算,容易得到以下結(jié)果:
根據(jù)協(xié)方差公式有:
因?yàn)?η(k),η(j))的聯(lián)合密度函數(shù)為:
根據(jù)(1.7)和(1.13)可以得到
所以
當(dāng)n≥3時(shí),很顯然以下不等式成立:
表1 和的方差
表1 和的方差
n Va Varξ)4 5 6 7 8 9 1 0 11 12 13 14 15 0.2500000 0.3200000 0.2000000 0.2804233 0.1666667 0.2334184 0.1428571 0.1966667 0.1250000 0.1687243 0.1111111 0.1471614 0.1000000 0.1301653 0.0909091 0.1164927 0.0833333 0.1052916 0.0769231 0.0959690 0.0714286 0.0881019 0.0666667 0.0813827
假設(shè)評委的打分服從正態(tài)分布,即 ξ1,ξ2,…,ξn是 N(μ,σ2)的子樣,ξ(1),ξ(2),…,ξ(n)是次序統(tǒng)計(jì)量.同樣地,令為傳統(tǒng)方法選手的得分為新方法選手的得分.
η(1)的密度函數(shù)為
η(n)的密度函數(shù)為
則
根據(jù)方差和協(xié)方差的定義公式:
η(k)的密度函數(shù)為:
此時(shí)E(η(k)),E(η2(k))可以寫成如下表達(dá)式:
η(k),η(j)的聯(lián)合密度函數(shù)為:
則 E(η(k)η(j))可以寫成如下表達(dá)式:
D':(0<u<+∞,0<v<+∞),且 Jacobi行列式 J=1.則
表2 和的方差
表2 和的方差
n Var(ξˉ) Var(ξ~)4 5 6 7 8 9 1 0 11 12 13 14 15 0.2500000 0.301409 0.2000000 0.229054 0.1666667 0.185498 0.1428571 0.156094 0.1250000 0.134828 0.1111111 0.118704 0.1000000 0.106045 0.0909091 0.095839 0.0833333 0.087431 0.0769231 0.080385 0.0714286 0.074393 0.0666667 0.069234
當(dāng) n=4,5,…,15 時(shí),分別運(yùn)行程序并得到 Var()和 Var()的值,并將其值在表 2 中.(考慮到 Var()和 Var()都有系數(shù)σ2,在這里計(jì)算的值是分別提取系數(shù)σ2后的值.)
通過以上分析知道,在評委的打分服從均勻分布或正態(tài)分布的情況下,令為傳統(tǒng)的評分方法(即以所有評委打分的平均值估計(jì)選手的得分)中的選手得分,為新式的評分方法(即除掉分?jǐn)?shù)中的最高值和最低值后的平均分計(jì)為選手的得分)中選手的得分,則有 E()=E(),Var()>Var().從以上結(jié)果可以知道,兩種方法都能估計(jì)選手的真實(shí)水平,且在評委數(shù)不是特別大的情況下,傳統(tǒng)的方法較新方法更能精確的反映選手的真實(shí)水平,也就是說傳統(tǒng)的評分方法要優(yōu)于新評分方法.
但現(xiàn)實(shí)生活中新式評分方式仍然大受歡迎,究其原因,更多的是防止評委偏袒,從而達(dá)到對選手的公平公正.
附錄R程序
〔1〕John Verzani.Using R for introductory statistics,Chapman&Hall CRC Press,New York,2004.
〔2〕茆詩松,王靜龍,濮曉龍.高等數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,1998.
〔3〕Philippe Caperaa,Louis-Paul Rivest.On the variance of the trimmed mean.Statistics&Probability Letters 22(1),79-85(1995).
O213
A
1673-260X(2017)12-0004-03
2017-09-19
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2017年24期