楊寶雷
?
體育統(tǒng)計學(xué)中統(tǒng)計距離之研究
楊寶雷
滁州職業(yè)技術(shù)學(xué)院體育部,安徽滁州,239000。
體育統(tǒng)計學(xué)在體育科研領(lǐng)域中的作用越來越突出,但是其應(yīng)用明顯的落后于體育科研的實際需要;統(tǒng)計距離的思想和構(gòu)造方法以及與其他統(tǒng)計思想和方法的聯(lián)系構(gòu)成了統(tǒng)計分析的基礎(chǔ),此基礎(chǔ)性的作用能幫助人們較容易地理解一元和多元統(tǒng)計分析中的諸多統(tǒng)計思想和方法。
體育;統(tǒng)計學(xué);統(tǒng)計距離;研究
近年來,隨著計算機技術(shù)的發(fā)展,開辟了統(tǒng)計學(xué)在體育科研領(lǐng)域中應(yīng)用的廣闊前景,越來越多的統(tǒng)計分析方法已應(yīng)用于體育科研領(lǐng)域,并取得了一定的成績。當前,正確地使用統(tǒng)計分析來解決有關(guān)的實際問題,已經(jīng)成為衡量研究體育工作水平先進性、科學(xué)性的一個重要標志。但是,在對體育問題的實際處理中,統(tǒng)計分析方法的利用率和應(yīng)用效果依然不高,而且人們常常是固定研究單一的因素以外的因素來進行分析,結(jié)果很難從整體上對問題進行描述和判斷,這與廣大體育研究者對多元統(tǒng)計分析的思想和方法不了解有很大關(guān)系。正因為如此,有必要使部分有些統(tǒng)計知識的體育工作者首先從統(tǒng)計思想上較容易地去理解一元和多元統(tǒng)計分析諸多方法中的基本思想甚至一些基本統(tǒng)計量的構(gòu)造過程及其含義。統(tǒng)計距離的含義、思想及其構(gòu)造過程在一元和多元體育統(tǒng)計分析的諸多統(tǒng)計思想和方法中,都體現(xiàn)出重要價值所在,以其基礎(chǔ)性的作用幾乎貫穿整個體育統(tǒng)計學(xué)的始終。因此,將統(tǒng)計距離的內(nèi)容專門提出來供廣大具備些統(tǒng)計知識的同行交流學(xué)習,提高自身統(tǒng)計分析方法的應(yīng)用能力以適應(yīng)體育科學(xué)發(fā)展的需要。
在體育訓(xùn)練、教學(xué)中,對于不同訓(xùn)練、教學(xué)方法的作用效果,往往會通過設(shè)定的某些同類指標前后之間的差異來體現(xiàn)。僅僅進行一次或幾次的實驗測量,可以讓人直接地想到:對這些設(shè)定的同類指標數(shù)值作出簡單的減法就可獲得數(shù)據(jù)上的直觀認識,就形如絕對距離或歐氏距離,在數(shù)軸上只是計算出點與點之間的直線距離。然而,對上述問題進行多次測量,涉及不同量綱的變量指標時,若依然采用該方法來處理時,將使問題變得非常麻煩,幾乎無法對問題進行科學(xué)的分析。盡管絕對距離或歐氏距離考慮不到變量間的量綱問題以及變量樣本數(shù)據(jù)之間的離散情況,但其從思想上直觀地啟發(fā)了人們在顧忌到這兩個方面而去思考構(gòu)建可以處理此類問題的距離形式。變量指標的每一次抽樣,會得到不完全一樣的數(shù)據(jù)集合,使得數(shù)據(jù)的集中趨勢和離散情況有所不同,其中蘊含著數(shù)據(jù)的重要信息,這正是值得探究的問題實質(zhì)所在。數(shù)據(jù)的離散情況在統(tǒng)計學(xué)中常用方差或協(xié)方差;集中趨度則用均值或均值向量來表示。體育統(tǒng)計中這兩個統(tǒng)計量構(gòu)成了其他絕大多數(shù)統(tǒng)計量的基礎(chǔ),無論是一元統(tǒng)計還是多元統(tǒng)計,在考慮了變量數(shù)據(jù)的集中趨度和離散程度后,對于變量數(shù)據(jù)間的差異依然是從其直觀的距離算起。因此,可以考慮引入“統(tǒng)計”上的距離。
在對某種體育問題進行計量分析時,經(jīng)常會出現(xiàn)以抽樣得到的樣本數(shù)據(jù)來推測整體的情況。很多時候要考慮變量間或變量與某個參考值之間的差異,絕對距離或歐氏距離此時已不再適用。例如,進行維變量=對應(yīng)維空間的點考察時,就其相關(guān)性和變差的情況而言(設(shè)位置可變),則需統(tǒng)計距離來體現(xiàn)。統(tǒng)計距離的思想及其作用幾乎貫穿于體育統(tǒng)計學(xué)的始終。
根據(jù)問題的需要,統(tǒng)計距離的分子可以有多種變化,如在一元統(tǒng)計分析中,在衡量樣本均值距總體均值的差異大小時,可以用,對于我們研究的實際問題時,負值并不顯現(xiàn)特別的意義,所以把絕對值的符號去掉,差值取正數(shù),又如在衡量兩個總體的均值差異大小時,并結(jié)合假設(shè)檢驗時,統(tǒng)計距離的分子就變成,其他變化形式視情況而定;分母中的標準差變化也隨著研究問題的情況而定,但是要和分子形式的意義保持一致,例如考察兩個總體間均值差異大小的問題時,對于兩個正態(tài)總體:,;分別抽取一個樣本:和,在假設(shè)時,統(tǒng)計距離的分母取(兩個樣本的加權(quán)標準差),這時統(tǒng)計距離變?yōu)橄率剑梢岳斫鉃榈木嚯x是加權(quán)標準差的倍數(shù)):=
在多元統(tǒng)計分析中,統(tǒng)計距離的分子形式就變成變量的向量內(nèi)積形式,分子在表示直觀的變量向量間的差異時可以取不同的向量之差內(nèi)積形式如,也可以是自身變量的內(nèi)積形式(分母為協(xié)方差陣,它的選擇視情況而定,兩者結(jié)合就可以根據(jù)研究問題的不同而構(gòu)造出不同的統(tǒng)計距離。
實際問題表現(xiàn)出的數(shù)據(jù)在沒經(jīng)過整理時,是雜亂無序的,沒什么規(guī)律可尋,又是抽樣得到的,不能完全反映實際問題的總體狀況?;诳傮w一般是龐大的、人為把握不了的,抽樣僅得到的是部分數(shù)據(jù);人們在應(yīng)對各種體育實際問題時希望在這樣看似無序的數(shù)據(jù)中發(fā)現(xiàn)規(guī)律性的東西,來揭示反映事物內(nèi)部及不同事物之間聯(lián)系的本質(zhì)。體育工作者在科研中會面臨多樣性問題的考量,比如:推測所研究總體的情況;不同總體間的比較與聯(lián)系的問題;影響問題的主要因素是哪些;某個問題內(nèi)部影響問題的各因素之間的聯(lián)系;以樣本觀測值建立的模型來預(yù)測相關(guān)事件將來可能發(fā)展的走勢;在體育領(lǐng)域根據(jù)專業(yè)知識將大體感識到的相近或相似的對象相聚成類;或依從既有成熟的分類法則將新遇到的研究對象進行近距離歸類等。
在面對上述問題時,人們往往會產(chǎn)生以樣本觀測值與所研究問題期望值的差異情況來衡量樣本對總體的推測情況;而對于研究不同總體間的比較問題時,通常會利用各自得到的抽樣數(shù)據(jù)來完成差異上的比較;在建模過程中對待定參數(shù)采取極大似然法及最小二乘法進行核定和檢驗等。這些通過“差異”的直觀想法對問題進行統(tǒng)計分析,在面臨不同維度時,通常以不同的距離形式來表現(xiàn),正如前面論述的絕對距離、歐氏距離、統(tǒng)計距離以及協(xié)方差的形式(也可以看作是一種特殊距離)。無論在一元統(tǒng)計分析還是在多元統(tǒng)計分析中,統(tǒng)計距離都有其優(yōu)良的統(tǒng)計性質(zhì),正是因為統(tǒng)計距離一方面幾乎兼容其他幾種距離的形式和性質(zhì),另一方面它考慮到所研究問題數(shù)據(jù)分布的性質(zhì)(數(shù)據(jù)差異波動大小,數(shù)據(jù)集中趨度),所以它可以根據(jù)問題的不同而構(gòu)造出相對應(yīng)的統(tǒng)計量,再配以小概率原則等,從而衍生出其他類別的統(tǒng)計方法如隨機變量的分布、假設(shè)檢驗等,能處理很多統(tǒng)計問題,因此它成為統(tǒng)計分析的基礎(chǔ)。
統(tǒng)計分析中,常用的距離有歐氏距離、馬氏距離、向量的內(nèi)積等。統(tǒng)計距離,當是一元統(tǒng)計分析問題時,分子可以是或等,分母可以是或等形式,但是須根據(jù)問題的需要而定;當是多元統(tǒng)計分析的問題時,分子就是向量內(nèi)積的不同形式,分母為單位矩陣時,它就是歐氏距離,當取時就是馬氏距離,若是有總體參數(shù)參與,則取變量的協(xié)方差陣,如果需要,也可以取其他的正定矩陣。上述是結(jié)合一元和多元統(tǒng)計分析對變量的不同形式要求,對統(tǒng)計距離的構(gòu)造形式給予剖析的,但在實際運用時不可以機械套用,要根據(jù)研究問題的實質(zhì)和所取得的數(shù)據(jù)特征對變量的限制,決定如何使用統(tǒng)計距離。
在了解統(tǒng)計距離的構(gòu)造和思想后,下面來看看統(tǒng)計距離有哪些優(yōu)缺點。
其協(xié)方差矩陣變換成:
由上式可知,原數(shù)據(jù)點X、中心化數(shù)據(jù)矩陣X在施加可逆矩陣T做出變換后,舊點(或矩陣)之間的距離和新點(或矩陣)之間的距離是相等的;換成另一種說法即是中心化數(shù)據(jù)經(jīng)過可逆性轉(zhuǎn)換后產(chǎn)生了標準化數(shù)據(jù),這兩種數(shù)據(jù)形式測算出來的點間距離相同,同時揭示了統(tǒng)計距離的計算與指標變量的單位無關(guān)(計量單位亦屬于可逆性變換的范疇)。統(tǒng)計距離的這種優(yōu)越性質(zhì),在體育科研領(lǐng)域中可將具有不同計量單位的指標變量進行統(tǒng)籌考量,也是其應(yīng)用價值所在。
統(tǒng)計距離雖然與體育項目不同指標變量間的計量單位無關(guān),但是它將所有指標變量的作用等同視之,使得重要變量的作用不突出,而對影響力小的變量作用夸大了,屬于缺點。
統(tǒng)計距離的思想源于人們對體育現(xiàn)實問題“差異”化尋求的想法,也是啟示我們考慮體育統(tǒng)計問題時的一種基本指導(dǎo)思路;統(tǒng)計距離的構(gòu)造過程讓我們對體育統(tǒng)計學(xué)中的許多統(tǒng)計量的構(gòu)建及其統(tǒng)計思想能較容易的理解。以統(tǒng)計距離的思想、構(gòu)建過程及其參與構(gòu)建別的統(tǒng)計量的過程為主線結(jié)合隨機變量的分布、小概率原則、區(qū)間估計、假設(shè)檢驗等基本原理和方法,在對體育統(tǒng)計諸多知識點的獲取上會來得輕松些;統(tǒng)計距離也正是一元和多元統(tǒng)計分析的基礎(chǔ),幾乎貫穿始終,應(yīng)用十分廣泛。很好的理解及應(yīng)用統(tǒng)計距離有助于我們理解很多統(tǒng)計分析方法中的思想和應(yīng)用方法,可以有效地避免對公式的生搬硬套,也有助于我們發(fā)現(xiàn)新的統(tǒng)計量。
[1] 張潤楚.多元統(tǒng)計分析[M].北京:科學(xué)出版社,2006,9.
[2] 唐守正.多元統(tǒng)計分析方法[M].北京:中國林業(yè)出版社,1986,10.
[3] 〔美〕Richard A·Johnson, Dean W·Wicheren.陸璇等譯.實用多元統(tǒng)計分析[M].北京:清華大學(xué)出版社,2001,4.
[4] 趙開斌.關(guān)于統(tǒng)計距離的一點注記[J].安慶師范學(xué)院學(xué)報(自然科學(xué)版),2002(8).
[5] 李鵬飛.多元質(zhì)量特性過程能力分析與控制[D].天津大學(xué)管理學(xué)院,2006,1.
[6] 趙書祥.實用體育統(tǒng)計學(xué).北京[M]:北京體育大學(xué)出版社,2005,10.
[7] 祁國鷹.體育用多元分析[M].北京:北京體育大學(xué)出版社,1998,12.
Statistics From the Sports Statistics in the Study
YANG Baolei
Dept of P.E., Chuzhou Vocational And Technical College, Chuzhou Anhui, 239000, China.
Sports statistics is more and more prominent in the sports scientificresearch domain function, but its application obvious backwardness tosports scientific research actual need; The statistical distancethought and the structure method as well as constituted thestatistical analysis foundation with other statistical thought and themethod relation, this foundational function can help a people easierunderstanding Yuan with many Yuan statistical analysis in manystatistical thought and the method.
Statistics distance; Methods; A peacekeeping; Multivariate
G80-32
A
1007―6891(2016)06―0005―03
2016-05-11
安徽省高校人文社科重點項目:環(huán)巢湖體育旅游產(chǎn)業(yè)升級策略研究——基于長三角區(qū)域居民體育旅游意愿的實證(SK2015A718)。