哈爾濱工程大學體育部,黑龍江 哈爾濱 150001
焉 石,陳永欣,李尚濱,糾延紅,楊 俊
?
體育科研中量表信效度檢驗的標準化程序解析
量表是一種測量工具,用于精確度量一個比較抽象或綜合性較強的概念,特別是度量態(tài)度和觀念的不同程度或差異[1]。朱智賢[2]主編的《心理學大辭典》將量表解釋為一個具有單位和參照點的連續(xù)體,將被測量的事物置于該連續(xù)體的適當位置,看它離開參照點多少單位的計數(shù)便得到一個測值。量表在社會科學研究中有著舉足輕重的作用,近年來在體育科研中也得到了廣泛應用,并得到了一致認可,尤其是在體育專業(yè)碩士論文的撰寫方面被大量采用。但由于采用量表做研究,就必須要很好掌握體育統(tǒng)計的相關知識,而目前雖然大部分體育院校都開設了體育統(tǒng)計和體育科研方法等課程,但使用教材只是一味注重復雜難懂的數(shù)理統(tǒng)計方面的原理及計算公式說明,并且對于統(tǒng)計出的眾多數(shù)據(jù)結果,哪些該在論文中報告,哪些不用報告等細節(jié)問題方面的講解甚少。另外針對一些像回歸分析、T檢驗、ANOVA等研究假設檢驗的統(tǒng)計方法,在正式統(tǒng)計分析之前,針對各變量應該先做什么再做什么等標準化處理程序的介紹也少之又少,而只是一味的將各個環(huán)節(jié)拆分進行統(tǒng)計原理介紹,這種情況對于一個完全沒有接觸過統(tǒng)計學的體育專業(yè)研究生來說,往往在看到一大堆復雜抽象的數(shù)學公式時,會造成其一頭霧水,彷徨失措不知從何入手,最后迫不得已只能求助于他人或采用相對較為低級簡單的頻率分析,甚至會出現(xiàn)嚴重誤用等現(xiàn)象發(fā)生,所以這樣很不利于體育專業(yè)研究生開展學術研究,同時也會對我國體育科研的長遠發(fā)展產生不良影響。
綜上,本研究旨在從初次接觸或從未學習過統(tǒng)計學的本科生或研究生角度出發(fā),并結合相關實例,著重對探索變量間關系方面的論文在做推論統(tǒng)計前,各變量所應該執(zhí)行哪些具體的標準化程序進行解析,同時回避統(tǒng)計的復雜原理說明,著重以應用性為主,盡可能做到言簡意賅、通俗易懂,為體育工作者及研究生在以后科研方面的正確使用量表提供參考。為了能夠更好的介紹量表信效度檢驗的標準化程序,本研究引用張偉豪[3]論文中的數(shù)據(jù)展開分析介紹,該論文主要內容是探討有用性、易用性和態(tài)度對行為意圖的影響。另外,本研究將著重介紹量表信效度檢驗的流程以及經過統(tǒng)計分析后結果中的一些關鍵數(shù)據(jù)的解釋,而針對具體SPSS操作程序將不做具體介紹。
1項目分析(題目鑒定)
項目分析的主要目的在于檢驗編制的量表或測驗個別題項的適切或可靠程度,它與信度檢驗的差異在于信度檢驗是檢核整份量表或包含數(shù)個題項的層面或構念的可靠程度,而項目分析的檢驗就是探究高低分的受試者在每個題項的差異或進行題項間同質性檢驗,項目分析結果可作為個別題項篩選或修改的依據(jù)[4]。根據(jù)以上要求,本研究應首先將四個量表分別進行題項總分計算,然后采用27%和73%將總體分為低分組和高分組,再將高低分組進行獨立樣本T檢驗,并根據(jù)P值將不顯著的題項進行刪除,保留P值顯著的題項。
表1 項目分析結果
由于篇幅有限,本研究只針對態(tài)度變量下的三個題項進行了項目分析,根據(jù)以上數(shù)據(jù)的T值和P值表明,態(tài)度變量下的三個題項分別具有較好的鑒別力,應全部予以保留,然后按照以上程序分別將有用性、易用性和行為意圖下的題項進行項目分析,刪除不符合標準的題項。
2因素分析(效度檢驗)
項目分析完后,為檢驗量表的建構效度,應進行因素分析。所謂建構效度指態(tài)度量表能測量理論的概念或特質的程度。因素分析目的即在找出量表的潛在的結構,減少題項的數(shù)目,使之變?yōu)橐唤M較少而彼此相關較大的變量,此種因素分析是一種探索性的因素分析方法。經過項目分析后,本研究涉及到的四個量表的題項分別予以保留,所以在此環(huán)節(jié)將四個量表的所有題項分別代入因素分析進行檢驗。
表2 因素分析結果
KMO=0.89 P=.000
根據(jù)以上統(tǒng)計結果顯示,KMO指數(shù)為0.89表明適合進行因素分析,同時P值非常顯著。另外通過主成分分析法結果顯示可以萃取出四個因素,并且解釋力達到72.33%,具有較高的解釋能力。另外,四個變量的題項因子載荷分別大于0.6,并且沒有出現(xiàn)同時跨越兩個以上因素的題項,表明各量表具有很好的建構效度。
3信度與收斂、區(qū)別檢驗
因素分析完后,要繼續(xù)進行的是量表各層面與總量表的信度檢驗。所謂信度,就是量表的可靠性或穩(wěn)定性,在態(tài)度量表法中常用的檢驗信度的方法為L.J.Cronbach所創(chuàng)的a系數(shù),a系數(shù)值介于0至1之間,出現(xiàn)0或1兩個極端值的概率甚低。究竟a系數(shù)要多大才算有高的信度,不同的方法論學者對此看法也未盡相同。學者Nunnally(1978)[5]認為等于0.7是一個較低但可以接受的量表邊界值;學者DeVellis(1991)[6]也提出,如果在0.6至0.65之間最好不要,0.65到0.7之間是最小可以接受值,0.7到0.8之間相當好,0.8到0.9之間非常好。綜上研究,本研究認為信度值應該在0.7以上最為合理,本研究將通過因素分析的各個變量分別進行信度檢驗,將信度指數(shù)偏低的題項進行篩選。
以上研究結果顯示,四個變量的內部一致性指數(shù)分別為.750、.784、.758、.888分別超過了.70的標準,表明各量表的內部具有較好的內部一致性。為了了解變量間的相關關系程度,各量表在通過信度檢驗后需要將各自的題項進行加總平均并生成一個新的變量,然后運用皮爾森相關檢驗各變量之間的關系程度,理想的關系范圍為0.3到0.7之間,如果高于0.7說明變量間可能會存在共線性問題,如果低于0.3則會在日后的統(tǒng)計結果中出現(xiàn)預測不顯著等問題,以上數(shù)據(jù)表明,四個變量間相關關系指數(shù)都在0.4-0.5之間,屬于合理區(qū)間。AVE指數(shù)是一個衡量變量內部題項間相關程度的指標,一般要求大于0.5,它是由因素分析里的題項間因素載荷指數(shù)加總平均后,再將平均值平方所得。本研究四個變量的AVE指數(shù)都在0.5以上,表明各變量內的題項間的相關較高,能夠很好的解釋變量特征,換言之,AVE指數(shù)越高說明變量對題項具有很好的收斂效度。而另一方面,變量與變量間還應該具備很好的區(qū)別效度,它的計算方法為將AVE值進行開根號,衡量標準為將所得AVE值進行開根號值后與其他變量間的皮爾森相關值進行比較,如果分別高于皮爾森相關值說明該變量與其他變量間具有很好的區(qū)別效度。結果顯示,例如態(tài)度.754明顯高于易用性.521、有用性.510、行為意圖.460的皮爾森相關系數(shù),以此類推各自都分別高于其他變量,說明各自都符合區(qū)別效度標準,換言之,變量與變量間具有很好的區(qū)別效度。
表3 信度與收斂、區(qū)別檢驗結果
對角線加粗字體為AVE之開根號值,下三角為皮爾森相關值
4小結
綜上,在體育科研中日后在使用量表探索變量間關系時,特別是在引用國外或他人的量表時,應該首先按照本研究介紹的信效度檢驗程序后,再進行相應的推論統(tǒng)計。同時也提示廣大統(tǒng)計專家學者,應該盡可能的簡化統(tǒng)計原理知識的介紹,著重傾向應用統(tǒng)計方面,從而真正讓學生了解統(tǒng)計并善于應用統(tǒng)計從事體育科研。
參考文獻:
[1]袁方.社會研究方法教程[M].北京:北京大學出版社,1997.
[2]朱智賢.心理學大辭典[M].北京:北京師范大學出版社,1989.
[3]吳明隆.問卷統(tǒng)計分析實務—SPSS操作與應用[M].重慶:重慶大學出版社,2010.
[4]Nunnally,J.C.(1978).Psychoosing a test statistic in multivariate analysis of variance[J].Psychological Bulletin,83(4),579-586.
[5]DeVellis,R.F.(1991).Scale DeVelopment Theory and Applications,London:SAGE.
Analysis of Standard Procedures of Reliability and Validity Test of Scale in Sports Science Research
哈爾濱工程大學體育部,黑龍江 哈爾濱150001
焉石,陳永欣,李尚濱,糾延紅,楊俊
Yan Shi, Chen Yongxin, Li Shangbin, Jiu Yanhong, Yang Jun
摘要:本研究通過運用文獻資料法、邏輯分析法對體育科研中針對量表的信效度檢驗應該遵循的必要程序進行了解析。結果顯示,其標準化程序依次為:項目分析、因素分析、信度檢驗、收斂效度及區(qū)別效度檢驗,只有在量表分別通過以上篩查后,才可以進行后續(xù)的推論統(tǒng)計分析。
關鍵詞:量表;項目分析;因素分析;信度
Abstract:This study analyzes the necessary procedures that should be followed in the reliability and validity test of a scale in sports science research with methods of literature and logical analysis. The results show that the standard procedures in turn are: item analysis, factor analysis, reliability test, convergent validity and discriminant validity test. Only after a scale passes the aforementioned screening respectively, can the subsequent inferential statistic analysis be conducted.
Key words:scale; item analysis; factor analysis; reliability
doi:10.3969/ j.issn.1005-0256.2016.04.008
中圖分類號:G804
文獻標識碼:A
文章編號:1005-0256(2016)04-0018-2
作者簡介:第一焉石(1981-),男,黑龍江哈爾濱人,副教授,研究方向:體育教育訓練學。
基金項目:哈爾濱工程大學2014年研究生教育教學改革項目(項目編號:JG2014YYB21)
Department of Physical Education, Harbin Engineering University, Harbin 150001, Heilongjiang, China.