戴儉慧,金亞虹
體育科學(xué)量表編制中幾個主要問題探究
——一種方法優(yōu)化的思考
戴儉慧1,金亞虹2
體育科學(xué)量表編制是科學(xué)測量領(lǐng)域的重要分支之一,追求的目標(biāo)在于其權(quán)威性、可靠性和有效性,其測量理論主要涉及經(jīng)典測量理論(Classical Test Theory,簡稱CTT)、概化理論(Generalizability Theory,簡稱GT)、項目反應(yīng)理論(Item Response Theory,簡稱IRT)及層面理論(Facet Theory,簡稱FT)?;趯Σ煌瑴y量理論的認(rèn)識,重點圍繞量表編制中的維度與題項、項目分析及信效度3個問題展開介紹,闡釋以隨機(jī)化為理論基礎(chǔ)的經(jīng)典測量理論的優(yōu)勢和弊端,也給出以潛在特質(zhì)為基礎(chǔ)的項目反應(yīng)理論及非計量化層面理論的應(yīng)用方法和主要作用。作者突出介紹了它們在體育科學(xué)量表編制中的方法組合優(yōu)化問題,列舉了相應(yīng)的研究案例,并認(rèn)為,這種方法上的組合優(yōu)化不失為一種可取的或值得嘗試的思路,也理應(yīng)成為體育科學(xué)量表編制逐步走向規(guī)范、精確和深入的重要標(biāo)志之一。
量表;方法優(yōu)化;項目反應(yīng)理論;心理測量
:Sports science scale is an important branch of scientific measurement field,the pursuit of the goal lies in its authority,reliability and validity.The measurement theory mainly relates to the classical test theory (referred to as CTT),generalizability theory (referred to as GT),item response theory (referred to as IRT) and facet theory (referred to as FT).Based on the understanding of different measurement theory,the author introduced the dimensions and items,the item analysis,reliability and validity in scale development,explained the advantages and disadvantages of the classical test theory as the theoretical basis of the randomization,also gave main analysis method of the item response theory based on latent trait and function of facet theory based on non quantitative level.Among them,the author specifically focused on how to achieve the best optimization in sports science scale,lists the corresponding cases,and pointed out that,the method of combinatorial optimization was a desirable or worthwhile ideas,also should become one of the important sign of sports science scale gradually moving towards standardized and accurate.
心理測量主要存在三大理論流派,即經(jīng)典測量理論(Classical Test Theory,簡稱CTT)、概化理論(Generalizability Theory,簡稱GT)和項目反應(yīng)理論(Item Response Theory,簡稱IRT),測量理論的發(fā)展又出現(xiàn)了層面理論(Facet Theory,簡稱FT)。體育科學(xué)量表編制是心理測量領(lǐng)域的一個細(xì)小分支,其編制方法的主要特征還停留在經(jīng)典測量理論的基礎(chǔ)之上,即以隨機(jī)抽樣為基礎(chǔ)。隨著項目反應(yīng)理論(以潛在特質(zhì)和數(shù)學(xué)統(tǒng)計模型為基礎(chǔ))和層面理論(以物理空間呈現(xiàn)概念空間,最重要模型為WASSA1)的發(fā)展,經(jīng)典測量理論的局限性也越來越凸顯。體育科學(xué)量表編制是體育科學(xué)研究中值得關(guān)注的領(lǐng)域之一,也是近些年來體育科學(xué)研究領(lǐng)域的重要分支,其編制方法的合理性和規(guī)范性不僅影響到量表的信效度,即有效的測量問題,更會影響到體育學(xué)科學(xué)術(shù)水平的發(fā)展。農(nóng)納利(Nunnally)在很早以前就已經(jīng)指出,缺乏合理統(tǒng)計方法的運用將會阻礙測量科學(xué)的進(jìn)步[38]。在現(xiàn)代科學(xué)測量不斷深入發(fā)展的今天,無論是國外[25,,31,33,37,39,41]還是國內(nèi)[4,13,17-19],越來越多的學(xué)科不僅僅依賴于來自經(jīng)典測量理論的統(tǒng)計方法,而是更加注重對一些傳統(tǒng)測量方法的修補(bǔ)和完善,并與一些較新的方法進(jìn)行組合運用,以提升研究的規(guī)范性和科學(xué)性。如同質(zhì)性研究方法在傳統(tǒng)定性研究方法基礎(chǔ)上的發(fā)展一樣,方法的規(guī)范化和組合優(yōu)化已成為科學(xué)測量的一種新取向。其中,不少研究指出[18,25,27,30,44-48],項目反應(yīng)理論以及運用到社會科學(xué)和心理學(xué)的層面理論已表現(xiàn)出越來越廣泛的應(yīng)用。例如,Thelma 等人運用項目反應(yīng)理論分析了關(guān)節(jié)炎患者運動行為的自我效能感[46],Glenda 等人運用項目反應(yīng)理論研發(fā)了護(hù)理專業(yè)學(xué)生的自我效能感量表[23]以及Maslovaty運用層面理論對教育心理的研究[36,37]等等。同時,這在國內(nèi)的一些母學(xué)科中也逐步有所運用,尤其是在心理學(xué)和教育學(xué)中量表的編制領(lǐng)域。楊建原等人運用項目反應(yīng)理論及層面理論對友誼質(zhì)量量表進(jìn)行了修訂[13],趙守盈等人運用多層面模型編制了教學(xué)效能感量表[18]等。
然而,這些方法在體育科學(xué)量表編制中的應(yīng)用顯得還有些滯后。面對許多新的理論或方法,雖然不能一味吸收,但至少在方法上的組合優(yōu)化應(yīng)成為一種新的值得嘗試的路徑。因此,體育科學(xué)工作者絕不能因為某些方法的復(fù)雜而退縮,只要它們確有優(yōu)勢之處,就應(yīng)該加以研究和引用。目前,從國外體育科學(xué)量表的研究來看,大部分運用了前面提出的項目反應(yīng)理論或?qū)用胬碚?,而這些理論或方法在我國體育科學(xué)量表的編制中還尚顯不足或缺乏規(guī)范性使用。
因此,本研究針對以我國體育科學(xué)量表編制中經(jīng)常運用到的方法為線索,對量表編制中方法運用的更優(yōu)組合進(jìn)行探討。相關(guān)研究指出[16,46],目前體育科學(xué)研究中,量表編制中的固定模式或方法存在一些弊端,而作為測量領(lǐng)域三大理論(經(jīng)典測量理論、概化理論、項目反應(yīng)理論)之一的項目反應(yīng)理論,可以對其缺陷進(jìn)行很好的彌補(bǔ)和輔助。例如,項目反應(yīng)理論可以用信息量來代表信度,它既可以檢驗整體量表的信度,也可以對每個題項的信度進(jìn)行檢驗(羅照盛,2012[7];楊建原,2011[13]);另外,傳統(tǒng)量表編制中通常用被試的通過率來估計題項難度參數(shù),用題總相關(guān)來評價區(qū)分度參數(shù)(這里的題總相關(guān)指的就是題項分?jǐn)?shù)與測驗總分的相關(guān),測驗總分也稱之為效標(biāo)分?jǐn)?shù),通常被作為區(qū)分度的一種分析方法[5,14]),這樣比較容易導(dǎo)致失去內(nèi)在的統(tǒng)一性,而項目反應(yīng)理論則把這兩個參數(shù)(難度參數(shù)和區(qū)分度參數(shù))定義在了同一個能力量尺上,從而使之具有相同的單位基礎(chǔ),來保證它們協(xié)調(diào)統(tǒng)一的解釋特性。當(dāng)然,體育科學(xué)量表編制中還存在一些其它缺陷,如觀察分?jǐn)?shù)權(quán)重線性的累加以及依賴被試樣本等等。盡管項目反應(yīng)理論不能說是對其全部進(jìn)行了彌補(bǔ),但說對其部分進(jìn)行了彌補(bǔ)還是不為過的。之所以提出相互結(jié)合的理論基礎(chǔ)還在于,首先:在聯(lián)系被試反應(yīng)與潛在特質(zhì)的過程中,經(jīng)典測量理論和項目反應(yīng)理論均是建立在數(shù)據(jù)模型的基礎(chǔ)之上;其次:經(jīng)典測量理論以真分?jǐn)?shù)為理論基礎(chǔ),項目反應(yīng)理論以潛在特質(zhì)為理論基礎(chǔ),采用不同的度量方式來表示同一心理特征,使建立的測量更具有對應(yīng)的關(guān)聯(lián)[26];最后:經(jīng)典測量理論可以從宏觀的層面把總體與題項結(jié)合,并運用通過率以及鑒別指數(shù)來體現(xiàn)其外在特性,而項目反應(yīng)理論從微觀層面把題項與潛在特質(zhì)聯(lián)系起來,并通過難度以及區(qū)分度等來體現(xiàn)內(nèi)在特征,這樣,內(nèi)、外結(jié)合使其具有更高的信效度。同時,項目反應(yīng)理論打破了人們一直以來所認(rèn)為的觀點(即為了保證更優(yōu)的信度,測驗長度越長越好的觀點),并證明了精簡的測驗同樣可以具有良好的信度。因此,本研究主張使用項目反應(yīng)理論與經(jīng)典測量理論的優(yōu)化組合來篩選出更優(yōu)的題項以及構(gòu)建更高的量表信度。
通常,為了使量表具有更優(yōu)的內(nèi)容效度以及構(gòu)想效度,也可配合使用層面理論中的部分方法。層面理論(FT)作為一種研究策略,將其范式化分析與內(nèi)部數(shù)據(jù)分析結(jié)合起來,其中,范式化分析針對的是理論構(gòu)建(運用映射語句),而內(nèi)部數(shù)據(jù)分析則主要針對的是實證研究,主要是運用最小空間分析技術(shù)(Smallest Space Analysis,簡稱SSA)[17,29]。在許多學(xué)科的研究中,過分強(qiáng)調(diào)復(fù)雜的定量分析而忽視了所研究內(nèi)容的概念理論框架,這種做法是欠妥的。層面理論可以在一定程度上權(quán)衡這一問題,它強(qiáng)調(diào)了理論構(gòu)建與概念結(jié)構(gòu)的合理性,把理論構(gòu)建和實證研究相結(jié)合,并運用最小空間分析技術(shù)來探索和驗證理論結(jié)構(gòu),從而很好地克服了將統(tǒng)計置于理論之上的錯誤[1]。并且,層面理論的范式化分析與數(shù)據(jù)處理技術(shù)比量表編制中所使用的因素分析具有多種優(yōu)越性:首先,在量表的編制過程中,運用層面理論的映射語句可以幫助科研人員窮盡和區(qū)分相關(guān)概念和變量,從而使建立的量表結(jié)構(gòu)更加科學(xué)以及具有更優(yōu)的內(nèi)容效度;其次,針對樣本的要求,因素分析高于層面理論分析,這就可能給研究人員在研究中帶來很大的限制因素和不確定因素;最后,層面理論不需要變量呈多元正態(tài)分布,這是因為,在因素分析中運用的是積矩相關(guān)系數(shù),而在層面理論數(shù)據(jù)處理技術(shù)中,則是把原始數(shù)據(jù)轉(zhuǎn)換成區(qū)分各變量接近程度的“距離”[17]。在許多研究中,不管其變量是否是正態(tài)分布或者線性分布,便泛泛采用了因素分析方法,這是不可取的,這在競技體育領(lǐng)域諸多特殊現(xiàn)象分析時顯得尤為重要。當(dāng)然,在確保被試總體屬于正態(tài)分布以及所選樣本能夠充分代表研究總體的情況下,其經(jīng)典測量理論的分析技術(shù)(例如因素分析)的結(jié)果還是很穩(wěn)定的,但不應(yīng)該崇尚它的簡單,而應(yīng)該在方法上向更深一層地邁進(jìn)。
由此看來。不同測量理論或方法的優(yōu)化組合是提高體育科學(xué)量表編制的一種新取向。因為,只有有效地組合與運用方法才能得出更加真實、精確的結(jié)果?;诖?,本研究將對體育科學(xué)量表編制中存在的主要問題進(jìn)行探究和述評,并就其如何與項目反應(yīng)理論、層面理論來優(yōu)化組合進(jìn)行理論梳理,以供探討和商榷。
2.1 初始與最終數(shù)量分析
量表的維度和題項是量表編制過程中涉及到的重要步驟。雖然不同的研究者對初始和最終確定的數(shù)量持不同觀點,但不少研究者認(rèn)為(Devellis,1991),一般情況下初始題項數(shù)最好應(yīng)該是最終題項數(shù)的3~4倍,但是如果研究的是某個領(lǐng)域的特定內(nèi)容,或者是基于以往的研究來編制的題項,理論上不需要過多的題項就可以使得出的最終量表具有較好的內(nèi)部一致性,初始題項數(shù)是最終題項數(shù)的1.5倍即可[20];對于量表維度的確立,通常采用經(jīng)典測量理論的因子分析等方法確立得到,沒有相對固定的維度數(shù)量標(biāo)準(zhǔn),僅根據(jù)自身研究需要而定。
為了使人們對體育科學(xué)研究領(lǐng)域量表編制中的題項數(shù)和維度數(shù)有更為直觀的認(rèn)識,有必要對我國近幾年體育類量表編制中的題項數(shù)和維度數(shù)進(jìn)行統(tǒng)計。本研究以2008—2012年間的13家體育類核心期刊為調(diào)查來源(《體育科學(xué)》、《北京體育大學(xué)學(xué)報》、《中國體育科技》、《上海體育學(xué)院學(xué)報》、《體育學(xué)刊》、《體育文化導(dǎo)刊》、《體育與科學(xué)》、《天津體育學(xué)院學(xué)報》、《武漢體育學(xué)院學(xué)報》、《西安體育學(xué)院學(xué)報》、《成都體育學(xué)院學(xué)報》、《廣州體育學(xué)院學(xué)報》和《山東體育學(xué)院學(xué)報》),共收集了體育類量表研制性論文116篇。隨后,對這116篇論文進(jìn)行了再次篩選(主要是剔除修訂性量表研究和沒有交代初始題項數(shù)或維度數(shù)的研究論文以及直接翻譯性量表),最終刪除不符合要求的文章61篇,從而確定55篇量表編制的文章作為分析對象。在對量表進(jìn)行分析的同時,若量表具有多級維度,僅計算至二級維度數(shù)。表1顯示了2008—2012年間13家體育類核心期刊發(fā)表的量表編制性論文對初測與最終題項數(shù)和維度數(shù)的統(tǒng)計。
表 1 體育科學(xué)量表編制中初始與最終維度和題項數(shù)統(tǒng)計一覽表
通常而言,初始維度數(shù)與最終維度數(shù)之間不會有很大差別,而初始題項數(shù)與最終題項數(shù)則會有較大差距。因此,表1僅展示了初始維度和最終維度的平均值,以便對體育科學(xué)量表維度的制定有大體的了解。針對初始題項數(shù)和最終題項數(shù),則不僅進(jìn)行了平均值的統(tǒng)計,而且還進(jìn)行了初始題項數(shù)與最終題項數(shù)的比值計算。從表1中對初始題項數(shù)與最終題項數(shù)的比值來看,《體育科學(xué)》的比值為1.82,而其他核心期刊平均為1.60。總體來看,我國體育科研中量表編制的初始題項數(shù)是最終題項數(shù)的1.71倍,考慮到本研究排除了量表修訂的文獻(xiàn),因此,推測導(dǎo)致這個原因只有以下幾種可能,第1種可能是體育科學(xué)量表編制中的題項數(shù)的確需要進(jìn)一步減少,以達(dá)到更加精簡量表的目的;第2種可能是在量表編制過程中,題目的編制內(nèi)容不夠全面,使其漏編了部分題項,這樣可能使部分優(yōu)良的題項也漏編了;第3種可能是體育科學(xué)研究中的量表編制大多數(shù)是針對特定內(nèi)容的研究;最后一種則是一些研究者可能根本就不知道初始量表的題項數(shù)與最終量表的題目數(shù)之間的關(guān)系。但無論哪種可能,體育科學(xué)量表的編制在題項和維度的確立上需要有更加嚴(yán)謹(jǐn)?shù)某绦蚝头椒▉磉M(jìn)行篩選和確立。
2.2 初始維度與題項的建立
初始維度與題項的建立往往涉及到編制量表內(nèi)容的合理性與否,因為,在隨后的工作中將主要考察所選維度和題項的驗證性,這就要求在初始維度和題項的建立方面盡量做到科學(xué)合理。從目前體育科研量表的初始維度和題項建立來看(表2),在維度確立方面,大部分量表編制運用了理論分析法、相關(guān)量表的引用、訪談法以及問卷調(diào)查法和專家評價法,并通過相關(guān)分析、因素分析、描述統(tǒng)計等分析資料的方法進(jìn)一步確立初始維度。從總體來看,我國體育科研量表編制中維度的初始確立首選的方法為理論分析法和訪談法;其次為問卷調(diào)查法、相關(guān)量表引用以及專家評價法。在題項編制方面,運用方法最多的則為相關(guān)量表引用,其次可為問卷調(diào)查法以及訪談法等。
表 2 體育科學(xué)量表初始維度制定和題項編制中常用方法一覽表
綜上所述,理論分析法、訪談法以及相關(guān)量表引用法在這一階段運用的比較頻繁,它們有著自身的優(yōu)勢,但也不能忽視它們在運用過程中的缺點。理論分析方法帶有很強(qiáng)的主觀色彩,缺乏必要的科學(xué)研究范式;訪談法在研究過程中可能會有一些意想不到的發(fā)現(xiàn),但具有樣本小,主、被試之間存在一定的相互影響,缺乏規(guī)范化結(jié)構(gòu)以及調(diào)查對象可能對調(diào)查問題具有很強(qiáng)的隱蔽性等弊端,因此常與其他方法結(jié)合使用。盡管相關(guān)量表引用帶有一定的科學(xué)范式含義,但是,被引用量表在編制過程中也可能運用了比較主觀的編制題項的方法,而且,很難保證被引用量表是否具有權(quán)威性以及符合自己的研究問題。這些方面的不足恰恰是當(dāng)前層面理論的優(yōu)勢,層面理論中通過映射語句,會使在維度的選擇以及題項的編制過程中偏向一種具有規(guī)范化的范式結(jié)構(gòu),從而權(quán)衡以往應(yīng)用方法中過于主觀的部分缺陷。
2.3 方法的優(yōu)化組合
目前,許多體育科學(xué)量表在編制過程中運用的是評價內(nèi)容效度的方式,例如,專家訪談法或?qū)<以u價法,且對效度的控制重點放在了量表的編制之后。實際上,編制題項也是量表編制過程中最重要和直觀的一個步驟。因為,題項的質(zhì)量從一開始就牽制著后期的種種努力行為[3]。例如,在統(tǒng)計的資料中有一篇關(guān)于“大學(xué)生體育鍛煉效果自評量表的研制”的文獻(xiàn)[2],有個題項為“我親身感受到體育鍛煉能有效地控制體重和體型”。這句話似乎在編制過程中就有些缺陷,由于體重和體型不能同等看待,而只能說是這兩個概念有交集。受試者在回答這一問題的時候很可能產(chǎn)生模棱兩可的感覺。因為,他有時候感覺控制住了自己的體重,但沒有控制住自己的體型,比如:體重下降了,但是腿變粗了,這讓他怎樣回答這個問題。因此,此題項談何效度?再就是,前面已經(jīng)了解到體育科學(xué)量表編制中初測的題項是最終題項的1.71倍,而導(dǎo)致這個結(jié)果的其中一種可能是在編制題項之初就已經(jīng)漏編了一些題項,而這些漏編的題項可能是包含具有很好信效度的題項。因此,為了在建立之初就要有比較好的內(nèi)容效度,就需要引入層面理論中的核心技術(shù)概念,即映射語句。由格特曼提出的映射語句來做研究設(shè)計可以把研究者的視野避免過度集中于無數(shù)的題項上,而是集中在一個數(shù)目有限的概念層面[22,42,43],且它可以將被試層面、內(nèi)容層面以及反應(yīng)范圍層面有機(jī)地連接起來,從而系統(tǒng)地闡述題項的內(nèi)容(圖1)。
映射語句中包括兩種成分,其主要的成分就是圖中所有的層面成分(另一成分為連接這些層面的詞語),這一成分具有嚴(yán)格和規(guī)范的特點。圖1顯示,層面包括:P層面(目標(biāo)人群層面)、C層面(內(nèi)容層面)以及R層面(反應(yīng)范圍層面),這些層面共同來界定研究的范疇,其中,P層面和C層面構(gòu)成了研究范圍[19]。P層面即為所研究的目標(biāo)人群(被試);C層面即為所研究內(nèi)容的一系列核心的概念,當(dāng)然也可以設(shè)定其為觀察變量,其內(nèi)容層面又包含各種子層面[19],對這些子層面的設(shè)計便是映射語句的關(guān)鍵。圖中的反應(yīng)范圍層面通常也可以被記為R層面,反應(yīng)可以從完全符合到完全不符合或非常同意到非常不同意等等(主要對應(yīng)于Likert 量表)。在實際應(yīng)用中,映射語句一般用來定義比較復(fù)雜理論框架的構(gòu)建,可以通過查閱工具書以及大量文獻(xiàn)經(jīng)常涉及到與研究內(nèi)容相關(guān)聯(lián)的方面,并對其歸納總結(jié),從而設(shè)計出簡單的映射語句。在編制過程中從每個層面僅選擇一個元素來進(jìn)行組合,然后,采用覆蓋題目或采樣題目的編寫方法來編寫題項。當(dāng)然,為了完善映射語句,可以通過元素擴(kuò)展和層面擴(kuò)展來進(jìn)行充實,具體的映射語句運用方法本文不做贅述,具體運用可以參閱相關(guān)書籍和文獻(xiàn)。
圖 1 層面理論中映射語句的一般表達(dá)式示意圖
為了更加清楚地表述這一過程,本研究給出了一個成就動機(jī)編寫的例子。在以往對成就動機(jī)的諸多研究當(dāng)中,涉及比較多的相關(guān)概念主要有:不確定性、估計風(fēng)險、困難、問題解決、責(zé)任以及需要的滿足。根據(jù)前面的表述,這6個概念可以歸結(jié)為映射語句的內(nèi)容層面(C層面),而為了使映射語句框架更加符合研究內(nèi)容實際,則需要對內(nèi)容層面進(jìn)行分解(內(nèi)容層面可包括多個子層面)。根據(jù)概念范疇可以將其分為時間子層面主要包括任務(wù)完成之前(不確定性和評估風(fēng)險)、任務(wù)完成之中(困難和解決問題)以及任務(wù)完成之后(責(zé)任和滿足需要);面對的類型子層面主要包括:挑戰(zhàn)性問題(不確定性、困難以及責(zé)任)和問題的解決(評估風(fēng)險、解決問題以及滿足需要);行為特征子層面主要包括:喜歡、滿意以及承擔(dān)責(zé)任。根據(jù)以上的表述,繪制成就動機(jī)題項的映射語句(圖2),可以得出2×3×3=18種組合,每一種組合采用覆蓋題目或采樣題目的編寫方法可以編寫出不同的題項,從而可以展開進(jìn)一步的題項研究。
總之,層面、元素和映射語句是層面理論的3個要素,其主要核心要素為映射語句,是一種把理論建構(gòu)和實證研究結(jié)合起來的方法,并且可以合理地將概括化的理論概念轉(zhuǎn)變成更合適的實證觀察概念。通過映射語句這種偏于科學(xué)范式的方法來對研究內(nèi)容進(jìn)行整理與分析,可以幫助科研人員窮盡和區(qū)分相關(guān)概念和變量,從而彌補(bǔ)過去比較主觀的編寫方法的不足,最終編制出結(jié)構(gòu)更加科學(xué)以及具有更優(yōu)內(nèi)容效度的量表。
圖 2 成就動機(jī)題項的映射語句示意圖
3.1 項目分析方法
部分論文對于項目分析的方法展示或是比較模糊或是劃分不規(guī)范,如在《大學(xué)生體育課學(xué)習(xí)滿意度測查量表編制》[10]中的鑒別指數(shù)和區(qū)分度被劃分成了兩個范疇。鑒別指數(shù)是用臨界比率(或稱為極端分組法)來計算的,通常與相關(guān)系數(shù)法一起被歸為區(qū)分度的計算方法當(dāng)中[11,12]。從目前體育科學(xué)量表編制中的項目分析方法來看,主要有相關(guān)分析、鑒別指數(shù)、標(biāo)準(zhǔn)差、探索性因素分析、驗證性因素分析及難度-平均得分率等方法。其中,相關(guān)分析法可包括題總相關(guān)、題他相關(guān)以及題項與所屬維度的相關(guān),而且,對區(qū)分度進(jìn)行分析的相關(guān)系數(shù)法也均歸入相關(guān)分析法之內(nèi)。其他方法運用相對較少,如頻數(shù)統(tǒng)計、逐步回歸分析以及克隆巴赫系數(shù)α分析等。
不同方法的運用自然會對量表的信效度有很大影響,盡管相關(guān)分析法在量表編制中運用得比較頻繁,例如,題總相關(guān)、題他相關(guān)以及題項與所屬維度相關(guān)等。最值得注意的是探索性因素分析法,它是在單純一種方法運用中使用次數(shù)最多的,運用此方法既可以來確定維度,又可以根據(jù)因子載荷刪減題項等。而鑒別指數(shù)法則是對題目的區(qū)分度進(jìn)行分析,從而刪除那些區(qū)分度小的題目。整體而言,對于一個量表的研制這3種方法是必不可少的。需要強(qiáng)調(diào)的是,既然是量表的研制,就應(yīng)該既要指明區(qū)分度,又要指明難度,才能使量表比較完整和規(guī)范。然而,在我國體育科學(xué)量表編制中對難度的分析甚少,盡管有對其分析的文獻(xiàn),也只是對量表整體通過率進(jìn)行寬泛地概括,而沒有對其更深入地界定。
3.2 方法的優(yōu)化組合
前面在維度與題項的編制中已經(jīng)了解到,體育科學(xué)量表編制中的初測題項數(shù)是最終題項數(shù)的1.71倍,這與其他學(xué)科通常的研究表述有所差距,即需要繼續(xù)刪減題項來簡化量表。雖然這個標(biāo)準(zhǔn)僅是一種參考,并不代表體育科學(xué)研究中量表題項存在的主要問題,但至少題項的不斷簡練和準(zhǔn)確是一種追求,值得對不同的方法進(jìn)行嘗試和組合使用,如前面提到的層面理論。值得思考的是,通過層面理論的最小空間分析技術(shù)(SSA)來刪減題項雖然具有一定的結(jié)構(gòu)優(yōu)勢,但是,最小空間分析技術(shù)無法精確地完成對跨區(qū)域題項的篩選,這就可能導(dǎo)致某些題項的確應(yīng)該在某一區(qū)域而產(chǎn)生誤刪的可能。所以,實際運用當(dāng)中,筆者主張把最小空間分析安排在結(jié)構(gòu)效度驗證的階段,與結(jié)構(gòu)方程模型一起組成更優(yōu)的組合來使其理論結(jié)構(gòu)更加合理。項目反應(yīng)理論是從微觀層面把題項與潛在特質(zhì)聯(lián)系起來,并通過難度、區(qū)分度以及信息量等指標(biāo)來體現(xiàn)內(nèi)在特征。這樣,優(yōu)化組合可以使編制的量表具有更高的信效度。因此,在這里引入了來自經(jīng)典測量理論又優(yōu)于經(jīng)典測量理論的項目反應(yīng)理論相關(guān)內(nèi)容來優(yōu)化題項刪減和驗證的過程,如通過Lord提出的三參數(shù)模型公式[34]:
來繪制項目反應(yīng)特征曲線(圖3)。式中,Pij(θj)表示能力為θ的人在項目上正確作答的概率,θj表示被試的能力或潛在特質(zhì),bi表示項目i的難度參數(shù),e表示自然對數(shù)之底=2.71828,ai表示項目i的區(qū)分度參數(shù),ci表示項目i的偽機(jī)遇參數(shù),習(xí)慣稱猜測參數(shù)[8]。
圖 3 項目反應(yīng)理論三參數(shù)項目特征曲線示意圖
從圖3中可以看出,如果同一個題項,對于不同受試來說,其項目反應(yīng)理論的疊加會是如圖的項目反應(yīng)理論曲線,而經(jīng)典測量理論則高低疊加相抵,出現(xiàn)適中,這就損失了很多信息,表現(xiàn)出了經(jīng)典測量理論依賴于樣本的特性。在這里,主要討論的是運用項目反應(yīng)理論的難度、區(qū)分度以及信息量并結(jié)合前面運用的方法來對題項進(jìn)行更優(yōu)的刪減。因此,這里主要探討圖中項目反應(yīng)理論的有關(guān)參數(shù)。由于在三參數(shù)模型的情況下,其區(qū)分度、難度以及猜測參數(shù)均可以被包括,所以,主要討論三參數(shù)模型的參數(shù)以及刪題標(biāo)準(zhǔn),而雙參數(shù)模型是在三參數(shù)模型的猜測參數(shù)等于零的情況下的特例,單參數(shù)則是在猜測參數(shù)和區(qū)分度參數(shù)均為零的情況下的特例。圖中b為橫坐標(biāo)能力尺度上的一個點,此點決定了項目特征曲線在坐標(biāo)軸的位置,稱為項目的位置參數(shù),但是大多數(shù)情況下稱它為難度參數(shù)。特征曲線在b點處的斜率為a,此點代表了項目的區(qū)分度,其值越高,則區(qū)分能力越大。c點則代表了猜測參數(shù),它的理論值在0.0~1.0之間,如果過高則不被接受。很多研究針對難度、區(qū)分度以及猜測參數(shù)定義的刪題標(biāo)準(zhǔn)不是很一致,但是這可能與研究的樣本有一定關(guān)系。有的研究[32]提出,a≤0.2,或a≥3;b≤-3或b≥4;c≥0.35則需要將其刪除。有的提出[6]a≤0.3,或a≥4;b≤-2.59或b≥2.59;c≥0.4,這需要根據(jù)具體情況而定。另外,信息量可以用于評價一個量表的信度,即用信息量來代表信度的概念,并把信息量定義到每個題項及其被試上,可以為檢驗結(jié)果是否可信提供更優(yōu)的信度。一般情況下,信息量高于25時,說明此量表質(zhì)量良好;在16~25的情況下,表明量表有待改進(jìn);如果低于16,則說明此量表較差[7,18],整個計算過程需要在專門軟件上來完成(如Parscale,Multilog,Bilog等軟件)。需要提醒的是,在項目反應(yīng)理論中的難度指標(biāo)不影響題項最大信息量的取值,僅會影響其位置,而區(qū)分度以及猜測參數(shù)對其均具有很大影響。區(qū)分度參數(shù)越高,則題項所提供的信息量也將變大;而猜測參數(shù)越大,則信息量參數(shù)就會越小。
4.1 信效度的選擇
測驗的信度是指測驗的可靠程度,而效度則是指一個測驗在測量某項指標(biāo)時所具有的準(zhǔn)確程度[14]。通常,在體育科學(xué)量表編制中使用的信度主要有內(nèi)部一致性系數(shù)、重測信度及評分者信度等;效度主要有內(nèi)容效度、結(jié)構(gòu)效度及效標(biāo)關(guān)聯(lián)效度等[15]。同時,結(jié)構(gòu)效度包括收斂效度和判別效度,效標(biāo)效度又稱為實證效度,它包括預(yù)測效度和同時效度。在信度方面,有些體育科學(xué)量表的編制中既用了克隆巴赫α系數(shù)的方法也用了折半法,但是僅用α系數(shù)即可,它優(yōu)于折半法。由于折半法是對測試題項對等分開,這本身就降低了信度,而克隆巴赫系數(shù)法克服了折半法的部分缺點。另外,體育科學(xué)量表編制中,量表的同質(zhì)性信度和結(jié)構(gòu)效度使用率是非常高的,可能是因為這兩種方法被認(rèn)可的程度較高。但是從理論上來說,內(nèi)容效度和效標(biāo)效度,在有條件的情況下均應(yīng)該進(jìn)行驗證。很早以前,美國心理學(xué)會就已經(jīng)把效度分為了3大類:內(nèi)容效度、結(jié)構(gòu)效度以及關(guān)聯(lián)效度。因此,這3種不同的效度對于一個量表來說均具有參考價值。
除了前面分析的信度以外,較多的是驗證了重測信度,但是效標(biāo)效度和內(nèi)容效度的驗證還有所欠缺。在今后的研究中結(jié)合層面理論的映射語句運用,可以在一定程度上保證內(nèi)容效度的提高,而效標(biāo)效度可以采用相關(guān)分析、區(qū)分度分析以及命中率分析來檢驗[14]。但是,建議應(yīng)該更加重視的是結(jié)構(gòu)效度,因為,無論是內(nèi)容效度還是效標(biāo)關(guān)聯(lián)效度在與結(jié)構(gòu)效度相比的情況下均不會處于同一地位,結(jié)構(gòu)效度是作為一個廣泛的概念在一定程度上包括了其他效度[9]。因此,本研究主張將結(jié)構(gòu)方程模型方法結(jié)合層面理論的最小空間分析(SSA)技術(shù)來優(yōu)化量表編制中的結(jié)構(gòu)效度。
4.2 方法的優(yōu)化組合
層面理論中數(shù)據(jù)處理的關(guān)鍵技術(shù)為多維尺度分析(MultiDimensional Scaling, 簡稱MDS),而MDS的一個重要模型是最小空間分析(SSA)[24,28],它既可以在研究內(nèi)容概念結(jié)構(gòu)還不是很確定的情況下進(jìn)行探索性SSA;也可以在理論結(jié)構(gòu)初步確立之后,進(jìn)行驗證性SSA。通過采用驗證性SSA來進(jìn)行結(jié)構(gòu)性驗證,可以為在理論上某題項更適合哪一維度提供統(tǒng)計上的數(shù)據(jù)支持,從而可以對此題項所屬維度進(jìn)行重新界定,并運用結(jié)構(gòu)方程模型來最后對運用驗證性SSA之前的模型與之后改變的模型進(jìn)行擬合度比較,從而得出最優(yōu)的結(jié)構(gòu)模型。
SSA主要是先計算變量或題項之間的相關(guān),然后在一個多維空間用點來表示每個題項或變量,其結(jié)果是空間中的距離關(guān)系代表了題項之間的相似系數(shù)關(guān)系[13]。最重要的是,SSA的圖形結(jié)構(gòu)中可以直觀地展示某個區(qū)域是否特定地代表了某一個維度的元素,如果代表了共同的層面,則說明這一設(shè)計是合理的[21]。SSA還可以通過區(qū)域的形狀以及同一層面元素的關(guān)系來驗證層面所扮演的角色,為理論結(jié)構(gòu)的假設(shè)提供依據(jù),例如極化角色、模塊角色等等[25]。為了更加直觀起見,筆者繪制了圖4,圖中的1、2、3、4等點為假設(shè)的各個題項,且假設(shè)層面A包括3個元素分別為a、b和c;而層面B包括d、e和f;層面C包括g、h和j。
圖 4 SSA的圓柱形結(jié)構(gòu)及其分解示意圖
由圖4可以發(fā)現(xiàn),層面A中包含的3個元素是一個軸線層面,對應(yīng)著圖右邊分解后的軸線角色;層面B包含的元素將空間分為3個扇形的區(qū)域,對應(yīng)著圖右邊分解的極化角色;層面C將空間分為3個圓環(huán)區(qū)域,對應(yīng)著圖右邊分解的模塊角色。其極化層面與模塊層面共同可以構(gòu)成圖右邊的雷達(dá)圖結(jié)構(gòu),越靠近中心的區(qū)域,元素相關(guān)以及題項相關(guān)越緊密,并且具有單向相關(guān)順序;而軸線層面也具有這種特點,如果在這個基礎(chǔ)上再加入此軸線層面,即加入了一個縱向維度,則成為圖左邊的圓柱形空間結(jié)構(gòu)圖[35,36]。當(dāng)然,SSA所得的結(jié)果不必是三維空間圖,可以是上面分解后圖形中的任何一種,并且圖形不會如此的規(guī)則[37]。
圖4中各層面看似分散,實際各層面元素都是連續(xù)的,并且題項之間的差異越小,區(qū)域的分離越不明顯。在不同的層面中,預(yù)測效度通常為雷達(dá)圖中心的元素優(yōu)于遠(yuǎn)離中心的元素。例如,圖4中f中的題項在g元素中的得分來預(yù)測d中的題項在g元素中的得分,往往優(yōu)于f中的題項在j元素中的得分來預(yù)測d中的題項在j元素中的得分。但這里更加關(guān)注的是,在進(jìn)行SSA分析之后,找出哪些是處于跨區(qū)域的題項,從而結(jié)合理論,探討是否對這些題項進(jìn)行重新劃分或者將其剔除,這樣就在一定程度上權(quán)衡了驗證性因素分析數(shù)據(jù)至上的弊端。因此,量表編制中結(jié)構(gòu)效度的驗證程序應(yīng)該是首先進(jìn)行結(jié)構(gòu)方程模型分析,然后進(jìn)行SSA,再對規(guī)整后的數(shù)據(jù)進(jìn)行結(jié)構(gòu)方程模型分析,最后比較前后擬合指數(shù),結(jié)合理論分析得出更優(yōu)的理論結(jié)構(gòu)以及結(jié)構(gòu)效度。
由于圖4結(jié)構(gòu)理解起來相對比較抽象,因此,本研究在以往研究的基礎(chǔ)上給出一個案例,2012年在《心理科學(xué)》發(fā)表的一篇《基于多層面模型的教學(xué)效能感量表》的研究[18],該研究對收回的問卷(162份)數(shù)據(jù)進(jìn)行了SSA分析,并對跨區(qū)域題項進(jìn)行了剔除,最后對剩余題項進(jìn)行了重新命名與驗證。在本研究所指的SSA分析側(cè)重的便是驗證,即:如果在驗證性SSA分析中出現(xiàn)跨區(qū)域題項,則應(yīng)該結(jié)合實際理論考慮這些跨區(qū)域題項是否應(yīng)該進(jìn)行重新劃分,這樣便在一定程度上權(quán)衡了驗證性因素分析數(shù)據(jù)至上的弊端。另外,根據(jù)層面理論原理,測量的維度驗證既可以通過同心圓來劃分,也可以通過軸線來劃分(圖5)。
圖 5 SSA分析中兩個層面的最小空間軸線結(jié)構(gòu)圖[18]
趙守盈(2012)的研究指出[18],兩個同心圓包括了知識傳授、課堂組織管理和品德行為教育(研究中將其稱為任務(wù)層面);而根據(jù)4條軸線可以將教學(xué)效能感量表分為素質(zhì)能力、學(xué)生反饋、積極體驗和情緒喚醒(研究中將其稱為認(rèn)識來源層面),它們處于同等重要的位置(因為是平行的關(guān)系[18])。事實上,圖5便是圖4中模塊角色與極化角色的疊加,從而構(gòu)成了圖4中的雷達(dá)圖結(jié)構(gòu)。由此可見,采用層面理論的SSA技術(shù)可以更加直觀的根據(jù)題項的距離進(jìn)行理論框架的驗證。
在這樣的分析過程中,擬合指標(biāo)是不可缺少的參考指標(biāo),最小空間分析進(jìn)行數(shù)據(jù)的轉(zhuǎn)換過程中,很多情況下是無法完全對應(yīng)的,而只能說是在一定程度上的滿足。例如,圖5中異化系數(shù)為0.15356,在可接受的范圍之內(nèi);區(qū)域指數(shù)為1.000,說明圖形的區(qū)分度非常好,無跨區(qū)域現(xiàn)象。通常,這一分析過程可通過相應(yīng)軟件來計算完成(如Hubag6.0),并需要多次迭代計算。因此,無論SSA是在反映概念結(jié)構(gòu)以及成功的構(gòu)建理論,還是在驗證其準(zhǔn)確性中,均需要擬合指數(shù)來進(jìn)行判定。在SSA中,經(jīng)常采用的擬合指標(biāo)為異化系數(shù),它表示與完美擬合之間的差異,反映了原始輸入數(shù)據(jù)通過SSA之后得出多維空間中輸出數(shù)據(jù)的不一致程度[40]。一般情況下應(yīng)該小于0.15,但有時在不超過0.20時也可以接受,這需要根據(jù)具體研究的內(nèi)容以及情況而定[21]。通常情況下,有兩種方式可以減小異化系數(shù)的數(shù)值,分別為增加維度數(shù)和刪除極端數(shù)據(jù)。這里,區(qū)域指數(shù)表示了某一維度對空間圖的區(qū)分程度,取值在0~1之間,其數(shù)值越大,說明區(qū)分程度越好。
因此,未來體育科研量表的編制需要將計量化和非計量化的手段結(jié)合使用是一個有價值的思路,通過優(yōu)勢互補(bǔ)達(dá)到編制量表的科學(xué)與規(guī)范。當(dāng)然,這種結(jié)合應(yīng)該以計量化手段為主體,這是遵從科學(xué)研究范式的基本前提,然而,添加非計量化的考察方法可能會得出更加理想化的結(jié)果。
5.1 量表初建以及方法的優(yōu)化
目前,我國體育科學(xué)量表編制中維度的初次確定運用比較多的方法為理論分析法和訪談法;題項編制過程中運用比較多的方法為相關(guān)量表引用法、因子分析法以及訪談法等。經(jīng)過對2008—2012期間我國體育類核心期刊(13家)發(fā)表的量表編制文獻(xiàn)的研究顯示,我國體育類量表編制中初始題項數(shù)是最終題項數(shù)的1.71倍(當(dāng)然,這僅是一種均值反映)。這與Devellis[20](1991)對量表編制中的觀點(初測是最終的3~4倍)有一定的出入,當(dāng)然,這可能與其專業(yè)特色有一定的關(guān)系,因為,畢竟體育研究是一個特殊的領(lǐng)域。但是,不可否認(rèn)的是,體育科學(xué)量表編制在研究方法上還存在單一性和機(jī)械性,對題項的篩減幾乎完全遵從固有的統(tǒng)計模式,缺少對多元方法的綜合運用或組合運用,而一些較為新穎的理論和方法可能會有更大的益處(如層面理論的映射語句),這便對來自經(jīng)典測量理論的方法提出了極大挑戰(zhàn),找到更加合適的方法與之進(jìn)行優(yōu)化組合可能會達(dá)到意想不到的結(jié)果。
層面理論之所以表現(xiàn)出較大優(yōu)勢,就在于首先從宏觀來分析,在運用中主要是通過查閱大量工具書以及文獻(xiàn),或者運用一些體育科研中常用的方法(訪談法、問卷調(diào)查等)來對所研究的內(nèi)容進(jìn)行歸納與演繹,設(shè)計出映射語句框架。從微觀來分析,在宏觀的映射語句框架下,從每個層面僅選擇一個元素來進(jìn)行組合,再采用覆蓋題目或采樣題目的編寫方法來編寫具有更好內(nèi)容效度的題項,這就使得量表的編制更加科學(xué)與規(guī)范。同時,為了完善映射語句,也可以對其通過元素擴(kuò)展和層面擴(kuò)展來進(jìn)行充實。當(dāng)然,對于更加具體的知識運用則需要讀者進(jìn)行相關(guān)書籍的閱讀。5.2 量表項目分析及方法的優(yōu)化
總體來看,我國體育類量表編制中項目分析方法運用較多的為相關(guān)分析法(如高低分組)、探索性因素分析法和鑒別指數(shù)法。但需要注意的是,探索性因素分析在體育量表編制中往往為單純的一種方法,而相關(guān)分析法則包括了許多的相關(guān),例如:題總相關(guān)、題他相關(guān)以及其他各種相關(guān)。從而可以看出探索性因素分析的重要性,因為,它既可以來確定維度,也可以根據(jù)因子載荷來刪減題項等等。當(dāng)然,對于一個量表的編制,這3種方法是均不可少的,但對量表的難度分析卻有待改進(jìn)。因此,筆者認(rèn)為,在結(jié)合經(jīng)典測量理論的基礎(chǔ)上,引入項目反應(yīng)理論的相關(guān)內(nèi)容來進(jìn)行題項的刪減尤為重要,至少可成為一種新的嘗試或取向。本研究針對Lord提出的三參數(shù)公式繪制了項目反應(yīng)理論三參數(shù)的項目特征曲線(雙參數(shù)和單參數(shù)均可以由三參數(shù)得到),并對其進(jìn)行了解釋說明。雖然,不同的研究內(nèi)容或樣本不同,可能導(dǎo)致考察的指標(biāo)或參考的評判標(biāo)準(zhǔn)不一,但經(jīng)過項目反應(yīng)理論分析來進(jìn)行刪減,不僅可以對量表的整體進(jìn)行分析,而且還可以對每個題項進(jìn)行考察,從而得出更優(yōu)的題項。
5.3 信效度分析以及方法的優(yōu)化
研究中發(fā)現(xiàn),對于我國體育科研中整體量表編制信度的檢驗,基本所有的論文均對同質(zhì)性信度進(jìn)行了檢驗,還有部分對其重測信度進(jìn)行了檢驗。方法運用最多的則是克隆巴赫α系數(shù),這與調(diào)查中基本都對其同質(zhì)性信度進(jìn)行了檢驗是一致的。當(dāng)然,克隆巴赫α系數(shù)克服了折半法的缺點,而且克隆巴赫α系數(shù)是目前比較認(rèn)可的信度評價指標(biāo)。但是,思考一個量表或者分量表僅給出一個α系數(shù)信度指標(biāo)可能會有不妥之處。因為,這樣可能存在有的題目因為信度很高而把部分信度很低的題目掩蓋了。考慮到這層原因,本研究提出了運用項目反應(yīng)理論中的信息量來代表信度的概念,并可以把信息量定義到每個題項以及被試上,從而結(jié)合前面經(jīng)典測量理論的分析方法來制定出量表更好的信度(參照標(biāo)準(zhǔn)前文已述)。更重要的是,它可以與經(jīng)典測量理論中能夠體現(xiàn)外在特性的方法進(jìn)行優(yōu)化組合,從而構(gòu)成內(nèi)外結(jié)合的范式,使量表可以具有更高的信效度。
對于我國體育科學(xué)量表編制的效度的檢驗,則基本都對結(jié)構(gòu)效度進(jìn)行了檢驗,內(nèi)容效度和效標(biāo)效度使用不一,這可能與它們的評價目的不一有關(guān)。但內(nèi)容效度和效標(biāo)效度,若有條件均應(yīng)該進(jìn)行驗證,因為,內(nèi)容效度、結(jié)構(gòu)效度以及關(guān)聯(lián)效度(效標(biāo)效度)對量表均具有參考價值。但是若在沒有很好的條件下,就應(yīng)該更加注重結(jié)構(gòu)效度的驗證,這是因為,若把它與內(nèi)容效度和效標(biāo)效度來進(jìn)行相比,它們是不會處于同一地位的,結(jié)構(gòu)效度作為一種廣泛的概念在一定程度上包括了其他的效度[9]。因此,本研究提出了更加優(yōu)化的方法組合來改善和驗證量表的結(jié)構(gòu)效度。具體的做法應(yīng)該是:對編制的量表運用結(jié)構(gòu)方程模型來檢驗,然后運用驗證性SSA來進(jìn)行驗證,并結(jié)合理論來探討哪些題項需重新界定,再結(jié)合結(jié)構(gòu)方程模型來最后對驗證性SSA之前的模型與之后改變的模型擬合度比較,從而確立最佳選擇。當(dāng)然,不同的量表編制對SSA模型以及指標(biāo)的評判標(biāo)準(zhǔn)會不一致,至于最終如何選擇,還需研究者自己來決定。
體育科學(xué)量表編制是體育科學(xué)研究中的一個重要分支,其科學(xué)性、規(guī)范性和精確性不僅影響到各種測量的準(zhǔn)確,更是彰顯著一種學(xué)科的發(fā)展水平,是每一位體育工作者對體育科學(xué)學(xué)科規(guī)范的一種追求。雖然,在這個道路上,大家可能缺乏統(tǒng)一的研究范式或結(jié)構(gòu),但對研究方法的不斷創(chuàng)新和追求應(yīng)該達(dá)成一種共識。研究中方法的使用也可能還存在這樣或那樣的誤區(qū),但它不能成為我們對方法追求的絆腳石。
體育科學(xué)量表編制在經(jīng)歷了經(jīng)典測量理論之后,勢必對概化理論和項目反應(yīng)理論有所應(yīng)用上的突破,經(jīng)典測量理論有著非常好的量化優(yōu)勢,但對樣本的追求過高,其完全的統(tǒng)計學(xué)意義也不一定符合特定領(lǐng)域的研究,尤其是體育這一特殊領(lǐng)域。而項目反應(yīng)理論在一定程度上對此進(jìn)行了彌補(bǔ),并且指向了測驗分?jǐn)?shù)的解釋階段,側(cè)重于測驗的精確度,從而使題項具有更優(yōu)的信度;層面理論則指向項目的編寫階段,側(cè)重于測驗的效度,從而使其具有更優(yōu)的內(nèi)容效度和結(jié)構(gòu)效度??上攵簩⑦@些理論結(jié)合起來優(yōu)化運用必將使體育量表的編制進(jìn)一步深入發(fā)展。因此,對新方法或理論的不斷追求應(yīng)成為我們每一位科研工作者的傳統(tǒng),讓我們的體育學(xué)科更加規(guī)范、有序發(fā)展。
[1]邊玉芳.警惕心理學(xué)研究中的統(tǒng)計誤用[J].心理科學(xué)進(jìn)展,2002,10(4):447-452.
[2]陳善平,潘秀剛,張平,等.大學(xué)生體育鍛煉效果自評量表(EEI)的編制和信效度檢驗[J].北京體育大學(xué)學(xué)報,2008,31(10):1404-1406.[3]金瑜.心理測量[M].上海:華東師范大學(xué)出版社,2001:209-216.[4][美]羅伯特·F·德威利斯.量表編制:理論與應(yīng)用[M].魏勇剛,龍長權(quán),宋武譯.重慶:重慶大學(xué)出版社,2004.
[5]劉電芝.教育與心理研究方法[M].重慶:西南師范大學(xué)出版社,2001.
[6]劉全,劉汀.基于項目反應(yīng)理論的社情民意調(diào)查問卷設(shè)計[J].統(tǒng)計與決策,2012,(10):29-32.[7]羅照盛.項目反應(yīng)理論基礎(chǔ)[M].北京:北京師范大學(xué)出版社,2012.[8]漆書青,戴海琦.項目反應(yīng)理論及其應(yīng)用研究[M].南昌:江西高校出版社,1992.
[9]漆書青.現(xiàn)代教育與心理測量學(xué)原理[M].北京:高等教育出版社,2002:262-275.
[10]史青.大學(xué)生體育課學(xué)習(xí)滿意度測查量表編制[J].體育學(xué)刊,2010,17(7):56-60.
[11]陶西平,張秀媛,李吉會.教育評價辭典[M].北京:北京師范大學(xué)出版社,1998.
[12]吳明隆.SPSS統(tǒng)計應(yīng)用實務(wù)[M].北京:中國鐵道出版社,2001.
[13]楊建原,臧運洪,趙守盈.應(yīng)用項目反應(yīng)理論對友誼質(zhì)量量表修定——以結(jié)構(gòu)方程、層面理論多種技術(shù)支持修定量表的質(zhì)量[J].心理學(xué)進(jìn)展,2011,(1):97-105.
[14]張力為.體育科學(xué)研究方法[M].北京:高等教育出版社,2002.[15]張力為.研究方法在制約我們的追求嗎?——閱讀《體育科學(xué)》2003年社會科學(xué)論文的聯(lián)想[J].體育科學(xué),2005,25(4):74-80.[16]趙必華,顧海根.心理量表編制中的若干問題及題解[J].心理科學(xué),2010,33(6):1467-1469.
[17]趙守盈,江新會.行為科學(xué)研究設(shè)計與理論構(gòu)建的一種重要策略——層面理論述評[J].貴州師范大學(xué)學(xué)報,2006,24(2):113-118.
[18]趙守盈,楊建原,臧運紅.基于多層面模型的教學(xué)效能感量表[J].心理科學(xué),2012,35(6):1484-1490.
[19]趙守盈,王艷,SAMUEL SHYE.層面理論的核心技術(shù)概念——映射語句[J].貴州師范大學(xué)學(xué)報,2010,28(3):41-45.
[20]DEVELLIS R F,BLALOCK S J,HOLT K D,etal.Arthritis patients’reactions to unavoidable social comparisons[J].Person Social Psycho Bulletin,1991,17(4):392-399.
[21]DONALD I,COOPER R.A facet approach to extending the normative component of the theory of reasoned action[J].Bri J Soc Psycho,2001,40(4):599-621.
[22]GUTTMAN L.Introduction to facet design and analysis[A].Proceedings of the Fifteenth International Congress of Psychology[C].Acta Psycho ,1959.
[23]GLENDA S,STUMP,JENEFER H,etal.The nursing student self-efficacy scale[J].Nurs Res,2012,61(3):149-158.
[24]GUTTMAN R,GREENBAUM C W.Facet theory:its development and current status [J].Eur Psycho,1998,3(1):13-36.
[25]HACKETT P,FOXALL G.Consumers’evaluation of an international airport:a facet theoretical approach[J].Int Rev Retail Distribut Consum Res,1997,7(4):339-349.
[26]HAMBLETON R K,JONES R W.Comparison of Classical Test Theory and Item Response Theory and Their Application to Test Development[J].Edu Measure Issue Practice,1993,12(3):38-47.
[27]HIDEYUKI T.Scale development for measuring junior high and high school students’ enjoyment,benefit,and psychological barrier for exercise by item response theory[J].Int J Sport Health Sci,2005,(3):129-141.
[28]HILDEBRANDT L.A facet theoretical approach for testing measurement and structural theories:an application of confirmatory MDS[J].Advances Consum Res,1986,13(1):523-528.
[29]HORNIK J.The facet design approach to the construction of multivariate marketing models[J].Eur J Market,2001,8(2):146-157.
[30]HOYT A L,RHODES R E,HAUSENBLAS H A,etal.Intergrating five-factor model facet-level traits with the theory of planned behavior and exercise[J].Psycho Sport Exe,2009,10(5):565-572.
[31]JAMES F F,ESWAR K,MATTHIAS R,etal.Improved responsiveness and reduced sample size requirements of PROMIS physical function scales with item response theory[J].Arth Res Therapy,2011,13(5):147-155.
[32]JOSHUA S A,ALEXANDER B,FRANK C W,et.al.An Analysis of Cross Racial Identity Scale Scores Using Classical Test Theory and Rasch Item Response Models[J].Measure Evaluat Counsel Develop,2012,46(2):136-153.
[33]KERN M L,FRIDMAN H S.Do conscientious individuals live longer:A quantitative review [J].Health Psycho,2008,27(5):505-512.
[34]LORD F M.Applications of item response theory to practical testing problems[M].Hillsdale,NJ:Lawrence Erlbaum Associates,1980.
[35]MANABE K.Applying facet theory to studies of Japanese society:verification of laws of human behavior[J].Soc Summary,2003,95(10):37-44.
[36]MASLOVATY N.Teachers’ perceptions structured thorough facet theory:smallest space analysis versus factor analysis[J].Edu Psycho Measure,2001,61(1):71-84.
[37]MASLOVATY N.The Placement of moral contents:priorities and structure of the belief system of teacher and high school students[J].Edu Res Evaluat,2003,9(1):109-134.
[38]NUNNALLY J C.Psychometric Theory(2nd Ed)[M].New York :McGraw-Hill,1978.
[39]RAPSON G.Item response theory analyses of adolescent self-ratings of the ADHD symptoms in the Disruptive Behavior Rating Scale[J].Personal Individual Differ,2012,53(8):963-968.
[40]REBHUN U.Jewish identity in America:Structural analysis of attitudes and behaviors[J].Rev Religious Res,2004,46(1):43-63.
[41]ROD,WARD R,etal.The search for meaning in nursing:could facet theory be a way forward [J].J Advance Nurs,1993,18(4):549-557.
[42]ROSE W,RUFINA W,CARMEN G,etal.Culturally Sensitive Depression Assessment for Chinese American Immigrants:Development of a Comprehensive Measure and a Screening Scale Using an Item Response Approach[J].Asian Am J Psycho,2012,3(4):230-253.
[43]SHYE S,ELIZUR D.Introduction to facet theory:Content design and intrinsic data analysis in behavioral research[M].Thousand Oaks CA:Sage,1994.
[44]SHYE S.On the search for laws in the behavioral sciences.Theory Construction and Data Analysis in the Behavioral Sciences[M].San Francisco:Jossey-Bass,1978.
[45]SYMONS D D,GRAHAM G M,YANG S,etal.Youth exercise intention and past exercise behavior:examining the moderating influences of sex and meeting exercise recommendations[J].Res Q Exe Sport,2006,77(1):91-99.
[46]THELMA J,MIELENZ MICHAEL CEDWARDS LEIGH,etal.Item-Response-Theory Analysis of two scales for self-efficacy for exercise behavior in people with arthritis[J].J Aging Physical Activity,2011,19(3):239-248.
[47]VAN D,LINDEN W J.Handboo of Modern Item Response Theory[M].New York:Springer,1996.
[48]VIRGINIA G,BORJA S,LUIS Y,etal.Depressive dimensions and item response analysis of the Hamilton Depression Rating Scale-17 in eating disorders[J].Compreh Psychiatry,2012,53(4):396-402.
DiscussiononSeveralMainProblemsinSportsScienceScaleConstruction——AThinkingonMethodsOptimization
DAI Jian-hui1,JIN Ya-hong2
scale;methodsoptimization;itemresponsetheory;facettheory
1000-677X(2014)03-0088-10
2013-11-14;
:2014-01-23
教育部人文社會科學(xué)研究規(guī)劃基金資助項目 (13YJA890004)。
戴儉慧(1967-),女,安徽宣城人,副教授,博士,碩士研究生導(dǎo)師,主要研究方向為體育科研方法學(xué)、社會體育學(xué)和體育社會學(xué),Tel:(0512)67162281,E-mail: sddjh@suda.edu.cn;金亞虹(1976-),女,上海人,教授,博士,碩士研究生導(dǎo)師,主要研究方向為體育科研方法學(xué)、運動與認(rèn)知,Tel:(022)23012331,E-mail:yahongking@hotmail.com。
1.蘇州大學(xué) 體育學(xué)院,江蘇 蘇州 215021;2.天津體育學(xué)院 健康與運動科學(xué)系,天津 300381 1.Soochow University,Suzhou 215021,China;2.Tianjin Institute of Sport,Tianjin 300381,China.
G804.8
:A