安徽師范大學(xué)體育學(xué)院(241002) 孫 影 方 敏
TPB量表運用于青少年鍛煉行為的測量不變性*
安徽師范大學(xué)體育學(xué)院(241002) 孫 影 方 敏△
目的檢驗計劃行為理論量表在青少年鍛煉行為研究中的有效性、可靠性和測量不變性。方法 1 292名中學(xué)生完成了鍛煉態(tài)度、主觀規(guī)范、行為控制感、意圖以及自陳鍛煉問卷的測量。采用驗證性因素分析和多組模型比較方法檢驗量表的因素效度、信度,以及跨性別和年級的測量不變性。結(jié)果 計劃行為理論具有滿意的因素效度和一致性信度;量表的跨性別和跨年級測量不變性基本得到認可。結(jié)論 計劃行為理論量表對青少年鍛煉行為的測量有著普遍適用性。未來研究應(yīng)檢驗計劃行為理論預(yù)測鍛煉行為的結(jié)構(gòu)模型等值性。
測量不變性 計劃行為理論 鍛煉行為
*:安徽省高校省級自然科學(xué)研究重點項目資助(KJ2011A147)
△通訊作者:方敏,E-mail:fangmin@mail.ahnu.edu.cn
測量不變性/等值性(measurement equivalence/invariance)是指同一量表施測于不同組群或時間點時測量參數(shù)保持相同,也就是說,當研究者利用一組測驗題目測得一個概念并應(yīng)用于組間的比較(如性別或年齡),研究者必須假設(shè)測驗分數(shù)的項目分數(shù)與尺度對不同的受試對象具有相同的意義。同一個測驗在不同的情境下應(yīng)用時,很可能會導(dǎo)致測量特性的改變。Cheung(1998)發(fā)現(xiàn)跨文化比較時,原始分數(shù)及潛在構(gòu)念分數(shù)計算出來的結(jié)果常不相同,以致衍生出許多爭議以及錯誤的結(jié)果推論〔1〕。經(jīng)典測量理論的研究基本表明,許多概念的組間差異或因果模式驗證都是基于觀測分數(shù)進行的,在觀測分數(shù)層面上的對等并不意味著測驗就具有相同的含義。因為,同一個測驗在不同組間測量的潛在結(jié)構(gòu)可能并不完全相同,潛在結(jié)構(gòu)之間以及其與測量項目之間的關(guān)系未必完全相同,測量的殘差變異也不一定完全相等?;诮?jīng)典測量理論的分析得到的對等性并不意味著潛變量以及潛變量和觀測變量之間關(guān)系的對等。因此,因素測量不變性在測驗發(fā)展的效度評價應(yīng)用上有相當重要的意義,因為一個測驗即使被證明有良好的信效度,并不能說明這些測驗題目與其所測得的潛在因素在不同的受試身上有相同的意義,此時,必須進行基于潛變量分析的測量不變性研究,即檢驗測量題目與所屬構(gòu)念之間的因素負荷量、變異數(shù)與共變量以及殘差變異量,在不同組群之間必須等值〔2〕。
計劃行為理論(theory of planned behavior,TPB)是從信息加工的角度,以期望價值理論為出發(fā)點解釋個體行為決策過程的理論。在國外TPB廣受行為研究者的青睞,它已被成功地應(yīng)用于多個行為領(lǐng)域。Armitage的元分析結(jié)果證明了TPB具有良好的解釋力和預(yù)測力〔3〕。運用TPB解釋和預(yù)測鍛煉行為也已得到大量研究支持,一項元分析證實了TPB在解釋鍛煉意圖和鍛煉行為的普遍適用性,強調(diào)TPB構(gòu)念對鍛煉意圖和行為的解釋效力的差異可能受到人口學(xué)因素的影響,如年齡、性別、種族等〔4〕。這樣,人口學(xué)因素可能造成的TPB量表測量是否具有不變性問題必須得到關(guān)注,這些問題包括TPB量表測量于不同群體是否具有相同的結(jié)構(gòu)型態(tài)、因素結(jié)構(gòu)、因素方差—協(xié)方差以及測量殘差。只有TPB測量等值性得到確認,才能明確TPB對特定群體鍛煉行為的解釋效力,這是制定干預(yù)計劃的前提。因此,本文主要目的是檢驗鍛煉TPB量表是否具有青少年群體的跨性別、跨年齡的測量不變性,探討TPB量表在青少年鍛煉行為測量的普適性。
采用整群分層抽樣方法,分別抽取省級示范、城市普通、農(nóng)村各2所高中學(xué)校,4所城市和1所農(nóng)村初級中學(xué)等11所學(xué)校的1 346名學(xué)生為測試對象,以班級為單位進行團體測試,最后獲取有效數(shù)據(jù)1 292份,其中高中688,初中604;男生580人,女生590人,22份數(shù)據(jù)性別信息缺失。年齡12~20歲。整個測試時間為2009年5月。
(1)TPB量表的預(yù)測驗
①測量工具 鍛煉TPB構(gòu)念的測量來源于Ajzen(2006)的 TPB 量表〔5〕,包括態(tài)度、主觀規(guī)范、行為控制感、意圖等4個分量表,共14個題項,項目采用7點評分。本研究鍛煉標準依美國運動醫(yī)學(xué)委員會(ACSM)推薦的鍛煉建議,將鍛煉定義為每次超過20分鐘,有明顯出汗和呼吸加快的課余時間體育活動。規(guī)律性鍛煉指每周3次或以上的鍛煉。
②研究步驟 在完成TPB英文量表的翻譯后,以1名體育心理學(xué)博士和1名英語言專業(yè)大學(xué)教師對翻譯本進行了校譯,確定TPB中文版。隨機抽取2所中學(xué)的188名中學(xué)生完成了預(yù)測試,使用SPSS 15和AMOS 17軟件對量表進行信、效度檢驗。
③預(yù)測結(jié)果 以態(tài)度、主觀規(guī)范、行為控制感、意圖和鍛煉行為等5個因素為潛變量,建立TPB一階相關(guān)測量模型。整體擬合評價方面,χ2/df=1.82<2.0,CFI=0.94,TLI=0.92,RMSEA=0.06,各項擬合指數(shù)均表明模型對數(shù)據(jù)的擬合較好。TPB各潛變量之間的相關(guān)系數(shù)介于0.44~0.84,模型中任兩個潛變量的受限模式與未受限模式的卡方差異值均有統(tǒng)計學(xué)意義(P<0.01),表明量表區(qū)別效度符合推薦標準〔6〕。模型各題項標準因素負荷在0.48~0.92之間,5個構(gòu)念的建構(gòu)信度在0.71~0.90之間,Cronbachα系數(shù)在0.70~0.89之間,反映模型各構(gòu)念具有良好的一致性信度。擬合結(jié)果支持了量表的有效性和可靠性,可作為正式測試問卷使用。
(2)正式測試工具 采用預(yù)測中文版TPB問卷。鍛煉態(tài)度量表由工具性和情感性態(tài)度測量構(gòu)成,包括2個工具性態(tài)度項目(有用的-無用的、明智的-愚蠢的),3個情感性態(tài)度項目(有趣的-厭煩的、放松的-緊張的、快樂的-痛苦的)。題干為“對我而言,未來兩周的規(guī)律性體育鍛煉將是……”。本次測量一致性系數(shù)α=0.74。主觀規(guī)范由3個項目構(gòu)成,例如,“許多人希望我參加規(guī)律性鍛煉”,本次測量α=0.70。行為控制感采用3個項目測量,例如,“今后兩周進行多少次鍛煉,完全由我決定”,本次測量α=0.76。鍛煉意圖由3個項目組成,例如,“今后兩周,我打算進行規(guī)律性鍛煉”,本次測量α=0.89。
采用驗證性因素分析的最大似然法估計模型擬合程度。χ2/df、RMSEA、CFI、TLI等擬合指標用來評價模型的擬合結(jié)果。CFI、TLI≥0.90,χ2/df< 5.0,RMSEA≤0.08,表示模型擬合可接受;CFI、TLI≥0.95,χ2/df<2.0,RMSEA≤0.05,表示模型擬合良好。采用卡方差異檢驗分析區(qū)別效度。建構(gòu)信度評價問卷一致性信度,接受的下限標準為0.6〔2〕。采用多組分析檢驗測量不變性〔7〕。由于測量等值性的檢驗是比較基線模型和嵌套模型的差異來實現(xiàn)的,對于等值性擬合度的評價,除了常用的擬合指數(shù),如 χ2、TLI、CFI、RMSEA外,還需反映模型之間差異的增量擬合指標。一個常用的比較指標是Δχ2,即χ2增量,其服從自由度為Δdf的分布。由于Δχ2值易受到樣本量的影響,在大樣本的情況下,即使模型和觀測矩陣擬合很好,Δχ2也容易有統(tǒng)計學(xué)意義,從而拒絕正確的理論模型。ΔCFI相對來說可以避免此問題,當ΔCFI<0.01時,表示模型組間具有等值性〔8,9〕。由于本研究屬大樣本研究,因此多組比較的差異主要通過ΔCFI評定,Δχ2指標僅列為參考。所有數(shù)據(jù)分析由AMOS 17.0程序運算完成。
以TPB的態(tài)度、主觀規(guī)范、行為控制感、意圖和鍛煉行為等5個構(gòu)念為潛變量,建立TPB一階相關(guān)測量模型。該模型在完全樣本組、男女生和高初中年級樣本組的擬合結(jié)果都比較理想(表1)。基本擬合評價顯示模式無違反估計問題。整體擬合評價方面,雖然χ2檢驗的 P <0.01,但是 CFI、TLI均大于0.90,RMSEA均小于0.07,表示數(shù)據(jù)接受測量模型擬合,說明模型具有較理想的結(jié)構(gòu)效度。TPB各構(gòu)念之間的相關(guān)系數(shù)在0.44~0.84之間,量表中任兩個因素的受限模式與未受限模式的卡方差異值皆大于3.84,均有統(tǒng)計學(xué)意義,表示該量表具有區(qū)別效度〔2〕。模型各題項標準因素負荷在0.48~0.92之間,5個構(gòu)念的建構(gòu)信度均大于0.7,反映模型各構(gòu)念具有良好的一致性信度。效度和信度的檢驗結(jié)果支持該測量模型的跨組測量結(jié)構(gòu)型態(tài)等同(基線模型)。
表1 TPB測量模型的擬合指數(shù)和建構(gòu)信度
性別比較的基線模型(模型1)評價結(jié)果,χ2/df=3.006,TLI=0.941、CFI=0.953、RMSEA=0.04,顯示模型的擬合程度良好。在基線模型基礎(chǔ)上進行因素負荷等值的檢驗(模型2),限定男女生兩樣本模型的觀察變量與其隸屬的潛變量之間的所有路徑系數(shù)相等,潛變量方差和各個觀測變量的殘差自由估計。Δχ2(12)=13.422,P=0.339 >0.05,ΔCFI=0.00,可以認為模型2的擬合和基線模型的擬合同樣好。從節(jié)儉原則考慮應(yīng)該接受簡潔的模型2,即因素負荷等值得到確認。在因素負荷相等的基礎(chǔ)上,限定男、女生樣本的潛變量方差—協(xié)方差相等得到等值模型3。模型3的擬合和模型2的擬合同樣好(表2),接受等價模型3。殘差矩陣等值是檢驗的最后一步。在模型3的基礎(chǔ)上限定兩樣本所有觀測變量的殘差方差相等,得到模型 4。ΔCFI=0.012 >0.01,Δχ2(17)=124.617,P<0.01,可以認為兩樣本測量殘差不等,拒絕模型4。
表2 TPB測量模型的跨性別、年級不變性檢驗
年級比較的基線模型評價結(jié)果,χ2/df=3.061,TLI=0.942、CFI=0.953、RMSEA=0.04,顯示模型的擬合度良好。各嵌套模型的比較中(表2),因素負荷、因素方差—協(xié)方差的跨年級測量不變性基本相等,而測量殘差的測量不變性被拒絕(Δχ2=118.498,df=17,P <0.01,ΔCFI=0.010)。
文章研究的主要目的是檢驗TPB量表在青少年鍛煉行為研究中的穩(wěn)定性和普遍適用性。驗證性因素分析顯示,所有的測量模型都得到各樣本數(shù)據(jù)的良好擬合,各樣本數(shù)據(jù)的擬合僅有較小的差異;多組分析顯示模型具有跨性別和年齡的測量不變性,這表明鍛煉TPB量表具有測量的有效性和普適性。
本研究的測量不變性檢驗主要由4項假設(shè)模式的分析與比較來進行:(1)型態(tài)等值,是指模型包含的潛在變量的數(shù)目以及觀察變量隸屬潛在變量的關(guān)系在不同群體中相同,這表明測量具有跨組的結(jié)構(gòu)等值性,意味著同一測量在不同組內(nèi)反映了類似的心理結(jié)構(gòu)。結(jié)構(gòu)型態(tài)等值性只要求潛變量、觀察變量之間的基本結(jié)構(gòu)關(guān)系對等,所有參數(shù)自由估計。結(jié)構(gòu)型態(tài)等值是測量等值性的前提條件,否則,量表無等值性可言。但是,即使有了相同的結(jié)構(gòu)也不意味著測量的結(jié)果就可以進行有意義的相互比較,因為測量指標對潛變量的重要性在不同組之間不一定相同,使得潛變量的含義未必一致。一旦結(jié)構(gòu)型態(tài)等值性得到確立,就可以繼續(xù)檢驗是否存在更為高級的因素負荷等值性。(2)因素負荷等值,指觀察變量與其隸屬的潛在變量之間的負荷在不同組中是相同的。如果成立則說明來自不同群體的潛變量得分相等的個體在相應(yīng)觀測變量上的得分也相等,這使得群體間的均值差異比較有意義。(3)因素方差-協(xié)方差等值,這個檢驗包含兩部分,潛變量在不同群體中是否具有相同的方差;當模型包含多個潛變量時,還要考慮潛變量協(xié)方差是否等值。(4)殘差方差等值,是指某一觀察變量的方差中不能由潛在變量解釋的部分,即測量殘差。殘差方差等值是指觀察變量在不同群體中的測量殘差是相同的,滿足這一條件,觀察變量在不同群體組具有相同的信度。
這4個水平的等值性檢驗屬于嵌套等值性檢驗,后一檢驗是在前一檢驗基礎(chǔ)上增加限制某些參數(shù)而形成的。在測量等值性檢驗中,型態(tài)等值模型常常被當作是檢驗的基線模型。如果接受基線模型擬合,則進行組間不同參數(shù)限制的嵌套模型比較決定取舍〔2,8〕。使用多組分析解決傳統(tǒng)以EFA來進行等值性的諸項問題,避免多次比較所帶來的I、II型錯誤,對于復(fù)雜的參數(shù)估計得以假設(shè)檢定的方式來進行。
本研究中,在完全樣本組和性別、年級樣本組的擬合結(jié)果表明,TPB測量模型具有較理想的信度和效度,意味著同一測量在不同組間反映了類似的心理結(jié)構(gòu),這為后續(xù)的嵌套模型比較提供了基線模型。性別和年級的測量不變性分析顯示,因素負荷不變性和因素方差-協(xié)方差不變性得到肯定,測量殘差不變性遭到拒絕。這一結(jié)果意味著同一測量在不同組內(nèi)反映了相同的心理結(jié)構(gòu),每一個項目與對應(yīng)的潛變量之間都具有對等的關(guān)系,具有完全對等的單位和同樣的測量起點,也就是說測驗分數(shù)每一個單位的變化在性別組群間、年級組群間有著相同的含義,測驗分數(shù)可以進行直接的比較,觀測分數(shù)的跨組差異可以反應(yīng)對應(yīng)的潛變量之間的差異。
本研究對TPB量表的4個水平等值性都進行了檢驗,理想的情況應(yīng)該是在4個水平上都具有完全等值性。但是,在實際應(yīng)用中,未必需要測驗滿足全部的等值性要求,具體要視研究的目的和要求而定。關(guān)于組間測量等值性的檢驗,研究者比較關(guān)注因素負荷量、因素的方差-協(xié)方差是否等值,至于測量殘差等值,則因要求過于苛刻較少被涉及。這是因為,多數(shù)的研究只需要進行模式內(nèi)的比較,少數(shù)進行均數(shù)的跨組差異檢驗,極少需要對分數(shù)的變異進行跨組的比較。
1.Cheung GW,Rensvold RB.Cross-cultural comparisons using non-invariantmeasurement items.Applied Behavioral Science Review,1998,6(1):93-110.
2.李茂能.結(jié)構(gòu)方程模式軟體AMOS之簡介及其在測驗編制上之應(yīng)用.臺北:心理出版社,2007.
3.Arm itage CJ,Conner M.Efficacy of the theory of planned behavior:A meta-analytic review.British Journal of Social Psychology,2001,40(4):471-499.
4.Hagger MS.Chatzisarantis NLD,Biddle SJH.A meta-analytic review of the theories of reasoned action and planned behavior in physical activity:predictive validity and the contribution of additional variables.Journal of Sport& Exercise Psychology,2002,24(1):3-32.
5.Ajzen I.TPB measurement:Conceptual and methodological considerations.Available from:http://www.people.umass.edu/aizen/pdf/tpb.measurement.pdf.2006.
6.黃芳銘,楊金寶,許福生.在學(xué)青少年生活痛苦指標發(fā)展之研究.臺灣師大學(xué)報,2005,50(2):97-119.
7.Arbuckle JL.Amos 7.0 user’s guide.Spring House,PA:Amos Development Corporation,2006.
8.Cheung GW,Rensvold RB.Evaluating goodness-of-fit indexes for testing measurement invariance.Structural Equation Modeling,2002,9(2):233-255.
9.Chen FF.Sensitivity of Goodness of Fit Indexes to Lack of Measurement Invariance.Structural equation modeling,2007,14(3):464-504.
M easurement Invariance of the Theory of Planned Behavior Scale in Exercise Behavior of Adolescents
SunYing,F(xiàn)angMin.CollegeofPhysicalEducation,AnhuiNormalUniversity(241002),Wuhu
Objective The present study tested the validity,reliability and measurement invariance of the theory of planned behavior scale among adolescents in a physical activity context.Methods 1 292 students completed measures of attitudes,subjective norms,perceived behavioral control,intentions for physical activity,and self-report measures of physical activity behavior.Measurement invariance was evaluated for gender and grade using Multi-group Analysis.ResultsThe construct validity of TPB measurement models was tested using confirmatory factor analysis with full-information maximum likelihood estimation.Results showed that measurement model of the scale adequately fit the data for the entire sample and sub-samples with minimal variations,and provided sufficient evidence of factorial validity and consistency reliability.The tests in multi-group indicated that invariance of factor structure,factor loadings,variance-covariance matrices,and measurement residuals for the TPB measures.ConclusionFindings supported the generaliza bility of the measures for the TPB among adolescents in a physical activity context.Future research should examine the measurement invariance of structural model for the TPB constructs across groups.
Measurement invariance;Theory of planned behavior;Exercise behavior