亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

中國青少年社會與情感能力測評之技術(shù)報告＊

2021-08-24 01:04:34唐一鵬郭家俊邵志芳

華東師范大學(xué)學(xué)報(教育科學(xué)版) 2021年9期

張靜唐一鵬郭家俊邵志芳

（1. 華東師范大學(xué)教育學(xué)部教育心理學(xué)系，上海 200062；2. 華東師范大學(xué)教育學(xué)部教育學(xué)系，上海 200062；3. 華東師范大學(xué)心理與認知科學(xué)學(xué)院，上海 200062）

2019年，經(jīng)濟合作與發(fā)展組織（Organisation for Economic Co-operation and Development，簡稱OECD）在世界范圍內(nèi)開展了青少年社會與情感能力研究（Study of Social and Emotional Skills），共有9個國家的10個城市參與了此次大規(guī)模國際測評項目。該研究的目標(biāo)是測評各個國家（或城市）青少年社會與情感能力的發(fā)展水平，分析影響青少年社會與情感能力發(fā)展的家庭、學(xué)校和社區(qū)因素，預(yù)測社會與情感能力對學(xué)生健康、幸福感等生活結(jié)果的重要作用，從而為決策者、管理者與廣大中小學(xué)教師提供啟示和改革建議。

蘇州市下轄的6個區(qū)和4個縣級市共151所中小學(xué)校的7268名學(xué)生參與此次測評項目，包括3647名10歲和3621名15歲學(xué)生。作為中國經(jīng)濟、文化和教育的發(fā)達地區(qū)之一，蘇州的測試結(jié)果及其揭示的問題帶有指向意義，對中國進一步深化素質(zhì)教育也具有借鑒價值。

一、OECD社會與情感能力測評工具

（一）OECD社會與情感能力測評框架

OECD社會與情感能力研究借鑒“大五人格”模型（Big Five Model），建構(gòu)社會與情感能力的測評框架。此框架主要分為五大維度：任務(wù)能力（盡責(zé)性）、情緒調(diào)節(jié)（情緒穩(wěn)定性）、協(xié)作能力（宜人性）、開放能力（開放性）和交往能力（外向性）。雖然這五個維度源自大五人格理論，但是又有發(fā)展，它們體現(xiàn)了人對社會情境的適應(yīng)能力。每個維度又確立了三項子能力，任務(wù)能力對應(yīng)大五人格的盡責(zé)性，包括自控力、責(zé)任感和毅力；情緒調(diào)節(jié)對應(yīng)大五人格的情緒穩(wěn)定性，包括抗壓力、樂觀和情緒控制；協(xié)作能力對應(yīng)大五人格的宜人性，包括共情、合作與信任；開放能力對應(yīng)大五人格的開放性，包括好奇心、創(chuàng)造性和包容度；交往能力對應(yīng)大五人格的外向性，包括活力、果敢和樂群。表1呈現(xiàn)了正式測評中包含的五大維度和15項子能力。

表1 社會與情感能力的測評框架（5個維度和15個子能力）

（二）OECD社會與情感能力測評工具概覽

社會與情感能力測評項目主要包括四類測評問卷：（1）學(xué)生調(diào)查問卷主要涵蓋學(xué)生對其社會與情感能力的自我測評，但也包含有關(guān)學(xué)生學(xué)校和家庭環(huán)境的題項。（2）家長調(diào)查問卷包括有關(guān)孩子的社會與情感能力、孩子的成長背景、家庭環(huán)境以及家長的社會和情感能力等問題。（3）教師調(diào)查問卷收集教師對學(xué)生社會與情感能力的測評以及教師關(guān)于學(xué)校學(xué)習(xí)環(huán)境的報告。（4）校長調(diào)查問卷涵蓋學(xué)校及其學(xué)生的更廣泛的社會背景，以及旨在改善學(xué)習(xí)環(huán)境的學(xué)?，F(xiàn)有的資源和計劃。具體而言，2019 OECD社會與情感能力正式測評為蘇州測評現(xiàn)場提供了7份在線測評問卷。有兩份學(xué)生問卷調(diào)查，一份針對10歲組，另一份針對15歲組。兩個年齡組的父母問卷調(diào)查是相同的。教師問卷包括兩個部分。第一部分由兩個年齡組的教師完成，包括教師問卷調(diào)查和輔測定錨題。每位參與的教師都完成這一部分。第二部分包括兩個版本，一個針對10歲組，另外一個針對15歲組。教師被要求為每個“他/她最了解”的學(xué)生完成這一部分。兩個年齡組的主要問卷調(diào)查是相同的。表2列出了OECD社會與情感能力研究所使用的問卷調(diào)查信息。

表2 OECD社會與情感能力研究所使用的問卷調(diào)查

二、OECD社會與情感能力測評工具的測量學(xué)分析

在經(jīng)過2017年的題項篩選、2018年的現(xiàn)場測試后，結(jié)合2019年的正式測試結(jié)果，OECD的社會與情感能力的正式測評最終確定學(xué)生問卷包含65個問題（15歲組有68個問題）；家長問卷包含53個問題；教師問卷包含34個問題；校長問卷包括32個問題。其中學(xué)生直接和家長間接評估社會與情感量表中，每項社會與情感能力各有8個題項，共90個題項。教師間接評估量表中，每項社會與情感能力各有3個題項，共45個題項。值得注意的是，OECD綜合所有參與國家或城市的數(shù)據(jù)分析后刪減有些不太符合測量學(xué)標(biāo)準(zhǔn)的題項，表3呈現(xiàn)了學(xué)生直接評估和家長間接評估量表中各項社會與情感能力的刪減題項。為了保持國際標(biāo)準(zhǔn)，本部分沿用OECD 2019社會與情感能力研究最終篩選后的各子能力測評題項分別進行測量學(xué)分析。

表3 學(xué)生和家長量表中15項社會與情感能力測評題項的刪減

表4列出使用的主要分析類型及其相應(yīng)的測量學(xué)指標(biāo)。在適用的情況下，這些分析是在分組水平上進行的，包括按年齡進行分析。由于進行了大量的分析，本報告這一部分的結(jié)果僅包含部分發(fā)現(xiàn)，以突出相關(guān)問題?？傮w來看，15項社會與情感能力測評工具在中國文化背景下的信效度符合測量學(xué)標(biāo)準(zhǔn)。

表4 本報告中使用的測量學(xué)指標(biāo)

（一）信度分析

表5和表6分別列出了根據(jù)學(xué)生自評和家長間接評估數(shù)據(jù)估計的15項社會與情感能力量表的信度，主要包括Alpha系數(shù)α（Cronbach，1951）和Omega系數(shù)Ω（McDonald，2013）。可以看出，無論是總體數(shù)據(jù)，還是基于10歲組或15歲組數(shù)據(jù)，學(xué)生和家長問卷調(diào)查中所有15項社會與情感能力各子量表的信度都相對不錯（Alpha和Omega系數(shù)均高于0.70）。而且相對于10歲組學(xué)生，根據(jù)15歲組學(xué)生自評和其家長間接評估數(shù)據(jù)估計的量表信度要好。

表5 15項社會與情感能力的信度系數(shù)（學(xué)生自評量表）

表6 15項社會與情感能力的信度系數(shù)（家長間接評估量表）

表7顯示了15項社會與情感能力量表中，教師對學(xué)生間接評估數(shù)據(jù)的量表信度。由于每個量表只有三個項目，因此預(yù)計信度低于根據(jù)學(xué)生和家長評估數(shù)據(jù)估計的信度，尤其是活力與自控力量表的信度比較低（Alpha和Omega系數(shù)均低于0.70）。然而，有一些量表的信度非常高，如毅力量表約為0.90。根據(jù)教師數(shù)據(jù)估計的量表信度在10歲和15歲組中差別不大。

表7 15項社會與情感能力的信度系數(shù)（教師間接評估量表）

（二）結(jié)構(gòu)效度：驗證性因子分析

為了進一步檢驗學(xué)生直接評估、家長和教師間接評估15項社會與情感能力測評工具的結(jié)構(gòu)效度，本部分采用Mplus7.4（Muthén & Muthén，1998—2017）分別基于總體學(xué)生樣本、10歲和15歲組學(xué)生子樣本對這些測評工具進行驗證性因子分析（Confirmatory Factor Analysis，簡稱CFA）分析。CFA的基本思想在于將所有的測量項（即所有因子對應(yīng)的測量量表題項）放在一個因子里面，然后進行分析。為了保持國際標(biāo)準(zhǔn)，本部分沿用OECD組織基于所有參與2019社會與情感能力測評項目的國家或城市數(shù)據(jù)分析，最終篩選后的各子能力測評題目分別進行CFA分析（參見表3）。

判斷各測量模型是否達到心理測量學(xué)可接受標(biāo)準(zhǔn)，主要依據(jù)卡方自由度比、RMSEA、SRMR、CFI等不太受樣本大小影響的指標(biāo)。如表4所示，若CFI（比較擬合指數(shù)）大于0.90，RMSEA（近似誤差均方根）小于0.08，SRMR（標(biāo)準(zhǔn)化殘差均方根）小于0.06，則模型擬合良好（Beauducel & Wittmann，2005；Heene，Hilbert，Draxler，Ziegler，& Bühner，2011；Hu & Bentler，1999）。如果測量模型擬合指標(biāo)無法達標(biāo)，即說明所有的測量項并不應(yīng)該同屬于一個因子。此時，可考慮根據(jù)模型修正指數(shù)（Model Indices，MI）修正模型直到上述各個指數(shù)達到可接受水平。如果因子與測量題項間的載荷系數(shù)低于0.40，也可考慮刪除某測量項。

（1）學(xué)生直接評估量表

對于學(xué)生直接評估數(shù)據(jù)，表8、表9和表10分別呈現(xiàn)基于總體學(xué)生樣本、10歲和15歲組學(xué)生子樣本所有15項社會與情感能力的CFA模型各擬合指標(biāo)信息。結(jié)果顯示，最終量表的測量模型幾乎所有指標(biāo)都達到了測量學(xué)可接受水平，表明模型擬合良好，而且標(biāo)準(zhǔn)化因子載荷系數(shù)（各因子與測量項之間的系數(shù)）均大于0.40，說明每項社會與情感能力與其相對應(yīng)的所有測量項之間有著良好的對應(yīng)關(guān)系，結(jié)構(gòu)效度好。對于10歲組的學(xué)生數(shù)據(jù)，活力這一能力的測量模型指標(biāo) CFI = 0.890，略小于0.90，模型擬合度一般。而對于15歲組的學(xué)生數(shù)據(jù)，好奇心和情緒控制兩個能力的測量模型擬合度一般。根據(jù)模型修正指數(shù)顯示，自由估計好奇心的第2題和第6題的誤差方差相關(guān)系數(shù)，以及情緒控制的第3題和第8題的誤差方差相關(guān)系數(shù)之后，這兩種能力的測量模型擬合度良好。

表8 15項社會與情感能力測量模型擬合指標(biāo)信息（總樣本）

表9 15項社會與情感能力測量模型擬合指標(biāo)信息（10歲組）

表10 15項社會與情感能力測量模型擬合指標(biāo)信息（15歲組）

續(xù)表10

（2）家長間接評估量表

對于家長間接評估數(shù)據(jù)，表11、表12和表13分別列出了基于總體學(xué)生樣本、10歲和15歲組學(xué)生子樣本15種社會與情感能力的CFA模型各擬合指標(biāo)信息。最終量表的測量模型幾乎所有指標(biāo)都達到了測量學(xué)可接受水平，表明模型擬合良好，而且標(biāo)準(zhǔn)化因子載荷系數(shù)（各因子與測量項之間的系數(shù)）均大于0.40，說明每種社會與情感能力與其相對應(yīng)的所有測量項之間有著良好的對應(yīng)關(guān)系，結(jié)構(gòu)效度好。與學(xué)生直接評估數(shù)據(jù)一致，對于家長間接評估10歲年齡組的數(shù)據(jù)，活力這一能力的測量模型指標(biāo)CFI = 0.890，略小于0.90，模型擬合度一般。對于家長間接評估10歲和15歲年齡組的數(shù)據(jù)，情緒控制和責(zé)任感能力的測量模型擬合度一般。根據(jù)模型修正指數(shù)顯示，自由估計情緒控制的第2題和第4題的，以及責(zé)任感的第5題和第6題的誤差方差相關(guān)系數(shù)之后，其測量模型的擬合度明顯提高，均達到可接受水平。

表11 15項社會與情感能力測量模型擬合指標(biāo)信息（總樣本）

表12 15項社會與情感能力測量模型擬合指標(biāo)信息（10歲組）

續(xù)表12

表13 15項社會與情感能力測量模型擬合指標(biāo)信息（15歲組）

（3）教師間接評估量表

不同于學(xué)生直接評估和家長間接評估量表，教師間接評估量表中每一項社會與情感能力各有3個測量題項，共45個題目，由最熟悉學(xué)生的教師來完成。驗證性因子分析理論上要求每個因子至少有三個測量題項，因此，教師間接評估量表中每一項能力的測量模型都有且只有三個題項，是一個飽和模型。這些模型的自由度為零，CFI = 1.00，RMSEA = 0.00，SRMR = 0.00（Brown，2006）。

（三）測量等值性檢驗：多組CFA

如前所述，OECD社會與情感能力測評項目主要抽取10歲和15歲年齡組學(xué)生參加，要比較不同年齡組或同一年齡組不同性別學(xué)生社會與情感能力的發(fā)展水平差異，首先要確保15項社會與情感能力的組間年齡和性別比較具有真實性和有效性。因此，社會與情感能力的測評工具必須具備跨年齡和跨性別測量等值性，這是組間比較的前提條件（French & Finch，2006）。

具體而言，我們使用Mplus7.4對每項社會與情感能力量表進行了三種測量等值檢驗：形態(tài)等值（無約束）、弱等值（因子載荷等值）和強等值（因子載荷和截距等值）。至少在滿足強等值之后，組間比較才真實有效（Chen，2007；Cheung & Rensvold，2002）。一般來說，模型擬合度會隨著模型約束的增加而降低，因為模型中約束越多，說明組間差異的空間就越小。為了判斷測量等值的程度，除了每個模型的整體擬合外，還可以查看模型擬合的相對變化。

表14列出了模型擬合指數(shù)以及這些統(tǒng)計數(shù)據(jù)在不同模型約束條件下的變化，這些指數(shù)變化用于評估測量模型等值水平。一般認為，當(dāng) RMSEA≤0.08，CFI≥0.90以及SRMR≤0.06 時，模型達到較好的擬合水平（Satorra & Bentler，2001；Hu & Bentler，1999）。值得注意的是，卡方檢驗受樣本量影響明顯，隨著樣本量增大，即使很小的差異也可能會得到差異顯著的結(jié)果，因此采用模型擬合指數(shù)CFI和RMESA的差異（即Δ CFI和ΔRMESA）來評估測量等值性（Chen，2007；OECD，2019）。當(dāng)ΔCFI<0.01 或ΔRMESA<0.015時，表明兩個嵌套模型不存在顯著差異，即認為模型等值可接受（王孟成，2014）。值得注意的是，用靜態(tài)臨界水平確定測量等值水平是不合適的，因為擬合指數(shù)只是指示性的，沒有科學(xué)確定的接受或不接受標(biāo)準(zhǔn)。然而，當(dāng)進行跨組差異比較（不同性別或不同年齡組）得出結(jié)論時，應(yīng)記住量表測量等值性水平，以避免錯誤解讀研究結(jié)果。

表14 測量等值模型擬合指數(shù)信息

（1）跨年齡組測量等值檢驗

運用多組驗證性因子分析分別檢驗15項社會與情感能力量表在10歲和15歲年齡組的測量等值性，結(jié)果如表15所示。首先檢驗形態(tài)等值，即檢驗潛變量的構(gòu)成形態(tài)是否相同，同時也為下一步檢驗設(shè)定基線模型。在形態(tài)等值檢驗中，允許各種參數(shù)自由估計，得到的擬合指數(shù)見表15的M1。各擬合指數(shù)均達到心理測量學(xué)要求，形態(tài)等值成立，形態(tài)等值模型可以作為下一步檢驗的基線模型。在基線模型 M1的基礎(chǔ)上進行弱等值，即檢驗同一題項在不同年齡組載荷等值。年齡弱等值檢驗的擬合結(jié)果（見表15的 M2）顯示ΔRMSEA≤0.015，ΔSRMR≤0.030，或 ΔCFI≤0.01，這一結(jié)果支持各量表對應(yīng)題項的因子載荷跨年齡組等值，即弱等值成立。在此基礎(chǔ)上檢驗強等值，分別設(shè)定每個指標(biāo)在10歲和15歲兩個年齡組別的截距等值。跨年齡組強等值檢驗的擬合結(jié)果（見表15的M3）ΔRMSEA≤0.015，ΔSRMR≤0.030，或 ΔCFI≤0.01，這些結(jié)果說明了各題項跨年齡組的截距等值成立，即強等值成立。然而對于好奇心、樂觀、樂群和包容度四項能力，有些題項的截距在10歲和15歲兩個年齡組是不等的。自由估計好奇心的第6題，樂觀的第5題，樂群的第4和第5題，以及包容度的第3題的截距之后，模型擬合指標(biāo)均達到可接受水平，所以部分強等值成立。

表15 15項社會與情感能力跨年齡組測量等值模型擬合信息

續(xù)表15

（2）跨性別測量等值檢驗

多組驗證性因子分析結(jié)果表明15項社會與情感能力量表分別在總體學(xué)生樣本、10歲和15歲組學(xué)生子樣本中具備跨性別測量等值性，結(jié)果如表16到表18所示。在形態(tài)等值檢驗中，允許各種參數(shù)自由估計，得到的模型擬合很好（RMSEA≤0.08，CFI≥0.90以及SRMR≤0.06），形態(tài)等值成立（見表16-18的 M1）。當(dāng)設(shè)定同一題項在男女樣本中的因子載荷相等（弱等值，見表16-18的 M2）后，嵌套模型比較分析發(fā)現(xiàn)兩模型差異不顯著（指標(biāo)變化參見表14），從簡約原則考慮應(yīng)接受簡潔模型M2，即弱等值成立。進一步設(shè)定每個題項在男女樣本中的截距相等（強等值見表16-18的M3），模型擬合指數(shù)變化不顯著，強等值成立。然而對于15歲年齡組，模型修正指數(shù)顯示活力的第5題在男女中的截距不相等，允許自由估計之后，模型擬合指標(biāo)均達到可接受水平，活力的部分強等值成立。

表16 15項社會與情感能力跨性別測量等值模型擬合信息（總樣本）

續(xù)表16

表17 15項社會與情感能力的跨性別測量等值模型（10歲組）

續(xù)表17

表18 15項跨性別測量等值模型分析（15歲組）

續(xù)表18

上述分析表明，15項社會與情感能力量表不僅在10歲和15歲組學(xué)生樣本中跨年齡等值，而且分別在總體樣本、10歲和15歲組學(xué)生子樣本中男女跨性別等值，從而確保這些能力的跨年齡和跨性別比較真實有效。

（四）項目反應(yīng)理論模型

OECD社會與情感能力研究的目標(biāo)是為了考察10歲和15歲組學(xué)生在社會與情感能力上的表現(xiàn)。由于這些社會與情感能力屬于個人特質(zhì)（personal traits），是無法直接觀察到的潛在結(jié)構(gòu)（latent constructs），因此必須根據(jù)被試對一組題項（item）的回答來估計這些深層的心理結(jié)構(gòu)。與OECD開展的其他大規(guī)模國際測評所不同的是，OECD對于社會與情感能力的測量基于學(xué)生-家長-教師“三角互證”（triangulation）的模式來進行（Kankara? et al.，2019），即在傳統(tǒng)的學(xué)生自評之外，加上家長和教師對學(xué)生社會與情感能力的間接評價。在正式測評中，三方評價都通過相應(yīng)的社會與情感能力量表來進行，一共包括15個單項能力測評（也即15個基本量表），其中學(xué)生和家長采用的量表完全相同，每項能力都采用8道題來進行測量。考慮到一名教師要同時評價多名學(xué)生，故而教師問卷中每項能力只在8道題中選取3道。正是由于學(xué)生、家長測評和教師測評之間的題量差別，所以O(shè)ECD在計算各項能力得分時，也采用了不同的思路。對于學(xué)生自評和家長評價，OECD基于項目反映理論（Iterm Reponse Theory，簡稱IRT），使用ConQuest 4 軟件來估計（Adams，Wu，& Wilson，2015），經(jīng)過刪減題目和多次測量學(xué)校正，得到跨國可比的標(biāo)準(zhǔn)化分數(shù)。對于教師評價，OECD則簡單計算了每個基本量表中3道題目的平均分數(shù)，將其作為該單項能力的得分，而且沒有再進行其他測量學(xué)的校正。

基于學(xué)生和家長測評數(shù)據(jù)的最終能力值要通過賦分、模型估計、反應(yīng)風(fēng)格校正、標(biāo)準(zhǔn)化這四個步驟來實現(xiàn)。首先，OECD需要對題項（item）的原始選項（response）進行賦分（0—4分）；其次，利用IRT中的廣義分步計分模型（Generalized Partial Credit Model，簡稱GPCM）對合并樣本（所有城市的10歲組和15歲組學(xué)生）進行參數(shù)估計，并基于加權(quán)似然估計（Weighted Likelihood Estimate，簡稱WLE）算法獲得能力初始值；再次，校正默認反應(yīng)風(fēng)格（Acquiescence Response Style）所帶來的估計偏誤，獲得能力校正值；最后，將能力校正值通過線性變換轉(zhuǎn)化為均值500分（所有城市10歲組均值）、標(biāo)準(zhǔn)差100分（所有城市10歲組標(biāo)準(zhǔn)差）的標(biāo)準(zhǔn)分，也即最終能力值。

（1）原始量表的賦分

社會與情感能力量表是5點計分的李克特量表，在利用IRT模型進行處理之前，需要先行對學(xué)生和家長評價的結(jié)果進行賦分，將量表項目的五個選項轉(zhuǎn)化為具體分值（表19）。從下表中可以看出，對于正向題，1—5選項被賦值成為0—4分，而對于反向題，則進行相反賦分。

表19 項目分數(shù)設(shè)定

（2）GPCM模型與初始值估計

OECD社會與情感能力研究基于IRT理論來估計學(xué)生自評和家長評價的各項社會與情感能力的得分，具體采用的是GPCM模型（Muraki，1992）。GPCM模型是一個概率模型，用于處理分步計分類型的題項，或者稱為有序多分類（ordered polytomous）題項。OECD社會與情感能力研究中的所有題項都采用5點計分的李克特量表，從“非常不同意”到“非常同意”。每個題項都有多個選項。對于具有mi個類別的題項i，GPCM模型采用下面式子來定義個體在特定題項中選擇某個選項的概率：

此處，P(xi|θ,βi,αi,τi)表示第n個被試在第i個題項上得到分數(shù)xi的概率； θn是第n個被試的潛在特質(zhì)的估計值； αi是第i個題項的區(qū)分參數(shù)（discrimination parameter）；δi是表示第i個題項在潛在連續(xù)統(tǒng)（latent continuum）上的位置參數(shù)（location parameter）； τij是一個表示第i個題項的第j個步驟的參數(shù)。

通過GPCM模型的估計并獲得模型中所示參數(shù)的基礎(chǔ)上，可以計算能力初始值，OECD社會與情感能力研究選擇生成基于加權(quán)似然估計（WLE）算法的初始估計值（Warm，1989）。在上述GPCM模型的估計過程中需要使用綜合權(quán)重（senate weight），學(xué)生綜合權(quán)重依據(jù)學(xué)生最終權(quán)重（WT2019）計算得到，而家長綜合權(quán)重依據(jù)家長最終權(quán)重（WT2019_PA）計算得到。通過綜合權(quán)重的使用，可以確保參與本次研究的所有城市都具有相同的代表性（即每個城市加權(quán)后的測評人數(shù)都為3000人）。

（3）初始值的ARS校正

反應(yīng)風(fēng)格（Response Style）是指被試回答問卷時不以題目實際內(nèi)容為依據(jù)的一種系統(tǒng)性行為傾向（郭慶科，2007）。比如，對于同一類型的題目，某一被試都傾向于選擇“4-同意”，而忽略了題目本身所包含的具體信息。反應(yīng)風(fēng)格的存在會引起共同方法偏差，并造成系統(tǒng)的測量誤差。對于反應(yīng)風(fēng)格造成的測量偏差，可以采用的方法主要有計數(shù)法和模型法兩大類（張纓斌，王燁暉，2019）。OECD社會與情感能力研究采用了正、反向計分題配對法，從15項能力的量表中挑選了25對正、反向計分題，并用如下公式計算其默認肯定集（acquiescence response sets，ARS）：

利用上述公式得到每個被試的ARS，可以對WLE初始值進行默認反應(yīng)校正（也稱為ARS校正），以減少由于默認反應(yīng)風(fēng)格帶來的測量偏誤。ARS校正利用ARS對WLE初始值的線性回歸系數(shù)，估計兩者之間的線性關(guān)系，再利用此種線性關(guān)系估計含有ARS偏誤的WLE初始值分數(shù)，并將其從WLE初始值中減去。具體地，首先用線性回歸模型估計WLE分數(shù)與ARS之間的線性關(guān)系，獲得參數(shù)a、b，也即：

然后，利用參數(shù)a、b得到含有ARS偏誤后的WLE分數(shù)，也即：

最后，將初始估計值減去含有ARS偏誤的估計值，得到ARS校正后的WLE估計值（即校正值）：

WLEscoreAdjusted=WLEscore?WLEscoreARS

（4）校正值的標(biāo)準(zhǔn)化

WLE初始值和ARS校正值都是分對數(shù)形式（logit metric），不便于用來直接呈現(xiàn)各項能力值，因此需要進行標(biāo)準(zhǔn)化轉(zhuǎn)換。與PISA類似，OECD社會與情感能力研究選擇將各項能力值轉(zhuǎn)化為一個均值500分，標(biāo)準(zhǔn)差100分的標(biāo)準(zhǔn)化分數(shù)。具體公式如下：

在標(biāo)準(zhǔn)化的過程中，10歲組的均值和標(biāo)準(zhǔn)差被作為參照，以確保均值（500分）對應(yīng)著10歲組的平均水平，即超過500分表明高于10歲組的均值，而低于500分則相反。值得注意的是，對10歲組的均值和標(biāo)準(zhǔn)差的計算，都需要使用學(xué)生綜合權(quán)重，以確保計算結(jié)果對所有城市都具有相同的代表性。

在經(jīng)過上一步標(biāo)準(zhǔn)化之后，還需要進行一次中間值（mid-points）校正。中間值校正的目的在于，使得均值500分所對應(yīng)的平均選項為中間選項（3-一般）。在所有被試中，有一類被試傾向于做出中間選擇（mid-point），將這部分被試的平均能力值進行計算得到SSm。然后，從500中減去SSm，再將其差值加到上一步標(biāo)準(zhǔn)化能力值SSn中，就獲得了如下式所示最終能力值：

FinalScoren=SSn+(500?SSm)

（5）單項能力值的整體結(jié)果

表20—21中分別呈現(xiàn)了根據(jù)學(xué)生、家長、教師數(shù)據(jù)得到的各項能力值的均值和標(biāo)準(zhǔn)差。總體而言，在同一年齡組內(nèi)，學(xué)生自評的能力值較高，而家長評價的能力值較低，尤其在10歲組階段最為明顯。不同年齡組相比較而言，學(xué)生自評的結(jié)果中，10歲組在各項能力上的得分要普遍高于15歲組，但是基于家長和教師評價的結(jié)果，15歲組在部分能力上的得分要高于10歲組。

表20 單項能力的均值與標(biāo)準(zhǔn)差（學(xué)生自評與家長間接評估）

表21 單項能力的均值與標(biāo)準(zhǔn)差（教師間接評估）