婁驥盧莎
摘要由于量表的整體性、測評時間過長、測評理論的局限性等因素,傳統(tǒng)的測評方式的精確性和效率往往不盡如人意,在大規(guī)模心理測評中已被逐步淘汰。研發(fā)精確、高效的測評工具已成為大規(guī)模心理測評的當務之急。通過以維度為單位組成測評問卷、應用IRT理論篩選高質量的測評題目、采用CAT的測評方法等途徑對測評工具進行更新,即可在很大程度上提高測評效率。
關鍵詞大規(guī)模心理測評;傳統(tǒng)測評的局限;高質量題目;測評方法
分類號B841
1大規(guī)模心理測評適應現(xiàn)代測評的發(fā)展需求
隨著心理學在國內的發(fā)展,心理學的兩大分支:心理咨詢和心理測評在國內得到了比較廣泛的應用。心理測評的應用主要體現(xiàn)在大規(guī)模心理測評和輔助心理咨詢兩方面。大規(guī)模心理測評是對數(shù)千人、數(shù)萬人進行的心理測評,主要應用于心理健康管理和人才管理兩個領域,例如,心理健康管理領域的學校心理普查、企業(yè)和醫(yī)院的心理體檢等方面;人才管理領域的人才選撥、人才晉升、特定人群的素質測評等方面。
1.1全方位、多特質的心理測評
根據(jù)麥克利蘭的素質冰山模型,個體的心理素質包括可觀察的 “冰山以上部分”,也就是外顯的知識和技能,以及深藏內隱的“冰山以下部分”,也就是個體的動機、個性特點、自我概念和社會角色等。冰山以上的部分可通過技能測評等方式進行了解,而冰山以下的部分則需要借助心理測評工具。冰山以下的部分比冰山以上外顯行為包含的內容更廣。在大規(guī)模心理測評時,往往涉及關于個體整體心理狀態(tài)的全面測評。心理健康管理一般包括基本心理健康狀況篩查、個性態(tài)度、社會歸屬性、職業(yè)活力、壓力應對方式等多個方面;人才管理一般包括個體基本的心理健康狀況、崗位勝任能力、職業(yè)價值觀、個性態(tài)度、職業(yè)興趣等方面。而這些方面又可細化為更加具體的維度,例如,每個人從事某個職業(yè)的動機是不同的,包括追求成就、社會地位、管理支配、經(jīng)濟報酬、智力挖掘、人際關系、穩(wěn)定等??梢姡诖笠?guī)模心理測評中,往往需要對人的很多特質進行全方位的綜合測評。
1.2心理測評的精確性
對上千人、上萬人進行大規(guī)模心理測評時,施測者沒有第二次機會了解受測者,因此測評應該精確地估計出受測者的特質,同時要能夠很好地識別無效作答、隨意作答、虛假作答等情況,以保證不會影響整體測評結果。另外,在整個施測過程中要減小誤差,受測者疲勞、測評程序不穩(wěn)定等情況都會造成一定的測量誤差,此時我們就很難評估受測者之間的個體差異??梢姡笠?guī)模心理測評的精確性是至關重要的,需要研究者在開發(fā)高質量的施測題目、篩選有針對性的維度、嚴格控制整體施測流程等方面加以控制。
面對大規(guī)模的施測樣本,需要降低測評系統(tǒng)題目的曝光率,呈現(xiàn)給每個受測者的題目是不同的,一方面避免受測者傳播題目的作弊行為,另一方面保護測評系統(tǒng)的可持續(xù)使用。
1.3心理測評的施測過程方便快捷
在大規(guī)模心理測評中,受測者往往來自全國各地,有時很難集中施測,因此互聯(lián)網(wǎng)是進行大規(guī)模心理測評的有利方式,它不會受到地域、施測時間等方面的限制。
另外,針對兒童的測評可借助計算機的方式實現(xiàn)文字、語音、圖畫、錄像等多種方式的結合,生動有趣的測評方式更能吸引兒童的注意力。此外,統(tǒng)一的說明語、演示流程、施測流程等能夠很好地消除主試對兒童的影響,最大程度減小測評誤差,提高測評結果的精確性。
2大規(guī)模心理測評的現(xiàn)狀
目前關于大規(guī)模心理測評的需求有很多,但是其理論基礎、實現(xiàn)方式等方面有諸多的局限性,阻礙了大規(guī)模測評的發(fā)展。主要體現(xiàn)在以下幾個方面。
《心理技術與應用》 2015年第10期 (總第26期)
婁驥盧莎大規(guī)模心理測評的發(fā)展現(xiàn)狀與趨勢
2.1心理測評的效率較低
在進行大規(guī)模心理測評時往往要對受測者施測多套經(jīng)典量表,以全面評估個體的心理發(fā)展狀況。但此種情況存在諸多的弊端:
第一,在使用多套量表施測的情況下,受測者必須完成每個量表的所有題目之后才可對結果進行比較和解釋,題目的曝光率很高,而且不同量表的評價標準不一,量表之間不能比較;
第二,多套量表施測則意味著題量大、作答時間長,受測者往往會因此出現(xiàn)不良情緒,影響作答效率。寬窄網(wǎng)①
的研究人員曾對三萬人的施測過程進行研究,結果發(fā)現(xiàn),大約在測評進行20分鐘時,15%的受測者會出現(xiàn)疲勞、煩躁等不良情緒,測評進行30分鐘時,24%的受測者會出現(xiàn)不良情緒,從而出現(xiàn)隨意作答、不作答等情況,造成測評效率低。
① 寬窄網(wǎng): 北京輔仁淑凡軟件科技有限公司研發(fā)的基于國際互聯(lián)網(wǎng)的心理測評產(chǎn)品, 上線時間為2012年。
另外,多套量表施測有時會有部分維度重復,甚至存在不需要施測的維度,造成測評資源的浪費,而且還會增加后期數(shù)據(jù)錄入和整理的工作量。
2.2經(jīng)典測量理論的局限
經(jīng)典量表按照固定的順序施測、綜合所有的題目得出常模和評價,其理論基礎為經(jīng)典測量理論(CTT)。其假設包括:個體的心理特征具有穩(wěn)定不變性,每個個體做測評時的誤差都是隨機的,測評分數(shù)就是個人的穩(wěn)定的心理特征和測評誤差之和,因此測量的目的在于減少測量誤差,進而能夠較為準確地得出個體的心理特征值。信度、效度、難度、區(qū)分度等指標建立在該理論的基礎上,用來評價測評量表的質量。
CTT理論的局限性在于:受測者的能力是單純通過得分的累加得出的,而沒有考慮題目難度、區(qū)分度等因素;測量不精確,因為每個人的測評誤差大小不一,其測量的精確性有待提高;測量統(tǒng)計指標的制定依賴抽樣的變動,抽樣偏差、抽樣樣本大小等因素均會影響測評的指標;受測者的能力與難度指標含義不同,無法相互解釋;量表以固定的題目和順序呈現(xiàn),計分方式不統(tǒng)一,因此非同一份量表的受測者無法比較。CTT理論的種種局限導致測評量表的精確性、測評效率很容易受到影響。