任 巖 潘逸沁 駱 方
(北京師范大學心理學部,應用實驗心理北京市重點實驗室,心理學國家級實驗教學示范中心(北京師范大學),北京 100875)
社會稱許性反應(Socially Desirable Responding,以下簡稱SDR),是指被試在填答人格測驗時,傾向于朝向社會期望的方向回答(Edwards,1961;Tracey,2016)。研究者發(fā)現(xiàn),SDR會污染人格測驗,大大降低測驗分數(shù)的真實性(Goffin & Christiansen,2003;Dunning,Heath,& Suls,2004;Krumpal,2013,Perinelli & Gremigni,2016)。1984年Paulhus提出了SDR有兩個成份:自我欺騙和印象管理。自我欺騙是指無意識中發(fā)生的夸大反應,個體報告了不真實的自我描述,但是他們確信自己就是這樣的。它反映了一定程度的非病態(tài)自戀和對自我了解的缺乏,類似一種人格特質(zhì),與心理適應、樂觀、自尊及一般的勝任感等人格概念有關(Farrow,Burgess,Wilkinson,& Hunter,2015)。對任何測量自我欺騙的社會稱許性量表分數(shù)加以控制,都會降低與自欺反應有聯(lián)系的人格測驗(如焦慮感、成就動機、支配性、幸福感、控制感知、自尊)的預測效度。印象管理是指個體故意報告不真實的自我描述來傳遞較好的社會形象的反應趨勢(Li & Bagger,2006)。印象管理在概念上與人格特質(zhì)無關,但仍對人格特質(zhì)的自陳得分產(chǎn)生作用,是一種反應偏差,對人格測驗的危害更大。
基于雙成分模型,Paulhus開發(fā)出了社會稱許性平衡量表(Balanced Inventory of Desirable Responding,BIDR,Paulhus,1991),描述的都是人類不可能具有的美德(或不可能去掉的陋習),如果被試承認(或否定)自己具有這類行為,則表明他(她)在無意或者故意地夸大反應。BIDR有兩個子量表,其中自我欺騙量表的內(nèi)容主要是有關性和侵犯方面的,這些念頭在人的無意識中廣泛存在,如果被試反應過度,則說明其具有自我欺騙的傾向。印象管理量表的項目則非常夸大和透明,個體對這些值得贊美的行為的過度宣稱,一定涉及有意識的粉飾。Paulhus推薦對印象管理量表使用特別的計分方式:在一個 7 點量表上,對正向項目僅對“6” 和“7”計分;對負向的項目僅對“1”和“2”計分。他認為自我欺騙在這些題目上只能引發(fā)“微弱”的反應,得分是較低的。
一些研究者采用實驗研究來檢驗BIDR量表的結構效度。他們操作了兩種實驗條件:“誠實”條件,指導語中要求被試“盡可能誠實回答”;“作假”條件,在指導語中要求被試“盡可能的夸大反應,表現(xiàn)出一個形象最佳的你”。Holden,Book,Edwards,Wasylkiw和Starzyk(2003)發(fā)現(xiàn)“誠實”條件下,被試在自我欺騙和印象管理兩個量表上的得分相關為.36,而在“作假”條件下,二者相關為0.80。很顯然,自我欺騙量表在“作假”條件下測量了一些有意識作假的成分;而在“誠實”條件下,印象管理量表也測量到了無意識中發(fā)生的自我欺騙。因而,BIDR的兩個量表并沒有良好的區(qū)分效度,尤其是印象管理量表的得分受到了自我欺騙的污染,無法實現(xiàn)使用它來篩選故意作假的被試的目的(Holden et al.,2003)。值得探討的是,當被試作答印象管理量表時,發(fā)生自我欺騙與發(fā)生印象管理在印象管理量表上的得分是否有差別,以及二者的作答模式是否有區(qū)別。如果能夠把二者有效區(qū)分開來,那么就有望將自我欺騙對印象管理量表的污染作用屏蔽掉,來篩選故意作假的被試,提高人格測驗的效度了。
本研究擬首先采用實驗研究的范式來誘導被試發(fā)生自我欺騙和印象管理,考察他們在印象管理量表得分上的差異。然后,采用Mixed Rasch Model(MRM,F(xiàn)ischer & Molenaar,2012)來考察這些被試在印象管理量表上的作答模式的差異?;趯@些差異的分析,采用logistic回歸劃定印象管理量表的分界線,將高于分數(shù)線的被試認定為有意的作假者,而低于分界線的被試認定為誠實者(僅在無意識中發(fā)生了自我欺騙)。
選取BIDR的印象管理量表中的10道題目作為社會稱許性量表,嵌套在《大五人格測驗簡版》中使用。
北京師范大學四年級216名學生,分屬兩個公共課班級,包含十多個專業(yè),其中,76名學生來自文科系,80名來自理科系,60名來自文理兼收系。平均年齡22.36歲(SD=1.04),男生64人,女生152人。
要求兩個班級的學生按照指導語的要求完成人格測驗。其中,一個班級接受誘使作假的指導語,一個班級接受誠實回答的指導語。
誠實指導語如下:“該測驗是由若干描述性格特征的句子構成,請你判斷自己的符合程度,并在相應的數(shù)字上打勾,數(shù)字越大表示越符合。測試結束后,你可獲得測試結果,據(jù)此你可以更加了解自己。我們對你的測試結果嚴格保密,請真實回答!”
作假指導語如下:“該測驗是由若干描述性格特征的句子構成,你不需要按照自己的真實情況回答,請把自己表現(xiàn)得盡量優(yōu)秀,并在相應的數(shù)字上打勾,數(shù)字越大表示越符合。如果你的測驗成績足夠優(yōu)秀,排名在前5%,我們兩周后會公布錄用名單,給你20元的獎勵?!?/p>
誠實條件下被試在印象管理量表上的得分代表自我欺騙;作假條件下則代表印象管理。
社會稱許性量表同時測量了“誠實條件”組的自我欺騙和“作假條件”組的印象管理,它們可視為一種潛在特質(zhì)(夸大反應的動機)同時估計。采用Mixed Rasch Model來估計潛在特質(zhì)θ,是因為(1)MRM能夠識別出具有不同反應模式的群體,可以揭示作假與SDR是否會促使不同類型的反應發(fā)生。(2)MRM通過對項目功能差異的檢驗,探索出具有不同反應模式的群體,這與根據(jù)均值差異來判斷類別的統(tǒng)計技術(比如,聚類分析,鑒別分析等)不同(Zickar,Gibby,& Robie,2004)。(3)MRM采用的是分部評分模型(Partial Credit Model,PCM)來分析個體的反應模式,PCM是基于項目的相鄰類級之間的關系來建構的,所以估計出的項目類級的難易參數(shù)dv不一定是遞增的。理論上,Likert量表的各個類級(比如,0~4個級別分別代表很不符合-非常符合)的難易參數(shù)應該是遞增的,也即類級越高,反應難度越大。如果個體不按照自己的真實水平反應,而更傾向于對某個類級反應(稱許性高的),那么項目類級的難易參數(shù)的順序?qū)⒈淮騺y,作假者的反應模式會被清晰展現(xiàn)。
采用軟件WINMIRA 2001進行Mixed Rasch Model分析,SPSS 16.0進行l(wèi)ogistic回歸分析。
3.1.1自我欺騙和印象管理的社會稱許性強度不同
使用MRM分析兩個組作答社會稱許性項目的反應數(shù)據(jù),估計的潛在特質(zhì)θ值。結果顯示,“誠實條件”組的θ值均值為0.115,“作假條件”組的θ值均值為1.272,二者有顯著差異(t=-9.407***),效應值Cohen’sd為1.304,說明印象管理的強度更大。需要注意的是,“誠實條件”組27人的θ值大于1,說明一些個體的自我欺騙水平較高。在θ值的最高端(2~5),幾乎全部是“作假條件”組,這說明采用社會稱許性量表時劃定較高的分界線識別嚴重作假者是可取的。
3.1.2印象管理與自我欺騙的反應模式不同
MRM采用CAIC指標來判斷分類結果,當把個體分為兩類時CAIC最小(1類:5942.80;2類:5940.40;3類:6107.77),說明把個體分為兩類最為合適。當將個體劃分為兩類時,所有項目的Q值在兩個類別上均未超過±1.96范圍,說明所有項目的擬合良好。
圖1描述了這兩個類別在項目(橫坐標)5個類級上的反應概率??梢?,第一類(左圖)的個體在第2和第3類級上有較大的反應概率,而第二類(右圖)的反應集中在第三和第四類級上,尤其對極端的類級4有最大的反應概率。
圖1 兩個類別的反應概率圖
圖2是這兩個類別在項目(橫坐標)上的各個類級的難易參數(shù)圖。第一類(左圖)的各類級位置參數(shù)的順序基本正確,第2和3類級的位置參數(shù)幾乎重合,說明對個體而言兩個類級(中間狀態(tài)、比較符合)并沒有區(qū)別,個體傾向于選擇代表較好程度的“比較符合”。第二類(右圖)各類級位置參數(shù)的順序是紊亂的,最低的是第3類級,4類級和1類級的位置參數(shù)類似,說明個體對第3和4類級敏感,傾向于對極端好的選項反應。
圖2 兩個類別的難易參數(shù)圖
可見,第一類的反應模式基本正確,而第二類的類級之間的難易參數(shù)完全被打亂,傾向于選擇極端好的反應鍵。這說明第一類個體的反應正常,動機低只會在低水平類級上反應,動機高才會對高水平類級反應。第二類個體傾向于選擇極端反應鍵,他們的反應更加劇烈。
進一步考察“誠實條件”組和“作假條件”組在這兩個類別上的人數(shù)。結果顯示,“作假條件”組有55人,“誠實條件”組有25人屬于第二類,“作假條件”組有53人,“誠實條件”組有83人屬于第一類。也即,“誠實條件”組更傾向于第一類別,“作假條件”組更傾向于第二類別。由此可見,作假者和誠實者的差異不僅大小強度不同(θ值),而且反應模式也不太一樣(作假者更容易選擇極端的反應鍵,得分更高)。
MRM分析的結果顯示,研究者能夠通過SDR分數(shù)的高低區(qū)分自我欺騙和印象管理。采用Logistic回歸劃定分界線識別作假者:以個體在社會稱許性量表的得分(SDR分數(shù))為自變量,兩種反應01編碼的識別變量(0為誠實,1為作假)為因變量,對216名被試的反應進行Logistic回歸。方程的解釋率Cox & Snell R2和Nagelkerke R2分別為0.336和0.448,說明該社會稱許性量表能夠較好的識別作假反應。
Logistic回歸可以估計個體的作假概率,如果大于臨界概率,可將個體判為作假者。下面考察三種臨界概率下誤中率和誤判率的大小,以及相應的社會稱許性量表的得分(即分界線)。結果顯示,當臨界概率為.3時,分界線較低(3.35),容易將個體判定為作假者,誤中率很小(4.6%),但是20.8%的誤判率較高,可能會將一些誠實者誤認為作假者。臨界概率為0.5和0.7時,分界線升高,更容易將個體判定為誠實者,誤中率增大(12.5%和21.3%),但是被誤判的誠實者減少(13.4%和4.2%)??梢?,分界線低時,誤中率低,但誤判率高;分界線高時,誤判率低,但誤中率高。因而,誤中率和誤判率不能同時減小,顯然劃定分界線是一個兩難的決策。
本研究在作假條件下的測驗結束后詢問被試:你對大約多少的項目作了夸大反應?請在以下5個反應項進行選擇(10%、20%、30%、40%、50%)。結果顯示,無論在哪種臨界概率下,被錯誤判為誠實反應的被試基本上都是作假比例為10%的輕微作假者。比如0.5的臨界概率下被誤中的27人中,有22人都是這種輕微作假者。在0.7的臨界概率下誤中的46人中,有37人是輕微作假者。這說明,當選擇較高的臨界概率(分界線為4)時,雖然誤中率較高,但在誤中的人群中大多數(shù)是輕微作假者,嚴重作假者(約20%)是能夠較好識別的。而選擇較低的臨界概率(分界線為3.5)時,更多的人(約60%)被判為作假者,如此大比例的剔除被試,顯然會大大降低使用人格測驗的意義。
SDR的研究范式通常是:隨機分配兩組被試完成相同的人格測驗,對一組要求“夸大反應,盡可能表現(xiàn)出最好的形象”(作假條件組),對另一組要求“盡可能誠實回答,結果匿名”(誠實條件組),通過兩個組的反應對比了解SDR的性質(zhì)。研究采用這種設計,使用不同的指導語創(chuàng)建誠實條件組和作假條件組,誘使作假條件組發(fā)生印象管理。本研究對作假條件組的指導語做了精心安排,鼓勵被試作假并給優(yōu)秀者20元的獎勵,期望能夠最大可能的模擬作假者心境。Mueller-Hanson,Heggestad和Thornton(2003)認為獎勵的方式會誘發(fā)出更加真實的作假反應。
研究結果表明,“作假條件”組的夸大反應(θ值)比“誠實條件”組大很多,而且在反應模式上也體現(xiàn)出更容易選擇極端反應的特征。對于MRM分出的兩個類別而言,“作假條件”組有55人,“誠實條件”組有25人屬于第二類,“作假條件”組的人數(shù)顯然更多,說明選拔情景中個體更傾向于極端反應。個體在誠實條件下有各種反應定勢(Response Set)包括極端反應、趨中反應、順從效應等,這表明一部分個體(25人)在回答測驗時,可能傾向于選擇極端反應鍵,他們視5點量尺與2點量尺相同,并沒有程度上的差別。“作假條件”組有53人,“誠實條件”組有83人屬于第一類,這些“作假條件”組的個體也許能夠理解反應鍵的不同強度,謹慎的傳遞理想個體形象,他們的夸大反應是更加精明的。
使用Logistic回歸可以幫助研究者尋找影響因變量分類的關鍵自變量,確定該怎樣對自變量劃定分界線,能夠更好的預測因變量的類別。本文把既有的實驗分組定為因變量(1為作假,0為誠實),社會稱許性量表分數(shù)作為自變量,結果顯示,該分數(shù)能夠較好的預測因變量。但是,基于臨界率劃定分界線是一個兩難問題,如果臨界概率較低,分界線會較低,個體容易被判定為作假者,誤中率很小,但是誤判率升高,可能把一些誠實者誤認為作假者。相反,臨界概率較高時,分界線升高,個體更容易被判定為誠實者,誤中率增大,但是被誤判的誠實者減少??梢?,分界線低時,誤中率低,但誤判率高;分界線高時,誤判率低,但誤中率高,誤中率和誤判率不能同時減小。
MRM的結果部分顯示:劃定較高的分界線更為合適,因而建議劃定較高的分界線(4分)識別嚴重的作假者,雖然誤中率較高,但是誤判率能夠大幅度的降低,即不會把誠實的回答者誤認為是作假者。
研究采用實驗研究范式,探討了當被試發(fā)生自我欺騙或印象管理時,其在BIDR印象管理量表上的得分差別有多大及二者的作答模式是否有區(qū)別。MRM的分析結果顯示,印象管理和自我欺騙的分數(shù)強度不同,而且它們會促使不同類型的反應發(fā)生,有更多的作假者傾向于選擇極端的反應鍵,項目得分更高。基于MRM的分析結果,繼續(xù)采用Logistic回歸技術對量表分數(shù)劃定了分界線,雖然分界線的劃定是一個兩難問題,但是劃定較高的分界線識別嚴重的作假者更為合適。