李英武 于 宙 彭坤霞麗 魏敏媛
(中國(guó)人民大學(xué)心理學(xué)系,北京 100872)
?
公務(wù)員面試測(cè)量了什么?我國(guó)公務(wù)員面試的構(gòu)想效度*
李英武 于 宙 彭坤霞麗 魏敏媛
(中國(guó)人民大學(xué)心理學(xué)系,北京 100872)
元分析證實(shí)面試可預(yù)測(cè)工作績(jī)效,但其預(yù)測(cè)機(jī)制尚不明確。最新版Standard psychological and educational Testing(2014Edition)建議,探索面試的構(gòu)想效度應(yīng)收集多方面證據(jù)。參照多波數(shù)據(jù)(multi-wave data)研究范式,結(jié)合多質(zhì)多法模型、驗(yàn)證性因素分析等方法,選取3家中央國(guó)家行政機(jī)關(guān)在2013至2014期間公務(wù)員面試中1069名應(yīng)試者面試檔案數(shù)據(jù)(archival data)交互驗(yàn)證公務(wù)員面試的構(gòu)想效度。結(jié)果表明,我國(guó)公務(wù)員面試測(cè)評(píng)了內(nèi)在因素和外在因素兩個(gè)維度,支持面試構(gòu)想的二維理論。
公務(wù)員;面試;多波數(shù)據(jù);構(gòu)想效度
面試是應(yīng)用最廣泛的人事選拔方法(Zibarras & Woods,2010)。所謂面試,即由一個(gè)或多個(gè)面試官與應(yīng)試者進(jìn)行人際互動(dòng),就應(yīng)試者是否可以滿足特定崗位需求進(jìn)行評(píng)估,這一過程稱之為面試(Levashina,Hartwell,Morgeson,& Campion,2014)。基于操作的標(biāo)準(zhǔn)化程度,面試可分為結(jié)構(gòu)化面試和非結(jié)構(gòu)化面試。結(jié)構(gòu)化面試(Structured Interview),又稱標(biāo)準(zhǔn)化面試(Standardized Interview),是一種相對(duì)穩(wěn)定的面試,它強(qiáng)調(diào)面試內(nèi)容的工作相關(guān)性、面試流程標(biāo)準(zhǔn)化、評(píng)分結(jié)構(gòu)化,即面試官以相同的方式,向應(yīng)試者提出相同的問題,并以相同的標(biāo)準(zhǔn)評(píng)價(jià)應(yīng)試者(Huffcutt,Van Iddekinge,& Roth,2011)。2015年11月18日中組部、人力資源和社會(huì)保障部和國(guó)家公務(wù)員局聯(lián)合頒布《公務(wù)員錄用面試組織管理辦法(試行)》,規(guī)定中進(jìn)一步明確中央國(guó)家機(jī)關(guān)“面試方法以結(jié)構(gòu)化面試和無(wú)領(lǐng)導(dǎo)小組討論為主,也可以采取其他測(cè)評(píng)方法”。那么,為什么中央國(guó)家機(jī)關(guān)在選拔 招錄公務(wù)員時(shí)要以結(jié)構(gòu)化面試為主呢?其原因一是在于結(jié)構(gòu)化面試采用標(biāo)準(zhǔn)化施測(cè)程序可以降低應(yīng)試者間的程序差異,減少面試官在面試過程中的隨意性(Huffcutt,Culbertson,& Weyhrauch,2014),減少過程偏差(Koch,Schultze,Eid,& Geiser,2014)。同時(shí),結(jié)構(gòu)化面試受混淆變量,如面試官自身特點(diǎn)(Kluemper et al.,2014)、應(yīng)試者外貌(Barrick,Shaffer,& DeGrassi,2009)、印象管理(Alkhouri,2012)、種族(McCARTHY,Van Iddekinge,& Campion,2010)等因素相對(duì)于非結(jié)構(gòu)化面試來(lái)說要低些,這樣就為“面試的程序公平性”奠定了基礎(chǔ)。
此外,結(jié)構(gòu)化面試預(yù)測(cè)效度的大量實(shí)證研究發(fā)現(xiàn),結(jié)構(gòu)化面試可以預(yù)測(cè)多種工作相關(guān)效標(biāo)(Kluemper,McLarty,Bishop,& Sen,2014;Ziegler,Dietl,Danay,Vogel,& Buehner,2011),也可以為其他測(cè)評(píng)方法提供增量效度(DeGroot & Kluemper,2007),這樣就為“面試的效果科學(xué)性”提供了數(shù)據(jù)支撐。
然而,上述結(jié)論的導(dǎo)出依賴于重要的邏輯前提,就是考官在結(jié)構(gòu)化面試中評(píng)價(jià)了哪些維度?這就是心理測(cè)量學(xué)中測(cè)量的“構(gòu)想效度問題”。梳理現(xiàn)有國(guó)內(nèi)外文獻(xiàn)后可見,結(jié)構(gòu)化面試構(gòu)想效度的研究相對(duì)不夠充分(Levashina et al.,2014),并未得出一致結(jié)論。主要包括以下幾種觀點(diǎn):
面試構(gòu)想的一維論:Pulakos和Schmitt(1995)采用信度分析和探索性因素分析,發(fā)現(xiàn)8個(gè)結(jié)構(gòu)化面試的測(cè)評(píng)要素(組織計(jì)劃、高效參與、評(píng)估信息、積極主動(dòng)性、適應(yīng)變化、身體素質(zhì)、誠(chéng)實(shí)守信、口頭溝通)只能抽取出一個(gè)特征根大于1的因子。洪自強(qiáng)和嚴(yán)進(jìn)(2003)采用同種方法,在我國(guó)企業(yè)招聘中驗(yàn)證了以上研究結(jié)果。
面試構(gòu)想的多維論:Salgado和Moscoso(2002)采用元分析技術(shù),收集傳統(tǒng)面試和行為面試研究數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)面試測(cè)量了四個(gè)成分:一般心理能力(GMA)、工作經(jīng)驗(yàn)、大五人格維度以及社交技能。Huffcutt(2001)等同樣采用元分析技術(shù),發(fā)現(xiàn)47 項(xiàng)招聘面試研究的預(yù)設(shè)測(cè)評(píng)構(gòu)想分為七大類。以上研究發(fā)現(xiàn),結(jié)構(gòu)化面試可用于測(cè)評(píng)多維構(gòu)想。
面試構(gòu)想的零維論:也有研究認(rèn)為,結(jié)構(gòu)化面試并不存在真正的構(gòu)想效度。Van Iddekinge 等(2004)分析了兩類用于選拔客戶服務(wù)經(jīng)理結(jié)構(gòu)化面試的構(gòu)想效度,采用多質(zhì)多法分析,發(fā)現(xiàn)其區(qū)分效度大于聚合效度。由于多質(zhì)多法分析自身缺乏可靠的量化指標(biāo)的,因此,Van Iddekinge 等(2004)開創(chuàng)性的采用驗(yàn)證性因素分析,構(gòu)建不包含方法因子或特質(zhì)因子的嵌套模型,由擬合指數(shù)衡量不同成分對(duì)模型擬合度的貢獻(xiàn)。進(jìn)一步采用驗(yàn)證性因素分析發(fā)現(xiàn),面試評(píng)分受面試官因素和應(yīng)試者因素影響較大,面試評(píng)分與面試的測(cè)評(píng)要素相關(guān)較低。因此,結(jié)構(gòu)化面試構(gòu)想效度較差。Van Iddekinge等(2005)采用模擬結(jié)構(gòu)化面試測(cè)評(píng)人格,驗(yàn)證了以上結(jié)果。
總結(jié)現(xiàn)有結(jié)構(gòu)化面試構(gòu)想效度研究可得出如下結(jié)論:結(jié)構(gòu)化面試究竟測(cè)量了哪些構(gòu)想,測(cè)評(píng)了幾維構(gòu)想,仍未得出一致結(jié)論。此外,上述研究數(shù)據(jù)多來(lái)源企業(yè)數(shù)據(jù),而基于中國(guó)公務(wù)員大規(guī)模面試的現(xiàn)場(chǎng)數(shù)據(jù)研究還相對(duì)缺乏。
雖然面試構(gòu)想效度研究缺乏一致結(jié)論,但構(gòu)想效度研究有重要意義。首先,有助于提高整個(gè)選拔系統(tǒng)的經(jīng)濟(jì)性和預(yù)測(cè)效度。如果面試測(cè)量的構(gòu)想與可以采用低成本的紙筆測(cè)驗(yàn)測(cè)量的構(gòu)想相關(guān)度過高,面試便失去了價(jià)值。面試應(yīng)更關(guān)注其他選拔方式難以測(cè)評(píng)的特質(zhì),提高增量效度。第二,結(jié)構(gòu)化面試構(gòu)想效度的研究對(duì)組織實(shí)踐有重要意義。面試過后,組織往往會(huì)基于對(duì)應(yīng)試者的評(píng)價(jià)進(jìn)行培訓(xùn)與開發(fā)(De Vos,De Hauw,& Van der Heijden,2011)。如果結(jié)構(gòu)化面試沒有測(cè)評(píng)預(yù)設(shè)構(gòu)想,那么評(píng)價(jià)結(jié)果不精確,據(jù)此進(jìn)行的開發(fā),有效性存疑。第三,也是最重要的一點(diǎn),構(gòu)想效度研究可以解釋結(jié)構(gòu)化面試預(yù)測(cè)效度的機(jī)制(王忠軍,龍立榮,2006),即結(jié)構(gòu)化面試所測(cè)構(gòu)想與工作績(jī)效等效標(biāo)的高度相關(guān),以此解釋結(jié)構(gòu)化面試高預(yù)測(cè)效度的背后機(jī)制。假設(shè),結(jié)構(gòu)化面試是GMA與人格的有效測(cè)評(píng)工具,而GMA和人格與工作績(jī)效高度相關(guān),這便可以解釋結(jié)構(gòu)化面試高預(yù)測(cè)效度的機(jī)制。構(gòu)想效度的提高可以進(jìn)一步提高預(yù)測(cè)效度(Hendry,Douglas,Winter,& Edens,2013)。
同時(shí),發(fā)掘中國(guó)管理實(shí)踐中值得研究的重要問題,是確保研究結(jié)果產(chǎn)生廣泛社會(huì)影響的重要途徑(徐淑英 , 呂力,2015)。目前結(jié)構(gòu)化面試已經(jīng)廣泛應(yīng)用于我國(guó)人事選拔領(lǐng)域(田效勛 , 車宏生,2009),探討結(jié)構(gòu)化面試的構(gòu)想效度成為需要重點(diǎn)關(guān)注的研究問題。
基于此,采用我國(guó)真實(shí)情景中公務(wù)員大規(guī)模面試數(shù)據(jù),按照Cronbach和Meehl(1955)提出的研究范式,采用信度分析、因素分析、多質(zhì)多法分析等多種方法,基于內(nèi)部一致性信度、因子載荷等多個(gè)指標(biāo)檢驗(yàn)結(jié)構(gòu)化面試的構(gòu)想效度,評(píng)估結(jié)構(gòu)化面試的構(gòu)想效度。
2.1 被試
基于研究目的,采用多波數(shù)據(jù)(multi-wave data)相互驗(yàn)證。選用三批不同年份(2013、2014)、不同政府部門的面試數(shù)據(jù),隨機(jī)分配于三部分分析。2013機(jī)構(gòu)一數(shù)據(jù)(N=353)用于探索性因素分析和信度分析,2013機(jī)構(gòu)二數(shù)據(jù)(N=380)數(shù)據(jù)用于驗(yàn)證性因素分析,2014機(jī)構(gòu)一數(shù)據(jù)(N=336)用于多質(zhì)多法分析。三批數(shù)據(jù)共有269名面試官參加,每位應(yīng)試者由標(biāo)準(zhǔn)面試官小組(Interviewer Panel)評(píng)分。將參加面試的1069位應(yīng)試者的面試相關(guān)數(shù)據(jù)全部納入分析,包括測(cè)評(píng)要素分和總分,應(yīng)試者人口統(tǒng)計(jì)學(xué)特征見表1。
表1 應(yīng)試者人口統(tǒng)計(jì)學(xué)變量
2.2 結(jié)構(gòu)化面試測(cè)評(píng)要素
結(jié)構(gòu)化面試題目由公務(wù)員考試研究機(jī)構(gòu)開發(fā)而成。結(jié)構(gòu)化面試測(cè)評(píng)要素的開發(fā),是在《國(guó)家公務(wù)員通用能力標(biāo)準(zhǔn)框架(試行)》中列出的通用能力的基礎(chǔ)上,對(duì)擬錄取崗位進(jìn)行了工作分析,確定分析能力、計(jì)劃能力、人際能力、應(yīng)急處置、語(yǔ)言表達(dá)、舉止儀表等六個(gè)測(cè)評(píng)要素。通過公務(wù)員面試職位專家的焦點(diǎn)小組討論,最終確定:分析能力、計(jì)劃能力、人際能力、應(yīng)急處置能力的權(quán)重為20%,語(yǔ)言表達(dá)、舉止儀表的權(quán)重為10%。每道題目包含一個(gè)或多個(gè)測(cè)評(píng)要素,原因在于:實(shí)踐中很難有單一考察某一特定測(cè)評(píng)要素的面試題目;符合《國(guó)家公務(wù)員錄用面試暫行辦法》中的命題原則;從心理測(cè)量學(xué)的角度,Van Iddekinge等(2004)提出,設(shè)定跨題目評(píng)價(jià)維度可提高面試的構(gòu)想效度?;赩an Iddekinge等(2004)提出的:在構(gòu)想效度研究中,不同面試題本和不同面試形式均可視作不同的方法,研究中收集四套面試題本符合多波數(shù)據(jù)研究范式和多質(zhì)多法分析的前提。
2.3 面試評(píng)分方法
面試前對(duì)所有面試官進(jìn)行評(píng)分相關(guān)培訓(xùn),便于面試官準(zhǔn)確把握評(píng)分標(biāo)準(zhǔn),提高面試官間評(píng)分一致性。面試過程中,所有應(yīng)試者提問順序相同、面試官相同、施測(cè)環(huán)境盡量保持一致。面試采用標(biāo)準(zhǔn)面試官小組(徐建平,周瀚,李文雅,陳孚, 張偉,2014),面試時(shí)長(zhǎng)約為20分鐘。面試中,每名面試官在應(yīng)試者回答完每個(gè)問題后,立刻獨(dú)立對(duì)應(yīng)試者基于行為錨定量表打分,以最小化一般印象效應(yīng)(General Impression Effect)(Van Iddekinge et al.,2004)。面試官組按照“題目—題—要素”順序,對(duì)應(yīng)試者的面試表現(xiàn)進(jìn)行評(píng)價(jià),面試分?jǐn)?shù)按照測(cè)評(píng)要素匯總,得出每一應(yīng)試者的不同測(cè)評(píng)要素得分,最后將所有測(cè)評(píng)要素的得分相加得出應(yīng)試者的面試總分。根據(jù)Huffcutt和Arthur(1994)對(duì)面試結(jié)構(gòu)化程度的分類標(biāo)準(zhǔn),研究中的關(guān)注的面試是高度結(jié)構(gòu)化面試。
2.4 構(gòu)想效度的分析方法
近年來(lái),面試構(gòu)想效度研究出現(xiàn)了綜合實(shí)驗(yàn)證據(jù)或理論數(shù)據(jù),以驗(yàn)證選拔方法測(cè)評(píng)特質(zhì)的充分性和恰當(dāng)性的趨勢(shì)(關(guān)丹丹 , 車宏生,2010)。據(jù)此,研究采用多種方法分析結(jié)構(gòu)化面試的構(gòu)想效度:內(nèi)部一致性信度、因素分析、多質(zhì)多法分析等。
采用經(jīng)典的內(nèi)部一致性信度評(píng)價(jià)構(gòu)想效度(Cronbach & Meehl,1955)。內(nèi)部一致性是題目之間的相關(guān)性(Revelle & Zinbarg,2009),如果同一維度內(nèi)部的題目之間相關(guān)高,則可認(rèn)為該結(jié)構(gòu)化面試的構(gòu)想效度高。采用因素分析衡量結(jié)構(gòu)化面試的構(gòu)想效度(Thompson & Daniel,1996)。對(duì)結(jié)構(gòu)化面試的測(cè)評(píng)要素進(jìn)行探索性因素分析,找出結(jié)構(gòu)化面試評(píng)分中的共同因素,用測(cè)評(píng)要素在共同因素上的因子載荷衡量結(jié)構(gòu)化面試的構(gòu)想效度;再用驗(yàn)證性因素分析驗(yàn)證結(jié)構(gòu)化面試的構(gòu)想效度。用多質(zhì)多法分析評(píng)估面試的聚合效度和區(qū)分效度,分別計(jì)算出任意兩套題本測(cè)量同一種特質(zhì)的相關(guān),和同一題本測(cè)量不同特質(zhì)的相關(guān),聚合效度顯著高于區(qū)分效度,則說明結(jié)構(gòu)化面試的構(gòu)想效度高(Campbell & Fiske,1959)。若用多種相似的方法測(cè)量同一種特質(zhì)相關(guān)較高,或用相似方法測(cè)量不同特質(zhì)相關(guān)較低,則說明測(cè)量的構(gòu)想效度高。由于傳統(tǒng)的通過相關(guān)矩陣計(jì)算平均相關(guān)系數(shù)的多質(zhì)多法模型缺乏可靠指標(biāo)衡量模型的擬合程度,因此進(jìn)一步采用驗(yàn)證性因素分析量化多質(zhì)多法模型的擬合效果(Kenny & Kashy,1992;Van Iddekinge et al.,2004)。出于控制共同方法偏差(Podsakoff,MacKenzie,Lee,& Podsakoff,2003)的需要,研究中的七人面試小組抽簽產(chǎn)生,并不固定,無(wú)法提供面試官因子,因此在驗(yàn)證性因素分析中,僅構(gòu)建了包含特質(zhì)因子和方法因子的嵌套模型。
3.1 結(jié)構(gòu)化面試探索性因素分析
采用探索性因素分析檢驗(yàn)結(jié)構(gòu)化面試的構(gòu)想效度,通過分析提取面試公因子,探索結(jié)構(gòu)化面試測(cè)評(píng)維度。首先檢驗(yàn)數(shù)據(jù)是否適合進(jìn)行探索性因素分析,依照Kaiser-Meyer-Olkin(KMO)和Barlett Test of Sphericity檢驗(yàn),得出KMO=0.847>0.80,Bartlett.s Test=6620.98,顯著性水平為0.000,表明各測(cè)評(píng)要素間存在共同因素可以進(jìn)行探索性因素分析。
采用主成分分析法抽取公因子結(jié)果發(fā)現(xiàn),特征值大于1的公因子有2個(gè),兩個(gè)因素總貢獻(xiàn)率為80.92%,解釋變異達(dá)到可接受水平。采用最大方差法旋轉(zhuǎn),每一測(cè)評(píng)要素的在相應(yīng)維度上的因子載荷均大于0.80(見表2),構(gòu)想效度良好。因此,探索性因素分析發(fā)現(xiàn),結(jié)構(gòu)化面試測(cè)評(píng)二維構(gòu)想,構(gòu)想效度良好。
表2 結(jié)構(gòu)化面試的因子載荷表
注:加粗字體為該測(cè)評(píng)要素在相應(yīng)維度上的因子載荷
3.2 結(jié)構(gòu)化面試的驗(yàn)證性因素分析
探索性因素分析主要是由數(shù)據(jù)驅(qū)動(dòng),單純分析數(shù)據(jù)結(jié)構(gòu),對(duì)于后期理論解釋的適應(yīng)性關(guān)注不夠。相對(duì)來(lái)說,驗(yàn)證性因素分析是先構(gòu)建理論框架再驗(yàn)證數(shù)據(jù)的擬合度。接下來(lái)采用另一批數(shù)據(jù),通過驗(yàn)證性因素分析進(jìn)一步檢驗(yàn)結(jié)構(gòu)化面試的構(gòu)想效度。
根據(jù)探索性因素分析和前人研究的結(jié)果設(shè)定不同模型。二維模型:基于探索性因素分析的結(jié)果設(shè)定;單維模型:Pulakos和Schmitt(1995)前人研究提出結(jié)構(gòu)化面試測(cè)評(píng)一維構(gòu)想;三維模型:Huffcutt(2011)提出結(jié)構(gòu)化面試測(cè)評(píng)多維構(gòu)想,同時(shí),結(jié)合驗(yàn)證性因素分析對(duì)觀察指標(biāo)數(shù)和因素?cái)?shù)的要求(模型識(shí)別要求每個(gè)因素上至少有2個(gè)觀察指標(biāo)(侯杰泰,溫忠麟, 成子娟,2004),設(shè)定三因素模型。在社會(huì)學(xué)中,對(duì)所有相關(guān)條目測(cè)量值作為對(duì)該潛變量的測(cè)量,其劃分標(biāo)準(zhǔn)為α≥7.0(Nunnally,2010)。也就是說α=7.0是一個(gè)合成測(cè)量最低可接受的信度。據(jù)此,分別計(jì)算前四個(gè)觀察指標(biāo)兩兩之間的α系數(shù),其中,只有分析能力和計(jì)劃能力(0.81)、人際能力和應(yīng)急處置(0.78)的α系數(shù)大于0.70?;诖耍_定三因素模型的觀察指標(biāo)劃分,即分析能力和計(jì)劃能力歸為一個(gè)因素,人際能力和應(yīng)急處置歸為一個(gè)因素,語(yǔ)言表達(dá)和舉止儀表歸為一個(gè)因素。
采用Mplus7.0,運(yùn)用極大似然法對(duì)三個(gè)競(jìng)爭(zhēng)模型進(jìn)行驗(yàn)證性因素分析。模型中數(shù)據(jù)的N/t遠(yuǎn)大于100:1,樣本量較大,對(duì)擬合指數(shù)較為有利(Marsh,Hau,Balla,& Grayson,1998)?;贖u和Bentler(1999)推薦的擬合指數(shù)衡量模型:χ2/df、RMSEA、CFI、TFI等。RMSEA小于0.05說明擬合度非常好,小于0.10都是可接受的(Schermelleh-Engel,Moosbrugger,& Müller,2003)。CFI是比較擬合指數(shù),其值大于0.90說明擬合度很好,如果接近0.95說明擬合度非常好(Bentler & Dudgeon,1996)。TFI是非常態(tài)擬合指數(shù),大于0.90則認(rèn)為方程擬合度較好(侯杰泰等,2004;Bentler,1990)。
研究發(fā)現(xiàn)僅有二因素模型的各項(xiàng)擬合指數(shù)均在0.90以上(見表3),三因素模型和單因素模型的TFI均小于0.90,說明僅有二因素模型總體擬合良好。接下來(lái),具體分析二因素模型的標(biāo)準(zhǔn)化載荷,二因素模型中每個(gè)測(cè)評(píng)要素在預(yù)設(shè)構(gòu)想上的標(biāo)準(zhǔn)化載荷均在0.60以上,大部分在0.70以上(見圖1)。綜上,可認(rèn)為分析結(jié)果符合一個(gè)擬合較好的模型對(duì)系數(shù)大小的要求,二因素模型的擬合程度良好。這進(jìn)一步表明結(jié)構(gòu)化面試測(cè)評(píng)了二維構(gòu)想,將這兩個(gè)維度分別命名為內(nèi)在因素和外在因素。
表3 多個(gè)模型擬合指數(shù)
圖1 二因素模型的標(biāo)準(zhǔn)化載荷
3.3 結(jié)構(gòu)化面試的描述性統(tǒng)計(jì)和信度分析
研究發(fā)現(xiàn)結(jié)構(gòu)化面試測(cè)評(píng)存在二維構(gòu)想,基于此對(duì)四套題本進(jìn)行信度(內(nèi)部一致性信度)分析,結(jié)果見表4。由于誤差不相關(guān),所以采用α系數(shù)計(jì)算內(nèi)部一致性信度(溫忠麟,葉寶娟,2011)。α系數(shù)是從測(cè)評(píng)要素之間的關(guān)系出發(fā)衡量信度,反映組成測(cè)驗(yàn)的測(cè)評(píng)要素內(nèi)部一致性的程度(屠金路,王庭照,金瑜,2010)。四套題本的兩個(gè)維度的平均數(shù)、標(biāo)準(zhǔn)差之間無(wú)顯著差異,但是外在因素的標(biāo)準(zhǔn)差顯著小于內(nèi)在因素的標(biāo)準(zhǔn)差,這可能是由于內(nèi)在因素可用的評(píng)分等級(jí)多于外在因素。四套題本的內(nèi)部一致性信度為0.80~0.90之間,均在0.81以上,表明不同構(gòu)想的評(píng)分要素之間一致性高。四套題本兩個(gè)維度的內(nèi)部一致性信度為0.75~0.92,說明四套題本不同維度的內(nèi)部一致性信度較高,每個(gè)維度內(nèi)的不同測(cè)量指標(biāo)評(píng)估同一特質(zhì)。
表4 四套題本測(cè)評(píng)兩個(gè)維度的描述性統(tǒng)計(jì)
3.4 結(jié)構(gòu)化面試的多質(zhì)多法分析
研究中結(jié)構(gòu)化面試采用多套題本,不同題本可認(rèn)為是不同方法(Van Iddekinge et al.,2004),符合多波數(shù)據(jù)研究范式的前提。此外,集合多質(zhì)多法分析(MTMM,multitrait-multimethod),基于維度之間的聚合效度和區(qū)分效度檢驗(yàn)結(jié)構(gòu)化面試的構(gòu)想效度(Campbell & Fiske,1959)。聚合效度是相同維度的不同題本之間的平均相關(guān)系數(shù);區(qū)分效度是相同題本測(cè)量不同維度的平均相關(guān)系數(shù)。
計(jì)算四套題本測(cè)評(píng)兩個(gè)維度的積差相關(guān)系數(shù),表5呈現(xiàn)了八個(gè)變量之間的零階相關(guān)矩陣。結(jié)果表明,四套題本測(cè)評(píng)兩個(gè)維度的相關(guān)系數(shù)為0.16~0.92,均達(dá)到0.01水平上的顯著。表中斜體數(shù)值表示同一題本測(cè)評(píng)不同維度之間的相關(guān),四套題本兩個(gè)維度之間的相關(guān)為0.16~0.68,通過R-Z轉(zhuǎn)換,計(jì)算區(qū)分效度,區(qū)分效度為0.41。表中加粗的數(shù)值表示不同題本測(cè)評(píng)同一維度之間的相關(guān),四套題本測(cè)評(píng)內(nèi)在因素的相關(guān)為0.91~0.94,四套題本測(cè)評(píng)外在因素的相關(guān)為0.21~0.46。同樣,通過R-Z轉(zhuǎn)換計(jì)算聚合效度,總聚合效度為0.76,在內(nèi)在因素上的聚合效度為0.93,在外在因素上的聚合效度為0.35。結(jié)果顯示,總聚合效度大于區(qū)分效度,結(jié)構(gòu)化面試的構(gòu)想效度良好,測(cè)評(píng)二維構(gòu)想。從具體維度來(lái)說,外在因素的聚合效度小于內(nèi)在因素。
表5 四套題本測(cè)評(píng)兩個(gè)維度的相關(guān)分析結(jié)果
注:A1即第一套題本的內(nèi)在因素特質(zhì),A2為第一套題本的外在因素;以此類推;**p<0.01;表中加粗字體為聚合效度,斜體為區(qū)分效度。
3.5 結(jié)構(gòu)化面試多質(zhì)多法模型的驗(yàn)證性因素分析
由于傳統(tǒng)的通過相關(guān)矩陣計(jì)算平均相關(guān)系數(shù)的多質(zhì)多法分析缺乏可靠的量化指標(biāo)衡量模型的擬合程度,因此,采用驗(yàn)證性因素分析驗(yàn)證多質(zhì)多法模型的擬合程度。為了分析四套題本測(cè)評(píng)兩維度的聚合效度和區(qū)分效度,研究構(gòu)建一系列的嵌套模型(Lance,Noble,& Scullen,2002),應(yīng)用Mplus7.0軟件處理結(jié)構(gòu)化面試的多質(zhì)多法數(shù)據(jù),用極大似然法估計(jì)模型的擬合度(Kenny & Kashy,1992)。
研究構(gòu)建的全模型,包括四個(gè)方法因子,兩個(gè)特質(zhì)因子。每套題本的測(cè)評(píng)要素作為模型的指標(biāo),四套題本分別作為模型的四個(gè)方法因子,內(nèi)在因素和外在因素作為模型的兩個(gè)特質(zhì)因子,模型中的每一個(gè)指標(biāo)都?xì)w屬于1個(gè)方法因子和1個(gè)特質(zhì)因子。多質(zhì)多法模型的擬合指數(shù)見表6的模型1,其中RMSEA為0.05,CFI為0.94,TFI為0.93,均大于0.90,接近0.95,因此模型擬合度較高。
多質(zhì)多法模型的指標(biāo)在特質(zhì)因子和方法因子上的載荷見表6。多質(zhì)多法模型的指標(biāo)在特質(zhì)因子上載荷越高表明測(cè)評(píng)工具的聚合效度越好,同時(shí),多質(zhì)多法模型的指標(biāo)在方法因子上的載荷越低,表明同一方法測(cè)評(píng)的不同特質(zhì)的區(qū)分效度越低,聚合效度大于區(qū)分效度,則說明結(jié)構(gòu)化面試的構(gòu)想效度良好。從表6呈現(xiàn)的結(jié)果分析中可以看出,總體上,四套題本在特質(zhì)因子上的載荷高于方法因子上的載荷。具體來(lái)說,第二套題本和第四套題本在特質(zhì)因子上的載荷大于在方法因子上的載荷;第一套題本和第三套題本中部分測(cè)評(píng)要素在特質(zhì)因子上的載荷大于在方法因子上的載荷;無(wú)論哪套題本,舉止儀表要素在特質(zhì)因子上的因子載荷均大于在方法因子上的因子載荷。總之,結(jié)構(gòu)化面試測(cè)評(píng)二維構(gòu)想,構(gòu)想效度良好,僅有個(gè)別測(cè)評(píng)要素需要進(jìn)一步完善。
表6 多質(zhì)多法模型的指標(biāo)在特質(zhì)因子和方法因子上的載荷(STDYX標(biāo)準(zhǔn)模型)
注:A1即第一套題本的內(nèi)在因素特質(zhì),A2為第一套題本的外在因素。A11~A14為屬于A1維度的四個(gè)測(cè)評(píng)要素;以此類推。
進(jìn)而,構(gòu)建不同嵌套模型,分析不同題本測(cè)評(píng)相同特質(zhì)的聚合效度和相同題本測(cè)評(píng)不同特質(zhì)的區(qū)分效度。各模型的指標(biāo)相同,潛變量設(shè)定不同。以全模型為基準(zhǔn)模型,設(shè)為模型1,比較不同在擬合指數(shù)上的差異。為了檢驗(yàn)不同題本測(cè)評(píng)相同特質(zhì)的聚合效度,建立模型2,僅設(shè)定四個(gè)方法因子,無(wú)特質(zhì)因子。比較模型1與模型2在擬合指數(shù)上的變化,若特質(zhì)因子有獨(dú)特貢獻(xiàn),則模型的擬合度更高。模型擬合指數(shù)有一定的改變(見表7),Δχ2=303.80(p<0.001),ΔCFI為0.06,ΔTFI為0.06,結(jié)果表明存在特質(zhì)因子的模型1與數(shù)據(jù)的擬合情況更好,反應(yīng)出特質(zhì)因子對(duì)模型的擬合有獨(dú)特貢獻(xiàn)。
表7 嵌套模型和全模型的擬合指數(shù)
注:模型1:全模型;模型2:僅有方法因子;模型3僅有特質(zhì)因子。
為了考察相同題本測(cè)評(píng)應(yīng)試者不同能力的區(qū)分效度,建立模型3,僅設(shè)定2個(gè)特質(zhì)因子,無(wú)方法因子。比較模型1和模型3在擬合指數(shù)上的變化(見表7),若方法因子有獨(dú)特貢獻(xiàn),則模型1的擬合度更高,Δχ2=1054.33(p<0.001),ΔCFI為0.22,ΔTFI為0.24。結(jié)果發(fā)現(xiàn),無(wú)方法因子的嵌套模型的擬合度是不可接受的,存在方法因子的模型1與數(shù)據(jù)的擬合度更好,說明方法因子對(duì)模型的擬合有獨(dú)特貢獻(xiàn)。
我國(guó)公務(wù)員大規(guī)模結(jié)構(gòu)化面試與前人研究中涉及的企業(yè)面試具有不同的特點(diǎn)。公務(wù)員面試時(shí)間相對(duì)較短但應(yīng)試者的人數(shù)更多,同時(shí)參與評(píng)價(jià)的面試官人數(shù)也非常多。研究采用公務(wù)員面試的真實(shí)數(shù)據(jù),探討了結(jié)構(gòu)化面試的構(gòu)想效度。研究發(fā)現(xiàn),在我國(guó)公務(wù)員大規(guī)模面試情景中結(jié)構(gòu)化面試的構(gòu)想效度良好,測(cè)評(píng)了內(nèi)在因素(分析能力、計(jì)劃能力、人際能力、應(yīng)急處置能力)和外在因素(語(yǔ)言表達(dá)、舉止儀表)兩維構(gòu)想,并未出現(xiàn)前人研究中的“效度悖論”(Van Iddekinge et al.,2005),效度悖論是指預(yù)測(cè)效度良好而構(gòu)想效度缺失(Arthur,2000)。
此外研究中的樣本選擇的是真實(shí)的公務(wù)員應(yīng)試者,在應(yīng)試動(dòng)機(jī)、年齡、性別、學(xué)歷、考試指導(dǎo)等可能影響面試評(píng)分的因素均與實(shí)際公務(wù)員面試一致,收集的面試數(shù)據(jù),來(lái)源于真實(shí)的面試現(xiàn)場(chǎng)與既往研究中使用實(shí)驗(yàn)室模擬面試數(shù)據(jù)不同,生態(tài)效度高于模擬面試(Kleinmann & Klehe,2011)。從分析方法的角度看,既采用信度分析和因素分析,也采用了多質(zhì)多法分析,盡量降低單一測(cè)評(píng)方法或同一測(cè)評(píng)者測(cè)評(píng)引起的信息偏差或缺失,進(jìn)一步分離測(cè)評(píng)方法和測(cè)評(píng)構(gòu)想帶來(lái)的變異(Geiser,Eid,Nussbeck,Courvoisier,& Cole,2010),符合現(xiàn)代效度理論驗(yàn)證范式(關(guān)丹丹,車宏生,2010),研究結(jié)果的可信度更高。
從測(cè)評(píng)要素的角度看,Huffcutt(2011)提出面試主要測(cè)評(píng)了三類構(gòu)想:工作相關(guān)因素、臨場(chǎng)表現(xiàn)因素和人口統(tǒng)計(jì)學(xué)因素。但由于研究中的面試屬結(jié)構(gòu)化面試,結(jié)構(gòu)化程度降低了人口統(tǒng)計(jì)學(xué)因素對(duì)面試評(píng)分的影響(Melchers,Lienhardt,Von Aarburg,& Kleinmann,2011)。因此,結(jié)構(gòu)化面試的測(cè)評(píng)呈現(xiàn)二維構(gòu)想:內(nèi)在因素(分析能力、計(jì)劃能力、人際能力、應(yīng)急處置能力)和外在因素(語(yǔ)言表達(dá)、舉止儀表)。與Huffcutt(2011)研究結(jié)果相互印證,即面試測(cè)量了工作相關(guān)因素和臨場(chǎng)表現(xiàn)因素。由此可見,面試官在評(píng)價(jià)考生外在因素時(shí)所關(guān)注的言語(yǔ)表達(dá)和舉止儀表測(cè)評(píng)要素,正是面試中人際溝通能力的外顯行為,大規(guī)模公務(wù)員面試時(shí)間緊面試考生人數(shù)多,考官依據(jù)易于觀察的外顯行為對(duì)考生特質(zhì)溝通能力進(jìn)行了快速評(píng)價(jià)。但是,這種大規(guī)模公務(wù)員面試考官面試評(píng)價(jià)的分?jǐn)?shù)是否有效,預(yù)測(cè)效度如何?顯然還應(yīng)該進(jìn)一步收集公務(wù)員入職后的工作績(jī)效數(shù)據(jù)即效標(biāo)數(shù)據(jù)進(jìn)行深入分析。
關(guān)丹丹, 車宏生.(2010).現(xiàn)代效度理論與效驗(yàn)方法述評(píng).心理科學(xué),33(3),654-656.
洪自強(qiáng), 嚴(yán)進(jìn).(2003).結(jié)構(gòu)化面試構(gòu)思效度現(xiàn)場(chǎng)研究.南開管理評(píng)論,(4),21-24.
侯杰泰,溫忠麟, 成子娟.(2004).結(jié)構(gòu)方程模型及其應(yīng)用.教育科學(xué)出版社.
田效勛, 車宏生.(2009).面試預(yù)測(cè)效度和構(gòu)想效度研究述評(píng).心理科學(xué)進(jìn)展,17(4),870-876.
屠金路,王庭照, 金瑜.(2010).結(jié)構(gòu)方程模型下多因子非同質(zhì)測(cè)量合成分?jǐn)?shù)的信度估計(jì).心理科學(xué),33(3),666-669.
王忠軍, 龍立榮.(2006).評(píng)價(jià)中心的結(jié)構(gòu)效度研究.心理科學(xué)進(jìn)展,14(3),426-432.
溫忠麟, 葉寶娟.(2011).測(cè)驗(yàn)信度估計(jì):從α系數(shù)到內(nèi)部一致性信度.心理學(xué)報(bào),43(7),821-829.
徐建平,周瀚,李文雅,陳孚, 張偉.(2014).結(jié)構(gòu)化面試中面試官的評(píng)分及影響因素.心理科學(xué)進(jìn)展,14(2),357-368.
徐淑英, 呂力.(2015).中國(guó)本土管理研究的理論與實(shí)踐問題:對(duì)徐淑英的訪談.管理學(xué)報(bào),(3),313-321.
Arthur,W.(2000).Convergent and discriminant validity of assessment center dimensions:A conceptual and empirical reexamination of the assessment center construct-related validity paradox.JournalofManagement,26(4),813-835.
Barrick,M.R.,Shaffer,J.A.,& DeGrassi,S.W.(2009).What you see may not be what you get:Relationships among self-presentation tactics and ratings of interview and job performance.JournalofAppliedPsychology,94(6),1394-1411.
Bentler,P.M.(1990).Comparative fit indexes in structural models.PsychologicalBulletin,107(2),238-246.
Bentler,P.M.,& Dudgeon,P.(1996).Covariance structure analysis:Statistical practice,theory,and directions.AnnualReviewofPsychology,47 ,563-592.
Campbell,D.T.,& Fiske,D.W.(1959).Convergent and discriminant validation by the multitrait-multimethod matrix.PsychologicalBulletin,56(2),81-105.
Cronbach,L.J.,& Meehl,P.E.(1955).Construct validity in psychological tests.PsychologicalBulletin,52(4),281-302.
De Vos,A.,De Hauw,S.,& Van der Heijden,B.I.(2011).Competency development and career success:The mediating role of employability.JournalofVocationalBehavior,79(2),438-447.
DeGroot,T.,& Kluemper,D.H.(2007).Evidence of predictive and incremental validity of personality factors,vocal attractiveness and the situational interview.InternationalJournalofSelectionandAssessment,15(1),30-39.
Geiser,C.,Eid,M.,Nussbeck,F(xiàn).W.,Courvoisier,D.S.,& Cole,D.A.(2010).Analyzing true change in longitudinal multitrait-multimethod studies:Application of a multimethod change model to depression and anxiety in children.DevelopmentalPsychology,46(1),29-45.
Hendry,M.C.,Douglas,K.S.,Winter,E.A.,& Edens,J.F.(2013).Construct measurement quality improves predictive accuracy in violence risk assessment:An illustration using the personality assessment inventory.BehavioralSciences&theLaw,31(4),477-493.
Hu,L.-t.,& Bentler,P.M.(1999).Cutoff criteria for fit indexes in covariance structure analysis:Conventional criteria versus new alternatives.StructuralEquationModeling-aMultidisciplinaryJournal,6(1),1-55.
Huffcutt,A.I.(2011).An empirical review of the employment interview construct literature.InternationalJournalofSelectionandAssessment,19(1),62-81.
Huffcutt,A.I.,& Arthur,W.(1994).Hunter and hunter(1984)revisited-interview validity for entry-level jobs.JournalofAppliedPsychology,79(2),184-190.
Huffcutt,A.I.,Conway,J.M.,Roth,P.L.,& Stone,N.J.(2001).Identification and meta-analytic assessment of psychological constructs measured in employment interviews.JournalofAppliedPsychology,86(5),897-913.
Huffcutt,A.I.,Culbertson,S.S.,& Weyhrauch,W.S.(2014).Moving forward indirectly:Reanalyzing the validity of employment interviews with indirect range restriction methodology.InternationalJournalofSelectionandAssessment,22(3),297-309.
Huffcutt,A.I.,Van Iddekinge,C.H.,& Roth,P.L.(2011).Understanding applicant behavior in employment interviews:A theoretical model of interviewee performance.HumanResourceManagementReview,21(4),353-367.
Kenny,D.A.,& Kashy,D.A.(1992).Analysis of the multitrait-multimethod matrix by confirmatory factor analysis.PsychologicalBulletin,112(1),165.
Kleinmann,M.,& Klehe,U.C.(2011).Selling oneself:Construct and criterion-related validity of impression management in structured interviews.HumanPerformance,24(1),29-46.
Kluemper,D.H.,McLarty,B.D.,Bishop,T.R.,& Sen,A.(2014).Interviewee selection test and evaluator assessments of general mental ability,emotional intelligence and extraversion:Relationships with structured behavioral and situational interview performance.JournalofBusinessandPsychology,1-21.
Koch,T.,Schultze,M.,Eid,M.,& Geiser,C.(2014).A longitudinal multilevel cfa-mtmm model for interchangeable and structurally different methods.FrontiersinPsychology,5(311),311-313.
Lance,C.E.,Noble,C.L.,& Scullen,S.E.(2002).A critique of the correlated trait-correlated method and correlated uniqueness models for multitrait-multimethod data.PsychologicalMethods,7(2),228.
Levashina,J.,Hartwell,C.J.,Morgeson,F(xiàn).P.,& Campion,M.A.(2014).The structured employment interview:Narrative and quantitative review of the research literature.PersonnelPsychology,67(1),241-293.
Marsh,H.W.,& Bailey,M.(1991).Confirmatory factor analyses of multitrait-multimethod data:A comparison of alternative models.AppliedPsychologicalMeasurement,15(1),47-70.
Marsh,H.W.,Hau,K.T.,Balla,J.R.,& Grayson,D.(1998).Is more ever too much? The number of indicators per factor in confirmatory factor analysis.MultivariateBehavioralResearch,33(2),181-220.
McCARTHY,J.M.,Van Iddekinge,C.H.,& Campion,M.A.(2010).Are highly structured job interviews resistant to demographic similarity effects?PersonnelPsychology,63(2),325-359.
Melchers,K.G.,Lienhardt,N.,Von Aarburg,M.,& Kleinmann,M.(2011).Is more structure really better? A comparison of frame-of-reference training and descriptively anchored rating scales to improve interviewers’ rating quality.PersonnelPsychology,64(1),53-87.
Nunnally,J.C.,& Bernstein,I.H.(2010).Psychometrictheory(3Edition).New York:McGraw-Hill Education.
Peterson,N.G.,Mumford,M.D.,Borman,W.C.,Jeanneret,P.,& Fleishman,E.A.(1999).Anoccupationalinformationsystemforthe21stcentury:ThedevelopmentofO*NET.American Psychological Association.
Podsakoff,P.M.,MacKenzie,S.B.,Lee,J.Y.,& Podsakoff,N.P.(2003).Common method biases in behavioral research:A critical review of the literature and recommend ed remedies.JournalofAppliedPsychology,88(5),879-903.
Pulakos,E.D.,& Schmitt,N.(1995).Experience-based and situational interview questions - studies of validity.PersonnelPsychology,48(2),289-308.
Revelle,W.,& Zinbarg,R.E.(2009).Coefficients alpha,beta,omega,and the glb:Comments on sijtsma.Psychometrika,74(1),145-154.
Salgado,J.F.,& Moscoso,S.(2002).Comprehensive meta-analysis of the construct validity of the employment interview.EuropeanJournalofWorkandOrganizationalPsychology,11(3),299-324.
Schermelleh-Engel,K.,Moosbrugger,H.,& Müller,H.(2003).Evaluating the fit of structural equation models:Tests of significance and descriptive goodness-of-fit measures.MethodsofPsychologicalResearchOnline,8(2),23-74.
Thompson,B.,& Daniel,L.G.(1996).Factor analytic evidence for the construct validity of scores:A historical overview and some guidelines.EducationalandPsychologicalMeasurement,56(2),197-208.
Van Iddekinge,C.H.,Raymark,P.H.,Eidson,C.E.,& Attenweiler,W.J.(2004).What do structured selection interviews really measure?The construct validity of behavior description interviews.HumanPerformance,17(1),71-93.
Van Iddekinge,C.H.,Raymark,P.H.,& Roth,P.L.(2005).Assessing personality with a structured employment interview:Construct-related validity and susceptibility to response inflation.JournalofAppliedPsychology,90(3),536-552.
Zibarras,L.D.,& Woods,S.A.(2010).A survey of UK selection practices across different organization sizes and industry sectors.JournalofOccupationalandOrganizationalPsychology,83(2),499-511.
Ziegler,M.,Dietl,E.,Danay,E.,Vogel,M.,& Buehner,M.(2011).Predicting training success with general mental ability,specific ability tests,and(un)structured interviews:A meta-analysis with unique samples.InternationalJournalofSelectionandAssessment,19(2),170-182.
What Do Civil Servant Selection Interviews Really Measure?The Construct Validity of Structured Interview Evidence from China
Li Yingwu Yu Zhou Peng Kunxiali Wei Minyuan
(Department of Psychology,Renmin University of China,Beijing 100872)
Meta-analysis confirmed that the interview can predict work performance,but the prediction mechanism is unclear.The APA latest Standard psychological and educational Testing(2014 Edition)propose that,explore the validity of the interview should collect multi perspective evidence.Follow this suit,this study according to the multicast data(multi - wave data)research paradigm,method of combining multiple mass model,methods of confirmatory factor analysis,to select several central state administrative organs during 2013 to 2014 1069 civil servants interview candidates interview data(archival data)interaction idea of validity of the civil servants interviews.The results showed that the civil servants interviews in China internal factors and external factors in two dimensions support the interview the two-dimensional theory.
civil servant;interview;multi wave data;construct validity
國(guó)家社科基金一般項(xiàng)目(14BZZ087)。
李英武,E-mail:liyingwu@126.com;魏敏媛,E-mail:weiminyuan0430@163.com。
B841.2
A
1003-5184(2016)05-0472-09