公務員面試測量了什么？我國公務員面試的構想效度*

2016-11-26 06:28:40李英武彭坤霞麗魏敏媛

心理學探新 2016年5期

關鍵詞：應試者效度特質

李英武于宙彭坤霞麗魏敏媛

(中國人民大學心理學系，北京 100872)

公務員面試測量了什么？我國公務員面試的構想效度*

李英武于宙彭坤霞麗魏敏媛

(中國人民大學心理學系，北京 100872)

元分析證實面試可預測工作績效，但其預測機制尚不明確。最新版Standard psychological and educational Testing(2014Edition)建議，探索面試的構想效度應收集多方面證據。參照多波數據(multi-wave data)研究范式，結合多質多法模型、驗證性因素分析等方法，選取3家中央國家行政機關在2013至2014期間公務員面試中1069名應試者面試檔案數據(archival data)交互驗證公務員面試的構想效度。結果表明，我國公務員面試測評了內在因素和外在因素兩個維度，支持面試構想的二維理論。

公務員；面試；多波數據；構想效度

1 問題提出

面試是應用最廣泛的人事選拔方法(Zibarras & Woods，2010)。所謂面試，即由一個或多個面試官與應試者進行人際互動，就應試者是否可以滿足特定崗位需求進行評估，這一過程稱之為面試(Levashina，Hartwell，Morgeson，& Campion，2014)?；诓僮鞯臉藴驶潭?，面試可分為結構化面試和非結構化面試。結構化面試(Structured Interview)，又稱標準化面試(Standardized Interview)，是一種相對穩(wěn)定的面試，它強調面試內容的工作相關性、面試流程標準化、評分結構化，即面試官以相同的方式，向應試者提出相同的問題，并以相同的標準評價應試者(Huffcutt，Van Iddekinge，& Roth，2011)。2015年11月18日中組部、人力資源和社會保障部和國家公務員局聯合頒布《公務員錄用面試組織管理辦法(試行)》，規(guī)定中進一步明確中央國家機關“面試方法以結構化面試和無領導小組討論為主，也可以采取其他測評方法”。那么，為什么中央國家機關在選拔招錄公務員時要以結構化面試為主呢？其原因一是在于結構化面試采用標準化施測程序可以降低應試者間的程序差異，減少面試官在面試過程中的隨意性(Huffcutt，Culbertson，& Weyhrauch，2014)，減少過程偏差(Koch，Schultze，Eid，& Geiser，2014)。同時，結構化面試受混淆變量，如面試官自身特點(Kluemper et al.，2014)、應試者外貌(Barrick，Shaffer，& DeGrassi，2009)、印象管理(Alkhouri，2012)、種族(McCARTHY，Van Iddekinge，& Campion，2010)等因素相對于非結構化面試來說要低些，這樣就為“面試的程序公平性”奠定了基礎。

此外，結構化面試預測效度的大量實證研究發(fā)現，結構化面試可以預測多種工作相關效標(Kluemper，McLarty，Bishop，& Sen，2014；Ziegler，Dietl，Danay，Vogel，& Buehner，2011)，也可以為其他測評方法提供增量效度(DeGroot & Kluemper，2007)，這樣就為“面試的效果科學性”提供了數據支撐。

然而，上述結論的導出依賴于重要的邏輯前提，就是考官在結構化面試中評價了哪些維度？這就是心理測量學中測量的“構想效度問題”。梳理現有國內外文獻后可見，結構化面試構想效度的研究相對不夠充分(Levashina et al.，2014)，并未得出一致結論。主要包括以下幾種觀點：

面試構想的一維論：Pulakos和Schmitt(1995)采用信度分析和探索性因素分析，發(fā)現8個結構化面試的測評要素(組織計劃、高效參與、評估信息、積極主動性、適應變化、身體素質、誠實守信、口頭溝通)只能抽取出一個特征根大于1的因子。洪自強和嚴進(2003)采用同種方法，在我國企業(yè)招聘中驗證了以上研究結果。

面試構想的多維論：Salgado和Moscoso(2002)采用元分析技術，收集傳統(tǒng)面試和行為面試研究數據，發(fā)現傳統(tǒng)面試測量了四個成分：一般心理能力(GMA)、工作經驗、大五人格維度以及社交技能。Huffcutt(2001)等同樣采用元分析技術，發(fā)現47 項招聘面試研究的預設測評構想分為七大類。以上研究發(fā)現，結構化面試可用于測評多維構想。

面試構想的零維論：也有研究認為，結構化面試并不存在真正的構想效度。Van Iddekinge 等(2004)分析了兩類用于選拔客戶服務經理結構化面試的構想效度，采用多質多法分析，發(fā)現其區(qū)分效度大于聚合效度。由于多質多法分析自身缺乏可靠的量化指標的，因此，Van Iddekinge 等(2004)開創(chuàng)性的采用驗證性因素分析，構建不包含方法因子或特質因子的嵌套模型，由擬合指數衡量不同成分對模型擬合度的貢獻。進一步采用驗證性因素分析發(fā)現，面試評分受面試官因素和應試者因素影響較大，面試評分與面試的測評要素相關較低。因此，結構化面試構想效度較差。Van Iddekinge等(2005)采用模擬結構化面試測評人格，驗證了以上結果。

總結現有結構化面試構想效度研究可得出如下結論：結構化面試究竟測量了哪些構想，測評了幾維構想，仍未得出一致結論。此外，上述研究數據多來源企業(yè)數據，而基于中國公務員大規(guī)模面試的現場數據研究還相對缺乏。

雖然面試構想效度研究缺乏一致結論，但構想效度研究有重要意義。首先，有助于提高整個選拔系統(tǒng)的經濟性和預測效度。如果面試測量的構想與可以采用低成本的紙筆測驗測量的構想相關度過高，面試便失去了價值。面試應更關注其他選拔方式難以測評的特質，提高增量效度。第二，結構化面試構想效度的研究對組織實踐有重要意義。面試過后，組織往往會基于對應試者的評價進行培訓與開發(fā)(De Vos，De Hauw，& Van der Heijden，2011)。如果結構化面試沒有測評預設構想，那么評價結果不精確，據此進行的開發(fā)，有效性存疑。第三，也是最重要的一點，構想效度研究可以解釋結構化面試預測效度的機制(王忠軍，龍立榮，2006)，即結構化面試所測構想與工作績效等效標的高度相關，以此解釋結構化面試高預測效度的背后機制。假設，結構化面試是GMA與人格的有效測評工具，而GMA和人格與工作績效高度相關，這便可以解釋結構化面試高預測效度的機制。構想效度的提高可以進一步提高預測效度(Hendry，Douglas，Winter，& Edens，2013)。

同時，發(fā)掘中國管理實踐中值得研究的重要問題，是確保研究結果產生廣泛社會影響的重要途徑(徐淑英，呂力，2015)。目前結構化面試已經廣泛應用于我國人事選拔領域(田效勛，車宏生，2009)，探討結構化面試的構想效度成為需要重點關注的研究問題。

基于此，采用我國真實情景中公務員大規(guī)模面試數據，按照Cronbach和Meehl(1955)提出的研究范式，采用信度分析、因素分析、多質多法分析等多種方法，基于內部一致性信度、因子載荷等多個指標檢驗結構化面試的構想效度，評估結構化面試的構想效度。

2 研究工具及方法

2.1 被試

基于研究目的，采用多波數據(multi-wave data)相互驗證。選用三批不同年份(2013、2014)、不同政府部門的面試數據，隨機分配于三部分分析。2013機構一數據(N=353)用于探索性因素分析和信度分析，2013機構二數據(N=380)數據用于驗證性因素分析，2014機構一數據(N=336)用于多質多法分析。三批數據共有269名面試官參加，每位應試者由標準面試官小組(Interviewer Panel)評分。將參加面試的1069位應試者的面試相關數據全部納入分析，包括測評要素分和總分，應試者人口統(tǒng)計學特征見表1。

表1 應試者人口統(tǒng)計學變量

2.2 結構化面試測評要素

結構化面試題目由公務員考試研究機構開發(fā)而成。結構化面試測評要素的開發(fā)，是在《國家公務員通用能力標準框架(試行)》中列出的通用能力的基礎上，對擬錄取崗位進行了工作分析，確定分析能力、計劃能力、人際能力、應急處置、語言表達、舉止儀表等六個測評要素。通過公務員面試職位專家的焦點小組討論，最終確定：分析能力、計劃能力、人際能力、應急處置能力的權重為20%，語言表達、舉止儀表的權重為10%。每道題目包含一個或多個測評要素，原因在于：實踐中很難有單一考察某一特定測評要素的面試題目；符合《國家公務員錄用面試暫行辦法》中的命題原則；從心理測量學的角度，Van Iddekinge等(2004)提出，設定跨題目評價維度可提高面試的構想效度。基于Van Iddekinge等(2004)提出的：在構想效度研究中，不同面試題本和不同面試形式均可視作不同的方法，研究中收集四套面試題本符合多波數據研究范式和多質多法分析的前提。

2.3 面試評分方法

面試前對所有面試官進行評分相關培訓，便于面試官準確把握評分標準，提高面試官間評分一致性。面試過程中，所有應試者提問順序相同、面試官相同、施測環(huán)境盡量保持一致。面試采用標準面試官小組(徐建平，周瀚，李文雅，陳孚，張偉，2014)，面試時長約為20分鐘。面試中，每名面試官在應試者回答完每個問題后，立刻獨立對應試者基于行為錨定量表打分，以最小化一般印象效應(General Impression Effect)(Van Iddekinge et al.，2004)。面試官組按照“題目—題—要素”順序，對應試者的面試表現進行評價，面試分數按照測評要素匯總，得出每一應試者的不同測評要素得分，最后將所有測評要素的得分相加得出應試者的面試總分。根據Huffcutt和Arthur(1994)對面試結構化程度的分類標準，研究中的關注的面試是高度結構化面試。

2.4 構想效度的分析方法

近年來，面試構想效度研究出現了綜合實驗證據或理論數據，以驗證選拔方法測評特質的充分性和恰當性的趨勢(關丹丹，車宏生，2010)。據此，研究采用多種方法分析結構化面試的構想效度：內部一致性信度、因素分析、多質多法分析等。

采用經典的內部一致性信度評價構想效度(Cronbach & Meehl，1955)。內部一致性是題目之間的相關性(Revelle & Zinbarg，2009)，如果同一維度內部的題目之間相關高，則可認為該結構化面試的構想效度高。采用因素分析衡量結構化面試的構想效度(Thompson & Daniel，1996)。對結構化面試的測評要素進行探索性因素分析，找出結構化面試評分中的共同因素，用測評要素在共同因素上的因子載荷衡量結構化面試的構想效度；再用驗證性因素分析驗證結構化面試的構想效度。用多質多法分析評估面試的聚合效度和區(qū)分效度，分別計算出任意兩套題本測量同一種特質的相關，和同一題本測量不同特質的相關，聚合效度顯著高于區(qū)分效度，則說明結構化面試的構想效度高(Campbell & Fiske，1959)。若用多種相似的方法測量同一種特質相關較高，或用相似方法測量不同特質相關較低，則說明測量的構想效度高。由于傳統(tǒng)的通過相關矩陣計算平均相關系數的多質多法模型缺乏可靠指標衡量模型的擬合程度，因此進一步采用驗證性因素分析量化多質多法模型的擬合效果(Kenny & Kashy，1992；Van Iddekinge et al.，2004)。出于控制共同方法偏差(Podsakoff，MacKenzie，Lee，& Podsakoff，2003)的需要，研究中的七人面試小組抽簽產生，并不固定，無法提供面試官因子，因此在驗證性因素分析中，僅構建了包含特質因子和方法因子的嵌套模型。

3 結果分析

3.1 結構化面試探索性因素分析

采用探索性因素分析檢驗結構化面試的構想效度，通過分析提取面試公因子，探索結構化面試測評維度。首先檢驗數據是否適合進行探索性因素分析，依照Kaiser-Meyer-Olkin(KMO)和Barlett Test of Sphericity檢驗，得出KMO=0.847>0.80，Bartlett.s Test=6620.98，顯著性水平為0.000，表明各測評要素間存在共同因素可以進行探索性因素分析。

采用主成分分析法抽取公因子結果發(fā)現，特征值大于1的公因子有2個，兩個因素總貢獻率為80.92%，解釋變異達到可接受水平。采用最大方差法旋轉，每一測評要素的在相應維度上的因子載荷均大于0.80(見表2)，構想效度良好。因此，探索性因素分析發(fā)現，結構化面試測評二維構想，構想效度良好。

表2 結構化面試的因子載荷表

注：加粗字體為該測評要素在相應維度上的因子載荷

3.2 結構化面試的驗證性因素分析

探索性因素分析主要是由數據驅動，單純分析數據結構，對于后期理論解釋的適應性關注不夠。相對來說，驗證性因素分析是先構建理論框架再驗證數據的擬合度。接下來采用另一批數據，通過驗證性因素分析進一步檢驗結構化面試的構想效度。

根據探索性因素分析和前人研究的結果設定不同模型。二維模型：基于探索性因素分析的結果設定；單維模型：Pulakos和Schmitt(1995)前人研究提出結構化面試測評一維構想；三維模型：Huffcutt(2011)提出結構化面試測評多維構想，同時，結合驗證性因素分析對觀察指標數和因素數的要求(模型識別要求每個因素上至少有2個觀察指標(侯杰泰，溫忠麟，成子娟，2004)，設定三因素模型。在社會學中，對所有相關條目測量值作為對該潛變量的測量，其劃分標準為α≥7.0(Nunnally，2010)。也就是說α=7.0是一個合成測量最低可接受的信度。據此，分別計算前四個觀察指標兩兩之間的α系數，其中，只有分析能力和計劃能力(0.81)、人際能力和應急處置(0.78)的α系數大于0.70。基于此，確定三因素模型的觀察指標劃分，即分析能力和計劃能力歸為一個因素，人際能力和應急處置歸為一個因素，語言表達和舉止儀表歸為一個因素。

采用Mplus7.0，運用極大似然法對三個競爭模型進行驗證性因素分析。模型中數據的N/t遠大于100：1，樣本量較大，對擬合指數較為有利(Marsh，Hau，Balla，& Grayson，1998)?；贖u和Bentler(1999)推薦的擬合指數衡量模型：χ2/df、RMSEA、CFI、TFI等。RMSEA小于0.05說明擬合度非常好，小于0.10都是可接受的(Schermelleh-Engel，Moosbrugger，& Müller，2003)。CFI是比較擬合指數，其值大于0.90說明擬合度很好，如果接近0.95說明擬合度非常好(Bentler & Dudgeon，1996)。TFI是非常態(tài)擬合指數，大于0.90則認為方程擬合度較好(侯杰泰等，2004；Bentler，1990)。

研究發(fā)現僅有二因素模型的各項擬合指數均在0.90以上(見表3)，三因素模型和單因素模型的TFI均小于0.90，說明僅有二因素模型總體擬合良好。接下來，具體分析二因素模型的標準化載荷，二因素模型中每個測評要素在預設構想上的標準化載荷均在0.60以上，大部分在0.70以上(見圖1)。綜上，可認為分析結果符合一個擬合較好的模型對系數大小的要求，二因素模型的擬合程度良好。這進一步表明結構化面試測評了二維構想，將這兩個維度分別命名為內在因素和外在因素。

表3 多個模型擬合指數

圖1 二因素模型的標準化載荷

3.3 結構化面試的描述性統(tǒng)計和信度分析

研究發(fā)現結構化面試測評存在二維構想，基于此對四套題本進行信度(內部一致性信度)分析，結果見表4。由于誤差不相關，所以采用α系數計算內部一致性信度(溫忠麟，葉寶娟，2011)。α系數是從測評要素之間的關系出發(fā)衡量信度，反映組成測驗的測評要素內部一致性的程度(屠金路，王庭照，金瑜，2010)。四套題本的兩個維度的平均數、標準差之間無顯著差異，但是外在因素的標準差顯著小于內在因素的標準差，這可能是由于內在因素可用的評分等級多于外在因素。四套題本的內部一致性信度為0.80～0.90之間，均在0.81以上，表明不同構想的評分要素之間一致性高。四套題本兩個維度的內部一致性信度為0.75～0.92，說明四套題本不同維度的內部一致性信度較高，每個維度內的不同測量指標評估同一特質。

表4 四套題本測評兩個維度的描述性統(tǒng)計

3.4 結構化面試的多質多法分析

研究中結構化面試采用多套題本，不同題本可認為是不同方法(Van Iddekinge et al.，2004)，符合多波數據研究范式的前提。此外，集合多質多法分析(MTMM，multitrait-multimethod)，基于維度之間的聚合效度和區(qū)分效度檢驗結構化面試的構想效度(Campbell & Fiske，1959)。聚合效度是相同維度的不同題本之間的平均相關系數；區(qū)分效度是相同題本測量不同維度的平均相關系數。

計算四套題本測評兩個維度的積差相關系數，表5呈現了八個變量之間的零階相關矩陣。結果表明，四套題本測評兩個維度的相關系數為0.16～0.92，均達到0.01水平上的顯著。表中斜體數值表示同一題本測評不同維度之間的相關，四套題本兩個維度之間的相關為0.16～0.68，通過R-Z轉換，計算區(qū)分效度，區(qū)分效度為0.41。表中加粗的數值表示不同題本測評同一維度之間的相關，四套題本測評內在因素的相關為0.91～0.94，四套題本測評外在因素的相關為0.21～0.46。同樣，通過R-Z轉換計算聚合效度，總聚合效度為0.76，在內在因素上的聚合效度為0.93，在外在因素上的聚合效度為0.35。結果顯示，總聚合效度大于區(qū)分效度，結構化面試的構想效度良好，測評二維構想。從具體維度來說，外在因素的聚合效度小于內在因素。

表5 四套題本測評兩個維度的相關分析結果

注：A1即第一套題本的內在因素特質，A2為第一套題本的外在因素；以此類推；**p<0.01；表中加粗字體為聚合效度，斜體為區(qū)分效度。

3.5 結構化面試多質多法模型的驗證性因素分析

由于傳統(tǒng)的通過相關矩陣計算平均相關系數的多質多法分析缺乏可靠的量化指標衡量模型的擬合程度，因此，采用驗證性因素分析驗證多質多法模型的擬合程度。為了分析四套題本測評兩維度的聚合效度和區(qū)分效度，研究構建一系列的嵌套模型(Lance，Noble，& Scullen，2002)，應用Mplus7.0軟件處理結構化面試的多質多法數據，用極大似然法估計模型的擬合度(Kenny & Kashy，1992)。

研究構建的全模型，包括四個方法因子，兩個特質因子。每套題本的測評要素作為模型的指標，四套題本分別作為模型的四個方法因子，內在因素和外在因素作為模型的兩個特質因子，模型中的每一個指標都歸屬于1個方法因子和1個特質因子。多質多法模型的擬合指數見表6的模型1，其中RMSEA為0.05，CFI為0.94，TFI為0.93，均大于0.90，接近0.95，因此模型擬合度較高。

多質多法模型的指標在特質因子和方法因子上的載荷見表6。多質多法模型的指標在特質因子上載荷越高表明測評工具的聚合效度越好，同時，多質多法模型的指標在方法因子上的載荷越低，表明同一方法測評的不同特質的區(qū)分效度越低，聚合效度大于區(qū)分效度，則說明結構化面試的構想效度良好。從表6呈現的結果分析中可以看出，總體上，四套題本在特質因子上的載荷高于方法因子上的載荷。具體來說，第二套題本和第四套題本在特質因子上的載荷大于在方法因子上的載荷；第一套題本和第三套題本中部分測評要素在特質因子上的載荷大于在方法因子上的載荷；無論哪套題本，舉止儀表要素在特質因子上的因子載荷均大于在方法因子上的因子載荷?？傊?，結構化面試測評二維構想，構想效度良好，僅有個別測評要素需要進一步完善。

表6 多質多法模型的指標在特質因子和方法因子上的載荷(STDYX標準模型)

注：A1即第一套題本的內在因素特質，A2為第一套題本的外在因素。A11～A14為屬于A1維度的四個測評要素；以此類推。

進而，構建不同嵌套模型，分析不同題本測評相同特質的聚合效度和相同題本測評不同特質的區(qū)分效度。各模型的指標相同，潛變量設定不同。以全模型為基準模型，設為模型1，比較不同在擬合指數上的差異。為了檢驗不同題本測評相同特質的聚合效度，建立模型2，僅設定四個方法因子，無特質因子。比較模型1與模型2在擬合指數上的變化，若特質因子有獨特貢獻，則模型的擬合度更高。模型擬合指數有一定的改變(見表7)，Δχ2=303.80(p<0.001)，ΔCFI為0.06，ΔTFI為0.06，結果表明存在特質因子的模型1與數據的擬合情況更好，反應出特質因子對模型的擬合有獨特貢獻。

表7 嵌套模型和全模型的擬合指數

注：模型1：全模型；模型2：僅有方法因子；模型3僅有特質因子。

為了考察相同題本測評應試者不同能力的區(qū)分效度，建立模型3，僅設定2個特質因子，無方法因子。比較模型1和模型3在擬合指數上的變化(見表7)，若方法因子有獨特貢獻，則模型1的擬合度更高，Δχ2=1054.33(p<0.001)，ΔCFI為0.22，ΔTFI為0.24。結果發(fā)現，無方法因子的嵌套模型的擬合度是不可接受的，存在方法因子的模型1與數據的擬合度更好，說明方法因子對模型的擬合有獨特貢獻。

4 討論

我國公務員大規(guī)模結構化面試與前人研究中涉及的企業(yè)面試具有不同的特點。公務員面試時間相對較短但應試者的人數更多，同時參與評價的面試官人數也非常多。研究采用公務員面試的真實數據，探討了結構化面試的構想效度。研究發(fā)現，在我國公務員大規(guī)模面試情景中結構化面試的構想效度良好，測評了內在因素(分析能力、計劃能力、人際能力、應急處置能力)和外在因素(語言表達、舉止儀表)兩維構想，并未出現前人研究中的“效度悖論”(Van Iddekinge et al.，2005)，效度悖論是指預測效度良好而構想效度缺失(Arthur，2000)。

此外研究中的樣本選擇的是真實的公務員應試者，在應試動機、年齡、性別、學歷、考試指導等可能影響面試評分的因素均與實際公務員面試一致，收集的面試數據，來源于真實的面試現場與既往研究中使用實驗室模擬面試數據不同，生態(tài)效度高于模擬面試(Kleinmann & Klehe，2011)。從分析方法的角度看，既采用信度分析和因素分析，也采用了多質多法分析，盡量降低單一測評方法或同一測評者測評引起的信息偏差或缺失，進一步分離測評方法和測評構想帶來的變異(Geiser，Eid，Nussbeck，Courvoisier，& Cole，2010)，符合現代效度理論驗證范式(關丹丹，車宏生，2010)，研究結果的可信度更高。

從測評要素的角度看，Huffcutt(2011)提出面試主要測評了三類構想：工作相關因素、臨場表現因素和人口統(tǒng)計學因素。但由于研究中的面試屬結構化面試，結構化程度降低了人口統(tǒng)計學因素對面試評分的影響(Melchers，Lienhardt，Von Aarburg，& Kleinmann，2011)。因此，結構化面試的測評呈現二維構想：內在因素(分析能力、計劃能力、人際能力、應急處置能力)和外在因素(語言表達、舉止儀表)。與Huffcutt(2011)研究結果相互印證，即面試測量了工作相關因素和臨場表現因素。由此可見，面試官在評價考生外在因素時所關注的言語表達和舉止儀表測評要素，正是面試中人際溝通能力的外顯行為，大規(guī)模公務員面試時間緊面試考生人數多，考官依據易于觀察的外顯行為對考生特質溝通能力進行了快速評價。但是，這種大規(guī)模公務員面試考官面試評價的分數是否有效，預測效度如何？顯然還應該進一步收集公務員入職后的工作績效數據即效標數據進行深入分析。

關丹丹，車宏生.(2010).現代效度理論與效驗方法述評.心理科學，33(3)，654-656.

洪自強，嚴進.(2003).結構化面試構思效度現場研究.南開管理評論，(4)，21-24.

侯杰泰，溫忠麟，成子娟.(2004).結構方程模型及其應用.教育科學出版社.

田效勛，車宏生.(2009).面試預測效度和構想效度研究述評.心理科學進展，17(4)，870-876.

屠金路，王庭照，金瑜.(2010).結構方程模型下多因子非同質測量合成分數的信度估計.心理科學，33(3)，666-669.

王忠軍，龍立榮.(2006).評價中心的結構效度研究.心理科學進展，14(3)，426-432.

溫忠麟，葉寶娟.(2011).測驗信度估計：從α系數到內部一致性信度.心理學報，43(7)，821-829.

徐建平，周瀚，李文雅，陳孚，張偉.(2014).結構化面試中面試官的評分及影響因素.心理科學進展，14(2)，357-368.

徐淑英，呂力.(2015).中國本土管理研究的理論與實踐問題：對徐淑英的訪談.管理學報，(3)，313-321.

Arthur，W.(2000).Convergent and discriminant validity of assessment center dimensions：A conceptual and empirical reexamination of the assessment center construct-related validity paradox.JournalofManagement，26(4)，813-835.

Barrick，M.R.，Shaffer，J.A.，& DeGrassi，S.W.(2009).What you see may not be what you get：Relationships among self-presentation tactics and ratings of interview and job performance.JournalofAppliedPsychology，94(6)，1394-1411.

Bentler，P.M.(1990).Comparative fit indexes in structural models.PsychologicalBulletin，107(2)，238-246.

Bentler，P.M.，& Dudgeon，P.(1996).Covariance structure analysis：Statistical practice，theory，and directions.AnnualReviewofPsychology，47 ，563-592.

Campbell，D.T.，& Fiske，D.W.(1959).Convergent and discriminant validation by the multitrait-multimethod matrix.PsychologicalBulletin，56(2)，81-105.

Cronbach，L.J.，& Meehl，P.E.(1955).Construct validity in psychological tests.PsychologicalBulletin，52(4)，281-302.

De Vos，A.，De Hauw，S.，& Van der Heijden，B.I.(2011).Competency development and career success：The mediating role of employability.JournalofVocationalBehavior，79(2)，438-447.

DeGroot，T.，& Kluemper，D.H.(2007).Evidence of predictive and incremental validity of personality factors，vocal attractiveness and the situational interview.InternationalJournalofSelectionandAssessment，15(1)，30-39.

Geiser，C.，Eid，M.，Nussbeck，F.W.，Courvoisier，D.S.，& Cole，D.A.(2010).Analyzing true change in longitudinal multitrait-multimethod studies：Application of a multimethod change model to depression and anxiety in children.DevelopmentalPsychology，46(1)，29-45.

Hendry，M.C.，Douglas，K.S.，Winter，E.A.，& Edens，J.F.(2013).Construct measurement quality improves predictive accuracy in violence risk assessment：An illustration using the personality assessment inventory.BehavioralSciences&theLaw，31(4)，477-493.

Hu，L.-t.，& Bentler，P.M.(1999).Cutoff criteria for fit indexes in covariance structure analysis：Conventional criteria versus new alternatives.StructuralEquationModeling-aMultidisciplinaryJournal，6(1)，1-55.

Huffcutt，A.I.(2011).An empirical review of the employment interview construct literature.InternationalJournalofSelectionandAssessment，19(1)，62-81.

Huffcutt，A.I.，& Arthur，W.(1994).Hunter and hunter(1984)revisited-interview validity for entry-level jobs.JournalofAppliedPsychology，79(2)，184-190.

Huffcutt，A.I.，Conway，J.M.，Roth，P.L.，& Stone，N.J.(2001).Identification and meta-analytic assessment of psychological constructs measured in employment interviews.JournalofAppliedPsychology，86(5)，897-913.

Huffcutt，A.I.，Culbertson，S.S.，& Weyhrauch，W.S.(2014).Moving forward indirectly：Reanalyzing the validity of employment interviews with indirect range restriction methodology.InternationalJournalofSelectionandAssessment，22(3)，297-309.

Huffcutt，A.I.，Van Iddekinge，C.H.，& Roth，P.L.(2011).Understanding applicant behavior in employment interviews：A theoretical model of interviewee performance.HumanResourceManagementReview，21(4)，353-367.

Kenny，D.A.，& Kashy，D.A.(1992).Analysis of the multitrait-multimethod matrix by confirmatory factor analysis.PsychologicalBulletin，112(1)，165.

Kleinmann，M.，& Klehe，U.C.(2011).Selling oneself：Construct and criterion-related validity of impression management in structured interviews.HumanPerformance，24(1)，29-46.

Kluemper，D.H.，McLarty，B.D.，Bishop，T.R.，& Sen，A.(2014).Interviewee selection test and evaluator assessments of general mental ability，emotional intelligence and extraversion：Relationships with structured behavioral and situational interview performance.JournalofBusinessandPsychology，1-21.

Koch，T.，Schultze，M.，Eid，M.，& Geiser，C.(2014).A longitudinal multilevel cfa-mtmm model for interchangeable and structurally different methods.FrontiersinPsychology，5(311)，311-313.

Lance，C.E.，Noble，C.L.，& Scullen，S.E.(2002).A critique of the correlated trait-correlated method and correlated uniqueness models for multitrait-multimethod data.PsychologicalMethods，7(2)，228.

Levashina，J.，Hartwell，C.J.，Morgeson，F.P.，& Campion，M.A.(2014).The structured employment interview：Narrative and quantitative review of the research literature.PersonnelPsychology，67(1)，241-293.

Marsh，H.W.，& Bailey，M.(1991).Confirmatory factor analyses of multitrait-multimethod data：A comparison of alternative models.AppliedPsychologicalMeasurement，15(1)，47-70.

Marsh，H.W.，Hau，K.T.，Balla，J.R.，& Grayson，D.(1998).Is more ever too much? The number of indicators per factor in confirmatory factor analysis.MultivariateBehavioralResearch，33(2)，181-220.

McCARTHY，J.M.，Van Iddekinge，C.H.，& Campion，M.A.(2010).Are highly structured job interviews resistant to demographic similarity effects?PersonnelPsychology，63(2)，325-359.

Melchers，K.G.，Lienhardt，N.，Von Aarburg，M.，& Kleinmann，M.(2011).Is more structure really better? A comparison of frame-of-reference training and descriptively anchored rating scales to improve interviewers’ rating quality.PersonnelPsychology，64(1)，53-87.

Nunnally，J.C.，& Bernstein，I.H.(2010).Psychometrictheory(3Edition).New York：McGraw-Hill Education.

Peterson，N.G.，Mumford，M.D.，Borman，W.C.，Jeanneret，P.，& Fleishman，E.A.(1999).Anoccupationalinformationsystemforthe21stcentury：ThedevelopmentofO*NET.American Psychological Association.

Podsakoff，P.M.，MacKenzie，S.B.，Lee，J.Y.，& Podsakoff，N.P.(2003).Common method biases in behavioral research：A critical review of the literature and recommend ed remedies.JournalofAppliedPsychology，88(5)，879-903.

Pulakos，E.D.，& Schmitt，N.(1995).Experience-based and situational interview questions - studies of validity.PersonnelPsychology，48(2)，289-308.

Revelle，W.，& Zinbarg，R.E.(2009).Coefficients alpha，beta，omega，and the glb：Comments on sijtsma.Psychometrika，74(1)，145-154.

Salgado，J.F.，& Moscoso，S.(2002).Comprehensive meta-analysis of the construct validity of the employment interview.EuropeanJournalofWorkandOrganizationalPsychology，11(3)，299-324.

Schermelleh-Engel，K.，Moosbrugger，H.，& Müller，H.(2003).Evaluating the fit of structural equation models：Tests of significance and descriptive goodness-of-fit measures.MethodsofPsychologicalResearchOnline，8(2)，23-74.

Thompson，B.，& Daniel，L.G.(1996).Factor analytic evidence for the construct validity of scores：A historical overview and some guidelines.EducationalandPsychologicalMeasurement，56(2)，197-208.

Van Iddekinge，C.H.，Raymark，P.H.，Eidson，C.E.，& Attenweiler，W.J.(2004).What do structured selection interviews really measure?The construct validity of behavior description interviews.HumanPerformance，17(1)，71-93.

Van Iddekinge，C.H.，Raymark，P.H.，& Roth，P.L.(2005).Assessing personality with a structured employment interview：Construct-related validity and susceptibility to response inflation.JournalofAppliedPsychology，90(3)，536-552.

Zibarras，L.D.，& Woods，S.A.(2010).A survey of UK selection practices across different organization sizes and industry sectors.JournalofOccupationalandOrganizationalPsychology，83(2)，499-511.

Ziegler，M.，Dietl，E.，Danay，E.，Vogel，M.，& Buehner，M.(2011).Predicting training success with general mental ability，specific ability tests，and(un)structured interviews：A meta-analysis with unique samples.InternationalJournalofSelectionandAssessment，19(2)，170-182.

What Do Civil Servant Selection Interviews Really Measure?The Construct Validity of Structured Interview Evidence from China

Li Yingwu Yu Zhou Peng Kunxiali Wei Minyuan

(Department of Psychology，Renmin University of China，Beijing 100872)

Meta-analysis confirmed that the interview can predict work performance，but the prediction mechanism is unclear.The APA latest Standard psychological and educational Testing(2014 Edition)propose that，explore the validity of the interview should collect multi perspective evidence.Follow this suit，this study according to the multicast data(multi - wave data)research paradigm，method of combining multiple mass model，methods of confirmatory factor analysis，to select several central state administrative organs during 2013 to 2014 1069 civil servants interview candidates interview data(archival data)interaction idea of validity of the civil servants interviews.The results showed that the civil servants interviews in China internal factors and external factors in two dimensions support the interview the two-dimensional theory.

civil servant；interview；multi wave data；construct validity

國家社科基金一般項目(14BZZ087)。

李英武，E-mail：liyingwu@126.com；魏敏媛，E-mail：weiminyuan0430@163.com。

B841.2

1003-5184(2016)05-0472-09

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

公務員面試測量了什么？我國公務員面試的構想效度*

1 問題提出

2 研究工具及方法

3 結果分析

4 討論

公務員面試測量了什么？我國公務員面試的構想效度*