摘要本文以一個(gè)大學(xué)社團(tuán)的團(tuán)體協(xié)作項(xiàng)目活動(dòng)的參賽大學(xué)生為測(cè)評(píng)對(duì)象,運(yùn)用多面Rasch模型從參賽選手、評(píng)分者和測(cè)評(píng)內(nèi)容三個(gè)側(cè)面考察團(tuán)隊(duì)協(xié)作能力測(cè)評(píng)的有效性。結(jié)果發(fā)現(xiàn),參賽選手的團(tuán)隊(duì)協(xié)作能力大都處于中等水平且彼此間相差不大,4位評(píng)分者的評(píng)分寬嚴(yán)度較低且不一致,評(píng)分者在評(píng)分過(guò)程中產(chǎn)生了偏差。另外,文章還揭示了團(tuán)隊(duì)協(xié)作能力的結(jié)構(gòu),為培養(yǎng)大學(xué)生團(tuán)隊(duì)協(xié)作能力提供了參考依據(jù)。
關(guān)鍵詞團(tuán)隊(duì)協(xié)作能力;多面Rasch模型;大學(xué)生;評(píng)分者效應(yīng)
分類(lèi)號(hào)B841
隨著企事業(yè)單位管理制度的不斷發(fā)展與完善,大學(xué)生如想實(shí)現(xiàn)個(gè)人職業(yè)生涯的良好發(fā)展,就必須學(xué)會(huì)與人協(xié)作,融入團(tuán)體。所謂協(xié)作,就是兩個(gè)或者兩個(gè)以上的人相互影響、相互協(xié)調(diào),使得彼此都朝著各自的目標(biāo)發(fā)展,高效率地完成任務(wù)。王忠偉(2014)提出,團(tuán)隊(duì)協(xié)作能力是指團(tuán)隊(duì)成員為完成共同的目標(biāo)而相互協(xié)作、 優(yōu)勢(shì)互補(bǔ)、 共同努力完成某一任務(wù)的能力。由此可見(jiàn),團(tuán)隊(duì)協(xié)作能力的核心是為了共同的目標(biāo)協(xié)作,其中要處理好個(gè)人利益與整體利益,保持較高的團(tuán)體凝聚力,使團(tuán)隊(duì)高效運(yùn)轉(zhuǎn),成員之間取長(zhǎng)補(bǔ)短,保障團(tuán)隊(duì)成員共同成長(zhǎng)、共同完成任務(wù)。朱偉峰(2010)從團(tuán)隊(duì)成員個(gè)體間溝通技能和團(tuán)隊(duì)整體運(yùn)作技能兩個(gè)方面,歸納了大學(xué)生團(tuán)隊(duì)協(xié)作能力培養(yǎng)的9項(xiàng)要素,包括團(tuán)隊(duì)成員個(gè)體間溝通技能方面的人際交流能力、團(tuán)隊(duì)評(píng)價(jià)能力、團(tuán)隊(duì)協(xié)助能力和團(tuán)隊(duì)激勵(lì)能力;團(tuán)隊(duì)整體運(yùn)作技能方面的問(wèn)題界定能力、項(xiàng)目分工能力、數(shù)據(jù)收集能力、解讀信息能力和提煉成果能力。
本次針對(duì)團(tuán)隊(duì)協(xié)作能力的測(cè)評(píng)采取多個(gè)評(píng)委評(píng)分的方式進(jìn)行,評(píng)分方式是維度評(píng)分法,以下是對(duì)各個(gè)評(píng)分維度(評(píng)分標(biāo)準(zhǔn))的解釋?zhuān)?/p>
評(píng)分維度一:人際交流能力,指在團(tuán)隊(duì)中可以很好地理解別人,并使自己也很好地被別人理解,達(dá)到相互溝通的效果。主要包括語(yǔ)言交流和身體語(yǔ)言交流兩種能力。
評(píng)分維度二:團(tuán)隊(duì)評(píng)價(jià)能力,指對(duì)團(tuán)隊(duì)內(nèi)部的績(jī)效進(jìn)行分析后,做出正確的決策和選擇的能力。
評(píng)分維度三:團(tuán)隊(duì)協(xié)助能力,指在團(tuán)隊(duì)中,能夠幫助其他成員完成團(tuán)隊(duì)任務(wù)的能力。
評(píng)分維度四:團(tuán)隊(duì)激勵(lì)能力,指采取一定的措施,激勵(lì)團(tuán)隊(duì)成員,提高團(tuán)隊(duì)積極性的能力。
評(píng)分維度五:?jiǎn)栴}界定能力,指面對(duì)所要解決的問(wèn)題時(shí),可以較快地發(fā)現(xiàn)問(wèn)題的癥結(jié)所在,確定問(wèn)題解決的目標(biāo)。
評(píng)分維度六:項(xiàng)目分工能力,指合理地安排團(tuán)隊(duì)內(nèi)部成員的工作內(nèi)容,使團(tuán)隊(duì)成員可以彼此協(xié)調(diào)完成相應(yīng)的任務(wù)。
評(píng)分維度七:數(shù)據(jù)收集能力,指量化所要解決的問(wèn)題,對(duì)量化的數(shù)據(jù)進(jìn)行收集整理,使問(wèn)題更加客觀精確。
評(píng)分維度八:解讀信息能力,指對(duì)數(shù)據(jù)產(chǎn)生的結(jié)果,可以解讀出問(wèn)題解決的策略和方法,解讀團(tuán)隊(duì)的任務(wù)的完成狀態(tài)。
評(píng)分維度九:提煉成果能力,指最后根據(jù)完成的結(jié)果,提煉出團(tuán)隊(duì)的成果,并進(jìn)行整理。
對(duì)大學(xué)生團(tuán)隊(duì)協(xié)作能力的測(cè)評(píng)是診斷大學(xué)生職業(yè)生涯發(fā)展的重要手段,對(duì)大學(xué)生團(tuán)隊(duì)協(xié)作能力測(cè)評(píng)的過(guò)程及效度進(jìn)行考察具有重要的意義。同時(shí),本研究不僅為團(tuán)隊(duì)協(xié)作能力測(cè)評(píng)提供了一種方法體系程序,也為后續(xù)的相關(guān)研究提供了參考依據(jù)。
1分析方法
本文將采用多面Rasch模型(Many Facets Rasch Model,MFRM)對(duì)測(cè)評(píng)結(jié)果進(jìn)行分析。多面Rasch模型屬于項(xiàng)目反應(yīng)理論(Item Response Theory,IRT)模型,它可以將被試能力與測(cè)試內(nèi)容的難度置于同一尺度下進(jìn)行比較,對(duì)被試的能力水平以及彼此間的差異進(jìn)行分析比較,從而進(jìn)行因材施教。
針對(duì)測(cè)評(píng)對(duì)象的特點(diǎn),本文將從評(píng)委、參賽學(xué)生和測(cè)評(píng)內(nèi)容三個(gè)方面進(jìn)行分析。多面Rasch模型在表現(xiàn)性評(píng)價(jià)中具有重要的實(shí)踐指導(dǎo)意義,現(xiàn)已在教育測(cè)評(píng)(王立君,黃星艷,2013;陳宛玉,戴海琦,2013)、語(yǔ)言測(cè)評(píng)(陳艷君,2014;田清源,2007)、人才測(cè)評(píng)與選拔(孫曉敏,薛剛,2008;孫曉敏,張厚粲,2007)等各種表現(xiàn)性評(píng)價(jià)中得到廣泛應(yīng)用。依據(jù)研究需要,本文采用的三面Rasch模型表達(dá)式如下:
Log(Pnijk / Pnij(k-1))=Bn-Di-Cj-Fk
在這個(gè)公式中,Pnijk是考生n在題目i上被評(píng)分者j評(píng)為k等級(jí)的概率;Pnij(k-1)是考生n在題目i上被評(píng)分者j評(píng)為k-1等級(jí)的概率;Bn是考生n的能力參數(shù);Di是題目i的難度參數(shù);Cj是評(píng)分者j的寬嚴(yán)程度;Fk是分部評(píng)分模型(Partial Credit Model,PCM)中考生得分從k-1等級(jí)到k等級(jí)的等級(jí)難度。
《心理技術(shù)與應(yīng)用》 2015年第10期 (總第26期)
黃明明大學(xué)生團(tuán)隊(duì)協(xié)作能力測(cè)評(píng)的多面Rasch分析
2研究設(shè)計(jì)
2.1測(cè)評(píng)過(guò)程與數(shù)據(jù)來(lái)源
本研究的數(shù)據(jù)來(lái)源于浙江省某高校社團(tuán)聯(lián)合會(huì)申請(qǐng)的“大學(xué)生創(chuàng)新創(chuàng)業(yè)基金項(xiàng)目”大賽。參賽學(xué)生共24人,均是在校本科生,其中男生14人,女生10人。所有參賽者合作參與這個(gè)項(xiàng)目的實(shí)施活動(dòng),活動(dòng)維持一個(gè)月左右,結(jié)束后,評(píng)分者對(duì)他們逐一進(jìn)行打分。評(píng)分者由學(xué)校學(xué)生會(huì)的骨干成員組成,共4人。測(cè)評(píng)的結(jié)果由4人的評(píng)分相加得到,并要求每個(gè)評(píng)分者從大學(xué)生團(tuán)隊(duì)協(xié)作能力的9個(gè)維度分別評(píng)分,每個(gè)維度的滿(mǎn)分是10分,共90分。為了研究的方便并保護(hù)隱私,本文對(duì)4個(gè)評(píng)分者以編號(hào)A、B、C、D來(lái)表示,并以數(shù)字1~ 24對(duì)所有的選手進(jìn)行編號(hào)。
2.2數(shù)據(jù)處理與側(cè)面設(shè)計(jì)
本文采用多面Rasch模型的專(zhuān)用統(tǒng)計(jì)分析軟件FACETS對(duì)所得數(shù)據(jù)分析,構(gòu)建了被試、評(píng)委和測(cè)評(píng)內(nèi)容三個(gè)側(cè)面,具體如下:
①被試:被試的能力水平是測(cè)評(píng)的對(duì)象,在多面Rasch模型分析中,我們可以通過(guò)被試的測(cè)驗(yàn)平均得分、平均能力水平及其標(biāo)準(zhǔn)誤等輸出指標(biāo)判斷每個(gè)被試的能力值。全體被試的能力平均值默認(rèn)為0,所以被試的能力值有正負(fù)值,數(shù)值越大,代表能力越強(qiáng)。
②評(píng)委:評(píng)委在評(píng)分的過(guò)程中,由于各方面的原因,評(píng)分者效應(yīng)在所難免。目前,影響評(píng)分者效應(yīng)的因素主要有評(píng)分者的寬嚴(yán)度、評(píng)分者評(píng)分一貫性、評(píng)分者與被試之間的交互效應(yīng)等。在本文中,我們主要探討評(píng)分者的寬嚴(yán)度和一致性原則對(duì)評(píng)分結(jié)果的影響。
③測(cè)評(píng)內(nèi)容:測(cè)評(píng)過(guò)程對(duì)團(tuán)隊(duì)協(xié)作能力的9個(gè)維度分別進(jìn)行評(píng)分,因此,統(tǒng)計(jì)結(jié)果會(huì)顯示出每個(gè)維度的難度估計(jì)值及其標(biāo)準(zhǔn)誤,我們可以由此看出大學(xué)生群體的團(tuán)隊(duì)協(xié)作能力結(jié)構(gòu)及其發(fā)展?fàn)顩r,從而可以更加精準(zhǔn)地找出哪個(gè)維度能力需要進(jìn)行重點(diǎn)培養(yǎng),有利于因材施教。
除此之外,評(píng)定等級(jí)、測(cè)評(píng)偏差也是本文重點(diǎn)研究的內(nèi)容,因?yàn)樵u(píng)定等級(jí)是反映測(cè)評(píng)計(jì)分方式是否合理的重要信息,每個(gè)等級(jí)的難度以及等級(jí)之間的難度閾限值等可以有效區(qū)分被試的能力水平。而測(cè)評(píng)偏差則是反映每個(gè)評(píng)分者評(píng)分質(zhì)量的信息,對(duì)于偏差較大的評(píng)分者,有必要進(jìn)行測(cè)評(píng)事宜的培訓(xùn),方能參與評(píng)分工作。
以上每個(gè)側(cè)面都會(huì)輸出擬合統(tǒng)計(jì)指標(biāo)、觀測(cè)值平均值、分隔指數(shù)(Separation)和分割信度(Seperation Reliability)等(Bond,T. G., & Fox,C. M.,2007)。其中,擬合統(tǒng)計(jì)指標(biāo)分為內(nèi)部擬合指標(biāo)(Infit MNSQ)和外部擬合指標(biāo)(Outfit MNSQ),Outfit MNSQ是指殘差的均方,Infit MNSQ是加權(quán)(以方差為加權(quán)系數(shù))后的殘差均方,兩者均為模型擬合指標(biāo),由于Outfit MNSQ容易受到極值的影響,一般采取Infit MNSQ作為項(xiàng)目擬合指標(biāo)。不同的研究對(duì)Infit MNSQ規(guī)定不一樣,Infit MNSQ 和Outfit MNSQ 可接受的取值范圍在很大程度上取決于研究目的,Linacre(2006)建議取0.5~1.5。在這里,本研究取值范圍規(guī)定在0.5至1.5之間,越接近1越好。分隔信度(Separation Reliability)值越接近1,則個(gè)體能力差異越顯著,而分隔指數(shù)(Separation)則反映了測(cè)評(píng)的有效性。
通過(guò)對(duì)這些統(tǒng)計(jì)指標(biāo)的考察,我們可以看出整個(gè)測(cè)評(píng)過(guò)程以及測(cè)評(píng)結(jié)果的有效性。
3研究結(jié)果
根據(jù)本文對(duì)側(cè)面的設(shè)計(jì),統(tǒng)計(jì)結(jié)果中會(huì)產(chǎn)生不同側(cè)面的測(cè)評(píng)結(jié)果。測(cè)評(píng)的結(jié)果均以參數(shù)值和相關(guān)圖表的形式呈現(xiàn),既客觀明確,又具體形象。
3.1被試能力
在多面Rasch模型分析結(jié)果中,程序會(huì)全面呈現(xiàn)被試的能力估計(jì)值及其相關(guān)統(tǒng)計(jì)量,這些統(tǒng)計(jì)量包括了平均得分、能力估計(jì)值、能力估計(jì)標(biāo)準(zhǔn)誤、擬合度以及分離指數(shù)、分離信度等。在本文的研究對(duì)象中,部分大學(xué)生被試的團(tuán)隊(duì)協(xié)作能力估計(jì)列表如下所示,表中既有高水平被試,也有低水平被試,也有中等水平被試。
被試平均觀測(cè)值能力值標(biāo)準(zhǔn)誤內(nèi)部擬合度外部擬合度被試平均觀測(cè)值能力值標(biāo)準(zhǔn)誤內(nèi)部擬合度外部擬合度
從表1所示的統(tǒng)計(jì)結(jié)果可以看出,平均觀測(cè)值(平均得分)越大,其能力估計(jì)值越大。平均觀測(cè)值在4.0至6.5之間,能力估計(jì)值在-0.73至0.49之間,被試4的團(tuán)隊(duì)協(xié)作能力水平較低,被試20的團(tuán)隊(duì)協(xié)作能力最高。對(duì)于內(nèi)外擬合度,所有被試的內(nèi)部和外部擬合度都在0.54至1.40之間,基本都滿(mǎn)足測(cè)驗(yàn)的要求。
3.2測(cè)評(píng)內(nèi)容
測(cè)評(píng)內(nèi)容的考察主要反映在對(duì)團(tuán)隊(duì)協(xié)作能力9個(gè)維度的難度估計(jì)考察,通過(guò)對(duì)每個(gè)維度任務(wù)的難度進(jìn)行估計(jì),我們可以探討被試完成此項(xiàng)維度任務(wù)應(yīng)具備多大的能力,也可以考察大學(xué)生在這些能力維度上的發(fā)展情況。如表2所示。
統(tǒng)計(jì)結(jié)果將團(tuán)隊(duì)協(xié)作能力進(jìn)行了分維度考察,在每個(gè)維度中,都有相應(yīng)的難度估計(jì)值、誤差以及內(nèi)外部擬合度。在本次統(tǒng)計(jì)結(jié)果中,數(shù)據(jù)收集能力維度的難度最大,高達(dá)0.19,說(shuō)明這個(gè)團(tuán)隊(duì)任務(wù)對(duì)成員量化數(shù)據(jù)的收集能力要求較高,也從另一個(gè)側(cè)面反映了團(tuán)隊(duì)成員在這方面的能力有待加強(qiáng)。難度最低的是人際交流能力和團(tuán)隊(duì)激勵(lì)能力,難度值均為-0.22,說(shuō)明團(tuán)隊(duì)的任務(wù)對(duì)團(tuán)隊(duì)成員的人際交流能力和團(tuán)隊(duì)激勵(lì)能力要求較低,或者這個(gè)團(tuán)隊(duì)的成員在人際交流能力和團(tuán)隊(duì)激勵(lì)能力方面具有較高的水平。內(nèi)外部擬合度也符合測(cè)驗(yàn)要求,測(cè)驗(yàn)結(jié)果有效。
3.3評(píng)定等級(jí)
評(píng)定等級(jí)是對(duì)計(jì)分方式進(jìn)行考察的主要方法,評(píng)定等級(jí)的結(jié)果既可以通過(guò)客觀精確的評(píng)定等級(jí)信息表反映出每個(gè)等級(jí)的難度值以及不同等級(jí)之間的難度閾限值,也可以通過(guò)評(píng)定等級(jí)曲線圖直觀形象地反映出評(píng)定結(jié)果的等級(jí)分布情況。表3反映了各等級(jí)的難度值及其難度閾值。
各個(gè)評(píng)分等級(jí)的難度及其閾難度不僅可以反映評(píng)分等級(jí)設(shè)置的合理性,也可以區(qū)分不同能力水平的被試群體。本次測(cè)評(píng)采取10點(diǎn)計(jì)分,由表格可以看出,沒(méi)有評(píng)分者打滿(mǎn)分的成績(jī),使用頻率高的是4、5、6、7四個(gè)等級(jí)。平均難度值隨著等級(jí)的增高而增大,預(yù)測(cè)到的被試能力也隨之增高。在估計(jì)的能力閾限中,較大的分別是1.33和1.78,這說(shuō)明,若想得到高分值8分或者9分很不容易,必須加倍努力。
為更加形象地了解評(píng)定結(jié)果的分布情況,我們還可以通過(guò)評(píng)定等級(jí)曲線圖分析評(píng)定結(jié)果。
圖1顯示了9個(gè)評(píng)定等級(jí)的變化概率曲線,覆蓋范圍是-4.0至4.0Logits左右。從圖中可以直觀地看出,各個(gè)等級(jí)的曲線劃分較為明顯,說(shuō)明等級(jí)設(shè)置合理。7等級(jí)和8等級(jí)的峰值較大一些,說(shuō)明這兩個(gè)等級(jí)所覆蓋的能力范圍的被試獲得這兩個(gè)等級(jí)的可能性較大,測(cè)驗(yàn)等級(jí)設(shè)置的精準(zhǔn)性較好。
3.4評(píng)分者寬嚴(yán)度
評(píng)分者在評(píng)分過(guò)程中,由于對(duì)評(píng)分準(zhǔn)則的把持程度不同,導(dǎo)致不同評(píng)分者在評(píng)分過(guò)程中出現(xiàn)寬嚴(yán)程度不一致的現(xiàn)象。統(tǒng)計(jì)結(jié)果可以看出每個(gè)評(píng)分者的平均評(píng)分、寬嚴(yán)程度等信息,其中寬嚴(yán)度的平均值默認(rèn)為0,數(shù)字越大,說(shuō)明評(píng)分越嚴(yán)格(見(jiàn)表4)。
不同的評(píng)分者在測(cè)評(píng)過(guò)程中的評(píng)分寬松度不一樣。在本次測(cè)評(píng)中,4位評(píng)分者打出的分?jǐn)?shù)都很接近,都較為寬松。其中A和D的平均觀測(cè)值均為5.4分,相對(duì)其他兩位較為嚴(yán)格一點(diǎn),C的評(píng)分最為寬松,平均分為5.9分。從內(nèi)外部擬合度看,A的擬合性最差,其他三位的評(píng)分?jǐn)M合度都很好。這些說(shuō)明了C在評(píng)分過(guò)程中,一直堅(jiān)持著較為寬松的評(píng)分原則。通過(guò)卡方分析(χ2(96)=525.9,df=3,p< 0.01)可知,達(dá)到了顯著性差異水平,說(shuō)明4位評(píng)分者評(píng)分寬嚴(yán)度差異較明顯。
3.5測(cè)評(píng)偏差
測(cè)評(píng)的偏差反映了評(píng)分者在評(píng)分過(guò)程中會(huì)出現(xiàn)動(dòng)搖、評(píng)分一貫性較差等現(xiàn)象。同一評(píng)分者從頭至尾是否堅(jiān)持自己一貫的評(píng)分原則將對(duì)測(cè)評(píng)偏差產(chǎn)生重要影響。反映測(cè)評(píng)偏差的信息主要有評(píng)分者與被試間偏差t值變化圖等,通過(guò)圖像可以形象地看出4名評(píng)分者對(duì)每個(gè)被試的評(píng)分波動(dòng)性幅度,波動(dòng)幅度最大的評(píng)分者,其評(píng)分偏差最大。4名評(píng)分者在測(cè)評(píng)過(guò)程中的評(píng)分偏差情況如圖2所示。
圖2反映了4個(gè)評(píng)分者在每位被試上評(píng)分的偏差,縱軸表示偏差的t值,t值的變化幅度越大說(shuō)明被試在評(píng)分過(guò)程中的一致性越差。一般情況下,由于評(píng)分者受到生理疲勞等因素的影響,評(píng)分總是會(huì)產(chǎn)生動(dòng)搖,導(dǎo)致偏差。從圖中可以直觀地看出4個(gè)評(píng)分者在24個(gè)被試上評(píng)分的寬嚴(yán)度變化,其中,變化最大是評(píng)分者B,變化幅度是6.6,其評(píng)分最不穩(wěn)定,一貫性最差;評(píng)分一貫性最好的是評(píng)分者A,變化幅度最小,為4.0。其中,在對(duì)前幾名被試的評(píng)分過(guò)程中,評(píng)分者A的評(píng)分變化很小,有明顯的趨中效應(yīng)。
4討論
多面Rasch模型是IRT中較為常用的模型之一,本文將多面Rasch模型應(yīng)用于大學(xué)生團(tuán)隊(duì)協(xié)作能力測(cè)評(píng)之中,在國(guó)內(nèi)尚屬首例。多面Rasch模型可以將本文所研究的三個(gè)側(cè)面置于同一量尺之下進(jìn)行比較分析,如圖3所示。
從圖3反映的信息可知,評(píng)分者的寬嚴(yán)度均較低,最嚴(yán)格的評(píng)分者A和D排在最上面,最寬松的評(píng)分者C排在最下面,但4位評(píng)分者的寬嚴(yán)度均小于0;被試能力水平較高的排在上面,較低者排在下面,形成了中間水平者多、兩端少的格局;測(cè)評(píng)的9個(gè)維度中,難度最高者排在上面,難度低者排在下面,不難看出,數(shù)據(jù)收集能力維度的難度最大,人際交流和團(tuán)隊(duì)激勵(lì)能力維度的難度最小,其他6個(gè)維度的難度適中,可能是此項(xiàng)活動(dòng)在人際交流和團(tuán)隊(duì)激勵(lì)能力方面對(duì)被試的要求較低所致;在評(píng)定等級(jí)分布中,等級(jí)不是等距的,這是受不同被試、不同評(píng)分者之間的差異影響所致。
本文通過(guò)運(yùn)用多面Rasch技術(shù),通過(guò)FACETS軟件的統(tǒng)計(jì)結(jié)果,分別對(duì)被試、不同評(píng)分者和測(cè)驗(yàn)內(nèi)容三個(gè)側(cè)面進(jìn)行了分析。通過(guò)分析發(fā)現(xiàn),本研究的結(jié)果有以下幾點(diǎn)值得注意。
其一,對(duì)被試團(tuán)隊(duì)協(xié)作能力及其維度難度的估計(jì)。本研究主要從個(gè)體間溝通技能上的人際交流能力、團(tuán)隊(duì)評(píng)價(jià)能力、團(tuán)隊(duì)協(xié)助能力,以及團(tuán)隊(duì)激勵(lì)能力和團(tuán)隊(duì)整體運(yùn)作技能上的問(wèn)題界定能力、項(xiàng)目分工能力、數(shù)據(jù)收集能力、解讀信息能力和提煉成果能力對(duì)被試的團(tuán)隊(duì)協(xié)作能力進(jìn)行評(píng)估,這9個(gè)維度的能力均是大學(xué)生職業(yè)發(fā)展中必須具備的能力,所以測(cè)評(píng)的針對(duì)性較強(qiáng)。通過(guò)對(duì)24名被試的分析發(fā)現(xiàn),這些被試的能力范圍的變化并不大,且內(nèi)外部擬合性也符合相應(yīng)的標(biāo)準(zhǔn),這論證了測(cè)評(píng)過(guò)程中測(cè)評(píng)結(jié)果的有效性。
此外,各個(gè)維度上的難度也相當(dāng)集中,數(shù)據(jù)收集能力維度的難度較大,說(shuō)明數(shù)據(jù)收集的工作涉及面復(fù)雜,且要具有較多的耐心和細(xì)心。而人際交流能力和團(tuán)隊(duì)激勵(lì)能力則成為被試較易獲得的兩項(xiàng)能力,可能是因?yàn)檫@些大學(xué)生平時(shí)活動(dòng)較多,注重此方面的訓(xùn)練。
其二,評(píng)分者效應(yīng)和評(píng)分等級(jí)的分析。評(píng)分者寬嚴(yán)度在一定程度上影響被試得分,評(píng)分者的寬嚴(yán)度與被試所得分?jǐn)?shù)呈負(fù)相關(guān),也是造成評(píng)分者效應(yīng)的重要因素之一。通過(guò)MFRM對(duì)測(cè)評(píng)數(shù)據(jù)進(jìn)行分析,將各評(píng)分者寬嚴(yán)度量化處理,為鑒別評(píng)分者提供了客觀指標(biāo)。在統(tǒng)計(jì)結(jié)果中,評(píng)分的寬嚴(yán)度在-0.35至-0.09之間,平均值是-0.18,總體評(píng)分規(guī)則較為寬松。其中,評(píng)分者C是評(píng)分最寬松的,而且其內(nèi)部擬合性也是最接近于1.0的,這揭示了評(píng)分者C在評(píng)分過(guò)程中始終較為寬松,其評(píng)分的一貫性也較好。
其三,通過(guò)對(duì)評(píng)分者與被試之間的偏差分析可知,4個(gè)評(píng)分者均存在評(píng)分偏差現(xiàn)象,其中評(píng)分者B的波動(dòng)最大,因此建議在測(cè)評(píng)之前,對(duì)評(píng)分者進(jìn)行評(píng)分規(guī)則等事宜的培訓(xùn),這樣會(huì)使測(cè)評(píng)結(jié)果更準(zhǔn)確。
本次對(duì)大學(xué)生團(tuán)隊(duì)協(xié)作能力的測(cè)評(píng)可以說(shuō)是全方位的,形成了多側(cè)面的測(cè)評(píng)效果,有利于更加有效地測(cè)評(píng)大學(xué)生的團(tuán)隊(duì)協(xié)作能力,也為測(cè)評(píng)的改進(jìn)和發(fā)展提供了方法體系。
5結(jié)論與展望
通過(guò)此次測(cè)評(píng)的統(tǒng)計(jì)分析,可以得出以下幾點(diǎn)結(jié)論。
第一,團(tuán)隊(duì)協(xié)作能力是一個(gè)多維度的能力,大學(xué)生群體在團(tuán)隊(duì)協(xié)作的各個(gè)維度上能力水平有差異,人際交流能力和團(tuán)隊(duì)激勵(lì)能力屬于成員個(gè)體間溝通技能,大學(xué)生在這兩方面的能力要比團(tuán)隊(duì)整體運(yùn)作技能方面的能力水平高。
第二,評(píng)分者在評(píng)分過(guò)程中的評(píng)分規(guī)則非常寬松,其一貫性也有波動(dòng),但測(cè)評(píng)的結(jié)果未受到太大的影響,測(cè)驗(yàn)結(jié)果具有較好內(nèi)外部擬合度。評(píng)分者評(píng)分有偏差現(xiàn)象,評(píng)分者B的評(píng)分偏差最大,應(yīng)該對(duì)評(píng)分者進(jìn)行測(cè)評(píng)規(guī)則的培訓(xùn),以提高測(cè)評(píng)的有效性。
第三,評(píng)定等級(jí)的難度隨著等級(jí)的增加而增高,等級(jí)間的閾難度可以反映被試的努力程度,等級(jí)8和9對(duì)被試的能力要求較高。評(píng)委未對(duì)被試打出滿(mǎn)分的成績(jī),等級(jí)設(shè)置整體合理。
多面Rasch模型作為一種優(yōu)秀的IRT模型,已經(jīng)在表現(xiàn)性評(píng)價(jià)中得到廣泛應(yīng)用。但本研究的研究對(duì)象僅限于大學(xué)生,且測(cè)評(píng)規(guī)模較小,這是本研究的一大缺點(diǎn)。本研究是對(duì)多面Rasch模型在表現(xiàn)性評(píng)價(jià)中的應(yīng)用的一次很好的嘗試,隨著研究的不斷發(fā)展,這一方法的應(yīng)用范圍也將更加廣泛。
參考文獻(xiàn)
陳宛玉, 戴海琦. (2013). 教育教學(xué)能力測(cè)驗(yàn)的GT和多面Rasch分析. 考試研究, 38(3), 70-78.
陳艷君. (2014). 多層面Rasch模型在語(yǔ)言評(píng)估中的應(yīng)用研究述評(píng). 教育測(cè)量與評(píng)價(jià):理論版, 6, 9-12.
孫曉敏, 張厚粲. (2007). 結(jié)構(gòu)化面試評(píng)定量表的現(xiàn)代測(cè)量學(xué)分析. 應(yīng)用心理學(xué), 13(3), 250-256.
孫曉敏, 薛剛. (2008). 多面Rasch模型在結(jié)構(gòu)化面試中的應(yīng)用. 心理學(xué)報(bào), 40(9), 1030-1040.
田清源. (2007). HSK主觀考試評(píng)分的Rasch實(shí)驗(yàn)分析. 心理學(xué)探新, 27(1), 65-69.
王忠偉. (2014). 淺談高職院校學(xué)生團(tuán)隊(duì)協(xié)作能力培養(yǎng). 教育與職業(yè), 23, 169-170.
王立君, 黃星艷. (2013). 多面Rasch模型在學(xué)科能力測(cè)評(píng)中的應(yīng)用. 考試研究, 36(1), 41-50.
晏子. (2010). 心理科學(xué)鄰域的客觀測(cè)量——Rasch模型之特點(diǎn)及發(fā)展趨勢(shì). 心理科學(xué)進(jìn)展, 18(8), 1298-1305.
朱偉峰. (2010). 論大學(xué)生團(tuán)隊(duì)協(xié)作能力培養(yǎng). 中國(guó)人才, 10, 53-54.
Bond, T. G., & Fox, C. M. (2007). Applying the Rasch model: Fundamental measurement in the human sciences (2nd ed.). Mahwah, NJ: Lawrence Erlbaum.
Linacre, J. M., & Wright. B. D. (1993). A users guide to FACETS: Rasch model computer program, version 2. 4 for PC compatible computers. Chicago, IL: MESA Press.
Applying the Manyfacet Rasch Model to Analyze the Data
of College Students Teamwork Capability Assessment
HUANG Mingming
(Department of Teacher education, Zhejiang Normal University, Jinhua 321004, China)
Abstract:
In this paper, a university community teamwork project activity was used as the object for teamwork capability assessment. In order to evaluate the effectiveness of teamwork capability assessment, we used the many facets Rasch model to anatyze in the matler of contestants, rater and the content of evaluation in the teamwork assessment. This study firds that most of the contestants are in the middle level of ability and have little difference between them.
The raters are lenient but inconsistent while scoring, and they produce a bisa. Besides, the study
reveals the structure of teamwork capability. Finally, this article provides a reference for developing college students teamwork capability.
Key words: teamwork ability; many facets Rasch model; college students; rater effect
欄目編輯/王抒文終校/王晶晶