□ 蔣華林 邢全超 吳 芳 朱曉華
廣義上的學情調查由來已久。從現(xiàn)有文獻看,1988年趙振旗在國內較早明確提出“學情”概念[1]。同年,學者北江介紹了我國臺灣地區(qū)與日本、美國學生“學情習況之對比”[2]。國內高等教育領域較正式的學情調查在20世紀90年代開始興起,當時主要是從學習科學的視角進行探討。如1994~1995年,“大學學習理論與方法”課題組曾對湖北省21所高校、5641名大學生學習情況進行調查分析[3]。
近年來,隨著“以學生為中心”教育思想和辦學理念在高等教育理論研究和實踐探索中的發(fā)酵以及教育教學評估的外部監(jiān)督和問責強化,大學生學情調查研究在國內迅速興起。如北京大學開展的“中國高等教育質量與學生發(fā)展監(jiān)測項目研究”、廈門大學開展的“大學生學習情況調查研究”、中山大學開展的“中國大學生學習調查研究”以及南京大學等參與的“本科生學習經歷調查”(SERU)等。
全國范圍大規(guī)模開展學情調查,可能源于2007年清華大學開始引進美國“大學生學習性投入調查”(National Survey of Student Engagement,NSSE)工具。截至2013年底,清華大學“中國大學生學習與發(fā)展追蹤研究”(Chinese College Student Survey,CCSS,原稱NSSEChina)已累計有27個省區(qū)108所院校參加,在國內掀起了學情(學習性投入)調查的一輪高潮。據(jù)不完全統(tǒng)計,以CCSS為基礎的學術(學位)論文量已超過40篇、研究報告上百篇??梢哉f,學情調查已經成為當前國內高等教育研究的新興方向和重要領域,并已逐漸成為高校進行院校診斷的重要工具,在深化教學改革、提高教育質量中發(fā)揮著越來越重要的作用。
在國外,由于學生自我報告的教育收獲(學情調查數(shù)據(jù))被用于評估學生學習和發(fā)展的有效性受到質疑,如Pascarella(2001);Bowman(2010,2011);Bowman and Brandenberger(2010)等。一些學者開展了關于學情調查(NSSE)中社會稱許性偏見效應的影響研究,如Gonyea(2005),Bowman & Hill(2011)等。但國內除少量關于調查工具信效度的論證或說明相關研究外,如羅燕(2009)、涂冬波(2013)等,大多是關于調查數(shù)據(jù)本身的靜態(tài)呈現(xiàn)或立體解讀,如羅燕(2009)、周玲(2011)、鮑威(2011)、史靜寰(2012)、史秋衡(2012)、蔣華林(2012)、屈瓊斐(2013)等,基本沒有涉及到社會稱許性的研究。
盡管CCSS早在2010年問卷中就設置了“社會稱許性”量表,但只是提醒和建議參與院校在分析時應當注意,并在解釋結果時保持謹慎,在實際分析中很少得到有效利用。也就是說,目前學情調查對社會稱許性“既沒有在理論上給予充分的分析,在實踐中也沒有很好地控制”[4](P47)。顯然,如果不能有效控制“社會稱許性”這一變量,則無論問卷本身的信效度如何“理想”,調查得到的數(shù)據(jù)都可能令人質疑;也無論研究者的研究方法如何“先進”,研究過程如何“科學”,其結果解釋的效力可能也是要打折扣的。為此,本文擬利用國內某“985”院校C大學參加2013年度CCSS調查獲得的數(shù)據(jù),就社會稱許性對學情調查的影響進行實證分析。
社會稱許性(Social Desirability,SD),也譯為“社會期望”或“社會贊許性”,最初是從人格測驗中的心理防衛(wèi)行為中總結發(fā)現(xiàn)的,并由愛德華茲(Allen L.Edwards)于1957年首次提出[5],后被廣泛應用于社會學研究之中。
馬洛和克羅恩(1961)認為,社會稱許性是指人們(被試)獲得社會贊賞和接受的一種需要,同時,人們還認為,這種社會贊賞和接受是可以通過文化上認同的、恰當?shù)男袨閬慝@得的[6]。韓振華和任劍峰(2002)認為,社會稱許性是指由社會主流文化或社會價值規(guī)范所包含的,被社會中絕大多數(shù)人稱贊的意識或行為[4](P47)。
與社會稱許性相關的另一個概念是“社會稱許性反應”(Social Desirability Responding,SDR)。SDR通常被定義為被試“給出正向自我描述的傾向”,如澤布和保盧斯(1987)將SDR定義為個體按照現(xiàn)行的社會規(guī)范和準則而展示出有利于自己的傾向[7](P250)。但按照保盧斯后來(1999)的論述,它應更準確地表述為:作出過度正向(overly positive)自我描述的傾向[8]。如果這種反應偏離了被試的內心想法或內在本質,就會產生社會稱許性偏見效應(Social Desirability Bias,SDB)。有兩種力量影響SDB:一是使自己更好地呈現(xiàn)給訪談者或者研究人員的需要,二是為維護自尊的需要(Nancarrow and Brace,2000)。
本文所稱社會稱許性,是指在大學生學情調查中被調查大學生對于調查問卷中所設計的題項作出相應回答所表現(xiàn)出來的正向自我描述的傾向,即其社會稱許性反應程度。
由于社會稱許性對調查或測驗的重要影響,人們就希望通過偵探和測量社會稱許性偏見或者阻止和降低社會稱許性偏見來解決社會稱許性問題。偵探和測量社會稱許性偏見的方法主要有兩種:一是使用社會稱許性量表,二是評定項目的稱許性。阻止和降低社會稱許性偏見,可選擇的方法有迫選項目、使用中性項目、隨機反應技術/隨機化回答法等[9]。為此,一些學者開發(fā)了專門的SD量表,如Edwards的SD量表、Marlowe和Crowne的MCSD量表、Jacobson等的多維SD量表、Paulhus的BIDR量表等。
由于CCSS采用的是自陳式問卷調查,因此不可避免地受到社會稱許性的影響。為此,自2010年以來,CCSS問卷中就直接嵌入SD量表(主要參考了MCSD量表),設計了若干題項,以測量被調查學生填答問卷的社會稱許性。2013年版問卷包括6個題項(如表1所示)。
表1 CCSS2013社會稱許性量表
每個題項設置4個選項:非常符合、比較符合、不太符合、非常不符合,并分別賦值100.00、66.67、33.33和0.00。然后通過計算算術平均數(shù)的方法算出SD,最高為100.00,最低為0.00分。SD得分越高,表明社會稱許性效應越大;反之越小。
C大學參與了2013年CCSS調查,回收有效問卷共計5045份,有效回收率89.29%。經檢驗,樣本具有較好的代表性。本文利用獲得的調查數(shù)據(jù),對SD與學情調查的核心指標:綜合分析五項指標、學習診斷八項指標、院校診斷七項指標以及教育收獲、滿意度等之間的相互關系進行分析,以期揭示SD對學情調查的影響,即偏見效應。
為簡化分析并考慮到C大學的SD常模為59.26,故將SD按得分分成五個區(qū)間:[0,20)、[20,40)、[40,60)、[60,80)、[80,100]。
CCSS綜合分析五項指標,包括學業(yè)挑戰(zhàn)度(LAC)、主動合作學習水平(ACL)、生師互動頻度(SFI)、教育經驗豐富度(EEE)和校園環(huán)境支持度(SCE)。
統(tǒng)計分析發(fā)現(xiàn),學生的SD得分與其在綜合分析五項指標上的表現(xiàn),在0.01水平(雙側)上顯著相關。SD得分越高,其五項指標表現(xiàn)越好,反之越差(見圖1)。
圖1 SD與綜合分析五項指標的關系
CC S S學習診斷指標共計8項:高階學習(HOL)、反思與整合學習(RIL)、學習策略(LS)、數(shù)量推理(QR)、合作性學習(CL)、與多元人群的討論(DDO)、生師互動(ind SFI)和互動質量(QI)。
統(tǒng)計分析發(fā)現(xiàn),學生的SD得分與其在學習診斷八項指標上的表現(xiàn),在0.01水平(雙側)上顯著相關。SD得分越高,其八項指標表現(xiàn)越好,反之越差(見圖2)。
圖2 SD與學習診斷八項指標的關系
CCSS院校診斷指標共計9項,考慮到其中的“自我報告的教育收獲”和“在校滿意度”主要作為學習結果,抽出另行分析,故此處只有7項:課程認知目標(COC)、課程要求嚴格程度(CR)、課程學習行為(SL)、課外拓展性學習行為(ELE)、向學/厭學(SWL)、有效教學實踐(ETP)和支持性環(huán)境(SE)。
統(tǒng)計分析發(fā)現(xiàn),學生的SD得分與其在院校診斷七項指標上的表現(xiàn),在0.01或0.05(CR、SWL)水平(雙側)上顯著相關。SD得分越高,其七項指標表現(xiàn)越好,反之越差(見圖3)。
圖3 SD與院校診斷七項指標的關系
CCSS的自我報告教育收獲(SSLO)主要調查學生個人在知識、能力、素質等方面的“進步量”或增值大小;在校滿意度(SSTF)包括學生整體就讀滿意度、學術經歷等單項滿意度以及向他人推薦所讀院校的意愿的強度。
統(tǒng)計分析發(fā)現(xiàn),學生的SD得分與其在SSLO、SSTF指標上的表現(xiàn),同樣在0.01水平(雙側)上顯著相關。SD得分越高,其兩項指標表現(xiàn)越好,反之越差。
上述分析在學情調查中“又一次”驗證了自陳式問卷調查通常都會有的社會稱許性效應,并且通過相關性分析驗證了SD與學情調查主要指標之間的相關性,證明了學情調查中SD的客觀影響,但目前仍缺乏更有說服力的實證數(shù)據(jù)來證明SD會實際影響到學情調查數(shù)據(jù)的使用及其研究結論的得出。為此,下面繼續(xù)利用C大學調查數(shù)據(jù),通過分析SD與學生自我報告的學業(yè)成績、真實GPA之間的關系,進一步揭示SD對學情調查的影響。
此處所稱學業(yè)成績,是指CCSS調查中學生填答的“與同班級/專業(yè)的同學相比”的成績排名情況,共分五個檔位:前5%,前5%~20%、前20%~50%、50%~80%和后20%。分析發(fā)現(xiàn),C大學學生的SD得分與其在學業(yè)成績上的表現(xiàn)之間的關系并不明晰,各區(qū)段SD都既有成績好的學生,也有成績差的學生(見圖4)。
從圖4可知,SD得分高、(按理)學習性投入(得分)多的學生,并不總是好成績;SD得分低、(按理)學習性投入(得分)少的學生,并不總是差成績。換言之,部分成績較差(如排名后20%)而SD偏高的學生,其自我報告的學習性投入得分偏高,明顯高于排名后20%學生的常模;部分成績較好(如排名前20%)而SD偏低的學生,其自我報告的學習性投入得分偏低,低于排名前20%學生的常模??梢?,社會稱許性對學情調查數(shù)據(jù)有直接的影響。
圖4 SD與學業(yè)成績排位的關系(%)
上述成績排名為學生自我報告,可能有一定誤差或不夠精確。這也是NSSE受到的主要批評之一:自我評價在多大程度上會夸大自己的學習收獲和掌握的技能呢?[10]如果用學生真實成績(GPA)來考察,情形又會怎么樣呢?
分SD區(qū)段統(tǒng)計C大學5045個樣本學生截止本次調查時所獲得的GPA,結果表明,SD偏低的學生群體中,成績特別差(GPA<1.0)和成績中偏上(2.0≤GPA<3.0)的比例較高,成績優(yōu)秀(GPA≥3.0)的比例偏低(見表2)。
從表2可知,SD得分高、(按理)學習性投入(得分)多的學生,同樣并不總是好成績,其中高達11%的成績較差(GPA<2.0)的學生,其SD在80分以上;SD得分低、(按理)學習性投入(得分)少的學生,也并不總是差成績,其中高達35.71%的成績較好(GPA≥3.0)的學生,其SD在20分以下。而且,SD≥80且GPA<2.0的學生的綜合分析五項指標得分明顯高于僅GPA<2.0的學生的常模;SD<20且GPA≥3.0的學生的綜合分析五項指標得分明顯低于僅GPA≥3.0的學生的常模。由此亦可見SD對學情調查數(shù)據(jù)的切實影響。
進一步研究發(fā)現(xiàn),各SD區(qū)段學生的平均GPA沒有明顯差異。這說明SD得分高的群體,其GPA并無明顯優(yōu)勢。那些SD得分高、學習性投入表現(xiàn)相應較好(得分高)的學生,其GPA并未“應然”地高;同理,那些SD得分低、學習性投入表現(xiàn)較差(得分低)的學生,其GPA并未“應然”地低。
上述分析表明,如果純粹或主要從學生自我報告的學情調查數(shù)據(jù)(學習性投入情況)來判斷學生的學習狀態(tài)或院校本科教育質量,即只“用數(shù)據(jù)說話”,可能存在偏差或有失偏頗。這種偏差產生的原因也許正是忽略了SD這一變量的關鍵影響。這提醒我們,不能籠統(tǒng)地說,學習性投入調查得分高,其學習收獲就大,或者說本科教育質量就高,而必須將SD納入分析變量。
表2 C大學各SD區(qū)段學生的GPA分布(%)
一如前述,SD與學情調查主要指標都呈顯著正相關關系(正向變動),而根據(jù)已有研究結論,學生學習性投入越高,其學習成績(教育收獲)也越高,由此推論,學生SD高,學習性投入就高,其學習成績(更進一步,本科教育質量)就好。但本文實證研究表明,SD得分較高且學習性投入表現(xiàn)較好的學生群體,其學習成績或者學習收獲并不必然就好。有相當一部分成績較差而SD較高的學生,其自我報告的學習性投入表現(xiàn)明顯偏高(還有一部分學生情況正相反)。進一步分析發(fā)現(xiàn),學生自我報告GPA普遍高于實際GPA 0.2以上,甚至0.3以上。這其中的差距可能正是由于SD“印象管理”的影響所致。這些都說明SD指標對學情調查數(shù)據(jù)有重要影響。
國外一些研究也已證明,SD對學情調查結果存在著程度不同的影響,如NSSE認為,SD對低年級的學業(yè)挑戰(zhàn)度、反思性學習,對高年級的校園支持環(huán)境、反思性學習、個人教育收獲、通識教育收獲等具有顯著的正向相關關系[11]。(也有研究證明沒有影響[12]。)無論如何,更好地理解學生自我報告的SD可以幫助高校更準確地評估學生的學習和發(fā)展。因此,在進行學情調查問卷設計及數(shù)據(jù)分析、結果解釋中都應當對SD予以必要的關注和重視。特別是進行橫向比較或對一些學生亞群體進行分析時,更要考慮SD的影響,盡量避免單純由學生自我報告數(shù)據(jù)得出“自以為是”的“客觀結論”。
“人即使不象亞里士多德所說的那樣,天生是政治動物,無論如何也天生是社會動物”[13]。因此,盡管CCSS這類調查研究并不過多涉及社會價值規(guī)范或道德等敏感問題,但在調查的邀請信或指導語中對調查重要性的強調,特別是通過某些行政力量組織調查,也許會使學生感到某種壓力或期許,“設身”理解調查者“想要的”,從而使稱許性效應被進一步“放大”(SD具有情境性,有研究者還探討了紙筆測試和計算機呈現(xiàn)兩種測驗方式對社會稱許性得分的影響)[14]。
社會稱許性反應已經被組織研究人員看作是自我評估的一種污染物或雜質(contaminant)[7](P250)。從現(xiàn)有文獻看,在學情調查設計中SD研究本身受到程度不同的忽視甚至忽略。CCSS雖然采用了在問卷設計階段直接嵌入量表對SD進行直接測量的常用做法,但對其信效度尚缺乏系統(tǒng)研究,至少對其如何分析應用還缺乏全面的考慮。為此,一方面,應在學情調查中將SD納入調查內容,在問卷設計中充分體現(xiàn),并對其作必要的測量學研究;另一方面,需要探討若干技術控制手段,研究如何校正和識別被試可能的一些做假(faking)反應。這樣我們才可能用一把自身精密度高的尺子去測量本身就難以把握的學情和教育質量,促進學情調查本身的質量不斷提高。反之,則可能“誤讀”學情,“誤解”質量,“誤導”改革。
現(xiàn)有研究一般認為,SD越高,社會稱許性偏見效應就越大,關注重點也因此在過高的SD或SD過高的學生(被試)。但本研究發(fā)現(xiàn),一些SD較低(如SD<20)的學生,其學情調查指標得分偏低,但其學業(yè)成績并不低。如果我們根據(jù)學情調查指標得分做出其學習性投入不足的判斷,則將與事實不相符。
一般認為,SD得分偏低,是“自我欺騙”的結果,即是無意識中發(fā)生的[15]。這種人往往不按照社會認可和贊許的方式采取行動,可能有較強的自我中心或我行我素的傾向。這就提醒我們,在關注學情調查中SD的影響時,除了“眼向高處看”,重視分析高SD得分的情況,還要特別關注偏低的社會稱許性反應以及那些低SD得分的學生群體情況,從而全面準確地理解和把握學情調查結果與數(shù)據(jù)分析。
從筆者掌握的數(shù)據(jù)看,CCSS調查中社會稱許性效應總體上對數(shù)據(jù)使用及工具信效度尚不構成致命威脅。但在學情調查數(shù)據(jù)(學習性投入表現(xiàn))被廣泛用于評價學生在高等教育中的學習效果和個人發(fā)展,甚至被用來作為衡量“中國本科教育距離世界一流大學有多遠”的一種判斷標準的情況下[16],如果不能盡可能控制調查數(shù)據(jù)的“誤差”,其信效度將不可避免地受到影響和削弱。因此,開展SD對大學生學情調查的影響研究,不只是一種純技術的專項研究,它事實上關乎到大學生學情調查本身的質量,影響著學情調查的生命力。當學情調查廣泛應用于質量監(jiān)控時,誰來評價學習調查本身的質量呢?SD也許是一個重要參考指標和控制手段。
[1]趙振旗.應加強對學情的研究[J].山東教育科研,1988(2):30.
[2]北江.臺灣、日本、美國學生學情習況之對比[J].廣州教育,1988(2):70.
[3]大學學習理論與方法課題組.對5641名大學生學習情況的調查分析[J].高等教育研究,1995(5):35-41.
[4]韓振華,任劍峰.社會調查研究中的社會稱許性偏見效應[J].華中科技大學學報(人文社會科學版),2002(3):47-50.
[5]趙丹,黃星艷.社會贊許性的研究現(xiàn)狀及展望[J].經濟研究導刊,2011(11):201-203.
[6]Marlowe, D., & Crowne, D.P..Social desirability and response to perceived situational demands.Journal of Consulting Psychology, 1961, no.25,pp.109-115.
[7]Zerbe, W.J., Paulhus, D.L..Socially desirable responding in organizational behavior: A reconception.Academy of Management Review,1987, Vol.12, no.2, pp.250-264.
[8]Paulhus, D.L..Social desirable responding: The evolution of a construct.In: Braun H., Wiley D.E.,& Jackson D N(Eds.), Personality and intellect,validity and values: Crosscutting themes.New York: Guilford, 1999, pp.49-69.
[9]鐘華,郭永玉.社會稱許性問題的解決方法初探[C].第十一屆全國心理學學術會議論文摘要集,2007:505.
[10]Kim,J.;Roksa,J.;Arum,R..在全球化時代衡量高等教育的學習效果[J].國際高等教育,2009(3):71-72.
[11]Sources of Error 2010 Social Desirability Bias:Other Quality Indicators-Social Desirability.http://nsse.iub.edu/links/psychometric_portfolio.2012-01-25.
[12]Miller, Angie L..Investigating Social Desirability Bias in Student Self-Report Surveys.Educational Research Quarterly, 2012, Vol.36, no.1, pp.30.
[13][德]馬克思.馬克思恩格斯全集(第23卷):資本論(第1卷)[M].北京:人民出版社,1995:363.
[14]白新文,李鋒,陳毅文.社會稱許性量表的測量等價性探討[J].心理科學,2004(5):1083-1086.
[15]駱方,黎堅.《社會稱許性量表》的分界線劃定[C].第十二屆全國心理學學術大會論文摘要集,2009:411-412.
[16]清華大學課題組.“中國大學生學習與發(fā)展”系列調研報告之一——本科教育怎么樣?[N].光明日報,2012-06-19(15).