楊佳樂,王傳毅
(清華大學(xué) 教育研究院,北京 100084)
研究生教育質(zhì)量是一個多維立體的概念,一般可分為入口階段的生源質(zhì)量、過程階段的培養(yǎng)質(zhì)量和出口階段的發(fā)展質(zhì)量。在“以學(xué)為中心”的理念驅(qū)動下,美國圍繞研究生在學(xué)經(jīng)歷展開了多項調(diào)查,如加州大學(xué)伯克利分校高等教育研究中心SERU(Student Experience in the Research University)團隊開展的研究生學(xué)習(xí)經(jīng)歷調(diào)查、[1]麻省理工學(xué)院開展的博士生離校調(diào)查[2]等。研究生職業(yè)發(fā)展也是美國重點關(guān)注的質(zhì)量監(jiān)測點,典型調(diào)查包括華盛頓大學(xué)研究生創(chuàng)新研究中心(Center for Innovation & Research in Graduate Education , CIRGE)開展的哲學(xué)博士畢業(yè)十年后調(diào)查、藝術(shù)史博士畢業(yè)十年后調(diào)查和社會科學(xué)博士畢業(yè)五年后調(diào)查。[3]這些調(diào)查為提升研究生培養(yǎng)質(zhì)量和發(fā)展質(zhì)量提供了必要的數(shù)據(jù)支撐,但對入口階段的生源質(zhì)量卻關(guān)注較少,致使招生環(huán)節(jié)對后續(xù)培養(yǎng)、職業(yè)發(fā)展環(huán)節(jié)的影響仍處于“黑箱”之中,難以形成研究生教育質(zhì)量保障閉環(huán)。故優(yōu)化招生改革,提高生源質(zhì)量成為美國研究生教育改革中的重要一環(huán),而“綜合審核”(Holistic Review)是主導(dǎo)改革的重要理念。
與此同時,中國也開始強調(diào)改革研究生招生制度?!秾W(xué)位與研究生教育發(fā)展“十三五”規(guī)劃》中提出要“加強能力考查,注重綜合評價,建立健全更加科學(xué)有效、公平公正的考核選拔體系”?!蛾P(guān)于高等學(xué)校加快“雙一流”建設(shè)的指導(dǎo)意見》也提到要“完善以提高招生選拔質(zhì)量為核心、科學(xué)公正的研究生招生選拔機制”。在此背景下,諸多中國高校開始試點博士生申請考核制,不以入學(xué)考試成績“論英雄”,更加看重申請者的綜合素質(zhì)。但目前申請考核制仍處于高校自主探索階段,如何科學(xué)有效地考察申請者的綜合素質(zhì)成為我國研究生招生制度改革亟待解決的重要問題?;诖?,本研究通過梳理美國研究生招生的綜合審核經(jīng)驗,期冀為中國的相關(guān)改革提供參考借鑒。
在美國,綜合審核這一術(shù)語最早應(yīng)用于本科生招生實踐,之后逐步擴散至研究生教育領(lǐng)域,但尚未形成統(tǒng)一意見,不同機構(gòu)和個人都嘗試定義研究生招生過程中的綜合審核。例如,研究生院理事會(Council of Graduate Schools, CGS)在20世紀(jì)90年代就提醒各招生單位不宜僅憑錄取分?jǐn)?shù)線就決定錄取與否,[4]這可以視為綜合審核的萌芽,但當(dāng)時并未給出明確定義或是界定與此相關(guān)的實踐,直到2016年才以報告的形式將其倡導(dǎo)的綜合審核表述為:學(xué)位點在審核研究生申請材料時應(yīng)考慮廣義特征集,傳統(tǒng)的認(rèn)知能力、非認(rèn)知能力以及其他個人特質(zhì)均需有所涉及。[5]美國醫(yī)學(xué)院協(xié)會(Association of American Medical Colleges, AAMC)對綜合審核的定義是使用靈活、個性化的方式綜合評估申請者的經(jīng)歷、特質(zhì)和學(xué)術(shù)水平,以及今后可能的貢獻,并構(gòu)建起實施綜合審核的經(jīng)歷—特質(zhì)—成績(Experiences-Attributes-Metrics)模型。[6]美國教育考試服務(wù)中心發(fā)布的《GRE使用指南》將綜合審核理解為在招生過程中使用包括研究生入學(xué)考試成績在內(nèi)的多元信息衡量申請人個人潛力。[7]格里芬(Griffin)等認(rèn)為綜合審核意味著在研究生招生中要跳出過往注重申請人GRE成績和本科院校背景的窠臼。[8]
綜上所述,本研究認(rèn)為綜合審核是指全面考察申請者的個人經(jīng)歷、學(xué)術(shù)能力、非認(rèn)知能力和科研潛力。換言之,錄取與否不僅取決于當(dāng)下的考試成績,而且取決于過去的學(xué)習(xí)經(jīng)歷和未來的個人潛力。那么,需要進一步回答的問題是,為什么要實施綜合審核?以及如何有效衡量個人經(jīng)歷、非認(rèn)知能力和科研潛力等,以落實綜合審核?
傳統(tǒng)的研究生招生考核方式過于倚重科研成果和考試成績。CGS2015年研究生就讀周期調(diào)查結(jié)果表明,學(xué)術(shù)成果證明材料和GRE、GMAT、LSAT等標(biāo)準(zhǔn)化考試成績在碩士、博士申請材料初篩階段均占有60%左右的比重(見表1),但已有研究證實研究生入學(xué)前的科研經(jīng)歷、標(biāo)準(zhǔn)化考試成績、學(xué)分績點等與其日后的科研生產(chǎn)力的關(guān)聯(lián)并不顯著,反而是專家推薦信能夠有效預(yù)測學(xué)生的科研產(chǎn)出。[9]Liane等的研究發(fā)現(xiàn),GRE成績既無法有效預(yù)測博士生是否能順利通過資格考試或獲得學(xué)位,也無法有效預(yù)測其科研生產(chǎn)力。[10]美國教育考試中心(Educational Testing Service, ETS)主導(dǎo)的“地平線”項目[11]以及Kuncel等開展的元分析[12]均表明,要提高GRE考試對研究生學(xué)業(yè)成就的預(yù)測效度還必須加入對非認(rèn)知能力的考量。相比傳統(tǒng)招考方式,綜合審核通過加大對申請者非認(rèn)知能力的考察能夠很大程度上克服以學(xué)習(xí)成績?yōu)楹诵暮Y選標(biāo)準(zhǔn)導(dǎo)致的無效預(yù)測和選擇偏差,因而受到推崇。
表1 各申請材料在研究生招生初篩階段的重要性
資料來源:2015 CGS Graduate Student Life Cycle Survey.
學(xué)生群體的多樣性是創(chuàng)新力的重要來源,生源多樣已成為研究生招生環(huán)節(jié)的普遍訴求。而女性、少數(shù)族裔、[13]以及大齡學(xué)生[14]等在標(biāo)準(zhǔn)化考試中往往處于劣勢地位,如ETS公布的數(shù)據(jù)顯示,白人的GRE考試成績通常比黑人高18%~32%,[15]即唯分?jǐn)?shù)論英雄的傳統(tǒng)招考方式容易造成對上述弱勢群體的“隱性歧視”,從而損害生源多樣性,給創(chuàng)新力的激發(fā)帶來負(fù)面影響。除GRE等標(biāo)準(zhǔn)化考試成績外,美國研究生招生還要求取得一定水平的語言成績,如TOEFL等。對母語為非英語的研究生而言,差強人意的語言成績則會致使招生委員會成員錯誤地將其排除在錄取名單之外,而不論其是否具備其他天賦,[16]這也從一個側(cè)面扼殺了生源多樣性。
過高的流失率和過長的就讀年限一直是美國研究生教育,特別是博士生教育的痛點。為此,僅CGS就曾發(fā)布四本專題報告集中探討博士學(xué)位流失率問題,[17-20]這些研究發(fā)現(xiàn):博士生與培養(yǎng)單位的匹配度、博士生的非認(rèn)知能力特征以及雙方信息的對稱性等是影響培養(yǎng)效率的重要因素。綜合審核的實施恰好能夠更好地將此類因素納入到考察的范圍中,從而篩選出更加勝任博士學(xué)習(xí)的候選人,在培養(yǎng)之初的招生環(huán)節(jié)就為培養(yǎng)效率的提高和教育成本的降低奠定良好的基礎(chǔ)。
平權(quán)運動的興起使得在研究生招生中推進綜合審核這一倡議得到了國家法律層面的支持。1978年巴克(Bakke)起訴加利福尼亞大學(xué)戴維斯醫(yī)學(xué)院案、2003年格魯特爾(Grutter)起訴密歇根大學(xué)法學(xué)院案和2013年費舍(Fisher)起訴德克薩斯大學(xué)奧斯汀分校案不斷警示院校要保留充分詳實的材料記錄招生過程,采用綜合審核的方式體現(xiàn)種族中立原則。第三方組織也通過發(fā)布報告、開展培訓(xùn)等方式推促院校開展綜合審核。AAMC相繼發(fā)布《通往多樣性的路線圖:醫(yī)學(xué)院招生過程中融入綜合審核原則》、《通往卓越的路線圖:衡量醫(yī)學(xué)院綜合審核招生的關(guān)鍵概念》和《通往多樣性和教育卓越的路線圖:影響醫(yī)學(xué)院的若干法律和教育政策》三份研究報告。CGS形成《研究生招生過程中的綜合審核》和《碩士招生:透明性、指導(dǎo)和培訓(xùn)》兩份專題研究報告。國家科學(xué)基金會(NSF)資助設(shè)立包容性研究生教育網(wǎng)絡(luò)(Inclusive Graduate Education Network)項目,所舉辦的工作坊主題之一即為“招生中的綜合審核”。在此背景下,院校逐步開始實施綜合審核,并在制定綜合審核的觀測維度、建立綜合審核的計分標(biāo)準(zhǔn)、創(chuàng)新對非認(rèn)知能力的評價以及加強對申請者與院系培養(yǎng)項目匹配度考察等方面取得了有益的經(jīng)驗。
綜合考核能否有效實施,首先取決于招生單位是否建立了一套科學(xué)系統(tǒng)的觀測維度,并將維度細(xì)化為可操作的指標(biāo)體系。如密歇根大學(xué)拉克哈姆研究生院(Rackham Graduate School)所實施的綜合審核涵蓋申請者的學(xué)術(shù)表現(xiàn)、科研潛力和個人特質(zhì)三個一級維度,以及相應(yīng)的若干二級維度(見表2)。華盛頓大學(xué)生物工程系的綜合審核涵蓋學(xué)術(shù)評價和個人特質(zhì)兩個一級維度,其中學(xué)術(shù)評價包括:①GPA成績的變化趨勢及課程難度;②GRE成績;③論文質(zhì)量;④科研項目參與情況。個人特質(zhì)包括:①所克服的教育、經(jīng)濟及個人困難(教育困難如屬于第一代大學(xué)生;經(jīng)濟困難如在校期間的工作經(jīng)歷;個人困難如遭遇家庭變故、存在生理/心理疾病等);②提升多樣性的能力;③對社區(qū)、培養(yǎng)單位或家庭的重要貢獻;④推薦信。[18]
表2 密歇根大學(xué)拉克哈姆研究生院綜合審核的指標(biāo)體系
資料來源:https://rackham.umich.edu/faculty-and-staff/resources-for-directors/holistic-review-of-applications/.
在不同的觀測維度上,招生單位能否建立明晰準(zhǔn)確的計分標(biāo)準(zhǔn)對申請人的能力素質(zhì)進行評判是保證綜合審核結(jié)果科學(xué)性和可比性的核心步驟。韋恩州立大學(xué)(Wayne State University)提供了如何使用綜合審核評價申請者的評估標(biāo)準(zhǔn)模板,主要包括寫作溝通能力、學(xué)術(shù)準(zhǔn)備、科研基本能力、學(xué)術(shù)恒心與學(xué)術(shù)熱情、貢獻創(chuàng)新觀點的能力五個方面,權(quán)重各占20%(見表3)[19]。
西德克薩斯農(nóng)工大學(xué)(West Texas A&M University)的綜合審核評估標(biāo)準(zhǔn)分為GPA、推薦信、寫作能力和面試表達四大部分,GPA成績與評估得分存在轉(zhuǎn)換標(biāo)準(zhǔn),如GPA3.8~4.00對應(yīng)4分,3.6~3.79對應(yīng)3分。寫作能力的評價為寫作內(nèi)容、寫作風(fēng)格、寫作結(jié)構(gòu)和語法規(guī)范四維度的得分加總,每個維度最高得分2分(見表4)。面試表達重點考察申請人所展現(xiàn)出的對學(xué)習(xí)的強烈熱情、領(lǐng)導(dǎo)力、有條理地交流溝通能力、對多樣性的貢獻力、恰當(dāng)?shù)闹w語言表現(xiàn)力、克服學(xué)習(xí)困難的能力以及簡明扼要陳述觀點的能力,最高得分10分。
表3 韋恩州立大學(xué)綜合審核標(biāo)準(zhǔn)制定模板
資料來源:https://gradschool.wayne.edu/faculty/portfolio-review.
表4 西德克薩斯農(nóng)工大學(xué)寫作能力評估標(biāo)準(zhǔn)
資料來源:West Texas A&M University GRADUATE ADMISSION RUBRIC.
在綜合審核中,非認(rèn)知能力的評價不僅是非常重要的部分,更是亟待加強的部分。鑒于非認(rèn)知能力方面數(shù)據(jù)的結(jié)構(gòu)化程度較低,其評價方法較之于認(rèn)知能力的評價還不夠成熟。但在理論層面,已基本建立非認(rèn)知能力測量的理論模型。根據(jù)Sedlacek的研究成果,調(diào)查問卷、面試、檔案袋等技術(shù)都可用于評價非認(rèn)知能力。[20]馬里蘭大學(xué)(The University of Maryland)使用Sedlacek等開發(fā)的調(diào)查問卷評價申請人的以下特征:(1)自信;(2)現(xiàn)實的自我評估;(3)處理種族主義;(4)著眼長遠(yuǎn)目標(biāo);(5)強有力的個人支持網(wǎng)絡(luò);(6)成功的領(lǐng)導(dǎo)力經(jīng)歷;(7)社區(qū)服務(wù);(8)取得某一領(lǐng)域的專業(yè)知識。[21]路易斯安那州立大學(xué)醫(yī)學(xué)院(Louisiana State University Medical School)則更加偏好于通過結(jié)構(gòu)化的面試對非認(rèn)知能力進行考察,在十年的探索實施中,成功地促進了學(xué)生群體的多樣性,非白人學(xué)生的入學(xué)比例增長一倍,保留率也提升至87%。北卡羅萊納州立大學(xué)設(shè)計學(xué)院(The School of Design at North Carolina State University)要求申請者提供裝有其設(shè)計作品相關(guān)材料的檔案袋,借此評價申請者克服困難、自我評價、目標(biāo)設(shè)定等非認(rèn)知能力。除上述方式外,招考環(huán)節(jié)也在嘗試采用標(biāo)準(zhǔn)化推薦信、傳記式數(shù)據(jù)、[22]情境判斷測驗、[23]內(nèi)隱聯(lián)想測驗[24]和條件式推理[25]等評價申請者的非認(rèn)知能力。
申請人與培養(yǎng)項目的匹配有助于學(xué)生順利完成專業(yè)社會化,推進本學(xué)科領(lǐng)域的知識邊界;也有助于院系培育和諧的組織文化,保持組織系統(tǒng)順暢運行。因為選拔研究生某種意義上和聘任教師的本質(zhì)類似,都屬于學(xué)術(shù)共同體評價篩選未來同行的過程,[26]需要特別關(guān)注研究生與培養(yǎng)項目的雙向匹配。CGS2018年面向各成員單位碩士項目主管的調(diào)查結(jié)果顯示(如圖1),可以從以下六個方面衡量匹配度,分別為:①和申請人匹配的科研導(dǎo)師的可得性;②和申請人匹配的實踐導(dǎo)師的可得性;③申請人適應(yīng)項目文化的潛力;④申請人遵守專業(yè)規(guī)范和倫理的潛力;⑤申請人和多元群體合作的潛力;⑥申請人提升項目多元性的潛力。其中,學(xué)術(shù)型碩士項目最看重申請人與科研導(dǎo)師的匹配,專業(yè)型碩士項目則更側(cè)重申請人符合本專業(yè)規(guī)范和倫理。[27]
圖1 不同碩士項目對匹配性的關(guān)注點(認(rèn)為“非常重要”)
匹配度的考察要求院校首先要反思自身的培養(yǎng)目標(biāo)及培養(yǎng)條件,在此前提下明確審核的標(biāo)準(zhǔn),包括招生簡章中列明重點考察的認(rèn)知及非認(rèn)知特質(zhì)、制定相對結(jié)構(gòu)化的面試審核標(biāo)準(zhǔn)等,同時也要求培養(yǎng)單位加強院校數(shù)據(jù)的積累與分析。如加州大學(xué)2019年新上線的博士項目數(shù)據(jù)庫詳細(xì)呈現(xiàn)了申請、錄取、資助、學(xué)位完成和校友就業(yè)等情況,[28]為該校改進招生方式,更準(zhǔn)確地判斷申請者與培養(yǎng)項目的匹配度提供了數(shù)據(jù)支持。
我國研究生招考制度結(jié)構(gòu)分為國家和院校兩個層次,規(guī)模與結(jié)構(gòu)、選拔方式與考察內(nèi)容、錄取標(biāo)準(zhǔn)與工作程序三個方面,[29]綜合審核屬于其中的環(huán)節(jié)之一,可以此為著力點實現(xiàn)招生制度的系統(tǒng)變革。美國的經(jīng)驗表明,研究生招考具有鮮明的“底部厚重”特征,國家和第三方機構(gòu)構(gòu)成招考質(zhì)量的保障者和招生考改革的推動者,但院校始終是招考主體,能夠根據(jù)生源情況和自身辦學(xué)實際自下而上推進綜合審核。為此國家主要是為綜合考核的實施提供的制度空間,即在保有考試優(yōu)勢的同時,通過制度創(chuàng)新弱化考試在招考錄取中的決定性作用,為綜合考核的實施提供條件。從操作層面而言,我國研究生招考制度改革可探索“一考多次,申請考核;一考多類,替代選擇”的方法,降低學(xué)生考試負(fù)擔(dān),鼓勵靈活申請。
“一考多次,申請考核”指引入標(biāo)準(zhǔn)化測試,一年兩次,考試成績2~3年有效,有效期內(nèi)該成績可多次使用,招考流程大致為國家完成制度供給,擬定標(biāo)準(zhǔn)化考試大綱與監(jiān)督保障條例,第三方專業(yè)機構(gòu)負(fù)責(zé)組織實施標(biāo)準(zhǔn)化測試,申請者向院校遞交考試成績單及其他申請材料,院校經(jīng)過綜合審核或進行必要考核后自主決定錄取與否。美國的標(biāo)準(zhǔn)化測試共分為三類,即研究生入學(xué)考試(GRE),專業(yè)測試如商學(xué)院看重的“經(jīng)企管理研究生入學(xué)考試”(GMAT)、法學(xué)院看重的“法學(xué)院入學(xué)考試”(LSAT)、醫(yī)學(xué)院看重的“醫(yī)學(xué)院入學(xué)考試”(MCAT)、心理學(xué)專業(yè)看重的“米勒類推測驗”(MAT),以及語言能力測試(如TOEFL),均由第三方專業(yè)機構(gòu)命題實施。我國可參考此體系,加快構(gòu)建符合中國國情的、“通用+專業(yè)+語言”三位一體的研究生標(biāo)準(zhǔn)化測試系統(tǒng)。其中通用型標(biāo)準(zhǔn)化測試主要考察邏輯推理、批判分析等非認(rèn)知能力;專業(yè)型標(biāo)準(zhǔn)化測試根據(jù)不同專業(yè)特色設(shè)計,主要考察各專業(yè)基礎(chǔ)知識和認(rèn)知能力,專業(yè)學(xué)位研究生招考可加大此項考試成績所占比重;語言測試分中文及外語兩大類,分別面向國際生源和本土生源。
“一考多類,替代選擇”指強化研究生招生考試與職業(yè)資格認(rèn)證的銜接,即職業(yè)資格考試成績在某些專業(yè)可替代標(biāo)準(zhǔn)化測試成績用于研究生入學(xué)申請,如法律、會計等。銜接方式包括完全銜接和部分銜接兩種,完全銜接是指通過職業(yè)資格考試的考生不必再參加額外的標(biāo)準(zhǔn)化測試,職業(yè)資格考試成績能夠完全等同于專業(yè)型標(biāo)準(zhǔn)化測試成績;部分銜接是指職業(yè)資格考試成績可按照規(guī)定比例折算為標(biāo)準(zhǔn)化測試成績,但考生仍需參加專業(yè)型標(biāo)準(zhǔn)化測試,為招生工作組綜合審核申請人特質(zhì)提供多樣參考。
招考分離后,院校的工作重心在于自主探索高效科學(xué)的研究生招生方式,形成適用于中國本土的綜合審核標(biāo)準(zhǔn)與程序。借鑒美國高校的經(jīng)驗,中國高校需重點改進完善以下三個方面。其一,試點面向不同院校類型、不同學(xué)科門類的研究生招生綜合審核的觀測維度與計分標(biāo)準(zhǔn)。綜合審核要求至少但不限于考察申請人過去的學(xué)習(xí)經(jīng)歷、當(dāng)下的考試成績和未來的發(fā)展?jié)摿?,并且?guī)定各個觀測維度的分?jǐn)?shù)轉(zhuǎn)換標(biāo)準(zhǔn),其中的難點在于面試環(huán)節(jié),個人陳述、專家推薦信等申請材料的結(jié)構(gòu)化測量評價。美國高校多重視申請人的考試成績與寫作溝通能力,目前已建立相對完善的計分標(biāo)準(zhǔn)體系,但面試環(huán)節(jié)仍高度依賴面試組專家的主觀判斷,結(jié)構(gòu)化程度有待提升。計分標(biāo)準(zhǔn)的結(jié)構(gòu)化取決于問題設(shè)置的結(jié)構(gòu)化,因此我國高??梢悦嬖噯栴}設(shè)置為突破口,對于知識性問題依據(jù)答案是否正確給出評價分?jǐn)?shù),對于開放性問題依據(jù)專業(yè)共識評分。同時不容忽視的是,不同院校和不同學(xué)科的生源需求及培養(yǎng)特色存在巨大差異,因此探索分層分類的多元觀測維度與計分標(biāo)準(zhǔn)至關(guān)重要。
其二,加快開發(fā)衡量申請人非認(rèn)知能力的評價工具。中國對于研究生非認(rèn)知能力的考察以面試為主,手段較為單一且信效度不佳。因此國內(nèi)招生單位首先要開展非認(rèn)知能力的相關(guān)研究,通過對國內(nèi)著名導(dǎo)師、優(yōu)秀研究生的訪談、調(diào)查,進一步確定影響中國研究生學(xué)業(yè)成就的非認(rèn)知能力;其次,實行量表測驗,納入情景式、案例式的題目,增強非認(rèn)知測量的科學(xué)性;此外,試點采用標(biāo)準(zhǔn)化推薦信,并依據(jù)推薦人的評分寬嚴(yán)程度、對研究生學(xué)業(yè)成就預(yù)測效度實行評分校正等。[30]
最后,為院系招生工作組成員提供綜合審核的培訓(xùn)服務(wù)與參考資料,保證申請人與培養(yǎng)項目的雙向匹配。實施綜合審核在賦予院系更大招生自主權(quán)的同時也對其人才選拔水平提出更高要求,校級研究生招生部門作為招考流程中承上啟下的協(xié)調(diào)組織,可定期組織綜合審核相關(guān)工作坊,一方面幫助院系招生工作的具體實施人員提高對申請材料的甄別篩選能力,結(jié)合不同培養(yǎng)項目的培養(yǎng)目標(biāo)、師資隊伍、文化氛圍、專業(yè)規(guī)范和學(xué)生群體特征,在入口階段選拔最適切的生源進入培養(yǎng)序列。另一方面,結(jié)合培養(yǎng)過程及畢業(yè)生發(fā)展追蹤數(shù)據(jù)構(gòu)建質(zhì)量反饋機制,持續(xù)改進申請人與培養(yǎng)項目的匹配度。