章芳芳,黃麗華
(浙江大學(xué)醫(yī)學(xué)院附屬第一醫(yī)院,浙江杭州 310003)
隨著實證科學(xué)概念的不斷推進,在醫(yī)學(xué)教育領(lǐng)域已有使用客觀證據(jù)取代個人主觀經(jīng)驗的趨勢。評價教學(xué)是否確有效益,必須講求證據(jù)。因此,具有高信效度、客觀全面的評價方法在醫(yī)學(xué)教育研究中就顯得尤為重要。目前護理臨床教學(xué)領(lǐng)域?qū)τ诮虒W(xué)效果的評價大多只局限于理論和操作考核,方法單一,也尚未形成完整連貫的評價系統(tǒng)。本文就國內(nèi)外文獻報道的醫(yī)學(xué)教育主要評價方法進行綜述,為建立護理臨床教學(xué)評價體系提供依據(jù)。
1.1 評價的定義 評價是指通過觀察、表現(xiàn)與專題評定或紙筆測驗從而獲得學(xué)生的學(xué)習(xí)信息,并對學(xué)生的學(xué)習(xí)進展予以價值判斷。評價具有導(dǎo)向與激勵、反饋與交流、檢查與監(jiān)控、鑒定與選拔的作用[1]。
1.2 評價的類型
1.2.1 按評價功能分類 按評價的功能[1]可分為形成性評價(formative evaluation)和總結(jié)性評價(summative evaluation)。形成性評價是評價學(xué)生在教學(xué)前和教學(xué)過程中知道了什么、能做什么,持續(xù)性的形成性評價能幫助確定學(xué)生當(dāng)前擁有的關(guān)于某個主題的知識和信念??偨Y(jié)性評價是在教學(xué)之后實施,用來確定學(xué)生是否掌握了某一課程的內(nèi)容,應(yīng)該給學(xué)生怎樣的最終成績,哪些學(xué)生可以進入下一階段的學(xué)習(xí)。
1.2.2 按評價形式分類 按評價的形式[2]可分為紙筆測驗和表現(xiàn)性評價(performance evaluation)。紙筆測驗是指書面形式的測驗,主要側(cè)重于評定學(xué)生科學(xué)知識方面學(xué)習(xí)成就高低或在認知能力方面發(fā)展強弱的一種評價方式。表現(xiàn)性評價是請具有相當(dāng)評價專業(yè)素養(yǎng)的教師,編擬與學(xué)習(xí)情境頗類似的模擬測驗,然后讓學(xué)生表現(xiàn)所知所能的學(xué)習(xí)結(jié)果。
1.3 評價方法的選擇 好的評價方法應(yīng)該具備RSVP特性,即信度(reliability)、標(biāo)準(zhǔn)化(standardization)、效度(validity)和實用性(practicality)[1]。每種評價方法都有其長處與短處,應(yīng)依據(jù)評估內(nèi)容做針對性的選擇[3],并將不同方法加以排列組合來評估不同的能力指標(biāo),同時考慮其信度、效度、對于未來學(xué)習(xí)與工作的幫助、參與者的接受程度以及成本等因素[4]。
2.1 紙筆測驗 多重選擇題(multiple choice questions,MCQs)是最常見的紙筆測驗形式,其最大的優(yōu)點是客觀公平,可使用計算機批改,基于這一特點也常被用于總結(jié)性評價,例如資格、執(zhí)照考試等。其他形式的紙筆測驗,包括簡答題(short answer)或結(jié)構(gòu)式申論題(structured essays)等,不僅可測試內(nèi)容知識,同時可測試知識的整合以及問題解決技巧等,但這些題目的可信度低、成本高、給分主觀、無法公平,故不適用于大型的資格考試,但可用于形成性評價[5]。雖然紙筆測驗?zāi)軠y量認知領(lǐng)域的學(xué)習(xí)結(jié)果,但在技能、態(tài)度領(lǐng)域則有其先天限制[2]。
2.2 表現(xiàn)性評價 表現(xiàn)性評價具有強調(diào)實際生活的表現(xiàn)、著重較高層次思考與解決問題技巧、允許評價時間彈性化、促進學(xué)生自我決定與負責(zé)、兼顧評價的結(jié)果與過程等特質(zhì)[2],彌補了傳統(tǒng)紙筆測驗存在的局限與不足。其形式多元,在醫(yī)學(xué)教育評價中常用的有迷你臨床演練(mini-clinical evaluation exercise,Mini-CEX)、操作技能直接觀察(direct observation of procedural skills,DOPS)、個案為基礎(chǔ)的討論(case based discussion,CbD)、多源反饋評價(multi-source feedback,MSF)、客觀結(jié)構(gòu)化臨床考試(objective structured clinical examination,OSCE)等。
2.2.1 基于工作場所的評估模式(workplace based assessment,WPBA) WPBA是一種以工作場所為基礎(chǔ),評價住院醫(yī)師實際執(zhí)業(yè)能力的評估模式[6],由多種評價方法組成。
2.2.1.1 Mini-CEX Mini-CEX由美國內(nèi)科醫(yī)學(xué)會(American Board of Internal Medicine,ABIM)Norcini等人設(shè)計[7],主要用于對住院醫(yī)師的臨床技巧評估。評估時間由住院醫(yī)師和臨床教師兩人預(yù)先約定,評估時在門診、急診或住院病房指定1例患者,教師觀察住院醫(yī)師對患者的診療工作,評估醫(yī)療面談、人文關(guān)懷、咨詢技巧、理學(xué)檢查、臨床判斷、組織技巧與效能,根據(jù)評定量表進行打分,并對其表現(xiàn)及時做出反饋和指導(dǎo)[8]。這種評估法的特點是能有效評估臨床技能并能立即給予反饋[9,10]。
2.2.1.2 DOPS DOPS由英國皇家內(nèi)科醫(yī)師協(xié)會(Royal College of Physicians,RCP)設(shè)計,主要用于評估住院醫(yī)師的臨床操作技能。DOPS由住院醫(yī)師自己選擇評估時間、內(nèi)容及考官。評估時,臨床教師直接觀察住院醫(yī)師在患者身上執(zhí)行1~2種臨床技術(shù)操作,在評定量表上打分并給予即時反饋[7]。
2.2.1.3 CbD CbD由英國國家醫(yī)療保健系統(tǒng)下屬的醫(yī)療評估和培訓(xùn)所設(shè)計,主要評估住院醫(yī)師的臨床推理與決策能力。個案為住院醫(yī)師照顧過的實際病例,考官由有經(jīng)驗并受過專門訓(xùn)練的臨床教師擔(dān)任。每次評估由住院醫(yī)師自己挑選病例個案,并事先將病例資料送交考官,使考官熟悉個案情況。評估時,考官首先結(jié)合病例與住院醫(yī)師作結(jié)構(gòu)式的討論,內(nèi)容涉及診斷、治療、醫(yī)學(xué)倫理及法律等領(lǐng)域,然后考官根據(jù)討論結(jié)果在評定量表上打分,并立即給予反饋[8]。
2.2.1.4 MSF MSF又稱360°反饋評價(360-degree feedback assessment),主要是讓和住院醫(yī)師常常接觸但背景不同的人從多角度評估其表現(xiàn),內(nèi)容涵蓋臨床照顧、醫(yī)療專業(yè)、教學(xué)與訓(xùn)練、醫(yī)患關(guān)系、團隊協(xié)作等被英國總醫(yī)學(xué)會(general medical council,GMC)認定為優(yōu)秀醫(yī)療實踐(good medical practice)[11]的各個領(lǐng)域。評估者由住院醫(yī)師自己提名,包括臨床教師、護理及其他醫(yī)療相關(guān)人員等,同時也要求住院醫(yī)師依據(jù)表格進行自我評估。MSF評估是比較綜合的,可以獲得住院醫(yī)師更豐富而深入的信息,除了知識與技能外,還可了解其工作習(xí)性、團隊精神、人際關(guān)系等[12]。MSF的缺點主要體現(xiàn)在同行評估的保密性和自我評估的偏差性[13]。
2.2.2 基于模擬操作的評估模式 模擬操作在醫(yī)學(xué)上的應(yīng)用導(dǎo)因于醫(yī)學(xué)生面對患者理學(xué)檢查或溝通技巧方面的不足可能導(dǎo)致的醫(yī)療質(zhì)量問題。一個好的模擬操作通常包括以下特質(zhì):培養(yǎng)操作中關(guān)鍵步驟的能力,高度擬實境性,對于可能情境的涵蓋性,以及在操作中提供適當(dāng)?shù)幕仞乕14]。在醫(yī)學(xué)模擬教育評估中常用的方法有以下幾種。
2.2.2.1 OSCE OSCE是由英國Dundee大學(xué)的Ross等[15]于1975年提出的,是一種集測試、評估和反饋于一體的臨床培訓(xùn)方法,也是一種客觀、有序、有組織的考核框架。不同醫(yī)學(xué)院或考試機構(gòu)可以根據(jù)自己的教學(xué)大綱和測試需求培訓(xùn)健康人作為標(biāo)準(zhǔn)化患者(SP)[16],并設(shè)計模擬臨床場景,讓考生通過一系列事先設(shè)計的考站來考察詢問病史、體格檢查、與患者交流、信息收集、假設(shè)建立、數(shù)據(jù)解釋及職業(yè)態(tài)度等。由觀察者或SP對考生進行評價,并即時對考生作出反饋,達到通過考試提高的目的[17]。OSCE因使用評定量表和多站評估使評分的客觀性大大增強,適合用于課程后的總結(jié)性評價。效度上OSCE高于筆紙測驗,但與WPBA相比又略遜一籌,信度上低于紙筆測驗但高于WPBA(因為患者與模具計算機為標(biāo)準(zhǔn)化情境)[18];缺點是成本很高且耗時,實施一次正規(guī) OSCE 所耗費的人力及財力相當(dāng)可觀,并非是可以經(jīng)常采用的方法[19]。
2.2.2.2 基于標(biāo)準(zhǔn)化患者的練習(xí)和考查(standardized patient experiences/exam,SPE/Xs) SPE/Xs既可用于醫(yī)學(xué)生平時的練習(xí)、評估及反饋,也可用于醫(yī)學(xué)生臨床技能的考查,解決醫(yī)師缺乏、患者缺乏及無法系統(tǒng)評估及反饋的問題[20]。SPE/Xs的缺點在于SP畢竟不是真實患者,不具有明確的陽性體征,在對醫(yī)學(xué)生臨床診療能力的考查上存在一定的局限。
2.2.2.3 基于仿真器的練習(xí)和考查 目前仿真器最普及的應(yīng)用是模擬假人,如歐美醫(yī)學(xué)院或教學(xué)中心廣泛使用的SIMMAN,可訓(xùn)練學(xué)生作循環(huán)呼吸的理學(xué)評估基本臨床技巧(氣管插管,中心或周圍靜脈導(dǎo)管置入),以及訓(xùn)練醫(yī)療人員(急診,加護病房或手術(shù)室)面對緊急狀況的團隊合作等[21,22]。在成本效益評估方面,過去文獻研究顯示[23],仿真假人在訓(xùn)練團隊合作方面具有很高的效益,但對于臨床理學(xué)檢查及技巧訓(xùn)練而言則投資報酬率低。因此,這種模擬假人目前僅應(yīng)用于OSCE及畢業(yè)后專科醫(yī)師培養(yǎng)或繼續(xù)教育訓(xùn)練(CME)等方面[24,25]。
未來的醫(yī)學(xué)教育評價應(yīng)導(dǎo)向多時段、多工具、多教師的多元化評價,評價本身的概念包含了不同的時機(課前、課中與課后)、不同的目的(形成性評價和總結(jié)性評價)、不同的形式(紙筆測驗和表現(xiàn)性評價)[5]。可靠的評價應(yīng)該同教學(xué)緊密相連,既反映教學(xué)目標(biāo)也指導(dǎo)教學(xué)策略,近來醫(yī)學(xué)教育的目標(biāo)已有微妙的轉(zhuǎn)變,由過去“我們想要產(chǎn)生什么樣的醫(yī)師”轉(zhuǎn)變?yōu)椤拔覀兘o予患者什么樣的服務(wù)”,這就是一種以顧客為中心的客制化概念。所以在教學(xué)中,如果牽涉實際患者、SP,甚至是一些小組或病房學(xué)習(xí)過程中的同行,都應(yīng)注意他們的評估意見(同行是屬于組織理論中的“內(nèi)部顧客”概念)。因此未來的教學(xué)評價不能只從師長或單方知識的觀點來看學(xué)生表現(xiàn),還需注意病患關(guān)切的照護質(zhì)量,以及同行的評價,即360°全方位評價。
參考文獻:
[1] 珍妮·埃利斯·奧姆羅德.教育心理學(xué)[M].龔少英,譯.6版.北京:中國人民大學(xué)出版社,2011:6-30.
[2] 李坤崇.教學(xué)評估多種評價工具的設(shè)計及應(yīng)用[M].上海:華東師范大學(xué)出版社,2011:125.
[3] Epstein RM.Assessment in medical education[J].N Engl J Med,2007,356:387-396.
[4] Wass V,Van der Vleuten C,Shatzer J,et al.Assessment of clinical competence[J].Lancet,2004,357:945-949.
[5] 陸希平.醫(yī)學(xué)教育未來發(fā)展重要趨勢-2007亞太國際醫(yī)學(xué)教育之重要信息(下)[J].西北醫(yī)學(xué)教育,2008,16(4):617-620.
[6] Norcini JJ. Work based assessment[J].BMJ,2003,326:753-755.
[7] Norcini JJ,Blank LL,Arnold GK,et al.The Mini-CEX(clinicalevaluation exercise):a preliminary investigation[J].Ann Intern Med,1995,123(10):795-799.
[8] 曹偉.WPBA在英國畢業(yè)后醫(yī)學(xué)教育中的應(yīng)用[J].復(fù)旦教育論壇,2010,8(4):92-96.
[9] Lawrence JW,Fauerbach JA,Heinberg LJ,et al.The reliability and validity of the Perceived Stigmatization Questionnaire(PSQ) and the Social Comfort Questionnaire(SCQ) among an adult burn survivor sample[J].Psychol Assess,2006,18(1):106-110.
[10] Corrigan G,Bowden FJ,Owen C.Mini-clinEx versus mini-CEX[J].Med Educ,2006,40(6):599-600.
[11] Howley LD,Wilson WG.Direct observation of students during clerkship rotations:a multiyear descriptive study[J].Acad Med,2004,79:276-280.
[12] Ramsey PG,Wenrich MD,Carline JD,et a1.Use of peer ratings to evaluate physician performance[J].JAMA,1993,269:1655-1660.
[13] Norcini JJ.Peer assessment of competence[J].Med Educ,2003,37:539-543.
[14] Carter FJ,Schijven MP,Aggarwal R,et al.Work group for evaluation and implementation of simulators and skills training programmes:consensus guidelines for validation of virtual reality surgical simulators[J].Surg Endosc,2005,19(12):1523-1532.
[15] Ross M,Carroll G,Knight J,et al.Using the OSCE tomeasure clinical skills performance in nursing[J].J Adv Nurs,1988,13(1):45-56.
[16] Barrows H.An overview of the uses of standardized patients for teaching and evaluating clinical skills[J].Academic Medicine,1993,68(6):443-453.
[17] 張新晨,吳德全,張麗穎,等.基于表現(xiàn)的教學(xué)與評估在醫(yī)學(xué)教育中的應(yīng)用[J].中國高等醫(yī)學(xué)教育,2010,(5):45-46.
[18] Pulito AR,Donnelly MB,Plymate M,et al.What do faculty observe omedical students’clinical performance[J].Teach Learn Med,2006,18:99-104.
[19] Wragg A,Wade W,Fuller G,et al.Assessing the performance of specialist registrars[J].Clin Med,2003,3:131-134.
[20] Battles JB,Wilkinson SL,Lee SJ.Using standardized patients in an objective structured clinical examination as a patient safety tool[J].Qual Saf Health Care,2004,13(8):i46-i50.
[21] Le CQ,Lightner DJ,VanderLei L,et al.The current role of medical simulation in American urological residency training programs:an assessment by program directors[J].J Urol,2007,177(1):288-291.
[22] Dawson DL,Meyer J,Lee ES,et al.Training with simulation improves residents’ endovascular procedure skills[J].J Vasc Surg,2007,45(1):149-154.
[23] MacDowall J.The assessment and treatment of the acutely ill patient-the role of the patient simulator as a teaching tool in the undergraduate programme[J].Med Teach,2006,28(4):326-329.
[24] Triola M,Feldman H,Kalet AL,et al.A randomized trial of teaching clinical skills using virtual and live standardized patients[J].J Gen Intern Med,2006,21(5):424-429.
[25] Issenberg SB,Gordon MS,Greber AA.Bedside cardiology skills training for the osteopathic internist using simulation technology[J].J Am Osteopath Assoc,2003,103(12):603-607.