趙成瑞,常明亮,吳惠文,溫海秀,魏建宏
(山西醫(yī)科大學(xué)汾陽(yáng)學(xué)院,山西 汾陽(yáng) 032200)
生理學(xué)作為一門溝通基礎(chǔ)醫(yī)學(xué)和臨床醫(yī)學(xué)的橋梁學(xué)科[1],在醫(yī)學(xué)人才培養(yǎng)課程體系中有著重要的作用??荚囋u(píng)價(jià)是檢驗(yàn)教學(xué)工作好壞以及學(xué)生學(xué)習(xí)質(zhì)量高低的重要手段和決定性環(huán)節(jié)??荚嚨慕逃郎y(cè)量學(xué)質(zhì)量特性,從宏觀上講有信度、效度及可用度;從微觀上講有題目的難度、區(qū)分度,以及題目的教學(xué)敏感度等[2]。課題組以某醫(yī)學(xué)院臨床醫(yī)學(xué)本科生理學(xué)考試進(jìn)行點(diǎn)對(duì)點(diǎn)研究,以期客觀了解該校生理學(xué)授課與命題的目標(biāo)性及科學(xué)性。
考核試題(2h卷,閉卷考核)1套;理論成績(jī)333份(統(tǒng)稱為宏觀數(shù)據(jù),時(shí)間為2018—2019學(xué)年第1學(xué)期),教務(wù)處加密提供;試卷抽樣估算采用EpiCaLc2000軟件計(jì)算,抽樣試卷52份。涉及的抽樣試卷及成績(jī)中被分析的各成分?jǐn)?shù)據(jù)(統(tǒng)稱為微觀數(shù)據(jù))由課題組雙人雙錄。
采用Excel 2010錄入數(shù)據(jù)建立數(shù)據(jù)庫(kù)。其中微觀數(shù)據(jù)以100分為標(biāo)準(zhǔn)進(jìn)行換算。
2.試題質(zhì)量。采用難度系數(shù)(P)、區(qū)分度(D)、信度(r)及知識(shí)點(diǎn)覆蓋率(C)進(jìn)行測(cè)量。(1)難度(P):反映試題難易程度是否適中。P>0.8試題太易,P<0.2時(shí),試題太難。一般情況為P>0.8、P<0.2的試題各占10%、P=0.2~0.4和P=0.6~0.8的試題各占20%、0.4
0.7可認(rèn)為可信度較高[4]。(4)覆蓋率(C):按照試卷覆蓋的章節(jié)數(shù)/教學(xué)大綱要求的章節(jié)總數(shù)來計(jì)算,一般要求C≥90%為宜[5]。
3.其他指標(biāo)及標(biāo)準(zhǔn)。(1)試卷的總題量:優(yōu)(70~100題量),良(50~70題量),差(題量小于50)。(2)試卷認(rèn)知水平知識(shí)點(diǎn):掌握、熟悉、了解、超綱分別為(55%~65%)、(25%~35%)、(10%~20%)、(0%~5%)。(3)試卷認(rèn)知目標(biāo)層次知識(shí)點(diǎn):包括記憶、理解、綜合應(yīng)用、邏輯推理等。(4)試卷內(nèi)容效度:反映考試內(nèi)容與大綱要求吻合的程度,它要求各單元試題分?jǐn)?shù)分配與學(xué)時(shí)數(shù)分配基本保持一致,即正比例關(guān)系[6]。(5)整體考核成績(jī)的評(píng)價(jià):優(yōu)(8%<75分及以上成績(jī)占比≤25%),良(25%<75分及以上成績(jī)占比≤40%或者5%<75分及以上成績(jī)占比≤8%),差(75分及以上成績(jī)占比處于其他區(qū)間)。(6)不及格率:優(yōu)(不及格率≤10%),良(10%<不及格率≤15%),差(不及格率處于其他區(qū)間)。(7)成績(jī)離散程度:一般認(rèn)為標(biāo)準(zhǔn)差在卷面分值的10%左右為適宜[7]。分值越大,成績(jī)?cè)诫x散。
考慮到要兼顧統(tǒng)計(jì)學(xué)意義及教學(xué)指導(dǎo)意義,成績(jī)分?jǐn)?shù)段的設(shè)定方式:25分以下(極差)、25分~60分(差)、60分(及格)、60分~75分(良好)、75分以上(優(yōu)秀)。
1.題型情況。試卷由客觀題、主觀題兩部分組成,其中客觀題型共60分,占比87%,包含單項(xiàng)選擇題40道(合計(jì)40分)、多項(xiàng)選擇題5道(合計(jì)10分)、判斷題10道(合計(jì)10分);主觀題共40分,占比13%,包含名詞解釋5道(合計(jì)10分)、問答題2道(合計(jì)10分)、論述題2道(合計(jì)20分)。
2.整體成績(jī)統(tǒng)計(jì)(見表1、表2)。
表1 成績(jī)頻數(shù)分布表(n=333)
表2 成績(jī)統(tǒng)計(jì)(n=333)
3.章節(jié)知識(shí)點(diǎn)統(tǒng)計(jì)。13個(gè)章節(jié)涉及到12個(gè),覆蓋率C=92.3%,但通過數(shù)據(jù)統(tǒng)計(jì)及對(duì)照發(fā)現(xiàn),13個(gè)章節(jié)中有11個(gè)章節(jié)分配的考點(diǎn)分值與教學(xué)大綱規(guī)定的教學(xué)課時(shí)數(shù)折合的理想分值顯著不符(以絕對(duì)值的20%差異為界)。
4.試卷認(rèn)知水平、認(rèn)知目標(biāo)知識(shí)點(diǎn)統(tǒng)計(jì)(見表3)。
表3 試卷認(rèn)知水平、認(rèn)知目標(biāo)知識(shí)點(diǎn)統(tǒng)計(jì)
各題型得分、認(rèn)知水平知識(shí)點(diǎn)得分、認(rèn)知目標(biāo)知識(shí)點(diǎn)得分具體如下(見表4、表5、表6)。
表4 各題型得分(n=52)
表5 認(rèn)知水平知識(shí)點(diǎn)得分(n=52)
表6 認(rèn)知目標(biāo)知識(shí)點(diǎn)得分(n=52)
1.題型、題量。這是試題的最直觀特征[8]。該試卷客觀題題型及題量大于主觀題,表明命題人側(cè)重于考核學(xué)生應(yīng)用知識(shí)進(jìn)行判斷、選擇與處理的能力。從考試是教與學(xué)的指揮棒角度分析,名詞解釋、填空題、簡(jiǎn)答題以及判斷題,這四類題題型、題量大的話,對(duì)于學(xué)生掌握生理學(xué)知識(shí)體系及知識(shí)點(diǎn)間銜接,綜合應(yīng)用生理學(xué)知識(shí),學(xué)習(xí)及理解后續(xù)醫(yī)學(xué)課程以及后續(xù)要接受的高層次的選拔性考試、畢業(yè)后教育及考試,均具有“負(fù)反饋”效應(yīng),試題編制角度看,題型上應(yīng)予改進(jìn)。
2.章節(jié)覆蓋率及內(nèi)容效度。該試卷章節(jié)覆蓋率C=92.3%,說明命題人編制試題兼顧了整本教綱,覆蓋全面,但章節(jié)試題分?jǐn)?shù)分配與學(xué)時(shí)分配比例明顯不符,甚至無(wú)關(guān)聯(lián),故內(nèi)容效度評(píng)價(jià)為“差”。
表2、表4顯示,整體成績(jī)離散在正常范圍,近似服從正態(tài)分布,試題為偏難,不及格率高,區(qū)分度尚可,信度仍需提高;宏觀、微觀成績(jī)有很好的正相關(guān)性。主觀題得分差于客觀題,單項(xiàng)選擇題、判斷題、問答題成績(jī)高于整體成績(jī),而多項(xiàng)選擇題、論述題得分低于整體成績(jī),且全距大;判斷題難度不夠,區(qū)分度差,全距小。判斷題這種題型,單從“即使靠猜測(cè)答題正確率也很高”,加之“判斷題對(duì)學(xué)生的水平考核難以拉開層次”這兩點(diǎn)講,該題型也應(yīng)予淘汰。提倡多使用重在考察綜合應(yīng)用能力且對(duì)學(xué)生層次能夠起到很好區(qū)分的題型(如A1、A2、A3、A4、B1、X題型、論述題)。
綜合應(yīng)用統(tǒng)計(jì)軟件及考試的教育測(cè)量學(xué)理論,對(duì)考核試卷、試題及成績(jī)進(jìn)行量化統(tǒng)計(jì)與分析,有助于考試分析與反饋,不再無(wú)從下手、無(wú)話可說,流于形式,對(duì)于推進(jìn)課程考核的改革與研究,實(shí)現(xiàn)精準(zhǔn)化管理與教學(xué),具有一定的理論依據(jù)和方向指導(dǎo)意義。當(dāng)前,如何科學(xué)構(gòu)建并應(yīng)用能促進(jìn)“教與學(xué)”雙提升的考試綜合量化及分析評(píng)價(jià)體系,已經(jīng)成為各高校教學(xué)改革與研究的重要課題。