霍 依,蔣小劍,馮曉琳
(湖南中醫(yī)藥大學護理學院,湖南 長沙 410208)
護理教育需要培養(yǎng)學生的評判性思維,以面對錯綜復雜的臨床情景以及開展證據(jù)驅(qū)動下的臨床護理實踐[1]。評判性思維是評價判斷護理教學項目質(zhì)量和臨床發(fā)展的重要指標之一[2-3],目前主要使用加利福尼亞臨床思維技能測試問卷、彭美慈修訂的中文版批判性思維評定量表等評價工具對尋求真相、開放思想、分析能力等一般性評判性思維進行評價[4]。但是后現(xiàn)代主義觀點認為評判性思維并不具有概括性和遷移性,只存在針對具體情境的評判性思維,其發(fā)展依賴于學科總體知識、認識論及對學科內(nèi)容的理解[5]。目前,對評判性思維的評價存在測試內(nèi)容與學生在校學習內(nèi)容分離問題,導致其對教學的診斷作用和促進作用不大,不能反映教學效果。護理技能競賽是培養(yǎng)護理技術(shù)技能人才的重要抓手,也設置了部分以評價學生評判性思維為目的的條目,但尚未有人對這些條目設置的規(guī)范性進行探討。本研究以2020 年10 月舉辦的湖南省第二屆大學生護理綜合技能競賽為契機,對競賽中以評判性思維為評價導向的條目進行評價,以期為后續(xù)與護理學科相融合的評判性思維評價工具的編制提供參考。
選取8 名來自附屬醫(yī)院和5 名來自護理學院的護理師資組成編寫團隊,所有成員均從事護理教學或臨床工作8 年以上,具有研究生學歷。編寫團隊以核心能力為評價維度,臨床工作為主線,圍繞基礎護理學、內(nèi)科護理學、外科護理學、婦產(chǎn)科護理學、兒科護理學、健康評估、急危重癥護理學、社區(qū)護理學、老年護理學學科知識,進行單項案例、進展性案例和綜合情境案例編寫。之后又以臨床案例為依托,結(jié)合患者特點以及相關(guān)知識點進行評判性思維考核條目的編寫,以針對性地評價學生的評判性思維。以外傷案例為例,患者摔倒導致右手臂大面積擦傷,在考查生命體征測量流程時設置條目“患者袖帶不能綁在右側(cè)手臂”,以考查學生能否在掌握血壓測量基礎知識的同時根據(jù)患者具體情況做出有利判斷。
從3 家附屬醫(yī)院抽取18 名護理師資作為評委,對來自12個院校的48 名參賽選手進行評價。參賽選手為已進入臨床實習的護理專業(yè)大四學生,具備充足的專業(yè)理論和實踐知識。競賽分為3 個單元,即初賽、復賽和決賽。初賽主要是針對糖尿病、外傷、慢性阻塞性疾病、直腸癌這4 個疾病的單個場景的評判性思維進行評價。復賽為進展性案例,以“車禍外傷致頭痛嘔吐”入院為例,之后患者出現(xiàn)昏迷、間斷嘔吐,經(jīng)過治療好轉(zhuǎn)進入病房處理。案例將這一疾病發(fā)展的整體過程分層次展開,貫穿了評估、診斷、計劃、實施、評價,學生的評判性思維也呈現(xiàn)出與場景進展相同的發(fā)展變化。決賽以綜合情境案例展開,以患者因腹痛2 天、伴解黑色柏油樣便入急診,而后出現(xiàn)心跳呼吸驟停以及在救治過程中家屬發(fā)生狀況的識別和正確處理為例,主要考查學生在復雜且緊急的臨床情境下的評判性思維。
美國得克薩斯州女子大學Morrison 教授等提出了編寫評判性思維測試題的原則,即要明確試題的目標層次和要用多種邏輯形式答題[6],我們根據(jù)此原則對本研究中條目的認知層次和出題切入點進行分析。認知層次采用布魯姆教育目標分類系統(tǒng)進行分類,從低級到高級共分為6 類,包括記憶、理解、應用、分析、綜合、評價。將條目與對應的認知層次進行匹配,并統(tǒng)計頻次。出題切入點分析是根據(jù)題目在教材中對應的知識點進行匹配,并統(tǒng)計頻次。另外,基于學生的表現(xiàn)對題目的難度和區(qū)分度進行評價。難度是指考試條目的難易程度,用來衡量試題對學生知識水平的適合程度,以學生在該條目上的平均分占滿分的比率表示。難度值>0.7 的題目為較容易題,在0.4~0.7 的題目為中等難度題,<0.4 的題目為較難題和難題[7]。區(qū)分度(D)是試題對學生實際水平的區(qū)分程度,具有良好區(qū)分度的試題,實際水平高的學生應該得高分,實際水平低的應該得低分。D=Xi-Xt÷W。公式中Xi 為排名前25%的平均分,Xt 為排名后25%的平均分,W 為試題滿分。通常情況下,0<D<0.2 認為考題區(qū)分度差,0.2≤D≤0.3 認為考題區(qū)分度尚可,0.3<D<0.4 認為考題區(qū)分度良好,D≥0.4 認為區(qū)分度很好[8]。
將評判性思維評價條目名稱、出題切入點、認知層次以及參賽選手得分由雙人錄入審核后,建立數(shù)據(jù)庫,采用SPSS 24.0軟件進行統(tǒng)計分析。對認知層次、出題切入點進行頻次統(tǒng)計。按照公式計算評判性思維條目的難度和區(qū)分度,并按照不同級別進行頻次統(tǒng)計。
本研究各條目對應的認知層次頻次由高到低分別為分析(22)、應用(19)、綜合(8)、評價(3),沒有處于記憶和領(lǐng)會層次的條目(見表1~3)。
表1 初賽各操作項目評判性思維評價條目的認知層次和出題切入點Table 1 Cognitive levels and purpose for critical thinking evaluation items of each operation item in the preliminary competition
表3 決賽各操作項目評判性思維評價條目的認知層次和出題切入點Table 3 Cognitive levels and purpose for critical thinking evaluation items of each operation item in the finals
據(jù)統(tǒng)計,出題切入點可以分為病情觀察、操作一般步驟、操作關(guān)鍵要點、操作注意事項、護理評估、健康教育、健康評估、醫(yī)護溝通與合作8 個(見表1~3),具體頻次見表4。其中有52 條可不用結(jié)合案例,直接按常規(guī)操作即可,有20 條需要結(jié)合案例進行深入思考操作。
表4 出題切入點頻次統(tǒng)計Table 4 Statistics of the frequency of purpose for questions
根據(jù)相關(guān)公式計算競賽中評判性思維評價條目的難度和區(qū)分度,結(jié)果見表5。初賽、復賽、決賽各環(huán)節(jié)條目的難度和區(qū)分度分布見表6、7。
表5 評判性思維評價條目難度和區(qū)分度統(tǒng)計Table 5 Statistics on the difficulty and discrimination of critical thinking evaluation items
表7 各比賽環(huán)節(jié)不同區(qū)分度條目的分布[n(%)]Table 7 Distribution of different differentiation items in each competition phase[n(%)]
評判性思維評價一直都是教學改革研究中重點關(guān)注且存有爭議的問題,目前多采用問卷形式,主要從認知、行為和思維習慣3 個維度進行評價[9]。但是有學者提出評判性思維還可以分為另外3 個維度,包括邏輯維度、標準維度和實用主義維度。其中標準維度和實用主義維度與特定領(lǐng)域的知識、技能直接相關(guān)[10],所以有觀點認為只有在特定學科背景下進行發(fā)展和評估,學生的評判性思維能力才會得到提高。因此,一般性評判性思維測試工具并不能很好地為教師教學提供參考[6]。在目前醫(yī)教協(xié)同、以賽促教、以賽促學的背景下,護理教學中對學生評判性思維和臨床思維能力、人文關(guān)懷精神、團隊合作意識的培養(yǎng)考核提升到了全新的高度。切實可行的評價標準是保證教學質(zhì)量的重要前提,護理操作中的評判性思維評價是一個值得關(guān)注的領(lǐng)域。
本研究采用布魯姆教育目標分類系統(tǒng)對評判性思維的認知層次進行評價,該系統(tǒng)是目前世界上使用最多、影響最為廣泛的教學設計和評價工具[11],為我們提供了6 個獨立的位置點來評估學生的學習情況,對學生相對能力水平進行精確區(qū)分。另外,由于該評價體系具有認知復雜性逐級上升的特點,可以用來設計具有挑戰(zhàn)性的評估方式,從而便于我們提取需要的信息來判斷學生的學習程度以及運用所學知識的熟練程度。有研究提出在醫(yī)學教育中應開展更高層次的認知學習,而不僅僅局限于記憶理解[12]。通過布魯姆分類法的更高認知層次來發(fā)展高階思維,應該成為一個重要的教學目標[13]。有學者提出可以基于分類法最高3 級(即分析、綜合和評價)提出問題來評估和培養(yǎng)評判性思維,但是目前很難有一個明確的標準來對評判性思維評估的合理性進行評價。另外,本研究結(jié)果顯示不同環(huán)節(jié)的比賽中評判性思維認知層次沒有太大變化,不同臨床情境案例中對認知水平的考查是否會有區(qū)別目前也沒有相關(guān)文獻提及。后續(xù)如何利用布魯姆教育目標分類系統(tǒng)把握好認知層次,對評判性思維進行完整、準確、細致的評價還需進一步探討。
從命題切入點分析來看,本研究主要是從病情觀察、操作一般步驟、操作關(guān)鍵要點、操作注意事項、護理評估、健康教育、健康評估、醫(yī)護溝通與合作8 個角度進行切入。根據(jù)答題所需要的知識儲備和思維方式將題目進一步分為5 類。第1 類:學生答題需要具備疾病整體有關(guān)的綜合知識以及運用多種思維方式,這需要綜合內(nèi)在與外在的資料信息,做出符合客觀事實的推斷,屬于最高的認知層次。本研究在護理評估和健康教育題目設置中有明顯體現(xiàn)。以初賽糖尿病血糖監(jiān)測項目的“健康宣教:糖尿病酮癥酸中毒預防治療要點”這一條目為例。在解答過程中,學生首先要具備糖尿病并發(fā)癥用藥、血糖監(jiān)測、日常護理等綜合知識儲備,然后根據(jù)病例中患者的具體情況來預判疾病可能的走向,從而進行預防性的疾病指導。此外學生還需根據(jù)案例提供的場景,識別出目前患者存在的認知行為相關(guān)缺陷,給予針對性指導。第2 類:學生要掌握一定的基本知識,然后結(jié)合患者具體情況進行審慎、明智的應用或分析,只是所涉及的思維方式不及第1 類復雜。本研究中主要體現(xiàn)在操作關(guān)鍵要點和操作注意事項的命題中。以皮下注射項目的“選擇注射部位(上臂三角肌下緣為注射部位)評估皮膚情況”條目為例。學生要了解胰島素注射可以選擇的位置以及胰島素注射的注意事項,然后結(jié)合目前患者的情況(患者已經(jīng)出現(xiàn)腹部硬結(jié))做出判斷,避開腹部選擇其他區(qū)域。第3 類:利用知識間的聯(lián)系和遷移命題,在操作過程中要聯(lián)系其他學科知識。本研究主要見于部分操作關(guān)鍵要點和操作一般步驟命題中。比如在肌內(nèi)注射中需關(guān)注到毒麻藥物的管理,靜脈注射中關(guān)注到化療藥及甘露醇使用前沖管和滴速的調(diào)節(jié)。第4 類:不需要結(jié)合案例或采用多種思考方式,主要考查操作常規(guī),但是操作本身具有一定難度。本研究主要體現(xiàn)在健康評估及操作關(guān)鍵要點上。如心電圖的判讀需要大量知識儲備及實踐才能夠準確給出評價;決賽團隊急救項目雙人心肺復蘇中快速評估脈搏和呼吸,學生在操作時要了解脈搏的解剖要點,找準位置,同時還要觀察呼吸的起伏,眼、耳、手要同步協(xié)調(diào)。第5 類:命題切入點最為簡單,主要是操作常規(guī),在以操作一般步驟命題的條目中體現(xiàn)較多,如擺體位、整理用物。
從分類可以看出,教師命題時要考慮到學生在解題過程中的思維活動、題目所涉及的知識儲備和學生的認知規(guī)律。至于本研究中命題思路或切入點是否合理,由于相關(guān)研究極少,無法找到確切的評價標準。Morrison 教授等提出了編寫評判性思維測試題的4 項原則,其中一項提到需要應用多種邏輯思考方式答題[6]。若以此為標準,本研究中第4、5 類題目可能并不符合評判性思維命題原則。
從難度分析來看,初賽和復賽是以較容易題和中等難度題為主,還有小部分較難題和難題,整體平均難度為0.66。一般認為,整份試卷平均難度在0.5 左右最為合適,高于0.7 和低于0.4 的試題占比不能太高。決賽以中等難度題為主,沒有較難題和難題,平均難度為0.80,顯示難度過低。對難度和認知層次的關(guān)系進行分析,發(fā)現(xiàn)本研究中難度與認知水平好像并沒有太大關(guān)聯(lián)。從理論上講,認知層次和題目難度呈正比關(guān)系,但實際結(jié)果并非如此,研究中認知層次較低的條目反而可能體現(xiàn)出較高難度,而認知層次較高的條目反而體現(xiàn)出中等難度,究其原因可能是每個人對認知層次分級的認識和理解有差異,而不同評價者對同一道題目體現(xiàn)出來的認知水平的認識也會存在差異[14]。真實準確評價學生的認知層次具有挑戰(zhàn)性,這需要實施者達成共識。至于認知層次低反而可能體現(xiàn)出較高難度的現(xiàn)象,可能是因為學生的基礎較為薄弱,還需加強基礎知識學習。
從區(qū)分度分析來看,初賽和復賽大部分條目區(qū)分度很好,決賽區(qū)分度較差,可能是由于決賽參賽人數(shù)較少,對區(qū)分度產(chǎn)生了一定影響。區(qū)分度與難度的關(guān)系分析顯示,當區(qū)分度處于很好的水平時,其條目對應平均難度為0.5,這與其他研究中得出的當難度在0.5 時區(qū)分度最佳的結(jié)論一致[7]。從區(qū)分度和認知層次的分析來看,目前并未發(fā)現(xiàn)明顯規(guī)律。有學者提出良好的評估能夠幫助學生展示其知識和理解能力,并且能區(qū)別不同層次的能力。若設置太多高層次的題目可能會難以區(qū)分能力較差的學生,設置過多低層次的題目可能難以區(qū)分能力較好的學生。所以在設置競賽條目時,要考慮設置不同水平的認知層次并為其合理賦分。
本研究從認知層次、出題切入點、難度和區(qū)分度4 個維度,對護理綜合技能競賽中以評判性思維為評價導向的操作考核條目的設計和應用進行評價,能對今后護理競賽中評判性思維的評價提供一定基礎,也能對特定學科背景下評判性思維培養(yǎng)提供一定思路。然而研究中也存在不足之處:在不同比賽中對不同認知層次的設定缺乏相應的標準,不同認知層次指導的命題切入點或命題原則缺乏統(tǒng)一標準,命題者與評價者對題目的認知有差異,有待進一步采取措施來達成共識。