李 佳,楊武晨,彭賢貴,高 蕾,張 曦,墻 星,陶廷露,劉思恒,冉岑霞,張 誠
(陸軍軍醫(yī)大學(xué)第二附屬醫(yī)院,重慶 400002)
骨髓細(xì)胞形態(tài)檢驗是醫(yī)學(xué)檢驗中最基礎(chǔ)的學(xué)科,是血液病實驗室診斷方法中最重要的技術(shù),也是目前各醫(yī)院必須開展的基礎(chǔ)檢驗項目。但骨髓細(xì)胞形態(tài)理論知識枯燥乏味,細(xì)胞體積小、種類繁多、差別細(xì)微,無法肉眼觀察,僅能在顯微鏡下觀察,難度極大,對細(xì)胞的識別及認(rèn)識主觀性強(qiáng),強(qiáng)烈依賴經(jīng)驗。骨髓細(xì)胞形態(tài)學(xué)是將實踐和經(jīng)驗融為一體的漫長的學(xué)習(xí)過程,是繼續(xù)教育中的常見進(jìn)修課程。傳統(tǒng)進(jìn)修骨髓細(xì)胞形態(tài)的教學(xué)形式多采用“灌輸式”教師講授—學(xué)習(xí)者聽的教學(xué)法,忽視了學(xué)習(xí)者的主觀能動性,部分帶教教師不夠重視,實驗教學(xué)手段單一且落后[1]。人工智能(Artificial Intelligence,AI)是目前生產(chǎn)技術(shù)革新和產(chǎn)能提高的重要手段,已進(jìn)入智慧教育領(lǐng)域,但在醫(yī)學(xué)教育領(lǐng)域甚少涉及。因此本課題引入人工智能識別系統(tǒng),讓學(xué)習(xí)者(在校學(xué)生及繼續(xù)教育者)在其幫助下學(xué)習(xí)骨髓細(xì)胞形態(tài),對比其與傳統(tǒng)骨髓細(xì)胞形態(tài)學(xué)習(xí)方式在進(jìn)修教學(xué)中的應(yīng)用,旨在研究人工智能識別系統(tǒng)在教學(xué)上有無優(yōu)勢,能否更好地完成教學(xué)任務(wù)。
納入2018年3月—2020年6月到陸軍軍醫(yī)大學(xué)第二附屬醫(yī)院血液病醫(yī)學(xué)中心參加進(jìn)修的各醫(yī)院醫(yī)生共26例,性別及年齡無特殊要求。
將進(jìn)修生隨機(jī)分為傳統(tǒng)教學(xué)組和人工智能組,傳統(tǒng)教學(xué)組主要通過教師帶教、學(xué)生聽課及學(xué)生提問教師回答的方式達(dá)到教學(xué)目的;人工智能組主要通過杭州智維公司開發(fā)的人工智能識別骨髓細(xì)胞形態(tài)軟件進(jìn)行細(xì)胞教學(xué)指導(dǎo),學(xué)生用鼠標(biāo)劃過需要學(xué)習(xí)的細(xì)胞,人工智能識別系統(tǒng)自動顯示細(xì)胞名字、需要鑒別的細(xì)胞類型及可能性百分?jǐn)?shù)。
1.2.1 師資 由經(jīng)驗豐富、臨床及教學(xué)時間大于10年的教員帶教,由主管技師以上職稱講解。
1.2.2 人工智能識別骨髓細(xì)胞形態(tài)軟件 由杭州智維軟件公司研發(fā),可進(jìn)行骨髓細(xì)胞識別,識別率分別為:中性粒細(xì)胞識別率99.8%,單核細(xì)胞識別率98%,淋巴細(xì)胞識別率99.7%,紅系有核細(xì)胞識別率97%。
1.2.3 評判標(biāo)準(zhǔn) 主要觀察指標(biāo):(1)教學(xué)滿意度和興趣(滿意度設(shè)為非常滿意5分,滿意4分,一般3分,差2分,很差1分;興趣設(shè)為非常有興趣5分,有興趣4分,一般3分,沒興趣2分,非常沒興趣1分),通過學(xué)生閱片考核及問卷調(diào)查的方法進(jìn)行效果評估;(2)學(xué)習(xí)時長(課后自習(xí)時長);(3)兩組進(jìn)修生單個細(xì)胞的識別準(zhǔn)確率(分別考核教學(xué)前和教學(xué)后);(4)單張骨髓涂片準(zhǔn)確率(分別考核教學(xué)前和教學(xué)后)。問卷調(diào)查包括教學(xué)滿意度、興趣;單個細(xì)胞考核以每張圖一個細(xì)胞的形式,考核100個細(xì)胞,記錄正確細(xì)胞數(shù);考核的骨髓片要求為骨髓增生活躍,細(xì)胞分布均勻且視野好,染色良好;單張涂片準(zhǔn)確率通過對單張骨髓涂片進(jìn)行細(xì)胞計數(shù),與正確計數(shù)答案做對比,統(tǒng)計正確率。
1.2.4 統(tǒng)計學(xué)分析 通過SPSS 19.0軟件分析數(shù)據(jù),采用配對t檢驗、秩和檢驗(Mann-Whitney U)及χ2檢驗進(jìn)行。
傳統(tǒng)教學(xué)組和人工智能組均為13例,平均年齡分別為27.18歲和 28.10 歲,無統(tǒng)計學(xué)差異(P>0.05),男女性別比為 1∶2。
表1 兩組教學(xué)滿意度及興趣評分分布情況(n)
傳統(tǒng)教學(xué)組和人工智能組的教學(xué)滿意度比較,秩和檢驗Z=-1.531,P=0.126>0.05。盡管人工智能組教學(xué)滿意度略高于傳統(tǒng)教學(xué)組,但并無差異,說明學(xué)生對傳統(tǒng)教學(xué)和人工智能教學(xué)均很滿意。傳統(tǒng)教學(xué)組和人工智能組的興趣比較,秩和檢驗Z=-2.571,P=0.01<0.05,人工智能組興趣高于傳統(tǒng)教學(xué)組??傊趯W(xué)習(xí)過程中,人工智能教學(xué)更能調(diào)動學(xué)生的學(xué)習(xí)積極性。
傳統(tǒng)教學(xué)組學(xué)習(xí)時間均值為(2.06±0.399)小時/天,人工智能組學(xué)習(xí)時間均值為(2.67±0.560)小時/天,傳統(tǒng)教學(xué)組和人工智能組比較,P=0.000<0.01,有統(tǒng)計學(xué)差異。
對比兩組教學(xué)前后的細(xì)胞識別情況,傳統(tǒng)教學(xué)組教學(xué)前正確識別細(xì)胞數(shù)均值為(26.46±8.491)個,教學(xué)后正確識別細(xì)胞數(shù)均值為(74.31±3.093)個,配對 t檢驗 t=-17.533,P<0.01,有統(tǒng)計學(xué)差異,教學(xué)成果顯著。人工智能組教學(xué)前正確識別細(xì)胞數(shù)均值為(25.00±7.937)個,教學(xué)后正確識別細(xì)胞數(shù)均值為(73.23±3.295)個,配對 t檢驗 t=-19.085,P<0.01,有統(tǒng)計學(xué)差異,教學(xué)成果顯著。教學(xué)后的傳統(tǒng)教學(xué)組和人工智能組比較,t=0.859,P>0.05,無統(tǒng)計學(xué)差異。
傳統(tǒng)教學(xué)組和人工智能組單張骨髓涂片細(xì)胞計數(shù)正確情況見表2,傳統(tǒng)教學(xué)組教學(xué)后成績顯著高于教學(xué)前(P<0.01);人工智能組教學(xué)后成績顯著高于教學(xué)前(P<0.01)。教學(xué)后的人工智能組和傳統(tǒng)教學(xué)組比較,無統(tǒng)計學(xué)差異(χ2=0.249,P=0.618)。
表2 兩組單張骨髓涂片細(xì)胞計數(shù)情況(n)
近年來,越來越多人工智能引入醫(yī)學(xué)范疇,AI醫(yī)學(xué)圖像識別已應(yīng)用于腸鏡AI圖像識別[2]、影像學(xué)(CT、B超等)[3]的AI圖像識別、胚胎與繁殖的AI圖像識別[4]、腫瘤病理的AI圖像識別[5]。本研究中主要涉及的是骨髓/血細(xì)胞的AI圖像識別,相比較而言,其觀察指標(biāo)更多,種類繁多而缺乏特征性組織結(jié)構(gòu),可參照的參數(shù)相對較少,因此對細(xì)胞認(rèn)識的要求更高,細(xì)胞的識別難度加大,系統(tǒng)研發(fā)或?qū)W習(xí)的難度極大提升。將AI識別系統(tǒng)應(yīng)用于骨髓細(xì)胞形態(tài)的學(xué)習(xí)中,可以幫助學(xué)生或進(jìn)修生更好地學(xué)習(xí)。
本研究中認(rèn)為采用人工智能教學(xué)和傳統(tǒng)教學(xué)的學(xué)生均有很高的教學(xué)滿意度及興趣,兩種方法均獲得學(xué)習(xí)者較高的認(rèn)可。但是學(xué)習(xí)者認(rèn)為AI教學(xué)更有趣,此方法可以寓教于樂,方式類似游戲,讓人有挑戰(zhàn)的沖動,且易于操作,便于學(xué)習(xí)。
本研究發(fā)現(xiàn),人工智能組學(xué)習(xí)者更愿意主動學(xué)習(xí),可能因為采用新型教學(xué)法學(xué)習(xí)者可根據(jù)自己的時間安排學(xué)習(xí),學(xué)習(xí)方式更有趣,并且在學(xué)習(xí)中能快速得到反饋,學(xué)習(xí)過程不枯燥,更能吸引學(xué)習(xí)者。
研究發(fā)現(xiàn),無論傳統(tǒng)教學(xué)法還是AI教學(xué)法,經(jīng)過長時間的學(xué)習(xí),成績都能得到較明顯的提升,差別并不大,可能是傳統(tǒng)教學(xué)組的教學(xué)雖然比較枯燥,學(xué)習(xí)者和教師的互動相對較少,但是經(jīng)過學(xué)習(xí)后,仍能很好地識別細(xì)胞及細(xì)胞分類,這也說明人工智能組和傳統(tǒng)教學(xué)組比較,優(yōu)勢更多地在學(xué)習(xí)過程中。
3.4.1 優(yōu)勢(1)目前AI教學(xué)模式優(yōu)勢之一是儲備能力及更新能力,可讓學(xué)習(xí)者最大可能地接觸最多最廣的細(xì)胞圖片[6],做到與時俱進(jìn)。長遠(yuǎn)來看,可能會讓學(xué)習(xí)者學(xué)習(xí)更快、更新能力更強(qiáng)[7];還可自動參考異常細(xì)胞,方便快捷。(2)AI教學(xué)法能減輕教師負(fù)擔(dān),教師不用專門抽時間給學(xué)生講課、準(zhǔn)備課件。同時,還可以通過AI識別系統(tǒng)進(jìn)行遠(yuǎn)程專家咨詢[8-10],有助于教育標(biāo)準(zhǔn)化[10]。
3.4.2 缺點(1)反饋環(huán)節(jié):盡管相較傳統(tǒng)教學(xué)組,人工智能組學(xué)習(xí)者能得到更多反饋,但這仍是薄弱環(huán)節(jié)。反饋是AI教學(xué)十分重要的環(huán)節(jié)[11-14],但本中心的AI識別系統(tǒng)提供反饋卻很困難,同樣問題還見于Egele等[15]的研究,他們發(fā)現(xiàn)80%的受調(diào)查者從未或很少收到糾正性反饋。另外,如何提高反饋質(zhì)量仍是亟須解決的方面。(2)考試模塊薄弱:本研究的考核手段仍是人工考核,AI識別系統(tǒng)缺乏考試模塊,有待后期補充。國際研究表明,目前大多AI教學(xué)系統(tǒng)均存在這一缺陷,其中通信安全及作弊問題需要警惕[16-17];機(jī)器故障或不正確的編碼而導(dǎo)致錯判誤判,可能造成可怕的后果。想辦法做到公正無誤且不出紕漏,才能更好地將AI識別系統(tǒng)運用在實際工作中。
加速系統(tǒng)的完善,注意隱私保護(hù),提高反饋質(zhì)量及加強(qiáng)考試系統(tǒng)的研發(fā)。