何寶琴
(廈門醫(yī)學(xué)院)
近年來,各大醫(yī)院都積極進(jìn)行信息化建設(shè)工作,同時(shí)社會中也涌現(xiàn)出了一批互聯(lián)網(wǎng)醫(yī)院,全面推進(jìn)智慧醫(yī)院建設(shè)已成為必然趨勢[1],這就意味著將來要在醫(yī)院、醫(yī)療行業(yè)工作的醫(yī)學(xué)生們,除了學(xué)好醫(yī)學(xué)專業(yè)知識外,也應(yīng)掌握計(jì)算機(jī)技能。對于醫(yī)學(xué)生而言,其了解計(jì)算機(jī)知識的核心方式是計(jì)算機(jī)公共課,然而由于醫(yī)學(xué)專業(yè)的特殊性,學(xué)生學(xué)習(xí)壓力大、課程量大,所以在實(shí)踐的過程中也遇到了一定的困難,有關(guān)問題主要體現(xiàn)在三方面:第一,對于醫(yī)學(xué)生來說很多計(jì)算機(jī)的理論知識比較晦澀難懂,因此在學(xué)習(xí)的時(shí)候有排斥心理,對計(jì)算機(jī)課程的學(xué)習(xí)興趣比較低;第二,由于計(jì)算機(jī)不是醫(yī)學(xué)的核心專業(yè),醫(yī)學(xué)生普遍不重視計(jì)算機(jī)課程,投入時(shí)間也比較少[2];第三,學(xué)生來自于全國各省份地區(qū),計(jì)算機(jī)水平差異較大。這些原因?qū)е掠?jì)算機(jī)教學(xué)未能取得良好的效果。由此可見,了解學(xué)生的學(xué)習(xí)意愿并激發(fā)他們的學(xué)習(xí)興趣,針對計(jì)算機(jī)公共課進(jìn)行改革具有一定的必要性與重要的意義[3],計(jì)算機(jī)教師應(yīng)積極思考這一問題,主動迎接挑戰(zhàn)。基于此,本研究面向大一醫(yī)學(xué)生進(jìn)行了調(diào)查,共采集了731名學(xué)生與計(jì)算機(jī)學(xué)習(xí)意愿相關(guān)的信息與數(shù)據(jù),并通過文本可視化的方式針對調(diào)查結(jié)果進(jìn)行了分析,確定了與計(jì)算機(jī)學(xué)習(xí)意愿相關(guān)的影響因素,并結(jié)合有關(guān)理論與筆者的思考,提出了改革計(jì)算機(jī)公共課的具體建議與對策。
隨著數(shù)字時(shí)代的到來,數(shù)據(jù)量從TB級別跨向PB、EB級別[4],而人腦并不擅長處理如此大量的信息,因此利用機(jī)器的計(jì)算能力對海量數(shù)據(jù)進(jìn)行分析挖掘成為一種趨勢。文本可視化作為數(shù)據(jù)挖掘的一種重要技術(shù),涉及了文本挖掘、統(tǒng)計(jì)分析、數(shù)據(jù)可視化等技術(shù),它對人和機(jī)器都具有可讀性。文本可視化是以動態(tài)或靜態(tài)的視覺符號、圖形圖像展示文字中的內(nèi)涵及規(guī)律[5],常見的文本可視化包括圖形、圖表、詞云、地圖、網(wǎng)絡(luò)、時(shí)間線等形式,它使人們能夠通過視覺的方式觀察數(shù)據(jù),了解其中潛藏的有價(jià)值的信息。本文分為四個(gè)步驟進(jìn)行文本數(shù)據(jù)可視化,包括信息收集、數(shù)據(jù)預(yù)處理、文本挖掘、數(shù)據(jù)可視化,具體流程見圖1。
圖1 文本可視化流程
信息收集是指根據(jù)系統(tǒng)需求或用戶需要利用各種設(shè)備、網(wǎng)絡(luò)抓取、問卷調(diào)查等各種方式采集原始數(shù)據(jù)的過程。本研究基于網(wǎng)絡(luò)調(diào)查了大一醫(yī)學(xué)生學(xué)習(xí)計(jì)算機(jī)知識的意愿,內(nèi)容為主觀題“你對大學(xué)計(jì)算機(jī)這門課程有什么建議或意見?”被調(diào)查者共有731人,均為大一醫(yī)學(xué)生,入學(xué)時(shí)間為2020年,專業(yè)涵蓋臨床醫(yī)學(xué)、麻醉學(xué)、精神醫(yī)學(xué)、口腔醫(yī)學(xué)、藥學(xué)等,其中男生261人,女生470人。調(diào)查問卷的發(fā)放數(shù)量為731份,全部順利回收。對于收集的數(shù)據(jù),本文利用python進(jìn)行數(shù)據(jù)預(yù)處理、文本挖掘以及數(shù)據(jù)可視化。
本文中回收的答卷為文本信息,文本數(shù)據(jù)屬于非結(jié)構(gòu)化數(shù)據(jù)的一種,非結(jié)構(gòu)化數(shù)據(jù)具有結(jié)構(gòu)不規(guī)則、不完整、沒有預(yù)定義模型等特點(diǎn),非結(jié)構(gòu)化的數(shù)據(jù)在數(shù)據(jù)存儲、管理以及分析挖掘上都會比結(jié)構(gòu)化數(shù)據(jù)面對更多的挑戰(zhàn)。由于文本數(shù)據(jù)的非結(jié)構(gòu)化的特殊性,其數(shù)據(jù)預(yù)處理步驟尤為重要。我們所收集完成的原始數(shù)據(jù)質(zhì)量并不高,存在不一致、重復(fù)、不完整、含噪聲等問題,因此不能直接用于數(shù)據(jù)分析,需要先進(jìn)行預(yù)處理。我們進(jìn)行如下預(yù)處理過程:第一,數(shù)據(jù)清洗,去除無效數(shù)據(jù)。首先作答時(shí)間小于10秒視為無效答卷,其次答案毫無意義,例如“無”“沒有”“沒建議”“好”也視為無效答卷。我們將回收的731份答卷進(jìn)行清洗后得到有效答卷657份。第二,標(biāo)準(zhǔn)化,文本數(shù)據(jù)是一種復(fù)雜、不規(guī)則的數(shù)據(jù)類型,它除了包括中文字以外,還會出現(xiàn)標(biāo)點(diǎn)符號、表情包、阿拉伯?dāng)?shù)字等,而這些字符會干擾我們數(shù)據(jù)分析的結(jié)果,需要在預(yù)處理時(shí)過濾掉。第三,中文糾錯(cuò),對文本中的錯(cuò)別字進(jìn)行糾錯(cuò)。
文本挖掘是通過自然語言處理技術(shù)將非結(jié)構(gòu)化信息轉(zhuǎn)換為結(jié)構(gòu)化信息,并挖掘其中規(guī)律,進(jìn)行文本處理包括以下步驟:第一,進(jìn)行詞語切分,即將每個(gè)句子拆分為一系列的詞,具體來講,便是把一句話分為若干個(gè)詞。第二,無意義詞匯過濾,在分析學(xué)生學(xué)習(xí)意愿過程中,類似于“老師”“希望”“以后”這些詞匯都是沒有分析意義的,需要將這些詞匯過濾掉。第三,相似詞聚類,在中文中,很多詞匯是相似的,例如“操作”“上機(jī)”“實(shí)踐”等詞匯在我們當(dāng)前語境下意思相同,即操作計(jì)算機(jī),因此需要把這些相似的詞匯進(jìn)行聚類。
通過可視化處理可以將數(shù)據(jù)轉(zhuǎn)換為相應(yīng)的圖形,目前數(shù)據(jù)可視化已成為了一種新的學(xué)科,文本可視化屬于該領(lǐng)域的一個(gè)重要分支,是指通過圖像以及圖形等展示文本信息,讓讀者能夠比較直觀、快速地獲取文章中內(nèi)涵與規(guī)律。詞云是最近比較熱門的文本數(shù)據(jù)可視化技術(shù)[6],它是一種漂亮、有創(chuàng)意和強(qiáng)大的文本可視化工具之一。詞云是一個(gè)基于關(guān)鍵詞的文本內(nèi)容可視化,它的核心技術(shù)是把文章中的重要詞語提煉出來,并按照頻率在二維空間上以不同的字體大小美觀地排版,使讀者能夠迅速從詞云圖中掌握海量文本的核心信息。詞頻分析主要研究的是某個(gè)詞匯出現(xiàn)的頻次,能夠幫助我們從大量的主觀意見中抓住關(guān)鍵點(diǎn)。在研究學(xué)生計(jì)算機(jī)學(xué)習(xí)意愿的過程中引入詞云分析技術(shù),能夠幫助我們更快、更準(zhǔn)確地找到學(xué)生們最關(guān)注的問題和最迫切的學(xué)習(xí)需求。我們根據(jù)詞頻生成詞云圖,如圖2所示,在圖中顯示的文字越大,說明其出現(xiàn)頻次越高。從圖中,不用去看調(diào)查數(shù)據(jù)的文本,就很容易知道學(xué)生們的最核心需求是什么。與此同時(shí),用戶可以設(shè)計(jì)詞云的形狀、色彩、方向等,使得詞云更加美觀,可以稱之為一個(gè)兼具審美特征和文學(xué)元素的藝術(shù)作品。
圖2 計(jì)算機(jī)學(xué)習(xí)意愿詞云圖
從圖2我們可以得到以下信息:第一,出現(xiàn)頻率最高的詞匯是“操作”,這里的“操作”指的是學(xué)生在計(jì)算機(jī)上進(jìn)行實(shí)踐。不難得出對于上課形式,大部分的學(xué)生希望有更多的上機(jī)操作機(jī)會,而不是大量的理論知識。第二,圖2中多次出現(xiàn)“辦公”“實(shí)用”“軟件”等高頻詞匯,可見對于課程內(nèi)容,學(xué)生們希望課堂更加注重實(shí)用性,以辦公軟件或常用軟件為主。第三,在圖2中多次出現(xiàn)關(guān)鍵詞匯“簡單”“慢”“基礎(chǔ)”“生動”等,我們能夠看出,有部分同學(xué)認(rèn)為計(jì)算機(jī)是枯燥難懂的知識,對于計(jì)算機(jī)的學(xué)習(xí)還沒開始就已經(jīng)出現(xiàn)畏難情緒,學(xué)生們希望老師在上課時(shí)能以通俗易懂且具有趣味性的方式講述。針對上述現(xiàn)象,筆者結(jié)合觀察與總結(jié)的經(jīng)驗(yàn),提出了計(jì)算機(jī)公共課改革的三方面建議。
在教學(xué)改革過程中,學(xué)生是否有興趣學(xué)習(xí)是教學(xué)改革是否成功、教學(xué)是否能達(dá)到理想效果的關(guān)鍵因素,基于上述學(xué)習(xí)意愿的分析結(jié)果,本文提出三點(diǎn)激發(fā)學(xué)生學(xué)習(xí)興趣的建議。
第一,大學(xué)計(jì)算機(jī)公共課課程內(nèi)容體系可采用理實(shí)結(jié)合模式,并且理論不應(yīng)該與實(shí)踐完全脫節(jié),以實(shí)踐為基礎(chǔ)才能激發(fā)學(xué)生的學(xué)習(xí)欲望,充分發(fā)揮主觀能動性。在計(jì)算機(jī)公共課中,計(jì)算機(jī)編碼、計(jì)算機(jī)工作原理、網(wǎng)絡(luò)原理、計(jì)算思維這幾個(gè)部分都屬于偏理論的章節(jié),對于醫(yī)學(xué)生而言比較抽象難懂,以純理論的講解,學(xué)生的接受度不高,可以在講述時(shí)結(jié)合實(shí)踐。例如筆者在進(jìn)行字符編碼教學(xué)時(shí),先給學(xué)生們發(fā)了一份亂碼的文檔,請同學(xué)們分析亂碼產(chǎn)生的原因,再結(jié)合計(jì)算機(jī)編碼原理講述亂碼產(chǎn)生的過程,最后學(xué)生們自己動手修復(fù)亂碼文檔。在這個(gè)過程中學(xué)生們學(xué)習(xí)興趣濃厚,同時(shí)也體驗(yàn)到發(fā)現(xiàn)問題、分析問題、解決問題的科學(xué)思維過程。
第二,對于教學(xué)難點(diǎn),可以結(jié)合案例或?qū)W生感興趣的熱點(diǎn)新聞事件深入淺出地講解,把枯燥的知識點(diǎn)轉(zhuǎn)換為學(xué)生感興趣的內(nèi)容。例如,筆者在講述DNS的工作原理時(shí),結(jié)合了當(dāng)下互聯(lián)網(wǎng)中最常見的一些網(wǎng)絡(luò)詐騙手段、廣告彈出現(xiàn)象以及常見網(wǎng)絡(luò)故障來講述,學(xué)生在聽這部分內(nèi)容時(shí),學(xué)習(xí)興致很高,不但掌握了理論知識,更提高了防騙意識。
第三,與專業(yè)結(jié)合。對于醫(yī)學(xué)生來說,沒有興趣的主要原因之一是沒有意識到計(jì)算機(jī)對于醫(yī)學(xué)的重要性。針對這一問題,可以在計(jì)算機(jī)課程教學(xué)中結(jié)合醫(yī)學(xué)專業(yè)案例與專業(yè)前沿技術(shù),將計(jì)算機(jī)在醫(yī)療上最新的研究進(jìn)展與應(yīng)用融入課程知識體系中,這樣能夠大大提升學(xué)生的學(xué)習(xí)興趣。例如將人工智能與智慧醫(yī)療相結(jié)合,將網(wǎng)絡(luò)原理與互聯(lián)網(wǎng)醫(yī)院相結(jié)合等。
2006年周以珍教授提出了一個(gè)改變計(jì)算機(jī)教學(xué)理念的概念——計(jì)算思維[7],自此大學(xué)計(jì)算機(jī)公共課漸漸地從原來的以技能教學(xué)為主向以計(jì)算思維的培養(yǎng)為主傾斜,全國高校計(jì)算機(jī)基礎(chǔ)課程教育正掀起計(jì)算思維改革的熱潮[8]。一線教師們已經(jīng)意識到新變化的意義和重要性,越來越重視計(jì)算思維內(nèi)容的教學(xué)。然而計(jì)算思維是一個(gè)比較抽象的概念,它指的是利用計(jì)算機(jī)科學(xué)的基本概念來解決問題、設(shè)計(jì)系統(tǒng)和理解人類行為的思維過程,只是單純地講述概念與理論對醫(yī)學(xué)生來說較為難以理解與接受。因此對于計(jì)算思維的培養(yǎng),需要分析醫(yī)學(xué)生的特點(diǎn)與實(shí)際,融入課程知識與實(shí)踐。例如在講解計(jì)算機(jī)硬件原理時(shí)結(jié)合排序、遞歸思想,在EXCEL函數(shù)講解時(shí)融入算法理念,采取這種方式不但能提高知識的接受程度,并且可以讓學(xué)生們真正實(shí)踐計(jì)算思維,而不是停留于理論。
由于學(xué)生來自于全國各個(gè)省份,初中、高中計(jì)算機(jī)課程難度與課時(shí)均不同,有些偏遠(yuǎn)地區(qū)的學(xué)生甚至從未接觸過計(jì)算機(jī),因此在教學(xué)過程中如何設(shè)置課程難度成為亟需解決的問題。目前常見的做法是分層次教學(xué)[9],即在開課前進(jìn)行計(jì)算機(jī)水平測試,依據(jù)測試結(jié)果進(jìn)行分班,根據(jù)學(xué)生計(jì)算機(jī)水平來設(shè)置課程難度。這樣的分層次教學(xué)雖然能夠有效解決計(jì)算機(jī)水平差異較大的問題,但并不是每個(gè)學(xué)校和專業(yè)都有條件實(shí)施分層次教學(xué)。在醫(yī)學(xué)院校實(shí)施分層次難度較大,其主要原因是醫(yī)學(xué)生普遍課多,每個(gè)班課表差異較大,分班時(shí)難以協(xié)調(diào)上課時(shí)間。因此,針對這兩種不同的情況我們采取不同的策略。首先,有條件實(shí)施分層次教學(xué)的學(xué)校優(yōu)先采用分層次教學(xué)法,該方法已經(jīng)在實(shí)踐中被證明能夠有效解決學(xué)生計(jì)算機(jī)水平差異問題。其次,無法實(shí)現(xiàn)分層次教學(xué)的學(xué)校,可以采用線上線下結(jié)合的教學(xué)方式。對于比較基礎(chǔ)且大部分同學(xué)都已經(jīng)掌握的內(nèi)容,采用線上學(xué)習(xí)與測試,測試通過的學(xué)生可以不用學(xué)習(xí)這部分內(nèi)容,而基礎(chǔ)較差的學(xué)生在線上自學(xué)并通過測試。這樣既照顧到基礎(chǔ)比較薄弱的學(xué)生,也能夠讓已經(jīng)掌握該內(nèi)容的學(xué)生不用重復(fù)學(xué)習(xí)。
本文基于文本可視化的方式研究分析了大一醫(yī)學(xué)生的計(jì)算機(jī)知識學(xué)習(xí)意愿,總結(jié)了醫(yī)學(xué)生的特點(diǎn)與實(shí)際,分析了其學(xué)習(xí)的需求,并結(jié)合有關(guān)理論與筆者的思考提出了具體的改進(jìn)建議。針對文中提到的課改建議,筆者進(jìn)行了實(shí)踐檢驗(yàn),結(jié)果表明,新的教學(xué)方式得到了學(xué)生們的普遍好評與認(rèn)可。由于計(jì)算機(jī)技術(shù)本身的不斷發(fā)展,社會對計(jì)算機(jī)技能需求的不斷變化,以及學(xué)生計(jì)算機(jī)水平的逐年提高,計(jì)算機(jī)公共課教學(xué)改革還需要繼續(xù)研究、探索和實(shí)踐,任重而道遠(yuǎn)。