亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于案例驅動的醫(yī)學數據挖掘課程教學研究與實踐

        2023-09-12 06:59:24李四海李燕
        科教導刊 2023年14期
        關鍵詞:教學資源庫數據挖掘創(chuàng)新能力

        李四海 李燕

        摘要 文章針對醫(yī)學數據挖掘課程教學過程中存在的涉及數學學科知識較多、理論知識抽象、教學難度較大、理論及實踐教學資源匱乏等問題,按照培養(yǎng)方案,遵循“模塊化、層次化、開放性”的原則,通過構建優(yōu)質的理論和實踐教學資源庫進行全程案例驅動教學,能夠降低理論知識學習難度、強化實踐教學環(huán)節(jié)、提高學生的學習興趣、提升課程教學質量、促進課程建設和專業(yè)團隊建設。分析了教學資源庫構建的必要性、路徑以及對培養(yǎng)學生創(chuàng)新能力的重要意義。

        關鍵詞 數據挖掘;教學資源庫;案例驅動;創(chuàng)新能力

        中圖分類號:G424文獻標識碼:ADOI:10.16400/j.cnki.kjdk.2023.14.034

        數據挖掘(Data Mining,DM)又稱知識發(fā)現(Knowledge Discover in Database,KDD),是目前人工智能和數據庫領域研究的熱點,數據挖掘是指從數據庫的大量數據中發(fā)現隱含的、先前未知的并有潛在價值的規(guī)律和知識的過程。數據挖掘主要基于人工智能、機器學習、模式識別、統(tǒng)計學、數據庫、可視化技術等[1]。與常規(guī)的數據挖掘相比,醫(yī)學數據挖掘有其自身的特點,主要表現在挖掘對象的廣泛性和異質性、挖掘算法的魯棒性和高效性、獲取知識或決策的準確性和可靠性等[2-3]。在醫(yī)學數據挖掘算法中,決策樹、貝葉斯網絡、深度神經網絡、關聯(lián)規(guī)則以及主題模型等在醫(yī)學輔助診斷、醫(yī)學影像識別、醫(yī)學文本語義分析方面取得了較大的進展并展現出獨特的優(yōu)勢。

        2019年10月中共中央、國務院發(fā)布的《關于促進中醫(yī)藥傳承創(chuàng)新發(fā)展的意見》提出了以信息化支撐中醫(yī)藥服務體系建設,實施“互聯(lián)網+中醫(yī)藥健康服務”行動。意見的發(fā)布,指明了大數據與中醫(yī)藥跨學科發(fā)展的方向,大數據在中醫(yī)大數據框架相關研究、物聯(lián)網傳感器技術相關研究、特殊疾病的治療相關研究及中藥材和制藥領域相關研究方面將大有可為。2020年8月19日,國家健康醫(yī)療大數據研究院正式成立,標志著國家將進一步大力推進政府健康醫(yī)療信息系統(tǒng)和公共健康醫(yī)療數據互聯(lián)、融合、開放、共享。隨著近幾年互聯(lián)網、AI、云計算、物聯(lián)網等高新技術的發(fā)展,為中醫(yī)藥發(fā)展注入了活力,也為中醫(yī)藥發(fā)揮更大價值提供了有力支撐。

        醫(yī)學數據挖掘課程是醫(yī)學信息工程本科專業(yè)開設的一門重要的專業(yè)方向課程,該課程的開設對于培養(yǎng)既具有一定的健康醫(yī)療背景知識,又具有扎實的計算機科學知識和良好的數據分析能力的交叉型應用型人才具有重要作用,符合教育部目前提出的“新工科”“新醫(yī)科”的新時代教育模式改革方向。

        通過對前期發(fā)放的調查問卷進行深入分析,結合多年的教學經驗發(fā)現,醫(yī)學數據挖掘課程涉及的數學知識較多、理論知識理解難度較大,主要原因在于理論和實踐教學資源匱乏,特別是滿足教學要求的實踐教學資源較少,針對性不強,沒有進行全程案例驅動教學。針對上述問題,本文分析了目前醫(yī)學數據挖掘課程教學中存在的問題,構建理論和實踐教學資源庫的必要性,列舉了構建理論和實踐教學資源庫的主要內容,最后提出了構建教學資源庫的路徑和資源庫的應用方法。

        1醫(yī)學數據挖掘課程教學分析

        1.1理論知識抽象,理解困難,教學難度較大

        醫(yī)學數據挖掘課程涉及的數學知識很多,包括最優(yōu)化理論、高等數學中的偏導數及泰勒展開,線性代數,矩陣論,概率論與數理統(tǒng)計中的貝葉斯公式、參數估計等知識點。這些數學知識點是深入理解數據挖掘相關算法的基礎,比如在講解樸素貝葉斯分類時,會涉及貝葉斯公式,上課過程中發(fā)現部分學生并沒有理解貝葉斯公式的實質,導致在學習貝葉斯分類算法時存在困難。

        1.2缺乏中醫(yī)藥實踐教學資源

        由于醫(yī)學數據挖掘主要解決的是中醫(yī)藥領域的具體問題,現有的實踐教學資源主要存在以下三個方面的問題。一是針對性不強。例如,目前常用的UCI標準數據集缺乏有關中醫(yī)方劑以及中藥紅外光譜方面的數據集。二是數據集大多是經過預處理的標準數據集,其主要目的在于測試比較不同算法的性能。但真實的數據挖掘場景通過數據的獲取、對數據的理解以及數據預處理,直接使用標準數據集進行數據挖掘導致實踐教學環(huán)節(jié)缺乏完整性。三是實踐教學資源和中醫(yī)藥領域問題的交叉融合度不夠,不能很好地體現“新工科、新醫(yī)科”的專業(yè)發(fā)展方向。

        2教學資源庫構建的必要性

        2.1優(yōu)選教學資源

        醫(yī)學數據挖掘課程主要講授數據挖掘技術在醫(yī)學領域中的具體應用,不論是在教材的選擇還是在內容的選取方面,不同的中醫(yī)藥院校著重點都有所不同,因此直接選取經典的數據挖掘教材并講述全部內容并不一定能產生好的教學效果。主要原因在于經典的數據挖掘教材更加注重算法原理的介紹,會涉及比較多的數學公式推導,并且在算法實例部分不會或很少涉及中醫(yī)藥領域的具體問題。因此,中醫(yī)醫(yī)院院校的醫(yī)學數據挖掘課程需要對理論教學內容進行優(yōu)化,將更多的關注點放在中醫(yī)藥領域常用的一些算法上,比如主成分分析、偏最小二乘、關聯(lián)規(guī)則、主題模型、神經網絡、支持向量機以及層次聚類算法等。同時,增加中醫(yī)藥領域的一些實踐教學資源,比如方劑數據庫、紅外光譜數據庫、醫(yī)學影像數據庫以及脈象和舌象數據庫等,通過理論和實踐教學資源庫的構建,體現中醫(yī)藥院校醫(yī)學數據挖掘課程的特色和優(yōu)勢,提高學生的學習興趣,強化學生對理論知識的理解和掌握。

        2.2增強實踐能力

        醫(yī)學數據挖掘是一門實踐性很強的課程,教學的最終目的在于讓學生具備運用相關算法解決實際問題的能力。然而,傳統(tǒng)的實踐教學資源大多是基于一些公開的標準數據集,如UCI公開數據集、這些數據集大多是經過預處理的,一般沒有缺失值、噪聲較小,基本可以直接導入使用,一般只能用于學生理解和運用學習的相關算法,對鍛煉學生解決實際問題的能力作用有限。實際的數據挖掘過程大約70%的工作量在于數據預處理,因此,學生通過自己獲取數據并進行數據的清洗、缺失值填充、數據的規(guī)范化等有利于學生對領域知識的了解,提高學生分析和解決實際問題的能力。比如,在構建近紅外光譜實踐教學資源過程中,其主要流程就包括中藥材的采集、中藥材近紅外光譜的掃描、光譜預處理方法等。

        2.3培養(yǎng)數據思維

        科學思維主要包括理論思維、實驗思維、計算思維以及數據思維。在醫(yī)學信息工程專業(yè)開設的眾多專業(yè)課程中,高等數學、線性代數、概率論與數理統(tǒng)計、離散數學的等數學類課程主要培養(yǎng)學生的理論思維;大學物理課程主要培養(yǎng)學生的實驗思維;數據結構、操作系統(tǒng)、計算機組成原理、Java語言程序設計、醫(yī)學信息學等課程主要培養(yǎng)學生的計算思維,學生通過這些課程的學習能夠學會從計算機的角度分析問題和解決問題,主要包括:迭代、遞歸、分治、編碼、分組、存儲以及并行計算等。隨著大數據和云計算技術的快速發(fā)展,進一步培養(yǎng)學生的數據思維意識對于豐富學生的科學思維具有重要作用。通過構建高質量的醫(yī)學數據挖掘課程實踐教學資源庫,開展構建醫(yī)學知識圖譜、醫(yī)學輔助診斷、醫(yī)學模式挖掘等方面的交叉研究,從醫(yī)學數據中挖掘出醫(yī)學領域的一些重要知識和規(guī)律,最終實現對學生計算思維和數據思維的培養(yǎng)。

        2.4促進課程建設和學科發(fā)展

        課程建設是專業(yè)建設和學科建設的基礎,醫(yī)學數據挖掘課程對于數據結構、概率論與數理統(tǒng)計、數據庫原理、Python語言程序設計等課程的學習具有很好的輻射和帶動作用,學生能夠將已有的課程知識很好地運用到解決數據挖掘的實際問題之中,這對于課程群的建設具有重要作用。通過構建理論和實踐教學資源庫,有利于推進教學模式的創(chuàng)新和教學方法的改革,有利于開展混合式教學,有利于建設一流課程,促進課程建設和學科發(fā)展[4]。

        3教學資源庫的主要內容

        3.1課程知識模塊設置

        醫(yī)學數據挖掘課程涉及的理論和算法很多,對于如何構建教學資源庫并沒有明確的結論,目前還處于探索中[5]。針對中醫(yī)藥院校開設的醫(yī)學數據挖掘課程,應該強調數據挖掘算法在中醫(yī)藥領域的應用。為此要對理論知識進行梳理和優(yōu)化,將在中醫(yī)藥領域常用的算法以知識點的方式進行模塊化,并構建相應的理論資源庫和實踐教學資源庫。將不同的知識點大致分為三個模塊:中醫(yī)方劑挖掘、中藥質量定量分析和定性評價、臨床輔助診斷。課程知識模塊設置如表1所示。

        3.2理論教學資源庫

        根據課程知識的模塊化設置,按照“模塊化、層次化、開放性”的原則構建理論教學資源庫。理論資源庫由三個部分組成:中國大學MOOC中有關機器學習和數據挖掘的課程,由教師遴選推薦;經典的數據挖掘算法源碼實現,scikit-learn等機器學習庫的介紹;教師錄制數據挖掘導論部分的內容,該視頻內容包括經典書目介紹、學習資源推薦、數據挖掘常用算法介紹以及常用的應用領域等。理論教學資源和實踐教學資源內容如圖1所示。

        3.3實踐教學資源庫

        實踐教學資源自底向上分為三個層次:驗證性資源[6]、醫(yī)學領域資源和開放性資源。驗證性資源主要包括常用的UCI標準數據集,經典教材中用到的超市購物數據集、西瓜數據集和天氣數據集等。這些數據集一般樣本量和特征數較少,主要用于理解算法的基本原理,熟悉算法的運行過程。醫(yī)學領域資源主要包括:玉米和小麥等標準紅外光譜數據集、方劑數據庫、胸片的影像數據庫以及生物信息學領域的基因、蛋白數據集。學生在理解數據挖掘算法基本原理的基礎上,在更大規(guī)模和更復雜數據上理解和運用數據挖掘方法解決實際問題,鍛煉醫(yī)學信息工程專業(yè)學生或其他中醫(yī)藥學專業(yè)研究生理解領域問題、預處理數據以及優(yōu)化和改進模型的能力[7]。開放性資源主要包括采集的當歸、黃芪、秦艽、黨參等道地藥材的紅外光譜數據集和醫(yī)院的HIS、PACS、LIS等系統(tǒng)產生的數據集[8],這涉及數據集成、數據清洗和預處理等工作。實踐性教學資源庫都是開放性的,需要不斷更新和優(yōu)化。

        4教學資源庫的構建路徑和應用

        醫(yī)學數據挖掘課程開展線上線下混合式教學,教學平臺由學校教育技術中心提供。其中,線上教學為學生提供理論教學資源和實踐教學資源。理論教學資源主要包括教師遴選的中國大學MOOC中的部分優(yōu)質教學資源、教師錄制的醫(yī)學數據挖掘課程簡介視頻、教師錄制的醫(yī)學數據挖掘數學基礎知識講解視頻等。實踐教學資源目前主要包括三個部分:第一是驗證性數據集,主要包括鳶尾花數據集、天氣數據集、超市數據集、西瓜數據集、闌尾炎數據集、中風數據集等。第二是具有中醫(yī)藥特色的中醫(yī)藥學數據集,包括方劑數據庫、部分道地藥材的紅外光譜數據集、部分醫(yī)學影像數據集。第三是與相關醫(yī)療機構和疾控中心共享的僅用于學術研究的一些開放性數據集,包括從醫(yī)院信息系統(tǒng)導出的各種醫(yī)學影像數據集、臨床診斷數據集和各種流行病調查方面的數據集等。實踐性教學資源庫根據理論教學內容的調整不斷進行更新和優(yōu)化,符合“模塊化、層次化、開放性”的構建原則。

        教學資源庫的應用按照層次化的原則,在授課過程中首先使用驗證性實踐教學資源,目的是使學生理解算法的基本原理,例如,在講解關聯(lián)規(guī)則分析時,使用AllElectronics某分店的事務數據集,該數據集共有5個事務,5個商品項。通過該數據集,學生能夠非常直觀地理解如何通過k-1項集的拼接得到候選k項集,如何利用先驗知識對候選k項集進行剪枝,如何根據預設的最小支持度閾值判斷候選k項集是否為頻繁k項集等。在理解算法原理的基礎上,基于Weka等流行的數據挖掘平臺導入該數據集[9],由于學生已經理解了相關算法,因此很容易理解Weka中Apriori算法各個算法參數的含義,也清楚參數的設置對挖掘結果的影響,通過對挖掘結果的驗證,學生已經基本熟悉了數據挖掘的基本流程。然后使用醫(yī)學領域的實踐教學資源,該教學資源是冠心病方劑的一些經典方劑,學生可以直接從線上教學平臺下載使用,該數據集需要進行數據清洗,數據格式轉換和數據集成,學生使用關聯(lián)規(guī)則挖掘算法,挖掘出治療冠心病的常用對藥。通過該層次的實踐環(huán)節(jié),學生將能夠進一步加深對關聯(lián)規(guī)則挖掘算法的理解,同時進一步熟悉數據挖掘在中醫(yī)藥領域的具體應用。

        教學資源庫的應用也要體現開放性的原則。例如,在講解CART回歸決策樹算法時,首先使用驗證性實踐教學資源,該數據集共10個樣本,一個特征x,構建決策樹根據x預測y值[10]。借助EXCEL等電子表格軟件,很容易計算每次分裂后左右子樹的均方根誤差,并完整復現二叉樹的分裂過程,需要指出的是,決策樹算法知識點可以挖掘出很好的課程思政元素[11],比如,從葉子結點中樣本的個數引出個性與共性的關系,葉子節(jié)點數量與模型復雜度以及模型欠學習和過學習的關系等,引導學生要正確處理個性與共性的辯證關系,樹立團隊意識,善于融入集體和團隊。在學生弄懂算法基本原理的基礎上,使用醫(yī)學領域實踐教學資源中的corn近紅外光譜數據集,該數據集80個樣本,700個波數特征,預測值為moisture、oil、protein、starch等成分含量。學生可以基于Weka完成該實踐任務,熟悉數據挖掘的基本過程;也可以基于scikit-learn等基于python的機器學習庫,調用CART回歸樹完成該實踐環(huán)節(jié),進一步熟悉sklearn中決策樹的使用接口,參數設置對決策樹的復雜度及預測能力的影響。在開放性資源的使用部分,學生通過參與教師課題,完成當歸、秦艽等中藥材的近紅外光譜采集,進一步理解近紅外光譜的指紋特性,光譜數據中的噪聲來源及類型,不同預處理方法對預測結果的影響等,通過該實踐環(huán)節(jié),學生加深了對數據的理解和認識,也進一步體會到數據預處理對數據挖掘的重要性,增強了學生開展交叉研究的能力。

        5結語

        隨著中醫(yī)藥信息化的不斷發(fā)展,在中醫(yī)藥大數據背景下,醫(yī)學數據挖掘課程的開設對于醫(yī)學信息工程專業(yè)及其他中醫(yī)藥學專業(yè)的研究生都具有重要意義。理論和實踐教學資源庫的構建對于優(yōu)化教學資源、進行全過程案例驅動教學,構建符合OBE理念的人才培養(yǎng)模式、提高學生的實踐能力和創(chuàng)新能力具有重要作用,教學資源庫的構建滿足“模塊化、層次化、開放性”的原則,其中的方劑數據庫、光譜數據庫以及影像數據集體現了中醫(yī)藥特色。教學資源庫的使用既強調理論知識的模塊化,更加要重視實踐環(huán)節(jié)的層次化和開放性,只有層層遞進,逐步提高,才能培養(yǎng)學生既具有扎實的理論基礎,又具有較強的解決實際問題和開展交叉研究的能力。同時,教學資源庫也要不斷更新和優(yōu)化,這樣才能不斷滿足醫(yī)學數據挖掘技術發(fā)展的需要。

        基金項目:甘肅中醫(yī)藥大學教學研究與教學改革項目(YB-201812)。

        參考文獻

        [1]劉銘,呂丹,安永燦.大數據時代下數據挖掘技術的應用[J].科技導報,2018,36(9):73-83.

        [2]秦文哲,陳進,董力.大數據背景下醫(yī)學數據挖掘的研究進展及應用[J].中國胸心血管外科臨床雜志,2016,23(1):55-60.

        [3]張國慶,李亦學,王澤峰,等.生物醫(yī)學大數據發(fā)展的新挑戰(zhàn)與趨勢[J].中國科學院院刊,2018,33(8):853-860.

        [4]黃嵐.數據挖掘課程實踐教學資源庫建設[J].計算機教育,2014(12): 89-92.

        [5]安璐,歐孟花,李綱.數據挖掘課程的知識體系構建[J].圖書情報知識,2016(5):4-12.

        [6]潘媛媛,黃道斌,盧小杰,等.醫(yī)學院校數據挖掘實踐教學資源庫建設[J].計算機教育,2020(7):144-147.

        [7]李四海,任真,李燕.中醫(yī)藥院校研究生計算機應用能力培養(yǎng)的探索與研究[J].甘肅中醫(yī)藥大學學報,2017,34(4):105-108.

        [8]吳宗友,白昆龍,楊林蕊,等.電子病歷文本挖掘研究綜述[J].計算機研究與發(fā)展,2021,58(3):513-527.

        [9]譚成兵,周湘貞,朱云飛.基于Weka和協(xié)同機器學習技術的數據挖掘方法研究[J].長春大學學報,2020,30(12):5-9.

        [10]李航.機器學習方法[M].北京:清華大學出版社,2022.

        [11]王倩,何海濤,王巖.“數據挖掘與知識發(fā)現”課程思政建設的探索與實踐[J].教學研究,2022,45(3):75-80.

        猜你喜歡
        教學資源庫數據挖掘創(chuàng)新能力
        高中數學課堂教學中創(chuàng)新能力的培養(yǎng)
        創(chuàng)新能力培養(yǎng)視角下的無機化學教學研究
        化工管理(2021年7期)2021-05-13 00:44:44
        探討人工智能與數據挖掘發(fā)展趨勢
        推進軟件產業(yè)創(chuàng)新能力提升
        信息化建設(2019年2期)2019-03-27 06:23:58
        基于并行計算的大數據挖掘在電網中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于創(chuàng)新能力培養(yǎng)的高職音樂教育改革探討
        北方音樂(2017年4期)2017-05-04 03:40:28
        基于學徒制的電氣自動化技術專業(yè)改革與實踐
        東方教育(2016年16期)2016-11-25 01:37:48
        移動互聯(lián)開發(fā)的教學資源庫的建設研究
        基于校企合作模式下計算機專業(yè)教學資源庫建設
        高職口腔醫(yī)學技術專業(yè)教學資源庫建設探索
        職業(yè)(2016年10期)2016-10-20 22:12:30
        国产午夜福利片在线观看| 色综合色综合久久综合频道| 国产精品成人久久一区二区| 开心久久婷婷综合中文字幕| 疯狂添女人下部视频免费| 少妇高潮惨叫久久久久久| 亚洲欧美国产精品久久久| 亚洲综合久久精品少妇av| 国产精品久久久爽爽爽麻豆色哟哟 | 在线观看一区二区三区在线观看 | 乱人伦中文无码视频| 亚洲区日韩精品中文字幕| 黄色三级国产在线观看| 蜜桃av噜噜一区二区三区策驰| 国产精品一区二区在线观看| 亚洲成人免费观看| 日本一区二区在线看看| 日韩精品视频久久一区二区| 全球中文成人在线| 产国语一级特黄aa大片| 青青草成人免费播放视频| 欧美性猛交99久久久久99按摩| 国产成人av免费观看| 欧美精品日韩一区二区三区| 日韩精品极视频在线观看免费| 亚洲人成影院在线无码按摩店| 中国极品少妇videossexhd| 在教室伦流澡到高潮hgl视频 | 337p西西人体大胆瓣开下部| 亚洲熟妇在线视频观看| 长腿丝袜在线观看国产| 精品偷自拍另类在线观看| 亚洲熟女乱色一区二区三区| 91精品国产闺蜜国产在线| 亚洲中文字幕高清av| 久久久久久国产精品免费免费| 精品十八禁免费观看| 一区二区三区手机看片日本韩国| 亚洲狠狠婷婷综合久久久久| 播放灌醉水嫩大学生国内精品| 国产美女自拍国语对白|