亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        醫(yī)學(xué)數(shù)據(jù)挖掘課程實踐教學(xué)資源庫的建設(shè)

        2023-03-25 09:24:16李四海陳建國
        科教導(dǎo)刊 2023年4期
        關(guān)鍵詞:決策樹資源庫數(shù)據(jù)挖掘

        李四海,陳建國,李 燕

        (甘肅中醫(yī)藥大學(xué)信息工程學(xué)院 甘肅 蘭州 730000)

        當(dāng)今時代,學(xué)科之間的交叉融合已成為現(xiàn)代科學(xué)技術(shù)和工程技術(shù)發(fā)展的重要趨勢和途徑,也是目前新工科建設(shè)和發(fā)展的核心要求[1-2]。實現(xiàn)工科和醫(yī)科的交叉融合,對培育以智慧醫(yī)療、醫(yī)療設(shè)備、藥物研發(fā)以及醫(yī)用材料為主要內(nèi)涵的新興新工科專業(yè)具有重要作用。

        醫(yī)學(xué)信息工程專業(yè)是具有中醫(yī)藥特色的工科專業(yè),以教育部首批“新工科”研究與實踐項目的獲批為契機,近年來,該專業(yè)在課程建設(shè)和專業(yè)內(nèi)涵建設(shè)上都取得了較好的進展。課程建設(shè)是連接新學(xué)科和新專業(yè)的橋梁和紐帶[3],是專業(yè)建設(shè)的內(nèi)在驅(qū)動力。醫(yī)學(xué)數(shù)據(jù)挖掘是醫(yī)學(xué)信息工程本科專業(yè)開設(shè)的一門重要的專業(yè)課程,該課程的開設(shè)對于培養(yǎng)既具有一定的健康醫(yī)療背景知識,又具有扎實的計算機科學(xué)知識和良好的數(shù)據(jù)分析能力的交叉型應(yīng)用型人才具有重要作用,符合目前教育部提出的新工科建設(shè)方向。

        醫(yī)學(xué)數(shù)據(jù)挖掘課程涉及的知識點較多,包含有寬泛的醫(yī)學(xué)背景知識、高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計、機器學(xué)習(xí)、數(shù)據(jù)倉庫以及最優(yōu)化理論等[4-5]。對于該課程學(xué)生理解困難、教學(xué)難度較大,主要原因在于實踐教學(xué)資源匱乏,特別是滿足實際教學(xué)要求的實踐教學(xué)資源較少,針對性不強。針對上述問題,課程團隊構(gòu)建了針對性較強的實踐教學(xué)資源庫,列舉了構(gòu)建實踐教學(xué)資源庫的主要內(nèi)容,提出了實踐教學(xué)資源庫的應(yīng)用方法。

        1 醫(yī)學(xué)數(shù)據(jù)挖掘課程實踐教學(xué)現(xiàn)狀

        1.1 實踐教學(xué)過程缺乏完整性

        醫(yī)學(xué)數(shù)據(jù)挖掘課程經(jīng)典教材嚴重缺乏,已有的一些醫(yī)學(xué)數(shù)據(jù)挖掘教材的側(cè)重點大多是面向生物醫(yī)學(xué)領(lǐng)域,沒有適合中醫(yī)藥院校的教材。經(jīng)典數(shù)據(jù)挖掘教材中的案例有助于學(xué)生理解常用的數(shù)據(jù)挖掘算法,但不利于培養(yǎng)學(xué)生的交叉研究能力和解決醫(yī)藥學(xué)領(lǐng)域?qū)嶋H問題的能力。目前,醫(yī)學(xué)數(shù)據(jù)挖掘課程的實踐環(huán)節(jié)以驗證性實驗為主,實踐教學(xué)環(huán)節(jié)缺乏完整性[6],實踐資源大多是一些標(biāo)準(zhǔn)的機器學(xué)習(xí)數(shù)據(jù)集,例如UCI 數(shù)據(jù)集,這些數(shù)據(jù)集主要用于測試比較不同算法的性能,不利于學(xué)生對數(shù)據(jù)挖掘整體過程的理解和掌握,完整的數(shù)據(jù)挖掘過程應(yīng)當(dāng)包括對具體問題的理解、數(shù)據(jù)的獲取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)質(zhì)量分析、數(shù)據(jù)挖掘模型的建立和優(yōu)化、模型的評估和可視化、對模型的解釋、對具體要解決問題的深入理解等。

        1.2 實踐教學(xué)資源的針對性不強

        醫(yī)學(xué)數(shù)據(jù)挖掘主要運用數(shù)據(jù)挖掘理論解決醫(yī)藥領(lǐng)域的具體問題,目前已有的實踐教學(xué)資源主要存在以下兩個方面的問題。一是針對性不強。例如,經(jīng)典教材中缺乏有關(guān)中醫(yī)方劑以及中藥紅外光譜方面的數(shù)據(jù)集[7]。二是實踐教學(xué)資源缺乏層次性。驗證性實踐教學(xué)資源的目的只是幫助學(xué)生理解數(shù)據(jù)挖掘算法的基本原理,對算法的深入理解、熟練運用相關(guān)算法解決醫(yī)藥領(lǐng)域的實際問題還需要綜合性實踐教學(xué)資源和開放性實踐教學(xué)資源,這兩個層次的實踐資源是對驗證性實踐教學(xué)資源的補充和深化,有助于學(xué)生對算法的深入理解,夯實理論基礎(chǔ),進一步培養(yǎng)學(xué)生的實踐能力和創(chuàng)新能力。

        2 實踐教學(xué)資源庫的主要內(nèi)容

        實踐教學(xué)資源自底向上分為三個層次:驗證性實踐教學(xué)資源、綜合性實踐教學(xué)資源和開放性實踐教學(xué)資源。如圖1 所示。

        圖1 實踐教學(xué)資源庫的主要內(nèi)容

        2.1 驗證性實踐教學(xué)資源

        驗證性實踐教學(xué)資源主要來自一些經(jīng)典數(shù)據(jù)挖掘教材中的數(shù)據(jù)集,數(shù)據(jù)集的樣本和特征都比較少,教師主要在課堂講授具體算法時使用。主要內(nèi)容如表1 所示。

        表1 驗證性實踐教學(xué)資源

        2.2 綜合性和開放性實踐教學(xué)資源

        綜合性實踐教學(xué)資源主要包括:標(biāo)準(zhǔn)的紅外光譜數(shù)據(jù)集、自建的經(jīng)方數(shù)據(jù)庫、胸片的影像數(shù)據(jù)庫以及生物信息學(xué)領(lǐng)域的基因數(shù)據(jù)集。這些數(shù)據(jù)集來自不同的應(yīng)用領(lǐng)域,以醫(yī)藥領(lǐng)域為主。學(xué)生在驗證性實驗的基礎(chǔ)上再進行綜合性實驗,進一步加深對算法的理解,熟悉數(shù)據(jù)挖掘的具體流程,鍛煉醫(yī)學(xué)信息工程專業(yè)學(xué)生解決不同領(lǐng)域特別是醫(yī)藥領(lǐng)域?qū)嶋H問題的能力。

        開放性實踐教學(xué)資源主要包括甘肅道地中藥材的近紅外和中紅外光譜數(shù)據(jù)集、醫(yī)院的電子病歷數(shù)據(jù)集[9],這涉及到數(shù)據(jù)集成、數(shù)據(jù)的清洗和數(shù)據(jù)預(yù)處理等工作。電子病歷評級政策的出臺對電子病歷的挖掘和利用提出了更高的要求,根據(jù)國家衛(wèi)健委電子病歷的評級要求,4 級要求醫(yī)院實現(xiàn)合理用藥功能,5 級要求醫(yī)院利用知識庫實現(xiàn)決策支持服務(wù),并能夠為醫(yī)療管理和臨床科研工作提供數(shù)據(jù)挖掘功能,6 級則要求醫(yī)院建立全院級多維度醫(yī)療知識庫體系,提供高級別醫(yī)療決策支持。因此,在以后的開放性實踐教學(xué)資源的更新和優(yōu)化過程中,要進一步充實和完善有關(guān)電子病歷方面的實踐教學(xué)資源。

        3 實踐教學(xué)資源庫的應(yīng)用

        實踐教學(xué)資源庫的應(yīng)用具有層次性。

        首先,使用驗證性實踐教學(xué)資源講授算法的基本原理。例如,在講解三種經(jīng)典的決策樹算法ID3、C4.5、CART 時,使用貸款申請數(shù)據(jù)集,該數(shù)據(jù)集共有15 個樣本,4 個特征:年齡、是否有工作、是否有自己的房子、個人信貸狀況,類別為是否同意貸款。該數(shù)據(jù)集樣本和特征少,便于理解算法的工作過程。在課堂講授中,教師分別以信息增益、增益率和基尼指數(shù)為劃分準(zhǔn)則,分別完整構(gòu)建ID3、C4.5、CART 決策樹,學(xué)生可以直觀感受到建立的ID3 決策樹枝繁葉茂,C4.5 是比較簡潔的多叉樹,而CART 決策樹是簡潔優(yōu)雅的二叉樹。由此,進一步講解ID3 算法的主要缺點以及C4.5 是如何克服這些缺點的,在學(xué)生理解二者的聯(lián)系和區(qū)別的基礎(chǔ)上,進一步講解基尼指數(shù)和熵的區(qū)別與聯(lián)系,指出基尼指數(shù)是熵的近似替代,CART 分類樹使用基尼指數(shù)作為劃分準(zhǔn)則的目的是為了簡化計算,并且更加容易構(gòu)建優(yōu)雅的二叉樹。以上講解由直觀到具體、由簡單到復(fù)雜、層層遞進、逐步深入,學(xué)生很容易理解三種決策樹的區(qū)別與聯(lián)系,也能理解枝繁葉茂的決策樹為什么容易過擬合,決策樹葉子節(jié)點中樣本的共性和個性之間的關(guān)系等。學(xué)生不僅掌握了決策樹算法的基本原理,也夯實了數(shù)據(jù)挖掘和機器學(xué)習(xí)的理論基礎(chǔ)。在理解算法原理的基礎(chǔ)上,基于Weka等流行的數(shù)據(jù)挖掘平臺[10]導(dǎo)入貸款申請數(shù)據(jù)集,由于學(xué)生已經(jīng)理解了相關(guān)算法,因此很容易理解Weka 中C4.5和CART 決策樹算法各個參數(shù)的含義,也清楚參數(shù)的設(shè)置對結(jié)果的影響,通過對挖掘結(jié)果的分析,學(xué)生已經(jīng)熟悉了數(shù)據(jù)挖掘的基本流程。

        在驗證性實驗的基礎(chǔ)上,下一步再進行綜合性實驗,該教學(xué)資源分別是UCI 中的乳腺腫瘤數(shù)據(jù)集和不同產(chǎn)地當(dāng)歸的中紅外光譜數(shù)據(jù)集,學(xué)生可以直接從教師提供的教學(xué)平臺下載使用,其中,中紅外光譜數(shù)據(jù)需要進行數(shù)據(jù)清洗和數(shù)據(jù)預(yù)處理,學(xué)生使用CART 分類樹算法,建立相應(yīng)的分類模型并對模型進行優(yōu)化、解釋和評價。開放性實驗要求學(xué)生與中藥學(xué)專業(yè)的學(xué)生合作,完成紅外光譜的采集,理解光譜數(shù)據(jù)的含義,掌握光譜預(yù)處理方法,這些前期工作對于學(xué)生深入理解模型、解釋模型、優(yōu)化模型都具有重要作用。總之,通過三個層次的實踐教學(xué),學(xué)生對決策樹算法的理解會更加深入,對數(shù)據(jù)挖掘理論的掌握會更加堅實,加深了學(xué)生對醫(yī)藥領(lǐng)域數(shù)據(jù)挖掘問題的理解,提高了學(xué)生運用數(shù)據(jù)挖掘理論解決醫(yī)藥領(lǐng)域?qū)嶋H問題的能力。

        實踐教學(xué)資源庫的構(gòu)建和應(yīng)用也要具有開放性。醫(yī)學(xué)數(shù)據(jù)挖掘課程的實踐教學(xué)資源庫要隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展以及醫(yī)學(xué)信息工程專業(yè)人才培養(yǎng)方案的調(diào)整不斷進行更新和優(yōu)化。例如,針對中醫(yī)方劑的數(shù)據(jù)挖掘,可以補充經(jīng)典的中醫(yī)典籍和中醫(yī)醫(yī)案的數(shù)據(jù)庫,方便學(xué)生開展中醫(yī)方劑的潛語義分析和知識圖譜構(gòu)建等方面的研究。

        4 結(jié)語

        醫(yī)學(xué)數(shù)據(jù)挖掘課程實踐教學(xué)資源庫的構(gòu)建對于優(yōu)化教學(xué)資源、提高學(xué)生的實踐能力和創(chuàng)新能力具有重要作用,實踐教學(xué)資源庫的構(gòu)建應(yīng)該具有層次性和開放性的特點,要解決醫(yī)藥領(lǐng)域的實際問題,構(gòu)建的中醫(yī)方劑數(shù)據(jù)庫、紅外光譜數(shù)據(jù)庫以及影像數(shù)據(jù)集體現(xiàn)了中醫(yī)藥特色。實踐教學(xué)資源庫的應(yīng)用強調(diào)層次性,只有層層遞進,逐步深入,才能夯實學(xué)生的數(shù)據(jù)挖掘理論基礎(chǔ),提高學(xué)生解決實際問題和開展交叉研究的能力。同時,實踐教學(xué)資源庫也要隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展和醫(yī)藥領(lǐng)域的研究熱點不斷更新和優(yōu)化,這樣才能滿足培養(yǎng)醫(yī)工結(jié)合的復(fù)合型應(yīng)用型人才的需要。

        猜你喜歡
        決策樹資源庫數(shù)據(jù)挖掘
        健身氣功開放課程資源庫建設(shè)研究
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        貴州●石斛種質(zhì)資源庫
        決策樹和隨機森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        高中歷史信息化教育資源庫應(yīng)用探索
        福建基礎(chǔ)教育教學(xué)資源庫建設(shè)研究——以福建基礎(chǔ)教育網(wǎng)資源庫為例
        基于決策樹的出租車乘客出行目的識別
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        欧美日韩人妻| 久久久99精品成人片| 天天爽夜夜爽人人爽一区二区| 又爆又大又粗又硬又黄的a片| 中文岛国精品亚洲一区| 日本一区二区高清视频| 日韩精品成人区中文字幕| 性欧美老人牲交xxxxx视频| 日本少妇熟女一区二区| 加勒比东京热中文字幕| 日本丰满熟妇videossex8k| 高清无码一区二区在线观看吞精| 国产偷闻隔壁人妻内裤av| 激情文学婷婷六月开心久久| 国产网红主播无码精品| 国产三级在线视频播放| 青青草手机成人自拍视频| 不卡的高清av一区二区三区| 久久精品国产网红主播| 91久久国产精品视频| 中文字幕色婷婷在线视频| 性色av一二三天美传媒| 最新国产乱人伦偷精品免费网站 | 亚洲春色在线视频| 亚洲七七久久综合桃花| 日韩中文字幕乱码在线| 无码人妻久久一区二区三区免费丨| 亚洲精品aa片在线观看国产| 狠狠狠狠狠综合视频| 深夜黄色刺激影片在线免费观看| 国产农村熟妇videos| 五月天综合网站| 中文字幕色婷婷在线视频| 亚洲中文字幕无码av永久| 亚洲综合av在线在线播放| 亚洲又黄又大又爽毛片| 久久天堂精品一区二区三区四区| 色八a级在线观看| 久久青草国产免费观看| 中文字幕亚洲精品在线免费| 免费无码一区二区三区蜜桃|