亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中醫(yī)數(shù)據(jù)挖掘算法研究進展*

        2015-04-14 11:17:30張鑫朱明峰杜建強郝竹林王國龍江西中醫(yī)藥大學計算機學院南昌330004
        江西中醫(yī)藥大學學報 2015年1期
        關鍵詞:數(shù)據(jù)挖掘中醫(yī)藥算法

        ★ 張鑫 朱明峰 杜建強郝竹林 王國龍 (江西中醫(yī)藥大學計算機學院 南昌330004)

        中醫(yī)數(shù)據(jù)挖掘算法研究進展*

        ★ 張鑫 朱明峰 杜建強**郝竹林 王國龍 (江西中醫(yī)藥大學計算機學院 南昌330004)

        伴隨大數(shù)據(jù)時代的到來和數(shù)據(jù)挖掘技術的興起,中醫(yī)數(shù)據(jù)挖掘也逐步走向熱門。本文對數(shù)據(jù)挖掘進行系統(tǒng)概述,著重對中醫(yī)數(shù)據(jù)挖掘的研究進展進行了具體的趨勢分析,對相關方法的研究進行了梳理,以期為相關科研工作者進行中醫(yī)領域數(shù)據(jù)挖掘的研究提供有價值的文獻參考。

        數(shù)據(jù)挖掘;中醫(yī);決策樹;隨機森林;深度學習

        千百年來累積的大量中醫(yī)數(shù)據(jù)資料是歷史傳承下來的寶貴財富,隨著數(shù)據(jù)庫技術的發(fā)展,基于數(shù)據(jù)庫的中醫(yī)信息管理變得越來越便利,且聚集其中的中醫(yī)藥數(shù)據(jù)也在持續(xù)激增,這些海量中醫(yī)藥數(shù)據(jù)背后必隱藏許多有價值的信息。通過對大規(guī)模中醫(yī)藥數(shù)據(jù)的挖掘分析,能夠為中醫(yī)診斷提供決策支撐,探索中藥配伍規(guī)律,對中醫(yī)研究產生重大意義;也能促進中醫(yī)文獻古籍研究,促進中醫(yī)信息的數(shù)字化、自動化和智能化的全面快速發(fā)展。當前,數(shù)據(jù)倉庫、人工智能、機器學習等數(shù)據(jù)挖掘相關學科帶動了數(shù)據(jù)挖掘的發(fā)展,因此也推動了數(shù)據(jù)挖掘在中醫(yī)領域的廣泛應用并迅速走向熱門。

        1 數(shù)據(jù)挖掘與中醫(yī)數(shù)據(jù)挖掘

        1.1 數(shù)據(jù)挖掘 所謂數(shù)據(jù)挖掘,是指從大量的、不完全的、有噪聲的、模糊的實際應用數(shù)據(jù)中,提取隱含在其中的、人們事先未知的但是有潛在應用價值的信息和知識的過程[1]。數(shù)據(jù)挖掘是一門涉及面很廣的交叉學科,包含機器學習、數(shù)理統(tǒng)計、神經網絡數(shù)據(jù)庫、模式識別、粗糙集、模糊數(shù)學等相關技術。

        1.2 中醫(yī)數(shù)據(jù)挖掘 近十幾年,隨著數(shù)據(jù)庫技術的發(fā)展和中醫(yī)領域數(shù)據(jù)的暴漲,數(shù)據(jù)挖掘方法開始引入到中醫(yī)藥研究上,產生中醫(yī)數(shù)據(jù)挖掘。不同于傳統(tǒng)科學數(shù)據(jù),中醫(yī)藥數(shù)據(jù)有自己的特點。胡金亮[2]歸納其特點包括:癥狀的模糊性、證候的多態(tài)性、證候與癥狀間的非線性、中醫(yī)藥數(shù)據(jù)的多維性,以及挖掘的復雜性?;诖祟愄攸c,傳統(tǒng)簡單的統(tǒng)計分析工具已經不能滿足中醫(yī)現(xiàn)代化、信息化發(fā)展的根本需求。而中醫(yī)數(shù)據(jù)挖掘技術正適合于復雜多維的數(shù)據(jù)分析,運用相應的算法可以從海量的中醫(yī)藥數(shù)據(jù)中發(fā)現(xiàn)知識。

        1.3 常用中醫(yī)數(shù)據(jù)挖掘分析方法 中醫(yī)藥研究過程中針對不同子領域的分析模式可選用不同的數(shù)據(jù)挖掘方法,常用的有關聯(lián)規(guī)則、聚類分析、人工神經網絡、決策樹等方法,還有一些其他分析方法,包括遺傳算法、貝葉斯信念網絡、小波變換、主成分分析、時間序列分析和孤立點分析等。岳路[3]將決策樹算法應用于小兒肺炎中醫(yī)辨證,構建出一種小兒肺炎分類模型,該模型中小兒肺炎辨證分類的準確率達到80%,可用于臨床輔助診斷。馬金剛[4]基于關聯(lián)規(guī)則研究方劑配伍的規(guī)律,所得到的分析結果與中醫(yī)理論和臨床經驗總結總體相符,為進一步研究提供了依據(jù)。郜巒[5]借助聚類分析技術,初步揭示了新安醫(yī)家對于中風病病因病機、辨證論治的獨特見解,挖掘出其臨床治療思路,為臨床防治中風病提供了一定的借鑒作用。楊濤[6]在應用人工神經網絡探討心系病位、病癥特性與基礎證的相關性研究中發(fā)現(xiàn),BP神經網絡能較好地模擬心系病位、病癥特性與基礎證的非線性映射,此類研究成果可以進一步應用于五臟系統(tǒng)辨證體系中,為病癥規(guī)范化和診斷信息化提供參考。謝家宇[7]借助連續(xù)小波變換算法分析脈象信號,能較好地從人體的脈象信號中提取人體病變的特征信息。

        2 中醫(yī)數(shù)據(jù)挖掘的研究進展

        近年來,為進一步促進中醫(yī)領域的信息化、智能化發(fā)展,數(shù)據(jù)挖掘在中醫(yī)藥相關研究上越來越深入。筆者著重對目前中醫(yī)數(shù)據(jù)挖掘的研究方向進行了具體分析,其主要呈現(xiàn)以下三個趨勢。

        2.1 改進傳統(tǒng)挖掘算法

        2.1.1 基于傳統(tǒng)經典算法局部改進 即改進傳統(tǒng)經典醫(yī)學數(shù)據(jù)挖掘算法,彌補算法的某些不足,以提高算法的效率和精度。馬建[8]針對傳統(tǒng)貝葉斯算法在訓練數(shù)據(jù)方面未考慮數(shù)據(jù)屬性間的相關性而造成對數(shù)據(jù)分析的冗余、資源浪費以及分析效率下降等不足進行改進,并結合中醫(yī)醫(yī)案數(shù)據(jù)復雜、易缺失等特點,應用改進的貝葉斯網絡算法對“內生五邪”醫(yī)案進行中醫(yī)規(guī)律的挖掘和分析,通過與傳統(tǒng)的貝葉斯網絡方法分類的結果相比較,發(fā)現(xiàn)前者具有更高的分析準確率。趙丹丹[9]以治療糖尿病的中藥方劑數(shù)據(jù)為研究樣本,通過改進的Apriori算法來發(fā)現(xiàn)中藥配伍規(guī)律,從而提取出使用中藥治療糖尿病的整體用藥規(guī)律。高麗君[10]針對缺失數(shù)據(jù)處理和決策樹分類對噪聲數(shù)據(jù)敏感的不足,提出了基于灰色關聯(lián)分析理論的填充算法,和基于尺度函數(shù)的變精度粗糙集屬性選擇標準的決策樹改進算法,并將其嵌入冠心病的中醫(yī)輔助診療系統(tǒng),實現(xiàn)對冠心病數(shù)據(jù)集的中醫(yī)診斷證型分類。張志順[11]結合中醫(yī)舌象的特點,利用可克服小波卷積濾波因非零軸對稱而導致邊緣重疊現(xiàn)象的改進型小波算法,對舌象圖像邊緣進行檢測,從而解決了傳統(tǒng)邊緣檢測算法對去除噪聲和獲取精細邊緣之間的矛盾,獲得比較理想的邊緣檢測效果。

        2.1.2 組合傳統(tǒng)經典挖掘算法 即撿取兩種或兩種以上數(shù)據(jù)挖掘算法,吸收其算法優(yōu)點,彌補某種算法的不足,以取得更好的挖掘效果。為了提高神經網絡的學習速度和泛化能力,謝錚桂[12]構建的中醫(yī)舌診智能診斷系統(tǒng)采用了一種改進的基于免疫聚類的RBF神經網絡算法,可以通過學習訓練集樣本中每個病例的舌象特征參數(shù),從而得出相應的病證。吳嘉瑞[13]采用關聯(lián)規(guī)則Apriori算法和復雜系統(tǒng)熵聚類等無監(jiān)督數(shù)據(jù)挖掘算法,分析處方中藥物使用頻次及藥物之間的關聯(lián)規(guī)則、處方規(guī)律,探討顏正華教授治療氣滯證的用藥經驗,驗證了其學術思想。吳蕓[14]同樣將組合算法用于舌診研究,考慮到神經網絡優(yōu)化程度受到訓練樣本種類和數(shù)量的限制,其利用遺傳算法尋優(yōu)的特點對神經網絡權值和結構等多方面進行優(yōu)化,使中醫(yī)舌診神經網絡能夠在滿足封閉性的同時也具有良好的開放性,提高其臨床實用能力。

        2.2 引進新的挖掘算法和技術 引入中醫(yī)領域的傳統(tǒng)數(shù)據(jù)挖掘方法多是基于分類、聚類以及關聯(lián)分析等思想,近年除分類聚類之外,一些新型的數(shù)據(jù)挖掘算法也被運用到此領域,包括隨機森林和深度學習等當前熱門算法,以及數(shù)據(jù)挖掘可視化技術等熱門技術,這也是中醫(yī)領域數(shù)據(jù)挖掘發(fā)展的第二個方向。

        2.2.1 隨機森林 隨機森林(RF)是Breiman提出基于統(tǒng)計學習理論的組合分類器算法,此方法是利用bootsrap重抽樣法從原始樣本中隨機抽取自助樣本集,對每個自助樣本集構建決策樹模型,然后組合多棵樹的預測,通過投票輸出最終預測結果[15]。大量實踐證明,隨機森林都有比較好的預測精度及良好的魯棒性,因此隨機森林在中醫(yī)領域得到廣泛應用。洪燕珠[16]利用隨機森林方法對慢性疲勞(CF)進行中醫(yī)癥候要素特征癥狀的提取,得到CF的4個癥候要素癥狀集的模型均達到94%以上,此結果表明隨機森林對CF癥候要素具有良好的分類性能。李雨[17]以中藥藥性為響應變量,基原性狀為預測變量,分別用Logistic回歸、支持向量機、決策樹、隨機森林、主成分-線性判別和偏最小二乘等六種方法建立判別模型,對植物性中藥進行藥性判別,并比較各種模型的判別效果,發(fā)現(xiàn)隨機森林判別分析的準確率和預測準確率均最高。

        2.2.2 深度學習 深度學習是一種新興的多層神經網絡學習算法,又被稱為無監(jiān)督的特征學習。深度學習結構特征是含多隱含層的多層感知器,通過組合低層特征形成更加抽象的高層表示(屬性類別或特征),以發(fā)現(xiàn)數(shù)據(jù)的分布式特征[18]。通過深度學習,可實現(xiàn)復雜函數(shù)的逼近,能夠從少數(shù)樣本集中學習數(shù)據(jù)集本質特征。王立文[19]以慢性胃炎患者中醫(yī)問診數(shù)據(jù)為研究樣本,從挖掘樣本特征之間關系和挖掘類別標簽之間關系兩個角度出發(fā),采用二類相關和深度置信網絡,或深度玻爾茲曼機模型的基于深度學習的多標記學習法,分別建立深度學習和條件隨機場模型,對中醫(yī)慢性胃炎患者問診數(shù)據(jù)進行訓練和預測,得到五個常見指標下的實驗結果符合中醫(yī)理論,明顯優(yōu)于其他常見方法。

        2.2.3 數(shù)據(jù)挖掘可視化 可視化數(shù)據(jù)挖掘技術是可視化技術和數(shù)據(jù)挖掘技術的有機結合,是應用計算機圖形學、圖像處理技術等,將數(shù)據(jù)挖掘的源數(shù)據(jù)、中間結果和最終結果轉換成直觀、易于理解的圖形或圖像的方式,并進行交互處理的理論、方法和技術[20]。可視化數(shù)據(jù)挖掘技術通過觀察數(shù)據(jù)在多重維數(shù)和圖形窗體中的存在狀態(tài),可以直觀、迅速揭示數(shù)據(jù)趨勢和相互聯(lián)系的特點,使其應用頗為廣泛。王玫[21]將可視化數(shù)據(jù)挖掘技術應用于HIS中的電子病歷信息,可以幫助醫(yī)生更直觀更方便地分析和獲得隱藏在病歷數(shù)據(jù)中的信息和規(guī)律。支雅男[22]運用數(shù)據(jù)挖掘方法將中醫(yī)古籍中的龐大數(shù)據(jù)信息進行可視化,以FCA理論為基礎,借助概念格為可視化工具,為《傷寒論》中7個方劑集合構建屬性偏序結構圖,通過此圖可以直觀顯示配伍研究與量效關系研究之間緊密的聯(lián)系。

        2.3 拓展中醫(yī)藥數(shù)據(jù)挖掘的應用領域 第三個趨勢是擴展經典算法在中醫(yī)藥數(shù)據(jù)領域的應用。中醫(yī)領域頗廣,數(shù)據(jù)挖掘可應用的方向很多,也有很多學者將經典且研究很深的挖掘算法引入到中醫(yī)數(shù)據(jù)研究的各個領域。主要有四大方向:一是在中醫(yī)診斷領域,體現(xiàn)在中醫(yī)四診客觀化、中醫(yī)癥候規(guī)范化和中醫(yī)辨證智能化;二是在中藥領域的研究,主要包括方劑藥對和中藥配伍規(guī)律探索、中藥藥性分類判斷、中藥藥效量效分析等;三是中醫(yī)信息學領域,包括中醫(yī)信息處理,中醫(yī)文獻古籍、中醫(yī)醫(yī)案及名老中醫(yī)診療經驗研究;四是中醫(yī)系統(tǒng)平臺研究,包括中醫(yī)輔助診斷系統(tǒng)、中醫(yī)診斷效果評估系統(tǒng),以及基于檢索的中醫(yī)文獻查詢系統(tǒng)研究。關聯(lián)分析在中醫(yī)領域的應用極其廣泛,代治國[23]將關聯(lián)分析中的頻繁模式增長算法(FP-Growth算法)用于中醫(yī)辨證診斷中經驗數(shù)據(jù)挖掘,即從病癥與辨證之間、辨證與處方之間、病癥與處方之間挖掘歸納中醫(yī)專家的辨證規(guī)律并模擬其診斷過程,其結果符合傳統(tǒng)典型的中醫(yī)理論。張潤順[24]通過名老中醫(yī)肝脾不調醫(yī)案,應用關聯(lián)規(guī)則對其治療肝脾不調證的用藥規(guī)律進行分析。李文林[25]將關聯(lián)規(guī)則用于分析明清古籍中疫病文獻的藥-證關系,其結果與中醫(yī)疫病的治法及用藥基本相符,能初步揭示明清醫(yī)家對疫病診療的學術思想和治疫經驗。

        3 結束語

        中醫(yī)的現(xiàn)代化、信息化、智能化是中醫(yī)迅速發(fā)展并走向世界的必行之路。數(shù)據(jù)挖掘技術在中醫(yī)領域的應用,極大地推動了中醫(yī)藥研究的規(guī)范化進程。目前,由于中醫(yī)藥數(shù)據(jù)自身的特殊性,基于此領域的數(shù)據(jù)挖掘研究比較有限,因此中醫(yī)數(shù)據(jù)挖掘有廣闊的研究空間。如何結合中醫(yī)藥數(shù)據(jù)的特點,在算法和技術上有更多突破,以提高挖掘的效率和準確性,同時也將更多熱門算法引入到中醫(yī)相關領域,也是未來研究的關鍵點。

        [1]Han J.W,Kamber M著.范明,孟小峰譯.數(shù)據(jù)挖據(jù):概念與技術[M].第2版.北京:機械工業(yè)出版社,2007:253.

        [2]胡金亮,李建生,李素云.數(shù)據(jù)挖掘技術在中醫(yī)證候研究的應用進展[J].遼寧中醫(yī)雜志,2009,36(1):148-150.

        [3]岳路,馬凌燕,魏本征.基于決策樹算法的小兒肺炎臨床辨證分類模型研究[J].電子測試,2013(5):243-244.

        [4]馬金剛,胡志帥,曹慧,等.基于關聯(lián)規(guī)則挖掘的方劑配伍規(guī)律初步研究[J].中國實驗方劑學雜志,2013,19(7):351-353.

        [5]郜巒,李鋒剛.基于聚類分析的新安醫(yī)家防治中風辨治規(guī)律探索[J].中國中醫(yī)藥信息雜志,2007,14(12):92.

        [6]楊濤,吳承玉.基于人工神經網絡的心系基礎證診斷模型構建[J].中國中醫(yī)基礎醫(yī)學雜志,2013,19(9):765-766.

        [7]謝家宇,蔡坤寶.基于連續(xù)小波變換的中醫(yī)脈象信號處理[J].生物醫(yī)學工程學雜志,2004,21(3):469-472.

        [8]馬健,盛魁.基于改進的貝葉斯網絡算法在中醫(yī)醫(yī)案中的應用研究[J].惠州學院學報,2013,33(3):52-56.

        [9]趙丹丹.Apriori算法改進及其在中藥知識發(fā)掘中的應用[J].計算機與現(xiàn)代化,2007(8):23-25.

        [10]高麗君.面向缺失數(shù)據(jù)的變精度粗糙集決策樹分類算法研究[D].大連海事大學,2013.

        [11]張志順.改進的小波變換在中醫(yī)舌象邊緣檢測中的研究 [J].計算機工程與應用,2012,48(35):135-138.

        [12]謝錚桂,韋玉科,鐘少丹.基于免疫聚類的RBF神經網絡在中醫(yī)舌診診斷中的應用[J].計算機應用與軟件,2009,26(4):42-43.

        [13]吳嘉瑞,郭位先,張冰,等.基于關聯(lián)規(guī)則和復雜系統(tǒng)熵聚類的顏正華治療氣滯證用藥規(guī)律研究 [J].中國中醫(yī)基礎醫(yī)學雜志,2013,19(9):837-839.

        [14]吳蕓,周昌樂,張志楓.中醫(yī)舌診神經網絡的優(yōu)化遺傳算法[J].計算機應用研究,2007,24(9):50-52.

        [15]Breiman L.Random forests[J].Machine learning,2001,45(1):5-32.

        [16]洪燕珠,周昌樂,張志楓,等.基于隨機森林法的慢性疲勞證候要素特征癥狀的選擇[J].中醫(yī)雜志,2010,51(7):634-638.

        [17]李雨.基于植物性中藥基原性狀藥性判別模型的比較[D].山東大學,2011.

        [18]孫志軍,薛磊,許陽明,等.深度學習研究綜述[J].計算機應用研究,2012,29(8):2 806-2 810.

        [19]王立文.基于深度學習與條件隨機場的多標記學習方法的中醫(yī)問診建模研究[D].華東理工大學,2013.

        [20]張俊.可視化數(shù)據(jù)挖掘技術的研究與實現(xiàn)[J].重慶工商大學學報.自然科學版,2013,30(3):58-61.

        [21]王玫,張?zhí)m華,張月東.電子病歷中可視化數(shù)據(jù)挖掘技術的應用[J].微計算機信息,2011,27(7):239-240.

        [22]支雅男.《傷寒論》中藥配伍量效群結構知識發(fā)現(xiàn)方法研究[D].燕山大學,2013.

        [23]代治國.關聯(lián)規(guī)則挖掘在中醫(yī)辨證診斷中的應用研究[D].哈爾濱工程大學,2007.

        [24]張潤順,周雪忠,姚乃禮,等.基于關聯(lián)規(guī)則挖掘肝脾不調證中藥配伍規(guī)律研究[J].中國中醫(yī)藥信息雜志,2010,17(2):97-99.

        [25]李文林,屠強,彭麗坤,等.基于關聯(lián)規(guī)則分析明清古籍中疫病文獻的藥-癥關系[J].時珍國醫(yī)國藥,2010,21(4):957-959.

        Research Progress of Data M ining A lgorithm in Traditional Chinese M edicine

        ZHANG Xin,ZHU M ing-feng,DU Jian-qiang,HAO Zhu-lin,WANG Guo-long
        School of Computer Science,JiangxiUniversity of Traditional Chinese Medicine,Nanchang 330004,China.

        With the arrival of the era of big data and the rise of data mining techniques,traditional Chinese medicine data mining gradually becomes popular.This articlemade a system summary of the datamining,putemphasis on the detailed trend analysis of the research progress of traditional Chinesemedicine datamining,and sorted the relevantmethods,which provided an important reference value of literature for the relevant research workers on traditional Chinesemedicine datamining.

        Datamining;Traditional Chinese Medicine;Decision tree;Random forest;Deep learning

        R2-03

        A

        2014-03-11)編輯:萬崇毅

        江西省教育廳青年基金項目(GJJ12539);江西省衛(wèi)生廳中醫(yī)藥科研計劃項目(2013A060);江西中醫(yī)藥大學重點學科青年教師培養(yǎng)資助計劃項目(2013jzzdxk019)。

        **通信作者:杜建強。E-mail:jianqiang_du@163.com。

        猜你喜歡
        數(shù)據(jù)挖掘中醫(yī)藥算法
        中醫(yī)藥在惡性腫瘤防治中的應用
        中醫(yī)藥在治療惡性腫瘤骨轉移中的應用
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于MapReduce的改進Eclat算法
        Travellng thg World Full—time for Rree
        進位加法的兩種算法
        從《中醫(yī)藥法》看直銷
        基于并行計算的大數(shù)據(jù)挖掘在電網中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        中醫(yī)藥立法:不是“管”而是“促”
        一種改進的整周模糊度去相關算法
        日本一区二区在线播放观看| 国产精品欧美一区二区三区| 乱人伦视频中文字幕| 亚洲AV肉丝网站一区二区无码 | 亚洲人妻中文字幕在线视频| 男女动态视频99精品| 久草青青91在线播放| 内射人妻视频国内| 女人色毛片女人色毛片18| 亚洲国模一区二区三区视频| 中文字幕视频一区二区| 国产在线高清理伦片a| 久久精品无码一区二区三区免费| 日韩无套内射视频6| 91精品国产91久久久无码95| 精品自拍偷拍一区二区三区| 精品人妻码一区二区三区剧情| 四川发廊丰满老熟妇| 中文字幕福利视频| 国产在线观看不卡网址| 久久九九精品国产av| 久久精品国产精油按摩| 亚洲一区欧美二区| 久久亚洲精品一区二区| 日韩三级一区二区三区| 天美传媒一区二区| 中文字幕国产欧美| 亚洲精品天堂在线观看| 亚洲精品中文字幕91| 在办公室被c到呻吟的动态图| 亚洲男同志网站| 无码国产日韩精品一区二区| 国产精品一区二区三区av在线| 国产精品久久精品第一页| 欧美巨大xxxx做受中文字幕| 中文亚洲成a人片在线观看| 国产老熟女精品一区二区| 亚洲国产成人av在线观看| 狠狠色狠狠色综合| 久久五月精品中文字幕| 日韩精品人妻中文字幕有码|