亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        最大熵在中醫(yī)智能辨證的研究及其應用

        2015-04-29 01:36:49葉培
        計算機時代 2015年3期
        關鍵詞:中醫(yī)辨證

        葉培

        摘 要: 分析了中醫(yī)臨床記錄中癥狀與癥候類別之間的關系,將機器學習中的最大熵原理應用于中醫(yī)辨癥中,建立相應的分類模型,從而觀察類別預測的正確性,為中醫(yī)智能診斷提供初篩和決策支持。同時,將基于最大熵的分類器和基于樸素貝葉斯的分類器進行比較,結果顯示,基于最大熵的分類效果勝過樸素貝葉斯分類。這表明將最大熵原理以及算法應用在中醫(yī)診斷是可行的。

        關鍵詞: 中醫(yī)臨床記錄; 最大熵; TCM; 中醫(yī)辨證

        中圖分類號:TP311.1 文獻標志碼:A 文章編號:1006-8228(2015)03-50-04

        Abstract: The relationship between clinical medicine symptoms and symptoms categories of records are analyzed. The principle of maximum entropy in machine learning is applied to the TCM syndrome. The corresponding classification model is established to observe the category and forecast category correctness. Intelligent diagnosis for TCM is provided to support the screening and decision support. Compared with the simple Bayesian classifier, the experimental results show that the maximum entropy classification is more effective than Naive Bayes. This suggests that the maximum entropy principle and the algorithm are feasible in the classification of traditional Chinese medicine.

        Key words: the doctor of traditional Chinese medicine clinical record; maximum entropy; TCM; syndrome differentiation

        0 引言

        隨著信息化和科技化的發(fā)展,實現(xiàn)中醫(yī)現(xiàn)代化這一進程刻不容緩,中醫(yī)診斷智能化是實現(xiàn)中醫(yī)現(xiàn)代化的重要部分,而在中醫(yī)診斷智能化中,必須解決的核心問題和關鍵技術就在于中醫(yī)智能辨證[1-2]。中醫(yī)辨證是需要經(jīng)歷由癥狀等信息,診斷出病,再考慮用藥這一過程,該過程有非線性、模糊性和復雜性等特點,由此產(chǎn)生的數(shù)據(jù)有不規(guī)范化性和模糊性等特征,如果單純的由人工對這龐大數(shù)據(jù)進行分類分析,就難以保證對全部中醫(yī)相關信息的綜合考量。

        數(shù)據(jù)挖掘本身就是通過分析數(shù)據(jù),從海量數(shù)據(jù)中挖掘出潛在的客觀規(guī)律或隱藏的有用信息,這一特點使其能夠成為能從中醫(yī)海量數(shù)據(jù)中挖掘相關信息的主要技術之一,基于此,我們將研究如何使用數(shù)據(jù)挖掘技術來實現(xiàn)中醫(yī)的智能辨證。

        中醫(yī)辨證的診斷過程,實質上是由中醫(yī)臨床記錄收集到的各種癥狀,通過分析,預估證型的過程,其過程相當于分類,因此我們可以采用數(shù)據(jù)挖掘中的分類方法來解決。關于分類方法有兩類模型,一類是生成模型(假設給定證型,由哪些相關癥狀得出證型),另一類是判別模型(通過給定相關癥狀來得出證型),它們是分別從不同視角來解決分類問題的。最大熵是屬于判別模型中的一種,現(xiàn)已被廣泛用于文本分類中,但實際應用于中醫(yī)智能辨證的研究還很少。因此我們選用最大熵對其進行中醫(yī)癥候的分類,對其進行相關實驗研究及其分析,從而為中醫(yī)智能診斷決策提供一次初篩。

        1 最大熵原理應用

        最大熵原理是由E.T. Jaynes在1957年提出來的。其主要思想是,在只掌握關于未知分布的部分知識,應該選取符合這些知識但熵值最大的概率分布[3],因為在這種情況下,符合已知知識的概率分布可能不止一個,而熵定義的實際最大熵原理指出,我們需要對一個隨機事件的概率分布進行預測時,預測應當滿足已知的條件,而對未知的情況不要作任何主觀假設,在這種情況下,條件概率分布最均勻,預測的風險最小,此時預測模型在滿足約束條件下的信息熵最大[4]。

        1.1 最大熵算法應用于中醫(yī)辨證的可行性

        最大熵在不同的領域有不同的表現(xiàn)形式,其靈活性很強。在中醫(yī)智能辨證中,我們希望通過給定的癥狀、特征,來得出它屬于哪類證型,但這一結果并沒有一個明確的標準,所以通過引入最大熵原理,使用最大熵算法優(yōu)化,可以使其結果最符合實際情況。

        其次,癥狀與癥狀之間的相關性,以及約束性,對判別癥候有一定的作用,這與最大熵在約束條件下求解有一些相似。

        1.2 最大熵簡介

        針對中醫(yī)辨證,如果想知道在給出癥狀x的前提下,判別屬于某證型y的概率,最基本的方法就是通過語料集對其進行概率統(tǒng)計。給定一個訓練集,X為癥狀集,Y為證型集,count(xi,yj)為訓練集中出現(xiàn)的次數(shù),其概率估計為:

        但是這個概率統(tǒng)計存在一個問題,即便存在很大的病例集,但很多(xi,yj)像某癥狀對應某證型這種情況卻沒有出現(xiàn),武斷地認為它不存在,這是不可取的。針對這個問題,最大熵采取的辦法是使其滿足已知的約束條件,對其未知情況不作任何主觀假設,使其分布平均。例如,寒邪客胃證,飲食傷胃證,脾胃虛寒證這三類證型,如果已知,出現(xiàn)“胃痛”這個癥狀時,60%的概率屬于飲食傷胃證,對于“胃痛”這個癥狀在其他兩類證型中的概率未知。由最大熵原理推測,如果我們給出一訓練集,其中包含“胃痛”這個癥狀,認為這個訓練集屬于飲食傷胃證的概率為0.6,屬于其他兩類證型的概率分別是0.2;在給出的訓練集中如果不包含“胃痛”這個癥狀,那么認為訓練集分別以相同的概率屬于每個證型,這就是最大熵在滿足已知條件的情況下,使未知事件盡可能平均分布。

        1.3 數(shù)據(jù)預處理

        實驗數(shù)據(jù)由成都中醫(yī)藥大學提供,有效病例2597例,其預處理過程如下。

        ⑴ 規(guī)范癥狀表

        由于臨床醫(yī)生的不同,收集到的病情資料,其表述也會極不相同,對于用不同的命名規(guī)則及術語表達的數(shù)據(jù),是不容易進行量化分析的,因此需要在實驗開始階段就對疾病癥狀等命名進行規(guī)范[5] 。本文進行實驗的病例數(shù)據(jù)中,一共有2000多種癥狀。

        ⑵ 規(guī)范病例表

        在臨床醫(yī)生錄入病例過程中,由于個人經(jīng)驗不同造成病情癥狀描述不一,因此對其病例也需要進行規(guī)范化處理[5]。其中證型大約有269種。

        ⑶ 建立符合實驗的規(guī)范證型癥狀表

        由于訓練模型時,采用的是“證型/癥狀集”的文本格式,所以需要根據(jù)規(guī)范化的癥狀表與病例表,建立新的證型癥狀表。

        ⑷ 特征選取

        經(jīng)過規(guī)范化后的處理,其中一些特征對癥候分類是很有用的,而另一些可能是噪聲數(shù)據(jù),會對癥候分類產(chǎn)生干擾,因此,我們需要對其癥狀進行特征選取操作,將其含有信息量少的癥狀和噪聲數(shù)據(jù)過濾掉,從而提高癥候分類的正確性或有用性。

        數(shù)據(jù)經(jīng)過預處理后,再進行癥候分類初篩。

        2 實驗結果與分析

        數(shù)據(jù)挖掘中的樸素貝葉斯被廣泛應用在中醫(yī)辨證的研究中,并取得了比較好的成果,基于此原因,我們使用樸素貝葉斯和最大熵進行實驗對比。

        樸素貝葉斯分類從中醫(yī)臨床記錄中的特征與中醫(yī)癥候類別之間的生產(chǎn)關系的角度出發(fā),通過發(fā)現(xiàn)包含于中醫(yī)臨床記錄中的診斷原則,達到輔助診斷的目的,也就是說,發(fā)現(xiàn)中醫(yī)癥候類別與臨床記錄診斷特征向量之間的定量關系。

        2.1 實驗數(shù)據(jù)集

        為避免特征訓練和預測的隨機性,采用交叉驗證方法預測平均值,將數(shù)據(jù)集分成十份,隨機采用九份樣本用于訓練,剩余的一份樣本用于預測并計算正確率和召回率。交叉驗證過程中經(jīng)歷10次訓練,準確率和召回率分別取其平均值。

        2.3 實驗結果

        樸素貝葉斯在進行癥候分類時,從癥候類別與癥狀的定量關系出發(fā),假設以癥狀之間是相互獨立的為前提,這在實際中醫(yī)辨證中是不切實際的,同時它通過計算先驗概率和類條件概率來進行,但是當訓練集中“胃痛”這個癥狀出現(xiàn)的次數(shù)很低時,則容易出現(xiàn)稀疏性問題,計算出的概率非常小,在實際癥候分類預測過程中,會很大程度影響預測結果。而最大熵會避免出現(xiàn)這種問題,根據(jù)最大熵模型訓練,求出每個癥狀對應證型的最優(yōu)參數(shù)值,然后再根據(jù)給出的“胃痛”,“畏寒”,“苔薄白”等癥狀,計算出概率及預測癥候類別。最大熵預測有60%的可能性屬于寒邪客胃證,20%的可能性屬于飲食傷胃證,20%的可能性屬于脾胃虛寒證。雖然這樣的預測會有一些偏差,但毫無疑問,可以為中醫(yī)臨床診斷提供重要的決策支持。此外,由于給出的訓練集,可能同時屬于不同類的證型,相對于樸素貝葉斯,最大熵模型更適于多類別識別,所以在中醫(yī)癥候分類上采用最大熵模型。

        3 結束語

        通過上述實驗的樸素貝葉斯和最大熵進行中醫(yī)證型類別的初篩,取得了比較好的實驗效果。但是由于上述實驗中進行中醫(yī)癥候分類采用的是人工的結構化的臨床記錄數(shù)據(jù),而采用人工來記錄這些數(shù)據(jù)耗時又費力,同時也會使得大量的中醫(yī)臨床記錄數(shù)據(jù)不能被有效地利用。所以下一步工作是,通過對原始自由文本的臨床記錄進行處理而得到的癥狀來進行分類,使其適合于中醫(yī)臨床記錄的數(shù)據(jù)挖掘和知識發(fā)現(xiàn),提高證型初篩的正確性。

        參考文獻:

        [1] 劉意.21世紀中醫(yī)中藥面臨的機遇與挑戰(zhàn)再思考[D].華中師范大學,

        2013.

        [2] 施明輝.面向中醫(yī)辨證計算的粗糙集知識獲取方法及其應用研究[D].

        廈門大學,2008.

        [3] 趙偉,趙法心等.一種基于改進的最大熵模型的漢語詞性自動標注的

        新方法[C].中國計算機學會.2006.

        [4] 張奇.基于信息熵的Web信息抽取技術研究[D].廣東工業(yè)大學,

        2013.

        [5] 宋燕等.基于文本挖掘詞頻反文檔頻率方法的疾病癥狀權重挖掘研

        究[J].成都信息工程學院學報,2014.

        [6] 酈永平,溫淑云.中醫(yī)證候量化研究的理論探討[J].中醫(yī)雜志,2008.8:

        677-679

        [7] 朱海峰,陳雪功.中醫(yī)診斷客觀化研究的現(xiàn)狀和展望[J].甘肅中醫(yī),

        2007.6:10-13

        [8] 王慶華,唐甜,王清青,劉雅瓊,林輝,黃國榮,熊鴻燕.小兒常見發(fā)熱出

        疹性疾病智能診斷模型研究[J].第三軍醫(yī)大學學報,2011.23:2471-2475

        [9] Zhang NL, Yuan S,Wang Y.Latent. Tree models and diagnosis in

        traditional Chinese medicine.Artif Intell Med,2008.42:229-245

        [10] 王毅杰,王海笑,楊濤.基于貝葉斯算法的手機在線中醫(yī)疾病診斷研

        究[J].軟件導刊,2010,12:97-99

        [11] 余江維,馬利莊,楊華元.中醫(yī)智能化診斷的研究現(xiàn)狀與展望[J].遼寧

        中醫(yī)雜志,2010.1:50-53

        [12] 許朝霞,王憶勤,顏建軍等.基于支持向量機和人工神經(jīng)網(wǎng)絡的心血

        管疾病中醫(yī)證候分類識別研究[J].北京中醫(yī)藥大學學報,2011.34(8):539-543

        [13] 李江平,潘保昌,韋玉科.兩層級神經(jīng)網(wǎng)絡及在中醫(yī)智能診斷中的應

        用[J].計算機應用研究,2008.10:3169-3170,3173

        [14] 鐘昌樂,鐘勇,李寧.基于BP神經(jīng)網(wǎng)絡的畜禽疾病診斷專家系統(tǒng)的

        設計與實現(xiàn)[J].現(xiàn)代計算機(專業(yè)版),2010.4:23-26

        [15] 王毅杰,王海笑,楊濤.基于貝葉斯算法的手機在線中醫(yī)疾病診斷研

        究[J].軟件導刊,2010.12:97-99

        [16] Yaqiang Wang, Zhonghua Yu, Li Chen, Yunhui Chen, Yiguang

        Liu, Xiaoguang Hu,Yongguang Jiang. Supervised methods for symptom name recognition in free-text clinical records of traditional Chinese medicine: An empirical study. Journal of biomedical informatics,2013.

        猜你喜歡
        中醫(yī)辨證
        中醫(yī)辨證治療小兒肺炎的治療療效
        中醫(yī)辨證治療心脾兩虛型失眠的臨床研究
        中醫(yī)辨證治療月經(jīng)后期伴量少臨床效果研究
        基于過敏性鼻炎的中醫(yī)辨證規(guī)律及小青龍湯加味治療的臨床研究
        中西醫(yī)結合治療神經(jīng)外科術后發(fā)熱56例療效觀察
        中醫(yī)治療老年慢性阻塞性肺病現(xiàn)況淺析
        今日健康(2016年12期)2016-11-17 14:48:20
        老年原發(fā)性高血壓應用中醫(yī)辨證方案治療臨床體會
        今日健康(2016年12期)2016-11-17 11:52:36
        中醫(yī)辨證治療腦血管所致癡呆療效觀察及評估
        慢性腎炎采用中醫(yī)辨證治療的臨床效果觀察
        慢性支氣管炎肺氣腫中醫(yī)辨證治療效果觀察
        久久久精品人妻久久影视| 少妇精品偷拍高潮少妇在线观看| 久久精品亚洲精品国产区| 久久国产精品一区二区三区| 色诱视频在线观看| 日本大尺度吃奶呻吟视频| 亚洲av不卡电影在线网址最新| 青青草原综合久久大伊人| 久久精品国产99精品国偷| 欧美在线Aⅴ性色| 国产影院一区二区在线| 在线视频观看国产色网| 免费人成视频x8x8入口| 国产免费又色又爽又黄软件| 激情亚洲的在线观看| 久久午夜一区二区三区| 午夜秒播久久精品麻豆| 亚洲avav天堂av在线网毛片| 色妺妺视频网| 国产高清亚洲精品视频| 亚洲国产精品av麻豆网站| 国产av天堂亚洲国产av天堂| 香蕉视频在线精品视频| 国产一级黄色录像| 日韩人妖一区二区三区| 富婆猛男一区二区三区| 欧美video性欧美熟妇| 无码h黄动漫在线播放网站| 亚洲国产精品久久久久婷婷软件| 日本一区二区三级免费| 午夜精品久久久久久久| 日本熟妇色xxxxx欧美老妇| 成人午夜视频一区二区无码| 精品午夜中文字幕熟女| 在线播放av不卡国产日韩| 精品久久香蕉国产线看观看亚洲| 99久久久精品免费香蕉| 国内偷拍视频一区二区| 人妻少妇进入猛烈时中文字幕| 高潮又爽又无遮挡又免费| 精品不卡久久久久久无码人妻 |