亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LDA主題模型和關(guān)聯(lián)規(guī)則的冠心病方劑組方規(guī)律分析

        2018-05-30 07:26:49李四海陳建國(guó)呂曉云
        新中醫(yī) 2018年6期
        關(guān)鍵詞:方劑證型關(guān)聯(lián)

        李四海,陳建國(guó),呂曉云

        1.甘肅中醫(yī)藥大學(xué),甘肅 蘭州 730000;2.蘭州大學(xué)基礎(chǔ)醫(yī)學(xué)院中西醫(yī)結(jié)合研究所,甘肅 蘭州 730000

        冠心病是冠狀動(dòng)脈性心臟病的簡(jiǎn)稱,是由于冠狀動(dòng)脈血管發(fā)生動(dòng)脈粥樣硬化病變而引起血管腔狹窄或阻塞,造成心肌缺血、缺氧或壞死而導(dǎo)致的心臟病,屬于中醫(yī)學(xué)胸痹、心痛、真心痛等范疇,胸痹、心痛的基本病機(jī)為本虛標(biāo)實(shí),根本原因在于心氣鼓動(dòng)無(wú)力,至痰濁、瘀血互結(jié),內(nèi)阻心脈,不通則痛,以氣虛為本,血瘀為標(biāo)。中醫(yī)治療冠心病能改善心肌缺血缺氧、保護(hù)心肌結(jié)構(gòu),明顯改善患者臨床癥狀,減少冠心病心絞痛復(fù)發(fā)頻率,具有顯著療效[1]。

        潛狄利克雷分配(Latent dirichlet allocation,LDA)模型是由Blei DM等[2]提出的針對(duì)文本集建模的三層貝葉斯概率主題模型,由詞、主題、文本三層構(gòu)成。由于主題數(shù)通常遠(yuǎn)小于文檔維度,LDA主題模型通過(guò)建立文本的概率主題分布,能夠同時(shí)實(shí)現(xiàn)對(duì)高維文本的潛語(yǔ)義分析和低維表達(dá),從而有效提高大型文本的聚類(lèi)和分類(lèi)效率。將主題模型中的文本、詞、主題分別與中醫(yī)藥中的方劑、藥物和方劑主治證型相對(duì)應(yīng),就能夠方便地實(shí)現(xiàn)對(duì)中醫(yī)藥方劑的潛語(yǔ)義分析,得到方劑在證型空間的概率表示及所有藥物被分配至不同證型的概率分布,通過(guò)對(duì)每個(gè)證型主題中概率取值較大的藥物進(jìn)行分析,能夠發(fā)現(xiàn)不同證型在遣方用藥方面的差異,進(jìn)一步揭示方證之間的對(duì)應(yīng)關(guān)系。近年來(lái),LDA主題模型被逐步引入中醫(yī)藥研究領(lǐng)域[3~5],通過(guò)提取癥狀或方劑隱含主題,并將主題與證型相關(guān)聯(lián),為癥-證及方-證相關(guān)性分析提供了新的研究思路。

        基于數(shù)據(jù)挖掘方法分析冠心病方劑用藥規(guī)律已有相關(guān)報(bào)道[6~8],關(guān)聯(lián)規(guī)則分析被廣泛用于中醫(yī)藥領(lǐng)域,通過(guò)設(shè)置支持度和置信度可以發(fā)現(xiàn)藥物和證型之間的知識(shí)和推理規(guī)則。關(guān)聯(lián)規(guī)則分析的優(yōu)點(diǎn)是方法簡(jiǎn)單、結(jié)果直觀,缺點(diǎn)是僅僅通過(guò)統(tǒng)計(jì)藥物出現(xiàn)頻次分析藥物之間的關(guān)聯(lián)性,無(wú)法反映中醫(yī)方劑的潛在語(yǔ)義。本研究收集冠心病方劑356首,涉及中藥318味,建立冠心病方劑數(shù)據(jù)庫(kù),綜合運(yùn)用關(guān)聯(lián)規(guī)則分析和LDA主題模型,分別從藥物關(guān)聯(lián)性及方劑主題隱含語(yǔ)義兩個(gè)角度,對(duì)冠心病方劑進(jìn)行挖掘,總結(jié)治療冠心病方劑的用藥規(guī)律,為中醫(yī)臨床治療冠心病提供新的思路和依據(jù)。

        1 資料與方法

        1.1 處方來(lái)源與規(guī)范化 收集整理《金匱要略》、《太平惠民和劑局方》、《醫(yī)林改錯(cuò)》、《廣濟(jì)方》、《冠心病良方大全》[9]中冠心病方劑及中國(guó)知網(wǎng)、萬(wàn)方數(shù)據(jù)庫(kù)知識(shí)服務(wù)平臺(tái)、維普中文期刊服務(wù)平臺(tái)等在線數(shù)據(jù)庫(kù)相關(guān)論文中所涉及的冠心病方劑,共得到有效方劑356首,建立冠心病方劑數(shù)據(jù)庫(kù),錄入包括序號(hào)、方名、組成、用量、主治功效等方劑信息。為避免錄入中藥因炮制、別名不同對(duì)數(shù)據(jù)分析結(jié)果的影響,對(duì)藥名進(jìn)行了統(tǒng)一規(guī)范化處理。如天門(mén)冬錄為天冬,麥門(mén)冬錄為麥冬,瓜蔞子、瓜蔞皮、瓜蔞實(shí)、瓜蔞仁、全瓜蔞均錄為瓜蔞,川郁金錄為郁金,炒酸棗仁錄為酸棗仁。由于甘草與炙甘草功效區(qū)別較大,將甘草、生甘草統(tǒng)一錄為甘草,炙甘草單獨(dú)錄入。

        1.2 數(shù)據(jù)挖掘方法與軟件 使用關(guān)聯(lián)規(guī)則算法和LPA主題模型對(duì)冠心病方劑進(jìn)行挖掘。關(guān)聯(lián)規(guī)則算法使用WEKA3.8.1中的Apriori算法[10],LDA主題模型則在基于JAVA語(yǔ)言編寫(xiě)的開(kāi)源軟件開(kāi)發(fā)包JGibbLDA中實(shí)現(xiàn)[11]。

        1.2.1 關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則挖掘方法是一種基于頻次的統(tǒng)計(jì)分析方法,通過(guò)支持度、置信度及提升度等指標(biāo)來(lái)度量規(guī)則的有效性及強(qiáng)弱程度。支持度的定義如下:sup(A?B)=P(A∪B)。支持度是一個(gè)概率值,是同時(shí)出現(xiàn)藥物A和藥物B的方劑數(shù)占方劑總數(shù)的比例,支持度衡量了規(guī)則的有用性。置信度的定義為置信度是一個(gè)條件概率值,是在所有出現(xiàn)藥物A的方劑中,同時(shí)出現(xiàn)藥物A和藥物B的方劑數(shù)所占的比例。置信度反映了規(guī)則的確定性。提升度的定義為提升度用來(lái)度量藥物之間的相關(guān)性,當(dāng)lift>1時(shí),二者正相關(guān);當(dāng)lift<1時(shí),二者負(fù)相關(guān);lift=1時(shí),二者相互獨(dú)立。

        1.2.2 LDA主題模型 LDA主題模型是一種三層的貝葉斯產(chǎn)生式有向概率圖模型,主要用于文本降維、聚類(lèi)和分類(lèi)。LDA模型假設(shè)文檔集包含多個(gè)主題,這些主題為所有文檔所共享,每個(gè)文檔由多個(gè)主題所構(gòu)成,每個(gè)主題則由文檔集中的詞所表達(dá)。文檔-主題和主題-詞分布分別服從超參數(shù)為α和β的多項(xiàng)分布,α和β均代表先驗(yàn)知識(shí),α反映了文檔集中隱含主題之間的相對(duì)強(qiáng)弱,α越大,主題越趨向于均勻分布;β刻畫(huà)了詞在主題上的概率分布。α和β的經(jīng)驗(yàn)取值一般為α=50/K,β=0.01,其中K為設(shè)定的主題數(shù)。

        2 結(jié)果

        2.1 藥物頻次分析 納入分析的356首治療冠心病的方劑中共涉及中藥318味,藥物出現(xiàn)總頻數(shù)3 557次,其中使用頻數(shù)最高的是丹參,共使用203次,頻數(shù)超過(guò)30次的藥物如表1所示。結(jié)果顯示冠心病方劑常用藥物主要以補(bǔ)益藥、活血化瘀藥、祛痰藥為主,兼顧理氣藥、化痰藥、溫里藥的使用。既有益氣養(yǎng)血之黨參、黃芪、炙甘草、白術(shù)、人參,又有養(yǎng)陰之麥冬、五味子、白芍,安神之酸棗仁,活血化瘀之丹參、當(dāng)歸、川芎、赤芍、桃仁、紅花、延胡索,化痰之瓜蔞、陳皮,溫里之制附子、桂枝。

        表1 使用頻次超過(guò)30次的藥物

        2.2 關(guān)聯(lián)規(guī)則分析 在WEKA3.8.1中調(diào)用Apriori算法,設(shè)定支持度閾值為5%,即只統(tǒng)計(jì)頻次超過(guò)18次的藥物之間的關(guān)聯(lián)性,Delta為0.05,置信度閾值為0.9,共得到23條藥物之間的關(guān)聯(lián)規(guī)則。一般認(rèn)為,提升度越大,藥物之間的關(guān)聯(lián)性越強(qiáng),得到的關(guān)聯(lián)規(guī)則越有價(jià)值[12]。對(duì)以上規(guī)則按照提升度的大小進(jìn)行篩選,表2列出了提升度值較大的前12條藥物關(guān)聯(lián)規(guī)則。

        表2 冠心病方劑藥物關(guān)聯(lián)規(guī)則

        2.3 方劑潛語(yǔ)義分析 《金匱要略·胸痹心痛短氣病脈證治》曰:“夫脈當(dāng)取太過(guò)不及,陽(yáng)微陰弦,即胸痹而痛。所以然者,責(zé)其極虛也。今陽(yáng)虛知在上焦,所以胸痹、心痛者,以其陰弦故也?!标?yáng)微為本虛,陰弦為標(biāo)實(shí)。虛性證候以血虛、氣虛、陰虛、陽(yáng)虛為主,實(shí)性證候以血瘀、痰濁、寒凝較為常見(jiàn)[13]。氣虛血瘀證為冠心病最常見(jiàn)的證型。將冠心病常見(jiàn)證型與方劑隱含主題相對(duì)應(yīng),建立冠心病方劑的LDA主題模型,對(duì)方劑進(jìn)行潛在語(yǔ)義分析。

        LDA主題模型的參數(shù)設(shè)置如下:主題數(shù)K=3,α=50/K=16.7,β=0.05,迭代次數(shù)為2 000。LDA主題模型通過(guò)蒙特卡洛吉布斯采樣算法,為每一味中藥采集主題,當(dāng)馬爾可夫鏈?zhǔn)諗繒r(shí),就得到了所有藥味的主題分布,利用得到的藥物主題分布可方便地計(jì)算出方劑主題和主題藥物兩個(gè)概率分布,最終將方劑映射到主題空間,3個(gè)主題中概率值較大的前10味中藥分別為:主題1:川芎、黃芪、赤芍、瓜蔞、法半夏、紅花、枳殼、三七、薤白、陳皮;主題2:當(dāng)歸、麥冬、茯苓、黨參、五味子、人參、白術(shù)、柴胡、酸棗仁、黃連;主題3:丹參、炙甘草、桂枝、黃芪、郁金、制附子、延胡索、白芍、細(xì)辛、澤瀉。將每一個(gè)主題與方劑主治證型相對(duì)應(yīng),則主題中概率值較大的藥物即為該證型對(duì)應(yīng)的核心藥物。通過(guò)對(duì)主題中核心藥物的分析,可以發(fā)現(xiàn)不同證型冠心病在用藥方面的差異。圖1顯示了所有318味中藥在主題1上的概率分布。結(jié)果顯示,主題1上不同藥物的概率值具有非常大的差異,說(shuō)明LDA主題模型較好地提取了藥物的語(yǔ)義。在概率值較大的前10味藥中,黃芪為補(bǔ)氣圣藥,具有補(bǔ)氣升陽(yáng)、益衛(wèi)固表的功效。赤芍養(yǎng)血和血,破血行瘀,《別錄》言赤芍能“通順血脈,緩中,散惡血,逐賊血”,川芎為血中之氣藥,辛香行散,溫通血脈,上走下達(dá),活血行氣,行血之中以和血,行氣之中以散郁。二者相伍,則行血而不破血,補(bǔ)血而不滯血,《本草匯言》謂“川芎,上行頭目,下調(diào)經(jīng)水,中開(kāi)郁結(jié),血中氣藥”,配伍組合,可除瘀血心痛。紅花、三七活血化瘀止痛,瓜蔞滌痰散結(jié),寬胸理氣,調(diào)暢血脈,通達(dá)陽(yáng)氣,與薤白相伍,辛散能助陽(yáng)氣以行,苦降能滌痰散瘀,二藥相用,滌痰之中能通陽(yáng),散瘀之中能通脈,走心竅而除痹,兼療痰中有瘀、瘀中有痰之胸痹。枳殼、陳皮開(kāi)提氣結(jié),理氣寬胸。以主治證型作為方劑隱含主題,結(jié)合以上分析,可以推斷主題1所對(duì)應(yīng)的冠心病證候極有可能為氣虛血瘀證[14~15]。

        圖1 所有藥物在主題1上的概率分布

        3 討論

        本研究建立了冠心病方劑數(shù)據(jù)庫(kù),基于WEKA3.8.1數(shù)據(jù)挖掘平臺(tái)及JGibbLDA主題模型軟件對(duì)冠心病方劑數(shù)據(jù)庫(kù)進(jìn)行挖掘。結(jié)果顯示使用頻率最高的前10味藥分別為:丹參、黃芪、川芎、炙甘草、當(dāng)歸、麥冬、桂枝、茯苓、赤芍、瓜蔞。其中丹參、川芎、當(dāng)歸、赤芍為活血化瘀藥,黃芪、灸甘草為補(bǔ)氣藥,麥冬為養(yǎng)陰藥,桂枝溫陽(yáng)通陽(yáng),茯苓健脾滲濕。以上藥物以益氣藥、活血化瘀藥為主,兼用健脾補(bǔ)氣、祛痰理氣及養(yǎng)陰藥物,這與目前臨床上治療冠心病的基本方法十分吻合。其中使用頻次最高的丹參具有活血祛瘀、通經(jīng)止痛、清心除煩、涼血消癰之功效。使用頻次排在第2位的黃芪為補(bǔ)氣圣藥。中醫(yī)學(xué)認(rèn)為,氣血同源,用黃芪可補(bǔ)氣養(yǎng)血,起到祛瘀散結(jié)之效?,F(xiàn)代藥理研究表明,黃芪有擴(kuò)張血管、降壓、強(qiáng)心、提高心肌耐缺氧能力、抗心肌缺血、鎮(zhèn)痛等作用,是治療冠心病心絞痛最常用的藥物之一。關(guān)聯(lián)規(guī)則挖掘方法共得到12個(gè)相關(guān)性較強(qiáng)的藥物組合,這些藥物大多為冠心病經(jīng)典方劑的核心藥物,如生脈散、瓜蔞薤白半夏湯、桃紅四物湯、血府逐瘀湯等。

        運(yùn)用LDA主題模型共提取到3個(gè)方劑主題,對(duì)主題1中的核心藥物進(jìn)行了分析,318味中藥在主題1上的概率值差異很大,說(shuō)明主題模型對(duì)方劑語(yǔ)義的提取是有效的。以方劑主治冠心病證型為方劑主題的隱含語(yǔ)義,推斷主題1對(duì)應(yīng)的冠心病證候可能為氣虛血瘀證,主題1中的前10味中藥與臨床對(duì)該證型治療所用的藥物十分吻合,說(shuō)明LDA主題模型較好地提取了冠心病方劑的潛在語(yǔ)義。

        LDA主題模型與關(guān)聯(lián)規(guī)則分析都能夠挖掘得到不同證型冠心病的核心藥物組合,兩種方法的不同之處在于:①關(guān)聯(lián)規(guī)則分析是通過(guò)統(tǒng)計(jì)不同藥物組合出現(xiàn)的頻次,得到滿足指定支持度和置信度的關(guān)聯(lián)規(guī)則。LDA主題模型則通過(guò)吉布斯采樣,為方劑數(shù)據(jù)庫(kù)中的每一味中藥分配一個(gè)概率值,在馬爾科夫鏈?zhǔn)諗壳懊恳晃吨兴幩鶎俚淖C型是動(dòng)態(tài)變化的,當(dāng)馬氏鏈?zhǔn)諗繒r(shí)每一味中藥所屬證型則是明確的,最終得到每個(gè)證型所包含的核心藥物組合。②LDA主題模型更適合于大型方劑數(shù)據(jù)庫(kù)的聚類(lèi)分析,每個(gè)主題中的藥物都具有較為明確的隱含語(yǔ)義。關(guān)聯(lián)規(guī)則分析適合于中小型方劑數(shù)據(jù)庫(kù)的挖掘,雖然無(wú)法明確每一味中藥的語(yǔ)義,但能夠得到不同藥物組合之間以及藥物組合和證型之間的相關(guān)性,顯得更為靈活。

        與大型文本的主題建模相比,中醫(yī)藥方劑的LDA主題建模有自身的特殊性。主要表現(xiàn)在:①方劑中無(wú)重復(fù)藥物且方劑文本較短,而短文本主題建模容易產(chǎn)生特征稀疏問(wèn)題[16]。②方劑最優(yōu)主題數(shù)及主題隱含語(yǔ)義的確定較為困難。進(jìn)一步研究解決短文本主題建模時(shí)出現(xiàn)的特征稀疏問(wèn)題,利用困惑度指標(biāo)確定方劑最優(yōu)主題數(shù),更好地對(duì)中醫(yī)藥方劑進(jìn)行語(yǔ)義挖掘,將是下一步的研究方向。

        [1]趙愛(ài)梅,任鈞國(guó),劉建勛.益氣活血方治療冠心病氣虛血瘀證作用機(jī)制研究進(jìn)展[J].中國(guó)實(shí)驗(yàn)方劑學(xué)雜志,2017,23(7):215-220.

        [2]Blei DM,Ng AY,Jordan MI.Latent dirichlet allocation[J].Journal of machine Learning research, 2003, 3(3): 993-1022.

        [3]許珠香,江弋.基于潛在狄利克雷分配模型的醫(yī)療數(shù)據(jù)研究[J].廈門(mén)大學(xué)學(xué)報(bào):自然科學(xué)版,2013,52(3):356-359.

        [4]張小平,周雪忠,黃厚寬,等.一種改進(jìn)的LDA主題模型[J].北京交通大學(xué)學(xué)報(bào),2010,34(2):111-114.

        [5]霍蕊莉,劉保延,何麗云,等.基于主題模型的消渴病痹痿癥藥關(guān)系研究[J].北京中醫(yī)藥,2014,33(3):163-166.

        [6]任毅,陳志強(qiáng),張敏州,等.當(dāng)代名老中醫(yī)治療冠心病用藥規(guī)律的聚類(lèi)分析[J].中國(guó)中西醫(yī)結(jié)合雜志,2016,36(4):411-414.

        [7]吳煥林,于俏,林基偉,等.基于數(shù)據(jù)挖掘的冠心病心絞痛方劑組方規(guī)律分析[J].中醫(yī)藥導(dǎo)報(bào),2016,22(19):38-40.

        [8]田松,何茜.基于現(xiàn)代文獻(xiàn)的冠心病中醫(yī)證候特征數(shù)據(jù)挖掘[J].中國(guó)中醫(yī)藥信息雜志,2013,20(3):29-30.

        [9]毛以林,吳彬才.冠心病良方大全[M].太原:山西科學(xué)技術(shù)出版社,2016.

        [10]Witten IH,F(xiàn)rank E,Hall MA,et al.Data Mining:Practical machine learning tools and techniques[M].San Francisco:Margan Kaufmann,2016.

        [11]Phan XH,Nguyen LM,Horiguchi S.Learning to classify short and sparse text&web with hidden topics from large-scale data collections[C].Proceedings of the 17thinternational conference on World Wide Web,ACM,2008:91-100.

        [12]關(guān)鵬,王曰芬.科技情報(bào)分析中LDA主題模型最優(yōu)主題數(shù)確定方法研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2016,32(9):42-50.

        [13]李貴華,姜紅巖,謝雁鳴,等.基于大數(shù)據(jù)84697例冠心病中醫(yī)證候及其中西藥使用分析[J].中國(guó)中藥雜志,2014,39(18):3462-3468.

        [14]袁建,梁庭棟.中醫(yī)藥治療冠心病心絞痛用藥規(guī)律探索[J].四川中醫(yī),2013,31(10):37-38.

        [15]莊逸洋,鄭升鵬,陳文嘉,等.國(guó)醫(yī)大師鄧鐵濤治療冠心病用藥規(guī)律的數(shù)據(jù)挖掘研究[J].時(shí)珍國(guó)醫(yī)國(guó)藥,2016,27(12):3025-3027.

        [16]張志飛,苗奪謙,高燦.基于LDA主題模型的短文本分類(lèi)方法[J].計(jì)算機(jī)應(yīng)用,2013,33(6):1587-1590.

        猜你喜歡
        方劑證型關(guān)聯(lián)
        基于因子分析及聚類(lèi)分析的241例感染后咳嗽中醫(yī)證素證型研究
        治咽炎要分清證型
        不同證型糖尿病的調(diào)理
        中藥方劑在治療黃褐斑中的應(yīng)用
        基于自適應(yīng)矩估計(jì)的BP神經(jīng)網(wǎng)絡(luò)對(duì)中醫(yī)痛經(jīng)證型分類(lèi)的研究
        《金匱要略》黃芪類(lèi)方劑探析
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        論方劑的配伍環(huán)境
        中成藥(2018年6期)2018-07-11 03:01:24
        奇趣搭配
        甘草在方劑中的作用及配伍規(guī)律
        老熟女一区二区免费| 夜鲁很鲁在线视频| 国产免费又色又爽又黄软件 | 久久久久久久98亚洲精品| 偷拍一区二区三区在线观看| 91九色人妻精品一区二区三区| 玩中年熟妇让你爽视频| 国产jizzjizz视频免费看| 亚洲中文字幕黄色小视频| 涩涩鲁精品亚洲一区二区| 免费无码中文字幕a级毛片| AV有码在线免费看| 蜜桃av区一区二区三| 国产色视频一区二区三区不卡| 又大又粗又爽18禁免费看| 国产又黄又爽视频| 日本久久黄色高清视频| 天天干天天日夜夜操| 国精无码欧精品亚洲一区| 国产亚洲高清不卡在线观看| 国产午夜三级精品久久久| 国产av久久久久精东av| 成人性生交大片免费看r | 精品人妻一区二区三区四区在线| 国产一区二区三区影院| 97久久综合区小说区图片专区| av在线播放免费观看| 少妇中文字幕乱码亚洲影视| 狠狠色狠狠色综合久久第一次| 视频一区二区三区中文字幕狠狠| 中文字幕精品一区久久| 中文字幕一区二区三区乱码| 一个人免费观看在线视频播放| 爱爱免费视频一区二区三区| 无码国内精品久久人妻| 亚洲香蕉视频| 东京热东京道日韩av| 国产无遮挡aaa片爽爽| 国产一区二区不卡老阿姨| 亚洲伊人久久综合精品| 日韩女同精品av在线观看|