韓 楠,喬少杰,李天瑞,宮興偉,舒紅平,元昌安
1.成都信息工程大學(xué) 管理學(xué)院,成都 610103
2.成都信息工程大學(xué) 網(wǎng)絡(luò)空間安全學(xué)院,成都 610225
3.西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,成都 610031
4.成都信息工程大學(xué) 軟件工程學(xué)院,成都 610225
5.廣西師范學(xué)院 科學(xué)計(jì)算與智能信息處理廣西高校重點(diǎn)實(shí)驗(yàn)室,南寧 530023
面向復(fù)雜網(wǎng)絡(luò)的中藥方劑配伍規(guī)律挖掘算法*
韓 楠1,喬少杰2+,李天瑞3,宮興偉3,舒紅平4,元昌安5
1.成都信息工程大學(xué) 管理學(xué)院,成都 610103
2.成都信息工程大學(xué) 網(wǎng)絡(luò)空間安全學(xué)院,成都 610225
3.西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,成都 610031
4.成都信息工程大學(xué) 軟件工程學(xué)院,成都 610225
5.廣西師范學(xué)院 科學(xué)計(jì)算與智能信息處理廣西高校重點(diǎn)實(shí)驗(yàn)室,南寧 530023
+Corresponding autho author:r:E-mail:qiaoshaojie@gmail.com
HAN Nan,QIAO Shaojie,LITianrui,etal.Prescription compatibilitym ining algorithm of traditionalChinesemedicineover complex networks.Journalof Frontiersof Com puter Scienceand Technology,2017,11(7):1159-1165.
針對(duì)傳統(tǒng)方劑配伍規(guī)律分析方法的不足,提出一種面向復(fù)雜網(wǎng)絡(luò)的新型中藥(traditional Chinese medicine,TCM)方劑配伍規(guī)律挖掘算法。根據(jù)中藥方劑特性并結(jié)合點(diǎn)式互信息構(gòu)建TCM網(wǎng)絡(luò)模型,結(jié)合TCM網(wǎng)絡(luò)的小世界特性提出TCM網(wǎng)絡(luò)的局部適應(yīng)度模型,分析TCM網(wǎng)絡(luò)的特性并挖掘TCM網(wǎng)絡(luò)中配伍關(guān)系緊密、相似度較大的藥物群。以4 000余首經(jīng)典方劑作為實(shí)驗(yàn)對(duì)象,驗(yàn)證了所提方法具有較好的有效性,與經(jīng)典LFM(local fitness measure)算法對(duì)比,平均模塊度值提高了0.05,為中藥方劑的配伍規(guī)律進(jìn)行探索及新藥研發(fā)提供了新思路。
中藥;數(shù)據(jù)挖掘;配伍;復(fù)雜網(wǎng)絡(luò);藥物群
在方劑配伍研究領(lǐng)域,諸多學(xué)者利用復(fù)雜網(wǎng)絡(luò)[1]對(duì)方劑配伍規(guī)律的挖掘進(jìn)行大量研究。胡金亮等人[2]分析研究了慢阻肺基地診療常見(jiàn)證候分布規(guī)律及中藥(traditional Chinesemedicine,TCM)核心藥組組合特點(diǎn),研究成果具有很好的聯(lián)想分析歸類作用。雷蕾等人[3]為臨床治療心絞痛血瘀證的方劑構(gòu)建中藥復(fù)雜網(wǎng)絡(luò)。楊銘等人[4]利用復(fù)雜網(wǎng)絡(luò),結(jié)合生存分析模型,對(duì)中醫(yī)腫瘤臨床的生存數(shù)據(jù)進(jìn)行挖掘。田曠等人[5]對(duì)不同療效的中藥配伍網(wǎng)絡(luò)進(jìn)行建模,依據(jù)構(gòu)建的零模式來(lái)尋找兩個(gè)網(wǎng)絡(luò)之間的顯著性差異。喬少杰等人[6]利用基因表達(dá)式編程技術(shù)挖掘方證關(guān)系,挖掘復(fù)方中藥物之間的依賴性。
2.1 方劑藥物重要性及連接度
每味藥物在方劑中所起的重要程度是存在差異的,其重要程度與藥物在方劑中的位置相關(guān),藥物越靠后重要程度越小[7]?;谶@一思想,給出單方中藥重要性IH(importance of Chinese herb)定義:
其中,hi表示方劑組成列表中第i味藥物,1≤i≤n,n為單方中組成的藥物個(gè)數(shù)。
方劑中任意兩種藥物之間的連接度(connection degree,CD)取對(duì)應(yīng)的IH均值,定義如下:
其中,i,j≤n,表示方劑中任意兩個(gè)藥物位置下標(biāo)。
假設(shè)共用m首方劑,則藥物之間總的連接度(total connection degree,TCD)定義如下:
其中,bool(hi,hj)表示hi和hj兩個(gè)藥物是否存在第m首方劑,如果其值存在,為1,否則為0。
2.2 基于藥物連接度的點(diǎn)式互信息
點(diǎn)互信息(pointw isemutual information,PM I)是信息論中用以度量?jī)蓚€(gè)事件的相互關(guān)系或相似性,其原始定義如下:
PM I在文獻(xiàn)[8]中得到廣泛應(yīng)用,但用在方劑藥物網(wǎng)絡(luò)中往往會(huì)受到配伍頻率較低的影響。因此結(jié)合上文提出的藥物間共現(xiàn)連接度,給出如下度量?jī)蓛伤幬锏年P(guān)聯(lián)度TP的定義如下:
2.3 方劑藥物組網(wǎng)
根據(jù)單方得到的藥物網(wǎng)絡(luò)是一個(gè)無(wú)向有權(quán)完全子圖,原始方劑集合通過(guò)單方疊加得到的方劑網(wǎng)絡(luò)連接過(guò)于密集,在藥物群發(fā)現(xiàn)階段,社團(tuán)劃分算法無(wú)法對(duì)如此密集的方劑網(wǎng)絡(luò)圖進(jìn)行有效劃分,通過(guò)設(shè)置閾值,以減小網(wǎng)絡(luò)規(guī)模,并得到具有稀疏性的網(wǎng)絡(luò)。因此,首先根據(jù)如上方法計(jì)算得出方劑藥物間的TP值,然后移除低于閾值的邊,由此得到稀疏的TCM網(wǎng)絡(luò),進(jìn)而進(jìn)行重疊性藥物群的發(fā)現(xiàn)。
定義1(TCM網(wǎng)絡(luò))在一個(gè)無(wú)向有權(quán)圖G(V,E,W)的TCM網(wǎng)絡(luò)中,對(duì)于給定的中藥方劑集合,以藥物作為網(wǎng)絡(luò)G的頂點(diǎn),V={v1,v2,…,vn}表示G中所有頂點(diǎn)集合,根據(jù)藥物的TP值構(gòu)建頂點(diǎn)之間的邊集E={(vi,vj)|vi,vj∈V},藥物頂點(diǎn) vi和 vj間的關(guān)聯(lián)度權(quán)值W={wij|(vi,vj)∈E}。
定義2(點(diǎn)權(quán)值)點(diǎn)權(quán)值指與當(dāng)前節(jié)點(diǎn)vi直接相連的所有鄰居節(jié)點(diǎn)連邊的權(quán)值之和,則vi的點(diǎn)權(quán)值表示為,其中vk是vi的鄰居節(jié)點(diǎn)。
定義3(社團(tuán)適應(yīng)度)社團(tuán)適應(yīng)度定義如下:
式(6)中,δl(C)表示社團(tuán)劃分的局部密度;ε為社團(tuán)內(nèi)部連邊;|C|表示社團(tuán)節(jié)點(diǎn)個(gè)數(shù),當(dāng)ε=n×(n-1)/2時(shí),社團(tuán)C可表示為完全子圖。式(7)中,δr(C)用以衡量社團(tuán)C內(nèi)部邊與外部邊權(quán)重的比值關(guān)系,其值越大反映局部社團(tuán)劃分效果越好;Kin(C)表示兩個(gè)節(jié)點(diǎn)都在社團(tuán)C內(nèi)的邊權(quán)值之和;Kout(C)表示一個(gè)節(jié)點(diǎn)在社團(tuán)C內(nèi)部,另一個(gè)節(jié)點(diǎn)在社團(tuán)C外部的邊權(quán)值之和。α為可調(diào)因子,當(dāng)α較大時(shí),發(fā)現(xiàn)的社團(tuán)較小,反之較大,α通常取1.0。式(8)定義的f(C)為社團(tuán)內(nèi)部節(jié)點(diǎn)對(duì)社團(tuán)C的貢獻(xiàn)程度,其值越大表示社團(tuán)內(nèi)部相似度越大;反之越小。
對(duì)于節(jié)點(diǎn) j,判斷其添加前后對(duì)當(dāng)前社團(tuán)適應(yīng)度f(wàn)(C)的影響,如添加節(jié)點(diǎn) j后 f(C)變大,則將該節(jié)點(diǎn)加入當(dāng)前社團(tuán)C,否則進(jìn)行下一個(gè)節(jié)點(diǎn)的判斷:
根據(jù)式(9),當(dāng)前社團(tuán)的局部適應(yīng)度達(dá)到最大值,即向社團(tuán)添加新節(jié)點(diǎn)不能令社團(tuán)的局部適應(yīng)度值繼續(xù)增大,則完成此社團(tuán)的劃分,社團(tuán)已經(jīng)到達(dá)最佳社團(tuán)適應(yīng)度 fmax。
定義4(模塊度函數(shù))模塊度函數(shù)用EQw表示,是一個(gè)用于衡量網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)劃分結(jié)果質(zhì)量好壞的標(biāo)準(zhǔn),本文采用文獻(xiàn)[9]提出的擴(kuò)展模塊度EQ函數(shù)作為衡量重疊社團(tuán)的一個(gè)標(biāo)準(zhǔn),由于原EQ函數(shù)用于無(wú)權(quán)圖,將其擴(kuò)展應(yīng)用于加權(quán)網(wǎng)絡(luò):
其中,W表示權(quán)值矩陣;w為所有連邊節(jié)點(diǎn)的權(quán)值之和;Qu表示第u個(gè)節(jié)點(diǎn)所屬的社團(tuán)個(gè)數(shù);wu表示節(jié)點(diǎn)u的點(diǎn)權(quán)值;δ(Cu,Cv)表示如果兩個(gè)節(jié)點(diǎn)處于同一個(gè)社團(tuán),其值為1,否則為0。
4.1 初始藥物群檢測(cè)
算法1初始藥物群發(fā)現(xiàn)算法
輸入:G(V,E,W),種子節(jié)點(diǎn)s,適應(yīng)度因子α
輸出:?jiǎn)蝹€(gè)初始藥物群Cs
9. end if
10. elsebreak;
11.endwhile
12.U←A;
13.end while
14.outputCs;
算法1中N(s)表示節(jié)點(diǎn)的鄰居節(jié)點(diǎn);U表示當(dāng)前處理社團(tuán)內(nèi)部節(jié)點(diǎn)所有不在社團(tuán)內(nèi)部的鄰居節(jié)點(diǎn);A是社團(tuán)在每輪向外進(jìn)行擴(kuò)展過(guò)程中,不屬于社團(tuán)Cs的鄰居節(jié)點(diǎn)集合。
算法1的主要操作為:(1)獲取種子節(jié)點(diǎn)s,初始化當(dāng)前社團(tuán)Cs包含s,集合U為s的鄰居節(jié)點(diǎn)集合N(s)(第1行)。(2)社團(tuán)Cs的擴(kuò)充過(guò)程如算法第2~13行所示。按照式(8)、(9)選擇最佳的節(jié)點(diǎn)v,如果存在v使得社團(tuán)適應(yīng)度f(wàn)max增大,則將v添加到社團(tuán)Cs中,從U集合中移除v,并將節(jié)點(diǎn)v的鄰居節(jié)點(diǎn)不在Cs中的節(jié)點(diǎn)添加到集合A中(第4~11行)。(3)如果集合A重新賦值,對(duì)集合V進(jìn)行社團(tuán)發(fā)現(xiàn)的迭代操作。
4.2 相似藥物群合并
一些藥物群之間具有較高的重疊性,需要將其合并以提高發(fā)現(xiàn)的藥物群的質(zhì)量。本節(jié)利用式(11)給出的藥物群重疊度概念對(duì)上節(jié)得到的初始藥物群進(jìn)行合并操作,最終實(shí)現(xiàn)藥物群的發(fā)現(xiàn)。
式中,|Ci?Cj|表示兩個(gè)藥物群集合之間重疊的個(gè)數(shù);min(|Ci|,|Cj|)表示取兩個(gè)藥物群集合的較小者。在實(shí)驗(yàn)中設(shè)置O(Ci,Cj)=0.5。
本文所使用的TCM數(shù)據(jù)包含近4 000余首經(jīng)典方劑,方劑來(lái)源為《太平惠民和劑局方》、《景岳全書(shū)》、《圣濟(jì)總錄》、《中國(guó)藥典》等。在進(jìn)行方劑的組網(wǎng)之前,經(jīng)過(guò)加工預(yù)處理,統(tǒng)計(jì)得出TCM網(wǎng)絡(luò)包括1 577味中藥節(jié)點(diǎn)和97 103條邊。
5.1 TCM網(wǎng)絡(luò)靜態(tài)拓?fù)涮卣鞣治?/p>
復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)度可以初步反映出復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)的重要性。由圖1可以看出,TCM網(wǎng)絡(luò)符合復(fù)雜網(wǎng)絡(luò)的冪律分布特性[10],即藥物配伍網(wǎng)絡(luò)中只有少部分藥物作為核心,絕大多數(shù)藥物按照中醫(yī)藥學(xué)理論與核心藥物進(jìn)行配伍。圖2中藥物之間的TP值最大為166.4,其中在0~20.0內(nèi)占所有藥物連邊數(shù)的94.5%,平均TP值為9.37,一定程度上說(shuō)明了在傳統(tǒng)中醫(yī)藥方劑配伍應(yīng)用中,只有較少的藥對(duì)頻繁地出現(xiàn)在不同的方劑中。
Fig.1 Node degree distribution of TCM networks圖1 TCM網(wǎng)絡(luò)藥物節(jié)點(diǎn)度分布
Fig.2 Distribution ofTPvalue in TCM networks圖2 TCM網(wǎng)絡(luò)用藥TP值分布
通過(guò)分析發(fā)現(xiàn),與甘草進(jìn)行配對(duì)的藥物較多,正是因?yàn)楦什菥哂姓{(diào)和諸藥的功效。另外,根據(jù)計(jì)算得到TCM網(wǎng)絡(luò)的平均最短路徑 <l>為2.84,說(shuō)明TCM網(wǎng)絡(luò)的<l>較小,符合復(fù)雜網(wǎng)絡(luò)小世界特性[11]。
在圖論中,聚集系數(shù)C[12]用于表示一個(gè)圖形中節(jié)點(diǎn)聚集程度的度量,節(jié)點(diǎn)i的聚集下Ci=2ei/ki(ki-1),小世界網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)都具有較大的聚類系數(shù)。本實(shí)驗(yàn)中TCM網(wǎng)絡(luò)藥物節(jié)點(diǎn)的平均聚類系數(shù)C為0.627,說(shuō)明該網(wǎng)絡(luò)具有較高的聚集性。
5.2 TP值對(duì)構(gòu)建方劑網(wǎng)絡(luò)的影響
在發(fā)現(xiàn)藥物團(tuán)時(shí)需要設(shè)置閾值TPmin,由于該閾值具體取值較難確定,實(shí)驗(yàn)對(duì)TPmin在[0,40]之間取值的情況進(jìn)行分析討論。
如圖3所示,平均節(jié)點(diǎn)度 <k>值在TPmin取值為2.0之前迅速降低,之后趨于平緩。通過(guò)設(shè)置TPmin大于2.0,可以移除大多數(shù)低頻且低相關(guān)的藥物邊。
Fig.3 Influenceof differentTPminon <k>圖3 不同TPmin對(duì)<k>的影響
需要進(jìn)一步驗(yàn)證本文方法和LFM算法[13]在多尺度的TPmin值下的藥物群劃分結(jié)果。LFM算法往往具有很大的隨機(jī)性,本文方法則能夠較好地克服這一問(wèn)題。EQw模塊度值作為衡量?jī)煞N算法運(yùn)行結(jié)果發(fā)現(xiàn)藥物群的質(zhì)量的一個(gè)標(biāo)準(zhǔn),其值越大表示社區(qū)劃分結(jié)果越好。如圖4所示,TPmin在[0,40]之間取值,EQw值平均提高了0.05。圖5是兩種方法在不同TPmin取值下最大藥物群包含的藥物數(shù)量,可以發(fā)現(xiàn)本文方法發(fā)現(xiàn)的最大藥物群所包含的藥物個(gè)數(shù)均小于LFM算法,能夠發(fā)現(xiàn)的藥物群個(gè)數(shù)更多。主要原因在于本文方法在最大化藥物群適應(yīng)度的同時(shí)考慮藥物群內(nèi)部藥物節(jié)點(diǎn)之間聯(lián)系的緊密程度,所以能夠發(fā)現(xiàn)的藥物群的個(gè)數(shù)更多,結(jié)果如圖6所示。
本文基于復(fù)雜網(wǎng)絡(luò)提出構(gòu)建TCM網(wǎng)絡(luò)模型的方法,通過(guò)設(shè)置不同的網(wǎng)絡(luò)閾值發(fā)現(xiàn)不同尺度的藥物群。對(duì)比LFM算法,本文方法可以有效發(fā)現(xiàn)內(nèi)部配伍聯(lián)系更加緊密、相似度更大的藥物群。后期研究包括:在構(gòu)建TCM網(wǎng)絡(luò)時(shí)考慮藥物的使用劑量,采用并行化處理發(fā)現(xiàn)TCM網(wǎng)絡(luò)核心藥物節(jié)點(diǎn)等,利用進(jìn)化算法研究復(fù)方藥物間的依賴性[14],應(yīng)用關(guān)聯(lián)規(guī)則分析方法挖掘方劑的配伍規(guī)律[15]。
Fig.4 ChangeofmodularityEQww ithTPmin圖4 模塊度EQw隨TPmin的變化
Fig.5 Change of the numberof herbs in the largestherb groupsw ithTPmin圖5 最大藥物群包含藥物個(gè)數(shù)隨TPmin的變化
Fig.6 Change of the numberof herb groupsw ith TPmin圖6 藥物群個(gè)數(shù)隨TPmin的變化
[1]Strogatz SH.Exploring complex networks[J].Nature,2001,410(6825):268-276.
[2]Hu Jinliang,Li Suyun,Zhang Xinghong,etal.Study on syndrome distribution and Chinese medicine composition of AECOPD based on complex networks[J].Modernization of Traditional Chinese Medicine and Materia Medica-World Scienceand Technology,2015,17(6):1268-1273.
[3]Lei Lei,Yang Ce,Wen Xianrong,etal.Study on formulating rules of Chinese herbal formula for treating angina blood stasis syndrome[J].World Chinese Medicine,2013,8(9):1101-1104.
[4]Yang M ing,Li Jiaqi,Jiao Lijing,etal.Effective core formulae for lung cancer based on complex network and survival analysis[J].China Journal of Chinese Materia Medica,2015,40(22):4482-4490.
[5]Tian Kuang,Du Ninglin.Multiscale backbone based network comparison algorithm for effective herbal interaction analysis[J].Electronic Science&Technology,2015,2(2):243-249.
[6]Qiao Shaojie,Tang Changjie,Han Nan,etal.M ining the compatibility law ofmultidimensionalmedicines based on dependencemode sets[J].Journal of Sichuan University:Engineering Science Edition,2007,39(4):134-138.
[7]Li Shao,Zhang Bo,Jiang Duo,et al.Herb network construction and co-module analysis for uncovering the combination rule of traditional Chinese herbal formulae[J].BMC Bioinformatics,2010,11(11):1-12.
[8]Wu Lifang,Wang Dan,Guo Cheng,etal.User profiling by combining topic modeling and pointw ise mutual information(TM-PM I)[C]//LNCS 9517:Proceedings of the 22nd International Conference on Multimedia Modeling,M iam i,USA,Jan4-6,2016.Berlin,Heidelberg:Springer,2016:152-161.
[9]Shen Huawei,Cheng Xueqi,Cai Kai.Detectoverlapping and hierarchical community structure in networks[J].Physica A:StatisticalMechanicsand ItsApplications,2009,388(8):1706-1712.
[10]Barabosi A L,Albert R.Emergence of scaling in random networks[J].Science,1999,286(5439):509-512.
[11]Watts D J,Strogatz S H.Collective dynam ics of‘smallworld’networks[J].Nature,1998,393(4):440-442.
[12]Soffer SN,Vázquez A.Network clustering coefficientw ithout degree-correlation biases[J].Physical Review E,2005,71(5):057101.
[13]LancichinettiA,Fortunato S,Kertész J.Detecting the overlapping and hierarchical community structure of complex networks[J].New Journalof Physics,2008,11(3):19-44.
[14]Qiao Shaojie,Tang Changjie,Jin Huidong,etal.KISTCM:know ledge discovery system for traditional Chinesemedicine[J].Applied Intelligence,2010,32(3):346-363.
[15]Han Jiawei,Pei Jian,Yin Yiwen.M ining frequent patterns w ithout candidate generation[J].ACM SIGMOD Record,2000,29(2):1-12.
附中文參考文獻(xiàn):
[2]胡金亮,李素云,張興紅,等.基于復(fù)雜網(wǎng)絡(luò)AECOPD證候分布及中藥組合研究[J].世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化,2015,17(6):1268-1273.
[3]雷蕾,楊策,溫先榮,等.基于復(fù)雜網(wǎng)絡(luò)的心絞痛血瘀證中藥組方研究[J].世界中醫(yī)藥,2013,8(9):1101-1104.
[4]楊銘,李嘉旗,焦麗靜,等.基于復(fù)雜網(wǎng)絡(luò)結(jié)合生存分析的中醫(yī)藥治療肺癌的核心有效處方的發(fā)現(xiàn)研究[J].中國(guó)中藥雜志,2015,40(22):4482-4490.
[5]田曠,杜寧林.基于多尺度骨干網(wǎng)的網(wǎng)絡(luò)比較算法——面向藥物配伍分析[J].電子科學(xué)技術(shù),2015,2(2):243-249.
[6]喬少杰,唐常杰,韓楠,等.基于依賴模式集挖掘組方藥物多維配伍規(guī)律[J].四川大學(xué)學(xué)報(bào):工程科學(xué)版,2007,39(4):134-138.
韓楠(1984—),女,陜西寶雞人,2012年于成都中醫(yī)藥大學(xué)獲得博士學(xué)位,現(xiàn)為成都信息工程大學(xué)講師,主要研究領(lǐng)域?yàn)橹嗅t(yī)數(shù)據(jù)挖掘。
QIAO Shaojiewas born in 1981.He received the Ph.D.degree from Sichuan University in 2009.Now he is a professor and M.S.supervisor at Chengdu University of Information Technology,and the seniormember of CCF.His research interests include databasesand datamining.
喬少杰(1981—),男,山東招遠(yuǎn)人,2009年于四川大學(xué)獲得博士學(xué)位,現(xiàn)為成都信息工程大學(xué)教授、碩士生導(dǎo)師,CCF高級(jí)會(huì)員,主要研究領(lǐng)域?yàn)閿?shù)據(jù)庫(kù),數(shù)據(jù)挖掘。
LITianruiwasborn in 1969.He received the Ph.D.degree from Southwest Jiaotong University in 2002.Now he is a professor and Ph.D.supervisor at Southwest Jiaotong University.His research interest is intelligent information processing.
李天瑞(1969—),男,福建莆田人,2002年于西南交通大學(xué)獲得博士學(xué)位,現(xiàn)為西南交通大學(xué)教授、博士生導(dǎo)師,主要研究領(lǐng)域?yàn)橹悄苄畔⑻幚怼?/p>
GONG Xingweiwas born in 1991.He is an M.S.candidate at Southwest Jiaotong University.His research interest isdatamining.
宮興偉(1991—),男,重慶潼南人,西南交通大學(xué)碩士研究生,主要研究領(lǐng)域?yàn)閿?shù)據(jù)挖掘。
SHU Hongping was born in 1974.He received the Ph.D.degree from Sichuan University in 2010.Now he isa professorand M.S.supervisoratChengdu University of Information Technology.His research interestis datam ining.
舒紅平(1974—),男,重慶潼南人,2010年于四川大學(xué)獲得博士學(xué)位,現(xiàn)為成都信息工程大學(xué)教授、碩士生導(dǎo)師,主要研究領(lǐng)域?yàn)閿?shù)據(jù)挖掘。
YUAN Chang'an was born in 1964.He received the Ph.D.degree from Sichuan University in 2006.Now he is a professorand M.S.supervisoratGuangxiTeachers Education University.His research interest is datam ining.
元昌安(1964—),男,安徽肥東人,2006年于四川大學(xué)獲得博士學(xué)位,現(xiàn)為廣西師范學(xué)院教授、碩士生導(dǎo)師,主要研究領(lǐng)域?yàn)閿?shù)據(jù)挖掘。
Prescription Com patibility M ining A lgorithm of Traditional Chinese M edicine over Com p lex Networks*
HAN Nan1,QIAO Shaojie2+,LITianrui3,GONG Xingwei3,SHU Hongping4,YUAN Chang'an5
1.SchoolofManagement,Chengdu University of Information Technology,Chengdu 610103,China
2.Schoolof CyberSecurity,Chengdu University of Information Technology,Chengdu 610225,China
3.Schoolof Information Scienceand Technology,Southwest Jiaotong University,Chengdu 610031,China
4.Schoolof Software Engineering,Chengdu University of Information Technology,Chengdu 610225,China
5.Science Computing and Intelligent Information Processing of Guangxi Higher Education Key Laboratory,Guangxi Teachers Education University,Nanning 530023,China
Aiming to overcome the drawbacksof traditional Chinesemedicine(TCM)prescription analysis,this paperproposes a new complex networks-based TCM prescriptionm ining algorithm,which creates the TCM networks by combining the characteristicsof prescriptionsand pointmutual information.This paperalso proposesa new local fitnessmodel of TCM networks by integrating the feature of small world,which can analyze the characteristics of TCM networks and discover the closely linked and sim ilar herb groups.Extensive experiments are conducted on more than 4000 prescriptions to evaluate the effectiveness of the proposed algorithm.Compared w ith the LFM(local fitnessmeasure)algorithm,the results show that the averagemodularity can be improved by 0.05.The proposed algorithm can be applied to explore the compatibility of prescriptions and provide new ideas for the research and developmentof new medicines.
traditionalChinesemedicine;datam ining;compatibility;complex networks;herb group
as born in 1984.She
the Ph.D.degree from Chengdu University of TraditionalChinese Medicine in 2012.Now she is a lecturer at Chengdu University of Information Technology.Her research interest is data mining in traditionalChinesemedicine.
A
:TP391
*The NationalNatural Science Foundation of China under GrantNos.61100045,61363037(國(guó)家自然科學(xué)基金);the Planning Foundation for Humanitiesand Social SciencesofM inistry of Education of China under GrantNo.15YJAZH058(教育部人文社會(huì)科學(xué)研究規(guī)劃基金);theYouth Foundation forHumanitiesand SocialSciencesofM inistry of Education of ChinaunderGrantNo.14YJCZH046(教育部人文社會(huì)科學(xué)研究青年基金);the SoftScience Foundation of Chengdu underGrantNo.2015-RK00-00059-ZF(成都市軟科學(xué)項(xiàng)目);the Science Foundation of EducationalComm ission of Sichuan Province underGrantNo.14ZB0458(四川省教育廳資助科研項(xiàng)目).
Received 2016-04,Accepted 2016-06.
CNKI網(wǎng)絡(luò)優(yōu)先出版:2016-06-23,http://www.cnki.net/kcms/detail/11.5602.TP.20160623.1139.006.htm l